Текст
                    Высшая математика
и ее приложения
к БИОЛОГИИ
Ю. Н. Сударев
Т. В. Першикова
Т. В. Радославова
основы
ЛИНЕЙНОЙ АЛГЕБРЫ
И МАТЕМАТИЧЕСКОГО
АНАЛИЗА
ACADEMA
Университетский учебник

Редакционный совет серии Председатель совета: академик РАН В. А. Садовничий Члены совета: В. И. Гаврилов (доктор физико-математических наук, профессор), В. Н.Латышев (доктор физико-математических наук, профессор), Т.П.Лукашенко (доктор физико-математических наук, профессор), А. В. Михалев (доктор физико-математических наук, профессор), А. Д. Некипелов (вице-президент РАН, академик РАН), Ю. В. Нестеренко (член-корреспондент РАН), И.X.Сабитов (доктор физико-математических наук, профессор), В. Н.Тутубалин (доктор физико-математических наук, профессор), В. Г. Чирскик (доктор физико-математических наук, профессор), В.Н.Чубариков (доктор физико-математических наук, профессор), А. Н. Ширяев (член-корреспондент РАН)
УНИВЕРСИТЕТСКИЙ УЧЕБНИК ВЫСШАЯ МАТЕМАТИКА И ЕЕ ПРИЛОЖЕНИЯ К БИОЛОГИИ Ю.Н. СУДАРЕВ, Т. В. ПЕРШИКОВА, Т. В. РАДОСЛАВОВА ОСНОВЫ ЛИНЕЙНОЙ АЛГЕБРЫ И МАТЕМАТИЧЕСКОГО АНАЛИЗА Допущено Научно-методическим советом по математике Министерства образования и науки Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению «Биология» ACADEMA Москва Издательский центр « Академия» 2009
УДК 51(075.8) ББК22.1я73 С892 Высшая математика и ее приложения к биологии Рецензенты: доктор физико-математических наук, профессор Г.И.Архипов (Математический институт РАН им. В. А. Стеклова); кандидат физико-математических наук, доцент А. Б. Плаченов (Московский государственный институт радиотехники, электроники и автоматики (технический университет)) Сударев Ю. Н. С892 Основы линейной алгебры и математического анализа : учеб, пособие для студ. высш. учеб, заведений / Ю.Н. Суда- рев, Т. В. Першикова, Т. В. Радославова. — М.: Издательский центр «Академия», 2009. — 352 с. — (Университетский учеб- ник. Высшая математика и ее приложения к биологии). ISBN 978-5-7695-4645-7 В учебное пособие включен материал по основным разделам курса высшей математики (аналитической геометрии, линейной алгебры и ос- новам математического анализа), Отдельные главы и подразделы пособия содержат материал повышенной сложности, предназначенный дтя студен- тов, обучающихся по специальности «Биофизика». Для студентов биологических специальностей высших учеоных заве- дений. УДК 51(075.8) ББК 22.1я73 Оригинал-макет данного издания является собственностью Издательского центра «Академия», и его воспроизведение любым способом без согласия правообладателя запрещается ©Сударев Ю.Н., Першикова Т.В., Радославова Т.В., 2009 © Образовательно-издательский центр «Академия», 2009 ISBN 978-5-7695-4645-7 © Оформление. Издательский центр «Академия», 2009
ПРЕДИСЛОВИЕ Учебное пособие написано на основе лекций по математике, которые читались в течение нескольких десятков лет вначале на биолого-почвенном, а затем на биологическом факультете МГУ им. М. В. Ломоносова. В нем представлены все основные разде- лы математики, необходимые студенту-биологу как для последу- ющего изучения более сложных математических вопросов, так и для усвоения таких дисциплин, как физика и физическая химия. В учебном пособии изложены основы аналитической гео- метрии и линейной алгебры, основы математического анали- за, дифференциальное исчисление функций одной и нескольких действительных переменных, интегральное исчисление, теория дифференциальных уравнений и теория рядов. Некоторые из этих разделов (они отмечены звездочкой) предназначены для студентов, изучающих углубленный курс математики, напри- мер, для тех, кто специализируется в области биофизики. В книге даны некоторые примеры применения математики к биологии (например, модель роста деревьев, задача о «хищнике и жертве» и др.). Из чисто математических новшеств отметим формулиров- ку критерия Лебега интегрируемости функции по Риману (см. гл. 6), который обычно не включают в математические курсы естественных факультетов, считая его слишком сложным для тех, кто не специализируется в области математики. Однако, как показал многолетний опыт, этот критерий в том виде, как он здесь изложен, успешно усваивается студентами-биологами и позволяет легко доказать ряд важных теорем об интегрируемо- сти функций, которые в противном случае пришлось бы форму- лировать без доказательства. Главы 1 и 2 написаны Т. В. Радославовой; гл. 8 и 9 — Т. В. Пер- шиковой; гл. 3 — 7 — Ю. Н. Сударевым.
л аъ а 1 АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ 1.1. Матрицы и действия с ними Определение 1.1. Матрицей размера т х п называется прямоугольная таблица чисел из т строк и п столбцов. Числа, из которых состоит матрица, будем называть элементами матри- цы и нумеровать двумя индексами, первый из которых означает номер строки, в которой стоит элемент, а второй — номер столб- ца. Квадратные матрицы размера п х п будем называть матри- цами порядка п. 5 Таким образом, матрица А это набор т х п чисел где . ,m, j = 1, ... ,п. Запятую между индексами можно опускать там, где это не вызывает недоразумений. Например, / , . /1 5 4\ п о А = (aij) — I n i о I ~ матрица размера 2 х 3 с элементами а11 — &12 = 5, П13 — 4, «21 = о, «22 — — 1» ^23 = 2; /0 0 \° 1 х 4,1 х 1 соответственно. (0,0,0,0), (0) — нулевые матрицы размеров 2 х 2, 3 х 1 Определение 1.2. Две матрицы Ап В одинакового размера т х п называются равными, если равны все их соответствующие элементы, т. е. А — В, если «^ = для любых г — 1, ... ,т и j 1, Матрипы можно складывать и умножать на число. Определение 1.3. Суммой А-Ь В двух матриц одинакового размера т х п называется матрица С размера т х тг, элементы которой определяются формулой для любых г = 1, ..., т и j — 1, ..., тг. 4
Упражнение 1.1. Докажите, что сложение матриц по фор- муле (1.1) коммутативно, т. е. Л + В = В-]-А для любых матриц А и В размера т х п, и ассоциативно, т. е. (Л + В) + С = А + + В + С) для любых матриц А, В, С одинакового размера т х п. Определение 1.4. Произведением ХЛ матрицы Л на число X называется матрица С, элементы которой определяются форму- лой Cij для любых i — 1, ..., т, j = 1, ..., п. Упражнение 1.2. Докажите, что умножение матриц на число по формуле (1.2) обладает свойством ХДХ2Л) = Х1Х2/4 и имеет место дистрибутивность двух видов: (Xi + Х2)Л — Х1Л + Х2Л; Х(Л + В) - хл + хв для любых чисел Xi, Х2, X и матриц Л, В одинакового размера т х п. Матрицы можно перемножать, если их размеры таковы, что число столбцов первой матрицы равно числу строк второй. Определение 1.5. Пусть Л и В матрицы размеров т х к и к хп соответственно. Произведением АВ этих матриц называ- ется матрица С размера т х п, элементы которой определяются формулой к с^д — CLiibij ~h ~Ь . •. Ч" a^b^j = 1=1 для любых i — 1, ..., т, j — 1, ..., п. Здесь для обозначения суммы использован знак . Когда I «пробегает» значения от 1 до к, выражение а^Ьц под знаком суммы принимает поочередно значения всех слагаемых. Пример 1.1. О , то С = АВ = —30у ’ ^П’есь ~ матрица размера 2 х 3; В матрица размера 3 х 2; С — АВ — квадратная матрица поряд-
ка 2. Чтобы узнать, например, элемент С21, нужно, согласно фор- муле (1.3), почленно перемножить соответствующие элементы, стоящие во второй строке матрицы Айе первом столбце матри- цы В, а затем сложить получившиеся произведения: С21 = «21^11 А- а22^21 + «23^31 = —4( —1) -4- 5 • 0 -г 0 • 1 = 4. Заметим, что умножение матриц, определяемое формулой (1.3), обладает свойствами ассоциативности, т. е. (АВ)С — = А(ВС), и дистрибутивности, т. е. (Л + В)С = АС + ВС, Л(В + С) = АВ + АС. Эти свойства легко проверить для матриц малого размера. Пример 1.2. Проверим свойство дистрибутивности для квадратных матриц второго порядка. Обозначим D — (А + В)С иГ = АС + ВС. Тогда для г, j = 1,2 по формулам (1.1) и (1.3) — (аг1 + bn)cij А“ (Пг2 A" bi2^C2j — А~ ЬцС^ + O-/2C2J А- ^2^2^ j и формула ' Л + В)С = АС + ВС доказана. Упражнение 1.3. Докажите, чго умножение матриц поряд- ка 2 обладает свойством ассоциативности. Однако коммутативность при умножении матриц не име- ет места. Для доказательства последнего утверждения достаточно привести следующий пример. Пример по (1.3) 1.3. Пусть А = . Тогда АВ = 2 1\ /5 -А /12 -1\ -3 4у у 2 1 ) ~ \-7 7 ) ’ т. е. АВ В Л, и коммутативность умножения матриц не имеет места. Пусть п 6 N т. е. п — натуральное число, и А - (aij) — квад- ратная матрица порядка п. Говорят, что элементы агг, i = 1, ..., п образуют главную диагональ матрицы. Вторая диагональ квадратной матрицы называется побочной. 6
Определение 1.6. Квадратная матрица О О О ... О О ... О 1 ... О О о \О О ... 1 о ... о 1/ главная диагональ которой состоит из единиц, а все остальные элементы суть нули, называется единичной матрицей. Таким образом, для единичной матрицы ец — 1, если i — — 1, ..., n; ei3 — 0 для любых i — 1, ..., n, j = 1, ..., тг, если г 3- Легко убедиться, что АЕ = ЕА = А (1-4) для любой матрицы А порядка п. Упражнение 1.4- Проверьте равенства (1-4) для п = 2. Кроме того, если еще какая-нибудь матрица С обладает та- ким же свойством АС = С А — А, то С = СЕ = Е, т. е. единич- ная матрица единственна. Определение 1.7. Матрица Л-1 называется обратной к матрице Л, если Обратная матрица существует не для всякой квадратной мат- рицы порядка п (случаи существования обратных матриц будут рассмотрены в подразд. 1.2). Заметим, что если для матрицы Л существует обратная мат- рица, то она единственна. Действительно, если наряду с (1.5) выполняется С А = АС = Е для некоторой матрицы (7, то С = СЕ = С(АА 4) = (СЛ)Л 1 = = ЕА~г — Л1 и, значит, обратная матрица единственна. Определение 1.8. Матрица Лт, которая получается из мат- рицы А, если в ней ^поменять местами строки и столбцы с оди- наковыми номерами, называется транспонированной к матрице Л, т. е. 7
«11 «12 • • • «In \ / «11 «21 • • • «nl «21 «22 • • • «2п I I «12 «22 • • • «n2 «nl «n2 • • • «пп/ \«ln «2n * * * «nn Пример 1.4* (Контакты первого и второго порядков в эпи- демиологии.} Предположим, что т человек заболели заразной болезнью. Обследуется вторая группа из п человек. Рассмотрим матрицу А = («у) размера т х п — матрицу контактов первого порядка первой группы больных из т человек со второй груп- пой из п человек; ai3 = 1, если j-й человек из второй группы контактировал с г-м человеком из первой группы. Рассмотрим контакты еще одной, третьей, группы из s чело- век с людьми из второй группы. Пусть В — (b^i) — соответству- ющая матрица контактов первого порядка между второй и тре- тьей группой. Непрямые контакты, или контакты второго порядка между больными из первой группы и людьми из третьей группы, опи- сываются с помощью матрицы С- АВ- п ci3 = дает число контактов второго порядка между k^l г-м больным из первой группы и j-м человеком из третьей груп- пы. Действительно, слагаемое a^b^j этой суммы равно единице только если — 1 и bk3 = 1, т. е. если были прямые контакты г-го больного с fc-м человеком из второй группы и затем этого fc-го человека из второй группы с j-м из третьей. Это означает, что был непрямой контакт между г-м больным и j-м человеком из третьей группы. Просуммировав все выражения вида aikbkf по к от 1 до п, получим число всех непрямых контактов меж,цу г-м больным и j-м человеком из третьей группы. /0010 Например, пусть т — 3, = 6 и Л I 1 0 0 1 \0 0 1 1 матрица контактов первого порядка между первой /00100 0 0 110 0 0 и 1 0 второй 0 группой. Пусть также s — 7 и В ~ 1 0 0 0 0 1 1 0 0 1 1 0 0 0 0 10 10 0 0 \1 0 0 0 0 1 о/ 8
матрица контактов первого порядка между второй и третьей /1 1 0 1 0 1 1\ группой. Тогда С = АВ == I 0 0 2 1 0 1 0 ] — матрица у2 0 1 1 0 2 1/ контактов второго порядка между первой группой больных и третьей группой. Так, сзд = 2 показывает, что имелись два кон- такта второго порядка между третьим больным и первым чело- веком из третьей группы (через 3-го и 6-го из второй); Сц1 = 1 — у первого человека из третьей группы был один непрямой кон- такт с первым больным (через 3-го человека из второй группы), а всего у первого человека из третьей группы было 1 + 2 = 3 непрямых контакта с больными из первой группы. У пятого че- ловека из третьей группы контактов с больными из первой груп- пы не было. Пример 1.5. Рассмотрим весьма распространенную схему применения матриц. Пусть Y — некоторое множество из N элементов и Yj, Y^ ..., Yn — его разбиение на п групп из М, , Nn элементов со- ответственно. Рассмотрим вектор-столбец (т. е. матрицу, состо- ящую из одного столбца) х — Ni — — доля г-и группы во всем множестве. Ясно, что 0 < Xi < 1, г = 1,2, ..., п, п и ^^Xi — 1. Назовем вектор х вектором распределения соот- i—1 ветствующего разбиения. Например, если Y некоторая попу- ляция и Ml, М, • • • ? Мг — разбиение популяции по некоторому (яЛ : I может быть назван вектором распределения генотипа по данному признаку. Пусть в некоторый начальный момент времени tg есть вектор /~о\ I 1 I распределения а?0 = | : |, а в некоторый следующий момент t\ 1 1 1 о п вектор распределения х . В качестве ti может быть вы- 9
бран момент, когда сформируется следующее поколение, и тогда х1 распределение генотипа следующего поколения. Пусть известен закон, по которому компоненты вектора ж1 получаются из ж0 следующим образом: X1! = ацхЧ + 012.^2 + ... + а1пх^; Х2 = 0-21X1 + 022X2 + ... + О2пХ®; X о п* Матрицу А = (aij) будем называть матрицей перехода к сле- дующему состоянию множества Y. В случае популяции мо- жет иметь следующий смысл: ац есть доля потомства г-й груп- пы предыдущего поколения, попавшего в j-ю группу разбие- ния по заданному признаку в следующем поколении. Ясно, что п О < atJ < 1, г, j — 1,2, ..., п, и aij = 1, J = 1,2, ..., п. Таким г=1 образом, можно записать в матричном виде х1 — Ах®. Пусть вектор распределения в следующий момент получа- ется из х1 по тому же закону: х2 — Ах1 — ААх° = А2х°, и так же в каждый следующий момент: х3 = Ах2 — АЛ2т° = А3х°, и так далее, хк ~ Акх®. Исследуя свойства матрицы А, можно сделать некоторые выводы относительно распределения х. Так, в приме- ре 2.24 исследуется вопрос о стационарном распределении (см. подразд. 2.4). 1.2. Определители и их свойства Каждой квадратной матрице порядка п ставится в соответ- ствие некоторое число, которое называется определителем мат- рицы и обозначается det А или |А|. Здесь рассмотрим определи- тели матриц порядка п — 2 и п = 3. Определение 1.9. Определителем матрицы А = второго порядка называется число |А| = оц 021 «12 022 — ОцО22 — 021012- (1-6) 10
Определителем матрицы, А = «11 «21 «31 «12 «22 «32 «13 «23 «33 третьего порядка называется число «11 «12 «13 «21 «22 «23 «31 «32 «33 = «11«22«33 + «21«32«13 + «31«12«23~ —«31«22«13 ~ «21«12«33 — «П«32«23- (1-7) Замечание. Определители матриц произвольного порядка п будут рассмотрены в гл. 2.3. Здесь сформулируем свойства определителей, верные и для определителей произвольного порядка п. Для п — 2,3 эти свойства легко проверяются исходя из определения, что и предлагается далее читателю проделать самостоятельно. Свойства определителей 1. При транспонировании матрицы определитель не меняет- ся, т. е. |А| — |АТ|. 2. При умножении всех элементов какой-либо строки (столб- ца) матрицы на какое-нибудь число X на это же число умножа- ется и определитель. Например, * 11 ? «21 ла22 = НцХа22 “ &21Х&12 = Х(ац(222 “ — «21«12 — X «11 «12 «21 «22 3. Если каждый элемент какого-либо столбца (строки) мат- рицы А представляется в виде суммы двух слагаемых, то опре- делитель матрицы А равен сумме определителей двух матриц, в первой из которых в соответствующем столбце (строке) стоят первые слагаемые, а во второй — вторые. Например, «11 «12 Н «21 «22 " «31 «32 ’ н и и -12 «13 22 «23 Зз2 «33 —— «11 «12 «13 «21 «22 «23 «31 «32 «33 «11 «21 «31 Р12 «13 1^22 «23 р32 «33 • 4. Если какая-нибудь строка или столбец матрицы состоит из нулей, то определитель матрицы равен нулю. 5. При перестановке двух каких-либо строк (столбцов) мат- рицы определитель меняет знак, а по абсолютному значению не меняется. 11
6. Если в матрице имеются две одинаковые строки (столбца), то определитель равен нулю. 7. Если к элементам некоторой строки (столбца) матрицы почленно прибавить элементы другой строки столбца), умно- женные на какое-нибудь число X, то значение определителя не изменится. Упражнение 1.5. Проверьте свойства 17 для квадрат- ных матриц порядка п = 2 и п = 3. Пример 1.6. Докажем, например, свойство 5 для определи- теля 2-го порядка. Пусть А — «и «21 «12 «22 . Если переставить строки в матрице А, то определитель получившейся матрицы равен «21 «22 «11 «12 = «21«12 ” «11«22 = 1 «11«22 — «21«12) = «11 «12 «21 «22 А|. Определение 1.10. Пусть (а^) — элемент матрицы А = /«11 ... «1? . . . «1п\ «ъ1 aij «яп порядка п, где г, j = 1, ..., п. Ми- ' «711 • • • «71J • • • «ПП/ нором Mij элемента называется определитель порядка п — 1 матрицы, которая получается из А вычеркиванием строки и столбца, в которых стоит этот элемент ai3. Алгебраическим до- полнением к элементу называется число А, = (1-8) т. е. A — это минор Мг>, взятый с определенным знаком, зави- сящим от номера строки i и номера столбца J, в которых стоит элемент Теперь можно сформулировать еще два свойства определите- лей. 8. Пусть i(j) — номер строки (столбца) матрицы А, где i,j — = 1, ..., п. Тогда, определитель этой матрицы равен сумме про- изведений элементов, стоящих в г-й строке (Дм столбце), умно- женных на их алгебраические пополнения, т. е. 12
|j4| — С1цАц 4~ ««2J4i2 4“ ... 4" разложение определителя по i-й строке, и (1.Ю) разложение определителя по J-му столбцу. Например для п — 3, i = 1 из (1.9) и (1.8) получаем «и «12 «13 «21 «22 «23 «31 «32 «33 ~ «1М11 + «12^412 + «13^413 “ «22 «23 «32 «зз + а12(--1)1+2 «23 «33 +М-1)1+3 «21 «22 «31 «32 «22 «32 9. Сумма произведений элементов строки (столбца) на ал- гебраические дополнения к соответствующим элементам другой строки (столбца) равна нулю, т. е. «il^4fcl 4“ «г2^4./с2 4- ... 4” «zn^fcn — 01 (1-11) «ij ^41/с + «2j^42fc 4- ... 4- (1>)1дАп^ — О (1.12) для любых г, к — 1, ..., п, г / А: и J / fc. Свойства 1-8 позволяют вычислять определители, предва- рительно преобразуя матрицы к более простому виду. Пример 1.7. Вычислим определитель IА = 4 5 . Вычи- тая из третьей строки вторую, затем из второй первую и приме- няя свойство 6, получим г4 ац(~1)14 1 6 - 0. 13
Пример 1.8. О -13 = 2[(—13) (—2) - (-11)1] — 2-37 — 74. Здесь мы вынесли 2 из третьей строки; вычли из первой строки третью, умноженную на 4, и вычли из второй строки третью. За- тем разложили определитель по первому столбцу и вычислили получившийся определитель по формуле (1.6). Пример 1.9. О «12 «22 О — ац«22«зз- Здесь все слагае- «13 «23 мые, кроме первого, в формуле (1.7) равны нулю. Таким обра- зом, определитель треугольной матрицы равен произведению диагональных элементов. Пример 1.10. 8 2 1= (-1)(-1)1+2 о х = -5 -3-2 Ь 2 — —16 — (—5) — —11. Здесь мы разложили определитель по эле- ментам первой строки. Пример 1.11. D — |А| — можно вычис- лить, разложив по первой строке. По свойству 8 имеем 1 + 2 2 - 5 74 - (-15) - 4(—31) - 33 - -370 + 15 + 124 -33 = -264. 14
2 О Пример 1.12. \Е\ = О ... О 1 ... О — 1. Здесь для вычисле- О ния определителя применили формулу (1.9) п — 3 раза (мож- но было также использовать формулу (1.10) и формулу (1.7) из определения 1.9). Пример 1.13. Проверим свойство 9, именно формулу (1.11) /1 2 -2\ для определителя матрицы А — 5 1 —3 |, i = 2, к = 1. \0 1 2 / Имеем «21 All + 022^12 + 023^413 = + (-з) = 5 • 5 - 10 - 15 = 0. О 1 Аналогично проверяется формула (1.12). Теорема 1.1. Определитель произведения двух матриц ра- вен произведению их определителей, т. е. |АВ| = |А||В|. (113) Для доказательства в случае п — 2 или п — 3 достаточно вычислить левые и правые части выражения (1.13) и убедиться в их равенстве. Теорема верна и в общем случае. Упражнение 1.6. Проверьте равенство (1.13) для матриц порядка 2. Определение 1.11. Квадратная матрица А называется не- вырожденной, если |А| 0, и вырожденной, если |А| — 0. Теорема 1.2. Квадратная матрица А — (а7у) имеет обрат- ную тогда и только тогда, когда она невырожденная. При этом обратная матрица имеет вид |А|(Л-’ (1-14) где Ai3 — матрица алгебраических дополнений к элементам мат- рицы А, и |А"11 = |А|-1. 15
Доказательство. Пусть матрица А имеет1 обратную. Так как \Е ~ 1 ипотеореме 1.1 |А| А х| = |АА 1 матрица А невырожденная, и, очевидно, = \Е — 1, то |А| 0 и .А’1! = 1АГ1. Обозначим В — (Aij)T и С = АВ. Покажем, что С = Е, это и будет означать, что В = А’1. Используя свойства 8 и 9, получим 1, если i — О, если i j, т. е. С — Е и формула (1.14) доказана. / Э -1 о\ Пример 1.14' Пусть А — | —2 1 11. Тогда |А| — —4, по \ 2 1 V формулам (1.14), (1.8) /1 0 о\ АА"1 — 10 1 0 I - Е. \0 0 1/ 1.3. Системы линейных уравнений Исторически понятие определителя возникло при решении системы линейных уравнений. Рассмотрим для примера систе- му из двух линейных уравнений с двумя неизвестными апх + а12у = bi; + а22у = Ь2. (1.15) Умножим первое уравнение на a22l второе на а 12 и вычтем из первого второе. Получим (аца22 — a2iai2)x = (bja22 — 62^12)- Аналогично, умножив первое уравнение на «21, а второе — на «ц 16
и вычитая, получим («ц«22 — ^2\а\2)у — («1162 — «21615 Таким образом, \А\у = \А2 (1-16) где |А| = «11 «21 «12 «22 1-411 = bl «12 &2 «22 «11 bi «21 &2 ; 1Л1 = Матрица А — матрица коэффициентов при неизвестных в системе (1.15), называемая матрицей системы. Матрицы Ai и А2 получаются из матрицы А системы заменой первого и, со- ответственно, второго столбца на столбец правых частей систе- мы (1.15). Теперь, если определитель (А| отличен от нуля, то из (1.16) получаем Формулы (1-17) называются формулами Крамера. Пусть теперь Щ = 0, тогда, как легко проверить, одна из строк матрицы А (для определенности, вторая) получается из другой умножением на некоторое число X: «21 = Хац; «22 = Х«12- Если при этом и b2 = X6i, то второе уравнение системы (1.15) по- лучается из первого умножением на X. Следовательно, система (1.15) эквивалентна своему первому уравнению и имеет беско- нечно много решений. Если же b2 / Xbi, то система не имеет ни одного решения, т. е. несовместна. Аналогичные результаты имеют место и в общем случае. Рассмотрим систему п уравнений с п неизвестными «11Ж1 + «12^2 4 :... 4- а1пхп = bi; «21^1 + «22^2 + • • + «2п^п = 62; (1-18) «п1^1 4“ «п2^2 4“ • • • 4“ «пп^п = bi- Если правые части уравнений в (1.18) равны нулю, то система «113-1 + «123-2 4" • • • «1п®п — О, «213-1 + «22^2 + ... + а?пхп - 0; (1-19) «nl^l 4” «7/23-2 4 • • • 4" «пп^п = 0 17
(«11 ai2 • • • ain \ 21 «22 • • «2тг I ид ®nl «?г2 • • • &1пп/ коэффициентов при неизвестных называется матрицей систе- мы. Обозначим Аг, г = 1, ... ,п, матрицы, получающиеся из А (ЪЛ заменой г-ro столбца на столбец * I правых частей системы. \ч Имеет место следующая теорема. Теорема 1.3 (теорема Крамера). Если определитель |А| матрицы системы п уравнений с п неизвестными отличен от ну- ля, то система имеет единственное решение, определяемое по формулам Крамера (1.20) Для случая п = 2 эта теорема фактически доказана в рас- смотренном примере системы двух уравнений. Докажем теоре- му для случая п — 3. 1. Пусть система аца;1 + а12д?2 + «13^3 = bi; «21^1 + «22^2 + «23^3 = &2; «31^1 + «32^2 + «33^3 = Ьз имеет решение я:2, ^з- Умножив первое уравнение системы на Ац, второе — на А2ц третье — на А31 и сложив (здесь А^- — алгебраическое дополнение к элементу azy матрицы А), получим уравнение Х1(ацАц + «21^21 + «зМз1) + ^2(^12-411 + «22^.21 + «32^31) + + жз(«1зАи 4" «23^21 + «ззАзД = biАц + Ь2А21 + ЬзАзц в котором при по свойству 8 определителей стоит коэффици- ент |А|, а при т2, хз стоят коэффициенты, по свойству 9 равные нулю. Таким образом, Х11^4| — &1Ац + Ь2А21 + Ьз^4з1 ~ bi ai2 ai3 &2 ^22 ^23 Ьз «зз = |Ai|. 18
Аналогично получим а?2|А| = |А.2|; жз|А| = |Аз|. Следова- тельно, _ И1| _ |Аг| _ Аз| Х1 ~ |А| ’ Х2 ~ |А| ’ W “ |А| ’ и доказано, что если система имеет решение, то оно единственно и определяется по формулам Крамера (1.20). 2. Покажем, что формулы Крамера дают решение системы. В самом деле, подставив ~ jjp fc — 1,2,3, в г-е уравнение, i — 1,2,3, и использовав свойства 8 и 9 определителей, получим + ^2(^1^412 + &2^22 + 63Л32) + «гз(^М13 4~ ^2^23 + 63Л33)] = [61 (пйЛи 4“ «22^12 + П?зЛз1) + 62(«21^21 + «*2^-22 + «гЗ^з) + 4- Ьз(^г1Лз1 4- «42^32 + агзЛзз)] = bi\A\ = bi, так как скобки при 6^, к г, равны нулю. Значит, обращают все уравнения системы в тождества, и формулы Крамера (1.20) дают решение системы. Приведем без доказательства теорему, которая может быть получена как следствие теорем гл. 2. Теорема 1.4. Если определитель AI матрицы системы п ли- нейных уравнений с п неизвестными равен нулю, то система ли- бо несовместна, либо имеет бесконечно много решений. Одно- родная система п линейных уравнений с п неизвестными име- ет ненулевое решение тогда и только тогда, когда определитель матрицы системы равен нулю. В случае п — 3 утверждение теоремы может быть проверено непосредственно, как было проделано в начале этого подраздела при п — 2. Замечание. Систему уравнений (1-18) можно записать в виде матричного уравнения Ах = Ь, (1.21) (жЛ /бЛ ' I — вектор-столбец неизвестных, a b = I ‘ I — вектор- X?) j ybfl j столбец правых частей системы. Если А невырожденная матрица, то 19
по теореме 1.2 у нее имеется обратная А2 (см. формулу (1.14)). Умно- жив равенство (1.21) на А-1 слева, получим х — А~1Ь. Матрица Л-1 может быть найдена также посредством решения п систем линейных уравнений с п неизвестными: АВг = Ег, где Вг i-й столбец обратной матрицы; Ег — столбец, состоящий из нулевых элементов, кроме стоя- щего в 2-й строке и равного единице (г — 1, ..., п). 1.4. Векторы и действия над ними Пусть в пространстве задана декартова (прямоугольная) си- стема координат, т. е. имеется начало координат О, три взаимно- перпендикулярных оси: ось абсцисс Ох, ось ординат Оу и ось аппликат Oz, и выбран отрезок единичной длины. Каждой точ- ке А в пространстве взаимно-однозначно соответствует упоря- доченный набор чисел (яд, уд, гд), называемых координатами точки. Например, точки А(х, у, z) и В(—х, —у, —z) симметричны относительно начала координат, точки В(х,у, z) и С(—х, — у, z) симметричны относительно оси Oz, точки D(x,y,0) лежат на плоскости хОу. Вектором называется направленный отрезок в пространстве. Векторы равны, если с помощью параллельного переноса их можно совместить. Далее чаще всего будет неважно, к какой точке приложен вектор, и будем рассматривать поэтому свобод- ные векторы, т. е., строго говоря, классы равных между собой векторов. Обозначим единичные векторы вдоль осей координат Ох, Оу и Oz, i,j,k соответственно; это координатные орты, или базис пространства. Будем говорить, что три вектора а, Ь, с образуют правую тройку векторов, если при совмещении начал этих векторов кратчайший поворот от а к b будет виден с конца вектора с совершающимся против часовой стрелки, т. е. в положительном направлении. Если же поворот от а к b виден в отрицательном направлении, т. е. по часовой стрелке, то будем говорить, что а, Ь, с образуют левую тройку векторов. Будем считать, что декартова система в пространстве выбра- на так, что i,j,k образуют правую тройку. В этом случае будем говорить, что пространство положительно ориентировано. —> Каждый вектор а — АВ единственным образом представля- ется в виде суммы а — axi + ayj + azk, числа ах, ау, az называют- ся координатами вектора а = {ax,ay,az}. Будем также исполь- зовать для вектора а обозначение а^^о^аД, Нулевой вектор 20
О — {0,0,0} — это просто точка в пространстве, при этом на- правление его считается неопределенным. Координатные орты имеют координаты i — {1,0,0}, j = {0,1,0}, к == {0,0,1}. Наряду с декартовой системой координат в пространстве бу- дем рассматривать аналогичным образом введенную декарто- ву систему координат на плоскости, т. е. Ох и Оу — взаимно- перпендикулярные оси, i, j — координатные орты, при этом крат- чайший поворот от i к j есть поворот в положительном направле- нии; точки и векторы на плоскости будут иметь две координаты. Пусть a.{ax,ay,az} — вектор в пространстве. Длина |а| этого вектора определяется формулой 2 Z' Если вектор а приложен к точке А(ха, Уа, zA) и его конец нахо- дится в точке В(хв, ув, zb), то (хв - хА), (ув - Уа)- (zb - zA) — -----------------------> координаты вектора а — ЛВ, а расстояние между точками А и В равно длине вектора а: р(А, В) = |ЛВ| = |а| = л/(яд - яд)2 + (ув - уд)2 + (zB - £д)2. Векторы можно умножать на число: если а — вектор и X — произвольное число, то Ха есть вектор, длина которого равна |Х| |а|, Ха расположен на параллельной а прямой и направлен в ту же сторону, что и а, если X > 0, и в противоположную сторо- ну, если X < 0. При умножении вектора на число выполняются свойства: Р(Ха) = (рХ)а; (X + а)а = Ха + аа. Векторы можно складывать друг с другом, сумму двух векто- ров можно находить по хорошо известным правилам параллело- грамма или треугольника. При сложении векторов имеют место свойства коммутативности, а 4- b = b + а, ассоциативности (а + Ь) + с = а + (Ь + с) и дистрибутивности Х(а + Ь) — Ха ХЬ. Пусть а{аж, ау, az} и b{bx, by, bz}. Тогда a + b - (axi + ayj + агк) + (bxi + byj 4 bzk) - — (fix + bx)i + (ау |- by)j + + 6г)к, Ха = X(axi + ау] + п2к) = (Xa^)i + (Xa^j + (Xaz)k, т. е. при сложении векторов координаты складываются, а при умножении вектора на число координаты умножаются на это число. 21
Определение 1.12. Скалярным произведением ab векторов а и b называется число, равное произведению длин этих векто- ров на косинус угла ср между ними: ab = |а| b| cos ср. (1-22) Из этого определения вытекают следующие свойства. Свойства скалярного произведения 1. Коммутативность: ab = Ьа. 2. Дистрибутивность: (а + Ь)с — ас + Ьс. 3. (Xa)b — Х(аЬ). 4. а2 = аа |a|2cos0 = |а|2. 5. ab = 0 тогда и только тогда, когда а и b взаимно-перпен- дикулярны (нулевой вектор будем считать перпендикулярным любому другому вектору). Взаимно-перпендикулярные векторы а и b будем обозначать а ± Ь. 6. Для координатных ортов имеют место соотношения: ij = О, ik — 0, jk — 0, i2 = j2 = k2 ~ 1. Найдем выражение скалярного произведения векторов через координаты. Пользуясь свойствами скалярного произведения, получим для а{аж, ау, az} и Ь{ЬЖ, by,bz} ab = (аД + «Д + агк)(ЬД + ЬД + Ьгк) = т. е. имеет место формула ab — ах bx Н- ^у by Н- Oz b z- Далее, зная скалярное произведение двух векторов и их дли- ны, или зная координаты векторов, из (1.22) можно найти коси- нус угла между векторами ab cos ср = ТПЛЙ |а||Ь| ^xbx “Ь &уЬу И- azbz (1-24) Если известно скалярное произведение ab и длина вектора Ь, то можно найти алгебраическое значение проекции вектора а на вектор Ь: ГТ II I I аЬ Прьа = a cos ср = а т-т—т. а b Заметим, что если угол ср тупой, то Пр ьа < 0. 22
Определение 1.13. Косинусы углов между вектором и ося- ми координат называются направляющими косинусами этого вектора. Обозначим направляющие косинусы вектора cos a, cos [3, cos у. Ьэльзуясь формулой (1.24), учитывая, что по (1.23) ai = , aj = — ау, ak — az и что длины координатных ортов равны единице, найдем cosoc=—; cosp = cosy = —. (1.25) |a| |a| |а| В частности, если а — е — орт, т. е. вектор единичной длины, то cos а = еж; cosp — еу; cosy = ez. (1.26) Заметим, что направляющие косинусы любого вектора связа- ны соотношением cos2 а + cos2 р + cos2 у — 1. (1.27) Действительно, используя (1.25), получаем: 2 । 2 о I 2 cos а Н -cos р + cos у = Определение 1.14. Векторным произведением ах b векто- ров а и b называется вектор с, длина которого равна площади параллелограмма, построенного на а и b как на сторонах, с пер- пендикулярен плоскости, в которой лежат векторы а и Ь, если их отложить от одной точки, и направлен так, что а, Ь, с обра- зуют правую тройку векторов. Таким образом, если с — а х b (рис. 1,1), то: 1 1 |с| = |а| |b| sin ср, где ср — угол между векторами а и Ь; 2 ) с 1 а и с 1 Ь; 3 а, Ь, с правад тройка векто- ров. Непосредственно из определения следуют свойства. Сн 23
Свойства векторного произведения 1. а х b = 0 тогда и только тогда, когда а и b коллинеарны. 2. Антикоммутативность: а х b = —b х а. 3. (Ха) х b = Х(а х Ь). 4. i х j = k; j x k = i; k x i = j. 5. Дистрибутивность: (a^ b) x c = ax c + b xc. Используя свойства векторного произведения, выведем фор- мулу для выражения векторного произведения через координа- ты векторов. Пусть а{аж, ау. az} и Ь{ЬЖ, by, bz}. Тогда а х b = (axi + ayj + azk) х (bxi + byj + bzk) = Отметим, что площадь S/\ треугольника, построенного на а и Ь, как на сторонах, можно вычислить по формуле = ||а х Ь|. (1.29) Пример 1.15. Найдем площадь S треугольника, двумя сто- ронами которого являются векторы а{1; 2; — 1} и Ь{3;0;-4}. Имеем по формуле (1.28) ах Ь- • • 1 J 1 2 3 О к = —8i+j — бк. Значит по формуле (1.29) 11 1 S = -|а х Ь| = -\/б4 + 1 + 36 = -V101. ^24 Определение 1.15. Смешанным произведением abc трех векторов а, Ь, с называется число abc — (а х Ь)с, т. е. скалярное произведение векторов а х b и с. Из этого определения и свойств векторного и скалярного про- изведения следуют свойства. Свойства смешанного произведения 1. Антикоммутативность: abc = bac. 24
2. Дистрибутивность: (ai + aa)bc — aibc + азЬс. 3. (Ла) be = X(abc). 4. abc = 0 тогда и только тогда, когда а, b и с компланарны (т. е. будучи отложенными из одной точки, лежат в одной плос- кости) . Выведем выражение смешанного произведения через коор- динаты, Пусть а{аж, ау, az}, b{bx,by,bz}, c{cx,Cy,cz Тогда, ис- пользуя формулу (1.28) и свойство 8 определителей, получим abc = (а х Ь)с — Ьх ау by Cz — Л о- & H S H ri СУ- p «е «2 «е Ci СУ- p N Ц (м Ьу az bz ♦ (1.30) Су cz Выясним геометрический смысл смешанного произведения. Рассмотрим сначала случай, когда а, Ь, с образуют правую тройку. Построим параллелепипед на векторах а, Ь, с, как на сторонах \рис. 1.2). Тогда площадь S лежащего в основании па- раллелепипеда параллелограмма OBDA равна а х Ь|, вектор а х b перпендикулярен плоскости основания и высота h парал- лелепипеда, опущенная из вершины (7, равна |с cos ср. Следова- тельно, объем параллелепипеда V — Sh — |а х b |с| cos ср — (а х b)c = abc. Если а, Ь, с — левая тройка векторов, то проекция с на а х b и вектор ах b имеют противоположные направления, Л,— - |с| cos ср и V = —abc. Таким образом, abc — ±V, (1-31) т. е. смешанное произведение abc век- торов а, Ь. с равно объему параллеле- пипеда, построенного на векторах а, Ь, с, как на сторонах, взятому со зна- ком <<+», если а, Ь, с образуют правую тройку, и со знаком «—», если а, Ь, с образуют левую тройку. Рис. 1.2 25
Отметим, что объем Упир пирамиды, построенной на а, Ь, с, как на сторонах, учитывая (1.31), можно вычислить по формуле Кир = |v=||abc|. (1.32) bo Пример 1-16. Вычислим объем пирамиды с вершинами А(5;2;0), В(2;5;0), С(1;2;4), 0(0;0;0). Имеем ОА - {5;2;0}, ОВ = {2; 5; 0}, ОС — {1; 2; 4}. Тогда по формулам (1.30) и (1.32) о О пир — Пример 1.17. Выясним геометрическую интерпретацию ре- шений однородной линейной системы из трех уравнений «11^1 + «12^2 + «13^3 = 0; «21^1 + «22^2 + «23^3 — 0; «31^1 + а32%2 + «зз^з = 0. Пусть ai — {«Ц,«12,«13}? »2 — {«21 > «22, «2з}, ^3 = {«31? «32, «зз}> х = {^1,^2,^з}- Тогда данная система эквивалентна системе {aix — 0; а2х = 0; а3х = 0, т. е. вектор х перпендикулярен каждому из векторов аг, / = 1,2,3. Необходимо рассмотреть три случая: а) векторы а1,а2,аз некомпланарны, т. е. Д = aia2a3 — «11 «12 «13 «21 «22 «23 «31 «32 «33 0. Тогда имеется единственный вектор х = 0, перпендикулярный аг, г — 1,2,3, и значит, единственное решение системы = х2 — х3 — 0; б) векторы а1,а2)аз компланарны, а значит Д — 0, но ai, а2, а3 не являются коллинеарными, т. е. ai,а2, аз лежат в одной плоскости а, но не лежат на одной прямой. В этом случае х пер- пендикулярен а и множество решений образует прямую Z, пер- пендикулярную а; в) векторы ai,a2,a3 коллинеарны, т.е. лежат на одной пря- мой I. В этом случае множество решений образует плоскость [3, перпендикулярную прямой I. 26
1.5. Плоскость и прямая в пространстве Пусть а — плоскость в пространстве, N{A, В, С} — некото- рый вектор, перпендикулярный плоскости а; такой вектор назы- вается нормальным вектором к плоскости; 7Ио(жо, Уо, ^о) — неко- торая известная точка на плоскости. Очевидно, что любая другая точка M(x,y^z) будет лежать ------------------------------------------------> на плоскости а тогда и только тогда, когда векторы М^М и N ---------------------------------------> взаимно-перпендикулярны, т. е. когда NMqM — 0 (рис. 1.3). Пе- репишем это условие, используя выражение скалярного произ- ведения через координаты: А(х - х0) + В(у - уо) + C(z - г0) = 0. (1.33) Получили уравнение плоскости а, проходящей через задан- ную точку Л/о(:го7 3/0? ^о) и перпендикулярной заданному векто- руЩА,В,С}- Перепишем последнее уравнение в виде Ах + By 4- Cz 4- D = 0, (1.34) где D = —Axq — Byo — Cz$. Получим, что координаты точек плоскости удовлетворяют линейному уравнению первого поряд- ка. Покажем, что обратное утверждение тоже верно, т. е. если задано линейное уравнение вида (1.34), то это уравнение будет уравнением некоторой плоскости. Действительно, пусть удовлетворяют этому уравне- нию, т. е. + Ву$ 4- Czq + D — 0. Вычитая последнее уравнение из (1.34), получим А(х - хо) + В(у - уо) + C(z - г0) = 0, т. е. векторы N{A, В, С} и MqM{x — xq, у — уо, z — zq} взаимно- перпендикулярны. Это означает, что множество точек 7И(т, у, z) с координатами, удовлетворяющими уравнению (1.34), лежит на плоскости с нормальным вектором N{A,B,C}. Уравнение (1.34) называется общим уравнением плоскости. Отметим некоторые частные случаи общего уравнения плоскости: • при D ~ 0 получаем уравнение плоскости, проходящей через начало координат: Ах + By 4- Cz = 0; 27
• при С = 0 — уравнение плоскости, параллельной оси Oz: Ах + By + D = 0; • при С ~ D = 0 — уравнение плоскости, проходящей через ось Oz: Ах + By — 0; • при В = С = 0 уравнение плоскости, параллельной коор- динатной плоскости yOz: Ах + D — 0; • при В = С — D = 0 — уравнение координатной плоскости yOz: х — 0. Пусть плоскость а отсекает на осях координат отрезки а, 6, с. Тогда уравнение плоскости а может быть записано в виде урав- нения плоскости в отрезках Действительно, (1.35) — линейное уравнение первого по- рядка, так как может быть переписано в виде (1.34), значит, это есть уравнение некоторой плоскости р. Плоскость р про- ходит через точки (а,0,0), (0,6,0) и (0,0, с), так как коор- динаты этих точек удовлетворяют уравнению (1.35). Значит, плоскость р (1.35) отсекает на осях координат отрезки а, Ь, с. По известной аксиоме стереометрии через три различные точ- ки в пространстве проходит единственная плоскость, следова- тельно, а — р и уравнение (1.35) будет уравнением плоско- сти а. Пример 1.18. Рассмотрим следующую задачу. Пусть даны три различные точки Mi(xi,yi, zi), М2(х2,у2, z2), М3(х3,у3, z3). Напишем уравнение плоскости а, проходящей через эти точки. Векторы 7И17И2{^2 - ^1,у2 - z2 - zj и 7И17Из{ж3 ~Х1,уз- — У1ч “ zi} лежат на плоскости а (рис. 1.4), и их векторное про- изведение перпендикулярно плоскости а (см. определение 1.14). Значит, в качестве нормального вектора к плоскости а может быть взят вектор N - мА х мА • • 1 J ~ «1 у2 - У1 Х3 ~ X! у3- у! (1.36) Чтобы написать уравнение плоскости а осталось воспользо- ваться уравнением (1.33), где в качестве жо,уо, zo можно подста- вить координаты любой из заданных точек Mi, М2, М3. Например, если МД; 2;— 1), М2(—2; 1; 3), Мз(2;3;4), то М1Мг{-3;-1;4}, МгМз{1;1;5} и по (1.36), (1.28) N = MiM2x 28
xMiM$ — i -3 1 = —9i + 19j - — 2k, и уравнение плоскости будет -9(х - 1) + 19(1/ - 2) - 2(г + 1) = О, т. е. 9х — 19у + 2г + 31 — 0. Другой способ решения задачи: за- ---------------------> -----> метим, что векторы MiM, М^М?, и -----> М1М3, где М(ж,у,г) — производная точка плоскости, компланарны, следовательно, их смешанное произведение по свойству 4 равно нулю, что дает уравнение плос- кости, проходящей через три различные точки: х ~ Xi Х2 “ жз — Х\ У ~У1 У2~У1 Уз ~ У1 Z — Zi ^2 - Z3 ~ (1-37) В случае АД (1; 2; —1), М2(2; 1; 3), Мз(2;3;4) по формуле (1.37) Раскрывая определитель по первой строке, получим (ж _ 1)(—9) - (у - 2)(-19) + (г + 1)(-2) = 0, т. е. 9х — 19у + 2г+31 = 0 — уравнение искомой плоскости. Выведем так называемое нор- мальное уравнение плоскости. Пусть р — расстояние от начала координат до плоскости к (рис. 1.5), точка Mi — основание перпендику- ляра, опущенного на к из начала координат, М(х,у, г) произволь- ная точка плоскости. Обозначим че- рез е единичный вектор, сонаправ- -------------> , ленный с О Mi; вектор е является нормальным вектором плоскости к. Если плоскость к проходит через па- Рис. 1.5 29
чало координат, то обозначим е единичный нормальный вектор. Как видно из рисунка, р = ОМ\ есть значение проекции вектора О7И{т, у, z] на вектор е, значит, ОМ • е — р, т. е. ОМ • е — р — 0. (1.38) Координатами вектора е являются его направляющие косину- сы cos a, cosp, cosy (см. (1.26)), следовательно, равенство (1.38) можно переписать в виде х cos а 4 у cos р 4 z cos у — р = 0: (1.39) это и есть нормальное уравнение плоскости. Заметим, что если Мо(жо,Ро5^о) — некоторая точка в про- странстве, то расстояние d от точки Мо^х^уо, zq) до плоско- сти к (см. рис. 1.5) равно d — |Пр GOMo — О Mi | = |яо cos а 4 у$ cos р 4- zq cos у -р|. (1.40) Пусть плоскость к задана общим уравнением Ах 4- By + Cz 4 4 D = 0. Так как это уравнение и (1.39) определяют одну и ту же плоскость, то их соответствующие коэффициенты пропор- циональны, т. е. при некотором X cos а = ХА; cosp = XB; cosy = XC; р — XD, (1.41) причем, используя свойство (1.27), имеем |х| = \А2 + в2 + с2 ’ Подставив (1.41) в (1.40), получим формулу расстояния от точ- ки Мо(хо, уо, zo) до плоскости Ах + By + Cz + D = 0: , _ |Лж0 + Бур + Cz0 + £>| v Л2 Ч - В2 + С2 (1-42) Рассмотрим возможные случаи взаимного расположения плоскостей и а: А±х 4 Biy 4 C±z + Di = 0 и р: А%х 4 В2У 4 C%z 4 4D2 = 0. Очевидно, эти плоскости параллельны тогда и только тогда, когда их нормальные векторы коллинеарны, т. е. если Если пропорциональны все коэффициенты уравнений 30
Ai _ Bi _ G 01 A -2 B‘2 C'2 D? ’ (1-44) то плоскости аир совпадают. Далее, плоскости аир перпендикулярны тогда и только то- гда, когда AiA2 + BiB2 + (7i(72 = 0. (1-45) Угол между плоскостями можно найти через угол между нормальными векторами плоскостей, так что cos ср = ± ЛМ2 + ВХР2 + CiC2 Л/А? + в? Ч- + cl (1-46) Формулы (1.43) — 11.46) позволяют выяснить взаимное распо- ложение двух плоскостей. Рассмотрим теперь в пространстве прямую с направляющим вектором a{Z,m, п}, проходящую через точку Л/о(то,уо?^о) (рис. 1.6). Точка 7И(т, у, z) будет лежать на прямой тогда и толь- ко тогда, когда векторы а и М$М{х — х^,у — уц, z — го} коллине- арны, т. е. х-ху _ у-уъ _ г -г0 I т п (1-47) Уравнения (1.47) называются каноническими уравнениями пря- мой. Если некоторые (не все!) координаты вектора а обращают- ся в нуль, то запись уравнения в виде (1.47 договорились сохра- нить. считая, что в этом случае числитель такой дроби в (1.47) тоже должен равняться нулю, и, значит, соответствующая коор- дината точки на прямой не меняется. Например, если I — 0, то х = хо для всех точек прямой, и прямая перпендикулярна оси абсцисс. Если на прямой известна еще одна точка Му\ ад,3/1, гД, то в качестве направляющего вектора а может быть взят вектор М$М\{х\ — г' — XQ^yi — 2/0— ^0}. Подставив коор- динаты этого вектора вместо Z, т, п в (1.47), получим уравнения прямой, проходящей через две заданные точки X ~ то У_^У^ = - ~ (Ъ48) о----------Г XI - то У1 - Уо , - Zq / Условие коллинеарности векторов /к М$М и а можно записать в виде Еис. 1-6 31
----> М$М = fa, где t может принимать произвольные значения. Пе- репишем это равенство в координатах: х — xq — It, у — у$ — mt, z — zq = nt, откуда получим параметрические уравнения прямой х — хо + It; У = Уо + mt; Z — Zq + nt. (1.49) Прямая может быть получена как линия пересечения двух плоскостей. Рассматривая уравнения этих плоскостей совмест- но, получим систему уравнений Aix + Bly + Ci z + Di = 0; А2х + В2у + C2z + D2 = 0, (1.50) которым должны удовлетворять координаты точек на прямой. Это общие уравнения прямой. Угол ср между двумя прямыми с направляющими вектора- ми ai{Zi,mi,ni} и э.2{12,т2,п2} определяется как угол между этими векторами, т. е. aia2 hl2 + mim2 + П1П2 д/Z2 + m2 + д/^2 + т2 4" п1 Угол ф между прямой с направляющим вектором a{Z, т, п} и плоскостью Ax + By + Cz + D — 0 может быть определен через угол ср между направляющим вектором прямой и нормальным вектором плоскости, т. е. эшф = | cos (р| = \Al + Вт + Сп\ \А2 + В2 + (72v7Z2 + m2 4- п2 Расстояние d от точки Mi(x±, у\, Z\) до прямой с направля- ющим вектором a{Z, т, п}, проходящей через точку Mo(xo,yo,zo), равно |MoMi| sin ср и может быть вычислено по формуле |а| У1 -Ув ^1 - Z() т п X! - То Zi - Zq L п ~ У1 - Уо I т 2 32
Пример 1.19. Написать в канонической форме уравнения прямой d, заданной общими уравнениями (1.50). Решение. Направляющий вектор а прямой d перпендикуля- рен нормальным векторам Ni{Ai,£?i,Ci} и ^{^2,52,02} за- данных плоскостей, так как прямая лежит в каждой из этих плоскостей. Следовательно, в качестве а можно взять вектор a — Ni х N2. В качестве координат точки Мо па прямой мож- но взять какое-нибудь решение системы из уравнений заданных плоскостей. Пример 1.20. Провести плоскость а через прямую d: X ~ Хо у — Уо Z — Zq _ _ z __ — — = --------- — -----и точку Mi(xi,yi)Z]}. Найти расстоя- I т п ние от точки М2(х2, У 2^2) ДР найденной плоскости. Решение. Нормальный вектор N к искомой плоскости а пер- пендикулярен направляющему вектору прямой a{Z,m,n} и век- тору MqMi{rri — У1 — Уо, z± — zq}. Следовательно, можно взять N ~ а х MqMi и записать уравнение плоскости (1.33). Для на- хождения расстояния от точки 7/2^2) ДО плоскости вос- пользуемся формулой (1.42). Пример 1.21. Написать уравнение плоскости а, проходящей через прямую d, являющуюся пересечением плоскостей ai: Агх + В2у + Ciz + £>i = 0; 0С2: А2х + В2у + C2z + jD2 — О и проходящую через заданную точку Mi(^i, j/i, zi). Решение (первый способ). Как в примере 1.19 найдем направ- ляющий вектор прямой а = Ni х N2, где Ni = {Л1, Bi, С;}, N2 = {А2, В2, С2}) и задача свелась к примеру 1.20. Решение (второй способ). Воспользуемся уравнением пучка плоскостей, проходящих через заданную прямую: р(Л1.т + В\у + C\z + £>1) + »(А2х + В2у + C2z 4- D2) ~ 0. (1.52) Здесь параметры р и v принимают произвольные значения. При каждой паре значений р и v (1.52) является линейным уравнени- ем и, значит, задает некоторую плоскость. Эта плоскость прохо- дит через прямую d, так как координаты точек прямой обраща- ют в тождества уравнения плоскостей oti и «о, и значит, выраже- ния в скобках в (1.52) равны нулю. При р = 0 получаем уравне- ние плоскости (Х2, при v = 0 — уравнение плоскости ар Чтобы 33
выделить из пучка плоскость, проходящую через точку Mi, под- ставим в (1.52) координаты точки М±. Получим для определения (1 и v уравнение ц(Л1Ж1 + Bxyi + CiZ! + D1) + v(A2si + В2У1 + C2Z! + Z>2) = 0. Осталось подобрать p и v так, чтобы удовлетворялось это уравнение и подставить найденные значения р и у в уравнение пучка (1.52). Пример 1.22. Найти точку пересечения прямой d: = у-уо г-г0 л । о > n п —------=-------с плоскостью а: Ах + By + С г + D = 0. т п Решение. Воспользуемся параметрическими уравнениями прямой (1.49). Координаты точки Mi (яд, у 1,21) пересечения пря- мой с плоскостью должны удовлетворять уравнению плоскости. Обозначим £i соответствующее значение параметра. Тогда A(lti + ^о) + B(mti + уо) + C(nti + го) 4- D = 0. Определим из этого уравнения И, подставим в параметрические уравнения прямой и найдем яд, тд, 21. Пример 1.23. Написать уравнения перпендикуляра к пря- мой d с направляющим вектором а{/,т,тг}, проходящего через заданную точку Мл(я:о, у о, %о)- Под перпендикуляром понимаем прямую, пересекающую данную прямую d: и перпендикулярную к ней. Решение. Проведем через заданную точку Mq плоскость а с нормальным вектором N — а, т. е. перпендикулярную прямой d. Уравнение этой плоскости (1.33). Найдем точку Му пересечения прямой d с плоскостью а (см. пример 1.22). Осталось написать уравнение (1.48) прямой, проходящей через две заданные точки Mi и Mq. Длина перпендикуляра, опущенного из точки М® на d, равна расстоянию между точками Mq и Mi, а также может быть вы- числена по формуле (1.51). 1.6. Кривые второго порядка Определение 1.16. Эллипсом называется геометрическое место точек плоскости, сумма расстояний п и Г2 которых до двух данных точек Fi и F2. называемых фокусами, есть вели- чина постоянная, равная 2а. 34
Таким образом, для точек эллипса и только для них выполняется усло- вие Расстояния Г1 и называются фо- кальными радиусами точки; прямая, на которой лежат фокусы и F2, на- зывается фокальной осью. Обозначим 2с расстояние между фокусами. Введем каноническую систему координат эллипса таким об- разом, что начало координат находится в середине отрезка F1F2 и осью Ох является фокальная ось (рис. 1.7). Из рисунка и опре- деления эллипса ясно, что а > с. Если а — с, то эллипс вырожда- ется в отрезок F1F2. Поэтому будем считать, что а > с. Эксцен- с триситетом эллипса называется число е = — < 1. Обозначим а Ь2 — а2 — с2; а называется большой полуосью, b — малой полу- осью эллипса. Теорема 1.5. Уравнение эллипса в канонической системе ко- ординат имеет вид а2 Это уравнение называется каноническим уравнением эллипса. Доказательство. Пусть 7И(т,у) — произвольная точка эл- липса. Условие (1.53) записывается в виде Перепишем последнее уравнение Возведя в квадрат почленно и раскрыв скобки, получим а у/ (х — с*)2 + у2 ~ а2 — хс. Снова возведя в квадрат и используя обозначение а2 - с2 ~ 62, получим о х + а у — а Ь. х2 у2 или —5- + 75- — 1. Таким образом, если точка принадлежит эл- а* о2 липсу, то она удовлетворяет каноническому уравнению (Д .54). 35
Докажем обратное утверждение, а именно, что каждая точка Л/(ж, у), координаты которой удовлетворяют уравнению (1.54), есть точка эллипса, тем самым теорема будет окончательно до- казана. Из (1.54) следует, что |ж| < |а|, у| < Ь, и, значит, |еж| < |ж| < а. Также из (1.54) Используя это выражение, для п получим — у/2хс + а2 + е2ж2 ~ \/(а + еж)2 — |а + еж| — а + еж. Учли, что |еж| < а, и значит, всегда а + еж > 0. Точно так же Г2 = а — еж, и, следовательно, условие (1.53) выполняется. Определение 1.17. Гиперболой называется геометрическое место точек плоскости, модуль разности расстояний г± и Г2 каж- дой из которых до двух фиксированных точек Fi и F2, называе- мых фокусами, есть величина постоянная, равная 2а. Таким образом, для точек гиперболы, и только для них, вы- полняется условие И - Г2 = ±2а. (1.55) Как и в случае эллипса, г\ и Г2 называются фокальными ради- усами точки, а прямая, на которой лежат фокусы F± и F2, на- зывается фокальной осью. Обозначим 2с расстояние между фо- кусами и введем, как и в случае эллипса, каноническую систему координат гиперболы (рис. 1.8). Рис, 1.8 36
Из рисунка и определения гиперболы ясно, что с > а Если с — а, то гипербола, т. е. множество точек со свойством (1.55), вырождается во множество точек (-ос, —с] U [с, +оо) на фокаль- ной оси Ох. Поэтому будем считать с > а. Эксцентрисите- с том гиперболы называется число е — — > 1. Обозначим также а Ь2 — (? ~ а2. Теорема 1.6. Уравнение гиперболы в канонической системе координат имеет вид 2 Это уравнение называется каноническим уравнением гипер- болы. Доказательство этой теоремы аналогично доказательству теоремы 1.5, и здесь не приводится. Упражнение 1.7. Докажите, что координаты точек гипер- болы удовлетворяют уравнению (1.56). Ь Прямые у — ±—х называются асимптотами гиперболы. а Можно показать, что точки гиперболы при неограниченном уве- личении |л?| неограниченно приближаются к асимптотам. Определение 1.18. Директрисой эллипса (гиперболы), со- ответствующей данному фокусу F, называется прямая d, пер- пендикулярная фокальной оси кривой и отстоящая от центра на а расстояние —. £ Можно доказать, что как эллипс, так и гипербола являются геометрическим местом точек, отношение расстояния от кото- рых до фокуса к расстоянию до Соответствующей директрисы равно е (см. рис. 1.7 и 1.8). Определение 1.19. Параболой называется геометрическое место точек на плоскости, равноудаленных от заданной точки F, называемой фокусом, и от некоторой прямой d, называемой директрисой. Обозначим р расстояние от фокуса до директрисы параболы. Введем каноническую систему координат параболы таким об- разом, что ось Ох проходит через точку F перпендикулярно ди- ректрисе, а начало координат находится на оси Ох посередине между фокусом и директрисой ( рис. 1.9). 37
Рис. 1.10 Теорема 1.7. Уравнение параболы в канонической системе координат имеет вид у2 - 2рх. (1.57) Уравнение (1.57) называется каноническим уравнением пара- болы. Доказательство. Из определения параболы и рис. 1.9 следу- ет, что точка М(х,у) лежит на параболе тогда и только тогда, когда 2 , откуда у2 = 2рх. Введем для параболы эксцентриситет е = 1. Тогда, очевид- но, парабола, как эллипс и гипербола, является геометрическим местом точек, отношение расстояния от которых до фокуса к расстоянию до директрисы равно е. Отметим еще одно свойство эллипса, гиперболы и параболы. Все эти кривые являются коническими сечениями, т. е. сечения- ми круглого конуса различными плоскостями (см. подразд. 1.7). Пример 1.24. Найдем угол р, образованный фокальным ра- диусом MoF точки Л7о(т(), т/о), лежащей на параболе, и касатель- ной к параболе, проведенной в точке Mq (рис. 1.10). Ввиду симметрии можно считать, что точка М$ лежит на верхней ветви параболы при у > 0, которая описывается функ- цией f(x) — у/2рх. Касательная в точке Mq имеет угловой коэф- 38
фициент ki — tga = /'(xq) — -^=. Прямая FMq имеет уг- \/2pxp левой коэффициент &2 = —п — 1—Тангенс угла, между х0-- 2ж0~Р 2 касательной и прямой FMq определяется по формуле к — tg (3 — = 7^?-—Подставив сюда значения к\ и к^ получим к = tg [3 — Р vf2pxo — /д, т.е. угол между фокальным радиусом точки и касательной к параболе в этой точке равен углу а наклона касательной. Отсюда получаем следующее оптическое свойство параболы: лучи света, параллельные оси параболы, после отра - женил от параболы попадают в фокус. Упражнение 1.8. Докажите, что фокальные радиусы про- извольной точки эллипса образуют равные углы с касательной к эллипсу в этой точке. Отсюда получим оптическое свойство эллипса: луч света, выпущенный из какого-либо фокуса эллипса, после отражения от эллипса попадает в его другой фокус. Эллипс, гипербола и парабола являются кривыми второго по- рядка. Общее уравнение кривой второго порядка имеет вид F(x,y) = 0, где F(x.у) — ацх' 4- Zauxy + а^у2 + 2uiz + 2а2у + (1.58) (1.59) — общий многочлен второй степени, причем хотя бы один из ко- эффициентов ац, ai2, 022 не равен нулю. Найдем новую декартову систему координат на плоскости, в которой уравнение кривой (1.5S) приняло бы возможно более простой — канонический — вид. К новой декартовой системе ко- ординат можно перейти с помощью преобразований поворота на некоторый угол и параллельного переноса. Пусть в (1.591 П12 7^ 0. Сделаем преобразование поворота на угол а, при этом, как можно показать, х — .r'jcos а — yf sin а; у — х sm а -4- у cos а. (1.60) Получим 39
F(x, у) — ац (х' cos а — у sin а)2+ +2^12 (#z cos а — yf sin а) (я/ sin а + yf cos а) + 4- tt22(^z sin а + у cos а)2 + 2ai (xf cos а — у' sin а) 4- + 2^2 (X sin а 4- у' cos а) 4- ад = = а'и.т'2 + 2а'12ж'у' + а,22у'2 + 2а'гг-' + 2а2у' + а0 = F'(x', у'), где а'п = ац cos2 а 4- 2ai2 cos а sin а 4- (122 sin2 а; а'12 = а12 cos2 а 4- + («22 “-ац) cos а sin а —(112 sin2 а; а22 == ah sin2 а-2ai2 cos а sin а4- 4- а22 cos2 а; а{ = ai cos а 4- (12 sin а; af2 = cos а — «i sin а. Очевидно, при преобразовании (1.60) степень многочлена не может повыситься, но она и не может понизиться, так как в про- тивном случае вернувшись к старым координатам с помощью поворота на угол (—а) мы не сможем получить у) второй степени. Определим угол а так, чтобы а'12 — 0, т. е. 2 / • . о а 12 cos а 4- (&22 ~ ац) cos а sm а — ai2 sin а = 0. Решение этого уравнения всегда существует. Таким образом, уравнение кривой приводится к виду a'nrr'2 4- a22y72 + 2а\х' + 2а2г/ + а'о — В случае, если ai2 — 0, выполнять преобразование поворота нет необходимости. Следующим шагом будет выделение полных квадратов по тем переменным, у которых в выражении F'(x,y) есть квадрат. Например, a'n ф 0. Тогда собираем в Ff(x\yf) все члены, содер- жащие х' аих/2 + 2a 1 х1 — а!п и делаем преобразование переноса, содержащее для хг строку Уравнение преобразуется к одному из следующих видов: rt" ~"2 . ff ff2 , ff п. anx 4-a22?/ 4- a0 — u, a'/^"2 + 2a^y" + a'o'- 0; а'2'2У'2 4- 2af[x,f 4- a" - 0. 40
Далее, при необходимости, выполняем еще одно преобразова- ние переноса. Например, в последнем уравнении, если а" 0 и (Zq 0, сделаем преобразование переноса а” 2а"' и уравнение преобразуется в уравнение параболы /// ///2 . _ п i *£ — О. Окончательно уравнение кривой второго порядка приведется к одному из следующих девяти видов (штрихи при хну опуще- ны). Классификация кривых второго порядка — 1 — эллипс с полуосями а и Ь. Ж2 7/2 2. -тг + то = —1 — мнимый эллипс, не имеет ни одной tr действительной точки. Т2 Z/2 3. — тт — 1 — гипербола с полуосями а и Ь. (г 9 9 Л Х У г. X у 4- — То — 0 -- пара пересекающихся прямых---------— О ст er а b 5. — 0 — пара мнимых пересекающихся пря- мых, имеет единственную действительную точку (0,0). 6. у2 — 2рх — парабола с параметром р. 7. х2 = а2 — пара параллельных прямых х = ±а. 8. х2 — —а2 — пара мнимых параллельных прямых, не имеет ни одной действительной точки. 9. х? = 0 — пара соепадающих прямых х — 0. Пример 1.25. Приведем к каноническому виду уравнение кривой 2х2 + 4ху — у2 = 12. Сделаем преобразование поворота (1.60). т. е. подставим в уравнение кривой х = Усова — у 'sin а, у = xf sin а + yf cos а. После приведения подобных получим 41
х'2 (2 cos2 а + 4 cos а sin а — sin2 а)+ 4- ж'?/(4 cos2 а — б cos а sin а — 4 sin2 а)+ + у'2 (2 sin2 а — 4 cos а sin а ~ cos2 а) = 12. Для определения угла поворота приравняем нулю коэффици- енты при xfyf\ —4 cos a sin а + 4 cos2 а — 4 sin2 а — 2 cos а sin а = 0. Это приводит к уравнению относительно tg а 2 tg2 ос -h 3 tg ос — 2 = 0, корни которого tga = - и tga = —2. Выберем угол поворота 2^ 1.1 2 а = arctg™. Тогда sin а = —cos а = —и после подстанов- 2 V5 у5 ки в преобразованное уравнение получим в новых координатах ж'2 у12 уравнение кривой —-— = 1. Это уравнение гиперболы с по- 4 6 луосями а = 2 и b = \/б. Пример 1.26. Приведем к каноническому виду уравнение кривой х2 + 2у2 + 4х — 8у + 8 = 0. В уравнении отсутствует член с произведением неизвестных ху. Выделим полные квадраты по х и у\ (х + 2)2 + 2(у - 2)2 - 4 = 0. Сделаем преобразование переноса х = х' — 2, у = у' + 2, и при- ж/2 у12 ведем уравнение к виду х'2 + 2у'2 = 4, или-----И — = 1. Это уравнение эллипса с полуосями а = 2 и b = \/2. 1.7. Поверхности второго порядка Всякое уравнение второго порядка F(x,y,z) = 0, где F(x, у, г) = апх~ + 2а12ху + 2а13жг + а22у2 + 2а23уг + а33г2 + + 2ахж + 2а%у + 2азг + По, и хотя бы один из коэффициентов 7^ 0, есть уравнение некоторой поверхности второго поряд- ка. В некоторой канонической системе координат уравнение по- верхности второго порядка может быть приведено к одному из следующих 17 типов. 42
Классификация поверхностей второго порядка 1. Эллипсоид (рис. 1.11 с полуосями а, 6, с х2 у2 z2 а2+^ + -> Эллипсоид лежит внутри прямоугольного параллелепипеда —а < х < а, —Ь < у < Ь, —с < z < с и, следовательно, явля- ется ограниченной поверхностью. По этой причине все плоские сечения эллипсоида являются эллипсами. Например, в сечении плоскостью z — h^ |h\ < с получаем эллипс Если какие-нибудь полуоси равны, то имеем эллипсоид враще- ния, а если все полуоси равны, а — Ъ — с, то — сферу х2 + у2 + + z2 — а2 радиуса а. 2. Мнимый эллипсоид не имеет ни одной действительной точки. 3. Однополостный гиперболоид (рис. 1.12 Рис. 1.11 Рис. 1.12 43
В сечении плоскостью z ~ h получаем эллипс При сечении плоскостью х = h, \h /а, или плоскостью у = h, |Л[ ф 6, имеем гиперболы, а плоскостью х — ±н или у — ±Ь — пары пересекающихся прямых. У однополостного гиперболоида есть два семейства так назы- ваемых прямолинейных образующих по одному представителю из которых Zi и 1% изображено на рис. 1.12. Можно показать, что через каждую точку однополостного ги- перболоида проходит по одной прямой из каждого семейства, це- ликом лежащей на этой поверхности. 4. Двуполостный гиперболоид (рис. 1.13) При сечении плоскостью z — /1, \h\ > с получаем эллипс; при \h\ < с плоскость z — h и двуполостный гиперболоид общих точек не имеют. Сечениями плоскостями z = hwy = h являются гиперболы. 5. Конус (рис. 1.14) Сечениями плоскостью z = h являются эллипс, сечениями плоскостями х ~ h w у = — гиперболы, а при h ~ 0 по- лучаем пары пересекающихся прямых. При надлежащем выборе плоскости можно получить в сечении и параболы (см. рис. 1.14). Поэтому эллипсы, гиперболы и параболы называются кониче- скими сечениями. 6. Мнимый конус 44
Рис. 1.13 Рис. 1.14 Единственная действительная точка этой поверхности есть точ- ка (0; 0; 0). 7, Эллиптический параболоид рис. 1.15) В сечении плоскостью z = h, h > 0 лежит эллипс, при сечении плоскостью х — h или у = h получаем параболы. 8. Гиперболический параболоид (рис. 1.16) 45
В сечении плоскостями z = Л, h / 0 получаем гиперболы; плос- костью z ~ 0 - пару пересекающихся прямых; плоскостями х — h или у — h — параболы. Гиперболический параболоид име- ет два семейства прямолинейных образующих Следующие четыре поверхности называются цилиндрически- ми. Их уравнение в канонической системе координат Г(ж, у) = О, где F(x,y) — многочлен второй степени от двух переменных. Кривая у) ~ 0 в плоскости хОу называется направляющей и может быть эллипсом, действительным или мнимым, гипер- болой или параболой. Прямые, параллельные оси Oz, проходя- щие через какую-либо точку направляющей, называются обра- зующими. 9. Эллиптический цилиндр (рис. 1.17) а2 Ь2 10. Мнимый эллиптический цилиндр х2 у2 а2 + Ь2 ~ не имеет действительных точек. Рис. 1.18 46
11* Гиперболический цилиндр (рис. 1.18) 12. Параболический цилиндр (рис. 1.19) у2 — 2рх. Наконец, следующие пять поверх- ностей распадаются на пары плоско- стей. 13. Пара пересекающихся плос- костей Рис. 1.19 а2 Ь2 состоит из двух пересекающихся плоскостей---- — 0 и —k а b а 14. Пара мнимых пересекающихся плоскостей имеет действительные точки только на оси Oz. 15. Пара различных параллельных плоскостей состоит из плоскостей х = ±а. 16. Пара мнимых параллельных плоскостей не имеет действительных точек. 17. Пара совпадающих плоскостей есть множество точек координатной плоскости х — 0. 47
1.8. Полярная, цилиндрическая и сферическая системы координат Для определения полярной системы координат на плоскости необходимо задать: • масштаб (единицу измерения длины); • начало или полюс О системы координат; • полярную ось Or, т. е. полуось, исходящую из полюса. Тогда для каждой точки М плоскости (рис. 1.20) определя- ------------------------------------------> ется полярный угол — угол наклона ср вектора ОМ к полярной оси, ~оо < ср < +оо, и полярный радиус г — длина вектора ОМ. Эти пары чисел (ср, г) и называются полярными координатами точки М на плоскости. Введем декартову систему координат с тем же масштабом, с началом координат в точке О и осью Ох, положительная полу- ось которой совпадает с полярной осью Or (см. рис. 1.20). Тогда имеем очевидные формулы х = г cos ср; у — г sin ср, (1.61) (1.62) Формулы (1.61) и (1.62) позволяют перейти от полярных ко- ординат к декартовым и обратно. Угол ср в формулах (1.62) опре- деляется с точностью до целого кратного 2л. Для однозначного задания ср обычно выбирают промежуток длиной в период, на- пример от 0 до 2л. Так, уравнение окружности х2 + + у2 = а2 в полярных координатах примет вид г — а; уравнение х2 + у2 — — 2ах = 0 окружности радиуса а с цен- тром в точке (а, 0) в полярных коорди- натах будет следующим: г — 2а cos ср. На рис. 1.21 представлена кривая, называемая логарифмической спира- лью, уравнение которой в полярных координатах г ~ а\ 48
Рис. 1.21 Рис. 1.22 На рис. 1.22 изображена кривая «трехлепестковая роза» с уравнением в полярных координатах г — cos Зср. Замечание. Рассмотрим для эллипса, гиперболы и параболы по- лярную систему координат так, чтобы полюс совпал с одним из фоку- сов для эллипса и гиперболы и с фокусом в случае параболы; поляр- ную ось выберем совпадающей с фокальной осью. Тогда для каждой из этих кривых в полярных координатах получится одно и то же урав- нение г = 1(J.63) 1 — е cos 9 (для гиперболы это уравнение одной из ветвей). В формуле (1.63 для эллипса и гиперболы фокальный параметр р = —. а Пусть теперь М(ж, у, z) - точка в пространстве с декартовы- ми координатами т, ?/, z. Введем на плоскости хОу полярную си- стему координат с началом в точке О и полярной осью Or, сов- падающе й с положительным направлением оси Ох {рис. 1.23). Тогда если ср, г — полярные координаты ортогональной проек- ции Мо точки М на плоскость хОу и z — аппликата, то числа ср, г, z называются гщлиндрическими координатами точки 7И, 49
при этом очевидны соотношения, связывающие цилиндрические и декартовы координаты точки {х — г sin ср; y = rcoscp; (1.64) Z — Z. Пример 1.27. Выведем уравнение гиперболического пара- болоида х2 — у2 — z в цилиндрических координатах. Подста- вив вместо х и у их выражения через г и ср из (1.64), получим г2 cos2 ср — г2 sin2 ср = z, т. е. z = г2 cos 2ср — уравнение этого ги- перболического параболоида в цилиндрических координатах. Для каждой точки М пространства, не лежащей на прямой Oz, могут быть определены следующие величины (рис. 1.24): • полярный радиус г точки М, равный длине вектора О7И; г > 0; • долгота ср точки М — полярный угол ортогональной про- екции Mq точки М на плоскость хОу, 0 < ср < 2к; -—» • широта ф точки М — угол между вектором ОМ и его про- -------> к к екцией OMq на плоскость хОу; — - < ф < -. Числа ср, ф, г называются сферическими координатами точки М в пространстве. Нетрудно видеть, что сферические и декар- товы коодинаты точки связаны соотношениями (х — г cos ф cos ср; у = г cos ф sin ср; (1.65) Z ~ Г 8шф. Пример 1.28. Напишем уравнение гиперболического пара- болоида х2 — у2 = z в сферических координатах. Подставив выражения для ж, у, z из (1.65), получаем г2 cos2 фcos2 ср — — г2 cos2 ф sin2 ср = г sin ф, откуда sin ф г —--------——_ cos2 ф cos 2ср уравнение этой поверхности в сферических координатах. 1.9. Комплексные числа В дальнейшем нам понадобится расширение множества дей- ствительных чисел — так называемые комплексные числа. 50
Определение 1.20. Комплексные числа — это упорядочен- ные пары in, Ь) действительных чисел с покомпонентной опера- цией сложения (а, Ь) + (с, d) — {а + с, b + d) и умножением, которое задается правилом (а. Ь)(с, d) = {ас — bd, ad + be). (1.66) (1.67) Комплексное число z — (а, b) может быть отождествлено с точкой на плоскости с координатами (а, Ь) или с радиусом- вектором этой точки (рис. 1.25) с естественной покомпонент- ной операцией сложения (1.66) и умножением по формуле (1.67). В таком случае плоскость называется комплексной плоскостью. Множество комплексных чисел обозначается буквой С. Действительные числа, соответствующие точкам на действи- тельной оси Ох, будем отождествлять с комплексными числами вида (а, 0) и обозначать (а, 0) = а. Обозначим число (0,1) = г, тогда по формуле (1.67) г2 = (0,1)(0,1) = (—1,0) = —1. Число i называется мнимой единицей. Числа вида (0, Ь), соот- ветствующие точкам на оси Оу, называются чисто мнимыми, и для них имеем (0, Ь) = (Ь, 0)(0,1)=Ьг. Таким образом, каждое комплексное число {а, Ь) представимо в виде z = {а, Ь) = (а, 0) + (0, Ь) = а + Ы, (1.68) где a, b Е R. Это алгебраическая форма комплексного числа. При этом а называется действительной частью комплексного числа и обозначается а = Re г, а b — мнимой частью комплексного числу и обозначается b = Im z. Арифметические действия над комплексными числами в форме (1.68) можно выполнять по алге- браическим правилам. Например {а + Ы)2 — а2 + 2abi + b2i2 = — {а2 - b2) + {2ab)i. Два комплексных числа z± = а± + + b^i и Z2 = «2 + считаются рае- 51
ними тогда и только тогда, когда равны соответственно их дей- ствительные и мнимые части, т. е. когда ai = и bi = 62. Число z — а — Ы называется комплексно-сопряженным к чис- лу z — а + Ы. Модулем комплексного числа называется величина г — |г| — |а + Ы\ — у/а2 + Ь2. Выведем формулу для деления комплексных чисел. Если zi = ai + b\i и ^2 = + b^i, причем |^| ф О? то zi ai + bii (ai + 6ii) (ci2 — 62г) Z2 az + bzi fa + bzi)(a2 ~ bzi) _ (^16X2 + &1&2) + (b]fl2 - _ a2 — _ 6X1612 + bjbz 610,2 “ O162 . (Xq +69 (Xo + 69 Ai Ал Ai A Пусть z € С и z ф 0. Угол ср между радиусом-вектором точки z и действительной осью (см. рис. 1.25) называется аргументом числа z. Аргумент числа z 6 С определяется не однозначно, а с точностью до кратного 2к. Множество всех значений аргумен- та z обозначается Arg z . То значение аргумента, которое лежит в промежутке [0,2к), называется главным и обозначается arg г. Иногда удобнее выбирать главное значение аргумента из про- межутка (—л, к]. Очевидно, имеем (см. рис. 1.25) Re г = г cos ср, Im г — г sin ср, где г ~ |г|, ср G Arg г. Следовательно, z — г (cos ср + г sin ср) (1.69) — это тригонометрическая форма комплексного числа. Л. Эйлер ввел показательную функцию ег<р = COS(p 4. г sin ср. (1-70) Используя формулу Эйлера (1.70), получим показательную фор- му комплексного числа z = тегф, (1.71) где г — |г|, ср G Arg г. Формулы (1.69) и (1.71) показывают также связь комплексных чисел с полярными координатами. Легко видеть, что комплексные числа обладают всеми свой- ствами действительных чисел: сложение и умножение комму- тативны и ассоциативны, т. е. zi + Z2 — ^2 + (^1 4- ^2) + + Z3 = z-L + (22 + г3); Z]_Z2 = z2Zi; (z! 23)2:3 - 21(2223) для лю- 52
бых zi, Z2, Z3; умножение дистрибутивно относительно сложе- ния, т. е. zi(z2 + Z3) = Z1Z2 + ^1^3 Для любых чисел Z], Z2, Z3; для любого комплексного числа z выполняется z + 0 — zh1-zi = zi и существует противоположное число (—z) = (~l)z, такое, что z + (—z) = 0; для любого ненулевого комплексного числа z су- ществует обратное число z”1, такое, что z-1z = 1. Однако в от- личие от действительного случая для комплексных чисел теря- ет смысл отношение порядка, т. е. для двух комплексных чисел невозможно ставить вопрос, которое из них больше. Полезна следующая формула Муавра: zn = (г (cos ер + zsinep))n = rn(cos nep + г sin nep), (1.72) которую нетрудно доказать по индукции, используя тригоно- метрические формулы для косинуса и синуса суммы двух ар- гументов (проделайте это самостоятельно в качестве упражне- ния). Формула (1.72) позволяет находить корни целой степени из комплексного числа. Пусть z = гё1^ и требуется найти такое комплексное число с — pe% что сп = z. Тогда согласно (1.72) ер + 2ки имеем рп — г, пф = ер + 2А:п, к Е Z. Откуда р = (/г, ф =-, к Е Z. Таким образом, При к = 0.1, ..., п — 1 получаем п различных корней степени п из z, которые делят окружность радиуса tyr на п равных дуг, т. е. лежат в вершинах правильного n-угольника, вписанного в окружность радиуса у/г. Пример 1-29- Найдем все различные корни третьей степени из числа z — — 1. Имеем г — |z|, ер — arg z — л, так что z — — 1 ~ 1 х хег7С. По формуле (1.73) при п — 3 3 3 :г з cos „ , Л Л . . Л 1 При к — 0 получаем фо ~ ~ и со — cos - + г sm - — - + г ; при 5л = ф1=лиС1=^ cos л 4 z sin л — —1; при к — 2 — ф‘2 — — и 5л . . 5л 1 .V с2 = cosy+2smy = корни третьей степени из —1. . Числа со, ci, С2 — все различные 53
Пример 1,30. Найдем все различные корни четвертой сте- пени из числа z — 1 = 1 • ег0. По формуле (1.73) 4/- ( 0 + 2/стс , . 0 + 2&тс\ Cfc = Vl I cos--------|-гsin-------- , к = 0,1,2,3, — все различные корни четвертой степени из числа z — 1. к л Таким образом, cq = cos 0 + г sin 0 = 1; q ~ cos —h i sin - = Зп . Зл С2 — cos л + г sin тс = —1; сз = cos --Н zsm — Замечание, Из курса высшей алгебры известно, что любой мно- гочлен n-й степени имеет ровно п, быть может комплексных, корней с учетом их кратностей. В частности, корни 2i, z^ многочлена az2 + bz + + с второй степени с действительными коэффициентами можно нахо- дить по известной формуле через дискриминант D = Ь2 — 4пс квадрат- —5 + \/D кого трехчлена: 21 д = ------, только в случае D < 0 эта формула Примет ВИД 21,2 = 2а Пример 1.31. Найдем все корни многочлена P(z) = z3 + + 2г2+62—26. Нетрудно заметить, что 2 = 2 обращает уравнение 23 + 2z2 + 62 — 26 — 0 в тождество, так что 21 = 2 - один из корней многочлена. Разложим многочлен на множители, один из которых (2 — 2). Имеем (например, применив деление столбиком или схему Горнера) Р(2) — (2 — 2)(22 + 42 + 13). Чтобы найти оставшиеся два корня многочлена, надо решить уравнение 22 + 42 + 13 = 0. По известным формулам находим D — 16 — 4 ♦ 13 = —36 < 0, так что и 21 = 2, 22 = — 2 + Зг, 23 = —2 + Зг все три корня данного многочлена. Пример 1,32. Найдем все корни уравнения 25 + z3 — 0. Пе- репишем уравнение в виде z3(z2 + 1) = 0. Тогда находим, что 2 = 0 есть корень кратности 3; уравнение z2 + 1 = 0 имеет корни 2 = ±г. Всего у данного уравнения 5-й степени получилось пять корней (с учетом кратности корня 2 = 0).
Глава 2 ЛИНЕЙНАЯ АЛГЕБРА* 2.1. Матрицы и определители n-го порядка Пусть даны п элементов (n > 1) ? ^2? • • • 5 &П* Всевозможные расположения этих элементов называются пе- рестановками из п элементов. Поскольку каждый элемент од- нозначно определяется своим номером, можно говорить просто о перестановках натуральных чисел 1,2, ..., п, что и будем де- лать в дальнейшем. Всего из п элементов можно составить п! = = п(п — 1) •... • 2 • 1 перестановок. Если какая-нибудь пара чисел 2, к расположена в перестанов- ке так, что большее число стоит впереди меньшего, то говорят, что эти числа образуют инверсию. Сосчитать число инверсий в какой-нибудь перестановке можно следующим образом. Сосчи- таем сначала количество чисел, стоящих впереди единицы — все эти числа и только они образуют инверсии с единицей. Затем вычеркнем единицу и сосчитаем количество чисел, стоящих впе- реди двойки. Затем вычеркнем двойку и сосчитаем количество чисел, стоящих впереди тройки и т. д. Число инверсий в пере- становке 21,22, • • • , in будем обозначать [21,22, • • • ? in]- Например, [2,5,1,4,7,3,6] =2+0+3+ 1+0 + 1 = 7. Перестановки с четным числом инверсий называются четны- ми^ с нечетным — нечетными. Пусть дана перестановка 21,22, .•., 2/, ..., г^, ..., in. Поменя- ем местами два ее числа ii и ik] при этом получим перестанов- ку 21? ^2? - * • ,ik, • • • ,iiK-* "Лп- Такая операция перемещения двух чисел перестановки называется транспозицией. Теорема 2.1. От одной транспозиции четность перестановки меняется. Доказательство. Рассмотрим сначала случай, когда меняют- ся местами два соседних числа аир перестановки 21,22, ..., 2/, а, 55
Р, г/+з, ..., in. При этом число инверсий после транспозиции ста- ло на единицу больше, если а < р, или на единицу меньше, если Р < а. Значит, четность перестановки изменилась и теорема в этом случае верна. Рассмотрим теперь общий случай. Пусть меняются местами числа а и р в перестановке гг, 22, •, Ч-i,a, 4+т, ^+-2, ..., ii±k-> Р, , inj между которыми находятся к чисел 21+2, ..., Можно выполнить транспозицию аир посредством не- скольких транспозиций рядом стоящих чисел. Сначала поменя- ем местами а с потом ас i/42 и так далее до aci/^. При этом выполнено к транспозиций рядом стоящих чисел. Затем по- меняем местами а и р, и после этого [3 с р — с и так далее до р с В конечном счете аир поменяются местами и при этом будет выполнено 2к + 1 транспозиций рядом стоящих чисел, при каждой из которых меняется четность перестановки. Следовательно, четность перестановки изменится 2fc +1 раз, т. е. четная перестановка станет нечетной, а нечетная четной, что и требовалось доказать. Следствие. Число нечетных перестановок из п (n > 1) пер- вых натуральных чисел равно числу четных перестановок и рав- но п!/2. Доказательство. Пусть из п\ перестановок п чисел р переста- новок четных и q нечетных. Сделаем в каждой четной переста- новке одну и ту же транспозицию, например поменяем местами первые два числа. Тогда каждая четная перестановка превра- тится в нечетную и все они будут разные. Следовательно, р < q. Аналогично убеждаемся, что q < р. Следовательно, р — q. Пусть теперь имеется квадратная матрица А порядка п. Определение 2.1. Определителем п-го порядка матрицы А порядка п называется алгебраическая сумма всевозможных про- изведений элементов, взятых по одному из каждого столбца и каждой строки матрицы А. Если в каждом таком произведе- нии множители расположены в порядке следования столбцов, то со знаком «+» берутся те произведения, у которых перестанов- ка первых индексов четная, а со знаком «—» те, у которых она нечетная, т. е. Оц П12 • • • &1п 021 «22 • • • 02п = -1) ’1,’2”’,гп1ай1^22 • • -агпП, (2.1) 0п1 0п2 • • • аПп 56
где суммирование распространяется на всевозможные переста- новки ii,22, ... из п чисел 1,2, ..., п. Определитель матрицы А обозначается |Л| или det Л. Так как число перестановок из п (n > 1) элементов равно п!, то по формуле (2.1) определитель матрицы А порядка п состоит из п\ слагаемых, половина из которых входит со знаком «+» и столько же со знаком «—». Пример 2.1. Пусть 7/ 3: матрица А состоит из 9 элементов Всевозможные произведения элементов из каждого столбца и каждой строки имеют вид «^«^«гзЗ, их 3! = 6, Четными пе- рестановками из 1, 2, 3 являются 1,2,3 — нуль инверсий; 2,3,1 — две инверсии; 3,1,2 — две инверсии. Им соответствуют произведения элементов матрицы «ц«22«зз, «21«32«13, «31«12«23, которые в сумму входят со знаком «+». Не- четными перестановками из 1, 2, 3 являются 3,2,1 три инверсии; 2,1,3 — одна инверсия; 1,3,2 — одна инверсия. Им СООТВеТСТВуЮТ Произведения П31«22«13? «21«12«33, «И«32«23, которые в сумму входят со знаком «—». Таким образом, «и «21 «31 «12 «22 «32 «13 «23 «зз — «11«22«33 + «21«32«13 + «31«12«23 “ «31«22«13 “ — «21«12«33 ~ «П«32«23, что совпадает с определением 1.9 (см. гл. 1). Лемма 2.1 (о знаке члена определителя). Произведение «г1Аг1«г2А:2 • • • ain^n входит в определитель n-го порядка со знаком, определяемым выражением 7 1 \hl V'^.J 79 9\ 57
Доказательство. Заметим, что если поменять местами два множителя в произведении а^^а^^ • • • ainkn-> то как в первых, так и во вторых его индексах произойдет по одной транспози- ции, и значит, четность суммы останется прежней. Теперь, если > в произведении а^к2 ••• ainkn> переставляя множители, по- ставить на первое место элемент из первого столбца, затем на второе — элемент из второго столбца и так далее, т. е. сделать так, чтобы вторые индексы шли в порядке возрастания, то чет- ность суммы [ii ,7’2, ..., in\ + [ki, &2, ..., kn будет совпадать с чет- ностью числа инверсий [mi,m2, ...,тп\ в перестановке первых индексов окончательного расположения сомножителей (вторые индексы образуют нуль инверсий). Следовательно, +п]+[АаЛ2, Пример 2.2. Определим, с каким знаком произведение «32«43«51«15«24 входит в определитель 5-го порядка. Так как [3,4,5,1,2] =3 + 3 = 6; [2,3,1,5,4] = 2 + 1 = 3, по формуле (2.2) произведение входит в определитель со знаком („1)6+3 = _L Свойства определителей были сформулированы в гл. 1 (см. подразд. 1.2). Докажем некоторые из них для произвольного п > 1. Свойство 1 (равноправие строк и столбцов). При транспо- нировании, т. е. замене каждой строки определителя столбцом с тем же номером, определитель не меняется. Доказательство. Пусть «12 «22 «п2 «21 «22 «2п Так как каждый член определителя составлен из элементов разных строк и столбцов, каждый член определителя |А| бу- дет членом определителя |АГ|, и наоборот. По лемме 2.1 знак перед членом . &inkn в Щ определяется вы- ражением ( — 1)Л1>г2,...,гп]+Л1Л2,.«*Лп. ? а в |ур . _ ВЫражением (—1)[*^ +2, --+]+[w2, но эти выражения равны, следователь- но, знаки совпадают и определители равны, А| = |АТ|. 58
Замечание. Из свойства 1 следует, что если какое-либо утвержде- ние доказано для строк (или столбцов) матрицы определителя, то транспонируя матрицу, получим, что утверждение будет верно и для столбцов (соответственно строк). Упражнение 2.1. Используя непосредственно определение, докажите свойства 2 5 определителей. Докажем, например, свойство 5. Свойство 5. При перестановке двух каких-либо строк (столбцов) матрицы знак определителя меняется, а по абсолют- ной величине не меняется. Доказательство (для столбцов). Пусть «11 • • • а1д «21 • • • «2q CZ-lg • • • &1п «2д • • • ^2п &пд • • • О“пп «1р ‘ ♦ • «In «2р * * * «2п &п1 ’ ’ ’ ^nq <%np * * * ^nn Ясно, что каждый член определителя |Ai| совпадает с каким- нибудь членом определителя |Аз |, и наоборот, так что осталось только сравнить знаки. Возьмем какой-нибудь член определи- теля |Ai| и расположим его множители в порядке возрастания столбцов «^1^22 • • • ^tpp * • • aigq * ‘ • ^inTi' (2-3) Этот член входит в |Ai| со знаком (—1)Н’г2,—Л, •••ЛД Этот же член входит в IA2I со знаком (—1)[h^2,---,*Q}—,ч>,—цо пере- становка ii,22, ., ip, ... уin получается из перестановки 21,22, • • •,2Р, ... yiqy •. • yin одной транспозицией ip и 2g, следова- тельно, числа [21, г2, • • •, 2g, ..., ip, ..., гД и [21,22, • • • , 2р, ...,2g, ..., гп] разной четности, и значит, член (2.3) входит в IA2I с дру- гим знаком, чем в |Ai |. Последнее утверждение верно для любо- го члена определителя. Следовательно, |^21 = ~ 1^411 - Для строк соответствующее утверждение следует из свой- ства 1. Как следствие, из свойства 5 легко доказывается свойство 6. Свойство 6. Если в матрице имеются две одинаковые стро- ки (столбца), то определитель равен нулю. , 59
Доказательство. Действительно, поменяем местами одина- ковые строки (или столбцы . Тогда определитель по свойству 5 изменит знак, но при этом он не должен измениться, так как строки (столбцы) одинаковые. Таким образом, |Л| — — |А , что может быть лишь при |Л| =0. Упражнение 2.2. Докажите свойство 7 определителей. Теорема 2.2. Если все элементы fc-ro столбца (строки) мат- рицы Л, кроме, быть может, одного аг^ равны нулю, то определи- тель । А| равен произведению на алгебраическое дополнение этого элемента: |Л| — а^А^. Доказательство. Рассмотрим сначала частный случай, ко- гда в матрице А все элементы первого столбца, кроме, быть мо- жет, ац, равны нулю, т. е. /Пц 012 * * * &1П О 022 • • ’ О аП2 * * В каждый член определителя входит в точности по одному эле- менту из первого столбца. В нашем случае все члены опреде- лителя с элементами из первого столбца, взятыми не из первой строки, равны нулю. Следовательно, по (2.1 И1 = 52 ... • • Лгпп = = «11 52 С-1)112’ ’гп1«г22-- «г„п, где 22, ...,in — всевозможные перестановки из чисел 2, ... ,п. J ак как 52 (-1)[г2’ •’г"]аг22-- «г„п = Мц и Ац = £-1)1+1ТИп= Мц см. определение 1.10 минора и алгебраического дополнения к элементу матрицы), получаем |А| = ацМц = ацАц. Рассмотрим теперь общий случай, когда все элементы fc-ro столбца матрицы X, кроме, быть может, а^, равны нулю, т. е. /ац .••• ai^-1 J **’ А = aAi • • • a^^—i а.^ ^г,/с+1 * * * \®п1 ‘ ‘ ^n^k~ 1 " ,/е-Ы ’ ‘ * ^пп/ Переставляя г-ю строку матрицы с (г — 1)-й, (г — 2)-й и так далее, и наконец, с первой строкой, а затем переставляя с (fc — 1)-м, 60
(fc — 2)-м, и так далее и, наконец, с первым столбцом, полу- чим матрицу, у которой все элементы первого столбца равны нулю, кроме, быть может, первого, равного «^. Определитель этой матрицы по свойству 5 будет отличаться от исходного зна- ком (—1)^ Ч = (~1) \ а значит, по доказанному ранее, |Л| = (—1 )А — (ЦкАц^ так как Мц нового определителя равен исходного. Свойство 8. Каждый определитель равен сумме произведе- ний элементов любой его строки (столбца) на их алгебраические дополнения, т. е. ап «12 • • • «in «21 «22 ‘ ‘ ’ «2тг — «zl-^zl “1“ «г2^г2 4" ... 4“ ttinAin (2.4) «nl «тг2 ’ * ’ «гт (разложение по элементам г-й строки) и — ^IkA^k 4“ «2/с A2k 4" . ♦• 4“ &пкАпк (2.5) (разложение по элементам fc-ro столбца). Доказательство. Заметим, что если две матрицы отличают- ся друг от друга только элементами одной строки (столбца), то алгебраические дополнения элементов этих строк (столбцов) в обоих определителях одинаковы. Докажем формулу разложения определителя по fc-му столб- цу. Для этого представим элементы fc-ro столбца в виде суммы п слагаемых. Получим по свойству 3 «11 • • • «21 • • • «1/с + о +... + О о + «2А: + • • • + о «1п «2п «п1 О 4~ 0 + . ♦. 4~ ank • • • «то — |Ai + А2 + ... + |АП|, где |А| = «11 «21 «1/с • • • «1п О •*• «2п «nl «пт? «11 «21 О ... «1п «2/с • • • «2п «п1 • • • V ... «7771 61
«11 «21 О . • • «1тг О . . . «2тг «nl апк • • • По теореме 2.2 |Ai| = aikAlk, А2\ = аъкАък, • • •, |Лг = ЯпкАпк, где Aik(i = 1, . ..,п) алгебраические дополнения к элемен- та там a-ж матрицы А. Следовательно, А| — и формула г~1 (2.4) доказана. Соответствующая формула (2.5) для разложения по строке легко получается аналогично или применением свой- ства 1. Пример 2.3. Вычислим определитель |Л| — разложив его по элементам первой строки (см. (2.4)): = -5 • 74 - (—15) - 4(—31) - 33 = -370 + 15 + 124 - 33 = ^-264. Свойство 9. Сумма произведений элементов любой строки (столбца) на алгебраические дополнения соответствующих эле- ментов другой строки (столбца; равна нулю. Доказательство. Пусть дан определитель ац 4 4* «1г • • • «1/с • 4 4 «1п А| = «21 • • • «2г • • • &2к • ♦ * «2п «п1 • • ^ni • • &пк 4 4 4 «7171 Докажем свойство для элементов г-го столбца. Рассмотрим дру- гой определитель |Л1| = ац «21 • • « 4 4* «1г ... «2г ’ ‘ * ®1г 024 ♦ • • 4 « 4 «1?1 «2п «711 • • • «т «72? • • «7171 62
отличающийся лишь тем, что в к-м столбце стоят соответству- ющие элементы г-го столбца (fc / г). Определитель |Лх| равен нулю, так как имеет два одинаковых столбца. Разложив его по элементам fc-ro столбца, получим |Л11 — ^2гЛ2/с + • • • + ап^Ап^ — О, что и требовалось доказать, так как (г — 1, ... ,п) — ал- гебраические дополнения элементов к-ro столбца матрицы Л1 равны алгебраическим дополнениям элементов к-ro столбца матрицы Л. Упражнение 2.3. Вычислите определитель О О О а2 «1 О п | | G>i г=1 тремя способами: а) переставляя столбцы; б) по определению; в) разложением по столбцу. В упражнениях 2.4 и 2.5 матрицы А± и А2 порядка к и I соот- ветственно. Упражнение 2.4- Докажите, что ^41 О О А2 = |Л1||Л2 Упражнение 2.5. Докажите, что = |Л1||Л2|(—1)ы. Определение 2.2. Рассмотрим прямоугольную матрицу А размера т х п. Пусть к < т и к < п. Выделим в этой матри- це какие-нибудь к строк и к столбцов. Из элементов, стоящих на пересечении выделенных строк и столбцов, составим определи- тель к-го порядка. Все такие определители называются минора- ми к-го порядка матрицы Л. Рангом г (А) матрицы А называ- ется наивысший порядок отличных от нуля миноров этой мат- рицы. 63
Таким образом, если ранг матрицы равен г, то среди миноров этой матрицы есть, по крайней мере, один минор 7-го порядка, отличный от нуля, а все ее миноры (г 4- 1)-го порядка и выше равны нулю. Для вычисления ранга матрицы ее можно сначала приводить к возможно более простому виду с помощью элемен- тарных преобразований, т. е. преобразований вида: • транспонирование; • перестановка двух строк или столбцов; • умножение всех элементов строки (или столбца) на любое число с, отличное от нуля; • прибавление ко всем элементам строки (или столбца) соот- ветствующих элементов другой строки (или столбца), умножен- ных на одно и то же число. Упразднение 2.6. Докажите, что при элементарных преоб- разованиях матрицы ее ранг не меняется. Будем обозначать А — В, если матрица В получается из А с помощью элементарных преобразований. /3 2 1 2\ Пример 2.^. Вычислим ранг матрицы А — I 2 О —1 11. \0 4 5 1/ Вычитая из третьей строки удвоенную первую, сокращая второй столбец на 2 и вычитая после этого из первого столбца утроен- ный второй, из третьего — второй и из четвертого — удвоенный второй, последовательно получаем /321 2 \ /311 2 \ /010 0 \ А- | 2 0-1 11-2 0 -1 1-2 0 -1 1. \-6 0 3-3/ \-6 0 3-3/ \-6 0 3-3/ Прибавляя к третьей строке утроенную вторую, сокращая на 2 первый столбец и вычитая из четвертого, прибавляя первый к третьему, и поменяв местами первые два столбца, получим /0 1 0 0\ /0 1 0 0\ /0 1 0 0\ Л-|2 0 -1 11 - 1 0 -1 II ~ 11 0 -1 0 - \0 000/ \0 0 0 0/ \0 0 0 0/ /о 1 0 0\ /1 о о о\ -1000 - 0100 . \о о о о/ \о о о о/ Значит, г(А) — 2. 64
Обозначим строки матрицы А из примера 2.4 через ei = = (3,2,1,2), в2 = (2,0,1,1), 63 = (0,4,5,1). Очевидно, имеет ме- сто равенство ез — 2б1 — Зб2, понимаемое в смысле поэлементного сложения. Вообще, если ei, «2, ..., ет. строки какой-то матрицы А и, например, — otjei + 0(2^2 + ... + где oq, i = 1, ..., т — 1 — какие-нибудь числа, то будем говорить, что m-я строка этой матрицы линейно выражается через пер- вые т — 1 строк, или что ст является линейной комбинацией строк ei, в2, ..., em-i. В этом случае oiiei + ot262 4" • • • Я- am-iem_i ет — О, где О понимается как нулевая строка (т. е. строка из п нулей l Определение 2,3. Будем говорить, что строки вц 62, ..., ет матрицы А линейно зависимы, если можно подобрать такие чис- ла ai, «2? • • • , am, не равные нулю одновременно, что -}- 012в2 “F • • • “F — О* Если таких чисел a*, i — 1, ..., т не существует, т. е. последнее равенство имеет место только в том случае, когда все аг = 0, то говорят, что строки ei, 62, ..., ет линейно независимы. Упражнение 2.7. Докажите, что строки ei, 62, ..., ет ли- нейно зависимы тогда и только тогда, когда, по крайней мере, одна из строк линейно выражается через остальные. Аналогичное понятие линейной зависимости можно ввести и для столбцов матрицы. Теорема 2.3 (о ранге матрицы). Если ранг матрицы ра- вен г, то в этой матрице можно найти г линейно независи- мых строк (столбцов), через которые линейно выражаются все остатьные ее строки (столбцы). Доказательство. Пусть матрица А размера т х н имеет ранг г. Не ограничивая общности можно считать, что отличный от нуля минор D г-го порядка ( так называемый базисный минор) расположен в верхнем левом углу матрицы, т. е. что А = /«п «1г «г1 ац «12 «21 «22 «1г «2г /0. «тп ^"пг1 «7’1 «Т'З 65
Докажем, что первые г строк матрицы А линейно независи- мы. Предположим, наоборот, что эти строки линейно зависимы. Тогда одна из них, для определенности ег, линейно выражается через остальные: — ai 61 4“ 0^2^2 4~ * • • Т —1^г—!• Вычтем из r-й строки матрицы А первую, умноженную на ai, вторую, умноженную на аг, и так далее до (г — 1)-й, умножен- ной на ocr-i. Тогда r-я строка матрицы А окажется состоящей из одних нулей. Отсюда следует, что определитель D равен ну- лю — противоречие. Следовательно, первые г строк матрицы А линейно независимы. Докажем теперь, что все остальные строки матрицы А ли- нейно выражаются через первые г строк. Пусть г < к < т и 1 < Z < п. Рассмотрим определитель (г Т 1)-го порядка ац ai2 • • • air ai/ 021 022 • • • О2г О2( ••• arr CL f ^kl ^к2 ’ ' ' ^kr &kl Он равен нулю при всех к > г и всех Z, так как если I < г, то у него два одинаковых столбца, если же I > г, то это минор (г + 1)-го порядка матрицы ранга г. Разложим Д по элементам последнего столбца Д = ацА1 + «2/^.2 4-... 4- ariAr + akiAr-^i = 0. Здесь Ai, ..., Ar+i — алгебраические дополнения к элементам последнего столбца, они зависят от к и не зависят от /, кроме того, Ar+i — D Ф 0. Значит, G>kl — OCiQiz Т (X2&2Z 4" » ♦ ♦ 4" OC-fG-rlj где di = - (i = 1, ..., г) не зависят от L Таким образом, к-я строка матрицы А линейно выражается через первые г строк: — oiiei 4- ot2e2 4- ... 4- осгег. Следствие 1. Максимальное число линейно независимых столбцов матрицы равно максимальному числу линейно незави- симых строк. 66
Следствие 2. Для того чтобы определитель был равен ну- лю, необходимо и достаточно, чтобы его строки (столбцы) были линейно зависимы. Следствие 3. Для того чтобы определитель матрицы А п-го порядка был равен нулю, необходимо и достаточно, чтобы ранг г(А) матрицы был меньше порядка матрицы, т. е. чтобы г(А) < п. Упражнение 2.8. Докажите следствия из теоремы о ранге матрицы. Замечание. Можно показать, что для вычисления ранга матрицы можно применять следующее правило «окаймления»: если уже найден минор к-го порядка Dk 0, то требуют вычис- ления лишь миноры (к + 1)-го порядка, окаймляющие минор Dk (т. е. содержащие Dk целиком внутри себя). Если все такие окаймляющие миноры (к + 1 t-го порядка равны нулю, то ранг матрицы равен к. Поясним, что если среди окаймляющих миноров (к + 1)-го порядка найдется минор D^i 0, то повторяем правило для него и т. д. Пример 2.5. Для матрицы А = 2 О 0. Все окаймляющие миноры 2 0 = 0. Следовательно, г (А) = 2. 2.2. Произвольные системы линейных уравнений Рассмотрим систему т линейных уравнений с п неизвестны- ми «11^1 Н” «12*^2 Ч- • • * 4“ «In^rt “ ^1? «21^1 + «22^2 + • • • + а2пХп ~ &25 (2-6) ч «ml^l ~Ь «т2^2 "Ь • • • 4" Щпп^п — ^т* Пусть А — матрица из коэффициентов при неизвестных и В расширенная матрица системы: «11 «12 ... «in «21 «22 • • • «2п «ml «m2 • • • «тп k«ml «m2 «11 «12 «21 «22 «1п «2?? ^тп 67
Ясно, что г (В) > г- А). Критерий совместности системы линей ных уравнений дает следующая теорема. Теорема 2.4 (теорема Кронекера — Капелли). Для сов- местности системы т линейных уравнений с п неизвестными необходимо и достаточно, чтобы ранг расширенной матрицы В был равен рангу матрицы системы А. Доказательство. Необходимость. Пусть система уравнений (2.6) совместна, т. е. существуют числа сд, «2, ..., ап, такие, что если их подставить в систему вместо ад, гг2? • • •, %п соответствен- но, то уравнения обратятся в тождества, т. е. ацод + ai20t2 + ... + aina.n — £д; «21а1 + ^22^2 + • • • + «2ПОСП — &25 Н“ ^т2^2 + • . - + ^-тп^-п — бт* Вычитая из последнего столбца матрицы В первый, умно- женный на од, второй, умноженный на «2, и так далее до ап, получим эквивалентную матрицу / ^11 &12 ... «1п 0 \ r-r I &21 а22 • • • а2г 0 | Дт1 ат2 • amn для которой г(С) — г(В). Но ранг матрицы С равен также рангу матрицы А, так как все ненулевые миноры матрицы С равны соответствующим минорам матрицы А и обратно. Достаточность. Пусть г(В) = г(А) — г, и пусть, для опре- деленности, базисный минор D матрицы А расположен в левом верхнем углу: D = Оц 012 • • • °1г 021 «22 • • • «2г аГ1 аг2 * * ’ агг 0. Тогда первые г строк матрицы В линейно независимы, а осталь- ные т — г линейно выражаются через них, тогда и последние т — г уравнений системы являются линейными комбинациями первых г уравнений. В этом случае достаточно решить лишь первые г уравнений, их решения будут автоматически удовле- творять т — г оставшихся уравнений. 68
Возможны два случая: 1) г = п. Тогда систему, состоящую из первых г уравнений, можно решить, например, по формулам Крамера (1.19) (см. под- разд. 1.3, теорему 1.3). В этом случае система имеет единствен- ное решение, т. е. она совместная и определенная; 2) г > п. Возьмем первые г уравнений системы и, оставив в левых частях первые г неизвестных, остальные перенесем в правые части: С1цаД 4 ^12^2 + • • • • Т* СДу-аД — аД-щ ^21^1 + &22х2 + -... + «2г^г — Ь2 — П2,г+1жгД1 “ • ^2n^n5 . агпхп. Решив эту систему относительно ад,а?2, ... ,ад, например по формулам Крамера, получим выражения для ад,а?2, • •.,ад че- рез 61,62, ...ybr и «свободные неизвестные» ад~|_х, ад+2 ? * • •, *^п > т. е. получим общие решения системы. Придавая свободным не- известным ад+х,ад+2> • • • ,хп произвольные значения, будем по- лучать при этом соответствующие значения «главных неизвест- ных» ад, а?2, ..., хг и, значит, частные решения системы. Это слу- чай совместной неопределенной системы. Упражнение 2.9. Пусть т = п и |Л| — 0. Докажите, что если система совместна, то она неопределенная. Рассмотрим примеры решения систем уравнений. Пример 2.6. Для системы ад + 2х2 + Зад = 2; xi ~ Х2 + хз — 0: х\ + Зад - хз — “2; ^Зад + 4ад 4- Зхз = 0 имеем г (Л) ~ 3, г (В) = 3 (базисный минор = 14 / 0), следовательно, система совместная и определенная. Из первых трех уравнений получаем ад — — 1, Х2 = 0, хз — 1. ад + 2X2 + Зхз — ад = 0; Пример 2.7. Для системы < х\ — ад + хз + 2ад = 4; име- xi + 5ад + 5ад — 4ад — —4; ад + 8x2 + 7хз — 7ад — —8 ем г(Л) — 2, г(В) — 2, следовательно, система совместная и, так 69
как г — 2 < 4 = п, неопределенная. Базисный минор I” — 3 0, и из первых двух уравнений находим общее решение системы х\ = — — —хз — х^ X2 — — Пример 2.8. Для системы < г( 4) = 2, г(В) — 3 и, следовательно, система несовместная. Рассмотрим теперь однородную систему уравнений f а1ххх + «12^2 + - Н- аъЛг 0; «21^1 + «22^2 + ... + СЬ2п^п — 0; т Щп2*^2 т “г О'тпп — б. Однородные системы всегда совместны, так как всегда имеется, например, нулевое решение х\ = 0, Х2 = 0, ..., хп — 0. Это сле- дует также из критерия совместности, так как для однородной системы г(В) = г (Л). Выясним, когда однородная система явля- ется неопределенной, т. е. кроме нулевого имеет еще и ненулевые решения. Теорема 2.5. Для того чтобы однородная система уравне- ний с п неизвестными имела ненулевые решения, необходимо и достаточно, чтобы ранг г ее матрицы коэффициентов был мень- ше п. Доказательство. Если г = п, то по теореме Крамера систе- ма имеет единственное (нулевое] решение. Следовательно, если система имеет ненулевое решение, то г < п. С другой стороны, если г < п, то из доказательства критерия совместности следует, что система будет неопределенной, т. е. будет иметь и ненулевые решения. Упражнение 2.10. Используя теорему 2.5 и следствие из теоремы о ранге матрицы, докажите следующую теорему. Теорема 2.6. Для того чтобы однородная система п линей- ных уравнений с п неизвестными обладала ненулевыми решени- ями, необходимо и достаточно, чтобы ее определитель был равен нулю. 70
Упражнение 2.11, Проверьте непосредственно подстанов- кой, что любая линейная комбинация решений однородной си- стемы линейных уравнений также будет ее решением. Определение 2.4. Линейно независимая система решений е2, ..., еь однородной системы уравнений называется фунда- ментальной, если каждое решение системы уравнений является линейной комбинацией этих решений. Теорема 2.7 (о существовании фундаментальных си- стем решений). Если ранг г матрицы коэффициентов систе- мы однородных уравнений меньше числа неизвестных п, то эта система уравнений обладает фундаментальными системами ре- шений. Доказательство. Пусть г (Л) = г < п, где А — матрица ко- эффициентов системы, и пусть, для определенности, базисный минор D порядка г стоит в левом верхнем углу матрицы: ап ац ttln /0. ami О-тп аГ1 CLff' После переноса свободных первых г уравнений системы в неизвестных , хп правые части получим эквива- лентную систему ацз [ 4~ ai2^2 4“ • • • 4_ а\тХу — ац^-^-ляд-щ ... а^-^Дп, a2i^i 4~ а22ж2 + • • • 4” а^г^г ~ a2.r+i^r+i • • а^ляд 4- а^‘2^2 4**... 4~ а^иряд. Решив эту систему при значениях неизвестных хг^у — 1, хТ^2 — 0, ..., хп = 0, получим соответствующие значения ху = ai, Х2 — а2, .. •, хг — аг для первых г неизвестных. Это дает стро- ку — решение исходной системы 1 1 1&15 ^21 • • ’ ч 1 , 0, ..., 0). Аналогично, придавая свободным неизвестным значения жг+1 = — 0, хг+2 = 1?^г+з “ 0, ... ,хп — 0, вычислим соответствующие значения неизвестных'яд — Pi, ^2 = р2, . = рг и получим строку — решение С2 - Ф1,р2, • ' ’ >Рг,О, 1,0, ... ,0) 71
и т. д. Таким образом найдем к — п — г решений системы одно- родных уравнений Эти к решений между собой линейно незави- симы, так как ранг образованной ими матрицы из к строк Хоц а2 ... ar 1 0 ... О ₽1 ₽2 ... ₽г 0 1 ... О \Y1 Y2 •’* Yr 0 0 1/ в точности равен fc. Покажем, что решения ei,e2, действительно образу- ют фундаментальную систему. Для этого осталось показать, что каждое решение однородной системы линейно выражается через ei, е2, ..., ек. Итак, пусть e(0i, 92, •. • ? 9Г, 9г+1 ? • • • > 9тг) — произвольное решение системы однородных уравнений. Рас- смотрим строку во — в 9r+i 61 9/’-|-2 ’2 •*. 9®^. Легко видеть, что во (91,92, ...,9г,о,о, ...,0) и тоже является решением системы. Так как значения свобод- ных неизвестных в во равны 0, то и значения всех остальных неизвестных в во равны 0, т. е. во — нулевая строка во = е — 9г+1в1 — 9г+2е2 — ... — 9r+fcejt = О, и, значит, в = 9r_|-iei + 9г_|_2е2 + ... + * И Таким образом, общее решение однородной системы линей- ных уравнений имеет вид 37 ciei “Ь с2в2 -F ... Я- скек, где к ~ п — г (A), ci, е2, ..., ек фундаментальная система ре- шений, a ci, с2, ..., ск — произвольные числа. Упражнение 2.12. Проверьте непосредственной подста- новкой, что разность любых двух решений неоднородной систе- мы линейных уравнений будет решением соответствующей од- нородной системы. 72
Упражнение 2ЛЗ. Проверьте непосредственной подста- новкой, что сумма какого-нибудь частного решения хч неодно- родной системы с любым решением соответствующей однород- ной системы линейных уравнений будет решением неоднородной системы. Таким образом, общее решение неоднородной системы линей- ных уравнений есть сумма какого-либо частного хч и общего ре- шений соответствующей однородной системы: х — хч Т ще! Т £2^2 Т • • Т где ei,62, — фундаментальная система решений; ci,C2, ..., Ск — произвольные постоянные. При решении систем линейных уравнений на практике часто применяют метод Гаусса (или метод последовательного исклю- чения неизвестных), который заключается в следующем. В си- стеме линейных уравнений (2.6), не ограничивая общности, мож- но считать, что ац 0. Если это не так, то переставим первое уравнение системы с каким-нибудь другим, у которого коэффи- циент при Xi не равен нулю. Преобразуем систему, исключив неизвестное zi из всех уравнений, кроме первого. Для этого пер- «21 вое уравнение умножим на число — и вычтем из второго, затем «11 умножим на-----и вычтем из третьего и т. д. Приходим к экви- «и валентной системе уравнений 'anxi + О12Ж2 + ... + а1пхп = Ьг, 27 'ти^п т Число уравнений в системе уменьшится, если в некоторых урав- нениях в левой части все коэффициенты при неизвестных станут нулевыми, а в правой части получится нуль и мы эти уравнения отбросим. Повторив процедуру для уравнений 2, ..., т и исключив из уравнений 3, ... ,ш неизвестное х% и т. д., получим либо какое- нибудь уравнение, в котором правая часть не равна нулю, а ле- вая равна, тогда система несовместна, либо систему, матрица которой треугольная или трапециевидная. В случае треуголь- ной матрицы разрешим последнее уравнение относительно хп, 73
подставим найденное значение хп в предыдущее (п — 1)-е урав- нение, найдем из него хп_\ и т. д. Система окажется определен- ной. В случае трапециевидной матрицы выражаем из последнего уравнения хт через остальные неизвестные хт+\,хт^2, • • • , хп и придавая им произвольные значения, будем получать различ- ные решения системы. Система окажется неопределенной. Пример 2.9. Решим систему уравнений + 2х2 + 5хз = —9; xi — Х2 + Зхз = 2; Зад — 6x2 — — 25. Преобразуя расширенную матрицу системы приходим к эквивалентной системе уравнений матрицей с треугольной решение которой х\ = 2, Х2 = —3, х$ — — 1. Пример 2.10. Дана система — 5x2 ~ 8x3 + хд — 3; + Х2 — Зхз — 5х4 = 1; — 7отз + 2х4 — 11x2 + 20хз — 9х4 = 2. Преобразуем расширенную матрицу системы (1-5-8 1 3 1-3-5 10-72 0 11 20 -9 (1-5-8 1 0 -89 0 -29 0 5 11 0 -89 0 -29 Таким образом, система несовместна (получили уравнение 0=2). 74
14^1 + х% — Зггз — х± = 0; 2х 1 + 3^2 + ^‘з — 5x4 = 0; Х] — 2x2 — 2хз + 3.^4 = 0. Это однородная система, число уравнений меньше числа не- известных, следовательно, эта система неопределенная. Преоб- разуя матрицу системы 4 1 -3 -1\ /0 9 5 —13\ /0 2 0 —2 \ 2 3 1-51-07 5 —11 I — ( 0 7 5—111, 1—2—23/ \1 -2 —2 3 / \1 -2-2 3 > приходим к системе уравнений 2x2 “ 2ж4 = 0; 7x2 + 5#з — 11^4 = 0; х\ — 2x2 — 2^з + 3^4 = 0. неизвестных п — Ранг матрицы г = 3, значит число свободных — г = 4 — 3 = 1.В качестве свободного неизвестного выберем 4 хд. Тогда из первого уравнения Х2 — хд, из второго хз = -T4, из третьего Xi = -х^. Полагая а = хд, находим общий вид решения Здесь ei(3,5,4,5) — фундаментальная система решений, состо- ящая из одного решения; с — произвольная постоянная. 2.3. Конечномерные векторные пространства Определение 2.5. Множество V элементов х,у,2, ... назы- вается линейным, или векторным, пространством, если для любых двух его элементов х,у определена сумма х + у Е V, и для каждого элемента х и каждого числа а определено произ- ведение ах Е V, причем для любых чисел а, р и любых элемен- тов х, y,z из V выполнены следующие аксиомы векторного про- странства: 1) х + у = у + X- f 2) (ж + у) 4- z = х + (у + z); 3) существует нулевой элемент О Е V, такой, что х + О = х для любох о х Е V; 75
4) для любого х G V существует противоположным элемент (—ж) Е V, такой, что х + (—ж) — О; 5) 1 • х = х; 6) а(р^) — (ар)ж; 7) (а + P)z — ах + рж; 8) а(х + у) = ах + ау. Элементы вект орного пространства называются векторами. Числа в определении векторного пространства могут быть действительными (вещественными), комплексными, рациональ- ными и т. д. Соответственно векторные пространства будут1 называться действительными (вещественными'!, комплексными и т.д. Здесь будем рассматривать действительные векторные пространства. Примеры векторных пространств рассмотрены в упражне- нии 2.14. Упражнение 2Л4* Докажите^ что следующие множества образуют векторные пространства: 1) векторы на плоскости; 2) векторы в пространстве; 3 ) множество решений системы линейных однородных урав- нений; 4) множество функций, непрерывных на отрезке; 5) множество Рп многочленов степени не выше п; 6} матрицы размера т х п; 7) множество Rn упорядоченных наборов из п чисел. Простейшие свойства векторного пространства 1. Единственность нуля. Пусть в V есть два нуля Oi и О2. По аксиоме 3 (см. определение 2.5) Oi + О2 = Oi; О2 + Oi — О2, но 01 + О2 = 02 + 01, следовательно, 01 = О2. 2. Единственность противоположного элемента. Пусть два элемента у и г являются противоположными для х. Тогда у + + ж + г = у + (х4 г) ~ у + 0 ~ у. С другой стороны, у н- х + + г = (у + ж) + г = 0 + ^ = г. Следовательно, у = z. 3. Пусть х — произвольный элемент из V. Тогда 0 • х — 0. Действительно, так как 0 — 0 + 0, то 0 • х — 0 • х + 0 • х. Прибавим к обеим частям этого равенства (—0 • х): 0 = 0 • х + (—0 • ж) = 0 • ж + 0 • + (—0 • х) = “ 0 • х + (0 • х + (—0 • ж)) = 0 * х + 0 = 0 • х. Следовательно, 0 • х = О. 76
4. Для любого числа а имеет место равенство а • О — О. Дей- ствительно, а • О — а(0 + 0) = а • О + а • О. Прибавим (—а • О): О = а • 0 + (—а • О) = а - 0 + а - 0 + (—а • О) — — а • О + (а • 0 + (—а • О)) — ос * O f О = ос - О, т. е. О = а • О. 5. Если ах = О, то либо а = 0, либо х — О. Действительно, если ос — 0, то ост = О. Если ос 0, то 6. Для любого х € V элемент (—1)т является противополож- ным. Действительно, х + (—1 — 1 • х + (—1)т = (1 + (—1))# = 0 • х = О. Элемент х + (—у) называется разностью х — у векторов х иу. Определение 2.6. Векторы ai,a2, ... , векторного про- странства V называются линейно зависимыми, если существуют числа ai, «2, ..., ос/-, не равные нулю одновременно, такие, что ai«i + a2a2 + ... + akak = 0. (2.7) Векторы, не являющиеся линейно зависимыми, называются ли- нейно независимыми. Таким образом, векторы ai,a2, линейно независимы тогда и только тогда, когда из равенства (2.7) следует, что все осг, г — 1,2, ..., к равны нулю. Если же векторы &i, а2, ..., ак линейно зависимы, т. е. имеет место (2.7), причем не все of, i — 1,2, ..., fc, равны нулю. Напри- мер, пусть ак ф 0, то ai ос2 otfc-i —----а1-----«2 “ - . •----Gfc-b ак ак т. е. ак есть линейная комбинация векторов ai,a2, ..., ак-1 (или ак линейно выражается через ai, a2, ..., ak-i)- Упражнение 2.15. Докажите, что векторы ai, а2? •.. ,ак линейно зависимы тогда и только тогда, когда по крайней мере один из них линейно выражается через остальные. 77
Упражнение 2.16. Докажите, что: 1) любые три вектора на плоскости линейно зависимы; 2) любые четыре вектора в пространстве линейно зависимы. Определение 2.7. Векторное пространство V называется конечномерным, именно п-мерным, если в нем можно найти п линейно независимых векторов, но любая система, состоящая более чем из п векторов, является линейно зависимой. Число п в этом случае называется размерностью пространства и обозна- чается d(V) или dim V. Определение 2.8. Совокупность п линейно независимых векторов n-мерного пространства называется его базисом. Теорема 2.8. Каждый вектор х линейного п-мерного про- странства можно представить, и притом единственным спосо- бом, в виде линейной комбинации векторов базиса. Доказательство. Пусть ei, е2, • * •,еп — произвольный базис n-мерного пространства V, и х € V. Так как любые п + 1 векто- ров из V линейно зависимы, то найдутся числа ai, а2? • • •, а, не все равные нулю, такие, что aiex + a2e2 + ... + + ах = О. При этом а ф 0, так как иначе из последнего равенства получили п бы ^2 агег — О, чего не может быть, так как ег, г — 1,2, ..., п, — ?~1 базис. Значит ai a2 х -------ei------е2 — . a a Полагая Xi = ——, будем иметь a х = хгех + х2е2 + ... + хпеп XiCi. (2.8) Это представление единственно. В самом деле, если есть еще од- но представление х = > Угег, то г—1 (г/i - Ж1)в1 + (уз - ж2)е2 + ... + (у„ - Хп)еп = О. Отсюда, так как ei,e2, . ..,еп линейно независимы, получаем, что yi — Xi — 0, т. е. yi — Xi для любых i ~ 1,2, ..., п. 78
Определение 2.9. Пусть ei,e2, ... , en — базис в простран- стве V и х € V. Тогда числа xi, #2, »..,жп в представлении (2.8) называются координатами вектора х в базисе щ, Q?, ..., еп. Ясно, что если у двух векторов координаты совпадают, то и векторы совпадают. Следовательно, задавать векторы можно координатами по известному базису: (Х]^Х2? ...^Хп). (2-9) Упражнение 2.17. Докажите, что: 1) при сложении векторов их соответствующие координаты складываются: У + X = (yi + X] )ei + ... 4- (уп + Хп)еп = (.У1 “Ь х±, ..., уп 4~ хп ); 2) при умножении на число все координаты вектора умножа- ются на это число: clx — axiei + аж2^2 + • • • + &хпеп = (a^i, ..., аж^); 3) у нулевого вектора все координаты в любом базисе равны нулю: 0 = (0, 4) у противоположного вектора координаты умножаются на —1: - ( ^1) • • • ? ^п)« Замечание. Соответствие (2.9), которое получено между элемен- тами п-мерного векторного пространства и элементами из R71 — упо- рядоченными строками из и чисел, называется изоморфизмом. Изо- морфизм позволяет свести изучение свойств произвольного п-мерного векторного пространства к изучению пространства Rn. Теорема 2.9. Если ei, в2, ..., еп — линейно независимые век- торы пространства V и каждый вектор х е V линейно выража- ется через ei, в2, ..., еп, то векторы ei, в2, ..., еп образуют базис в V. Доказательство. Нужно доказать, что если fti,a2? • • • любая система векторов из V и т > п, то векторы ai, &2, ..., аш линейно зависимы. По условию — осцв! 4~ • • • 4- «2 = ^2161 4- ... 4 «2n^n; — &ml^l 4“ * * • 4- ^-тп^п- 79
(0<11 • • • O^ln \ ............I. В этой матрице Oral * * * ^mn J m(m > n) строк и n столбцов. Следовательно, ее ранг г(Л) < п< < т, и значит, ее строки линейно зависимы. Это означает, что линейно зависимы и векторы ai, ., ат, откуда следует, что 61,62, ... ,еп — базис. Упражнение 2.18. Докажите, что пространство Rn п-мер- но. (Указание. Докажите, что векторы 61(1,0, ... ,0), 62(0,1,0, ..., 0), ..., еп(0,0, ..., 1) образуют базис в R71.) Пример 2.12. Пространство Рп многочленов степени не вы- ше п имеет размерность п + 1. Действительно, многочлены 1, т, #2, •. •, Хп линейно независимы и любой многочлен р е выра- жается через них очевидным образом. Теорема 2.10. В конечномерном пространстве каждое мно- жество линейно независимых векторов можно включить в неко- торый базис. Доказательство. Пусть ei, 62, ..., е^ — система линейно не- зависимых векторов из V. Если любой из остальных векторов пространства V линейно выражается через 61,62, ... ,е^, то 61, в2, ..., е^ — базис. Если найдется какой-нибудь вектор e^+i, ко- торый линейно через ei, 62, ..., е^ не выражается, то присоеди- ним его к ei, в2, ..., е^. Получим линейно независимую систему ei, в2, ..., е/~, е&+1 из k + 1 векторов. Действительно, если 0(161 + . . . + OCfcCfc + 0tfc+i6fc+i — О, то либо a/c-f-i = 0, и тогда otiei + ... + оце^. = О, и значит, аг = 0, г — 1, и 61,62, ..., е/с, efc-f-i линейно независимы; либо ocfc+i Ф 0, тогда «1 0Ц Ск+1 =------------61 - . . .---------6fc, OQe-|-l afc+l и линейно выражается через ei, 62, ...,е* — противоречие. Далее повторяем доказательство. Процесс когда-нибудь за- кончится, так как пространство V конечномерно, т. е. в нем мо- жет существовать только конечное число линейно независимых векторов. Пусть в пространстве Rz имеются два базиса: 61,62, ...,еп (будем называть его «старый») и е^, е^, ..., е'п — «новый». Каж- 80
Дый элемент «нового» базиса можно разложить по элементам «старого»: е'г — «цех + <22162 4-... 4- е'2 — а12С1 + «22^2 + .. ♦ + «п2бп; 6П = (21^61 4“ Cl2n^2 4" • •• 4” аппеп^ так что коэффициенты разложения можно записать по столбцам в матрице /«и а-12 ... П1П\ л I «21 «22 • • • «2/1 I «п1 «п2 * ’ ’ «тш Матрица А называется матрицей перехода от базиса ei, 62, ..., еп к базису е^, е2, ..., егп. Определитель матрицы |А| 0, так как в противном случае столбцы ее были бы линейно зависимы, а значит, были бы ли- нейно зависимы и векторы е^, е2, ..., 6^, чего быть не может, так как е'15 е2, ..., е'п — базис. Покажем, как связаны координаты вектора х в «старом» и «новом» базисе. Пусть х — ^161 + х^еъ + ... + хпеп Подставив вместо е± его разложение в «старом» базисе, полу- чим — Х-^ (ац61 4“ «21.62 + • • • 4" «п16п) 4~ 4“ ^2(а12е1 + «2262 + • • • + «п2бп) + • • • + 4~ Tn(ain6i 4 а2Пб2 + «.. + «тгтг67г) — = (ацТ1 + ai2/2 + ... + «1п^)б1+ + («21^1 + • •. + «2п^)е2 + ... + 4 («711^1 4“ ... 4“ «7171^71)бт1? т. е. Ti = an^i + ai2x2 4-... 4- alnx'n\ ^2 = «21^'1 + «22^2 + ’ • • + a2n^fni (2.10) ввиду единственности разложения вектора по базису вц е2, ..., 81
Равенства (2.10) можно записать в матричном виде или х = Axf. (2.11) Формулы (2.10) и (2.11) называют формулами перехода к новому базису. Пример 2.13. Пусть ei, — базис на плоскости, состоящий из единичных векторов, направленных по осям прямоугольной системы координат. Повернув оси на угол ср против часовой стрелки, получим новый базис причем ~ eicos ср 4~ + в2 sin ср; в2 = —ei sin ср + 62coscp. Так что матрица перехода к новому базису имеет вид — sin ср cos ср Определение 2.10. Подпространством L векторного про- странства V называется множество его элементов, само явля- ющееся векторным пространством относительно введенных в V операций сложения векторов и умножения на число. Упражнение 2.19. Докажите, что: 1) в трехмерном пространстве векторов подпространствами будут все векторы, параллельные какой-либо плоскости или пря- мой; 2) в пространстве Рп многочленов степени не выше п множе- ство Р&, к < п будет подпространством; 3) Рп подпространство в пространстве всех многочленов; 4) множество всех многочленов подпространство в про- странстве непрерывных функций; 5) множество решений системы п линейных однородных уравнений с п неизвестными с матрицей коэффициентов А бу- дет подпространством в Rn размерности к = п — г( А). Определение 2.11. Пересечением L% — L\ П подпро- странств Li Е V hL2 E V называется множество всевозможных векторов из V, принадлежащих одновременно Li и Суммой L/4 = Li + L<2 называется множество всех векторов вида и + v, где U Е V Е L?. Упражнение 2.20. Докажите, что пересечение и сумма двух подпространств являются подпространствами.
Теорема 2.11. Если £i и подпространства векторного пространства V, то * dim!,! + dim£2 = dim(£i П £2) + dim(£i + £2). (2.12) Доказательство. В £3 — L\ П £2 выберем какой-нибудь базис ei, ...,Q и дополним его до базиса в £1: ei, . и до базиса в £2: 61, . . . ,6^, . , Qq. Покажем, что векторы ег, ...,ek, fk+i, 9к+1, • • •,9q ли- нейно независимы. Тогда, так как любой г 6 £4 = £1 + £2 ли- нейно выражается через еъ ..., ek, fk+i, gk+i, ...,9q, это будет базис в £4. Пусть aiei + а2е2 + ... + ocfcCfc + pjt+i/fc+i +....+ ' fipfp + Yfc+lSfc+1 ~H • • • T 4q9q — О. Тогда вектор а &161 + 0t2^2 + . • . + ^-к^к “Ь Р&-|-1«/&4-1 Т • • • “Ь Рр/р “ — Yfc-|-l/7fc+l • • • Yq9q с одной стороны, принадлежит £1, а с другой — £2. Значит, a G £3. Тогда а — aid + 02^2 + •.. + o/~6fc и ввиду единственности разложения по базису в £1 получаем, что oti = 01, ..., а& — ок и pfc+i = 0, ..., рр = 0. Следовательно, aiei + а2е2 + ... + акек + Yfc+iP/c+i + • • • + 4q9q = О, и значит, все о^, г = 1, ..., к\ уn j = к + 1, ..., q равны нулю, так как 61, ..., efc, дк+1, ...,gq — базис в £3. Итак, ei, ..., ек, Д+1, ..., /р, gfe+i, ...,gq~ базис в £4. Тогда dim £4 — к + (р — к) + (q — к) — = р + q ~ к — dim £] + dim £0 dim £3 откуда и следует формула (2.12). Пример 2.14* В R4 подпространства £1 и £2 размерности 2: а) могут пересекаться по нулевому вектору и тогда их сумма совпадает со всем пространством; б) могут пересекаться по пря- 83
мой, тогда их сумма имеет размерность 2 4- 2 — 1 = 3; в) могут совпадать, тогда dim(Li П L^) ~ 2, dim(£i + 1Д) = 2. Если dimLi = dim £2 — 3, то £i и в R4 и: а) либо пересе- каются по плоскости, dim L\ + dim £2 = 2 4- 4; б) либо совпадают, dim Li 4- dim ~ 3 4- 3, других возможностей нет. Если dimZ/i — 2, dim £2 = 3, то: а) либо £1 и £2 пересекаются по прямой; б) либо £1 С £2- Определение 2.12. Если пространство £ является суммой подпространств £1 и £2, пересечение £1 П £2 которых состоит лишь из нулевого вектора, то говорят, что £ есть прямая сумма подпространств £1 и £2 и пишут £ = £1 Ф £2- Из теоремы 2.11 следует, что если £ = £1 ф £2, то dim£ = — dim £1 4- dim £2. Пример 2.15. R3 может быть прямой суммой R1 и R2, где R1 — прямая, R2 — плоскость, проходящая через начало коор- динат. R3 не может быть прямой суммой двух плоскостей. Теорема 2.12. Если £ = £1 ф £2, то каждый вектор из £ единственным образом представляется в виде и 4- т где и € £1, v е £2. Доказательство. Пусть х G £ и х ~ 4- гд = 4- Г2- Тогда — U2 ~ V2 — ni — О, поскольку подпространства L\ и £2 пере- секаются только по нулевому вектору. Таким образом, = и<2, Vi — V2- Определение 2.13. Пусть «1, ... — некоторая система векторов из V. Совокупность £ всевозможных линейных комби- наций этих векторов otiai 4-... 4- образует подпространство в V. Это подпространство называют линейной оболочкой векто- ров «1, ..., обозначают С — {«1, «2? • . • , &к} и говорят, что £ натянуто на векторы щ, ..., Упражнение 2.21. Пусть А — матрица, в столбцах которой стоят координаты векторов , i — 1, ..., к, по некоторому базису в У. Докажите, что dim£ = г (А). 2.4. Линейные операторы Определение 2.14. Говорят, что в векторном пространстве V задан линейный оператор или линейное преобразование Д, ес- 84
ли каждому вектору х Е V поставлен в соответствие определен- ный вектор А(х), или Ах, принадлежащий V, и при этом для любых двух векторов х и у из V и произвольного числа а: 1 j A(z + у) = Ах + Ау; 2 i A(cix) — ctAx. Выберем в пространстве V базис ei,C2, ...,еп. Тогда, если х — Xiei + ... + хпеп, то в силу линейности оператора А имеем Ах = xiAei + ... + хпАеп. Так как Aei тоже можно разложить по базису. Aei = ацв1 + ... + ап{вп, i — 1,2, ..., п, то Ах — #1(ацв1 + «21^2 + ... + anien) + + #2(^1261 + П22в2 + ... + ап2еп) + ... + 4“ Хп[с1>1п(: х + . . . 4~ аппСп) — = («11^1 + «12^2 + • • + «1п^п)е1 + • • • + 4“ ^п2^2 4~ • •• 4- dfifixAc ... + х'п6п, то Ах = Ах = х , так что если Ах — х\е± + ... 4- х'пе где А — (aij) — матрица порядка п, в г-м столбце которой стоят координаты разложения вектора Аег по базису; матрица А на- зывается матрицей линейного преобразования А. Обратно, каждая квадратная матрица А порядка п может рассматриваться как матрица некоторого линейного преобразо- вания. Будем обозначать линейный оператор и его матрицу одной и той же буквой: Д, В, С — операторы, А, В, С — матрицы. Определение 2,15. Оператор называется невырожденным, если Ах — О тогда и только тогда, когда х — О, иначе он называ- ется вырожденным. Таким образом, оператор А невырожден тогда и только то- гда, когда однородная система уравнений Ах = О (2.13) имеет единственное (нулевое) решение, т. е. когда матрица А невырождена; оператор А вырожден тогда и только тогда, ко- гда система (2.13) имеет ненулевые решения, т. е. когда матрица А вырождена. 85
Упразднение 2.22. Рассмотрите следующие примеры и до- кажите, что преобразование является линейным. Найдите мат- рицу преобразования: 1) поворот плоскости на угол ср вокруг начала координат бу- дет линейным преобразованием; 2) поворот пространства на угол ср вокруг оси Oz будет ли- нейным преобразованием; 3) ортогональное проектирование векторов на плоскость хОу вырожденное линейное преобразование; 4) пусть Ах — симметричный вектор к вектору х относитель- но плоскости хОу. Тогда А — линейное преобразование; 5) в пространстве Рп многочленов степени не выше п опера- тор дифференцирования, очевидно, линейный и вырожденный С ХП (рассмотрите базис < 1, ж, —, [ 2! п\ J 6) тождественный оператор: £х = х для любого х € V; 7) нулевой оператор: Ох = 0 для любого х 6 V. Упразднение 2.23. Докажите, что при линейном преобра- зовании векторного пространства образом подпространства сно- ва является подпространство. Определение 2.16. Суммой А+В операторов А\\В называ- ется такой оператор С, который ставит в соответствие вектору х вектор Сх = Ах + Вх. Определение 2.17. Умножением оператора А на число а называется такой оператор, который ставит в соответствие век- тору х вектор а Ах. Очевидно, сумма линейных операторов и произведение ли- нейного оператора на число будут линейными операторами с матрицами, равными сумме матриц и произведению матрицы на число соответственно. При этом выполняются все аксиомы векторных пространств. Следовательно, множество всех линей- ных операторов в пространстве V является линейным простран- ством. Определение 2.18. Произведением. АВ операторов АиВ на- зывается оператор С, определяемый следующим образом: Сх = - А(Вх). Можно доказать, что произведение АВ линейных операторов также будет линейным оператором, матрицей которого является матрица АВ. 86
Отметим также, что для невырожденного линейного опера- тора А существует обратный оператор Л-1, такой, что АА~Х = — А~] А — £. Для доказательства достаточно рассмотреть опе- ратор с матрицей А 1. Теорема 2.13. Пусть А — линейный оператор с матрицей А в базисе ei, в2, ..., еп и С — матрица перехода к новому базису e'v е2, ... 7е/п. Тогда в базисе бд, е2, ..., оператор А имеет мат- рицу А! - С^АС. (2.14) Доказательство. Рассмотрим линейное преобразование С с матрицей С. Для него, очевидно, Сег = e'v Это преобразование невырожденное, так что С-1 существует, имеет матрицу, равную С-1, и для него С~ — е$. Применив к равенству оператор С 1, получим С Mei = а!иС М + a'2iC . + a'niC le'n = откуда С ACei Т Я- • • • T и формула (2.14) доказана. Из формулы (2.14) следует, что определитель матрицы ли- нейного оператора не зависит от базиса, так как ИН = |C-XAC7| = |С'-г||А||С'| == |А|. Пример 2.16. Пусть в базисе ei,62 оператор А имеет мат- (6 2\ рицу А = lg Напишем матрицу этого преобразования = + в2, в2 = 2в1 + Зв2- Здесь матрица перехода следовательно, в базисе -3 2 \ /6 -2\ /1 2\ _ /-3 2 \ /2 б\ _ (2 0\ 2 -1/\6 \2 37 \2 -1/\4 9/ \° 37 Определение 2.19. Пусть А — линейный оператор, действу- ющий в пространстве V. Совокупность AV всевозможных век- 87
торов вида Дж, где х 6 V, называется областью значений опе- ратора А, или образом пространства V при преобразовании Д, и обозначается Im Д. Множество всевозможных векторов х Е V, для которых Ах — О, называется ядром оператора А и обозна- чается ker Д. Упражнение 2.24- Докажите, что область значений и ядро оператора А являются подпространствами в У, причем размер- ность Im Д совпадает с рангом г (А матрицы Л. Размерность области значений оператора А называется ран- гом оператора Д, а размерность ядра — дефектом линейного оператора Д. Имеет место следующая теорема. Теорема 2.14. Сумма ранга и дефекта линейного оператора равна размерности п пространства: dim Im Д + dim ker А = п. Определение 2.20. Подпространство Vi пространства V на- зывается инвариантным относительно линейного оператора Д, если образ Ах каждого вектора х из Vi принадлежит Ц. Упражнение 2.25. Докажите инвариантность подпро- странств в следующих примерах: 1) А поворот вокруг оси Oz. Инвариантными подпростран- ствами будут, например, плоскость хОу и ось Oz; 2) Д — ортогональное проектирование пространства R3 на хОу. Инвариантными подпространствами будут все плоскости, проходящие через ось Oz; все прямые, лежащие в плоскости хОу и проходящие через начало координат (в частности, оси Ох и Оу); 3) в пространстве Рп многочленов степени не выше п подпро- странства Pfc при всех fc, 0 < к < п, инвариантны относительно оператора дифференцирования: 4) в любом пространстве каждое подпространство инвариант- но относительно тождественного и нулевого операторов; 5) в любом пространстве само пространство и его подпро- странство, состоящее только из нулевого вектора, инвариантны относительно любого линейного оператора. Упражнение 2.26. Докажите, что пересечение и сумма подпространств, инвариантных относительно линейного опера- тора, инвариантны относительно этого оператора. 88
Имеет место следующая теорема. Теорема 2.15. Если А — невырожденный линейный опера- тор и £ — подпространство, инвариантное относительно А. то L инвариантно и относительно Л"1. Пусть L — одномерное инвариантное подпространство отно- сительно линейного оператора А. Пусть х 6 L, х 0. Тогда Ах е £, Ах = Хх, где X — некоторое число. Если у — любой дру- гой вектор из £, то у — ах и Ау — Л(аж) = а Ах — аХх = Хат = = Ху. Определение 2.21. Вектор х А 0 называется собственным вектором линейного оператора А, если найдется такое число X, что Ах — Хх. Это число X называется соответствующим вектору х собственным значением оператора А (и матрицы А). Таким образом, если L — одномерное инвариантное подпро- странство, то каждый ненулевой вектор из L является собствен- ным вектором оператора А и притом с одним и тем же собствен- ным значением. Обратно, если х — собственный вектор операто- ра Л, то порожденное им одномерное подпространство L (состо- ящее из всех векторов вида ах) будет, очевидно, инвариантным относительно Л. Предположим, что х — собственный вектор, X — соответству- ющее собственное значение. Тогда Ах — Хт. Выберем в про- странстве V базис ei, в2, ... , еп, и пусть х — ... + тпеп, а матрица оператора А в этом базисе А — (а^). Тогда Ах = Хх и (А — ХЕ)х = 0, т. е. собственный вектор является решением системы линейных однородных уравнений (<111 X)J1 + G'12^'2 + ••• + ^1п^п — d, «21^1 + («22 - Х)т2 + ... + а2пхп = 0; (2-15) Т ^п2^2 “Ь + пп Для существования ненулевого решения этой системы необходи- мо и достаточно, чтобы ее определитель был равен нулю, т. е. чтобы было det (А — ХЕ) — 0 характеристическое уравнение для А. Если X — корень характеристического уравнения, то X бу- дет собственным значением оператора А. Легко заметить, что левая часть характеристического уравнения является многочле- ном степени п относительно переменной X. Этот многочлен k(X) = det (А - ХЕ) 89
называют характпзристическим многочленом оператора Л. Та- ким образом, для нахождения собственного вектора оператора нужно найти корни характеристического многочлена и затем — решение соответствующей однородной системы уравнений. Теорема 2.16. Характеристический многочлен линейного оператора не зависит от выбора базиса. Доказательство. Пусть fce(Xi = det (А — ХЕ) — характери- стический многочлен в базисе ei, 62, .. *, еп. Если в'15 , е'п другой базис и С — матрица перехода, то в базисе ., efn fc(X) = det(Ai - ХЕ) = det(C“] AC - ХЕ) = = det(C-1AC - C~lXEC) = det(C'“1(A - XE)C) = = det(C~1) det(A - XE) = det(C) - det(A - XE) = ke(X). Пример 2.17. Для линейного оператора с мат рицей А = (1 2\ - Z ) характ еристический многочлен k(X) = det А — ХЕ ~ — X2 — 5Х — 6 имеет корни Xj = 6, Х2 — — 1. Собственные векторы находим из систем: для Xi — 6 (1 — 6)xi + 2x2 = 0; 5xi + (4 — 6)^2 = 0 собственные векторы при с 0; для Х2 = — 1 rl + 1)ti + 2x2 — 0; 5xi + (4 + 1)^2 = 0 2x1 + 2x2 ~ 0; 5xi + 5x2 = 0 х = с собственные векторы при с ф 0. Теорема 2.17. Собственные векторы линейного оператора, отвечающие попарно различным собственным значениям, ли- нейно независимы. Доказательство. Проведем доказательство индукцией по числу рассматриваемых собственных векторов. Для одного век- тора это ясно, так как по определению собственного вектора он отличен от О и, значит, из равенства ах = О следует а = 0. Пусть утверждение верно для (к—1)-го вектора, т. е. собственные векторы xi,X2, ...,x^-i, отвечающие попарно различным соб- 90
ственным значениям Xi, ..., i, линейно независимы. Предпо- ложим, что к собственных векторов, отвечающих попарно раз- личным собственным значениям, линейно зависимы, т. е. ОС1Ж1 + а2т2 + ... + ^кХк = о (2.16) и не все oq, г = 1, ..., к равны нулю. Применив к (2.16) оператор, имеем aiXiXi + а2Х2гг2 + ... + otfcX^fc — О. Вычтем из этого равенства равенство (2.16), умноженное на Х^, получим ai(Xi - XA)xi + а2(Х2 - Xfc)a;2 + ... + a*._!(Xfe_i - Xfc)xfc_i = О. Так как яд, ж2, ..., Хк -i линейно независимы и все Х? , i = 1, ..., fc, попарно различны, то отсюда следует, что — 0, г — 1, — 1, и значит, из равенства (2.16) ctkxk = О, откуда = 0, так как Хк О. Таким образом, все оц равны 0, г = 1, — про- тиворечие с предположением о линейной зависимости. Значит, яд, ж2, ..., Хк линейно независимы. Теорема 2.18 (о существовании инвариантных под- пространств). Для всякого линейного оператора, действующе- го в вещественном пространстве размерности п > 2, существует одномерное или двумерное инвариантное подпространство. Доказательство. Если характеристический многочлен опе- ратора А имеет хотя бы один вещественный корень, то оператор имеет собственный вектор, и значит, в V существует одномерное инвариантное подпространство. Если характеристический многочлен не имеет действитель- ных корней, то по основной теореме алгебры характеристиче- ский многочлен имеет хотя бы один комплексный корень, т. е. существует комплексное число X = a + г|3, р 0, такое, что det А — ХЕ) = 0. Решив систему А — \E)z = О, получим со- ответствующее комплексное решение /ж1+?у1' z — х + iy : I ~ : У “Ь ЪУп J Систему (А — ХЕ)г = 0, т.е. А{х + iy) — ;ос + ф)(т + гу), или Ах -I- 1Ау = ах — ру + йДу + Р^)? можно представить в виде двух систем отдельно для действительной и мнимой частей: 91
Ax = ax — £?/; Ay — ay + рж. (2-17) Значит, подпространство, порожденное векторами х и инвари- антно относительно А. Это подпространство двумерно, так как х и у линейно независимы. Если бы они были линейно зависи- мы, например у = уж, то Ах — аж — |3уж — (а — Ру)ж и получили бы, что ж — собственный вектор с вещественным собственным значением а — ру. Это противоречит предположению о том, что вещественных корней у характеристического многочлена нет. Пример 2.18. Рассмотрим вопрос: «Существует ли стацио- нарное разбиение множества на группы с матрицей перехода к новому разбиению А = (а^), 0 < агз < 1, i.j = 1,2, ...,п, п aij ~ 1? 3 — 1, 2, ... ,п, в частности существует ли стацио- г=1 парное распределение генотипа (см. пример 1.5)?» Стационар- ное распределение — это такое распределение ж О, которое в следующий момент времени (в следующем поколении) не изме- нился, т. е. должно выполняться Ах = ж. Таким образом, получили задачу о собственных значениях и собственных векторах для матрицы А (см. определение 2.21) и нас интересует, есть ли среди собственных значений X матрицы А значение, равное единице. Предположим, что ж О — собственный вектор, X — соответ- ствующее собственное значение. Тогда Ах — Хж и для нахожде- ния ж нужно решить систему однородных уравнений (2.15). Эта система, как известно (см. теоремы 2.5 и 2.6), имеет ненулевое решение тогда и только тогда, когда определитель матрицы этой системы равен нулю, т. е. когда X — корень характеристического уравнения det (Л — ХЕ) = 0, т. е. уравнения Пц - X П-12 #21 «22 ” • • * • . • &1п «2п апп Относительно X это есть уравнение п-й степени. Покажем, что X — 1 — корень этого уравнения. Прибавим к первой строке опре- делителя вторую, затем третью и так далее до п-й строки. При этом, как известно из свойств определителя, определитель не из- менится. Но после сделанных преобразований он будет равен 92
п E«-i 2 — 1 «21 п У7 ~ 1 г=1 «22 “ 1 «7272 «nl в характеристическом уравнении приняли X = 1). Так как п aij — 1 по свойству матрицы перехода, первая строка этого 2-1 определителя состоит из нулевых элементов, и значит, определи- тель равен нулю, а X = 1 является корнем характеристического уравнения. Следовательно, найдутся и собственные векторы ж, удовлетворяющие системе ( 2 Л 5) с собственным значением X — 1. Можно показать, что среди собственных векторов найдется та- п кой, для которого 0 < Xi < 1, i — 1,2, х. = 1, т. е. г—1 такой, который будет стационарным распределением. Пример 2.19. Найдем стационарное распределение геноти- па, когда матрица перехода А — . Убедимся, что X = = 1 — корень характеристического уравнения det(A — ХЕ) — 0: det (А — ХЕ) — - 0. Составим систему уравнений для нахождения собственного век- тора (см. систему (2.15)): Очевидно, для нахождения решения достаточно рассмотреть первое уравнение. Так как мы ищем стационарное распределе- ние генотипа, должны еще выполняться условия: 0 < хг < 1, i = 1,2, и х\ + Х2 — 1. Подставив — 1 — х\ в первое уравнение системы, получим решение х = ( А ), которое и будет сгацио- \ /5/ парным распределением генотипа, что легко проверить, подста- вив найденное решение в уравнение Ах — х.
“лава 3 ВВЕДЕНИЕ В МАТЕМАТИЧЕСКИЙ АНАЛИЗ 3.1. Общее понятие функции Рассмотрим некоторое множество (совокупность элементов произвольной природы) X. Пусть задан закон, сопоставляющий каждому элементу х G X элемент другого множества Y. Тогда скажем, что на множестве X задана функция у = f(x) со зна- чениями в Y. Множество X называется областью определения данной функции, а множество Yi элементов У, которые имеют вид /(z) при некотором х Е X, — областью ее значений. Сам закон может быть задан любым способом, никаких ограничений на сдособ задания не накладывается. Здесь будем иметь дело почти исключительно со случаем, где и X и У являются некото- рыми подмножествами множества действительных чисел, т. е. с действительной функцией действительной переменной. Один из наиболее популярных способов задания такой функции — фор- мульный (например, у — х2, у — sinT, у — tg.T и т.п.) Хотя, строго говоря, нужно помнить, что формула — это еще не функ- ция, так как при одной и той же формуле и разных областях определения получаются разные функции. Тем не менее при ре- шении конкретных задач действует (часто молчаливое) соглаше- ние, что, если не оговорено противное, то областью определения функции считается естественная область определения, т. е. мно- жество всех чисел, для которых имеет смысл данная формула. Так, областью определения функции у = х2 будет вся число- вая ось, а областью определения функции у = у/х — множество х Е [0, оо). Формульный способ задания функции не единственный. Можно, например, рассмотреть функцию, которая каждому ра- циональному числу сопоставляет единицу, а каждому иррацио- нальному числу нуль. Эта функция называется функцией Ди- рихле. Также будут рассмотрены функции, которые задаются с помощью интегралов от других функций, бесконечных сумм и т. п. 94
Особый случай представляют функции, заданные на множе- стве натуральных чисел N. Такие функции называются последо- вательностями. Для них обычно вместо f(n) используется обо- значение ап, и аргумент трактуется как номер соответствующего числа. Так что можно понимать последовательность как некото- рое множество перенумерованных чисел. Стандартное обозначе- ние для последовательности: {пп} или в развернутом виде: ^1? ^2? ♦ * • 5 &п-> • • • (3*1) Здесь ап называют общим членом последовательности. Теперь определим понятие предела для такой последовательности и изучим свойства подобных пределов. Следует отметить, что существуют геометрические способы представления функций. Для функций действительного пере- менного таким способом служит график, т. е. линия на плоско- сти, которая в декартовой системе координат задается уравне- нием у — f(x). (По-другому: график — это множество точек на плоскости с координатами (ж, f (х').) Для последовательности {ап} такой способ представления не- удобен, поскольку графиком в этом случае является дискретное множество точек на плоскости. Поэтому члены последователь- ностей обычно изображают в виде точек на числовой оси. 3-2. Предел последовательности В математических формулировках постоянно встречаются слова «для любого» и «существует», для сокращения записи ко- торых применяют кванторы: V и 3 соответственно. (Необходи- мо отметить, что роль кванторов значительно превосходит про- стое сокращение записи. Они являются важным элементом та- кого раздела математики, как математическая логика. Однако эти вопросы лежат за пределами данного курса.) Определение 3.1. Число а называется пределом последова- тельности {ап} (обозначение: а = lim ап), если для любого по- п—+оо ложительного числа е существует номер 7V, такой, что для лю- бого большего или равного номера п выполняется неравенство |пп — а| < е. С использованием кванторов это можно записать так: Ve>0 37V: => | — а| < е. (3.2) Если члены последовательности изображать в виде точек на числовой оси, то соотношению (3.2) можно дать следующую 95
геометрическую интерпретацию. Для любого положительного г найдется номер (вообще говоря, свой для каждого е), начи- ная с которого все члены последовательности окажутся внутри е-окрестности точки а. Здесь под е-окрестностью точки а понимается симметричный интервал с центром в точке а и радиуса е (т. е. расстояния от центра интервала до его концов равны г) (рис. 3.1). Последовательность, имеющая предел, называется сходящей- ся последовательностью. Отметим, что для сходимости ап к пределу а используется иногда обозначение ап а. Пример ЗА, ап = —, Ит ап = 0. П п—►оо Пример 3.2* Последовательность 1,0,1,0,1,0, ... предела не имеет. Пример 3.3. Последовательность 1,2,3, ..., п, ... также не имеет предела. Пример 3.4< Постоянная последовательность ап = с имеет предел, равный с. Теорема 3.1. Если последовательность сходится, то она име- ет только один предел. Доказательство, Предположим, что, напротив, у последова- тельности {ап} имеется более одного предела. Возьмем два из них — а и Ь: lim ап = а, п—>ос lim ап — Ь, п—юо а Ь. Выберем число е, такое, что 0<е Тогда на числовой оси две е-окрестности точек а и b не будут пересекаться (рис. 3.2). В силу (3.2) ЭМ: Рис. 3.1 Рис. 3.2 96
и, следовательно, все ап с номерами, большими TVi, попадают в s-окрестность точки а. Аналогично, 3TV2: | Ь| < S Vn> TV2 (3-4) и все ап с такими номерами попадают в s-окрестность точки Ь. Возьмем N — тах{А1,Лг2}- При этом для любых номеров, больших или равных 7V, будут выполняться соотношения (3.3) и (3.4) и, следовательно, соответствующие ап попадут одновремен- но в указанные ранее s-окрестности точек а и 5, что невозможно, так как эти окрестности не пересекаются. Таким образом, мы пришли к противоречию. Значит, наше предположение ложно и верно утверждение теоремы. Определение 3.2. Последовательность {ап} называется ограниченной, если 30 0 и 3N: X/n^N Ы < С. (3.5) Отметим, что это определение равносильно следующему: 3 Ci > 0 : V n е N => Ы Ci, однако определение (3.5) технически более удобно. Теорема 3.2. Всякая сходящаяся последовательность огра- ничена. Доказательство. Возьмем s = 1. Тогда в силу (3.2) 37V: По известному свойству модуля 71 Щ • Отсюда I «п| < I а| + 1. Обозначив через С число |п| + 1, получим (3.5). (Очевидно, что из неравенства \ап\ < С следует, что *ап| С.) Замечание. Обратная теорема неверна. Например, последова- тельность 1,0,1,0, ... ограничена, но предела не имеет. Перед доказательством теоремы о переходе к пределу в нера- венствах докажем лемму. 97
Лемма 3.1. Пусть последовательность {сп} удовлетворяет следующим условиям: 1) 37V : 2) lim сп ~ с. п—>оо Тогда с 0. Сп^О; Доказательство. Другими словами, предел сходящейся по- следовательности с неотрицательными членами сам неотрица- телен. Id Действительно, предположим, что с < 0. Возьмем е = —. Тогда в силу (3.2) d А7!: Vn 7V1 => |сп - с| < Поскольку с < 0, то |с| = —с, и мы приходим к неравенству Положим ЛГ2 = max{7V, TVi}. Тогда V n > Лт2 сп будет удовлетво- рять одновременно неравенствам сп 0 и Сп < 0. что невозможно. Следовательно, утверждение леммы верно. Теорема 3.3 (о переходе к пределу в неравенствах). Пусть заданы две последовательности {ап} и {6П}, удовлетворя- ющие следующим условиям: 1) 3;7V : ап^Ьп' 2) lim ап = a, lim bn = Ь. П—ГОС п—>оо Тогда а Ь. Доказательство. Положим сп = Ьп — ап. Тогда для сп бу- дут выполнены все условия леммы 3.1 (то, что lim cn — b — а, п—*оо следует из теоремы о пределе разности, которая будет доказана далее). В силу этой леммы 0 С b — а, т. е. Замечание. Теорему 3.3 нельзя усилить, заменив нестрогие нера- венства строгими. Действительно, возможен случай, когда ап<Ьп, но , тт л 7 1 а = Ь. Например, ап = 0, Ьп = — : п 98
но 5 п lim 0 = lim — — 0. n—>оо тг—>оо 77, Теорема 3.4 (о сохранении знака). Пусть последователь- ность {ап} удовлетворяет следующим условиям: 1) lim ап — а; П^НХ) 2) а > 0 (а < 0). Тогда 3 TV: VпД N => ап > 0 (ап < 0). Доказательство. Пусть а > 0. Возьмем е -.В силу (3.2) 37V: Vn^TV ап ~ «| или а а а — — < ап < а + —. Следовательно, ап > — > 0. Случай а < 0 аналогичен. Теорема 3.5 (о «зажатой переменной»). Пусть даны три последовательности {ап}, {Ьп} и {сп}, удовлетворяющие следу- ющим условиям: 1) 2) 37V: Vn^N => lim bn = lim сп — а. п—+оо тг—>оо Ьп ап (3.6) Тогда lim ап = а. тг—>ос Доказательство. Действительно, возьмем Ve > 0. По опреде- лению предела 3 TVi : Vn TVi | Ьп — а < е, т. е. а — е < Ьп < а + е; 3 N2 ‘ V72 > TV2 => | Сп — а) < е, т. е. а — е < сп < а + е. (3.7) Положим N3 = maxfN; TVi; N%}. Тогда в силу (3.6) и (3.7) V n а — г <Ьп ап Сп < <Л+ е, т. е. | в"П Е. Это и означает, что lim ап = а. 71—>ОО Определение 3.3. Последовательность {otn} называется бес- конечно малой^ если lim ап = 0. 71—^OG л В развернутом виде это можно записать так: Ve>0 Э^: Vn N => |ап| < е. (3.8) 99
Теорема 3.6 (о связи пределов с бесконечно малыми). Предел последовательности {пп} равен а тогда и только тогда, когда выполняется соотношение ап — а + ап, где lim ап — 0. (3.9) п—>оо Доказательство. В самом деле, пусть lim ап — а. Положим п—>оо ап — ап — а. По определению предела Ve>0 37V: \/n^N |an — a| < e, т.е.' |an| < e. Мы пришли к (3.8), а это значит, что {an} — бесконечно малая, откуда и получается (3.9). Пусть теперь, наоборот, выполнено (3.9). Тогда справедли- во (3.8). Но ап — ап — а', значит, Ve>0 37V: Vn > TV => \ап — a| < с, т.е. lim ап = а. п^-ос Выясним теперь некоторые свойства бесконечно малых. Теорема 3.7. Сумма (разность) двух бесконечно малых есть бесконечно малая. Доказательство. Пусть lim an — 0 и lim pn — 0. Положим п—>ос п—>ос ‘ Уй = &-П i рп- Возьмем V е > 0. Поделим это число на 2. В силу (3.8) ЭМ: Vn>M => |оеп|<^; ЕМ: Vп Л?2 => |pn|<t (3.10) Полагая TV «= max{7Vi; получим, что \/п N выполня- ются оба неравенства (3.10), а тогда I Уп| “ i р;г| | | рй, ~ + — — Е. Значит, lim уп = 0. п—»ос Следствие. Сумма (разность) любого конечного числа бес- конечно малых есть бесконечно малая. Доказательство. Действительно, если {ос„}, {рп} и < уп} — бесконечно малые, то их сумму 8П можно представить в виде = (^п "Н'1 т,) + Уп* 100
Величина, стоящая в скобках, является бесконечно малой по тео- реме 3.7. По этой же теореме будет бесконечно малой сумма ве- личины в скобках и уп, т. е. 8П. Аналогичные рассуждения мож- но провести и в случае любого конечного числа слагаемых. Теорема 3.8. Произведение бесконечно малой на ограничен- ную есть бесконечно малая. Доказательство. Пусть {ап} — бесконечно малая, а {ап} — ограниченная. Тогда выполняется соотношение (3.5). Положим рп = апап. Возьмем V е > 0 и поделим его на С, где С — постоян- ная из (3.5). В силу (3.8) ЕМ: Vn^M |otn Взяв TV2 ~ max{7V, получим, что Vn^TV2=> Следовательно, {рп} — бесконечно малая. Следствие 1. Произведение двух бесконечно малых есть бесконечно малая. Доказательство. В самом деле, пусть {otn} и {рп} — две бес- конечно малые последовательности. Бесконечно малая {(Зп} яв- ляется сходящейся последовательностью и, следовательно, в си- лу теоремы 3.2 ограничена. Применив теорему 3.8 к произведе- нию {апрп}, получим требуемое утверждение. Следствие 2. Произведение любого конечного числа беско- нечно малых есть бесконечно малая. Доказательство проводится аналогично тому, как это дела- лось в следствии к теореме 3.7. Определение 3.4. Последовательность {ап} называется бес- конечно большой, если VC> 0 37V: Vn^N^an>C. (3.11) Коротко (3.11) записывается в виде lim ап = ос. п—>ос Замечания. 1. В этой записи символ «эо» ие является пределом в обычном смысле, поэтому теоремы о пределах здесь, вообще говоря, ие выполняются. 101
2. Хотя каждая бесконечно большая не будет ограниченной, суще- ствуют неограниченные последовательности, которые не удовлетворя- ют условию (3.11). Такой, например, является последовательность 1,0,2,0,3.0, ...,0,п,0... 5. Если бесконечно большая величина, кроме того, сохраняет опре- деленный знак, хотя бы начиная с некоторого номера, то это записыва- ют следующим образом: lim ап = -hoc или lim ап = — ос. п—>сю п—>оо Теорема 3.9. Пусть {ап} — бесконечно большая. Тогда — бесконечно малая. Доказательство. Действительно, возьмем V е > 0. Положим С = - и применим (3.11): е Тогда при тех же п е Значит, lim — = 0. п—>ос' ап Упражнение ЗА. Докажите, что если {ап} — бесконечно малая, причем ап 0, то < — > — бесконечно большая. Докажем теперь ряд теорем о действиях с пределами. Теорема 3.10. Пусть lim ап — а и Нт Ьп — Ь. Тогда п—>ос п—>оо Ит (ап ± Ьп) = а±Ь. п—>оо Доказательство. В силу теоремы 3.6 — а + и Ьп — Ь -J- Рп, где {ап} и {рп} бесконечно малые. Поэтому i П — Ь) "Ь рп)’ (3.12) 102
По свойствам бесконечно малых последовательность {уп}, где Yn = осп ±рп, является бесконечно малой. Но тогда в силу той же теоремы 3.6 lim (ап ± Ьп) — а ± Ь. п—*-ос Теорема 3.11. Пусть lim ап — а и lim bn = Ь. Тогда п—>оо п—>ос lim (anbn) = ab. п—>ос Доказательство. Снова по теореме 3.6 имеем: ап = а + ап и bn — b + В„, где lim otn = lim 6n = 0. п—>OO 71—ЮО Откуда ^ПЬП — T Pn) — (^Pn “b «71 “b ^TlPn)- В силу свойств бесконечно малых выражение, стоящее в скоб- ках, является бесконечно малой, и по теореме 3.6 получаем тре- буемое утверждение. Теорема о пределе частного доказывается сложнее, поэтому предварительно придется доказать одну лемму. Лемма 3.2. Пусть последовательность {Ьп} удовлетворяет следующим условиям: 1) lim bn ~ Ь’, п—^оо 2)Ь/0, bn^OVneN. „ Г 1 1 1огда hm — = -. п->оо Оп О Доказательство. Как и ранее, по теореме 3.6 Ьп — Ь + рп, где lim Вп = 0. п—>оо Далее Положим е — — > 0. Тогда в силу определения бесконечно ма- лой ЭЛТ: Vn > N => |рп| < Используя свойство модуля, находим |Ь + Рп|> |Ь| - Ipnl > |Ь| |Ь| = |Ь| 2 2 ’ 103
Значит, для таких п выполняется соотношение Таким образом, последовательность {”ь(ь7К)}’ входа” щая в (3.13), является ограниченной. По свойствам бесконеч- но малых вся правая часть (3.13) есть бесконечно малая {уп}. Из (3.13) находим Em чп = 0. п—'ОС' Следовательно, по теореме 3.6 утверждение леммы верно. Замечание. Второе условие леммы 3.2 можно несколько ослабить, убрав требование Ьп 0, поскольку в силу теоремы о сохранении знака (см. теорему 3.4), если b 0. то, начиная с некоторого номера, все будут иметь тот же знак, что и 6, а значит, будут отличны от нуля. Теорема 3.12. Пусть последовательности {ап} и {Ьп} удо- влетворяют следующим условиям: 1) lim ап = a, lim Ьп — Ь\ П—>ОО 71-^СЮ 2) b ф 0. Тогда lim = п—юс 0п Доказательство. Запишем дробь в виде произведения Ьп ®П 1 ~Г~ — ип Ьп Применив теорему 3.11 и лемму 3.2, получим r ®n r r 1 1 lim — = lim ап lim — = а- — —. п—>оо Ьп п^-оо п—>оо Ьп Ь и Теперь нужно ввести довольно тонкие понятия точной верх- ней и точной нижней граней некоторого множества. Рассмотрим некоторый отрезок [а, 6], т. е. множество чисел вида {х : а х Ь}. В этом множестве есть, очевидно, наиболь- ший (Ь) и наименьший (п) элементы. В то же время в интервале (а, Ь), т. е. множестве вица {х : а < х < Ь} нет ни самого большо- го, ни самого маленького элементов, хотя ясно, что число b точ- нее всего ограничивает (а, b) сверху, а число а — снизу. Число b и 104
будет в этом случае точной верхней, а число а — точной нижней гранями множества (а, Ь). Эти же числа будут, соответственно, точной верхней и точной нижней гранями и для отрезка |а, Ь]. Перейдем теперь к точным определениям. Определение 3.5. Множество А называется ограниченным сверху (снизу), если 3 b : V а 6 А => а Ъ (а Ь). Число b при этом называется верхней (нижней) границей мно- жества А. Определение 3.6. Точной верхней гранью множества А на- зывается наименьшая из его верхних границ, а его точной ниж- ней гранью наибольшая из его нижних границ. Для точной верхней и точной нижней граней множества А используют обозначения sup А и inf А соответственно. (Читается: «супремум Л» и «инфимум А».) Дав такое определение, нам придется доказать его коррект- ность. В самом деле, ведь не у всякого множества имеется наи- меньший элемент, как показывает пример интервала (а,Ь). От- куда может возникнуть уверенность в том, что среди верхних границ множества А такой элемент найдется? Для этого сформулируем одну аксиому из теории чисел. Аксиома 3.1 (аксиома отделимости). Пусть заданы два числовых множества А и В, причем для любых элементов а € А и b е В выполняется условие а Ь. Тогда существует число с, такое, что Vа Е А и ЧЬЕ В => а^с^Ь. (3.14) Возьмем теперь в качестве А ограниченное сверху множество, а в качестве В - множество его верхних границ. Тогда в си- лу (3.14) соответствующее число с будет, с одной стороны, одной из верхних границ множества А (а с), а с другой наимень- шей из них (с С 6), т. е. точной верхней гранью sup А. Отметим, что точная верхняя грань единственна, так как если бы их было две — щ и С2, то выполнялись бы соотношения С2 < С1 И Cl < С2, л откуда ci — С2- Аналогичные рассуждения доказывают существование точ- ной нижней грани у ограниченного снизу множества. 105
Теорема 3.13. Число с является точной верхней гранью мно- жества А в том и только в том случае, когда выполняются сле- дующие два условия: 1) V а Е А => а с; 2) Ve>0 ЗаеЛ: а>с — е. (3.15) Доказательство. Действительно, пусть с = sup А, тогда пер- вое условие выполняется, поскольку с — одна из верхних границ. Если бы не выполнялось.второе из соотношений (3.15), то это означало бы, что при некотором е > О все а Е А удовлетворяют противоположному неравенству а с — е, а это в свою очередь означало бы, что число (с — е) — одна из верхних границ. Но это невозможно, поскольку с — наименьшая из верхних границ. Следовательно, верны оба соотношения (3.15). Пусть теперь с — некоторое число, удовлетворяющее соотно- шениям (3.15). Первое из них означает, что с — одна из верхних границ, а второе — что любое меньшее число не является верх- ней границей. Таким образом, с —наименьшая из верхних гра- ниц, т. е. с = sup А. Определение 3.7. Последовательность {ап} называется возрастающей (убывающей), если V?2 ап <С fln-hl fan > (3.16) Если в (3.16) неравенство нестрогое, то будем называть последо- вательность {пп} нестрого возрастающей (убывающей). Возрастающие и убывающие последовательности носят соби- рательное название монотонных последовательностей. Теорема 3.14 (теорема Вейерштрасса). Всякая монотон- ная (быть может, нестрого) ограниченная последовательность имеет предел. Доказательство. Докажем это утверждение для возраста- ющей последовательности {пп}. В силу ограниченности множество значений {ап} является ограниченным множеством чисел. Значит, существует с — sup А. Возьмем произвольное е > 0. В силу (3.15) существует член последовательности адг, такой, что > с — е. Тогда V п N выполняются неравенства с — е < ам ап с < с + е. 106
Таким образом, 37V: Vn^7V^>c — Е<ап<с + е, или \an — c| < e. Но это и означает, что lim ап = с. п—*сх> Если {ап} монотонно убывает, то {Ьп}, где Ьп — — ап. моно- тонно возрастает и, по доказанному, имеет предел с: lim b7l — с. п^оо Тогда lim ап — — lim bn — - с. п—>эо п—>ос Значит, теорема Вейерштрасса справедлива и в этом случае. Свойства точной нижней грани аналогичны свойствам точ- ной верхней грани. Аналогом теоремы (3.13) здесь служит сле- дующая теорема. Теорема 3.15. Число р является точной нижней гранью мно- жества А в том и только том случае, когда выполняются следу- ющие условия: 1) V а G А => а > р; 2)Ve>0 ЗаеА: а<р + е. Предлагается доказать эту теорему самостоятельно. Рассмотрим кратко еще одно понятие. Выберем некую воз- растающую последовательность натуральных чисел П1,п2,пз, ... Члены последовательности {ап} с этими номерами образуют так называемую подпоследовательность исходной последовательно- сти {ап}: °П1 7 ^П2 1 ^Пз 7 ’ * ' 7 7 • • • Теорема 3.16. Всякая подпоследовательность сходя- щейся последовательности {ап} сходится к тому же пределу, что и исходная последовательность. Доказательство. Действительно, пусть lim ап — а. Тогда п—>оо Ve > О Возьмем теперь 7<, такое, что п/< Е. N. Такое К, разумеется, найдется, так как /ц- оо. Тогда V /О К п^> пк N, а значит, |аПл “ а| < е • 107
Итак, Ve>0 ЭК: Но это и означает, что V к > К => — а| < s. lim аПк — а, k^-OQ Обратное утверждение неверно. Подпоследовательность мо- жет сходиться, тогда как сама последовательность является рас- ходящейся. Это видно на примере последовательности 1,0,1,0,1,0, ... Действительно, подпоследовательность ее элементов с нечетны- ми индексами состоит из единиц и имеет предел, равный единице. Однако сама последовательность расходится. Эта же последовательность может служить иллюстрацией и к следующему очевидному следствию теоремы 3.16. Следствие. Если у последовательности имеются две подпо- следовательности, сходящиеся к разным пределам, то исходная последовательность расходится. Докажите следствие самостоятельно. 3.3. Предел функции действительного аргумента Дадим определение предела для функции /(ж) действитель- ного аргумента. Под окрестностью точки то будем понимать множество сле- дующего вида: U(to) = {т : |т — то| < 8}, где 8 > 0 (3-17) Иначе, U(то) — это симметричный интервал (то — 8, xq + 8) с цен- тром в точке то и радиусом (расстоянием от центра до концевой точки), равным 8. Проколотой окрестностью U(tq) точки то будем называть окрестность с выколотым центром, т. е. множество вида U(tq) = {т : 0 < |т - то| < 8}, где 8 > 0. (3.18) Здесь будем рассматривать функции, определенные в некото- рой проколотой окрестности точки Tq. 108
Рис. 3.3 Рис. 3.4 Определение 3.8. Число а называется пределом функции при х, стремящемся к хд, если Ve>0 3U(xo): Vt e U(xo) |/(т) — а| < е. (3.19) Коротко это записывается так: lim f(x) = а. х— Обратим внимание, что в (3.19) участвует проколотая окрест- ность. Это означает, что наличие предела, а также его значе- ние полностью определяются поведением функции /(т) в точ- ках, близких к а?о, но отличных от самой жд- В частности, f(x) может быть вообще не определена в точке х$ или определена в ней и равна какому угодно значению — это никак не отразится на ее пределе. Например, на рис. 3.3 и 3.4 представлены графики двух функций, одна из которых не определена в нуле, а другая определена и равна нулю в этой точке. Но и в том, и в другом случае предел при ж, стремящемся к нулю, будет равен единице. Теорема 3.17 (о единственности предела). Если у функ- ции f(x) имеется предел, то он единственный. Доказательство. Действительно, пусть lim /(ж) = а и lim /(ж) — fe; а ф Ь. X—^XQ X—^XQ Выберем е > 0 настолько малым, чтобы интервалы (а — б, а + е) и (Ь — £, b + е) не пересекались. Для этого достаточно взять \Ь — а| _ О < е < -----. Но определению предела 2 Эй1(ж0): Vr G Ui(x0) => |/(х)-а| < е, т. е. число f (т) попадает в Е-окрестность точки а. Аналогично, Зи2(ж0) : Vx G и2(жо) => |/(ж) - ь| < Е, т. е. число /(х) попадает в е-окрестность точки Ь. Положим й(х0) =й1(.то)Пи2(то). (3.20) 109
Знак P| в (3.20) означает пересечение (т. е. общую часть) данных множеств. (Фактически, U(xq) совпадает с той из окрестностей Ui(a?o) и ^(хо), у которой радиус меньше.) Тогда для любого х G U(xq) число /(х) одновременно попада- ет в два интервала (а — е, а + е) и (b — е, b + е), которые не имеют общих точек. Следовательно, предположение о наличии у f(x) двух пределов ложно, и f(x) может иметь лишь один предел. Определение 3.9. Функция /(ж) называется локально огра- ниченной в точке жо, если ЗС>0 и 3U(x0): VxgU(x0)^>|/(x)|^C. (3.21) Теорема 3.18. Если f(x) имеет предел при ж, стремящемся к xq, то она локально ограничена в точке xq. Доказательство. В самом деле, возьмем е = 1. Тогда в си- лу (3.19) 3U(xq): \/х е U(xq) => |/(х) — а| < 1. По свойству модуля |/(«)| - |а| < I/O) - °|- Отсюда V.t G U(xq) |/(х)| — |а| < 1, т.е. |/(х)| < |п| + 1. Полагая С = |а| + 1, получим (3.21) (строгое неравенство всегда можно заменить нестрогим.) Лемма 3.3. Пусть для функции /(ж) выполняются следу- ющие условия: 1) 3U(x0): \/х е U(x0) => /(х) > 0; 2) lim f(x) = с. X-^Xq Тогда с 0. Доказательство. Действительно, пусть с<0. Возьмем е = Тогда по определению предела или 3Ui(x0): Уж G й1(ж0) |/(ж) - с| ПО
Но с < 0, значит, с =— с и с + — ~ с - - = из (3.22) вытекает, что /(z) < 0 для Vz G Ui(^o)- Положим U2(®o) = й(жо) С|й1(жо). О, а тогда Тогда Ух gU2(zq) выполняются одновременно неравенство /(ж) < < 0 и первое из условий леммы, что невозможно. Следовательно, с 0. Теорема 3.19 (о переходе к пределу в неравенствах). Пусть функции /(z) и д(Д) удовлетворяют следующим услови- ям: 1) 3U(z0): Vz G U(z0) f(x) ^(z); 2) lim /(z) = а и lim g(x) = b. X—>Xo x—>Xo Тогда a < b. Доказательство. В самом деле, положим <p(z) = д(х) — f(x). Тогда для функции cp(z) выполнены все условия леммы 3.3. По этой лемме lim cp(z) = lim д(х) — lim /(z) = b — a 0, или a b. x—>Xo X—>X0 71—*Xq Здесь, как и в случае последовательностей, использовано то, что предел разности двух функций равен разности их преде- лов. Соответствующая теорема будет доказана далее (см. теоре- му 3.26). Теорема 3.20 (о сохранении знака). Пусть функция /(z) удовлетворяет следующим условиям: 1) lim /(z) = а; х—>Ж0 2) а > 0 (а < 0). Тогда BU(z0): Vz G U(z0) =>/(ж) > 0 №) < 0). Доказательство. Пусть, например, а > 0. Положим е = — >0. По определению предела Откуда BU(z0) : Vz G U(zq) /(z) - a\ a 2* a f(p) 111
Следовательно, /(z) > — > 0. Гёорема 3.21 (о «зажатой переменной»). Пусть даны три функции /(ж), д(х) и hx), удовлетворяющие следующим условиям: 1) 3 U(#o): Vrr G U(xo) => д(х) < /(ж) h(x): 2) lim д(х) — lim h(x) = а. х—>хо ж—*а?о (3.23) Тогда существует lim /(ж) — а. X—+XQ Доказательство. Возьмем е > 0. В силу определения предела 3Ui(s0): Уж € Ui(x0) =4> |5(x) - a <8, t. e. a — 8 < q(x) < a + e; . V 7 (3.24) Эйз^го): Vt e иг(жо) => \h(x) — a| < e, t. c. a — e < /г(ж) < a + e. Положим йз(яо) = и(жо)Пи1(жо)Г|й2(жо). Тогда из (3.23) и (3.24) следует, что Vх G Цз(жо) => a — е < д(х) С f(x) < h(x) < а 4- е. откуда |/(ж) -а| < е. Пришли к определению предела для f(x): lim f(x) — а. х—>Хо Дадим теперь определение бесконечно малой функции и изу- чим свойства таких бесконечно малых. Определение 3.10. Функция а(ж) малой при х, стремящемся к xq, если называется бесконечно lim ос г) — 0. X^XQ Это определение в развернутом виде выглядит так: Ve > 0 3U(.T0): W G и(ж0) => |а(д;)| < е. (3.25) Теорема 3.22 (о связи пределов с бесконечно малы- ми j. Для функции /(х) ]im /(z) = а <4 3U(^o • Vz G UQro) => /(^) — a + a(rr), X—>Жо где а(а?) ~~ бесконечно малая. 112
Доказательство этой теоремы повторяет доказательство тео- ремы 3.6 с очевидной заменой ап на /(.т), N — на U(xq) и т.д. Предлагается провести его самостоятельно. Теорема 3.23. Сумма (разность) двух бесконечно малых есть бесконечно малая. Доказательство. Пусть а'х) и (3(х) лежим бесконечно малые. По- у(ж) — ос(ж) ± Р(#). Возьмем Ve О, поделим его на два и применим (3.25) е SUi(rro): Vx G Ui(^o) «COI 3U2(^o): G U2(^o) => |₽(ж)| (3.26) Положим Тогда Vx G UQeq) выполняются оба неравенства (3.26). Следова- тельно, для этих х у(ж)| = |а(ж) ± р(#)| |а(ж)| + |р(х)| т. е. у (ж) — бесконечно малая. Как и для последовательностей, отсюда вытекает, что сумма (разность) любого конечного числа бесконечно малых есть бес- конечно малая. Теорема 3.24. Произведение бесконечно малой функции на локально ограниченную есть бесконечно малая. Доказательство Действительно, пусть lim сох) = 0, а Х—гХ(} fix) — локально ограничена в точке а?о- Тогда для f(x) выпол- няется соотношение (3-21). Возьмем Ve > 0 и разделим его на £ константу С из (3.21). Полагая в (3.25) — вместо Е, получим: 3Uj(to): Vt е Ui(to) => |а(т)| Положим U2(x0) = U(a?o) AUi(^o)- 113
Тогда Vx G U2(x0) => |a(x)/(x)| = |a(x)| /(x)| < = e. Следовательно, a(x)f(x) — бесконечно малая. Следствие. Произведение двух бесконечно малых есть бес- конечно малая. Следствие. Произведение любого конечного числа бесконеч- но малых есть бесконечно малая. Эти следствия доказываются точно так же, как и в случае последовательностей. Определение 3.11. Функция называется бесконечно большой при ж, стремящемся к жо, если VC>0 Зи(ж0): Vx g й(ж0) => !/(®)| Кратко это обозначается так: lim / (т) — ос, х—*XQ хотя надо ясно понимать, что у бесконечно большой нет настоя- щего предела, и, следовательно, теоремы о пределах к данному случаю неприменимы. Как и для последовательностей, в случае, если f(x) сохраняет знак в окрестности Й(я;о)7 используют обозначения lim /(ж) — +оо х—>Хо lim /(т) = —ос. X—>XQ И Теорема 3.25. Пусть функция /(ж) — бесконечно большая при х -+ х$. Тогда —.ч — бесконечно малая при х хц. /и) Доказательство. Возьмем произвольное е > 0. Положим Z-V 1 тл С = -. В силу определения бесконечно большой Эй(гго): Vx G U(x0) => I/O) > С = Е Тогда для тех же х Е 114
Мы пришли к определению бесконечно малой. Выясним: верно 1 ли утверждение, что если f(x) - бесконечно малая, то •• — /W бесконечно большая? Здесь возникает сложность, связанная с тем, что бесконечно малая может обращаться в нуль в некото- рых точках сколь угодно малой окрестности точки то, а тогда ] дробь -77—г не будет определена в этих точках. Но если потре- f&J бовать, чтобы /(ж) не обращалась в нуль в некоторой проколо- той окрестности точки xq, то соответствующая теорема будет справедливой. Докажите ее самостоятельно в качестве простого упражнения. Теперь докажем ряд теорем о действиях с пределами, анало- гичных тем, что изучались нами в случае последовательностей. Теорема 3.26 (о пределе суммы). Пусть lim f(x) = а и х—+XQ lim ф х) = Ь. Тогда X-^XQ Доказательство, Действительно, по теореме 3.22 /(ж) = а + а(ж); д(х) = 6 + Р(ж), где а(х • и р(ж) — бесконечно малые. Тогда f(x) ± д(х) = (а ± Ь) + (а(ж) ± Р(®))- (3.27) Но в силу свойств бесконечно малых выражение во второй скоб- ке в правой части (3.27) является бесконечно малой. А тогда по той же теореме 3.22, но примененной в обратную сторону, полу- чим утверждение теоремы. Теорема 3.27 (о пределе произведения). Предположим, что lim f(x) — а и lim д(х) — Ъ. Тогда lim f(x) д(х) = ab. х—-XQ х—X~^XQ Доказательство. Вновь по теореме 3.22 /(ж) — а + а(х); д(х) -Ь + р(ж), где а(х) и р(ж) — бесконечно малые. Поэтому л f(x)g(x) = {а + а(ж))(Ь + р(ж)) = — ab + (ар(х) + Ьа х' + а(х)р(х)). (3.28) 115
Как и ранее, убеждаемся, что выражение, стоящее в скобках в правой части (3.28), является бесконечно малой. И опять по тео- реме 3.22 получим требуемое утверждение. Перед теоремой о пределе частного необходимо доказать лемму. Лемма 3.4. Пусть функция д(х) удовлетворяет следующим условиям: lim д(х) — Ь; X— XQ 2) b ф 0. 1 Тогда lim ——— Доказательство. Заметим вначале, что по теореме о сохра- нении знака из второго условия леммы следует, что Эи(ж0): V® 6 й(хо) ==• д(х) ± 0. Далее по теореме 3.22 д{х) = b + |3(.т 1, где $(х) — бесконечно малая. Тогда 1 0(ж) 1 _ 1 1 b b + Р(х) b Р(ж). (3.29) Положим е лой 0, тогда в силу определения бесконечно ма- 3Ui(x0): Vx t Ui(x0) =>|р(я)| < — Откуда |fr + ₽WI>|!>|-|₽«|>|6|-V=T- Значит, в проколотой окрестности йг^о) = Wo)nUi(xo) справедливо неравенство 1 Ь(Ь + р(х)) 116
Таким образом, величина, стоящая в скобках в (3.29), является локально ограниченной в точке .гд. Но тогда, по свойствам беско- нечно малых, вся правая часть в ( 3.29), которую для краткости обозначим через у (ж), является бесконечно малой. Но Следовательно, по теореме 3.22 lim х—>2Со Теорема 3.28 (о пределе частного). Пусть функции f(x) и д(х) удовлетворяют следующим условиям: 1) lim f(x) — a, lim д(х) — b; Х~>Х() Х-^Хо 2) b / 0. Тогда т /(О « 111П . х—*хо д{х) b Доказательство. В самом деле, запишем дробь в виде произ- ведения и применим теорему о пределе произведения с учетом леммы 3.4 lim ——— = lim f(x) lim ——— = a- — x-^xo g(x) x->x0 x^xo g(x) b b Теперь введем некоторые специальные типы пределов. Определение 3.12. Назовем проколотой окрестностью бесконечности любое множество вида U(oo) = {ж: |х| > Л}, где А > 0. Определение 3.13. Число а называется пределом f(x) при т, стремящемся к бесконечности, если Ve > 0 3U(oo): Va; Е U(oo) => |/(ж) — а| < е. л Это кратко записывают следующим образом: lim /(а;) = а. х—>оо 117
Видим, что данное определение есть, фактически, дословное по- вторение определения предела при х —+ xq с заменой и(жо) на U(oc). Поэтому все теоремы о пределах оказываются справедливы- ми и в этом случае. Определение 3.14. Число а называется предел ом справа функции f(x) при ж, стремящемся к жо (обозначение: lim /(ж)), >жо+ если Ve > 0 Зй(жо'): Уж Е й(жд) : ж > жо => /(ж) — а| < е. Определение 3.15. Число а называется предел ом сле- ва функции /(ж) при ж, стремящемся к жо (обозначение: lim Х—>Х$ — /(ж)), если Уе > 0 Эи(жо): УжЕ и(жо) : ж < жо => |/(ж) — а| < е. Пределы справа и слева носят название односторонних пре- делов. Теорема 3.29. Для того чтобы существовал Вт /(ж) = а, X—+XQ необходимо и достаточно, чтобы существовали оба односторон- них предела при ж —> жо, причем lim /(ж) — lim /(ж) — а. х—>Э?о+ X^XQ— (3.30) Доказательство. Пусть сначала выполнено (3.30). Возьмем произвольное е > 0. Тогда ЭЬ]^жо): УжвПДжо): ж > жо => |/)ж) — а| < е; Зи2(жо): Ужеи2(жо): ж < жо => |Дж) — «| < е. (3.31) Положим и(ж0) = Ui’ ж0) Пй2(ж0). Тогда из (3.31) следует, что Уже U($o) ==> |/(ж) — а| < е. Но это и означает, что lim /(ж) = а. х—>Хо Пусть теперь, наоборот, дано, что lim -ж = а. Требуется х—>XQ дрказ&гь, ЧТО lim /(ж) = lim f ж) = а. Т-~>3’о+ X—>XQ — 118
Доказательство этого утверждения тривиально. Проведите его самостоятельно. Понятие односторонних пределов переносится и на случай X 03. Говорят, что lim f(x) — а, если я—>+оо Ve > 0 3U(oo): Vj: е U(oo): х > 0 => |/(х) — а| < е. Аналогично, lim f(x) = а, если х—>—ОС Ve > О 3 U(ос): Vx е U(oc): х < 0 => |/(х) — а| < е. Разумеется, здесь также справедлива теорема 3.29. В случае бесконечно больших величин мы встречаемся с вы- ражениями типа lim f(х) = +оо; х—ОС lim /(ж) — +ос; ж—>+ос lim /(ж) = ос и т. п. х~->Ч-ос Упражнение 3.2. Расшифруйте самостоятельно, что озна- чает каждое из подобных выражений. Введем теперь число е, играющее важную роль в высшей ма- тематике. Вначале укажем без доказательства известную формулу из элементарной математики, которая носит название «Бином Ньютона» (о + Ь)” = о” + по”"1!) + ,,(1‘ ^п'-2!)2 + • • • + "("-I)''("-*+D +... +„ (3.32) где а и b ~ произвольные действительные числа; п любое на- туральное число; kl = 1 • 2 • ... • к. Коэффициенты в правой ча- сти (3.32) называются биномиальными коэффициентами. Положим в (3.32) а — 1, тогда эта формула примет вид: VLbk +... + ьп. (1 + ьу1 = 1 + nb + -^2! Ь2 + • • • + п — 1) • • ♦ (п — к + к\ Теорема 3.30. Существует предел ( 1V lim |1-|— ) п—>ос \ nJ (3.33) (3.34) 119
Доказательство. Рассмотрим последовательность ап Ч—Y1. Подставив в (3.33) Ь ~ п 5 п получим: (3.35) В правой части (3.35) имеется ровно п слагаемых. Что произой- дет с правой частью (3.35), если перейти от п к n+1? Знаменате- ли дробей в каждой скобке возрастут, вычитаемые уменьшатся, а выражения в скобках увеличатся. Кроме того, добавится еще одно положительное слагаемое. В итоге вся правая часть возрас- тет. Таким образом, при любом п справедливо соотношение Следовательно, последовательность {нп} монотонно возрастает. Заменим теперь в (3.35) каждую скобку единицей, а во всех факториалах, стоящих в знаменателях, числа, большие 2, заме- ним на 2. При этом правая часть (3.35) увеличится, и получится оценка (3.36) Но дроби в правой части (3.36) являются членами геометриче- ской прогрессии. Применив известную формулу для суммы чле- нов такой прогресии, получим оценку: 2П 2n-i 2П-1 Итак, при любом п (3.37) 120
Значит, последовательность {пп} — монотонная ограниченная последовательность, а тогда по теореме Вейерштрасса она имеет предел, что и требовалось доказать. Предел (3.34) называется числом е. Из (3.37) следует, что это число расположено между 2 и 3. На самом деле, это иррацио- нальное число, которое представляется бесконечной десятичной дробью: е — 2,71... Можно показать (хотя, сделать это акку- ратно не так уж просто), что числу е равен не только предел последовательности (3.34), но и предел функции, которая полу- чается формальной заменой в (3.34) натурального п на действи- тельное х: ( 1V lim 1 + - = е. (3.38) х—>ос \ X J Убедимся теперь, что и (3.39) Действительно, заменим в (3.39) х на Тогда Последний предел очевидно совпадает с (3.38), ибо обозначение переменной роли не играет. 3.4. Непрерывность функции Определение 3.16. Функция f(x) называется непрерывной в точке хо, если она определена в некоторой окрестности этой точки и lim /(т) = /(ж0). (3.40) X—+XQ Можно, воспользовавшись определением предела, расшиф- ровать (3.40). При этом вместо проколотой окрестности U(jro) можно взять полную окрестность U(j7q), поскольку функция f(x) определена в точке х$ и ее предел равен именно значению /(жо), а не какому-либо иному числу. Итак, функция f(x) непрерывна в точке то, если Ve >0 3U(x0) : Ух е U(x0) => |/(х) - /Ы1 < е. (3.41) Установим арифметические свойства непрерывных функций. 121
Теорема 3.31. Пусть функции /(ж) и д(х) непрерывны в точ- ке х^. Тогда: 1) f{x) ± д(х) непрерывна в точке то; 2) f(x)g(x) непрерывна в точке а?о; 3) если д(хо) 0, то непрерывна в точке #о- р(^) Доказательство этой теоремы очевидно следует из определе- ния 3.16 и соответствующих теорем о пределах. Например, п. 2 доказывается так: lim f(x)g(x) = lim /(ж) lim д(х) = f(xo)g(xo). В силу (3.40) это означает, что функция f(x)g(x) непрерывна в точке жо- Пункты 1 и 3 докажите самостоятельно. Очевидно, что если некоторая функция постоянна в окрест- ности U(to), то она непрерывна в точке яд* Ясно также, что /(ж) = х непрерывна в любой точке то, поскольку lim х — Xq. x—+xq Из теоремы 3.31 следует, что непрерывными в любой точке будут функции — х к раз Но тогда непрерывным в любой точке будет многочлен а$хп + + а]Хп 1 + • • • + апу а также отношение таких многочленов при условии, что знаменатель отличен от нуля. Иначе, рациональная функция а^хп 4- а±хп 1 +---ап boxm + bixm 1 4--4- Ь. непрерывна в любой точке своей области определения. А что произойдет, если в непрерывную функцию вместо аргу- мента подставить другую непрерывную функцию? Будет ли та- кая сложная функция непрерывной? Для ответа на этот вопрос докажем одну теорему. 122
Теорема 3.32 (о предельном переходе под знаком непрерывной функции). Пусть заданы две функции f'^u) и <р(т), удовлетворяющие следующим условиям: 1) f(u) непрерывна в точке wo; 2!) lim <р(т) — ио- X^Xq Тогда lim f (<р(ж)) = /(п0). Доказательство. Действительно, возьмем произвольное е 0. В силу (3.41) Эи(зд): Viz, е и(зд) |/(w) - /(п0)| < £• (3.42) Обозначим радиус окрестности U(#o)i фигурирующей в (3.42), через 8. Таким образом, L(wo) — {и- < 8}. Поскольку lim ср(#) = ио Vei>0 V# € U(#o) => !<?(#)-^о| < (3.43) Возьмем в (3.43) Ei — 8. Тогда для любого х из U жо) справед- ливо неравенство (ж) — ло| < 8, а это означает, что число <р(я) попадает в окрестность U(^o) из (3.42). Значит, I/ (ф(®)) - /(«о) Е. Итак, Ve > 0 3U(a?o): Уж € С(ж0) =>• |/(ср(х)) - Л«о)| < е- Но это и означает, что lim f (<р(ж)) = /(м0). Из теоремы 3.32 вытекает следующая важная теорема. Теорема 3.33 (о непрерывности сложной функции). Пусть функции f(u) и <р(ж) удовлетворяют следующим усло- виям: 1) f(u) непрерывна в точке ио; 2) ср (ж) непрерывна в точке то; 3) cp(zo) = ио. 1огда сложная функция / (ср(®)) непрерывна в точке tq. 123
Доказательство. В самом деле, из условий 2 и 3 теоремы сле- дует, что lim ф(ж) = (р(^о) — Зд- * Но тогда мы оказываемся в условиям теоремы 3.32, согласно ко- торой lim f (<р(ж)) = /(«о) = f (фОо)) • Х^-Хо А это и означает, что f (<р(ж)) непрерывна в точке £о- Таким образом, получен ответ на поставленный ранее вопрос о том, что при подстановке в качестве аргумента одной непре- рывной функции в другую получается снова непрерывная функ- ция. Приведем еще одно определение: функция называется непре- рывной на некоем множестве, если она непрерывна в каждой точке этого множества. Вспомним теперь общее определение функции, согласно ко- торому каждому элементу х из множества X ставился в соот- ветствие элемент у из множества У, но при этом не исключался случай, когда разные х переходили в один и тот же у. Напри- мер, функция f(x) = 1 всю числовую прямую переводит в одну точку 1. Если же на функцию у = f(x) наложить дополнительное условие, что из .zi х% следует, что у± Ф у%, тогда на области значений этой функции можно определить обратную функцию х — ср(т/), которая каждому элементу у сопоставляет тот един- ственный элемент х, который переходит в этот у под действием функции f(x). Понятно, что обратной функцией к функции х = <р у) будет исходная функция у — f(x), так что следует говорить о паре взаимно-обратных функций. А теперь сформулируем (без доказательства! следующую теорему. Теорема 3.34 (об обратной функции). Пусть функция у “ f(xj определена на некотором промежутке, непрерывна и строго монотонна на нем. Тогда у нее существует обратная функция х — ф(у), определенная на своем промежутке, и также непрерывная и строго монотонная на нем (в ту же сторону). Показательная функция у — ах, где а > 0 и а 1, непрерывна и строго монотонна на всей числовой оси. (Доказательство этого факта достаточно сложно и здесь не приводится.) 124
По теореме 3.34 у показательной функции существует обрат- ная функция, называемая логарифмической х = logrj у. Обла- стью определения этой функции является область значений по- казательной функции, т. е. полупрямая (0; +оо|. Логарифмиче- ская функция непрерывна на этой полупрямой и строго моно- тонна в ту же сторону, что и показательная функция ах (т. е. мо- нотонно возрастает при а > 1 и монотонно убывает при а < 1). В частности, если в качестве основания а взять число е, то и показательная (еж), и логарифмическая 1п?у функции будут монотонно возрастающими. Обычно аргумент логарифмической функции, как и у всех остальных функций, обозначается бук- вой х, что, конечно, не меняет сути дела. Рассмотрим теперь две функции f(u) = lnu И ф(ж) = (1 + х)*. Полагая uq — е и xq = 0 и применяя теорему 3.32 о предельном переходе под знаком непрерывной функции, получим: lim (р(х) = lim (1 + я) * = е, х—>0 1 х—»0 lim f (ср(т)) = lim ln(l + х)^ = lim — 1п(1 + ш) — Ine 1. ж—>0 х—>0 х—>0 X Ч Итак, вычислен еще один важный предел: 1п(1 + х) lim----------- (3.44) х—*0 X Возьмем функцию жп, где п — целое число, отличное от ну- ля. Это частный случай рациональной функции. Поэтому она непрерывна на всей своей области определения, т. е. на всей чис- ловой оси при натуральны к п и всюду, кроме точки 0, при отри- цательных п. Рассмотрим теперь хр при произвольном действительном р. Поскольку не при всех р такая функция определена для отри- цательных значений ж, докажем ее непрерывность для V х > 0. Для этого положим f(u) = e{' и ср( х) = р In х и применим теорему о непрерывности сложной функции. По- скольку /(<?(ж)) = е^п* = е1пжР ^хр. то из этой теоремы следует непрерывность на (0,4-ос). 125
Заметим, что при некоторых р функция хр оказывается опре- деленной и для отрицательных значений ж, но тогда опа облада- ет свойством четности (/(—ж) = /(ж)) или нечетности (f(—x) — — —/(ж)), что позволяет вопрос о непрерывности функции при отрицательных х свести к вопросу о непрерывности на (0, +оо). Что касается самой точки 0, то при р 0 функция хр будет непрерывной в этой точке (быть может, только в смысле непре- рывности справа, которая определяется аналогично односторон- нему пределу), а при р < 0 эта точка не входит в область опре- деления данной функции. Таким образом, хр непрерывна на всей своей области опреде- ления. Перейдем теперь к тригонометрическим функциям. Сначала установим важное неравенство: V х Е R: | sinж| |ж1. (3.45) Пусть х Е (0; -). На тригонометрическом круге угол /ЛОВ, измеренный в радианах, равен х и расположен в первой четвер- ти (рис. 3.5). Поэтому длина дуги АВ также равна ж, так как ра- диус круга равен 1, и больше длины стягивающей ее хорды АВ, которая в свою очередь больше длины перпендикуляра ВС> ко- • TJ /га \ торая равна sin ж. Итак, для ж Е (0, -) справедливо неравенство sin ж Поскольку обе части неравенства положительны, его можно пе- реписать в виде 181пж| < |ж|. (3.46) Пусть теперь ж Е (— ведливо неравенство 0). Тогда (—ж) Е (0: -) и для него спра- |sin(—ж)| < | — ж|. Но | sin(—ж)| = | — sin ж =|яшж| и | — х — = |ж|. С ледовательно, и для этих ж вы- полняется (3.46). _ . , n |.| Если ж ТО 8ШЖ 1 ' 2 1 1 и мы снова получаем ( 3.46).. Наконец, если ж — 0, то 18шж| = | sin0| — 0 — :Ж|. It 2 kb п 126
Таким образом, неравенство (3.45) выполняется для всех дей- ствительных х. Теперь уже можно доказать непрерывность тригонометриче- ских функций. Начнем с sin х. Возьмем произвольную точку zq и оценим разность sinz — — sinzg. | sin x — sinzol — . X — Xq sm —-— . x — Zq x + Zq 2 sm —~— cos —-— 2 2 x + Xq cos —-— 2 (3.47) Здесь мы воспользовались неравенством (3.46) и очевидной оценкой для косинуса. Н озьмем теперь произвольное е > 0. Выберем окрестность точки хо радиуса е: U(zo) = {х : |z — хо| < е}. Тогда из (3.47) следует, что Vz е U(zq) => | sinz — sinzol < Мы пришли к определению непрерывности. Поскольку zq была произвольной точкой, получаем, что функция sin z непрерывна на всей числовой оси. Упражнение 3.3. Проведите аналогичное доказательство непрерывности cos z. Далее, функции tg z и ctg х представляют собой дроби: sin х cos z tg x =----; erg x = -----, cos z sm x поэтому они непрерывны на всей своей области определения в силу теоремы о непрерывности частного. Вернемся к функции sin х. На всей числовой оси она не имеет обратной функции, так как каждое свое значение принимает в бесконечном числе точек. (Чтобы убедиться в этом, вспомните формулу для решения уравнения sin х = а.) Если ограничить область определения функции sinz отрез- я m ком то на нем функция у = sinz будет строго моно- тонной и непрерывной, а тогда по теореме об обратной функции 127
(см. теорему 3.34) у нее существует обратная функция (аркси- нус) х — arcsin?;, областью определения которой будет область значений функции у — sin х. т. е. отрезок [—1; 1]. Если переобозначить переменные, то получим график этой функции, представленный на рис. 3.6. Аналогично определяются и остальные обратные тригоно- метрические функции: арккосинус, арктангенс и арккотангенс. Все они являются строго монотонными и непрерывными на сво- ей области определения функциями. Их графики представлены соответственно на рис. 3.7, 3.8 и 3.9. В заключение этого подраздела выведем еще один «замеча- тельный» предел v sinj: /о lim-----= 1. (3.48) т->0 х Рассмотрим чертеж, представленный на рис. 3.10. Для вы- числения предела (3.48) нужно знать поведение функции---- в некоторой проколотой окрестности точки 0. Возьмем проколо- ти тую окрестность U л (0) радиуса - и вначале рассмотрим правую 2 2 л половину этой окрестности: х Е (0, ~). Из чертежа видно, что в этом случае треугольник АО В содержится в секторе ЛОВ, ко- торый, в свою очередь, содержится в треугольнике АОС. Выражая площадь каждой из этих фигур через угол т, изме- ренный в радианах, и учитывая, что радиус окружности равен 1, получим ~ S1HT (3.49) Здесь учли, что длина отрезка АС равна tgx. Поскольку все ве - личины в (3.49) положительны, получим неравенство Рис. 3 7 128
sin a; (3.50) cos a; Если теперь x E т. e. принадлежит левой половине окрестности Uл (0), то 2 / к Z (-ж) G (О,-) и, следовательно, . Л sm(—х) cost—ж) < —----— < 1. (—ж) Учитывая четность cos ж и нечетность sin ж, находим, что нера- венство (3.50) остается справедливым и в этом случае. Таким образом, (3.50» выполняется во всей окрестности U" (0). Заметим, что в силу непрерывности косинуса lim cos ж = cos 0—1. а?—>0 Очевидно также, что lim 1=1. ж—>0 Тогда по теореме о «зажатой переменной» из (3.50) полу- чим (3.48). Изучим теперь так называемые локальные свойства непре- рывных функций, т. е. поведение функции в малой окрестности заданной точки, которое выражается следующими двумя теоремами. Их мож- но вывести из соответствующих теорем о пределах, но здесь докажем их непо- средственно. Теорема 3.35. Если функция /(ж) непрерывна в некоторой точке жо, то она локально ограничена в этой точке. Рис. 3.10 129
Доказательство, Возьмем £ — 1. В силу определения непре- рывности Э и(ж0)•• Vrr G U(®0) => |/(х) - Дя0)| < 1- По свойству модуля /(а?)| - |/(я0)| < /(ж) - Тогда 1/001 - |/(жо)[ < 1, ИЛИ /(а=о)| + 1- Полагая С — |/(а?о)| + 1, получим определение локальной огра- ниченности. Теорема 3.36. Если /(ж) непрерывна в точке то и f(xo) > О (f(®o) < 0), то Эи(ж0): Ухе U(x0) => /(ж) > 0 (/(х) < 0). Доказательство. Пусть, например, /(то) 0. Положил! е = тогда по определению непрерывности Эи(то): Ух е и(т0) ;/(т) - /(то)| < ИЛИ Лад) - < /Ы + Но Дх0) - ~~^г~ - > 0- Значит, Дх) > 0. Замечание. В теоремах 3.35 и 3.36, в отличие от соответствующих теорем о пределах фигурируют полные, а не проколотые окрестности ТОЧКИ Т(). гёперь изучим общие свойства функций, непрерывных на не- котором отрезке [а, Ь]. Подчеркнем, что речь здесь идет имен- но об отрезке, т. е. промежутке, в который входят обе концевые точки а и 5, а не о промежутке произвольного вида. Сформули- руем несколько фундаментальных теорем. Доказательства этих теорем весьма непростые и будут приведены в приложении к данной главе (см. подразд. 3.6 ), а здесь ограничимся формули- ровками. 130
Следует отметить, что, изучая функции, непрерывные на от- резке, мы, вообще говоря, не предполагаем, что они определе- ны вне этого отрезка. Поэтому при определении непрерывности в концевых точках а и b отрезка нужно следить за тем, чтобы переменная х не выходила за пределы [а, b . Поэтому определе- ние (3-16) в этом случае примет вид: и Ит /(ж) = f\b), х—Ь— т. е. речь идет о так называемой односторонней непрерывности в точках а и Ь. Но это уточнение не влияет ни на формулировки приведенных далее теорем, ни на их доказательство. Теорема 3.37. Если функция непрерывна на отрезке [п, Ь], то она ограничена на этом отрезке, т. е. 3(7>0: Уж 6 [п, Ь] => |/(ж)| < С. Теорема 3.38. Если функция /(ж) непрерывна на отрезке а, Ь], то она достигает на нем своих точной верхней и точной нижней граней, т. е. Зжх,ж2 G [а, 6]: /(Ж1) = т = inf {/(ж)}; /(ж2) = М = sup{/(x)}. [а,Ь] Теорема 3.39. Если функция /(ж) непрерывна на отрезке а, Ь] и на концах его принимает значения противоположных зна- ков, то 3 Жо € [а, Ь]: /(ж0) = 0. Теорема 3.40. Если функция /(ж) непрерывна на отрезке [й, Ь], то ее область значений на этом отрезке совпадает с отрез- ком [m, М], где т = inf {/(ж)}; М = sup{/(x)}. [аД] 3.5. Асимптотическое поведение функций Рассмотрим три функции: ж, ж2, х\ При х —> 0 все они явля- ются бесконечно малыми, однако легко заметить, что стремят- ся к нулю они «с разной скоростью». Так, если х — 0,01, то ij — 0,0001 , а х3 — 0,000001. При меньших х разница будет еще нагляднее. Можно сказать, что х2 стремится к нулю быст- 331
рее, чем ж, аж3 — быстрее, чем т2. Если х —> оо, то наоборот, т3 растет быстрее всех, х2 — медленнее, чем т3, а х еще медленнее. । озникает необходимость сравнивать между собой бесконеч- но малые и бесконечно большие величины по тому, с какой ско- ростью они изменяются при х —* то, т. е. изучать асимптотиче- ское поведение функций в окрестности точки то- Будем считать, что каждая из функций, изучаемых в данном подразделе, отлична от нуля в некоторой проколотой окрестно- сти U(tq) точки Tq- Определение ЗД7. Говорят, что функция а(т) эквивалент- на функции р(т) (а ~ р) при х —> то, если в некоторой проколо- той окрестности U(tq) точки то справедливо соотношение а(т) = р(т)д(т), где lim q(x) = 1. (3.51) X—>Хо Очевидно, что это определение равносильно следующему: lim X—>хо Р(т) (3.52) Для доказательства равносильности обоих определений досга- сх(т) точно обозначить через п(т) дробь . Р(т, Таким образом, на множестве функций, отличных от нуля в некоторой U(то), вводится так называемые отношение эквива- лентности. Это отношение обладает следующими свойствами: 1) а ~ а (рефлексивность); 2) а ~ р => р ~ а (симметричность); 3 j а ~ р и р ~ у а у (транзитивность). Действительно , а(т) — а(т) • 1, lim 1 — 1. X—>Хо Значит, верно первое свойство. Далее, а ~ р => а(т) — р(т}Дт), где lim q(x) ~ 1. Х—>Хо Тогда Р(т) = ос(т) 9 (ж) = а(ж)д1(ж), где lim Х~>Хо 91 (ж) = q(x) Следовательно, верно и второе свойство. Наконец, а~р а(т) — P(t)qi(t), Р ~ У => р(т) = y(x)q2(x), где где lim gi (т) — 1: х—i-XQ lim q2(x) — 1. X—^XQ 132
Поэтому а(х) = y(x)qi(x)q2(x) = у(х)7(х), где lim q(x) = lim qi(x)qz(x) = 1, т.e. справедливо и третье X—+Хо Х~~>Х() СВОЙСТВО. Теорема 3.41. Пусть lim f (х) — С, где С*^0. Тогда Дх)~С х—>XQ при х —> хо. Доказательство. Действительно, x—?Xq С и приходим к (3.52). Замечание. Подчеркнем, что здесь очень существенно условие 0^0. Так, нельзя сказать, что бесконечно малая эквивалентна нулю! ±еорема 3.42. Пусть f ~ д при х —* Xq и lim д(х) = а. Тогда О’—КГ() lim /(х) — а. X—>Х() Доказательство. В силу эквивалентности fug выполняется соотношение (3.51). Значит, lim f(x) = lim д(х) lim q(x) = a • 1 = a. X~^XQ X~^XQ X—►Xo Учитывая, что отношение эквивалентности симметрично, приходим к выводу, что две эквивалентные функции либо обе имеют один и тот же предел, либо обе предела не имеют. Теорема 3.43. Пусть при х —> хо /(ж) ~ а(х) и д(х) ~ Р(х). Тогда /(ж)«7(ж) ~ а(х)Р(х), Дх) Дх) Щ) р(х) и /₽(х) ~ о ’(х), (3.53) причем последнее соотношение справедливо при условии суще- ствования fp(x) и ар*'х). Доказательство. Докажем, например, ний (3.53): /(х) ~ а(х) /(х) = а(х)91(х), где первое из соотноше- lim Qi (х) — 1; X~^XQ д(х) ~ Р(х) => д{х) = р(х)д2(ж), где lim q%(x) — 1. X^Xq 133
Откуда /(ж)^(ж) = а(г’)Р(ж)91(я)д2(®) = а(ж)Р(ж)д(ж), где q(x) = q\(x)q2(x) и, очевидно, lim q(x) = 1. Следовательно, х—>.Т0 по определению f(x)g(x) ~ а(а?)р(т). Аналогично доказываются и остальные соотношения (3.53). Проведите доказательство самостоятельно. Установим следующий факт: при х оо ХУ XV.’ I ХУ /'уХ' 1 | 1 ХУ х» хуД^ CIqX I CZ] X [ -j CLqX где a0 ф 0. (3.54) Действительно, ху nrXl 1 ХУ 1 I ХУ _____ CIqX I С1^_Х I — — а$хп G1 1 _|_ fl2 1 По X По х2 Выражение, стоящее в скобках, стремится к единице при х сю, что и доказывает (3.54). Выведем таблицу эквивалентных величин (для удобства ар- гумент обозначим буквой t). В реальных задачах в роли t буду! выступать различные функции от х. Таблица справедлива при t-^0. Таблица эквивалентных величин 1. sint ~ t; 2. tgt ~ t; 3. arcsin t ~ t; 4. arctg t ~ t‘ 5. 1 — cos / -t2: 2 ’ 6. ln(l + t) ~ t; 7. a* — 1 ~ tin a; a > 0, a ± 1; 8. (l + t^-l-pt, p^O. Замечание. Формула 7 при a — e принимает вид e* — 1 ~ t; фор- мула 1 — перефразированное утверждение (3.48). Докажем справедливость формул, приведенных в таблице. , sin t t • Формула 2: tg t =--~ - — t, cost 1 arcsin t • Формула о: lim------ arcsin t = y t = sin у = lim — 134
arctg t Формула 4’ пт------ arctg t — у t = tgy — lim-----— lim - = 1. ^t2. Формула 5:1 — cos t — 2 sin2 - ~ 2 2 Формула 6 — перефразированное равенство (3.44). _ . a — J Формула 7: lim —-- t—о t In a t = ~i- ma — lim • Формула 8: (1 + t)p — 1 — epln^ — 1 pln(l +1) ~ pt. Определение 3.18. Будем говорить, что функция а(ж) есть «о малое от р(т)» (а — °(Р)) при х если в некоторой про- колотой окрестности U(#o) справедливо соотношение 0.(х) = Р(т)<д(т), где lim ы(х) — 0. X—?Х® (3.55) Если функции а(т) и р(т) — бесконечно малые, то a — о(р) означает, что ос(т) убывает быстрее, чем р(т), т. е. является бес- конечно малой более высокого порядка по сравнению с Р(я). Например, при х —> 0 х2 — о(^); .т3 — о(т2); Если функции ос(т) и р(т) — бесконечно большие, то утвер- ждение a = о(р) означает, что при х —> то функция a(j;) растет медленнее, чем Р(а:), т. е. является бесконечно большой меньше- го порядка по сравнению с Р(т). Так, при х —> ос х = о(х2); х2 = о(#3); Следует иметь в виду, что под символом о(0) «скрывается» не одна функция, а бесконечное семейство функций а(.т), для ко- торых выполняется (3.55) при различных w(rr). Поэтому, напри- мер, о(р) - о(р) = p<oi - Рб)2 = Р(о>1 - ы2) = Рб) = о(р). (3.56) В правой части (3.56) мы получили о(Р), а не нуль, как можно было предположить. Отметим также, что все свойства эквивалентных, включая и таблицу эквивалентных, без изменений переносятся на случай последовательностей. 135
Приведем несколько примеров вычисления пределов с ис- пользованием эквивалентных величин. Пример 3.5. l — cos2:r lim-----т----~ Jim —----- хх zsinrr — lim Пример 3.6. 7 lim — ™ . 1 О. — iim i — lim i — lim Пример 3.7. lim п21п 71—>О0 = lim п П—>ОС П/ т Я cos----1 п ЦП П -*оо п п2 сю л 1 cos-----1 п 71 1 — cos — п Пример 3.8. х—>Н-оо — — lim т?2 • п—>оо 2 К х—>+оо lim x ж—>+oc lim 4л lim — Пример 3.9. x—>0 = lim е* ln(1+sini> = lim ln(l±sin^) lim sina -- gT—<0 x — —>0 lim - — grz:-H) x — g 136
3.6. Приложение* В данном подразделе будут рассмотрены вопросы, которые могут быть включены в усиленные курсы математики (напри- мер, для студентов, специализирующихся в области биофизики). Прежде всего упомянем о классификации точек разрыва функции. Если функция/(ж) разрывна в точке <гд (т. е. определе- на в окрестности этой точки, но не является непрерывной в zg) и при этом существуют два конечных односторонних предела — lim /(ж) и lim f(x), то такая точка называется точкой раз- X~*X(j+ х—>XQ~ рыва первого рода. Причем, если эти два предела совпадают (но не равны /(ig)), то такая точка называется устранимой точкой разрыва. Если хотя бы один из этих пределов бесконечен или вообше не существует, то такую точку называют точкой раз- рыва второго рода. Например, функция sgnx (читается: «сиг- нум икс») {1, х > 0; 0, х ~ 0; —1, х < 0, имеет в нуле разрыв первого рода, а функции /(я) = X 0; х — 0 И д(х) = sin - , х 0, х 0; х -= 0 имеют в нуле разрыв второго рода. (Функция /(г) имеет одно- сторонние пределы, равные бесконечности; функция д(х) не име- ет пределов — ни конечных, ни бесконечных.) Далее докажем ряд важных теорем, но предварительно да- дим следующее определение. Определение 3.19. Последовательность отрезков [ап.6п], п Е N называется системой вложенных отрезков, если каждый последующий отрезок содержится в предыдущем, т. е. , Ьг] D [а2, Ь2]э ... Э [un, bn] D ... Теорема 3.44 (о вложенных отрезках*. Пусть задана произвольная система вложенных отрезков [ап, &п], длины кото- рых стремятся к нулю ( lim (bn — ап) — 0). Тогда существует п— единственная точка с, которая принадлежит всем этим отрез- кам. 137
Доказательство. Очевидно, что последовательность левых концов отрезков ап возрастает (в широком смысле), а последо- вательность правых концов Ьп убывает. Обозначим через А множество всех левых концов а че- рез В — множество всех правых концов {Ьп}. Покажем, что лю- бой элемент множества А не превосходит любого элемента мно- жества В. Возьмем любое ап и любое Ьт. При т — п, очевидно, ап<Ьп — — Ът. Если т < п, то ап < Ьп < Ьт. Если же т > п, то < Ьт. Во всех случаях получим, что ап < Ьт. Тогда по аксиоме отделимости Зс: ап Е А и V bm Е В =$» ап с в частности, Vn ап с Ьп. Но это и означает, что с принад- лежит всем отрезкам [ап, Ьп]. Предположим, что имеются две та- кие точки ci и С2- Пусть для определенности > Q. Тогда V 77 0 < С2 Щ Ьп Ofi. (3.57) Но правая часть (3.57) по условию стремится к нулю при п ос, а С2 ~~ ci — постоянная. Отсюда следует, что Ог — = 0, т. е. С2 = Ci. Тем самым доказана единственность точки с. Системой интервалов {J} будем называть произвольное множество интервалов (т. е. промежутков без концевых точек) J = {тг: а < х < Ь}. Определение 3.20. Будем говорить, что система интерва- лов {J} образует покрытие множества А, если любой элемент а Е А принадлежит хотя бы одному интервалу данной системы. Теорема 3.45 (о конечном покрытии). Из любого беско- нечного покрытия отрезка [а, Ь] системой интервалов {J} можно выделить конечную подсистему, покрывающую данный отрезок. Доказательство. Действительно, предположим противное, что существует бесконечное покрытие {J} отрезка [а, 6], из ко- торого нельзя выделить конечное подпокрытие. Разделим этот отрезок на две равные части. По крайней мере для одной этой части из {J} нельзя выделить конечное подпокрытие, так как в противном случае конечное подпокрытие выделялось бы и для всего [а, Ь]. Такую половину отрезка обозначим через [аг, &2 (удобно считать, что [ai,bi] = [а,Ь ). Разделим пополам [«2,^2 138
и снова выберем ту половину [аз, Ь%\ этого отрезка, для которой нельзя выделить конечное подпокрытие. Продолжим неограни- ченно этот процесс. В результате получится система вложенных отрезков [ап,Ьп], для каждого из которых нельзя выделить ко- нечное подпокрытие. Ясно, что длина каждого из этих отрезков равна Ьп — ап = п —-> ос. b — а Далее, по теореме 3.44 существует точка с, принадлежащая всем этим отрезкам. Эта точка находится на отрезке [а, Ь], а зна- чит, существует некоторый интервал Jc из системы, покрыва- ющий эту точку (рис. 3.11). Наименьшее расстояние от с до концов интервала Jc обозна- чим через 8 (8 > 0). Тогда, если Ьп — ап < 8 (а такое п обяза- тельно найдется, так как Ьп — ап —► 0), то отрезок [ап,Ьп] цели- ком содержится в интервале Jc, т. е. один интервал Jc и будет конечным подпокрытием отрезка [ап,Ьп]. Но по построению от- резок [ап, Ьп\ не допускает выделения конечного подпокрытия. Полученное противоречие показывает, что утверждение теоре- мы справедливо. Отметим: в данной теореме существенно использовалось, что покрывается именно отрезок и именно системой интервалов. Если отбросить одно из этих требований, то теорема, вообще го- воря, перестает быть справедливой. Например, система интер- /1 \ валов I —, 1 ), п G Z образует бесконечное покрытие интервала (0,1), из которого нельзя выделить конечного подпокрытия (по- думайте, почему?). Теперь перейдем к доказательству теорем о свойствах функ- ций, непрерывных на отрезке, которые были сформулированы в подразд. 3.4. Докажем вначале, что, если функция f(x) непрерывна на от- резке [а, 6|, то она ограничена на нем (см. теорему 3.37). Доказательство. Возьмем произвольную точку х$ € [а, Ь]. По локальному свойству непрерывных функций (см. теорему 3.35) 3 Сжо > 0 зи(жо): V X G и(х0) => |/(®)| Схо. Рис. 3.11 139
Все такие окрестности, выбранные для каждой точки из а,Ь], образуют покрытие отрезка а, Ь] интервалами, поскольку каж- дая точка отрезка принадлежит одному из интервалов покры- тия, а именно — своей окрестности. В силу теоремы 3.45 из этого покрытия можно выделить ко- нечное подпокрытие, т. е. конечный набор окрестностей U(a;i),U(a;2), ...,и(жп), покрывающих отрезок [а, Ь]. В каждой из этих окрестностей U(rr^) верно неравенство |/(ж)| СХ:. Положим С = тахСЖг. I Тогда для любого х из отрезка 'а, Ь] будет выполнено неравен- ство |/(<т), С, что и доказывает теорему. Итак, множество значений функции /(ж), непрерывной на от- резке [а, Ь], ограничено сверху и снизу. Значит, существуют точ- ные верхняя и нижняя грани М = sup{/(a?)} [аЛ] и т— inf {/(ж)}. Докажем теперь, что эти величины достигаются на отрезке а, Ь] (см. теорему 3.38), т. е. 3 ^1,^2 £ \a,b : /(^i) — т, /(я^) = М. Доказательство. Пусть, например, не достигается точная верхняя грань М, т. е. ни в одной точке отрезка [a, Ь] f(x] не совпадает с М. Поскольку всегда /(т) М, на [a, b] f(x) < М. Рассмотрим функцию / х 1 (3.58) Эта функция на [а, Ь] положительна и непрерывна (знаменатель не обращается в нуль). Тогда, как только что было доказано, она ограничена на [а, Ь]. В частности, 300: V х 6 [а, Ь] => д(х) С. (3.59) Из (3.58) и (3.59) следует, что V х е [а, Ь] 140
Но это означает, что М — — — одна из верхних границ множе- ства {/(т)}. Иначе, нашлась верхняя граница, которая меньше наименьшей из верхних границ М. Это невозможно. Следова- тельно, наше предположение ложно и существует точка на а, Ь], в которой значение /(т) совпадает с М, Для точной нижней грани доказательство аналогично. Теперь докажем теорему о нуле (см. теорему 3.39). Пусть функция f(x) непрерывна на [а, Ь] и на концах этого отрезка при- нимает значения противоположных знаков. Докажем, что тогда найдется точка то £ [«,Ь], в которой /(#о) ~ 0. Доказательство. Разделим отрезок ц, Ь] пополам и выбе- рем ту половину, у которой значения f(x) на концах противопо- ложны по знаку; обозначим ее через [d2, £>21 (снова считаем, что [ai,bi] — [а, Ь]). Разделим [«2,62] пополам, вновь выберем ту по- ловину, на концах которой функция /(z) принимает значения, противоположные по знаку, и т. д. Возможны два варианта: либо на каком-то шаге очередная точка деления окажется нулем функции/(т) и именно ее примем за либо процесс будет продолжаться неограниченно и тогда получим систему вложенных отрезков [an,bn], длины которых стремятся к нулю, а значит, существует точка с, принадлежащая всем отрезкам. Ясно, что последовательность (21, Ь1, (22, ?>2з • • • 5 Ьп? • • (3.60) сходится к с (докажите это!). Выберем из (3.60) подпоследова- тельность точек, в которых /(т) положительна и обозначим эту подпоследовательность через (/(х^) > 0). Аналогично вы- берем из (3.60) подпоследовательность {т"} : /(т") < 0. После- довательности {я^} и сходятся к с как подпоследователь- ности сходящейся к с последовательности (3.60). Но /(т) непре- рывна в точке с. Значит, п—>ос и Jim /(.<) = /(с), п—>оо (3.61) /«) > 0 Применив теорему о переходе к пределу в неравенствах, по- лучим из (3.61), что Л<=) 0 и /(с) < 0. Но это означает, что /(с) = 0 и мы полагаем то — с. 141
Отметим, что теорема о нуле служит основой одного из мето- дов приближенного нахождения корней уравнения вида /(ж) = о, где /(ж) — непрерывная на некотором промежутке функция. Если нельзя найти корень точно, но нам удастся определить отрезок [а, 6], содержащий лишь один искомый корень и такой, что на его концах f(x) принимает значения противоположных знаков, то можно применить ту же процедуру деления отрезка пополам, что и в доказательстве теоремы о нуле. Если требует- ся найти корень с точностью до е, то достаточно выбрать тот отрезок [ап, Ьп], длина которого меньше е. За приближенное зна- чение корня можно взять середину этого отрезка. Существуют другие, более эффективные, методы приближенного нахожде- ния корней, которые будут рассмотрены далее. Наконец, докажем последнюю теорему о том, что область значений непрерывной на [а, Ь] функции f(x) совпадает с отрез- ком [т,М], где т = ш£{/(т)}, а М — sup{/(«r)} (см. теоре- М [а,Ь] му 3.40). Доказательство. В самом деле, число т — это наименьшее из возможных значений f(x) на а, Ь], а М — ее наибольшее зна- чение на [а, Ь]. Значит, за пределами отрезка [т,М] не может быть значений функции f(x). Как мы только что видели, сами значения т и М принимаются функцией /(т) на [а, Ь]. Возьмем теперь произвольное число с: т < с < М и рассмотрим вспомо- гательную функцию д(х) — /(т) — с. Выберем точки #1,^2 Е \fyb] (пусть для определенности яд < я?2): /Си) = т, /(т2) = М и рассмотрим отрезок [яд, т2] С \а, Ь]. На этом отрезке д(х) непре- рывна и, кроме того, ясно, что 9&1) < 0, д(х2) > 0. Значит, существует точка зд е [яд, х2: д(х$) = 0- Но это означа- ет, что /(то) = с. В силу произвольности с получаем, что весь отрезок [m, М] заполнен значениями /(т), что и требовалось доказать.
Глава 4 ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ 4.1. Дифференцируемость, производная, дифферен циа л В этой главе рассмотрим функции, определенные в некоторой окрестности точки Xq. Пусть функция /(а?) определена в U(«o)- Введем обозначения: Ах = х- х0; Ay = f(x) - /(ж0). (4-1) Определение 4.1. Производной функции /(а?) в точке жо на- зывается предел №)= 1нп (4'2) (Другие обозначения производной: dx Заметим, что при изменении Дт меняется т, а х$ остается постоянным. Из (4.2) немедленно следует, что функция, принимающая по- стоянное значение в U(to), имеет производную в точке то, рав- ную нулю: С' — 0, и функция у — х имеет в любой точке произ- водную, равную единице: xf = 1. Рассмотрим теперь произвольную линейную функцию у = Ах + В. Пусть в точке то ее значение равно у$: Уо = Axq 4- В. Тогда, очевидно У - Уо = А{х - т0) т. е. Дт/ — АДт. (4.3) Легко видеть, что и обратно, если (4.3) выполняется при любом Дт, то функция у(х) линейная. Можно несколько ослабить требования к функции, допуская, что равенство (4.3) выполняется не точно, а «в главном» при ма- лых Дт. Таким образом, приходим к следующему определению. 143
Определение 4.2. Функция у = f(x) называется дифферен- цируемой в точке жо, если в некоторой окрестности U(xq ) спра- ведливо соотношение Ду — А Дж + о (Дж), или Ду = АДж + ос(Дж)Дж, где Jim а(Дж) — 0. (4.4) Слагаемое А Дж, где коэффициент А не зависит от Дж, называют главной линейной частью приращения Ду, или дифференциалом (обозначение: dy). Замечание. Линейная функция дифференцируема в любой точке, и ее дифференциал dy совпадает с приращением Ду. Это немедленно получается, если (4.3) записать в виде (4.4), полагая а, Дж) = 0. Разумеется, далеко не каждая функция является дифферен- цируемой. Выясним теперь связь между дифференцируемостью функ- ции в точке Жо и ее непрерывностью в этой точке, а также между дифференцируемостью и существованием производной Д(жо). Вначале установим, как записывается определение непрерыв- ности через приращения Дж и Ду. Очевидно, справедливы сле- дующие соотношения: lim /(ж) = /(ж0) X—^XQ lim (/(ж) - Да?о)) = 0 X—>XQ ' lim Ду — 0. Дх—>0 Таким образом, данное ранее определение непрерывности функ- ции /(ж) в точке жо в новых обозначениях выглядит так: lim Дх-~>0 Ду = 0. (4-5) Теорема 4.1. Если функция дифференцируема в точке, то она непрерывна в этой точке. Доказательство данной теоремы очевидно, так как из (4.4) следует (4.5). Эта теорема показывает, что требование дифференцируемо- сти сильнее требования непрерывности. Теорема 4.2. Функция /(ж) дифференцируема в точке Жо то- гда и только тогда, когда она имеет в точке жо производную. Доказательство. Действительно, пусть у = /(ж) дифферен- цируема в точке жо, тогда выполняется (4.4). Поделим обе части равенства на Дж: Ду Дж А + ос(Дж). (4-6) 144
Г Прейдем к пределу в (4.6) при Дж 0 и получим ГЫ = А, Обратно, пусть существует Г(Ы- Тогда - У'(^о) и по теореме о связи пределов с бесконечно малыми получим Л?у —— f (ж0) -р а(Дж), где lim а(Дж) — 0. —>0 (4-7) Умножив обе части равенства (4.7 на Дж, получим (4.4) сА = ~ Л(^о)? т.е. /(#) оказывается дифференцируемой в точке жо,. что и завершает доказательство. Теорема 4.2 позволяет, в частности, использовать термин «дифференцируемость в точке» как синоним существования производной в этой точке. Отметим, что в процессе доказательства теоремы установле- но, что коэффициент А в (4.4) с необходимостью совпадает с /'(жо). Значит, дифференциал dy принимает вид dy = y'(xG)b.x. Но ж можно рассматривать как частный случай линейной функ- ции, а тогда его приращение совпадает с дифференциалом, т. е. приходим к следующей формуле для вычисления дифференци- ала: dy = y'xdx. (4.8) Значит, выражение можно понимать не просто как другое обозначение производной, а как обычную дробь. Таким образом, производная функции в точке равна отношению дифференциала функции к дифференциалу аргумента. Приведем геометрическую интерпретацию дифференцируе- мости в точке. Для этого рассмотрим график функции у -- /(ж) в окрестности точки Л/о, на котором изображены наклонные прямые, проходящие через точку (жо, Уо)> где Уо — /(жо) (рис. 4 1). Уравнения таких прямых можно записать в виде У - Уо = А(х - ®о), (4.9) где А —произвольный коэффициент. 145
Рис. 4.1 Назовем касательной к графику в точке жо прямую (4.9), та- кую, что разность ординат графика ?/гр и этой прямой ук есть о(Дж) при Дж —> 0, т. е. Z/rp ~ Z/k = о(Дж). (4.10) Визуально касательная - это та из прямых (4.9), которая «наи- теснейшим образом» прилегает к графику в окрестности точки жо (см. рис. 4.1). Докажем теперь следующую теорему. Теорема 4.3 (о геометрическом смысле дифференци- руемости). 1. У графика функции у = /(ж) имеется касатель- ная в точке жо тогда и только тогда, когда функция дифферен- цируема в этой точке. 2. Касательная единственна, и ее уравнение имеет вид У - Уо = f\xo)(x - Жо). (4.11) Доказательство. Пусть вначале /(ж) дифференцируема в точке жо- Тогда справедливо соотношение (4.4), которое запишем в виде Z/rp — З/о = - ж0) + о(Дж). (4.12) Отбросив в (4.12) слагаемое о(Дж), получим уравнение прямой (ординату которой обозначим ук): Ук ~ Уо = А(х - ж0). (4.13) Покажем, что это касательная в точке жр. Действительно, после почленного вычитания (4.13) из (4.12) получим Z/rp - Ук = о(Дж). Значит, (4.13) — это уравнение касательной. 146
Обратно, пусть у графика у — f(x) имеется касательная в точке xq, описываемая уравнением (4.13), где А некоторое чис- ло. Сложив (4.10) и (4.13), получим: ?/гр ~ Уо = Л(х - т0) + о(Дт), т. е. соотношение (4.4). А это и означает дифференцируемость f(x) в точке Кроме того, число А в уравнении (4.13) оказа- лось равным коэффициенту в дифференциале dy^ который, как известно, равен /'(то). Таким образом, уравнение касательной с необходимостью принимает вид (4.11), что и доказывает второе утверждение теоремы. При сравнении уравнения касательной (4.11) с определени- ем дифференциала можно отметить, что дифференциал функции у = в 7почке xq совпадает с приращением ординаты каса- тельной к ее графику в этой точке. 4.2. Основные правила дифференцирования Теорема 4.4. Пусть функции и(х) и v(x) дифференцируемы в точке жо- Тогда функции Си(х), и(Д) ± и(т), u(x)v(x} также дифференцируемы в этой точке. Функция дифференциру- V(X) ема в точке то при дополнительном условии и(то) ф 0. При этом в точке то выполняются следующие соотношения: 1) (Си)' - С и\ 2) (и ± u)' - uf ± u'; . , (u\f u'v — uv' 3) (uv) = it v + uv ; 4) I — I = --5---. \v/ m Доказательство. Действительно, пусть у — Си. Тогда Д<у = у(х) — ?/(то) - Си(х) — С и До) — С(и(х) — и(то)) — СДи. Переходя к пределу при Дт —> 0, получим Ау СДи Ди f lim —— — lim —-— — С lim -— = Си. Дж->0 Дт Дж—>0 Дт Дж—*0 Дт Пусть далее у = и ± ъ\ тогда Д?/ — Ди ± Ди и Ди Ди±Ди Ди , Ди , , . lim —— = lim ---------= lim —— Т lim —— и ± и . Дж—>0 Дт Дж^О Дт Дж^О Дт Дж—о Дт 147
Пусть теперь у = uv, тогда и(х) = u(xq) + Аи; v(x) = у(жр) + Av и, соответственно, Ay = (и(жр) + Au) (v(xq) + Au) — и(жр)и(жр) = = Диу(жр) + и(жр) Av + AuAv. Откуда получаем /\v Av i- Au A + и(жр) lim —---h lim —— lim Av. Ax-~>0 Дж Аж—О Аж Дж->0 (4-14) Но из дифференцируемости у(ж) в точке xq вытекает ее не- прерывность в этой точке, т. е. соотношение lim Av = 0. Учи- Ах->0 тывая это, из (4.14) получим требуемую формулу. Пусть, наконец, у = —, тогда v и(жр) + Au у(жр) + Av Ау = и(жр) Аиу(жр) — и(жр)Ау и(жо) у(жр)(и(жр) + Ду) Переходя к пределу при Аж —» 0, получим г Ау lim —— Аж—*0 Дж А и Ду _ lim = Аж-»0 у(жр)(у(жр) + Av) _ и/(ж0)у(жр) - и(жр)у/(ж0) У2(ж0) Здесь вновь воспользовались непрерывностью у (ж) в точке жр. Теорема 4.5 (правило дифференцирования сложной функции). Пусть 1) /(и) дифференцируема в точке up; 2) ср(ж) дифференцируема в точке жр; 3) <р(ж0) = и0. Тогда сложная функция у(х) ~ /(ср(ж)) дифференцируема в точ- ке Жр и У(ж0) = /,(и0)ср'(ж0). (4.15) 148
Доказательство. Действительно, в силу дифференцируемо- сти функции у = /(fit) Ay = /Х(^о)Д^ + а(Ди) Ди, где lim а(Ди) = 0. (4,16) Заметим, что из (4.16) нельзя определить значение шДи) при Ди = 0. Каково бы ни было это значение, равенство (4.16) оста- нется справедливым. Будем считать, что а(0) — 0. При этом функция а(Ди) будет непрерывной в нуле. Положим теперь и — ср(х). Тогда Ди — ср(т) — <р(то) = <р(то + Дт) — ср(то). Разделим обе части (4.16) на Дт и устремим Дж к нулю: f'(un) lim ------h lim а(Ди) • lim -—. v 7 Дж Дт Дж—>o v 7 Дх-Tj Дт В силу непрерывности ср(т) в точке то, которая вытекает из диф- lim Ди = 0, но тогда и lim а(Ди) = 0. От- ференцируемости, куда и получим (4.15). ’ Замечание. Более наглядно, но менее точно, равенство (4.15) можно записать в виде Ух Уи^х' Теорема 4.6 (о производной обратной функции). Пусть функция у — /(т) непрерывна на промежутке (а, Ь) и строго мо- нотонна на нем, и пусть в некоторой точке то Е (а, Ь) существует /'(то) 0. Тогда у обратной функции х — <р(у) существует про- изводная <р'(?/о) > где у о = /(т0), причем = 7W (4.17) или, более наглядно, ^=1 У Ух (Здесь под символом (а, Ь) понимаем промежуток произвольного вида. Это может быть отрезок, интервал, ось, полуось и т. п.) Доказательство. В самом деле, в силу теоремы об обратной функции (см. теорему 3.34) при данных условиях существует непрерывная и строго монотонная обратная функция х = Возьмем точку у$ и дадим у приращение Д?/, тогда 149
Ду Ду ’ (4-18) Дт Здесь, если Ду 0, то и Дж 0 в силу строгой монотонности функции х — ср (у). Поэтому преобразование (4.18) законно. В си- лу непрерывности ср(у), при Ду 0 и Дт —> 0, значит, Дт 1 1 д^оАу Пп1 Ду /'(ж0) Дж—>0 что и доказывает утверждение теоремы. 4.3. Некоторые вычислительные формулы Таблица производных 7. (tgT)' =----— COSZ T / V 1 (ctgT) =——j-; sm x 3. (ax)f = ах In а; 4. (1пт)' = —; х 5. (shit)' — cost; 6. (cost)' — — sin ж; 10. (arcsin t)' 11. (arctgT)' = 1 \Z1 — t2 ’ (arccos t)' = — 12. (arcctg t)' — — Замечание. Приведенные формулы справедливы гам, где суще- ствуют одновременно левая и правая части соответствующих равенств. Докажем справедливость формул, приведенных в таблице. • Формула 1. Рассмотрим вначале функцию у = тп, где п — натуральное число. Возьмем произвольную точку тр и дадим то приращение Дт. Тогда Ду = (т0 + Дт)п - Tq = птд 1 Дт + о(Дт) и г п-1 . V °(Дт) п-1 lim —— — птп + lim —-—- — птп А:г—0 Дт Дх—>0 Дт 1 150
Так что формула 1 справедлива при n Е N. Пусть теперь п —целое отрицательное число, тогда — п хп 1 Так что формула 1 справедлива и в этом случае. Справедливость формулы 1 в общем случае докажем чуть позже. • Формула 3. Рассмотрим у = выберем точку xq и дадим ей приращение Дж, тогда Д?/ _ ахо lim —— — lim -----------~-------— Дх—>о Дж Дх-^о Дж аЛ;/; — 1 „п Дж In а lim —---------= а 0 lim — --------= а J In а Дх->о Дж Дх-*0 Дж Тем самым обоснована формула 3. • Формула 2 немедленно следует из формулы 3, если поло- жить а = е. • Формула 4* если у — In ж, то ж = еу, и по правилу (4.17) находим 1 11 /1 х х х (1пж)г — --гу — - = (еУУу еУ % • Формула 1. Теперь можно доказать справедливость форму- лы 1 для любого действительного р и ж > 0. — 1пж 1п гс)7 ер1паф . — = рхр • • Формула 5: функция у — sin ж. Рассмотрим произвольную точку жо и получим , Дт/ вт(жо + Дж) — втжо пт —— = пт----------------------= Дх—>0 Дж Дх-»0 Дж гч • Ах 2sm —- г 2 = пт---------- Дх—»0 Дж — lim 2 Ит cos (жо + Дх->0 Дж Дх—О V — СОРЖо- • Формулу 6 докажите самостоятельно. 151
• Формула 7: у — tg ж. Имеем (sin х)' cos х — sin х (cos х)1 cos2 х cos2 х + sin2 x cos2 x cos2 x • Формула 8 доказывается аналогично формуле 7. • Формула 9. Если у — arcsine, то х = sin?/, поэтому / . V 1 1 1 1 (arcsmxL. = ——— —----------— —, . ~ . (sinyyy cosy уД _ Sin2 у Л - ж2 Здесь перед корнем квадратным выбран положительный знак, поскольку на области изменения арксинуса косинус неотрицате- лен. • Формулы 10 — 12 докажите самостоятельно. Вернемся еще раз к понятию дифференциала. Мы выяснили, что если функция у = f(x) дифференцируема в данной точке, то для ее дифференциала справедлива формула (4.8). Подста- вим теперь вместо х некоторую дифференцируемую функцию х — cp(t). Тогда в силу теоремы 4.5 сложная функция y(t) = — /(<p(t)) будет дифференцируема в соответствующей точке и, значит, ее дифференциал можно будет вычислять по формуле dy = y't dt. Но в силу той же теоремы y't = y'xx'f Значит, dy = у'х x't dt = у'х dx, где dx теперь уже не совпадает с приращением Да;, а являет- ся дифференциалом функции х = cp(t). Таким образом, форму- ла (4.8) сохраняется независимо от того, является ли х незави- симой переменной или представляет собой дифференцируемую функцию другой переменной. Это свойство называют инвариантностью дифференциала. Теперь перейдем к функциям, заданным параметрически. Пусть заданы две функции х — cp(t) и у — ф(£), определенные на некотором промежутке (а, Ь). Может оказаться, что у функ- ции х — cp(t) имеется обратная функция t = со (а:). Подставив 152
эту функцию вместо аргумента в ф(£), получим сложную функ- цию от переменной х: у(х) — ф(со(аг)). В этом случае говорят, что эта функция от х задана параметрически (т. е. посредством параметра t) системой равенств ж = cp(t); У = Ф(*), t 6 'а. Ь). (4.19) Наша цель — научиться вычислять производную ух такой функции. Теорема 4.7 (о производной функции, заданной пара- метрически). Пусть на промежутке (а, Ь} заданы две функции cp(t) и ф(£), удовлетворяющие следующим условиям: 1) ф(0, Ф(0 © С1 «а, &)); 2) cp'(t) 0 на (а, Ь). 1 огда существует функция у\х}, заданная параметрически с помощью равенств (4.19); эта функция дифференцируема в лю- бой точке то, такой, что то ~ cp(to)? где to £ (а,Ь), причем ее производная вычисляется по формуле или, более наглядно, (4.20) Доказательство. Первое условие данной теоремы требует пояснений. Под символом С1 ( а, Ь)) понимается множество всех функций, непрерывных на (а, Ь) и имеющих на (а, Ь) непрерыв - ную производную. Это множество носит название «класс С1 на (аД». Таким образом, первое условие теоремы означает, что функции <p(t |, ф^) непрерывны на промежутке (а, b и имеют на нем непрерывные производные. В силу второго условия непрерывная функция cp'(t) нигде не обращается в нуль на (а, Ь), откуда следует, что она сохраняет на а, Ь) постоянный знак. Действительно, если бы, например, нашлись две точки ti,t2 6 (а,Ь), в которых знаки cp'(t) были бы различны, то по свойству непрерывных функций на отрез- ке [ti, ts С (a, h) нашлось бы число £з, такое, что — 0, а это запрещено условием 2. Значит, на всем (а, Ь} либо cp'(t) > 0, либо cp'(t) < 0, откуда следует строгая монотонность ср11 на (а, Ь) (см. подразд. 4.3). Но тогда для функции х - ср (t) выполнены все условия тео- ремы о производной обратной функции (см. теорему 4.6), в силу которой существует обратная функция t = со (ж), производная которой вычисляется по формуле 153
?'(io) ’ где x0 = <p(t0), to € (a,b). Подставив эту функцию вместо t в функцию у = ф(£) и приме- нив теорему о производной сложной функции (см. теорему 4.5), получим уЫ = ф'(^)<о'(аго) = Ф'^о)-4гт = , ср (to; ф (to; т. е. формулу (4.20). 4.4. Основные теоремы дифференциального исчисления В этом подразделе будут доказаны три знаменитые теоремы, носящие имена Ферма, Ролля и Лагранжа, а также получены важные следствия из них. Вначале дадим определение. Определение 4.3. Точка zq является точкой локального максимума (минимума) функции /(z), если Зи(жо): V®eU(rr0) => /(«) </(®о) (/(ж) > /(®о))- (4.21) Общее название локальных максимума и минимума — ло- кальный экстремум. Если в неравенствах (4.21) фигуриру- ет знак нестрогого неравенства «^» («^»), то мы говорим о нестрогом локальном экстремуме. В определении берется про- колотая окрестность, поскольку неравенство f(x) < f(xo) не мо- жет, очевидно, выполняться при х — zq. Но, разумеется, /(z) определена и в самой точке zq. Обратим также внимание, что если функция определена на отрезке [а. Ь] и принимает, допустим, максимальное значение в концевой точке Ь, то это не подпадает под определение локаль- ного максимума, поскольку, хотя f(x) < f(b) для всех х Е [а, Ь], отличных от Ь, мы не сможем окружить точку b окрестностью U(5), целиком содержащейся в данном отрезке. Поэтому сфор- мулированная далее теорема Ферма на этот случай не распро- страняется. Теорема 4.8 (теорема Ферма). Пусть функция f(x) име- ет в точке zq локальный экстремум (быть может, нестрогий"I и дифференцируема в этой точке. Тогда ff(xo) — 0. 154
Доказательство. В самом деле, пусть, например, у /(т) в точке то имеется локальный максимум, т. е. выполнено (4.21). Возьмем произвольное х 6 U(tq), такое, что х < то- Тогда Ду Дт Т — То Перейдя к пределу в этом неравенстве, получим г г ку lim —- — lim -— Да:—*0— Дт Ляг-» 0 Дт = /'(жо) > 0. (4.22) Если теперь взять любое т G U(to), такое, что т > то, то, проводя аналогичные рассуждения, получим lim = lim ^ = /'(Жо)<О. (4.23) Дя-Я)+ Дт Дт-^0 Дт Из (4.22) и (4.23) следует, что /'(то) — 0. Теорема 4.9 (теорема Ролля). Пусть задана функция /(т), удовлетворяющая следующим условиям: 1) /(т) непрерывна на отрезке [а, 6]; 2) /(т) дифференцируема в интервале (а, Ь); 3) /(а) = /(b) • Тогда существует точка с Е (а, 6), такая, что f'(c) = 0. Доказательство. Действительно, по свойствам функций, не- прерывных на отрезке, Эт1,т2 е [а,Ь] : Уте [а,Ь] /(тх) < /(т) < /(т2)- (4.24) Пусть вначале обе точки Ti и т2 находятся на концах отрезка. Тогда из (4.24) и третьего условия теоремы немедленно следует, что /(т) постоянна на [а, Ь] и в качестве точки с можно взять любую точку интервала (а, Ь). Пусть теперь хотя бы одна из точек, например Ti, принадле- жит интервалу (а, Ъ). Тогда можно выбрать малую окрестность U(ti), такую, что U(ti) С (а, Ь). Значит, в точке х^ у f(x) име- ется локальный минимум, а тогда по теореме Ферма ff(xi) — 0. Итак, в качестве точки с можно взять ад. Замечание. Второе условие теоремы не надо понимать так, что функция дифференцируема только в интервале (а, 5). Она может быть, например, определена и дифференцируема на всей числовой оси. 155
Условия теоремы несколько избыточны. Ведь из дифференцируе- мости /(ж) в интервале (а, Ь) следует ее непрерывность в этом интер- вале. Так что первое условие можно было бы заменить на требование непрерывности (причем, односторонней) в концевых точках отрезка [а, Ь]. Однако в приведенном ранее виде это условие более наглядно, поэтому традиционно теорема формулируется именно так. В качестве упражнения предлагаем читателям выяснить, по- чему теорема Ролля не применима к функции у/х? на отрезке Н;1]- Теорема 4.10 (теорема Лагранжа). Пусть функция /(ж) удовлетворяет следующим условиям: 1) /(ж) непрерывна на отрезке [п, 6]; 2) /(ж) дифференцируема в интервале (а, Ь). Тогда существует точка с, такая, что Г = /(с). (4.25) Ь — а Доказательство. Введем вспомогательную функцию ср(ж) — /(ж) — /(а) — Х(ж — а), (4.26) где X —пока произвольная постоянная. Очевидно, что эта функ- ция непрерывна на отрезке [а, Ь], дифференцируема в интервале ’ (а, Ь) и <р(а) = 0. Подберем в (4.26) такое значение X (обозначим его Хо), чтобы ср(Ь) также равнялось нулю. <р(6) = f(b) - /(а) - Хо(Ь - а) = 0. Откуда Если подставить это значение Xq в формулу (4.26), то функция ср(ж) будет удовлетворять всем требованиям теоремы Ролля. То- гда в силу этой теоремы Все (п, Ь): ср'(с) — Но ср'(ж) = ~ следовательно, — Xq — 0 f'(c) = Хо, что равносильно (4.25). Следствие. Пусть /(ж) дифференцируема на промежутке (а, Ь' и во всех точках этого промежутка /'(ж) = 0. Тогда /(ж) постоянна на (а. Ь). 156
Доказательство. Возьмем две произвольные точки х± и х2 из (а, 6), такие, что х\ < х2. На отрезке [ад,&2] для /(# выполнены все условия теоремы Лагранжа. В частности, непрерывность на ад, х2 следует из дифференцируемости. Г оэтому Ясе (ад,х2): 1(®2) - /(2-1) (4.27) Но по условию во всех точках промежутка (а, 6), в том числе и в точке с, f'(x) = 0. Из (4.27) находим, что /(ад) — f т2)- В силу произвольного выбора точек х± и а2 это и означает постоянство /(а) на (с, Ь). 4.5. Приложение дифференциального исчисления к исследованию поведения функции Дадим следующее определение. Определение 4.4. Функция f(x) называется монотонно возрастающей (убывающей) на промежутке (аД), если v^i,rr2 е (аД): ад < х2 f(xr) < f(x2) (У(я1) > ЖО). (4.28) Теорема 4.11 (достаточный признак монотонности). Пусть функция f(x) дифференцируема на промежутке (а, Ь) и во всех точках этого промежутка выполняется неравенство ff(x) > > 0 (Д'(х) < 0). Тогда функция f(x) монотонно возрастает (убы- вает) на (а, &). Доказательство. Возьмем произвольную пару точек ад,х2 Е Е (a, b): X] < х2 и применим к отрезку [ад, аг2] теорему Лагранжа (выполнение условий этой теоремы обеспечено дифференцируе- мостью f(x)). Тогда Яс Е (ад,т2): /(Д1) - Л*г) XI — х2 = Г (с) > о (Г(с) < 0). Отсюда и вытекает (4.28). Теорема 4.12 (достаточный признак локального экс- тремума). Пусть функция f(x) удовлетворяет следующим условиям: 1) f(x) непрерывна в точке а?о; 157
2) /(х) дифференцируема в некоторой проколотой окрестно- сти й(х0); 3) /7х) меняет знак при переходе через точку хд. Тогда у /(х) имеется в точке хд локальный экстремум, причем, если знак производной меняется с «+» на «— », то — максимум, а если с «—» на «+», то минимум. Доказательство. Здесь требуется пояснить третье условие теоремы. Мы считаем, что /7(х) меняет знак при переходе че- рез точку хд, если для всех х из U(xg) : х < хд она имеет один знак, а для всех х из U хд) : х > х$ — противоположный знак. Пусть для определенности знак j (х) меняется с <<+» на «—». Возьмем произвольную точку Xi £ В (xg) : х\ < хд и применим к отрезку [Xi, Xg теорему Лагранжа. Отметим, что непрерывность х) на промежутке [xi,xg следует из цифференцируемости, а непрерывность в точке хд оговорена в условии. Получим: 3ci G (ж1,ж0): /(жр) - /(Ж1) Хд — Xi = /'(н) > 0. Следовательно, /(xi) < /(хд). Рассмотрим теперь произвольную точку Х2 £ В(хд) : Хд < Х2. Применив теорему Лагранжа к отрезку [хд,х2], получим Эс2 £ (хд,Х2): /(^2) - Джр) ж2 - жр = /'(с2) < 0. Следовательно, /(х2) < /(хд). Итак, доказано, что V.T € и(жр) => /(ж) < /(жр) , а это и означает, что у функции /(х) в точке хд имеется локаль- ный максимум. Перейдем теперь к вопросу о так называемом сравнении скоростей роста степенной, показательной и логарифмической функций, т. е. установим следующие соотношения: Vp и а > 1; Х/р и е > 0; Vp и е > 0. (4.29) 158
Докажем первое равенство. Если р 0, то равенство очевид- но, так как хр представляет собой ограниченную в окрестности „ л 1 бесконечности функцию, а — а Пусть теперь р стремятся к бесконечности и результат совсем не очевиден. Ис- 37^ следуем поведение функции у = — на положительной полуоси о1 х е 0,+оо): бесконечно малую. 0. Тогда и числитель, и знаменатель дроби р хр — храх In а а2ж (р — ж In а). (4.30) Ясно, что знак yf совпадает со знаком выражения в скобках р в (4.30), т.е. он положителен при х < xv = -— и отрицате- ша лен при х > хр. Изобразим график функции при х е (0, +ос) (рис. 4.2). В точке хр функция принимает наибольшее значение на (0, +оо), которое обозначим Ср. Возьмем теперь дробь ---. В cилv вышеизложенного, на ах (0, +оо) справедливо неравенство 0,<----^Ср+1. х ах (4.31) Поделим все части (4.31) на х: хр С 11 х < ах ' х (4.32) Очевидно, что левая и правая части (4.32) стремятся к нулю при х —> +оо. Отсюда по теореме о зажатой переменной получим первое равенство из (4.29). Рис. 4.2 159
Чтобы доказать второе соотношение из (4.29), сделаем замену переменной: 1пт — t. Тогда искомый предел выразится в виде lim — — lim -—= 0. t-^+oo eEt t—->н-ос (еЕ)г Последний шаг был сделан на основании первого соотноше- ния (4.29) и того, что ее = а > 1. Третье соотношение (4.29) можно доказать, сделав замену пе- 1 ременной t — В результате получим х .. IlntlP (lnt)P = lim —---------— hm ------------- = 0. t—>4-00 tE t—>4-oo tz lim тЕ|1пт|р = lim — In- ce—>0-h t—>4-оо tz t Последний шаг был сделан на основании второго соотноше- ния (4.29). Первые два соотношения (4.29) можно интерпретировать так, что при х —> +оо степенная функция растет медленнее показа- тельной, а логарифмическая - медленнее степенной. Пусть функция у = /(ж) дифференцируема на некотором промежутке (а, Ь). Тогда ее производная у1 сама является функ- цией, определенной на этом промежутке, и можно рассматри- вать ее производную. Эта производная (у')' носит название вто- рой производной (или производной второго порядка) от функции дРу у и обозначается у” или —Аналогично можно рассматривать dxz производные третьего, четвертого порядка и т. д. Вообще, про- изводной тг-го порядка заданной функции называется производ- ная от ее (п — 1)-й производной: у^ — (?/п~^) . Обозначается dny или -—. Отметим, что в отличие от dxn _ dny производной первого порядка обозначение —— уже нельзя ин- dxn терпретировать как настоящую дробь — это всего лишь единый n-я производная так: у символ для п-й производной. Для выяснения «геометрического смысла» второй производ- ной у” рассмотрим график функции у — f(x), дифференцируе- мой на промежутке (а, Ь). Определение 4.5. График функции f(x) называется выпук- лым вниз (вверх) на (а, 6), если на этом промежутке он располо- жен не ниже (не выше) каждой касательной к этому графику, проведенной через произвольную точку (то,/(то)), х$ е (а,Ь). 160
На рис. 4.3 представлены графики функций, выпуклой вниз (рис. 4.3, а) и выпуклой вверх (рис. 4.3, б). Теорема 4.13 (достаточный признак выпуклости). Пусть функция f(x) имеет вторую производную на промежутке (а, Ь) и пусть на этом промежутке //Х(х) > 0 (f"(x) < 0). Тогда график у — f(x) будет на (а, Ь) выпуклым вниз (вверх). Доказательство. Действительно, наряду с графиком у — f(x) рассмотрим касательную к этому графику, проведенную через его произвольную точку (то,/(то))? где xq € (а, Ь). Уравнение такой касательной, как известно, имеет вид Ук = f(xo) + /'(жо)(ж - ж0). Изучим знак разности ординат графика и касательной в произ- вольной точке Xi 6 (а, Ь): У ~Ук = /(Ж1) - (/(жо) + /'(ж0)(Ж1 - Ж0)) = = (/(Ж1) - /(жо)) - /'(a?o)(^i - ЖО). (4.33) К разности выражения в первых скобках правой части формулы применим теорему Лагранжа на отрезке [то, тх]. (Заметим, что в силу существования /"(ж) сама функция /(т) и ее производная /'(#) будут непрерывны на (а, Ь).) В силу этой теоремы Все(ж0,Ж1): /(жх) -/(ж0) =/'(c)(xi - ж0). (4.34) Подставив (4.34) в (4.33), получим У~Ук = (У(с) - /'(жо)) (Ж1 - Жо). (4.35) 161
Снова применив теорему Лагранжа, но уже к функции ff<x. на отрезке [тсь с] (объясните, почему это можно сделать), придем к соотношению У~Ук = f (ci)(c - Жо)(^1 - ®о), (4.36) где ci е (ж0, с). Заметим теперь, что где бы ни нахо- дилась точка , справа или слева от То, произведение (с-ж0)(^1 ~жо) положительно и, следовательно, знак разности у — у к совпадав! со знаком Если на промежутке (a,b) ff(x) > 0, то и > 0. Значит, у — ук > 0 и график лежит выше касательной для всех х х$ (в самой точке разность у — у к = 0), т.е. график у = fix' является выпуклым вниз. Аналогично рассматривается случай /,х(ж) <0. Пусть функция /(т) дифференцируема на промежутке а, Ь) и жо Е (а, Ь). Тогда, если существует окрестность этой точки и(#о) = {lc: то — 8 < х < то + 8}, такая, что на интервале (то ~ 8, то) график у — f(x} является выпуклым в одну сторону, а на интервале ('то,то + 3) — в другую, го точка То называет- ся точкой перегиба графика у — f(x}. В этой точке происходит изменение выпуклости и график переходит с одной стороны ка- сательной на другую (рис. 4.4). Итак, теперь можно ответить практически на все вопросы о поведении графика функции у = определить возрастание и убывание графика, его выпуклость, точки локального экстрему- ма и точки перегиба. Чтобы завершить эту тему, введем понятие наклонной асимптоты графика. Под ней будем понимать на- клонную прямую, такую, что разность ординат графика и этой прямой в точке х будет стремиться к нулю при т —> оо. Теорема 4.14. Для того чтобы график функции у — f\x^ обладал наклонной асимптотой, необходимо и достаточно, чтобы существовали следующие два предела: lim — к и. lim (f(x) — kx) — b. ,4.37) -T—^oo X ' При этом уравнение асимптоты имеет вид у “ кх + 6. (4.38) 162
Доказательство. В самом деле, пусть у графика имеется на- клонная асимптота. Тогда в силу ее определения справедливо соотношение lim Х—+(Х) (/(ж) - (кх + b)^ = о, т. е. /(т) — кх 4- Ь + а(т), где lim а(т) = 0. х— (4.39) Поделив обе части (4.39) на х и перейдя к пределу при х —* сю, получим первое соотношение из (4.37). Вычитая из /(ж) сла- гаемое кх и снова переходя к пределу при х —> сю, получим второе соотношение из (4.37). Столь же легко доказывается и обратное утверждение: если существуют оба предела (4.37), то прямая (4.38) является асимптотой графика у == f(x) (проведи- те доказательство самостоятельно). Нужно отметить, что, вооб- ще говоря, следует отдельно искать асимптоту при х 4-ос и ж — оо, поскольку поведение функции на «+оо» и на «—сю» может быть совершенно разным. И лишь для рациональных функций можно быть уверенным, что, если наклонная асимпто- та есть, то она одна и та же как на «+оо», так и на «—ос». 4.6. Формула Тейлора Пусть функция у — /(ж) дифференцируема в точке xq. Фор- мулу (4.4) для ее приращения можно переписать в таком виде /(ж) - /(ж0) = /'(жо)(ж - Жо) + о(ж - Жо) при х -> Ж0, или /(ж) = /(жо) + /'(ж0)(ж - Жо) + °(ж - Жо). (4.40) Формулу же (4.40) можно интерпретировать так: функция /(ж) в окрестности точки х$ приближенно равна некоторому многочле- ну первого порядка, а погрешность такого приближения стре- мится к нулю быстрее, чем х — xq при х Xq. Но задачу о приближении функции многочленом можно по- ставить не только для многочлена первого порядка, но и для многочлена любого порядка п. Предварительно возьмем произвольный многочлен n-го по- рядка Рп(ж) = Ьо + Ь1Ж Ч--h bnxn (4.41) и запишем его в другой, более удобной форме. 163
Положим t — x—xq, t. e. x = xo+tn подставим это выражение для х в (4.41): Pn(t) = Ьо + Ь^хо +1) + b2(x0 +1) 4--\-bn(x0 + t)n. (4.42) Раскрыв скобки в (4.42) и приведя подобные члены, получим Fn(t) = а0 + arf Н--1- antn. Возвращаясь к прежней переменной, находим Рп(ж) = т- «1 (х — з?о) + • * * + ап(х — #о) • 4.43) Представление (4.43) имеет перед (4.41 то преимущество, что здесь каждое слагаемое при х —> Xq стремится к нулю со своей, отличной от других, скоростью. Выясним теперь, как связаны коэффициенты аь е (4.43) с производными многочлена Рп(х ) в точке &о- Очевидно, что а$ = = Г (х$). Продифференцируем (4.43): Р^(х) = ai + 2az(x—а?о)+3аз(а; —#or “I-\-пап(х—xq)"'~1 (4.44) и подставим в полученное выражение х — xq. Тогда 7^ (.т0) = ai. Продифференцируем 4.44): = 2й2 + 3 • 2аз(х — то) Ч-Ни п — 1)ап(т - жс)/-’ и опять подставим х = хц: Р^х-о) = 2а2. Продолжая действовать подобным образом, можно установить следующую формулу: ^к — ,,п. к\ ’ э ёперь многочлен (4.43) можно записать в вице /„ч о ч , O.'z„ W „ ч . Р"Сжо)/ (4.45) п\ (4.46) 164
А теперь вернемся к нашей задаче. Требуется найти такой мно- гочлен n-го порядка РДт), для которого при х —> то выполня- лось бы соотношение /(«) = Рп(х) о[(х - Zo)n] или, в развернутом виде, /(ж) = «о + ai(^ - #о) Ч--Н ~ жо)п 4- о[(т - т0)п]. (4.47) Теорема 4.15. Для заданной функции /(т) существует не более одного многочлена, удовлетворяющего условию (4.47). Доказательство. В самом деле, пусть наряду с Рп(х) есть еще один многочлен Qn(x) ~ Ъ^ + Ь±(х ~ то) + ’ • • 4- Ьп(х — то)п, такой, что /(т) = Ьо + 6Дт - То) 4---Ь ЬДх - т0)п + о[(т - т0)п]. (4.48) Перепишем (4.47) и (4.4S), раскрыв символы о[(т — то)п]: /(т) = а0 Ч- &1(т - т0) Ч-1- ап(х - т0)п + а(т)(т - т0)7', (4.49) /(т) —60 Ч- 61 (т - то) Ч- • • Ч- 6п(т - т0)п Ч- р(т)(т - т0)п. (4.50) Здесь а(т) и р(т) — бесконечно малые при т —> tq. Вычитая (4.50) из (4.49), получим («о - 60) Ч- (ai - 6i)(t - то) Ч--1- («п - 6п)(т - т0)пЧ- (4.51) Ч-у(я)(т-т0)п — 0, где у(т) — а(т) — р(т) — бесконечно малая. Полагая т — то в (4.51), получим, что «о = Ьо, и равенство (4.51) примет вид («1 - 61)(т - То) Ч~ (tt2 - ь2)(т - То)2 Ч- ---1- («И - 6-п)(т - ТоГ + у(ж)(т - т0)п = 0. Разделим обе части (4.52) на (т — то) и устремим х к xq. Найдем, что ai — 61. Продолжая действовать подобным образом, устано- вим, что — 6/^, к — 0,1, ..., а, что и означает совпадение Рп(т) с Qn(^)- Рассмотрим простейшие функции срДт) = (т — то)^. Мы ви- дим, что, с одной стороны, справедливы соотношения 165
<р1(ж0) = о, ЫМ = <Р2(жо) = О , фз(ж0) = Фз(жо) = Фз(жо) = О, <pfc(-r0) = <pfc («о) = • • • = cpfc 1 (жо) = о, а с другой стороны, при х —* xq <р2(ж) = ©(ж - Жо), фз(ж) = о[(ж -ж0)2], ?<к(ж) = о[(ж-ж0)/г“1]. Это не случайное совпадение. Существует тесная связь между количеством производных некоторой функции, обращающихся в нуль в точке Жо, и скоростью убывания этой функции при х xq. Эта связь устанавливается в следующей теореме, кото- рую приводим здесь без доказательства. Теорема 4.16. Пусть функция <р(ж) определена в окрестно- сти точки жо и удовлетворяет следующим условиям: ф(ж0) = ф'(ж0) = ... = ф^(жо) = о, тогда при х —> жо (р(ж) — о[(ж — Ж0Г] - А теперь предположим, что функция /(ж) определена в окрестности точки жо, а в самой этой точке имеет п-ю произ- водную /^(жо). Найдем многочлен n-го порядка Тп(ж), который в окрестности точки жо точнее всего приближал бы /(яЛ в том смысле, что разность между /(ж) и этим многочленом убыва- ла бы быстрее всего при ж —> жо- Здравый смысл подсказывает, что среди всех многочленов n-го порядка точнее всего прибли- жать функцию будет тот, значение которого в точке жо совпадет с /(жо), а также значения всех его производных до n-го порядка включительно в точке жо будут равны значениям соответству- ющих производных функции. Иначе, /(жо) = Тп(ж0), /'(жо) = Т4(жо), • • • , /(,1)(жо) = Т^(жо). (4.53) Но тогда, учитывая (4.45), такой многочлен однозначно запи- шется в виде 166
2! (4.54) п\ Многочлен (4.54) назовем многочленом Тейлора п-го порядка для функции f(x) в точке xq. Теорема 4.17. Пусть у функции /(т), определенной в окрестности точки xq, в самой этой точке существует n-я про- изводная f(n\xo). Тогда при х —► справедлива формула /(ж) = /(т0) + /'(^о)(ж - #о) Ч------Т Ч-о [(т - т0)п]. п! (4.55) Формула (4.55) носит название формулы Тейлора. Доказательство. Действительно, рассмотрим функцию ср(т) — /(ж) — Тп(х). В силу (4.53) для нее выполняются условия <р(жо) = ф'(л?о) = -. = Ф(п)(ж0) = о. Но тогда в силу теоремы 4.16 <р(т) = о[(ж — tq)”]. Иначе, f(x) - Тп{х) - о[(ж - ж0)п], (4.56) Перенесем в (4.56) Тп(х) в правую часть и получим (4.55). Отметим, что при xq = 0 (4.55) принимает вид /(т) = /(0) + /'(0)х + • • • + -^хп ТТ. и носит название формулы Маклорена. (4-57) Разность между функцией f(x) и ее многочленом Тейлора Тп(х) носит название остаточного члена гп(х) формулы Тей- лора. В формуле (4.55) этот остаточный член записан в виде о[(ж — то)71]. В этом случае говорят, что остаточный член задан в форме Пеано. Стоит отметить, что существуют и многие дру- гие формы записи остаточного члена. Перепишем формулу (4.57) для некоторых важных функций. Для этого предварительно выясним, как выглядят их п-е произ- водные. Во-первых, очевидно, что (4.58) 167
так как ех при дифференцировании не меняется. Далее, пусть у — хр тогда у" =р(р- 1)жр , у'" = р (р - 1)(р - 2}хр~ Вообще, (хр)^ ~ р (р — 1) • • • (р — п + 1)хр п. (4.59) Заметим, что если р — натуральное число, то при п >р У Н=0. Кроме того, ясно, что ((1 + х)р)(п) = р (р — 1) • • • (р — п + 1)| 1 + х)р п , (4.601 поскольку, применяя правило дифференцирования сложной функции, каждый раз нужно умножать найденное выражение на 11 + хУ ~ 1. Таким образом, (4.60) получается из 4.59) заме- ной х на (1 + х). Рассмотрим теперь функцию In т: InxV = — (_ 1)(—1 — !)••• (—1 — (и — 1) lix ’ 1\ После очевидных упрощений приходим к формуле (1пж)(п) = Д. (4.61) X Аналогично (4.60) можно получить формулу ,4 — 1 1 (1 + х)п ’ (1п(1 + ж))'П) = п—1 (4.62) Если у = sinx, то yf — cosx, у"— —sinx, у"'— — соях, у—-sinx. Далее производные циклически повторяются, так что у(«+4) _ у(п) Легко проверить, что все эго укладывается в формулу sinx r 7 — sin х Ч— п \ 2 (4.63) 168
Аналогично получается формула для производной косинуса (cos — cos . (4.64) Теперь, учитывая все найденые формулы, можно записать пять основных разложений: Иногда в качестве шестого разложения добавляют пятое разло- жение для специального случая р = — 1, который часто встреча- ется на практике: 4.7. Приложение* Рассмотрим функцию у — u{x)v{x\ где и(х) и v(x) функции, имеющие производные любого порядка, и найдем фор- мулы вычисления производных различных порядков от этой функции. у' ~ и'V + uv'; у" — (u'v)' + (ш/)' = u"v + u'v' + u'v' + uv" = u"v + 2uV + uv"; y"' = (u"v)' + 2(uV)' + (ш/')' - u'"v + 3uV + 3uV + W". Заметим, что коэффициенты в этих формулах совпадают с ко- эффициентами в формулах л (а + Ь)2 = а2 Т 2аЬ + д2; tn + 5)3 = а3 + За2Ь + ЗаЬ2 4- b\ 169
Естественно возникает предположение, что эта закономерность распространяется и на производные более высокого порядка. Иначе, должна выполняться формула (") = u^v + nu^-^v' + u^-^v" + • • £ • к\ (4.66) Коэффициенты в (4.66) — это биномиальные коэффициенты, т. е. коэффициенты в разложении (а + Ь)п. Оказывается, что эта формула действительно имеет место (это можно доказать, на- пример, с помощью математической индукции) и носит назва- ние формулы Лейбница, Вычислим, например, с ее помощью п-ю производную функции у = х2ех. Поскольку полагая в (4.65) и ~ ех, v = т2, получим у^ — х2ех + 2пхех + п(п — 1)ет . А теперь вернемся к вопросу о приближенном вычислении корня алгебраического уравнения /(ж) = 0. (4.67) Ранее мы видели, что, если удается выделить отрезок [а, 6], на котором находится единственный корень х$ уравнения (4.67), то приближенное значение х$ с любой точностью можно получить методом деления отрезка [а, Ь] пополам. Однако существуют бо- лее эффективные методы приближенного вычисления xq^ быст- рее приводящие к цели. Здесь кратко опишем два таких метода: метод хорд и метод касательных. Будем предполагать, что f(x) удовлетворяет следующим условиям: 1) ж Е С2([н, Ь]), т. е. функция /(т) непрерывна на [а, Ь] вместе со своими производными первого и второго порядка; 2) значения /(т) на концах [а, Ь] имеют разные знаки: /(«)/(&) < 0; 3) f'(x) и /"(ж) сохраняют знаки на [а, 6]. Заметим, что сохранение знака f(x) гарантирует монотон- ность /(.т) на [а, 6], а, значит, и единственность корня 2'о на этом 170
Рис. 4.5 отрезке. Сохранение же знака f"(x) гарантирует выпуклость графика у = f{x) на [а, Ь| в одну сторону. Изобразим схемати- чески график функции на [а, Ь] для случаев выпуклости вверх и выпуклости вниз (рис. 4.5, а, 5). Напишем сначала уравнение прямой (хорды), проходящей че- рез точки Л(а, /(а)) и B(b, /(b)): У - Ца) = ж - а /(Ь) - /(а) b - а ’ (4.68) Корень жо — это абсцисса точки пересечения графика у = f(x) с осью Ох. Приближенным значением для него будет абсцисса х точки пересечения хорды (4.68) с осью Ох, которая легко нахо- дится из уравненения (4.68), если положить у — 0: а/(Ь) ~ b/(Q) Ь — а Теперь из отрезков [a, xi] и [ад, Ь] выбираем тот, на концах кото- рого /(о?) принимает значения разных знаков. На этом отрезке снова можно провести хорду, абсцисса точки пересечения кото- рой с осью Ох будет следующим приближением к корню х$ и т. д. В этом состоит метод хорд. С другой стороны, можно провести касательную к графику у — в точке (с,/(c)), где с е [а, Ь], и абсциссу х% точки пе- ресечения этой касательной с осью Ох выбрать в качестве при- ближенного значения для х$. Уравнение такой касательной, как известно, имеет вид Полагая здесь у — 0, найдем 171
Обычно в качестве с выбирают один из концов отрезка [щ Ь], при- чем именно тот, на котором знаки/(с* и f"(c) совпадают. В этом случае, как можно показать, приближенное значение х% будет лежать в интервале (а, Ь). Как и в методе хорд, можно теперь выбрать тот из отрезков [а, ^2], [^2, Ь], на концах которого f(x) принимает значения раз- ных знаков, и уже на нем провести новую касательную, чю даст новое приближение для корня то- Этот метод носит название метода касательных или метода Ньютона. Можно доказать, что при сделанных предположени- ях относительно функции f(x\ применяя нужное число раз ме- тод хорд или метод касательных, можно получить приближен- ное значение для тр с любой заданной точностью. Обратим внимание, что на рис. 4.5 точки х\ и приближают #о с разных сторон. Это общая ситуация. Поэтому иногда, при- меняют комбинированный метод, когда одновременно ищут при- ближенные значения для как по методу хорд, так и по методу касательных. Теперь докажем теорему Коши, которая является естествен- ным обобщением теоремы Лагранжа. Теорема 4.18. Пусть на отрезке [а, Ь] заданы две функции и д(х , удовлетворяющие следующим условиям: 1) f(x) и д{х \ непрерывны на [а, 6]; 2) J 1ж) и д(х) дифференцируемы на (а, Ь), 3) gf(х) Ф 0 на (а, Ь). Тогда существует точка с 6 (а, Ь) такая, что /(0 - Да) _ /\с) .?(0 - д[а) д'(с)' (4.69) Доказательство. Действительно, введем вспомогательную функцию ф(ж) «= /Ф) - /(а) - X(fl(x) - g(aY), где X — пока произвольный числовой параметр. Очевидно, что ' <р(а) - 0. Подберем X так, чтобы <р(Ь) также равнялось нулю: Я0 - /(«) - ^{д(Ь) - д(а}) = 0. Отсюда Л0-Да) д(Ь} - д(а)' 172
Заметим, во-первых, что знаменатель данной дроби не может об- ратиться в нуль, поскольку, если бы д(Д) равнялось #(а), то в си- лу теоремы Ролля нашлась бы точка на (а, 6), в которой д'(х) об- ращалась бы в нуль, а это противоречит третьему условию тео- ремы. Во-вторых, <р(ж) очевидно удовлетворяет при так выбран- ном X всем условиям теоремы Ролля. Но тогда в силу этой тео- ремы 3 с G (а, 6): ср'(с) — 0. Учитывая, что ср'(ж) = /'(ж) — \д'{х}^ приходим к соотношению 9'(с) что равносильно (4.69). С помощью теоремы 4.18 можно доказать другую теорему* которая носит название правила Лопиталя — Бернулли. Стоит отметить, что чаще всего эту теорему называют просто прави- лом Лопиталя, что несправедливо, так как «заслуга» Лопиталя лишь в том, что он опубликовал доказанную Бернулли теорему под своим именем. Теорема 4.19. Пусть f(x) и д(х) дифференцируемы в неко- торой проколотой окрестности U(#o) точки xq, причем д[х > и д'(х) в этой окрестности не обращаются в нуль. Пусть далее f'(x^ lim У(х) = lim q(x) = 0 и существует lim - - — — а. х—>Жо X-+XQ X—>XQ gf\X) !огда г /О) lim -z- — а. Х—>Х() 9W Доказательство. В самом деле, доопределим функции f(x) и д(х) в точке по непрерывности, полагая /(жо) ~ д(#о) = 0- Возьмем фиксированное х € U(rro)- Заметим, что на отрезке [з?о, /(ж) и д(х) удовлетворяют всем условиям теоремы Коши. Тогда в силу этой теоремы 3 с 6 (жо> /(х) - /(ж0) /'(с) §(ж) - д(х0) д'(с)' т. е. (4.70) 173
Устремим х к £о. Тогда с тоже будет стремиться к жо, а значит, УДс) будет стремиться к а. Отсюда в силу (4.70) получим утвер- д \с) ждение теоремы. Данная теорема обобщается, во-первых, на случай, когда х сю, а во-вторых — на случай, когда lim j''x) = lim 5 fx) = оо. X—+XQ Х—+Х0 Доказательство этих вариантов данного правила более сложное и здесь его не проводим. Проиллюстрируем теорему 4.19 на двух примерах: sin гг сова; lim------ = lim —-— = 1; х—+0 X х-^0 1 lim — = lim — — 0. х—>4-00 ж—ех
Глава 5 ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 5.1. Дифференциальное исчисление В основном мы будем иметь дело с функциями двух перемен- ных. Если функция у — f(x) сопоставляла каждому числу х из области определения другое число у, то функция двух перемен- ных z = сопоставляет паре чисел (ж, у) третье число z. Функцию одной переменной часто удобно было рассматривать как функцию точки на числовой прямой. Точно так же, функ- цию двух переменных естественно считать функцией точки на плоскости z = где М имеет координаты (ж, у). Геометри- ческим изображением функции одной переменной являлся гра- фик. Точно так же, для функции двух переменных можно гово- рить о «графике», понимая под ним поверхность с уравнением z = f(x,y) (рис. 5.1). Замечание. Если в случае функций одной переменной график служил важным инструментом исследования поведения функции, то для функции двух переменных график имеет лишь теоретическое зна- чение, поскольку даже для очень простых функций изобразить соот- ветствующую поверхность нелегко. Функция п переменных и — • ,Хп) сопоставляет на- бору из п чисел (#1, ... ^Хп) число и. Здесь также можно гово- рить, что такая функция является функцией точки, но уже в n-мерном пространстве, понимая под точкой М набор из п чи- сел М = (жь ...,жп). Определение 5.1. Окрестностью точки Мо(жо, уо) называ- ется множество U(M0) = {(ж, у) : уДх - ж0)2 4- (у - Уо)2 < S, где 8 > 0}. (5.1) Таким образом, U(Mq) это открытый круг (т. е. круг без граничной окружности) радиуса 8 с центром в точке Mq. Определение 5/2. Проколотой окрестностью точки Мо(то,Уо) называется окрестность U(Mo) с исключенным центром. 175
Иначе, это множество U(Mo) = {(z,y):O< < у/(х- а?о)2 + (у - Уо)2 < &, где 8 > 0}. (5.2) Для функции п переменных соотноше- ния (5.1) и (5.2) принимают, соответ- ственно, вид и ?7(Мо) = {(^1, ...,жп) : 8 > 0} й(М0) = {(яд, .. .,хп) : 0 Определение 5.3. Число а называется пределом f(M) при М М$ (пишут lim — а), если М —> Мо Ve > 0 3U(M0) : \/М е и(М0) => |/(М) - а| < г. (5.3) Это общее определение для функций любого числа перемен- ных. Применяются также обозначения .Ц™ Л^У) = « и lim Лл, ..., ягп) = а l-^Уо ? Хп~ которые имеют тот же смысл, что и (5.3). Замечание. Определение 5.3 практически дословно повторяет определение предела для функции одной переменной. Поэтому все тео- ремы о пределах (такие, как, например, теоремы о действиях с преде- лами, теорема о сохранении знака и т. д.) остаются справедливыми и в этом случае. Определение 5.4. Функция f(M) называется непрерывной в точке Мо, если Иш М~+Мо т. е. если /(М) = /(Мо), Ve > 0 Яи(М0) : \/М Е U(M0) =$► f(M) - f(Ma) < е. (5.4) 176
Замечание. Здесь вновь имеется полная аналогия с одномерным случаем. Поэтому оказываются справедливыми, например, теоремы об арифметических действиях с непрерывными функциями. Для функций двух и более переменных непрерывность можно по- нимать и в несколько ином смысле — как непрерывность по каждой переменной при фиксированных остальных. Но такое понятие непре- рывности не равносильно определению 5.4. Определение 5.4 налагает на функцию более сильные ограничения. Докажем два локальных свойства непрерывных функций. Теорема 5.1. Если функция f(M) непрерывна в точке Mq, то она локально ограничена в этой точке. Доказательство. Действительно, фиксируем произвольное г > 0. Тогда в силу (5.4) Эи(Мо): VM G U(Mo) => |/(М) -/(Мо)| < е. Но по свойству модуля |/(7И)|-|/(Мо)|<|/(М)-/(Мо)|. Следовательно, VM е U(Mo) |/(М)| < |/(Мо)| + е = С. Это и означает локальную ограниченность f(M) в точке Мц. Теорема 5.2. Если функция f(M) непрерывна в точке Mq и аи(М0): VM€U(M0)=>/(M) > 0 (< 0). Доказательство. Пусть для определенности /(Л/о) Ж) т (-Л1 ложим £ = —-—. тогда в силу (Ь.4) 3U(Mo) : VM G U(M0) => |/(М) - /(Мо)| < откуда Ж) - ДО- /(М) < /(Мо) + /(Мо) Таким образом, в любой точке М окрестности U(Mo) выполня- ется неравенство О < < f(M). 177
Перейдем теперь к дифференциальному исчислению функ- ций нескольких переменных. Рассмотрим вначале функцию двух переменных z — /(х^у), определенную в окрестности точки М^х^у^). Введем следу- ющие величины: Дх = х - х0, Ду - у - уо, Дг = /(х, у) - f(xo, уо) = /(хо + Дж, уо + Ду) - /(х0, уо), = /(хо + Дх, уо) - /(х0, Уо), Д^г = /(хо,уо -г Ду) - /(а?о,Уо)- Величина Дг является приращением функции f(x,y}, а величи- ны Дх% и Д^г — это частные приращения f{x^y) соответственно ПО X и по у. ’'(пределение 5.5. Частными производными функции z = = /(ж, у) по х и у в точке 7Ио(жо, уо) называются следующие пре- делы: х$(жо,?/о) = Иго-------- V 7 Дгг—0 Дж И 4(^0, Уо) = lim у Дy^Q _? У (5-5) Таким образом, частная производная — это производная по соответствующей переменной при фиксированных значениях остальных переменных. Отметим, что для записи частных производных используют- ся dz ся также обозначения —— и —, которые в отличие от случая дх оу одной переменной нельзя понимать как дроби. Определение 5.6. Функция z — f(x, у) называется ренцируемой в точке МДхп^уп), если в некоторой окрестности этой точки выполняется соотношение Д г ~ А Дж + В Ду + а (Дж, Ду) Дж + р(Дж, Ду) Ду, (5-6) где lim а(Дж, Ду) = lim р( Дж, Ду) — 0; А и В постоянные. Теорема 5.3. Если функция дифференцируема в точке, то она непрерывна в этой точке. Доказательство. Отметим сначала, что, как и в случае одной переменной, условие непрерывности функции г =- /(ж. г/) в точке Мо(жо, у(\) можно записать через приращения в виде 178
lim Az — 0. Дх—Ю Aj/->0 (5.7) Но тогда очевидно, что из (5.6) следует (5.7). Отметим, что дифференцируемость в точке — более сильное условие, чем непрерывность: если функция непрерывна в точке, то отсюда не следует ее дифференцируемость в этой точке, что видно на примере функции г = |ж| + |у|. Данная функция, как легко показать, непрерывна в точке (0,0), но не является дифференцируемой в ней. Теорема 5.4. Если функция z = f(x,y) дифференцируема в точке 7Ио(жо,уо)? то У нее в этой точке существуют обе частные производные гДжо^о) — А и ^(жо,?/о) = В, где А и В — посто- янные из (5.6). Доказательство. Докажем, например, что гДжо.?/о) — А. Из (5.6) следует, что 2±xz — АДж 4- а(Дж, 0) Дж. Поэтому lim ~~~ = lim (А 4- а(Дж, 0)) = А. Ах—>0 Дж Дх-ЛГ 7 Аналогично доказывается, что г^(жо,1/о) = В. Замечание. Эта теорема аналогична соответствующей теореме для функций одной переменной, однако в случае нескольких перемен- ных обратное утверждение не имеет места: из наличия частных про- изводных в точке не следует дифференцируемость функции в данной точке. Это можно увидеть на примере следующей функции двух пе- ременных: f(x,y) = ж = 0 или при ж £ 0 и у 0. Данная функция равна нулю на осях координат, а вне их вы- 1 числяется по формулу —----о-. Для нее, очевидно, выполняется ж2 4- yz равенство 4(о,о) = 4(о,о) = о, 179
но в то же время не существует предела Ьш /(ж, у). Значит, эта х—Л) функция разрывна в начале координат и, следовательно, не мо- жет быть дифференцируемой в (0,0). Тем не менее с помощью частных производных можно устано- вить дифференцируемость функции, если наложить более силь- ные ограничения. А именно, справедлива следующая теорема. Теорема 5.5 (достаточное условие дифференцируемо- сти). Если функция f (ж, у) имеет обе частные производные в окрестности точки (жд. уо), которые как функции двух перемен- ных непрерывны в точке (жо,уо), то /(яру1 дифференцируема в этой точке. Данную теорему приводим здесь без доказательства. Заме- тим, что во всех практически встречающихся задачах условия данной теоремы выполняются. Рассмотрим функцию п переменных и = /(жг, ..., жп). Как и в случае двух переменных, определяются частные приращения а также частные производные / -»• ^-Х • -«л Чт; = Aiimп-Ц-, г = 1,2,...,п, Д.Ж?; а соотношение (5.6) принимает вид Ди — А1Дж1 +---Н АпДхп -р oti( Дж1, ..., Дхп) Дх± + • • • (5.8) ---1- an(A«i, ..., Джп)Дхп, где lim aj(A;ri, ..., Axn) = 0, i — 1,2, ... ,п. О Теоремы 5.3 и 5.4 остаются справедливыми и в этом случае так же, как и достаточное условие дифференцируемости. Определение 5.7. Дифференциалом dz функции z — f{x} у: в точке (жо, уф) называется величина dz = АД.т + ВДу, где А и В — коэффициенты из (5.6). Очевидно, что для линейных функций дифференциал dz сов- падает с приращением Дz. В частности, Дж = d.iz Ду — dy. Учи- тывая это, а также теорему 5.4, получим следующее выражение для дифференциала 180
dz = ?'.(ж0, yo)dx + Zy(x0, y0)dy. (5.9) Заметим, что часто dz называют полным дифференциалом. Выясним теперь геометрический смысл дифференцируемо- сти и дифференциала для функции двух переменных. Как уви- дим далее, здесь имеется полная аналогия со случаем одной пе- ременной. Обратимся к «графику» функции двух переменных, т. е. к по- верхности в пространстве с уравнением z — /(т, у). Выберем те- перь некоторые фиксированные значения то, уо и соответству- ющее им значение zq = /(хо,Уо)- Через точку поверхности с координатами (то, Уо, го) проходит бесконечно много наклонных тлоскостей. Все они задаются уравнениями вида z- z0 = А(ж - ж0) + В(у - Уо), (5.10) где А и В — постоянные. Назовем касательной плоскостью к поверхности z = f(x,y) в точке (то, уо, го) ту из плоскостей (5.10), которая обладает сле- дующим свойством: г — г/с = а(Дт, Ду)Дт + Р(Дт, Ду)Ду, (5.11;. где г — координата точки на поверхности; г^ — аналогичная ко- ордината точки на плоскости; ос(Дт, Ду) и |3( Дт, Ду) — бесконеч- но малые при Дт —> 0 и Ду —» 0. (Это означает, что среди всех плоскостей (5.10) касательная плоскость «теснее всего» прилегает к поверхности в окрестности точки касания.) Теорема 5.6. Для того чтобы поверхность г — f(x,y) обла- дала в точке (то,уо,го) касательной плоскостью, необходимо и достаточно, чтобы функция /(т, у) была дифференцируемой в точке (то, уо)- Касательная плоскость единственна, ее уравнение имеет вид z - Z0 = 4(жо,уо)(ж - Жо) + 2^(жо,уо)(у - Уо). (5.12) Доказательство. Действительно, пусть z = f(x,y) диффе- ренцируема в точке (то, уо).- Тогда справедливо равенство z - ZQ = ^Х(х0,у0)(х - Жо) + 4(жо,уо)(у - Уо)+ +а(Дт, Ду) Дт + Р(Д.т, Ду ] Ду. 181
Рассмотрим плоскость с уравнением (5.12). Очевидно, что для этой плоскости выполнено соотношение (5.11), т. е. она является касательной плоскостью. Пусть теперь существует плоскость, задаваемая уравнени- ем (5.10), для которой справедливо соотношение (5.11), т. е. ка- сательная плоскость, проходящая через точку (жо, уо, zo). Тогда, как и в одномерном случае, для приращения функции будет вы- полняться соотношение Аг = АДж + В Ду + а(Дж, Ду) Дж + р(Дж, Ду) Ду. Но это есть не что иное, как определение дифференцируемости. Значит, f(x^y) дифференцируема в точке (жо,?/о)? а коэффици- енты А и В совпадают с соответствующими частными произ- водными. Следовательно, касательная плоскость имеет уравне- ние (5.12). Замечание. Из соотношения (5.12), подобно одномерному случаю, вытекает, что дифференциал совпадает с приращением координаты z касательной плоскости. В случае п переменных формула (5.9) для дифференциала прини- мает вид du = uX1dxi 4--И uXndxn. (5.13) Здесь тоже можно было бы дать геометрическую интерпретацию диф- ференциалу, но при этом пришлось бы говорить о касательной гипер- плоскости к n-мерной поверхности в (п + 1)-мерном пространстве, что выходит за рамки данного курса. Посмотрим теперь, какую форму принимает правило диффе- ренцирования сложной функции в случае двух переменных. Теорема 5.7. Пусть функция z — f(x,y) дифференцируема в точке (жо, Уо), а функции ж — cp(t) и у — ф(£) дифференцируемы в точке to, причем жо — <р(£о.)? З/о = ф(^о)- Тогда сложная функция г(£) — /(cp(t), ф(£)) дифференцируема в точке to и z'(*o) = 4(®0, yo)<p'(to) + 4(жо, уо)ф'(*о)- (5.14) Замечание. Равенство (5.14) можно записать в другом, более на- глядном и удобном ^цгя приложений виде, а именно zt = zxxt + z'y уt. (5.15) Доказательство. Для доказательства воспользуемся диффе- ренцируемостью функции z — f(x,y) в точке (жд,?/о) и запишем приращение Дг в виде 182
Lz = 4(жо,Уо)Ая + ^(хо,уо)Ду+ + а(Дж, Дт/) Дж Н- р(Дж, Дт/) Дт/, (5.16) где Дж и Дт/ — произвольные приращения аргументов, а lim а(Дж,Дт/) = lim р(Дж,Ду)=0. Дж—>0 Дж—>0 Ду—>0 Ду—*0 Договоримся для удобства считать, что а(0,0) — р(0,0) = 0, что”не противоречит фавёнству^5. Гб). Пусть теперь^ги у будут функциями от t, дифференцируемыми в точке to- Дадим аргу- менту t приращение Д£ = t — to- Тогда ж и у получат соответ- ствующие приращения Дж = <p(t0 + At) - <p(t0) и Дт/ = c|>(to + At) - cp(to). Равенство (5.16) при этом .сохранится. Поделим обе части (5.16) на Дt: Дт/ = ^(^о,Уо Дт/ и перейдем к пределу при At —> 0. Заметим, что в силу дифференцируемости функции ж — cp(t) и cp(t) будут непрерывными в точке to, а тогда lim Дж — lim Дт/ — 0, д^о д/^о откуда следует, что и lim а(Дж, Дт/) = lim Р(Дж, Дт/) — 0. В свою очередь lini = ср'(£0) и lim Д = <p'(io) • Таким образом, в пределе равенство (5.17) перейдет в (5.14). Отметим частный случай теоремы 5.7. Пусть в качестве па- раметра t выступает прежняя переменная ж. Тогда сложная функция примет вид Дж) = /(ж, Дж)). Соответственно форму- ла (5.15) запишется как dz dy ду dx 183
В этом случае говорят, что вычислена полная производная z по д т. е. производная, учитывающая как непосредственную за- висимость z от д так и зависимость z от х через посредство у. Приведем теперь без доказательства вторую теорему о про- изводных сложной функции. Теорема 5.8. Пусть функция z — f(x,.y- дифференцируема в точке (од,уо), а функции х — (р(п,и) и у ~ ф(щ v) дифферен- цируемы в точке (од, од), причем од *= <р(од,од), Уо = ф(од,од)- огда сложная функция г(одг) — /(ср(щ ъ’),фш, г>)) дифферен- цируема в точке (од, од) и (5.18) где производные вычисляются в соответствующих точках. Ранее была выведена формула (5.9 для дифференциала dz. Пусть теперь х и у будут функциями от и и v и пусть выполнены все условия теоремы 5.8. Покажем, что при этом формула (5.9) сохранится, хотя dx и dy будут уже не приращениями, а диффе- ренциалами функций х = cp(u, v) и у = ф(гди) в точке (од, од). Действительно, применив формулу для дифференциала относи- тельно независимых переменных и и v и (5.18), получим dz = z'du + z'dv = (z' хИ + zL. y')du 4- (z' xL + z' tfAdv — IT U \ (X (J LX / \ X V у V — z r(xfudu + xfbdv) 4- z (y1 du 4 yfvdv) = zfxdx 4- Zydy. Таким образом, дифференциал обладает свойством инвари- антности. Это общий факт, справедливый для функций любо- го числа переменных и для произвольного числа новых перемен- ных. Если интерпретировать функцию двух переменных как функцию то^ки на плоскости, то частные производные приоб- ретают очевидный смысл — это скорости изменения функции в направлении координатных осей. Естественно поставить вопрос о скорости изменения функции в произвольном направлении. Для этого выберем точку 7Ио(од, уо) и зададим направление с помощью единичного направляющего вектора Сместимся теперь из точки М$ вдрлъ прямой с направляющим вектором е в точку М. Обозначим через М^М расстояние меж- ду этими точками, взятое со знаком, т. е. MqM равно расстоянию 184
между точками Mq и 7И, если сместиться в направлении векто- ра е, и минус этому расстоянию, если сместиться в противопо- ложную сторону. Определение 5.8. Производной функции z = f(M) по на- правлению е в точке Mq называется выражение 4(Мо)= ,,ш м-^Мо MqM (5.19) * (Другое обозначение: (Мо\) Теорема 5.9. Пусть функция z — f(x,y) дифференцируема в точке 7Ир(ггр, ур). Тогда у нее существует в этой точке производ- ная по любому направлению е, которая вычисляется по формуле 4(М)) = z'x(M0)ex + Zy(Mo)ey. (5.20) Доказательство. В самом деле, зададим прямую, проходя- щую через точку Мр в направлении вектора е, в параметриче- ской форме: MqM — te, или У = Ув + tey. (5.21) Из формул (5.21) немедленно следует, что параметр t как раз и совпадает с введенным ранее расстоянием со знаком MqM. По- этому формулу (5.19) можно переписать в виде 2, _ ev J t-o t (5.22) Но выражение (5.22) есть не что иное, как определение произ- водной в точке 0 сложной функции от t: z(t) = /(a?(t),y(t)), где x(t) и y(t) задаются формулами (5.21). Поскольку по условию функция z = f(x,y) дифференцируе- ма в точке (жр,ур)? а функции x(t) и y(t) дифференцируемы на всей числовой оси как линейные функции от t, причем т(0) = xq , у(0) = Уо; ж'(0) = ех , 1/(0) = еу , то в силу теоремы 5.7 получим формулу (5.20). 185
На плоскости формулу (5.20) можно переписать в иной фор- ме, если вспомнить, что ех — cos а, еу — cos(3 = sin а, где аир — углы, которые вектор е образует с координатными осями Ох и Оу соответственно. А именно, z'e(Mo) = z^(Mo)cosa + X/(Afo)cosp = 2^. (Mo) cos а+ 2Д Mo) sin a. Для функции п переменных и — /(яд, ... ,хп) производную по направлению лучше всего сразу определить по формуле, ана- логичной (5.22): 4(М0) = lim + *еЬ • • • ,4 +^е») ~ Л4 • • •, 4) (5 23) Разумеется, теорема 5.9 будет справедлива и в этом случае, а формула (5.20) примет вид ( «е(мо) = и'Х1ег + и'Х2е2 4-4- и'Хпеп, (5.24) где е = {еь ...,еп}, |е| - 1. Введем в случае двух переменных вектор V2(M0) = U(M0), 4(М0)}, (5.25) который назовем градиентом функции z — f(x,y). Тогда фор- мулу (5.20) можно переписать в виде ^е(М)) — Vz(Mo)e = |Vz(Mo)|je| coscp. (5.26) Поскольку |е| — 1, ясно, что максимальное по модулю (и притом неотрицательное) значение производная zf (Mq) принимает при ср — 0 и совпадает в этом случае с |V2(M0)|. Таким образом, градиент направлен в сторону наибыстрей- шего роста функции в данной точке., а его модуль совпадает с максимальной скоростью роста. Это означает, что градиент обладает свойством инвариант- ности. Если, например, повернуть систему координат на плос- кости, то изменятся как координаты х и у, так и координаты градиента, но изменятся они таким образом, что сам градиент как вектор останется неизменным. Все это относится и к случаю функции п переменных. 186
Упомянем еще об одном свойстве градиента. Назовем линией уровня функции двух переменных z — линию с уравне- нием /(ж, у) = с, где с — некоторая постоянная. Оказывается, что, если f(x,y) дифференцируема и мы вычислим градиент Vz в любой точ- ке линии уровня, то он будет перпендикулярен этой линии (т. е. перпендикулярен касательной к этой линии в соответствующей точке). •Аналогично, для функции трех переменных и = f^x^y^z) ее поверхность уровня будет задаваться уравнением /(х, у, z) = с, а градиент Viz в любой точке этой поверхности будет перпенди- кулярен касательной плоскости. Это свойство градиента позво- ляет использовать его в геометрических задачах. Вернемся к случаю двух переменных. Пусть функция z — ~ f(x>y) имеет обе частные производные, z'r и zfy, в некоторой области. Тогда можно рассмотреть в свою очередь частные про- изводные от этих частных производных. Таким образом, придем к следующим четырем производным второго порядка от исход- ной функции: z З2 z З2 z (Для них также употребляются обозначения —тг' ? дхЛ дхду дудх 32z ду2 Производные z" и z1^. носят название смешанных производ- них. Можно доказать, что в случае непрерывности смешанных производных они совпадают друг с другом, так что различных производных второго порядка не четыре, а три. Аналогично можно определить частные производные любо- го порядка для функции любого числа переменных и при этом, в случае непрерывности смешанных производных, они будут за- висеть лишь от того, сколько раз проводилось дифференцирова- ние по каждой из переменных, но не от порядка, в котором такое дифференцирование проводилось. Например, х2у ^хух Лух2 187
Ранее была получена формула для дифференциала dz функ- ции двух переменных. Мы видим, что dz зависит как от точки (через посредство своих коэффициентов, совпадающих с част- ными производными), так и от дифференциалов переменных dx, dy. Стоит отметить и еще одно обстоятельство. Если записать дифференциал функции двух переменных в виде dz ~ Р(х, y)dx + Q(t, y)dy. то в случае, когда Р(х, у) и Q(x, у) имеют непрерывные частные производные, справедливо соотношение dQ _ дР_ дх ду ’ поскольку и та, и другая величина совпадают со смешанной про- d2z изводной . дхду Определение 5.9. Вторым дифференциалом d2u функции нескольких переменных называется дифференциал от ее перво- го дифференциала du при условии, что дифференциалы незави- симых переменных считаются постоянными. Для функции двух независимых переменных х, ус уче- том равенства смешанных производных выражение для второго дифференциала примет вид d2z = г"2(сЬ)2 + 2z"ydxdy -н z”2(dy)2. (5-27) Выражение (5.27) представляет собой так называемую квад- ратичную форму относительно «вектора дифференциалов» {dx, dy}. Сразу же отметим, что в отличие от первого дифференциала второй дифференциал не обладает свойством инвариантности: если х^ у перестанут быть независимыми переменными, а сдела- ются дифференцируемыми функциями от других переменных, то формула (5.27) не будет справедлива. Поэтому второй диф- ференциал можно считать лишь удобным сокращением для за- писи определенной комбинации производных и дифференциалов аргументов. Договоримся еще о еледующей терминологии. Если для лю- бого вектора {dx,dy} {0,0} второй дифференциал d2z будет 188
строго больше нуля (меньше нуля), то будем говорить, что он по- ложительно определен (отрицательно определен). Разумеется, такое условие будет выполнено не всегда, а лишь при определен- ном соотношении между коэффициентами d2z. Перейдем теперь к вопросу о локальных экстремумах функ- ции двух переменных z ~ f(x,y). Определение 5.10. Функция z = имеет в точке Mq локальный максимум (минимум), если Вй(Мо) : VM G й(Мо) => /(М) < /(Мо) (/(М) > /(Мо)). В данном определении речь идет о строгом максимуме (ми- нимуме). Если здесь заменить знак неравенства на нестрогий, то получим нестрогий максимум (минимум). Локальный максимум и локальный минимум носят собирательное название локального экстремума. Теорема 5.10 (необходимое условие локального экс- тремума). Пусть функция z = f(x,y) имеет в точке 7Ио(^о,Уо) локальный экстремум (быть может, нестрогий), и пусть она диф- ференцируема в этой точке. Тогда 4(жо,Уо) = 4(жо,уо) - 0. Замечание. Эта теорема совершенно аналогична теореме Ферма для функции одной переменной. Доказательство. Пусть для определенности функция имеет в точке Mq локальный максимум. Тогда Зй(М0): VM е U(M0) /(М) < /(Мо). Рассмотрим функцию одной переменной <р(т) = /(т, ?/о)- Обозна- чим через U(xo) проекцию окрестности U(Mq) на ось Ох. Тогда \/х G U(to) выполняется неравенство <р(т) ср(то)- Следова- тельно, у ср(т) в точке то имеется локальный максимум. Кроме того, в силу дифференцируемости z ~ /(т,у) в точке (то,уо^ су- ществует г^(то,Уо) = </(яо)э а значит, <р(т) дифференцируема в точке xq. Тогда по теореме Ферма </(то) - 0, т. е. ^(то, Уо) ~ 0. Аналогично, вводя функцию ф(у) — f(xo<>y\ получим, что 4(жо,уо) = о. , Отметим, что, как и в случае одной переменной, данное необ- ходимое условие не является достаточным: обращение в нуль 189
первых производных в некоторой точке еще не гарантирует на- личия в этой точке локального экстремума. Если функция z = /\х, у) непрерывна в некоторой области D и имеет в этой области непрерывные первые и вторые частные производные, то будем говорить, что она принадлежит классу «це-два» в области D | / (ж, у) € C2(D)). Сформулируем теперь достаточное условие локального экс- тремума для функции двух переменных. Теорема 5.11. Пусть функция z — f(x,yi определена в окрестности U(Mo) и принадлежит классу С Е.ТИо)). Пусть, кроме того, выполняются следующие условия: 11 все первые частные производные равны нулю в точке Mq; 2) второй дифференциал данной функции знакоопределен в точке Мо. Тогда функция f\x,y) имеет в точке Mq локальный экстремум, причем, если d2z > 0, то это локальный минимум, а если d2z < О, то это локальный максимум. Если же d2z знэконеопределен, то в точке Mq экстремума нет. / Доказательство этой теоремы весьма непросто и требует предварительного доказательства ряда вспомогательных тео- рем, поэтому здесь мы его не приводим. Теорема 5.11 с очевидными изменениями ь формулировке справедлива и для функций п переменных. Отметим еще, что, если d2z 0 (jf z 0), то этот признак не дает ответа на вопрос о локальном экстремуме. В случае двух переменных с учетом так называемого крите- рия ( ильвестра знакоопределенности квадратичных форм, ко- торый доказывается в развернутых курсах высшей алгебры (но не в данной книге), теорему 5.11 можно переформулировать в более наглядном виде. Пусть f Е C2(J7(Mo)) и выполняются условия: 1) 4(жо,Уо) = 4(жо,Уо) = 0; •г"2(жо3Уо) z'yX^o,yo) ZXy (®0> Уо) ^2(жо,?/о) Ф 0. 1 огда при А > 0 функция имеет в точке Mq локальный экс- тремум, причем максимум» при г^х^уи) < 0 и минимум при z^Uo^yo') > 0. Если же Д < 0, то у f(x,y) в точке Mq локального экстре- мума нет. При Л = 0 признак ответа не дает. 190
Пример 5Л. Исследовать на экстремум функцию z — Зт2 — х3 + З?/2 + 4?/. Найдем частные производные данной функции. 4 = 6ж - Зж2 , z'y = бу + 4, z"2 = 6 - 6ж, z"y = zyx = °, 42 = 6- Приравняв нулю zfx и zryy находим «подозрительные» точки Mi . Составим определитель Д в каждой из точек: О 6 = 36 > 0; 6 > 0, функция имеет локальный мини- значит, в точке М\ мум; -6 0 = -36 < 0, следовательно, в точке М2 у функции нет экстремума. 5.2. Приложение* В данном приложении прежде всего мы докажем достаточное условие дифференцируемости для функции двух переменных. Итак, пусть функция z = /(ж, у) определена в окрестности U(Mo) точки Мо, имеет в этой окрестности обе частные произ- водные zx и Zy, которые как функции двух переменных непре- рывны в точке Мо- Докажем, что в этом случае функция диф- ференцируема в данной точке. Для этого запишем приращение Дг в специальном виде, а именно, Az = г(ж0 + Дж, уо + Ау) - г(ж0, уо) = 4жо, Уо + Ду) - 4жо, Уо (5.28) 191
Выражение в первой скобке в правой части выражения можно рассматривать как приращение функции одной переменной х, которая задается формулой г(т,уо + Ау). Аналогично, выраже- ние во второй скобке рассматриваем как приращение функции от у, равной 2(.то,у). Для этих функций выполняются все усло- вия теоремы Лагранжа соответственно на отрезках [.то, 2'о + Ат] и [Уо^Уо + Ау Поэтому найдутся два числа щ С + Ах) и С2 € (у0, Ус + Ау), такие, что выражения в скобках будут рав- ны соответственно z^(ci,yo + Ау) и ^(xo,Qg). Если устремить приращения аргументов Дт и Ду к нулю, то, очевидно, щ бу- дет стремиться к то, а С2 к Уо- В силу непрерывности частных производных в точке Mq(tq, уо) будут справедливы равенства 4(с1, Уо + Ду) = 40'0, Уо) + а(Дж, Ду); ^у(хо, с2) = z'y{xQ, уо) + р(Д®, Ду), (5.29) где lim а(Дт, Ду) = lim Д Дт, Ду) — 0. ьх—>0 Да?—>0 Но тогда в силу (5.28) и (5.29) приращение Дгх примет вид Дг = 4(жо, Уо)Д^ + 4(хо, Уо) Ду + а(Дж. Ду) Д^ + ₽( Дх, Ду)Ду. А это и есть определение дифференцируемости. Теперь коснемся вопроса о так называемой неявной функции. Вначале рассмотрим уравнение т2 + у2 — 1 = 0. (5.30) Как известно, это уравнение задает на плоскости окружность радиуса 1 с центром в начале координат. Алгебраически оно рав- носильно совокупности двух уравнений (5-31) Под неявной функцией, задаваемой уравнением (5.30), будем по- нимать любую функцию у — /(т), при подстановке которой в данное уравнение получается тождество. Ответим теперь на следующий вопрос: «Сколько на отрез- ке [—1,1] существует неявных функций, задаваемых уравнени- ем (5.30)?» Таких функций бесконечно много, поскольку в каж- дой точке можно задать такую функцию по любой из фор- мул (5.31). 192
Изменим формулировку вопроса: «Сколько на отрезке [—1,1] существует непрерывных неявных функций, задаваемых урав- нением (5.30)?» Ясно, что таких функций только две, а именно те, которые задаются уравнениями (5.31). Чтобы выделить од- ну из них, нужно взять какую-либо точку £ [—1? 1] и указать, какое значение неявная функция принимает в этой точке. Так, 1 , если потребовать, чтобы при х§ — - функция принимала, значе- ние уо — , то найдется ровно одна такая функция, а именно, у = л/1 — я2- Если же потребовать, чтобы при х$ — - значение ?/о равнялось — , то найдется также одна неявная функция Замечание. Здесь имеются исключения. Действительно, если в качестве xq взять одну из концевых точек отрезка [—1,1], например Хо = 1, то соответствующее значение уо = 0 принимают обе из вы- шеупомянутых неявных функций, так что данное условие не позволя- ет выделить однозначно одну из них. Следует обратить внимание, что именно в этой точке (1,0) частная производная по у левой части урав- нения (5.301, равная 2у, обращается в нуль. Уравнение (5.30) явилось лишь простейшей моделью общей ситуации. Пусть задано уравнение Шу)-о, (5.32) Где F(x, у) — некоторая функция двух переменных. При каких условиях оно задает неявную функцию? Как из множества всех неявных функций выделить одну конкретную? Здесь уже нельзя надеяться на то, что удастся выразить явно у через х и ответить на эти вопросы. Значит, нужно найти ответы на поставленные вопросы косвенным путем. Сформулируем без доказательства одну из теорем, дающую ответ на эти вопросы. Теорема 5.12 (о неявной функции). Пусть задано уравне- ние (5.32), где функция F(z, у) удовлетворяет следующим усло- виям: 1) F(z, у) непрерывна в прямоугольнике •То - х Zq + Si Уо — §2 С у С Уо + §2 193
2) в D существуют непрерывные частные производные F'x, F'-, 3)F(®o,yo) = O; 4) Fy(xQ,yQ') ± 0. Тогда существует 8 > 0, такое, что на отрезке [жо — 8, хд + + 8] уравнение (5.32) определяет однозначную неявную функ- цию у — f(x), которая в точке хо принимает значение у^ имеет непрерывную производную на [ж0 — 8, .?'о + 8] и эта производная задается формулой /'(*) = - F'(s,/(t)) ’ Замечание. В этой теореме по свойствам заданной функции двух переменных F(x, у) нам удается сделать вывод о свойствах неявной функции, которую нельзя выразить в виде явной формулы.
Глава 6 ИНТЕГРАЛЬНОЕ ИСЧИСЛЕНИЕ 6.1. Неопределенный интеграл Определение 6.1. Первообразной для функции /(ж) на про- межутке (а, Ь) называется функция F(rr), такая, что на всем (а, Ь) выполняется соотношение F'(x) = /О)- Сразу возникает вопрос о существовании и единственности такой первообразной. Что касается существования, то, как будет показано далее, оно гарантировано во всяком случае для непрерывных функций. Единственности же очевидно нет, поскольку, если F(x) — перво- образная для /(ж), то F(x) + С при любой постоянной С — тоже первообразная, ибо (F(«) + С)' = F'(z) + 0 = f(x). Пусть теперь F\(x) — еще одна первообразная для /(ж) на нромежутке (а, Ь). Тогда существует такая постоянная С, что на (а, Ь) выполняется равенство F] (х) = F(x) + С. (6.1) Действительно, рассмотрим функцию д(х) = Fi(x) - F(s). Очевидно, у (ж) = F[(x) - F’(x) = /(ж) - /(ж) = 0. Тогда по следствию из теоремы Лагранжа д(х) — С на откуда и следует (6.1). Таким образом, на. промежутке (а, Ъ} все первообразные для f(x) отличаются друг от друга постоянным слагаемым. Подчеркнем, что этот результат справедлив именно на про- межутке, а не на каком-либо ином множестве. 195
Определение 6.2. Произвольная первообразная для /(т) называется неопределенным интегралом и обозначается f(x)dx. Таким образом, если F(x) — одна из первообразных для /(ж) на (а, Ъ , то f{x) dx ~ F(x) 4- С. Заметим, что, если F(x) — первообразная для /(ж), то dF х) = — f(x)dx. Поэтому под знаком интеграла стоит не что иное, как дифференциал любой первообразной для /(ж). Легко доказываются следующие две формулы: A f(x) dx = А /(ж) dx; (6-2) f(/(x) ± g{x))dx = J/(x)d 'x zb g{x)dx. (6.3) Здесь A — произвольная постоянная, а /(ж) и g(x) — интегруе- мые'функции (т. e. функции, имеющие первообразные). Действительно, пусть, например, F(x) — первообразная для У (a?), a G(x) — первообразная для д(х). Тогда (jF(z) zb G^x))7 = F'(x) zb Gf(x) = f(x) ± g(x) что равносильно формуле (6.3). Аналогично устанавливается и (6.2). Заметим еще, что, поскольку неопределенным интегралом на- звана произвольная первообразная, то равенства (6.2) и (6.3) сле- дует понимать так, что они имеют место для любых первообраз- ных с точностью до постоянного слагаемого. Основой для практ ического вычисления интегралов служит некоторый стандартный набор так называемых табличных ин- тегралов. На основе таблицы производных можно, обращая ее, выписать ряд таких интегралов. Таблица неопределенных интегралов xr dx — ^.р+1 + с (р^-1); — = 1пЫ + С; 196
(a > 0, a/- 1); cos x dx — sin a; 4- C; sin xdx = — cos x + C; Эти формулы справедливы на любом промежутке, на ко- тором существуют левая и правая части соответствующих ра- венств. Последние две формулы отмечены номерами со штри- хом, так как далее будут заменены на более общие формулы. Пример 6.1. Однако формул (6.2) и (6.3) недостаточно для вычисления сколько-нибудь сложного интеграла. Поэтому установим еще не- которые важные свойства интеграла. Теорема 6.1. Пусть f(u) непрерывна на промежутке {а, &), <р(т) непрерывна и имеет непрерывную производную на (а,[3), причем V х € (а,р) => ср(т) € {а, Ь}. Тогда, если f f(u) du = F(u) + С, (М то f(y(x))q'(x)dx — F (<pi ж)) + С. 197
Доказательство. Действительно, оба интеграла в (6.4) суще- ствуют, поскольку подынтегральные функции непрерывны. Да- лее по правилу дифференцирования сложной функции имеем ^F(cp(x)) = ГД<р(ж))<р'(ж) = /(ср(ж))<р'(а;), что и доказывает теорему. Замечание. Теорема 6.1 носит название метода подстановки, или метода замены переменной в неопределенном интеграле. Последнюю формулу в (6.4) можно записать в более наглядной форме: /(и(ж)) du(x) — F{u{xj) -F С. С помощью метода подстановки, имея один табличный интеграл, можно вычислить много других интегралов. Пример 6.2. рЗ о « 1 тг.3 _ о 1 е х dx — — е dx" — ~е 3 J 3 Отметим, что под знаком интеграла стоит дифференциал первообразной, к которому можно применить правила действия с дифференциалом. Вычислим теперь несколько новых табличных интегралов. Рассмотрим dx .9 9, где а > 0. J v ar — xz Имеем: д/1 — и2 х ~ аи dx — adu х — arcsm и 4 С = arcsm —FC. а Таким образом, дополняем таблицу интегралов формулой о С dx . х 8. —- = arcsm —FC J v а2 — х2 а Аналогично вычисляется интеграл _ f dx 1 х 9. ----о = ” arctg - + С I ст + я/ а а (а > 0). (н > 0). 198
Далее, dx а2 — х2 dx (а + х)(а — х) dx = 2а — In 2а Итак, получен еще один табличный интеграл 10. dx а2 — х2 а + х а — х + С (а > 0). Этот интеграл математики называют «высоким логарифмом». Вычислим теперь dx ЛУН ===== , где А ф 0. dx dx du du и Занесем этот интеграл в таблицу. 11. — In| 4- х2 + Л| 4- С (А 0). Данный интеграл математики называют «длинным логариф- мом». Добавим в таблицу последние два интеграла, которые пред- варительно вычислим 199
dx _ ----= In smx 1Q f dx 13. —— — In J cos ж Существует еще один специальный метод интегрирования, который называется интегрированием по частям. Теорема 6.2. Пусть функции и(х) и v(x) Е С1((а,Ь)) ( т.е. сами непрерывны и имеют непрерывную проиводную на (а,Ь)). Тогда v(x)u'(x) dx — u(x)v(т) — u(z)t/(z) dx. (6.5) Доказательство. Действительно, (^u(x)v(x)^ = uf(x)v(x) + и(х)и\х). (6-6) Все функции, участвующие в (6.6), непрерывны, следовательно, имеют первообразную. Отсюда v(x)u'(x) dx + u(x)v (x)dx. (6*7) Заметим, что одной из первообразных для \u(x)v(x является u(x)v(x). Тогда из (6.7) и вытекает (6.5). очевидно Формулу (6.5) можно записать в более наглядной форме: v{x^ du(x) = u[x)v(x) — и(т)с?г;(т). (6.8) Данный метод имеет значительно более узкую область примене- ния, чем метод замены переменной, зато в этой узкой области он незаменим. Пример 6.3. х cos х dx — x d sin x = x sin x — — х sin х — 2 COST = cos x dx) — Здесь дважды применена формула (6.8). 200
6.2. Определенный интеграл Наряду с неопределенным интегралом (см. подразд. 6.1) су- ществует и другой тип интеграла, называемый определенным интегралом, который, на первый взгляд, ничего общего не имеет С неопределенным интегралом и лишь в дальнейшем выясняется wk глубокая внутренняя взаимосвязь. Пусть на отрезке [а, Ь] задана функция /(х). Разобъем этот урезок на более мелкие части конечным числом точек Xi так, Что а — Xq < Xi < ... < хт ~ Ь. Множество точек {а^} назовем разбиением отрезка и обозна- чим кратко буквой Т. Введем далее величины /^Xi — хг — x^i и Х(Т) — max Дя?, г где Атг — длина отрезка [х^±,х^, а Х(Т) назовем диаметром (разбиения Т, На каждом отрезке [тг-1, #г] выберем произвольную точку а разбиение с выбранными точками <^г назовем отмеченным раз- биением и будем обозначать через Г. Ясно, что диаметр отме- ченного разбиения Х(Т) не зависит от выбора точек посколь- ку полностью определяется множеством {я:*}. Сопоставим каждому отмеченному разбиению Т сумму i которую назовем интегральной суммой для функции f(x). Определение 6.3. Последовательность отмеченных разбие- ний Тп называется нормальной, если lim Х(ТП) = 0. п—*оо Определение 6.4. Если для любой нормальной последова- тельности отмеченных разбиений {Тп} соответствующая после- довательность интегральных сумм {о^ } сходится к одному и то- му же пределу J, то этот предел называется определенным ин- тегралом от функции,У (я) по отрезку [а, Ь]: lim on = J, где оп = о(Тп). п—>оо 201
Разумеется, интеграл существует не у всякой функции. Функ- ции, для которых существует определенный интеграл на отрезке [а, 6], будем называть интегрируемыми на этом отрезке. Для определенного интеграла будем использовать следующее обозначение: /(ж) dx, (6-9) J а аналогичное обозначению неопределенного интеграла, однако в данном случае величина (6.9) — число, а не функция. Поэтому в (6.9) вместо х можно использовать любую другую букву, отче- го значение интеграла не изменится: ь f(x) dx ~ f(u) du — /(t) dt и т. д. j а Почему же для совершенно другого объекта выбрано обозна- чение, столь похожее на использованное для неопределенного интеграла? Это станет ясно в дальнейшем, когда мы научимся вычислять определенный интеграл с помощью неопределенного. (Отметим, что определенный интеграл ноЬит еще название интеграла Римана, по имени немецкого математика, который предложил данную конструкцию.) Рассмотрим геометрический смысл определенного интегра- ла. Предположим, что функция /(т) непрерывна и положитель- на на [а, 6]. Рассмотрим фигуру, ограниченную осью Ох, графи- ком у — f(x) и двумя вертикальными прямыми х = а и х — Ь. Назовем такую фигуру криволинейной трапецией (рис. 6.1). Если взять какое-то отмеченное разбиение отрезка [а. 6], то соответствующая интегральная сумма выражает площадь сту- пенчатой фигуры, состоящей из прямоугольников с основания- ми [.Тг-1,Жг] и высотами /(£*) (рис. 6.2). При стремлении диа- метра разбиения к нулю происходит бесконечное измельчение разбиения и площадь ступенчатой фигуры будет приближаться к площади криволинейной трапеции. Поэтому f(x} dx должен j о совпадать с площадью такой трапеции. Если f(x) отрицательно, то площади всех прямоугольников будут браться с отрицательным знаком, и интеграл совпадет с площадью трапеции, взятой со знаком «минус». 202
Рис. 6.1 Данное рассуждение весьма приблизительно и позже будет рассмотрено подробнее. Установим теперь некоторые простейшие свойства опреде- ленного интеграла. Возьмем функцию /(т), постоянную на отрезке [а, 6]: /(аг) = С. Тогда любая ее интегральная сумма, очевидно, имеет вид o(f) = Ж)Д^ = 52 C^Xi = С 52 = С(Ъ - а), г i г Следовательно, lim оп = С(Ь — а), т. е. п—>оо В частности, Cdx = C(b-a). (6.10) ъ 0 dx = 0. а Теорема 6.3. Если /(.т) и д(х) интегрируемы на la, Ь], то справедливы следующие равенства: ь | Af(x)dx а b * — A f(x)dx при VA; а (6.11) причем существование интегралов, стоящих слева в (6.11), га- рантируется. 203
Доказательство. Докажем, например, второе из равенств (6*11). Выберем произвольное отмеченное разбиение Т и соста- вим соответствующую интегральную сумму о = У^(/(^)±д(Сг))Дж» = = °' + а"’ г г г где о' и о"~ интегральные суммы соответственно для f(x) и д(х). Если взять произвольную нормальную последовательность отмеченных разбиений {Гп}, то для последовательностей инте- гральных сумм будет справедливо равенство (6.12) Поскольку lim о" — п—>оо Ъ д(х) dx, «и а по свойству пределов последовательностей lim ап = П~>ОС Ъ * /(х) dx ± а b g(x)dx, а что равносильно второму равенству (6.11). Теорема 6.4. Пусть функция /(ж) отлична от нуля на [а,Ь] лишь в конечном числе точек. Тогда она интегрируема на [а, Ь] и интеграл от нее равен нулю. Доказательство. Действительно, пусть J\x) 'О лишь в к точках на [а, Ь]. Тогда она, очевидно, ограничена на [a, fe]: ЭС>0: Vx Е [а,Ь] => |/(^)| С. (В качестве С можно взять максимальный модуль значений /(х) в тех точках, где /(ж) 0.) Возьмем теперь произвольное отмеченное разбиение Т и оце- ним соответствующую интегральную сумму о: 0 2кС\(Т\ (6.13) г 204
5 правой части (6.13) стоит множитель 2, потому что каждая точка 5г может участвовать дважды в интегральной сумме, если она является общей концевой точкой двух соседних малых от- резков. Возьмем теперь произвольную нормальную последователь- ность отмеченных разбиений {Гп}. Тогда из (6.13) для соответ- ствующих оп получается оценка О |on| 2fcCX(fn). (6.14) Поскольку lim Х(ГП) — 0, из (6.14) по теореме о «зажатой пере- п—>оо менной» получим, что lim = 0. Таким образом, п—>оо b f(x)dx — 0. а Как следствие из теоремы 6.4 выведем следующую теорему. Теорема 6.5. Пусть /(т) интегрируема на [а, Ь], а д(х) опре- делена на «а, Ь] и отлична от /(т) лишь в конечном числе то- чек. Тогда д(х) тоже интегрируема на [а, 6] и ь g(x)dx ~ о b f(x)dx. а (6.15) Доказательство. Действительно, представим д(х) следу- ющим образом: (6.16) Разность, стоящая в скобках в (6.16), отлична от нуля лишь в конечном числе точек, откуда в силу теоремы 6.4 следует, что она интегрируема и интеграл от нее равен нулю. А тогда в силу теоремы 6.3 получим (6.15). Таким образом, определенный интеграл оказывается нечув- ствительным к изменению функции в конечном числе точек. Теорема 6.6 (необходимый признак интегрируемости). Если функция /(ж) интегрируема на отрезке [а, 5], то она огра- ничена на нем, т. е. 30 0: М] |/(т)| ^С. 205
Доказательство. Предположим, что это не так, т. е. что /(ж) интегрируема на |а, 6], но при этом не ограничена на нем. Возьмем некоторую нормальную последовательность отме- ченных разбиений {Тп}, тогда для соответствующей последова- тельности интегральных сумм {оп} выполняется соотношение lim сп п— dx — J. (6-17) Выберем теперь новую нормальную последовательность {Т?'} следующим образом. Разбиение Тп порождает конечное число малых отрезков \х^ i, Xi\. Ясно, что, если f(x) не ограничена на [а, Ь], то она не ограничена хотя бы на одном из этих отрезков; пусть это будет x^-i, хь]. Оставим те же самые отрезки и фикси- руем те же самые £$, кроме Новое разбиение Т'а отличается от Тп только точкой которую подберем специальным образом. Запишем следующее соотношение: = /(^)Axfc + [/&) - /(5fe)] Axfc. (6.18) Поскольку величину /(£*.) можно сделать за счет выбора сколь угодно большой по модулю, то найдется такое что бу- дет выполняться соотношение [Ж) - /(^)|дх J > п. (6.19) Заметим, что второе слагаемое (впрочем, как и первое) в (6.18) при каждом п будет свое; обозначим его через оад. Но из нера- венства (6.19) следует, что lim ап — сю, т.е. {ап} -* бесконечно 71—1ЭО большая последовательность. С другой стороны, из (6.18) вы- текает, что для интегральных сумм оп и соответствующих разбиениям Тп и Т', справедливо соотношение п- (6.20) Поскольку {7^} — тоже нормальная последовательность отме- lim о'п — J. Но тогда из (Д20) следует, ченных разбиений, то что {ап} — бесконечно малая последовательность. Полученное противоречие показывает, что исходное предположение ложно и что, следовательно, справедлива данная теорема. 206
Перейдем теперь к весьма непростому вопросу о существо- вании определенного интеграла. В самом деле, как описать все интегрируемые функции? Ранее было отмечено, что неограни- ченные функции заведомо не интегрируемы. Однако, как пока- зывает следующий пример, ограниченность функции на отрезке еще не гарантирует ее интегрируемость. Рассмотрим на отрезке [0,1] так называемую функцию Ди- рихле D а;), которая принимает значение 1 во всех рациональ- ных точках (т. е. в точках вида х = —, где т, п — целые числа) п и равна нулю во всех иррациональных точках. Известно, что на любом сколь угодно малом отрезке существует бесконечно много как рациональных, так и иррациональных точек. Возьмем нор- мальную последовательность отмеченных разбиений, где в каче- стве выбраны рациональные точки. Соответствующие ап бу- дут равны 52 ж jДж» = 521 Джг= 1- (6-21) г i Теперь возьмем другую нормальную последовательность от- меченных разбиений, где в качестве выбраны иррациональные точки. В этом случае On = 52 Ж»)Джг = 52 0 ’ Дж« = °' (6.22) г i Последовательность (6.21) имеет предел, равный единице, а пре- дел последовательности (6.22) равен нулю. Отсюда следует, что нет единого предела lim оп. * п—>оо Значит, функция D(x) не интегрируема на [0,1]. Как легко заметить, D(x) разрывна во всех точках отрезка [0,1]. Ее неин- тегрируемость связана со слишком большой разрывностью. Где же проходит нужная грань? Необходимое и достаточное условие интегрируемости функ- ции установил французский математик А. Лебег. Однако для того чтобы сформулировать это условие, необходимо познако- миться с некоторыми новыми понятиями. Прежде всего рассмотрим числовую последовательность ai,a2, ... (6.23) Можно ли придать смысл сумме всех ее членов и как это сде- лать? Образцом служит хорошо известная из школьной про- граммы бесконечно убывающая геометрическая прогрессия. 207
Рассмотрим так называемую частичную сумму последова- тельности (6.23): Sn ~ 4“ * * * 4" ап. Назовем суммой всех членов данной последовательности предел Sn при п оо, т. е. ап = lim Sn. n—>оо В школе этот предел вычисляется для бесконечно убывающей геометрической прогрессии и называется суммой этой прогрес- сии. Разумеется, такой предел существует далеко не всегда. На- пример, для последовательности 1 1 X, -L, . . . , -L, • • • , (6.24) Sn — п, и, следовательно, у (6.24) нет суммы всех членов. Определение 6.5. Множество А называется счетным. если можно установить взаимно-однозначное соответствие между его элементами и множеством натуральных чисел. Это означает, что можно так сопоставить элементам А нату- ральные числа, что каждому элементу из А будет соответство- вать ровно одно натуральное число и каждому натуральному числу будет соответствовать ровно один элемент из А. Иначе, счетными будут те множества, элементы которых можно пере- нумеровать. Бесконечные множества, которые не являются счетными, на- зывают несчетными множествами. Очевидно, что само множество натуральных чисел является счетным. (Каждому элементу такого множества надо сопоста- вить этот же элемент.) Гораздо менее очевидно, что счетным является и множество т рациональных чисел, т. е. чисел вида —, где тип-— целые п числа и п 0. А вот множество чисел, образующих отрезок [а, Ь] — несчетное множество. Его элементы невозможно перену- меровать, поскольку оно содержит слишком много элементов, на которые «не хватает» натуральных чисел. Введем теперь еще одно важное и непростое понятие множе- ства меры нуль. Рассмотрим множество А и произвольную систему интерва- лов {J = (а, р)} (конечную или бесконечную). 208
Определение 6.6. Система интервалов {J} образует покры- тие множества А, если каждый элемент из А принадлежит хотя бы! одному интервалу из этой системы. '| Определение 6.7. Множество А называется множеством меры нуль, если для любого е > 0 существует не более чем счет- ная система интервалов { Jn}, покрывающая это множество, сум- ма длин которых меньше е. Слова «не более чем» означают, что система {Jn} либо конеч- на, либо счетна. Отметим также, что само множество меры нуль не обязатель- но будет счетным. Существуют и несчетные множества меры нуль. Попытка представить как выглядят все множества меры нуль, заведомо обречена на провал, поскольку математики об- наружили такие «хитроумные» множества этого типа, о суще- ствовании которых никто даже и не подозревал. Наша задача более скромна: нужно установить несколько простых свойств таких множеств, которые понадобятся в даль- нейшем. Теорема 6.7. Всякое подмножество множества меры нуль са- мо является множеством меры нуль. Это, очевидно, следует из определения 6.7 и того факта, что любое покрытие множества А интервалами является одновре- менно и покрытием любого подмножества из А. Теорема 6.8. Объединение двух множеств меры нуль явля- ется также множеством меры нуль. Доказательство. Действительно, пусть А и В - множества меры нуль. Возьмем произвольное е > 0 и поделим его пополам. Е 2 В силу определения 6.7 для О существует не более чем счет- ная система интервалов {Jn}, покрывающая А и такая, что п где | Jn\ — длина интервала Jn. Аналогично, для В существует система интервалов {Д }, по- крывающая В и такая, что п 209
Заметим теперь,что система интервалов не более чем счетна, покрывает объединение A J В, а сумма длин системы (6.25) удовлетворяет неравенству: Таким образом, для A U В выполнены все условия определе- ния 6.7, т. е. это множество есть множество меры нуль. Последовательно применяя теорему 6.8 несколько раз, полу- чим, что объединение конечного числа множеств меры нуль есть множество меры нуль. Очевидно, множество, состоящее из одной точки яд, являет- ся множеством меры нуль, поскольку его можно покрыть одним интервалом сколь угодно малой длины. В силу вышеизложенно- го любое конечное множество точек {яд, я?2, • • * >хп} есть множе- ство меры нуль. Заметим без доказательства, что теорема 6.8 обобщается на случай счетного объединения множеств А}. Отсюда следует, например, что множество всех рациональ- ных чисел есть множество меры нуль. Отметим также, что в математике принято соглашение, по которому пустое множество, т. е. множество, не содержащее ни одного элемента, считается множеством меры нуль. Если А множество меры нуль, то будем записывать это так: 11(A) = 0. Наконец, можно сформулировать критерий интегрируемости функций. Теорема 6.9 (критерий Лебега). Для того чтобы функция /(я?) была интегрируема на отрезке [а, Ь], необходимо и достаточ- но, чтобы она была ограничена на этом отрезке и множество ее точек разрыва на [а, b имело меру нуль. Доказательство этой теоремы чрезвычайно сложно и здесь мы его не приводим, по теорему 6.9 можно успешно использовать для установления нужных нам результатов. Теорема 6.10. Если функция непрерывна на отрезке, то она интегрируема на нем. Доказательство. Действительно, из непрерывности функ- ции на отрезке вытекает ее ограниченность на нем, а множество 210
ее точек разрыва пусто, т. е. имеет меру нуль. Отсюда по крите- рию Лебега и следует ее интегрируемость. 1 Теорема 6.11. Если функция ограничена на отрезке и имеет на нем конечное число точек разрыва, то она интегрируема на этом отрезке. Доказательство данной теоремы станет очевидным, если вспомнить, что всякое конечное множество имеет меру нуль. Теорема 6.12. Если f(x) и д(х) интегрируемы на отрезке [а, Ь], то их произведение f(x)g(x) интегрируемо на нем. Доказательство. В самом деле, по критерию Лебега из ин- тегрируемости /(ж) и д(х) вытекает их ограниченность на [а, Ь] и то, что множество точек разрыва каждой из них имеет меру нуль: |/(ж)| (71, |з(ж)| С'2 Vz 6 ц(А) = 0, р(В) = 0, (6.26) где под А и В подразумевается множество точек разрыва соот- ветственно функций f(x) и д(х). Отсюда следует, что |/(л?)р(ж)| С1С2, т. е. ограниченность f(x)g(x) на [а, 6]. Далее, если f(x) и д(х) непрерывны в точке х, то их произ- ведение также непрерывно в этой точке. Поэтому каждая точка разрыва произведения f(x)g(x) принадлежит, по крайней мере, одному из множеств А и В. Значит, С С ли В, (6.27) где С — множество точек разрыва /(гНд(т). Из теоремы 6.8 и соотношений (6.26), (6.27) вытекает, что р(С) = 0. Таким образом, выполнены все условия критерия Лебега, от- куда и следует утверждение теоремы. Из данной теоремы вытекает очевидным образом, что произ- ведение любого конечного числа интегрируемых на [а, Ь] функ- ций само интегрируемо на [а, Ь]. Теорема 6.13. Еслд f(x) интегрируема на |а, Ь], то ее модуль |/(а;)| также интегрируем на [а, 6], причем справедливо неравен- ство 211
|/(x)|dx. (6.28) J a Доказательство. Действительно, ограниченность модуля |/(ж) | на [а, b] очевидна в силу ограниченности /(х), вытекающей из критерия Лебега. Поскольку каждая точка разрыва | f (х) | яв- ляется одновременно, по свойствам модуля, и точкой разрыва /(я), то, как и в теореме 6.12, отсюда следует, что множество то- чек разрыва |/(ж) имеет меру нуль. Откуда по критерию Лебега и следует интегрируемость на [а, b . Для установления неравенства (6.28) запишем очевидное не- равенство для произвольной интегральной суммы: Е/m ^£|Ж)|Д (6.29) Если взять произвольную нормальную последовательность от- меченных разбиений, то для соответствующих последовательно- стей интегральных сумм оп и где оп — интегральная сумма для /(ж), а о'п — интегральная сумма для /(т)|, получим в си- лу (6.29) неравенство Переходя здесь к пределу при п —> оо, получаем (6.28). Теорема 6.14. Если /(ж) интегрируема на [а, Ь\ то она инте- грируема на любом отрезке [а, р], содержащемся в [а, Ь]. Доказательство. В самом деле, по критерию Лебега из инте- грируемости функции /(ж) на [а, Ь\ следует ее ограниченность на этом отрезке и то, что множество ее точек разрыва имеет меру нуль. Отсюда ясно, что теми же свойствами она обладает и на отрезке [а,р], что в силу критерия Лебега и доказывает утвер- ждение данной теоремы. Теорема 6.15 (об интегрировании неравенств). Пусть f(x) и д(х) интегрируемы на [а, Ь] и на этом отрезке выполняется неравенство f(x) д(х)- Тогда g(x)dx. (6.30) Доказательство. Рассмотрим произвольное отмеченное раз- биение Т отрезка [а, Ь] и соответствующие интегральные суммы 212
для функций f(x) и д(х). Для них выполняется очевидное соот- ношение Ж) Дхг < 52 g^Xi. (6.31) i i Снова рассматривая произвольную нормальную последователь- ность разбиений и соответствующие последовательности инте- гральных сумм для /(ж) и д(х), получаем б.30). Из этой теоремы вытекают два следствия. Следствие 1. Если функция д(х) интегрируема на [а, Ь] и д(х) 0 на [а, Ь], то ь J д(х dx 0. (6.32 > а Для доказательства (6.32) достаточно положить в (6.30) /(ж) = 0. Следствие 2. Если f(x) интегрируема на [а, Ь] и А f(x) В на [а, Ь], то ь А(Ь — а) f(x)dx В(Ь — а). (6.33) а Доказательство непосредственно следует из (6.30) с учетом формулы (6.10). Теорема 6.16 (о среднем). Пусть на отрезке [а, Ь] заданы две функции f(x) и д(х), причем выполняются следующие усло- вия: 1) f(x) непрерывна на [а, Ь]; 2) д(х) интегрируема на [а, Ь]; 3) д(%) 0 на [а, Ь]. Тогда 9с G [а,6]: ь ь J /(^)р(жМг ~ /(с) g(x)dx. (6.34) а а Доказательство. Из условий теоремы, очевидно, следует ин- тегрируемость f(x)g(x) на [а, Ь]. По свойствам функций, непре- рывных на отрезке, V х € [в, b] => т f(x) М, (6.35) где т — inf {f(x)} и М = sup{/(.r)}. М [а,6] 213
Умножая неравенство (6.35 на д(х) и учитывая неотрицатель- ность у{Х I, получим Интегрируя неравенство 6.36), приходим к соотношению ь ь ь т (6.37) а а а Из неотрицательностид[х) на [а, Ь] вытекает неравенство д(х) dx 0. а Пусть вначале b f g\x)dx = 0. а Тогда из неравенства (6.371 следует, что ъ f(x)g(x)dx = 0, а и формула (6.34) будет, очевидно, справедлива при любом с G € [%Ь]. Пусть далее ь д(х) dx > 0. а Поделив все части неравенства (6.37) на этот интеграл, полу- чим: ь * f(x)g(x) dx т < —, ----------< М . ь д(х) dx а 214
По теореме о промежуточных значениях (см. теорему 3.40) для непрерывной на отрезке функции f(x) f(x)g(x) dx 3 с 6 [а, 6] : -/(с) д(х) dx откуда и вытекает формула (6.34). Если в (6.34) положить д(х) = 1, то придем к формуле 1 b — а f(c) = f(x) dx. (6.38) Величина, стоящая в правой части (6.38), называется средним значением функции f(x) на отрезке [а, Ь], откуда и происходит название теоремы. Заметим, что если заменить третье условие теоремы, потребо- вав, чтобы д{х) 0, то формула (6.34) останется справедливой, что станет очевидным, если умножить на (—1) верное соотноше- ние J/(®)(-5(^))rfa? =/(с) (-g(x))d Теорема 6.17. Пусть функция /(т) интегрируема на отрезке [а, 6]. Тогда для произвольного числа с 6 (а, b) J f(x)dx = ъ f(x)dx + ( f(x)dx. (6.39) Доказательство. Действительно, в силу теоремы 6.14 все ин- тегралы в (6.39) существуют. Возьмем произвольное отмеченное разбиение Т\ отрезка [а, с] диаметром X(7i) и аналогичное раз- биение Т2 отрезка [с, Ь] диаметром Х(Т2). Объединив Т\ и Г2, по- лучим разбиение Т отрезка [а, Ь] диаметром Х(Т) - max{X(7i), Х(Т2)} . 215
Соответствующая интегральная сумма на [д, b складывается из интегральных сумм для отрезков а, с] и [с, £>]: Г Е Дятг6[а,Ь] + Е -Ж)Джг- Дя?€[сД (6.40) Если Х(Т) —> 0, то й X(7'i) 0, Х(72) —> 0. Выбирая нормальную последовательность отмеченных разбиений и переходя к преде- лу при Х(ТП) —> 0 в (6.40), получим (6.39). До сих пор мы рассматривали интеграл по отрезку [а. Ь:, где а < Ь. Однако полезно расширить понятие интеграла на слу- чай произвольного соотношения между а и Ь, причем так, чтобы нужные свойства интеграла сохранялись. Для этого положим по определению а f{x)dx = 0, а а (а > Ь). (6.41) Теперь можно утверждать, что формула (6.39/ сохраняется при любом соотношении между а, b и с. Здесь возникает много воз- можных случаев. Возьмем один из них, а именно: а < b < с, и докажем для него справедливость (6.39). В силу теоремы 6.17 с естественным переобозначением преде- лов интегрирования (т. е. чисел а, b и с) получим j а /(ж) dx + с b (6.42) Учитывая , что /(ж) dx = . 6.421 в левую часть и перенеся второе слагаемое в правой части равенства, получим (6 39). Аналогично можно убедиться в справедливости формулы (6.39 и во всех остальных возможных случаях. ч Ранее мы получили ряд соотношений для интегралов, в од- них из которых участвует знак равенства, в других -- знак нера- венства. Какие из этих соотношений останутся справедливыми при новом, расширенном, понимании интеграла? Легко убедигь- 216
(6.43) ся, что все соотношения, содержащие знак равенства, остаются в силе, тогда как формулы, где фигурирует неравенство, будут справедливы только, если нижний предел интегрирования мень- ше верхнего. Перейдем теперь к важнейшим теоремам, связанным со свой- ствами интеграла как функции верхнего предела. Пусть функция f(x) интегрируема на отрезке [а, Ь]. Возьмем произвольную точку х е [а, 6] и рассмотрим новую функцию F(x), задаваемую формулой X F(x) = f(t)dt. а (Здесь во избежание путаницы переменную интегрирования обо- значили буквой t, поскольку, как указывалось ранее, определен- ный интеграл не зависит от ее обозначения, а буква х уже занята для обозначения верхнего предела интегрирования.) В силу свойств интеграла функция (6.43) определена на всем отрезке fa,/)]. Задача состоит в том, чтобы выяснить свойства функции F(x) при различных условиях, накладываемых на f(x). Теорема 6.18. Если функция f(x) интегрируема на отрезке [а, Ь], то F(x) непрерывна на этом отрезке. Доказательство. Выберем произвольную точку xq Е [п, Ь] и преобразуем приращение AF в этой точке: жо+Дж xo ДЕ — F(xq + Дж) — Е(жо) — J — [ f(t)dt = г а а?о+Дж = /(«)<& + f f(t)dt= f(t)dt. J J а жо+Дж a Л a (6-44) жо+Дж 4 7 xo a xq Возьмем Дж > 0. Поскольку /(ж) интегрируема на отрезке [а, Ь], то она ограничена на нем: ЗС>0: Уже [а,&] => |/(ж)| ^С. (6.45) Тогда из (6.44) и (6.45) получим жо+Дж Жо+Дж Жо+Дж |AF| = fx)dt > Cdt = Жо жо Жо — С(жо + Дя — жо) — СДж = С|Дж|. 217
Если Дт < 0, то жо Хо Жо J жо+Дж ftt)dt = Жо + Дж Жо [ f(t)dt = - жо4~Дж жо J Cdt = C(-Ax) = С|Дж|. жоН-Дж жо+Дж Таким образом, при любом знаке Дт справедлива формула О |ДЕ'I С|Дх (G.46) (Разумеется, Дт выбирается таким, чтобы точка То + Ах не вы- шла за пределы отрезка [а. Ь].) Из (6.46) по теореме о «зажатой переменной» следует, что lim ДЕ — О, Дж—>0 а это и означает непрерывность Е(Е> в точке tq. Поскольку то произвольная точка из [а, Ь], отсюда и вытекает утверждение теоремы. Теорема 6.19. Если функция /(т) непрерывна на отрезке а, Ь], то Е(т) дифференцируема на этом отрезке, причем F\x) = /(•»)• (6-47) (В концевых точках а и b речь идет, разумеется, об односторон- ней производной.) Доказательство. Возьмем, как и ранее, произвольную точку #0 € [а, Ь] и составим приращение ДЕ. Имеем Жо+Дж ДЕ — [ /^-/(с)Дт, где с е [#о,жо + Дт]. (6.48) жо Здесь мы воспользовались теоремой о среднем, полагая tykr) = 1. Из (6 48) следует, что Устремим теперь Дт к нулю. Поскольку с 6 [то,то + Дт], то с а тогда в силу непрерывности f(x) получим из (6 49), что 218
F'fxo) = /(xo). Учитывая произвольность tq, получаем (6.47). Равенство (6.47) означает, на самом деле, что функция F(x) является одной из первообразных для /(ж) на отрезке [а, Ь]. Тем самым установлено, что для всякой непрерывной на отрезке функции существует неопределенный интеграл. Перейдем теперь к центральной, в некотором смысле, теоре- ме интегрального исчисления. Теорема 6.20 (формула Ньютона — Лейбница). Пусть функция /(ж) непрерывна на отрезке [а, Ь], а Ф(ж) — ее произ- вольная первообразная на этом отрезке. Тогда ъ | /(ж) dx = Ф(Ь) — Ф(п). а (6.50) Доказательство. Действительно, в силу условий теоремы, учитывая (6.47), F(x) — Ф(ж) + С. (6.51) Полагая в (6.51) х — а, находим, что F(a) = 0 = Ф(а) Т С, откуда С = —Ф(а). Тогда (6.51) примет вид F(t) = Ф(ж) — Ф(а). (6.52) Подставив в (6.52) вместо х значение b и учитывая, что F(fe) сов- падает с интегралом, получим (6.50). Для разности, стоящей в (6.50), используется специальное обозначение: (Читается: «подстановка от а до &».) С его использованием формула (6.50) принимает вид , ь | /(ж) dx — Ф(ж) о (6.53) а 219
Эта формула названа по имени двух выдающихся математи- ков, открывших ее, формулой Ньютона — Лейбница. Она уста- навливает теснейшую связь между прежде обособленными по- нятиями определенного и неопределенного интегралов и позво- ляет с помощью неопределенного интеграла вычислять опреде- ленный интеграл. Пример 6Д Ранее мы изучали два метода вычисления неопределенного интеграла: замену переменной и интегрирование по частям (см. теоремы 6.1 и 6.2). Теперь их можно приспособить непосред- ственно для вычисления определенных интегралов. Теорема 6.21. Пусть f(x) Е С([п,Ь]), а ср(тч Е Cfl([a,pj (т. е. f(x) непрерывна на [п, &], а ср(я’) имеет непрерывную про- изводную на [а, р]). Пусть далее ср(т) Е [а, Ь] для Vх Е ,а,р и ср(а) — а, ср(Р) = Ъ, 16г да справедливо равенство f(u) du — /( ср(жр y'(x)dx. (6.54) Доказательство. Действительно, все подынтегральные функции, участвующие в 16-54), непрерывны в силу условий теоремы. Пусть Ф(д) — некая первообразная для f(u) па от- резке |ау Ьр Как и в теореме 6.1, убеждаемся, что Ф(ср(т)) — первообразная для f (ср(т))ср'(т) на 1а,3;. По формуле Ньюто- на Лейбница J /(u) du = Ф(Ь) — Ф(а), /(ср(т))ср'(ж) dx = ф(ср(р)) - ф(ср(а)) — Ф(Ь) - Ф(а). Отсюда и следует -6.54). 220
Теорема 6.22. Пусть функции и(х'^ v(x) е С3 ([а, 6]). Тогда ь v(x)uf (x)dx = u(x)v(x) а Ъ u(x)vf (x)dx. а (6.55) Ь а Доказательство. В самом деле, интегрируя равенство (6.6) от а др 6, учитывая, что и(х)и(х) — одна из первообразных для (гб(ж)г7(а?)),1 и применяя формул у Ньютона—Лейбница, полу- чим (6.55). Пример 6.5. COS X _ -------—dx — 1 + sin х sin# — и cos xdx ~ du 1 f du 1 к J 1 + u2 о 4 о Пример 6.6. Рассмотрим теперь функцию /(т) е C°°(i7(a;o)), т.е. функ- цию, обладающую непрерывными производными всех поряд- ков в некоторой окрестности точки х$. Здесь не предполагает- ся, что окрестность U(zq) мала (не исключен случай, когда эта окрестность совпадает со всей числовой осью). Фиксируем точку х е и(а?о)- Тогда в силу формулы Ньютона —Лейбница справед- ливо соотношение /(х) - /(жо) /'(*) dt XQ X или /(ж) — f(xo) + J \t) dt. (6.56) к. жо К интегралу, стоящему в правой части (6.56), применим несколь- ко раз формулу интегрирования по частям. Имеем: 221
X (so) - f'(t) d(x - Xo x X «О Xq XQ n! X жо К последнему интегралу в (6.57) применим теорему о среднем, где в роли функции f(x) выступает j 1 }, а в роли д(х) — (х — функция ------—. Очевидно, все требования этой теоремы вы- п\ полнены. Полечим: х п\ XQ X (6.58) п! п — dt = хо Комбинируя (6,57) и (6.58), приходим к следующей теореме. Теорема 6.23. Пусть функция f(x) Е С°°(и(жо))- Тогда при любом п и для любого х Е U(to) справедлива формула (6.59) п! где с Е |то,т Формула (6.59) носит название формулы Тейлора с остаточ- ным членом в форме Лагранжа. Разумеется, число с в этой фор- муле зависит как от п, так и от х. Первая группа сла1аемых 222
в (6.59) есть не что иное, как многочлен Тейлора. Разница меж- ду формулой (6.59) и той формулой, которую мы изучали ранее, состоит лишь в форме записи остаточного члена, т. е. разности между функцией /(ж) и ее многочленом Тейлора. Если прежде мы знали, что остаточный член имеет вид о[(ж — #o)% то в фор- муле (6.59) о нем содержится гораздо более подробная информа- ция. При решении ряда задач (отыскание площади бесконечной области, вычисление работы силы на бесконечном пути и т. п.) введенного ранее интеграла оказывается недостаточно. Обоб- щим его, во-первых, на случай бесконечного промежутка и, во- вторых, на случай неограниченных функций. Определение 6,8. Пусть функция f(x) Е С([а,+оо)), т.е. непрерывна на полуоси [а, +ос). Назовем несобственным инте- гралом от этой функции по данной полуоси следующую вели- чину: J a f(x) dx — lim /(ж) dx. b-^+oc (6.60) Если конечный предел в (6.60) существует, то интеграл называ- ется сходящимся и его значение считается равным этому пре- делу, а если конечный предел не существует, то интеграл назы- вается расходящимся и ему не соответствует никакое числовое значение. Поскольку для непрерывной функции на [a, fe] действует фор- мула Ньютона— Лейбница, ясно, что такая же формула справед- лива и для несобственного интеграла, если под значением перво- образной в +оо понимать соответствующий предел: f -Too f(x) dx = Ф(ж) = lim Ф(з?) — Ф(а), где Ф (я?) = /(ж). х—*4-оо Пример 6.7. dx = 0 —(—1) - 1. . 1 Пример 6.8. dx , . — — In ж х 223
Поскольку In | ж | не имеет конечного предела на +оо, то послед- ний интеграл расходится. Рассмотрим теперь один важный для дальнейшего интеграл +эо dx Х'Р * 1 (6.61) При р — 1 интеграл (6.61) расходится (см. пример 6.8\ Пусть р 7^ 1, тогда dx х? 1-р Ясно, что правая часть (6.62) равна конечному значению при р > 1 и обращается в бесконечность при р < 1. Таким образом, интеграл (6.61) сходится при р > 1 и расхо- дится при р 1. Подобно интегралу (6.60) можно определить и следующие ин- тегралы: —оо —оо (6.63) (6.64) причем интеграл (6.64) считается сходящимся, если сходятся оба интеграла в правой части. Определение 6.9. Рассмотрим функцию /(ж)-G С((а, ?>]), неограниченную в окрестности точки а. Назовем несобствен- ным интегралом от а до b величину ь f(x)dx = lim ь f(x) dx. (6.65) Как и в случае (6.60), интеграл (6.65) считается сходящимся, если соответствующий конечный предел существует, и расходя- щимся в противном случае. 224
Здесь тоже действует формула Ньютона —Лейбница, при- чем под значением первообразной Ф(х) в точке а понимается lim Ф(яф х~ Пример 6.9. -2-0-2. Пример 6.10. dx _ , — — In ж J х о 1 о Поскольку In |ж| не имеет конечного предела при х —> 04-, то последний интеграл расходится. 1 Упражнение 6.1. Исследуйте на сходимость о — при всехр. хр Наряду с интегралом (6.65) можно определить интеграл для случаев, когда особая точка (точка, в окрестности которой функция не ограничена) находится не на левом, а на правом кон- це отрезка [а, Ь] или внутри него (в точке с). Соответственно, от функции /(ж) требуется непрерывность на множестве [а, 6) или [а, с) U (с, 6]. При этом соответствующие интегралы определяют- ся как (6.66) (6.67) причем в случае (6.67) для сходимости интеграла требуется схо- димость обоих интегралов в правой части этого равенства. Как и ранее, можно и здесь обосновать применимость фор- мулы Ньютона — Лейбница. Сделаем еще несколько замечаний. Если, например, применить определение (6.66) к функции, л ь для которой существует | f(x)dx в обычном смысле, то в силу а 225
непрерывности интеграла по верхнему пределу придем к преж- нему значению интеграла. Для несобственных интегралов применимы с очевидными из- менениями все методы вычисления интегралов, такие, напри- мер, как метод подстановки и метод интегрирования по частям. Нужно лишь постоянно следить за сходимостью интегралов. Можно было бы ослабить требования к функции f ,х) и, на- пример, в случае (6.60) отказаться от непрерывности f(x) на всей полуоси [а, +оо). В этом случае пришлось бы потребовать, чтобы У(т) dx существовал при любом b > а, и применение j а формулы Ньютона — Лейбница не было бы здесь гарантировано. Аналогичное замечание относится и ко всем другим типам несобственных интегралов. 6.3. Приложения определенного интеграла Пусть f\xj Е С([а, Ь]) и У (ж ) > 0 на [а, Ь]. Найдем площадь криволинейной трапеции (см. рис. 6.1). При любом х Е [а, Ь] рассмотрим площадь той части криволи- нейной трапеции, которая расположена на участке [а. т]. Обозна- чим ее через S(t). Очевидно, S(a) — 0, S(6) = S (S — площадь всей исходной трапеции'. Фиксируем произвольное то Е [п, Ь\ и дадим ж о приращение Дж. Тогда S(x) получит приращение \ Д5 - S(x0 + Дж) - 5(т0). Ясно, что Д5 — площадь узкой полоски, вырезанной из трапе- ции и расположенной на участке |tq, xq + Дт| (рис. 6.3). Поскольку У\ж) непрерывна на отрезке [xq,xq Дт], го она имеет на этом отрезке максимум и минимум, т. е. Я Xi, Х2 (= [tq, То + Дт] : Vt 6 [то, xq 4- Дт] => /(^1) < /(ж) й /(ж2). Рассмотрим два прямоугольника с высотой соответственно .Ti) и У(т2). Очевидно, что площадь Д5 заключена между пло- щадями этих прямоугольников . (ж1)Дт Д5 У1Т2)Дт. (6.68) 226
Положим для простоты в (6.68) Дж > 0 и поделим все части этого нера- венства на Да*; получим /(^1) AS Да? /(Ж2)- Устремим теперь Да? к нулю. Посколь- (6.69) ку точки х\ и а?2 принадлежат отрезку [ад, + Дж], они обе будут стремиться кжо, а в силу непрерывности f(x) значения /(ад) и /(а?2) будут стремиться к /(а?о). Применив к (6.10) теорему о «зажатой пере- менной», получим Д5 lim —— Дж->о Да: = Л^о), 5'(ж0) = Л*о)- В силу произвольности жо находим, что на всем отрезке [а, Ь] 5'(ж) = /(ж). (6.70) Проинтегрируем равенство (6.70): а а ИЛИ 5(Ь) - S(d) = ь J /(ж) dx. а Но, как отмечалось ранее, S(a) — 0, а значение S(b) совпадает с площадью криволинейной трапеции. Поэтому приходим к фор- муле ь S — J /(a?) dx. (6.71) а Рассмотрим более общий случай криволинейной трапеции (рис. 6.4). Здесь /(а:), д(х) е С([а,Ь]) и 0 < < < /(ж) на [а, Ь]. Ясно, что площадь такой трапе- ции равна разности площадей двух трапеций предыдущего типа, одна из которых ограничена сверху графиком ?/ = /(а:), а другая — графиком у — 227
— д(х). Таким образом, приходим к следующей формуле для площади S трапеции ь (/(ж) - 5(®)) dx. а (6.72) Отметим, что (6.71) является частным случаем (6.72), где д(х) — = 0. Формула (6.72) сохранится и в случае, если отбросить требо- вание неотрицательности /(т) и д(х). Действительно, учитывая ограниченность /(т) и д(х) на [а, Ь], можно выбрать столь боль- шое положительное число Л, чтобы функции /(т) + А и д(х) + А оказались положительными на [а, Ь]. Соответствующая криволи- нейная трапеция получится из исходной параллельным сдвигом вдоль оси Оу, который, как известно, не меняет площади фигур. Но если применить (6.72) к новой трапеции, то получим Следовательно, формула (6.72) справедлива и в этом случае. Рассмотрим вновь трапецию, изображенную на рис. 6.1, и бу- дем вращать ее как жесткую пластину вокруг оси Ох. В резуль- тате возникнет некое пространственное тело, называемое телом вращения. Наша задача - вычислить объем Vqx такого тела. Как и в задаче с площадью, введем функцию К(т), равную объему тела, которое получается при вращении части трапеции, расположенной на участке [а,т]. Ясно, что К(а) — 0 и V(b) = - VOx. Снова фиксируем произвольную точку то € Ь] и дадим ар- гументу приращение Дт. При этом объем изменится на вели- чину ДК = V(xQ 4- Ах) - V(x0). (6.73) Величина (6.73) представляет собой объем тела, полученного при вращении тонкой полоски, изображенной на рис. 6.3. Как и ранее, выбираем на отрезке [тд. Ху + Дт] точки ti, xz* /(ti) /(т) /(Т2). Тогда ДК окажется заключенным меж- ду двумя объемами, порожденными прямоугольниками с осно- ваниями [то, то + Дт] и высотами, равными /(тх) и /(Т2). Но при вращении прямоугольников вокруг оси Ох получаются прямые круговые цилиндры. Таким образом (Дт > 0), 228
к/2(т1)Дт < AV < л/2(т2)Дт. (6.74) Поделив неравенство (6.74) почленно на Air и перейдя к пре- делу при Ат —> 0, как и ранее, получим lim — = л/2(ж0), т.е. V'(xq) = n/2(z0) ДХЗ/ *л/ Учитывая произвольность То, находим, что Vf(x) — nf2(x) на [а, 6]. Интегрируя (6.75) по отрезку [а, 6], придем к формуле (6.75) Vox (6.76) При вращении трапеции вокруг оси Оу получим еще одно те- ло вращения объемом Voy- (В этом случае требуем, чтобы отре- зок [а, 6] располагался на положительной полуоси.) Здесь тело, получающееся при вращении узкого прямоугольника вокруг оси Оу, представляет собой полый цилиндр. Поэтому, поступая так же, как и ранее, вместо (6.74) находим оценку п(жо + Дж)-/(«1)-лжо/(ж1) < AV < п(а>о + Дж)2/(а:2)-пх5/(ж2), откуда после очевидных преобразований получаем соотношение 2яж0/(«1) + я/(ж1)Дж < — < 2яя0/(ж2) + п/(ж2)Дж. (6.77) Переходя, как и прежде, в (6.77) к пределу при Дт —> 0, имеем формулу V'(t) — 2кт/(т). (6.78) Проинтегрировав (6.78), получаем окончательную формулу Voy — 2п ъ f xf(x) dx. (6.79) а Заметим, что если отрезок [а, Ь] расположен на отрицательной полуоси, то (6.791 нужно заменить на более общую формулу: ь VOy ~ 2к J |ж|/(ж) dx. (6.80) 229
Приведем без доказательства еще одну формулу для вычис- ления объема. Пусть некое тело расположено вдоль оси Ох на участке [а. b . Пусть, далее при любом х € [а, Ь] известна площадь сечения S(x) тела плоскостью, проходящей через точку х и перпендикулярной оси Ох. Тогда объем данного тела равен ь S(x) dx. а (6.81) Формула (6.81) это формула вычисления объема тела по попе- речным сечениям. Перейдем теперь к вопросу о вычислении длины дуги некото- рой кривой. Рассмотрим непрерывную функцию f(x) и возьмем кусок ее графика, располагающийся над отрезком [а, b . Такой кусок будем называть дугой и обозначать АВ (рис. 6.5). Выберем на этой дуге конечное множество точек Mq = — A, Mi, М2, ..., Mk = В. Такое множество назовем разбиени- ем дуги и обозначим через Q. Соединим соседние точки прямо- линейными отрезками. В результате получим ломаную линию с теми же концами А, В, что и исходная дуга; обозначим длину этой ломаной через 1дв или, кратко, I. (Разумеется, 1дв зависит от выбора точек Мг.) Длину максимального звена ломаной обо- значим через р. Последовательность разбиений Qn назовем нормальной, если последовательность соответствующих рп стремится к нулю. Определение 6.10. Величина 1дв называется длиной дуги АВ, если для любой нормальной последовательности разбиений дуги Qn lim ln = lAB- Если длина духи существует, то дуга АВ называется спрямляе- мой, в противном случае — неспрямляемой. Рис. 6.5 230
Заметим, что определение длины дуги через предел длин ло- маных аналогично определению интеграла через интегральные суммы. Докажем теперь следующую теорему. Теорема 6.24. Пусть /(т) € С1([п, Ь]). Тогда соответству- ющая дуга спрямляема и ее длина вычисляется по формуле ь Iab = \/1 + [/'(ж)]2 dx. а (6.82) Доказательство. В самом деле, возьмем произвольное раз- биение Q ~ {Mi} дуги АВ и спроецируем точки Mi на ось Ох. В результате на отрезке [а, Ъ] возникнет разбиение Т, состоящее из проекций Xi точек Mi. Очевидно, диаметр такого разбиения удовлетворяет оценке К (Г) р, поскольку длина любого отрезка на плоскости не меньше длины его проекции на ось Ох. Подсчи- таем теперь длину одного звена Mi-iMi ломаной. Имеем: + (Дуг)2 = = У(ДЖг)2 + [Ж)М2 - х/1+ (/'(У]2ДЖг- (6.83) Здесь Дх« ~ Xi — Xi-i, а к приращению Ду^ = f(%i) — f(xi-i) применили формулу Лагранжа, что законно в силу условия тео- ремы. Сложив все величины (6.83), найдем длину всей ломаной: i (6.84) Заметим, что разбиение Т вместе с точками образует отме- ченное разбиение Г, а величина (6.84) есть не что иное, как со- ответствующая интегральная сумма для непрерывной функции Д+ [ги2- Возьмем теперь произвольную нормальную последователь- ность разбиений дуги Qn. Она порождает нормальную после- довательность отмеченных разбиений на [а, Ь]. Последователь- ность длин ломаных 1п совпадает с последовательностью соот- ветствующих интегральных сумм и, следовательно, 231
lim ln П^<Х> 71 b a что равносильно формуле f'6.82). Рассмотрим теперь вопрос о вычислении работы, совершае- мой переменной силой на прямолинейном участке пути. Если в каждой точке оси Ох на материальную точку, находящуюся на этой оси, действует направленная вдоль этой же оси сила, то такую силу можно охарактеризовать алгебраической величиной F(x) и, переходя на «физический уровень строгости», считать, что при смещении точки вдоль «бесконечно малого пути» dx ве- личина F* х) не меняется, и поэтому совершенная элементарная работа равна F(z) dx. Если теперь материальная точка переме- стится из положения а в положение Ь. то поле сил совершит при этом работу, равную ь ^F(x)tx. а (6.85) Рассмотрим теперь следующую физическую задачу. Пусть в небольшом шарике проделано отверстие и этот ша- рик насажен на гладкий стержень так, что он может смещать- ся только вдоль этого стержня. Прикрепим к шарику пружин- ку и будем считать, что шарик первоначально находится в по- ложении равновесия. Выясним, какую нужно затратить работу, чтобы переместить шарик из положения равновесия на расстоя- ние а. Направим ось Ох вдоль продольной оси стержня, а точку, где центр шарика располагается в положении равновесия, примем за начало координат. Как известно из механики (закон Гука), при смещении шари- ка из положения равновесия на небольшое расстояние на шарик со стороны пружины будет действовать упругая сила, пропор- циональная смещению и направленная в противоположную сме- щению сторону. При нашем выборе оси Ох эта сила характери- зуется алгебраической величиной F(x) — — кх. (6.86) Применив к (6.86) формулу (6.85), получим, что работа, совер- шенная упругой силой, равна 232
A = —к xdx — — к ко/ (6.87) Значение работы получилось отрицательным, так как перемеще- ние шарика происходило против поля сил. Соответственно, для преодоления сопротивления пружины необходимо совершить та- кую же работу, но с положительным знаком. 6.4. Приложение* В этом приложении коснемся вопроса о приближенном вы- числении определенного интеграла. Рассмотрим непрерывную на отрезке [а.Ь] функцию /(т). Возьмем некое разбиение Т = {жг} данного отрезка. Тогда /(ж) dx ~ f(x) dx. i==1X 1 (6.88) Будем считать, что длины всех малых отрезков одинаковы, Дхг — h; величину h назовем шагом разбиения, а точки Xi — узловыми точками. Находя различные приближенные выражения для интеграла по малому отрезку, в силу (6.88) будем получать приближенные значения для интеграла по всему отрезку. Итак, рассмотрим f(x)dx. Заменим f(x) на отрезке жг-1 [xi~i,Xi] константой, равной ~ /(^г-1)« Тогда получим при- ближенное значение f(x)dx и yi-ih. (6.89) ^г — 1 Суммируя (6.89) по всем i, получим приближенную формулу /(ж) Их « (уо + У1 н----ь Уп-ijh. (6.90) 233
Рис. 6.7 В случае положительной функции /(х) формула (6.89) озна- чает, что на участке Xi] заменяем площадь узкой полоски, вырезанной из криволинейной трапеции, площадью прямоуголь- ника с высотой ^-1 (рис. 6.6). Поэтому формула (6.90) носит название формулы прямо- угольников. Конечно, формула (6.89) дает довольно грубое приближение. Более точное приближение можно получить, если заменить на отрезке [xi~i7Xj] график функции не горизонтальным отрезком, а хордой, соединяющей концевые точки графика на этом отрез- ке. В результате получится трапеция, площадь которой прибли- женно равна площади узкой полоски (рис. 6.7). Учитывая, что площадь такой трапеции очевидно равна Уг-1 + Уг , 2 и суммируя все такие площади, получим для вычисления инте- грала приближенную формулу трапеций (6.91) Еще более точное приближение можно получить, если заменить на соответствующем участке график функции куском парабо- лы. Для этого разобьем отрезок [а, 6] на четное число 2т малых отрезков и заменим на участке ^2fc+2] график функции параболой, проходящей че- рез три ТОЧКИ (х2к, У2к), (®2fc+l, У2Л.+1) И (®2jb+2,y2fc+2) (рис. 6.8). Чтобы легко найти уравнение такой параболы, применим метод, предло- женный Лагранжем. Введем три квад- ж2*+1 х2к+2 х Рис. 6.8 234
ратичные функции, каждая из которых равна единице в «своей» узловой точке и нулю в двух других точках. Легко видеть, что такие функции задаются формулами (ff - Xjjt^i)(x - X2k+2) (х-2к — Х2к+1)(х2к — Х2к+‘2) (Ж ~ Х2к)(х - Х2к+2) 2fc+1( (х2к-1Л — X2k)(x2k+1 — Х2к+2)' / х _ (х - X2fc)(a? - Ж2<1)_________ е2к+2{Х) " (х2к+2 - Х2к){х2к+2 - ®2fc+l) ’ (6.92) Если записать линейную комбинацию этих функций: Lk(x) = У2к^2к(х) + y2fc+le2fcl-lU) + У2к+2С2к+2(х) , (6.93) то получим квадратичную функцию, график которой проходит через три указанные ранее точки, т. е. это и будет искомая пара- бола. Поэтому ж2&4-2 Ж2/с+2 J У(ж) dx « J Lk(x) dx. (6.94) ^2fc %2к Легко подсчитать, что %2к+2 C2fc (яг) dx = Х2к t-2 J e2k+2(x)dx = #2fc ^2к Учитывая (6.93), (6.94) и (6.95), находим, что %2к dx « --{У2к + 4у2Л+1 + У2к+2)- (6.96) Суммируя (6.96) по всем ку получаем окончательную формулу ь fa f(x) dxin- (уо + У2ш + 2(У2 4- у4 Ч----+ У2т-а)4 J 3 а (6.97) 4-4(yi 4- У? 4- • • 4- У2т -1))- 235
Формула (6.97) носит название формулы Симпсона. Она яв- ляется самой точной из трех приближенных формул, получен- ных нами, и поэтому на практике предпочитают пользоваться именно ею. Конечно, существуют и другие формулы, а также методы для приближенного вычисления интегралов. С ними можно позна- комиться в специальных руководствах по вычислительным ме- тодам.
Глава 7 РЯДЫ 7.1. Простейшие свойства числовых рядов формальной точки зрения ряд — это числовая последова- тельность, члены которой соединены знаком «+», т. е. это некая формальная сумма. Ряд записывается следующим образом: “I* (Z-2 4“ * * * 4“ G'ti “Ь (Здесь ап называется общим членом ряда.) Если говорить неформально, то ряд — это сумма бесконечно- го числа слагаемых. Такой сумме нужно прежде всего придать смысл. Мы уже касались этого вопроса в гл. 6 в связи с кри- терием Лебега. Теперь пришло время разобраться во всем этом основательно. Назовем частичной суммой Sn ряда сумму его первых п сла- гаемых: «$*72, — G-1 4- 4~ • • • 4~ Un* Частичные суммы сами образуют числовую последователь- ность. Определение 7.1. Числовой ряд называется сходящимся, если сходится последовательность его частичных сумм, причем предел частичных сумм называется суммой ряда. В противном случае ряд называется расходящимся. Таким образом, сумма ряда S вычисляется по формуле S = lim Sn. 72—►СЮ Изучим теперь простейшие свойства числовых рядов. Пусть заданы два ряда 72 = 1 И 72=1 237
Под суммой (разностью) этих рядов будем понимать ряд п—1 Теорема 7.1. Пусть даны два сходящихся ряда ап — А и п=1 ^2 Ьп ~ В. Тогда их сумма (разность) также сходится, причем п=1 (ап ± Ьп) = А ± В. Доказательство. Рассмотрим частичные суммы рядов т п=1 т И Возьмем, например, сумму рядов и выразим через Лт и Вт ее частйчную сумму т т тп (7-2) Учитывая определение суммы ряда (7.1) и применив к (7.2) тео- рему о пределе суммы двух последовательностей, получим S — lim Sm ~ lim (Ат + Вт) — А + В. т —*оо Аналогично доказывается теорема и для разности рядов. Следует отметить, что эту теорему нельзя обратить: из сходи- мости суммы двух рядов нс следует сходимость каждого ряда. Например, каждый из двух рядов с постоянными слагаемыми расходится, а их суммой будет ряд 0 + 04 ... 4- 0 + • • • , который сходится к нулю. 238
Упражнение 7.1. Докажите утверждение: если один ряд сходится, а другой расходится, то их сумма представляет собой расходящийся ряд. Теорема 7.2. От умножения всех членов ряда на ненулевую постоянную сходимость (расходимость) ряда не меняется. Доказательство. В самом деле, рассмотрим два ряда 77=1 где С 0. Если обозначить их частичные суммы соответственно через Ап и А^, то выполняется очевидное соотношение Отсюда ясно, что если сходится последовательность {Ап}, то сходится и последовательность {А^}, и наоборот. Понятно также, что в случае сходимости для сумм рядов справедливо равенство Теорема 7.3 (необходимый признак сходимости). Если ряд сходится, то его общий член стремится к нулю. сходится Иш ап = 0. п—>ос Доказательство. Действительно, запишем очевидное соот- ношение (7-3) где Sn — частичная сумма ряда. Поскольку lim Sn = S и, очевидно, lim Sn-i ~ S, П—*(Х) n—+(X> получим lim an — lim Sn — lim Sn-i — S — S ~ 0. n—>oo n~>oc n—>oo Отметим, что этот признак не является достаточным: из то- го, что предел общего члена равен нулю, не следует сходимость ряда. Это можно увидеть на примере следующих двух рядов: 239
Как будет установлено далее, первый из этих рядов расходится, а второй сходится, хотя и в том, и другом случае общий член стремится к нулю. Теорема 7.4. От изменения (добавления, отбрасывания) ко- нечного числа членов сходимость (расходимость) ряда не меня- ется. Доказательство. Действительно, пусть задан ряд ап. П—1 Обозначим через У^ ап ряд, полученный из исходного ряда из- 71=1 менением конечного числа членов. Поскольку у этих двух рядов отличается лишь конечное чис- ло членов, 37V: \/п N а'п = ап. Обозначим через Ап и А'п соответствующие частичные суммы. Тогда, начиная с номера 7V, разность между ними будет посто- янна — Ап ~ С. или А'п = Ап + С. Отсюда ясно, что последовательности {Ап} и {Л'Д либо обе име- ют предел, либо обе предела не имеют. Теорема 7.5. Если ряд сходится, то последовательность его частичных сумм ограничена. Это немедленно следует из определения сходимости ряда и соответствующего свойства числовых последовательностей. Важно отметить, что ограниченность частичных сумм еще не гарантирует сходимости ряда, как это видно на примере ряда 1 - 1 4-1 - 1 + • • • Последовательность его частичных сумм имеет вид 1,0,1,0,1, ... 240
Ясно, что эта последовательность ограничена, но предела не имеет. Любой ряд можно представить в виде 4- а2 4---1- ап) + (an+i + ап+2 4-). (7.4) В первой скобке (7.4) стоит не что иное, как частичная сумма Sn. Ряд, стоящий во второй скобке, называется остатком Rn ряда. Понятно, что исходный ряд сходится тогда и только тогда, ко- гда сходится его остаток. Для сходящегося ряда получаем спра- ведливое при любом п равенство S = Sn + Rn. (7.5) Из (7.5) немедленно вытекает следующее свойство рядов. Теорема 7.6. Если ряд сходится, то lim Rn = 0. п—>оо Докажите эту теорему самостоятельно. Далее изучим еще одно свойство рядов, которое вряд ли мож- но назвать «простейшим», — критерий Коши сходимости рядов. Вначале дадим следующее определение. Определение 7.2. Последовательность {Ьп} называется фундаментальной, если Ve>0 37V: Vn, N \bn — bm\ < e. (7.6) Теорема 7.7 (критерий Коши сходимости последова- тельностей) . Последовательность сходится тогда и только то- гда, когда она является фундаментальной. Замечание. Ограничимся доказательством необходимости усло- вия (7.6), отложив более сложное доказательство достаточности до приложения к данной главе. Доказательство. Пусть дана сходящаяся последователь- ность {5П}. Возьмем произвольное е > 0 и поделим его на 2. То- гда по определению сходимости ЗАГ: < |. (7.7) Пусть п, т — произвольные номера, большие или равные N. По- лагая в (7.7) к — п и т, получим |ЬП-Ь|<| и \Ьт-Ъ\Д. (7.8) 241
Далее, Здесь воспользовались свойством модуля и (7.8). Таким образом, справедливо соотношение (7.6). С учетом определения сходимости ряда можно переформули- ровать критерий Коши применительно к рядам. Теорема 7.8 (критерий Коши сходимости рядов). Ряд сходится тогда и только тогда, когда последовательность его ча- стичных сумм является фундаментальной. В свою очередь теорему 7.8 можно переформулировать так: ряд сх°дится тогда и только тогда, когда выполня- п=1 ется условие Ve>0 V n, т > N (т > п) => т ®к В N: к=п-\-1 Справедливость данного утверждения станет ясной, если заме- тить, что ТП Из критерия Коши как следствие получается следующее утверждение. Теорема 7.9. Если сходится ряд (ап|, то сходится и ряд / п’ тг—1 Доказательство. Действительно, поскольку ряд Vj |ап| схо- дится, то по критерию Коши О 3 7V: Vn, т £. fc=n-j-l 242
Но тогда т т /с=п-И т к=п+1 Значит, для ряда УУ выполняется (7.9). А тогда по тому же п—1 критерию Коши отсюда следует сходимость этого ряда. Отметим, что обратная теорема, вообще говоря, не верна: из сходимости ряда У^ ап не следует сходимость ряда У^ |ап|. П—1 71=1 Определение 7.3. Ряд называется абсолютно сходящимся, если сходится ряд из модулей его членов. Если сам ряд сходится, а ряд из модулей его членов расходится, то такой ряд называется условно сходящимся. Упражнение 7.2. Докажите, что для абсолютно сходяще- гося ряда справедливо неравенство п-1 (7.10) 7.2. Ряды с положительными членами Очень важный класс рядов составляют ряды с положитель- ными (неотрицательными) членами. Пусть задан такой ряд ап 0 V п. (7-11) Рассмотрим последовательность его частичных сумм {5П}. Яс- но, что эта последовательность монотонно возрастает (в широ- ком смысле): Si S2 Отсюда в силу теорему Вейерштрасса о монотонных последо- вательностях вытекает важное следствие: если последователь- ность частичных сумм ряда (7.11) ограничена, ?по этот ряд 243
сходится. (Напомним, что для произвольного ряда такое утвер- ждение несправедливо.) В свою очередь из данного факта можно вывести два призна- ка сравнения. Теорема 7.10 (первый признак сравнения). Пусть даны два ряда 71—1 П=1 такие, что Vп => ап < Ьп. (7.12) Тогда из сходимости ряда с большими членами следует сходи- мость ряда с меньшими членами. Доказательство. В самом деле, обозначим через Ап и Вп ча- стичные суммы рядов. Из (7.12) следует, что Ап Вп. (7.13) Но ряд Ьп сходится к некоторому числу В. Тогда выполняет- n—1 ся неравенство Вп < В. (7.14) (Вспомним, что в теореме Вейерштрасса предел монотонно воз- растающей последовательности совпадал с точной верхней гра- нью.) Из (7.13) и (7.14) находим, что Ап В. Это означает, что последовательность {Ап} ограничена, а тогда ряд ^2 ап сходится. п~ 1 Заметим, что условие (7.12) можно ослабить, заменив его тре- бованием, чтобы 3 7V: ап ^Ьп. (7.15) Действительно, если выполняется (7.15), то неравенство для членов рядов может нарушаться лишь для конечного числа но- меров. Отбросим члены двух рядов с этими номерами. От этого, как известно, сходимость или расходимость рядов не изменится. Но для новых рядов уже будет выполнено (7.12). 244
Теорема 7.11 (второй признак сравнения). Пусть даны Ч-оо -f-oo два ряда с положительными членами ап и Ьп, Пусть далее 71=1 П—1 ап ~ kbn при п —> оо, где к ~=£ 0. Тогда эти два ряда сходятся или расходятся одновременно. Доказательство. Действительно, по определению эквива- лентности а>п = кЬпЦщ где lim qn = 1. п—»ос Возьмем е = - > 0, тогда 37V: Vn>W=»|gn-l| <- & или Откуда получается соотношение - кЬ -кЬп. (7.16) Учитывая простейшие свойства числовых рядов и первый при- знак сравнения, из (7.16) находим, что если сходится ряд п=1 то сходится и ряд а также, если сходится ряд то 71 = 1 97 = 1 СХОДИТСЯ и ряд . п—1 Оба признака сравнения позволяют при исследовании ряда на сходимость свести задачу к исследованию некоторого друго- го, как правило, более простого ряда. Но для практического при- менения этих признаков нужно иметь некий стандартный набор рядов, про которые известно, сходятся они или нет, и с которыми можно сравнивать другие ряды. Единственный известный нам пока класс таких рядов обра- зуют геометрические прогрессии, т. е. ряды вида 245
CQn, где с > 0, q > О, п=О (7-17) при О < q < 1 такие ряды сходятся, а при q 1 расходятся. В простейших случаях можно сравнить ряд с рядом ти- па (7.17), непосредственно применив один из признаков сравне- ния. Еэзьмем, например, ряд (7-18) Очевидно, справедлива следующая оценка для членов этого ряда /2п- IV < /2nV ру \3п + 1/ ’ Но ряд с членами — это геометрическая прогрессия с 1. Такой ряд сходится, а тогда по первому признаку сравнения сходится и ряд (7.18 . Однако часто не удается непосредственно сравнить члены ря- да с членами геометрической прогрессии. Поэтому приходится искать другие пути для такого сравнения. Так появились следу- ющие два признака. +оо Теорема 7.12 (признак Коши). Пусть для ряда \ ап с п—1 положительными членами выполняется условие lim п = (?- Тогда при q < 1 ряд сходится, при q > 1 (7.19) расходится, а при q - 1 признак ответа не дает. Доказательство, Действительно, пусть вначале q < 1. Возь- мем такое малое число ei > 0, чтобы qi = q + si тоже было меньше единицы. Раскроем условие (7.19): 37V: Vn > Л’ => | ^ап - <?| < Ei. или q - El < 141 < q + El = 41 < 1. 246
Значит, у/< <717 О'п < <71 • (7.20) По первому признаку сравнения из (7.20) и вытекает сходимость ряда. Пусть теперь q > 1. Возьмем такое малое £2 > 0, чтобы q — — «2 — <72 было больше единицы. Снова раскрывая (7.19), най- дем, что 37V: N =>q% <ап. Но отсюда следует, что lim ап — оо, т. е. ап не стремится к нулю, 71—+00 а тогда по необходимому признаку ряд расходится. Теорема 7.13 (признак Даламбера). Пусть для ряда с по- ложительными членами ап выполняется условие П—1 lim = q. (7.21) п—>ос ап Тогда при q < 1 ряд сходится, при q > 1 расходится, а при q — 1 признак ответа не дает. Доказательство, Пусть сначала q < 1. Возьмем такое малое Е1 > 0, чтобы qi — q + Ei < 1. Раскроем (7.21): <^П или q — Ei < < q _|_ £1 _ q1w (7.22) Из (7.22) следует неравенство <^п+1 < &п<71- (7.23) Выпишем неравенство (7.23) для нескольких номеров, начиная cN: a;V4-i < ayvQi; <W+2 < < aN41\ 3 aw+з < &N+2Q1 < Видим, что справедливо соотношение V k 1 => dN+k < dNq* (7.24) 247
Переобозначим индексы, полагая N 4- к = т. Тогда неравен- ство (7.24) примет вид ) Q1 •> т. е. Cq?, где -2V Отсюда по первому признаку сравнения получим сходимость ряда. Пусть теперь q > 1. Выберем £2 > 0 такое, чтобы 6/2 = Q — £2 > 1- Из (7.22) получим, что 3 7V: Но это означает, что для таких номеров ^п+1 • Значит, последовательность {ап} с положительными членами монотонно возрастает, начиная с номера N. Поэтому она не мо- жет стремиться к нулю. т.е. нарушен необходимый признак и ряд расходится. В качестве иллюстрации рассмотрим следующие два при- мера. Пример 7.1. V /— .. 4п + 1 4 lim ^/ап = hm -------- = - < 1. и—*ос п—*схз Щ/ — / О Следовательно, данный ряд сходится по признаку Коши. Пример 7.2. а > 0. ZL-/ П1 п—1 lim - lim - а 1* = lim —Т == °<< L п—>00 ап п-^сс (п 4 1)! ап т? 4-1 ▼ Следовательно, данный ряд сходится по признаку Даламбера. Из примера 7.2, вспоминая необходимый признак сходимости, можно сделать важный вывод: ап Va > 0 => lim — = 0. (7.25^ 7l^OC fl'. 248
Иначе, при целочисленных значениях аргумента показательная функция растет медленнее факториала. Отметим еще, что как в признаке Коши, так и в признаке Да- ламбера не исключен случай q — 4 -оо. Здесь при доказательстве расходимости такого ряда в качестве можно брать любое чис- ло, большее единицы. Сравнение данного ряда со стандартным набором рядов напо- минает просеивание сквозь сито: что-то удается уловить, а что- то «проскакивает» сквозь ячейки. Члены геометрической про- грессии либо очень быстро растут, либо очень быстро убывают. Поэтому для многих рядов сравнение с прогрессиями ничего не 1 дает. Например, для ряда / —х и признак Коши, и признак ---------------------------* П=1 Даламбера приведут к q = 1, т. е. это как раз тот случай, ко- гда признаки не позволяют ответить на вопрос о сходимости. Значит, нужно расширить набор стандартных рядов. Это мож- но сделать, доказав еще один признак сходимости. Но предвари- тельно докажем теорему, аналогичную теореме Вейерштрасса о монотонных последовательностях. Теорема 7.14. Пусть функция д(х) определена на полуоси 'п,+оо), монотонно возрастает на этой полуоси (быть может, нестрого) и ограничена сверху, т. е. ЗМ>0: \/ х е ja, 4-оо) => д(х) < М. Тогда существует предел этой функции при т —> 4-оо. Доказательство. Действительно, множество значений функ- ции {д(а;)} ограничено сверху. Обозначим через с точную верх- нюю грань этого множества: с = sup {.д(ж)}. (7.26) Возьмем произвольное е > 0. По свойству верхней грани с - е < 5(х6). Тогда для любого J ' X£ будут выполняться соотношения с — е < д(хь) д(х) с < с 4- е. (7.27) Из (7.27) следует, что \! х > => |^(а*) — с| < с. 249
Рис. 7.1 Если теперь взять проколотую окрестность бесконечности U(oc) — {х: |ж| > Л}, где положительная постоянная А больше х^ то ¥х е U(oo) (х > 0) => |д(ж) — с| < е. (7.28) Но это и означает, что lim q(x) = с, х—* boo Дадим теперь геометрическую интерпретацию ряда с поло- жительными членами. Построим прямоугольник, основанием которого служит отрезок [1,2] на оси Ох, а высота совпадает с первым членом ряда ар Площадь такого прямоугольника чис- ленно равна первому члену ряда. Аналогично, построим прямо- угольник с основанием [2,3] и высотой а2, затем прямоугольник с основанием [3,4] и высотой аз и т. д. Получится некая беско- нечная ступенчатая фигура (рис. 7.1). Частичная сумма ряда Sn будет равна площади той ча- сти ступенчатой фигуры, которая располагается над отрезком [l,n + 1], а площадь всей бесконечной ступенчатой фигуры бу- дет совпадать с суммой ряда. Докажем теперь следующую теорему. Теорема 7.15 (интегральный признак Коши). Пусть за- дан ряд с положительными членами ^^ап и функция /(ж), п~ 1 определенная на полуоси [1,+оо), причем выполняются следу- ющие условия: 1) f(x) непрерывна на [1, +оо); 2) /(ж) > 0 на 1, +оо); 3) /(т) монотонно убывает на [1, +оо); 4) Vn /(п) = ап. 250
Ч-оо Тогда ряд сходится в том и только в том случае, когда 71=1 сходится f (xj dx. 1 Доказательство. Действительно, пусть вначале сходится ряд. Тогда, если обозначить его частичные суммы через Ап, а всю сумму через А, то, как было показано ранее, будет выпол- няться неравенство Vn=> Ап А. (7.29) Построим теперь на оси Ох, как пояснялось ранее, ступенча- тую фигуру, изображающую ряд, и проведем график у - f(x) (рис. 7.2). Рассмотрим функцию ь F(b) = J f(x) dx. i (7.30) Поскольку /(х) > 0, то (7.30) — возрастающая функция. Эта функция численно равна площади криволинейной трапеции, расположенной под графиком у = f(x) на отрезке [1,6]. Фик- сируем b и выберем наименьшее натуральное число п, такое, что п Ь. Понятно (см. рис. 7.2), что криволинейная трапе- ция содержится внутри ступенчатой фигуры, построенной над Отрезком [1,п]. Но площадь такой фигуры как раз и равна ча- стичной сумме Ап_1 ряда. Площадь криволинейной трапеции не превосходит площади объемлющей ступенчатой фигуры. Следо- вательно, с учетом (7.29) приходим к неравенству Г(6) Ап_! < А. Рис. 7.2 251
еперь видим, что F(b) удовлетворяет на полуоси [1,-t-oo всем условиям теоремы 7.14. Поэтому Я lim F(b) = b~-*-hoc f(x) dx. Но это и означает, что f(x) dx сходится. Пусть теперь, наоборот, сходится интеграл /(т) dx. Пере- двинем ступенчатую фигуру на единицу влево и получим карти- ну, изображенную на рис. 7.3. Из этого рисунка видно, что ступенчатая фигура на отрезке [1, п], площадь которой равна Ап — ai, целиком содержится в со- ответствующей криволинейной трапеции. Поэтому справедливо следующее неравенство: An сц п Г f(x) dx f f(x)dx или f x) dx + ai. (7.31) Ho (7.31) означает ограниченность частичных сумм ряда, откуда вытекает его сходимость. Теперь можно исследовать на сходимость очень важное се- мейство рядов: (7.32) 71= 1 где р — любое действительное число. Заметим сначала, что прир 0 ряд ( 7.32) заведомо расходит- ся, поскольку здесь нарушен необходимый признак сходимости, ап 0. Пусть теперь р > 0. Рассмотрим функцию 252
Легко видеть, что эта функция удовлетворяет всем требованиям интегрального признака Коши. Значит, в данном случае сходи- мость ряда (7.32) равносильна сходимости интеграла (7.33) Но интеграл (7.33) уже был исследован на сходимость при изуче- нии несобственных интегралов. Учитывая это, приходим к окон- чательному результату: ряд i7.32) сходится при р > 1 и расхо- дится при р С 1. +оо 1 Отсюда, в частности, следует, что ряд у — (гармонический п— 1 ряд) расходится, а ряд Д- сходится. Z—/ 77 — 1 Ряды, задаваемые формулой (7.32), образуют еще один стан- дартный набор, который можно использовать при исследовании рядов на сходимость. Пример 7.3. : arcsm — ~ ; п з * П2 сходится => сходится и данный ряд. 7.3. Ряды произвольного знака В этом подразделе будут рассмотрены ряды, члены которых имеют разные знаки. Заметим вначале, что, если все члены ряда отрицательны, то, умножая их на (—1), отчего, как известно, сходимость или расхо- димость ряда не меняется, получим положительный ряд. Если у ряда имеется только конечное, число отрицательных членов, то, отбросив их, снова придем к положительному ряду. Аналогич- но обстоит дело для ряда, у которого имеется только конечное число положительных членов. 253
Существенно новым будет случай, когда у ряда имеется бес- конечно много как положительных, так и отрицательных чле- +оо нов. Итак, пусть задан ряд ап с членами произвольного зна- 71=1 ка. Введем два новых ряда и где 71=1 где (7.34) (7.35) Очевидно, справедливо равенство (7..36) Кроме того ясно, что {ап, если ап 0; 0, если ап < 0. {0, если ап 0; апу если ап < 0. Таким образом, ряд (7.34) представляет собой сумму всех поло- жительных членов исходного ряда, а ряд (7.35) — сумму всех его отрицательных членов. Известно, что сходящиеся ряды делятся на абсолютно сходя- щиеся и условно сходящиеся. Выясним, как описать абсолютную сходимость в терминах рядов (7.34 и (7.35). Теорема 7.16. Ряд у ап абсолютно сходится тогда и только п—1 тогда, когда сходятся оба ряда (7.34) и (7.35). Для абсолютно сходящегося ряда справедливо равенство 72=1 71=1 (7.37) Доказательство. Действительно, из определения величин и а~ немедленно следуют соотношения (7.38) (7.39) 254
Пусть ряд абсолютно сходится. Тогда в силу (7.38) по первому признаку сравнения сходятся ряды lan I и 1% |- Но 71=1 71—1 (7.40) Отсюда следует сходимость рядов (7.34) и (7.35). Пусть, обратно, сходятся ряды <7.34) и (7.35). В силу (7.40 тогда сходятся и ряды |п^| и |, откуда, учитывая 71=1 71—1 (7.39), вытекает сходимость ряда У |ап|. Что касается равен- 72=1 ства (7.37), то, вспоминая простейшие свойства числовых рядов, сразу получим его из (7.36). Рассмотрим, какие еще возможны варианты. Если один из рядов (7.34), (7.35) сходится, а другой расходится, то данный ряд расходится. А вот если оба эти ряда расходятся, то данный ряд либо расходится, либо сходится условно. Определить, что здесь имеет место на самом деле — наиболее сложная задача. Для этого докажем еще один признак. Предварительно дадим следующее определение. Определение 7.4. Ряд называется знакочередующимся, ес- ли с каждым следующим номером знак члена ряда меняется на йротивопо ложный. Таким образом, у знакочередующегося ряда чередование зна- ков может быть либо таким: +, —, +, --, +, ..., либо противопо- ложным: —, +, —, 4 , —, ... Если, например, у ряда идут два по- ложительных члена, потом два отрицательных, потом опять два положительных и так далее, то такой ряд не подходит под опре- деление 7.4. Теорема 7.17 (признак Лейбница). Пусть дан ряд у п=1 причем выполняются следующие условия: 1) ряд — знакочередующийся; 2) последовательность {|ап|} монотонно убывает; 3) lim ап = 0. 72 —*ОО Тогда этот ряд сходится. 255
Доказательство. Возьмем для определенности случай, когда ряд начинается с положительного члена, и обозначим через сп модуль n-го члена: сп — |пп1. Тогда в развернутом виде ряд за- пишется следующим образом: ci - с2 + с3 - с4 + - • (7.41) Рассмотрим частичные суммы ряда с четными номерами S2fc. Они образуют некоторую подпоследовательность последова- тельности всех частичных сумм. Представим каждую такую сумму двумя способами: S<2k — (ci - С2) + (с3 - С4) -|-h (C2k-1 — 02k) (7-42) и $2k — Cl - (c2 — C3) ----(c2^_2 - C2k-1) — C2k- (7.43) В силу монотонного убывания сп выражение в каждой скобке в (7.42) положительно. Значит, с увеличением количества таких скобок величина (7.42) возрастает. Иначе, суммы 82k образуют монотонно возрастающую последовательность 52<54< ...<S2fc< ... (7.44) В силу той же монотонности и положительности сп из (7.43) сле- дует, что при любом к S2k < с (7.45) Соотношения (7.44) и (7.45) означают, что последовательность {S^aJ ~ монотонно возрастающая и ограниченная. Поэтому по теореме Вейерштрасса она имеет предел lim S2k = S. (7.46) к-*оо Рассмотрим теперь суммы с нечетными номерами. Ясно, что ^2А;+1 = S2k + а2АН-1- (7.47) Поскольку по условию члены ряда стремятся к нулю, из (7.46) и (7.47) следует, что lim S2k и = S. к—*ос> Итак, частичные суммы с четными и нечетными номерами стре- мятся к одному и тому же числу S, а поскольку эти суммы ис- черпывают всю последовательность Sn, отсюда вытекает, что lim Sn - S. Значит, ряд сходится. 256
В качестве иллюстрации рассмотрим ряд 1-| + |---+(-1)п^ + --- (7.48) л-i О I v Если взять соответствующий ряд из модулей, то получим гармо- нический ряд, который расходится. Оцнако, сам ряд (7.48 удо- влетворяет всем условиям признака Лейбница и, значит, сходит- ся. Таким образом, ряд (7.48) — это условно сходящийся ряд. Ряды, удовлетворяющие всем условиям теоремы 7.17, назы- вают рядами Лейбница. Часто можно услышать, что признак Лейбница - это при- знак условной сходимости. Но это не верно. Ряды Лейбница бы- вают как абсолютно, так и условно сходящимися. Примером аб- солютно сходящегося ряда Лейбница может служить ряд 1 _ -- + —_____|- (-1)п— ч__ 22 З2 J п2 Другое дело, что признак Лейбница часто используется для установления условной сходимости, но при этом требуется еще предварительное исследование на сходимость соответствующего ряда из модулей. Анализируя доказательство признака Лейбница, можно по- лучить оценку для суммы ряда Лейбница. Теорема 7.18. Сумма ряда Лейбница по модулю не превос- ходит модуля его первого члена и имеет тот же знак, что и этот член. * Доказательство. В самом деле, если ряд начинается с поло- жительного члена, то, во-первых, его сумма положительна, по- скольку является пределом монотонно возрастающей последо- вательности положительных чисел S^k- Во-вторых, из (7.45) и (7.46) следует, что или, учитывая положительность 5, |S| < |й1|. (7.49) 1аким образом, утверждение теоремы выполнено. Случай, когда первый член ряда отрицателен, можно свести к предыдущему, вынося «—» за знак суммы. Легко убедиться, что и здесь утвер- ждение теоремы справедливо. Отсюда вытекает утверждение, которое сформулируем в виде самостоятельной теоремы. 257
Теорема 7.19. Сумма остатка ряда Лейбница по модулю не превосходит модуля первого отброшенного члена и имеет тот же знак, что и этот член. Доказатмьство. Отметим, что остаток ряда Rn — ^п+1 Т ^714-2 *1 сам является рядом Лейбница, а <<первый отброшенный член» — не что иное, как первый член остатка. Поэтому утвер- ждение данной теоремы немедленно получится, если применить теорему 7.18 к Известно, что от перестановки слагаемых сумма не меняет- ся. Сохраняется ли это свойство для бесконечных сумм, т. е. для рядов? Далее увидим, что оно сохраняется для абсолютно схо- дящихся рядов, которые в этом отношении подобны конечным суммам, и не сохраняется для рядов, сходящихся условно. Будем говорить, что ряд \ а'п получился из ряда } ап пе- v — 1 П— 1 рестановкой слагаемых, если он состоит из тех же самых чле- нов, но расположенных в ином порядке. Мы не ограничиваем себя перестановкой только конечного числа слагаемых. Можно, например, поменять местами все члены, стоящие на четных и нечетных местах. При этом получится ряд «2 + «1 + «4 + «3 + ^6 + + • • • а2к + ®2к-1 + • • • Считаем, что он тоже получился перестановкой слагаемых из Вначале рассмотрим ряды с неотрицательными членами. Теорема 7.20. Пусть задан сходящийся ряд с неотрицатель- ными членами. Тогда любой ряд, полученный из исходного пере- становкой слагаемых, также сходится и его сумма равна сумме исходного ряда. Доказательство. Действительно, пусть дан ряд (7.50) п— 1 258
Ряд получен перестановкой слагаемых из ряда (7.50). 71=1 Возьмем произвольную частичную сумму Afn второго ряда. Она состоит из конечного числа слагаемых. Все эти слагаемые вхо- дят и в ряд (7.50), но под другими номерами. Обозначим наи- больший из этих номеров через т. Ясно, что Ат А. (7-51) В самом деле, Ат содержит все слагаемые из А'п> да еще, воз- можно, некоторое количество неотрицательных слагаемых, и, кроме того, как и для всех положительных рядов, частичная сумма Ат не превосходит суммы ряда. Из (7.51) следует ограниченность последовательности {Л^}: (7.52) Следовательно, ряд ап сходится. Переходя к пределу в (7.52), 71 = 1 получим неравенство А' А, где А' — (7.53) Итак, если переставить слагаемые у сходящегося ряда с неот- рицательными членами, то сумма нового ряда будет не больше, Чем сумма исходного ряда. Выберем теперь за исходный ряд а'п. Тогда с помощью об- 71=1 ратной перестановки из него получится ряд 1 ап- По доказан- 71=1 ному имеем: А А'. (7.54) Но из (7.53) и (7.54) следует, что А' — А. Рассмотрим теперь ряд с неположительными членами (ап 0). Умножением всех членов на (—1) его можно превратить в ряд с неотрицательными членами. Ясно, что теорема 7.20 будет справедлива и в этом случае. Наконец, докажем итоговую теорему. 259
Теорема 7.21. Если переставить слагаемые абсолютно схо- дящегося ряда, то полученный ряд будет сходиться и его сумма будет равна сумме исходного ряда. Доказательство, В самом деле, пусть задан абсол ютно схо- дящийся ряд ап. Рассмотрим соответствующие ряды (7.34) и п=1 (7.35). Любой перестановке слагаемых исходного ряда соответ- ствует точно такая же перестановка слагаемых рядов и п=1 ; а.~. При этом равенство п—1 (7.55) где штрихами обозначены члены переставленных рялов, сохра- нится. Но ряды (7.34) и (7.35) — знакопостоянные ряды, для кото- рых, как только что было установлено, перестановка членов не меняет сумму. Значит, (7.56) Из (7.55) и (7.56} следует, что 72 — 1 Для условно сходящихся рядов справедлива теорема, кото- рую приводим здесь без доказательства. Теорема 7.22 (теорема Римана), Пусть задан условно схо- дящийся ряд. Тогда для любого действительного числа А (вклю- чая символы +ос и —ос» можно так переставить его слагаемые, что сумма полученного ряда будет равна А, Эта теорема показывает, что бессмысленно говорить о сумме условно сходящегося ряда безотносительно к порядку его слага- емых, тогда как для абсолютно сходящегося ряда порядок сла- гаемых — фактор несущественный. 260
7.4. Функциональные ряды Рассмотрим ряд У7 ип (®), (7.57) 71—1 где ип(х} — функции, определенные на некотором промежутке (а, Ь). Как понимать сходимость такого ряда? Самый простой способ — поступать так же, как в случае других операций с функциями. А именно, будем говорить, что ряд (7.57) сходится в точке xq е (а, Ь), если сходится числовой ряд Е( А М^о)- ' ) п=1 Множество всех точек, в которых ряд сходится, носит название области сходимости. Известно, что конечная сумма непрерывных функций непре- рывна, производная суммы равна сумме производных и т. д. Как обстоит дело в случае бесконечных сумм? Оказывается, при по- точечном определении сходимости ни одно из этих свойств не со- храняется. Так, если все ип(х) в (7.57) непрерывны в точке х^ то сумма ряда(7.57) S(x) может оказаться разрывной в этой точке. Поэтому для того чтобы гарантировать выполнение требуемых свойств, требуется наложить на ряд дополнительные ограниче- ния. Определение 7.5. Числовой ряд с положительными члена- ми называется мажорантой для функционального ря- п -1 да (7.57) на промежутке (а, Ь), если Vn \/х G (а, Ь) => |wn(rr)| ап. (7.58) Разумеется, мажоранта существует не для всякого ряда и определяется неоднозначно. Теорема 7.23 (о непрерывности суммы функциональ- ного ряда). Пусть задан функциональный ряд (7.57), удовле- творяющий следующим условиям: 1) Vn ип(х) е C({a,b)Y, 2) существует сходящаяся мажоранта ап на ty- п=1 261
Тогда ряд (7.57) абсолютно сходится на (а, Ь) и его сумма S(x) непрерывна на (а, Ь), Доказательство. Действительно, возьмем произвольную фиксированную точку xq Е (а, Ь). В силу второго условия тео- ремы и (7.58) получим по первому признаку сравнения абсолют- ную сходимость функционального ряда. Докажем, что его сумма S(x) непрерывна в точке то. Запишем следующие соотношения: 5(ж) = Sm(x) + #т(я), где *5(^о) “ Sm(xo) + 7?т(то). НДх) — остаток ряда; |$(ж) S(^o)| — (^тп(^) $ттг(#о)) Т ^т(^) ^т(^о) Оценим остаток ряда n—m-f-l (7.59) / — ^-т- п—т-Н (7.60) Величина ат представляет собой остаток сходящегося числового ряда (мажоранты), поэтому она стремится к нулю при m —> оо. Тогда по Возьмем произвольное е > 0 и поделим его на 3. определению бесконечно малой для - > О 37V: — Положим, т — N, тогда из (7.60), (7.61) .следует, что Е \/ х Е (а, Ь). (7.61) (7.62) В силу (7.4) (7.63) Далее, Sn(x) представляет собой конечную сумму непрерывных функций и, значит, сама непрерывна на (а, Ь). в частности в точ- тт ' Е ке xq. По определению непрерывности для того же самого - > 0 3U(a;o): \/х Е U(a?o) => |^(z) - 5лг(жо)| (7.64) 262
Из (7.63) и (7.64) следует, что |5(ж) —. 5(^о)| < е. (7.65) Итак, для любого е > 0 нашлась окрестность U(rro), такая, что для любого х из этой окрестности выполняется неравенство (7.65). А это и означает непрерывность S(x) в точке х$. В силу произвольности xq отсюда следует утверждение теоремы. Отметим, что наличие сходящейся мажоранты явилось суще- ственным условием данной теоремы, без которого не прошло бы доказательство. Теорема 7.24 (об рядов). Пусть задан р интегрировании функциональных яд (7.57), удовлетворяющий следующим условиям: l)Vn ип(х)еС([а .4); 2) существует сходя] щаяся мажоранта ап на [а, 5]. Тогда ряд (7.57) аб< равенство м а 71—1 юлютно сходится на [а, Ь] и справедливо +оо Ь bn(x)^dx = 1 un(x)dx, (7.66) 11 1 а причем сходимость ряда в правой части (7.66) гарантируется. Замечание. Обратим внимание, что в отличие от теоремы (7.57) ряд задан на отрезке, а не на произвольном промежутке, что суще- ственно используется при доказательстве данной теоремы. Доказательство. В силу теоремы 7.23 ряд абсолютно сходит- ся на [а, Ь], а его сумма S(x) представляет собой непрерывную на [а, Ь] функцию. Снова запишем равенство при любом натураль- ном т: S(x) = Sm(x) + Л„(ж). (7.67) 71—1 YI-ТП‘ 1 Поскольку S( х 1 и Sm(x) непрерывны на га, Ь], то из (7.67) сле- дует, что и остаток Rm(x) непрерывен на [а, Ь], а тогда все эти три функции интегрируемы на [а, Ь]. Проинтегрируем равенство (7.67) 263
b [ S(x)dx = a (7.68) Заметим, что по свойствам определенного интеграла ь тп п=1 а (7.69) Мы видим, что интеграл от частичной суммы Sm(x) равен ча- стичной сумме ряда, стоящего в правой части (7.66). Оценим те- перь второе слагаемое в (7.68): (7.70) Но ут в (7.70) равно константе (Ь — а), умноженной на остаток сходящегося числового ряда (мажорантцт) и поэтому является бесконечно малой величиной при m *•-> оо. Значит, по теореме ь «о зажатой переменной» и Rm(x)dx —* 0 при m —> оо. Пере- а ходя в (7.68) к пределу при m —> оо с учетом (7.69) и (7.70), получим (7.66). Теорема 7.25 (о дифференцировании функциональ- ных рядов). Пусть задан ряд (7.57), удовлетворяющий следу- ющим условиям: 1) Vn Un(x) е С1 ([а,Ь]); 2) ряд (7.57) сходится на [а, 5]; 3) существует сходящаяся мажоранта для ряда ufn(x) п=1 на. [а, Ь]. 264
Тогда сумма исходного ряда дифференцируема на [а, 6] и справедливо равенство 77 = 1 72=1 (7-71) (Здесь снова в концевых точках а и b производные понимаются в одностороннем смысле.) Доказательство. Действительно, фиксируем х е [а, Ь], тогда ряд ^2 ип(х) удовлетворяет всем условиям теорем 7.23 и 7.24 на 72 = 1 отрезке [а, ж]. Значит, он абсолютно сходится, его сумма непре- рывна и к нему можно применить формулу, аналогичную (7.66): ИЛИ р 4-00 J СЕл^(*)) а ”=1 72=1 (7.72) J(EX(*))d* а п~1 Здесь буквой t обозначена переменная интегрирования во избе- жание путаницы и к интегралам от и'п применена формула Нью- тона — Лейбница. Под знаком интеграла, стоящего в правой части (7.72), нахо- дится непрерывная функция. Поэтому по свойствам интеграла с переменным верхним пределом этот интеграл дифференциру- ем и его производная равна подынтегральной функции в точке х. Первое слагаемое в правой части (7.72) — константа, произ- водная которой равна нулю. Дифференцируя равенство (7.72), получим (7.71). 7.5. Степенные ряды Важнейший класс функциональных рядов образуют степен- ные ряды, т. е. ряды вида 265
74=0 (7.73) где сп числовые коэффициенты. Члены этого ряда определены на всей числовой оси и имеют производные всех порядков. Известно, что среди всех функций наиболее «хорошими» свойствами обладают многочлены. Весьма условно ряд (7.73) можно было бы назвать многочленом бесконечной степени. Во всяком случае, можно надеяться, что такие ряды в отличие от других функциональных рядов обладают очень «хорошими» свойствами. Эта надежда полностью оправдывается, как будет видно в дальнейшем. Заметим сначала, что, каковы бы ни были коэффициенты сп, ряд (7.73) сходится в точке х = 0. Теперь докажем следующую важную теорему. Теорема 7.26 (первая теорема Абеля). Если степенной ряд (7.73) сходится при а?о Ф 0, то он сходится абсолютно при любом ж, таком, что |х| < |а?о|• Доказательство. Действительно, фиксируем |гг| < |хо| и оценим модуль общего члена ряда (7.73) IcnXg \qn, где q = (7-74) Поскольку ряд сходится в точке по необходимому признаку его общий член стремится к* нулю, епХд ~ М). Поэтому последо- вательность {cnXQ }, как всякая сходящаяся последовательность, ограничена: ЗЛ>0 ЗА: V п > N => А. (7-75) Из (7.74) и (7.75) следует, что 1^1 Адп. (7.76) Но в правой части неравенства (7.76) стоит член схццящейся гео- метрической прогрессии. Отсюда по первому признаку сравне- ния и вытекает утверждение теоремы. Все числа ж, удовлетворяющие неравенству |гг Жо|> обра- зуют симметричный интервал с центром в нуле и радиусом хо |. Таким образом, сходимость степенного ряда в точке влечет за собой его абсолютную сходимость в целом интервале. 266
Понятно, что есть три возможности: 1) нет ни одной отлич- ной от нуля точки, в которой ряд сходится. Значит, область схо- димости данного ряда — это единственная точка х = 0; 2) сре- ди точек сходимости имеются точки, сколь угодно большие по модулю. Тогда соответствующие интервалы можно расширять неограниченно, что приведет к абсолютной сходимости ряда на всей числовой оси; 3) существуют точки, отличные от нуля, в ко- торых ряд сходится, и точки, в которых ряд расходится. В этом случае соответствующий интервал нельзя расширять неограни- ченно и должен существовать максимальный интервал, в кото- ром ряд абсолютно сходится. Чтобы придать точный смысл всем этим нестрогим рассуж- дениям, введем следующее понятие. Определение 7.6. Радиусом сходимости R степенного ряда называется следующее число: R — sup{ |х|: в точке х ряд сходится}. (7.77) Радиус сходимости совпадает с точной верхней гранью мно- жества неотрицательных чисел — модулей точек сходимости. Ес- ли множество таких модулей не ограничено, то положим R — — +оо. При 0 < R С +оо можно ввести понятие интервала схо- димости, понимая под ним интервал (—Л, Я). Теорема 7.27. Пусть дан степенной ряд с ненулевым радиу- сом сходимости. Тогда он абсолютно сходится внутри интервала сходимости, расходится вне его, а в концевых точках ±7? может вести себя произвольным образом. Доказательство. Рассмотрим вначале случай R — +оо. То- гда интервал сходимости совпадает со всей числовой осью. Возь- мем произвольную точку х$. Поскольку множество модулей то- чек сходимости не ограничено, найдется такая точка х\, в кото- рой ряд сходится, причем |я?о| < |ад1- В силу теоремы Абеля ряд абсолютно сходится в точке х$. Поскольку точка х$ была выбра- на произвольно, можно сделать вывод об абсолютной сходимо- сти ряда на всей числовой оси. Пусть теперь 0 < R < +оо. Возьмем произвольную точку xq G (—R, Я) и е — R - |a?o| > 0. По свойству точной верхней грани найдется точка яд, такая, что в точке яд ряд сходится и при этом |rri | > R — е = |жо|. Но тогда по теореме Абеля ряд аб- солютно сходится в точке хц. Значит, ряд абсолютно сходится в интервале (—Я, Л). Если взять любую точку х : |т| > R, то в ней ряд заведомо расходится, поскольку в противном случае в 267
соответствующем множестве модулей нашелся бы элемент, пре- восходящий точную верхнюю грань, что невозможно. Как же практически искать радиус сходимости? Можно пред- ложить одну полезную формулу, которая хотя и не универсаль- на, но помогает во многих случаях. Теорема 7.28. Пусть задан ряд (7.73), где все коэффициенты сп отличны от нуля. Тогда его радиус сходимости R вычисляется по формуле R = lim (7.78) сп+1 при условии существования данного предела. Замечание. Здесь не исключаются случаи, когда предел в (7.78) равен 0 или Н-оо. Обозначим этот предел через с. Доказательство. Пусть вначале 0 < с < +оо. Известно, что в точке 0 ряд заведомо сходится. Возьмем х 0 и к ряду из модулей применим признак Даламбера Ita l«W;^+1l _ k| lim hi+il = И. (7.79) п^оо Спхп п—>ж |cn| С Ряд будет сходиться абсолютно при Д < с. При |ж| > с исходный ряд расходится, поскольку нарушен необходимый признак сходимости. Итак, число с обладает тем свойством, что при Д < с ряд абсолютно сходится, а при |т| > с расходится. Но тем же са- мым свойством обладает и радиус сходимости R. Следователь- но, R = с. Если с — 0, то при любом х 0 предел (7.79) будет равен +оо, что по признаку Даламбера соответствует случаю расходи- мости ряда. Следовательно, ряд сходится только в точке х = О, а это и означает, что R — 0. Если же с — +оо, то предел (7.79) будет при любом х равен нулю. Следовательно, ряд абсолютно сходится на всей числовой оси. А это значит, что R — +оо. Таким образом, формула (7.78) остается справедливой и в этих особых случаях. 1 „71 Пример 7-4- У — • п~0 Здесь 1 (П + сп = „ => R = lim „ п—»оо 1)2 / 1 у — = lim (14 ) = 1. 71—>00 V ) 268
Рассмотрим теперь наряду с рядом (7.73) ряд ^ПСпХ1- 1 П=1 (7.80) Ряд (7.80) получился из ряда (7.731 почленным дифференци- рованием. Аналогично, ряд (7-81) 71=0 получается из (7.73) почленным интегрированием. Ряды (7.80) и (7.81) сами являются степенными рядами с ра- диусами сходимости /?1 и R% соответственно. Как связаны меж- ду собой 7?, Ri и Теорема 7.29. При почленном дифференцировании радиус сходимости степенного ряда не меняется (R± — R). Доказательство. Полностью доказывать эту теорему мы здесь не будем, однако проверим ее утверждение для случая, ко- гда радиус сходимости ряда находится по формуле (7.78). Име- ем: Взяв теперь за исходный ряд (7.81) и применив к нему теоре- му 7.29, получим, что R — R?. Иначе, справедлива следующая теорема. Теорема 7.30. При почленном интегрировании радиус схо- димости степенного ряда не меняется. Пусть задан степенной ряд (7.73) с ненулевым радиусом схо- димости R > 0. Выясним, какими свойствами обладает его сум- ма в интервале сходимости. Теорема 7.31. Сумма степенного ряда дифференцируема в интервале сходимости и ее производная вычисляется по формуле ^пспхп 1 (7.82) Доказательство. Действительно, возьмем произвольную точку хо Е (~R,R). Выберем в интервале сходимости такую точ- 26Q
ку яд, чтобы выполнялось неравенство |ято| < 1яд| < R. В силу со- хранения радиуса сходимости при почленном дифференцирова- нии у ряда из производных будет тот же интервал сходимости, а значит, этот ряд будет абсолютно сходиться в точке х^. Но тогда для исходного ряда выполнены все условия теоремы о диффе- ренцировании функциональных рядов на отрезке [—яд, яд . В си- лу этой теоремы равенство (7.82) будет справедливо на всем от- резке [—яд, яд], в том числе и в точке х$. Поскольку ад> ~ произ- вольная точка из интервала сходимости, то получаем утвержде- ние теоремы. Применив теперь теорему 7.31 к ряду из производных, най- дем, что сумма исходного ряда имеет вторую производную в ин- тервале (—/?,/?), причем /,___________. \ и ___ п—2 п п Этот процесс можно продолжать неограниченно. В результате приходим к следующей теореме. Теорема 7.32. Сумма степенного ряда с ненулевым ра- диусом сходимости бесконечно дифференцируема в интервале сходимости, причем все ее производные получаются почлен- ным дифференцированием соответствующее число раз исходно- го ряда. Заметим теперь, что, если степенной ряд имеет ненулевой ра- диус сходимости 7?, то, выбрав произвольное х из интервала схо- димости, можно проинтегрировать ряд от 0 де х. (Проверьте са- мостоятельно выполнение всех условий теоремы об интегриро- вании функционального ряда.) В результате получим, что х . _ ._ (7.83) I I / 4 v Q 71—0 П-0 Вместо рядов (7.73) можно было бы рассмотреть ряды не- сколько более общего вида (7.84) П—О Простой заменой переменной t = х — х$ такой ряд сводится к п, который отличается от (7.73) лишь обозначени- п—о 270
ем переменной. Поэтому все факты, относящиеся к ряду (7.73), остаются справедливыми и в случае ряда (7.84). Здесь тоже есть радиус сходимости, только интервал сходимости (xq — /?, xq + R) будет уже с центром не в нуле, а в точке то- Теорема 7.32 также справедлива для ряда (7.84). 7.6- Ряды Тейлора Рассмотрим ряд (7.83) с ненулевым радиусом сходимости и обозначим его сумму через S(x). Подобно действиям с многочленом (см. гл. 4), попытаемся вы- яснить, как коэффициенты сп данного ряда связаны с производ- ными его суммы в точке xq. Для наглядности запишем ряд в развернутом виде S(x) — Со + С1(т — То) 4- С2(т — То)2 + Сз(т — то)3 + • ’ • ---Нсп(т -То)л -|-- Подставив то вместо т в (7.84), найдем, что со = 5(т0). Продифференцируем (7.85) S\x) — ci + 2с2 {х — то) 4- Зсз(т — то)2 + • — • • • + псп(х — то)71-1 4- • • • Подставив вместо т в 7.86) то, получим Cl =* S'(to). Продифференцируем (7.86) Sz/(t) — 2с2 + 3 • 2сз т — то) 4- • • • 4- п(п — 1)сЛ(т — т0)п“2 4- (7.85) (7.86} (7.87) Подставив т = то в (7.87), находим, что 5"(т0) С2 = Продолжив процесс нужное число раз, придем к формуле Vn сп 5^(т0) п! (7.88) 271
Таким образом, можно записать равенство (7.89) (Мы здесь придерживаемся соглашения, что 0! = 1.) Рассмотрим теперь произвольную бесконечно дифференци- руемую (т. е. имеющую производные всех порядков’ функцию /(т), заданную в некоторой окрестности U(xq) точки xq. Соста- вим ряд 71= О (Ж ~ Ж0)П. (7.90) Ряд (7.90) назовем рядом Тейлора для функции f(x) в точке .tq. (При xq = 0 этот ряд называют также рядом Маклорена.) Спра- шивается, будет ли для этой функции выполняться равенство, аналогичное (7.89), т. е. будет ли ряд Тейлора сходиться к по- родившей его функции? Ответ, вообще говоря, отрицательный. В качестве примера рассмотрим функцию /(ж) = _ ] е , при х 0; 0, при х — 0. (7.91) Ясно, что /(ж) бесконечно дифференцируема при х / 0 и очень быстро убывает при х —> 0. Пользуясь определением производ- ной, можно показать, что эта функция имеетлтроизводные всех порядков в точке 0 и все они равны нулю. Поэтому, если вы- писать для нее ряд Тейлора (7.90), где яд — 0, то увидим, что он состоит из одних нулей, а значит, сходится на всей оси к тождественному нулю. Но функция (7.91) отлична от нуля при х 7^ 0. Таким образом, для данной бесконечно дифференциру- емой функции порожденный ею ряд Тейлора сходится, но не к ней. Этот пример показывает’, что суммы сходящихся степенных рядов образуют более узкий класс среди всех бесконечно диф- ференцируемых функций. Они носят название аналитических функций и имеют ряд дополнительных замечательных свойств, которыми произвольные бесконечно дифференцируемые функ- ции не обладают. Попытаемся теперь выяснить, при каких условиях бесконеч- но дифференцируемая функция раскладывается в ряд Тейлора. 272
Итак, пусть /(х) 6 С°°([7(хо))- При любом п для нее будет справедлива формула Тейлора /(т) = / (х0) + f%xQ)(x - х0) + • • • (х - х0)п + гп(х), (7.92) где гп(х) — остаточный член формулы Тейлора. Заметим теперь, что многочлен Гейлора является не чем иным, как частичной суммой ряда Тейлора (7.90). Отсюда получаем следующую тео- рему, утверждение которой непосредственно вытекает из (7.92). Теорема 7.33. Пусть функция /(х) е C°°(U(xo)). Для то- го чтобы эта функция раскладывалась в ряд Тейлора в точке х G СДхо), необходимо и достаточно, чтобы в этой точке оста- точный член удовлетворял условию lim rn(x) = 0. п—>ОС (7.93) Доказательство, Действительно, по теореме о связи преде- лов с бесконечно малыми, частичные суммы ряда Тейлора будут стремиться к /(х), т. е. lim zZ —~ = п—>оо к\ к=0 тогда и только тогда, когда выполняется (7.93), а это равносиль- но утверждению данной теоремы. Теорема 7.33 дает хотя и исчерпывающее, но трудно прове- ряемое условие разложимости функции в ряд Тейлора. Поэтому приходится искать более обозримые достаточные условия та- кого разложения. Одно из простейших, хотя и весьма грубых, условий такого типа формулируется следующим образом. Теорема 7.34. Пусть функция /(х) е Coc(U(xq)). Если 37И>0: Vn Vx 6 U(xo) => |/(n)(^)| M, (7.94) то функция /(х) раскладывается в ряд Тейлора в U(xq). Доказательство, Действительно, запишем остаточный член гп(х) формулы Тейлора в форме Лагранжа гп(х) = :7--—~(х - хп)п, где с€[я-0,х]. (п + 1)! 273
Фиксируем х Е U(xq) и оценим гп(х\ используя (7.94), (7.95) Но, как было установлено ранее, при любом положительном а ап имеем: lim — — 0, откуда следует, что правая часть неравен- п—Tl\ ства (7.95) стремится к нулю при п —» оо, а следовательно, по теореме «о зажатой переменной» стремится к нулю и гп(х]. Но тогда по теореме 7.33 функция f(x) раскладывается в точке х в ряд Тейлора. В силу произвольности точки х получаем утвер- ждение теоремы. Ранее, изучая формулу Тейлора, мы выписывали эту форму- лу при х’о = 0 для шести стандартных функций. Приведем те- перь для этих же функций разложения в ряд Тейлора: Для каждого разложения указана область, на которой оно спра- ведливо. Выведем все эти формулы, кроме (7.101), доказатель- 274
ство которой представляет большие трудности, чем в случае остальных разложений. Вид соответствующих рядов Тейлора вытекает из формул для n-х производных функций7 которые были разобраны в подразделе, посвященном формуле Тейлора. Так что здесь остается лишь проверить выполнение достаточно- го условия. Прежде всего рассмотрим ех. Выберем произвольную окрест- ность нуля радиуса а > О /7(0) = {ж : |я| < а}. Здесь а — любое положительное число, которое вовсе не пред- полагаемся малым. В этой окрестности справедлива следующая оценка: ех < еа; 4 аким образом, здесь выполняются условия теоремы 7.34 и, сле- довательно, ех раскладывается в ряд Тейлора в U 0 . В силу про- извольности а отсюда получается разложение (7.96). Для sina: и сона: получаются оценки сразу на всей числовой оси: (7.102) Поэтому в силу теоремы 7.34 справедливы разложения (7.97) и (7.98). Разложение (7.99) — хорошо знакомая из школы формула суммы бесконечно убывающей геометрической прогрессии со знаменателем q — — х. Интегрируя (7.991 от нуля до х. где х Е (—1,1), получим раз- ложение (7.100). Можно заметить, что ряд (7.100) сходится и в точке 1. Оказывается (здесь мы это не доказываем), что его сум- ма совпадает с In 2. Так что разложение (7.100) справедливо и для точки 1. 7.7. Ряды с комплексными членами Рассмотрим ряд с комплексными членами УЗгде wn^un + ivn- п—1 (7.103) 275
Ряд (7.103) считается по определению сходящимся, если сходят- ся два ряда с действительными членами у ип и у vn, причем П=1 П~1 его сумма полагается рапной (7.104) В противном случае ряд ( .103) расходится. Теорема 7.35. Пусть сходится ряд > тогда сходится и 71=1 / Д'и- П“1 Доказательство. В самом деле, |гсп| — у/зД + Д, откуда вы- текают очевидные неравенства К < \wn (7.105) Из неравенств (7.105) по первому признаку сравнения рядов с положительными членами следует, что сходятся ряды \ип и п=1 |сп|, а тогда, как известно, сходятся и ряды и уп, П— 1 П=1 г 77=1 что равносильно сходимости ряда (7.103). Как и е случае с дей- ствительными членами, если сходится ряд из модулей ' |wn|, ?г~ 1 то ряд (7.103) называется абсолютно сходящимся. Можно рассмотреть степенные ряды с комплексными коэф- фициентами и комплексной переменной z: п 0 (7.106) Теорема 7.36 (теорема Абеля). Если ряд (7.106^ сходится в точке zq Ф 0, то он абсолютно сходится для любых х., таких, что |z| < |го|. 276
Доказательство. Доказательство практически дословно по- вторяет доказательство теоремы Абеля для действительных ря- дов. Возьмем произвольную точку z : [Д < |zo|- Тогда для моду- ля члена ряда (7.106) в этой точке получим оценку \cnZn\ = \CnZ^\ z ZQ Aqn. (7.107) Здесь q — — < 1, и последовательность 1сп2л | ограничена (кон- zo стантой Л), поскольку по необходимому признаку cnz$ —> 0 при п —> оо. В силу первого признака сравнения рядов с положи- тельными членами из (7.107) вытекает абсолютная сходимость ряда (7.106). Заметим, что если изобразить комплексные числа как точ- ки на комплексной плоскости, то неравенству |г| < |zo| удовле- творяют все точки, расположенные внутри круга радиуса |го| с центром в начале координат. Соответственно, вместо интервала сходимости в действительном случае здесь возникает круг схо- димости радиуса R, где радиус сходимости R определяется со- отношением R — sup < |г|: У CnZn сходится в точке z > . I n—Q J Внутри круга сходимости ряд (7.106) сходится абсолютно, вне круга он расходится, а на границе поведение ряда может быть каким угодно. Если R — 0, то ряд сходится только при z — 0, а если R = +оо, то ряд абсолютно сходится на всей комплексной плоскости. Ранее было доказано, что функция ех раскладывается на всей числовой оси в степенной ряд Естественно определить ez как сумму такого же ряда, где вместо действительной переменной х стоит комплексная переменная z. (7.108) Исследуем ряд (7.108) на сходимость при z 0 по признаку Да- ламбера 277
lim - — lim 71 i — О Таким образом, данный ряд абсолютно сходится при любом z (R = +оо), а функция ez определена тем самым на всей ком- плексной плоскости. Возьмем теперь z = гср, где ср — действительное число. Тогда, отделяя действительную часть от мнимой, получим Но в скобках в (7.109) стоят ряды, сходящиеся соответственно к cos <р и sin <р. Поэтому справедливо равенство егф = cos ср + i sin ср. (7.110) Подставив в (7.110) (—ср) вместо <р, получим е г<₽ — cos ср — zsincp. (7-111) Формулы (7.110) и (7.111) носят название формул Эйлера. Из них можно выразить cos ср и sin ср через экспоненты в комплексных степенях: COS ср =---— ; sin ср =-------—. 2г Можно показать, что функция сД определенная по формуле (7.108), обладает многими свойствами обычной экспоненты. На- пример в*1+*2 = е21ег2. = enz^ (7.112) Если z — и + w, то, учитывая формулы Эйлера и (7.112), полу- чим ez — еие™ = ew(cosv Tisinv). (7.113) 7-8. Приложение* Прежде всего вернемся к критерию Коши сходимости после- довательности и докажем его достаточность. 278
Итак, пусть задана фундаментальная последовательность {Ьп}. Докажем, что она имеет предел. Возьмем произвольное е > 0 и поделим его на три. Тогда по определению фундамен- тальной последовательности 37V: Vn,fc N => \Ьп - Ьк\ < о Положим к — N, тогда из (7.114) следует, что Vn TV => fyv — | < < fc/v + |. О О (7.114) (7.115) £ (А также неравенство |ЬП| \Ь]у\ + -.) Таким образом, последо- вательность {Ьп} ограничена. Положим Рт = inf {bn}} тС&т qm = sup {fen}. п^т Ясно, что справедливо неравенство Pm Рт+1 Qm+1 Ятч ибо при переходе от множества к его подмножеству точная ниж- няя грань не уменьшается, а точная верхняя грань не увеличива- ется. Значит, отрезки [pm,Qm] образуют систему вложенных от- резков. В приложении к гл. 3 была рассмотрена теорема о вло- женных отрезках (см. теорему 3.44) и доказано существование единственной точки с, принадлежащей всем отрезкам. В нашем случае пока не известно, стремятся ли к нулю длины отрезков [pmiQm]- Поэтому можно утверждать лишь, что такая точка с существует, но пока не делаем вывод о ее единственности. Итак, Зс: (7.116) Но V п т рт = inf {Ьп} < bn < sup{bn} = qm. (7.117) Из (7.116) и (7.117) следует, что и с7 и Ьт принадлежат отрезку [pw, Qm], а тогда справедливо неравенство \Ьп - с| Qm Рт • (7.118) Но из (7.115) следует, что 279
Mm^N 6/v — 7; inf {brJ = pm < qm = = sup {kJ < b/v -b -. (7.119) п'гп‘ Из (7.119) вытекает, что V т > N => qm - рш < — < е. (7.120) Сравнив (7.118) и (7.120), находим, что \/п > N Ьп — с| < е. Итак Ve>0 ЯЛ: Ъп-с (7.121) Но (7.1211 есть не что иное, как определение предела. Значит, lim Ьп — с. п—оо (Отсюда, в частности, следует единственность точки с.) Важно подчеркнуть, что, если при доказательстве необходи- мости критерия Коши мы опирались лишь на определение пре- дела, то в случае достаточности пришлось использовать теорему о вложенных отрезках, которая сама существенно опирается на строение действительной числовой оси. Представим себе человека, которому известны только рацио- нальные числа, и который ничего не слышал о числах ирра- циональных. Возьмем последовательность рациональных чисел, сходящуюся, например, к иррациональному числу \ 2. Какой вывод сделает этот человек? Он скажет, очевидно, что перед ним — фундаментальная последовательность, у которой нет пре- дела. Так что по тому, выполняется ли достаточность критерия Ко- ши, можно делать определенные выводы о строении множества чисел, с которыми мы имеем дело. И вообще, наличие точной верхней грани у ограниченного множества, достаточность кри- терия Коши, существование предела у монотонной ограничен- ной последовательности — все это разные аспекты одного и то- го же фундаментального факта: действительная числовая ось сплошь заполнена действительными числами, в ней <отсутству- ют дыры». На «высоконаучном языке» это называется «полно- той пространства действительных чисел». 280
А теперь вернемся к функциональным рядам. При доказа- тельстве важнейших теорем об этих рядах выдвигалось требова- ние наличия сходящейся мажоранты. Но такое требование мож- но ослабить. Для этого дадим следующее важное определение. Определение 7.7. Пусть на промежутке (а, Ь) задана функциональная последовательность {/Дт)}. Будем говорить, что она равномерно сходится на (а, Ь) к /(т) (обозначение: /Дя) =4 /(ж)), если Ve>0 3.ZV: Vn N и Vt G (а,Ь) => |/Д#) — /(#)| < £• (7.122) Заметим, что из простой поточечной сходимости последова- тельности следует наличие такого N в каждой точке. Но для каждбго х G (а, Ь) такое N будет, вообще говоря, свое и ни отку- да не следует, что при заданном е > 0 найдется единое N сразу для всех ж, при которых выполняется (7.122). Требование равно- мерной сходимости гарантирует наличие такого единого N. ) Определение 7.8. Пусть на промежутке (п, Ь) задан функ- циональный ряд ип(х). Этот ряд называется равномерно схо- п=1 дящимся на (а, Ь), если на (а, Ь) равномерно сходится последова- тельность его частичных сумм (5Дт) =4 S(x)). Теорема 7.37 (признак Вейерштрасса). Пусть на проме- жутке (п, Ь) задан функциональный ряд ^^иДх). Если у этого 71 — 1 ряда существует на промежутке (а, Ь) сходящаяся мажоранта, то он равномерно сходится на (а, Ь). Доказательство. Действительно, по условию существует та- кой сходящийся ряд с положительными членами ап, что п= 1 Vn и Vt G (п, b) |иДт) (7.123) Как и ранее, из (7.123) следует абсолютная сходимость ряда на (а, Ь). Далее, для любого п можно выписать соотношение между суммой, частичной суммой и остатком ряда: откуда (7.124) 281
Оценим модуль остатка \Rn(%) к=п к=п (7.125) Но величина ап в (7.125) —- это остаток сходящегося числового ряда, который стремится к нулю при п —> оо. Поэтому Ve>0 3 2V: Vn N => |anl < e. (7.126) Возьмем произвольное e > 0 и найдем соответствующее N. То- гда из (7.126), (7.125) и (7.127) следует, что V п N и V х Е {а, Ъ) => sn(x) — £(#)! <£- Но это и означает, что последовательность частичных сумм рада равномерно сходится на (а, Ь), т. е. ряд равномерно сходится на (а, Ь}. Читателю предлагается самостоятельно ответить на вопрос: «Какие изменения нужно внести в доказательства теорем о функциональных рядах, если заменить требование существова- ния сходящейся мажоранты на равномерную сходимость?».
Г лава 8 ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 8.1. Основные определения При изучении многих явлений природы не удается непосред- ственно найти закон, связывающий рассматриваемые величины, но легко установить зависимость между неизвестной функцией, ее производными и независимыми переменными. При этом по- лучим уравнения, содержащие неизвестные функции под зна- ком производных или дифференциалов. Такие уравнения на- зываются дифференциальными. Нахождение неизвестных функ- ций, определяемых дифференциальными уравнениями, и явля- ется основной задачей теории дифференциальных уравнений. Если в дифференциальном уравнении неизвестная функция зависит только от одной переменной, то дифференциальное уравнение называется обыкновенным. Например: xf(t) — tx(t) ~ t2; d2y dy 71 + Ут = ycosx; dxz dx xdx + ydy = dx. Если же неизвестная функция, входящая в дифференциаль- ное уравнение, зависит от нескольких переменных, то диффе- ренциальное уравнение называется уравнением в частных про- изводных. Например: В этой главе будут рассмотрены обыкновенные дифференци- альные уравнения. 283
Определение 8.1. Порядком дифференциального уравне- ния называется максимальный порядок производной неизвест- ной функции, входящей в уравнение. Обыкновенное дифференциальное уравнение n-го порядка имеет вид ...,у(п)) = 0, (8.1) где Т — некоторая функция. Определение 8.2. Если левая часть уравнения (8.1) явля- ется многочленом относительно производной максимального по- рядка, то степень этого многочлена называется степенью диф- ференциального уравнения. Например: (у")5 + (у')7 - у5 + Л = о — уравнение второго порядка пятой степени. Определение 8.3. Решением дифференциального уравне- ния называется функция, которая при подстановке в уравнение обращает его в тождество на некотором интервале. Эта функция должна иметь, по крайней мере, столько производных, каков по- рядок дифференциального уравнения. Легко проверить, что для уравнения dx — = х dt х = ef будет решением, а для уравнения у" + у = О решениями будут у — sin х и у = cos х. Определение 8.4. Семейство решений, содержащее все без исключения решения этого дифференциального уравнения, на- зывается общим решением. В случае дифференциального урав- нения n-го порядка имеем семейство /(ж;с1,С2, ... ,сп), завися- щее от п произвольных постоянных. Решение, получающееся из общего при конкретных значениях постоянных щ, С2, ..., сп, называется частным решением: график частного решения — интегральной кривой уравнения. Процесс нахождения реше- ний дифференциального уравнения называется интегрировани- ем дифференциального уравнения. Дифференциальное уравне- ние считается проинтегрированным, если его решения найдены в явном виде 284
У = У(х) (8-2) или определяются неявным уравнением Уравнения (8.2) и (8.3) называют интегралами дифференци- ального уравнения. 8.2. Уравнения первого порядка, разрешенные относительно производной Дифференциальные уравнения первого порядка первой сте- пени можно разрешить относительно производной у- f(x,y)- (8.4) Простейший вид такого уравнения у' = /(ж) рассматривал- ся в интегральном исчислении. Тогда было установлено, что х Рассмотрим уравнение (8.4). Производная функции yf задает угловой коэффициент касательной к кривой у — у(х) в точке с абсциссой х. Следовательно, уравнение (8.4) каждой точке (х, у сопоставляет направление касательной к интегральной кривой в той же точке. Если это направление изобразить отрезком, то получится поле направлений. Задача интегрирования диффе- ренциального уравнения заключается на геометрическом языке в том, чтобы найти кривые, направление касательных к которым в каждой точке совпадает с направлением поля. Пример 8.1. — -у х 0. В каждой точке кроме (0,0) ах х угловой коэффициент касательной к интегральной кривой сов- у „ падает с —. Очевидно, что любая прямая с уравнением у — сх х обладает тем свойством, что угловой коэффициент касательной к ней в любой ее точке (х,у) равен у' = с — Следовательно, х интегральными кривыми дифференциального уравнения будут прямые у = сх (рис. 8.1). В дальнейшем мы научимся решать некоторые простейшие типы дифференциальных уравнений. Однако рассчитывать на 285
Рис. 8.1 Рис. 8 2 то, что в общем случае нам удастся найти решения таких урав- нений, не приходится. Поэтому при исследовании дифференци- альных уравнений наметились два направления; качественная теория, когда мы, не имея аналитического выражения для ре- шений, делаем выводы об их поведении, и численные методы, где мы приближенно вычисляем значения конкретного решения в конкретных точках с заданной точностью |эти направления будут рассмотрены на примере метода изоклин и метода, лома- ных Эйлера). Определение 8.5. Изоклинами называются геометрические места точек, в которых касательные к искомым интегральным кривым сохраняют постоянное направление. Поэтому уравнения изоклин имеют вид: /\х,у) — к. Любая интегральная кривая, пересекающая изоклину, имеет в точке пе- ресечения угловой коэффициент касательной, равны! к. Взяв ' достаточно большой набор изоклин и отметив на каждой их них кусочки касательных, можно представить поведение интеграль- ных кривых подобно тому, как металлические опилки в магнит- ном поле выстраиваются в известном опыте вдоль силовых ли- ний. Пример 8.2, Здесь изоклинами являются линии ах у х 1 1 т-г 1 ( 1А 1 — — к, т. е. прямые у — ~~тх- Поскольку к I —— I = —1, по- ту к \ к ле направлений (которое имеет угловой коэффициент к) орто- гонально изоклинам. Кажется правдоподобным, что интеграль- ными кривыми будут окружности х2 + у2 = с2 (рис. 8.2). Это подтверждается и аналитическими выкладками. 286
8.3. Метод ломаных Эйлера Класс дифференциальных уравнений, для которых можно найти точное решение, весьма узок. Поэтому уже cg времен Л. Эйлера используются приближенные методы при решении дифференциальных уравнений. Многие современные методы численного интегрирования представляют собой то или иное уточнение (улучшающее скорость приближения* метода лома- ных Эйлера. Этот метод состоит в следующем. Для приближенного вы- числения значения искомого решения у(х) на отрезке [.то,Ь от- резок делится на п равных отрезков длины h (шаг вычисления j, Xi = xq + hi. Приближенные значения искомого решения в точ- ке Xi обозначаются у?. Для вычисления у\ заменяем на ад-яд] искомую интегральную кривую отрезком ее касательной в точке (хо,уо)- Следовательно, у\ - уо + hy'Q, где у;> = /(жо,уо). Анало- гично, у2 = yi + hy{, где у'г = f\xx, yi), ...,уп = Уп-1 + где у'п-1 = f(xn-i,yn-i) <рис. 8.3 . При h —> 0 ломаные Эйлера при- ближаются к графику искомой интегральной кривой. Можно по- казать, что в случае «достаточно хорошей» функции /(z, у) для Уе>038>0, такое, что при шаге h < б ломаная б^дет отли- чаться от графика истинного решения меньше, чем на г на всем отрезке [жо, Ь\. В результате получится ломаная, которая носит название ломаной Эйлера. ч8.4. Теорема существования и единственности Рассмотрим задачу Коши. Требуется найти решение у(а?) уравнения • у'=^Ш,у\ (8.5) удовлетворяющее начальному условию Уо = У&о)- (8.6) 287
Оказывается, что при некоторых предположениях относи- тельно правой части уравнения (8.4) эта задача всегда разреши- ма и решение единственно. Важность задачи Коши с физической точки зрения состоит в том, что условия, присоединенные к уравнению, описывающему какой-либо процесс, делают задачу «физически определенной». Назовем множество А на плоскости открытым, если каждая точка Мо(то,уо) этого множества входит в него вместе с целой окрестностью U(jWq)- Примером открытого множества служит круг без граничной окружности. Множество А называется связным, если любые две его точки М1(тх,у1). и М^Х2,У2) можно соединить непрерывной кривой, целиком состоящей из точек этого множества. Примером связного множества служит уже упомянутый круг без границы, а вот два изолированных друг от друга круга обра- зуют несвязное множество. Открытое связное множество D называется областью. Теорема 8.1. Пусть в плоскости (ж, у) существует область D, для которой выполняются следующие условия: 1) /(#? У) непрерывна в области Л; а/ 2) — (т,у) непрерывна в области Л; з) (жо,уо) G D. Тогда существует 8 > 0, такое, что задача Коши имеет реше- ние у (ж), определенное на [то — 8, то 4- 8], при этом единственное. Иначе, теорема утверждает, что через точку 'что,Уо) обяза- тельно проходит интегральная кривая, и только одна. Существо- вание и единственность решения можно утверждать лишь на от- резке [то — 8, то 4- 8]. Однако можно снова применить теорему, взяв за начальную точку (то + 8,у(то + 8)). При этом нужно, чтобы решение не выходило за границу области D, т. е. точка (то 4-8, у (То 4-8)) принадлежала бы области D. Аналог ично мож- но продолжать решение и влево, через точку, (то — 8; у(то — 8)). В качестве примера рассмотрим уравнение yf — Такие уравнения мы научимся решать далее, а сейчас сообщим лишь, что все решения данного уравнения имеют вид у = (т 4- С)3, где С — произвольная постоянная, и, кроме того, есть еще решение, тождественно равное нулю. Если мы зададим начальное условие у(0) — 1, то найдется единственное решение, у = (т 4- I)3, удовлетворяющее этому 288
условию. Однако, если мы зададим начальное условие ?/(1) = О, то обнаружим, что имеются два решения: у = (х — I)3 И у = О, которые удовлетворяют этому условию, т. е. налицо наруше- ние единственности. Причина в том, что у точки (0,1) имеется окрестность, в которой выполнены все условия теоремы 8.1. А у точки (1,0), как и у любой другой точки вида xq, 0, в каждой окрестности найдутся точки (а именно, все точки, лежащие на оси Ох\ в которых не существует частная производная по у от правой части исходного уравнения. Обметим также, что решение, тождественно равное нулю, обладает тем свойством, что в каждой его точке нарушается единственность. Такие решения называются особыми (см. под- разд. 8.19). 8.5. Уравнения с разделяющимися переменными Определение 8.6. Уравнение вида у' = /(ж)о(?/) называется уравнением с разделяющимися переменными. Учитывая, что у' = —, получим ах Тогда общим интегралом будет / 0(у) J Если уравнение д‘у) = 0 имеет действительные корни вида у = Ь, то функции у и: Ь также будут решениями уравнения (8.7). Пример 8.3. Разделив переменные, интегрируем dy dx 7 X dx 5 0. 289
Потенцируя, получим равенство у\ — Съ (где С2 >0), ко- торое эквивалентно равенству у = или у — Сх< где С мо- жет принимать как положительные, так и отрицательные значе- ния. Кроме того, при делении на у было потеряно решение у — 0. Поэтому общее решение данного уравнения у — Сх, причем С принимает любые значения. Пример 8.4. ж(1 + у2) dx — у( 1 Т х2) dy = 0. Разделив переменные, интегрируем Пример 8.5. Полагая z ~ 2х + ?/, получим dy dz dx dx Разделяя переменные и интегрируя, получим — dx; In \z + 2| = х + InCi; \z + 2| - Ciex; z + 2 - Cex; 2x + у ~ — 2 + Cex ; у — Cex -2x- 2, где С может принимать как положительные, так и отрицатель- ные значения. Кроме того, при делении па 2 4-2, было упущено решение 2 4-2 — 0. Поэтому общее решение данного уравнения 2х 4- у 4- 2 = Сех, причем С принимает любые значения. Уравнения вида dy = f(y\ dx \х/ называются однородными и приводятся к уравнениям с разделя- У ющимися переменными с помощью замены z — —. Тогда у = xz, х 290
dy dz — — x-—h z. Подставив последнее равенство в уравнение, по- лучим rz ч dz dz dx /(г) = х — + z\ ---------= —. dx j(z) — z x Заметим, что в случае /(z) = z однородное уравнение яв- ляется уравнением с разделяющимися переменными (см. при- мер 8.3). Пример 8.6. Вводим новую функцию z — —, тогда х 8.6. Линейные уравнения первого порядка Линейным дифференциальным уравнением первого поряд- ка называется уравнение, линейное относительно неизвестной функции и ее производной, т. е. имеющее вид — + Р(х)у = Q(x), (Id' (8-8) где Р(х) и Q(t) будем считать непрерывными функциями пере- менной х в той области, в которой требуется проинтегрировать уравнение (8.8). Если Q{x) = 0, то уравнение (8.8) называется линейным однородным. В линейном однородном уравнении — + Р(х)у = О dx (8-9) переменные разделяются: dy У — —Р(х) dx. Интегрируя, получаем: 291
= Се dx э (8.10) С ф 0. При делении на у было упущено решение у0, однако оно может быть включено в найденное семейство решений, если счи- тать, что постоянная С может принимать и нулевое значение. Для интегрирования неоднородного линейного уравнения (8.8) может быть использован метод вариации постоянной. При применении этого метода сначала интегрируется соответству- ющее однородное уравнение (8.9), общее решение которого име- — I Р [х} dx ет вид (8.10). При постоянном С функция Се J является решением однородного уравнения. Попробуем теперь найти ре- шение неоднородного уравнения, считая С функцией от т, т. е. будем искать решение уравнения (8.8) в виде (8.11) где С(х) — неизвестная функция. Далее, продифференцировав равенство (8.11), из (8.8) и (8.11) получим dx — С(т)Р(х)е + С(ж)Р(т)е J — Q(^), откуда dC(x) dx Из (8.12) следует, что Q(x)e J Р(х) dx (8.12) и тогда С(х) = (8.13) 292
Мы видим, что общее решение линейного неоднородного уравнения (8.8) равно сумме общего решения однородного урав- нения (8.10) и частного решения неоднородного уравнения (8.8), получающегося из (8.13) при С] — 0. Пример 8.7. dy —----yctgx — 2a?sinT. dx Решим сначала соответствующее однородное уравнение: dy „ dy cos х , - у ctg х — 0; — = —-dx\ dx-------------------------у sin x In |?/| = In | sin.r| + InC; у = C sin x. Варьируем постоянную: у = C(j*)sinT; yf — C'(x)sinx + C(x)cosx. Подставляя в исходное уравнение, получим / \ / х \ • COS X . С (х) sm х + С (х) cos х — С (я) sin х-— 2х sm х; sin х С\х) sin х — 2х sin ж; С'(х) = 2х; С(х) = х2 + Ci. Таким образом, решение данного уравнения имеет вид у(х) — C(x)sin£ = (х2 + Ci)sinx. Некоторые дифференциальные уравнения путем замены пе- ременной могут быть сведены к линейным. Например, уравне- ние Бернулли, имеющее вид ^ + P(x)y = Q(x)yn, п/1, (8.14) сводится к линейному заменой z — yv~n. При этом dz dy z — - 1 - n f"/. 8.15 dx dx Разделим уравнение (8.14 | на yn и получим у-п + Р^у1-” = С(ж). (8.16) 293
Подставив (8.15) в (8.16), имеем 1 dz 1 — п dx + P(x)z = Q(x) — линейное уравнение для функции z. Линейные дифференциальные уравнения первого порядка. (8.8) можно решать другим способом. Сделаем подстановку у = uv, где и(х) — частное решение однородного уравнения у + Р{х)у = 0. Тогда v(uf Т Р(х)и) 4- v'u — Q(x); и1 + Р(х)и = 0 —> du п/ \ 7 — — ~Р(х) dx; In и = — Р(х) dx + Ci; и = е Так как решение частное, константу С\ можно положить рав- ной нулю. Далее Таким образом, получено то же самое решение линейного уравнения другим путем. Заметим, что решать уравнения Бернулли можно тем же са- мым способом, что и линейные, не приводя их предварительно к линейным подстановкой z — у1 п. Пример 8.8. Рассмотрим уравнение Бернулли Первый способ - вариация постоянной: у dy dx 2х ’ у 2х ’ у = С1л/ж; у = С1(ж)-/ж; 294
Cl dCi — y/x dx; Cf = 2x3'2 4- С; у — С1(я)х/ж, откуда у3 - С3(х)х3/2 = (2х3/2 + СИ2 = 2х3 + Сх3'2, Второй способ — подстановка у — uv\ ( . и \ f х2 v\u------) 4- v и = \ 2х/ u*v v3 — 2х3/2 4- С; у3 = и3г>3; у3 = х3/2(2х3/2 +С}. Пример 8.9. ху1 + У sin У sin X ~ s*n У' Так как у' —, то можно видеть, что данное уравнение будет /у»» линейным относительно х как функции от у\ — х sin?/, или xr sin у — х — sin у sin ~. Решаем методом вариации произвольной постоянной: dy 111 1 ГЧ..У — = -—; In ж =lnCtg - ; x sm у 2 x = C(y) tg^. (8.17) 295
Подставим х из (8.17) в уравнение sin у у ------у - С(у) tg - = smy sm 2 cos2 - cos Тогда С (у) = 2 sin +С, откуда получаем ответ 2 sin - Пример 8.10. Уравнение является уравнением Бернулли Делаем замену х ~ uv: Так как и - - частное решение уравнения du dy 1 то — ~-----, откуда и — и у у Подставив полученное значение и в уравнение, получим v dv 1 v3 у Откуда - In Су; --2 In Су; 2 ~ ^~2 = -2У~1пС'У- ?ZZ?7Z 296
8.7. Уравнения в полных дифференциалах Возможен случай, когда левая часть дифференциального уравнения Р(х, у) dx + Q(x, y)dy — 0 (8.18) является полным дифференциалом некоторой функции и{х,у), т. е. du = Р(ж, у) dx + Q(t, у) dy. Следовательно, уравнение (8.18) принимает вид du — 0. Если у(х) является решением уравнения (8.18), то du(x, у(х)) = 0, следовательно п(т,?/(т)) = С, (8.19) где С — постоянная, и наоборот, если у(х) обращает в тождество уравнение (8.19), то, продифференцировав это равенство, при- дем к уравнению (8.18). Таким образом, и(х,у) = С является общим интегралом уравнения (8.18). Для того чтобы левая часть уравнения (8.18) была пол- ным дифференциалом du, необходимо в случае непрерывности дР dQ частных производных ——- выполнение равенства (см. под- ду ох разд. 5.1) дР(х, у) _ dQ(x, у) (8.20) m ди ч Тогда — = Р{х,уу ди ду = Q{x,y\ откуда и(х,у) J Р(х, y)dx + C{y). Поскольку интегрирование здесь ведется по переменной х, то произвольная постоянная С не зависит от х. но является, вообще говоря, функцией от у. Продифференцировав найденную функ- цию по у, учтем, что g = и получим уравнение для нахождения С (у): + С'(у) = Q(x,y). 297
Заметим, что С (у) должно зависеть только от у, если уравнение (8.18) действительно в полных дифференциалах. Пример 8.11. (х + у + 1) dx + (ж — у3 + 3) dy = 0. Проверяем выполнение условий (8.20) Тогда д ду (а? 4- у + 1) = 1; дх (ж - у2 + 3) = 1. и(х, у) = (ж + у + 1) dx + С(у) х2 — + ху + х + С(у); Откуда ди ду = ж + С"(у) = ж - у2 + 3. С"(у) = -у2 + 3; С(у) = -^ + Зу + С1 О т. е. интегралом данного уравнения будет и Зт2 + бху — бх — 2у3 + 181/ — С2. 8.8. Уравнения порядка выше первого. Простейшие случаи понижения порядка В некоторых простейших случаях удается решить уравнения высокого порядка, сводя их к уравнениям первого порядка. 1. Уравнение имеет вид у{п} = f(x). Решение этого уравнения находится путем n-кратного интегри- рования. Пример 8.12. у^ — sin ж; ^(4) — _ cos х (71 • 298
у'" ~ — sinx + Cix 4- С2; х2 у" = cosx + Ci у + С2х + С3; ж3 ж2 у’ = sinx + Ci — + С2 — + С3х + С4; О £ у = - cos X + Cl ~ + С2 - - + С3 + С4 х + С5. В общее решение уравнения пятого порядка входят пять произ- вольных постоянных. 2. Уравнение второго порядка не содержит искомой функции, т. е. имеет вид F(x,y',y") = 0. Порядок этого уравнения может быть понижен с помощью вве- дения новой функции у' — р(х\ у” = pf(x). Тогда уравнение F(x,p,p') = 0 является уравнением первого порядка относитель- но неизвестной функции р(х). Если при этом его удается решить, то для нахождения решения у исходного уравнения необходимо решить опять же уравнение первого порядка у' ~ р{х). Пример 8.13. ху" — ?/1п —. X Положим yf — р, у" — р', тогда / з Р I Ру Р хр — р ш —; р = — ш — ОС ОС ОС — однородное уравнение, р Делаем замену — = t, р = xt и х In | In t — 11 — In (ж | + In Ci; х -—F t " tint\ dx d(lnt —1) dx In t — 1 x ’ Int — 1 = Cix; У —Pi У— xe1]C1X dx + C2. Интегрируя по частям, получим еС1Ж) + C2. 299
3. Уравнение второго порядка явно не содержит независимой переменной ж, т. е. имеет вид F(y, у', у") = 0. В этом случае порядок уравнения можно понизить, сделав заме- НУ Р(У) = У', „ d . d dp dy . У = i~y = тгр= тгтг =pp- dx dx dy dx Уравнение относительно p имеет вид (y,p,p') = 0, т. e. являет- ся уравнением первого порядка. Пример 8.14* уу" = у2у' + (у')2. Полагая р = yr\ уп ~ pfp, получим урр' = У2Р + Р2-, р(ур' - у2 - Р) = 0. (8.21) Из (8.21) Из р — 0 следует у — С. А второе уравнение является линейным относительно р и pf. Решаем его методом ва- риации произвольной постоянной. Сначала решаем однородное уравнение ур' - Р = 0; dp dy откуда Р = С{у)у (8.23) (см. пример 8.3). Подставив (8.23) в (8.22) получим уС\у)у + уС(у) - С(у)у = у2-, С\у) = 1; + (8.24) 300
Из (8.24) и (8.23) получим р(у) = у(у + С1) = у2 + Сху. Так как р(у) — разделив переменные, получим = dx; dy C1\2 In = х + С2 — решение данного уравнения. 8.9. Линейные уравнения n-го порядка Линейным дифференциальным уравнением n-го порядка на- зываемся уравнение, линейное относительно неизвестной функ- ции и ее производных и, следовательно, имеющее вид «о(ж)у(п) + ai(x)y 11 4-... + an_t(x)yf + ап(х)у = /(х). (8.25) Если /(х) = 0, то уравнение называется однородным. Если ао(х) 0, то, разделив на него, получим y(n) + + • • • + Рп-1{х)у' + рп(х)у = 0. (8.26) Самую важную теорему этого подраздела сформулируем без доказательства. Теорема 8.2 (существования и единственности). Если коэффициенты Pi(x) (i = 1,2, ...,?г) непрерывны на отрезке [а, Ь], то для каждого xq из интервала (а, 6) и любого набора чи- сел г/о9 Уь • • • > Уп-i существует и только одно, решение у(х) урав- нения (8-26), удовлетворяющее начальным условиям у(х0) =^уо, у'(х0) = У1,... ,у ' = уп-\. Теорема 8.3. Если у х) является решением уравнения (8.26), то и Су(х), где С — произвольная постоянная, является решени- ем этого уравнения. 301
Доказательство. (Су)^ + р^Су)^ + ... +рп-1(х)(Су)' + p„(x)(C-y) = = С(у№ +Р1(х)у(п г) + • • • + рп-1(х)у' + рп(х)у) = 0. Теорема 8.4. Если yi(x) и У2(х) — решения уравнения (8.26), то У1(ж) + у2 (х) — тоже решение этого уравнения. Доказательство. (pi + Уг)(п) + Pi(^)(yi + у2)(п х) + ... + +Рп-1(®)(У1 + У2)' + Рп(я0(у1 + у2) = = + Р1(ж)у}П-1) + . . . + Pn-lix^ + рп(я)У1) + + + Pl (ж)У2 ’ 1! + ••• + Рп-1(ж)у2 + Рп(^)р2) = 0. Следствием из теорем 8.3 и 8.4 является то, что линейная комбинация решений yi,• • • ,Уп линейного однородного урав- нения (8.26) с произвольными постоянными коэффициентами п У2 Сгу{ также является решением этого уравнения. г=1 Если задана комплекснозначная функция действительного переменного у(х) = и(х) -Ь w(rr), то ее производной по опреде- лению считается выражение yf (ж) = и'(х) + iv\x). Аналогично определяются и производные высших порядков. Теорема 8.5. Если линейное однородное дифференциальное уравнение (8.26) с действительными коэффициентами pi (ж) име- ет комплексное решение у(х} = и(х) + iv(x)y то действительная и(х) и мнимая v(x) части этого решения в отдельности являются решениями уравнения (8.26). Доказательство. У(п) + Р1(ж)у(п х) + ... +рп-1(х)у' + рп(х)у = = +Р1(гг)м(" + рп-1(хУи + рп(х)и + + г(г/п) + р, (,т)г("1) + ... + pn_r(x)v' + Pn(a-)v) = 0, откуда.. +pn_iu'+рпи — 0 и +piv(n~l)+... f — 0, так как комплексная функция действитель- ного переменного обращается тождественно в нуль тогда и толь- ко тогда, когда ее действительная и мнимая части тождественно равны нулю. 302
Определение 8.7. Функции yi(x), у2(ж), называ- ются линейно зависимыми на [а, Ь], если существуют постоянные а2, • • *, а™, такие, что на [а, 6' + а2?/2(ж) + ... 4- апуп(х) = 0, (8.27) причем хотя бы одно из чисел а* 0. Если же тождество (8.27) возможно только при ai = а2 — ... — ап = 0, то функции щ(аг), 7/2(ж), ..., уп(х) называются линейно независимыми на [а, Ь]. Пример 8.15. Функции 1,ж,т2, ...,жп линейно независимы на любом отрезке [п, &], так как тождество oti + а2л; + ... + 4- an+ircri = 0 возможно лишь при ах = а2 = ... = ап+1 = 0, по- скольку алгебраическое уравнение n-го порядка имеет не более п корней. Пример 8.16. Функции ек1Х, ек'2Х, .,. ,екпХ, где kj к3 при i J, линейно независимы на любом отрезке [а, 6]. Допустим, что они линейно зависимы, тогда существуют ai,a2, ... ,an, такие, что otie^137 4- иъек2Х 4- • • • 4- апекпХ = 0, (8.28) причем, например, ап / 0. Разделив (8.28) на ек1Х и продиффе- ренцировав, получим а2(^2 - + ... + an(fcn - к^кп'к^х = 0. (8.29) Разделив (8.29) на е^2 к1^х и продифференцировав, получим аз(£з - A;i)(fc3 - к2)е^-к^х +...+an(fen - fci)(fcn - к2)е^~к^х = 0. Продолжив этот процесс, имеем ап(кп - А:] )(/гп - к2) • • • {кп - kn-i)elkn к"-^х = 0. (8.30) Но ап ф 0, кг 7^ kj при г / J, следовательно, (8.30) невоз- можно. Замечание. Доказательство остается в силе и при комплексных коэффициентах къ (i = 1,2, ..., п). Теорема 8.6. Если функции yi(x),y2(x), ...,уп(х) линейно зависимы на [а, Ь], то на том же отрезке определитель IP (ж) = У1(ж) 3/2 (®) У2(ж) УгД) Уп(ж) У1 W у^-1)(ж) (п-1)/ ч Уп (X) называемый определителем Вронского, равен нулю: W(х) = 0. 303
Доказательство. Так как pi, г/2, • • •, Уп линейно зависимы на [а. Ь], то найдутся ai, «2, ..., an, такие, что «1У1(ж) + а2?/2(ж) + ... + апуга(ж) = О (8.31) на [а,Ь], причем не все оц = 0. Дифференцируя равенство (8.31) (п — 1) раз, получим: aiyi 4- а2у2 + ... + апуп = 0; aiy'i + a2?/2 + • • • + ^пУ'п = 0; (n—1) . (тс—1) I I (п— 1) п [aiyi +«2^2 + ---+<*пУп 0. Эта система, линейная и однородная по , имеет нетривиальное решение (не все аг — 0) при х 6 [а,Ь]. Следовательно, опреде- литель системы, которым является W(x), тождественно равен нулю в каждой точке ж, принадлежащей [а, Ы. Теорема 8.7. Если линейно независимые функции yi(x), Уъ(х), ...,Уп(х) являются решениями линейного однородного уравнения У^ +Р1(х')у('п + ... + рп(хУу = 0 (8.32) с непрерывными на [а, Ь] коэффициентами Рг(т), то W(х) не мо- жет обращаться в нуль ни в одной точке отрезка [а, Ь]. Доказательство. Допустим, что в некоторой точке то, при- надлежащей [а, Ь], ИД то) = 0- Рассмотрим систему Г(Х1Р1(т0) + a2y2(^o) + • • • + anPn(^o) = 0: Д1У1" 1)(«о) + а2У2” 1) (х0) + ... + апу,(г ^(жо) = 0. Решения системы ai, 0С2, ..., ап не все равны нулю, так как опре- делитель системы равен нулю. Тогда у(х) — aiPi+a2?/2+- • -+<*пУп является решением однородного уравнения у^ + pi(x)y(n~^ + + ... + рп(х)у — 0, удовлетворяющим в силу системы нулевым начальным условиям р(тд) — 0, у'(хо) — 0, ..., = 0. Таким же начальным условиям удовлетворяет нулевое ре- шение у ~ 0, но по теореме о существовании и единственно- сти решения у и нулевое решение совпадают, т. е. aipi + а^У2 + 304
4- ... 4- апуп = 0, следовательно, функции yi, у2, • • > ,Уп линейно зависимы, вопреки предположению о линейной независимости системы у^. Замечание. В теореме 8.7 обязательным является условие о том, что функции уг решения уравнения (8.26); если это условие не вы- полняется, то и теорема может быть неверна. Действительно, рассмот- рим две функции: Т¥(ж) = У1 у'1 У2 У2 Очевидно на [0,2|. Однако yi и у2 линейно независимы, так как из otiyi 4- и^Уъ = О следует, что «1 = о<2 = 0. Теорема 8.8. Общим решением при а < х < b линейного однородного уравнения у (п) +Р1(ж)у("“1) + • • -+Рп(х)у = о с непрерывными на [а, Ь] коэффициентами Pi(x) является линей- п ная комбинация у = ^^Сгуг{х} любых п линейно независимых на том же отрезке частных решений yi(x) с произвольными по- стоянными коэффициентами С(. Замечание. Иначе, нужно доказать, что любая линейная комби- п нация у = СгУг(ж) линейно независимых решений также является г—1 решением этого уравнения, и любое решение можно представить в та- ком виде. Доказательство. Если функции yi,y2, 'Уп являются ре- шением уравнения (8.26), то, как было установлено ранее, у — п — ^2 Ciyz(x) также есть решение данного уравнения. г=1 п Теперь докажем, что у = Сгуг (ж) является общим реше- г=1 нием уравнения (8.26), т. е. содержит все частные решения этого 305
уравнения. Зададим произвольные начальные условия у{хо) ~ у0, у'(жо) = У1, ..у(п-1\жо) = Уп-1, где гг0 G [а, Ь]. Получим систе- му уравнений + С2г/2(жо) + ... + Спуп(х0) = у0; Ciy'i (жо) + СгУгСжо) + ... + Сп^(ж0) = уг, .С1У1''(®о) + С2У2" 1} (ж0) + ... + Спу^ (жо) = Уп-I• Определителем этой системы является определитель Врон- ского Ж(хо), отличный от нуля по теореме 8.7. Таким образом, задав начальные условия, можно единственным образом найти коэффициенты Ci (i = 1,2, ... ,п). Тогда у = 5 С7уг будет ре- шением уравнения (8.26), удовлетворяющим данным начальным условиям. Следствие. Максимальное число линейно независимых ре- шений линейного однородного дифференциального уравнения равно его порядку. Определение 8.8. Любые п линейно независимых решений линейного однородного дифференциального уравнения n-го по- рядка называются фундаментальной системой решений (ФСР). Дадим способ построения ФСР. Задается п2 чисел а , где i = = 1,2, ..., п, к — 0,1, ..., п — 1, удовлетворяющих условию 7^0. Решения уг (гг) определим начальными значениями у^ (гго) = ар ‘ для некоторого .tq 6 [а, Ь]. По теореме 8.2 они существуют и обра- зуют фундаментальную систему, так как их определитель Врон- ского W(rr) ^Ов точке xq, следовательно, по теореме 8.7 функ- ции ?/i,?/27 . • • ,Уп линейно независимы. Так как существует бес- конечно много определителей, отличных от нуля, для каждого уравнения существует бесконечно много ФСР. 306
8.10. Линейные уравнения с постоянными коэффициентами Теперь рассмотрим уравнения второго порядка. Уравнение вида у" + py' + ЧУ = 0 (8.33) является линейным однородным уравнением второго порядка, p^q — постоянные. Теоремы 8.2— 8.8 верны и для этого уравне- ния. Будем искать решение в виде екх. Это единственная функция, производная которой пропорциональна ей: у = екх; yf ~ кекх] у" ~ к2екх. Подставим ее в уравнение (8.33): екх(к2 -\-рк + q) = 0, екх ф 0. Получим к2 + рк + q — 0. Это уравнение назовем ха- рактеристическим уравнением дифференциального уравнения (8.33). При нахождении его корней возможны три случая. 1. Дискриминант D — р2 — 4су > 0 — уравнение имеет два дей- ствительных различных корня ki k^. По теореме 8.8 общее ре- шение уравнения (8.33) имеет вид у = С\у\ + С2У2, где yi и у^ со- ставляют фундаментальную систему. Из примера 8.16 известно, что ек1Х и ек2Х линейно независимы при ki к%. Следовательно, общее решение уравнения (8.33) будет иметь вид У = Схек1Х + С2ек*х. 2. Дискриминант D — 0 — уравнение имеет два равных корня р к — fci — В качестве первой функции фундаменталь- ной системы решений выберем у\ = екх. Покажем, что в качестве У2 можно взять хекх. Действительно, у = хекх\ у' = скх + кхекх-, у" = 2кекх + к2хекх. Подставим в уравнение (8.33) 2кекх 4- к2хекх + рекх + ркхекх + xqekx — — (к2 +рк + q)xekx + екх(2к +р) ~ 0. Выражение в первой скобке равно нулю, так как к — решение ха- рактеристического уравнения, выражение во второй скобке так- же равно нулю, так как к = 307
Кроме того, yi и у? линейно независимы. Действительно, ИДж) = „кх С кекх хекх = е2/сж(1 + кх) - кхе2кх = е2кх > О для любого х. Значит, в этом случае общее решение у = С±ек1Х + C2eklXx. 3. Дискриминант D < 0 — уравнение имеет два комплексно сопряженных корня ki = а + ?'(3 и к2 = а — гб. В качестве ФСР выберем yi = ек1Х и у2 = ек<2Х. Тогда общее решение имеет вид У = Ауг + Ву2. Упростим вид общего решения. По формулам Эйлера (см. подразд. 7.7) ег<р — cos ср + i sin ср; е-гср = cos ср — г sin ср. Тогда у = Ае(оЖр)ж + Ве^~^х = еах(Аег?х 4- Ве~грж) = = еах (A cos 0а> + iA sin + В cos — iB sin 0а;) — — eax(Ci COS0X + С2 зш0ж). Пример 8.17. у" + 2у' - 24т/ - 0. Корнями характеристического уравнения к2 + 2к — 24 — 0 яв- ляются к± = — 6 и к2 — 4. Значит, общим решением будет у = = Сге-6х + С2е4х. Пример 8.18. у" + 8yz + 16^ = 0. Характеристическое уравнение к2 + 8к 4- 16 = 0 имеет один корень к — — 4 кратности два. Значит, общим решением будет у = Схе~4х + С2хе~4х. Пример 8.19. у" + yf + у = 0. Корнями характеристического уравнения к2 4- fe+1 — 0 являются , -1 + г\/3 , ~1 —?'vz3 ki =---------и к2 =--------. Значит, общим решением будет + С2 cos Каждому корню характеристического уравнения к^ 4- рк + 4- q — 0 соответствует определенное решение дифференциаль- ного уравнения (8.33). Доказано, что таким же образом можно 308
решать и линейные уравнения с постоянными коэффициентами более высокого порядка. Пример 8.20. W . // . .-1 п У + У +у + 1 = 0. У характеристического уравнения fc3 + А:2 + А; + 1 = 0 есть один вещественный корень Ai = — 1 кратности 1 и пара комплексно- сопряженных корней к-2 = i. к% = —г. Значит, общим решением будет у — С\е~х + sinх + Сз cost. Пример 8.21. yIV - 16у - 0. Характеристическое уравнение имеет четыре корня: к\^ — ±2, А34 — i2z. Следовательно, решением данного уравнения будет функция у — С±е2х + С?е 2х + Сз sin 2т + С4 cos 2т. Пример 8.22. ,jIV - Зу'" + Зу" - j/ = 0. Ранее было доказано, что если характеристическое уравне- ние для дифференциального уравнения второго порядка имеет кратный корень А, то решением дифференциального уравнения будут функции екх и хекх. Можно доказать, что если характе- ристическое уравнение для дифференциального уравнения п-го порядка имеет корень А кратности г, то решениями этого диффе- ренциального уравнения (причем, линейно независимыми) бу- дут функции екх, хекх, ..., тг~1е/сх. Характеристическое уравнение /с4 - 3fe3 + ЗА:2 - к = 0 имеет корни Ai = 0, А2Д4 — 1, поэтому общее решение данного уравнения имеет вид у = Ci + С2ех + С3хех + С4ж2ех. 8.11. Решение линейных неоднородных уравнений Рассмотрим линейное неоднородное дифференциальное урав- нение второго порядка с постоянными коэффициентами у" + Ру' + УУ ~ f(x)- (8.34) 309
Теорема 8.9. Если yi(rr) и yz(x) два решения неоднород- ного уравнения (8.34), то у\(ж) — У2(х) является решением одно- родного уравнения у" + pyf + qy = 0. Доказательство. (У1 - Уг)" + р(У1 - yi)' + g(yi - yi) = = у" +ру'\ + чул - (у'г +РУ2 + qyi) = f - f = о. Следовательно, общее решение неоднородного уравнения бу- дет иметь вид у = у о 4 у, где у о — общее решение однородного уравнения; у — частное решение неоднородного уравнения. Бу- дем искать решение у только для функций /(т) специального вида. 1. Правая часть — многочлен /(гг) = апхп 4- an_ixni 4-. • • 4- сцт 4- ад : а) если fci 0, 0, то у будем искать в виде: у = Ьпхп + 4- ... 4- Ь±х + Ьо> ф 0. Здесь Ьо? , Ьп — неизвестные коэф- фициенты. Их можно найти, подставив у в уравнение; б) если ki ~ 0, /ь2 / 0, то у будем искать в виде: у = х(Ьпхп 4- 4- ... 4- Ъ\х 4- Ьд)- В данном случае в уравнении (8.34) q ~ 0, и степень многочлена, стоящего в правой части, равна степени у', поэтому у должен иметь степень, на единицу большую, чем сте- пень /(ж); в) если ki = &2 = 0, то уравнение имеет вид yff — f(x) и его можно решить двойным интегрированием. Пример 8.23. у" - г/ = я2 - 3. Сначала найдем общее решение уо однородного уравнения у" -1/ - 0. Характеристическое уравнение fe2 — к — 0 имеет корни к± — 1, fc2 — 0, следовательно, уо — С± 4- Съех. Частное решение у неод- нородного уравнения будем искать в виде у = т(аж2 + Ьх + с). Тогда у = Зах2 + 2Ьх 4- с; уп — бах + 2Ь. Подставив полученные решения в уравнение, получаем бах + 2Ь ~ Зах2 — 2Ьх — с - х" — 3. 310
Приравняв коэффициенты при одинаковых степенях х в левой и правой частях последнего равенства, приходим к системе урав- нений —За — 1; 6а — 26 ~ 0; 26- с = -3. Решением этой системы являются числа а = — = — 1 и с — 1. Таким образом, общее решение уравнения имеет вид 2. Правая часть — экспонента /(ж) - Ае™ : а) если ki а, / а, то у будем искать в виде: у = ае0^, где а — неизвестный коэффициент; б) если fci — а, 7^ ос, то у будем искать в виде: у = ха,еах: в) если к\~ к2 — а, то будем искать у в виде: у = ах2еах. Пример 8.24» у" + у = 2е 2х. Сначала решим однородное уравнение у" + у = о. Характеристический многочлен к + 1 = 0 имеет пару комплекс- но-сопряженных корней ki = i и ^2 ~ Значит, общее реше- ние однородного уравнения имеет вид у® — Ci sin х + Oncost. Частное решение неоднородного уравнения будем искать в виде у — ае^2ж. Тогда yf = —2ае 2ж; у" - 4ае 2х. Подставив данное решение в уравнение, получаем 4ае 2х + ае 2х = 2е 2х. Сократив на экспоненту, имеем уравнение 5а — 2, откуда а — -. 5 Таким образом, общее решение неоднородного уравнения имеет вид у — Ci sin х 4- С2 cos х -I—e 2x. 5 311
3. Правая часть «комплексная экспонента» /(ж) = еаж(Л8трж + Bcosp^) : а) Если ki 2 7^ а±гр, то будем искать у в виде у — еаж(а sin рж+ + 6cos рж), где а и b — неизвестные коэффициенты; б) если = а±ф, то будем искать у в виде у — хе^х{а sin рж+ + бсоврж). Замечание. Если /(ж) является суммой функций указанного вида, то частное решение ищется в виде суммы частных решений для каж- дого слагаемого. Пример 8.25. у" — Зу' — ж2 — 2е3ж 4- 2 sin 2ж. Общее решение однородного уравнения имеет вид УО = С1 + С2е3х. Тогда частное решение ищем в виде у = ах3 + Ьх2 + сх + dxe3x + е sin 2ж + f cos 2ж; у = Зах2 + 2Ьх + с + de3x + Зс/же3,г + 2е cos 2ж — 2/ sin 2ж; у" — бах + 2Ь 4- 6de3x + 9(/же3ж — 4е sin 2ж — 4/ cos 2ж. Подставим решение в исходное уравнение и получим бпж + 2b + 6de3x + 9dxe3x — 4е sin 2ж — 4/ cos 2ж— —9ах2 — 66ж — Зс — 3de3x — 9б?же3ж — бе cos 2ж + 6/ sin 2ж = — ж2 — 2е3;г + 2 sin 2ж. В итоге имеем систему уравнений для нахождения неизвестных коэффициентов (~9а = 1; ба — 66 — 0; 26 — Зс — 0; 1-4/-6е-0; Таким образом, получим общее решение исходного уравнения 312
Замечания, 1. Если правая часть линейного неоднородного урав- нения имеет вид epx(asxs + 4- ... + то, если р не является корнем характеристического уравнения, то част- ное решение надо искать в виде у = epx(bsxs 4-... + 6о)« Если же р является корнем характеристического уравнения кратно- сти а, то частное решение уравнения следует искать в виде У = xaepx(bsxs + ... + Ьо)- 2. Пусть правая часть линейного дифференциального уравнения имеет вид ерх (Ps cos qX 4- Qs (ж) sin qx) , где один из многочленов (Fs или Qs) степени s, а другой — степени не выше ,s, тогда, если р ± iq не являются корнями характеристического уравнения, то частное решение уравнения следует искать в виде у = epx(As(x) cos qx 4- Bs(x) sin qx), а если p ± iq являются корнями характеристического уравнения крат- ности а, то частное решение уравнения следует искать в виде у ~ x^epx(As(x) cos qx 4- В3(х) sin да), где Л5(т) и Bs(x) — многочлены степени s. Пример 8.26. у" -у = ех(х2 - 1). Корни характеристического уравнения к — ±1, тогда у — xex(bzx2 + Ъ]Х 4- &о)- Пример 8.27. Трехкратным корнем характеристического уравнения будет —1, тогда частное решение нужно искать в виде у — х3е r(bixPbo). Пример 8.28. ylv 4- 2?/// + у — sin х. Так как числа ±г являются корнями характеристического уравнения кратности 2, то у — rr2(Acosrr + В sin ж). 313
Пример 8.29. у + 2yf 4- 2у = e~x(xcosx + 3sin х). Так как числа — 1 ± i являются однократными корнями ха- рактеристического уравнения, то частное решение ищем в виде у = хе ' + «о icosj? Н-(Ь1Т Н-&o)sinx'). 8.12. Огибающая семейства кривых Уравнение кривой кроме переменных х и у, вообще говоря, содержит некоторые постоянные, от которых зависят размеры, вид и положение этой кривой. Например, геометрическое место точек, удовлетворяющих уравнению (z — а)2 + у2 = Д2, (8.35; есть окружность с центром в точке (а, 0 радиуса R. Если а при- нимает различные значения, a R — постоянное, то получим се- мейство окружностей с центрами на оси Ох и одинакового рали- уса. В подобных случаях говорят, что задано семейство кривых, зависящих от параметра. Чтобы показать, что а входит в урав- нение в качестве переменного параметра, условились подобные уравнения записывать следующим образом: R[x^ у, а) — 0. -8.36 Все кривые семейства (8.36) могут касаться одной или не- скольких линий. В таком случае эту кривую (или эти несколь- ко кривых) называют огибающей данного семейства. Предпо- ложим, что кривая, заданная уравнениями в параметрическом виде х = ср(а); у = ф(а), (8.37) касается каждой из кривых семейства (8.36), причем параметр а один и тот же как в уравнениях :8.37), так и в уравнении 8.36 с Из уравнений (8.37) тангенс угла наклона касательной к кри- вой в любой ее точке равен dy ф'(а) dx ср'(а)’ а тангенс угла наклона касательной к кривой из уравнения (8.36) определяется из соотношения Хх(х, у, a) dx -4- Ху(х, у, a) dy = 0, 314
откуда dy ^'Х(х,у,а) В таком случае или Т7'(ж, у, а)ф'(а) + Т7' (х, у, а)ф'(а) = °- (8.38) По предположению, при всяком значении а кривая (8.37) касается соответствующей этому значению а кривой семейства (8.36), поэтому для всякого значения а координаты х и ?/, опре- деляющиеся уравнениями (8.37), будут удовлетворять уравне- нию соответствующей кривой (8.36). Следовательно, для всяко- го значения а справедливо равенство ^(ф(а),ф(а),а) = 0, (8.39) получаемое подстановкой х и у из уравнений (8.37) в уравне- ние (8.36). Поэтому полная производная левой части (8.39) по а должна быть равна нулю для всякого значения а, т. е. J7'(ж, у, а) <р'(«) + -^(ж> а) Ф'(а) + а) = °, где х = у(а)', у — ф(а). Принимая во внимание равенство (8.38), получим •^а(ж,у,а) = 0. (8.40) Отсюда заключаем, что координаты точек огибающей удовле- творяют уравнениям (8.36) и (8.40): •Цж, у, а) = 0; J7'(ж, у, а) = 0, (8.41) т. е. параметрические уравнения огибающей могут быть найде- ны решением уравнений (8.41) относительно х и у, откуда х и у определяются как функции параметра а. Рассмотрим приведенный ранее пример с семейством окруж- ностей (8.35). Продифференцировав (8.35) по а, считая х и у по- стоянными, получим систему уравнений для нахождения огиба- ющей семейства (8.35): 315
откуда у2 = R\ или у — ±7? — уравнения двух прямых, па- раллельных оси Ож, которые касаются всех окружностей, за- данных уравнением (8.35), т. е. являются огибающими данного семейства. Замечание. Уравнения (8.41) иногда могут определять и другие кривые. Однако, если хотя бы одна из производных или —— от- ох ду лична от нуля и обе локально ограничены в точках, удовлетворяющих уравнениям (8.41), то эти уравнения определяют только огибающую. 8.13. Уравнения Клеро* Рассмотрим уравнение у = ху' + <р(у')- (8.42) ' Положив у' — р, продифференцируем это равенство по х: р = р + х dp dx —(ж + ср'(р)) = О, откуда или — = 0, или х + <р'(р) — 0. В первом случае получаем dx р = С — const, во втором х = -“(pz(p). Из первого равенства и уравнения (8.42) получаем У = Сх + <р(С) — общее решение уравнения Клеро, а из системы у = Сх + <р(С); х = — (р'(С') (8.43) (8.44) находим еще одно решение. Заметим, что система (8.44) совпадает с параметрическими уравнениями огибающей (8.41), где в роли параметра а выступа- ет С, а ^(ж, у, С) = у - Сх — <р(С). В подразделе 8.12 было дано также достаточное условие того, чтобы система (8.41) определя- ет7 ат7 ла только огибающую: хотя бы одна из производных — или —- ох ом 316
отлична от нуля и обе ограничены. В данном случае = 1^0, —— = —С, значит, уравнение (8.44) задает огибающую, которая ох иногда может выродиться в точку, если семейство у = Сх^-у(С} является пучком прямых, т. е. прямых, проходящих через одну точку. Пример 8.30. у = ху' - (у')2. (8.45) Положим уг = р. Уравнение принимает вид у = рх — р2. Про- дифференцируем его по х\ р — р-\- xpf — 2рр\ р(х — 2р) = 0; р = 0; х = 2р. Из первого равенства и уравнения (8.45) получаем у — Сх — С2. Второе равенство приводит к системе * {х — 2р\ у = рх- р2, X X2 х2 X2 откуда р = — или у = —---— = —Решение уравнения (8.45) 2 2 4 4 х2 у = — является огибающей семейства прямых у = Сх — С2. Пример 8.31. у = ху + у. Дифференцируя уравнение, получим у' = у' + ху" + у". Обозначив yf — р, у” ~ pf, имеем р'(х +-1) = 0, откуда р = С и х = —1. Таким образом, у — Сх + С - общее решение уравнения К ле- ро — представляет собой пучок прямых, проходящих через точ- ку х — —1. В этом случае огибающей семейства прямых нет. 317
8.14. Системы линейных дифференциальных уравнений Решением системы двух уравнений dx dt dy dt = f(t,x,y); = g(t,x,y) (8.46) называется пара дифференцируемых на интервале (ti, t^) функ- ций х — x(t) иу ~ y(t), которые при подстановке в систему (8.46) обращают оба уравнения в тождества. Общее решение системы (8.46) содержит две произвольные постоянные Ci и 62. Если за- даны начальные условия x(t0) = ^0; = Уо, t С (^1,^2)? (8.47) то можно определить Ci и 62, т. е. найти частное решение. Если на плоскости задать декартову систему координат, то решения системы (8.46) х = x(t); У = y(i) (8.48) можно рассматривать как систему параметрически заданных кривых, зависящих от двух параметров С\ и С2, называемых ин- тегральными кривыми. При некоторых условиях на функции /(£, х, у) и #(£, х, у) кри- вые (8.48) не пересекаются. Таким образом, если задать началь- ные условия (8.47), то получим кривую семейства (8.48), прохо- дящую через точку (z0, Уо)- Существует и другая интерпретация решений системы (8.46), очень удобная в различных прикладных задачах, где параметр t — время, a (x(t),y(ty) - координаты точки на плоскости (х,у). Тогда решение (8.48) определяет закон движения точки по неко- dx dy торой траектории в зависимости от изменения f, а — и — dt dt координаты скорости той же точки. При такой интерпретации система (8.46) называется динами- ческой системой, плоскость (х, у) — фазовой плоскостью, а каж- дая кривая семейства (8.48) фазовой кривой. 318
Линейные системы с постоянными коэффициентами можно решать сведением их к линейным уравнениям 2-го порядка. Пример 8.32. {(/ж — За- - 2у; dt d-У q — 2х — у. dt Д ифференцируем второе уравнение Таким образом, решение системы имеет вид: C2t); Точно так же можно решать и линейные системы с постоянными коэффициентами более высокого порядка. Пример 8.33. d2x d2y лё = х' Дважды дифференцируя первое уравнение, получим d3x dy d4x d2y dt’ dt’ dt* dP 319
х^ — х — 0; /с4 — 1 -- 0; — =Ы; /сз 4 = х — Ciet + C*2e-t + С3 sin t + С4 cos t; у — C\etjr — C3 sin t — C4 cos t, так как у — d2x dt2 8.15. Уравнение радиоактивного распада Основной закон радиоактивного распада состоит в том, что скорость распада радиоактивного вещества пропорциональна количеству нераспавшегося вещества в данный момент времени. Если обозначить x(t) количество вещества в момент времени t, то этот закон можно выразить в виде следующего дифференци- ального уравнения: dx dt= -рх' где р зависит от вида радиоактивного вещества и выбора систе- мы единиц. Знак «—» означает, что количество вещества убыва- ет, т. е. скорость отрицательна (х положительно, р > 0). Пусть при t ~ 0 т(0) = zq. Решим это уравнение: dx — = —pdt] х In |т| — —pt + Ci; х = Се-1*. Учитывая начальное условие яд = С, имеем х = хде ~pt (8.49) закон радиоактивного распада. Найдем период полураспада. Периодом полураспада называ- ют время Г, за которое количество вещества уменьшается вдвое по сравнению с первоначальным значением: х(Т) = -ж0; ;; хц - хое рТ- In 2 320
Для различных радиоактивных веществ время Т колеблется от долей секунды до миллиардов лет. Уравнение (8.49 ) описыва- ет процесс радиоактивного распада приближенно. Когда веще- ства становится мало, начинают действовать другие законы, по- этому с этим уравнением связывают только время полураспада, но не время полного распада. 8.16. Закон роста биомассы Если живую клетку поместить в питательную среду, то она начнет размножаться. В качестве количественно!i характеристи- ки ее роста принимают так называемую концентрацию биомас- сы, измеряемую сухой массой клеток, находящихся в 1 см3 рас- твора. Следовательно, единицей измерения служит 1 мг/см3. Будем считать, что прирост биомассы за малый промежуток времени пропорционален количеству биомассы в данный момен™ времени и длине этого малого промежутка. Это согласуется с опытными данными для большинства одноклеточных организ- мов. Пусть хо — количество биомассы при t ~ 0. Будем измерять последовательно ее количество через очень малые промежутки времени фиксированной длины t — h. Тогда получим последова- тельность значений tq, Xi, ..., тп, где хп — количество биомассы в момент времени tn. Закон роста биомассы задается с помощью уравнения з^п+1 = кЬ'Х'п, (8.50) где к — коэффициент пропорциональности, не зависящий ни от п, ни от t. Уравнение (8.50) называется рекуррензпным уравнением, т. е. уравнением, связывающим значение члена некоторой число- вой последовательности со значениями одного или нескольких предыдущих членов этой же последовательности. Отсюда и на- звание: рекуррентные, т. е. «бегущие назад». Решением рекур- рентного уравнения называется числовая последовательность, все члены которой удовлетворяют этому уравнению. Решить ре- куррентное уравнение — значит найти все его решения. Преоб- разуем (8.50) иначе: — (kh + 1)т (8.51) или, обозначая kh 1 = q: + 1 — 321
где q не зависит от номера п. Зная то, из (8.52) найдем и т. д. Физически имеют смысл только решения с условием то > 0. Таким образом, для любого жо. найдем последователь- ность #о5 ч • • • , • • • В общем случае решить рекуррентное уравнение трудно. В данном случае: хп - qnx0 — геометрическая прогрессия. Как любая математическая модель, построенная модель опи- сывает процесс приближенно. На самом деле моделей каждого процесса может быть много, а выбор той или иной конкретной модели зависит от целей модел ирования данного явления и тре- буемой точности. Построим теперь другую модель роста биомассы. В предыду- щем случае нас интересовали значения хп концентрации биомас- сы в дискретные моменты времени tn. Теперь нас будут интере- совать значения этой концентрации х(1. в произвольный момент времени t. В соответствии с вышеизложенным получим уже не рекуррентное, а дифференциальное уравнение. Для того чтобы его получить, будем считать, что закон роста (8.51) является приближенным законом, который выполняется тем точнее, чем за меньший промежуток времени его рассматривать. Перепишем (8.52) следующим образом: (8.53) и заметим, что в (8.53) слева стоит выражение Ах h At В предположении, что все протекающие процессы достаточно гладкие, заметим, что lim dx dt Поэтому, заменив в (8.53) —- на дифференциальное уравнение dx —, а хп на :r(t), получим Civ dx 1 - - — kx при — жо- (8.54) 322
Откуда dT , , — — к dt; х In т| — kt + Ci; Inaso = C; x — x^e . Может возникнуть вопрос: «Зачем от рекуррентного уравне- ния (8.50) переходить к дифференциальному уравнению (8.54)?» Подумаем, какое уравнение труднее решить: = х^ + 1 или dx dt 100 Что проще вычислить: 100 или dx ? Ответ уже известен. = х" + 1 ? Поэтому предпочтительнее сводить все к дифференциальному уравнению. Коэффициент к называется удельной скоростью роста. Вре- мя между двумя последовательными делениями клетки называ- ется временем репродукции. Клетки, вообще говоря, размножа- ются не одновременно, но в среднем время репродукции должно совпадать со временем удвоения биомассы Т. Тогда х (П = 2жо, п /сТ г г ГТ1 тт 2#о = х$е , 1 = , т. е. 1 не зависит от х$. На самом деле к биомасса, конечно, меняется дискретно, но мы ведем измерение в единицах, значительно превосходящих массу одной клетки. За- меняем ступенчатую линию на гладкую кривую, что естествен- но, если ступеньки малы. В уравнении (8.54) можно считать из- вестным x(t) не при t — 0, а при t ~ £(ь тогда решение имеет вид х = x^ek^~to\ I федыдущее уравнение было получено в предположении, что ресурсы питания неограничены и колония не подавляется ни- каким другим видом. Более точное описание развития коло- нии клеток дает уравнение Ферхгюльста—Перла, полученное в 1845 г. Оно учитывает «эффект самоотравления» популяции или внутривидовую борьбу в популяции. Этот эффект, снижающий скорость роста популяции, объясняется следующими причина- ми: конкурентной борьбой за пищу, распространением инфекций из-за тесноты и г. д. При этом Дт = kxAt — 8т2А£, х2 обосновывается следующим образом: величина 8т2 At отража- ет снижение скорости роста популяции из-за внутривидовой кон- 323
куренции. Но конкуренция тем выше, чем больше встреч между особями, а количество встреч пропорционально т2, 8 называют коэффициентом самоотравления. Таким образом, Обозначив fc/8 = Л, получим Разделяем переменные и интегрируем: hdx . . , х --------------------------- — к at, или ш ----- x(h — x)-----------------------h — x = fct + Ci, или -----= Cekt. (8.55) h — X Отсюда x ~ ~xCekt + hCekt. При t = 0 x — то, т. e. ~~— = C. h — tq Значит, hCekt _ hxoekt hxoekt X 1 + Cekt (h — Tq)(1 + ekt) h — tq + x$ekt* И при t —* +эо величина x(t) —> h положение насыщения (h — максимальная численность популяции, теоретически воз- можная для данного вида в данных условиях). На основании модели Ферхгюльста—Перла можно рассмот- реть и более общие задачи, нанример, dX , * О . ЛТ 71 — = кх — 8т2 + N — М. dt где N — приток извне; М — численность особей, покидающих популяцию. 8.17. Почему рост деревьев ограничен Рассмотрим причины ограничения роста деревьев даже в са- мых благоприятных условиях. Почему все деревья независимо от породы растут сначала быстро, а потом рост замедляется, и, 324
наконец, совсем прекращается? Интуитивно ясно, что с ростом кроны, с одной стороны, увеличивается приток энергии благо- даря фотосинтезу, а с другой — увеличиваются трудности, свя- занные, например, с доставкой питательных веществ, и, следо- вательно, увеличивается расход энергии на подобные нужды. Б конце концов, притока энергии уже не хватает для покрытия расходов, и дерево перестает расти. Перейдем от интуитивных рассуждений к модели, предло- женной И. А. Полетаевым, которая основывается на следующих гипотезах: 1) у зрелого растения с ростом не меняются отношения гео- метрических размеров; 2) свободную энергию растение получает только путем фото- синтеза; 3) свободная энергия расходуется на фотосинтез, построение живой клетки и подъем питательного раствора из почвы; 4) в среднем за большие отрезки времени растение получает постоянное количество света на единицу поверхности и может поглощать необходимые вещества из неограниченного запаса. Составим уравнение баланса энергии. Пусть х — линейный размер растения. Это значит, что высоту растения будем изме- рять величиной х, площадь поверхности всей листвы пропор- циональна ж2, объем ствола пропорционален ж3. Понятно, что х изменяется со временем: ае(^). Свободная энергия Е образуется благодаря фотосинтезу в листьях кроны. Таким образом, мож- но считать, что Е = аж2, где а — коэффициент пропорциональ- ности (зависит от размеров и формы листьев и интенсивности фотосинтеза). Других источников энергии в силу гипотез нет. Теперь про- следим за расходом энергии. Энергия тратится на нужды фото- синтеза. Этот расход пропорционален ж2, и его можно записать как рж2 (Р < а). Далее, энергия расходуется на доставку питательных веществ во все части растения. Расход будет тем больше, чем больше объ- ем растения. Кроме того этот расход связан с преодолением си- лы тяжести и будет тем больше, чем на большую высоту прихо- дится поднимать питательные вещества, т. е. расход пропорцио- нален ж3 и высоте ж. Таким образом, он равен уж3ж = уж4. Наконец, энергия расходуется на увеличение массы расте- ния — на рост. Этот расход пропорционален скорости роста, т. е. производной от массы т — рж3 (р — средняя плотность). Таким образом, этот расход равен 8—(рж3). 325
Рис. 8.4 В силу закона сохранения энергии и гипотез 1 — 4: dt (8.56) х ф 0, поэтому, разделив (8.56) на ЗВрж2 и обозначив или Так — Ь, получим dt 38р dx — = а — Ьх2. 5 dx как дерево растет, то — 0. Тогда dx 1п __Q^Zx/abt. Таким образом, a/b (Ce^t - 1) Из (8.58) видно, что при t - оо x(i) —> у/а/Ь. Из (8.57) следует, что — -2Ьх^~. Так как b > 0, х > 0 и > 0, то dt2 dt ’ dt x(f) — выпуклая кривая (рис. 8.4). 0 и 326
8.18. Модель «хищник — жертва» (модель Вольтерра) Экспериментальные данные о колебании численности рысей и зайцев были собраны в Канаде в период 1845—1935 гг. Пусть в некотором изолированном районе живут хищники (рыси^ и жертвы (зайцы). Зайцы питаются растительной пищей, ее ко- личество неограниченно, а рыси питаются только зайцами. Эти предположения упрощают реальную ситуацию, но такие пред- положения неизбежны при построении математических моде- лей. Обозначим x(t) количество зайцев; y(t) количество ры- сей. Пусть x(t),y(t) — непрерывные дифференцируемые функ- ции. Возникает вопрос: «Как количество животных может быть непрерывной функцией? » Но если взять очень крупную единицу измерения, например 10 000 особей, то 0,7 означает 7 000 особей и т. д. Так как экологическая ниша для зайцев неограниченна, то если бы рысей не было, скорость прироста зайцев была бы про- порциональна их количеству: dx , ч — — ах (а > 0). dt v 7 С другой стороны, если бы зайцев не было, го рыси бы вы- мирали, и скорость их вымирания была бы пропорциональна их количеству: dt Пусть теперь рыси и зайцы живут на одной территории. Тогда число рысей будет тем больше, чем больше зайцев они «встретят». Соответственно скорость роста численности зайцев из-за таких «встреч» тоже замедлится. Частота встреч характе- ризуется произведением ху. Действительно, если есть п зайцев и т рысей, то каждая рысь может встретить любого зайца. Об- щее число таких возможных комбинаций равно тп. Учитывая получим: изложенное, ах — bxy = х(а — by)] dt dy ' S X / ! X dt = + РХУ = У\РХ ~ СЬ \Р,Ь,с,р> 0). Первый вопрос: «Существуют ли у системы (8.59) положе- ния равновесия — такие точки на фазовой плоскости (см. под- разд. 8.14), попав в которые, движущаяся точка останется там навсегда (скорость в этом положении равна 0), т. е. из (8.59) 327
х(а — by) — 0; у(рх — с) = 0. (8.60) Так как а^с^р > 0, система (8.60) имеет два решения (0,0) /с с\ __ и I-, — ). Первое означает отсутствие рысей и зайцев и не пред- \р а/ ставляет интереса. Остается решение (8.61) Ему соответствует решение системы (8.59) x(t) — y(t) = р b Соответствующая фазовая кривая вырождается в точку. Что бу- дет, если чуть-чуть отойти от положения равновесия (х,^), т.е. с количество зайцев и рысей будет немного отличаться от - и - ' р b Дадим хну малые приращения и и v соответственно: x(t) ~ х + w(t); y(t) = У + v(t). (8.62) Подставим теперь (8.62) в (8.59) и получим систему дифферен- циальных уравнений относительно новых функций u(t) и v(t): f du dt | dv I dt (z + u)(a — by — bv); (y 4- v)(px +pu — c). (8.63) Подставим в (8.63) выражение (8.61) и, отбросив слагаемые uv ввиду их малости, получим: (8.64) Продифференцировав первое из уравнений (8.64\ имеем d2u be dv dfi p dt Из (8.64) и (8.65) получим (8.65) 328
cP и be ар dt2 p b t. e. или ePu ~—r — — acu dt2 d2u —7 4- acu — (J. Поскольку ас > 0, обозначив <d = у/ас, имеем u(t) — A cos <dt + В sin (dt; z ч p du ры, . , t _ v(t) = --— = —(—Asmcdt + В cos cd v ' be dt bev (8.66) Несложные преобразования дают г -----/А В \ u(t) — V а2 + в2 ( . . cos <dt + . о sin (dt) = V лМ2 + в2 VLF+B2 / = \/ А2 + В2 sin(<of + ф); v (t) = — А2 + В2 (-----у А sin <ot + . ~ = cos (А = v ’ be v \ v/Л2 + В2 \Л42 + В2 / = —у—А2 + В2 cos(«t + (р). be Составим уравнение, связывающее u(t) и r(t): (8.67) где di — \/А2 + В2; cfo = x/А2 + В2. Уравнение (8.67) пред- be ставляет собой уравнение эллипса с центром в точке (0,0). Используя (8.62), получим уравнение эллипса с центром в точке (х, у). Таким образом, фазовые кривые для системы (8-59^ имеют вид эллипсов с центром в точке, являющейся положением рав- новесия. Максимумы количества рысей и зайцев различаются по фазе. На основании (8.66) заключаем, что движение по этим замкнутым кривым будет периодическим с периодом, близким 329
к —. Оказывается, что периодическое движение имеет место не G) только для фазовых кривых, близких к положению равновесия, но и для «далеких» кривых, но форма этих кривых отличается от эллиптической. В итоге получается примерная картина пове- дения решений на фазовой плоскости. Видим, что система устой- чива, т. е., если зайцы и рыси будут предоставлены сами себе, то не погибнут ни те, ни другие, а их численности будут совершать колебания с отставанием по фазе друг от друга (максимум и y(t) принимаются при разных t). Рассмотрим систему = т(а - бу); = у(рх - с). (8.68) с а — имеем b dx dt =0;|. dt C 0, следовательно, x 1. При х < у > Р и у убывают. „ с а dx „ dy 2. При х < у < - имеем р b возрастает, у убывает. „ с а dt dx > 0- — < ’ dt n dy C 0, следовательно, x 3. При х > у < Р и у возрастают. _ с — имеем Ь а dt dx >0; : dt „ dy > 0, следовательно, x 4. При х > у > ~ имеем р Ь убывает, у возрастает. dt C 0- — ' ’ dt ' > 0, следовательно, x Таким образом, получаем, что движение точек по фазовым кривым происходит против часовой стрелки (рис. 8.5). Поэтому, если требуется увеличить количество зайцев, про- изводя отстрел рысей, то нужно правильно выбрать момент от- стрела. Если отстрел произвести в тот момент, когда система на- 330
ходится в точке ai кривой 5, то перейдем в точку 0С2 кривой 1. При этом количество зайцев будет уменьшаться. Если отстрел произвести, когда система будет находиться в точке Pi кривой £, то перейдем в точку р2 кривой 1. При этом количество зайцев будет расти. Возможен случай, когда точка Р2 окажется на эллипсе, ко- торый пересекается с осью Оу. В этом случае в определенный момент времени количество зайцев станет равным нулю, т. е. по- пуляция зайцев вообще исчезнет. Это лишний раз доказывает, как осторожно следует вмеши- ваться в естественные природные процессы. Часто подобное вме- шательство приводит к результатам прямо противоположным тем, на которые рассчитывали невежественные «эксперимента- торы». 8.19. Особые точки и особые решения В подразделе 8.4 были даны условия существования и един- ственности решения уравнения = (8-69) в области D. Для более подробного изучения точек, в которых условия теоремы не выполняются, несколько обобщим предыду- щую постановку задачи. Сделаем переменные х и у равноправ- ными, т.е. будем искать решение х(у) и у\х). Иначе, допуска- ем, чтобы поле направлений в некоторых точках было парал- лельно оси Оу. Пусть f(x^ у) неограниченна в окрестности точки (^о,Уо)? а "77-г при соответствующем доопределении в точке Л^У) (^о? Уо) непрерывна. Тогда в окрестности точки (а?о, уо) будем ис- кать интегральные кривые уравнения dx 1 z 7- - 77---v (8.70) dy у) Определение 8.9. Точка (жо,Уо) называется неособой., если существует ее окрестность (Л такая, что через каждую точку этой окрестности проходит одна, и только одна, интегральная кривая уравнения (8.69) и (8.70). В противном случае точка (гго,Уо) называется особой. Решение, все точки которого являют- ся особыми, называется особым решением. 331
Наиболее часто встречаются два типа особых точек. 1. Точка лежит на границе области G, где f(x,y) или —-~ непрерывны. В приложениях эти точки чаще всего встречаются при исследовании уравнений вида dy М(х,у) dx = 7V(®,y)’ ГДе N(x,y) — непрерывные функции. Точка (xq, уо): М(хо,уо) = 0; N(x0,y0) = 0 в» p-о M(s,y) Д/ (д?5 у\ будет особой, если не существует lim —-——~ и p-о N(x,y) Проиллюстрируем на примерах как по-разному могут вести себя интегральные кривые в окрестности особой точки первого типа. Пример 8.34* Решаем уравнение всюду кроме точки (0,0), поскольку — и неограниченны в окрестности этой точки dy 2dx У х In \у\ — 2 In |ж| + Ci; |у| — е21п|ж|+С1 _ x^eCi. у = ±еС1т2 — Вт2, где В — произвольная константа, так как у = 0 «потеряли» при делении. На рис. 8.6 видно, что все интегральные кривые при- ближаются к (0,0) как угодно близко, и при этом имеют общую касательную у ~ 0 (т. е. приближаются по определенному на- правлению) . Такие особые точки называют узлами. Пример 8.35. dy = у dx х Точка (0.0) — особая. Решаем уравнение всюду, кроме (0,0). В этом случае к точке (0,0) подходят сколь угодно близко толь- ко четыре интегральные кривые: две полуоси Ох и две полу- оси Оу. Всякая же другая интегральная кривая, приблизившись 332
Рис. 8.6 Рис. 8.7 достаточно близко к точке (0,0), начинает от нее удаляться. Та- кие точки называются седлами. Именно такой вид имеют на карте линии уровня высоты на перевале между двумя горами (рис. 8.7). Пример 8.36. Точка (0,0) — особая, называемая центром. Вообще, если некоторая окрестность точки О целиком заполнена замкнутыми интегральными линиями, содержащими внутри себя О, то такую точку называют центром (рис. 8.8). Пример 8.37. dy х + у dx х — у' Решаем dy 1+х/у. dx 1 — у/х1 333
Переходя к полярным координатам, получим г = се^. В точке (0,0) фокус. Интегральная кривая приближается к (0,0), бесконечно навиваясь на эту точку (рис. 8.9). 2. Данная классификация особых точек принадлежит Пуан- каре. Ранее были рассмотрены случаи, когда нарушалось первое условие теоремы существования и единственности, т. е., факти- чески, условие существования решения. Второе условие теоре- мы чаще всего нарушается в точках, при приближении к кото- рым — неограниченно возрастает, т. е. в таких точках, в кото- рых —> 0. Соотношение —> 0, вообще говоря, определя- ет нёкоторую кривую, в точках которой может быть нарушена единственность. Все такие точки — особые точки второго типа. Если, кроме того, эта кривая окажется интегральной, то полу- чим особое решение. Замечание. Кривая, определяемая соотношением -х-» —> 0, может ду содержать несколько ветвей, тогда одна ветвь может являться инте- гральной кривой, а другая — нет. 334
Рис. 8.10 Пример 8.38. Имеет ли уравнение dy dx у/(у - т)2 + 5 особое решение? Правая часть непрерывна, но частная производная ду тАу — х неограниченно возрастает при приближении к прямой у = х, следовательно, на прямой у — х может нарушить- ся единственность. Но функция у = х не удовлетворяет рассмат- риваемому уравнению, следовательно, особого решения нет. Пример 8.39. Имеет ли уравнение dy dx особое решение? Как и в примере 8.38, условие -qj 0 определяет прямую ду у = ж, но на этот раз функция у = х удовлетворяет данному уравнению. Остается выяснить, нарушена ли единственность в точках этой прямой. Заменой переменных z = у — х приводим исходное уравнение к уравнению с разделяющимися перемен- ными, после чего без труда находим решение у — х = Кривые этого семейства проходят через точки графика решения у — х. Следовательно, в каждой точке прямой у — х единствен- ность нарушена и функция у — х является особым решением (рис. 8.10).
Глава 9 РЯДЫ ФУРЬЕ* 9.1. Основные определения и леммы Определение 9.1. Функция /(ж), определенная на всей дей- ствительной оси, называется периодической, если для всех х вы- полняется равенство /(т + Т)^/(т), а число Т ~ ее периодом. Если Т — период функции /(я), то для любого целого п пТ тоже будет периодом f(x). Если f(x) имеет период Г, то д(х) — /(аж) имеет период —. Действительно, а а )) = /(аж + Г) = J (аж) = д[х). Обычно, говоря о периоде функции, под словом «период» по- нимают наименьший положительный период, если он существу- ет (в дальнейшем будем это предполагать). Лемма 9.1. Если функция f(x) имеет период Т, то интегра- лы от этой функции по любому отрезку длины Г равны, т. е. с-ЬТ dx - т f(x) dx. о Доказательство. dx — (9.1) Во втором интеграле равенства (9.1) сделаем замену перемен- ной 336
х = у + Т, dx = dy, тогда f(x)d.x= f(y + T)dy = f(y)dy. (9-2) Подставив (9.2) в (9.1), получим то, что требовалось дока- зать. Определение 9.2. Две действительные функции ср(т) и ф(х) называются ортогональными на отрезке [а, Ь], если ср(т)ф((т) dx = 0. (9.3) Определение 9.3. Система функций <fn(x) (п — 1,2,3, ...) называется ортогональной на [а, Ь], если функции этой системы попарно ортогональны, т. е. dx — 0 при т п. (9.4) Определение 9.4. Нормой функции ср(ж) на [а, h] (обозна- чается кр(.т);|) называется корень квадратный из интеграла от квадрата этой функции, т. е. |<p(z)|j = (ср(ж))2 d.x. (9-5) Определение 9.5. Система функций называется нормиро- ванной на а, 6], если норма каждой функции равна единице на [&, Ь]. Определение 9.6. Ортогональная и нормированная на [а, Ь] система функций называется ортонормированНой. Для нее вы- полняются условия 0, т ф п; ], т = п. (9-6) 337
Если ввести символ Кронекера _ /о, т^п-, * ®тп — л 1, т = п, (9-7) то равенство (9.6) можно переписать так: <?т(х)<?п(х') dx = 8 тп* (9-8) а Определение 9.7. Комплексные функции действительного переменного и д(х) = аЦж) 4- z[3i (т) называются ортогональными на а, Ь], если ь J f(x)g(x) dx = О, а где д(х) = ai(ar) — ф(ж) — сопряженная функция. Норма функции определяется формулой b 1/2 а где |/(ж)| = у/а2(х') + р2(ж) — модуль функции f(x\ Лемма 9.2. Всякую ортогональную систему, не содержащую функций с нулевой нормой, можно нормировать. Доказательство. Пусть на [а, Ь] задана ортогональная систе- ма функций (х) (n = 1,2,3, ...). Если ввести новые функции фп(а;) 1Ы*)||’ фп(х) = то полученная таким образом система фп(х) (п = 1,2,3, ...) бу- дет ортонормированной: тп* 338
В дальнейшем нам понадобится следующее свойство: а ~^а f\X) dx. f(~x) = f(x\, f(-x) = Д.г). (9.9) Покажем справедливость равенства (9.9 a 0 a /(.т) dx = /(т) dx + f(x) dx. J J -a (i 0 (9.10) В первом интеграле правой части равенства (9.10) сделаем замену переменной х = —t, dx = —dty тогда о —а Если функция четная, то f(-t) = f(t), а если нечетная, то /(—t) = —f(t\ откуда следует равенство (9.9). Лемма 9.3. Система функций . тпх sm —-— ппх , cos —— (m —1,2,3, ...) \п — 0,1,2, ...) (9.11) с общим периодом 21 ортогональна на любом отрезке длины 21. Доказательство. Так как была доказана лемма 9.1, то эту лемму достаточно доказать для отрезка [-1,1] , тих _ sin —-— dx — 0; тих ппх sin —-— cos —— dx = 0, так как подынтегральные функции нечетны.. ппх т I . ппх 1 cos —— dx — - sm —— I im I -0; 339
I I при m / n; . mux . nnx 1 sm —-— sm —— dx = i " / nx(m — ri) itx(m + n) \ , ( cos------------cos------------\ (]x = о J ' t t / о при m n. Ортогональность доказана. Найдем еще квадрат нормы этих функций на [—Z, I 1 — cos (9.12) о 2ттс sin —-— 9.2, Ряды Фурье Пусть функция / (ж), заданная на а, 6], допускает разложение в равномерно сходящийся ряд по ортогональной на [а, Ь] системе функций срп(^) (п = 1, 2, ...): ос /(Ж) = УТсгУпСж). п—1 (9.13) 340
Найдем коэффициенты сп. Умножив обе части равенства 9.13) на срт(ж) (т = 1,2, ...) и проинтегрировав по [а,6], по- лучим: 71—1 71=1 Напомним (см. подразд. 7.8), что если ряд ;9.13) равномер- но сходится и функции (рп(ж) непрерывны на a. ft], то этот ряд можно почленно интегрировать. В силу ортогональности функций срп(т) на [а, Ь, а |б, m п. Тогда ь f(x)4m(x) dx = cm||<pm(x)||2. (9.14) а Определение 9.8. Коэффициенты ст, определяемые фор- мулой (9.14), называют коэффициентами Фуръе функции fix относительно данной ортогональной системы функций уп(х)~ Функциональный ряд (9.13) с коэффициентами Фурье ст назы- вается рядом Фуръе независимо от его сходимости. Если f(x) периодическая функция с периодом Т — 21 и допускающая разложение в ряд Фурье по тригонометрической системе функций (9.11), то ,, , an , nuz . тх\ /(ж) = у + Z^\ancos — -f-ftnsm—(9.15) 71—1 где коэффициенты Фурье ар,ап,6п вычисляются по формулам (9.14) с учетом равенств (9.12), т. е. — j (т) cos - - ах; (9.16) П 7 ---ах 341
Мы предполагали, что f(x) разложима в равномерно сходя- щийся ряд (9.15 с коэффициентами Фурье (9.16). Теперь опре- делим, при каких условиях на функцию f(x / этот ряд будет схо- диться. Определение 9.9. Функция f\X' называется кусочно-непре- рывной на интервале, если она ограничена на этом интервале и имеет на нем конечное число точек разрыва только первого рода. Пусть дана функция f(x) с периодом Т = 21. Интервал (~Z, Z) называется основной областью. J построим для этой функции тригонометрический ряд Фурье: /(•с) ~ ар 2 ОС + У? (°П COS п=1 ППХ пх/х (9-17) нёорема 9.1. Пусть функция кусочно-непрерывна и имеет кусочно-непрерывную производную в основной области (~Z, Z), тогда: а) ее соответствующий ряд Фурье (9.17) сходится для всех т; б) сумма S(<r) этого ряда Фурье равна /(ж) в точках непре- рывности /(х) и равна среднему арифметическому пределов сле- ва и справа в точках разрыва, т. е. {/(а:), если х - точка непрерывности: /(ж - 0) + fix + 0) -----------------, если х — точка разрыва. (9.18) Замечание, Так как в точках непрерывности /(т) f{x - 0) = f(x + 0) = fix), то равенство i 9.18) можно записать так: S(x) = + °) + № ~ °) для всех х. Доказательство этой теоремы не приводим ввиду его с ложно- сти. 1ёорема 9.2. Тригонометрический ряд Фурье четной перио- дической функции содержит только косинусы, а нечетной — только синусы. Доказательство. Пусть f(x) раскладывается в ряд Фурье '9.171 с коэффициентами (9.16). Тогда, если /(—.т) = f(x\ т. е, функция f(x) четная, то 342
— ПКХ 7 Z —— dx — - nnx _ —— dx; (9.19) о /( х \ sin n nizx . —— dx — 0. Если /(—x) = —f(x), т. e. функция нечетная, то (9.20; ~ a nizx я n j ( x) cos —— dx - 0. J —I Равенства (9.19) и 9.201 получены с учетом свойства опреде- ленного интеграла 9.9). Кроме того, известно, что произведение двух четных или двух нечетных функций является четной функ- цией. а произведение четной и нечетной функций — нечетной. 1аким образом, если f(—x) — f(x), то (9-21) т. е. ряд f(x) раскладывается в ряд Фурье по косинусам. Если же f(—x) = то пкх (9.22) т. е. fix) раскладывается по синусам. Пример 9-1. Функция /(ж) = - (ж 0) задана на (—к,к). IXI Разложить ее в ряд Фурье и, пользуясь разложением, найти сумму (-1) п— 1 2п - 1 ’ Решение. Функцию /(ж), заданную на (- л, л), продолжим на всю числовую ось периодически с периодом Т — 2л (рис. 9.1). 343
I t —I----► Зк x Рис. 9.1 Так как /(ж) — нечетная функция, I = к, то ее ряд Ф имеет вид: оо /(ж) — bn sin пх^ 71=1 где 2 г 2 к 2 п Ъп — - I siunxdx = —(— cos га) = —(1 — (—l)n) = kJ кп о кп о Таким образом, в точках непрерывности При х = к 2 откуда 2^ (-l)n-i _ п ' 2п - 1 “ 4 !=1 9.3. Четное и нечетное продолжение функций Пусть функция f(x) задана только на интервале (О, Z). Что- бы разложить f(x) в ряд Фурье, ее нужно продолжить на интер- 344
вал (—Z, 0). Это можно сделать бесчисленным множеством спосо- бов. Все получающиеся ряды Фурье будут на (0, Z) иметь суммой f(x) в точках непрерывности и среднее арифметическое преде- лов слева и справа в точках разрыва. Вне интервала (0,1) эти ряды будут представлять совершенно различные функции. В частности, /(ж) можно продолжить четным образом и раз- ложить по косинусам, а если продолжить нечетным образом, то получим разложение по синусам (см. теорему 9.2). Пример 9.2. Разложить /(т) — ж, заданную на (0,2): а) по синусам; б) по косинусам. Решение, а) Положим /( — х) — ~f(x) на (—2,0) и продолжим эту функцию на всю числовую ось с периодом 4 (рис. 9.2). Тогда оо , . ППХ Ьп S1D —— 71 где 2 , Г . mix 1 2s bTl = 1 х sm —— dx — J 2 К7 0 1 u — x, \du — dx, 4 4 = COS ПЯ -| ; Tin ГХП‘ A OO /(®) = - E л n=l Ла \ 7^Л r p Zl 2 2 r mix 2 2 f nux , cos + I cos —— dx = i 2 о ли J 2 0 . nux . sm dx = dv, \ 2 nux / v — cos —-/ nn 2 . mx 2 4 . ysm— - — (-1) ; 2 2 о тшу ' / 1W4 1 • ПКХ (—l)n±1 sm —— (9.23) n 2 --Z Z Z 7 ! 7 1 7 ' 7 1 7 । 7 । 7 \ / \ 7 \ 7 ' 7 7 i S 0 i /4 d /8 x । 7 i 7 । 7 । 7 - -2 f ис. 9.2 345
б) Положим У (—т I = f(x) на (—2:0) и продолжим эту функ- цию на всю числовую ось с периодом 4 (рис. 9.3). Тогда QO ппх ап cos -у- /7—1 где 2 «° = J О ПИХ Ах х cos---ах — — sm 2 кп ппх КП О 4 ПКЖ ~2~2 COS~V к2п2 2 В таком случае тс П‘ о, cos (9. О 2 О п о О . ппх _ sm —— ах = Ряды 19.23) и (9.24) различны, хотя на (0,2 ) оба ряда имеют своей суммой функцию f(x) = х. 9.4. Комплексная форма тригонометрического ряда Фурье Рад Фурье по тригонометрической системе функций с коэф- фициентами (9.16) может быть представлен в комплексной фор- ме. Для этого воспользуемся формулами Эйлера тих е i — cos ПКЛ . ппх —— + г sm —— inp х ПИХ . ПИХ € I —cos—----------£Sin—-- 1 346
откуда ппх 1 / mux _____Ч-Д х ПИХ cos —— = - (е I 4-е « ); sin —— I Li v Подставив (9.25) в (9.15), получим ап cos ппх . ПИХ Ьп sm —— а0 П—1 «о inizx inrrx гптсх ' "плх a^i — irir.x ---------------e i _irntx —е i &=1 Введем обозначения «о ПИХ . . шея cos —---г sm —— injur I ах; 'п —п ПИХ cos ППХ i i тпж Отсюда получаем комплексную форму ряда Ф^рьс: оо Eikrix Ске 1 , —оо где Ск = 7^ ikr.x I ах 347
Такая форма записи рядов Фурье встраивается в физике, в частности в квантовой механике, где волновые процессы приня- то описывать с помощью комплексных экспонент. На этом мы заканчиваем элементарное знакомство с рядами Фурье, хотя эти ряды обладают еще многими замечательными свойствами. Теории рядов Фурье активно разрабатывались ма- тематиками, в том числе и в МГУ им. М. В. Ломоносова в первой половине XX в. и послужили толчком для дальнейшего разви- тия математики.
СПИСОК ЛИТЕРАТУРЫ 1. Александров П. С. Лекции по аналитической геометрии. — М. : Наука, 1968. 2. Архипов Г. И. Лекции по математическому анализу / Г. И. Архи- пов, В. А. Садовничий, В. Н. Чубариков. - М. : Дрофа, 2004. 3. Банах С. Дифференциальное и интегральное исчисление. — М. : Наука, 1958. 4. Гильдерман Ю. И. Лекции по высшей математике для биоло- гов. — Новосибирск : Наука, 1974. 5. Головина Л. И. Линейная алгебра и некоторые ее приложения. — М. : Наука, 1985. 6. Гроссман С. Математика для биологов / С. Гроссман, Дж. Тер- нер. — М. : Высшая школа, 1983. 7. Делоне Б. Н. Аналитическая геометрия / Б. Н. Делоне, Д. А. Рай- ков. — М. —Л. : Гостехиздат, 1948. 8. Зорич В. А. Математический анализ. — М. : Наука, 1983. 9. Ивашев-Мусатов О. С. Начала математического анализа. — М. : Наука, 1988. 10. Курош А. Г. Курс высшей алгебры. М. : Наука, 1975. 11. Минорский В. П. Сборник задач по высшей математике. — М. : Наука, 1978. 12. Петровский И. Г Лекции по теории обыкновенных дифферен- циальных уравнений. - М. : Гостехиздат, 1952. 13. Першикова Т. В. Обыкновенные дифференциальные уравне- ния / Т. В. Першикова, Е. В. Александрова, А. Н. Бобров. — М. : Изд-во Моск, ун-та, 2003. 14. Проскуряков И. В. Сборник задач по линейной алгебре. — М. : Наука, 1984. 15. Романовский П. И. Ряды Фурье. Теория поля. Аналитические и специальные функции. Преобразование Лапласа. — М. : Физматгиз, 1959. 16. Сударев Ю. Н, Курс лекций по высшей математике для биоло- гов. М. : Изд-во Моск, ун-та, 2001. 17. Фихтенгольц Г М. Курс дифференциального и интегрального исчисления. - - М. : Физматлит, 2005. 18. Эльсгольц Л. Э. Обыкновенные дифференциальные уравне- ния. — М. : Гостехиздат, 1957.
ОГЛАВЛЕНИЕ Предисловие............................................ 3 Глава 1. Аналитическая геометрия .......................4 1.1. Матрицы и действия с ними......................... 4 1.2. Определители и их свойства...................... 10 1.3. Системы линейных уравнений ........................16 1.4. Векторы и действия над ними.......................20 1.5. Плоскость и прямая в пространстве ................ . 27 1.6. Кривые второго порядка............ .............. 34 1.7. Поверхности второго порядка..................... 42 1.8. Полярная, цилиндрическая и сферическая системы координат............................................. 48 1.9. Комплексные числа ................................50 Глава 2. Линейная алгебра*.............................55 2.1. Матрицы и определители n-го порядка...............55 2.2. Произвольные системы линейных уравнений...........67 2.3. Конечномерные векторные пространства ........... 75 2.4. Линейные операторы................................84 Глава 3. Введение в математический анализ .............94 3.1. Общее понятие функции........................... 94 3.2. Предел последовательности.........................95 3.3. Предел функции действительного аргумента . .......Ю8 3.4. Непрерывность функции............................121 3.5. Асимптотическое поведение функций ...............131 3.6. Приложение*......................................137 Глава 4. Дифференциальное исчисление функций одноц переменной ......................................... 143 4.1. Дифференцируемость, производная, дифференциал...143 4.2. Основные правила дифференцирования ..............147 4.3. Некоторые вычислительные формулы.................150 4.4. Основные теоремы дифференциального исчисления...154 4.5. Приложение дифференциального исчисления к исследованию поведения функций.....................................157 4.6. Формула Тейлора..................................163 4.7. Приложение*......................................169 Глава 5. Функции нескольких переменных ...............175 5.1. Дифференциальное исчисление......................175 5.2. Приложение*......................................191 350
Глава 6. Интегральное исчисление.....................195 6.1. Неопределенный интеграл.........................195 6.2. Определенный интеграл...........................201 6.3. Приложения определенного интеграла..............226 6.4. Приложение*.....................................233 Глава 7. Ряды........................................237 7.1. Простейшие свойства числовых рядов..............237 7.2. Ряды с положительными членами ................ 243 7.3. Ряды произвольного знака .......................253 7.4. Функциональные ряды.............................261 7.5. Степенные ряды .................................265 7.6. Ряды Тейлора....................................271 7.7. Ряды с комплексными членами.....................275 7.8. Приложение*.....................................278 Глава 8. Обыкновенные дифференциальные уравнения .......................................... 283 8.1. Основные определения . .........................283 8.2. Уравнения первого порядка, разрешенные относительно производной..........................................285 8.3. Метод ломаных Эйлера ...........................287 8.4. Теорема существования и единственности..........287 8.5. Уравнения с разделяющимися переменными .........288 8.6. Линейные уравнения первого порядка..............291 8.7. Уравнения в полных дифференциалах...............297 8.8. Уравнения порядка выше первого. Простейшие случаи понижения порядка....................................299 8.9. Линейные уравнения n-го порядка.................301 8.10. Линейные уравнения с постоянными коэффициентами . . . 307 8.11. Решение линейных неоднородных уравнений........310 8.12. Огибающая семейства кривых* ...................315 8.13. Уравнения Клеро* . ............................317 8.14. Системы линейных дифференциальных уравнений.....318 8.15. Уравнение радиоактивного распада .............. 320 8.16. Закон роста биомассы......................... 321 8.17. Почему рост деревьев ограничен................% 325 8.18. Модель «хищник жертва» (модель Вольтерра) .....327 8.19. Особые точки и особые решения..................332 Глава 9. Ряды Фурье*.................................337 91. Основные определения и леммы ...................337 9;2. Ряды Фурье ............................ 341 9.3. Четное и нечетное продолжение функций...........345 9.4. Комплексная форма тригонометрического ряда Фурье .... 347 Список литературы....................................349
Учебное издание Сударев Юрий Николаевич Першикова Татьяна Валерьевна Радославова Татьяна Васильевна Основы линейной алгебры и математического анализа Учебное пособие Редактор Л. В. Честная Технический редактор Е. Ф. Коржуева Компьютерная верстка: Т. А. Клименко Корректоры JL В. Гаврилина, Н. И, Сухобокова Изд. № 101110579. Подписано в печать 24.10.2008. Формат 60x90/16. Бумага офсетная № 1. Печать офсетная. Гарнитура «Таймс». Усл. печ. л. 22,0. Тираж 3000 экз. Заказ № 6425. Издательский центр «Академия», www.academia-moscow.ru Санитарно-эпидемиологическое заключение № 77.99.02.953.Д.007496.07.04 от 20.07.2004 117342, Москва, ул. Бутлерова, 17-Б, к. 360. Тел./факс: (495)334-8337, 330-1092. Отпечатано с электронных носителей издательства. ОАО "Тверской полиграфический комбинат", 170024, г. Тверь, пр-т Ленина, 5. Телефон: (4822) 44-52-03,44-50-34, Телефон/факс (4822) 44-42-15 Home page - www.tverpk.ru Электронная почта (E-mail) - sales@tverpk.ru *
Сударев Юрий Николаевич - доцент кафедры математического анализа механико-математического факультета Московского государственного университета им. М. В. Ломоносова. Работает в МГУ с 1965 г. Автор научных публикаций в отечественных и зарубежных журналах, научно-популярных изданий и методических пособий для студентов; был переводчиком книг по занимательной математике. Першикова Татьяна Валерьевна - доцент кафедры математического анализа механико-математического факультета Московского государственного университета им. М. В. Ломоносова. Работает в МГУ с 1961 г. Автор ряда научных публикаций и многочисленных методических пособий для студентов. Радославова Татьяна Васильевна - доцент кафедры математического анализа механико-математического факультета Московского государственного университета им. М. В. Ломоносова. Работает в МГУ с 1985 г: Автор публикаций по теоретическим и прикладным задачам, нескольких методических пособий для студентов. , t К, '*,' " t основы £. ЛИНЕЙНОЙ АЛГЕБРЫ И МАТЕМАТИЧЕСКОГО АНАЛИЗА ISBN 978-5-7695-4645-7 9 785769 546457 Издательский центр «Академия» www. academia-moscow. ru