Вариационное исчисление, математическая дисциплина, посвященная отысканию экстремальных (наибольших и наименьших) значений функционалов — переменных величин, зависящих от выбора одной или нескольких функций. В. и. является естественным развитием той главы математического анализа, которая посвящена задаче отыскания экстремумов функций. Возникновение и развитие В. и. тесно связано с задачами механики, физики и т.д.

Одной из первых задач В. и. была знаменитая задача о брахистохроне (И. Бернулли, 1696): определить форму кривой, лежащей в вертикальной плоскости, по которой тяжёлая материальная точка, двигаясь под действием только одной силы тяжести и не имеющая начальной скорости, перейдёт из верхнего положения А в нижнее положение В за минимум времени. Эта задача сводится к отысканию функции у (х), доставляющей минимум функционалу

где а и b — абсциссы точек А и В.

Другой такой же «исторической» задачей является задача об отыскании пути, вдоль которого распространяется свет, идущий от источника света (точка А) к некоторой точке В, в среде с переменной оптической плотностью (то есть в среде, где скорость распространения v есть функция координат). Для решения этой задачи может быть использован, так называемый, Ферма принцип, согласно которому из всех кривых, соединяющих точки А и В, луч света распространяется вдоль той, по которой свет приходит из A в B за кратчайшее время. В простейшем случае, когда свет распространяется в плоскости, задача сводится к отысканию кривой y (x), доставляющей минимум функционалу

Из разрозненных задач подобного рода постепенно в 18 в. начало формироваться В. и. Но и после оформления В. и. в самостоятельную дисциплину она продолжала оставаться связанной с различными проблемами механики и физики. На протяжении 2-й половины 18 в. и всего 19 в. делались интенсивные попытки построить здание механики, опираясь на некоторые общие вариационные принципы (см. Вариационные принципы механики). Со 2-й половины 19 в. начинают разрабатываться различные вариационные принципы в механике сплошных сред, затем позднее в квантовой механике, электродинамике и т.д. Возникают вариационные принципы и в средах с диссипацией энергии. Исследования во всех подобных областях продолжают служить базой формирования новых задач В. и. и областью приложения её методов. Однако со временем появились и новые классы задач, далеко раздвинувших традиционные границы дисциплины и превративших В. и. в одну из наиболее обширных ветвей современной математики, включающей в себя, с одной стороны, самые абстрактные вопросы, относящиеся в равной степени к топологии и функциональному анализу, а с другой — разнообразные вычислительные методы решения технических или экономических задач.

Прямые методы. В. и. как самостоятельная научная дисциплина сформировалась в 18 в., главным образом благодаря работам Л. Эйлера.

Простейшей задачей В. и. называют задачу отыскания функции x (t), доставляющей экстремум функционалу

где F — непрерывная и дифференцируемая функция своих аргументов. При этом функция x (t) должна удовлетворять следующим условиям:

а) она должна быть кусочно дифференцируемой,

б) при t = t_o и t = T она должна принимать значения

х (t_o) = х₀, х (Т) = х_т. (2)

Обе задачи, рассмотренные в начале статьи, являются частными случаями простейшей задачи В. и.

Первые вариационные задачи были задачами механики. Они были поставлены в 18 в. и, следуя традициям того времени, первый вопрос, на который надо было ответить, был вопрос о способе фактического отыскания функции x (t), реализующей минимум функционала (1).

Эйлер создал численный метод решения задач В. и., который получил название Эйлера метода ломаных. Этот метод был первым среди большого класса, так называемых, прямых методов; все они основаны на редукции задачи отыскания экстремума функционала к задаче отыскания экстремума функции многих переменных. Поскольку для получения решения с высокой точностью задачу приходится сводить к отысканию экстремума функции с большим числом переменных, она становится весьма сложной для ручного счёта. Поэтому долгое время прямые методы были вне основного русла, по которому направлялись усилия математиков, занимавшихся В. и.

В 20 в. интерес к прямым методам значительно усилился. Прежде всего были предложены новые способы редукции к задаче об экстремуме функции конечного числа переменных. Поясним эти идеи на простом примере. Рассмотрим снова задачу отыскания минимума функционала (1) при дополнит. условии

x (t_o) = x (T) = 0 (3)

и будем разыскивать решение задачи в форме

где j_n(t) — некоторая система функций, удовлетворяющих условиям типа (3). Тогда функционал J (x) становится функцией коэффициентов a_i:

J = J (a_i,..., a_N),

и задача сводится к отысканию минимума этой функции N переменных. При известных условиях, наложенных на систему функций {j_n}, решение этой задачи стремится при N ® ¥ к решению задачи (1) (см. Ритца и Галёркина методы).

Другая причина усиления интереса к прямым методам — это систематическое изучение конечноразностных методов в задачах математической физики, начавшееся с 20-х гг. 20 в. Применение ЭВМ превращает постепенно прямые методы в основной инструмент решения вариационных задач.

Метод вариаций. Второе направление исследований — это изучение необходимых и достаточных условий, которым должна удовлетворять функция x (t), реализующая экстремум функционала J (x). Его возникновение также связано с именем Эйлера. Предположим, что тем или иным способом построена функция x (t). Как проверить, является ли эта функция решением задачи? Первый вариант ответа на этот вопрос был дан Эйлером в 1744. В приведённой ниже формулировке этого ответа употребляется введённое в 60-х гг. 18 в. Ж. Лагранжем понятие вариации (отсюда название — В. и.), являющееся обобщением понятия дифференциала на случай функционалов.

Пусть x (t) — функция, удовлетворяющая условию (2), a h (t) — произвольная гладкая функция, удовлетворяющая условию h (t_o) = h (T) = 0. Тогда величина

J (x + eh) = J*(e),

где e — произвольное действительное число будет функцией e. Вариацией dJ функционала J называют производную

(dJ*/de)_e = 0.

Для простейшей задачи В. и.

Разлагая полученное выражение в ряд по степеням e, получим

где о (e) — члены более высокого порядка. Так как h (t_o) = h (T) = 0, то, проведя интегрирование по частям во втором интеграле, найдём

Пусть теперь x (t) реализует экстремум. Тогда функция J*(e) имеет экстремум при e = 0. Поэтому величина dJ должна обратиться в нуль. Отсюда следует: для того чтобы функция x (t) доставляла экстремум функционалу (1), необходимо, чтобы она удовлетворяла уравнению

называемому уравнением Эйлера.

Это — дифференциальное уравнение 2-го порядка относительно функции x (t). Необходимое условие dJ = 0 может быть применено в ряде случаев для эффективного отыскания решения вариационной задачи, поскольку функция x (t) необходимо должна быть решением краевой задачи x (t_o) = x_o, x (T) = x_T для уравнения (4). Если найдено это решение и оно единственно, то найдено тем самым и решение исходной вариационной задачи. Если краевая задача допускает несколько решений, то достаточно вычислить значение функционала для каждого из решений краевой задачи и выбрать из них то, которому отвечает наименьшее значение J (x). Однако указанный путь обладает одним существенным недостатком: не существует универсальных способов решения краевых задач для обыкновенных (нелинейных) дифференциальных уравнений.

Уже во 2-й половине 18 в. круг задач, изучаемых В. и., значительно расширился. Прежде всего основные результаты, относящиеся к простейшей задаче В. и., были перенесены на общий случай интегральных функционалов вида

где x (t) — вектор-функция произвольной размерности, и на функционалы ещё более общего вида.

Условный экстремум. Задача Лагранжа. В конце 18 в. был сформулирован ряд задач на условный экстремум. Этим термином принято называть задачи отыскания функции x (t), доставляющей экстремум функционалу J (x) при каких-либо дополнительных условиях, кроме условий на концах интервала (t₀, T). Простейшей задачей подобного вида является класс так называемых изопериметрических задач. Своим названием этот класс задач обязан следующей: среди всех замкнутых кривых данной длины найти ту, которая ограничивает максимальную площадь.

Значительно более сложной задачей является та, в которой ограничения носят характер дифференциальных уравнений. Эту задачу называют задачей Лагранжа; особое значение она приобрела в середине 20 в. в связи с созданием теории оптимального управления. Поэтому её формулировка даётся ниже на языке этой теории, возникшем после работ Л. С. Понтрягина и его учеников.

Пусть x (t) и u (t) — вектор-функции размерностей n и m соответственно, причём функция x (t), которую называют фазовым вектором, при t = t_o и t = T удовлетворяет граничным условиям:

x (t₀) Î e₀, x (T) Î e_T (5)

где e₀ и e_T — некоторые множества. Простейшим примером условий типа (5) являются условия (2). Функция x (t) и функция u (t), которую называют управлением, связаны условием

dx/dt = f (x, u, t), (6)

где f — дифференцируемая вектор-функция своих аргументов. Рассматриваемая задача состоит в следующем: определить функции x (t) и u (t), доставляющие экстремум функционалу

Заметим, что и простейшая задача В. и. и изопериметрическая задача являются частным случаем задачи Лагранжа.

Задача Лагранжа имеет огромное прикладное значение. Пусть, например, уравнение (6) описывает движение какого-либо динамического объекта, например космического корабля. Управление u — это вектор тяги его двигателя. Множества e₀ и e_T — это две орбиты разных радиусов. Функционал (7) описывает расход горючего на выполнение маневра. Следовательно, задачу Лагранжа, применительно к данной ситуации, можно сформулировать следующим образом: определить закон изменения тяги двигателя космического аппарата, совершающего переход с орбиты e₀ на орбиту e_T за заданное время так, чтобы расход топлива на этот маневр был минимальным.

Важную роль в теории подобных задач играет функция Гамильтона

H (x, y, u) = (f, y) - F.

Здесь y — вектор, называется множителем Лагранжа (или импульсом), (f, y) означает скалярное произведение векторов f и y. Необходимое условие в задаче Лагранжа формулируется следующим образом: для того чтобы функции и были решением задачи Лагранжа, необходимо, чтобы была стационарной точкой функции Гамильтона Н (х, y, u), то есть, чтобы при

было ¶H/¶u = 0, где y — не равное тождественно нулю решение уравнения

¶y/t = —¶H/¶x = j(x, y, u, t). (8)

Эта теорема имеет важное прикладное значение, так как она открывает известные возможности для фактического нахождения векторов x (t) и u (t).

Развитие В. и. в 19 в. Основные усилия математиков в 19 в. были направлены на исследование условий, необходимых или достаточных для того, чтобы функция x (t) реализовала экстремум функционала J (x). уравнение Эйлера было первым из таких условий; оно аналогично необходимому условию

которое устанавливается в теории функций конечного числа переменных. Однако в этой теории известны ещё и другие условия. Например, для того, чтобы функция f (x) имела в точке минимум, необходимо, чтобы в этой точке было

каков бы ни был произвольный вектор h. Естественно поставить вопрос: в какой степени эти результаты переносятся на случай функционалов? Для того чтобы представить себе сложность, которая здесь возникает, заметим, что функция может реализовать минимум среди функций одного класса и не давать минимум среди функций другого класса и т.д.

Подобные вопросы послужили источником разнообразных и глубоких исследований А. Лежандра, К. Якоби, М. В. Остроградского, У. Гамильтона, К. Вейерштрасса и многих других. Эти исследования не только обогатили математический анализ, но и сыграли большую роль в формировании идей аналитической механики и оказали серьезное влияние на развитие разнообразных отделов теоретической физики.

Развитие В. и. в 20 в. В 20 в. возник целый ряд новых направлений В. и., связанных с интенсивным развитием техники, смежных вопросов математики и вычислительной техники. Одно из основных направлений развития В. и. в 20 в. — рассмотрение неклассических задач В. и., приведшее к открытию принципа максимума Л. С. Понтрягина.

Рассмотрим снова задачу Лагранжа: определить минимум функционала

при условии

фазовый вектор x (t) должен удовлетворять ещё некоторым граничным условиям.

В своей классической постановке условия задачи Лагранжа не предусматривают никаких ограничений на управление u (t). Выше (см. раздел Условный экстремум. Задача Лагранжа) подчёркивалась тесная связь между задачей Лагранжа и задачей управления. В рассмотренном там примере u (t) — тяга ракетного двигателя. Эта величина подчинена ограничениям: тяга двигателя не может превосходить некоторой величины, и угол поворота вектора тяги также ограничен. В данном конкретном примере компонента uⁱ (i = 1,2,3) вектора тяги двигателя подчинена ограничениям

где а^-_i и a⁺_i — некоторые заданные числа. Подобных примеров можно привести много.

Таким образом, в технике появилось много задач, которые сводятся к задаче Лагранжа, но при дополнительных ограничениях типа (10), записываемых в форме u Î G_u, где G_u — некоторое множество, которое, в частности, может быть замкнутым. Такие задачи получили название задач оптимального управления. В задаче Лагранжа можно исключить управление u (t) при помощи уравнения (8) и получить систему уравнений, которая содержит только фазовую переменную х и множитель Лагранжа j. Для теории оптимального управления должен был быть разработан специальный аппарат. Эти исследования привели к открытию принципа максимума Л. С. Понтрягина. Он может быть сформулирован в форме следующей теоремы: для того чтобы функции и были решением задачи оптимального управления чтобы они доставляли минимум функционалу (9)], необходимо, чтобы u (t) доставляла максимум функции Гамильтона

где y — множитель Лагранжа (импульс), который является ненулевым решением векторного уравнения

Принцип максимума позволяет свести задачу оптимального управления к краевой задаче для системы обыкновенных дифференциальных уравнений порядка 2n (n — размерность фазового вектора). Принцип максимума и в этом случае даёт более сильный результат, чем теорема Лагранжа, поскольку он требует, чтобы было не стационарным значением функции Гамильтона Н, а доставляло максимум Н.

Возможен и другой подход к тем же проблемам теории оптимального управления. Пусть s (х, t) — значение функционала (9) вдоль оптимального решения. Тогда для того чтобы функция была оптимальным управлением, необходимо (а в некоторых случаях и достаточно), чтобы функция s (х, t) удовлетворяла следующему дифференциальному уравнению с частными производными:

называемому уравнением Беллмана (см. Динамическое программирование).

Круг вопросов, которыми занимается В. и., непрерывно расширяется. В частности, всё большее и большее внимание уделяется изучению функционалов J (x) весьма общего вида, задаваемых на множествах G_x элементов из нормированных пространств. Для задач такого рода уже трудно использовать метод вариаций. Возникли новые методы, основанные на использовании понятия конуса в банаховых пространствах, опорных функционалов и т.д.

Уже в 19 в. была обнаружена глубокая связь между некоторыми проблемами теории уравнений с частными производными и вариационными задачами. П. Дирихле показал, что решение краевых задач для уравнения Лапласа эквивалентно решению некоторой вариационной задачи. Эта проблема привлекает к себе всё больше и больше внимания. Рассмотрим один пример.

Предположим, что имеется некоторое линейное операторное уравнение

Ax = f, (11)

где х (x, h) — некоторая функция двух независимых переменных, обращающаяся в нуль на замкнутой кривой Г. При предположениях, естественных для некоторого класса задач физики, задача отыскания решения уравнения (11) эквивалентна отысканию минимума функционала

где W — область, ограниченная кривой Г.

уравнение (11) в этом случае является уравнением Эйлера для функционала (12). Редукция задачи (11) к (12) возможна, например, если А — самосопряжённый и положительно определённый оператор. Оператор Лапласа

удовлетворяет этим требованиям. Связь между проблемами для уравнений с частными производными и вариационными задачами имеет большое практическое значение. Она позволяет, в частности, устанавливать справедливость различных теорем существования и единственности и сыграла важную роль в кристаллизации понятия об обобщённом решении. Эта редукция очень важна также и для вычислит, математики, поскольку она позволяет использовать прямые методы вариационного исчисления.

В перечислении основных разделов современного В. и. нельзя не указать на глобальные задачи В. и., решение которых требует качественных методов. Искомое решение вариационной задачи удовлетворяет некоторому сложному нелинейному уравнению и краевым условиям. Естественно поставить вопрос о том, сколько решений допускает эта задача. Примером такой задачи является вопрос о количестве геодезических, которые можно провести между двумя точками на заданной поверхности. Проблема подобного рода относится уже к компетенции качественной теории дифференциальных уравнений и топологии. Последнее обстоятельство очень характерно. Методы, специфические для смежных дисциплин, топологии, функционального анализа и т.д., всё шире начинают применяться в В. и. В свою очередь, идеи В. и. проникают во всё новые области математики, и грань между В. и. и смежными областями математики теперь провести уже трудно.

Лит.: Лаврентьев М. А., Люстерник Л. А., Курс вариационного исчисления, 2 изд., М. — Л., 1950; Блисе Г. А., Лекции по вариационному исчислению, пер. с англ., М., 1950; Михлин С. Г., Вариационные методы в математической физике, М., 1957; Смирнов В. И., Курс высшей математики, 5 изд., т. 4, М., 1958; Гельфанд И. М., Фомин С. В., Вариационное исчисление , М., 1961; Математическая теория оптимальных процессов, М., 1969.

Н. Н. Моисеев.

Оглавление