Вариационное исчисление, математическая дисциплина, посвященная отысканию экстремальных (наибольших и наименьших) значений функционалов — переменных величин, зависящих от выбора одной или нескольких функций. В. и. является естественным развитием той главы математического анализа, которая посвящена задаче отыскания экстремумов функций. Возникновение и развитие В. и. тесно связано с задачами механики, физики и т.д.

  Одной из первых задач В. и. была знаменитая задача о брахистохроне (И. Бернулли, 1696): определить форму кривой, лежащей в вертикальной плоскости, по которой тяжёлая материальная точка, двигаясь под действием только одной силы тяжести и не имеющая начальной скорости, перейдёт из верхнего положения А в нижнее положение В за минимум времени. Эта задача сводится к отысканию функции у (х), доставляющей минимум функционалу

 

  где а и b — абсциссы точек А и В.

  Другой такой же «исторической» задачей является задача об отыскании пути, вдоль которого распространяется свет, идущий от источника света (точка А) к некоторой точке В, в среде с переменной оптической плотностью (то есть в среде, где скорость распространения v есть функция координат). Для решения этой задачи может быть использован, так называемый, Ферма принцип, согласно которому из всех кривых, соединяющих точки А и В, луч света распространяется вдоль той, по которой свет приходит из A в B за кратчайшее время. В простейшем случае, когда свет распространяется в плоскости, задача сводится к отысканию кривой y (x), доставляющей минимум функционалу

 

  Из разрозненных задач подобного рода постепенно в 18 в. начало формироваться В. и. Но и после оформления В. и. в самостоятельную дисциплину она продолжала оставаться связанной с различными проблемами механики и физики. На протяжении 2-й половины 18 в. и всего 19 в. делались интенсивные попытки построить здание механики, опираясь на некоторые общие вариационные принципы (см. Вариационные принципы механики). Со 2-й половины 19 в. начинают разрабатываться различные вариационные принципы в механике сплошных сред, затем позднее в квантовой механике, электродинамике и т.д. Возникают вариационные принципы и в средах с диссипацией энергии. Исследования во всех подобных областях продолжают служить базой формирования новых задач В. и. и областью приложения её методов. Однако со временем появились и новые классы задач, далеко раздвинувших традиционные границы дисциплины и превративших В. и. в одну из наиболее обширных ветвей современной математики, включающей в себя, с одной стороны, самые абстрактные вопросы, относящиеся в равной степени к топологии и функциональному анализу, а с другой — разнообразные вычислительные методы решения технических или экономических задач.

  Прямые методы. В. и. как самостоятельная научная дисциплина сформировалась в 18 в., главным образом благодаря работам Л. Эйлера.

  Простейшей задачей В. и. называют задачу отыскания функции x (t), доставляющей экстремум функционалу

 

  где F — непрерывная и дифференцируемая функция своих аргументов. При этом функция x (t) должна удовлетворять следующим условиям:

  а) она должна быть кусочно дифференцируемой,

  б) при t = to и t = T она должна принимать значения

  х (to) = х0, х (Т) = хт.     (2)

  Обе задачи, рассмотренные в начале статьи, являются частными случаями простейшей задачи В. и.

  Первые вариационные задачи были задачами механики. Они были поставлены в 18 в. и, следуя традициям того времени, первый вопрос, на который надо было ответить, был вопрос о способе фактического отыскания функции x (t), реализующей минимум функционала (1).

  Эйлер создал численный метод решения задач В. и., который получил название Эйлера метода ломаных. Этот метод был первым среди большого класса, так называемых, прямых методов; все они основаны на редукции задачи отыскания экстремума функционала к задаче отыскания экстремума функции многих переменных. Поскольку для получения решения с высокой точностью задачу приходится сводить к отысканию экстремума функции с большим числом переменных, она становится весьма сложной для ручного счёта. Поэтому долгое время прямые методы были вне основного русла, по которому направлялись усилия математиков, занимавшихся В. и.

  В 20 в. интерес к прямым методам значительно усилился. Прежде всего были предложены новые способы редукции к задаче об экстремуме функции конечного числа переменных. Поясним эти идеи на простом примере. Рассмотрим снова задачу отыскания минимума функционала (1) при дополнит. условии

  x (to) = x (T) = 0     (3)

  и будем разыскивать решение задачи в форме

 

  где jn (t) — некоторая система функций, удовлетворяющих условиям типа (3). Тогда функционал J (x) становится функцией коэффициентов ai:

  J = J (ai,..., aN),

  и задача сводится к отысканию минимума этой функции N переменных. При известных условиях, наложенных на систему функций {jn}, решение этой задачи стремится при N ® ¥ к решению задачи (1) (см. Ритца и Галёркина методы).

  Другая причина усиления интереса к прямым методам — это систематическое изучение конечноразностных методов в задачах математической физики, начавшееся с 20-х гг. 20 в. Применение ЭВМ превращает постепенно прямые методы в основной инструмент решения вариационных задач.

  Метод вариаций. Второе направление исследований — это изучение необходимых и достаточных условий, которым должна удовлетворять функция x (t), реализующая экстремум функционала J (x). Его возникновение также связано с именем Эйлера. Предположим, что тем или иным способом построена функция x (t). Как проверить, является ли эта функция решением задачи? Первый вариант ответа на этот вопрос был дан Эйлером в 1744. В приведённой ниже формулировке этого ответа употребляется введённое в 60-х гг. 18 в. Ж. Лагранжем понятие вариации (отсюда название — В. и.), являющееся обобщением понятия дифференциала на случай функционалов.

  Пусть x (t) функция, удовлетворяющая условию (2), a h (t) — произвольная гладкая функция, удовлетворяющая условию h (to) = h (T) = 0. Тогда величина

  J (x + eh) = J*(e),

  где e — произвольное действительное число будет функцией e. Вариацией dJ функционала J называют производную

  (dJ*/de)e = 0.

  Для простейшей задачи В. и.

 

  Разлагая полученное выражение в ряд по степеням e, получим

 

  где о (e) — члены более высокого порядка. Так как h (to) = h (T) = 0, то, проведя интегрирование по частям во втором интеграле, найдём

 

  Пусть теперь x (t) реализует экстремум. Тогда функция J*(e) имеет экстремум при e = 0. Поэтому величина dJ должна обратиться в нуль. Отсюда следует: для того чтобы функция x (t) доставляла экстремум функционалу (1), необходимо, чтобы она удовлетворяла уравнению

 

  называемому уравнением Эйлера.

  Это — дифференциальное уравнение 2-го порядка относительно функции x (t). Необходимое условие dJ = 0 может быть применено в ряде случаев для эффективного отыскания решения вариационной задачи, поскольку функция x (t) необходимо должна быть решением краевой задачи x (to) = xo, x (T) = xT для уравнения (4). Если найдено это решение и оно единственно, то найдено тем самым и решение исходной вариационной задачи. Если краевая задача допускает несколько решений, то достаточно вычислить значение функционала для каждого из решений краевой задачи и выбрать из них то, которому отвечает наименьшее значение J (x). Однако указанный путь обладает одним существенным недостатком: не существует универсальных способов решения краевых задач для обыкновенных (нелинейных) дифференциальных уравнений.

  Уже во 2-й половине 18 в. круг задач, изучаемых В. и., значительно расширился. Прежде всего основные результаты, относящиеся к простейшей задаче В. и., были перенесены на общий случай интегральных функционалов вида

 

  где x (t) вектор-функция произвольной размерности, и на функционалы ещё более общего вида.

  Условный экстремум. Задача Лагранжа. В конце 18 в. был сформулирован ряд задач на условный экстремум. Этим термином принято называть задачи отыскания функции x (t), доставляющей экстремум функционалу J (x) при каких-либо дополнительных условиях, кроме условий на концах интервала (t0, T). Простейшей задачей подобного вида является класс так называемых изопериметрических задач. Своим названием этот класс задач обязан следующей: среди всех замкнутых кривых данной длины найти ту, которая ограничивает максимальную площадь.

  Значительно более сложной задачей является та, в которой ограничения носят характер дифференциальных уравнений. Эту задачу называют задачей Лагранжа; особое значение она приобрела в середине 20 в. в связи с созданием теории оптимального управления. Поэтому её формулировка даётся ниже на языке этой теории, возникшем после работ Л. С. Понтрягина и его учеников.

  Пусть x (t) и u (t) — вектор-функции размерностей n и m соответственно, причём функция x (t), которую называют фазовым вектором, при t = to и t = T удовлетворяет граничным условиям:

  x (t0) Î e0, x (T) Î eT     (5)

  где e0 и eT — некоторые множества. Простейшим примером условий типа (5) являются условия (2). Функция x (t) и функция u (t), которую называют управлением, связаны условием

  dx/dt = f (x, u, t),     (6)

  где f — дифференцируемая вектор-функция своих аргументов. Рассматриваемая задача состоит в следующем: определить функции x (t) и u (t), доставляющие экстремум функционалу

 

  Заметим, что и простейшая задача В. и. и изопериметрическая задача являются частным случаем задачи Лагранжа.

  Задача Лагранжа имеет огромное прикладное значение. Пусть, например, уравнение (6) описывает движение какого-либо динамического объекта, например космического корабля. Управление u — это вектор тяги его двигателя. Множества e0 и eT — это две орбиты разных радиусов. Функционал (7) описывает расход горючего на выполнение маневра. Следовательно, задачу Лагранжа, применительно к данной ситуации, можно сформулировать следующим образом: определить закон изменения тяги двигателя космического аппарата, совершающего переход с орбиты e0 на орбиту eT за заданное время так, чтобы расход топлива на этот маневр был минимальным.

  Важную роль в теории подобных задач играет функция Гамильтона

  H (x, y, u) = (f, y) - F.

  Здесь y — вектор, называется множителем Лагранжа (или импульсом), (f, y) означает скалярное произведение векторов f и y. Необходимое условие в задаче Лагранжа формулируется следующим образом: для того чтобы функции  и  были решением задачи Лагранжа, необходимо, чтобы  была стационарной точкой функции Гамильтона Н (х, y, u), то есть, чтобы при

 

  было H/u = 0, где y — не равное тождественно нулю решение уравнения

  ¶y/t = —H/x = j(x, y, u, t).     (8)

  Эта теорема имеет важное прикладное значение, так как она открывает известные возможности для фактического нахождения векторов x (t) и u (t).

  Развитие В. и. в 19 в. Основные усилия математиков в 19 в. были направлены на исследование условий, необходимых или достаточных для того, чтобы функция x (t) реализовала экстремум функционала J (x). уравнение Эйлера было первым из таких условий; оно аналогично необходимому условию

 

  которое устанавливается в теории функций конечного числа переменных. Однако в этой теории известны ещё и другие условия. Например, для того, чтобы функция f (x) имела в точке  минимум, необходимо, чтобы в этой точке было

 

  каков бы ни был произвольный вектор h. Естественно поставить вопрос: в какой степени эти результаты переносятся на случай функционалов? Для того чтобы представить себе сложность, которая здесь возникает, заметим, что функция  может реализовать минимум среди функций одного класса и не давать минимум среди функций другого класса и т.д.

  Подобные вопросы послужили источником разнообразных и глубоких исследований А. Лежандра, К. Якоби, М. В. Остроградского, У. Гамильтона, К. Вейерштрасса и многих других. Эти исследования не только обогатили математический анализ, но и сыграли большую роль в формировании идей аналитической механики и оказали серьезное влияние на развитие разнообразных отделов теоретической физики.

  Развитие В. и. в 20 в. В 20 в. возник целый ряд новых направлений В. и., связанных с интенсивным развитием техники, смежных вопросов математики и вычислительной техники. Одно из основных направлений развития В. и. в 20 в. — рассмотрение неклассических задач В. и., приведшее к открытию принципа максимума Л. С. Понтрягина.

  Рассмотрим снова задачу Лагранжа: определить минимум функционала

 

  при условии

 

  фазовый вектор x (t) должен удовлетворять ещё некоторым граничным условиям.

  В своей классической постановке условия задачи Лагранжа не предусматривают никаких ограничений на управление u (t). Выше (см. раздел Условный экстремум. Задача Лагранжа) подчёркивалась тесная связь между задачей Лагранжа и задачей управления. В рассмотренном там примере u (t) тяга ракетного двигателя. Эта величина подчинена ограничениям: тяга двигателя не может превосходить некоторой величины, и угол поворота вектора тяги также ограничен. В данном конкретном примере компонента ui (i = 1,2,3) вектора тяги двигателя подчинена ограничениям

 

  где а-i и a+i — некоторые заданные числа. Подобных примеров можно привести много.

  Таким образом, в технике появилось много задач, которые сводятся к задаче Лагранжа, но при дополнительных ограничениях типа (10), записываемых в форме u Î Gu, где Gu — некоторое множество, которое, в частности, может быть замкнутым. Такие задачи получили название задач оптимального управления. В задаче Лагранжа можно исключить управление u (t) при помощи уравнения (8) и получить систему уравнений, которая содержит только фазовую переменную х и множитель Лагранжа j. Для теории оптимального управления должен был быть разработан специальный аппарат. Эти исследования привели к открытию принципа максимума Л. С. Понтрягина. Он может быть сформулирован в форме следующей теоремы: для того чтобы функции  и  были решением задачи оптимального управления чтобы они доставляли минимум функционалу (9)], необходимо, чтобы u (t) доставляла максимум функции Гамильтона

 

  где y — множитель Лагранжа (импульс), который является ненулевым решением векторного уравнения

 

  Принцип максимума позволяет свести задачу оптимального управления к краевой задаче для системы обыкновенных дифференциальных уравнений порядка 2n (n — размерность фазового вектора). Принцип максимума и в этом случае даёт более сильный результат, чем теорема Лагранжа, поскольку он требует, чтобы  было не стационарным значением функции Гамильтона Н, а доставляло максимум Н.

  Возможен и другой подход к тем же проблемам теории оптимального управления. Пусть s (х, t) значение функционала (9) вдоль оптимального решения. Тогда для того чтобы функция  была оптимальным управлением, необходимо (а в некоторых случаях и достаточно), чтобы функция s (х, t) удовлетворяла следующему дифференциальному уравнению с частными производными:

 

  называемому уравнением Беллмана (см. Динамическое программирование).

  Круг вопросов, которыми занимается В. и., непрерывно расширяется. В частности, всё большее и большее внимание уделяется изучению функционалов J (x) весьма общего вида, задаваемых на множествах Gx элементов из нормированных пространств. Для задач такого рода уже трудно использовать метод вариаций. Возникли новые методы, основанные на использовании понятия конуса в банаховых пространствах, опорных функционалов и т.д.

  Уже в 19 в. была обнаружена глубокая связь между некоторыми проблемами теории уравнений с частными производными и вариационными задачами. П. Дирихле показал, что решение краевых задач для уравнения Лапласа эквивалентно решению некоторой вариационной задачи. Эта проблема привлекает к себе всё больше и больше внимания. Рассмотрим один пример.

  Предположим, что имеется некоторое линейное операторное уравнение

  Ax = f,     (11)

  где х (x, h) — некоторая функция двух независимых переменных, обращающаяся в нуль на замкнутой кривой Г. При предположениях, естественных для некоторого класса задач физики, задача отыскания решения уравнения (11) эквивалентна отысканию минимума функционала

 

  где W — область, ограниченная кривой Г.

  уравнение (11) в этом случае является уравнением Эйлера для функционала (12). Редукция задачи (11) к (12) возможна, например, если А — самосопряжённый и положительно определённый оператор. Оператор Лапласа

 

  удовлетворяет этим требованиям. Связь между проблемами для уравнений с частными производными и вариационными задачами имеет большое практическое значение. Она позволяет, в частности, устанавливать справедливость различных теорем существования и единственности и сыграла важную роль в кристаллизации понятия об обобщённом решении. Эта редукция очень важна также и для вычислит, математики, поскольку она позволяет использовать прямые методы вариационного исчисления.

  В перечислении основных разделов современного В. и. нельзя не указать на глобальные задачи В. и., решение которых требует качественных методов. Искомое решение вариационной задачи удовлетворяет некоторому сложному нелинейному уравнению и краевым условиям. Естественно поставить вопрос о том, сколько решений допускает эта задача. Примером такой задачи является вопрос о количестве геодезических, которые можно провести между двумя точками на заданной поверхности. Проблема подобного рода относится уже к компетенции качественной теории дифференциальных уравнений и топологии. Последнее обстоятельство очень характерно. Методы, специфические для смежных дисциплин, топологии, функционального анализа и т.д., всё шире начинают применяться в В. и. В свою очередь, идеи В. и. проникают во всё новые области математики, и грань между В. и. и смежными областями математики теперь провести уже трудно.

 

  Лит.: Лаврентьев М. А., Люстерник Л. А., Курс вариационного исчисления, 2 изд., М. — Л., 1950; Блисе Г. А., Лекции по вариационному исчислению, пер. с англ., М., 1950; Михлин С. Г., Вариационные методы в математической физике, М., 1957; Смирнов В. И., Курс высшей математики, 5 изд., т. 4, М., 1958; Гельфанд И. М., Фомин С. В., Вариационное исчисление , М., 1961; Математическая теория оптимальных процессов, М., 1969.

  Н. Н. Моисеев.

 

Оглавление