Оптимальное управление

Оптимальное управление, раздел математики, изучающий неклассические вариационные задачи.

Объекты, с которыми имеет дело техника, обычно снабжены «рулями» — с их помощью человек управляет движением. Математически поведение такого объекта описывается некоторыми уравнениями, куда входят и управляющие параметры, характеризующие положение «рулей». Естественно, возникает вопрос об отыскании наилучшего (оптимального) в том или ином смысле управления движением. Например, речь может идти о достижении цели движения за минимальное время. Этот вопрос является задачей вариационного исчисления. В отличие от классических вариационных задач, где управляющие параметры меняются в некоторой открытой области (без границы), теория О. у. охватывает и тот случай, когда управляющие параметры могут принимать и граничные значения. Последнее обстоятельство особенно существенно с прикладной точки зрения, поскольку при управлении техническим объектом именно положение «руля» «на упоре» часто обеспечивает О. у.

Уже само зарождение (в начале 50-х гг. 20 в.) О. у. представляет собой яркий пример того, как запросы практики с неизбежностью порождают новые теории. Для новейшей техники и современного высокомеханизированного и автоматизированного производства характерно стремление выбирать наилучшую программу действий, наиболее рационально использовать имеющиеся ресурсы. Именно эти конкретные технические задачи стимулировали разработку теории О. у., оказавшейся математически очень содержательной и позволившей решить многие задачи, к которым классические методы были неприменимы. Интенсивное развитие теории О. у., в свою очередь, оказалось мощным фактором, способствующим успешному решению научно-технических и народнохозяйственных задач.

Центральным результатом теории О. у.. является принцип максимума Понтрягина, дающий общее необходимое условие оптимальности управления. Этот результат и связанные с ним исследования, проведённые Л. С. Понтрягиным и его сотрудниками, послужили исходный пунктом разработки теоретических, вычислительных и прикладных аспектов теории О. у. При решении ряда задач О. у. с успехом используются идеи метода динамического программирования, основы которого разработаны американским учёным Р. Беллманом и его сотрудниками.

В общих чертах задача О. у. состоит в следующем. Рассмотрим управляемый объект, под которым понимается некоторая машина, прибор или процесс, снабжённые «рулями». Манипулируя «рулями» (в пределах имеющихся ресурсов управления), мы тем самым определяем движение объекта, управляем им. Например, технологический процесс осуществления химической реакции можно считать управляемым объектом, «рулями» которого являются концентрации ингредиентов, количество катализатора, поддерживаемая температура и др. факторы, влияющие на течение реакции. Для того чтобы знать, как именно ведёт себя объект при том или ином управлении, необходимо иметь закон движения, описывающий динамические свойства рассматриваемого объекта и устанавливающий для каждого избираемого правила манипулирования «рулями» эволюцию состояния объекта. Возможности управлять объектом лимитируются не только ресурсами управления, но и тем, что в процессе движения объект не должен попадать в состояния, физически недоступные или недопустимые с точки зрения конкретных условий его эксплуатации. Так, осуществляя манёвр судном, необходимо учитывать не только технической возможности самого судна, но и границу фарватера.

Имея дело с управляемым объектом, всегда стремятся так манипулировать «рулями», чтобы, исходя из определенно начального состояния, в итоге достичь некоторого желаемого состояния. Например, для запуска ИСЗ необходимо рассчитать режим работы двигателей ракеты-носителя, который обеспечит доставку спутника на желаемую орбиту. Как правило, существует бесконечно много способов управлять объектом так, чтобы реализовать цель управления. В связи с этим возникает задача найти такой способ управления, который позволяет достичь желаемого результата наилучшим, оптимальным образом в смысле определённого критерия качества; в конкретных задачах часто требуется реализовать цель управления за наименьшее возможное время или с минимальным расходом горючего, или с максимальным экономическим эффектом и т.п.

В качестве типичного можно привести управляемый объект, закон движения которого описывается системой обыкновенных дифференциальных уравнений

= , (1)

i = 1,..., n,

где x¹,..., xⁿ — фазовые координаты, характеризующие состояние объекта в момент времени t, а u ¹,..., u ^r— управляющие параметры. Управление объектом означает выбор управляющих параметров как функций времени

, j = 1,..., r, (2)

являющихся допустимыми с точки зрения имеющихся возможностей управления объектом. Например, в прикладных задачах часто требуется, чтобы в каждый момент времени точка (u ¹,..., u ^r) принадлежала заданному замкнутому множеству U. Это последнее обстоятельство делает рассматриваемую вариационную задачу неклассической. Пусть заданы начальное ( x ¹₀,..., x ⁿ₀) и конечное (x ¹₁,..., x ⁿ₁) состояния объекта (1). Об управлении (2) говорят, что оно реализует цель управления, если найдётся такой момент времени t₁ > t₀, что решение (x ¹(t),..., x ⁿ(t)) задачи

(3)

x ⁱ(t₀) = x ⁱ₀,

i = 1,..., n,

удовлетворяет условию x ⁱ(t₁) = x ⁱ₁. Качество этого управления будем оценивать значением функционала

, (4)

где — заданная функция. Задача О. у. состоит в отыскании такого реализующего цель управления, для которого функционал (4) принимает наименьшее возможное значение. Т. о., математическая теория О. у. — это раздел математики, рассматривающий неклассические вариационные задачи отыскания экстремумов функционалов на решениях уравнений, описывающих управляемые объекты, и управлений, на которых реализуется экстремум.

Сформулируем для поставленной задачи необходимое условие оптимальности управления.

Принцип максимума Понтрягина. Пусть вектор-функция

u = u (t) = (u ¹(t),..., u ^r(t)), t £ t₀ £ t₁, (5)

– оптимальное управление, а вектор-функция

x = x (t) = (x ¹(t),..., x ⁿ(t)), t £ t₀ £ t₁,

– соответствующее ему решение задачи (3). Рассмотрим вспомогательную линейную систему обыкновенных дифференциальных уравнений

, (6)

k = 0, 1,..., n,

и составим функцию

Н (y, х, u) = ,

зависящую, помимо х и u, от вектора y = (y₀, y₁,..., y_n). Тогда у линейной системы (6) существует такое нетривиальное решение

y = y(t) = (y₀(t), y₁(t),..., y_n(t)),

t £ t₀ £ t₁,

что для всех точек t из отрезка [t₀, t₁], в которых функция (5) непрерывна, выполнено соотношение

мах Н (y(t), х (t), u) = Н (y(t), x (t), u (t)) = 0,

u Î U

причём y₀(t) º const £ 0.

К виду (1) обычно приводятся уравнения движения в случае управляемых механических объектов с конечным числом степеней свободы. В многочисленных реальных ситуациях возникают и иные постановки задач О. у., отличающиеся от приведённой выше: задачи с фиксированным временем, когда продолжительность процесса заранее задана, задачи со скользящими концами, когда про начальное и конечное состояния известно, что они принадлежат некоторым множествам, задачи с фазовыми ограничениями, когда решение задачи (3) в каждый момент времени должно принадлежать фиксированному замкнутому множеству, и др. В задачах механики сплошных сред характеризующая состояние управляемого объекта величина х является функцией уже не только времени, но и пространственных координат (например, величина х может описывать распределение температуры в теле в данный момент времени), а закон движения будет дифференциальным уравнением с частными производными. Часто приходится рассматривать управляемые объекты, когда независимая переменная принимает дискретные значения, а закон движения представляет собой систему конечно-разностных уравнений. Наконец, отдельную теорию составляет О. у. стохастическими объектами.

Лит.: Математическая теория оптимальных процессов, 2 изд.. М., 1969 (авт. Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко); Красовский Н. Н., Теория управления движением, М., 1968; Моисеев Н. Н., Численные методы в теории оптимальных систем, М., 1971.

Н. Х. Розов.

Оглавление БСЭ