Математические методы изучения процессов управления
Введение
Создание в середине 50-х годов
прошлого столетия математической теории оптимального управления было связано с
потребностями решения технических и экономических задач. Проблемы управления, в
частности проблемы отыскания наилучшего, оптимального управления, возникают
всюду. Наиболее яркие примеры таких задач - это задачи управления летательными
аппаратами, управления технологическим процессом на производстве и т. п. В
настоящее время оптимальное управление выросло в обширную самостоятельную
теорию, использующую в своих исследованиях аппарат высшей алгебры,
математического и функционального анализа, дифференциальных уравнений.
Курсовая работа состоит из двух
глав. В 1 главе рассматривается общая постановка задачи оптимального
управления. 2 глава состоит из двух частей: постановка задачи о мягком
прилунении космического корабля и решение этой задачи.
Глава 1. Задачи оптимального
управления системами обыкновенных дифференциальных уравнении
.1 Постановка задачи оптимального
управления
Пусть управляемый
процесс ,
,
,
подчинен системе обыкновенных дифференциальных уравнений:
, .
(1)
Вектор-функция называется
управлением. Допустимые управления принадлежат классу кусочно-непрерывных на
отрезке функций,
удовлетворяющих ограничению типа включения:
, .
(2)
Вектор функция называется
состоянием (фазовой траекторией) управляемого процесса.
Целью задачи является
минимизация функционала:
(3)
при дополнительных
условиях:
, ,
, ,
(4)
где
, .
Система уравнений (1),
определяющая дифференциальную связь между состоянием и управлением, должна
выполняться во всех точках непрерывности вектор-функции .
Управляемый процесс, для которого выполнены все перечисленные выше условия (1),
(2), (4) называется допустимым. Отметим, что в ряде случаев под допустимыми
управлениями понимаются вектор-функции, принадлежащие одному из пространств ,
.
В случае фиксированных
моментов и
рассматриваемая
задача называется задачей с закрепленным временем. Если условия (4) определяют
ограничение для
любых допустимых процессов, то левый конец траектории называется закрепленным.
Если условия (4) не налагают никаких ограничений на ,
то левый конец называется свободным. Наконец, если условия определяют
ограничения вида ,
где -
непустое множество пространства , не совпадающее с и
содержащее более одного элемента, то говорят о подвижном левом конце.
Аналогичным образом вводятся понятия закрепленного, свободного и подвижного
правого конца.
Целевой функционал (3)
представляет собой сумму терминального функционала и
интегрального слагаемого. Задача оптимального управления с функционалом такого
вида называется задачей Больца (Майера-Больца). Ее частными вариантами является
задача Лагранжа - минимизация интегрального функционала и задача Майера, в
которой критерием качества служит терминальный функционал. Задача Лагранжа с называется
задачей быстродействия. Целевым функционалом в ней является .
Заметим, что условия
(2), (4) не являются самыми общими. В приложениях часто встречаются также и
более сложные ограничения точечного вида: , .
Глава 2. Задача о мягком
прилунении космического корабля
.1 Дискретные задачи оптимального
управления
До сих пор рассматривались
непрерывные процессы, которые моделируются системой дифференциальных уравнений.
В таких процессах время изменяется непрерывно в пределах какого-то промежутка.
Если же время может принимать лишь дискретное множество значений, например t =
0,1,K,T −1, то мы будем иметь дело с дискретным объектом управления.
Часто дискретные
процессы называют многошаговыми. В каждый момент времени (или на каждом шаге)
такие процессы характеризуются двумя наборами переменных: и . Это соответственно
вектор состояния и вектор управления. Состояние на t +1-м шаге определяется
конечно-разностным уравнением
(2.3.1)
где - заданная
вектор-функция.
В некоторых случаях
бывает удобно записывать (2.3.1) в координатах:
…
Таким образом, (2.3.1) - это система
конечно-разностных уравнений. Она называется линейной, если имеет вид
где - матрицы размерности и соответственно. Если
эти матрицы не зависят от времени t, то мы будем иметь линейную стационарную
дискретную систему.
Последовательность называется дискретным
управлением.
Дискретное управление
называется допустимым, если оно удовлетворяет условию
где - заданное множество в
пространстве
Предположим, что задано
положение объекта в момент , т.е. задано начальное
условие
В этом случае дискретное
управление однозначно определяет соответствующую ему траекторию - решение
системы (2.3.1). Таким образом, дискретная траектория - это последовательность
Рассмотрим пару , где - допустимое дискретное
управление, - соответствующая
дискретная траектория. Такую пару будем называть допустимой. Пусть на множестве
допустимых пар задан некоторый функционал , который определяет
качество процесса. Сформулируем задачу оптимального управления. Требуется найти
допустимое дискретное управление и соответствующую дискретную траекторию (т.е.
решение задачи (2.3.1) - (2.3.3)), которые доставляют минимум функционалу . Функционал называется критерием
качества. Решение сформулированной задачи называется оптимальным управлением и
оптимальной траекторией. В краткой записи эта задача выглядит следующим
образом:
Здесь левый конец траектории
закреплен, а правый свободен. Другие задачи, соответствующие различным режимам
на концах траектории, определяются точно так же, как в непрерывном случае.
Аналогично можно задать ограничения на управление, фазовые и смешанные
ограничения.
Наиболее часто встречающиеся в
дискретных задачах критерии качества задаются следующими функционалами:
1) суммарный
) терминальный
3) смешанный
Дискретные задачи оптимального
управления служат моделями для многих технических и экономических процессов
управления. Примеры таких моделей можно найти в [4], [5]. Однако дискретные
задачи возникают не только как объекты самостоятельного исследования. Очень
часто к ним сводятся непрерывные задачи оптимального управления. Необходимость
рассмотрения дискретных аналогов непрерывных систем возникает почти всегда при
численном решении непрерывных задач управления.
Возможны различные, в смысле
точности или простоты, переходы к дискретной аппроксимации. Приведем наиболее
простой способ. Пусть задано дифференциальное уравнение
(2.3.8)
где - n-вектор состояния, - вектор управления.
Зафиксируем натуральное
число N и положим Будем придавать
аргументу τ лишь значения и введем дискретный
аргумент по формуле
Таким образом, t будет
принимать значения 0,1,2,…,N. Вместо переменных y, v введем новые переменные x,
u по формулам
Дифференциальное
уравнение (2.3.8) заменим приближенным разностным:
y(τ) − y(τ − h) =
f (y(τ − h),v(τ − h)). (2.3.11)
Будем рассматривать это уравнение
лишь для значений τ = h, 2h,..., Nh.
Из (2.3.11) получим:
(τ)
= y(τ − h) + hf (y(τ − h), v(τ)), или, в силу (2.3.9),
(2.3.10),(t) = x(t −1) + hf (x(t −1),u(t −1)), t =1, 2, …, N.
Это и есть дискретный аналог
непрерывной системы.
Если рассматривается непрерывная ЗОУ
с критерием качества
J (y, v) = ∫ f0
(y(τ), v(τ))dτ+Φ(y(T)),
то при построении дискретного
аналога он преобразуется в суммарный критерий:
−1(x,u) = h∑
f0 (x(t),u(t)) + Φ(x(N)).=0
2.2 Постановка задачи
Теория оптимального управления нашла
широкое применение в ракетодинамике. Вывод космических аппаратов на орбиту,
маневры в космосе, посадка требуют решения ряда оптимизационных задач,
связанных с минимизацией расхода топлива, минимизацией времени выхода в заданную
точку траектории и т.п. Именно процессы движения управляемых летательных
аппаратов описываются достаточно простыми и, вместе с тем, точными
математическими моделями. Наличие хорошо разработанной ранее теории движения
ракет позволило быстро и эффективно применить методы оптимального управления к
решению ряда проблем в этой актуальной области техники.
Предположим, что
космический аппарат, который можно рассматривать как материальную точку,
осуществляет мягкую посадку на Луну. Прилунение производится по вертикальной
прямой, нормальной к поверхности Луны. Пусть начало координат совпадает с этой
поверхностью, координатная ось направлена вертикально вверх. В начальный момент
времени космический
корабль, находящийся на известной высот , обладает скоростью и
имеет массу .
В каждый момент времени на
аппарат действует сила притяжения Луны, направленная вертикально вниз и равная
по абсолютной величине.
Здесь -
масса аппарата, -
ускорение свободного падения на Луне, которое мы будем считать постоянным. При
включенных двигателях действует сила тяги, направленная вверх и равная ,
где -
мгновенный расход топлива, ; -
известный постоянный коэффициент. Связь изменения массы с расходом горючего
определяется формулой .
Требуется найти режим расхода топлива, обеспечивающий нулевую скорость аппарата
в точке прилунения и минимальные суммарные затраты топлива. Время посадки
заранее не оговаривается.
Перейдем к формализации
поставленной задачи как задачи оптимального управления. Роль управляющего
воздействия играет скалярная функция , стесненная
ограничениями типа (2):
,
В качестве
вектор-функции, характеризующей состояние процесса, выберем .
Здесь -
высота аппарата в момент ,
-
скорость, -
масса аппарата. Тогда .
Согласно второму закону
Ньютона
.
По определению расхода
топлива
Приведенные три
дифференциальные уравнения образуют систему (1), определяющую дифференциальную
связь между состоянием и управлением. Ограничениями (4) являются начальные
условия ,
,
и условия,
обеспечивающие мягкое прилунение: , .
Требуется минимизировать суммарный
расход топлива, т.е.
.
Этот же функционал можно
записать и в интегральном виде:
.3 Решение задачи
Рассматриваемый пример
представляет собой задачу оптимального управления с закрепленным начальным
моментом ,
нефиксированным конечным моментом , закрепленным левым
концом траектории (и частично закрепленным правым концом).
Введём обозначения:
Построим функцию
Понтрягина
,
Где -
переменные сопряженной системы
;
;
.
Таким образом, функция
Понтрягина - линейная функция относительно . Максимального значения
она достигает лишь на границе области определения. Остается выяснить, как ведет
себя множитель, стоящий перед ,
.
Рассмотрим производную
.
Поскольку в
нуль не обращается (),
этот множитель изменяется монотонно, не имеет ни максимума, ни минимума.
Как правило, режим
работы двигателя следующий: если он включен, то тяга постоянна и равно ,
если выключен - тяга равна нулю. Поэтому имеет максимальное
значение при .
Задача оптимального
управления мягкой посадки, таким образом, сводится к определению момента
включения двигателя и
момента посадки .
Чтобы эти моменты
определить, проинтегрируем дифференциальные уравнения.
При имеем:
, ,
,
,
.
На следующем отрезке
времени получим
, ,
Возьмем интеграл, для
чего воспользуемся равенством
Отсюда
.
Краевое условие ,
приводит
к следующим трансцендентным уравнениям, определяющим и
:
,
где ,
Итак, чтобы совершить
мягкую посадку, необходимо на космическом корабле иметь измерительные
устройства, дающие информацию о высоте, скорости и массе. Вычислительное
устройство по заданным параметрам находит момент
включения двигателя.
Заключение
Задачи оптимизации
управляемых процессов или задачи оптимального управления составляют один из
широких классов экстремальных задач и имеют важное прикладное значение.
В общем случае задачу
управления нельзя ограничивать только достижением некоторого значения вектора
состояния .
Может оказаться, что в таком строгом достижении этого состояния и нет
необходимости: важно, чтобы состояние динамической системы не вышло из
некоторой области, определяющей многообразие допустимых значений вектора
состояния. Естественно, каждому заданному закону управления соответствует закон
изменения координат вектора состояния, то есть траектория “движения”
управляемого объекта в фазовом пространстве. Зачастую процесс управления
осуществляется с “ограниченными ресурсами”, то есть закон управления не может
быть произвольным, а должен выбираться из некоторого множества.
В курсовой работе
рассмотрена задача о мягком прилунении космического корабля. Как правило, режим
работы двигателя следующий: если он включен, то тяга постоянна и равно ,
если выключен - тяга равна нулю.
дифференциальный
уравнение управление дискретный
Список литературы
1. Афанасьев В.Н. Математическая теория конструирования систем
управления. - М.: Высшая школа, 1989. - 447 с.
. Галамекс В.Ю. Оптимальная механика - Санкт-Петербург.:, 2008.-
608 с.
. Демьянов В. Ф. Условия экстремума и вариационное исчисление -
Москва.: Высшая школа, 2005.- 336 с.
. Зотов М. Г. Многокритериальное конструирование систем
автоматического управления - Москва.: Бином. Лаборатория знаний, 2004.- 376 с.
. Летов А.М. Математическая теория процессов управления. - М.:
Наука, 1981. - 256 с.
. Пантелеев А. В., Летова Т. А. Методы оптимизации в примерах и
задачах - Санкт-Петербург.: Высшая школа, 2008.- 544 с.
. Струченков В. И. Методы оптимизации - Москва.: Экзамен, 2005.-
256 с.
. Струченков В. И. Методы оптимизации в прикладных задачах -
Санкт-Петербург.: Солон-Пресс, 2009.- 320 с.
. Сухарев А. Г., Тимохов А. В. Курс методов оптимизации -
Санкт-Петербург.: ФИЗМАТЛИТ, 2005. - 368 с.