Выбрать главу

Пусть x = x(t), y = y(t) — произвольное решение системы (8). Для геометрического его изображения рассмотрим на фазовой плоскости переменных (x, y) точку [x(t), y(t)], движущуюся с течением времени t. Получаемая в результате движения точки по фазовой плоскости траектория называется фазовой траекторией. Для системы (8) она представляет собой окружность с центром в начале координат, по которой точка движется с постоянной угловой скоростью, равной одному радиану в секунду, причём движение происходит по часовой стрелке. Допустим теперь, что на нашу движущуюся точку x воздействует внешняя сила величины u, которая не может превосходить по модулю единицы. Тогда уравнение движения точки записывается в виде x″ + x = u или в виде системы уравнений

Система уравнений (9) описывает движение управляемого объекта, где u есть управляющий параметр. Постараемся теперь привести точку, находящуюся в начальный момент времени в произвольном положении (x0, y0), в состояние покоя, то есть в начало координат фазовой плоскости, за минимальное время, используя для этого управляющий параметр u. Из принципа максимума непосредственно следует, что оптимальное управление u может принимать только значения ±1. При u = +1 фазовой траекторией системы (9) является окружность с центром в точке (1, 0), а при u = –1 фазовой траекторией системы (9) является окружность с центром в точке (–1, 0). Зная, что оптимальное значение u = ±1, мы должны теперь только указать, как меняется u между этими двумя значениями в процессе движения. Из принципа максимума легко вывести, что значение u зависит лишь от положения фазовой точки на фазовой плоскости, а именно, вся фазовая плоскость разбивается на две части, в одной из которых u должно иметь значение +1, а в другой — значение –1.

Разбиение фазовой плоскости на две части осуществляется линией, начерченной на рис. 1. Она состоит из полуокружностей радиуса единица, опирающихся как на диаметры на отрезки оси абсцисс. Причём на положительной части абсциссы полуокружности обращены вниз, а на отрицательной части абсциссы полуокружности обращены вверх. Две полуокружности, примыкающие к началу координат, сами являются оптимальными траекториями, так что если начальная точка находится на одной из них, то движение в начало координат осуществляется по соответствующей полуокружности. Оказывается дальше, что если фазовая точка находится под начерченной линией раздела, то u должно иметь значение +1, а если над линией раздела, то значение u должно быть равно –1. Легко вычертить траекторию оптимального движения точки (см. рис. 1), исходя из произвольного начального положения (x0, y0). Начиная с какой-либо точки плоскости (x0, y0), движение определяется уравнением (9) с определённым значением u = ±1, причём значение это переключается на противоположное, когда соответствующая траектория доходит до линии раздела переключения. В конце концов точка попадает на одну из полуокружностей линии раздела, примыкающих к началу координат, после чего точка движется по соответствующей полуокружности к началу координат.

Рис. 1

Принцип максимума является всеобъемлющим универсальным методом для решения задач оптимизации. Он нашёл многочисленные применения в различных областях знания и оказал существенное влияние на развитие вариационного исчисления. В игровых задачах достигнуть разультатов столь общего характера нам не удалось. Ими занимается сейчас большое число математиков, среди которых следует отметить группу сотрудников Математического института им. В. А. Стеклова и школу академика Н. Н. Красовского в Свердловске. Ими достигнуты значительные результаты. Здесь я ограничусь тем, что приведу один конкретный пример задачи преследования.

В пространстве R произвольной размерности n, где n ≥ 2, рассмотрим две точки x и y, каждую из которых мы можем одновременно трактовать как вектор. Точку x будем считать преследующей точкой, а точку y — убегающей точкой. Процесс преследования считается законченным, когда x совпадает с y. Движение этих точек описывается следующими уравнениями: