Экстремальные системы автоматического управления. Методы поиска экстремума. Адаптивные и экстремальные системы управления

Принцип управления: (буровой станок)

Программы и законы регулирования Программа регулирования

План формирования задающего воздействия g (t ) на систему.

Программа регулирования может быть:

    временной: y = y (t );

    параметрической: y = y (s 1 , s 2 , s 3 , ..., s n ).

Например, временная программа приготовления пищи (лапшу варить 12 мин.), или параметрическая программа посадки самолета на палубу авианосца (в зависимости от: бокового ветра, изменений координат посадочной полосы, массы остатка топлива, ...).

Закон регулирования

Зависимость, по которой формируется регулирующее воздействие u (t ) на объект из первичной информации: g (t ) и/или x (t ) и, возможно, f (t ).

Законы регулирования бывают:

    линейные:

;

    нелинейные:

F 1(u , du /dt , ...) = F 2(x , dx /dt , ...; g , ...; f , ...) .

Классификация нелинейных законов регулирования:

    Функциональные.

    Логические.

    Параметрические.

    Оптимизирующие.

Примеры статических функциональных нелинейностей в законах:

Примеры динамических функциональных нелинейностей в законах:

Пример логического нелинейного закона:

Если |x | < 0.2G m , тогда u = k 1 x ;

Если |x | > 0.2G m , тогда u = k 2 x ;

где: k 1 < k 2

Пример параметрического нелинейного закона:

u = k (t [°C]; h [м]; G [кг]) x .

Пример оптимизирующего нелинейного закона:

u = k (min(CO 2); max(КПД)) x .

Линейные непрерывные законы регулирования

Под законом регулирования (управления) понимается алгоритм или функциональная зависимость, определяющая управляющее воздействие u (t ) на объект:

u (t ) = F (x, g, f ) .

Линейные законы описываются линейной формой:

u (t ) = k 1 x (t ) + k 2 x (t )dt + k 3 x (t )dt 2 + ... + k 4 x" (t ) + k 5 x"" (t ) + ...

она же в операторной форме записи:

u (t ) = x (t ) [k 1 + k 2 /p + k 3 /p 2 + ... + k 4 p + k 5 p 2 + ...] (1*).

Наличие в (1*) чувствительности регулятора к пропорциональной, к интегральным или к дифференциальным составляющим в первичной информации x (t ), определяет тип регулятора:

    P - пропорциональный.

    I - интегральный.

    PI - пропорционально интегральный (изодромный).

    PD - пропорционально дифференциальный.

    и более сложные варианты - PID, PIID, PIDD, ...

Пропорциональное регулирование

Пропорциональный закон регулирования имеет вид:

u (t ) = W рег (p ) x (t ) = k 1 x (t ) ,

W (p ) = W рег (p ) W o (p ) = k 1 W o (p ) .

Рассмотрим уравнение ошибки:

В установившемся режиме p 0 (все производные равны нулю); W o (p )k o ; W (p )k 1 k o =k ; где k - контурный коэффициент усиления разомкнутой системы (при W ос (p )=1).

Резюме : P-регулирование позволяет уменьшить установившуюся (статическую) ошибку, но только в 1+k раз, поэтому регулирование будет статическим. Т.е. при любом k x уст 0.

Интегральное регулирование

Интегральный закон регулирования имеет вид:

u (t ) = W рег (p ) x (t ) = k 2 /p x (t ) ,

тогда в разомкнутом состоянии система будет характеризоваться ПФ:

W (p ) = W рег (p ) W o (p ) = k 2 /p W o (p ) .

Рассмотрим уравнение ошибки:

В установившемся режиме p 0, => W (p ); => первая составляющая ошибки g 0 /0. Ошибка от возмущения зависит от вида функции W f (0) и может быть отлична от нуля.

Резюме : I-регулирование позволяет исключить статическую ошибку в системе, т.е. система будет астатической по отношению к задающему воздействию g (t ).

Настройка (экстремальное управление)

Экстремальное управление получило такое название от специфической цели этого управления. Задача экстремального управления заключается в достижении экстремальной цели, т. е. в экстремизации (минимизации или максимизации) некоторого показателя объекта, значение которого зависит от управляемых и неуправляемых параметров объекта. К экстремальному управлению приводит очень распространенная операция настройки.

Всякая настройка заключается в построении такой системы действий, которые обеспечивают наилучший режим работы настраиваемого объекта. Для этого необходимо уметь различать состояния объекта и квалифицировать эти состояния так, чтобы знать, какое из двух состояний следует считать «лучше» другого. Это означает, что в процессе настройки должна быть определена мера качества настройки.

Например, при настройке технологического процесса показателем его качества может служить число бракованных деталей в партии; в этом случае задача настройки процесса заключается в том, чтобы минимизировать брак. Однако далеко не все экстремальные объекты допускают столь простое количественное представление показателя качества настройки. Так, например, при настройке радиоприемников или телевизоров такими мерами качества настройки могут служить качество звучания и качество

изображения принимаемой передачи. Здесь уже довольно сложно определить показатель качества настройки в количественной форме. Однако, как будет показано ниже, для решения задач экстремального управления часто важно знать не абсолютное значение показателя качества, а знак его приращения в процессе управления. Это означает, что для управления достаточно знать, увеличился или уменьшился показатель качества. В случае настройки радиоаппаратуры человек довольно хорошо решает эту задачу, если речь идет о качестве звучания или изображения.

Рис. 1.3.1.

Таким образом, в дальнейшем предполагается, что всегда существует такой алгоритм переработки информации настраиваемого объекта, который позволяет количественно определись качество настройки этого объекта (или знак изменения этого качества в процессе управления). Качество настройки измеряется числом Q , которое зависит от состояния управляемых параметров объекта:

. (1.3.1)

Целью настройки является экстремизация этого показателя, т. е. решение задачи

где буквой S обозначена область допустимого изменения управляемых параметров.

На рис. 1.3.1 показана блок-схема экстремального объекта. Он образуется из собственно объекта настройки с управляемыми входами и наблюдаемыми выходами, которые несут информацию о состоянии объекта, и преобразователя, который на основе полученных сведений образует скалярный показатель качества объекта.

Примером экстремального объекта может служить радиоприемник в процессе поиска станции. Если слышимость станции уменьшается (как говорят, станция «уплывает»), то для получения наилучшего звучания передачи, т. е. для настройки приемника, необходимо подстроить контур. Управление настройкой в данном случае заключается в определении направления вращения рукоятки настройки. Уровень слышимости станции здесь является показателем качества настройки. Он не несет необходимой

Рис. 1.3.2.

информации об управлении, т. е. не указывает, в каком направлении следует вращать рукоятку настройки. Поэтому для получения необходимой информации вводится поиск -- пробное движение рукоятки настройки в произвольном направлении, что дает дополнительную и необходимую информацию для настройки. После этого уже можно точно сказать, в каком направлении следует крутить рукоятку: если слышимость уменьшилась, нужно крутить в обратном направлении, если уже увеличилась, следует вращать ручку настройки туда же до максимума слышимости. Такой простейший алгоритм поиска, применяемый при настройки радиоприемника, который является типичным примером экстремального объекта.

Таким образом, объекты экстремального управления отличаются недостаточностью информации на выходе объекта, наличием своеобразного информационного «голода». Для получения необходимой информации в процессе управления экстремальными объектами необходимо ввести поиск в виде специально организованных пробных шагов. Процесс поиска отличает настройку и экстремальное управление от всех других видов управления.

В качестве более «серьезного» примера однопараметрического экстремального объекта рассмотрим задачу об оптимальном демпфировании следящей системы второго порядка (рис. 1,3.2). На вход этой следящей системы подается задающее возмущение у* (t), определяющее состояние выхода у (t). Относительно характера поведения у* (t) ничего не известно. Более того, статистические свойства возмущения у* (t) могут изменяться непредвиденным образом.

Рис. 1.3.3.

Задача настройки заключается в выборе такого демпфирования о которое делает эту следящую систему оптимальной в смысле минимума функционала:

Величина Q является оценкой дисперсии невязки о(t)=y(t)-y*(t) на базе Т . Очевидно, что при настройке следящей системы следует добиваться минимизации величины Q.

Здесь в качестве объекта настройки выступает указанная следящая система, выходной информацией для определения качества работы объекта являются его вход и выход, а преобразователь образует показатель качества по формуле (1.3.3). Полученный экстремальный объект имеет характеристику, показанную на рис. 1.3.3. Характер зависимости Q (о ) выражает тот очевидный факт, что малое демпфирование столь же плохо, как и слишком большое. Как видно, характеристика (1.3.3) имеет ярко выраженный экстремальный характер с минимумом, соответствующим оптимальному демпфированию о *. Кроме того, характеристика зависит от свойств возмущения у* (t). Следовательно, оптимальное состояние о*, минимизирующее Q (о ), также зависит от характера задающего возмущения y*(t) и изменяется вместе с ним. Это и заставляет обратиться к созданию специальных систем автоматической настройки, поддерживающих объект в настроенном (экстремальном) состоянии независимо от свойств возмущений. Эта автоматические приборы, решающие задачу настройки, носят название экстремальных регуляторов или оптимизаторов (т. е. приборов для оптимизации объекта).

Отличительной особенностью экстремальных объектов является немонотонность (экстремальность) характеристики, что приводит к невозможности воспользоваться методом регулирования в целях управления подобными объектами. Действительно, наблюдая выходное значение Q объекта в рассмотренном выше примере (см. рис. 1.3.3), нельзя построить управление, т. е. определить, в каком направлении следует изменить управляемый параметр о. Эта неопределенность связана, прежде всего, с возможностью двух ситуаций и, выход из которых к цели о* производится прямо противоположным образом (в первом случае следует увеличивать о, а во втором -- уменьшать). Прежде чем управлять таким объектом, необходимо получить дополнительную информацию -- в данном примере эта информация заключается в определении, на какой ветви характеристики находится объект. Для этого, например, достаточно определить значение показателя качества в соседней точке о + ? о, где? о -- достаточно малое отклонение.

Следует отметить, что автоматизация процесса настройки оправдана лишь в том случае, если экстремальная характеристика объекта изменяется во времени, т. е. при блуждании экстремального состояния. Если же характеристика объекта не изменяется, то процесс поиска экстремума имеет однократный характер и, следовательно, не нуждается в автоматизации (достаточно стабилизировать объект в однажды определенном экстремальном состоянии).

На рис. 1.3.4 для иллюстрации показана блок-схема экстремального управления демпфированием следящей системы, отслеживающей положение цели у (t), характер поведения которой изменяется.

Рис. 1.3.4.

Здесь экстремальный регулятор решает задачу настройки, т. е. поддерживает такое значение демпфирования о , которое минимизирует показатель качества следящей системы.

Назначением экстремальной системы является автоматическое отыскание регулирующих (управляющих) воздействий, соответствующих оптимальному (экстремальному) значению показателя качества при неконтролируемом изменении характеристик системы и внешних условий, влияющих на положение экстремальной точки показателя качества.

Рис. 12.2. Общая схема экстремальной системы О - объект; ЧЭ - чувствительный элемент; УФ - устройство формирования показателя качества; ИЭ - исполнительный элемент; УАП - устройство автоматического поиска экстремума; ЭР - экстремальный регулятор

В экстремальной системе соответствующая перестройка входных воздействий производится путем анализа результатов пробных движений (колебаний), в процессе которых изучается тенденция изменения показателя качества системы. Можно говорить, что в экстремальной системе существует своеобразная обратная связь по показателю качества. На рис. 12.2 представлена принципиальная схема экстремальной системы. Особенностью ее является наличие устройства автоматического поиска экстремума УАП, которое производит анализ показателя качества и через исполнительный элемент ИЭ подает на вход объекта управляющее воздействие такое, чтобы характеристика получила экстремальное значение

В экстремальной системе устройство поиска экстремума выполняет роль анализатора и синтезатора.

Экстремальный регулятор целесообразно использовать только тогда, когда функция характеризующая показатель качества, является «плавающей» (рис. 12.3), т. е. как сама величина так и

соответствующее ей значение существенно меняются неконтролируемым образом.

Обычно показатель качества зависит от нескольких регулирующих воздействий, т. е. В точке экстремума

где - базисные векторы.

Рис. 12.3. Экстремальные характеристики

Таким образом, экстремальная система должна обеспечить движение рабочей точки по поверхности в пространстве до точки, где Для осуществления такого движения необходимо, во-первых, определить градиент и, во-вторых, в соответствии со значением градиента организовать движение к точке экстремума.

Рис. 12.4. Синхронное детектирование

Первая задача - определение градиента - может решаться несколькими способами, наиболее распространенными из которых являются способы синхронного детектирования, непосредственного измерения производной и запоминания и удержания экстремума.

Способ синхронного детектирования основан на том (рис. 12.4), что для ориентации рабочей точки относительно экстремума

показателя качества к основным медленно меняющимся входным сигналам добавляются малые гармонические (обычно периодические) составляющие. Синхронные детекторы выполняют операцию умножения функции на соответствующие гармонические составляющие и операцию усреднения во времени этих произведений. В результате на выходах синхронных детекторов получаются величины, пропорциональные с точностью до малых высших порядков составляющим градиента в точке

Действительно, разложим функцию в окрестности точки в ряд Тейлора:

После умножения выражения (12.1) на и усреднения получим

Если учесть, что при медленном изменении справедливы соотношения:

то выражение (12.2) можно привести к виду

где погрешность, имеющая больший, чем первое слагаемое, порядок малости.

В результате на выходах синхронных детекторов получаются сигналы

Способ непосредственного измерения производной предполагает дифференцирование функции по времени. Для производной, имеем

Допустим, что имеется возможность задавать поочередно величины }