Автор неизвестен - Сборник научных трудов 3-го международного радиоэлектронного форума прикладная радиоэлектроника - страница 35

Страницы:
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99  100  101  102  103  104  105  106  107  108  109  110  111  112  113  114  115  116  117 

Вводится вектор сопряженных переменных р = о,... Рп }, динамика которого описывает­ся ДУ

^ = ад/^. (4)

Оптимальным является такое управление, которое обеспечивает максимум Гамиль­тониана

Г= Ър/ (х,и). (5)

I=0

На практике ДУ заменяются разностными уравнениями, что удобно для вычисле­ний в управляющем компьютере. Основная и практически единственная трудность вы­числений связана с тем, что для вектора х заданы начальные условия, в то время как для вектора р заданы конечные условия.

Таким образом, задача заключается в формулировке ДУ состояния (2) и ДУ для функционала качества (3) для задач адаптивного управления.

Отметим, что в задачах АУ фазовые координаты должны быть достаточными коор­динатами [3], т.е. достаточными статистиками, условными по управлению и прошлым наблюдениям.

1. Методика синтеза и основные соотношения. Рассмотрим задачу минимизации среднего риска так, что критерий качества имеет вид

СРРСН'2008

1-ч.1 - 201

Є = іпіп^8 [і(і\у(і ),и(( )}а+8Т [і(т ),у(т )||, (6)

где м {} - оператор статистического усреднения (аналогично рассматривается задача

максимизации среднего выигрыша).

Исходя из вида критерия (6) и принципа оптимальности, можно показать, что при

принятии решения и(т, У^) в текущий момент времени т следует минимизировать буду­щий средний риск

уо,и о

шт ] Мр { 18 ((),у ((),и(()]/й+8т (Т ),у (Т)] ]

(7)

где м р {•} - усреднение по условной ПВ вида ж\

(

о'Ао

причем І > т .

Используя параметрическое представление ПВ, после усреднения приходим к запи­си выражения (7) в виде

ут ит уо,ио шіп <! 1 О[х((),и (()]/#+вТ [х(Т)]], (8)

где х - параметры рассматриваемой условной ПВ, которые мы назовем прогнозируе­мыми параметрами.

Соотношение (8) формально отличается от (1) только тем, что в качестве начально­го момента рассматривается момент принятия решения. Поэтому так же, как и в детер­министических задачах, исходя из (8) можно ввести координату хо и ДУ для описания

среднего риска

^ = (х,и ) = о (х,и ).

(9)

Прогнозируемые параметры можно рассматривать как достаточные координаты. При гауссовской аппроксимации ПВ прогнозируемыми параметрами являются статисти­ческие моменты первого и второго порядка, т.е. элементы вектора т и матрицы Б.

Примем марковскую модель динамики параметров системы х({, и)

м1

= 0(Х,и, і)+0(Х,и, і )пх().

(іо)

Тогда уравнения состояния для прогнозируемых моментов можно получить из сто­хастических ДУ (СДУ) для апостериорных моментов, описывающих оптимальную нели­нейную фильтрацию марковских процессов в гауссовском приближении [5]. При этом апостериорные моменты рассматриваются как условные по управлению. Усредняя ука­занные СДУ по будущим наблюдениям, получим

где а = Мр {а}, В = \Мр {б| , Н(х,и,і)

с/іп ~

-= А,

/

МО   ~ Т

= Б + Н О + О НТ + О Ф О,

Мг

ЗА, (і,и,і)

І

а  и б

(11)

(12)

вектор коэффи-

циентов сноса и матрица коэффициентов диффузии процесса (10). Прогнозируемая ин­формационная матрица

СРРСН'2оо8

1-ч.1 - 2о2ф,и, t )--

М,

д 2 F дАмдАу

(13)

где F(y,>,u,t) = -2[y(t)-s(l,u,Of N-1(u).[y(()-s(,u,t)] (14)

y(() = s(X,u, t) + у(u)n(t), s(X,u, t) - небелая часть принимаемого «сигнала», n(() - белый шум со спектральной плотностью N0.

Для решения задач различения и, в частности, обнаружения, формируются и срав­ниваются апостериорные величины логарифма отношения правдоподобия (ЛОП) по раз­личным гипотезам 0= 1,2,...A...,H . Следовательно, качество различения определяется статистическими параметрами плотности вероятности ЛОП, которые должны быть вклю­чены в число достаточных координат. Получение ДУ для прогнозируемых параметров ПВ величины ЛОП становится возможным, поскольку изменение апостериорных вели­чин ЛОП Zh во времени описывается СДУ. Усредняя это СДУ по будущим наблюдени­ям, можно прийти, в частности, к уравнению состояния для первого прогнозируемого момента ЛОП

где Fh - функция (15) для гипотезы h .

При использовании ПМ время разбивается на достаточно малые интервалы дли­тельностью А и рассматривается управление в моменты tn = пА, где n = 0,1,2.... Посколь­ку в радиотехнических задачах может оказаться, что ширина спектра сигналов 8со >> , то вместо (14) при дискретизации времени следует использовать

Fk (y, b,u, t) = - —  1  [y(t )-s(l,u,t )f.N-1(u ).[y(t )-s(l,u,t )]dt. (16)

tk

2. Примеры синтеза адаптивного управления. При помощи предлагаемой мето­дики можно решать разнообразные задачи синтеза, выходящие за рамки теории Калмана. Рассмотрим, например, задачу управления излучением, задачу управления приемом и за­дачу управления инерционным объектом. Две первых задачи относятся к управлению наблюдением, а последняя задача - к дуальному управлению объектом. Первая задача рассмотрена более подробно, а в остальных ограничимся постановкой задачи и анализом гамильтониана.

2.1. Обнаружение объекта с адаптивной фокусировкой излучения антенны.

Пусть имеются разнесенные излучающая и приемная антенны, а также точечный отража­тель. Излучающая антенна состоит из M модулей. Подводимый на вход i - го модуля сигнал V-(t) = СА-(t)cos(cot+сф-(t)) после излучения, распространения и отражения сигналы

приобретает случайную фазу ^ (t) так, что принимаемый сигнал

.      . М

X,u) = c ZAi(t-t^cosfco^-t'^(t-t')+cp0 +Ai(t)], (17) i=1

где управление u определяет модуляцию излучаемых сигналов. Введем модель флюк-туаций фаз

^ = -aAi + иА(() (18) dt

На выходе приемной антенны наблюдается реализация _y(t) = Es(t,А,и) + n(t), где Е = 1, если отражатель присутствует и Е = 0 , если отсутствует, n(t) - белые гауссовские шумы.

СРРСН'2008

1-ч.1 - 203

Необходимо решить задачу обнаружения c заданным качеством за минимальное время T так, что в критерии (б) функция риска g    = 1.

Поскольку вероятность ложной тревоги не зависит от модуляции сигнала, то мож­но рассматривать только вероятность правильного обнаружения в момент t = T . Послед­няя вероятность монотонно зависит от среднего значения ЛОП m(T ) = M {z (T )-._і}так, что

требуемое конечное состояние системы можно задать условием m(T) = const. Разбивая время на малые интервалы А, введем управление на k - м шаге

uk = uk  V Ak(t-t')Ak(t-t')cosUk ((-t')^k ((-t')+m* -m*

tk

ое

описывается уравнениями вида

\dt, (19)

где т^кі - прогнозируемое среднее значение фазы в канале с номером і. Тогда система

тк+1 = тк + \ С1 + " !/Ч ехр(- хк )], (20)

Ч+\ = Ч (1 - 2«А)+ ЬА-д(1 - uk /^ехр^ xk ), (21)

где Xk = Dk (1 - Rk ), Dk - прогнозируемая дисперсия ошибок измерения фаз, Rk - взаим­ная корреляция этих ошибок в разных каналах распространения волн, д - отношение сигнал/шум, Ь - коэффициент диффузии процессов Xт ().

Введем ограничения на излучаемую энергию вида = 1, при г = ] и 0 < < 1, при г ^ } . Как видно из (20), (21) наилучшие условия для измерения фаз имеются при Uk = 0, что означает излучение взаимно ортогональных сигналов разными модулями. Однако, при таком управлении эффект фокусировки системы модулей не используется и приращение ЛОП минимально.

Максимальное приращение среднего ЛОП на данном шаге обеспечивается при ик = 1, что означает одинаковую модуляцию всех сигналов и их когерентное суммирова­ние возле отражателя, с точностью до ошибок оценки фаз. Однако при этом имеют место наихудшие условия для измерения фаз.

Отметим, что повышение точности измерения фаз на данном шаге позволяет лучше

сфокусировать излучение на последующих шагах и увеличить, в будущем, рост среднего

*

ЛОП. Поэтому должно существовать управление 0 < Uk < 1, оптимальным образом учи­тывающее возможности накопления ЛОП на данном шаге и возможности улучшения фо­кусировки в будущем.

Зависящая от управления часть гамильтониана имеет вид

Г = ukq exp(- xk ) AM(m -1) + pkx2

(22)

Из условия максимума гамильтониана получаем

{0   при   Ak > 1,

^ =|1 при 4 < 1,   4 = МЩ-1)№х1 (23)

Как видно, оптимальное управление заключается в переключении двух режимов работы, один из которых можно назвать режимом измерения, а другой - режимом фоку­сировки.

Уравнение для сопряженной переменной р имеет вид

pk+1 = pk

1 + 2аА + q(l - uk )(Xk - xk )exp(- Xk )]^ -2 qM - 1><k exp(- Xk ). (24)

СРРСН'2008

I-ч.І - 204

Решение системы уравнений (21),(24) с учетом правила(23) не представляет особых трудностей. Так, например, при т(Т) = 110 и начальных условиях т(т) = 0, х(т) = 4, а

также д = 2, М = 5, аА = 0.05, Ь = ах(т) получаем зависимости, изображенные ниже в табл. 1.

Таблица 1

к

1

2

3

4

5

6

7

8

9

10

11

12

13

14

Хк

4

3,58

3,2

2,78

2,29

1,7

1,73

1,1

1,18

1,25

0,67

0,79

0,9

1,0

Рк

7,3

6

5

4,3

4,2

5,9

2,65

11,35

5,72

0

22,3

14,7

7,35

0

ик

0

0

0

0

0

1

0

1

1

0

1

1

1

1

Ак

11,7

7,7

5

Страницы:
1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99  100  101  102  103  104  105  106  107  108  109  110  111  112  113  114  115  116  117 


Похожие статьи

Автор неизвестен - 13 самых важных уроков библии

Автор неизвестен - Беседы на книгу бытие

Автор неизвестен - Беседы на шестоднев

Автор неизвестен - Богословие

Автор неизвестен - Божественность христа