Н С Подцыкин - Адаптивная модель надежности и работоспособности технической системы - страница 1

Страницы:
1  2 

УДК 621.391.175 Н.С. ПОДЦЫКИН

АДАПТИВНАЯ МОДЕЛЬ НАДЕЖНОСТИ И РАБОТОСПОСОБНОСТИ ТЕХНИЧЕСКОЙ СИСТЕМЫ

Предлагается модель надежности и работоспособности технической системы. Пред­полагается, что в процессе эксплуатации из-за случайных процессов износа и разрегули­ровки работоспособность системы снижается. Характеристики этого процесса известны не полностью. Предлагается метод последовательного улучшения стратегии управления работоспособностью в процессе наблюдения за поведением системы. Управлениями счи­таются виды регламентных работ, проводимые в заданные моменты времени.

1. Общая постановка задачи, актуальность и цель исследования

Важной задачей при эксплуатации технической системы на неограниченном интервале времени является обеспечение оптимального уровня ее работоспособности [1]. Основной показатель работоспособности часто может быть охарактеризован величиной прибыли, которую обеспечивает работающая система. Для поддержания оптимального уровня рабо­тоспособности предусмотрено проведение регламентных работ, направленных на обновле­ние системы. Под обновлением системы будем понимать все виды ремонтных работ, проведение регулировок и других действий, обеспечивающих такое состояние системы, которое в конечном итоге увеличивает прибыль и эффективность ее использования. Регла­ментные работы различаются по глубине воздействия на систему и, следовательно, по стоимости.

Актуальной задачей является выбор такой стратегии применения регламентных работ и их типов, которые обеспечивали бы максимальную прибыль от эксплуатации системы.

Пусть введено в рассмотрение понятие состояния системы. Состояние системы опре­деляется набором контролируемых параметров, которому соответствует определенный уровень эффективности и работоспособности. Выбор набора информативных параметров и определение с их помощью состояния могут быть проведены методами теории распозна­вания образов [2]. Далее будем считать, что множество состояний Е = {x} определено и ранжировано по уровню работоспособности системы. Положим, что это множество совпа­дает с множеством неотрицательных вещественных чисел. Состоянию x = 0 соответству­ет наивысшая эффективность функционирования системы, при возрастании значения x эффективность монотонно уменьшается.

Предполагается, что регламентом установлено проведение профилактических ремон­тов после ее работы в течение интервала времени т . Тип регламентных работ далее будем называть управлением. Множество всех различных управлений обозначим через Y = {уі,У2,...,Уі} . Допускаем, что применение управления yi в любом состоянии x не меняет этого состояния. Применение управления yk, k > 1, в состоянии x приведет к переходу системы в одно из лучших, по сравнению с x, состояний. Это состояние опреде­ляется заданным вероятностным распределением на множестве [0, x). Будем предпола­гать, что среднее значение обновления системы тем больше, чем больше номер управле­ния. Ниже это свойство будет уточнено.

Реализация управления занимает определенное время, в течение которого система простаивает, и требует определенных затрат.

Состояние системы в момент контроля и принятия решения о выборе управления является реализацией случайной величины. Вероятностное распределение этой случайной величины неизвестно. Выбор типа распределения для конкретной рассматриваемой систе­мы возможен лишь в том случае, если доступна необходимая статистическая информация. Выберем для моделирования тот класс систем, для которых это распределение является гамма-распределением. Такой выбор достаточно общий, так как при определенных значе­ниях параметров гамма-распределение определяет экспоненциальное распределение, рас­пределение х2 и другие. Предлагаемый метод моделирования и оптимизации потребует

очевидных изменений при использовании другого типа распределения.

Целью исследования является разработка метода оптимизации уровня работоспособ­ности технической системы в условиях неполной информации о ее характеристиках. В работе предлагается адаптивный подход к решению этой задачи. Наблюдения, получае­мые в процессе работы системы, последовательно используются для уточнения стратегии управления.

2. Математическая модель

В основу моделирования выбранной системы положим марковский процесс принятия решений [3]. Для этого необходимо определить следующие элементы: E - множество состояний, Y - множество управлений, Q - переходная функция, определяющая одноша-говые переходы на множестве состояний E, п - стратегия управления, w - функция непосредственных доходов.

Положим, что множество состояний E конечно. Для этого проведем дискретизацию множества е = [0,да). Пусть h - шаг дискретизации. Выберем количество состояний, задав число N. Тогда множество состояний E = {xo,x!,...,xN}. Если в момент контроля состояние системы попадает в полуинтервал [ih, (i + 1)h) , 0 < i < N -1, то будем считать, что наблюдалось состояние xi = ih . Наблюдению значения из полуинтервала [Nh, да) по­ставим в соответствие состояние xN .

Пусть множество управлений Y состоит из l элементов: {УьУ2,- -,Уі}, каждое из которых может быть применено в любом состоянии.

Отображение со : E Y назовем решающей функцией, последовательность решающих функций п = {ю1,ff>2v} - стратегией управления. Стратегия управления п для каждого состояния x в момент tk определяет выбор управления a>k (x Y.

Стратегию вида л = со(оо) = {со, со,...} назовем стационарной.

Для определения переходной функции Q проведем вспомогательные построения. Пусть в момент контроля tk идентифицировано значение xее. Применение управления Ук є Y в этом состоянии за время Tk переведет систему в некоторое случайное состояние z є [0, x) в соответствии с плотностью распределения вероятностей fk(z)(x), k = 2,...,l. Для k = 1 величина простоя системы T1 равна 0 , а плотность f1 вырождена в точке x . Все плотности fk (z)(x) , k = 2,... определяются конкретными регламентными работами, оцени­ваются статистическими методами. Будем считать их заданными.

Управления различаются по степени обновления системы. Положим, что они упорядо­чены следующим образом. Если 2 < k < n < l, то

x x

j zfk (z)(x)dz > j zfn (z)(x)dz

0 0

для всех xее.

Последнее неравенство означает, что чем больше номер управления, тем в большей степени в среднем оно обновляет систему.

Рассмотрим теперь действие управлений на множестве E . Если наблюдаемое значение x попало в полуинтервал [x^x^) се , то будем считать, что система находится в состоя­нии xi є E. Пусть в этом состоянии было применено управление yk є Y. Тогда через интервал времени Tk система перейдет в состояние xj, j = 0,...,i, с вероятностью

P((k) = xjfk(z)(x)dz , P(1k) = ?fk(z)(x)dz , _ , p(k) = jfk(z)(x)dz . (1)

Очевидно, что p0q) = 1 для любого yk є Y, p(1) = 1 для любого xi є E . Заметим, что длительность перехода T равна 0 только для управления У1 .

После перехода в состояние z под действием управления є Y, система работает в течение периода времени т . С работающей системой связана интенсивность дохода v^ , зависящая от состояния \ є Е . По предположению случайная величина (x - z) имеет гамма-распределение с неизвестными параметрами а и в, где x є Е - наблюдение состояния системы в конце указанного периода. Плотность гамма-распределения имеет следующий вид [4]:

f(x| а, в) = -P—x а-1е-вх , x > 0, а,в> 0. Г(а)

Определим соответствующие переходы на дискретном множестве состояний E и веро­ятности переходов.

Пусть x; є E - состояние системы, в которое управление ее переводит. Обозначим искомые вероятности через q;j, x;,xj є E. По предположению, состояние системы в про­цессе работы не может улучшиться. Поэтому

h 2h qi0 = ^ qi1 = ^      qii-1 = ^ qii =\ f(x|а,0)dx, qii+i = j f(x|a, 0)dx,...,

о h

(N-i)h x

qiN-i =     j   f(x| a, 0)dx,      =   j f(x| a,|3)dx. (2)

(N-i-l)h (N-i)h

Теперь легко определить переходную функцию Q марковского процесса принятия решений. Пусть в момент контроля наблюдалось состояние x; є E, в котором применено управление ук є Y. Через интервал времени Tk это управление переведет систему в состояние xs є E c вероятностью p(k). Затем через интервал времени т состояние xj є E будет наблюдаться с вероятностью qsj. Поэтому вероятность перехода за один период, с учетом формул (1) и (2), в этом случае составит величину

m;n(i,j)

Q(k) =   Z   p(skV (3)

s=0

Рассмотрим далее определение функции непосредственных доходов w . Для этого необходимо вычислить среднюю прибыль системы на одном периоде как функцию от состояния в начале периода перед применением управления и управления. Вычислим сначала средний доход на интервале времени т , получаемый при работе системы. Пусть xs є E - состояние системы после применения управления ук є Y. Предположив, что на интервале времени (0, т) износ и падение эффективности работы системы происходит по линейному закону, получим среднюю величину дохода:

N 1 V(xs) = Z qsj(VsT + -(Vj+i -Vj)T), j=s 2

V N+l = 0.

Величина непосредственного дохода в единицу времени на одном периоде при условии, что в начале периода в состоянии x; є E применено управление ук є Y , равна

w(x;,yk) = —+-( Z P(sk)V(xs) - r(x;,yk)), (4)

здесь p(k) определены в (1); r(x;,yk) - стоимость управления yk є Y, примененного в состоянии xi є E .

Решающей функции со поставим в соответствие матрицу переходных вероятностей Q(co) с элементами Q(jto(x;)), i,j = 1,...,N, ro(x;)єY, и вектор-столбец непосредственных доходов w(ro) с компонентами w(x;, ro(x;)), i = 1,...,N, ro(x;) є Y. Пусть система управляет­ся стационарной стратегией п = со(оо). Тогда средний доход в единицу времени, приносимый системой при неограниченном времени работы, составит величину

Ф(п) = lim-ni:1Qk(ra)w(ra) . (5)

n^x nk=0

Известно [3], что если множество состояний образует один эргодический класс, то вектор-столбец ф(п) состоит из одинаковых компонент. Это означает, что величина сред­него дохода в единицу времени не зависит от начального состояния. В нашем случае это условие выполнено.

Задача состоит в отыскании стационарной стратегии п, для которой компоненты векто­ра ф(п) максимальны. Решение этой задачи дает алгоритм Ховарда [3]. Применить непосредственно этот алгоритм не удастся, так как модель определена не полностью. Параметры а и в , определяющие распределение приращений траектории процесса износа и разрегулировки системы, неизвестны. Предлагается применить адаптивный подход к выбору оптимальной стратегии управления. Именно, наблюдая состояние системы после применения "априорной" стратегии управления, уточнить оценки параметров, получить улучшенную "апостериорную" стратегию, применить ее и получить очередное наблюде­ние. Затем вновь улучшить стратегию. Улучшение стратегии понимаем здесь в смысле критерия ф . Учитывая, что стационарных стратегий конечное число, а оценки параметров

Страницы:
1  2 


Похожие статьи

Н С Подцыкин - Адаптивная модель надежности и работоспособности технической системы

Н С Подцыкин - Математическая модель надежности восстанавливаемой технической системы