В М Довгаль, С В Неежмаков, В Ф Шевченко - Проблемы приложений теории нечетких множеств автоматическая диагностика - страница 1

Страницы:
1  2 

УДК 681.5.013

 

В.М. Довгаль, С.В. Неежмаков, В.Ф. Шевченко

Юго-Западный государственный университет, г. Курск кафедра программного обеспечения вычислительной техники, Донецкий национальный технический университет, г. Донецк кафедра «Горная электротехника и автоматика им. Р.М. Лейбова» E-mail: vmdovgal@yandex.ru, serg_n@list.ru

 

ПРОБЛЕМЫ ПРИЛОЖЕНИЙ ТЕОРИИ НЕЧЕТКИХ МНОЖЕСТВ: АВТОМАТИЧЕСКАЯ ДИАГНОСТИКА

 

Аннотация

Довгаль В.М., Неежмаков С.В., Шевченко В.Ф. Проблемы приложений теории нечетких множеств: автоматическая диагностика. В работе рассматриваются проблемы применения аппарата теории нечетких множеств при разработке систем автоматической диагностики; осуществляется анализ ряда работ, в которых присутствуют спорные или недостаточно обоснованные результаты теоретических исследований в названной предметной области, с целью обнаружения механизмов возникновения системных ошибок и предупреждения распространения некорректных методов и средств научных исследований. Ключевые слова: теория нечетких множеств, автоматическая диагностика, функция принадлежности, коэффициент уверенности.

 

Общая постановка проблемы.

Значимые достижения последнего десятилетия в области прикладной теории нечетких множеств (ТНМ) при решении проблем управления и распознавания образов в различных областях науки и техники во многом приостановили и деактуализировали споры о возможностях и практической пригодности нечетких систем и мягких вычислений. На постсоветское геополитическое пространство ТНМ распространилась с некоторым запозданием, но процесс ее практического использования удивительным образом совпадает с периодом ее становления в США и других странах. Первые шаги на пути практического применения ТНМ были омрачены быстрым ростом числа научных работ, явно спекулятивного характера, что инициировало подготовку правительством США решения о запрете преподавания в вузах этой дисциплины. В то же время, военное ведомство США завершило несколько научных проектов на основе ТНМ, достигнув впечатляющих результатов. Это стало весомой причиной для отмены правительственного решения. Сходным образом ситуация повторяется в научных кругах России, где публикации исследований с некорректным использованием методов прикладной ТНМ появляются всё чаще, по сути, приобретают системный характер, являются составляющей некоторых диссертационных исследований [3-17]. Это, тем более, не желательно, поскольку предлагаемые в упомянутых работах эффектно поданные упрощённые методы решения задач теории нечётких множеств быстро распространяются на менее подготовленный в области современной теории множеств контингент пользователей - представителей медицинских и биологических наук, инженеров, экономистов и т.д.

В отдельных случаях используются методы, пригодные для решения частных задач, но не допустимые для системного применения. Это ослабляет научную содержательность публикаций и, в целом, акцентирует внимание научной общественности на методологии, не пригодной для развития проблематики задач теории нечётких множеств.

Таким образом, актуально выполнение анализа научных работ, посвящённых применению и развитию ТНМ, в частности, - в области создания систем автоматической диагностики на основе ТНМ, для выявления причин и механизмов распространения некорректных методов и средств научных исследований.

Постановка задач исследования.

Основная задача исследования заключается в анализе допустимых границ использования упрощённых методов применительно к задачам теории нечётких множеств, в частности, в области создания систем медицинской автоматической диагностики.

Решение задач и результаты исследований.

Для конкретизации терминологии при изложении приведем сведения из ТНМ, основываясь на работах ее создателя Заде Л. [1, 2]. Определение 1. Нечетким подмножеством G называется совокупность пар:

G = {d; ^G(D)|dGD}, (1) где M^g(D) - функция принадлежности \Lq\D -» [0; 1]; D - область определения функции принадлежности (базовое множество или универсум), в виде любого классического (четкого) множества, часто называемого универсумом, из элементов которого могут быть заданы все другие подмножества.

Из определения 1 следует эквивалентность M-g(D) &G Q* D, где Q* - обозначение «G есть нечеткое подмножество на D». Как и характеристическая функция в классической теории множеств, так и функция принадлежности в ТНМ отображает область определения в множество степеней принадлежности G на Д. С целью исключения разночтений термин «носитель» в [1] определяется как четкое подмножество на D, для всех элементов которого выполняется M-g(D) > 0 и будем обозначатся - G*.

Детализируем механизм распознавания образов, в его применении для решения упрощенного варианта задачи диагностики. Пусть имеется набор диагностических признаков Я[(і =1,2, ...,п) для конечного и счетного множества объектов qj (j = l,2,...,rri), являющимися реальными системами, относительно которых осуществляется диагностика (пациенты, машины, агрегаты и т.д.). Каждому объекту qj взаимно однозначно соответствует кортеж dj = < hlj,h2j,... ,hn.j>, представляющий собой элемент пространства диагностических признаков D = HI X Н2 X ... X Нп при hijG Hi. Очевидно, что каждый из кортежей < hlj,h2j,... ,hn.j > не является множеством, т.к. значения разных диагностических признаков могут быть равными.

Пусть в D по результатам обучения и предварительного анализа заданы нечеткие отношения (подмножества) Gk - классы (диагнозы) (/с = 1,2,...,/Г) на D, заданные функциями принадлежности \iGk(hl,h2, ...,hri). При этом на всем протяжении текста статьи для всех к выполняется Gk Q* D. Данные о пациентах, входящие в обучающую совокупность, с необходимостью включается диагноз и степень его выраженности, т.е. для всех кортежей в D формируется степень принадлежности и заносится в базу данных.

Без потери общности с целью упрощения изложения рассмотрим случай при К = 2 и двух отношениях в D (диагнозах) - G1hG2. Допустим, что G1 П G2 = 0, где П -обозначение операции пересечения множеств, 0 - обозначение пустого множества.

Пусть заданы две функции принадлежности |J.gi(.D) и ЦсгСО). Пусть в дополнение к существующим в обучающей совокупности М элементам в виде кортежей появился новый элемент d' = dM+1. При введенных выше условиях проблем отождествления и различения элемента dM+1, заданного кортежем < hlM+1,h2M+1 >, не возникает. Действительно, при Gt П G2 = 0, т.е. когда min(^G1(D), ^G2(D)) = 0, получим:

-  если \id. (£>) = [max {\iG1(D), ЦСі(Д))] = 0,Tod' ? {G1* U G2*),

-если \id.(D) = [max (\iG1(D), цС1(Д))] = \iG1(D) > 0,Tod' Є Gt*, (2)

если     (_D) = [max (\іс1Ф),\іс1Ф))] = V-ciiP) > 0,Tod' Є G2*,где G-i* и G2* - носители нечетких подмножеств.

Таким образом, задача диагностики в такой постановке задачи решается корректно и без ошибок для любого dM+m. Следует отметить, что ТНМ является самодостаточным математическим аппаратом, и не требуется привлечения никаких других теорий. Основанием для такого заявления является общеизвестная FAT (fuzzy approximation theorem), доказанная Бартом Коско, сущность которой заключается в том, что любая математическая система может быть аппроксимирована системой, основанной на нечеткой логике.

Представленная в работах [3 - 17] (всего проанализировано 48 научных работы и 16 диссертаций) концепция «диагностики на основе нечеткой логики» начинается с использования «функции принадлежности к классу (диагнозу) по признаку». Диагнозы заданы как Gk<^* D, а D = HI X Н2 X ...X Нп. Интересен вид функции принадлежности и способ ее построения. Данная функция определяется авторами, как функция от одной переменной, а этой переменной является диагностический признак, т.е. диагностический признак является базовым множеством (которое во всех анализируемых работах называется «носителем» нечеткого множества, вопреки терминологическому базису, определенному Л. Заде). В соответствии с графической формой представления функции принадлежности, приведенной в анализируемых работах, по оси абсцисс задается признак в его единицах измерения по выбранной шкале, например, «концентрация меди» - HI, а по оси ординат -значения функции принадлежности к классу (диагнозу) по признаку» - цС1(Н1).

В работе [3] предлагается способ построения такой «функции принадлежности к диагнозу по признаку». На оси признака Н1 строится гистограмма класса G1 в виде проекции всех точек класса (диагноза) на эту ось. Затем по этой гистограмме эксперты задают функцию принадлежности к диагнозу по признаку. Со всей очевидностью, на этом этапе авторы осуществляют фаззификацию гистограммы, т.е. относительных частот принадлежности некоторого числа элементов класса, которые имеют близкое значение признака. Далее, судя по содержанию анализируемых работ, дефаззификация не выполняется, поскольку вместо нечеткого логического вывода авторами вводятся решающие правила, представляющие собой или алгебраическую сумму нечетких множеств, или условный оператор с четким предикатом в левой части, при истинности которого - в правой его части - выполняется алгебраическая сумма конечного числа нечетких множеств, в цикле или однократно. Естественно предположить, что между отдельным признаком и классом (диагнозом) имеется отношение, возможно, нечеткое, но с функцией принадлежности от двух переменных, задания которой явно недостаточно для разграничения классов (диагнозов). По этой причине в приложениях ТНМ в распознавании образов, включая диагностику, часто задается нечеткое отношении на прямом произведении множества всех признаков и алфавита классов (диагнозов).

Во всех работах, особенно в диссертациях [12 - 17], способ построения «функции принадлежности к диагнозу по признаку» (ФПКП) тщательно маскируется и дается ссылка на экспертов, чем создается иллюзия правдоподобия, и тогда эта функция воспринимаются читателем как подлинная функция принадлежности. Покажем, что такого корректного способа не существует с помощью следующих процедур reductio ad absurdum:

1. ФПДФ не удовлетворяет определению 1. В строгом соответствии с ним функции принадлежности задает нечеткое подмножество только на собственном базовом множестве, в рассматриваемом случае - на оси диагностического признака и только на нем. Зададим импликативное высказывание: «Если есть ФПКП, то тогда класс (диагноз) является нечетким подмножеством признака на основании Ucfc(Hi) <<>Gk Q* Ні». При заданном множестве диагностических признаков элементами класса (диагноза) являются кортежи, а элементами признака - скаляры, как результаты измерения в шкалах, кроме шкал наименований (в анализируемых работах шкалы наименований не используются). Кортежи не являются скалярами, что с необходимостью влечет за собой "Gk не есть подмножество на Hi", т.е.заключение ложно, отсюда по modus tollens посылка является ложной, следовательно, ФПКП является нелепостью.

2.             Класс (диагноз) является множеством кортежей, а признак - множеством скаляров,
отсюда класс и признак не имеют общих элементов. Следовательно, эти два множества не
пересекаются, что влечет за собой  в строгом соответствии с канонической ТНМ
Ucfc(Hi) =
0. Авторы анализируемых работ задают носитель
НІ* на HI и используют цС1(Н1) > 0, что

является абсурдом (стандартной математической нелепостью).

3. Еще одним вариантом получения авторами ФПКП является «принадлежность»
элемента признака к подмножеству кортежей для случаев, когда некоторые фиксированные
элементы признака «размещаются» (попадают) в строго отведенные для них позиции в
кортежах, например, для
HI - первая позиция кортежа. Другими словами, задается проекция
npGfe на Hi. Авторы предположительно определяют (путем опроса экспертов)
относительную частоту каждого значения признака по всему их списку для каждого класса
(диагноза) отдельно. При этом в соответствующую позицию кортежа «размещается»
фиксированный элемент признака столько раз, сколько он встречается в кортежах класса
(диагноза) и делится на общее число кортежей в классе. Авторы выдают результат деления за
степень принадлежности к позиции в кортежах. По своей внутренней структуре кортеж
является набором признаков, а поскольку набор может иметь равные значения разных
признаков, то он не является множеством. В канонической ТНМ рассматриваются
множества, и только они, вопреки этому в диссертациях и публикациях авторов [3 - 17]
вводится «функция принадлежности» к объектам, которые множествами не являются (!).
Задание функции принадлежности к такого рода объектам является математически
некорректным. Следовательно, ФПКП не имеет никакой связи с ТНМ.

Таким образом, ФПКП не является функцией принадлежности «к диагнозу по признаку». По процедуре 1 ФПКП является нелепостью, по процедуре 2 она всегда равна нулю и по процедуре 3 она не относится к ТНМ. В таком случае авторы анализируемых работ не имеют на основе ФПКП никакой возможности построить многомерную функцию принадлежности к диагнозу, например, G1 на D при заданных HI и Н2 на основе известного равенства Л. Заде [1]:

uG1(L>) = min(uG1(Hl),uG1(H2)), (3) где min(-) - обозначает прямое произведение HI X Н2, что лишает их возможности решить даже упрощенную задачу диагностики, приведенную нами выше по тексту.

Особенный интерес представляет процесс решения задачи диагностики во всех представленных в списке литературы анализируемых в данной статье научных работ. Нужно подчеркнуть, что многомерная функция принадлежности к классам (диагнозам) имеется по результатам обучения системы диагностики и предварительной обработке данных об обучающей выборке, например аппроксимации функции принадлежности кортежей к классу (диагнозу) по заданным узловым кортежам с заранее известной степенью принадлежности. На этом основании предлагаемая авторами концепция диагностики является лишней сущностью на основании принципа У. Оккама.

Концепции авторов основывается на разбиении множества признаков и в определении для каждого подмножества разбиения частных коэффициентов уверенности в диагнозе. По признакам, входящих в каждое разбиение, они задают ФПКП, что дает КУ1 = цС1(Н1) и КУ2 = цС1(Н2). После чего, получают частный коэффициент уверенности в диагнозе:

КУч = КУ1 + КУ2- КУ1 ■ КУ2 или КУч = тах(КУ1, КУ2), (4) чем создают иллюзию использования некоторой не известной теории уверенности или возможностей. Затем по формулам из (4), но теперь подставляя в них частные коэффициенты уверенности, авторы формируют обобщенный коэффициент уверенности КУо. Также точно они получают частные коэффициенты неуверенности по каждому ранее заданному разбиению  множества признаков,  путем  использования диагностическихпризнаков PI и Р2, опровергающих диагноз, по которым также задаются ФПКП, и выполняются присвоения КНУ1 = ЦсіСРІ) и КНУ2 = цС1(Р2):

КНУч = КНУ1 + КНУ2- КНУ1 ■ КНУ2 или КНУч = тах(КНУ1, КНУ2). (5)

Затем по формулам из (5), подставляя в нее частные коэффициенты неуверенности, авторами определяется общий коэффициент неуверенности КНУо.

Заключительным этапом предлагаемой авторами анализируемых работ научному сообществу концепции диагностики на основе нечеткой логики является получение результирующего коэффициента уверенности в диагнозе по формуле:

КУр = КУ1о - КНУо. (6)

Если в формулах (4, 5 и 6) заменить КУ и КНУ на соответствующие ФПКП, то, в предлагаемой авторами концепции автоматической диагностики, все нелепости легко обнаруживаются. Выполним записи формул из (4) в их подлинном виде

ЦСі(?) = ЦСі(Н1)+ ЦСі(Н2)- цС1(Н1)-цС1(Н2)или

uG1(?) = max(uG1(Hl),uG1(Hl)). (7)

Очевидно, что первое выражение из (7) задает алгебраическое сложение нечеткого множества G1 самого с самим, но с неизвестным базовым множеством результата сложения, поскольку базовые множества разные, а второе - логическим объединение множества G1 самого с самим, но также с неизвестным базовым множеством результата. В точности такие же выражения получим для формул из (5).

При использовании разнородных признаков или признаков, заданных в разных единицах измерения, т.е. в случае общего положения в диагностике, получаем НІ П Н2 = 0. Это условие строго обеспечивается во всех работах авторов при переходах по формулам из (4) и (5) от одних частных коэффициентов к другим в процессе формирования КУо или КНУо, где они в точности оперируют разнородными признаками или признаками, заданными в разных единицах измерения. Например, в [5] задается группа признаков (и для них вычисляется коэффициент уверенности) концентрации микроэлементов (мг/мм3), а затем вводится группа признаков (и для них также вычисляется частный коэффициент уверенности), каждый из которых задает электрическое сопротивление (Ом) для множества биологически активных точек. Во всех анализируемых работах авторов на заключительном этапе всегда осуществляются вычисления частных коэффициентов уверенности и используются ФПКП на признаках, являющихся электрическими сопротивлениями множества биологически активных точек.

Докажем следующие утверждения при условии, что функции принадлежности цА1(Н1), цА2(Н1) заданы корректно.

Утверждение 1. Если НІ П Н2 = 0, то тах(цА1(Н1), цА2(Н1)) = 1.

Действительно, при А1 с ні и А2 с Н2 также выполняется -іАІ с Ній -iA2 Q Н2. Отсюда А1 П А2 = 0 и -іАІ П -iA2 = 0. Тогда по закону де Моргана получим

Страницы:
1  2 


Похожие статьи

В М Довгаль, С В Неежмаков, В Ф Шевченко - Проблемы приложений теории нечетких множеств автоматическая диагностика