И И Бобок - Детектирование наличия возмущений матрицы цифрового изображения как составная часть стеганоанализа - страница 1

Страницы:
1  2 

Л іте рату pa

1. A.C. Popescu and H. Farid, "Exposing Digital Forgeries in Color Filter Array Interpolated Images", IEEE Transactions on Signal Processing, Vol. 53, 2005, pp. 3948-3959.

2. J.Fridrich, D. Soukal, and J. Lukas, "Detection of Copy - Move Forgery in Digital Images", in Proceedings of Digital Forensic Research Workshop, August 2003.

3. A.C. Popescu and H. Farid, "Exposing Digital Forgeries by Detecting Duplicated Image Regions", Technical Report, TR2004 - 515, Department of Computer Science, Dartmouth College, 2004.

4. G.Li, Q. Wu, D. Tu, and S. Sun, "A Sorted Neighborhood Approach for Detecting Duplicated Regions in Image Forgeries based on DWT and SVD", in Proceedings of IEEE International Conference on Multimedia and Expo, Beijing China, July 2-5, 2007, pp. 1750-1753.

Надійшла в редколегію 22.04.2011

Рецензент: д.т.н., проф. Пожидаев В.Ф. Белозерова Я.А.

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ВЫДЕЛЕНИЯ СВОЙСТВ ОБЪЕКТОВ В ЗАДАЧАХ ОЦЕНКИ ПОДДЕЛКИ ИЗОБРАЖЕНИЙ.

Предлагается общий подход к построению модели обнаружения подделки изображений на основе математической модели описания свойств объектов изображения. Проведенная достоверность при использовании модели в задачах обнаружения составляет 75%.

Ключевые слова: подделка изображения, характеристика блоков, энтропия, центральный момент блока.

Belozerova Y.A.

A MATHEMATICAL MODEL OF SEPARATION PROPERTIES OF THE OBJECTS IN THE PROBLEMS OF ASSESSING A FAKE IMAGES.

A general approach to constructing models of forgery detection of images based on a

mathematical model describing the properties of objects in the image.

Keywords: fake picture, characteristic of blocks, the entropy, the central point of the block.

***

УДК 004.056.5

Бобок И.И.

ДЕТЕКТИРОВАНИЕ НАЛИЧИЯ ВОЗМУЩЕНИЙ МАТРИЦЫ ЦИФРОВОГО ИЗОБРАЖЕНИЯ КАК СОСТАВНАЯ ЧАСТЬ СТЕГАНОАНАЛИЗА

Предлагается новый стеганоаналитический подход детектирования стеганографических вложений в цифровое изображение, хранимое в формате JPEG. Приведены результаты вычислительного эксперимента.

Введение

Стеганография, один из древнейших способов сокрытия и защиты информации, переживает в настоящий момент очередной виток в своем развитии, результатом чего является активизация работы в области стеганоанализа (СА) [1-4]. Стеганография и СА -два взаимосвязанных и взаимозависимых звена одной цепи: развитие одного звена приводят к адекватному ответу в другом, хотя цели и задачи их различны. Так общим для стеганографирования является организация тайного канала связи внутри открытого канала: в непривлекающий внимание объект - контейнер (или основное сообщение (ОС)) погружается секретная, или дополнительная, информация (ДИ) таким образом, что ее

32        наличие в составе ОС остается незамеченным. Результатом такого погружения, или стеганопреобразования (СП), является стеганосообщение (СС), которое открыто пересылается адресату по каналам связи. Задачей стеганоанализа является детектирование наличия и, возможно, декодирование ДИ в «подозрительном» информационном контенте, или доказательство отсутствия секретного сообщения [1,4].

Несмотря на то, что разработки в области СА в последние годы ведутся достаточно активно [4-7], общего подхода к проблеме решения задачи детектирования ДИ в информационном контенте до настоящего момента создано не было. Абсолютное большинство стеганоаналитических методов и алгоритмов ориентированы на выявление результатов работы конкретных стеганографических алгоритмов, работающих в конкретной области контейнера: пространственной (ПО) или частотной (ЧО). Это ограничивает возможности СА как такового, поскольку в реальных условиях в подавляющем большинстве случаев информация о примененном стеганографическом алгоритме отсутствует.

Цель статьи и постановка исследований

Глобальной целью авторов является разработка универсального метода СА, позволяющего отделить исходный информационный контент от контента, подвергавшегося СП, не зависящего не только от области анализа контента (пространственной, частотной), но и от конкретики стеганографического алгоритма, использованного при погружении ДИ.

В соответствии с общим математическим подходом к анализу состояния и технологии функционирования информационных систем (ОПАИС), разработанным в [8], любое преобразование информационной системы, в частности, СП контейнера, может рассматриваться как возмущающее воздействие, а результат преобразования - как возмущение матрицы (матриц), отвечающей исходной информационной системе (контейнеру). Таким образом, необходимым условием СП является наличие возмущения матрицы исходного информационного контента, а основным шагом в процессе СА будет выявление такого возмущения.

Не ограничивая общность рассуждений [8], для конкретизации дальнейшего изложения в качестве контейнера рассматривается цифровое изображение (ЦИ). Учитывая то, что ДИ чаще всего формализуется в виде шума (или малого возмущающего воздействия [3]), далее понятия СС отождествляется с понятием возмущенного (зашумленного) ОС.

Целью настоящей работы является разработка стеганоаналитического метода, позволяющего отделить информационный контент (ЦИ), который не подвергался никакому возмущающему воздействию (не испытывал наложения шума), от возмущенного (зашумленого) контента.

Поскольку на сегодняшний день один из наиболее часто используемых форматов хранения ЦИ является JPEG, то этот формат рассматривается ниже для ОС.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Определить набор формальных параметров, характеризующих состояние ЦИ, возмущение которых даст возможность отделить исходное JPEG-ЦИ от зашумленого;

2. Определить и обосновать отличия множества формальных параметров СС, сформированного на базе JPEG-контейнера, - зашумленого ЦИ, от множества СНЧ исходного ЦИ;

3. На основе решений задач 1,2 разработать метод, позволяющий автоматизировать процесс отделения JPEG-ЦИ, не подвергавшегося возмущающему воздействию, от зашумленного ЦИ.

Формальные параметры, определяющие состояние цифрового изображения

В соответствии с ОПАИС произвольная информационная система, в том числе, стеганографическая    система    (или    отдельно    рассматриваемые    контейнер, СС),

Вісник Східноукраїнського національного університету ім. В. Даля, №7 (161), 2011, Ч. 1.

33формализуется в виде двумерной матрицы (конечного множества двумерных матриц). О результате преобразования информационной системы, ее свойствах можно судить по характерным особенностям совокупности возмущений однозначно определяющих ее формальных параметров сингулярных чисел (СНЧ) и сингулярных векторов (СНВ) соответствующей матрицы (матриц) [8].

Анализ состояния контейнера, формальным представлением которого является матрица F, или анализ СС, в частности, стеганоанализ, целесообразно свести к анализу только СНЧ соответствующей матрицы (матриц), являющихся в соответствии с соотношением [8]

max\а, (F) -а, (F + AF) < ||AF|I , (1)

1< j<n'    J j I      И 112

где  Gj (F), а, (F + AF)   - СНЧ матриц  F, F + AF  соответственно,  ||AF|| 2 -

спектральная норма матрицы возмущения AF, нечувствительными к возмущающим воздействиям, или хорошо обусловленными, поскольку реакция СНВ на возмущения различна, а в некоторых случаях - непредсказуема [8]. Хорошая обусловленность СНЧ приводит к тому, что величина их возмущений качественно отвечает величине возмущающего воздействия, характеризуя «силу» этого воздействия, в отличие от СНВ. Таким образом, результатом решения задачи 1 является множество СНЧ матриц, отвечающих ЦИ-контейнеру.

Необходимо отметить, что поскольку одним из основных требований к произвольному   стеганографическому   алгоритму   является   обеспечение надежности

восприятия результирующего СС, то возмущение матрицы контейнера AF и ||AF|| 2 везде

ниже предполагается малым [3].

Отличия формальных параметров

В соответствии с ОПАИС, произвольное СП можно представить в виде аддитивного погружения некоторой информации в пространственной области:

F = F + AF (2)

где F - матрица СС, AF - матрица возмущения ОС вследствие СП (или вследствие наложения шума).

В  качестве в первую очередь, рассмотрим матрицу, сформированную

случайным образом, элементы которой принадлежат множеству {—1,0,1}. Ненулевые элементы AF возмущают элементы F . Такой вид AF выбран не случайно: во-первых, ненулевые элементы AF обеспечивают минимально возможное возмущение элементов F , а за счет количества ненулей в AF величина возмущающего воздействия может быть сделана сколь угодно малой, следовательно возможность выявления такого возмущения даст реальную перспективу для эффективной работы разрабатываемого метода по выявлению результатов работы других, более значительных, возмущающих воздействий (шумов); во-вторых, для одного из наиболее широко используемых на сегодняшний день стеганографических методов, метода модификации наименьшего значащего бита(Ь8Б), при представлении результатов его работы в виде (2) и случайном формировании стеганопути, матрица AF имеет описанный выше вид [3]. Как известно, при СП с рассматриваемой

матрицей AF полученное СС с матрицей F  является чувствительным к любого рода

34возмущениям (ВВ), в частности, к операции сжатия [3]. Следовательно, сформированное СС может быть сохранено только в формате без потерь (например, TIF, BMP). Везде ниже для определенности в качестве формата хранения без потерь ЦИ рассматривается TIF.

Матрицы одного ЦИ в форматах TIF и JPEG (обозначим эти матрицы FTIF и FJPEG

соответственно) отличаются друг от друга. В процессе сохранения ЦИ в JPEG происходит обнуление высокочастотных (и, возможно, некоторых среднечастотных) коэффициентов дискретного косинусного преобразования (ДКП) 8 х 8 -блоков, полученных после стандартного разбиения матрицы исходного изображения. Исключение высоких (и возможно средних) частот в JPEG-ЦИ никак не восполнится при его пересохренении в формате TIF, поэтому матрица изображения, сохраненненного в TIF первоначально и

сохраненного в TIF после JPEG-сжатия (обозначим последнюю  FJPEG_^TIF) должны

качественно отличаться друг от друга по своим характеристикам, в частности, они кардинально по-разному должны отреагировать на пересохранение ЦИ в формате JPEG (для определенности и однозначности везде ниже пересохранение в формате JPEG

проводится в Adobe Photoshop CS2 с качеством Q=10). Действительно, ведь FTIF отвечает

представлению сигнала, у которого все частотные коэффициенты в «первозданном»

невозмущенном виде, в то время, как Fjpeg_^tif соответствует представлению сигнала, у

которого уже «отсутствуют» высокочастотные (возможно, среднечастотные) составляющие - коэффициенты при них если ненулевые, то  малые  (сравнимы с погрешностями

округлений). Сжатие для FTIF - первое (матрицу результата обозначим FTIF_^JPEG), его

качественные результаты описаны выше, а свойства ^.jpeg аналогичны Fjfeg . С учетом того, что сжатие происходит с достаточно высоким качеством, ожидаемым результатом является незначительное возмущение значений яркости большинства пикселей

изображения. Для FJPEG_^TIF  очередное сжатие является вторым (матрицу результата

обозначим  FJPEG_^TIF_^JPEG), причем матрица квантования для повторного сжатия с

большой вероятностью не будет совпадать с матрицей квантования для первого сжатия, в силу чего, несмотря на высокое качество второго сжатия, результат возмущений значений

яркости   пикселей   FJPEG _^TIF   при  переходе   к   FJPEG^TIF^JPEG   в  общем случае

принципиально предсказать невозможно. Ясно лишь, что эти возмущения должны быть

значительнее,     чем     при     переходе     от     FTIF     к     FTlF_^JPEG. Обозначим:

R = ats(FTiF ftif^JPEG ) ( R = abs{FJPEG^TIF FJPEG->TIF-+JPEG ) )     — матрицу

абсолютных значений разностей элементов FTIF и FTF _^JPEG (FJPEG _^TIF и FJPEG^TIF^>JPEG). Пусть M(A) - значение, которое встречается среди элементов произвольной матрицы A с максимальной частотой, max( A) - максимальное значение

среди элементов матрицы A .

На   основании   проведенных   рассуждений   выдвинем   следующую гипотезу:

max(R) < maxR);M(R) <M(R) .

Для проверки выдвинутой гипотезы в среде MATLAB был проведен вычислительный эксперимент, в котором участвовало около 800 ЦИ размером 1024 х 1024 пикселей. В качестве предмета исследования рассматривались гистограммы

Вісник Східноукраїнського національного університету ім. В. Даля, №7 (161), 2011, Ч. 1.

35значений матриц R , r .

На первом этапе эксперимента было получено, что для различных ЦИ

max(R) є{7Д9,...,32},

(3)

причем для подавляющего большинства изображений max(R) є {18,19,...,24} , при

этом гистограммы значений R имеют «правильную» и определенную форму, типичные виды которой представлены на рис.1 (лишь 1.5% исследованных ЦИ дали гистограммы ІІ-типа (рис.1(б))). Для всех ЦИ с гистограммой І-типа глобальный максимум - мода, который одновременно является единственным локальным максимумом, достигается в 1, а для гистограмм ІІ-типа - в 0. Таким образом:

Большинство пикселей ЦИ при переходе от FTIF к FTlF —jpeg , как и предполагалось,

претерпевают незначительные возмущения или не возмущаются вовсе.

Во второй части вычислительного эксперимента было установлено, что

для     разных     ЦИ,     причем     для     подавляющего     большинства изображений

max(r)g {40,...,44}, что в совокупности с (3) экспериментально подтверждает первую

часть выдвинутой гипотезы. При этом гистограммы значений r качественно отличаются от гистограмм R : в большинстве случаев наблюдается наличие нескольких локальных

максимумов - полимодальное распределение; для всех протестированных ЦИ M(R) > 1

(причем для абсолютного большинства изображений M(R) >> 1), что в совокупности с (4) подтверждает вторую часть выдвинутой гипотезы и, с учетом соотношений (3) и (5) позволяет различить ЦИ, первоначально сохраненные в формате TIF, и ЦИ, пересохраненные в TIF после JPEG-сжатия.

Пусть JPEG-контейнер подвергается ВВ (СП) с матрицей  AF. Результат в

соответствии с (2) будем представлять: Fjpeg = FJPEG + AF, где Fjpeg - матрица СС

(матрица возмущенного контейнера). Отношение количества ненулевых элементов AF к общему числу ее элементов, выраженное в процентах, назовем объемом погружаемой информации (ОПИ).  СС сохраняется в формате TIF (результирующая матрица -

Fjpeg—tif). Как показывает проведенный вычислительный эксперимент, в котором ОПИ изменялся от 10% до 50% с шагом 10%, полученные СС Fjpeg—tif ведут себя аналогично FJPEG—тш , т.е. аналогично ЦИ, которое не подвергалось ВВ (СП): после последующего пересохранения СС в формат JPEG (результирующую матрицу обозначим Fjpeg—tif--jpeg ), гистограммы значений элементов матриц

Страницы:
1  2 


Похожие статьи

И И Бобок - Детектирование наличия возмущений матрицы цифрового изображения как составная часть стеганоанализа