Статья опубликована в рамках: XX Международной научно-практической конференции «Современная медицина: актуальные вопросы» (Россия, г. Новосибирск, 01 июля 2013 г.)
Наука: Медицина
Секция: Клиническая лабораторная диагностика
Скачать книгу(-и): Сборник статей конференции
- Условия публикаций
- Все статьи конференции
дипломов
ЭФФЕКТИВНОЕ ОПИСАНИЕ ДИАГНОСТИРУЮЩИХ ПРИЗНАКОВ
THE EFFECTIVE DESCRIPTION OF DIAGNOSTIC SIGNS
Maisenia Alena
candidate of Medical Science, surgeon-oncologist, City clinical
oncological dispensary, Minsk, Belarus
Mitsiukhin Anatol
аssociate Professor, Belarusian State University of Informatics & Radioelectronics,
Institute of Information Technology, Minsk, Belarus
АННОТАЦИЯ
Рассматривается эффективная методика архивации многомерных диагностирующих признаков начальной классификации. В основе метода лежит использование преобразования Хотеллинга. Применение этого подхода в диагностической практике позволяет снизить размерность исследуемого пространства признаков, упростить процесс диагностического решения.
ABSTRACT
Is a cost-effective method of backup multivariate diagnostic signs of initial classification. The method is based on the use of orthogonal Hotelling transformation. This approach in diagnostic practices can reduce the dimensionality of space and to simplify the process of diagnostic decision.
Ключевые слова: описание; диагностика; признаки; архивация; преобразование Хотеллинга.
Keywords: description; diagnostic; attribute; archiving; Hotelling transform.
Введение
Во многих медицинских приложениях эффективная и качественная диагностика заболевания основывается на анализе многомерных биомедицинских данных (признаков). По мере развития вычислительных мощностей компьютеров, стало возможным обрабатывать значительные массивы данных. На основе многомерных признаков формируется логика диагностического решения, позволяющая определить, например, оптимальный план лечения, выбрать доступ хирургического вмешательства, снизить их инвазивность и пр.
В медицинских технологиях существуют повышенные требования к качеству обрабатываемого материала. Хранение, передача, обработка и анализ неточных биомедицинских данных может привести к установлению ошибочного диагноза. Внедряемый в настоящее время интерактивный способ анализа больших массивов медицинских данных требует компактного представления этой информации. Подобная задача характерна и в медицинских системах распознавания, где клиническая информация имеет сравнительно большой размер. Это усложняет процесс классификации из-за роста функции сложности, описывающей классификатор.
В работе рассматривается эффективная методика архивации многомерных диагностирующих признаков начальной классификации. В основе метода лежит использование преобразования Хотеллинга [2, с. 964]. Эффективное описание образа достигается за счет перехода в новую систему координат, в которой все пространство признаков становится некоррелированным. При этом наиболее информативный диагностический признак будет обладать резко выделяющейся наибольшей дисперсией. Становится возможным исключать из диагностического анализа признаки, которые мало несут полезной информации и практически не ухудшают процесс классификации образов. Использование такого подхода помогает решать современные задачи уменьшения размерности в современной молекулярной биологии [3, с. 1216].
Теоретические принципы
Сущность метода заключается в том, что архивируется, передается не исходный массив признаков, а значения коэффициентов, получающихся при преобразовании Хотеллинга. В отличие от исходных значений признаков, для которых характерно в среднем равномерное распределение энергии между дескрипторами, распределение энергии между коэффициентами резко неравномерно. Это свойство позволяет использовать меньшее число признаков для описания диагностических данных. Уменьшение размера входа обработки реализуется путем двух операций. Первая операция состоит в линейном преобразовании статистически зависимых векторов признаков, получении ковариационной матрицы. С помощью второй операции осуществляется выбор определенным способом коэффициентов преобразования.
Пусть регистрируется некоторое множество многомерных медицинских данных. Образ, принадлежащий классу , можно представить в виде вектора , где означает -ый образ, описываемый результатом измерений. Класс образов описывается кластером векторов признаков:
.
Выборочная оценка ковариационной матрицы для этого процесса определяется как
, (1)
где: — среднее значение векторов образов класса.
Для действительной и симметричной ковариационной матрицы (1) всегда существует ортонормированный базис {}, состоящий из собственных векторов. Обозначим матрицу собственных векторов ковариационной матрицы . Тогда существует такая диагональная матрица , для которой выполняется следующее равенство [1, с. 603]:
,
где: — собственные значения матрицы . Упорядочим собственные значения по убыванию, так что
, для . (2)
Пусть представляет собой матрицу, составленную из транспонированных собственных векторов ковариационной матрицы таким образом, чтобы они соответствовали упорядоченным собственным значениям (2). Матрица используется в качестве ядра, соответственно, прямого и обратного преобразования Хотеллинга:
, (3)
. (4)
Предположим, что вместо использования всех собственных векторов ковариационной матрицы строится ядро преобразования , состоящее лишь из собственных векторов, которым отвечают наибольших собственных значений дисперсий. Тогда восстановление исходного вектора определяется соотношением
. (5)
Среднеквадратичная ошибка (СКО), возникающая при отбрасывании координат, при восстановлении по оставшимся координатам определяется выражением
.
Так как собственные значения упорядочены по убыванию, ошибку можно минимизировать, выбирая собственных векторов, которым соответствуют наибольшие собственные значения. C целью иллюстрации применения рассматриваемого метода для архивации диагностирующих признаков ниже рассматривается пример.
Пример эффективного описания признаков
Имеется массив признаков аномальных образов некоторого класса.
; ; .
Используя выражения (1), получаем
, (6)
Матрице (6) соответствуют следующие собственные значения:
.
Каждому из этих значений соответствует пространство собственных векторов, удовлетворяющих уравнению
. (7)
Например, из (7) собственному значению соответствует собственный вектор
.
Матрица собственных векторов ковариационной матрицы имеет вид
.
Упорядочим собственные значения по убыванию как . Используя матрицу , вычисления по формуле (3) приводят к коэффициентам преобразования диагностирующих признаков:
; ; ; .
Компактное описание данных признаков реализуем, используя два собственных вектора, соответствующих значениям и Эти собственные значения характеризуют все информационное содержание описываемых признаков. По формуле (5) получаем следующие оценки восстановленных исходных данных:
Таким образом, для нашего примера вместо хранения (передачи) всех коэффициентов каждого вектора признаков достаточно хранить только два (половину коэффициентов) в области преобразований. При этом значение СКО равно нулю. Если оставлять только первую координату , эффективность описания диагностических признаков еще более возрастет, а ошибка будет точно соответствовать собственному значению .
Выводы
1. Полная декорреляция многомерных диагностирующих признаков посредством преобразования Хотеллинга позволяет эффективно осуществлять архивацию данных с минимально возможной ошибкой.
2. Достоинством рассмотренного эффективного метода является возможность предсказания качества сохраняемых медицинских данных.
Список литературы:
- Мэтьюз Д, Финк Г, Куртис Д. Численные методы: Пер. с англ. — М.: Вильямс, 2001. — 720 с.
- Gonzalez R, Woods E. Digital Image Processing. Prentice Hall, 2002. — 1072 p.
- Nguyen D., Rocke D. Multi-class cancer classification via partial least squares with gene expression profiles // Bioinformatics. — 2002 Sep; 18(9):1216—26.
дипломов
Оставить комментарий