Автоматизированная клиническая информационно-интеллектуальная справочная система |
|
Глотко В.Л.
Развитие автоматизированных технологий (АТ) обработки медицинской информации идет по пути все более глубокой переработки "информационного сырья", в результате чего "информационный продукт" все в большей степени отличается от исходного состояния информации [6].
Если на первых этапах переработка общей медицинской информации (в основном документооборот) заключалась в сортировке и выполнении арифметических операций, прежде всего суммирования сроков лечения, количества назначений, осмотров и т.д., то в последующем она становится все более и более интеллектуальной. Все большее значение приобретают системы с элементами искусственного интеллекта (ИИ): это экспертные клинические системы, системы прогнозирования, системы диагностики и оценки информации и т.д. [4]. Однако, на сегодняшний день не существует предложенных вариантов решения задачи автоматизированной обработки общих медицинских и специализированных клинических данных, связывающих в единое информационное поле результаты опросов, осмотров, инструментальных и лабораторных исследований пациента. Опыт показывает, что максимальная сложность клинических систем, создаваемых централизовано по единому проекту, ограничена.
Альтернативой централизованному проектированию и внедрению клинических программных систем является идеология открытых автоматизированных клинических систем, при которой над развитием системы одновременно и независимо друг от друга работают очень многие, иногда тысячи разработчиков, не придерживающихся какого-либо одного плана, но подчиняющихся некоторым общим правилам.
Саморазвивающиеся открытые системы создают как бы информационную среду общего доступа к потокам медицинских данных, в развитие которой могут вносить свой вклад разработчики и даже пользователи, независимо от своего места нахождения [2,5,6].
По такому принципу создавалась автоматизированная клиническая информационно-интеллектуальная справочная система (АКИИСС) [7,8,9].
При создании АКИИСС разработчики оперировали такими основополагающими понятиями, как:
связи одного клинического признака с другими клиническими проявлениями, симптома с заболеваниями, заболевания с анатомическими изменениями, течения с проявлением, стадий с формированием новых симптомов и т.д., анализ взаимодействия, управление потоками информационного структурирования клинических данных и т.д
От того, какое конкретное содержание вкладывается разработчиками в данные понятия, самым существенным образом зависят и подходы к созданию математических моделей, структур данных и алгоритмов функционирования АКИИСС.
Проблема состоит в том, что смысловое содержание этих понятий чаще всего не конкретизируется. И это не случайно. Одной из основных причин этого положения дел является то, что конкретизировать смысловое содержание многих клинических понятий представляется возможным лишь на основе аксиоматико-дедуктивного метода и хорошо обоснованной концепции смысла. Однако, как это ни удивительно и парадоксально, но реальные разработчики АКИИСС это математики и программисты, чаще всего недостаточно знакомы с подобными концепциями.
Нам удалось решить эти задачи утвердительно, привлекая различных специалистов, более того, АКИИСС содержит информацию о системе в целом в каждой своей части определенного уровня структурной иерархии:
При построении клинической интеллектуальной интегрированной справочной системы основным методом идентификации симптома и/или синдрома (любого клинического признака) является дифференциально-диагностическая матрица (ДифДиагМат) [8,9]. Суть концепции ДифДиагМата сводится к понятию смысла Шенка-Абельсона, который состоит в том, что факты рассматриваются как причины и их смысл считается известным, если известны последствия данного факта. Таким образом, понимание смысла определенных конкретных клинических данных заключается в выявлении причинно-следственных взаимосвязей между этими данными и другими.
Но АКИИСС, это не только автоматизированная система дифференциальной обработки общих медицинских и специализированных клинических данных в он-лайн режиме, но и система анализа проявления клинических изменений на органном уровне, со способностью прогнозирования течения заболевания, уточнение его степени, стадии и формы проявления, помощи в подборе диагностических методов исследования, лекарственной и другой терапии. В этой системе учтена возможность диагностического сочетания разноуровневых исследований для проведения комплексных лечебных мероприятий. Например: данных психофизиологических и психосоматических исследований с результатами клинических и инструментально-лабораторных исследований. Таким образом, может быть решена задача преемственности и последовательности информационной составляющей функциональных изменений (преморбид) и переход их в органические, а также выявление адаптационных механизмов клинического проявления и дифференциацию их с дезадаптационными.
На стадии создания АКИИСС была решена важная задача по технологии хранения, формирования, структурирования, передачи и интеллектуального анализа всех собранных данных. Понятие хранилища данных было введено Б. Инмоном, определившим его как предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки принятия управляющих решений [1,5,12].
Объем данных в АКИИСС как минимум на порядок превосходит объемы данных в оперативных базах данных (БД), так называемых OLTP-системах (On-Line Analytical Processing — интерактивная аналитическая обработка данных). Большей сложностью отличаются и запросы к хранилищу АКИИСС. Названные особенности обусловливают необходимость обеспечения:
• высокой производительности обработки запросов;
• масштабируемости используемых алгоритмов.
При загрузке в хранилище АКИИСС новых данных выполняется их верификация, включающая:
• выявление и устранение ошибок, а также нарушений ограничений целостности;
• выявление и разрешение противоречий в данных, поступающих из разных источников;
• выявление и устранение избыточности в данных и т. д.
В архитектурном плане хранилище данных АКИИСС включает три уровня. На верхнем уровне располагается обобщенная медицинская информация для руководителей всех подразделений медучреждений, которым требуются средства анализа данных. Нижний уровень занимают источники общих медицинских и специализированных клинических данных, в том числе БД оперативной клинической информации. В трехуровневой архитектуре над двухуровневым хранилищем организуются специализированные хранилища медицинских данных для отдельных подразделений. Анализ данных в хранилищах АКИИСС базируется на технологиях интеллектуального анализа данных (ИАД). Целью ИАД является извлечение медицинских знаний из данных, т. е. обнаружение в исходных данных ранее неизвестных нетривиальных практически полезных и доступных для интерпретации знаний, необходимых для принятия решений в верификации различных состояний человека (СЧ).
В зависимости от их характера СЧ можно разделить на три группы:
1) СЧ с доминированием случайных событий (ожоги, травмы, экстремальные состояния человека и др.);
2) СЧ, в которых все события причинно обусловлены (заболевания, коматозные состояния и др.);
3) СЧ, в которых наблюдаются как причинно обусловленные, так и случайные события (отравления, воздействие экстремальных факторов внешней среды, психогенные факторы и т.д.).
В первой группе СЧ преобладают частотные закономерности, во второй — жесткие причинно-следственные зависимости, в третьей — причинно-следственные зависимости, допускающие исключения. Как правило, методы ИАД оперируют с данными, представленными тремя основными способами:
• атрибутивным (заболевания (состояния) описываются значениями фиксированного набора атрибутов т.е. симптомов (синдромов);
• структурным (объекты определяются типологически);
• полнотекстовым (исходными данными служат тексты).
Традиционно принято считать, что исходные медицинские данные в технологиях ИАД имеют структурированное представление и являются цифровыми или символьными [10,11]. Поскольку до 80 % всех медицинских данных существуют в неструктурированном виде (содержатся в текстовых документах), важность интегрированных средств, реализующих технологии ИАД и анализа текста, будет возрастать, поэтому в АКИИСС предусмотрены методы ИАД, которые реализуются в технологиях [3,12,13,14]:
• интерактивной аналитической обработки данных (On-Line Analytical Processing — OLAP);
• глубинного анализа данных (Data Mining — DM);
• визуализации данных.
В АКИИСС для технологии хранения и интеллектуального анализа данных могут применяться OLAP-сервера (например: Oracle Express Server и Microsoft OLAP Services). Слой многомерной обработки обычно встраивается в OLAP-клиент или в OLAP-сервер, но может выделяться и в самостоятельном качестве (например: Pivot Tables Service фирмы Microsoft).
Слой физического хранения данных реализуется либо в реляционных, либо в многомерных структурах, представляемых в виде многомерных массивов. Обычно OLAP-продукты обеспечивают оба эти способа хранения, а также их комбинации.
При выполнении запросов используются операции соединения таблицы симптомов и таблиц их измерений (достоверность, вероятность и т.д.).
В технологии АКИИСС в хранении медицинских данных важную роль играет управление метаданными. Метаданные хранилищ делятся на административные, операционные и medic-метаданные. Административные метаданные отражают сведения, необходимые для инсталляции и эксплуатации хранилища. Они описывают OLTP-БД, служащие источниками для OLAP, схемы данных хранилища, измерения гиперкубов, физическую организацию данных, формы стандартных отчетов, полномочия пользователей, типовые запросы и др. Операционные метаданные фиксируются в процессе работы хранилища. Они отражают информацию о текущем состоянии данных, статистике функционирования и т. д. К medic-метаданные относятся словари терминов с их определениями, описания источников и владельцев данных, финансово-экономической политики, электронного формирования документооборота и т. п.
Технология DM в АКИИСС предназначена для анализа структурированных общих медицинских и специализированных клинических данных с помощью математических моделей, основанных на статистических, вероятностных и оптимизационных методах, с целью выявления в них заранее неизвестных закономерностей, зависимостей и извлечения непредвиденной информации.
К числу основных задач DM в АКИИСС относятся задачи классификации, кластеризации, поиска ассоциаций и корреляций, выявления типовых образцов на заданном множестве клинических признаков жалоб, анамнеза, осмотров, инструментально-лабораторных заключений и т.д., обнаружения объектов данных, не соответствующих установленным характеристикам и поведению, исследование тенденций во временных рядах и др..
Решение этих задач требует обработки больших объемов клинической информации, содержащейся в хранилищах данных. Особенность используемых при этом алгоритмов состоит в том, что при их создании необходимо учитывать организацию источника клинических данных, их значительный объем и большие размерности задач. Одно из важных требований к алгоритмам связано с обеспечением их масштабируемости.
Процесс ИАД в АКИИСС включает четыре основных этапа. На первом аналитик формулирует постановку задачи в терминах целевых переменных. На втором этапе осуществляется подготовка данных для анализа. Обычно данные представляются в виде таблицы, строки которой (записи) соответствуют объектам или состояниям объекта, а столбцы (поля, переменные) — свойствам (признакам) объектов. Значения свойств могут выражаться числами, логическими величинами и категориальными (нечисловыми) данными (симптом, анатомический объект, анатомическое расположение, семантическое определение симптома и/или синдрома, выраженность его, условие формирования и т.д.).
Категориальная переменная может быть заменена набором логических переменных, количество которых равно количеству значений категориальной переменной. Между множеством значений категориальной переменной и множеством логических переменных устанавливается взаимно однозначное соответствие. Например, категориальную переменную «головная боль», принимающую значения из множества («достоверна», «вероятна», «точная», «не возможна»), можно заменить набором логических переменных Z1, Z2, Z3, Z4. Из множества свойств должны быть исключены избыточные и малоинформативные элементы, остальные должны иметь связанные дополнительные уточняющие данные. Малоинформативными являются свойства, имеющие одно и то же значение почти для всех записей, а также свойства, количество значений которых приближается к числу записей [10,11].
Таким образом, использование в АКИИСС ИАД позволяет обеспечивать информационно-интеллектуальное сопровождение лечебно-диагностического процесса, оказывая клиницисту поддержку в виде:
АКИИСС позволяет решать следующие задачи для повседневной деятельности медицинских учреждений (в качестве самостоятельной системы, либо интегрируемая в существующие/действующие системы документооборота):
Литература:
1. Башмаков А.И., Бамаков И.А. Интеллектуальные информационные технологии. Учебное пособие. Москва, МГТУ им. Н.Э. Баумана, 2005. С.302.
2. Григорьев П.А. Методы интеллектуального анализа данных в предметных областях с частично детерминированными свойствами объектов: Автореф.дисс. ... канд. техн. наук. — М.: РГГУ, 2000. — 24 с.
3. Дюк В., Самоиленко А. Data mining: учебный курс. — СПб.: Питер, 2001. —368 с.
4. Кобринский Б.А. Ретроспективный анализ медицинских экспертных систем // Новости искусственного интеллекта. – №2. – 2005. – С.6-17.
5. Когаловский М.Р. Перспективные технологии информационных систем. — М.: ДМК Пресс; М.: Компания АйТи, 2003. — 288 с.
6. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ, 2002. – 605 с.
7. Патент РФ №103022. Заявка №2010147474, 2010.
8. Патент РФ №103209. Заявка №2010144144, 2010.
9. Патент РФ №106013. Заявка №2011110101, 2011.
10. Спирли Э. Корпоративные хранилища данных. Планирование, разработка, реализация. Т. 1: Пер. с англ. — М.: Издательский дом «Вильяме», 2001.
11. Стулов А.В. Хранилища данных: основные архитектуры и принципы построения // Новости искусственного интеллекта. 2003. — № 2. — С. 37—41.
12. Inman W. Building the Data Warehouse. — New York: John Willey & Sons,1992.
13. http://www.megaputer.ru.
14. http://www.crisp-dm.org.