SlideShare ist ein Scribd-Unternehmen logo
1 von 395
А.А. ХАЛАФЯН
СОВРЕМЕННЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ
МЕДИЦИНСКИХ ИССЛЕДОВАНИЙ
Электронная версия, дополненная и переработанная
Рецензенты:
доктор физико-математических наук, профессор Е.А.Семенчин,
доктор медицинских наук, профессор Л.Н. Елисеева
2
В печатном издании монографии (ЛКИ, 2008) приведены результаты науч-
ных исследований, проведенных автором совместно с врачами-
исследователями. На реальных медицинских данных изложена технология
современного статистического анализа данных в среде пакета прикладных
программ STATISTICA. Представлены классические многомерные и совре-
менные углубленные методы анализа данных: множественный регрессион-
ный анализ, кластерный анализ, факторный анализ, анализ главных компо-
нент и классификация, многомерное шкалирование, анализ соответствий,
канонический анализ, дискриминантный анализ, общие модели дискрими-
нантного анализа, дисперсионный анализ, деревья классификации, анализ
выживаемости, моделирование структурными уравнениями, временные ряды
и прогнозирование.
В новой электронной версии монографии дополнительно представлены та-
кие методы как: ковариационный анализ, общие линейные модели, надеж-
ность и позиционный анализ, кросстабуляция, логлинейный анализ.
Уделено внимание постановочной части рассмотренных методов и интер-
претации результатов. Показаны возможности пакета при разработке диагно-
стических программ.
Книга рассчитана на широкий круг читателей – врачи, занимающиеся ис-
следовательской работой, профессорско-преподавательский состав, аспиран-
ты, студенты и научные работники медико-билогических вузов, заитересо-
ванные в применении современных технологий статистического анализа дан-
ных; а также все специалисты, использующие анализ данных в различных
прикладных областях знаний.
3
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ ...........................................................................................................6
1. СИСТЕМНЫЙ ПОДХОД И ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В
СОВРЕМЕННОЙ МЕДИЦИНЕ .........................................................................17
1.1. СИСТЕМНЫЙ АНАЛИЗ В МЕДИЦИНЕ..............................................................17
1.2. ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В МЕДИЦИНЕ ..............................................21
1.3. ДЕТЕРМИНИРОВАННЫЕ И СТОХАСТИЧЕСКИЕ МАТЕМАТИЧЕСКИЕ...............25
МОДЕЛИ В МЕДИЦИНСКИХ ИССЛЕДОВАНИЯХ .....................................................25
2. МНОГОМЕРНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ СТРУКТУРЫ
МЕДИЦИНСКИХ ДАННЫХ .............................................................................39
2.1. КЛАСТЕРНЫЙ АНАЛИЗ .................................................................................39
2.1.1. Кластерный анализ больных нефроптозом методом к-средних.......44
2.1.2. Кластерный анализ больных нефроптозом методом иерархическая
классификация..............................................................................................53
2.2. ДИСПЕРСИОННЫЙ АНАЛИЗ ............................................................................55
2.2.1. Дисперсионный анализ клинико-лабораторных показателей..........56
больных нефроптозом ..................................................................................56
2.3. ФАКТОРНЫЙ АНАЛИЗ ....................................................................................64
2.3.1. Факторный анализ клинико-лабораторных показателей больных
лептоспирозом ..............................................................................................66
2.4. АНАЛИЗ ГЛАВНЫХ КОМПОНЕНТ И КЛАССИФИКАЦИЯ ...................................80
2.4.1. Классификация больных гипертонией при наличии или отсутствии
сахарного диабета методом анализ главных компонент..............................83
2.5. МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ.................................................................98
2.5.1. Многомерное шкалирование больных гипертонией .....................101
2.6. АНАЛИЗ СООТВЕТСТВИЙ............................................................................111
2.6.1. Анализ соответствий углов ротации и степени опущения почек у
больных нефроптозом ................................................................................113
2.7. КАНОНИЧЕСКИЙ АНАЛИЗ ............................................................................121
2.7.1. Канонический анализ клинико-лабораторных показателей...........125
больных лептоспирозом.............................................................................125
3. УГЛУБЛЕННЫЕ МЕТОДЫ АНАЛИЗА.......................................................139
3.1. АНАЛИЗ ВЫЖИВАЕМОСТИ .........................................................................139
3.1.1. Анализ таблицы времен жизни больных лептоспирозом...............140
3.1.2. Оценка функции выживаемости ......................................................148
3.1.3. Выживаемость в различных группах больных ...............................152
3.1.4. Модель зависимости времени жизни больных от возраста............155
3.2. МОДЕЛИРОВАНИЕ СТРУКТУРНЫМИ УРАВНЕНИЯМИ ...................................159
3.2.1. Моделирование структурными уравнениями факторов.................163
4
заболеваемости больных лептоспирозом.................................................163
3.3. ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫМИ РЯДАМИ ..............................................177
3.3.1. Анализ динамики заболеваемости лептоспирозом в г. Краснодаре.
Исследование структуры временного ряда...............................................179
3.3.2. Модель проинтегрированного скользящего среднего АРПСС ......185
3.3.3. Экспоненциальное сглаживание и прогноз.....................................190
4. МНОГОМЕРНЫЕ МЕТОДЫ ИДЕНТИФИКАЦИИ...................................195
СОСТОЯНИЯ БОЛЬНЫХ ................................................................................195
4.1. МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ............................................195
4.1.1. Построение регрессионной модели 6-минутного теста..................197
4.1.2. Программа DIREAN прогнозирования функционального класса
хронической сердечной недостаточности.................................................211
4.2. ДИСКРИМИНАНТНЫЙ АНАЛИЗ......................................................................213
4.2.1. Дискриминантный анализ больных, страдающих хронической
сердечной недостаточностью.......................................................................215
4.2.2. Программа DIXCH определения функционального класса............228
хронической сердечной недостаточности.................................................228
4.2.3. Дискриминантный анализ больных лептоспирозом.......................230
4.2.4. Программа DILEPTS идентификации состояния больных.............238
лептоспирозом ............................................................................................238
4.2.5. Дискриминантный анализ больных нефроптозом ..........................239
4.2.6. Программа SEAR определения степени ротации патологически
подвижной почки........................................................................................243
4.3. ОБЩИЕ МОДЕЛИ ДИСКРИМИНАНТНОГО АНАЛИЗА.........................................245
4.3.1. Общие модели дискриминантного анализа больных, страдающих
хронической сердечной недостаточностью ..............................................248
4.3.2. Программа ODAXCH определения функционального класса
хронической сердечной недостаточности.................................................263
4.4. ДЕРЕВЬЯ КЛАССИФИКАЦИИ.........................................................................264
4.4.1. Построение дерева классификации больных, страдающих ............269
хронической сердечной недостаточностью ..............................................269
4.4.2. Программа DITREAN определения функциональных классов
хронической сердечной недостаточности.................................................280
4.4.3. Построение дерева классификации больных нефроптозом............281
4.4.4. Программа TREENEF определения групп больных по степени
ротации почки.............................................................................................283
4.4.5. Построение дерева классификации больных лептоспирозом ........284
4.4.6. Программа TREELEPTS идентификации состояния больных........288
лептоспирозом ............................................................................................288
4.5. ПРОГРАММНЫЙ КОМПЛЕКС ИДЕНТИФИКАЦИИ СОСТОЯНИЯ БОЛЬНЫХ.......288
5
4.6. СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ ИДЕНТИФИКАЦИИ СОСТОЯНИЯ .........292
БОЛЬНЫХ..........................................................................................................292
5. ДОПОЛНИТЕЛЬНЫЕ РАЗДЕЛЫ................................................................296
5.1. КОВАРИАЦИОННЫЙ АНАЛИЗ ......................................................................296
5.2. ОБЩИЕ ЛИНЕЙНЫЕ МОДЕЛИ ......................................................................317
5.3. НАДЕЖНОСТЬ И ПОЗИЦИОННЫЙ АНАЛИЗ ...................................................327
5.4. КРОССТАБУЛЯЦИЯ (ТАБЛИЦЫ СОПРЯЖЕННОСТИ) ......................................347
5.5. ЛОГЛИНЕЙНЫЙ АНАЛИЗ.............................................................................358
ЗАКЛЮЧЕНИЕ .................................................................................................380
БИБЛИОГРАФИЧЕСКИЕ ССЫЛКИ ..............................................................381
6
ВВЕДЕНИЕ
Человеческий организм – это функциональная биологическая система со
сложными и еще далеко не изученными взаимосвязями как между элемента-
ми внутри системы, так и с окружающей средой. Поэтому медицинские ис-
следования должны проводиться на основе системного анализа. Одним из
этапов или методов системного анализа является математическое моделиро-
вание, включающее построение и анализ как детерминированных, так и веро-
ятностно-статистических моделей. Таким образом, математическое моде-
лирование и применение вероятностно-статистических методов анализа дан-
ных должны быть неотъемлемой частью исследований в области медицины.
Конечная цель научного исследования заключается в нахождении связей
(зависимостей) между признаками, характеризующими объекты исследова-
ния. В частности математическая статистика разрабатывает вероятностные
модели установления статистических закономерностей и получения научно
обоснованных выводов о массовых явлениях из данных наблюдений или экс-
периментов. В медицине в качестве объектов исследования могут выступать
больные, а в качестве признаков – клинико-лабораторные показатели, харак-
теризующие состояние больного. Поэтому применение вероятностно-
статистического моделирования как метода системного анализа в медицин-
ских исследованиях направлено на исследование закономерностей функцио-
нирования человеческого организма как биологической системы.
При этом особую актуальность приобретают методы многомерного стати-
стического анализа, при помощи которых можно строить не только оптималь-
ные планы сбора, систематизации и обработки медицинских данных, но и вы-
явить характер и структуру сложных взаимосвязей между компонентами ис-
следуемого многомерного признака. Под многомерным признаком понимается
совокупность показателей, характеризующих исследуемый объект. В данном
случае – это человек, как биологическая система с совокупностью показателей
характеризующих его состояние. Результаты анализа данных и построенные
вероятностно-статистические модели могут быть использованы при принятии
медицинских решений по стратегии и тактике лечения больных.
Развитие современных информационных технологий, в частности стати-
стических пакетов прикладных программ (ППП), делает возможным более
эффективно использовать, как правило, достаточно трудоемкие многомерные
статистические методы. Одним из наиболее известных и широко применяе-
мых статистических ППП является программа STATISTICA (USA).
В монографии приведены результаты научных исследований, проведенных
автором совместно с учеными и врачами медицинских вузов – доктором ме-
7
дицинских наук, профессором, заведующей кафедрой факультетской терапии
Л.Н. Елисеевой; доктором медицинских наук, профессором кафедры госпи-
тальной хирургии с курсом урологии А.С. Татевосяном; кандидатом меди-
цинских наук, главным врачом ГУЗ «Специализированная клиническая ин-
фекционная больница» департамента здравоохранения Краснодарского края
В.Н. Городиным; кандидатом медицинских наук, врачом-урологом Красно-
дарской городской клинической больницы скорой медицинской помощи А.Г.
Тоняном; кандидатом медицинских наук врачом Центра медицинской профи-
лактики департамента здравоохранения Краснодарского края С.Г. Сафоно-
вой; кандидатом медицинских наук, зав. колопроктологическим отделением
ГБУЗ «Краевая клиническая больница №1» В. В. Половинкиным; кандидатом
медицинских наук, врачом терапевтического отделения стационара «Анапа»
Е.В. Бородулиной; кандидатом медицинских наук, старшим преподавателем
кафедры психологического консультирования, психокоррекции и психотера-
пии факультета клинической психологии МГМСУ им. А.И. Евдокимова А.В.
Ялтонской; доктором медицинских наук, профессором, деканом факультета
клинической психологии и заведующей кафедрой клинической психологии
МГМСУ им. А.И. Евдокимова Сирота Наталье Александровне; аспиранту
кафедры клинической психологии МГМСУ им. А.И. Евдокимова Московчен-
ко Денису Владимировичу в таких областях медицины, как кардиология, уро-
логия, инфекционные болезни, терапия, психотерапия, медицинская психоло-
гия.
Статистическими методами (множественный регрессионный анализ, кла-
стерный анализ, факторный анализ, анализ главных компонент и классифи-
кация, многомерное шкалирование, анализ соответствий, канонический ана-
лиз, дискриминантный анализ, общие модели дискриминантного анализа,
дисперсионный анализ, деревья классификации, анализ выживаемости, моде-
лирование структурными уравнениями, ковариационный анализ, логлинейный
анализ, общие линейные модели, надежность и позиционный анализ) была ис-
следована структура медицинских данных.
Исследование и анализ данных позволили решить задачу идентификации
состояния больных. В качестве инструментария исследований и диагностики
использованы ППП STATISTICA и разработанный под руководством автора
комплекс программ.
Подробное описание технологии работы с ППП STATISTICA дано в других
изданиях автора – учебном пособии «STATISTICA 6.0. Статистический ана-
лиз данных.», М.: Бином, 2007, 2009 гг; «STATISTICA 6.0. Математическая
статистика с элементами теории вероятностей», М.: Бином, 2010 г.
При работе с статистическими методами и моделями важными являются
содержательная часть решаемых задач, идеология методов, ограничения на
8
характер исходных данных, и интерпретация результатов. Поэтому в описа-
нии статистических методов дан тот необходимый объем информации, кото-
рый нужен читателю для полного понимания результатов исследований. С
этой целью в монографии достаточно подробно описываются задачи решае-
мые данным методом, требования к исходным данным, построенные таблицы
и графики.
Все таблицы и графики сопровождаются указанием «пути», в котором
прописаны названия модулей, вкладок и кнопок, последовательная активация
которых приводит к построению данной таблицы или графика. Читатель при
проведении собственных исследований сможет воспроизвести получение тех
или иных таблиц и графиков по указанному пути и правильно их интерпрети-
ровать.
Исходные данные для статистического анализа представляют таблицу, стро-
ки которой обозначают объекты исследования (например, больных). В терми-
нологии ППП STATISTICA строки называются наблюдениями. Столбцы обо-
значают переменные (признаки), описывающие наблюдения, например клини-
ко-лабораторные показатели больного. Переменные могут быть количествен-
ными и качественными. Качественные переменные измеряются в классифика-
ционной шкале (номинальной), когда в результате измерения определяется
принадлежность объекта к определенному классу или в порядковой шкале, ко-
гда в результате измерения также определяется принадлежность объекта к не-
которому классу, но дополнительно можно упорядочить объекты, сравнив их в
каком-то отношении друг с другом. Например, диагноз заболевания – это из-
мерение в классификационной шкале, а определение степени тяжести заболе-
вания – измерение в порядковой шкале. Качественные переменные называют-
ся группирующими, или категориальными. Количественные переменные мо-
гут быть измерены в интервальной шкале (например, температура больного),
в шкале отношений (например, вес больного) или абсолютной шкале (напри-
мер, некоторый безразмерный клинико-лабораторный показатель).
Статистические методы используют гипотезы (некоторые предположения),
которые принимаются или не принимаются в результате проведения исследо-
вания. При этом если гипотеза была верна, но ее отвергли, совершается
ошибка, которая называется ошибкой 1-го рода. Вероятность совершить
ошибку 1-го рода называется уровнем значимости критерия и обозначается
р-уров. Если р-уров. больше чем 0,05 (5%), то считается, что вероятность со-
вершить ошибку велика и гипотезу принимают, в противном случае гипотезу
отвергают, т.е. p-уров. представляет собой вероятность ошибки, связанной с
распространением наблюдаемого результата на всю совокупность изучаемых
объектов. Например, p-уров. = 0,05 показывает: имеется 5-процентная вероят-
ность, что выявленная в результате анализа взаимосвязь между переменными
9
вызвана стечением случайных обстоятельств. Значение 0,05 в ППП
STATISTICA принято по умолчанию, но может быть изменено исследовате-
лем. Например, если речь идет о жизни человека, целостности важных объек-
тов, конструкций и т.д., то значение р-уров. может быть уменьшено до 0,01
или 0,001.
Некоторые методы многомерного анализа являются параметрическими ме-
тодами, другие – непараметрическими. При реализации параметрических ме-
тодов предполагается выполнение основного требования к исходным данным
– количественный признак измерен как минимум в интервальной шкале и его
выборочное распределение соответствует нормальному закону. Непараметри-
ческие методы не требуют знания закона распределения количественного при-
знака.
В первой главе книги автором затрагиваются проблемы использования сис-
темного анализа в медицине, обосновывается системный подход к пониманию
функций всего организма. Анализируются проблемы информатизации в ме-
дицине и здравоохранении. Показана актуальность применения статистиче-
ских пакетов при создании программ, диагностирующих и прогнозирующих
состояние больных для практической и исследовательской медицины с мак-
симально дружественным интерфейсом для пользователя, не требующих спе-
циальных знаний в области математики, программирования или информаци-
онных технологий. Показано, что стохастические модели в равной степени с
детерминированными моделями могут быть использованы в качестве инст-
рументария системного анализа в медицинских исследованиях. Сделан ана-
литический обзор работ, посвященных применению статистических методов
в медицинских исследованиях. Это монографии, сборники научных трудов,
учебные пособия, научные статьи, а также изобретения, в основе которых ле-
жат статистические методы.
Во второй главе приведены результаты использования многомерных ста-
тистических методов для исследования структуры анализируемых медицин-
ских данных:
1. Кластерный анализ позволяет произвести разбиение множества иссле-
дуемых объектов и признаков на однородные в некотором смысле группы,
или кластеры. Проведено разбиение больных нефроптозом на группы одно-
родности методом k-средних и методом иерархической классификации, пока-
зано, что по сравнению с общепринятым разделением больных на группы по
величине опущения почки наиболее адекватной классификацией является
распределение больных на группы по степени ротации почки в трех коорди-
натных плоскостях.
2. Дисперсионный анализ посредством сравнения средних количественной
переменной в группах, полученных разбиением всей совокупности наблюде-
10
ний по одной или нескольким категориальным (качественным) переменным,
позволяет исследовать зависимость количественной переменной от данных ка-
чественных переменных. Например, количественная переменная – величина
опущения почки, группирующая переменная – степень опущения почки, ко-
торая разбивает больных на группы 1, 2, 3, соответствующие 1-й, 2-й и 3-й
степени опущения почки. Дисперсионным анализом установлено различие
средних клинико-лабораторных показателей, характеризующих состояние
больных нефроптозом, в группах по степени опущения и ротации почки. По-
казано, что в группах по степени ротации почек различие средних более вы-
ражено. То есть установлена зависимость между величинами указанных пока-
зателей и степенью опущения и ротации почки. Причем для степени ротации
почки эта зависимость сильнее.
3. Главной целью факторного анализа является сокращение числа пере-
менных. Сокращение достигается посредством выделения скрытых (латент-
ных) общих факторов, объясняющих связи между наблюдаемыми признаками
исследуемых объектов, т.е. вместо исходного набора переменных анализиру-
ются данные по выделенным факторам, число которых значительно меньше
исходного числа признаков. Факторным анализом выявлены латентные пока-
затели, характеризующие состояние больных лептоспирозом в остром перио-
де заболевания (первые 3 недели). Так, на 1-й неделе заболевания выделены
следующие: фактор 1 – синдром интоксикации, фактор 2 – синдром орган-
ной дисфункции, фактор 3 – синдром неспецифической адаптационной реак-
ции; на 2-й неделе заболевания выделены фактор 1 – синдром эндогенной
интоксикации и органной дисфункции, фактор 2 – синдром воспалительной
реакции периферической крови, фактор 3 – синдром водно-электролитных на-
рушений; на 3-й неделе заболевания выделены фактор 1 – синдром органных
и метаболических нарушений, фактор 2 – синдром диспротеинемии, фактор 3
– синдром воспалительной реакции периферической крови.
4. Анализ главных компонент и классификация предназначены для умень-
шения общего числа переменных (редукция данных) для того, чтобы полу-
чить «главные» и «некоррелирующие» переменные и классификации пере-
менных и наблюдений. Методом выявлены факторы, наиболее полно описы-
вающие состояние больных гипертонической болезнью. Выявлено различие
между группами больных гипертонией, страдающих и не страдающих сахар-
ным диабетом. Так, показано, что больных гипертонической болезнью, не
страдающих сахарным диабетом, можно объединить в группу однородности,
так как они имеют идентичное распределение значений основных клинико-
лабораторных показателей. Для больных гипертонической болезнью, стра-
дающих сахарным диабетом, эти показатели ведут себя весьма хаотично и
непредсказуемо, принимая различные значения, поэтому не приходится гово-
11
рить об идентичности больных, а следовательно, и об одинаковых методах их
лечения. Причем «индивидуальность» больных сахарным диабетом не зави-
сит от длительности заболевания сахарным диабетом или гипертонической
болезнью, от возраста или пола больного.
5. Многомерное шкалирование представляет собой совокупность методов, с
помощью которых определяется размерность пространства базовых характе-
ристик объектов и конструируется конфигурация объектов в этом пространст-
ве значительно меньшей размерности, чем исходное. Это пространство (мно-
гомерная шкала) аналогично обычно используемым шкалам в том смысле, что
значениям базовых характеристик объектов соответствуют определенные зна-
чения на осях пространства. Другими словами многомерное шкалирование –
это способы наиболее эффективного размещения объектов в пространстве
меньшей размерности, приближенно сохраняющие наблюдаемые между ними
расстояния. Например, если состояние больных характеризуется несколькими
десятками клинико-лабораторных показателей, значения которых косвенно ха-
рактеризуют «сходство» в состоянии больных, то методами многомерного
шкалирования можно построить пространство значительно меньшей размерно-
сти, максимально сохранив «сходство» между больными. Малая размерность
пространства, например 2, позволяет исследователю визуализировать объекты
исследования на плоскости, оценивая степень сходства между объектами рас-
стоянием между ними. Показано, что существуют групповые различия в со-
стоянии больных, страдающих гипертонической болезнью при наличии и от-
сутствии сахарного диабета, наряду с определенным сходством между состоя-
ниями больных в каждой группе присутствуют индивидуальные различия
больных и более значимы эти различия для больных с сахарным диабетом.
6. Метод анализ соответствий содержит описательные и разведочные ме-
тоды анализа двухвходовых и многовходовых таблиц частот. Одна из целей
анализа соответствий – представление содержимого таблицы относительных
частот в виде расстояний между отдельными строками и/или столбцами таб-
лицы в пространстве возможно более низкой размерности. Анализ соответ-
ствий показал, что между степенью опущения почки и ее ротацией существу-
ет тесная взаимосвязь, но эта взаимосвязь не носит характер прямой зависи-
мости, так как большей степени опущения почки не соответствует большая
степень ее ротации. Прямая зависимость имеет место только для больных с 1-
й степенью опущения и ротации почки, 2-я степень опущения почки способ-
ствует более сильной ротации почки, чем 3-я степень опущения.
7. Метод канонический анализ является обобщением множественного кор-
реляционного анализа как меры взаимосвязи одной переменной с множест-
вом других переменных. Канонический анализ необходим, если имеются две
совокупности переменных и необходимо определить взаимосвязь между ни-
12
ми. В результате исследований, проведенных каноническим анализом, выяв-
лена сильная зависимость между показателями синдрома интоксикации и ор-
ганной дисфункции и показателями гематологического синдрома для больных
лептоспирозом 1-й недели заболевания.
В третьей главе приведены результаты использования углубленных стати-
стистических методов для более полного исследования структуры анализи-
руемых данных:
1. Метод анализ выживаемости дает возможность исследовать вероятно-
стные характеристики интервалов времени между последовательным возник-
новением критических событий, т.е. интервалов времени между началом на-
блюдения за объектом и моментом прекращения, при котором объект пере-
стает отвечать заданным для наблюдения свойствам. Методы анализа выжи-
ваемости в основном применяются к тем же статистическим задачам, что и
другие методы, однако их особенность состоит в том, что они применяются к
неполным данным или, как иногда говорят, цензурированным. Как правило,
вместо обычной функции распределения в этих методах используется так на-
зываемая функция выживания, представляющая собой вероятность того, что
объект проживет время большее, чем некоторое значение t. Методом анализ
выживаемости построены вероятностные модели и установлены определен-
ные закономерности течения инфекционного процесса при лептоспирозе, оп-
ределены периоды времени наибольшего риска летального исхода больных,
выявлены факторы, влияющие на выживаемость больных.Так установлено,
что наибольший риск летального исхода имеется у больных в первые 2–3 не-
дели заболевания. Вероятность летального исхода больного в этот период со-
ставляет более 30%. Около 25 % больных умирают в течение первых 11 дней,
выживаемость женщин выше, чем мужчин, выживаемость больных безжел-
тушной формой также выше, чем при желтушной форме болезни, чем старше
больной, тем меньше у него шансов на выздоровление.
2. Метод моделирование структурными уравнениями посредством иссле-
дования вероятностных характеристик параметров системы изучает ее струк-
туру и устанавливает причинно-следственные взаимосвязи между элементами
системы. В медицинских исследованиях причинное моделирование может
быть использовано для установления причинных связей между латентными
(скрытыми) факторами заболевания, измерение которых по определенным
причинам невозможно, и явными, доступными для измерения факторами.
Моделированием структурными уравнениями построена причинная модель в
виде линейных уравнений и выявлена взаимосвязь между тяжестью заболева-
ния и факторами макроорганизма и микроорганизмов больных лептоспиро-
зом. При этом факторы макроорганизма и микроорганизма, тяжесть течения
заболевания являются латентными переменными, значения которых неиз-
13
вестны. Показано, что факторы макроорганизма – нарушения иммунного
статуса организма, наличие сопутствующих заболеваний, вредных привы-
чек, возраст и т.д. – в значительно большей степени влияют на состояние
больного, чем факторы микроорганизма – активность, проникающая способ-
ность лептоспир и т.д.
3. Метод временные ряды и прогнозирование посредством анализа времен-
ного ряда позволяет построить наиболее оптимальную модель ряда, по кото-
рой можно делать прогноз интересующего показателя на будущий временной
интервал произвольной длины. Построены модели временного ряда количе-
ства госпитализированных с диагнозом лептоспироз в специализированную
клиническую инфекционную больницу г. Краснодара. Методом авторегрес-
сии и скользящего среднего построена более адекватная модель, чем методом
экспоненциального сглаживания. Построенные модели временных рядов по-
казали, что количество заболевших носит колебательный характер, причем
наблюдается тенденция стабилизации числа заболевших в течение года отно-
сительно величины в 120 чел. Результаты исследований структуры данных
методами статистического анализа позволили решить задачу идентификации
состояния больных, страдающих нефроптозом, хронической сердечной не-
достаточностью, лептоспирозом.
В четвертой главе приведены результаты применения множественного
регрессионного анализа и методов классификационного анализа – дискрими-
нантного анализа, общие модели дискриминантного анализа и деревья клас-
сификации для идентификации состояния больных хронической сердечной
недостаточностью, нефроптозом, лептоспирозом.
1. Регрессионный анализ изучает вид зависимости одного признака (пере-
менной) от одного или нескольких других признаков и предполагает решение
двух задач. Первая заключается в выборе независимых переменных, сущест-
венно влияющих на зависимую величину, и в определении формы уравнения
регрессии. Данная задача решается путем анализа изучаемой взаимосвязи.
Вторая задача – оценивание параметров – решается с помощью того или ино-
го статистического метода обработки данных наблюдения. Построено линей-
ное множественное уравнение регрессии, в котором зависимой переменной
является результат 6-миутного теста, а независимыми – основные клинико-
лабораторные показатели, характеризующие состояние больных хронической
сердечной недостаточностью. Уравнение используется для прогнозирования
результатов 6-минутного теста, если известны значения клинико-
лабораторных показателей.
2. Цель дискриминантного анализа состоит в том, чтобы на основе измерения
различных характеристик (признаков, параметров) объекта классифицировать
его, т. е. отнести к одной из нескольких групп (классов) некоторым оптимальным
14
способом. Под оптимальным способом понимается либо минимум математиче-
ского ожидания потерь, либо минимум вероятности ложной классификации. Этот
вид статистического анализа является многомерным, так как использует несколь-
ко параметров объекта. Для каждого из заболеваний (хронической сердечной
недостаточности, нефроптоза, лептоспироза) выделено небольшое количество
клинико-лабораторных показателей, по которым можно с высокой достоверно-
стью определить степень тяжести состояния больного. Показана возможность и
целесообразность использования дискриминантного анализа для идентификации
состояния больных указанных заболеваний.
3. Методы общие модели дискриминантного анализа и деревья классифи-
кации используют, если не выполняются условия применимости модуля дис-
криминантный анализ, т.е. присутствуют в данных независимые переменные,
измеренные в более слабой шкале, чем интервальная шкала, или их распреде-
ление не соответствует нормальному закону. Возможности метода общие мо-
дели дискриминантного анализа значительно шире, чем у классического дис-
криминантного анализа. Предусмотрено наличие в файле данных анализируе-
мой выборки – совокупности наблюдений, которые включены в вычисления
оценок параметров модели и кросс-проверочной выборки – совокупности на-
блюдений, которые могут быть использованы для оценки доли ошибочной
классификации наблюдений. Другой особенностью метода является наличие
опций, позволяющих анализировать, насколько различные уровни предикто-
ров влияют на классификацию наблюдений, что в конечном итоге дает воз-
можность определить комбинации значений предикторов, которые максими-
зируют правдоподобие того, что соответствующее наблюдение принадлежит
тому или иному классу. Так как в данных для больных хронической сердеч-
ной недостоточностью присутствуют категориальные переменные (одышка,
слабость), метод использован для определения степени тяжести больных,
страдающих хронической сердечной недостаточностью.
4. Деревья классификации – это метод, позволяющий предсказывать при-
надлежность наблюдений или объектов к тому или иному классу категори-
альной переменной в зависимости от соответствующих значений одной или
нескольких независимых переменных. Деревья классификации выполняют
одномерное ветвление по независимым переменным различных типов – не-
прерывным и категориальным. Построенное дерево может быть очень слож-
ным. Однако использование специальных графических процедур позволяет
упростить интерпретацию результатов даже для очень сложных деревьев.
Возможность графического представления результатов и простота интерпре-
тации во многом объясняют большую популярность метода в прикладных об-
ластях, в частности в медицинских исследованиях. По выделенным клинико-
лабораторным показателям для каждого из указанных заболеваний – хрони-
15
ческой сердечной недостаточности, нефроптоза, лептоспироза – построены
деревья классификации, при помощи которых можно для произвольного
больного определить степень тяжести состояния.
5. Ковариационный анализ в отличие от дисперсионного и регрессионного
анализа (ANCOVA) − раздел анализа данных, ставящий своей целью исследо-
вать характер взаимосвязи между зависимой величиной – откликом и набо-
ром количественных и качественных независимых величин – предикторов и
построить регрессионную модель, т.е. он является как бы синтезом регресси-
онного и дисперсионного анализа. Независимые количественные перемен-
ные, относящиеся к интервальной шкале или к шкале отношений (метриче-
ской), называются ковариатами. Поэтому, в качестве ковариат должна ис-
пользоваться непрерывная величина, или дискретная (порядковая) с большим
количеством значений.
6. Общие линейные модели являются обощением множественного регрес-
сионного анализа. В классическом регрессионном анализе предполагается,
что отклик и предикторы – это непрерывные случайные величины, имеющие
нормальное распределение. Однако в некоторых задачах в качестве предик-
торов целесообразно рассматривать качественные переменные, измеренные в
номинальной или порядковой шкале. Если в качестве предикторов использу-
ются непрерывные и категориальные переменные, то для построения регрес-
сионной модели следует использовать метод Общие линейные модели, кото-
рый реализован в пакете STATISTICA с одноименным модулем.
7. Надежность и позиционный анализ предназначен для построения на-
дежных анкет (шкал), а также анализа и улучшения используемой шкалы.
Оценивание надежности шкалы основано на корреляциях между индивиду-
альными позициями или измерениями, составляющими шкалу, и дисперсия-
ми этих измерений.
8. Кросстабуляция (сопряжение) – метод многомерного частотного анали-
за, состоящего в объединении двух (или нескольких) таблиц частот так, что
каждая ячейка в построенной таблице представляется единственной комби-
нацией значений или уровней табулированных переменных. Кросстабуляция
позволяет совместить частоты появления наблюдений на разных уровнях рас-
сматриваемых качественных (категориальных) переменных. Исследуя эти
частоты, можно выявить не только связи между переменными, но и исследо-
вать структуру этой связи.
9. Логлинейный анализ является более «глубоким» методы исследования
многомерных таблиц, а именно, этот метод посредством моделирования час-
тот в таблице сопряженности позволяет проверить статистическую значи-
мость различных факторов и их взаимодействий. Логлинейный анализ имеет
сходство с дисперсионным анализом и регрессионным анализом. Для прове-
16
дения логлинейного анализа все переменные должны быть измерены в кате-
гориальной шкале.
Описаны разработанные на основе указанных методов программы на язы-
ке STATISTICA VISUAL BASIC с применением макросов модулей регрессион-
ного анализа, дискриминантного анализа и общих моделей дискриминантного
анализа. Программы могут быть использованы в практической, образователь-
ной и исследовательской медицине, так как имеют простой и максимально
дружественный интерфейс для пользователя, не требуют специальных знаний
в области математики, статистического анализа или информационных техно-
логий. Программы зарегистрированы в Федеральной службе по интеллекту-
альной собственности, патентам и товарным знакам.
Книга адресована врачам, занимающимся исследовательской работой,
профессорско-преподавательскому составу, аспирантам, студентам и науч-
ным работникам медико-билогических вузов, заитересованным в использо-
вании современных технологий анализа данных; а также всем специалистам,
использующим статистический анализ данных в различных прикладных об-
ластях знаний.
Буду признателен всем читателям за замечания и пожелания по содержа-
нию и оформлению книги. Адреса для контактов: 350040, г. Краснодар, ул.
Ставропольская, 144, Кубанский государственный университет, факультет
прикладной математики, А.А. Халафяну или khaliphyan@kubannet.ru,
statlab.kubsu.ru, statlab@kubsu.ru
Выражаю благодарность Л.Н. Елисеевой, В.Н. Городину, С.Г. Сафоновой,
А.С. Татевосяну, А.Г. Тоняну, В.В. Половинкину, А.В. Ялтонсокй, Е.В. Боро-
дулиной, Н.А.Сирота, Д.В. Московченко за содержательную постановку задач
и формулирование медицинской проблемы, консультацию и обсуждение ре-
зультатов исследований; М.Х. Уртенову, Е.А. Семенчину за обсуждение ма-
тематической части монографии и критические замечания; а также моему ас-
пиранту Д.В. Савенко за помощь в написании программ.
17
1. СИСТЕМНЫЙ ПОДХОД И ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В
СОВРЕМЕННОЙ МЕДИЦИНЕ
1.1. СИСТЕМНЫЙ АНАЛИЗ В МЕДИЦИНЕ
Исторически под влиянием естественных наук, в частности анатомических
исследований, медицина развивалась по органному принципу, несмотря на
принцип целостности организма, провозглашенный еще в работах С.Г. Зыбе-
лина, М.Я. Мудрова, И.П. Сеченова, И.П. Павлова и др. В связи с этим мно-
гие относительно независимые клинические дисциплины носят названия ор-
ганов, которые они изучают – кардиология (кардио – сердце), пульмонология
(пульмо – легкое). Любой современный учебник по важнейшим фундамен-
тальным дисциплинам – анатомия, физиология, гистология и др. – строится
по органному принципу. В соответствии с разделением патологии органов –
болезни сердца, легких, печени и т. д., врачи разделились по органным специ-
альностям. Патогенез, диагностика и лечение непосредственно связываются с
функцией конкретных органов, и профессиональный взгляд врача, как прави-
ло, в основном направлен в сторону больных органов [1]. Это так называемый
морфологический (органо-морфологический, анатомический) подход к анали-
зу организма человека, который дал свой результат. Сейчас имеется чрезвы-
чайно развитая номенклатурная классификация болезней, построенная на
принципах морфологического анализа и принятая в большинстве развитых
стран мира. К настоящему времени описательный морфологический анализ
организма человека усилен инструментальными методами исследования –
микроскопом, рентгеном, компьютерной томографией, ультразвуком и т.д.
В то же время живой организм не является набором органов, как это следу-
ет, например, из самой номенклатурной классификации болезней. Живой ор-
ганизм – это биологическая система с многочисленными и еще не изученны-
ми взаимосвязями между элементами и средой обитания. Система (от греч.
systema – целое, составленное из частей; соединение) – совокупность взаимо-
связанных элементов, обособленная от среды и взаимодействующая с ней как
целое для достижения некоторой цели [2]. Системный подход – это методо-
логия научного познания, в основе которого лежит исследование объектов
как систем. Системный подход предполагает адекватное формулирование
проблемы и выработку эффективной стратегии их изучения. Поэтому важное
значение имеет рассмотрение человека как системы при изучении болезней и
их первопричин, а также использование системного подхода при диагностике
заболевания.
Основной задачей медицины является обеспечение полноценного качества
жизни человека [3]. В это понятие включается не только снятие боли и стра-
18
даний у больного, но и его возврат к полноценному образу жизни, который не
должен отличаться от уровня жизни любого другого здорового человека. Это
значит, что медицина должна уметь полностью восстанавливать поврежден-
ные органы у больного, чтобы организм мог успешно и эффективно функ-
ционировать в том же ритме, что и до болезни. Каждый человек, обратив-
шийся за помощью к услугам медицины, вправе ожидать от неё полного вы-
здоровления и возврата к своим нормальным жизненным функциям в тех
объёмах, которые предъявляют к нему современные условия жизни. И хотя,
несомненно, есть очевидное продвижение развития медицины, особенно за
последние десятилетия, следует признать, что она всё ещё далека от подобно-
го решения этих задач. У малой части больных наступает излечение от забо-
левания. Если заболевание достаточно сложное, то оно переходит в хрониче-
скую форму или заканчивается летальным исходом. Дополнительным факто-
ром, свидетельствующим о недостатках современной медицины, является то,
что врачи подвержены различным заболеваниям не в меньшей степени, чем
обычные граждане, и нет статистически подтвержденных сведений об их
большей продолжительности жизни.
По-видимому одной из причин такого состояния медицины является огра-
ниченность знаний о человеке как о сложной, большой, а возможно и беско-
нечной и неограниченной системе, являющейся частью или элементом еще
более сложных систем. П.К. Анохин одним из первых сформулировал новый
подход – системный, к пониманию функций целого организма [4]. Взамен
классической физиологии органов, традиционно следующей анатомическим
принципам, теория функциональных систем провозглашает системную орга-
низацию функций человека, начиная от молекулярного вплоть до социально-
го уровня. Целый организм с этих позиций представляет слаженную интегра-
цию множества функциональных систем, одни из которых своей саморегуля-
торной деятельностью определяют устойчивость различных показателей
внутренней среды – гомеостазис, другие – адаптацию живых организмов к
среде обитания. Одни функциональные системы генетически детерминирова-
ны, другие складываются в индивидуальной жизни в процессе взаимодейст-
вия организма с разнообразными факторами внутренней и внешней среды, т.
е. на основе обучения. Теория функциональных систем, однако, коренным
образом отличается от системного подхода, предложенного Л. Фон Берта-
ланфи. В соответствии с общепринятым системным подходом под системами
понимается только совокупность взаимосвязанных элементов. В отличие от
такого «статического» понимания системы функциональные системы явля-
ются динамически функционирующими организациями, обеспечивающими
своей саморегуляторной деятельностью полезные для организма приспособи-
тельные результаты.
19
Ведущим свойством функциональной системы живых организмов любого
уровня организации является принцип саморегуляции и самовосстановления.
В соответствии с теорией функциональных систем отклонение того или иного
результата деятельности функциональных систем от уровня, определяющего
нормальную жизнедеятельность организма, само является причиной к моби-
лизации всех составляющих функциональные системы компонентов на воз-
вращение измененного результата к уровню, определяющему оптимальное
течение процессов жизнедеятельности. В функциональных системах орга-
низма отклонение результата деятельности системы от уровня, определяюще-
го нормальную жизнедеятельность, заставляет все элементы системы рабо-
тать в сторону его возвращения к оптимальному уровню. При этом формиру-
ется субъективный информационный сигнал – отрицательная эмоция, позво-
ляющая живым организмам оценивать возникшую потребность. При возвра-
щении результата к оптимальному для жизнедеятельности уровню элементы
функциональных систем работают в противоположном направлении. Дости-
жение оптимального уровня результата в норме сопровождается информаци-
онной положительной эмоцией. По аналогичной схеме происходит самовос-
становление живых организмов в определенных пределах. Таким образом,
человеческий организм представляет собой обучающуюся, саморегулирую-
щуюся и самовосстанавливающуюся функциональную систему. Например, в
системе кровообращения есть подсистема стабилизации артериального дав-
ления, у которой есть вполне определённая цель – поддерживать артериаль-
ное давление на заданном уровне. Цель для этой подсистемы задаёт система
кровообращения, нейронные центры управления которой расположены в
продолговатом мозгу. Система кровообращения распределяет кровоток по
всем тканевым регионам организма за счёт определённого баланса между со-
судистым сопротивлением микроциркуляторной зоны различных тканевых
регионов, сердечным выбросом, и объёмом циркулирующей крови. Если эта
система «решила», что нужно поддерживать высокое артериальное давление,
она задаст эту цель для системы стабилизации артериального давления, кото-
рая «постарается» это сделать [3].
Снижение компенсаторно-приспособительных и регенераторных возмож-
ностей организма приводит к возникновению заболеваний. Поэтому, учиты-
вая системность как человека, так и окружающей его среды, востребована но-
вая номенклатурная классификация болезней, основанная как на органо-
морфологическом, так и на системном подходе к пониманию функций чело-
веческого организма. Наряду с органной патологией надо анализировать сис-
темную патологию. Организм – это цельная и очень тонко сбалансированная
сложная система, дисбаланс которой уже является патологией! Чтобы заме-
тить патологию на ранних этапах – так называемые субклинические проявле-
20
ния болезни, когда ещё нет разрушений и патология проявляется только на
функциональном, а не морфологическом уровне, необходимо рассмотрение
человека как системы. Тем более, системный подход важен при диагностике
и лечении заболевания. Например, многие терапевты при пневмонии не толь-
ко назначают антибиотики, но и, кроме местной терапии (ингаляции, массаж
грудной клетки, отхаркивающие средства, электропроцедуры на грудную
клетку), также используют и методы общего воздействия (витамины, лечеб-
ные ванны, лечебная физкультура). Но это не системный, а всего лишь ком-
плексный подход. Если предположить, что у больного имеется еще и наслед-
ственная или приобретенная функциональная слабость тонкого кишечника,
поджелудочной железы, одной из почек (обычно у каждого человека бывает
больше подобных скрытых дефектов), то это дает постоянное нарушение об-
мена витаминов, микроэлементов, белков, водно-солевого обмена, нарушение
дезинтоксикации в организме, а терапевт этими органами не занимается. Сле-
довательно, острая пневмония протекает на фоне отмеченных нарушений, ес-
тественно протекает хуже или гораздо хуже, чем если бы все это было учтено.
Именно целенаправленная работа со всем организмом, а это уже системный
подход, какой бы ни была сегодняшняя частная проблема, позволяет добиться
максимального эффекта [3].
Целенаправленная работа со всем организмом требует определенной ин-
формации о деятельности различных систем и органов человека. Сбор этой
информации в виде клинико-лабораторных показателей и их анализ – это
также проявление системного подхода и, как правило, реализуется в условиях
стационара. К сожалению, не всегда творчески подходят к сбору и анализу
этих данных, что является одной из причин врачебных ошибок. Ведь систем-
ный анализ, особенно в области медицины, – это синтез науки, искусства и
технологий. Зачастую собранных данных недостаточно (нет соответствую-
щей аппаратуры, позднее обращение, неизвестны основные симптомы забо-
левания и т.д.), но иногда их количество достаточно, или избыточно. В пер-
вую очередь обращают внимание на показатели, которые вышли за пределы
допустимых общепринятых границ и по этим «зашкаленным» значениям оп-
ределяют дальнейшую стратегию исследований или лечения больного. По су-
ти, врачам, выражаясь математической терминологией, приходится решать
многокритериальную задачу принятия решений при диагностиоровании со-
стояния больного или заболевания. В то же время многие клинико-
лабораторные показатели взаимосвязаны друг с другом, некоторые из них
наиболее информативны в описании состояния больного, другие менее зна-
чимы. В большинстве случаев о состоянии больного можно судить не по зна-
чениям отдельных показателей, а по комбинации значений небольшой сово-
купности показателей. Выявить такие информативные показатели и по соче-
21
танию их значений «распознать образ» заболевания или идентифицировать
тяжесть состояния больного можно с использованием методов системного
анализа, в частности посредством вероятностно-статистического моделиро-
вания.
При интерпретации результатов статистического анализа нужно быть пре-
дельно осторожным и помнить, что все полученные результаты имеют опре-
деленную достоверность и условия применимости. Иначе могут быть получе-
ны выводы типа «средняя температура по больнице равна 36,6º». Это, впро-
чем, то же самое, что говорить о средней зарплате по стране. Можно анализи-
ровать, сравнивать средние температуры выздоравливающих, тяжелоболь-
ных, или средние зарплаты работников бюджетной сферы, министров, депу-
татов различных уровней и т.д. Даже в этом случае само среднее еще не явля-
ется полной характеристикой анализируемого явления, необходимо также
рассматривать и степень разброса усредняемых величин. При значительном
разбросе среднее не может служить достоверной оценкой анализируемой ве-
личины.
1.2. ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В МЕДИЦИНЕ
В настоящее время происходит тотальная информатизация практически
всех областей человеческой деятельности. Частные и государственные ком-
пании, фирмы, малые предприятия оснащены самой современной компью-
терной техникой с соответствующим программным обеспечением. При этом
медицина и здравоохранение значительно отстают от необходимого на сего-
дняшний день уровня информатизации муниципальных поликлиник и боль-
ниц. Нет повсеместно внедренных программных продуктов, которые могли
бы существенно облегчить работу специалистов и сделать ее более компе-
тентной и эффективной.
В то же время существует огромный объём научной информации в виде
научных статей, монографий и сборников, но ни один врач не в состоянии
справиться с той лавиной информации, которая уже существует, продолжает
появляться и которую он должен переработать. Невозможно перечесть все
книги и статьи во всех научных журналах, пусть даже и по узкой специально-
сти. Но кроме повышения квалификации, которой постоянно должен зани-
маться врач, ему необходимо справляться еще и с огромным объемом отчет-
ной документации, которая, к сожалению, не уменьшается, а продолжает рас-
ти [3].
Возрастает объем информации и вследствие разработки новых средств ди-
агностики. Раньше, чтобы поставить диагноз, врачу было достаточно фонен-
доскопа, тонометра, глаз для осмотра и пальцев для пальпации. Сейчас до-
22
бавлено огромное число современных методов исследования, среди которых
есть много достаточно агрессивных (инструментальные методы исследова-
ния), без которых постановка диагноза невозможна. Но, наряду с позитивны-
ми моментами, из-за резко возросшего объема информации одновременно ус-
ложнилась диагностика, потому что приходится «переваривать» огромное ко-
личество информации. Так, например, если состояние больного лептоспиро-
зом характеризуется несколькими десятками клинико-лабораторных показа-
телей, то врач должен выделить из этого количества показателей наиболее
информативные и по сочетанию значений этих показателей верифицировать
состояние больного. Поэтому, врачу необходимо уметь работать не только с
приборами для исследования тех или иных систем организма, но и с компью-
тером, и с соответствующими прикладными программами, иметь понятие о
компьютерном моделировании и уметь им пользоваться. Сегодня ни один
технический проект невозможен без компьютерного моделирования. Но по-
чему-то считается, что изменить что-то в больном организме без предвари-
тельного компьютерного моделирования – это нормальное явление и вполне
нам под силу, хотя организм человека невообразимо сложнее любого техни-
ческого проекта [3].
В некоторых случаях аналитические способы диагностики дают ту инфор-
мацию, которую невозможно получить никаким другим способом. Так, ещё
более двадцати лет назад был обнаружен синдром перегрузки миокарда у
больных хроническими неспецифическими заболеваниями лёгких и останов-
ками дыхания во сне при использовании соответствующей математической
модели [3]. Причём открыт был не путём прямого измерения каких-либо па-
раметров миокарда, а с помощью использования некоторых формул и физио-
логических неинвазивных методов измерений. Такой же синдром был открыт
у больных артериальной гипертонией, а у больных с артериальной гипоксе-
мией при поражении лёгочных сосудов был открыт синдром перегрузки ко-
ронарного кровообращения.
Было бы абсолютно неверным утверждать, что медицинские информаци-
онные технологии (МИТ) не развиваются. Напротив, медицинская информа-
тика – стремительно развивающаяся область знаний, предоставляющая меди-
цине ценнейшие технологии [5]. Создана Ассоциация Развития Медицинских
Информационных Технологий, на сайте которой (ARMIT.ru) представлены мо-
нографии и учебные пособия по медицинской информатике, приведены ана-
литические обзоры разработанных информационных систем с указанием
фирм-разработчиков, выпущен каталог «Медицинские информационные тех-
нологии 2006», проводятся выставки и конференции, защиты диссертацион-
ных работ. Создана Медицинская информационная система Кондопога, пред-
назначенная для автоматизации работы медицинских учреждений независимо
23
от принадлежности (государственное, ведомственное или частное) и специа-
лизации. При этом она разработана с учетом возможности ее использования в
поликлинике, многопрофильном стационаре с различными клиническими и
диагностическими отделениями, санатории. Функционируют специализиро-
ванные сайты для врачей, например, Российский сайт врачей ультразвуковой
терапии (ACUSTIC.ru), Поволжский портал для специалистов-медиков
(MedPFO.ru), Клуб радиологов и врачей функциональной и ультразвуковой
терапии (Radiology.ru, узи.ru), Русская онкологическая сеть (Onconet.ru) и др.
Есть сайты интересные и полезные как врачам, так и их пациентам, например,
Русский онкологический форум (Oncoforum.ru), сайт MedLinks.ru и др.
Таким образом, МИТ развиваются столь же интенсивно, как и современные
компьютерные технологии. Проблема во внедрении в практическую медици-
ну. Нужна, по-видимому, глубоко продуманная государственная программа,
которая позволит выбрать и внедрить наиболее достойные и эффективные из
разработанных медицинские информационные системы, обучить медицин-
ский персонал грамотному пользованию ими. Очевидно, что разработка, вне-
дрение МИТ должны осуществляться на основе системного подхода [6]. В
противном случае возможен сценарий предыдущих не очень успешных ре-
форм в здравоохранении, реализованных по принципу «хотелось как лучше, а
получилось как всегда" – вместо уменьшения рутинной работы значительно
возрастет ее объем за счет необходимости ввода большого количества ин-
формации в компьютер.
Развитие и внедрение в здравоохранение информационных технологий (в
том числе и через разработанные автоматизированные рабочие места специа-
листов) позволит [7]:
– внедрить сетевые технологии управления в медицинские учреждения с
созданием специальных баз данных;
– обеспечить доступ специалистов к информации о новейших медицинских
технологиях через Интернет (специализированные консультационные сайты
и форумы для врачей);
– внедрить электронные формы документов, что частично автоматизирует
ведение истории болезни и другой отчетной документации;
– разрабатывать и внедрять в практическую медицину программы для ком-
пьютерного моделирования динамики состояния больного вследствие приме-
нения тех или иных препаратов или методов лечения;
– разрабатывать и внедрять в практическую медицину диагностические
программы, направленные на оказание помощи врачу в идентификации со-
стояния больного и т.д.
Не вызывает сомнения тот факт, что правильная и своевременная диагно-
стика заболевания, а также диагностика и прогнозирование состояния боль-
ного являются решающими факторами в его успешном лечении. В пользу
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография
монография

Weitere ähnliche Inhalte

Ähnlich wie монография

Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным  спектром и электромагнитная совместимость радиосистемУправление радиочастотным  спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистемSergey Vyazelenko
 
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем latokar
 
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...Иван Иванов
 
фармацевтическая химия
фармацевтическая химияфармацевтическая химия
фармацевтическая химияИван Иванов
 
фармацевтическая химия
фармацевтическая химияфармацевтическая химия
фармацевтическая химияИван Иванов
 
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...Иван Иванов
 
теория вероятностей и математическая статистика. часть 1. вариационные ряды, ...
теория вероятностей и математическая статистика. часть 1. вариационные ряды, ...теория вероятностей и математическая статистика. часть 1. вариационные ряды, ...
теория вероятностей и математическая статистика. часть 1. вариационные ряды, ...Иван Иванов
 
Аналитические методики и валидация методик [Guidance for Industry: Analytical...
Аналитические методики и валидация методик [Guidance for Industry: Analytical...Аналитические методики и валидация методик [Guidance for Industry: Analytical...
Аналитические методики и валидация методик [Guidance for Industry: Analytical...PHARMADVISOR
 
ICH S7B (The Non-clinical Evaluation of The Potential for Delayed Ventricular...
ICH S7B (The Non-clinical Evaluation of The Potential for Delayed Ventricular...ICH S7B (The Non-clinical Evaluation of The Potential for Delayed Ventricular...
ICH S7B (The Non-clinical Evaluation of The Potential for Delayed Ventricular...PHARMADVISOR
 
Анализ законодательства и правоприменительной практики по защите леса и обесп...
Анализ законодательства и правоприменительной практики по защите леса и обесп...Анализ законодательства и правоприменительной практики по защите леса и обесп...
Анализ законодательства и правоприменительной практики по защите леса и обесп...ENPI FLEG
 
Стоматолог Кудин Денис Викторович - Диссертация
Стоматолог Кудин Денис Викторович - ДиссертацияСтоматолог Кудин Денис Викторович - Диссертация
Стоматолог Кудин Денис Викторович - ДиссертацияКудин Денис Викторович
 
ICH Q2 (Validation of Analytical Procedures: Text and Methodology Q2(R1))
ICH Q2 (Validation of Analytical Procedures: Text and Methodology Q2(R1))ICH Q2 (Validation of Analytical Procedures: Text and Methodology Q2(R1))
ICH Q2 (Validation of Analytical Procedures: Text and Methodology Q2(R1))PHARMADVISOR
 
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...Иван Иванов
 
Национальная научно-технологическая политика «быстрого реагирования»: рекомен...
Национальная научно-технологическая политика «быстрого реагирования»: рекомен...Национальная научно-технологическая политика «быстрого реагирования»: рекомен...
Национальная научно-технологическая политика «быстрого реагирования»: рекомен...Ilya Klabukov
 
651.локальные методы анализа динамических систем учебное пособие
651.локальные методы анализа динамических систем учебное пособие651.локальные методы анализа динамических систем учебное пособие
651.локальные методы анализа динамических систем учебное пособиеivanov1566353422
 
651.локальные методы анализа динамических систем учебное пособие
651.локальные методы анализа динамических систем учебное пособие651.локальные методы анализа динамических систем учебное пособие
651.локальные методы анализа динамических систем учебное пособиеefwd2ws2qws2qsdw
 
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...Иван Иванов
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)unigujjar
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)Masen Rollins
 

Ähnlich wie монография (20)

Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным  спектром и электромагнитная совместимость радиосистемУправление радиочастотным  спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
 
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем Управление радиочастотным спектром и электромагнитная совместимость радиосистем
Управление радиочастотным спектром и электромагнитная совместимость радиосистем
 
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
 
фармацевтическая химия
фармацевтическая химияфармацевтическая химия
фармацевтическая химия
 
фармацевтическая химия
фармацевтическая химияфармацевтическая химия
фармацевтическая химия
 
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
 
теория вероятностей и математическая статистика. часть 1. вариационные ряды, ...
теория вероятностей и математическая статистика. часть 1. вариационные ряды, ...теория вероятностей и математическая статистика. часть 1. вариационные ряды, ...
теория вероятностей и математическая статистика. часть 1. вариационные ряды, ...
 
Аналитические методики и валидация методик [Guidance for Industry: Analytical...
Аналитические методики и валидация методик [Guidance for Industry: Analytical...Аналитические методики и валидация методик [Guidance for Industry: Analytical...
Аналитические методики и валидация методик [Guidance for Industry: Analytical...
 
ICH S7B (The Non-clinical Evaluation of The Potential for Delayed Ventricular...
ICH S7B (The Non-clinical Evaluation of The Potential for Delayed Ventricular...ICH S7B (The Non-clinical Evaluation of The Potential for Delayed Ventricular...
ICH S7B (The Non-clinical Evaluation of The Potential for Delayed Ventricular...
 
Анализ законодательства и правоприменительной практики по защите леса и обесп...
Анализ законодательства и правоприменительной практики по защите леса и обесп...Анализ законодательства и правоприменительной практики по защите леса и обесп...
Анализ законодательства и правоприменительной практики по защите леса и обесп...
 
Стоматолог Кудин Денис Викторович - Диссертация
Стоматолог Кудин Денис Викторович - ДиссертацияСтоматолог Кудин Денис Викторович - Диссертация
Стоматолог Кудин Денис Викторович - Диссертация
 
ICH Q2 (Validation of Analytical Procedures: Text and Methodology Q2(R1))
ICH Q2 (Validation of Analytical Procedures: Text and Methodology Q2(R1))ICH Q2 (Validation of Analytical Procedures: Text and Methodology Q2(R1))
ICH Q2 (Validation of Analytical Procedures: Text and Methodology Q2(R1))
 
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
 
Dis_Lisenko
Dis_LisenkoDis_Lisenko
Dis_Lisenko
 
Национальная научно-технологическая политика «быстрого реагирования»: рекомен...
Национальная научно-технологическая политика «быстрого реагирования»: рекомен...Национальная научно-технологическая политика «быстрого реагирования»: рекомен...
Национальная научно-технологическая политика «быстрого реагирования»: рекомен...
 
651.локальные методы анализа динамических систем учебное пособие
651.локальные методы анализа динамических систем учебное пособие651.локальные методы анализа динамических систем учебное пособие
651.локальные методы анализа динамических систем учебное пособие
 
651.локальные методы анализа динамических систем учебное пособие
651.локальные методы анализа динамических систем учебное пособие651.локальные методы анализа динамических систем учебное пособие
651.локальные методы анализа динамических систем учебное пособие
 
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...вестник южно уральского-государственного_университета._серия_компьютерные_тех...
вестник южно уральского-государственного_университета._серия_компьютерные_тех...
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)
 
сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)сто газпром 9001 2006 (часть 2)
сто газпром 9001 2006 (часть 2)
 

Mehr von Alexan Khalafyan

Позиционный анализ для магистров
Позиционный анализ для магистровПозиционный анализ для магистров
Позиционный анализ для магистровAlexan Khalafyan
 
Общие модели дискриминантного анализа для магистров
Общие модели дискриминантного анализа для магистровОбщие модели дискриминантного анализа для магистров
Общие модели дискриминантного анализа для магистровAlexan Khalafyan
 
Общие линейные модели для магистров
Общие линейные модели для магистровОбщие линейные модели для магистров
Общие линейные модели для магистровAlexan Khalafyan
 
логилинейный анализ для магистров
логилинейный анализ для магистровлогилинейный анализ для магистров
логилинейный анализ для магистровAlexan Khalafyan
 
ковариационный анализ для магистров
ковариационный анализ для магистровковариационный анализ для магистров
ковариационный анализ для магистровAlexan Khalafyan
 
Общие модели дискриминантного анализа (главная)
Общие модели дискриминантного анализа (главная)Общие модели дискриминантного анализа (главная)
Общие модели дискриминантного анализа (главная)Alexan Khalafyan
 
Общие линейные модели (главн)
Общие линейные модели (главн)Общие линейные модели (главн)
Общие линейные модели (главн)Alexan Khalafyan
 
Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)Alexan Khalafyan
 
Ковариационный анализ (главная)
Ковариационный анализ (главная)Ковариационный анализ (главная)
Ковариационный анализ (главная)Alexan Khalafyan
 
ответы к задачам по тв и мс
ответы к задачам по тв и мсответы к задачам по тв и мс
ответы к задачам по тв и мсAlexan Khalafyan
 
задачи для студентов по тв и мс
задачи для студентов по тв и мсзадачи для студентов по тв и мс
задачи для студентов по тв и мсAlexan Khalafyan
 
Mathematical statistic in sport of football
Mathematical statistic in sport of footballMathematical statistic in sport of football
Mathematical statistic in sport of footballAlexan Khalafyan
 

Mehr von Alexan Khalafyan (13)

Позиционный анализ для магистров
Позиционный анализ для магистровПозиционный анализ для магистров
Позиционный анализ для магистров
 
Общие модели дискриминантного анализа для магистров
Общие модели дискриминантного анализа для магистровОбщие модели дискриминантного анализа для магистров
Общие модели дискриминантного анализа для магистров
 
Общие линейные модели для магистров
Общие линейные модели для магистровОбщие линейные модели для магистров
Общие линейные модели для магистров
 
логилинейный анализ для магистров
логилинейный анализ для магистровлогилинейный анализ для магистров
логилинейный анализ для магистров
 
ковариационный анализ для магистров
ковариационный анализ для магистровковариационный анализ для магистров
ковариационный анализ для магистров
 
Общие модели дискриминантного анализа (главная)
Общие модели дискриминантного анализа (главная)Общие модели дискриминантного анализа (главная)
Общие модели дискриминантного анализа (главная)
 
Общие линейные модели (главн)
Общие линейные модели (главн)Общие линейные модели (главн)
Общие линейные модели (главн)
 
Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)Надежность и позиционный анализ (главная)
Надежность и позиционный анализ (главная)
 
Ковариационный анализ (главная)
Ковариационный анализ (главная)Ковариационный анализ (главная)
Ковариационный анализ (главная)
 
ответы к задачам по тв и мс
ответы к задачам по тв и мсответы к задачам по тв и мс
ответы к задачам по тв и мс
 
задачи для студентов по тв и мс
задачи для студентов по тв и мсзадачи для студентов по тв и мс
задачи для студентов по тв и мс
 
Mathematical statistic in sport of football
Mathematical statistic in sport of footballMathematical statistic in sport of football
Mathematical statistic in sport of football
 
Aist
AistAist
Aist
 

монография

  • 1. А.А. ХАЛАФЯН СОВРЕМЕННЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ МЕДИЦИНСКИХ ИССЛЕДОВАНИЙ Электронная версия, дополненная и переработанная Рецензенты: доктор физико-математических наук, профессор Е.А.Семенчин, доктор медицинских наук, профессор Л.Н. Елисеева
  • 2. 2 В печатном издании монографии (ЛКИ, 2008) приведены результаты науч- ных исследований, проведенных автором совместно с врачами- исследователями. На реальных медицинских данных изложена технология современного статистического анализа данных в среде пакета прикладных программ STATISTICA. Представлены классические многомерные и совре- менные углубленные методы анализа данных: множественный регрессион- ный анализ, кластерный анализ, факторный анализ, анализ главных компо- нент и классификация, многомерное шкалирование, анализ соответствий, канонический анализ, дискриминантный анализ, общие модели дискрими- нантного анализа, дисперсионный анализ, деревья классификации, анализ выживаемости, моделирование структурными уравнениями, временные ряды и прогнозирование. В новой электронной версии монографии дополнительно представлены та- кие методы как: ковариационный анализ, общие линейные модели, надеж- ность и позиционный анализ, кросстабуляция, логлинейный анализ. Уделено внимание постановочной части рассмотренных методов и интер- претации результатов. Показаны возможности пакета при разработке диагно- стических программ. Книга рассчитана на широкий круг читателей – врачи, занимающиеся ис- следовательской работой, профессорско-преподавательский состав, аспиран- ты, студенты и научные работники медико-билогических вузов, заитересо- ванные в применении современных технологий статистического анализа дан- ных; а также все специалисты, использующие анализ данных в различных прикладных областях знаний.
  • 3. 3 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ ...........................................................................................................6 1. СИСТЕМНЫЙ ПОДХОД И ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В СОВРЕМЕННОЙ МЕДИЦИНЕ .........................................................................17 1.1. СИСТЕМНЫЙ АНАЛИЗ В МЕДИЦИНЕ..............................................................17 1.2. ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В МЕДИЦИНЕ ..............................................21 1.3. ДЕТЕРМИНИРОВАННЫЕ И СТОХАСТИЧЕСКИЕ МАТЕМАТИЧЕСКИЕ...............25 МОДЕЛИ В МЕДИЦИНСКИХ ИССЛЕДОВАНИЯХ .....................................................25 2. МНОГОМЕРНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ СТРУКТУРЫ МЕДИЦИНСКИХ ДАННЫХ .............................................................................39 2.1. КЛАСТЕРНЫЙ АНАЛИЗ .................................................................................39 2.1.1. Кластерный анализ больных нефроптозом методом к-средних.......44 2.1.2. Кластерный анализ больных нефроптозом методом иерархическая классификация..............................................................................................53 2.2. ДИСПЕРСИОННЫЙ АНАЛИЗ ............................................................................55 2.2.1. Дисперсионный анализ клинико-лабораторных показателей..........56 больных нефроптозом ..................................................................................56 2.3. ФАКТОРНЫЙ АНАЛИЗ ....................................................................................64 2.3.1. Факторный анализ клинико-лабораторных показателей больных лептоспирозом ..............................................................................................66 2.4. АНАЛИЗ ГЛАВНЫХ КОМПОНЕНТ И КЛАССИФИКАЦИЯ ...................................80 2.4.1. Классификация больных гипертонией при наличии или отсутствии сахарного диабета методом анализ главных компонент..............................83 2.5. МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ.................................................................98 2.5.1. Многомерное шкалирование больных гипертонией .....................101 2.6. АНАЛИЗ СООТВЕТСТВИЙ............................................................................111 2.6.1. Анализ соответствий углов ротации и степени опущения почек у больных нефроптозом ................................................................................113 2.7. КАНОНИЧЕСКИЙ АНАЛИЗ ............................................................................121 2.7.1. Канонический анализ клинико-лабораторных показателей...........125 больных лептоспирозом.............................................................................125 3. УГЛУБЛЕННЫЕ МЕТОДЫ АНАЛИЗА.......................................................139 3.1. АНАЛИЗ ВЫЖИВАЕМОСТИ .........................................................................139 3.1.1. Анализ таблицы времен жизни больных лептоспирозом...............140 3.1.2. Оценка функции выживаемости ......................................................148 3.1.3. Выживаемость в различных группах больных ...............................152 3.1.4. Модель зависимости времени жизни больных от возраста............155 3.2. МОДЕЛИРОВАНИЕ СТРУКТУРНЫМИ УРАВНЕНИЯМИ ...................................159 3.2.1. Моделирование структурными уравнениями факторов.................163
  • 4. 4 заболеваемости больных лептоспирозом.................................................163 3.3. ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫМИ РЯДАМИ ..............................................177 3.3.1. Анализ динамики заболеваемости лептоспирозом в г. Краснодаре. Исследование структуры временного ряда...............................................179 3.3.2. Модель проинтегрированного скользящего среднего АРПСС ......185 3.3.3. Экспоненциальное сглаживание и прогноз.....................................190 4. МНОГОМЕРНЫЕ МЕТОДЫ ИДЕНТИФИКАЦИИ...................................195 СОСТОЯНИЯ БОЛЬНЫХ ................................................................................195 4.1. МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ............................................195 4.1.1. Построение регрессионной модели 6-минутного теста..................197 4.1.2. Программа DIREAN прогнозирования функционального класса хронической сердечной недостаточности.................................................211 4.2. ДИСКРИМИНАНТНЫЙ АНАЛИЗ......................................................................213 4.2.1. Дискриминантный анализ больных, страдающих хронической сердечной недостаточностью.......................................................................215 4.2.2. Программа DIXCH определения функционального класса............228 хронической сердечной недостаточности.................................................228 4.2.3. Дискриминантный анализ больных лептоспирозом.......................230 4.2.4. Программа DILEPTS идентификации состояния больных.............238 лептоспирозом ............................................................................................238 4.2.5. Дискриминантный анализ больных нефроптозом ..........................239 4.2.6. Программа SEAR определения степени ротации патологически подвижной почки........................................................................................243 4.3. ОБЩИЕ МОДЕЛИ ДИСКРИМИНАНТНОГО АНАЛИЗА.........................................245 4.3.1. Общие модели дискриминантного анализа больных, страдающих хронической сердечной недостаточностью ..............................................248 4.3.2. Программа ODAXCH определения функционального класса хронической сердечной недостаточности.................................................263 4.4. ДЕРЕВЬЯ КЛАССИФИКАЦИИ.........................................................................264 4.4.1. Построение дерева классификации больных, страдающих ............269 хронической сердечной недостаточностью ..............................................269 4.4.2. Программа DITREAN определения функциональных классов хронической сердечной недостаточности.................................................280 4.4.3. Построение дерева классификации больных нефроптозом............281 4.4.4. Программа TREENEF определения групп больных по степени ротации почки.............................................................................................283 4.4.5. Построение дерева классификации больных лептоспирозом ........284 4.4.6. Программа TREELEPTS идентификации состояния больных........288 лептоспирозом ............................................................................................288 4.5. ПРОГРАММНЫЙ КОМПЛЕКС ИДЕНТИФИКАЦИИ СОСТОЯНИЯ БОЛЬНЫХ.......288
  • 5. 5 4.6. СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ ИДЕНТИФИКАЦИИ СОСТОЯНИЯ .........292 БОЛЬНЫХ..........................................................................................................292 5. ДОПОЛНИТЕЛЬНЫЕ РАЗДЕЛЫ................................................................296 5.1. КОВАРИАЦИОННЫЙ АНАЛИЗ ......................................................................296 5.2. ОБЩИЕ ЛИНЕЙНЫЕ МОДЕЛИ ......................................................................317 5.3. НАДЕЖНОСТЬ И ПОЗИЦИОННЫЙ АНАЛИЗ ...................................................327 5.4. КРОССТАБУЛЯЦИЯ (ТАБЛИЦЫ СОПРЯЖЕННОСТИ) ......................................347 5.5. ЛОГЛИНЕЙНЫЙ АНАЛИЗ.............................................................................358 ЗАКЛЮЧЕНИЕ .................................................................................................380 БИБЛИОГРАФИЧЕСКИЕ ССЫЛКИ ..............................................................381
  • 6. 6 ВВЕДЕНИЕ Человеческий организм – это функциональная биологическая система со сложными и еще далеко не изученными взаимосвязями как между элемента- ми внутри системы, так и с окружающей средой. Поэтому медицинские ис- следования должны проводиться на основе системного анализа. Одним из этапов или методов системного анализа является математическое моделиро- вание, включающее построение и анализ как детерминированных, так и веро- ятностно-статистических моделей. Таким образом, математическое моде- лирование и применение вероятностно-статистических методов анализа дан- ных должны быть неотъемлемой частью исследований в области медицины. Конечная цель научного исследования заключается в нахождении связей (зависимостей) между признаками, характеризующими объекты исследова- ния. В частности математическая статистика разрабатывает вероятностные модели установления статистических закономерностей и получения научно обоснованных выводов о массовых явлениях из данных наблюдений или экс- периментов. В медицине в качестве объектов исследования могут выступать больные, а в качестве признаков – клинико-лабораторные показатели, харак- теризующие состояние больного. Поэтому применение вероятностно- статистического моделирования как метода системного анализа в медицин- ских исследованиях направлено на исследование закономерностей функцио- нирования человеческого организма как биологической системы. При этом особую актуальность приобретают методы многомерного стати- стического анализа, при помощи которых можно строить не только оптималь- ные планы сбора, систематизации и обработки медицинских данных, но и вы- явить характер и структуру сложных взаимосвязей между компонентами ис- следуемого многомерного признака. Под многомерным признаком понимается совокупность показателей, характеризующих исследуемый объект. В данном случае – это человек, как биологическая система с совокупностью показателей характеризующих его состояние. Результаты анализа данных и построенные вероятностно-статистические модели могут быть использованы при принятии медицинских решений по стратегии и тактике лечения больных. Развитие современных информационных технологий, в частности стати- стических пакетов прикладных программ (ППП), делает возможным более эффективно использовать, как правило, достаточно трудоемкие многомерные статистические методы. Одним из наиболее известных и широко применяе- мых статистических ППП является программа STATISTICA (USA). В монографии приведены результаты научных исследований, проведенных автором совместно с учеными и врачами медицинских вузов – доктором ме-
  • 7. 7 дицинских наук, профессором, заведующей кафедрой факультетской терапии Л.Н. Елисеевой; доктором медицинских наук, профессором кафедры госпи- тальной хирургии с курсом урологии А.С. Татевосяном; кандидатом меди- цинских наук, главным врачом ГУЗ «Специализированная клиническая ин- фекционная больница» департамента здравоохранения Краснодарского края В.Н. Городиным; кандидатом медицинских наук, врачом-урологом Красно- дарской городской клинической больницы скорой медицинской помощи А.Г. Тоняном; кандидатом медицинских наук врачом Центра медицинской профи- лактики департамента здравоохранения Краснодарского края С.Г. Сафоно- вой; кандидатом медицинских наук, зав. колопроктологическим отделением ГБУЗ «Краевая клиническая больница №1» В. В. Половинкиным; кандидатом медицинских наук, врачом терапевтического отделения стационара «Анапа» Е.В. Бородулиной; кандидатом медицинских наук, старшим преподавателем кафедры психологического консультирования, психокоррекции и психотера- пии факультета клинической психологии МГМСУ им. А.И. Евдокимова А.В. Ялтонской; доктором медицинских наук, профессором, деканом факультета клинической психологии и заведующей кафедрой клинической психологии МГМСУ им. А.И. Евдокимова Сирота Наталье Александровне; аспиранту кафедры клинической психологии МГМСУ им. А.И. Евдокимова Московчен- ко Денису Владимировичу в таких областях медицины, как кардиология, уро- логия, инфекционные болезни, терапия, психотерапия, медицинская психоло- гия. Статистическими методами (множественный регрессионный анализ, кла- стерный анализ, факторный анализ, анализ главных компонент и классифи- кация, многомерное шкалирование, анализ соответствий, канонический ана- лиз, дискриминантный анализ, общие модели дискриминантного анализа, дисперсионный анализ, деревья классификации, анализ выживаемости, моде- лирование структурными уравнениями, ковариационный анализ, логлинейный анализ, общие линейные модели, надежность и позиционный анализ) была ис- следована структура медицинских данных. Исследование и анализ данных позволили решить задачу идентификации состояния больных. В качестве инструментария исследований и диагностики использованы ППП STATISTICA и разработанный под руководством автора комплекс программ. Подробное описание технологии работы с ППП STATISTICA дано в других изданиях автора – учебном пособии «STATISTICA 6.0. Статистический ана- лиз данных.», М.: Бином, 2007, 2009 гг; «STATISTICA 6.0. Математическая статистика с элементами теории вероятностей», М.: Бином, 2010 г. При работе с статистическими методами и моделями важными являются содержательная часть решаемых задач, идеология методов, ограничения на
  • 8. 8 характер исходных данных, и интерпретация результатов. Поэтому в описа- нии статистических методов дан тот необходимый объем информации, кото- рый нужен читателю для полного понимания результатов исследований. С этой целью в монографии достаточно подробно описываются задачи решае- мые данным методом, требования к исходным данным, построенные таблицы и графики. Все таблицы и графики сопровождаются указанием «пути», в котором прописаны названия модулей, вкладок и кнопок, последовательная активация которых приводит к построению данной таблицы или графика. Читатель при проведении собственных исследований сможет воспроизвести получение тех или иных таблиц и графиков по указанному пути и правильно их интерпрети- ровать. Исходные данные для статистического анализа представляют таблицу, стро- ки которой обозначают объекты исследования (например, больных). В терми- нологии ППП STATISTICA строки называются наблюдениями. Столбцы обо- значают переменные (признаки), описывающие наблюдения, например клини- ко-лабораторные показатели больного. Переменные могут быть количествен- ными и качественными. Качественные переменные измеряются в классифика- ционной шкале (номинальной), когда в результате измерения определяется принадлежность объекта к определенному классу или в порядковой шкале, ко- гда в результате измерения также определяется принадлежность объекта к не- которому классу, но дополнительно можно упорядочить объекты, сравнив их в каком-то отношении друг с другом. Например, диагноз заболевания – это из- мерение в классификационной шкале, а определение степени тяжести заболе- вания – измерение в порядковой шкале. Качественные переменные называют- ся группирующими, или категориальными. Количественные переменные мо- гут быть измерены в интервальной шкале (например, температура больного), в шкале отношений (например, вес больного) или абсолютной шкале (напри- мер, некоторый безразмерный клинико-лабораторный показатель). Статистические методы используют гипотезы (некоторые предположения), которые принимаются или не принимаются в результате проведения исследо- вания. При этом если гипотеза была верна, но ее отвергли, совершается ошибка, которая называется ошибкой 1-го рода. Вероятность совершить ошибку 1-го рода называется уровнем значимости критерия и обозначается р-уров. Если р-уров. больше чем 0,05 (5%), то считается, что вероятность со- вершить ошибку велика и гипотезу принимают, в противном случае гипотезу отвергают, т.е. p-уров. представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю совокупность изучаемых объектов. Например, p-уров. = 0,05 показывает: имеется 5-процентная вероят- ность, что выявленная в результате анализа взаимосвязь между переменными
  • 9. 9 вызвана стечением случайных обстоятельств. Значение 0,05 в ППП STATISTICA принято по умолчанию, но может быть изменено исследовате- лем. Например, если речь идет о жизни человека, целостности важных объек- тов, конструкций и т.д., то значение р-уров. может быть уменьшено до 0,01 или 0,001. Некоторые методы многомерного анализа являются параметрическими ме- тодами, другие – непараметрическими. При реализации параметрических ме- тодов предполагается выполнение основного требования к исходным данным – количественный признак измерен как минимум в интервальной шкале и его выборочное распределение соответствует нормальному закону. Непараметри- ческие методы не требуют знания закона распределения количественного при- знака. В первой главе книги автором затрагиваются проблемы использования сис- темного анализа в медицине, обосновывается системный подход к пониманию функций всего организма. Анализируются проблемы информатизации в ме- дицине и здравоохранении. Показана актуальность применения статистиче- ских пакетов при создании программ, диагностирующих и прогнозирующих состояние больных для практической и исследовательской медицины с мак- симально дружественным интерфейсом для пользователя, не требующих спе- циальных знаний в области математики, программирования или информаци- онных технологий. Показано, что стохастические модели в равной степени с детерминированными моделями могут быть использованы в качестве инст- рументария системного анализа в медицинских исследованиях. Сделан ана- литический обзор работ, посвященных применению статистических методов в медицинских исследованиях. Это монографии, сборники научных трудов, учебные пособия, научные статьи, а также изобретения, в основе которых ле- жат статистические методы. Во второй главе приведены результаты использования многомерных ста- тистических методов для исследования структуры анализируемых медицин- ских данных: 1. Кластерный анализ позволяет произвести разбиение множества иссле- дуемых объектов и признаков на однородные в некотором смысле группы, или кластеры. Проведено разбиение больных нефроптозом на группы одно- родности методом k-средних и методом иерархической классификации, пока- зано, что по сравнению с общепринятым разделением больных на группы по величине опущения почки наиболее адекватной классификацией является распределение больных на группы по степени ротации почки в трех коорди- натных плоскостях. 2. Дисперсионный анализ посредством сравнения средних количественной переменной в группах, полученных разбиением всей совокупности наблюде-
  • 10. 10 ний по одной или нескольким категориальным (качественным) переменным, позволяет исследовать зависимость количественной переменной от данных ка- чественных переменных. Например, количественная переменная – величина опущения почки, группирующая переменная – степень опущения почки, ко- торая разбивает больных на группы 1, 2, 3, соответствующие 1-й, 2-й и 3-й степени опущения почки. Дисперсионным анализом установлено различие средних клинико-лабораторных показателей, характеризующих состояние больных нефроптозом, в группах по степени опущения и ротации почки. По- казано, что в группах по степени ротации почек различие средних более вы- ражено. То есть установлена зависимость между величинами указанных пока- зателей и степенью опущения и ротации почки. Причем для степени ротации почки эта зависимость сильнее. 3. Главной целью факторного анализа является сокращение числа пере- менных. Сокращение достигается посредством выделения скрытых (латент- ных) общих факторов, объясняющих связи между наблюдаемыми признаками исследуемых объектов, т.е. вместо исходного набора переменных анализиру- ются данные по выделенным факторам, число которых значительно меньше исходного числа признаков. Факторным анализом выявлены латентные пока- затели, характеризующие состояние больных лептоспирозом в остром перио- де заболевания (первые 3 недели). Так, на 1-й неделе заболевания выделены следующие: фактор 1 – синдром интоксикации, фактор 2 – синдром орган- ной дисфункции, фактор 3 – синдром неспецифической адаптационной реак- ции; на 2-й неделе заболевания выделены фактор 1 – синдром эндогенной интоксикации и органной дисфункции, фактор 2 – синдром воспалительной реакции периферической крови, фактор 3 – синдром водно-электролитных на- рушений; на 3-й неделе заболевания выделены фактор 1 – синдром органных и метаболических нарушений, фактор 2 – синдром диспротеинемии, фактор 3 – синдром воспалительной реакции периферической крови. 4. Анализ главных компонент и классификация предназначены для умень- шения общего числа переменных (редукция данных) для того, чтобы полу- чить «главные» и «некоррелирующие» переменные и классификации пере- менных и наблюдений. Методом выявлены факторы, наиболее полно описы- вающие состояние больных гипертонической болезнью. Выявлено различие между группами больных гипертонией, страдающих и не страдающих сахар- ным диабетом. Так, показано, что больных гипертонической болезнью, не страдающих сахарным диабетом, можно объединить в группу однородности, так как они имеют идентичное распределение значений основных клинико- лабораторных показателей. Для больных гипертонической болезнью, стра- дающих сахарным диабетом, эти показатели ведут себя весьма хаотично и непредсказуемо, принимая различные значения, поэтому не приходится гово-
  • 11. 11 рить об идентичности больных, а следовательно, и об одинаковых методах их лечения. Причем «индивидуальность» больных сахарным диабетом не зави- сит от длительности заболевания сахарным диабетом или гипертонической болезнью, от возраста или пола больного. 5. Многомерное шкалирование представляет собой совокупность методов, с помощью которых определяется размерность пространства базовых характе- ристик объектов и конструируется конфигурация объектов в этом пространст- ве значительно меньшей размерности, чем исходное. Это пространство (мно- гомерная шкала) аналогично обычно используемым шкалам в том смысле, что значениям базовых характеристик объектов соответствуют определенные зна- чения на осях пространства. Другими словами многомерное шкалирование – это способы наиболее эффективного размещения объектов в пространстве меньшей размерности, приближенно сохраняющие наблюдаемые между ними расстояния. Например, если состояние больных характеризуется несколькими десятками клинико-лабораторных показателей, значения которых косвенно ха- рактеризуют «сходство» в состоянии больных, то методами многомерного шкалирования можно построить пространство значительно меньшей размерно- сти, максимально сохранив «сходство» между больными. Малая размерность пространства, например 2, позволяет исследователю визуализировать объекты исследования на плоскости, оценивая степень сходства между объектами рас- стоянием между ними. Показано, что существуют групповые различия в со- стоянии больных, страдающих гипертонической болезнью при наличии и от- сутствии сахарного диабета, наряду с определенным сходством между состоя- ниями больных в каждой группе присутствуют индивидуальные различия больных и более значимы эти различия для больных с сахарным диабетом. 6. Метод анализ соответствий содержит описательные и разведочные ме- тоды анализа двухвходовых и многовходовых таблиц частот. Одна из целей анализа соответствий – представление содержимого таблицы относительных частот в виде расстояний между отдельными строками и/или столбцами таб- лицы в пространстве возможно более низкой размерности. Анализ соответ- ствий показал, что между степенью опущения почки и ее ротацией существу- ет тесная взаимосвязь, но эта взаимосвязь не носит характер прямой зависи- мости, так как большей степени опущения почки не соответствует большая степень ее ротации. Прямая зависимость имеет место только для больных с 1- й степенью опущения и ротации почки, 2-я степень опущения почки способ- ствует более сильной ротации почки, чем 3-я степень опущения. 7. Метод канонический анализ является обобщением множественного кор- реляционного анализа как меры взаимосвязи одной переменной с множест- вом других переменных. Канонический анализ необходим, если имеются две совокупности переменных и необходимо определить взаимосвязь между ни-
  • 12. 12 ми. В результате исследований, проведенных каноническим анализом, выяв- лена сильная зависимость между показателями синдрома интоксикации и ор- ганной дисфункции и показателями гематологического синдрома для больных лептоспирозом 1-й недели заболевания. В третьей главе приведены результаты использования углубленных стати- стистических методов для более полного исследования структуры анализи- руемых данных: 1. Метод анализ выживаемости дает возможность исследовать вероятно- стные характеристики интервалов времени между последовательным возник- новением критических событий, т.е. интервалов времени между началом на- блюдения за объектом и моментом прекращения, при котором объект пере- стает отвечать заданным для наблюдения свойствам. Методы анализа выжи- ваемости в основном применяются к тем же статистическим задачам, что и другие методы, однако их особенность состоит в том, что они применяются к неполным данным или, как иногда говорят, цензурированным. Как правило, вместо обычной функции распределения в этих методах используется так на- зываемая функция выживания, представляющая собой вероятность того, что объект проживет время большее, чем некоторое значение t. Методом анализ выживаемости построены вероятностные модели и установлены определен- ные закономерности течения инфекционного процесса при лептоспирозе, оп- ределены периоды времени наибольшего риска летального исхода больных, выявлены факторы, влияющие на выживаемость больных.Так установлено, что наибольший риск летального исхода имеется у больных в первые 2–3 не- дели заболевания. Вероятность летального исхода больного в этот период со- ставляет более 30%. Около 25 % больных умирают в течение первых 11 дней, выживаемость женщин выше, чем мужчин, выживаемость больных безжел- тушной формой также выше, чем при желтушной форме болезни, чем старше больной, тем меньше у него шансов на выздоровление. 2. Метод моделирование структурными уравнениями посредством иссле- дования вероятностных характеристик параметров системы изучает ее струк- туру и устанавливает причинно-следственные взаимосвязи между элементами системы. В медицинских исследованиях причинное моделирование может быть использовано для установления причинных связей между латентными (скрытыми) факторами заболевания, измерение которых по определенным причинам невозможно, и явными, доступными для измерения факторами. Моделированием структурными уравнениями построена причинная модель в виде линейных уравнений и выявлена взаимосвязь между тяжестью заболева- ния и факторами макроорганизма и микроорганизмов больных лептоспиро- зом. При этом факторы макроорганизма и микроорганизма, тяжесть течения заболевания являются латентными переменными, значения которых неиз-
  • 13. 13 вестны. Показано, что факторы макроорганизма – нарушения иммунного статуса организма, наличие сопутствующих заболеваний, вредных привы- чек, возраст и т.д. – в значительно большей степени влияют на состояние больного, чем факторы микроорганизма – активность, проникающая способ- ность лептоспир и т.д. 3. Метод временные ряды и прогнозирование посредством анализа времен- ного ряда позволяет построить наиболее оптимальную модель ряда, по кото- рой можно делать прогноз интересующего показателя на будущий временной интервал произвольной длины. Построены модели временного ряда количе- ства госпитализированных с диагнозом лептоспироз в специализированную клиническую инфекционную больницу г. Краснодара. Методом авторегрес- сии и скользящего среднего построена более адекватная модель, чем методом экспоненциального сглаживания. Построенные модели временных рядов по- казали, что количество заболевших носит колебательный характер, причем наблюдается тенденция стабилизации числа заболевших в течение года отно- сительно величины в 120 чел. Результаты исследований структуры данных методами статистического анализа позволили решить задачу идентификации состояния больных, страдающих нефроптозом, хронической сердечной не- достаточностью, лептоспирозом. В четвертой главе приведены результаты применения множественного регрессионного анализа и методов классификационного анализа – дискрими- нантного анализа, общие модели дискриминантного анализа и деревья клас- сификации для идентификации состояния больных хронической сердечной недостаточностью, нефроптозом, лептоспирозом. 1. Регрессионный анализ изучает вид зависимости одного признака (пере- менной) от одного или нескольких других признаков и предполагает решение двух задач. Первая заключается в выборе независимых переменных, сущест- венно влияющих на зависимую величину, и в определении формы уравнения регрессии. Данная задача решается путем анализа изучаемой взаимосвязи. Вторая задача – оценивание параметров – решается с помощью того или ино- го статистического метода обработки данных наблюдения. Построено линей- ное множественное уравнение регрессии, в котором зависимой переменной является результат 6-миутного теста, а независимыми – основные клинико- лабораторные показатели, характеризующие состояние больных хронической сердечной недостаточностью. Уравнение используется для прогнозирования результатов 6-минутного теста, если известны значения клинико- лабораторных показателей. 2. Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, т. е. отнести к одной из нескольких групп (классов) некоторым оптимальным
  • 14. 14 способом. Под оптимальным способом понимается либо минимум математиче- ского ожидания потерь, либо минимум вероятности ложной классификации. Этот вид статистического анализа является многомерным, так как использует несколь- ко параметров объекта. Для каждого из заболеваний (хронической сердечной недостаточности, нефроптоза, лептоспироза) выделено небольшое количество клинико-лабораторных показателей, по которым можно с высокой достоверно- стью определить степень тяжести состояния больного. Показана возможность и целесообразность использования дискриминантного анализа для идентификации состояния больных указанных заболеваний. 3. Методы общие модели дискриминантного анализа и деревья классифи- кации используют, если не выполняются условия применимости модуля дис- криминантный анализ, т.е. присутствуют в данных независимые переменные, измеренные в более слабой шкале, чем интервальная шкала, или их распреде- ление не соответствует нормальному закону. Возможности метода общие мо- дели дискриминантного анализа значительно шире, чем у классического дис- криминантного анализа. Предусмотрено наличие в файле данных анализируе- мой выборки – совокупности наблюдений, которые включены в вычисления оценок параметров модели и кросс-проверочной выборки – совокупности на- блюдений, которые могут быть использованы для оценки доли ошибочной классификации наблюдений. Другой особенностью метода является наличие опций, позволяющих анализировать, насколько различные уровни предикто- ров влияют на классификацию наблюдений, что в конечном итоге дает воз- можность определить комбинации значений предикторов, которые максими- зируют правдоподобие того, что соответствующее наблюдение принадлежит тому или иному классу. Так как в данных для больных хронической сердеч- ной недостоточностью присутствуют категориальные переменные (одышка, слабость), метод использован для определения степени тяжести больных, страдающих хронической сердечной недостаточностью. 4. Деревья классификации – это метод, позволяющий предсказывать при- надлежность наблюдений или объектов к тому или иному классу категори- альной переменной в зависимости от соответствующих значений одной или нескольких независимых переменных. Деревья классификации выполняют одномерное ветвление по независимым переменным различных типов – не- прерывным и категориальным. Построенное дерево может быть очень слож- ным. Однако использование специальных графических процедур позволяет упростить интерпретацию результатов даже для очень сложных деревьев. Возможность графического представления результатов и простота интерпре- тации во многом объясняют большую популярность метода в прикладных об- ластях, в частности в медицинских исследованиях. По выделенным клинико- лабораторным показателям для каждого из указанных заболеваний – хрони-
  • 15. 15 ческой сердечной недостаточности, нефроптоза, лептоспироза – построены деревья классификации, при помощи которых можно для произвольного больного определить степень тяжести состояния. 5. Ковариационный анализ в отличие от дисперсионного и регрессионного анализа (ANCOVA) − раздел анализа данных, ставящий своей целью исследо- вать характер взаимосвязи между зависимой величиной – откликом и набо- ром количественных и качественных независимых величин – предикторов и построить регрессионную модель, т.е. он является как бы синтезом регресси- онного и дисперсионного анализа. Независимые количественные перемен- ные, относящиеся к интервальной шкале или к шкале отношений (метриче- ской), называются ковариатами. Поэтому, в качестве ковариат должна ис- пользоваться непрерывная величина, или дискретная (порядковая) с большим количеством значений. 6. Общие линейные модели являются обощением множественного регрес- сионного анализа. В классическом регрессионном анализе предполагается, что отклик и предикторы – это непрерывные случайные величины, имеющие нормальное распределение. Однако в некоторых задачах в качестве предик- торов целесообразно рассматривать качественные переменные, измеренные в номинальной или порядковой шкале. Если в качестве предикторов использу- ются непрерывные и категориальные переменные, то для построения регрес- сионной модели следует использовать метод Общие линейные модели, кото- рый реализован в пакете STATISTICA с одноименным модулем. 7. Надежность и позиционный анализ предназначен для построения на- дежных анкет (шкал), а также анализа и улучшения используемой шкалы. Оценивание надежности шкалы основано на корреляциях между индивиду- альными позициями или измерениями, составляющими шкалу, и дисперсия- ми этих измерений. 8. Кросстабуляция (сопряжение) – метод многомерного частотного анали- за, состоящего в объединении двух (или нескольких) таблиц частот так, что каждая ячейка в построенной таблице представляется единственной комби- нацией значений или уровней табулированных переменных. Кросстабуляция позволяет совместить частоты появления наблюдений на разных уровнях рас- сматриваемых качественных (категориальных) переменных. Исследуя эти частоты, можно выявить не только связи между переменными, но и исследо- вать структуру этой связи. 9. Логлинейный анализ является более «глубоким» методы исследования многомерных таблиц, а именно, этот метод посредством моделирования час- тот в таблице сопряженности позволяет проверить статистическую значи- мость различных факторов и их взаимодействий. Логлинейный анализ имеет сходство с дисперсионным анализом и регрессионным анализом. Для прове-
  • 16. 16 дения логлинейного анализа все переменные должны быть измерены в кате- гориальной шкале. Описаны разработанные на основе указанных методов программы на язы- ке STATISTICA VISUAL BASIC с применением макросов модулей регрессион- ного анализа, дискриминантного анализа и общих моделей дискриминантного анализа. Программы могут быть использованы в практической, образователь- ной и исследовательской медицине, так как имеют простой и максимально дружественный интерфейс для пользователя, не требуют специальных знаний в области математики, статистического анализа или информационных техно- логий. Программы зарегистрированы в Федеральной службе по интеллекту- альной собственности, патентам и товарным знакам. Книга адресована врачам, занимающимся исследовательской работой, профессорско-преподавательскому составу, аспирантам, студентам и науч- ным работникам медико-билогических вузов, заитересованным в использо- вании современных технологий анализа данных; а также всем специалистам, использующим статистический анализ данных в различных прикладных об- ластях знаний. Буду признателен всем читателям за замечания и пожелания по содержа- нию и оформлению книги. Адреса для контактов: 350040, г. Краснодар, ул. Ставропольская, 144, Кубанский государственный университет, факультет прикладной математики, А.А. Халафяну или khaliphyan@kubannet.ru, statlab.kubsu.ru, statlab@kubsu.ru Выражаю благодарность Л.Н. Елисеевой, В.Н. Городину, С.Г. Сафоновой, А.С. Татевосяну, А.Г. Тоняну, В.В. Половинкину, А.В. Ялтонсокй, Е.В. Боро- дулиной, Н.А.Сирота, Д.В. Московченко за содержательную постановку задач и формулирование медицинской проблемы, консультацию и обсуждение ре- зультатов исследований; М.Х. Уртенову, Е.А. Семенчину за обсуждение ма- тематической части монографии и критические замечания; а также моему ас- пиранту Д.В. Савенко за помощь в написании программ.
  • 17. 17 1. СИСТЕМНЫЙ ПОДХОД И ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В СОВРЕМЕННОЙ МЕДИЦИНЕ 1.1. СИСТЕМНЫЙ АНАЛИЗ В МЕДИЦИНЕ Исторически под влиянием естественных наук, в частности анатомических исследований, медицина развивалась по органному принципу, несмотря на принцип целостности организма, провозглашенный еще в работах С.Г. Зыбе- лина, М.Я. Мудрова, И.П. Сеченова, И.П. Павлова и др. В связи с этим мно- гие относительно независимые клинические дисциплины носят названия ор- ганов, которые они изучают – кардиология (кардио – сердце), пульмонология (пульмо – легкое). Любой современный учебник по важнейшим фундамен- тальным дисциплинам – анатомия, физиология, гистология и др. – строится по органному принципу. В соответствии с разделением патологии органов – болезни сердца, легких, печени и т. д., врачи разделились по органным специ- альностям. Патогенез, диагностика и лечение непосредственно связываются с функцией конкретных органов, и профессиональный взгляд врача, как прави- ло, в основном направлен в сторону больных органов [1]. Это так называемый морфологический (органо-морфологический, анатомический) подход к анали- зу организма человека, который дал свой результат. Сейчас имеется чрезвы- чайно развитая номенклатурная классификация болезней, построенная на принципах морфологического анализа и принятая в большинстве развитых стран мира. К настоящему времени описательный морфологический анализ организма человека усилен инструментальными методами исследования – микроскопом, рентгеном, компьютерной томографией, ультразвуком и т.д. В то же время живой организм не является набором органов, как это следу- ет, например, из самой номенклатурной классификации болезней. Живой ор- ганизм – это биологическая система с многочисленными и еще не изученны- ми взаимосвязями между элементами и средой обитания. Система (от греч. systema – целое, составленное из частей; соединение) – совокупность взаимо- связанных элементов, обособленная от среды и взаимодействующая с ней как целое для достижения некоторой цели [2]. Системный подход – это методо- логия научного познания, в основе которого лежит исследование объектов как систем. Системный подход предполагает адекватное формулирование проблемы и выработку эффективной стратегии их изучения. Поэтому важное значение имеет рассмотрение человека как системы при изучении болезней и их первопричин, а также использование системного подхода при диагностике заболевания. Основной задачей медицины является обеспечение полноценного качества жизни человека [3]. В это понятие включается не только снятие боли и стра-
  • 18. 18 даний у больного, но и его возврат к полноценному образу жизни, который не должен отличаться от уровня жизни любого другого здорового человека. Это значит, что медицина должна уметь полностью восстанавливать поврежден- ные органы у больного, чтобы организм мог успешно и эффективно функ- ционировать в том же ритме, что и до болезни. Каждый человек, обратив- шийся за помощью к услугам медицины, вправе ожидать от неё полного вы- здоровления и возврата к своим нормальным жизненным функциям в тех объёмах, которые предъявляют к нему современные условия жизни. И хотя, несомненно, есть очевидное продвижение развития медицины, особенно за последние десятилетия, следует признать, что она всё ещё далека от подобно- го решения этих задач. У малой части больных наступает излечение от забо- левания. Если заболевание достаточно сложное, то оно переходит в хрониче- скую форму или заканчивается летальным исходом. Дополнительным факто- ром, свидетельствующим о недостатках современной медицины, является то, что врачи подвержены различным заболеваниям не в меньшей степени, чем обычные граждане, и нет статистически подтвержденных сведений об их большей продолжительности жизни. По-видимому одной из причин такого состояния медицины является огра- ниченность знаний о человеке как о сложной, большой, а возможно и беско- нечной и неограниченной системе, являющейся частью или элементом еще более сложных систем. П.К. Анохин одним из первых сформулировал новый подход – системный, к пониманию функций целого организма [4]. Взамен классической физиологии органов, традиционно следующей анатомическим принципам, теория функциональных систем провозглашает системную орга- низацию функций человека, начиная от молекулярного вплоть до социально- го уровня. Целый организм с этих позиций представляет слаженную интегра- цию множества функциональных систем, одни из которых своей саморегуля- торной деятельностью определяют устойчивость различных показателей внутренней среды – гомеостазис, другие – адаптацию живых организмов к среде обитания. Одни функциональные системы генетически детерминирова- ны, другие складываются в индивидуальной жизни в процессе взаимодейст- вия организма с разнообразными факторами внутренней и внешней среды, т. е. на основе обучения. Теория функциональных систем, однако, коренным образом отличается от системного подхода, предложенного Л. Фон Берта- ланфи. В соответствии с общепринятым системным подходом под системами понимается только совокупность взаимосвязанных элементов. В отличие от такого «статического» понимания системы функциональные системы явля- ются динамически функционирующими организациями, обеспечивающими своей саморегуляторной деятельностью полезные для организма приспособи- тельные результаты.
  • 19. 19 Ведущим свойством функциональной системы живых организмов любого уровня организации является принцип саморегуляции и самовосстановления. В соответствии с теорией функциональных систем отклонение того или иного результата деятельности функциональных систем от уровня, определяющего нормальную жизнедеятельность организма, само является причиной к моби- лизации всех составляющих функциональные системы компонентов на воз- вращение измененного результата к уровню, определяющему оптимальное течение процессов жизнедеятельности. В функциональных системах орга- низма отклонение результата деятельности системы от уровня, определяюще- го нормальную жизнедеятельность, заставляет все элементы системы рабо- тать в сторону его возвращения к оптимальному уровню. При этом формиру- ется субъективный информационный сигнал – отрицательная эмоция, позво- ляющая живым организмам оценивать возникшую потребность. При возвра- щении результата к оптимальному для жизнедеятельности уровню элементы функциональных систем работают в противоположном направлении. Дости- жение оптимального уровня результата в норме сопровождается информаци- онной положительной эмоцией. По аналогичной схеме происходит самовос- становление живых организмов в определенных пределах. Таким образом, человеческий организм представляет собой обучающуюся, саморегулирую- щуюся и самовосстанавливающуюся функциональную систему. Например, в системе кровообращения есть подсистема стабилизации артериального дав- ления, у которой есть вполне определённая цель – поддерживать артериаль- ное давление на заданном уровне. Цель для этой подсистемы задаёт система кровообращения, нейронные центры управления которой расположены в продолговатом мозгу. Система кровообращения распределяет кровоток по всем тканевым регионам организма за счёт определённого баланса между со- судистым сопротивлением микроциркуляторной зоны различных тканевых регионов, сердечным выбросом, и объёмом циркулирующей крови. Если эта система «решила», что нужно поддерживать высокое артериальное давление, она задаст эту цель для системы стабилизации артериального давления, кото- рая «постарается» это сделать [3]. Снижение компенсаторно-приспособительных и регенераторных возмож- ностей организма приводит к возникновению заболеваний. Поэтому, учиты- вая системность как человека, так и окружающей его среды, востребована но- вая номенклатурная классификация болезней, основанная как на органо- морфологическом, так и на системном подходе к пониманию функций чело- веческого организма. Наряду с органной патологией надо анализировать сис- темную патологию. Организм – это цельная и очень тонко сбалансированная сложная система, дисбаланс которой уже является патологией! Чтобы заме- тить патологию на ранних этапах – так называемые субклинические проявле-
  • 20. 20 ния болезни, когда ещё нет разрушений и патология проявляется только на функциональном, а не морфологическом уровне, необходимо рассмотрение человека как системы. Тем более, системный подход важен при диагностике и лечении заболевания. Например, многие терапевты при пневмонии не толь- ко назначают антибиотики, но и, кроме местной терапии (ингаляции, массаж грудной клетки, отхаркивающие средства, электропроцедуры на грудную клетку), также используют и методы общего воздействия (витамины, лечеб- ные ванны, лечебная физкультура). Но это не системный, а всего лишь ком- плексный подход. Если предположить, что у больного имеется еще и наслед- ственная или приобретенная функциональная слабость тонкого кишечника, поджелудочной железы, одной из почек (обычно у каждого человека бывает больше подобных скрытых дефектов), то это дает постоянное нарушение об- мена витаминов, микроэлементов, белков, водно-солевого обмена, нарушение дезинтоксикации в организме, а терапевт этими органами не занимается. Сле- довательно, острая пневмония протекает на фоне отмеченных нарушений, ес- тественно протекает хуже или гораздо хуже, чем если бы все это было учтено. Именно целенаправленная работа со всем организмом, а это уже системный подход, какой бы ни была сегодняшняя частная проблема, позволяет добиться максимального эффекта [3]. Целенаправленная работа со всем организмом требует определенной ин- формации о деятельности различных систем и органов человека. Сбор этой информации в виде клинико-лабораторных показателей и их анализ – это также проявление системного подхода и, как правило, реализуется в условиях стационара. К сожалению, не всегда творчески подходят к сбору и анализу этих данных, что является одной из причин врачебных ошибок. Ведь систем- ный анализ, особенно в области медицины, – это синтез науки, искусства и технологий. Зачастую собранных данных недостаточно (нет соответствую- щей аппаратуры, позднее обращение, неизвестны основные симптомы забо- левания и т.д.), но иногда их количество достаточно, или избыточно. В пер- вую очередь обращают внимание на показатели, которые вышли за пределы допустимых общепринятых границ и по этим «зашкаленным» значениям оп- ределяют дальнейшую стратегию исследований или лечения больного. По су- ти, врачам, выражаясь математической терминологией, приходится решать многокритериальную задачу принятия решений при диагностиоровании со- стояния больного или заболевания. В то же время многие клинико- лабораторные показатели взаимосвязаны друг с другом, некоторые из них наиболее информативны в описании состояния больного, другие менее зна- чимы. В большинстве случаев о состоянии больного можно судить не по зна- чениям отдельных показателей, а по комбинации значений небольшой сово- купности показателей. Выявить такие информативные показатели и по соче-
  • 21. 21 танию их значений «распознать образ» заболевания или идентифицировать тяжесть состояния больного можно с использованием методов системного анализа, в частности посредством вероятностно-статистического моделиро- вания. При интерпретации результатов статистического анализа нужно быть пре- дельно осторожным и помнить, что все полученные результаты имеют опре- деленную достоверность и условия применимости. Иначе могут быть получе- ны выводы типа «средняя температура по больнице равна 36,6º». Это, впро- чем, то же самое, что говорить о средней зарплате по стране. Можно анализи- ровать, сравнивать средние температуры выздоравливающих, тяжелоболь- ных, или средние зарплаты работников бюджетной сферы, министров, депу- татов различных уровней и т.д. Даже в этом случае само среднее еще не явля- ется полной характеристикой анализируемого явления, необходимо также рассматривать и степень разброса усредняемых величин. При значительном разбросе среднее не может служить достоверной оценкой анализируемой ве- личины. 1.2. ПРОБЛЕМЫ ИНФОРМАТИЗАЦИИ В МЕДИЦИНЕ В настоящее время происходит тотальная информатизация практически всех областей человеческой деятельности. Частные и государственные ком- пании, фирмы, малые предприятия оснащены самой современной компью- терной техникой с соответствующим программным обеспечением. При этом медицина и здравоохранение значительно отстают от необходимого на сего- дняшний день уровня информатизации муниципальных поликлиник и боль- ниц. Нет повсеместно внедренных программных продуктов, которые могли бы существенно облегчить работу специалистов и сделать ее более компе- тентной и эффективной. В то же время существует огромный объём научной информации в виде научных статей, монографий и сборников, но ни один врач не в состоянии справиться с той лавиной информации, которая уже существует, продолжает появляться и которую он должен переработать. Невозможно перечесть все книги и статьи во всех научных журналах, пусть даже и по узкой специально- сти. Но кроме повышения квалификации, которой постоянно должен зани- маться врач, ему необходимо справляться еще и с огромным объемом отчет- ной документации, которая, к сожалению, не уменьшается, а продолжает рас- ти [3]. Возрастает объем информации и вследствие разработки новых средств ди- агностики. Раньше, чтобы поставить диагноз, врачу было достаточно фонен- доскопа, тонометра, глаз для осмотра и пальцев для пальпации. Сейчас до-
  • 22. 22 бавлено огромное число современных методов исследования, среди которых есть много достаточно агрессивных (инструментальные методы исследова- ния), без которых постановка диагноза невозможна. Но, наряду с позитивны- ми моментами, из-за резко возросшего объема информации одновременно ус- ложнилась диагностика, потому что приходится «переваривать» огромное ко- личество информации. Так, например, если состояние больного лептоспиро- зом характеризуется несколькими десятками клинико-лабораторных показа- телей, то врач должен выделить из этого количества показателей наиболее информативные и по сочетанию значений этих показателей верифицировать состояние больного. Поэтому, врачу необходимо уметь работать не только с приборами для исследования тех или иных систем организма, но и с компью- тером, и с соответствующими прикладными программами, иметь понятие о компьютерном моделировании и уметь им пользоваться. Сегодня ни один технический проект невозможен без компьютерного моделирования. Но по- чему-то считается, что изменить что-то в больном организме без предвари- тельного компьютерного моделирования – это нормальное явление и вполне нам под силу, хотя организм человека невообразимо сложнее любого техни- ческого проекта [3]. В некоторых случаях аналитические способы диагностики дают ту инфор- мацию, которую невозможно получить никаким другим способом. Так, ещё более двадцати лет назад был обнаружен синдром перегрузки миокарда у больных хроническими неспецифическими заболеваниями лёгких и останов- ками дыхания во сне при использовании соответствующей математической модели [3]. Причём открыт был не путём прямого измерения каких-либо па- раметров миокарда, а с помощью использования некоторых формул и физио- логических неинвазивных методов измерений. Такой же синдром был открыт у больных артериальной гипертонией, а у больных с артериальной гипоксе- мией при поражении лёгочных сосудов был открыт синдром перегрузки ко- ронарного кровообращения. Было бы абсолютно неверным утверждать, что медицинские информаци- онные технологии (МИТ) не развиваются. Напротив, медицинская информа- тика – стремительно развивающаяся область знаний, предоставляющая меди- цине ценнейшие технологии [5]. Создана Ассоциация Развития Медицинских Информационных Технологий, на сайте которой (ARMIT.ru) представлены мо- нографии и учебные пособия по медицинской информатике, приведены ана- литические обзоры разработанных информационных систем с указанием фирм-разработчиков, выпущен каталог «Медицинские информационные тех- нологии 2006», проводятся выставки и конференции, защиты диссертацион- ных работ. Создана Медицинская информационная система Кондопога, пред- назначенная для автоматизации работы медицинских учреждений независимо
  • 23. 23 от принадлежности (государственное, ведомственное или частное) и специа- лизации. При этом она разработана с учетом возможности ее использования в поликлинике, многопрофильном стационаре с различными клиническими и диагностическими отделениями, санатории. Функционируют специализиро- ванные сайты для врачей, например, Российский сайт врачей ультразвуковой терапии (ACUSTIC.ru), Поволжский портал для специалистов-медиков (MedPFO.ru), Клуб радиологов и врачей функциональной и ультразвуковой терапии (Radiology.ru, узи.ru), Русская онкологическая сеть (Onconet.ru) и др. Есть сайты интересные и полезные как врачам, так и их пациентам, например, Русский онкологический форум (Oncoforum.ru), сайт MedLinks.ru и др. Таким образом, МИТ развиваются столь же интенсивно, как и современные компьютерные технологии. Проблема во внедрении в практическую медици- ну. Нужна, по-видимому, глубоко продуманная государственная программа, которая позволит выбрать и внедрить наиболее достойные и эффективные из разработанных медицинские информационные системы, обучить медицин- ский персонал грамотному пользованию ими. Очевидно, что разработка, вне- дрение МИТ должны осуществляться на основе системного подхода [6]. В противном случае возможен сценарий предыдущих не очень успешных ре- форм в здравоохранении, реализованных по принципу «хотелось как лучше, а получилось как всегда" – вместо уменьшения рутинной работы значительно возрастет ее объем за счет необходимости ввода большого количества ин- формации в компьютер. Развитие и внедрение в здравоохранение информационных технологий (в том числе и через разработанные автоматизированные рабочие места специа- листов) позволит [7]: – внедрить сетевые технологии управления в медицинские учреждения с созданием специальных баз данных; – обеспечить доступ специалистов к информации о новейших медицинских технологиях через Интернет (специализированные консультационные сайты и форумы для врачей); – внедрить электронные формы документов, что частично автоматизирует ведение истории болезни и другой отчетной документации; – разрабатывать и внедрять в практическую медицину программы для ком- пьютерного моделирования динамики состояния больного вследствие приме- нения тех или иных препаратов или методов лечения; – разрабатывать и внедрять в практическую медицину диагностические программы, направленные на оказание помощи врачу в идентификации со- стояния больного и т.д. Не вызывает сомнения тот факт, что правильная и своевременная диагно- стика заболевания, а также диагностика и прогнозирование состояния боль- ного являются решающими факторами в его успешном лечении. В пользу