SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Региональный индекс
пациентов
Проблема. Решение. Результат.
Региональный индекс пациентов - что это?
Региональный индекс пациентов…
Enterprise master patient index…
“is a database that is used across a healthcare organization to maintain consistent, accurate and
current demographic and essential medical data on the patients seen and managed within its
various departments.”
… база данных, используемая медицинскими организациями для ведения полных, точных и
корректных демографических и некоторых медицинских данных пациентов, доступных для
просмотра и управления различными учреждениями.
Для чего это нужно?
Цель и основная задача
Цель:
Информационное обеспечение процессов, связанных с
оказанием медицинских услуг населению.
Основная задача:
Необходимо интегрировать медицинские и иные данные
в привязке к субъекту оказания медицинской помощи -
пациенту!
Место индекса пациентов
До… После…
Задачи
● Разработать алгоритм идентификации карточек пациентов;
● Выбрать состав, структуру и формат обмена персональными данными
пациентов;
● Разработать сервис (микросервис);
● Интегрировать сервис в существующее решение.
Проблемы идентификации
● Неоднородность данных в интегрированных системах.
● Низкое качество первичных данных.
○ Опечатки
○ Дубли
○ Повторное использование карточек
○ и т.д.
● Отсутствие достоверного и общедоступного источника мастер-данных.
● Отсутствие общепринятого идентификатора пациента.
● Сложность применяемых стандартов обмена медицинскими данными.
Анализ предметной области
● Отечественные решения отсутствуют*;
● Зарубежные продукты ориентированы на использование Мастер-
данных.
● Имеющиеся решения не поддерживают работу с отечественными
идентификаторами (например, СНИЛС);
● Интерфейс взаимодействия сложен - стандарт HL7 версий 2 и 3.
* В 2015 году российское подразделение InterSystems предложило свое
решение для отечественного рынка.
Статистика на начало проекта
● всего 30 млн. карточек
○ из них 18 млн. уникальных карточек
○ из них 7% повторно использованных карточек (идентификаторов)
Обзор методов связывания
Алгоритмы сравнение строк:
● Детерминированные - основаны на полном совпадении атрибутов
записей;
● Вероятностные - используют предположение о наличии связи атрибутов
и весовые коэффициентов для вычисления оценки связи двух записей.
Оценка набранных баллов вероятностного алгоритма:
● выше порога связывания - автоматическое связывание карточек;
● ниже порога связывания - присвоение нового идентификатораразделение;
● между порогами - ручной разбор инцидента идентификации.
Детерминированные алгоритмы
Детерминировнные алгоритмы возможно применять тогда, когда в обработку
передаются четко структурированные (стандартизированные ) наборы
данных и имеется выверенный эталонный набор мастер-данных.
Пример
№ Имя Пол Дата рождения Идентификатор
1 Александр Пушкин М 06.06.1799 112233
2 Михаил Лермонтов М 15.10.1814 2345
3 Лермонтов М
4 А.С. Пушкин М 112233
5 М.Ю. Лермонтов 15.10.1814
Вероятностные алгоритмы
Метрики похожести атрибутов
Пример использования метрики Jaro-Winkler для определения соответствия
атрибутов.
Пример:
Строка 1 Строка 2 Метрика
Гусенко Гусенков 98%
Гусенко Кузенко 81%
Песков Лесков 83%
Геращенко Гирасченко 86%
Фонетическое кодирование
Для оценки схожести звучания строк применяется фонетическое
кодирование.
Пример применения алгоритма Daitch-Mokotoff.
Строка Фонетический код
Геращенко 594650
Гирасченко 594650
Песков 745700
Лесков 845700
Гусенко 546500
Кузенко 546500
Гусенков 546570
Вероятностные алгоритмы
Весовые коэффициенты
Пример
Гусенко Александр Гусенков Александр 98% * 3 + 0 + 100% * 2 = 4,94
Гусенко Александр Кусенко Александр 81% * 3 + 1+ 100% * 2 = 5,43
Гусенко Александр Кусенко А 81% * 3 + 1 + 0 * 2 = 3,43
Алгоритм идентификации
Подбор карточек-
кандидатов
Вероятностный
анализ имен
Смешанный анализ
атрибутов карточек
Оценка
набранных
баллов
● Фонетическое
кодирование;
● Вероятностный
анализ.
● Детерминированный
и вероятностный
анализ атрибутов;
● Вычисление
контрольных сумм
идентификаторов
(СНИЛС)
Компоненты решения
Хранилище карточек
Хранилище связей
карточек
WEB-сервис
Анализатор
Графический
интерфейс оператора
● Полученные данные не трансформируются.
● Связь данных с карточкой не разрывается.
Результат
● Разработан алгоритм оценки схожести карточек;
● Результат работы первой версии алгоритма:
18 млн. карточек породили 6 млн. глобальных идентификаторов.
○ 87% карточек оказались выше порога связывания
○ 10% карточек оказались ниже порога связывания
○ 3% карточек требуют ручного разбора инцидентов идентификации
● Выбран стандарт обмена данными - FHIR (новый стандарт HL7);
● Разработан сервис по обработке персональных данных пациентов;
Спасибо за внимание!

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (11)

Внедрение системы управления требованиями. Опыт пользователя
Внедрение системы управления требованиями. Опыт пользователяВнедрение системы управления требованиями. Опыт пользователя
Внедрение системы управления требованиями. Опыт пользователя
 
Особенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проектеОсобенности разработки требований в интеграционном проекте
Особенности разработки требований в интеграционном проекте
 
To requirements and beyond...
To requirements and beyond...To requirements and beyond...
To requirements and beyond...
 
Одна голова - плохо
Одна голова - плохоОдна голова - плохо
Одна голова - плохо
 
Системный аналитик в Agile команде
Системный аналитик в Agile командеСистемный аналитик в Agile команде
Системный аналитик в Agile команде
 
Как опознать аналитика?
Как опознать аналитика?Как опознать аналитика?
Как опознать аналитика?
 
Коммуникация при различной структуре мышления - таксономия против фолксономии
Коммуникация при различной структуре мышления - таксономия против фолксономииКоммуникация при различной структуре мышления - таксономия против фолксономии
Коммуникация при различной структуре мышления - таксономия против фолксономии
 
Моделирование бизнес-процессов: методы и инструменты
Моделирование бизнес-процессов: методы и инструментыМоделирование бизнес-процессов: методы и инструменты
Моделирование бизнес-процессов: методы и инструменты
 
Человек со стокгольмским синдромом
Человек со стокгольмским синдромомЧеловек со стокгольмским синдромом
Человек со стокгольмским синдромом
 
Аналитик на тёмной стороне
Аналитик на тёмной сторонеАналитик на тёмной стороне
Аналитик на тёмной стороне
 
Бизнес-аналитик в проектах по разработке ПО в обозримой перспективе
Бизнес-аналитик в проектах по разработке ПО в обозримой перспективеБизнес-аналитик в проектах по разработке ПО в обозримой перспективе
Бизнес-аналитик в проектах по разработке ПО в обозримой перспективе
 

Ähnlich wie Региональный мастер-индекс пациентов

phd thesis presentation
phd thesis presentationphd thesis presentation
phd thesis presentation
Roman Veynberg
 
Математика таргетинга. #izso2011. Лев Глейзер
Математика таргетинга. #izso2011. Лев ГлейзерМатематика таргетинга. #izso2011. Лев Глейзер
Математика таргетинга. #izso2011. Лев Глейзер
Nikolay Belousov
 
Математика таргетинга © Лев Глейзер
Математика таргетинга © Лев ГлейзерМатематика таргетинга © Лев Глейзер
Математика таргетинга © Лев Глейзер
Cossa
 
Семинар совещание 16.05.2014. Cбор и обработка данных, Захаров А.В., Фадеев К...
Семинар совещание 16.05.2014. Cбор и обработка данных, Захаров А.В., Фадеев К...Семинар совещание 16.05.2014. Cбор и обработка данных, Захаров А.В., Фадеев К...
Семинар совещание 16.05.2014. Cбор и обработка данных, Захаров А.В., Фадеев К...
Anastasia Khuraskina
 
тема 6 2
тема 6 2тема 6 2
тема 6 2
asheg
 
Персональная медицина: технологии BigData на охране здоровья (вводная лекция ...
Персональная медицина: технологии BigData на охране здоровья (вводная лекция ...Персональная медицина: технологии BigData на охране здоровья (вводная лекция ...
Персональная медицина: технологии BigData на охране здоровья (вводная лекция ...
Alexandre Prozoroff
 
Presentation at the conference
Presentation at the conferencePresentation at the conference
Presentation at the conference
Vitaly Grigoriev
 

Ähnlich wie Региональный мастер-индекс пациентов (20)

НИР "Анализ информационной деятельности территориальных органов МЧС России"
НИР "Анализ информационной деятельности территориальных органов МЧС России"НИР "Анализ информационной деятельности территориальных органов МЧС России"
НИР "Анализ информационной деятельности территориальных органов МЧС России"
 
phd thesis presentation
phd thesis presentationphd thesis presentation
phd thesis presentation
 
Математика_таргетинга
Математика_таргетингаМатематика_таргетинга
Математика_таргетинга
 
Математика таргетинга. #izso2011. Лев Глейзер
Математика таргетинга. #izso2011. Лев ГлейзерМатематика таргетинга. #izso2011. Лев Глейзер
Математика таргетинга. #izso2011. Лев Глейзер
 
Математика таргетинга © Лев Глейзер
Математика таргетинга © Лев ГлейзерМатематика таргетинга © Лев Глейзер
Математика таргетинга © Лев Глейзер
 
Deep Learning Course Introduction
Deep Learning Course IntroductionDeep Learning Course Introduction
Deep Learning Course Introduction
 
It med.conf региональный мастер-индекс пациентов
It med.conf региональный мастер-индекс пациентовIt med.conf региональный мастер-индекс пациентов
It med.conf региональный мастер-индекс пациентов
 
Семинар совещание 16.05.2014. Cбор и обработка данных, Захаров А.В., Фадеев К...
Семинар совещание 16.05.2014. Cбор и обработка данных, Захаров А.В., Фадеев К...Семинар совещание 16.05.2014. Cбор и обработка данных, Захаров А.В., Фадеев К...
Семинар совещание 16.05.2014. Cбор и обработка данных, Захаров А.В., Фадеев К...
 
Семантическая обработка медицинских данных в задачах диагностики и управления...
Семантическая обработка медицинских данных в задачах диагностики и управления...Семантическая обработка медицинских данных в задачах диагностики и управления...
Семантическая обработка медицинских данных в задачах диагностики и управления...
 
тема 6 2
тема 6 2тема 6 2
тема 6 2
 
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
 
Data Mining - lecture 5 - 2014
Data Mining - lecture 5 - 2014Data Mining - lecture 5 - 2014
Data Mining - lecture 5 - 2014
 
Targmath yandex
Targmath yandexTargmath yandex
Targmath yandex
 
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
 
Персональная медицина: технологии BigData на охране здоровья (вводная лекция ...
Персональная медицина: технологии BigData на охране здоровья (вводная лекция ...Персональная медицина: технологии BigData на охране здоровья (вводная лекция ...
Персональная медицина: технологии BigData на охране здоровья (вводная лекция ...
 
Presentation at the conference
Presentation at the conferencePresentation at the conference
Presentation at the conference
 
РАЗРАБОТКА МОДЕЛИ ЭКСПЕРТНОЙ СИСТЕМЫ НА ОСНОВЕ НЕЧЁТКОЙ ЛОГИКИ
РАЗРАБОТКА МОДЕЛИ ЭКСПЕРТНОЙ СИСТЕМЫ НА ОСНОВЕ НЕЧЁТКОЙ ЛОГИКИРАЗРАБОТКА МОДЕЛИ ЭКСПЕРТНОЙ СИСТЕМЫ НА ОСНОВЕ НЕЧЁТКОЙ ЛОГИКИ
РАЗРАБОТКА МОДЕЛИ ЭКСПЕРТНОЙ СИСТЕМЫ НА ОСНОВЕ НЕЧЁТКОЙ ЛОГИКИ
 
НСИ в Минздраве описание информационного обеспечения (1)
НСИ в Минздраве описание информационного обеспечения (1)НСИ в Минздраве описание информационного обеспечения (1)
НСИ в Минздраве описание информационного обеспечения (1)
 
Интеграция / Integration
Интеграция / IntegrationИнтеграция / Integration
Интеграция / Integration
 
Эффективность применения ЭМК(EHR) в региональных фрагментах ЕГИСЗ
Эффективность применения ЭМК(EHR) в региональных фрагментах ЕГИСЗЭффективность применения ЭМК(EHR) в региональных фрагментах ЕГИСЗ
Эффективность применения ЭМК(EHR) в региональных фрагментах ЕГИСЗ
 

Mehr von SQALab

Mehr von SQALab (20)

Готовим стажировку
Готовим стажировкуГотовим стажировку
Готовим стажировку
 
Куда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщикаКуда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщика
 
Оптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержкиОптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержки
 
Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программированияАвтоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования
 
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
 
Continuous performance testing
Continuous performance testingContinuous performance testing
Continuous performance testing
 
Конфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженКонфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нужен
 
Команда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииКоманда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихии
 
API. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовAPI. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советов
 
Добиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовДобиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестов
 
Делаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsДелаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIs
 
Вредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеВредные привычки в тест-менеджменте
Вредные привычки в тест-менеджменте
 
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииМощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
 
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеКак hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
 
Стили лидерства и тестирование
Стили лидерства и тестированиеСтили лидерства и тестирование
Стили лидерства и тестирование
 
"Давайте не будем про качество"
"Давайте не будем про качество""Давайте не будем про качество"
"Давайте не будем про качество"
 
Apache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовApache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектов
 
Тестирование геолокационных систем
Тестирование геолокационных системТестирование геолокационных систем
Тестирование геолокационных систем
 
Лидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросЛидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопрос
 
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
 

Региональный мастер-индекс пациентов

  • 2. Региональный индекс пациентов - что это? Региональный индекс пациентов… Enterprise master patient index… “is a database that is used across a healthcare organization to maintain consistent, accurate and current demographic and essential medical data on the patients seen and managed within its various departments.” … база данных, используемая медицинскими организациями для ведения полных, точных и корректных демографических и некоторых медицинских данных пациентов, доступных для просмотра и управления различными учреждениями.
  • 4. Цель и основная задача Цель: Информационное обеспечение процессов, связанных с оказанием медицинских услуг населению. Основная задача: Необходимо интегрировать медицинские и иные данные в привязке к субъекту оказания медицинской помощи - пациенту!
  • 6. Задачи ● Разработать алгоритм идентификации карточек пациентов; ● Выбрать состав, структуру и формат обмена персональными данными пациентов; ● Разработать сервис (микросервис); ● Интегрировать сервис в существующее решение.
  • 7. Проблемы идентификации ● Неоднородность данных в интегрированных системах. ● Низкое качество первичных данных. ○ Опечатки ○ Дубли ○ Повторное использование карточек ○ и т.д. ● Отсутствие достоверного и общедоступного источника мастер-данных. ● Отсутствие общепринятого идентификатора пациента. ● Сложность применяемых стандартов обмена медицинскими данными.
  • 8. Анализ предметной области ● Отечественные решения отсутствуют*; ● Зарубежные продукты ориентированы на использование Мастер- данных. ● Имеющиеся решения не поддерживают работу с отечественными идентификаторами (например, СНИЛС); ● Интерфейс взаимодействия сложен - стандарт HL7 версий 2 и 3. * В 2015 году российское подразделение InterSystems предложило свое решение для отечественного рынка.
  • 9. Статистика на начало проекта ● всего 30 млн. карточек ○ из них 18 млн. уникальных карточек ○ из них 7% повторно использованных карточек (идентификаторов)
  • 10. Обзор методов связывания Алгоритмы сравнение строк: ● Детерминированные - основаны на полном совпадении атрибутов записей; ● Вероятностные - используют предположение о наличии связи атрибутов и весовые коэффициентов для вычисления оценки связи двух записей. Оценка набранных баллов вероятностного алгоритма: ● выше порога связывания - автоматическое связывание карточек; ● ниже порога связывания - присвоение нового идентификатораразделение; ● между порогами - ручной разбор инцидента идентификации.
  • 11. Детерминированные алгоритмы Детерминировнные алгоритмы возможно применять тогда, когда в обработку передаются четко структурированные (стандартизированные ) наборы данных и имеется выверенный эталонный набор мастер-данных. Пример № Имя Пол Дата рождения Идентификатор 1 Александр Пушкин М 06.06.1799 112233 2 Михаил Лермонтов М 15.10.1814 2345 3 Лермонтов М 4 А.С. Пушкин М 112233 5 М.Ю. Лермонтов 15.10.1814
  • 12. Вероятностные алгоритмы Метрики похожести атрибутов Пример использования метрики Jaro-Winkler для определения соответствия атрибутов. Пример: Строка 1 Строка 2 Метрика Гусенко Гусенков 98% Гусенко Кузенко 81% Песков Лесков 83% Геращенко Гирасченко 86%
  • 13. Фонетическое кодирование Для оценки схожести звучания строк применяется фонетическое кодирование. Пример применения алгоритма Daitch-Mokotoff. Строка Фонетический код Геращенко 594650 Гирасченко 594650 Песков 745700 Лесков 845700 Гусенко 546500 Кузенко 546500 Гусенков 546570
  • 14. Вероятностные алгоритмы Весовые коэффициенты Пример Гусенко Александр Гусенков Александр 98% * 3 + 0 + 100% * 2 = 4,94 Гусенко Александр Кусенко Александр 81% * 3 + 1+ 100% * 2 = 5,43 Гусенко Александр Кусенко А 81% * 3 + 1 + 0 * 2 = 3,43
  • 15. Алгоритм идентификации Подбор карточек- кандидатов Вероятностный анализ имен Смешанный анализ атрибутов карточек Оценка набранных баллов ● Фонетическое кодирование; ● Вероятностный анализ. ● Детерминированный и вероятностный анализ атрибутов; ● Вычисление контрольных сумм идентификаторов (СНИЛС)
  • 16. Компоненты решения Хранилище карточек Хранилище связей карточек WEB-сервис Анализатор Графический интерфейс оператора ● Полученные данные не трансформируются. ● Связь данных с карточкой не разрывается.
  • 17. Результат ● Разработан алгоритм оценки схожести карточек; ● Результат работы первой версии алгоритма: 18 млн. карточек породили 6 млн. глобальных идентификаторов. ○ 87% карточек оказались выше порога связывания ○ 10% карточек оказались ниже порога связывания ○ 3% карточек требуют ручного разбора инцидентов идентификации ● Выбран стандарт обмена данными - FHIR (новый стандарт HL7); ● Разработан сервис по обработке персональных данных пациентов;

Hinweis der Redaktion

  1. региональный индекс пациентов- это БД, содержащая реестр (список, перечень) всех пациентов региона. is a database that is used across a healthcare organization to maintain consistent, accurate and current demographic and essential medical data on the patients seen and managed within its various departments. https://en.wikipedia.org/wiki/Enterprise_master_patient_index
  2. Тут показать исходные данные
  3. http://asecuritysite.com/forensics/simstring
  4. что обрабатывает фонетический подбор - только фамилию или все вместе (ФИО)?
  5. Нужен результат обработки карточек алгоритмом