Big data на страже здоровья: как и зачем медицинские организации собирают и хранят данные

22.09.2018 Цифровизация медицины — перспективное направление, которое не только унифицирует работу клиник или лабораторий, но и может спасти человеческие жизни. Обработка и хранение big data позволяют делать постановку диагнозов точнее, проверять медицинские данные без нагрузки на врачей, а также интегрировать результаты исследований, выполненных на разных устройствах в общую систему. Директор по инновациям мобильной клиники DOC+ Илья Ларченко специально для «Хайтека» подготовил обзор развития MedTech, стандартов хранения и обмена медицинской информации и способов автоматизации услуг в здравоохранении.

Ощутимая польза

Работа с big data становится обыденностью, причем не только для крупного бизнеса. В 2017 году 39% респондентов исследования Tech Pro Research подтвердили, что в их организациях принято извлекать коммерчески значимые инсайты из больших данных для улучшения продуктов, совершенствования процессов и выявления запросов потребителей.

Главное, польза от big data осязаема и поддается измерению. К примеру, American Express методами предиктивной аналитики удалось выявить в своем австралийском подразделении 24% счетов, владельцы которых с высокой степенью вероятности закрыли бы их в ближайшие четыре месяца. С такой форой у бизнеса возникает возможность заранее придумать, как удержать клиентов. Однако без системного сбора и хранения информации, на основе которой предстоит делать выводы, затея теряет смысл.

Сказанное в полной мере относится к организациям в сфере здравоохранения: больницам, клиникам, медицинским центрам. С той разницей, что от того, насколько грамотно в них налажено управление информационными массивами, зависит не только эффективность учреждения, но и здоровье и благополучие людей.

Медицина не хуже остальных сфер человеческой деятельности поддается цифровизации. Причем в случае со здравоохранением уместно говорить о самой настоящей, полновесной во всех отношениях big data. Одна только здравоохранительная система США к 2013 году накопила данных приблизительно на 153 ЭБ. А динамика прироста предвещает, что к 2020 году их будет в 15 раз больше. Впору задуматься, откуда столько информации, зачем она нужна и что с ней делать.

«Мощный сервер в белой комнате»

Медицинские учреждения аккумулируют огромные объемы информации, причем самой разной. В их ИТ-инфраструктуре учету подлежат не только простейшие сведения в текстовом формате, например данные, которые собирают в регистратуре, но и:

- томографические или рентгеноскопические снимки (вплоть до 3D-реконструкций);
- показания биопсии;
- результаты клинических анализов;
- медицинские назначения, включая выписанные препараты;
- биометрические данные с носимых пациентами устройств и так далее.

Данных — огромное количество, поступают они из десятков источников, «завернуты» во множество форматов (не всегда совместимых между собой) и в массе своей никак не упорядочены. Ситуация осложняется тем, что даже развитые рынки, где система здравоохранения компьютеризируется с 1980-х и индустрия MedTech вышла из младенчества, страдают от «лоскутной цифровизации».

Впрочем, за последние годы пул решений по работе с медданными стал гораздо менее фрагментированным. В частности, появились пусть не универсальные и не обязательные к соблюдению, но популярные отраслевые стандарты. Появляются лучшие практики, выведенные за время перевода здравоохранения на digital-рельсы.

Можно представить себе некую «эталонную клинику», применяющую трендовые технологии по обмену медицинскими данными и их хранению.

В этом образцово-показательном учреждении сведения о пациенте и история его лечения заносятся в реестр ЭМК (электронных медицинских карт). Потоки данных из разнородных информационных систем, включая ранее упомянутые ЭМК, вливаются в так называемую HIS (Hospital Information System), то есть программный комплекс, где и осуществляется централизованное управление ими. Туда попадают не только врачебные заключения и истории болезней, но и сведения медстраховки, — все, что сопутствует обследованиям и лечению. Софт класса HIS выпускают и форсированно продвигают многочисленные вендоры, и среди них — гиганты вроде Cerner, McKesson и Siemens.

В идеальном случае — по состоянию на 2018 год — все информационные системы внутри клиники взаимодействуют между собой на базе выбранного стандарта структурирования медицинской информации в электронных форматах и обмена ею, например, HL7. Сегодня он наиболее широко распространен в мире, однако есть и другие, в том числе ASTM. Впрочем, организации-разработчики HL7 и ASTM не первый год прилагают недюжинные усилия к тому, чтобы их «подружить».

Большая часть профессионального оборудования, с помощью которого проводятся клинические исследования, поддерживает стандарт DICOM. Он регламентирует принципы, в соответствии с которыми генерируется, передается, архивируется и хранится диагностическая мединформация — в первую очередь визуальная: рентгенография, флюорография, эндоскопия.

Стандарт был создан ради того, чтобы избежать возникновения зависимости от производителей аппаратуры, которые изобретали собственные виды представления данных. Благодаря DICOM-интерфейсам удается предотвратить проблему «Вавилонской башни» и обеспечить единообразие в «упаковке» цифровых медицинских изображений внутри больничной сети, где чаще всего со временем образуется «зоопарк» техники. Эта коммуникационная надстройка чрезвычайно важна для отрасли: чем дальше, тем больше медоборудования поддерживает форматы компьютерного кодирования графики. Однако и этот стандарт не является единственным: например, в Германии используется свой протокол обмена данными между медицинской аппаратурой — GDT.

Для «складирования» больших объемов медицинских данных используются разного рода накопители, например, NAS (Network Attached Storage). А объемы у современных медицинских данных и правда большие: одна томограмма может занимать несколько сотен мегабайт. Выпускаются в том числе специализированные хранилища повышенной надежности под нужды медицинских ИТ-систем. К таким хранилищам предъявляются повышенные требования: в США, например, это соответствие положениям «Закон об ответственности и переносе данных о страховании здоровья граждан». Надо заметить, интеграция NAS — лишь один из нескольких вариантов хранения медицинских данных в клиниках.

Где дает сбои информационный метаболизм

Как утверждали аналитики McKinsey пять лет назад, несмотря на бурное развитие медицинских технологий, сфера здравоохранения существенно отставала от других отраслей с точки зрения прикладного применения big data. Не в последнюю очередь — в связи с тем, что в среднем врачи по-прежнему предпочитают полагаться на свой профессиональный опыт и не склонны доверять выводам, сделанным с помощью одних лишь инструментов data mining, без «человеческой оптики».

Тем не менее, подвижки в сторону ускорения цифровизации медицины в нашей стране есть. А значит — есть перспективы по более активному использованию больших данных в медицине. Так, в 2016 году в РФ был сформирован ГОСТ Р 52636-2006, который определяет параметры электронной медицинской карты. Ну а в 2020–2025 годах Минздрав в сотрудничестве с Ростехом собирается обеспечить масштабное внедрение Единой государственной информационной системы в здравоохранении (ЕГИСЗ), предназначенной, в частности, для «развития систем электронного медицинского документооборота и внедрения единых стандартов информационного обмена в этой сфере».

Цена ошибки — жизнь человека

Показательно, что даже встраивание отдельных элементов data-friendly ИТ-инфраструктуры в работу клиники или больницы заметно поднимает уровень медицинских услуг. В частности, само по себе внедрение электронных медицинских карт существенно снижает вероятность врачебной ошибки. Не говоря уже о том, какую пользу можно извлечь из грамотной целенаправленной работы с медицинскими данными.

Если данные в медицинской системе агрегируются системно, построить на таком фундаменте медицину будущего гораздо легче и быстрее. Одним из обязательных факторов такого развития — является система автоматической проверки электронных медкарт. Традиционно в медицинских учреждениях принято проверять точность и корректность заполнения медкарт. Раньше единственным вариантом решить эту задачу был аудит медицинских документов с привлечением врачей-экспертов: они изучали собранный анамнез, правильность постановки диагноза, результаты осмотров и оценивали работу своего коллеги в баллах.

Когда 100% медицинских карт, заполненных врачами, предварительно проверяет система, врачам-экспертам отправляются только «подозрительные» по мнению системы медкарты. Это позволяет вылавливать 60–70% всех ошибок, проверяя только 20% карт.

Естественно, медицина — та область, где цена ошибки невероятно высока, а участие профессионала «алгоритмизируется» пока отнюдь не во всех операциях. Возможно, ее ближайшее будущее — за гибридными, человеко-машинными системами. Тому есть убедительные доказательства. В частности, совместное исследование Гарвардской медицинской школы, Медицинского центра Beth Israel Deaconess в Бостоне и Массачусетского технологического института показало, что при диагностике метастатического рака молочной железы нейросеть допускает ошибки в среднем в 7,5% случаев, человек (онколог) — в 3,5% случаев, зато при их совместной работе величина злосчастной метрики падает до 0,5%.

В Калифорнийском университете в Дейвисе изобрели метод, который за счет оперативного анализа записей из электронных медкарт выявляет пациентов с риском развития сепсиса, способного привести к гибели больного. Разумеется, для таких изысканий необходимо, чтобы записи о состоянии госпитализированных были детальными, хорошо структурированными, унифицированными и доступными как врачам, так и инженерам по работе с данными.

Использование современных инструментов для управления данными способно оказывать комплексное положительное воздействие на деятельность медицинских учреждений. С помощью аналитической платформы Power BI Университетский госпиталь Осло ощутимо улучшил свою работу сразу на нескольких уровнях.

Система ускорила сбор информации в процессе исследований, позволила сотрудникам организации эффективнее анализировать данные, более точно ставить диагнозы, а в конечном счете дала возможность сократить бюджет на ИТ-инфраструктуру и пустить освободившиеся средства на целевые, приоритетные задачи госпиталя.

Инновации в data science могут не только помочь больным, но и избавить квалифицированных врачей от изрядной части рутины. Преимущества такого подхода к оптимизации процессов в клинической практике демонстрируют чат-боты. Так, к примеру, виртуальный помощник DOC+ за счет технологий машинного обучения умеет собирать первичный анамнез пациента за одну-три минуты в ходе непринужденного диалога. Конечно, затем эстафету у него перенимает врач-эксперт. Многие клиники используют чат-боты для первичного анамнеза прямо в клиниках, таким образом облегчая работу врачей в приемном покое.

В сфере цифровой медицины, в том числе в клиниках и исследовательских центрах мирового уровня, до сих пор много пробелов и «сумеречных зон». Но практика показывает: технологизация даже тех процессов, которые на первый взгляд ей не поддаются, а также выстраивание целостной системы сбора и обмена информацией уже сегодня помогают нащупать точки роста, которые определят, каким будет здравоохранение в обозримом будущем.




Назад