Непосредственным поводом для последующих заметок явился вебинар «Инструменты искусственного интеллекта в охране труда», организованный Клинским институтом охраны и условий труда [1]. Вебинар провёл генеральный директор КИОУТ О. А. Косырев. Он доложил об основных принципах работы искусственного интеллекта (далее — ИИ) в сфере организации охраны труда на производстве. Использование ИИ может помочь обнару- жить потенциальные опасности, уменьшить количество человеческих ошибок и в целом повысить безопасность труда сотрудников. Внедрение ИИ в управление охраной труда и безопасностью даёт возможность специалистам принимать более обоснованные решения, улучшать коммуникацию по вопросам безопасности сотрудников.
Кроме решения этих организационных задач, ИИ можно использовать для прогнозирования потенциальных рисков для здоровья, повышения эффективности процессов управления здоровьем. Так, основанные на ИИ предиктивные аналитические системы могут выявлять закономерности и тренды в данных о здоровье сотрудников, обеспечивая раннюю диагностику потенциальных проблем. Такой превентивный подход поможет существенно снизить заболеваемость и улучшить общее здоровье сотрудников. Здесь мы попадаем в область медицины труда, где использование ИИ не столь обеспечено, как в организационной области, — это обусловлено общими факторами:
- увеличением количества и повышением качества медицинской информации из-за обновления диагностической аппаратуры;
- ростом скорости и плотности информационных обменов как между отдельными исследовательскими группами, так и между медиками теоретического и практического профиля.
Рост объёма медицинской информации (в мире издаётся до 40 000 биомедицинских журналов, публикующих около 2 млн статей ежегодно [2]) привёл к смене представлений об этиологии, патогенезе и структуре отдельных видов заболеваний (или отдельных нозологических форм). Оказывается, наличие всего лишь одного заболевания у пациента, особенно пожилого возраста с большим стажем работы, сегодня редкое явление. Как правило, можно встретить сочетание двух и более нозологических единиц у одного пациента одновременно. В конце прошлого века это явление (и соответствующий раздел медицины) получило название «полиморбидность». Его распространённость позволила ряду авторов говорить об эпохе «полиморбидной медицины» [3].
Полиморбидными являются более 50% пациентов с хроническими заболеваниями. В систематическом обзоре [2] утверждается, что распространённость полиморбидности варьируется от 13 до 95% в зависимости от изучаемой популяции и способа сбора и регистрации данных о заболеваемости. Понимание этого требует интегральных оценок состояния больного, однако современные тенденции узкой специализации в медицине (в том числе в медицине труда) привели к тому, что врачи консультируют больного об отдельных органах и системах.
Для определённости будем ниже под полиморбидностью понимать наличие двух и более заболеваний (произвольной этиологии) у одного пациента. Полиморбидность будем подразделять на мультиморбидность — наличие множественных заболеваний, не связанных между собой доказанными па- тогенетическими механизмами либо рассматриваемых без учёта патогенеза вовсе [4, 5], и на коморбидность — сочетание заболеваний, связанных доказанными едиными патогенетическими механизмами.
Единой общепринятой классификации коморбидности не существует. В литературе встречаются данные о формировании устойчивых сочетаний (кластеров) некоторых хронических заболеваний [6]. Проблема коморбидности как результата объективного взаимодействия ведущих клинических факторов различных заболеваний обусловливает появление новых клинических симптомов и синдромов. На сегодняшний день бытует характеристика коморбидности как «феноменологического бульона» [7] или симптомокомплекса — совершенно новой нозологической единицы [8].
Причины возникновения сочетанной патологии, а также факторы, влияющие на её развитие и прогрессирование,
разобраны детально, также обсуждаются варианты классификации коморбидности. Был предложен ряд правил формулировки клинического диагноза при коморбидности, которые должны соблюдаться практикующим врачом. Основным из них является выделение в структуре диагноза основного и фоновых заболеваний, а также их осложнений и сопутствующей патологии. Утверждается, что если больной страдает многими болезнями, то одна из них — основная.
Основным было предложено считать заболевание, послужившее причиной обращения за медицинской помощью. Это та нозологическая форма, которая сама или вследствие осложнений вызывает первоочередную необходимость лечения в связи с наибольшей угрозой жизни и трудоспособности. Основное заболевание само по себе или из-за осложнений может быть причиной летального исхода.
Недостаток такого подхода — его разрыв с физиологией. Принимаются во внимание в основном социологические характеристики заболевания. Как один из результатов — по мере обследования выстраиваемая нозологическая структура полиморбидного заболевания может измениться, основным может стать диагноз наименее благоприятного (прогностически) заболевания; при этом прочие болезни рассматриваются как сопутствующие.
Другой аспект роста потока медицинской информации: в наше время организации по всему миру собрали чрезвычайно много данных, а благодаря интернету эти данные объединяются, и их суммарный объём превосходит возможности традиционных средств работы с такой информацией. Иными словами, сколько-нибудь полноценный анализ медицинских данных, которые характеризуются большим объёмом, высокой скоростью поступления и разнообразием, вызывает ряд проблем.
Появился такой термин, как «большие данные» (далее — BD). Их обработка требует больших вычислительных ресурсов, специальных алгоритмов и программного обеспечения. Для действий с ними разработаны совершенно новые методы. Облачные вычисления позволяют хранить и обрабатывать информацию на удалённых серверах. Разработаны специальные способы доступа и использования информации.Для BD можно определить, по крайней мере, три глобальные задачи.
- Строить модели. Систематизировать данные и находить причинно-следственные связи. Всё это помогает понять, как работают сложные системы, делает их прозрачными.
- Оптимизировать процессы. Автоматизировать рутинные и наиболее трудозатратные этапы, повышать точность расчётов и значительно экономить ресурсы. Например, медицинские сервисы позволяют автоматически рассчитывать стоимость лечения.
- Делать прогнозы. С помощью аналитики прогнозируется поведение пациентов и возможный спрос на медицинские услуги, планируются их объёмы. ИИ может способствовать более эффективному выявлению болезней на ранней стадии и оценивать ход лечения.
BD представляют собой сложную и многомерную структуру, которую не всегда легко интерпретировать и анализировать. Как работать с ней без потери нужной информации, находить существенные признаки и свойства, классифицировать и группировать данные по определённым критериям?
Любые данные — это выраженные в разной форме сырые факты, которые сами по себе не несут пользы до тех пор, пока не поставлены в контекст, должным образом не организованы и не упорядочены в процессе обработки.
Данные — это неорганизованные факты, которые следует превращать в информацию. Информация появляется в результате анализа обработанных данных, и этот анализ придаёт данным смысл, обеспечивая им потребительские качества.
До последнего времени представления об обработке данных сводились к органичному кругу алгоритмических, логических или статистических операций над относительно небольшими объёмами данных. Однако по мере сближения компьютерных технологий с реальным миром возросла потребность преобразовывать данные из реального мира в информацию о реальном мире, и обрабатываемых данных становится больше, а требования к скорости обработки возрастают. В основе современных методов интеллектуального анализа данных лежат такие концептуальные направления, как математическая статистика, машинное обучение и искусственный интеллект.
Аналитическая деятельность по определению условий труда как причин и факторов риска профессионально обусловленных заболеваний (далее — ПОЗ), которые возникают в результате воздействия на организм вредных производственных факторов (далее — ВПФ), составляет содержание эпидемиологии ПОЗ (профэпидемиологии). Все предположения в этой области спекулятивны, пока не найдено рациональных методов, которые можно было бы использовать для количественной реконструкции ситуации с ПОЗ в трудовых коллективах.
Здесь недостаточно описательных заключений — нужны доказательства и количественные характеристики причинно-следственной связи между заболеванием и воздействием ВПФ. Эти требования вносят в профэпидемиологию элементы доказательной медицины (далее — ДМ), понимаемой как интеграция лучших научных доказательств и клинических знаний при диагностике и лечении заболеваний [9].
Требования, которые предъявляются к работе ИИ в области медицины коморбидных патологий, подразумевают добросовестное, точное и осмысленное использование лучших результатов клинических исследований для выбора путей лечения конкретного пациента. Растущая потребность в критической оценке медицинской информации с целью установления её надёжности и достоверности привела к необходимости принятия концепций ДМ.
ДМ — это раздел медицины, основанный на доказательствах, предполагающий поиск, сравнение, обобщение и широкое распространение полученных доказательств для использования в интересах больных [10]. Предложенная ещё в начале 1990-х гг. концепция ДМ подразумевает критическую оценку медицинской информации с целью установления её надёжности и достоверности. Для этого ДМ должна опираться на рациональные (количественные) клинические данные, прошедшие проверку в ходе крупных рандомизированных испытаний. И несмо тря на то что все эти постулаты были осознаны медицинской общественностью гораздо раньше, лишь при современном информационно-техническом уровне стали возможны широкий сбор достоверных данных о различных клинических исследованиях, их обобщение и использование врачами-практиками.
Для того чтобы упростить весьма сложный и противоречивый процесс включения концепций ДМ в алгоритм работы искусственного интеллекта, его можно подразделить на следующие этапы:
- определение этиологии заболевания по признакам его распространения и развития в результате наблюдений населения (различных популяций) с помощью клинических наблюдений и лабораторных исследований;
- формулирование теорий, описывающих, как протекает здоровый жизненный цикл и происходит возникновение и развитие заболевания;
- выделение из теории возможного «зерна» ради модернизации клинической практики с целью предотвращения, замедления или обратного развития заболевания (процесса деградации). Затем следует разработать виды «вмешательства» для достижения этой цели;
- внедрение мер «вмешательства» либо в сферу общественного здравоохранения, либо в клиническую практику с оценкой как терапевтического, так и ятрогенного эффекта этих мер в сравнении с уже существующими на сегодня стандартными методами лечения, или плацебо, или невмешательством.
Непосредственному применению логики и методов ДМ в эпидемиологических исследованиях коморбидной патологии препятствует явно устаревший подход к организации медицинских исследований. Здесь нельзя не отметить, однако, что ситуация с внедрением концепций ДМ в науку и практику российского здравоохранения, в том числе в области медицины коморбидных патологий, меняется очень медленно.
Искусственный интеллект — это общий термин для различных стратегий и методов обработки больших объёмов статистических данных и выявления паттернов данных. Существенная часть подготовки ИИ к работе — машинное обучение. Это методика разработки алгоритмов и статистических моделей, которые используются программами ИИ для выполнения сложных задач без наличия чётких инструкций. Алгоритмы машинного обучения полагаются на закономерности и выводы.
Проще говоря, на входе — сырые данные, а на выходе — полезная информация. Однако связь между этими двумя сущностями чрезвычайно сложна. ИИ — это комплекс методик математики, биологии, психологии, кибернетики и других наук, с помощью которого создаются технологии для написания интеллектуальных программ и обучения компьютеров самостоятельному решению интеллектуальных задач. Фактически ИИ — это группа задач, предполагающих использование баз знаний и правил для создания экспертных систем и систем знаний. Результирующий продукт — это системы, которые могут принимать (или соучаствовать в принятии) решения, а также разрешать проблемы в конкретных областях. К ним можно отнести, например, системы диагностики и поддержки принятия решений. Один из основных компонентов в процессе создания ИИ — это машинное обучение, в котором можно выделить две задачи:
- сбор и подготовка обучающих данных;
- выбор уже существующей стратегии или модели машинного обучения, например линейной регрессии или дерева решений.
В процессе машинного обучения ИИ создаются базы знаний, для чего используются комплексы сопряжённых данных «вход — выход». Эти данные определяют реальные причинно-следственные отношения, они должны удовлетворять установленным требованиям, главные из которых — рациональное описание входных и выходных (медицинских) данных, а также доказательность выводов. Материал для обучения ИИ должен представлять собой логически связанный контент, а не субъективно скомпилированную сумму слов, в изобилии появляющихся в сфере сочинений на темы медицины.
Вместо явного программирования машинное обучение использует специальные алгоритмы для анализа больших объёмов данных, извлечения уроков из полученных знаний и принятия аргументированных решений. Иначе говоря, это то, что ИИ узнаёт в результате работы с обучающими данными. Чем точнее эти данные и чем их больше, тем лучше будет работать ИИ.
Машинное обучение — это процесс разработки алгоритмов и статистических моделей, которые компьютерные системы формируют, запоминают и используют впоследствии для выполнения сложных задач без чётких инструкций, полагаясь на закономерности и выводы. Компьютерные системы применяют алгоритмы машинного обучения для обработки весомых объёмов статистических данных и выявления шаблонов данных. Хотя машинное обучение — это ИИ, далеко не все действия ИИ можно назвать машинным обучением.
Сам по себе процесс машинного обучения — довольно сложная математическая задача, решение которой включает следующие разделы математики: функциональный анализ, формальная логика, теория множеств, математический анализ, линейная алгебра, теория информации, кибернетика, теория вероятностей и математическая статистика. Специалисты по работе с данными выбирают данные и вводят их в модель обучения, при этом постоянно уточняется набор данных с их обновлением и проверкой ошибок. Именно качеством и разнообразием данных определяется точность модели машинного обучения.
Решения в области машинного обучения требуют набора из нескольких сотен входных данных для обучения, как и достаточной вычислительной мощности. В зависимости от приложения и сценариев использования может быть достаточно одного сервера или небольшого кластера серверов. Но другие интеллектуальные системы могут предъявлять более высокие требования к инфраструктуре, зависящие от задачи, которую необходимо выполнить, и используемой методологии вычислительного анализа. Для некоторых вариантов высокопроизводительных вычислений с BD (см. выше п. 2) и достижения весьма сложных целей необходима совместная работа нескольких тысяч машин.
При подготовке обучающих ИИ наборов данных целесообразно учитывать, что они должны моделировать реальную работу ИИ — содержать входные наборы данных и соответствующие им выходные результаты анализа входных данных. Эмпирически подобранные наборы представляют собой хорошо известные в эпидемиологии зависимости «доза — эффект» для вредных внешних факторов. Они кодируют причинно-следственные рассуждения и знания в предметной области (в той же клинической или биологической) и при выполнении соответствующих требований ими обеспечивается добросовестное, точное и осмысленное приложение оптимальных результатов клинических исследований для выбора путей лечения конкретного пациента с мультиморбидной патологией (основы такого подхода изложены в книге [11]).
Определение «дозы» представляет самостоятельную (не медицинскую) проблему, а «эффект» предлагается описывать биометрическими функциями, отражающими скорость развития заболеваний. В рамках такого подхода доза определяет зависимость параметров (и, как следствие, поведение) биометрических функций от уровня и времени воздействия вредных внешних факторов.
В книге [11] рассмотрено несколько видов вредных
производственных факторов: тяжесть труда, производственный шум, аэрозоли и пыль, опасность травмирования. Для них указаны параметры биометрических функций и их величины в зависимости от уровней вредных производственных факторов. Биометрические функции можно использовать для исчисления эпидемиологического риска ПОЗ и размера финансово-экономического ущерба предприятия от уровня заболеваемости работников. Аналогичные алгоритмы применимы и для оценки воздействия экологических факторов, возрастных изменений, явлений инициирования одних заболеваний другими.
Только алгоритмы, кодирующие причинно-следственные рассуждения и знания в предметной области (например, клинической и биологической), оказываются преобразующими. В книге [11] изложены начала гигиены, основанной на зависимости «доза — эффект» для вредных внешних факторов. Рассматриваемые как принципы идеологии совершенствования систем здравоохранения, управления качеством медицинской помощи, согласования интересов конкретного больного и общества, они полностью укладываются в концепцию доказательной медицины. Тем самым требования ДМ к переменным в зависимости «доза — эффект» определяют и качество данных для обучения ИИ.
Для решения новых проблем в области патологии ПОЗ нужны новые методы анализа материала, которых раньше не требовалось. Всё дело в том, что ПОЗ представляет собой элемент в комплексе процессов жизнедеятельности организма. Сложность этого комплекса определяет необходимость использования методов статистического анализа для его исследования. Важное место здесь занимает сводка единичных факторов, образующих совокупность BD наблюдения. Статистически значимое количество единичных данных об отдельных объектах наблюдения образует комплекс статистических результатов. На этом этапе проявляются как общие черты, так и закономерности исследуемых явлений [12].
Одна из основных особенностей такого подхода — это группировка объектов BD. Обычно (в частности, в эпидемиологии) статистические результаты натурного исследования группируются в таблицы сопряжённости (далее — ТС), которые являются наиболее наглядным универсальным средством изучения стохастических связей [13]. Поэтому имеет смысл вернуться к причинно-следственной проблеме, которая возникает, когда одно заболевание «инициирует» другое.
Известен ряд статистических методов определения значимости причинно-след- ственных связей между различными компонентами ТС. Например, оценка силы ассоциации критериями χ2, Yule´s Q и др. [14, 15].
Значимость не указывает на направление причинно-следственной зависимости. И тем не менее причинность весьма важна в эпидемиологии. Основной метод эпидемиологии заключается в наблюдении и количественной оценке ассоциаций [16].
При оценках причинности нередко обращаются к критериям Бредфорда Хилла, однако их ценность неоднократно подвергалась сомнению. В некоторых работах указывается, что наблюдать причинно-следственные связи напрямую невозможно [17], но это не так, и ниже будет показано, как же на самом деле. Информация из ТС содержит прямое указание на направление и уровень причинно-следственных зависимостей в изучаемой системе ВПФ — ПОЗ. Но, чтобы извлечь это указание, требуются методики анализа сложных (вероятностных) ситуаций. Такая возможность предоставляется вероятностной логикой Т. Байеса для оценки убеждений [18].
Принципы рациональной систематизации комплекса полиморбидных патологий основаны на выявлении причинно-следственных отношений между отдельными нозологиями. И поскольку в общем случае причина здесь лишь частично ответственна за результат, а последний лишь частично зависит от отдельной причины, то множественность причин обусловливает случайность результата и для анализа ситуации следует использовать вероятностную логику Т. Байеса [19].
Байесовская интерпретация вероятности выглядит несколько мистически: теорема Байеса показывает, как уровень доверия к оценке вероятности некоторого события может кардинально измениться вследствие получения результатов иных событий. В частности, уточнить ответы на вероятностные вопросы о состоянии подмножества переменных можно, наблюдая за другими переменными (переменные-свидетельства). Процесс вычисления апостериорного распределения переменных по переменным-свидетельствам называют вероятностным выводом.
На самом деле логика байесовского вывода может быть сформулирована достаточно просто и наглядно — это оценка изменения условной вероятности события в зависимости от того, при каких условиях она определяется. Первоначальная (априорная) оценка вероятности, сделанная для контрольных условий без выделения случаев влияния ВПФ, меняется на более специфическую (апостериорную) вероятность для условий определённого влияния ВПФ.
Следующий шаг — инверсия результата: вынесение суждения об уровне внутренней связи событий по относительной вероятности их проявления в выбранных условиях. Именно в этот момент мы можем утверждать, что теорема Байеса связывает воедино доверие к
предположению до и после принятия во внимание новых доказательств.
Предложенная логика использовалась в работе [19] для рациональной диагностики причин ПОЗ. Подробно описан алгоритм, подразумевающий специальную технологию сбора, анализа и представления данных эпидемиологических исследований. Показано, что оценки силы вероятностной связи ПОЗ с ВПФ, основанные на коэффициенте Yule´s Q и статистике Фишера χ2, приводят к тем же качественным выводам, что и анализ Т. Байесом апостериорной вероятности, однако последний позволяет наглядно проследить логику возникновения ситуации и даёт количественную меру воздействия ВПФ, то есть достоверно диагностировать заболевание в качестве профессионально обусловленного.
Анализ причинно-следственных отношений ясно указывает на ВПФ как причину ПОЗ. Это обстоятельство было очевидно заранее, поэтому результат следует рассматривать как подтверждение адекватности алгоритма. Помимо конкретных результатов, предлагаемые методы анализа, основанные на расширении логики Т. Байеса, дают новые возможности рациональной (количественной) характеристики ситуации с ПОЗ в рабочем коллективе [19].
Рост качества и объёмов медицинской информации приводит к развитию интегрированного подхода к проблемам пациентов с коморбидностью и способствует углублённому пониманию проблем специалистами в области общественного здравоохранения и клиническими работниками. Одновременно уверенный рост объёмов медицинской информации в мире и скорости её накопления приводит к необходимости использования ИИ для управления охраной труда в промышленности.
Частью работы по разработке искусственного интеллекта является подготовка комплекса обучающих данных, моделирующего реальные зависимости «доза — эффект» в области медицины труда. Результаты исследований в данной области позволяют более точно определять параметры требуемой медицинской помощи, а также оценивать прогностически значимые параметры развития неотложных состояний у работников, подвергающихся действию вредных производственных факторов.
- Косырев О. А. Искусственный интеллект и развитие охраны труда: введение в ИИ и от теории к практике. — URL: https://www.youtube.com/watch?v=HjU4q2_ywP0
- Oxman A. D., Guyatt G. H., Guidelines for reading literature reviews. Canadian Medical Association Journal 1988 (v. 138): p. 697–703.
- Тарловская Е. И. Коморбидность и полиморбидность — современная трактовка и насущные задачи, стоящие перед терапевтическим сообществом // Кардиология. — 2018. — № 58 (S9). — С. 29–38. — DOI: 10.18087/cardio.2562
- Лазебник Л. Б. Старение и полиморбидность // Consilium Medicum. — 2005. — Т. 7. — № 12. — С. 1−7.
- Верткин А. Л., Скотников А. С. Коморбидность // Лечащий врач. — 2013. — № 6. — С. 66–68.
- Laux G. et al. Co — and multimorbidity patterns in primary care based on episodes of care: results from the German CONTENT project // British Medical Journal Health Services Research. — 2008. Vol. 8, № 14. — URL: http://www.biomedcentral.com/1472-6963/8/14
- Гасанов Р. Ф. Коморбидность синдрома нарушения внимания как результат диагностической неопределённости // Обозрение психиат- рии и медицинской психологии им. В. М. Бехтерева. — 2007. — № 4. — С. 1−6.
- Белялов Ф. И. Лечение внутренних болезней в условиях коморбидно- сти: монография. — Иркутск: РИОИГИУВа, 2012. — 285 с.
- Федорович Г. В. Рациональная эпидемиология профессиональных заболеваний (модели и методы). — Saarbrűcken, Deutschland: Palmarium Academic Publishing, 2014: Р. 343. ISBN-13: 978-3-639-82722-4. — URL: https://www.morebooks.shop/shop-ui/shop/ product/9783639827224; http://elibrary.ru/item.asp?id=23256439
- Guyatt G. H., Sackett D. L., Cook D. J. Users´ guides to the medical literature. Evidence-Based Medicine Working Group. JAMA. 1993 Dec 1; 270 (21): 2598 — 601. DOI: 10.1001/jama.270.21.2598. PMID: 8230645
- Федорович Г. В. Зависимость «доза — эффект» в гигиене труда (риск- ориентированный подход). — Saarbrűcken, Deutschland: Palmarium Academic Publishing, ISBN-13: 978-620-2-38060-7. 2017:201. — URL: http://www.palmarium-publishing.ru/; https://www.morebooks. shop/store/gb/book/
- Ломовской Р. А. Статистический анализ данных: методы и приложения в научных исследованиях // Актуальные исследования. — 2023. — № 15 (145). — С. 29–34. — URL: https://apni.ru/article/6013- statisticheskij-analiz-dannikh-metodi-i-prilo
- Аптон Г. Анализ таблиц сопряжённости. — Москва: Финансы и статис- тика, 1982. — 143 с.
- Youden W. J. Index for rating diagnostic tests // Cancer, Vol. 3, № 1, 1950, pp. 32–35.
- Yule G. On the Methods of Measuring Association Between Two Attribu tes // Journal of the Royal Statistical Society, Vol. 75, № 6, 1912, pp. 579–652.
- Савилов Е. Д. Причинность в эпидемиологии / Савилов Е. Д., Астафьев В. А., Анганова Е. В., Кичигина Е. Л., Жданова С. Н. — Ир- кутск: РИО ГБОУ ДПО ИГМАПО, 2015. — 36 с.
- Joffe M., Gambhir M., Chadeau-Hyam M. et al. Causal diagrams in systems epidemiology // Emergig Themes in Epidemiology, Vol. 9, № 1, 2012. DOI: 10.1186/1742-7622-9-1
- Хей Дж. Введение в методы байесовского статистического вывода. — Москва: Финансы и статистика, 1987. — 336 с.
- Федорович Г. В. Теорема Т. Байеса в профэпидемиологии // Безопас- ность и охрана труда. — 2023. — № 2. — С. 5–9. — DOI: 10.54904/52952_2023_2_5_9