Структура данных для статистического анализа
профессионального риска.

Г.В.Федорович,
ООО «НТМ-Защита», г. Москва

1.Введение

Непосредственным поводом для настоящей работы стал опубликованный Министерством здравоохранения и социального развития РФ приказ № 125 «Об утверждении комплекса мероприятий, направленных на сохранение здоровья работников на производстве, на 2012 - 2015 годы». Одним из первых в этом комплексе мероприятий является создание информационной системы АС «Профессиональные риски», объединяющей на общероссийском уровне базы данных о состоянии условий труда и профессиональных рисках. На платформе АС предполагается сформировать систему прогноза производственного травматизма и профессиональной заболеваемости. Возможность такого прогноза, вообще говоря, определяется тем, насколько адекватно будет структурирована исходная информация, заносимая в АС «Профессиональные риски».

Изучение профессиональных рисков актуально, в первую очередь - в связи со становлением страховых механизмов обязательного социального страхования от несчастных случаев на производстве и профессиональных заболеваний. Становление и эффективное функционирование таких страховых механизмов предполагает решение ряда серьезных проблем, первая из которых - разработка системы анализа профессиональных рисков. Проблема оценки профессионального риска была сформулирована почти полвека назад в Конвенциях Международной организации труда (ILO) и Рекомендациях Международной организации по стандартизации (ISO), несколько десятилетий выходит специализированный журнал «Risk Analysis», работает Международное общество по анализу риска (SRA), в США и Англии действуют национальные исследовательские центры. Тем не менее, до настоящего времени в этой области не существует даже устоявшейся терминологии. Понятию «профессиональный риск» в различных документах даются различные трактовки. Если ограничиться отечественными НТД, можно обнаружить достаточно существенные различия в определениях. Например, в 1998 году в ФЗ № 125 [1] профессиональный риск определяется как «Вероятность повреждения (утраты) здоровья или смерти, связанная с исполнением обязанностей по трудовому договору (контракту) …». В 2002 году в ФЗ № 184 [2] в аналогичное определение вводится новое понятие «Вероятность причинения вреда жизни или здоровью граждан … с учетом тяжести этого вреда». В Руководстве [3] появляется уже «Сочетание вероятности нанесения ущерба и тяжести этого ущерба». Аналогичное определение дается в ГОСТ 12.0.230 - 2007 ССБТ [4] : «Сочетание вероятности возникновения в процессе трудовой деятельности опасного события, тяжести травмы или другого ущерба для здоровья человека, вызванных этим событием». Иными словами, в дополнение к вероятности вреда, в понятие риска в последнее время вводится еще и связанный с этим ущерб. В последнем по времени документе ГОСТ Р 12.0.010-2009 [5] риск определяется как математическое ожидание ущерба здоровью и жизни работника, т.е. ущерб становится определяющим показателем риска. При этом допускаются различные толкования ущерба, в зависимости от целей исследования:

  • количество и тяжесть профессиональных заболеваний;
  • продолжительность временной утраты трудоспособности;
  • сумма пособий по временной нетрудоспособности;
  • количество случаев стойкой утраты профессиональной трудоспособности;
  • степень утраты профессиональной трудоспособности в процентах;
  • сумма расходов на обеспечение по страхованию;
  • другие показатели.

Таким образом, введенный как единый показатель опасности, профессиональный риск может быть различным в зависимости от цели исследования. Используя последнее толкование ущерба («другие показатели») авторы любого исследования могут вводить свои критерии риска, не заботясь о согласовании с ранее принятыми.

Предполагая, что прийти к консенсусу в строгом определении профессионального риска сейчас уже невозможно, автор ниже собирается использовать этот термин расширительно - в качестве названия научной дисциплины, занимающейся теоретическим и методологическим обоснованием решения проблем сохранения здоровья работающих, подвергающихся действию вредных факторов производственной среды и трудового процесса. Последующее рассмотрение структуры исходной информации для решения поставленной выше задачи прогнозирования профессиональной заболеваемости, в соответствии с требованиями доказательной медицины, представляет собой один из разделов дисциплины «Профессиональный риск».

2. Проблема корреляции показателей «фактор-заболевание».

В области профессионального риска существует широкий спектр исследований профессионально обусловленных нарушений здоровья (ПОЗ) работников: от углубленного изучения заболеваемости с временной утратой трудоспособности (ЗВУТ), до патологии хронических профессиональных заболеваний. Общий вопрос, возникающий при этом: «Существует ли связь между объектами исследования - вредными производственными факторами (ВПФ) и заболеваемостью (ПОЗ) работников?». В самом общем случае, представляющие практический интерес ответы могут быть получены при статистическом корреляционном анализе данных. Для проведения такого анализа необходимо количественно характеризовать как предполагаемую причину (ВПФ) так и следствие - уровень ПОЗ. С первым, как правило, проблем не возникает: для большинства ВПФ существуют допустимые уровни, так что интенсивность воздействия можно описать отношением реального уровня ВПФ к допустимому. Количественная характеристика ПОЗ может быть различной в зависимости от целей исследования. Например, при изучении ЗВУТ принято использовать два показателя - количество случаев и количество дней ЗВУТ в году, для профзаболеваний - количество ПЗ, впервые выявляемых за год.

Корреляционный анализ позволяет определить наличие связи между величинами, характеризующими предполагаемые причину и следствие. Вычисляя коэффициент корреляции, можно оценить, насколько тесна и существенна связь «ВПФ - ПОЗ».
Для того, чтобы наглядно представить характер задач в этой области, допустим, что изучается трудовой коллектив из N работников, на каждого из которых воздействует ВПФ с интенсивностью Xi , его индивидуальный показатель заболеваемости обозначим как Yi (i = 1,2,…,N). Ситуацию с каждым работником можно отобразить точкой на фазовой плоскости с координатами (x,y). Множество из N точек (см. рис.1) отражает состояние трудового коллектива. Возможны несколько ситуаций:

  • Множество точек образует более-менее симметричное во всех направлениях «облако» (рис.1(а)). Очевидно, здесь нет корреляции между ВПФ и заболеваемостью.
  • «Облако» точек вытянуто в направлении роста координат х и у (рис.1(б)). Здесь рост ВПФ приводит к росту заболеваемости.
  • «Облако» вытянуто так, что с ростом координат точек Хi величина координат Yi в среднем убывает (рис.1(в)). Если здесь нет систематической ошибки в исходных данных, следует признать, что влияние исследуемого фактора благотворно действует на здоровье работников.

Для оценки характера и степени связи величин X и Y используется коэффициент линейной корреляции (коэффициент Пирсона):

(1)

Здесь через <X> и <Y> обозначены средние значения соответствующих координат.

Коэффициент корреляции меняется от 1 (строгая прямая пропорциональная зависимость величин, линия А-В на рис.1.(б)) до -1 (строгая обратная линейная зависимость). Значению r = 0 соответствует отсутствие зависимости между величинами (рис.1(а)).

Если есть данные типа приведенных на рис.1(б), можно провести регрессионный анализ, дающий, например, количественную оценку зависимости заболеваемости Y от интенсивности Х воздействия ВПФ :

(2)

Для данных на рис.1(б) эта зависимость представлена прямой А-В .

В некоторых случаях, при подборе функции, дающей оценку зависимости Y от Х , следует учитывать эффект ограниченности возможных значений Y. Например, при характеристике заболеваемости количеством дней с ВУТ в году, следует учитывать, что эта величина не может превосходить полного количества дней в году. Количество выявляемых случаев профзаболеваний не может превосходить полного количества обследуемых работников и т.п. В биостатистике для этих случаев используется т.н. логистическая функция (кривая L на рис. 1(б)) , максимальная величина которой ограничена:

(3)

Здесь X0, Y0 и δХ - характерные масштабы зависимости, подбираемые при анализе данных методом логистической регрессии.

В эпидемиологии профзаболеваний логистическая регрессия используется редко, т.к. уровень заболеваемости редко бывает столь велик, чтобы проявлялся эффект ограниченности возможных значений Y.

3. Таблицы сопряженности признаков.

Корреляционный (и регрессионный) анализ индивидуальных данных о воздействии ВПФ и обусловленной этим воздействием заболеваемости является, несомненно, наиболее информативным источником суждений о профессиональных рисках. Такие методы анализа используются в фундаментальных исследованиях. В рутинных эпидемиологических исследованиях ПОЗ, однако, применяются менее затратные методы анализа, использующие суммированные данные, дифференцированные по бинарной шкале «да - нет». Суммирование идет по частям фазовой плоскости «ВПФ-ПОЗ», разграниченными линиями x = X0 и y = Y0. Предполагается, что ВПФ действует (ВПФ = 1) только в области x > X0 и не действует (ВПФ = 0) в остальной части фазовой плоскости (x < X0 ). Аналогично, работники с заболеваемостью y < Y0 считаются здоровыми (ПОЗ = 0), а к болеющим (ПОЗ = 1) относят только тех, заболеваемость которых превышает уровень Y0 .

Так отформатированные результаты принято размещать в 2х2 таблице, называемой «таблица сопряженности»:

Таблица 1

Таблица сопряженности
результатов эпидемиологических исследований
профзаболеваний

Несмотря на свою простоту, такой метод представления результатов обеспечивает возможность проведения глубокого нетривиального анализа.
Остановимся на смысле отдельных чисел в таблице. Величина а - это число заболевших (ПОЗ = 1) работников, подвергавшихся действию ВПФ, b - число работников, подвергавшихся действию ВПФ, но не заболевших (ПОЗ = 0). Соответственно, a + b - это суммарное число работников, подвергшихся действию ВПФ. Величина с - это число заболевших (ПОЗ = 1) работников, не подвергавшихся действию ВПФ, d - число работников, не подвергавшихся действию ВПФ и не заболевших (ПОЗ = 0). Соответственно, с + d - это суммарное число работников, не подвергшихся действию ВПФ. При суммировании по столбцам получим полное число а + с заболевших работников и число b + d работников, оставшихся здоровыми в течение срока исследования. Данные табл.1 позволяют перейти от случаев к вероятностям. Например, вероятность заболеть Р(ПОЗ = 1) в обследованном коллективе определяется соотношением

Р(ПОЗ = 1) = (a + c) / N (4)

Вероятность попасть под действие ВПФ Р(ВПФ = 1) равна

Р(ВПФ = 1) = (a + b) / N (5)

Можно оценить условную вероятность для работника заболеть, если на него действует ВПФ :

Р(ПОЗ = 1 | ВПФ = 1) = a / (a + b) (6)

Последнюю вероятность следует отличать от вероятности обнаружить воздействие на работника ВПФ, если известно, что он заболел:

Р(ВПФ = 1 | ПОЗ = 1) = a / (a + c) (7)

Вероятности (4-5) можно рассматривать как априорные, а (6-7) - как апостериорные. Как таковые, они подчиняются соотношению, известному как теорема Байеса:

Р(ПОЗ = 1 | ВПФ = 1) = Р(ВПФ = 1 | ПОЗ = 1)*Р(ПОЗ = 1) / Р(ВПФ = 1) (8)

Аналогичные соотношения можно выписать и для вероятностей, соответствующих отсутствию ВПФ или заболевания.
Связь данных таблиц сопряженности с априорными и апостериорными вероятностями приводит к возможности использования аппарата вероятностной Байесовской логики. Это направление оказалось весьма плодотворным при анализе экологических и медицинских данных. В последнее время методы Байесовской классификации и Байесовского вывода использовались также и в области оценки условий труда [6] [7]. В случае существования однозначной зависимости «ВПФ-ПОЗ» в таблице сопряженности недиагональные элементы с и d должны были бы быть равны нулю. Реально, однако, существует «фоновая» вероятность заболевания (без влияния ВПФ). Она определяется соотношением

Р(ПОЗ = 1 | ВПФ = 0) = c / (c + d) (9)

Вообще говоря, существует также ненулевая вероятность остаться здоровым при действии ВПФ:

Р(ПОЗ = 0 | ВПФ = 1) = b / (a + b) (10)

Отличие от нуля вероятностей (9) и (10) исключает однозначность зависимости «ВПФ-ПОЗ», однако можно поставить вопрос о статистической связи признаков ВПФ и ПОЗ. Они могут считаться независимыми, если для совместной вероятности Р(ВПФ;ПОЗ) имеет место соотношение

Р(ВПФ;ПОЗ) = Р(ВПФ)*Р(ПОЗ) (11)

Если данные (количества работников) в клетках таблицы сопряженности были бы независимы, то их можно было бы определить по формулам:

а0 = (a+b)*(a+c)/N ; b0 = (a+b)*(b+d)/N ; c0 = (a+b)*(c+d)/N ; d0 = (c+d)*(b+d)/N (12)

Степень зависимости данных можно определить, вычисляя разности а-а0, b-b0 … . Общепринятым критерием независимости данных в таблицах сопряженности является критерий χ2 (К.Пирсон, Р.Фишер), определяемый как сумма квадратов разностей, деленных на ожидаемые количества работников а0 , b0 … :

χ2 = N*(ad-bc)2/(a+b)/(a+c)/(b+d)/(c+d) (13)

Принято также оценивать силу связи «ВПФ-ПОЗ». Для этого можно использовать критерий φ, определяемый по формуле
(14)
Величина φ может меняться от 0 (отсутствие связи) до 1 (однозначная зависимость). Более детальная интерпретация величины критерия φ приведена в табл. 2:

Таблица 2

Интерпретация значений критерия φ

Если зависимость «ВПФ-ПОЗ» значима, можно определить добавочную вероятность заболевания δP, обусловленную воздействием ВПФ. Она определяется разностью между вероятностью заболевания при действии ВПФ Р(ПОЗ=1|ВПФ=1) (см. ф-лу (6)) и «фоновой» вероятностью Р(ПОЗ=1|ВПФ=0) (см. ф-лу (9)) :

δP = Р(ПОЗ=1|ВПФ=1) - Р(ПОЗ=1|ВПФ=0) = (a*d - b*c)/(a+b)/(c+d) (15)

Добавочная вероятность пропорциональна величине критерия , хотя и не совпадает с ней.

4. Связь с эпидемиологией профессиональных заболеваний.

Таблицы сопряженности применяются для анализа эпидемиологических данных, в этой области, однако, используется специфическая терминология, обусловленная, в том числе, дизайном проводимого эпидемиологического исследования.

4.1. При проведении когортного исследования выявляется воздействие ВПФ на заболеваемость, т.е. устанавливается фактор риска. Соответственно, определяются следующие виды риска:

  • Оценочный риск заболевания - отношение числа случаев заболевания в когорте к численности когорты. В терминах вероятностей эта величина равна Р(ПОЗ=1) (см. ф-лу (4)).
  • Риск возникновения заболевания в группе, подверженной воздействию ВПФ. Это условная вероятность Р(ПОЗ = 1|ВПФ = 1) (см. ф-лу (6)).
  • Риск возникновения заболевания в группе, не подверженной воздействию ВПФ. Это условная вероятность Р(ПОЗ = 1|ВПФ = 0) (см. ф-лу (9)).
  • Относительный риск (RR) - величина, описывающая увеличение риска заболевания под действием ВПФ. Это отношение вероятности заболевания у работников подвергающихся воздействию ВПФ к вероятности заболевания у работников, не подвергающихся такому воздействию:

RR = Р(ПОЗ = 1|ВПФ = 1)/ Р(ПОЗ = 1|ВПФ = 0) = a*(c+d)/c/(a+b) (16)

С относительным риском непосредственно связана этиологическая доля

EF = (RR-1)/RR (17)

  • Атрибутивный (абсолютный) риск AR - дополнительный риск заболевания, обусловленный ВПФ. Это добавочная вероятность δP (см. ф-лу (15)).

4.2. При исследованиях «случай-контроль» определяются шансы (Odds) заболевания под действием ВПФ. По определению, шансы - это отношение частоты заболевания к частоте отсутствия заболевания. Шансы и вероятности Pr содержат одну и ту же информацию, но по-разному выражают ее: Odds = Рr/(1-Рr). Логика исследований случай-контроль предопределяет необходимость оценки шансов подверженности ВПФ в группе случаев: Odds[cases] = a/c и в группе контролей: Odds[controls] = b/d .

Характеристикой воздействия ВПФ является величина «отношение шансов» (OR) - отношение шансов заболевания в группе случаев к шансам в группе контролей. OR - основной показатель связи заболеваемости с предшествующими событиями. Оценка OR имеет вид

OR = Odds[cases] / Odds[controls] = (a*d ) / (b*c) (17)

5. Эпидемиологическая характеристика респираторной патологии в горно-химической промышленности Крайнего Севера.

Продемонстрируем возможности использования таблиц сопряженности для анализа бронхолегочной патологии у рабочих, занятых добычей, транспортировкой и обогащением апатит-нефелиновых руд в климатических условиях Крайнего Севера. Исходные статистические данные взяты из работы [8], целью которой было изучение структуры хронических бронхолегочных заболеваний у различных групп рабочих предприятия ООО «Апатит» (Мурманская обл.). При проведении углубленного медосмотра были обследованы, в частности, 2238 работников подземных рудников (основная группа) и 790 работников железнодорожного цеха (группа контроля). Хронические бронхолегочные заболевания (ХБЛЗ) дифференцировались по нозологическим формам, однако, в связи с иллюстративностью последующего, ниже этого делаться не будет. Авторы [8] выделяли «группу риска», в которую включались лица с некоторыми признаками респираторной патологии, недостаточными для установления диагноза какого-либо ХБЛЗ. Ниже эта группа будет объединена с группой «здоровые лица».

В рамках принятых предположений таблица сопряженности имеет вид:

Таблица 3

Таблица сопряженности
состояния респираторного здоровья работников

Анализ данных табл.3 с использованием соотношений п.4 позволяет утверждать следующее:

  • Оценочный риск ХБЛЗ в обследованном коллективе составляет Р(ПОЗ=1) = 0,146.
  • Риск возникновения ХБЛЗ в группе, подвергающейся воздействию ВПФ, составляет Р(ПОЗ=1|ВПФ=1) = 0,173.
  • Риск возникновения ХБЛЗ в группе, не подвергающейся воздействию ВПФ, составляет Р(ПОЗ=1|ВПФ=0) = 0,07.
  • Относительный риск RR = 2,48 ; соответственно, этиологическая доля EF = 60% . Согласно Руководству [9] такие величины RR и EF
  • свидетельствуют о высокой степени причинно-следственной связи нарушений здоровья с работой.
  • Атрибутивный риск AR = δP = 0,103 , т.е. более 10% заболеваний работников обусловлены действием ВПФ.

Так исследования были когортными, оценивать шансы и относительные шансы некорректно.

6. Заключение.

Эпидемиология профессиональных заболеваний, имея дело с ВПФ, как этиологическими факторами, находится в выигрышном положении по сравнению с другими разделами медицины. Она наиболее приближена к вредным условиям производства, а также к развитию профессионально обусловленных заболеваний. Профэпидемиология, благодаря системе обязательных периодических медосмотров, оказывается ближе других разделов медицины к начальным проявлениям заболеваний, что открывает возможности разработки мер их своевременной профилактики и лечения. Однако, для того, чтобы использовать эти преимущества в общероссийском масштабе, информационная система АС "Профессиональные риски" должна получать информацию определенной структуры. В качестве шаблона такой структуры могут использоваться таблицы сопряженности признаков «ВПФ-ПОЗ»

Развитые в настоящее время методы анализа и интерпретации содержания таблиц сопряженности (либо в простейшем варианте 2х2, либо в более сложных многоуровневом и многомерном вариантах) создают научную основу для градации условий труда и анализа эффектов реально многофакторного воздействия ВПФ.

Возможность использования аппарата вероятностной Байесовской логики для анализа содержания таблиц сопряженности позволяет разрабатывать Байесовскую классификацию условий труда и прогнозирование профессиональных (и профессионально обусловленных) заболеваний.

7. Литература

1. Федеральный закон «Об обязательном социальном страховании от несчастных случаев на производстве и профессиональных заболеваний» № 125 - ФЗ от 24.07.1998 г.
2. Федеральный закон «О техническом регулировании» № 184 - ФЗ от 27.12. 2002 г.
3. Руководство ISO/IEC 51-2002 «Аспекты безопасности. Руководящие указания по включению их в стандарты».
4. ГОСТ 12.0.230 - 2007 ССБТ «Система управления охраной труда. Общие требования».
5. ГОСТ Р 12.0.010-2009 «Системы управления охраной труда. Определение опасностей и оценка рисков».
6. Федорович Г. В. Классификация условий труда по эпидемиологическим данным // Безопасность и охрана труда. - 2011. - № 4.- С.49-52.
7. Федорович Г. В. Профессиональный риск. Количественная оценка и управление // Безопасность и охрана труда. -2012. - №1. - С.45 - 50.
8. Сюрин С.А., Буракова О.А. Респираторная патология в горно-химической промышленности Крайнего Севера // Безопасность и охрана труда. - 2012. - № 4. - С.56-59.
9. Р 2.2.1766-03 «Руководство по оценке профессионального риска для здоровья работников. Организационно-методические основы, принципы и критерии оценки».