Как анализ инструктажей по охране труда с помощью LLM в металлургии заменяет выборочный контроль?

Анализ инструктажей по охране труда с помощью LLM в металлургии: запись есть — контроля нет

Аудиозапись инструктажа сама по себе не снижает травматизм. На участках регулярно пишут устные инструктажи, но в отчётах остаются только отметки или выборочные проверки. Например, смена может не проговорить действия при разливе металла — и это не попадёт в контроль.

Возникает разрыв: данные есть, но их нельзя измерить и сравнить. Моя позиция проста: ценность не в записи, а в измеримой полноте содержания. Это достигается связкой ASR, доменной LLM и отраслевой базы знаний.

Отсюда последствия. Без сопоставимых метрик появляются слепые зоны. Одна смена пропускает аварийные сценарии, другая — закрывает всё. Система этого не видит.

Это важно для руководителей по ОТ и ПБ, производственных директоров и IT. Ниже — как перейти от выборочного аудита к сплошному цифровому контролю: какие модули нужны, что проверять и какие метрики использовать. Фокус — не на «ИИ вообще», а на связке ASR + LLM + база знаний, которая превращает шумные записи в проверяемые отчёты.

Почему запись не даёт контроля

Кажется, что запись инструктажа закрывает задачу. Есть файл, есть подпись — значит контроль выполнен. Из-за этого содержание почти не проверяют.

На практике записи остаются сырыми. Это часы аудио с шумом, эхом и наложением голосов. Без транскрибации и сверки с базой знаний нельзя понять, проговорены ли ключевые риски.

В результате часть тем просто выпадает. Например, из 10 обязательных пунктов может звучать только 6–7. Аварийные сценарии часто упоминают вскользь или не упоминают вовсе.

Итог — слепые зоны. Пропуски повторяются от смены к смене, но не попадают в KPI. Формальный контроль есть, управления рисками — нет.

Featured image: safety briefing analysis ai

Как работает анализ инструктажей

Поток обработки

Запись — это исходные данные. Инструктажи фиксируют перед сменой, при переводе изменениях технологии.

ASR переводит аудио в текст и делит его на фрагменты. Это критично: записи могут длиться часами.

Далее доменная LLM сопоставляет текст с отраслевой базой знаний. Она отмечает, какие темы есть, а какие пропущены.

На выходе — отчёт с оценкой качества. Это процент покрытия и уровни: высокий, достаточный, недостаточный.

Как считаются метрики

Процент покрытия — это доля обязательных тем, которые реально озвучены. Например, из 12 пунктов закрыты 9 — это 75%.

Уровни задаются порогами. Условно: выше 85% — высокий, 60–85% — достаточный, ниже — недостаточный.

Также учитываются критические пропуски. Если не проговорён аварийный сценарий, уровень может снижаться независимо от процента.

Почему без связки система не работает

ASR нужен из-за шума и наложения голосов. Без него смысл теряется.

Обычная языковая модель не понимает специфику. Поэтому используют дообученную модель — например, Gemma 3 от Google (12 марта 2025 года), адаптированную под металлургию.

База знаний задаёт эталон. В ней — риски, регламенты и сценарии. Без неё система видит слова, но не их значимость.

Что это меняет в управлении

Контроль становится сплошным. Система находит пропуски автоматически: нет запрета, не разобран сценарий, не учтён новый норматив.

Появляются метрики. Руководитель видит динамику по сменам и подразделениям.

Дальше — внедрение. Нужно:

настроить транскрибацию и сегментацию
подключить доменную модель
собрать базу знаний
задать метрики и пороги

После этого отчёты становятся основой для решений, а не формальностью.

Где система даёт сбой без анализа

Отметка в журнале вместо контроля

Вы видите запись и подпись. Кажется, что всё в порядке.

Но запись не разобрана. Ключевые риски могут не прозвучать.

Ошибка — доверие формальному признаку. Итог — системные пропуски, которые не видны до инцидента.

Проверка «хорошего» фрагмента

Вы слушаете короткий отрывок, где всё корректно.

Но это не вся запись. Проблемные части остаются вне проверки.

Ошибка — выбор удобного участка. Итог — искажённая картина качества.

Есть текст, но нет смысла

Вы получили транскрипт и отчёты.

Но система не выделяет важное. Риски и сценарии не интерпретируются.

Ошибка — отсутствие доменной модели и базы знаний. Итог — данные есть, решений нет.

Подход	Что получают	Проверка полноты инструктажа	Работа с шумом и многочасовыми записями	Сопоставимость между сменами и подразделениями	Итог для управления
Традиционный выборочный контроль	Аудиозапись, отметка в журнале	Частичная — проверка по выборочным фрагментам	Не масштабируется; ручной разбор многочасовых записей затруднён	Отсутствует или фрагментарна	Формальность контроля; скрытые слепые зоны
ASR — транскрибация только	Текстовые транскрипты (ASR)	Не оценивает значимость рисков и сценариев — фиксирует слова, но не их важность	Нуждается в автоматическом сегментировании; распознавание осложнено шумом и наложением голосов (факт)	Технически возможна, но без стандарта оценки содержание несопоставимо	Есть данные, но нет интерпретации для принятия решений
ASR + доменная LLM + база знаний	Отчёт с оценкой качества (процент/уровни) и сегментированные фрагменты	Автоматическая проверка наличия рисков, аварийных сценариев, запретов изменений нормативной базы (факт)	Предназначена для обработки многочасовых записей; шум остаётся фактором, влияющим на распознавание (факт)	Формируется статистика подразделениям, сменам и динамике качества (факт)	Измеряемые метрики и сопоставимость, позволяющие управлять полнотой инструктажей

Как меняются управленческие решения

Аудиозапись и галочка не управляют рисками. Управляют метрики.

Связка ASR, доменной LLM и базы знаний переводит звук в измеримую полноту. Появляется единый стандарт оценки.

Это убирает слепые зоны. Видно, где и что именно пропускают.

Пример: отчёт показывает, что в ночной смене падает покрытие аварийных сценариев до 60%. Руководитель вводит целевой инструктаж по этим сценариям и проверяет динамику через неделю.

Вместо разовых проверок появляется цикл управления: обнаружение — корректировка — контроль изменений.

От записи к управляемым метрикам

Аудиозаписи создают видимость контроля. Но без анализа нет сопоставимых показателей и видимых рисков.

Решение — перевести процесс в цифровой слой. Транскрибация, доменная модель и база знаний дают оценку покрытия и статистику по сменам.

Это работает, потому что каждый элемент закрывает свою задачу: текст вместо шума, контекст вместо слов, метрики вместо ощущений.

Начать можно с простого: собрать базу обязательных тем и запустить транскрибацию сегментацией. Затем подключить доменную модель и задать пороги качества.

Дальше система сама покажет, где теряется полнота — и где нужно вмешательство.

Частые вопросы по системе

Вопрос: Что даёт анализ инструктажей по охране труда с помощью LLM в металлургии?

Ответ: Он переводит аудио в метрики: показывает полноту, риски и даёт отчёт с процентом покрытия.

Вопрос: Достаточно ли только транскрибации?

Ответ: Нет. Текст без контекста не показывает значимость. Нужны модель и база знаний.

Вопрос: Как система работает с шумом?

Ответ: ASR обрабатывает длинные записи и делит их на части. Но шум и наложение голосов всё равно влияют на точность.

Вопрос: Какие метрики использовать?

Ответ: Процент покрытия, уровни качества и динамика по сменам.

Вопрос: Есть ли ограничения?

Ответ: Да. При сильном шуме ASR может ошибаться. Это может влиять на выводы, поэтому важны дообучение и проверка критичных случаев.

Вопрос: Заменяет ли система проверки?

Ответ: Нет. Она показывает, где проверять точечно и что исправлять.