Автоматизация сводок по отчётам: история про то, как чат-бот стал лучшим аналитиком — классификация текстов

Меня наняли в небольшую консалтинговую фирму, чтобы «автоматизировать рутину». Главная боль — еженедельные отчёты от десятков менеджеров. Каждый писал в свободной форме: кто в ворде, кто в почте, кто в телеге. Руководство тратило полдня, чтобы все это прочитать и составить общую картину.

Мне пришла в голову, на первый взгляд, безумная идея: а что, если научить бота читать эти отчеты и делать выжимку?

Первая версия была на базе извлечения ключевых слов. Работало так себе — контекст терялся. Потом я открыл для себя модели суммаризации текста, те же T5 или Bart. Загрузил в память несколько примеров «исходный отчет — краткая сводка», настроил few-shot промпт для GPT-подобного API (бюджет был ограничен, брал не самый дорогой).

Создал простого телеграм-бота, куда менеджеры стали присылать тексты. Бот через API отправлял текст в модель суммаризации, а потом складывал все краткие сводки в один общий документ, выделяя общие тренды и проблемы через анализ тональности и кластеризацию.

Помню лицо директора, когда он впервые получил готовую сводку на трех страницах через 5 минут после дедлайна сдачи отчетов. Он спросил: «И это всё сделал компьютер?» Кивнул. Теперь этот бот — неофициальный член команды, его даже в общем чате упоминают. А я понял, что иногда лучший результат дает не полная замена человека, а грамотное избавление его от самой нудной части работы

Подробнее