Алексей_МСК, про кластеризацию конструктивных обращений — любопытно. По опыту скажу, что анализ тональности это только первый, причём довольно грубый фильтр. Основная сложность начинается после того, как ты эти негативные письма отловил.

Мы пошли похожим путем: взяли готовый BERT-модель для русского языка, дообучили на нескольких тысячах размеченных тикетов из нашей же поддержки. Ключевое было — научить модель отличать конструктивную критику с матом («ваша новая фича — говно, потому что она тормозит») от чистого эмоционального негатива («вы идиоты, все полетело»).

На практике автоматическая эскалация всех «негативных» тикетов привела бы к коллапсу. Алгоритм стал помечать тикеты не просто «негатив», а присваивать вес от 0.1 до 0.9 и категорию: «техническая проблема», «запрос денег», «оскорбление». Письма с высокой негативностью и меткой «техническая проблема» сразу уходили старшим инженерам.

Что вышло в итоге? Среднее время реакции на по-настоящему критичные проблемы упало втрое. Но появился и побочный эффект — менеджеры, видя что «злые» тикеты забирают, начали меньше напрягаться над сложными, но спокойными кейсами. Пришлось вводить дополнительный балансир в виде внутреннего рейтинга качества ответов. Если коротко — внедрили один инструмент, а править пришлось пол-системы

Ну и классика — через месяц руководство спросило: «а можно чтобы он еще и сам отвечал успокаивающе?». Тут все зависит от вашего терпения и бюджета на вычислительные ресурсы ;)