Короче, была тут недавно история. Помнится, работал я над одним проектом, где нужно было внедрить классификацию текстов для отдела поддержки. Задача, казалось бы, стандартная: чтобы заявки сразу в нужный отдел улетали. Ну, типа, юмор — в отдел мемов, техническая проблема — к админам.
Собрали мы датасет, натренировали модельку NLP, всё красиво. Первые тесты — огонь! Бот разруливал все по полочкам, никто не жаловался. Я уже мысленно начал планировать отпуск, ахах.
И тут началось самое интересное. Оставляю я заявку, мол, «Программа зависла, не могу сохранить документ». Отвечает мне бот: «Страдание — великая вещь, господа, страдание». Я сначала в ступор впал. Думаю, может, я в какой-то шуточный бот попал?
Перечитал свой запрос — нет, все серьёзно. А он дальше, про «тварь дрожащую» и «право имею». Ну, думаю, хана. Либо модель сошла с ума, либо кто-то из коллег решил подшутить.
Разбирались мы с этим добрых полдня. Оказалось, всё дело в одном очень специфическом текстовом анализе, который мы случайно добавили в pipeline. Он был заточен под определение стиля письма и, видимо, наткнулся на какое-то древнее сообщение от кого-то, кто явно увлекался русской классикой. И все, понеслось. Вот такой вот неожиданный «интеллект» появился у нашего помощника.
Пришлось этот модуль убирать, конечно. Но момент был тот ещё. Теперь, когда какая-то фигня происходит с кодом, я иногда шучу, что это «Достоевский на связи»)