Ребята, это уже переходит все границы. Собрал в декабре 2025 года классификатор текстов для русского языка, использовал стандартные модели. Работал нормально, точность на тестовой выборке держалась в районе 89-91%. Ну, типа, приемлемо.
Обновил вчера основные библиотеки – pandas, spacy, transformers. И все, как под замену. Точность просела до 75%.
Я уже перепробовал откатить версии по одной – не помогает. Уже не знаю, на что грешить. Может, кто сталкивался с такой же фигней? Может, есть какие-то подводные камни в новых версиях, которые влияют на обработку естественного языка?