Ребят, я уже не знаю, что делать. Пытаюсь сделать классификацию текстов по темам, чтобы потом это все в базу складывать. Взял небольшой датасет, попробовал разные подходы — от простых TF-IDF + Logistic Regression до чего-то более навороченного с использованием предобученных эмбеддингов. Но точность ну просто никакая. Вот прям еле-еле выше случайного угадывания. А ведь надо потом на большие объемы переходить. Это какие-то мои руки кривые, или что-то не так с самими методами? Может, есть какие-то лингвистические сервисы, которые прям реально помогают с такой задачей, а не просто красивую обертку дают?