Коллеги, привет! Часто мы говорим о задачах текстового анализа, о классификации текстов, о всяких крутых NLP-штуках. Мы пишем модели, которые отлично справляются с определением тональности, тематики, извлечением сущностей. Но вот...
Выбираю модель для классификации технических текстов на 10 классов. Объем данных средний — 50к размеченных примеров. Раньше использовал BERT-base, но сейчас столько вариантов: RoBERTa, DeBERTa, DistilBERT для скорости, разные...