Глубинные связи: Лингвистические модели действительно понимают смысл?

Общие вопросы и теория / Лингвистические модели и алгоритмы

Коллеги, привет! Часто мы говорим о задачах текстового анализа, о классификации текстов, о всяких крутых NLP-штуках. Мы пишем модели, которые отлично справляются с определением тональности, тематики, извлечением сущностей. Но вот...

Да ну, NLP еще рано выводить в продакшен! Это все пока сырая игрушка! — Textocat API

Общие вопросы и теория / Лингвистические модели и алгоритмы

Ребята, я тут подумал, и мне кажется, что вся эта современная обработка естественного языка (NLP) — она еще так далека от совершенства! Ну да, модели стали умнее, вроде бы. Но вот когда дело доходит до реальных задач, например,...

Гайд по выбору лингвистических сервисов для обработки текстов

Общие вопросы и теория / Лингвистические модели и алгоритмы

Эх, времена были, когда мы вручную тексты разбирали! Сейчас, конечно, все иначе. Но даже среди этого изобилия современных NLP-инструментов легко потеряться. Вот решил поделиться опытом, как выбрать действительно подходящий...

Не могу никак настроить парсер для кракен сайта! Помогите!

Общие вопросы и теория / Лингвистические модели и алгоритмы

Народ, я уже неделю бьюсь об стену! Хочу парсить данные с одного маркетплейса, но вот с кракен сайтом какая-то беда. Вроде и библиотеку красивую нашел, и документацию прочитал, но постоянно какие-то ошибки вылезают. То 403...

Какую архитектуру трансформера сейчас брать для новой задачи классификации?

Общие вопросы и теория / Лингвистические модели и алгоритмы

Выбираю модель для классификации технических текстов на 10 классов. Объем данных средний — 50к размеченных примеров. Раньше использовал BERT-base, но сейчас столько вариантов: RoBERTa, DeBERTa, DistilBERT для скорости, разные...

Новости партнёров

File engine/modules/mainstats.php not found.