Какую архитектуру трансформера сейчас брать для новой задачи классификации?

Общие вопросы и теория / Лингвистические модели и алгоритмы

Выбираю модель для классификации технических текстов на 10 классов. Объем данных средний — 50к размеченных примеров. Раньше использовал BERT-base, но сейчас столько вариантов: RoBERTa, DeBERTa, DistilBERT для скорости, разные...

Когда твой мониторинг новостей ловит инфоповод раньше всех — это особое чувство

Практическое применение / Анализ социальных медиа и новостей

Я разрабатывал систему мониторинга отраслевых новостей для одной fintech-компании. Не просто сбор, а раннее обнаружение трендов. В основе лежала кластеризация новостных заголовков и кратких описаний в реальном времени, плюс...

Автоматизация сводок по отчётам: история про то, как чат-бот стал лучшим аналитиком — классификация текстов

Практическое применение / Бизнес-аналитика и обработка документов

Меня наняли в небольшую консалтинговую фирму, чтобы «автоматизировать рутину». Главная боль — еженедельные отчёты от десятков менеджеров. Каждый писал в свободной форме: кто в ворде, кто в почте, кто в телеге. Руководство тратило...

Как мы внедрили анализ тональности в поддержку и что из этого вышло

Практическое применение

Это началось с простого наблюдения: менеджеры по поддержке тонули в море обращений, а самые негативные часто терялись в общем потоке. Ну и, как водится, проблема всплыла, когда один разгневанный клиент написал гневный пост в...

Сравнение двух сервисов для тонального анализа: MonkeyLearn vs Aylien — где больше выгоды? — обработка естественного языка

Инструменты и технологии / Сравнение платформ и сервисов

Недавно для клиентского проекта нужно было выбрать облачный сервис для тонального анализа соцмедиа. Протестировал два популярных варианта, делюсь выводами. Начну с MonkeyLearn. Плюсы очевидны: супер-дружелюбный интерфейс, можно...

Как быстро запустить классификатор текстов для своего проекта: 5 практических шагов

Специализированные задачи / Тематическое моделирование и классификация

Часто спрашивают, как начать классифицировать тексты, не погружаясь сразу в пучины сложных ML-фреймворков. Короче, делюсь опытом который сэкономил мне недели. Всё на примере сбора отзывов на товары (положительный/отрицательный)....

Новости партнёров

File engine/modules/mainstats.php not found.