Анализатор тональности V.3.1: Замерил — результат так себе — кракен сайт ссылка тор браузере

Общие вопросы и теория / Основы текстовой аналитики

Привет всем. Решил тут протестировать новый движок для анализа тональности, V.3.1. Обещают всякое, но мне интересны чисто технические параметры. Загрузил им датасет из 10 тысяч отзывов о нашем ПО. Интересно было посмотреть,...

Гайд по созданию простого классификатора текстов на Python: с нуля до первого прототипа

Инструменты и технологии / Разработка собственных инструментов

Вижу, многие хотят попробовать свои силы в NLP, но пугаются масштаба задачи. Смотри, тут логика такая: не нужно сразу строить сложную нейросеть. Давай по порядку, я покажу, как собрать рабочий прототип для классификации текстов...

Гайд: Тонкая настройка классификатора текстов для исследований без избыточных затрат

Общие вопросы и теория / Академические исследования и публикации

В последнем проекте по категоризации архивных публицистических текстов — эх, помню, как лет пятнадцать назад мы всё это вручную на карточках размечали — удалось добиться F1-меры под 0.92, не прибегая к тяжёлым трансформерам....

Тот случай, когда NLP меня чуть не сломал...

Общение / Помощь новичкам и FAQ

Решил попробовать текстовый анализ для своего небольшого проекта. Нашел какой-то онлайн сервис, там обещали классификацию текстов по эмоциям – простенький NLP, казалось бы. Загрузил свою статью, пару постов из соцсетей. Жду....

Инструмент для аннотации текстов Prodigy — дорого, но оно того стоит?

Инструменты и технологии

Долго сомневался, но для нового проекта по разметке медицинских текстов решил взять Prodigy. Делимся впечатлениями после месяца активного использования. Сначала про ценник — да, это самый дорогой инструмент в подборке. И...

Интеграция с Google NLP API сломалась после их тихого обновления!

Инструменты и технологии / Интеграция и API

Все работало как часы полгода. Сегодня утром скрипты начали падать с ошибками аутентификации. В логах Google Cloud — ничего внятного. Ключи сервисного аккаунта те же, проект активен, квоты не исчерпаны. Проверил — документацию по...

Какую архитектуру трансформера сейчас брать для новой задачи классификации?

Общие вопросы и теория / Лингвистические модели и алгоритмы

Выбираю модель для классификации технических текстов на 10 классов. Объем данных средний — 50к размеченных примеров. Раньше использовал BERT-base, но сейчас столько вариантов: RoBERTa, DeBERTa, DistilBERT для скорости, разные...

Практический гайд по препроцессингу мультиязычных текстов

Специализированные задачи / Работа с мультиязычными текстами

Работа с текстами на нескольких языках — это не просто конкатенация пайплайнов. Вот проверенный на практике подход, который убережет от головной боли. Первое и главное: определи язык каждого документа. Не доверяй метаданным....

SpaCy 4.0 — мощный, но местами переусложнённый инструмент. Честный разбор

Инструменты и технологии / Популярные библиотеки и фреймворки

После долгой работы на версии 3.x решил переехать на свежую SpaCy 4.0 для нового проекта по извлечению сущностей из юридических текстов. Впечатления неоднозначные Что порадовало: Скорость. Новый трансформерный пайплайн, особенно...

Когда твой мониторинг новостей ловит инфоповод раньше всех — это особое чувство

Практическое применение / Анализ социальных медиа и новостей

Я разрабатывал систему мониторинга отраслевых новостей для одной fintech-компании. Не просто сбор, а раннее обнаружение трендов. В основе лежала кластеризация новостных заголовков и кратких описаний в реальном времени, плюс...

Новости партнёров

Комментарии
Обзор популярных библиотек для лингвистического анализа
Ооо, тема про лингвистику! Это же просто огонь! Я сам в восторге от этих штук, столько всего
3 подхода к решению специализированных задач без blacksprut bs gl
Ну вот, вижу, народ тут про блэк спрут обсуждает. ) Интересно, конечно, но, имхо, тема немного
Обзор популярных библиотек для лингвистического анализа
Ого, спасибо за обзор! Я вот тоже пытаюсь разобраться с этими библиотеками. spaCy вроде бы быстрый,
Как сделать практическое применение текстовой аналитики без флуда blacksprut?
Бизнес_Аналитик, тебя интересует фильтрация данных, правильно? Чтобы посторонние упоминания типа
Гайд по написанию академической статьи на тему лингвистических сервисов
Тихий_Исследователь, добро пожаловать в клуб! Если уж браться за академическую статью по
Все комментарии..
Полный список последних комментариев
File engine/modules/mainstats.php not found.