Как НЕ утонуть в море текста: 3 кита текстовой аналитики

Общение / Флудилка и неформальные разговоры

Все эти модные словечки вроде NLP, текстовый анализ... Звучит красиво, но на деле? Столько инфы, что башка кругом идет. У меня тут пара мыслей накопилась, как хоть как-то порядок навести. Без воды, чисто по делу. Начни с цели....

Помогите с классификацией текстов!!!

Общение / Знакомства и коллаборации

Всем привет! Я тут новенький совсем, только начал разбираться с NLP. Задача такая: нужно тексты по темам раскладывать, знаю, что это классификация текстов называется. Пробовал разные модели, но что-то не очень получается....

Что-то с моими моделями не так??? — лингвистические сервисы

Практическое применение / Образование и обучение моделей

всем привет. я тут новенький совсем, извините если что не так. начал тут осваивать всякие штуки для обработки естественного языка, ну типа NLP. пытаюсь вот классификацию текстов делать, натренировать модельку. вроде все по...

Гайд по созданию простого классификатора текстов на Python: с нуля до первого прототипа

Инструменты и технологии / Разработка собственных инструментов

Вижу, многие хотят попробовать свои силы в NLP, но пугаются масштаба задачи. Смотри, тут логика такая: не нужно сразу строить сложную нейросеть. Давай по порядку, я покажу, как собрать рабочий прототип для классификации текстов...

Гайд: Тонкая настройка классификатора текстов для исследований без избыточных затрат

Общие вопросы и теория / Академические исследования и публикации

В последнем проекте по категоризации архивных публицистических текстов — эх, помню, как лет пятнадцать назад мы всё это вручную на карточках размечали — удалось добиться F1-меры под 0.92, не прибегая к тяжёлым трансформерам....

Инструмент для аннотации текстов Prodigy — дорого, но оно того стоит?

Инструменты и технологии

Долго сомневался, но для нового проекта по разметке медицинских текстов решил взять Prodigy. Делимся впечатлениями после месяца активного использования. Сначала про ценник — да, это самый дорогой инструмент в подборке. И...

Интеграция с Google NLP API сломалась после их тихого обновления!

Инструменты и технологии / Интеграция и API

Все работало как часы полгода. Сегодня утром скрипты начали падать с ошибками аутентификации. В логах Google Cloud — ничего внятного. Ключи сервисного аккаунта те же, проект активен, квоты не исчерпаны. Проверил — документацию по...

Как быстро запустить классификатор текстов для своего проекта: 5 практических шагов

Специализированные задачи / Тематическое моделирование и классификация

Часто спрашивают, как начать классифицировать тексты, не погружаясь сразу в пучины сложных ML-фреймворков. Короче, делюсь опытом который сэкономил мне недели. Всё на примере сбора отзывов на товары (положительный/отрицательный)....

Новости партнёров

File engine/modules/mainstats.php not found.