Как НЕ утонуть в море текста: 3 кита текстовой аналитики

Общение / Флудилка и неформальные разговоры

Все эти модные словечки вроде NLP, текстовый анализ... Звучит красиво, но на деле? Столько инфы, что башка кругом идет. У меня тут пара мыслей накопилась, как хоть как-то порядок навести. Без воды, чисто по делу. Начни с цели....

Помогите с классификацией текстов!!!

Общение / Знакомства и коллаборации

Всем привет! Я тут новенький совсем, только начал разбираться с NLP. Задача такая: нужно тексты по темам раскладывать, знаю, что это классификация текстов называется. Пробовал разные модели, но что-то не очень получается....

Тех, кто помнит dial-up, ещё берут в NLP?

Общение / Вакансии и карьера

Эх, помню я еще, как первые мои шаги в программировании были связаны с обработкой текстов. Это было… ну, скажем так, не совсем то, что сейчас называют модным NLP. Тогда мы кодили на чем-то вроде Паскаля, и любая задача, связанная...

Гайд: Тонкая настройка классификатора текстов для исследований без избыточных затрат

Общие вопросы и теория / Академические исследования и публикации

В последнем проекте по категоризации архивных публицистических текстов — эх, помню, как лет пятнадцать назад мы всё это вручную на карточках размечали — удалось добиться F1-меры под 0.92, не прибегая к тяжёлым трансформерам....

Тот случай, когда NLP меня чуть не сломал...

Общение / Помощь новичкам и FAQ

Решил попробовать текстовый анализ для своего небольшого проекта. Нашел какой-то онлайн сервис, там обещали классификацию текстов по эмоциям – простенький NLP, казалось бы. Загрузил свою статью, пару постов из соцсетей. Жду....

Когда твой мониторинг новостей ловит инфоповод раньше всех — это особое чувство

Практическое применение / Анализ социальных медиа и новостей

Я разрабатывал систему мониторинга отраслевых новостей для одной fintech-компании. Не просто сбор, а раннее обнаружение трендов. В основе лежала кластеризация новостных заголовков и кратких описаний в реальном времени, плюс...

Тот раз, когда тематическая модель спасла меня от трёх месяцев рутины

Практическое применение / Кейсы и реальные проекты

Было это года два назад. Работал я тогда в одном издательском доме. Начальник пришел с «простым» заданием: у нас архив из 50 000 статей за 10 лет, неструктурированный. Нужно понять, какие основные темы мы поднимали, как они...

Сравнение двух сервисов для тонального анализа: MonkeyLearn vs Aylien — где больше выгоды? — обработка естественного языка

Инструменты и технологии / Сравнение платформ и сервисов

Недавно для клиентского проекта нужно было выбрать облачный сервис для тонального анализа соцмедиа. Протестировал два популярных варианта, делюсь выводами. Начну с MonkeyLearn. Плюсы очевидны: супер-дружелюбный интерфейс, можно...

Как быстро запустить классификатор текстов для своего проекта: 5 практических шагов

Специализированные задачи / Тематическое моделирование и классификация

Часто спрашивают, как начать классифицировать тексты, не погружаясь сразу в пучины сложных ML-фреймворков. Короче, делюсь опытом который сэкономил мне недели. Всё на примере сбора отзывов на товары (положительный/отрицательный)....

Новости партнёров

File engine/modules/mainstats.php not found.