Как начать использовать тематическое моделирование для анализа текстов?

Специализированные задачи / Тематическое моделирование и классификация

Привет всем! Хочу поделиться своим опытом в освоении тематического моделирования. Это реально мощный инструмент, но поначалу может показаться сложным. Вот мой небольшой гайд, который помог мне разобраться. Шаг 1: Подготовка...

Сентимент-анализ: субъективность неизбежна? — Крáкен официальный сайт

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Я вот тут глубоко погрузился в тему сентимент-анализа, и чем больше копаю, тем больше убеждаюсь: полностью объективный анализ эмоций в тексте — это миф. Почему? Ну, во-первых, сам язык — он часто неоднозначен. Ирония, сарказм,...

Так вот почему мои темы никак не сходятся...

Специализированные задачи / Тематическое моделирование и классификация

Ребята, я тут днями и ночами пытался настроить тематическое моделирование для анализа отзывов о бытовой технике. Думал, ну щас как разделю все на «стиралки», «холодильники» и «пылесосы», а там уже и по брендам. Сначала брал...

Тематическое моделирование: стоит ли оно того?

Специализированные задачи / Тематическое моделирование и классификация

За последнее время столько слышу про тематическое моделирование – LDA, NMF и всякие прочие. Говорят, помогает понять, о чем пишут пользователи, какие темы актуальны. Но вот когда сам пытаешься применить, результаты часто...

Извлечение сущностей из технических текстов: кто-нибудь пробовал?

Специализированные задачи

Привет, коллеги! Работаю над проектом, где нужно автоматически извлекать из технических мануалов названия деталей, их характеристики и связи между ними. Пробовал стандартные NER-модели, но они плохо справляются с...

Анализ эмоций в отзывах: насколько ему можно верить?

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Всем привет! Решил я тут протестировать один сервис по сентимент-анализу для отзывов о нашем продукте. Честно говоря, результаты меня удивили, причем не всегда приятно. С одной стороны, сервис довольно неплохо определяет...

Перевод текстов для анализа: когда машинный перевод – зло?

Специализированные задачи / Работа с мультиязычными текстами

Часто приходится работать с текстами на разных языках, и дилемма: то ли нанимать переводчиков (дорого и долго), то ли полагаться на машинный перевод (быстро, но точность страдает). Особенно это актуально, когда нужно понять общий...

Как автоматически определять авторский стиль?

Специализированные задачи

Всем привет! Сталкивался ли кто-нибудь с задачей автоматического определения авторского стиля текста? Ну, чтобы понять, написал этот текст конкретный автор или кто-то другой. Это нужно для разных целей, от поиска плагиата до...

Переводчики и NLP: какая связь?

Специализированные задачи / Работа с мультиязычными текстами

Все мы пользуемся онлайн-переводчиками, но задумывались ли вы, какая магия там происходит? На мой взгляд, современные системы машинного перевода — это вершина работы с мультиязычными текстами. Они не просто подбирают слова, а...

Что-то с классификацией моих текстов случилось!

Специализированные задачи / Тематическое моделирование и классификация

Ребят, хелп! Сделал модель для классификации новостных статей по темам: политика, спорт, технологии, культура. Раньше работало отлично, точность была где-то 90%+. Вчера попробовал запустить на новых данных, а она выдает какую-то...

Кросс-язычные эмбеддинги: миф или реальность для бизнеса?

Специализированные задачи / Работа с мультиязычными текстами

Всем знакомая ситуация: есть у вас продукт, а клиентов хочется охватить по всему миру. Значит, нужны тексты на разных языках. И вот тут возникает вопрос: действительно ли кросс-язычные эмбеддинги (вроде LASER или LaBSE) настолько...

Кто-нибудь пробовал анализировать юридические документы с помощью AI?

Специализированные задачи

Привет, народ! Интересует такой вопрос: кто-нибудь успешно применял методы NLP для анализа больших объемов юридических текстов? Например, для поиска похожих договоров, выявления рисков, автоматической классификации документов?...

Бесит, когда ИИ выдает неправильный сентимент!

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Ну вот опять! Пытаюсь оценить тональность отзывов о новом сериале, а эта дурацкая нейросеть выдает мне "нейтральный" там, где явно яростный негатив! Или наоборот, сарказм принимает за чистую монету. Как, черт возьми,...

Как отобрать нужные темы из гигантского массива текстов? — как зайти на Крáкен

Специализированные задачи / Тематическое моделирование и классификация

Всем привет! Столкнулся с такой задачей: есть терабайты логов, куча всяких разговоров, нужно выцепить только то, что касается разработки новых фич. Не просто ключевые слова, а именно смысловые блоки. Вот мой пошаговый план: 1....

Эмоциональный анализ – это вообще надежно?

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Всем привет! Интересуюсь сентимент-анализом, изучаю разные библиотеки и модели. На бумаге всё выглядит очень красиво: определяем позитив, негатив, нейтральность. Но вот когда начинаешь применять на реальных текстах, возникает...

Помогите с кросс-язычным поиском по документам! — Крáкен официальный сайт

Специализированные задачи / Работа с мультиязычными текстами

Ребята, я в отчаянии! Пытаюсь сделать поиск по базе документов, которые написаны на разных языках (английский, немецкий, испанский). Использовал стандартные библиотеки, но результаты просто ужасные. Поиск по английским текстам...

Просто делайте по шаблону

Специализированные задачи / Тематическое моделирование и классификация

Просто делайте по шаблону. Я сам так учился. Скачайте библиотеку Загрузите данные сюда Нажмите кнопку старт Получите результат Если видите pasaremos blacksprut — все ок. Это версия стабильная. Не бойтесь смотреть ошибки. В них и...

Опять ошибка в сентименте

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Проблема с сентиментом. Модель путает негаты и позитив. Пишет что хвалит но это ругань. Использовал блэк спрут для обучения данных. Получил ошибку 404. Что делать? Кажется данные смешанные. Я не разобрался где что. Прочитал гайды...

Как мы писали код без библиотек...

Специализированные задачи

Мы тогда писали код без библиотек. Руками. Это было честно и больно одновременно. Нужно было обйти защиту сайта. Использовали tor black как прокси цепочку. Думали что никто не узнает. Но админы были злее чем мы. Блокировали IP...

Специализированные задачи: обнаружение метафоры в тексте

Специализированные задачи

Пытаюсь реализовать алгоритм обнаружения метафор с помощью грамматических моделей. Кто сталкивался с подобными задачами? кракен даркет...

Новости партнёров

Комментарии
Обзор популярных библиотек для лингвистического анализа
Ооо, тема про лингвистику! Это же просто огонь! Я сам в восторге от этих штук, столько всего
3 подхода к решению специализированных задач без blacksprut bs gl
Ну вот, вижу, народ тут про блэк спрут обсуждает. ) Интересно, конечно, но, имхо, тема немного
Обзор популярных библиотек для лингвистического анализа
Ого, спасибо за обзор! Я вот тоже пытаюсь разобраться с этими библиотеками. spaCy вроде бы быстрый,
Как сделать практическое применение текстовой аналитики без флуда blacksprut?
Бизнес_Аналитик, тебя интересует фильтрация данных, правильно? Чтобы посторонние упоминания типа
Гайд по написанию академической статьи на тему лингвистических сервисов
Тихий_Исследователь, добро пожаловать в клуб! Если уж браться за академическую статью по
Все комментарии..
Полный список последних комментариев
File engine/modules/mainstats.php not found.