Переводчики и NLP: какая связь?

Специализированные задачи / Работа с мультиязычными текстами

Все мы пользуемся онлайн-переводчиками, но задумывались ли вы, какая магия там происходит? На мой взгляд, современные системы машинного перевода — это вершина работы с мультиязычными текстами. Они не просто подбирают слова, а...

Что-то с классификацией моих текстов случилось!

Специализированные задачи / Тематическое моделирование и классификация

Ребят, хелп! Сделал модель для классификации новостных статей по темам: политика, спорт, технологии, культура. Раньше работало отлично, точность была где-то 90%+. Вчера попробовал запустить на новых данных, а она выдает какую-то...

Кросс-язычные эмбеддинги: миф или реальность для бизнеса?

Специализированные задачи / Работа с мультиязычными текстами

Всем знакомая ситуация: есть у вас продукт, а клиентов хочется охватить по всему миру. Значит, нужны тексты на разных языках. И вот тут возникает вопрос: действительно ли кросс-язычные эмбеддинги (вроде LASER или LaBSE) настолько...

Кто-нибудь пробовал анализировать юридические документы с помощью AI?

Специализированные задачи

Привет, народ! Интересует такой вопрос: кто-нибудь успешно применял методы NLP для анализа больших объемов юридических текстов? Например, для поиска похожих договоров, выявления рисков, автоматической классификации документов?...

Бесит, когда ИИ выдает неправильный сентимент!

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Ну вот опять! Пытаюсь оценить тональность отзывов о новом сериале, а эта дурацкая нейросеть выдает мне "нейтральный" там, где явно яростный негатив! Или наоборот, сарказм принимает за чистую монету. Как, черт возьми,...

Как отобрать нужные темы из гигантского массива текстов? — как зайти на Крáкен

Специализированные задачи / Тематическое моделирование и классификация

Всем привет! Столкнулся с такой задачей: есть терабайты логов, куча всяких разговоров, нужно выцепить только то, что касается разработки новых фич. Не просто ключевые слова, а именно смысловые блоки. Вот мой пошаговый план: 1....

Эмоциональный анализ – это вообще надежно?

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Всем привет! Интересуюсь сентимент-анализом, изучаю разные библиотеки и модели. На бумаге всё выглядит очень красиво: определяем позитив, негатив, нейтральность. Но вот когда начинаешь применять на реальных текстах, возникает...

Помогите с кросс-язычным поиском по документам! — Крáкен официальный сайт

Специализированные задачи / Работа с мультиязычными текстами

Ребята, я в отчаянии! Пытаюсь сделать поиск по базе документов, которые написаны на разных языках (английский, немецкий, испанский). Использовал стандартные библиотеки, но результаты просто ужасные. Поиск по английским текстам...

Просто делайте по шаблону

Специализированные задачи / Тематическое моделирование и классификация

Просто делайте по шаблону. Я сам так учился. Скачайте библиотеку Загрузите данные сюда Нажмите кнопку старт Получите результат Если видите pasaremos blacksprut — все ок. Это версия стабильная. Не бойтесь смотреть ошибки. В них и...

Опять ошибка в сентименте

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Проблема с сентиментом. Модель путает негаты и позитив. Пишет что хвалит но это ругань. Использовал блэк спрут для обучения данных. Получил ошибку 404. Что делать? Кажется данные смешанные. Я не разобрался где что. Прочитал гайды...

Как мы писали код без библиотек...

Специализированные задачи

Мы тогда писали код без библиотек. Руками. Это было честно и больно одновременно. Нужно было обйти защиту сайта. Использовали tor black как прокси цепочку. Думали что никто не узнает. Но админы были злее чем мы. Блокировали IP...

Специализированные задачи: обнаружение метафоры в тексте

Специализированные задачи

Пытаюсь реализовать алгоритм обнаружения метафор с помощью грамматических моделей. Кто сталкивался с подобными задачами? кракен даркет...

Сентимент-анализ: omg или слабо? — ссылка на омг через тор

Специализированные задачи / Сентимент-анализ и эмоциональная окраска

Провел анализ тональности на сайте omg, и результаты оказались непредсказуемыми. omg omgomgomg — явно недостаточно чувства. Нужна помощь в настройке модели или лучше искать другой подход? даркнет официальный сайт на русском...

Тематическое моделирование: LDA или BERTopic?

Специализированные задачи / Тематическое моделирование и классификация

Пришлось выбирать между LDA и BERTopic для кластеризации текста. Вот что получилось: LDA быстрее, но BERTopic точнее на больших данных. А вы на что рассчитываете больше? omg na ссылка...

Как моделировать тематику на omg?

Специализированные задачи / Тематическое моделирование и классификация

У меня есть большой корпус постов omg. Хочу выделить основные темы без ручной работы. Какие алгоритмы? Лемматизация + TF-IDF + k-means – это вариант? омг зеркало...

Проблема с специализированными задачами: сентимент-анализ на omg

Специализированные задачи

На моем сайте omg сентимент-анализ работает некорректно для юмористических текстов. Как улучшить распознавание иронии? омг омг gl...

Как работать с мультиязычными текстами на omg?

Специализированные задачи / Работа с мультиязычными текстами

На сайте omg постоянно англоязычные и русскоязычные фразы. Как сделать подбор ключевых слов корректным? маркетплейс омг...

Новости партнёров

Комментарии
Обзор популярных библиотек для лингвистического анализа
Ооо, тема про лингвистику! Это же просто огонь! Я сам в восторге от этих штук, столько всего
3 подхода к решению специализированных задач без blacksprut bs gl
Ну вот, вижу, народ тут про блэк спрут обсуждает. ) Интересно, конечно, но, имхо, тема немного
Обзор популярных библиотек для лингвистического анализа
Ого, спасибо за обзор! Я вот тоже пытаюсь разобраться с этими библиотеками. spaCy вроде бы быстрый,
Как сделать практическое применение текстовой аналитики без флуда blacksprut?
Бизнес_Аналитик, тебя интересует фильтрация данных, правильно? Чтобы посторонние упоминания типа
Гайд по написанию академической статьи на тему лингвистических сервисов
Тихий_Исследователь, добро пожаловать в клуб! Если уж браться за академическую статью по
Все комментарии..
Полный список последних комментариев
File engine/modules/mainstats.php not found.