BERT и его потомки: лучшее, что случалось с NLP?

Общие вопросы и теория / Лингвистические модели и алгоритмы

Ну вот реально, после BERT’а какой-то прорыв случился. Эти трансформеры – это ж магия! Раньше модели были такие, ну типа, ограниченные, а сейчас понимание контекста на совершенно другом уровне. Вот если взять тот же RuBERT или...

С чего начать новичку в текстовой аналитике? Гайд от старой школы.

Общение / Помощь новичкам и FAQ

Эх, помню, как я начинал… Тогда и интернета такого не было, а про всякие Крáкен ссылки вообще молчу. Но суть одна: надо базу заложить. Если вы совсем зеленые, то вот вам мой совет: Основы Python. Без него никуда, это язык...

Ищу партнера для проекта по NLP: есть идея, нет рук!

Общение / Знакомства и коллаборации

Народ, привет! Сижу уже неделю, мозгую над одним проектом в области семантического анализа, но одному как-то тяжко. Нужна помощь опытного разработчика или просто энтузиаста, который шарит в питоне и библиотеках типа NLTK или...

Новостной поток: как отделить зерна от плевел

Практическое применение / Анализ социальных медиа и новостей

У меня тут дилемма образовалась: как анализировать огромные массивы новостей, чтобы вычленять действительно что-то стоящее? Каждый день потоки информации такие, что просто мозг кипит. И ведь нужно не просто счетчик публикаций...

Что такое вообще 'лингвистическая модель' простыми словами?

Общие вопросы и теория

Ребят, привет! Я тут случайно наткнулся на ваш форум и меня очень заинтересовала тема текстовой аналитики. Но я совсем новичок, и многие термины пока что не понятны. Вот, например, говорят про 'лингвистические модели'....

Обучение моделей на данных из интернета: почему это почти всегда плохо

Практическое применение / Образование и обучение моделей

Ну, типа, все же мы знаем, что для обучения модели нужны данные. И самый простой способ их добыть — это взять откуда-то из сети. На парсить, например. Но тут есть подвох, друзья. Большинство данных из интернета — это просто...

Ищу соавтора для проекта по анализу научных статей — Крáкен официальный сайт

Общение / Знакомства и коллаборации

Привет, сообщество! Меня зовут Андрей, занимаюсь NLP уже пару лет. Сейчас работаю над интересным проектом, связанным с автоматической классификацией научных публикаций по областям знаний. Ищу единомышленника, кто также увлечен...

Все эти модели... Как вообще начать?

Общение / Помощь новичкам и FAQ

Привет всем! Я совсем новичок в текстовой аналитике. Смотрю на все эти библиотеки, модели, алгоритмы – голова кругом. Кажется, что пройти этот путь от нуля до какого-то понятного результата нереально. Мой главный страх – это...

Как я собрал свой мини-сервис для анализа тональности за выходные

Инструменты и технологии / Разработка собственных инструментов

Всем привет! Хочу поделиться опытом создания собственного небольшого инструмента для анализа тональности текста. Это может быть полезно, если вам нужно что-то очень специфичное, чего нет в готовых решениях, или вы просто хотите...

NLTK устарел? Пора переходить на spaCy!

Инструменты и технологии / Популярные библиотеки и фреймворки

Серьезно, коллеги, я тут недавно попробовал снова покопаться в NLTK для рутиненрых задач, и это просто боль. Столько сайд-эффектов, медленная работа, и вообще все какое-то громоздкое. spaCy же, напротив, дико быстрый, элегантный...

Новости партнёров

Комментарии
Обзор популярных библиотек для лингвистического анализа
Ооо, тема про лингвистику! Это же просто огонь! Я сам в восторге от этих штук, столько всего
3 подхода к решению специализированных задач без blacksprut bs gl
Ну вот, вижу, народ тут про блэк спрут обсуждает. ) Интересно, конечно, но, имхо, тема немного
Обзор популярных библиотек для лингвистического анализа
Ого, спасибо за обзор! Я вот тоже пытаюсь разобраться с этими библиотеками. spaCy вроде бы быстрый,
Как сделать практическое применение текстовой аналитики без флуда blacksprut?
Бизнес_Аналитик, тебя интересует фильтрация данных, правильно? Чтобы посторонние упоминания типа
Гайд по написанию академической статьи на тему лингвистических сервисов
Тихий_Исследователь, добро пожаловать в клуб! Если уж браться за академическую статью по
Все комментарии..
Полный список последних комментариев
File engine/modules/mainstats.php not found.