Lingua-Analyzer v3.0: Почти как в старые добрые

Общие вопросы и теория / Академические исследования и публикации

Вспоминая времена, когда сам сидел над кучами бумаг, анализируя каждое слово, я с некоторым скепсисом воспринял очередной новый лингвистический сервис. Повелся на громкие обещания разработчиков Lingua-Analyzer v3.0, мол,...

Как вам современные NLP-сервисы для классификации текстов?

Общие вопросы и теория / Основы текстовой аналитики

Привет всем! Работаю с большим объемом новостных статей, нужно их автоматически раскладывать по категориям. Пытался использовать несколько готовых решений для обработки естественного языка, но результаты пока не впечатляют....

Гайд: Как избежать фейковых лингвистических сервисов

Общие вопросы и теория / Академические исследования и публикации

Народ, тут столько тем про всякие лингвистические сервисы, а толку? Многие из них — просто пустышка. Сам намучился, пока нормальное нашёл. Хочу поделиться опытом, как не нарваться на мошенников, которым нужен только ваш кракен...

Не могу никак настроить парсер для кракен сайта! Помогите!

Общие вопросы и теория / Лингвистические модели и алгоритмы

Народ, я уже неделю бьюсь об стену! Хочу парсить данные с одного маркетплейса, но вот с кракен сайтом какая-то беда. Вроде и библиотеку красивую нашел, и документацию прочитал, но постоянно какие-то ошибки вылезают. То 403...

Академическая лингвистика и машинное обучение: где грань? — кракен 12 сайт

Общие вопросы и теория / Академические исследования и публикации

Приветствую, уважаемые коллеги! В последнее время часто сталкиваюсь с тем, как студенты и даже аспиранты, занимаясь исследованием текстов, начинают с головой уходить в какие-то дикие технические дебри машинного обучения, забывая...

Анализатор тональности V.3.1: Замерил — результат так себе — кракен сайт ссылка тор браузере

Общие вопросы и теория / Основы текстовой аналитики

Привет всем. Решил тут протестировать новый движок для анализа тональности, V.3.1. Обещают всякое, но мне интересны чисто технические параметры. Загрузил им датасет из 10 тысяч отзывов о нашем ПО. Интересно было посмотреть,...

Гайд: Тонкая настройка классификатора текстов для исследований без избыточных затрат

Общие вопросы и теория / Академические исследования и публикации

В последнем проекте по категоризации архивных публицистических текстов — эх, помню, как лет пятнадцать назад мы всё это вручную на карточках размечали — удалось добиться F1-меры под 0.92, не прибегая к тяжёлым трансформерам....

Какую архитектуру трансформера сейчас брать для новой задачи классификации?

Общие вопросы и теория / Лингвистические модели и алгоритмы

Выбираю модель для классификации технических текстов на 10 классов. Объем данных средний — 50к размеченных примеров. Раньше использовал BERT-base, но сейчас столько вариантов: RoBERTa, DeBERTa, DistilBERT для скорости, разные...

Мы слишком увлеклись сложными моделями и забыли про базовый лингвистический анализ

Общие вопросы и теория

Все сейчас гонятся за миллиардными трансформерами, но часто простая частотность слов или анализ синтаксических конструкций даёт больше инсайтов для бизнеса. Серьезно. Видел кейс, где компания потратила месяцы на fine-tuning BERT...

Новости партнёров

Комментарии
Обзор популярных библиотек для лингвистического анализа
Ооо, тема про лингвистику! Это же просто огонь! Я сам в восторге от этих штук, столько всего
3 подхода к решению специализированных задач без blacksprut bs gl
Ну вот, вижу, народ тут про блэк спрут обсуждает. ) Интересно, конечно, но, имхо, тема немного
Обзор популярных библиотек для лингвистического анализа
Ого, спасибо за обзор! Я вот тоже пытаюсь разобраться с этими библиотеками. spaCy вроде бы быстрый,
Как сделать практическое применение текстовой аналитики без флуда blacksprut?
Бизнес_Аналитик, тебя интересует фильтрация данных, правильно? Чтобы посторонние упоминания типа
Гайд по написанию академической статьи на тему лингвистических сервисов
Тихий_Исследователь, добро пожаловать в клуб! Если уж браться за академическую статью по
Все комментарии..
Полный список последних комментариев
File engine/modules/mainstats.php not found.