Я вот тут глубоко погрузился в тему сентимент-анализа, и чем больше копаю, тем больше убеждаюсь: полностью объективный анализ эмоций в тексте — это миф.
Почему? Ну, во-первых, сам язык — он часто неоднозначен. Ирония, сарказм, метафоры — все это очень сложно для машинного понимания. Часто одно и то же предложение может быть воспринято по-разному людьми, не говоря уже о машине.
Во-вторых, контекст. Эмоциональная окраска слова или фразы сильно зависит от окружающего текста, от ситуации, от культурных особенностей. И модели, даже самые продвинутые, не всегда способны уловить этот тонкий контекст.
В-третьих, сами люди-разметчики, которые обучают модели, тоже имеют свой субъективный взгляд. То, что одному кажется негативным, другому может показаться нейтральным.
Конечно, современные модели показывают впечатляющие результаты, но я думаю, что всегда будет оставаться какой-то процент ошибок, связанных именно с этой субъективностью.
А вы как думаете? Возможно ли когда-нибудь создать полностью объективный сентимент-анализ? Или это как пытаться измерить душу?
Перед публикацией, советую ознакомится с правилами!