За последнее время столько слышу про тематическое моделирование – LDA, NMF и всякие прочие. Говорят, помогает понять, о чем пишут пользователи, какие темы актуальны. Но вот когда сам пытаешься применить, результаты часто получаются довольно... ну, странными. То есть, вроде бы темы выделяются, но они либо слишком общие, либо перемешанные так, что смысла никакого нет. Может, я что-то не так делаю, или это действительно такой инструмент, который требует очень тонкой настройки и большого объема данных, чтобы хоть что-то путное получилось? Интересно ваше мнение, особенно если у вас есть успешные кейсы. Может, есть какой-то работающий Крáкен зеркало, где собраны лучшие практики?
Перед публикацией, советую ознакомится с правилами!