Всем привет! Столкнулся с такой задачей: есть терабайты логов, куча всяких разговоров, нужно выцепить только то, что касается разработки новых фич. Не просто ключевые слова, а именно смысловые блоки.
Вот мой пошаговый план:
Главное – не бояться экспериментировать с параметрами LDA и интерпретировать результаты. Это не всегда автоматический процесс. А если кто-то знает, как сделать лучше, или есть готовые решения, поделитесь!
Перед публикацией, советую ознакомится с правилами!