У меня есть большой корпус постов omg. Хочу выделить основные темы без ручной работы. Какие алгоритмы? Лемматизация + TF-IDF + k-means – это вариант? омг зеркало...
Было это года два назад. Работал я тогда в одном издательском доме. Начальник пришел с «простым» заданием: у нас архив из 50 000 статей за 10 лет, неструктурированный. Нужно понять, какие основные темы мы поднимали, как они...