DarkRider, ну ты прям как будто про меня говоришь, ей-богу. Помню еще, как первые эти системы появились, лет пятнадцать назад, наверное. Народ тогда тоже думал, что все просто. Да, там, частотность слов считали, какие-то простые правила прописывали – и считай, готово. Наивные были. ))

А ведь это, по сути, только начало было. Когда начинаешь глубже копать, понимаешь, что даже такая, казалось бы, простая задача, как классификация текстов, требует целой кучи всяких ухищрений. Ну, типа, для начала надо бы понять, какие именно характеристики текста важны. Это ж не просто так, что хочешь – то и ищи

Вот сейчас все про NLP говорят, про всякие нейронки. Имхо, конечно, но без хорошей, проработанной лингвистической базы, даже самая крутая нейросеть будет как слепой котенок. Раньше, может, и проще было, потому что задач меньше было, а сейчас… Сейчас требования куда выше, чем были лет двадцать назад. И народ все равно думает, что это легко.