Эх, помню я еще, как первые мои шаги в программировании были связаны с обработкой текстов. Это было… ну, скажем так, не совсем то, что сейчас называют модным NLP. Тогда мы кодили на чем-то вроде Паскаля, и любая задача, связанная...
Решил попробовать текстовый анализ для своего небольшого проекта. Нашел какой-то онлайн сервис, там обещали классификацию текстов по эмоциям – простенький NLP, казалось бы. Загрузил свою статью, пару постов из соцсетей. Жду....
Ребята, SOS. Делаю парсер для форумов по игровой тематике — там часто пишут на ломаном англо-русском, типа «го в раш, бро» или «Этот читер такой лузер» Пробовал стандартный токенизатор из nltk для английского — он разрывает...