Всем привет! Накипело, сил нет. Работаю в компании, где куча бумаг, которые надо бы перевести в цифровой вид и рассортировать по категориям. Руками это делать – ад кромешный, сам понимаешь. Решил автоматизировать.
Начал с того, что нашел какой-то генератор моделей, который вроде как обещал золотые горы. Покормил его сотней документов, запустил. Результат – такая чушь, что смешно. Модель путает совершенно разные типы документов, классифицирует их наугад. Может, я что-то неправильно делаю?
Пробовал разные параметры, разные библиотеки – результат тот же. В общем, пока я в тупике. Может, кто-нибудь сталкивался с подобным? Поделитесь, как вы вообще решаете задачи автоматической классификации документов? Есть ли какие-то проверенные рабочие схемы или сервисы, которые реально помогают, а не просто занимают место на диске? Мне бы хоть какую-нибудь ссылку на Крáкен, где можно посмотреть примеры успешных кейсов
Перед публикацией, советую ознакомится с правилами!