Я вот тут работаю с большим объемом юридических документов, в основном договорами. Пытаюсь настроить автоматическое извлечение ключевых условий, сроков, сумм, сторон. И знаете, что я думаю? Это какой-то ад.
Модели вроде бы и работают, но постоянно дают сбои. То дату договора в срок окончания договора запишут, то сумму увидит там, где ее нет. Пытался использовать готовые библиотеки, типа spaCy с правилами, но юристы вносят такие формулировки, что ни одна регулярка не справится. Даже тонкая настройка под конкретные типы договоров занимает массу времени.
На мой взгляд, полная автоматизация обработки таких сложных документов, как договоры, пока невозможна Всегда нужен человек, который проверит. А вы как думаете? Может, я просто не нашел нужный инструмент, или мои ожидания слишком завышены?
Перед публикацией, советую ознакомится с правилами!