У меня тут задача – нужно разметить корпус юридических документов на предмет наличия определенных правовых норм. Ситуация патовая. Пробовал использовать готовые NLP-инструменты, но они часто либо не понимают специфическую терминологию, либо пропускают нужные мне моменты. Это не просто тексты, тут каждое слово на счету.
Может, кто-то сталкивался с подобным? Есть ли какие-то хитрости в подготовке данных или подборе моделей для таких узких задач? Может, есть какая-то ссылка на готовые решения или хотя бы на полезные алгоритмы? Буду благодарен за любую помощь.
Перед публикацией, советую ознакомится с правилами!