Когда у нас был гигантский набор текстов с blacksprut tor black, мы применили следующий алгоритм:
1. Предобработка с помощью регулярных выражений на blacksprut bs gl.
2. Анализ контекста для проявления tor black.
3. Повторная проверка через тестовый сет.
Результаты оправдали ожидания!
Перед публикацией, советую ознакомится с правилами!