Не могу никак настроить парсер для кракен сайта! Помогите!

Народ, я уже неделю бьюсь об стену! Хочу парсить данные с одного маркетплейса, но вот с кракен сайтом какая-то беда. Вроде и библиотеку красивую нашел, и документацию прочитал, но постоянно какие-то ошибки вылезают. То 403 Forbidden, то вообще ничего не возвращается.

Пытался менять user-agent, ставить задержки между запросами, даже через прокси пробовал – всё тщетно. Может, кто-то сталкивался с таким? Есть ли какие-то хитрости или рабочие ссылки на кракен, чтобы парсинг прошел гладко? Устал уже от этих бесконечных попыток. Или, может, посоветуете другой инструмент, который с такими вещами справляется?

ссылка на кракен в браузере

Подробнее

Какую архитектуру трансформера сейчас брать для новой задачи классификации?

Выбираю модель для классификации технических текстов на 10 классов. Объем данных средний — 50к размеченных примеров.

Раньше использовал BERT-base, но сейчас столько вариантов: RoBERTa, DeBERTa, DistilBERT для скорости, разные национальные BERT-ы. Есть даже специализированные, типа SciBERT.

Есть ли какой-то условный «золотой стандарт» 2026 года для таких задач, или всё ещё нужно перебирать и смотреть по валидации? Посоветуйте, пожалуйста, с чего начать эксперименты.

Подробнее