Online deep learning в рекламе — одно из самых перспективных направлений в улучшении качества рекламы и увеличении доходов Яндекса. Online learning — это обучение моделей с небольшим отставанием от прода и регулярным обновлением.
Tasks that await you
near-realtime GPU обучение — необходимо перевести продакшен-обучение на обработку реалтаймовых логов и максимально ускорить довоз моделей до продакшен-сервисов;
online learning на историях действий — научиться делать качественные инкрементально дообучаемые sequence-модели (BERT-like модели, классические рекурентные);
end-to-end обучение рекламы. Реклама — это огромная система с кучей взаимодействующих деталей: отбор кандидатов, предсказание клика и ранжирование, прогноз денег от показов, наконец, сам аукцион. Мы хотим взять все эти разрозненные задачи, обучающиеся под разные таргеты на разных логах с разными фичами, и сделать одну end-to-end модель, знающую сразу про все. И внедрить ее!
We expect that you
знание Python/C++. Хотя бы на одном языке нужно иметь опыт продакшен-разработки;
глубокое понимание хотя бы одного современного deep learning фреймворка. Работать будем на PyTorch, но мы уверены: если досконально разобрались в любом фреймворке, в торче тоже разберетесь;
понимание того, как строятся современные нейросетевые архитектуры для какого-либо класса задач. Мы разрабатываем рекомендательные системы, но важно, чтобы кандидат глубоко понимал хотя бы одну область задач, а там разберемся;
опыт обучения и внедрения нейросетевых архитектур в продакшен-сервисы.