ML-разработчик для нейросетевых рекомендательных систем

MoscowC++, PythonAdvertisingSpecialist, Leading specialist
Online deep learning в рекламе — одно из самых перспективных направлений в улучшении качества рекламы и увеличении доходов Яндекса. Online learning — это обучение моделей с небольшим отставанием от прода и регулярным обновлением.

Задачи, которыми надо будет заниматься.

  • Near-realtime GPU обучение — необходимо перевести продакшен-обучение на обработку реалтаймовых логов и максимально ускорить довоз моделей до продакшен-сервисов.
  • Online learning на историях действий — научиться делать качественные инкрементально дообучаемые sequence-модели (BERT-like модели, классические рекурентные).
  • End-to-End обучение рекламы. Реклама — это огромная система с кучей взаимодействующих деталей: отбор кандидатов, предсказание клика и ранжирование, прогноз денег от показов, наконец, сам аукцион. Мы хотим взять все эти разрозненные задачи, обучающиеся под разные таргеты на разных логах с разными фичами, и сделать одну end-to-end модель, знающую сразу про все. И внедрить ее!

Мы ждем, что у вас есть:

  • знание Python/C++. Хотя бы на одном языке нужно иметь опыт продакшен-разработки;
  • глубокое понимание хотя бы одного современного deep learning фреймворка. Работать будем на PyTorch, но мы уверены: если досконально разобрались в любом фреймворке, в торче тоже разберетесь;
  • понимание того, как строятся современные нейросетевые архитектуры для какого-либо класса задач. Мы разрабатываем рекомендательные системы, но важно, чтобы кандидат глубоко понимал хотя бы одну область задач, а там разберемся;
  • опыт обучения и внедрения нейросетевых архитектур в продакшен-сервисы