Старший разработчик-исследователь в команду анализа пользовательского поведения

MoscowMachine learning, C++Leading specialist
Множеством сервисов Яндекса ежедневно пользуются десятки миллионов людей: задают запросы в Поиск, общаются с Алисой, смотрят фильмы и сериалы в Яндекс.Эфире, читают публикации в Яндекс.Дзене, слушают музыку в Яндекс.Музыке, заказывают доставку в Яндекс.Еде.
Мы можем на основе этой информации делать взаимодействие пользователя с нашими сервисами более персонализированным, например показывать интересный ему контент. Для этого необходимо из истории пользовательских действий, доступной Яндексу, построить полноценную модель пользователя. Так каждый отдельный сервис сможет лучше понимать пользователя.
Мы придерживаемся идеологии distributed representations и поэтому применяем все самые новые способы анализа последовательностей из областей NLP и рекомендаций, в том числе подходы attention-based, например BERT, и RNN-based. Улучшения в этих базовых моделях могут отражаться на качестве сразу во многих сервисах.
Важно гарантировать приватность пользовательских данных на всех этапах конвейера: при подготовке данных, обучении и предсказании в рантайме.

Мы очень хотели бы, чтобы вы:

  • понимали принципы машинного обучения;
  • имели опыт решения прикладных задач с помощью технологий Deep Learning, в частности в областях NLP или рекомендаций;
  • имели опыт работы с одним из фреймворков Deep Learning (TensorFlow, PyTorch, Caffe или другие);
  • интересовались последними публикациями в области Deep Learning (не обязательно только в сфере NLP);
  • имели хорошую алгоритмическую подготовку.

Плюсом будет, если вы:

  • знаете C++, потому что иногда вам придется что-то внедрять в боевой продакшен;
  • умеете работать с большими объемами данных (мы считаем, что набор репрезентативного и как можно более чистого обучающего множества — это один из ключей к успеху).