Исследователь-разработчик в Поиск

MinskC++SearchSpecialist
Благодаря постоянным усовершенствованиям алгоритмов ранжирования люди могут за считаные секунды получать ответы на сложные и замысловатые вопросы. Мы предлагаем вам возможность работать в команде, от которой напрямую зависит качество поисковой выдачи Яндекса.
По сути дела, наша работа — это непрерывное соревнование по машинному обучению. Базовый уровень, который мы стараемся превзойти, невероятно высок: согласно метрикам качества, алгоритм веб-ранжирования Яндекса часто оказывается впереди конкурентов в русскоязычном сегменте. Поэтому каждый новый шаг в улучшении дается непросто, но мы следим за последними результатами в смежных научных областях и используем передовой опыт в своих экспериментах и внедряемых моделях.

Вам предстоит:

  • близко познакомиться с инфраструктурой Поиска — ключевого сервиса Яндекса;
  • ежедневно обрабатывать колоссальные объемы данных;
  • реализовывать свои идеи от прототипа через эксперименты и оценку внедряемости до продуктового кода, который будет работать при каждом запросе в поиске Яндекса;
  • применять свои знания машинного обучения для анализа самых разнообразных пользовательских запросов;
  • находить закономерности в поведении пользователей, используя множество поисковых логов;
  • в составе большой команды единомышленников участвовать в подготовке таких запусков, как «Палех» и «Королёв»;
  • увидеть пользу от проделанной работы на графиках возвращаемости пользователей.

Для работы вам понадобятся:

  • уверенные знания C++ и STL (большая часть программного кода в Поиске написана на С++);
  • владение основными алгоритмами и структурами данных (эффективность кода критична как для поискового рантайма, так и для экспериментальных проектов: чем эффективнее решение, тем быстрее вы сможете проверить гипотезу);
  • знание основ машинного обучения и математической статистики, а также опыт их практического применения (вам не должны быть чужды термины «регрессия, классификация, кросс-валидация, нейронная сеть, математическое ожидание» и др., особенно приветствуется практический опыт решения задач автоматической обработки текстов);
  • опыт работы разработчиком или исследователем от одного года (мы особенно заинтересованы в людях, имеющих опыт в анализе неструктурированных данных и в машинном обучении).

Плюсами будут:

  • знакомство с нейронными сетями и глубоким обучением;
  • знание Python и bash;
  • опыт работы с моделью вычислений MapReduce.