Наша команда разрабатывает realtime pipeline обработки и анализа данных о пользовательском поведении на сервисах Яндекс.Поиска.
Мы ищем специалиста для разработки инфраструктуры и внедрения новой функциональности в персонализацию поиска и ранжирование.
Tasks that await you
писать код для потоковой агрегации данных о взаимодействии пользователей Яндекса с поисковой выдачей (запросы, клики, перезапросы и т. д.);
придумывать новые способы извлекать из этих данных полезный сигнал, который улучшает персонализацию поиска и ранжирование (т. е. используется в ML-формулах);
ускорять доставку сигнала до поискового рантайма;
помогать смежным командам (рекомендации, Маркет, Турбо) улучшать качество их продуктов на основании наших данных, факторов и ML-моделей.
We expect that you
хорошо знаете С++ и STL (или аналогично на Java и C#, но разрабатывать предстоит на С++);
хорошо знаете классические алгоритмы структуры данных;
имеете опыт многопоточного программирования.
It'd be a plus if you
имеете опыт в Machine Learning и Data Science;
занимались системами распределенной обработки данных;
работали над нагруженными runtime-компонентами;
имеете опыт работы с высокой нагрузкой (десятки тысяч запросов в секунду).
Our benefits
сильная команда, с которой можно расти;
сложные задачи для сервисов с миллионами пользователей;
возможность влиять на процесс и результат;
зарплата на уровне рынка и выше;
премии каждые полгода для всех, кто успешно прошел ревью;
ипотечные программы;
компенсация оплаты питания;
расширенная программа ДМС: оплата 80% стоимости ДМС для супругов и детей;