Разработчик объектного поиска

Saint PetersburgC++, PythonSearchSpecialist
Яндекс помогает миллионам пользователей решать свои повседневные задачи: от выбора фильма и покупки билета в кино до планирования отпуска в незнакомой стране. Некоторые из этих задач носят информационный характер, другие приводят к необходимости долгого выбора.
Многие из этих задач связаны с объектами, существующими в реальном мире: фильмами, людьми, книгами, достопримечательностями, играми, музыкой, животными и т. п.
Наша команда занимается автоматическим сбором данных и построением базы таких объектов. Информация об объектах приходит из большого количества источников – Википедия, Кинопоиск, Яндекс.Музыка, специализированные сайты с данными и т. п. А затем сливается в объекты, обогащается, уточняется и приходит пользователю Яндекса в различных сценариях.

Примеры задач, которые решает наша команда:

  • Как обогатить данные по объектам и установить правильные связи между ними?
  • Как понять, что страницы про художника на двух разных сайтах – это страницы про один и тот же объект?
  • Как быстро подключить новый источник информации к базе?
  • Как наиболее эффективно сериализовать объект для нужд процесса сборки?
  • Как обеспечить свежесть и актуальность данных по объектам?
  • Как построить правильную модель иерархии для того или иного типа объектов?

Что нужно делать:

  • совершенствовать инфраструктуру сборки объектной базы, улучшать качество данных, дополнять эти данные для создания новых возможностей использования объектного ответа в различных сценариях поиска.

Мы ждем, что вы:

  • знаете Python и С++;
  • знаете базовые алгоритмы и структуры данных.

Будет плюсом:

  • опыт применения машинного обучения.