Разработчик качества Справочника

Moscow, Saint PetersburgC++, Python, JavaBusiness directory, MapsSpecialist
Справочник организаций по сути своей является контент-системой для геопоиска. Ежедневно нам поступают сотни тысяч сигналов об организациях на картах: люди оставляют фидбек, операторы call-центра актуализируют информацию о наиболее важных компаниях, нам поступает поток информации из интернета.
Весь этот объем информации нужно уметь обрабатывать:
  • объединять сигналы об одной и той же организации, чтобы на картах не появлялись нежелательные дубликаты;
  • применять только те обновления, которые произошли в реальности;
  • эффективно организовывать процесс актуализации, не звоня слишком часто в компании.

Что нужно делать:

  • майнить (собирать) данные об организации из веба (нам же доступна вся контент-система большого поиска);
  • создавать метрики качества работы Справочника организаций;
  • разрабатывать алгоритмы унификации разнородных данных (адреса, телефоны и т. п.);
  • заниматься поиском адресных точек в базе в распределенной системе (например, MapReduce);
  • оптимизировать работу call-центра — нам очень хочется соблюдать высокий SLA, чтобы операторы всегда могли бесперебойно осуществлять свою работу.

Мы ждем, что вы:

  • пишете на C++, Python;
  • знаете классические алгоритмы и структуры данных, принципы функционирования распределенных систем;
  • имеете опыт в программировании на Java (в данный момент большая часть кодовой базы Справочника написана именно на этом языке).