DevOps-инженер в Единое хранилище данных

Moscow, Saint Petersburg, Novosibirsk, YekaterinburgLinux, Python, Go, C++InfrastructureSpecialist, Leading specialist
Яндекс – это огромное количество информации, сетевого трафика и различных паттернов работы с данными.
Один из фундаментальных инфраструктурных сервисов — Единое хранилище данных Яндекса. Это решение используется в огромном количестве внешних и внутренних сервисов Яндекса, которым необходимо хранить самые разные данные:
  • Диск,
  • Почта,
  • Видео,
  • Карты,
  • Yandex.Cloud Object Storage,
  • Маркет/Auto.ru и многие-многие другие.
Мы ищем DevOps-инженера в команду Единого хранилища данных Яндекса. У вас будет возможность развивать сервис, регулярно решая задачи, связанные с эксплуатацией, автоматизацией и масштабированием хранилища.
Вы будете работать над системой, обрабатывающей сотни тысяч запросов в секунду, хранящей экcабайты данных и распределяющей сотни гигабит трафика.

Что нужно делать:

  • обеспечивать отказоустойчивость и бесперебойную работу сервиса для пользователей 24/7/365;
  • решать задачи автоматизации большого количества процессов, обеспечивающих работу хранилища;
  • заниматься текущим масштабированием постоянно растущей системы;
  • решать амбициозную задачу масштабирования хранилища на десятки тысяч хостов;
  • работать над эффективностью и производительностью сервиса;
  • обеспечивать минимальное время ответа сервиса;
  • заниматься улучшением пользовательского опыта взаимодействия с хранилищем;
  • оптимизировать ресурсы, используемые хранилищем.

Мы ждем, что вы:

  • имеете опыт администрирования Linux-серверов;
  • знаете сетевые протоколы TCP/IP;
  • знаете Python, Go или С++;
  • имеете опыт работы с Git или SVN;
  • имеете опыт работы с виртуализацией (LXC, LXD, Docker, Qemu-KVM и т. д.);
  • имеете хорошие коммуникативные навыки (умеете обосновать предлагаемое решение и обсудить детали реализации);
  • ответственны и аккуратны.

Будет плюсом, если вы:

  • имеете опыт работы с базами данных (MySQL, PostgreSQL, ClickHouse, MongoDB, etc.);
  • имеете опыт работы с распределенными хранилищами данных;
  • имеете опыт построения высоконагруженных сервисов;
  • умеете работать с системами управления конфигурациями (Ansible, Salt, Chef);
  • имеете опыт распределения трафика от сотен гигабит.