София
София

About the vacancy

Our client is one of the biggest online retailers worldwide with an annual revenue of £1 billion. Over the years we helped the client develop web-portals, mobile apps, delivery control systems, staff management tools, data storage and much more. The systems we’ve built together are in operation 24/7, contributing to the client’s success.

Site Reliability Engineering is a new role, first introduced by Google, that combines the skills of developers and ops to deliver more reliable, scalable software. The goal is to analyze a diverse set of applications (primarily built using Java, Oracle, AWS, Google Cloud services and a number of other technologies) and bind them into a reliable self-healing suite, working within defined reliability requirements. This requires proactive work to ensure observability, analyze potential bottlenecks and suggest their fixes before they become a production incident.

Responsibilities

  • Analyze and improve the availability, latency, performance, and efficiency of the applications
  • Proactive support of production applications (both in-office and out of hours) across a range of domains, these are mainly written in Java and use Oracle databases.
  • Improve the monitoring and alerting of the applications
  • Capacity planning and provisioning
  • Improve and standardize build pipelines, identify and reduce any areas of manual toil through automation.
  • Consult in areas of reliability and scalability for the development of new applications.
  • Work together with teams in other departments to find solutions
  • Conduct periodic on-call duties

Must have

  • Expertise in designing, analyzing and troubleshooting large-scale distributed systems.
  • Good understanding of cloud technologies
  • Experience with algorithms, data structures, complexity analysis and software design.
  • Good understanding of Java, hands-on experience in troubleshooting nontrivial problems like multithreading race conditions, memory leaks, cache issues, etc
  • Good understanding of SQL, experience with query optimization and performance tuning
  • Good understanding of high load systems development practices, reliability measuring, failover processes
  • Understanding of microservices architecture, containers, orchestration frameworks
  • Deep understanding of Unix/Linux systems administration
  • Knowledge and understanding of network theory (MAC addresses, IP packets, DNS, OSI layers, and load balancing).
  • Ability to get to the root cause of problems and facilitate this approach within the team
  • Ability to conduct post mortems and learn from past failures.
  • Driving a constant measurable system improvement process
  • Good English communication and interpersonal skills

За работата в DataArt:

На първо място - хората

Взаимоотношенията в екипа се градят на взаимно уважение, независимо от различнията ни

  • Дългосрочно сътрудничество
  • Уважение към личността и свобода при взимането на решения
  • Гъвкаво работно време, уютен и модерен офис, възможност за работа от разстояние
  • Допълнително здравно осигуряване
  • Храна и напитки в офиса

Професионализъм

Възможност за развитие и реализация

  • Екип от квалифицирани професионалисти и работа по интересни проекти
  • Възможност за продължаващо обучение
  • Уроци по английски език
  • Добре развита вътрешна информационна система
  • Кариерно развитие

Гъвкавост

Възмоност да натрупате опит, да участвате в нови проекти и да се развивате

  • Наемаме хора на постоянен договор, а не за отделен проект
  • При нас няма стриктна йерархия
  • Без заповеди и строги правила
  • Дори и да растем и да се променяме, основните ценнисти, залегнали в политиката на DataArt, остават същите
  • Възможност да работите от различни точки на света, в които DataArt има офис. Ние ще ви окажем съдействие за временна или постоянна релокация

Доверие

Ние разчитаме един на друг и нашата политика е свързана с доверие, тъй като смятаме, че хората са основна ценност за една компания

  • Ролята на мениджърите в DataArt е да създават среда, в която хората да са способни да взимат свои собствени решения
  • Справедливи правила и политики, даващи равни условия на всеки член на екипа
  • Не толерираме надмощието и конкуренцията между колегите, вместо това стимулираме способността да се работи в екип

Не виждате подходяща позиция?

Изпратете ни автобиографията си, а ние ще отговорим с интересни предложения

Изпрати

Не виждате подходяща позиция?

Изпратете ни автобиографията си, а ние ще отговорим с интересни предложения

Изпрати