👋 Hi, I'm Vitalii Philyuchkoff, SRE Head at the largest provider of cloud and AI technologies in Russia
Service for create SLOs (Service Level Objectives) in OpenSLO format with full alerting support
My book about Site Reriability Engineering for non-engineers (in Russian)
🆕 Recent
- Как я боролся с OOM Killer в моем приложении
- Как читать книги про SRE, чтобы они приносили пользу
- SRE Agent: доверять нельзя контролировать
- Происходит нечто грандиозное
📖 All Articles (40+)
- From Signals to Reliability: SLOs, Runbooks and Post-Mortems
- Что такое Reliability Block Diagrams (RBD)
- Resilience Engineering
- Деградация vs сбой
- Эволюция SRE в Google
- How to Build Software like an SRE
- “Надежность” и “Доступность” — в чём разница?
- Гарантии безотказной работы — практический подход
- Пошаговое руководство по расчету SLA, SLI и SLO
- How Complex Systems Fail / Как падают сложные системы
- Bad Observability
- Правило 10x/9
- Staff Engineer: Leadership Beyond the Management Track
- Maker’s Schedule, Manager’s Schedule
- An Elegant Puzzle: Systems of Engineering Management
- High Output Management
- The Hard Thing About Hard Things
- Партизанское руководство по проведению собеседований (v3.0)
- Как работает Load Average
- Как работает OOM-Killer
- Что такое файловый дескриптор
- Exit codes Docker-контейнеров
- 5 вариантов использования curl
- Использование Caddy
- Grafana + Prometheus: обнаружение аномалий
- Полное руководство по управлению Grafana as code
- WAL-G — инструмент для управления бэкапом БД
- Хорошо спроектированное ПО должно быть «слишком простым»
- SLI Compass: точность и детализация
- Что такое и как работает перцептрон
- Дилемма повторных попыток подключения


