Конференция для инженеров и всех, кто должен понимать инженеров

Как уронили кубы и как после этого стали тестировать Ansible

DevOps практики и культура

Управление конфигурацией
Непрерывное развертывание и деплой
Тестирование новых продуктов

Доклад отклонён

Целевая аудитория

DevOps, SRE

Тезисы

В докладе поделюсь опытом исправления критической ошибки в Ansible playbook, из-за которой происходил 'сброс' кластеров Kubernetes.
- Рассказ как использовать идею тестирования кода применимо к IaC
- Примеры как можно разрушить критические элементы инфраструктуры и что может последовать.
- Как идентифицировали и устранили эту ошибку, и какие шаги предприняли для предотвращения подобных проблем в будущем.
- Насколько важно тестировать Ansible playbooks, особенно в контексте их взаимодействия с другими инструментами с примерами.
- Практические советы по обеспечению надёжности инфраструктурного кода.

Более 25 лет в ИТ. От установки Linux с 3.5" дискет до обслуживания инфраструктуры с тысячами серверов. Побывал в роли Team/Tech Lead DevOps команды в ML проекте. Сейчас ведущий инженер в кластерной команде которая обслуживает инфраструктуру для продуктов Vi.Tech

Vi.Tech

Vi.Tech — это дочерняя компания ВсеИнструменты.ру, в которой делают IT-продукты для одного из крупнейших игроков на рынке e-commerce.

Видео

Другие доклады секции

DevOps практики и культура