Как уронили кубы и как после этого стали тестировать Ansible
Доклад отклонён
Целевая аудитория
Тезисы
В докладе поделюсь опытом исправления критической ошибки в Ansible playbook, из-за которой происходил 'сброс' кластеров Kubernetes.
- Рассказ как использовать идею тестирования кода применимо к IaC
- Примеры как можно разрушить критические элементы инфраструктуры и что может последовать.
- Как идентифицировали и устранили эту ошибку, и какие шаги предприняли для предотвращения подобных проблем в будущем.
- Насколько важно тестировать Ansible playbooks, особенно в контексте их взаимодействия с другими инструментами с примерами.
- Практические советы по обеспечению надёжности инфраструктурного кода.
Более 25 лет в ИТ. От установки Linux с 3.5" дискет до обслуживания инфраструктуры с тысячами серверов. Побывал в роли Team/Tech Lead DevOps команды в ML проекте. Сейчас ведущий инженер в кластерной команде которая обслуживает инфраструктуру для продуктов Vi.Tech
Vi.Tech
Видео
Другие доклады секции
DevOps практики и культура