AI в роли Junior SRE: как построить умного помощника для сложной инфраструктуры

Эксплуатация LLM

Логирование и мониторинг
Управление конфигурацией
Devops / другое
Управление инцидентами
Application security
DevOps / Кубер
Инфраструктура
Расширение кругозора

Программный комитет ещё не принял решения по этому докладу

Целевая аудитория

- DevOps и SRE инженеры, которые сталкиваются с большим потоком изменений и нехваткой времени на подготовку документации, runbook’ов, знаний для L2/L3; - Инженеры, поддерживающие сложные распределённые системы (k8s, сервис-мэш, multi-env инфраструктуры), где важно быстро собирать фактуру по системам; - Команды, заинтересованные в использовании AI-агентов для автоматизации анализа инфраструктуры, метрик, логов и документации; - Архитекторы, ведущие инженеры и тимлиды, которым важно централизовать знания о системе и снизить bus-factor.

Тезисы

Что если у вашей команды появится «junior SRE», который:
- понимает Kubernetes, код и мониторинг лучше большинства новичков,
- сам собирает фактуру по инциденту за минуты,
- знает архитектуру сервисов без устаревшей документации,
- и при этом работает строго в read-only режиме, не имея возможности что-либо сломать?

В докладе я покажу, как построить SRE-Copilot — AI-агента, который объединяет данные из k8s, Git, мониторинга и логирования, использует RAG и MCP, выполняет автоматический триаж, помогает с RCA и подсвечивает проблемы в конфигурациях, секретах, DNS и сервисных зависимостях.

Разберём архитектуру, реальные сценарии автоматизации и то, как AI-агенты позволяют SRE-командам работать быстрее, увереннее и качественнее — без дорогих проприетарных решений и без риска для продакшена.

DevOps/MLOps/LLMOps-инженер.

Видео