Исправлены критические проблемы в health-check-alerting.sh: 1. check_backup_status: Исправлено определение последнего snapshot - Было: grep | tail | cut (брал первый time из JSON) - Стало: python3 парсинг JSON массива (берет snapshots[-1]) - Теперь видит актуальный бэкап от 2025-11-07 14:37 2. check_container_restarts: Добавлена проверка uptime - Теперь алертит только если uptime < 24h для >10 рестартов - Или uptime < 48h для >5 рестартов - realtime-dev.supabase-realtime (uptime: 63h) больше не алертит 3. check_backup_status: Улучшена проверка локальных бэкапов - Изменено с days на hours для более точного контроля Настроено расписание cron: - Было: Каждые 30 минут (*/30 * * * *) - Стало: Дважды в день в 10:00 и 19:00 (0 10,19 * * *) Результаты тестирования: - ✅ Restic backup OK: 0h old (было: 8 days old) - ✅ Local DB backup OK: 0h old - ✅ Container restarts: нет алертов (было: 2 critical) - ⚠️ 1 warning: Too many R2 snapshots (некритично) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com> |
||
|---|---|---|
| .. | ||
| 00-infrastructure | ||
| 01-security | ||
| 02-core | ||
| 03-business | ||
| 04-tools | ||
| 05-backups/scripts | ||
| infrastructure-docs | ||
| postiz-config | ||
| fix_odoo_pass.py | ||