На просторах интернета нашел интересный дашборд
для Proxmox VE и Backup
Мне очень зашел на сейчас пока я не дошел до прикручивания графаны, но пока очень информативно и красиво выглядит для тех, кто хочет понимать что происходит с сервисами.
Но самый кайф тут будет от мониторинга если вы используете Proxmox для построения сервисов, не K8S или всякие runtpi а именно ProxmoxVE (больше скринов тут)
Что умеет:
- Работать как с хостами, так и с кластером (мой случай):
- Показывать ресурсы нод
- Выводить список виртуалок и контейнеров с отображением ресурсов как в виде прогрессбара, так и графиками
- Выводить состояние стораджей
- Показывать снепшоты
- Информацию по бекапам в PBS
- Информацию по стораджам
- Делать какие-то нотификации, пока не понял какие и как настраивать
Что не умеет:
- Вносить изменения в PVE - тут чисто мониторинг в режиме только для чтения
- Аутентификацию, я прикрутил traefik proxy и ок, тем более, что ролевки все равно нет
- Стабильно работать, мне показалось, что как-то не быстро загружается и не всегда, например, те же снепщоты просто висит Loading…
Лично я для себя для дома пока остановился на следующем варианте
- Proxmox VE Cluster из нескольких машин
- VM для PBS и TrueNAS
- LXC для сервисов, причем, LXC + Alpine Linux + Docker + Docker compose дает минимальный оверхед меньше 1% CPU, 90MB RAM, 100MB HDD
- LXC без докера если это не надо, например Qbittorrent замечательно работает в LXC контейнере с Alpine Linux, при этом там самая актуальная версия из всех дистрибутивов, а сам контейнер весит очень мало
- LXC контейнеры бекапятся в PBS
- в docker-compose.yml есть еще proxmox-backup-client, который аккуратно бэкапит файлы в PBS
- Ansible для деплоя и провижининга LXC контейнеров
- (В процессе) Komodo для управления стеками внутри LXC контейнеров, compose файлы лежат в Forgejo и CI/CD шатся в LXC контейнеры
- (не до конца) На каждой ноде PVE есть LXC контейнер c Traefik + Consul + VRRP. Локальный DNS направляет трафик на Traefik на одной с сервисом ноде, конфигурация traefik находится в гите и деплоится в кластер
- crowdsec + grafana + Loki для сбора метрик и fail2ban