Global HomeLab News: Медленный PBS verify на NFS
✎В сообществе Proxmox разобрали кейс медленной верификации бэкапов в Proxmox Backup Server: ежедневный verify шёл около 8.5 часов при хранилище на Synology по NFS. При объёме проверки ~855 ГБ средняя скорость держалась на уровне 20–35 MiB/s, хотя 1GbE-линк не был полностью загружен. Практический вывод: для verify критичнее задержки и IOPS хранилища, чем номинальная полоса сети.
Что произошло
Пользователь запустил PBS на mini-PC (Celeron J4125, 8 ГБ RAM) и хранит backup datastore на Synology через NFS. В инфраструктуре: 21 VM, 2 LXC, 243 snapshots, занято 1.77 ТБ.
В daily verify включён Skip Verified (повторная проверка через 30 дней), поэтому из 243 снапшотов в текущем цикле реально проверялись 25. Несмотря на это, из-за крупных VM (100–400 ГБ) проход читает большой объём данных и длится большую часть дня.
Технические детали
- Фактический объём чтения на verify: ~855 ГБ за запуск.
- Наблюдаемая скорость: 20–35 MiB/s.
- При таких значениях 1GbE не является единственным ограничителем (канал не насыщен до теоретического максимума).
- В обсуждении основной гипотезой названо ограничение по random read/IOPS на цепочке
PBS -> NFS -> NAS disks. - Отмечены рабочие варианты из практики:
- запуск PBS ближе к данным (например, VM на NAS, если поддерживается);
- переход с NFS на iSCSI LUN в аналогичном сценарии давал ускорение;
- проверка текущего профиля I/O через встроенный бенчмарк PBS.
Риски и ограничения
- Длинное окно verify увеличивает RPO/RTO-риск: часть задач может пересекаться с backup/prune и ночными окнами обслуживания.
- На слабом CPU и медленном storage увеличение потоков может не ускорить verify, а поднять latency для остальных сервисов.
- NFS-backed datastore на бытовом NAS часто чувствителен к мелкоблочному чтению и конкуренции за диски.
- Без замеров (IOPS/latency/throughput) изменение настроек «вслепую» может ухудшить общую стабильность.
Практика для HomeLab (чеклист)
- Зафиксировать базовую метрику verify:
- длительность джобы,
- прочитанные байты,
- средний throughput,
-
нагрузку NAS в этот интервал.
-
Проверить профиль PBS локально:
proxmox-backup-client benchmark
Критерий: понять, ограничение в CPU/диске/сети до изменения архитектуры.
- Снять I/O-метрики на узле PBS во время verify:
iostat -x 5
nfsiostat 5
Критерий: если высокий await/latency при неполной загрузке сети, упор в storage IOPS.
- Тюнинг потоков verify делать пошагово:
- менять read threads/verify workers по одному параметру,
-
повторять замер на одинаковом наборе снапшотов.
Критерий: время verify уменьшается без роста ошибок и без деградации других задач. -
Если verify стабильно выходит за окно обслуживания:
- рассмотреть перенос datastore на более быстрый бэкенд (локальный SSD/ZFS, iSCSI),
- либо запуск PBS ближе к дискам NAS.
Критерий: verify укладывается в целевое окно и не конфликтует с backup/prune.
Источник:
- https://reddit.com/r/Proxmox/comments/1td4qed/i_run_pbs_on_a_150_minipc_with_synology_nfs/
- https://www.reddit.com/r/proxmox/new.json?limit=20