Homelab — Genel Bakış

Yüklenen 01-homelab-infra.md + README’den (23 Haz 2026 durumu) damıtıldı. Canlı/ayrıntılı kaynak: ahmetem/homelab.

Donanım

  • Sunucu: Cisco HX220C-M4S (UCS C220 M4); eski HyperFlex node, standalone’a çevrildi.
  • CPU: 2× Intel Xeon E5-2630 v4 (Broadwell, 2.20 GHz, max ~3.1 GHz) = 2 soket × 10 çekirdek = 20 çekirdek / 40 thread. ISA: AVX2 + FMA + F16C var, AVX-512 yok; ayrık GPU yok (yalnız Matrox G200e BMC çipi) → yoğun hesap/ML işleri CPU-only. ^[çıkarım: lscpu]
  • OS: Proxmox VE 9.2.3 (kernel 7.0.12-1-pve). IMC firmware 4.1(2m). RAID JBOD/passthrough (ZFS için).
  • RAM: 24 GB (geçersiz: 2026-06-13) → 40 GB = 4×8 GB + 2×4 GB = 6 DIMM, hepsi 2133 MT/s (ECC RDIMM zorunlu). 13 Haz yükseltmede iki yeni 8 GB modül kanal dengesi için iki ayrı CPU’ya (slot 10 ve 16, bank-A) dağıtıldı. ^[çıkarım]
  • NIC vmbr0 MAC: <gizli> (orijinal kaynakta tutuluyor).

Disk / ZFS

  • Pool’lar: nvmepool (production, NVMe), vmdata (yedek hedefi, HDD), vmpool (replikasyon hedefi, SSD), vmpool2 (torrent, HDD — ölmeye yakın, replace adayı).
  • ⚠️ Tüm pool’lar TEK DİSK — redundancy yok. Koruma yedekleme katmanıyla sağlanıyor.

  • Subnet 192.168.1.0/24, gateway .1. Switch: Cisco 3750G (.3). IMC: .4 (statik).
  • Proxmox host pve .21. Yük IP’leri: bkz. _MOC tablosu.
  • CT 210 homelab-brain → .33 (yeni, bu sistem).

Uzaktan erişim (CT 206 Nginx Proxy Manager)

  • proxmox.ahmetkaraca.com.21:8006 · pbs.ahmetkaraca.com.27:8007 · cisco.ahmetkaraca.com.4:443 · proxmox.ahmetkaraca.com:2222 → SSH bastion.
  • Backend portları doğrudan dışarı kapalı; tek giriş NPM, geçerli Let’s Encrypt TLS.

Yedek mimarisi (katmanlı)

  • Tier 0 (ZFS snapshot): sanoid; aynı-pool snapshot. (sanoid timer ile cron yarışı serialize-with-cron.conf flock’uyla çözüldü.)
  • Tier 0c (host-içi ZFS replikasyon): nvmepool → SanDisk SSD saatlik syncoid. Bkz. 2026-06-13-nvme-replikasyon-tier0c.
  • Tier 1 (yerel vzdump → vmdata): jobs.cfg — 01:00 kritik-küçük (202/203/206/207/208), 01:45 Postgres (200), 02:00 HA (101/204), 04:00 Immich (201).
  • Tier 2 (PBS → WD My Cloud, off-host): ~06:00–09:00 wdmycloud-pbs. Off-host olan tek katman — host+yerel diskler birlikte giderse tek kurtuluş budur.

Bilinen riskler / olaylar (özet)

  • ⚠️ UPS YOK — #1 fiziksel risk; 14 Haz ani kesinti host’u sert kapattı (ZFS hasarsız). Öneri: line-interactive UPS + NUT graceful shutdown. ^[çıkarım]
  • ⚠️ vmpool2/sdd diski ölmeye yakın: SMART Load_Cycle_Count ömrü aştı (~3M cycle), ~19.000 saat, 1 reallocated sektör → mirror/RAID eşi olarak kullanılmamalı. ^[çıkarım]
  • vmdata+vmpool2 RAID/mirror REDDEDİLDİ (13 Haz): vmdata 727 GB > vmpool2 696 GB (sığmaz); ‘RAID yedek değildir’ (vmdata zaten yedek deposu); eş olacak sdd en ölü disk. Tier 2 (off-host) işi daha iyi yapıyor.
  • systemd PID-1 çökmesi (20 Haz) → CrashAction=reboot + softdog watchdog ile çözüldü.
  • perl-ABI SIGSEGV (Mayıs+Haz) → çözüldü (reinstall+reboot). Kanonik özet: perl-abi-cokme-olayi.
  • BIOS adayı (uygulanmadı): Power Technology=Disabled → Turbo Boost kapalı + derin C-state yok (boşta ~30-60W fazla). Power Restore Policy=Power On ise doğru (UPS’siz kritik sigorta). ^[çıkarım]
  • IMC fan override: nvmepool 3.parti NVMe kartları tanınmadığından IMC ‘High Power’ uyguluyor; NVMe’ler sıcak çalıştığı için kabullenildi. ^[çıkarım]
  • PSU (12 Haz): PSU 1 IMC’de CRITICAL fault verdi ama kullanıcı bilinçli test için kapatmıştı, geri taktı — kalıcı arıza belirsiz, teyit gerek. ^[belirsiz]

Otomatik güncelleme / upgrade güvenliği

Günlük otomatik güncellemenin ‘eksik yarısı’ kapatıldı: apt-daily-upgrade.service’e ExecStartPost=/usr/local/sbin/pve-post-upgrade.sh hook’u eklendi — perl/PVE kütüphaneleri değiştiyse PVE daemon’larını (pvedaemon/pveproxy/pvestatd/pvescheduler) otomatik restart eder, yeni çekirdek kurulduysa planlı reboot. needrestart 3.11 rapor-modunda. Eski full-upgrade override’ı paketleri kuruyor ama servisleri tazelemiyordu; bu boşluk 22 Haz perl-ABI nüksüne yol açmıştı. Bkz. 2026-06-23-cekirdek-guncelleme-reboot-politikasi.

İlgili