|
|||||||||||
|
|
#31 |
|
N0teb00k n00b
Datum registracije: Jan 2005
Lokacija: Zagreb/Koprivnica
Postovi: 2,122
|
__________________
|
|
|
|
|
|
#32 |
|
Premium
Datum registracije: Sep 2007
Lokacija: Zagreb
Postovi: 5,805
|
jucer na novi disk KC3000 stavio svjezu instalaciju Proxmoxa, sve updejtao, restorao backup VM (haos) i sve radio ok, danas ujutro opet ista stvar, proxomx smrznut, VM HAOS također. Prosao jos jednom kroz postavke (mrezne, firewall Proxmoxa i VM-a, sve ok), podesio C states (quiet pcie_aspm=off nvme_core.default_ps_max_latency_us=0 nvme_core.io_timeout=35000 nvme.noacpi=1 intel_idle.max_cstate=1 processor.max_cstate=1), sve provjerneo i loadano u GRUBU, čak sam napravio i skriptu koja mi svakih 10 min zapisuje logove diska pa u vidjet jel ima sta u tim logovima i ovo je trenutni zapis: root@pve:~# tail -n 40 /var/log/proxmox-health.log ===== Sun Dec 7 12:10:01 PM CET 2025 ===== Uptime: 12:10:01 up 43 min, 1 user, load average: 0.05, 0.06, 0.09 Zauzeće RAM-a: total used free shared buff/cache available Mem: 15Gi 4.9Gi 10Gi 39Mi 320Mi 10Gi Swap: 8.0Gi 0B 8.0Gi Zadnjih 10 NVMe poruka iz kernela: [ 0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-6.8.12-17-pve root=/dev/mapper/pve-root ro quiet pcie_aspm=off nvme_core.default_ps_max_latency_us=0 nvme_core.io_timeout=35000 nvme.noacpi=1 intel_idle.max_cstate=1 processor.max_cstate=1 [ 0.038524] Kernel command line: BOOT_IMAGE=/boot/vmlinuz-6.8.12-17-pve root=/dev/mapper/pve-root ro quiet pcie_aspm=off nvme_core.default_ps_max_latency_us=0 nvme_core.io_timeout=35000 nvme.noacpi=1 intel_idle.max_cstate=1 processor.max_cstate=1 [ 1.827409] nvme nvme0: pci function 0000:01:00.0 [ 1.832962] nvme nvme0: Shutdown timeout set to 10 seconds [ 1.834397] nvme nvme0: 6/0/0 default/read/poll queues [ 1.836434] nvme0n1: p1 p2 p3 Zadnjih 10 CPU/C-state poruka: [ 0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-6.8.12-17-pve root=/dev/mapper/pve-root ro quiet pcie_aspm=off nvme_core.default_ps_max_latency_us=0 nvme_core.io_timeout=35000 nvme.noacpi=1 intel_idle.max_cstate=1 processor.max_cstate=1 [ 0.038524] Kernel command line: BOOT_IMAGE=/boot/vmlinuz-6.8.12-17-pve root=/dev/mapper/pve-root ro quiet pcie_aspm=off nvme_core.default_ps_max_latency_us=0 nvme_core.io_timeout=35000 nvme.noacpi=1 intel_idle.max_cstate=1 processor.max_cstate=1 [ 0.198328] cpuidle: using governor ladder [ 0.198328] cpuidle: using governor menu [ 0.460127] intel_idle: max_cstate 1 reached Zadnjih 10 kernel poruka općenito: [ 6.999335] e1000e 0000:00:1f.6 eno1: entered promiscuous mode [ 10.779525] e1000e 0000:00:1f.6 eno1: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx [ 10.779568] vmbr0: port 1(eno1) entered blocking state [ 10.779574] vmbr0: port 1(eno1) entered forwarding state [ 15.972218] tap100i0: entered promiscuous mode [ 16.011614] vmbr0: port 2(tap100i0) entered blocking state [ 16.011622] vmbr0: port 2(tap100i0) entered disabled state [ 16.011643] tap100i0: entered allmulticast mode [ 16.011736] vmbr0: port 2(tap100i0) entered blocking state [ 16.011739] vmbr0: port 2(tap100i0) entered forwarding state Memoriju sam prije jos testirao sa mem testom koji ste mi rekli i sve je proslo ok. Suma sumarum, BIOS HP-a updejtan i podesen, promjenio 2 nova diska, memorija istestirana problem i dalje tu. Jedino sto mi jos ostaje je stavit drugu memoriju i probat s njom, ako je problem i dalje prisutan, nabava novog racunala jer je onda ocito problem negdje u mbo/pitaj boga gdje ![]() |
|
|
|
|
|
#33 |
|
49%winner
Datum registracije: Sep 2007
Lokacija: PU
Postovi: 10,367
|
Podsjeti me, kad spojis monitor na HP, da li imas video output i mozes li se kroz konzolu ulogirati u proxmox te raditi na njemu dok je u "smrznutom" stanju? Vidim da sam te to pitao, ali nisam iz odgovora skuzio jesi li probao
__________________
♕ Keep calm and fastboot oem unlock. ♕
|
|
|
|
|
|
#34 |
|
Premium
Datum registracije: Sep 2007
Lokacija: Zagreb
Postovi: 5,805
|
Nisam to probao, iskreno, jer mi je HP u ormaru, spojen na PSU i LAN. I kad ga ulovim smrznutog, samo ga isteka iz napajanja i ponovo ustekam. Onda kad se sljedeci put smrzne trebam ustekati monitor i vidjeti jel imam video output na monito i ako imam probat se ulogirat u Proxmox? P.S. Pitao Cloude za problem, kaze da je problem u mreznoj kartici Intel i219-LM i dodao u GRUB: GRUB_CMDLINE_LINUX_DEFAULT="quiet pcie_aspm=off nvme_core.default_ps_max_latency_us=0 nvme_core.io_timeout=35000 nvme.noacpi=1 intel_idle.max_cstate=1 processor.max_cstate=1 e1000e.InterruptThrottleRate=0,0,0,0 e1000e.EEE=0" Claude kaze da trebam u biosu ugasiti opciju "Wake on LAN" pa cu i to napraviti jer nemam potrebu za tim featureom |
|
|
|
|
|
#35 |
|
49%winner
Datum registracije: Sep 2007
Lokacija: PU
Postovi: 10,367
|
Tako je, kad se ulogiras direktno na hosta onda debugiraj (ako host uopce radi, a prilicno sam siguran da bi mogao raditi). Provjeri mreznu i ima li dobar IP, vidi li host net i lokalnu mrezu, itd itd. Pokreni htop ili slican tool za pracenje tko sta i koliko cucla (instaliraj ga unaprijed). Nisam bas na "ti" s debugiranjem VM-ova, al sigurno postoji neki nacin da provjeris i VM. Ovo sa mreznom me ne iznenadjuje, to sam u prvom postu spominjao, ali mi je bizarno to da host zakuha dok je "neresponzivan". Nemam iskustva s ovim grub parametrima.
__________________
♕ Keep calm and fastboot oem unlock. ♕
|
|
|
|
|
|
#36 |
|
White Rabbit
Datum registracije: May 2006
Lokacija: -
Postovi: 5,483
|
Ja da sam na tvom mjestu bih spojio cijelo vrijeme monitor i mozda lupio journalctl -f nekl vrti. Kad se desi sranje mozda ces vidjet koji mu je vrag. I da - makni molim te iz default kernel linije sve sto je iza quiet, updejtaj grub i rebotaj komp nakon toga. |
|
|
|
|
|
#37 |
|
49%winner
Datum registracije: Sep 2007
Lokacija: PU
Postovi: 10,367
|
Da, definitivno kreni s cistim grub-om, zelis reproducirati problem s monitorom pri ruci a ne pogadjati sto je rijesilo problem kad ne znas sto je problem baby steps!
__________________
♕ Keep calm and fastboot oem unlock. ♕
|
|
|
|
|
|
#38 |
|
Premium
Datum registracije: Jul 2021
Lokacija: Sesvete
Postovi: 1,206
|
Kod mene je problem da jednostavno nema mrežu. Ištekam uštekam i radi. Mijenjao i kabel već. Oni Nucevi kaj imam.. Isto proxmox u clusteru.
__________________
tomek@vz: ajd nemoj | Mali Čile SAD Češka Peru | Windows Free |
|
|
|
|
|
#39 | |
|
Premium
Datum registracije: Sep 2007
Lokacija: Zagreb
Postovi: 5,805
|
Citiraj:
Update, vise host odnosno HP ne zakuha, radni mormalno, ali mu ne mogu pristupiti. Sljedeci put kad se se smrzne cu se probati spojiti direktno na njega preko monitora, i onda ce se vidjeti jel proble sa mrezom (pa ga ne vidim preko IP-a) ili bas cijeli host zasteka. Za sad bi ostavio kako je, pratio i pa onda poslije postavio defaultni grub i testirao dalje |
|
|
|
|
|
|
#40 | |
|
White Rabbit
Datum registracije: May 2006
Lokacija: -
Postovi: 5,483
|
Citiraj:
Mozda...samo po ovim cijenama memorije bude malo problem. P.S. - u slucaju kernel panica moze se dogoditi da na ekranu neces nista vidjeti ako ga naknadno ustekas nece biti od koristi > zato je bolje to napraviti vec sad. A kaj se ovih svih opcija tice > odmah testiras dali radi sve kak spada kad su deaktivirane > ako tad sve radi > onda dodajes jednu po jednu ponovno. Deducirali smo vec sad da nije SSD problem i sve mi vise smrdi da je nesto krivo optimirano na razini proxmoxa. Ukratko > pokusavamo ti ubrzati proces debugginga. |
|
|
|
|
|
|
#41 |
|
Premium
Datum registracije: Sep 2007
Lokacija: Zagreb
Postovi: 5,805
|
Memorija je poslije uredno prosla memetest koji mi je predlozen, pa sam ju prekrizio kao moguci problem. Spojio sam monitor i sada journalctl -f vrti sve logove, potencijalni problem je sto ne mogu nista s tim logovima, (tipa c/p) osim uslikat ih mobitelom, a osobno nemam znanja da mogu problem iščitat iz njih samih, nadam se da bude neki "crveni log" prija samog crasha pa da cu biti pametniji. |
|
|
|
|
|
#42 | |
|
White Rabbit
Datum registracije: May 2006
Lokacija: -
Postovi: 5,483
|
Citiraj:
Samo poslikaj sto pise kad se smrzne...najcesce kernel: nesto |
|
|
|
|
|
|
#43 |
|
Premium
Datum registracije: Sep 2007
Lokacija: Zagreb
Postovi: 5,805
|
OK, sad čekam prvo smrzavanje u visokom stupnju pripravnosti ![]() Fora je sto sam napravio sva ona podesenja u Proxmoxu by GPT i nakon toga je uredno radilo 8 dana, prvi crash i onda se počelo dogadjati svaka 24 sata, ubačen novi disk opet crash u roku par sati U svakom slučaju hvala svima na supportu, valjda cemo naci krivca ![]() ![]() |
|
|
|
|
|
#44 | |
|
Extrema Thule
Datum registracije: Feb 2005
Lokacija: 「 ✖ ✖ ✖ 」
Postovi: 7,725
|
Citiraj:
Vidim da ova tema više odlazi u krivom smjeru.
__________________ |
|
|
|
|
|
|
#45 |
|
Premium
Datum registracije: Sep 2007
Lokacija: Zagreb
Postovi: 5,805
|
Pitao sam GPT, proguglao ono sto mi je predlozio i internet kaze da to moze biti legit problem, probao sa cisto instalacijom i drugim diskom, problem i dalje prisutan. Zao mi je ako u tvojim očima izgleda kao trosenje vremena kolega koji zele pomoci, samo sam zelio napraviti sto je u mojoj moci i znanju da rijesim problem. Trenutno je sve postavljeno kako su kolege sugerirali i monitoriram situaciju u nadi da cu dobiti log koji ce biti trag k rijesenju problema. Jos jednom hvala svima na pomoci ![]() |
|
|
|
|
|
#46 |
|
Moderator
Datum registracije: Sep 2006
Lokacija: St
Postovi: 23,656
|
Ranije sam pitao ali nisi reagirao, da probaš složiti na nekoj drugoj makinji .... |
|
|
|
|
|
#47 | |
|
Premium
Datum registracije: Sep 2007
Lokacija: Zagreb
Postovi: 5,805
|
Citiraj:
Pročitao sam pitanje, ali ga nisam registrirao ![]() Iskreno nemam pri ruci neki adekvatan komp na kojem bi mogao zavrtiti proxmox+VM, ali i da mogu posuditi i da taj setup radi, opet mi ostaje ovaj moj koji ne radi. Nekako mi je na granici sa suludim misliti da je problem sa mojom mrežom/podzemnim vodama/uroku na mojoj adresi ![]() |
|
|
|
|
|
|
#48 |
|
49%winner
Datum registracije: Sep 2007
Lokacija: PU
Postovi: 10,367
|
Mozda nevezano za kolegin problem (a mozda i je) al cu pustiti post ukratko ovdje nek se nadje jer se nadovezujem na moj post #5. Mene moj mini pc isto poceo hebati, ispadne mreze. To mi se bas i nije dogadjalo do sada, ali ovih dana preslagujem docker kontejnere i ima malo vise traffica preko interfejsa - i dogodilo se prvi put s ovim kompom. Spojio monitor na hosta (jos jedan benefit zasto je dobro imati monitor pri ruci), dmesg kaze: Code:
e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang Isao sam malo dublje istrazivati taj problem sa intel nic-ovima na mini pc-ima i ispada da je problem do e1000e drivera koji je navodno trebao biti sredjen u starim verzijama kernela. Ukratko, sad cu ovo testirati pa zivi bili... https://nb.balaji.blog/posts/fix-int...-proxmox-hang/
__________________
♕ Keep calm and fastboot oem unlock. ♕
|
|
|
|
|
|
#49 |
|
Uptime 99.99%
Datum registracije: Nov 2001
Lokacija: Zagreb
Postovi: 2,753
|
To sam ja slagao na jednoj masini isto, a nekad je Intel bio sinonim za stabilnost.
__________________
“Those who surrender freedom for security will not have, nor do they deserve, either one.” |
|
|
|
|
|
#50 | |
|
Premium
Datum registracije: Jul 2021
Lokacija: Sesvete
Postovi: 1,206
|
Citiraj:
A-ha... našao u proxmoxu: Code:
Dec 17 15:44:55 eywa kernel: e1000e 0000:00:19.0 eno1: Detected Hardware Unit Hang: TDH <c8> TDT <fe> next_to_use <fe> next_to_clean <c7> buffer_info[next_to_clean]: time_stamp <11cf54cb4> next_to_watch <c8> jiffies <12e989980> next_to_watch.status <0> MAC Status <40080083> PHY Status <796d> PHY 1000BASE-T Status <3cff> PHY Extended Status <3000> PCI Status <10> Dec 17 15:44:56 eywa kernel: e1000e 0000:00:19.0 eno1: NIC Link is Down
__________________
tomek@vz: ajd nemoj | Mali Čile SAD Češka Peru | Windows Free |
|
|
|
|
|
|
#51 |
|
Premium
Datum registracije: Sep 2007
Lokacija: Zagreb
Postovi: 5,805
|
Kod mene je bio na kraju taj isti problem, rijesio ga sa ovom skriptom: https://community-scripts.github.io/...Virtualization Čak sam pogasio sve postavke prije (C-state 1) i evo vec 7 dana u komadu radi stabilno, htio sam pričekati jos dan dva i onda javiti da je sve ok. Vjerojatno sam džabe kupovao novi ssd, ali ajde, iskoristit ce se kao storage ![]() Navodno je problem u kernerlu drivera za tu karticu i kazu da intel ne brine brigu oko toga. (stariji hardver and nobody cares )Na internetu sam vidio da se ovaj problem znao ekipi javljati nakon updejta proxmoxa, pa cisto da znamo svi za ubuduce, ako nam se vrati ![]() ![]() Za mene je ovaj moj slučaj završen, hvala svima koji su nesebično pomogli meni, ali i ostalima ![]() ![]() ![]() |
|
|
|
![]() |
| Uređivanje | |
|
|