![]() |
Citiraj:
Što se tiče LLMa, isti i tako ide u VRAM, što bi ga trpao u RAM disk? |
Citiraj:
A i ovo za VRAM, mislim da to funkcionira jedino ako imas nVidiju... Integrirke ionako koriste DRAM... :) A uvijek se nadje netko tko zeli korisiti lokalni AI na svojoj masini, pa makar za probu, pa eto, nema nVidiju, ima samo integrirku i... Ma nek se igra i veseli... :) |
Koliko ja znam, ovo što sam čačkao po "AI" lokalno (InvokeAI uglavnom) bitan je samo VRAM, proizvođač GPU je nevažan što se toga tiče. Ako model može biti skroz učitan u VRAM dobiješ jednu brzinu, ako ne može biti učitan dobiješ drugu brzinu i vjerojatno rušenje.
InvokeAI ima neki workaround koji bi kao trebao spriječiti rušenje pa koristi RAM ali to uz velike penale. Ako uz to imaš nevidiju onda dobiješ i compute boost od kakvih 300-400% prema AMD, makar prema seriji 7xxx koju sam ja ponešto testirao. 3060 Ti 8GB je bila od 7800 XT 16GB podosta brža u computu, a te dvije nemaju veze jedna s drugom, ako gledaš raster. Sve dok koristiš model koji stane u 8GB, jelte. |
Priupitao sam statisticko pogladjalo #2 (aka. DeepSeek) zasto su performanse FAT32 volume vece nego NTFS u RAMDisku i... pa mogu reci da mi je dao OK rezultate, na tragu onoga sto sam i sam zakljucio...
Kada su stvari toliko brze kao u RAMu, onda svaki overhead igra ulogu i vidljiv je... Your observation that FAT32 performs faster than NTFS on a RAMDisk in ATTO Disk Benchmark (or similar tools) can be explained by several technical factors. Here’s why: 1. Overhead of NTFS Features - NTFS includes advanced features that add overhead, which isn’t beneficial (and can even slow things down) in a RAMDisk environment: - Journaling (for crash recovery) → Writes extra metadata. - File permissions (ACLs) → Unnecessary for a RAMDisk. - MFT (Master File Table) updates → More complex than FAT32’s simple allocation table. - Small file handling → While NTFS is better for small files on HDDs/SSDs, RAM is so fast that the overhead of NTFS’s metadata management can actually slow it down. FAT32, being much simpler, has: - No journaling. - No file permissions. - A straightforward File Allocation Table (FAT) structure. → Less CPU overhead = faster in RAM. 2. Benchmark Workload Matters ATTO Disk Benchmark typically tests sequential read/write speeds with different block sizes. In this case: - For large sequential transfers, both NTFS and FAT32 should be close to RAM’s raw speed (~10+ GB/s). - For small block sizes (4KB–64KB), FAT32 often wins because: - NTFS has to update more metadata (MFT, journals, etc.). - FAT32’s simple structure allows near-direct writes. 3. RAMDisk Optimizations - NTFS is optimized for disks (HDD/SSD), not RAM. - FAT32’s simplicity aligns better with RAM’s speed because: - No need for fragmentation management (RAM is inherently fast at random access). - No need for advanced caching (RAM is already cache). 4. File System Drivers & Caching - The NTFS driver in Windows is more complex and may introduce tiny delays. - The FAT32 driver is lightweight and well-optimized for simple operations. - Windows caching mechanisms may behave differently between the two. When Would NTFS Be Faster on RAMDisk? - If you’re working with many tiny files, NTFS’s MFT might help (but often, FAT32 still wins). - If the workload involves heavy metadata operations (though RAM is so fast that the difference is minimal). Pa eto, rezultati ne lazu, svi testovi koje sam radio su radjeni na isti nacin, sa istim volume sizeom, samo sam mijenjao filesystem... Jedino, ne kuzim ovo za FAT32 vs NTFS performanse jer mi i DeepSeek veli da je NTFS brzi... Valjda desetljecima zivim u uvjerenju da je FAT32 brzi bas zbog minimalnog overheada i jednostavnosti samog FSa... Tako da, sljedeci projekt ce biti da istestiram FAT32 vs NTFS na nekom NVME disku i SSDu pa da vidim sta je sa time... Budem si samo pronasao neki laptop na kojem cu to moci bez problema odraditi... |
Baš se igramo s ollamom na poslu s nekim modelima. Čim ponestane VRAMa i krene koristiti sistemski RAM stvar se strašno uspori.
|
OK, konačno došlo moje na red. Kao izvor za kopiranje sam napravio fajlove random (binarnog) sadržaja i smjestio ih na NVME A:
1. 100k fajlova od 1 KiB 2. 10k fajlova od 4 KiB 3. 1k fajlova od 10 KiB 4. 1k fajlova od 1 MiB Test sam napravio u 4 koraka, ponovio par puta s ponovljivim rezultatima: 1. rsync direkt u RAM preko TMPFS 2. rsync na BTRFS RAM particiju, bez kompresije 3. rsync na BTRFS RAM particiju, sa kompresijom 4. rsync na BTRFS particiju s kompresijom na NVME B Ukupno za kopiranje 112k fajlova ukupne veličine 1.19 GiB (na kraju vidim da je tu bilo i nešto više fajlova, ali mislim da nije bitno s obzirom da samo to i tako napravio nasumično). 1. kopiranje direkt u RAM: 189 MiB/s 2. kopiranje na RAM BTRFS particiju bez kompresije: 74 MiB/s 3. kopiranje na RAM BTRFS particiju s kompresijom: 79 MiB/s 4. kopiranje na BTRFS particiju na drugom NVME: 98 MiB/s Pod 3 pretpostavljam kako je limitirana mogućnost komprimiranja s obzirom na nasumičan sadržaj fajlova. Da su neki tekstualni fajlovi vjerojatno bi ta brzina bila veća. Mislim da se ovdje pokazalo ono što je bilo i za očekivati, kod rada s nekim povećim arhivama RAM kao temp dir već i na DDR4 ima smisla. Code:
# create a bunch of small files; 100k 1k large files |
Citiraj:
E o ovome govorim cijelo vrijeme - real world test. Hvala mkey :) Nego jel bi ti bio bed jos sa EXT4 testirat, preferabilno sa noatime mount opcijom? |
Na RAM driveu bi trebalo isključiti cache u file sistemu :D
|
Citiraj:
Pretpostavljam da ti je DDR4 u dual-channel modu, jelda? Volio bih probati taj test na nekoj DDR5 masini, no trenutno nemam nista takvog osim mog radnog stroja koji mi treba za rad, a njega ne mislim rasturati da instaliram nativno Linux... Mozda u neku virtualnu masinu, ali to onda nije bas nativno... |
Tomek, na tom drugom NVME sam napravio jednu malu EXT4 particiju i napravio rsync na nju i to je bilo ponešto sporije nego copy na BTRFS particiju, cca 74 MiB/s. To je usporedivo s brzinom koju dobivam na BTRFS particiji u RAMu. Ne da je usporedivo, nego identično :D
Skroz identičan broj daje rsync (78,050,043.15 bytes/sec) u ta dva slučaja. Sada nisam baš siguran što ja tu mjerim. Ispada da RAM BRTFS particija i fizička EXT4 particija imaju identično usko grlo, šta li? Code:
# copy to EXT4 partition on another NVME medo, nisam baš shvatio na što misliš. To je za slučaj kada napravim RAM BTRFS particiju? calypso, nisam baš siguran što smo ovdje dokazali, s obzirom na ovaj gornji slučaj. Ne vidim kako u realnom scenariju podatak koji daje rsync može biti identičan na dvije decimale u dva skroz različita scenarija. U mene je DDR4 u dual channelu, jeste. Ali pitanje je što bih s TMPFS dobio na DDR5, kada je i ovako max brzina debelo ispod teoretske max brzine od samog DDR4 RAMa kada radi na 3200. Teoretski bi to bilo 25.6 GiB/s, onaj benchmark mi je pokazivao kakvih 17, a ja sa sekvencijalnim copy na TMPFS dobijem 2.5. |
Citiraj:
Dakle EXT4 je i dalje car Linux FS-ova po pitanju brzine. Hovewer evo jedan kontra produktivni test, jednostavan ko pasulj što bi susjedi rekli: https://i.postimg.cc/Tw4Nb8DP/2025-0...0-Postavke.png Testirano na Lenovo lapu u sigu, kopiranje vise fajlova razlicitih velicina sa Microna na Sandisk. Bez Ramdiska. Windows 11 sa NTFS-om, bez ikakvih optimizacija. |
Citiraj:
Citiraj:
|
Tomek ne znam kako si došao do zaključka da je EXT4 kralj brzine, s obzirom da je u ovom mom primjeru sporiji od BTRFS 20ak%. Ili je to možda bi neki lagani sarkazam?
Također, nisam siguran koliko je primjer s tvog SSa relevantan. Ti dakle imaš 150GB u 22.051 file, odnosno skoro 7 MB po fajlu, dok je u mom primjeru 1.2GB u skoro 113k fajlova, odnosno prosječno 0.01 MB po fajlu. Da i ne spominjem kako ne vjerujem tom njegovom mjerenju brzine a bogami niti podatku o preostalom vremenu. Čisto onako iskustveno :D |
Ne budi lijen, potražio sam alternativu rsyncu u smislu kopiranja fajlova uz prikaz brzine transfera i našao ovo zgodno rješenje "tar c source | pv | tar -C x dest"
Disclaimer: koliko je ovo usporedivo s onime što rsync radi, u smislu prenošenja svih atributa, pojma nemam. Tako da ne tvrdim kako je ovo brže ili bolje od rsync, samo sam htio vidjeti što po pitanju brzine kopiranja fajlova kaže neka druga aplikacija. Dobio sam slijedeće (za uvijek isti set fajlova): - TMPFS: 570 MiB/s - fizički BTRFS s kompresijom: 199 MiB/s - fizički EXT4: 164 MiB/s - RAM BTRFS particija, bez kompresije: 172 MiB/s - RAM BTRFS particija, sa kompresijom: 168 MiB/s Dakle, u odnosu na rsync sam prijenos je brži cca x2 dok je sada još i veća razlika između TMPFS i NVME. Nisam pratio, ali ovdje bih očekivao veće korištenje RAM i CPU. Code:
# tar + pv |
Sad mi nista nije jasno...
Ispada da je kopiranje sa jednog na drugi NVME disk brze nego kopiranje sa NVME u BTRFS RAMdisk? Ili sam ja nesto krivo shvatio? |
Da, kopiranje u taj RAM BTRFS je konzistentno sporije od fizičkog diska, što meni ima smisla. Očito ima tu dosta overheada. Nisam baš primijetio da se takvo nešto uobičajeno koristi, mene je samo zanimalo što bi kompresija značila za performanse.
Ono što je tu bitno je po meni TMPFS vs NVME, a to je pak u ovom slučaju skoro 3x brže. |
Citiraj:
Ajd pliz, ako imas vremena i volje, probaj isto to zavrtiti na EXT2 particiji - nema overheada nikakvog, najjednostavniji FS, nema journaling koji za potrebe RAMDiska i nije potreban... |
Tu je poanta priče tmpfs, koji, koliko ja shvaćam, nije napravljen s performansama kao glavnim ciljem. Meni je logično da tmpfs sam mora biti brži od tmpfs + nešto. Što god da dodaš biti će veći overhead. Izuzetak bi bila možda neka situacija gdje se koristi kompresija na fajlovima koji se daju dobro komprimirati.
EXT2 RAM particija povuče s tar metodom 207 MiB/s, tako da je to 20% brže u odnosu na BTRFS. |
Citiraj:
Ext2 -> jos jedna potvrda da non-journaling FS ima nesto bolje performanse nego journaling, sto je ista prica i kod FAT32 vs NTFS, a sto je i logicno na kraju krajeva... Pricam o RAMDisku, nisam testirao na NVME tako da ne znam kako se to ponasa, iako i tamo ocekujem da bi FAT32 trebao biti nesto malo brzi od NTFS... Iako, i dalje mi nije jasno zasto bi BTRFS u RAMDisku bio sporiji od BTRFS na NVME disku, to nema nikakvog smisla... Ako sam dobro shvatio, ovi tvoji testovi se svode na testiranje write performansi, zar ne? Ali svejedno, rezultati su cudni... |
To je sve write, da. U testovima od prije par dana, kada sam pisao prazan od 1 GiB kojeg se dalo jeftino komprimirati, BTRFS s kompresijom je bio cca 30% brži od BTRFS bez kompresije. Penal je overhead komprimiranja, ali ipak se na kraju umjesto 1 GiB piše 70ak MiB i to sve skupa bude brže. Iako to nije primjer nečega što ima realnu primjenu, s obzirom da se radi o praznom fajlu.
|
Citiraj:
|
RAMDisk - Ubrzavanje kompa uz pomoc prebacivanja cache/temp foldera na RAM Disk
Citiraj:
Citiraj:
|
Citiraj:
Not a bad Idea.... @mkey - raspali :lol2: |
Ne mogu reći da vidim načina kako odraditi multithreaded copy.
|
Citiraj:
|
Citiraj:
fio? |
fio na tmpfs neće da može.
|
Iskreno, nemam pojma da li bude ovo od ikakve koristi, ali kreiral sam RAMdisk od 32GB na sveukupno 128GB DDR5-5200, prije toga pogasil sve virtualne mašine, naknadno kopiral i smjestil EndeavourOS VM od 25GB u prethodno kreirani 32GB RAMdisk i provjeril kakve su brzine pisanja i čitanja u odnosu na NVMe SSD. Swap file i ostala čuda tehnike su uključena po defaultu, a nekih konkretnih razlika na relaciji RAMdisk - NVMe SSD, u ovom mojem slučaju - baš i nema. #umount:frend:
https://i.postimg.cc/grQNgjNm/RAMdisk-01.png https://i.postimg.cc/ZWFHYcZ5/RAMdisk-02.png https://i.postimg.cc/TKXQXszs/RAMdisk-03.png Code:
root@fedora-ws:/# df -h |
Sekvencijalni write je i kod mene bio tu negdje, samo cca pola tvojih brojeva.
|
Da, sve ove novije mašine unatrag nekoliko godina se čisto dobro drže, tj. RAMdisk (više) ne dolazi toliko do izražaja.
|
Citiraj:
|
VirtualBox je u pogonu, ali lako za te brojke, kad ionak nisu neke pretjerane razlike, a VM se isto ponaša po pitanju tzv. responzivnosti, bilo na NVMe SSD-u ili u RAMdisku.
|
Citiraj:
Fedora podrzava KVM, koji bi trebao biti puno bolja platforma za virtualizaciju od Virtualboxa... Pa mozda da to probas? https://docs.fedoraproject.org/en-US...tting-started/ Nasao sam neki plugin koji poslozi Virtualbox da koristi KVM kao hypervisor, pa mozes i njega isprobati ako ti se da... To bi trebalo imati nesto bolje performanse nego Virtualboxov hypervisor... https://github.com/cyberus-technology/virtualbox-kvm Dodatno, VMware Workstation je free for personal use odnedavno, pa mozes i to staviti... Mozda zapravo najbolje da to stavis jer je nemjerljivo bolji od svega ostalog, od UI pa do performansi i funkcionalnosti... https://blogs.vmware.com/workstation...sonal-use.html Jednostavno mi je totalno besmisleno da imas iste rezultate sa virtualkom na RAMDisku kao sto imas sa NVME diskom... Prilicno sam uvjeren da je virtualizacijski layer usko grlo, pogotovo ako imas Virtulbox... No, bez testa sa KVM ili VMWare, ne znam sto ocekivati... Zapravo, sad sam se sjetio necega... Davno (pred nekih 15ak godina) sam imao situaciju gdje smo nesto kopirali izmedju on-prem servera i servera u cloudu i sve se vuklo u 3PM... I onda sam pitao ekipu (neke Indijce) kako oni to kopiraju... Kad su mi objasnili mi je pao mrak na oci... Znaci, umjesto da se ulogiraju na storage (Nexenta), i sa FTP klijentom prebace podatke na FTP server u cloudu, oni su to nesto kopirali preko neke intermediate masine koja je bila slozena na onom besplatnom prastarom VMware Server (on je po performansama bio ko Virtualbox) pa su onda od tamo nesto opet FTPom dizali u cloud... Ma uglavnom, oni nisu mogli preci 1MB/s... Kad sam preuzeo to cudo sam uredno dobijao preko 20-30MB/s jer sam kopirao sa jednog servera na drugi direktno... Poanta price - VMware Server je bio usko grlo... Pa tako je ovdje mozda Virtualbox usko grlo (ne bi me cudilo)... Htio bih isprobati dalje performanse (mogo bi i ja strpati virtualku u RAMDisk), no sutra idem na odmor na par dana i ne zelim se bakcati sa tim glupostima... Plus u firmi su mi uvalili brdo posla pa se i tome moram posvetit... |
VMware/ESXi ionak imam svakodnevno na poslu, a i godinama je bil u pogonu na ovim kućnim mašinama, dok se Broadcom nije odlučil posvađati sam sa sobom i cijelim svijetom, pa sam lijepo doma sve vratil natrag na VirtualBox. Za tih 20 virtualnih mašina, bilo VMware, bilo VirtualBox, oba rade podjednako dobro za moje potrebe, do te mjere da mi je čak svejedno da li imam i konkretnije stvari poput Proxmox ili XCP-ng rješenja, pošto se i to svojevremeno koristilo. Na ovaj način sam samo iskoristil virtualnu mašinu u RAMdisku čisto da provjerim kakvo je stanje i nadovežem se na ono kaj smo već komentirali.
|
Citiraj:
U svakom slucaju, hvala na testiranju... Sad znamo jos manje... :D Meni se cini da je Virtualbox tu usko grlo, no na tim brzinama to neces primjetiti... :D |
Vmware Workstation je Type 2 Hypervisor bas kao i Virtualbox. ESXi je Type 1 Hypervisor. Baš kao i npr. KVM. Vmware Workstation j meni bolji proizvod ali u ovakvim scenarijima se nije baš pokazao toliko brži iako se slažem da u određenim scenarijima bolje barata sistemskim resursima od Virtualboxa. Naravno puno toga ovisi i o OS-u ispod haube. Esxi na barebone instalaciji - da, definitivno. Ono što na kraju dana treba razlučiti jest: kolko RAM-a ima u računalu/serveru (te kolko je brz) - ako korisnik u računalu ima ispod 64GB meme - OS i ostale aplikacije koje će ovakav konstrukt koristiti bude malo "žedan". Za brzi nvme disk više ne moraš prodat bubreg. Zato kažem - praktičnih benefita na modernoj arhitekturi osim većih brojki u be nchmarku nema ili su vrlo male. Ono gdje tmpfs/ramfs još uvijek imaju smisla je u starim kantama bez SSD-a (vidi Acer u mom sigu) gdje je razlika u prvom pokretanju aplikacije sa diska i svaka nakon toga poprilično brža. Samo opet - Linux OS je optimiran da sav cache i tmp trpa u tmpfs/ramfs i za Linux je 8GB RAM-a za takvo korištenje uvrh glave. A ja kolko znam većina normalnih korisnika ima neki SSD i vrti Windows. Implementacija takvog sustava na Windows OS-u na toj razini jednostavno nije moguća što si i sam pokazao.
Evo da ne budem lijen... Stroj: HP ProLiant DL360 Gen9 CPU: 2x Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40GHz RAM: ECC DDR3 1866MHz 80GB RAMFS: 20G OS: Proxmox 8.4.1 Code:
dd if=/dev/zero of=/mnt/ramfs/zero bs=4k count=100000 CPU: 2x Intel(R) Xeon(R) E-2334 CPU @ 3.40GHz RAM: ECC DDR4 3200MHz 128GB RAMFS: 20G OS: SLES 15 SP6 Code:
dd if=/dev/zero of=/mnt/ramfs/zero bs=4k count=100000 I za kraj od mene - moderni OS-evi hendlaju RAM drukcije nego prije 20 godina. Zato kazem - nije sve u RAW brojkama. I jos par korisnih linkova: https://www.thegeekstuff.com/2008/11...mpfs-on-linux/ https://www.geeksforgeeks.org/windows-memory-managment/ https://docs.kernel.org/admin-guide/mm/index.html |
RAMDisk - Ubrzavanje kompa uz pomoc prebacivanja cache/temp foldera na RAM Disk
Linux fio random write na lz4-komprimiranom zram driveu: single i/o depth, 4kb page, Ryzen 9600X
Single process = 665MB/s, 163k IOPSa 12 procesa = 5.2GB/s, 1266k IOPSa Isto samo na Samsung 990 Pro SSDu: Single process = 288MB/s, 70k IOPSa 12 procesa = 3GB/s, 741k IOPSa Znači komprimirani RAM drive je ~2x brži od Samsunga 990 Pro bar u ovom testu. |
Ja sam koristio KDiskMark (koji koristi fio) i kada sam ga stavio na RAM drive srao je da ne želi.
|
Citiraj:
https://www.opencompute.org/events/p...rage-tech-talk |
Samo da se javim... Dakle, proslo je vec mjesec dana otkad sam slozio RAMDiskove na desktopu i laptopu... Nisam jos primjetio da mi nesto ne radi ili da mi se nesto skrsilo... Kompovi rade kako rade, meni to sve prilicno responzivno, ne znam vise kako je bilo bez RAMDiska...
Ono sto sam zelio istaknuti je da nema nikakvog utjecaja na stabilnost stroja... Dakle, iskljucen mi je swap file na oba stroja (desktop ima 64GB, laptop 32GB), i imam RAMDisk na oba stroja na koja sam natrpao cache i temp foldere raznorazne... So far so good, ja zadovoljan... :) |
Sva vremena su GMT +2. Sada je 03:54. |
Powered by vBulletin®
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
© 1999-2024 PC Ekspert - Sva prava pridržana ISSN 1334-2940
Ad Management by RedTyger