View Single Post
Staro 28.07.2015., 17:33   #14
ZOX
Premium
Moj komp
 
ZOX's Avatar
 
Datum registracije: May 2007
Lokacija: Koprivnica
Postovi: 297
Radi se o tome da raspored jezgri utječe na način organizacije threadova:



Znači, 15 jezgreni Xeon ima tri stupca od 5 jezgri.
Susjedni stupci dvore unutarnji QPI (ne znam dal je to interconnect za međujezgrenu komunikaciju) prsten dok su vanjski povezani posebnim prstenom.

Svaki plavi skok je barem 10 ns.
Tak da je za lokalni OS bitno na koji način će mu biti jezgre dodijenjene.
Budući da intel treba samo prekopirati 2,5MB L3 da prekopira cijelo stanje jezgre na neku drugu, svaka dodatna ns je bačena struja.

Sad zamisli da OS sa 4 thread -a šeta okolo po jezgrama.
Desi se to da nijedna jezgra nije dovoljno opterećena da CPU ode u Turbo množitelj jer ima previše skokova.

Ako čovek slaže ESXi server, jako je bitno kak su jezgre konfigurirane.
Npr, ako je nekom OS -u dodijeljeno više jezgri, onda je poželjno da su na lokalnom stupcu jer 4 susjedne jezgre međusobno imaju samo jedan skok, tj minimalanu kaznu od 10 ns.
Ako su na drugom stupcu, treba dodati minimalno 20 ns na vreme kopiranja L3.

Intel reklamira 10c procesor kao da ima jedan prsten oko jezgri, a meni se čini da je moj otpadak od E7 4890 Xeon -a.
U tom slučaju ima tri stupca i dva komunikacijska prstena.

Fale jezgre 10, 12, i 14 na srednjem stupcu i jezgre 26 i 28 na zadnjem stupcu.


Opet, to znači da možda memorijski kontroler radi kao 2x2.
U slučaju da ipak radi kao 4c, onda je to samo stvar mikrokoda.

Ima kakav pametan softver koji vidi razliku između 2c i 4c bandwidth -a?
Po mogućnosti da nije AIDA jer sam imal demo i isteklo ...

Edit:
Process Lasso je odličan softver jer more isključit automatsku regulaciju prioriteta od Win i ručno namjestiti kome i kak paše ...

Zadnje izmijenjeno od: ZOX. 28.07.2015. u 18:10.
ZOX je offline   Reply With Quote