View Single Post
Staro 23.10.2014., 10:27   #13
Bubba
E Pluribus UNIX
Moj komp
 
Bubba's Avatar
 
Datum registracije: Oct 2002
Lokacija: M82
Postovi: 6,753
Citiraj:
Autor syss Pregled postova
pci-e 3.0 nije dovoljan za nešto?
Ne da nije dovoljan, nego u memcpy() specificnim funkcijama imas latenciju do nekoliko stotina uS. Jos ako ne napravis (ili napravis krivo) sync threadova, dolazis do problema.

Znas i sam da je prosjek memorijskih latencija u danasnjih x86 masinama reda velicine 100 nS, a cachea zna pasti i ispod 10 nS.

Ima tu jako puno detalja i "sitnica".

Citiraj:
jasno mi je da propusnost kudikamo manja od cpu-a, ali brate mili raw power modernog gpu čipa i cpu čipa je LOL usporedba.
Da, samo se taj "raw power" odnosi na ono sto GPU i radi - grafiku. Pogledaj sto i kako rade shaderi pa ces vidjeti koliko je njihova primjena ogranicena.

CPU i GPU nisu ni do koljena usporedivi, i to na stranu prednosti CPU-a.

Citiraj:
pod vrlo određenu primjenu misliš izuzetno usku jelte asemblijaše?
Ne, krivo si me shvatio - OCL/CUDA ima svoju primjenu, samo ona mora biti jako specificno odredjena i dobro iskodirana. Tada ces zaista postici vrhunske performanse.

S druge strane, kada invertiras taj skup i cak kada maknes "general computing", i dalje nemas bas previse sirokih primjena OCL/CUDA price.
__________________
https://2.71828182845904523536028747...966967627.com/

Programer
Rok od dva mjeseca u stvari znači četiri, ali nikako ispod šest.
Bubba je offline   Reply With Quote