Citiraj:
Autor syss
pci-e 3.0 nije dovoljan za nešto?
|
Ne da nije dovoljan, nego u memcpy() specificnim funkcijama imas latenciju do nekoliko stotina uS. Jos ako ne napravis (ili napravis krivo) sync threadova, dolazis do problema.
Znas i sam da je prosjek memorijskih latencija u danasnjih x86 masinama reda velicine 100 nS, a cachea zna pasti i ispod 10 nS.
Ima tu jako puno detalja i "sitnica".
Citiraj:
jasno mi je da propusnost kudikamo manja od cpu-a, ali brate mili raw power modernog gpu čipa i cpu čipa je LOL usporedba.
|
Da, samo se taj "raw power" odnosi na ono sto GPU i radi - grafiku. Pogledaj sto i kako rade shaderi pa ces vidjeti koliko je njihova primjena ogranicena.
CPU i GPU nisu ni do koljena usporedivi, i to na stranu prednosti CPU-a.
Citiraj:
pod vrlo određenu primjenu misliš izuzetno usku jelte asemblijaše?
|
Ne, krivo si me shvatio - OCL/CUDA ima svoju primjenu, samo ona mora biti jako specificno odredjena i dobro iskodirana. Tada ces zaista postici vrhunske performanse.
S druge strane, kada invertiras taj skup i cak kada maknes "general computing", i dalje nemas bas previse sirokih primjena OCL/CUDA price.