Spíše to budou 2 až 3 ms kdyby to šlo přes grafiku.
Tomu sam neveris, ze by to bylo vice nez 1ms, vazne ne. Kdyz uvazuji Sandybrige-E a grafiku pripojenou do PCI-E v CPU, tak to jde do RAM jen 2x: ze sitovky do RAM a z ni do GPU a pak z GPU do RAM a pak do sitovky. Kdyz uvazujes rychlosti a frekvence PCI-E a RAM, tak mi vysvetli, co by tam trvalo tech cca 3miliony CPU cyklu (=1ms)? Latenci PCI-E v3.0 (Sandybrigde ji uz umi) ale i starsi v2.0 muzeme vpodstate zanedbat vzheldem k jeji prenosove seriove rychlosti 8 resp. 4Gbps a tomu odpovidajici lateci. Latence RAM se pocita v jednotkach az desitkach ns, tam ty tvoje jednotky ms take nedostanes. A na latenci uvnitr GPU to doufam hodit nechces, to by take neklaplo vzheldem k rychlosti a frekvenci tech pameti a GPU co se u modernich grafik pouzivaji.
jeste k tem IRQ pro GPU: jiste jsi si vedom toho, ze pro GPGPU se IRQ jiz vetsinou nepouziva, nybrz se pouziva polling nebo hybridni pristup, stejne jako je tomu u modernich 10Gb sitovek.
Je dulezite si uvedomit, ze pri pouziti dual-socket Sandybidge-E lze ke kazdemu CPU priradit jednu, treba i dual-GPU kartu, takze tuto platformu lze velice efektivne skalovat. Vzhledem k masivne paralelni povaze dnesnich GPU je to pro zpracovani pokrocilych deep packet inspection technik jako delane :) Navic existuji i GPU s ECC pameti, ktere tery pravda neco stoji.