ČeskéHry.cz - KOMUNITA HERNÍCH VÝVOJÁŘŮ

Matasx · Založen: 17. 08. 2008 Příspěvky: 258

Zdravím všechny. Udělal jsem si takový malý test v C#. Dvourozměrné pole se strukturou (float,float,float). Procházím všechny prvky a nad každou strukturou provedu 3 FPU operace (např. 3 vynásobení dvou čísel). Při "rozlišení" 800x600 se dostanu na 5 průchodů celým polem za vteřinu (5fps). Z toho mi (ať počítám jak počítám) vychází: 800*600*3*5 = 7 200 000 (?FLOPS?). Samozřejmě jsou mezitím nějaké režijní operace (nějaký ten mov, add, inc a bůh ví co tam .NET ještě nabastlí). - Toto na i7 pouze na jednom jádru. Někde na netu sem našel že i7 extreme na 3.2GHz má 70 GFLOPS. Proto se mi to zdá trochu málo. A nebo je to ok?

Ještě přiložím kód.

Deluxe

Ja myslim ze se to takhle neda rict, tech 70 GFLOPS bude urcite teoretickej vypocetni vykon. Tady ti muze system napr. pozastavit vlakno nebo dalsich 1000 veci. Spis bych to porovnaval se stejnym kodem v C/C++ nebo jinym nativnim jazykem.

Marek

Yep, zkus to samý napsat v C/C++.

Do teoretického výkonu se může počítat využití všech jader a všech dostupných instrukčních sad (zejména poslední verze SSE).
_________________
AMD Open Source Graphics Driver Developer

Matasx · Založen: 17. 08. 2008 Příspěvky: 258

No takže výsledky (1 440 000 operací):
C# - 192 až 200 ms
C - 190 až 197 ms

Takže rozdíl žádný. A není těch 7 200 000 operací opravdu nějak málo? Embarassed

JohnyDog · Založen: 17. 08. 2007 Příspěvky: 66

Matasx · Založen: 17. 08. 2008 Příspěvky: 258

C#: http://nopaste.ceske-hry.cz/222806
C: http://nopaste.ceske-hry.cz/222807

Mantharis · Založen: 28. 07. 2007 Příspěvky: 39

Jedno nebo vice rozmerny pole pointru je imho irelevantni co se vlivu na vykon tyka...prekladac ty pole optimalizuje ze to vyjde ve vysledku na stejno a naopak tim ze se pouzije "pruhlednejsi" zdrojak tam tim spis nad tim prekladac vymysli nejakou "hezkou" optimalizaci
_________________
If the God gave us the source code we could bug the world.

Matasx · Založen: 17. 08. 2008 Příspěvky: 258

Jednorozměrný / dvourozměrný, float / double - to je bezpředmětný. To na výkon vliv nemá. A přepisem do čistýho ASM bude výsledek IMHO taky stejnej.

No proč to vlastně řeším. - Stále sem nepustil z hlavy ten raytraincing (jestli si někdo třeba ještě matně vzpomíná). Tak TEORETICKY, když přídám ještě 3 jádra, dostanu 20fps. A stále to znamená že barvu pixelu musím získat nanejvýš pomocí tří Exclamation

FPU operací. A to se tu vůbec nebavím o nějakém vykreslování toho pole na obrazovku. Takže buďto je celá tahle úvaha uplně špatně (čili mám tam něco uplně špatně) - což asi jo a nebo nejde napsat realtime raytracer (800x600) pro i7 Very Happy

A nebo ten počet operací pro získání barvy pixelu stačí (a to pochybuju).

EDIT: taková drobnost, kterou jsem přehlídl ... mam na i7 zaplý HT (tedy virtuálně 8 jader), zatížení 13% odpovídá vytížení půljádra tím pádem. (nejspíš).

JohnyDog · Založen: 17. 08. 2007 Příspěvky: 66

Matasx · Založen: 17. 08. 2008 Příspěvky: 258

Co znamenají optimalizace?
A C nebo C# ?
Všiml jsem si že když dám pryč ten cyklus tak poprvé se to provede za 4ms a pak už kolem těch 200ms ... nechápu.

JohnyDog · Založen: 17. 08. 2007 Příspěvky: 66

Matasx · Založen: 17. 08. 2008 Příspěvky: 258

Jo vidíš, to mě nenapadlo, po pár cyklech se "zařadí další převod"... ale to neřeším, těch 200 ms je i v C vzhledem k frekvenci výpisu odpovídající.

JohnyDog · Založen: 17. 08. 2007 Příspěvky: 66

Matasx · Založen: 17. 08. 2008 Příspěvky: 258

V kompileru to taky není. Poslal jsem exe zkompilované u mě kámošovi a ten na zastaralém AMD hlásí 16 nebo 32... tak už mě napadá jen problém zvaný Vista.
EDIT: a nebo vypnout swap.
EDIT2: swapem to taky není. Uvidím až vyměním OS za W7 - pokud do té doby nezjistím čím to je.

Marek

Jak jsi to kompiloval? Tj: Jaká byla konfigurace projektu? Jaké jsi použil optimalizace kompilátoru? Link-time code generation? Bez SSE nebo s SSE1/2? Máš zapnutý frame pointer? Co třeba Buffer Security Check a použitý Floating Point Model?

Bez těchto informací je celý test k ničemu. Základní konfigurace projektu (Debug) může klidně dát 10x pomalejší kód.

Clock nepoužívej, použij performance counter.
_________________
AMD Open Source Graphics Driver Developer

	Obsah fóra České-Hry.cz -> Obecné	Časy uváděny v GMT + 1 hodina Jdi na stránku 1, 2, 3 Další
Strana 1 z 3