Zobrazit předchozí téma :: Zobrazit následující téma |
Autor |
Zpráva |
Weny Sky

Založen: 28. 07. 2007 Příspěvky: 241
|
Zaslal: 15. listopad 2008, 17:01:07 Předmět: |
|
|
Eosie napsal: |
Není mi jasné, proč je mode3 nejpomalejší, když by měl být logicky nejrychlejší. |
mne to udela to same ale az na rozliseni 2048x2048, do te doby je ten mod nejrychlejsi, a mam 512 MB VRAM, takze bych to videl na to, ze proste dojde vram a sosa se to ze systemove |
|
Návrat nahoru |
|
 |
Marek

Založen: 28. 07. 2007 Příspěvky: 1782 Bydliště: Velká Morava
|
Zaslal: 15. listopad 2008, 17:58:45 Předmět: |
|
|
U mě je to stejné i u 512x512. Jinak asi to vypadá, že brzdou je sběrnice na kartě, to by to vysvětlovalo.
Ad BSOD - doporučuju to reportovat jako bug do ATI/nVidie, chyba určitě není na straně aplikace. _________________ AMD Open Source Graphics Driver Developer |
|
Návrat nahoru |
|
 |
Khaj

Založen: 16. 01. 2008 Příspěvky: 49
|
Zaslal: 15. listopad 2008, 19:18:45 Předmět: |
|
|
Trocha retrospektivy:
CPU 3Ghz 2048 MBRam
Vendor: NVIDIA Corporation
Renderer: GeForce FX 5200/AGP/SSE2
Version: 2.0.3
mode 0 MTirs/s FPS
256 8.1 61-62
512 14-16. 30-31
1024 6.6-7.3 2.6-3.3
-pri pokusu o pridani nad 1024 se nehorazne seklo CPU na 100%-
mode 1
256 7.9-8.1 60-62
512 15.9-16.4 29-31
1024 5.2-7.3 2.7-3.4
mode 2
256 7.9-8.4 59-62
512 14-16 28-30
1024 5.6-6.7 2.8-3.1
mode 3
256 4-6 29-43
512 5-6 9-13
1024 4-5 1-2
Hmm ... asi tomu nerozumim, ale me prijde logicky, ze mod 3 je nejpomalejsi ... dyt grafarna jede pouze na 4xfloat registry a 1-2 ji cpou vsechno krasne ve dvou vektorovejch registerech, jak to chce, a 3ka ji to cpe ve ctyrech (divil bych se, hodne, kdyby to umela zapakovat do dvou registru).
U dvojky to je jeste OK, to sou dva registry (dovolil bych si tvrdit, ze to zarovnava na 4x float tim, ze tam pri posilani doplnuje nuly, ale to je jen muj nepodlozenej dojem) |
|
Návrat nahoru |
|
 |
Marek

Založen: 28. 07. 2007 Příspěvky: 1782 Bydliště: Velká Morava
|
Zaslal: 15. listopad 2008, 20:15:42 Předmět: |
|
|
Khaj napsal: |
Hmm ... asi tomu nerozumim, ale me prijde logicky, ze mod 3 je nejpomalejsi ... dyt grafarna jede pouze na 4xfloat registry a 1-2 ji cpou vsechno krasne ve dvou vektorovejch registerech, jak to chce, a 3ka ji to cpe ve ctyrech (divil bych se, hodne, kdyby to umela zapakovat do dvou registru). |
Ne o registry nejde, to už jsou shadery. Výsledky, co tu ukázal nou, tak nějak odpovídají tomu, jak by to mělo v ideálním případě být. Jde o zarovnání na velikost cache-line neboli aby se každý vertex vlezl na cache-line celý (mode1, mode3). Dále jde ještě o to, jak je čtení ze dvou streamů (mode0, mode1) rychlé v porovnání s jedním prokládaným streamem (mode2, mode3). Jelikož počet vertexů a index buffer je stejný pro všechny módy, vykonávání vertex shaderu by vždycky mělo trvat stejnou dobu, takže jde ve výsledku pouze o test rychlosti sběrnice, využití cache apod. zkrátka rychlost čtení vertexů z VRAM.
Khaj napsal: |
U dvojky to je jeste OK, to sou dva registry (dovolil bych si tvrdit, ze to zarovnava na 4x float tim, ze tam pri posilani doplnuje nuly, ale to je jen muj nepodlozenej dojem) |
Tohle je úplně irelevantní.
---
Moje hypotéza: Mám pomalou sběrnici, takže přidání bajtů kvůli zarovnání na velikost cache-line to jenom zhoršilo, zatímco nou má sběrnici dost rychlou, takže tam mu to pro změnu pomohlo a trochu zvýšilo efektivitu čtení. _________________ AMD Open Source Graphics Driver Developer |
|
Návrat nahoru |
|
 |
nou

Založen: 28. 07. 2007 Příspěvky: 1050
|
Zaslal: 15. listopad 2008, 21:55:48 Předmět: |
|
|
od kamarat s ATi Radeon 4870 som dostal tieto vysledky
pri 1024
mode 0 - 333MTris/s 159 FPS
mode 1 - 345MTris/s 164 FPS
mode 2 - 347MTris/s 165 FPS
mode 3 - 392MTris/s 187 FPS _________________ Najjednoduchšie chyby sa najtažšie hľadajú. |
|
Návrat nahoru |
|
 |
Belgarat
Založen: 28. 11. 2008 Příspěvky: 1
|
Zaslal: 6. prosinec 2008, 02:27:19 Předmět: |
|
|
AMD turion X2-tl56, GF 8400G 128 MB, 2GB ram
1024:
mode 0 - 74M
mode 1 - 74M
mode 2 - 74M
mode 3 - skace mezi 65M a 80M
2048:
0 18M
1 16M
2 16M
3 20M
Pri 2048 uz nefunguje ale prekreslovani sceny. |
|
Návrat nahoru |
|
 |
|