Dy karta video mesatare në vend të një maje. Burim kompjuterik U SM

28.04.2019 Interesante

Ka kaluar shumë kohë që nga lëshimi i sistemit operativ Microsoft Windows Vista dhe API i përditësuar DirectX 10 si pjesë e tij. Aplikacionet e lojërave me mbështetje për versionin e ri të Direct3D 10 po shfaqen gradualisht, megjithatë, ndërsa këto janë vetëm aplikacione D3D 9 të modifikuara pak, ato nuk përdorin në mënyrë aktive veçoritë e reja të D3D 10. Dhe edhe ato lojëra që tashmë janë lëshuar befasojnë me rezultate polare në kartat video të dy prodhuesve kryesorë të çipave, sigurisht që mund t'i përdorni në këtë formë për krahasim, por kini shumë kujdes...

Bollëku i paketimeve sintetike dhe testet e lojës me mbështetje për Direct3D 10 gjithashtu nuk është vërejtur ende, i njëjti Futuremark nuk ka lëshuar një tjetër 3DMark. Por faqja ka paketën e vet teste sintetike, dhe ne kemi planifikuar të përditësojmë RightMark3D për një kohë të gjatë në mënyrë që të jemi në gjendje të vlerësojmë performancën maksimale të përshpejtuesve D3D10 në detyra të ndryshme. Versioni përfundimtar i RightMark3D 2.0, i krijuar për përshpejtuesit e pajtueshëm Direct3D 10 në sistemin operativ MS Windows Vista, u shfaq kohët e fundit, dhe ne menjëherë fillojmë ta përdorim atë në materialet tona.

Disa teste të njohura më parë në paketën e përditësuar u rishkruan për DX10, u shtuan lloje të reja të testeve sintetike: teste të modifikuara të shaderit të pikselit të rishkruara për SM 4.0, teste të hijezuesit të gjeometrisë, teste të tërheqjes së teksturës nga shaderat e kulmit. Ky artikull do të jetë i pari në RightMark3D 2.0, ai përfshin një grup të madh kartash video të testuara, më pas do të fillojmë të përdorim testin e ri në materialet tona bazë.

Duhet të theksohet se të gjitha testet tona janë thjesht sintetike, ato zakonisht përdorin vetëm blloqe të caktuara të çipit video, ndikimi i performancës së pjesës tjetër reduktohet qëllimisht në minimum. Në të gjitha testet, procesori qendror nuk është i përfshirë, gjithçka konsiderohet ekskluzivisht nga çipi video. Le të fillojmë testet e shumëpritura DirectX 10!

Kushtet e testimit

Versioni i paketës së provës sintetike RightMark3D 2.0 i përdorur nga ne me një përshkrim të shkurtër të testeve është i disponueshëm për shkarkim (4,5 MB)

RightMark3D 2.0 kërkon paketën e instaluar ZNJ studio vizuale 2005 koha e ekzekutimit dhe e fundit Përditësimi i DirectX koha e ekzekutimit.

Shënim: pamja e ekranit tregon një version të veçantë të RightMark3D 2.0 me aftësinë për të testuar në modalitetin e grupit. Është menduar për përdorim shtëpiak dhe do të jetë në dispozicion më vonë.

Konfigurimi i stolit të provës:

Kompjuteri i ndezur Me bazë Intel Core 2 Duo (Socket 775)
- procesor Intel Core 2 Duo Extreme X6800 (2930 MHz) (L2=4096K);
- Pllaka amë EVGA nForce 680i SLI është aktivizuar chipset Nvidia nForce 680i;
- RAM 2 GB DDR2 SDRAM Corsair 1142 MHz (CAS (tCL)=5; Vonesë RAS në CAS (tRCD)=5; Parambushje e rreshtit (tRP)=5; tRAS=15);
- hard disk WD Caviar SE WD1600JD 160GB SATA;
- njësia e furnizimit me energji elektrike Tagan 1100-U95 (1100W).
salla e operacionit Sistemi Windows Vista Ultimate 32-bit; DirectX10;
monitor Dell 3007WFP (30").
versioni 8.3891 i drejtuesve të ATI CATALYST; Nvidia ForceWare versioni 158.45.

Testet sintetike u kryen në kartat video:

RADEON HD 2900XT me cilësime standarde
RADEON HD 2600XT me cilësime standarde
RADEON HD 2600 PRO me cilësime standarde (version me memorie video GDDR3)
RADEON HD 2400XT me cilësime standarde
Geforce 8800 Ultra me cilësime standarde
Geforce 8800 GTX me cilësime standarde
Geforce 8800 GTS me cilësime standarde (Versionet me memorie video 320 dhe 640 MB tregojnë performancë të ngushtë)
GeForce 8600 GTS me cilësime standarde
GeForce 8600 GT me cilësime standarde
GeForce 8500 GT me cilësime standarde

Për të krahasuar kartat video me njëra-tjetrën, do të përdoren çifte modelesh AMD dhe Nvidia, që përkojnë në pozicionimin në treg: HD2900XT GF8800GTS, HD2600XT GF8600GT, HD2600PRO GF8500GT. Disa nga kartat video nuk janë ende në treg, dhe nëse janë çmimet reale do të jetë ndryshe, është e nevojshme të bëhen ndryshime në përfundimet e artikullit. Çmimet gjithashtu luhaten vazhdimisht, dhe shumë nga përfundimet e artikullit janë të vlefshme vetëm për kohën kur u botua. Sigurisht, kjo nuk vlen për krahasimin teorik të çipave të rinj dhe të vjetër të së njëjtës kompani, vlerësimi i performancës së tyre relative nuk varet nga çmimet.

Përshkrimet dhe rezultatet e testit

Ju kujtojmë se rezultatet e testeve sintetike të arkitekturave të unifikuara DirectX 10 duhet të analizohen me kujdes, ngarkesa në to shpesh qëndron vetëm në një ose dy lloje shader: kulm, gjeometri, piksel. Dhe nëse në një arkitekturë konvencionale, me një ngarkesë të balancuar në të gjitha blloqet e listuara, performanca nuk ulet, atëherë në një arkitekturë të unifikuar, puna totale do të bjerë në gjithçka menjëherë dhe shpejtësia e paraqitjes do të bjerë.

Testet e shaderit të pikselëve PS 4.0 (teksturimi, ciklimi)

Versioni i ri i RightMark3D 2.0 i përdorur në këtë artikull përfshin dy teste tashmë të njohura për ne nga PS 3.0, më të vështirat nga testet tona sintetike të hijezuesit të pikselëve Direct3D 9, si dhe dy teste krejtësisht të reja. Të parët u rishkruan për DirectX 10, ata gjithashtu shtuan vetë-hije dhe aftësinë për të mundësuar supersampling, gjë që rrit më tej ngarkesën tashmë të konsiderueshme në çipat video.

Gëzof shader procedural që bën lesh
Harta e pjerrët e paralaksit Lloji "i rëndë" i teknikës së hartës së paralaksit, ende i pa përdorur në lojëra, i përshkruar më parë në artikull

Këto dy teste matin performancën e ekzekutimit të shaderave të pikselit me cikle, me një numër të madh të marrjes së teksturës (në modalitetin më të rëndë, deri në disa qindra tërheqje për piksel!) dhe një ngarkesë relativisht të vogël ALU. Me fjalë të tjera, ata matin shpejtësinë e marrjes së teksturës dhe efikasitetin e degëzimit në hijezuesin e pikselit.

Leshi do të jetë testi ynë i parë i hijezuesit të pikselëve. Në maksimum cilësime të ulëta ai përdor 15 deri në 30 mostra teksture nga harta e lartësisë dhe dy mostra nga tekstura kryesore. Detajet e efektit Modaliteti "High" rrit numrin e mostrave deri në 40-80, përfshirjen e supersampling "shader" deri në 60-120 mostra dhe modaliteti "High" së bashku me SSAA ka një "ashpërsi" maksimale nga 160 në 320. mostra nga harta e lartësisë. Duket kështu:

Një test shumë i vështirë, edhe nëse gjykojmë vetëm nga përshkrimi. Le të shohim se si përballen me të të gjitha kartat video DirectX 10 të disponueshme për ne. Le të kontrollojmë së pari mënyrat pa aktivizuar supersampling, ato janë relativisht të thjeshta dhe raporti i rezultateve në modalitetet "Low" dhe "High" duhet të jetë afërsisht i njëjtë.

Testet e para të paraqitjes procedurale të gëzofit me tërheqje të shumta teksture nga shader kompleks me cikle tregojnë një avantazh të madh të kartave video Nvidia ndaj zgjidhjeve AMD. Edhe çipat Nvidia të rangut të mesëm tregojnë rezultate në të njëjtin nivel me zgjidhjen më të lartë të AMD, për të mos përmendur kartat e bazuara në çipat G80, të cilat nuk kanë fare konkurrentë. Pra, sipas këtij testi, të gjitha zgjidhjet Nvidia janë më të shpejta se kartat e tyre përkatëse video AMD. Duke marrë parasysh se një vonesë e tillë teorikisht nuk duhet të ekzistojë, mund të supozohet se në rezultatet e ulëta të AMD në në një masë të madhe drejtuesit e këqij janë fajtorë.

Numrat e paraqitur në mënyra të ndryshme, korrelojnë mirë me njëri-tjetrin rezultatet në "Lartë" janë afërsisht një herë e gjysmë më të ulëta se në "I ulët". Për sa i përket raportit të performancës midis kartave të nivelit të lartë dhe kartave të rangut të mesëm, mund të themi se reduktimi i njësive të ekzekutimit godet shumë fort çipat e rangut të mesëm dhe të mesëm. nivele më të ulëta për të dy prodhuesit, kjo vlen veçanërisht për zgjidhjet Nvidia (dhe për AMD, nëse supozimi për mangësitë versionet aktuale shoferi është i saktë) G84 është tre herë pas G80, dhe G86 tregon një rezultat dy herë më të ulët. Nisur nga këto shifra, performanca e këtij testi nuk varet vetëm nga numri dhe shpejtësia e TMU-ve, përndryshe diferenca do të ishte më e vogël.

Le të shohim rezultatin e të njëjtit test, por me supersampling "shader" të ndezur, i cili rrit sasinë e punës katër herë më shumë:

Një kompleksitet i tillë i testit është i mundur vetëm për çipat e nivelit të lartë, vlerat e treguara të shpejtësisë së kornizës për sekondë flasin në mënyrë elokuente për këtë. Në përgjithësi, fotografia duket pothuajse e njëjtë si në rastin e mëparshëm, por shihet qartë se ndërsa kompleksiteti i shaderit dhe ngarkesa në çipin e videos rritet, zgjidhjet AMD fillojnë të arrijnë me kartat video Nvidia. GeForce 8600 nuk e kalon më HD 2900 XT, megjithëse është afër tij, dhe GeForce 8500 GT madje fillon të humbasë pak nga konkurrenti i tij në rangun e çmimeve, HD 2600 PRO.

Aktivizimi i super-kampionimit teorikisht rrit ngarkesën me saktësisht katër herë, por në kartat video të familjes G8x zvogëlon shpejtësinë me më shumë se 5 herë, dhe në R6xx vetëm me pak më shumë se 3, për shkak të së cilës këto të fundit në kushte të tilla marrin rezultate relative të përmirësuara. Me shumë mundësi, me përsosjen e duhur të drejtuesve, Nvidia do të jetë në gjendje të zvogëlojë rënien e performancës kur aktivizohet SSAA, por AMD gjithashtu ka mundësi të ngjashme për përmirësim ...

Testi i dytë që mat performancën e ekzekutimit të hijeve komplekse të pikselave me sythe me një numër të madh të tërheqjeve të teksturës është Harta e Paralaksave të Pjerrëta. Në cilësime të ulëta, ai përdor 10 deri në 50 mostra teksture nga harta e lartësisë dhe tre mostra nga teksturat kryesore. Kur aktivizoni modalitetin e rëndë me vetëhije, numri i mostrave dyfishohet (nga 20 në 100), marrja e super-kampioneve katërfishon këtë numër (nga 40 në 200 mostra). Me e veshtira modaliteti i testimit me supersampion dhe vetëhije përdor 80 deri në 400 mostra teksture, pra tetë herë më shumë se modaliteti i thjeshtë.

E njëjta gjë ne fillimisht kontrollojmë opsionet e thjeshta pa supersampion:

Testi i dytë është më interesant nga pikëpamja praktike, pasi variacionet e hartës paralaksore përdoren tashmë në lojëra, dhe variacionet e rënda, si harta jonë e pjerrët e paralaksave, së shpejti do të përdoren në to. Dhe në këtë test, përveç super-kampionimit, mund të aktivizoni vetë-hije, e cila përafërsisht dyfishon ngarkesën në çipin e videos. Kjo mënyrë quhet "E lartë", dhe e zakonshme "I ulët".

Në testet tona të hartës së paralaksisë Direct3D 9, zgjidhjet ATI (dhe më pas AMD) ishin tradicionalisht të forta, këtë herë nuk fituan, përkundrazi, pa ndezur supersampling, çipat Nvidia e përballojnë detyrën më shpejt. Ne vërejmë menjëherë një rënie pak më të madhe të performancës kur kalojmë nga modaliteti "I ulët" në "High" për kartat video AMD. Ndryshimi i rezultateve kur aktivizohet vetë-hije për zgjidhjet Nvidia është rreth 1.5 herë, dhe për AMD më shumë se dy herë. Për shkak të kësaj, rezultatet në modalitetin "High" për këtë të fundit janë relativisht të ulëta. Në përgjithësi, sipas rezultateve të testeve, mund të vërejmë edhe një herë fitoren e zgjidhjeve Nvidia në të gjitha sferat e çmimeve, fitimi në segmentin e sipërm është veçanërisht i dukshëm.

Çipat e diapazonit të çmimeve të mesme dhe të ulëta në këtë test tregojnë pothuajse të njëjtën ose pak më të mirë: ato të mesme mbeten prapa atyre të larta për më shumë se dy herë, dhe ato më të dobëtat mbeten prapa atyre mesatare me të njëjtën shumë. Le të shohim se çfarë do të ndryshojë përfshirja e supersampling, në testin e fundit shkaktoi një rënie më të madhe të shpejtësisë në Nvidia dhe kjo mund të përmirësojë pozicionin e kartave AMD.

Shifrat FPS tregojnë edhe një herë kompleksitetin e detyrave tona edhe për zgjidhjet e nivelit të lartë. Shikoni FPS-në që rezulton me supersampling dhe vetë-hije të aktivizuara (grafiku i fundit), duke i mundësuar ato së bashku rrit ngarkesën me pothuajse tetë herë, duke shkaktuar një rënie katastrofike të performancës. Dallimi midis shpejtësisë së kartave video nga të ndryshme segmentet e çmimeveështë i shpëtuar.

Aktivizimi i super-kampionimit ka pothuajse të njëjtin efekt si në rastet e mëparshme, kartat e bazuara në çipat AMD R6xx përmirësojnë performancën e tyre në krahasim me Nvidia G8x. Është e çuditshme që Nvidia ka një rënie prej 4 herë (e barabartë me teorinë), dhe AMD vetëm 3 herë. Pavarësisht kësaj, AMD nuk arrin të fitojë në përgjithësi, përveç se në segmentin e çmimeve më të ulëta GeForce 8500 GT (G86) zakonisht humbet nga HD 2600 PRO (RV630). Në çiftet e mbetura, ne deklarojmë një tjetër fitore për zgjidhjet Nvidia.

PS 4.0 Pixel Shader Tests (Informatikë)

Çifti tjetër i testeve të hijezuesit të pikselit përmban një minimum të tërheqjeve të teksturës, kjo është bërë për të zvogëluar ndikimin e shpejtësisë së njësive TMU në shpejtësinë e përgjithshme. Megjithatë, përdoret një numër shumë i madh veprimet aritmetike(mëkat, cos, fuqizim, etj.). Këto teste matin saktësisht performancën matematikore të çipave video, shpejtësinë e ekzekutimit të udhëzimeve aritmetike në shaderin e pikselëve. Ndikimi i të gjitha njësive të tjera të ekzekutimit është minimizuar.

Testi i parë i matematikës Mineral. Mund të quhet një test i teksturimit kompleks procedural, ai përdor vetëm dy mostra të të dhënave të teksturës dhe 65 udhëzime sin dhe cos, për një total prej mbi një mijë udhëzime për piksel.

Në përputhje me rezultatet e hulumtimit tonë duke përdorur versionin e mëparshëm të testeve sintetike Direct3D 9, në probleme komplekse llogaritëse Arkitektura AMD performon shumë mirë, të gjitha zgjidhjet e tyre janë përpara konkurrencës. Por Nvidia G8x nuk është shumë prapa. Po, zgjidhjet AMD janë më të shpejta në të gjitha segmentet e çmimeve, por në nivelet e larta, më të rëndësishmit nga pikëpamja strategjike, epërsia është e vogël, veçanërisht duke pasur parasysh që Nvidia ka gjithashtu zgjidhje më të shtrenjta. Këtu në segmentet e poshtme dhe të mesme, zgjidhja e bazuar në çipin G86 nuk mund t'i rezistojë sulmit të RV630 më të ulët dhe përafërsisht korrespondon me zgjidhjen e bazuar në RV610, dhe opsion i shpejtë i bazuar në G84 mbetet pas RV630 të lartë. Në përgjithësi, duke marrë parasysh çmimet reale dhe të vlerësuara të të gjitha zgjidhjeve, AMD fiton këtë herë.

Performanca e zgjidhjeve të rangut të mesëm nga të dy prodhuesit në këtë test është rreth dy herë më e ulët se shpejtësia e atyre më të afërta, çipat e nivelit të ulët performojnë edhe dy herë më keq. Raporti tradicional vërehet vazhdimisht, në përputhje të plotë me reduktimin në aspektin teorik, duke marrë parasysh frekuencat e orës. Në përgjithësi, jo gjithçka është aq e keqe me çipat DirectX 10 të niveleve të mesme dhe të ulëta ... Edhe pse, në çdo rast, nuk po flasim për cilësimet maksimale Lojërat e ardhshme D3D 10, kartat e nivelit të lartë do të kenë një kohë të vështirë në to.

Testi i dytë i këtij blloku quhet Fire, dhe është edhe më i vështirë për ALU. Ajo ka vetëm një marrje teksture, por numri i udhëzimeve sin dhe cos është rritur në 130, më shumë se një mijë udhëzime në total.

Le të shohim se çfarë ka ndryshuar me rritjen e ngarkesës:

Vëmë re menjëherë se një krahasim i plotë në testin "Zjarri" nuk funksionon, ekziston një gabim i dukshëm në drejtuesit e AMD, i cili nuk lejon që produktet e tyre të tregojnë rezultate që korrespondojnë me forcën reale. Përpara se të nxjerrim përfundime, le të presim për rregullime në drejtuesit.

Dallimi midis versionit më të ri të G80 dhe G84 më të vjetër doli edhe një herë të jetë pak më shumë se dy herë, gjë që përafërsisht korrespondon me ndryshimin në frekuenca dhe numrin e njësive të ekzekutimit. E njëjta gjë vlen edhe për çipin e nivelit të ulët të Nvidia.

Testet e hijezuesit të gjeometrisë

Paketa RightMark3D 2.0 përfshin dy teste të shpejtësisë së hijezuesit të gjeometrisë kushte të ndryshme. Opsioni i parë quhet "Galaxy", teknika është e ngjashme me "point sprites" nga versionet e mëparshme Direct3D. Ai animon një sistem grimcash në GPU, një hijezues gjeometrik nga çdo pikë (nga 0.5 në 2.0 milion në total) krijon katër kulme që formojnë një grimcë (zgjerimi katërkëndor). Me sa duket, algoritme të tilla do të përdoren gjerësisht në lojërat e ardhshme DirectX 10, kështu që rezultatet e treguara në test janë veçanërisht interesante.

Është e rëndësishme të theksohet se ndryshimi i ekuilibrit në testet tona të hijezuesit të gjeometrisë nuk ndryshon rezultatin vizual, në të dyja rastet imazhi përfundimtar është saktësisht i njëjtë, ndryshojnë vetëm metodat e përpunimit të skenës. Parametri "GS load" përcakton se në cilin shader kryhen llogaritjet në kulm ose gjeometri, por numri i llogaritjeve në të dyja rastet është i njëjtë.

Le të shqyrtojmë versionin e parë të testit "Galaxy", me llogaritjet në shaderin e kulmit, për tre nivele Kompleksiteti gjeometrik:

Mund të shihet se raporti i shpejtësive për kompleksitetin e ndryshëm gjeometrik të skenave doli të jetë afërsisht i njëjtë për të gjitha kushtet, vetëm vlerat absolute ndryshojnë. Performanca e treguar nga të gjitha zgjidhjet korrespondon plotësisht me numrin e pikëve, me çdo hap rënia e FPS është rreth dy herë. Kartat video Nvidia ndjehen pak më mirë në kushte të tilla, duke treguar rezultate më të mira në të gjitha çiftet e krahasuara: GeForce 8800 GTS është më e shpejtë se HD 2900 XT, GeForce 8600 GT është më e shpejtë se HD 2600 XT, GeForce 8500 GT është më e shpejtë se HD 2600 PRO. Dallimi është i vogël, por është aty.

Detyra nuk është aq e vështirë për karta video moderne, zgjidhjet kryesore i kapërcejnë pak kartat video të rangut të mesëm, diferenca nuk arrin as dy herë. Edhe pse pjesët e ulëta mbeten prapa skajeve të mesme për të njëjtën dy herë. Ndoshta, kur transferoni një pjesë të llogaritjeve në hijezuesin e gjeometrisë, situata do të ndryshojë, si kur krahasoni zgjidhjet prodhues të ndryshëm dhe segmentet e çmimeve. Tani do ta kontrollojmë.

Në fakt, ka pasur disa ndryshime. Tani zgjidhjet e bazuara në çipat G8x jo gjithmonë i tejkalojnë zgjidhjet e bazuara në R6xx në të gjitha rastet me sasi të ndryshme gjeometria. Megjithëse GeForce 8600 GT është ende përpara RADEON HD 2600 XT dhe GeForce 8500 GT është pak përpara HD 2600 PRO, karta video e nivelit të lartë të AMD merr drejtimin. Është interesante se nuk ka pothuajse asnjë ndryshim midis numrave të Geforce 8800 GTX dhe GTS, megjithëse numri i njësive të ekzekutimit aktiv për këto çipa është i ndryshëm. Si rezultat, AMD vazhdon të humbasë, gjë që është pak e çuditshme, duke pasur parasysh efikasitetin e lartë të ekzekutimit të shader kulme nga çipat e tyre të vërejtur në testet tona të kaluara. Të shohim, ndoshta rezultati do të ndryshojë në testin e dytë...

"Hyperlight" është testi i dytë i hijezuesit të gjeometrisë në versionin e ri të RightMark3D, i cili demonstron përdorimin e disa teknikave interesante njëherësh: instancimi, prodhimi i transmetimit, ngarkesa e tamponit. Ajo përdor krijimi dinamik gjeometria duke u tërhequr në dy bufera, përdor edhe ky test mundësi e re DX10 rrymë dalje. Shaderi i parë i përdorur gjeneron drejtimin e rrezeve, shpejtësinë dhe drejtimin e rritjes së tyre, këto të dhëna vendosen në një bufer, i cili përdoret nga shaderi i dytë për renderim. Për secilën pikë të rrezes, ndërtohen 14 kulme në një rreth, në total deri në një milion pika dalëse.

Një lloj i ri programi shader përdoret për të gjeneruar "rrezet", dhe me parametrin "GS load" të vendosur në "Heavy" gjithashtu për t'i tërhequr ato. Kjo do të thotë, në modalitetin "E balancuar", hijezuesit e gjeometrisë përdoren vetëm për të krijuar dhe "rritur" rrezet, dalja kryhet duke përdorur "instancën", dhe në modalitetin "Heavy", hijezuesi i gjeometrisë është gjithashtu i përfshirë në dalje. . Le të shohim së pari mënyrën e thjeshtë:

Rezultatet e kartave të ndryshme video praktikisht nuk ndryshojnë në lidhje me njëra-tjetrën, pavarësisht nga kompleksiteti gjeometrik i skenës. Performanca shkallëzohet mirë dhe pothuajse korrespondon me parametrat teorikë, sipas të cilëve çdo nivel tjetër i "Numërimit të shumëkëndëshit" duhet të jetë dy herë më i ngadalshëm.

Avantazhi i madh i kartave video Nvidia vihet re edhe këtë herë, kur ngarkesa në shaderat e gjeometrisë nuk është aq e madhe. RADEON HD 2900 XT ka performancë më të mirë edhe nga Geforce 8600 GT, dhe zgjidhja më e ulët e Nvidia është pak më përpara se HD 2600 XT. G80 nuk ia vlen të flitet - ata janë shumë përpara, dhe performanca e tyre është e kufizuar qartë nga diçka tjetër, pasi ata nuk fitojnë shumë në krahasim me G84.

Është interesante se performanca e HD 2400 XT është pothuajse e barabartë me atë të HD 2600 PRO, dhe të dyja shifrat janë shumë prapa HD 2600 XT, gjë që nuk ishte rasti në të kaluarën. Të gjithë këta numra mund të ndryshojnë në testin tonë të ardhshëm, ku shaderat e gjeometrisë përdoren edhe më aktivisht. Do të jetë veçanërisht interesante të krahasohen numrat e marrë në mënyrat "E balancuar" dhe "Rëndët" me njëri-tjetrin.

Dakord, situata doli krejt ndryshe! Mund të themi qartë se çipat e serisë AMD R6xx e kryejnë këtë punë shumë më shpejt se çipat Nvidia G8x, duke pasur një avantazh prej 2 herë ose edhe më shumë. Kryerja e këtyre testeve varet shumë nga kompleksiteti i punës për shaderat e gjeometrisë. Çipat AMD bëjnë më shumë sesa thjesht punë vendime më të shpejta Nvidia, me kompleksitetin e gjeometrisë, ky ndryshim rritet. Rezulton se sa më e vështirë të jetë puna për shaderin e gjeometrisë, aq më shpejt do të krahasohet R6xx me G8x.

Por, duke krahasuar rezultatet në mënyra të ndryshme, kur lloje të ndryshme shader përfshihen në dalje, duhet theksuar se rezultatet e Nvidia në Balanced rezultuan më të mira se ato të AMD në Heavy. Përkundër faktit se imazhi i shfaqur nuk ndryshon. Kjo kërcënon edhe një herë zhvilluesit e aplikacioneve 3D me faktin se ata do të duhet të optimizojnë kodin e tyre për dy arkitektura kaq të ndryshme në mënyrë që të arrijnë performancën maksimale nga të dyja.

Kur kaloni nga përdorimi i "instancimit" në një hijezues gjeometrie në dalje, kartat video Nvidia humbasin shumë performancë, nga 2 në 6 herë. Për më tepër, sa më i ri të jetë çipi, aq më i madh është ndryshimi në shpejtësinë e paraqitjes midis dy mënyrave. AMD ka të kundërtën, rezultatet në mënyrën e përdorimit të një shader gjeometrik për dalje janë më të mëdha se sa me "instancimin", megjithëse jo nganjëherë. Rezulton se vetë shaderat gjeometrikë punojnë më mirë në çipat AMD me një rritje të punës (numri i kulmeve të gjeneruara), por realiteti ndryshon nga testet sintetike në atë që zhvilluesit janë të lirë të zgjedhin rrugën e tyre dhe nëse përdorin shader kulme për detyrat janë më fitimprurëse, ata mund ta bëjnë këtë.

Dallimi midis shpejtësisë në modalitetet "E balancuar" dhe "Heavy" për çipa të ndryshëm të së njëjtës linjë është gjithashtu jashtëzakonisht kurioz. Situata qesharake me krahasimin HD 2400 XT dhe HD 2600 PRO u përkeqësua edhe më shumë tani çipi i vogël madje tejkalon atë të vjetër. Dhe "fajtor" këtu, ka shumë të ngjarë, më shumë Frekuencë e lartë vendimi i vogël dhe konfigurimi i trekëndëshit të kufirit të shpejtësisë. Nvidia nuk e sheh këtë, të gjithë çipat treguan rezultate në mënyrë rigoroze sipas linjës G84 është 2-3 herë më i ngadalshëm se G80, dhe G86 4-6 herë më i ngadalshëm. HD 2600 PRO është një tjetër mister që nuk mund të shpjegohet vetëm se kjo kartë video AMD humbet performancën kur ndryshon modalitetin nga "E balancuar" në "Heavy" në një modalitet me shumë gjeometri.

Duhet gjithashtu të theksohet se ka një gabim në drejtuesit e AMD, i cili shfaqet vetëm në HD 2900 XT, duke shkaktuar mungesën e një imazhi të shfaqur në modalitetin më të vështirë të testit "Hyperlight" dhe anormal. Rezultati i lartë e cila nuk mund të merret si e saktë. Prandaj, në diagramin e fundit nuk ka asnjë rezultat për këtë kartë video.

Përfundimi kryesor i kësaj pjese është se testet e ndryshme të hijeve të gjeometrisë mund të japin rezultate të ndryshme, në disa teste zgjidhjet Nvidia do të jenë në krye, në të tjera AMD. Me rritjen e kompleksitetit të punës së hijezuesit të gjeometrisë, AMD merr drejtimin, por duhet të mbani mend se këto janë të gjitha teste sintetike, rreth performancë reale do të jetë e mundur të gjykohet vetëm nga testet e lojërave, të cilat janë ende shumë të pakta, për fat të keq.

Shkalla e tërheqjes së teksturës nga shaderat e kulmit

Testet "Vertex Texture Fetch" matin shpejtësinë një numër i madh mostrat e teksturës nga shaderi i kulmit. Testet janë të ngjashme me njëra-tjetrën, teorikisht, raporti midis shpejtësive të testeve "Tokë" dhe "Valët" duhet të jetë afërsisht i njëjtë. Në të dy testet përdoret bazuar në të dhënat e mostrës së teksturës. Dallimi është se testi "Valët" përdor kërcime të kushtëzuara, ndërsa ai "Toka" jo.

Në provën e parë ("Toka"), janë bërë 32 (për modalitetin "Efekti i detajeve të ulëta") ose 48 ("Efekti i detajuar i lartë") mostra teksture bilineare për kulm. Numri i kulmeve gjithashtu mund të ndryshohet, për tre mënyrat e mundshme këta numra korrespondojnë me: 30000, 124000 dhe 280000.

Merrni parasysh modalitetin "Efekti i detajuar i ulët":

Të tre grafikët tregojnë afërsisht të njëjtën pamje të performancës së kartave video në lidhje me njëra-tjetrën, përveç Performanca e GeForce 8500 GT "ulet" më shpejt kur ngarkesa rritet sesa performanca e konkurrencës HD 2600 PRO, nëse karta e parë video fiton në "Low", atëherë zgjidhja e AMD është përpara në "High". Për një palë HD 2600 XT dhe Geforce 8600 GT, gjithçka është saktësisht e kundërta, me një ngarkesë të lehtë zgjidhja e AMD është përpara, dhe në "High" tashmë është pak prapa. Nuk kishte asnjë luftë midis zgjidhjeve kryesore, të gjitha variantet e G80 janë më të shpejtë se R600.

Raporti midis performancës së zgjidhjeve kryesore dhe kartave video të niveleve të mesme dhe të ulëta mbetet i njëjtë, deri në 2-3 herë midis të parës dhe 2-3 herë midis të dytit. Thjesht shumë interesante dallim i madh në performancën midis HD 2600 PRO dhe HD 2600 XT, nuk mund të shpjegohet me numrin e ndryshëm të njësive të teksturës (TMU), pasi përdoren të njëjtat çipa. Rezultatet e testit gjithashtu mund të ndikohen nga xhiros memorie, e cila është shumë e ndryshme për variantet PRO dhe XT.

Le të shohim rezultatet e të njëjtit test me një numër në rritje të marrjes së teksturës:

Në këtë variant Kartat video AMD pak të humbur në shpejtësi në krahasim me rivalët e tyre. Në të gjitha çiftet konkurruese, fituesit janë zgjidhjet Nvidia që kanë sasi e madhe modulet e teksturës efikase. Dallimi midis AMD dhe Nvidia kushtet e specifikuaraështë deri në 1.5-2 herë. Çipat e videove Nvidia janë qartësisht më efikasë në marrjen e të dhënave të teksturës, bazuar në teste dhe hijezues kulmesh dhe pikselësh.

Le të shohim rezultatet e testit të dytë VTF, pyes veten nëse probleme të ngjashme do të shfaqen atje? Testi i valëve ka më pak mostra, por përdoren kërcime të kushtëzuara. Numri i mostrave të teksturës bilineare për këtë rast deri në 14 ("Efekti i detajeve të ulëta") ose deri në 24 ("Efekti i detajeve të larta") për kulm. Kompleksiteti i gjeometrisë ndryshon në mënyrë të ngjashme me testin e mëparshëm, numri i përgjithshëm i kulmeve mund të jetë afërsisht 124000, 498000 dhe 1122000 për modalitetet "Numërimi i shumëkëndëshit i ulët", "Mesat" dhe "I lartë", përkatësisht.

"Valët" nuk na tregon asgjë të re, gjithçka është pothuajse e njëjtë si në testin e mëparshëm "Toka". Mund të shihet se disa çipa Nvidia (G80 dhe G86) humbasin kornizat në sekondë me rritjen e kompleksitetit të gjeometrisë pak më shpejt se konkurrentët nga AMD (R600 dhe RV630), por zgjidhjet Nvidia ende rezultojnë të jenë më të mirat në shumicën e rasteve.

Rezultatet e fundit gjithashtu korrespondojnë afërsisht me ato të treguara në rastet e mëparshme, vetëm avantazhi i zgjidhjeve të Nvidia shihet pak më mirë. Në përgjithësi, ne mund të shohim qartë se kartat video të bazuara në çipat Nvidia G8x kryejnë testet tona të mostrës së teksturës nga shaders vertex më shpejt se zgjidhjet AMD të bazuara në arkitekturën R6xx. Ky është përfundimi kryesor nga kjo seri testesh VTF.

Përfundime dhe përfundime mbi testet sintetike

Pra, ka ndodhur debutimi i përdorimit të RightMark3D 2.0 për kërkime në faqen tonë. Testet në përbërjen e tij mbulojnë pothuajse të gjitha aspektet e inovacioneve në Direct3D 10, ato janë të konfiguruara në mënyrë fleksibël, duke na lejuar të vlerësojmë performancën krahasuese të të gjitha linjave të çipave Direct3D 10 nga AMD dhe Nvidia. Të dyja arkitekturat e unifikuara nga këto kompani performuan mjaft mirë në testet tona të reja Direct3D 10, pa rënie të mëdha të performancës, me përjashtim të disa gabimeve të dukshme në drejtuesit e AMD. Të dyja familjet: R6xx dhe G8x dallohen nga performanca e lartë llogaritëse dhe tekstura, ato përballen mirë me shader kompleks të të gjitha llojeve.

Nëse i marrim rezultatet në tërësi, atëherë zgjidhjet e Nvidia kanë një avantazh ndaj konkurrentëve të tyre nga AMD, për momentin që kartat e tyre video janë përpara në shumicën e rasteve. Por në disa teste, çipat AMD tregojnë pikët më të mira, për shembull, në testet komplekse të gjeometrisë dhe hijezuesit të pikselëve. Avantazhi i çipave AMD në teste të tilla madje rritet me rritjen e ngarkesës. Pra, rezultati i betejës në lojërat DirectX 10 ende nuk është përcaktuar, është e pamundur të thuhet me siguri se cili nga rivalët do ta fitojë atë. Mund të supozojmë vetëm se rezultatet do të jenë të ngjashme me tonat në shumicën e aplikacioneve R6xx dhe G8x do të jenë afër njëri-tjetrit, në disa zgjidhje të bazuara në zgjidhje nga Nvidia, në të tjera AMD. Dhe kjo do të varet kryesisht nga zhvilluesit dhe nga metodat dhe algoritmet që ata përdorin.
Testet e versionit 4.0 të shaders piksel treguan se çipat video Nvidia përballen më mirë me marrjen e teksturave të shumta me një ngarkesë relativisht të ulët ALU. Zgjidhjet AMD, nga ana tjetër, janë përpara konkurrencës në testet llogaritëse të hijezuesit të pikselëve. Në njërën prej tyre, kartat video të bazuara në çipat e arkitekturës R6xx treguan rezultate shumë të mira dhe tejkaluan konkurrentët e tyre nga kampi Nvidia, dhe situata në testin e dytë është ende e paqartë për shkak të gabimeve në drejtuesit.
Siç kemi vërejtur tashmë, testet e gjeometrisë dhe shaderëve të kulmit japin rezultate të ndryshme, në disa raste zgjidhjet Nvidia janë në krye, në të tjera AMD. Meqenëse kartat video AMD marrin drejtimin me rritjen e kompleksitetit të hijeve të gjeometrisë, mund të supozojmë se në aplikacionet me përdorimin aktiv të hijeve të gjeometrisë, nëse ndonjë do të shfaqet në të ardhmen e afërt, çipat e kësaj kompanie do të jenë në krye.
Dy testet e fundit të RightMark3D 2.0 janë teste për shpejtësinë e marrjes së teksturës nga shaderat e kulmit. Rezultatet që ata tregojnë tregojnë qartë se kartat video të bazuara në çipat Nvidia G8x kryejnë testet tona të mostrës së teksturës nga shaders vertex më shpejt se zgjidhjet AMD të bazuara në arkitekturën R6xx. Kjo është për shkak të ekuilibrit tradicionalisht të ndryshëm midis strukturës dhe aftësive llogaritëse të çipave të dy kompanive konkurruese.
“Reduktimi” i numrit të njësive shader, TMU-ve dhe ROP-ve ka pasur një ndikim mjaft të rëndësishëm në zgjidhjet e nivelit të mesëm dhe të ulët, duke ulur ndjeshëm performancën e tyre. Kartat video të lira mbeten disa herë pas atyre të para, ato më të mirat e mesme janë 2-3 herë prapa (nga HD 2900 XT dhe Geforce 8800 GTS), dhe ato të nivelit të ulët janë edhe më shumë deri në 4-8 herë. E cila konfirmohet nga rezultatet e testeve të lojërave, deri më tani vetëm Direct3D 9.
Bazuar në rezultatet tona, drejtuesit e AMD për Vista janë qartësisht më pak të lëmuar se Drejtues Nvidia. Nëse nuk u gjetën gabime në produktet e kompanisë së dytë në testet tona, atëherë zgjidhjet e AMD kishin dy probleme të dukshme: e gjithë linja e çipave në testin e dytë "kompjuterik" të hijeve të pikselëve ("Zjarri"), si dhe zgjidhje e lartë HD 2900 XT në modalitetin më të vështirë të provës për shpejtësinë e marrjes së teksturës nga hijezuesit e kulmit të Tokës. Do të doja shumë të besoja se këto mangësi do të eliminohen në versionet e ardhshme të drejtuesve të CATALYST.

Falë fillimit të shitjeve të përpunuesve AMD Ryzen 5 përpara afatit (11 Prill), rishikimet e para të këtyre procesorëve shfaqen tani. Ne kemi folur tashmë shkurtimisht për performancën e procesorit me 4 bërthama Ryzen 5 1400 në testet sintetike dhe lojërat moderne. Tani kolegët tanë spanjollë nga El Chapuzas Informatico kanë publikuar një përmbledhje të 6-bërthamave procesor AMD Ryzen 5 1600.

Ky procesor ka gjashtë bërthama fizike, secila prej të cilave ka dy fije llogaritëse, të cilat në fund të fundit japin dymbëdhjetë fije. Frekuenca bazë e procesorit është 3.2 GHz dhe mund të rritet dinamikisht deri në 3.6 GHz. AMD Ryzen 5 1600 ka një cache totale L3 prej 16 MB (8+8 MB), dhe çdo bërthamë ka 512 KB memorie L2 dhe 64 dhe 32 KB memorie instruksionesh dhe të dhënash L1, përkatësisht. Ashtu si procesorët e tjerë Ryzen, ky çip është bërë në paketën Socket AM4, dhe TDP e tij është 64 W. Kostoja e rekomanduar e artikujve të rinj për tregun amerikan është 219 dollarë.

Konfigurimi i stendës së testimit të përdorur nga kolegët tanë përfaqësohet nga komponentët e mëposhtëm:

Motherboard: MSI X370 XPower Gaming Titanium;
RAM: G.Skill TridentZ DDR4 3600MHz, me frekuencë 2400MHz;
Karta video: MSI GeForce GTX 1070 Lojëra Z;
Furnizimi me energji elektrike: Jini të qetë! Dark Power Pro11 1200V;
SSD: Kingston SSDNow KC400 128GB dhe Corsair LX 512GB;
Sistemi i ftohjes: Wraith Spire;
Sistemi operativ: Windows 10 64 bit.

Performanca me një bërthamë të procesorit Ryzen 5 1600 nuk pritet të jetë shumë e ndryshme nga performanca me një bërthamë të Ryzen 7 1700X, pasi ato janë ndërtuar në të njëjtën masë silikoni, vetëm procesori me gjashtë bërthama ka dy bërthama të çaktivizuara.

Në shumëfije Standardet e CPU-Z dhe wPrime 2.1 (32M), produkti i ri tregoi rezultate mjaft të pritshme, duke demonstruar një nivel shumë të mirë të performancës.

Në Cinebench 15, risia është përpara jo vetëm e mbingarkuar në 4.9 GHz dhe e plotësuar me më shumë memorie e shpejtë(3600 MHz) më i shtrenjtë me katër bërthama Intel Core i7-7700K, por edhe Intel Core i7-5930K me gjashtë bërthama. Por në kodimin e videos, kjo e fundit doli të ishte më e shpejtë.

Me memorie, procesori Ryzen 5 1600 nuk funksionon mirë, megjithëse është pak më i mirë se Ryzen 7 1700X.

Në disa teste sintetike, AMD e re tregon rezultate më të mira se Ryzen 7 1700X, dhe në disa humbet pak. Në shumicën e testeve sintetike, procesori Intel Core i7-6700K është më i shpejtë se të dy përfaqësuesit e AMD.

Sa i përket performancës së lojërave, është mjaft mbresëlënëse. Në shumicën e testeve në Rezolucioni i plotë HD (1920 x 1080 piksele), produkti i ri nuk është shumë prapa, nga Intel Core i7-6700K më i shtrenjtë, dhe në një farë mënyre është përpara tij. Është interesante të theksohet se Doom (duke përdorur OpenGL) dhe Rise of Tomb Raider (duke përdorur duke përdorur DirectX 11) Ryzen 5 1600 është shumë përpara Ryzen 7 1700X.

Me rezolucionin 4K UHD (3840 x 2160 piksele), situata është pothuajse e njëjtë, dhe në rastin e shumicës së lojërave, gjithçka mbështetej në performancën e kartës video.

Kështu që sistemi i rregullt ftohja, frekuenca e procesorit u rrit në 3.9 GHz, ndërsa tensioni i bërthamës ishte 1.36 V. Do të jetë interesante të shihet se sa mund të mbingarkohet produkti i ri me lëng i ftohur, dhe çfarë frekuencash do t'i nënshtrohet në overclocking ekstrem.

Temperatura e procesorit AMD Ryzen 5 1600 është 39 gradë Celsius në boshe, dhe 62 deri në 65 gradë Celsius nën ngarkesë. Konsumi i sistemit bazuar në risinë në lojëra ishte 245 W, që është afërsisht i barabartë me konsumin e sistemit të bazuar në Intel Core i7-6700K, i cili është i barabartë me 250 W.

Debati pro dhe kundër për të ashtuquajturat teste sintetike është po aq i vjetër sa koha. Ose, nga të paktën si vetë testet sintetike. Ideja kryesore në të cilën ata bazohen është të vlerësojnë performancën e përgjithshme të një sistemi kompjuterik, dhe në teori kjo është një ide vërtet e mrekullueshme.

AT botë ideale rezultati i një testi të tillë mund t'ju japë një ide të qartë dhe, më e rëndësishmja, realiste se çfarë do të prisnit nga një kompjuter, qoftë desktop apo celular, në skenarë të ndryshëm praktik - nga puna dhe shfletimi në internet deri te argëtimi dhe lojërat multimediale. .

Fatkeqësisht, nuk ka gjëra ideale dhe për këtë arsye testet sintetike, si çdo gjë tjetër, nuk janë perfekte. Në veçanti, dy më të njohurit dhe të përdorur gjerësisht programet e testimit kjo klasë - 3DMark dhe PCMark nga Futuremark - ka ndodhur tashmë të jetë në epiqendrën e një sërë skandalesh. Sigurisht, ky nuk është faji i vetë zhvilluesve nga Futuremark - arsyet, para së gjithash, qëndrojnë në qasjet e ndryshme të prodhuesve për të "optimizuar" pajisjet e tyre, me të cilat ata përdorin me shkathtësi disa mangësi në procedurat e testimit dhe zbatojnë artificialisht të larta rezultate, të cilat megjithatë nuk konfirmohen më vonë në praktikë.

Dhe megjithëse kjo u jep atyre një emër të keq, testet sintetike janë ende të njohura. Megjithatë, është shumë e rrallë që ato të përdoren si matës i vetëm i performancës së një kompjuteri. Në vend të kësaj, ato shpesh shoqërohen nga një alternativë më realiste për matjen e shpejtësisë, e cila është zakonisht lojërat më aktuale me njehsor të integruar për një nga treguesit më të rëndësishëm për çdo lojtar - numrin e kornizave për sekondë.

Megjithatë, në disa raste ky lloj testi nuk është i zbatueshëm nga një këndvështrim thjesht pragmatik - për shembull, kur po flasim në lidhje me sistemet e klasës së biznesit për të cilat performanca në lojëra nuk është e një rëndësie kyçe. Arsyeja është se lojërat japin përshtypjen e gabuar kur bëhet fjalë për një makinë plotësisht të fuqishme si, le të themi, Lenovo ThinkPad X1 Carbon ose HP EliteBook 1040. "udhëtojnë" në laptopin e tyre me 60+ fps. Në vend të kësaj, gjërat janë të rëndësishme për ta, si forca strukturore, mbrojtja e besueshme e informacionit dhe koha maksimale jetëgjatësia e baterisë.

Është në raste të tilla që "sintetikët" vijnë në shpëtim - si PCMark, i cili mat performancën e përgjithshme të të gjithë konfigurimit. Megjithatë, kjo çon në disa veçori në lidhje me interpretimin e duhur të rezultateve, të cilat sisteme të ndryshme tregojnë në test.

Rast Studimi: Krahasimi i drejtpërdrejtë i lojës Laptop Lenovo Ultrabook-i i biznesit Y50 dhe HP EliteBook 1040 mund të jetë befasues. Arsyeja është se rezultatet e këtyre dy sistemeve janë të ngjashme, por njëri prej tyre bazohet në një sistem mjaft të fuqishëm kartë grafike diskrete (NVIDIA GeForce 860M), dhe tjetra në zgjidhjen e integruar grafike (Intel HD Graphics 4400). Megjithatë, nëse krahasojmë performancën e tyre të lojrave, shpejt bëhet e qartë se, ndryshe nga Lenovo Y50, EliteBook 1040 nuk mund të ofrojë një përvojë optimale të lojrave… Dhe nuk duhet, sepse në këtë rast po flasim për makinë e lëvizshme me një qëllim krejtësisht tjetër.

Por për shkak se PCMark merr parasysh performancën e përgjithshme, të dyja makinat marrin një rezultat të ngjashëm. Në thelb, testi përbëhet nga një sërë detyrash të ndryshme, qëllimi kumulativ i të cilave është të vlerësojë me saktësi (për aq sa është e mundur) aftësinë e një kompjuteri të caktuar për të përballuar skenarët e ngarkesës normale, të përditshme. Për shembull, PCMark ka detyra të dizajnuara për të vlerësuar performancën e një kompjuteri në skenarë të tillë si shfletimi në internet, puna me redaktori i tekstit, redaktimi imazhe dixhitale, video chat dhe lojëra të rastësishme.

Secila prej këtyre testeve ngarkon komponentët e sistemit në mënyrën e vet, ndërsa performanca totale e sistemit në provë llogaritet duke përdorur një formulë të veçantë dhe formohet rezultati përfundimtar.

Megjithatë, nëse doni të merrni një pamje më të qartë të aftësive të kompjuterit, duhet të bëni dy gjëra: së pari, shikoni ndarjen e detajuar të rezultateve sipas seksioneve individuale. Së dyti, vizitoni faqen e internetit të Futuremark; aty do të gjeni qindra mijëra konfigurime të ndryshme dhe do të jeni në gjendje të krahasoni performancën e sistemit tuaj kundrejt një makinerie me cilësime të ngjashme, më të ulëta ose më të larta.

Dhe një gjë tjetër - më lejoni të përfundoj duke përsëritur: rezultatet e testeve sintetike, qoftë 3DMark apo PCMark, nuk duhet të merren fjalë për fjalë. Ato janë vetëm një pikë referimi e mirë, një nga mjetet e shumta për vlerësimin e performancës së kompjuterit, ndaj nuk duhet t'u jepni atyre shumë kredi. me rëndësi të madhe. Nëse keni nevojë për informacion të detajuar, gjithëpërfshirës që do t'ju ndihmojë të zgjidhni një ose një tjetër konfigurim, jini të durueshëm dhe lexoni të gjithë rishikimin e tij (ose më mirë, disa rishikime në burime të ndryshme), në vend që të lëvizni në fund të tekstit vetëm për të parë rezultatet e testeve sintetike.

Kalofsh nje dite te mire!

Testet sintetike

AT rishikim origjinal të gjitha testet shkojnë në faqe të ndryshme, do i kombinoj per lehtesi por do i ndaj ne sintetike dhe loje.

Wprime 2.0

Një mjet i njohur për testimin e procesorëve me shumë bërthama, përcakton fuqinë e tyre duke bërë llogaritje të caktuara. Sa më pak kohë të kaloni në test, aq më i mirë është rezultati.

Më i shpejti (që nuk është për t'u habitur - me shpejtësinë e tij të orës) doli të ishte procesori kryesor i testit të sotëm. I befasuar në mënyrë të pakëndshme që Core i5 2300 mbeti pas i5 760 pothuajse një sekondë (me të njëjtën frekuencë). Ndoshta ndikohet nga madhësia më e vogël e cache-it të nivelit të tretë.

Fritz Chess Benchmar

Dhe ky është një test që përcakton performancën e procesorit duke përpunuar algoritme të ndryshme shahu. Në këtë pikë referimi, sa më shumë pikë - aq më i mirë është rezultati.

"Plaku" Core i5 760 kapërceu të gjithë përfaqësuesit e familjes Sandy Bridge.

WinRAR 3.92

Ky arkivues nuk ka nevojë për prezantim. Performanca do të përcaktohet nga numri i KB/s kur kompresohet skedarë të caktuar. Sa më i madh, aq më mirë.

Fotografia, si në provën e parë, është lideri 2500K, i ndjekur nga i 760-ti, dy hapa larg nga i cili është i5 2300.

7-Zip 9.13

Nje me shume arkivues i njohur, të cilin unë personalisht ua rekomandova shumë njerëzve (shtyp shumë më mirë se RAR dhe ZIP, është mik i mirë me të procesorë me shumë bërthama dhe OSes x64, plus plotësisht falas) në të njëjtën kohë. Performanca llogaritet në të njëjtën mënyrë si në testin e mëparshëm.

Testi u krye në modalitetin e kompresimit (grafiku i parë) dhe dekompresimi (i dyti) i skedarëve. Është e qartë se kush po udhëheq dhe me sa.

Adobe Photoshop CS5

Paketa e famshme e përpunimit skedarët grafikë. Nuk e kuptova se si u testuan në mënyrë specifike përpunuesit (nëse keni ndonjë ide - flisni), por megjithatë, le të shohim rezultatet:

Me sa duket, rezultati është në sekonda. Më pak është më mirë. Drejtues "Urat e rërës"

Rreze POV 3.7

POV Ray- program popullor me burim i hapur për testimin e procesorëve në operacionet me pikë lundruese. Numri i pikëve në test është numri i pikselëve të dhënë në sekondë, sa më shumë, aq më mirë.

Situata nga testi i mëparshëm përsëritet. Kushtojini vëmendje se çfarë avantazhi ka i5 2300 ndaj i5 760 (ju kujtoj se shpejtësia e orës është e njëjtë për të dy procesorët)! Patjetër që arkitektura e re tregon karakter. Apo ndihmon modaliteti Turbo?

CineBench R11.5

Bluebench nuk ka nevojë për prezantim provë e madhe performanca e procesorit (si në modalitetin 1-thread dhe multi-thread) në kushtet e paraqitjes 3D.

Fotografia është saktësisht e njëjtë si në disa teste të mëparshme. "Urat" përpara, 760 - prapa. Dhe avantazhi i produkteve të reja është shumë i fortë.

H.264 Enkoder V2

Kodimi i videos është një detyrë që merret shpesh procesorë të fuqishëm. Sa më pak kohë të duhet për të koduar videon në h264, aq më mirë.

I varfër 760! Sandy Bridge "dhe mos i jepni atij një shans për të fituar. Unë tashmë dua një procesor të tillë (vetëm hexacore, të paktën), më mirë të mbingarkuar në 4.5-5 GHz menjëherë. Përndryshe, kodimi i videos në Atom" dhe Q9550 nuk është më si i gëzuar si më parë

Nuk më pëlqen kur dikush përpiqet të përdorë mostra kodi të krijuara me dorë për të vlerësuar aftësitë e një analizuesi të kodit statik. Tani e tutje shembull specifik Unë do të tregoj pse kam një qëndrim negativ ndaj testeve sintetike.

Jo shumë kohë më parë, Bill Torpey shkroi një shënim në blogun e tij "Even Mo" Static ", ku tregoi sesi, sipas mendimit të tij, veglat Cppcheck dhe PVS-Studio funksionuan kur analizonin projektin itc-benchmarks. Projekti itc-benchmarks është një standard i analizës statike nga Toyota ITC.

Nuk më pëlqeu që pas leximit të artikullit të krijohet përshtypja se analizuesit Cppcheck dhe PVS-Studio janë afërsisht të barabartë në aftësitë e tyre. Nga artikulli rezulton se një analizues performon më mirë në një, i dyti në një tjetër, por në përgjithësi aftësitë e tyre diagnostikuese janë të ngjashme.

Unë nuk mendoj kështu. Sipas mendimit tim, analizuesi ynë PVS-Studio është disa herë më i fuqishëm se Cppcheck. Dhe në përgjithësi, ky nuk është një "opinion", e di!

Sidoqoftë, meqenëse nga jashtë nuk është e qartë se PVS-Studio është 10 herë më i mirë se Cppcheck, atëherë duhet të përpiqemi të kuptojmë arsyen. Vendosa të shikoj të njëjtat standarde itc dhe të zbuloj pse PVS-Studio nuk performoi mirë në këtë bazë testimi.

Sa më shumë që e shikoja, aq më i irrituar ndihesha. Dhe një shembull më çekuilibroi plotësisht, dhe unë do të flas për të pak më poshtë. Përfundimet e mia janë: Unë nuk kam ankesa kundër Bill Torpey. Ai shkroi një artikull të mirë, të ndershëm. Faleminderit Bill. Por unë kam një pretendim për Toyota ITC. Mendimi im personal: baza e tyre e provës është e kotë. Kjo është, sigurisht, një deklaratë me zë të lartë, por besoj se kam kualifikime dhe përvojë të mjaftueshme për të folur për analizuesit e kodeve statike dhe si t'i vlerësoj ato. Sipas mendimit tim, standardet itc nuk mund të përdoren për të vlerësuar në mënyrë adekuate aftësitë e një analizuesi të veçantë.

Dhe këtu është vetë testi, i cili më në fund më nxori nga qetësia.

Pra, çfarë ndodh, a është PVS-Studio më i dobët se Cppcheck në këtë shembull? Jo, ai është thjesht më i fortë!

Analizuesi PVS-Studio e kupton që ky kod është shkruar qëllimisht dhe nuk ka asnjë gabim këtu.

Ka situata kur shkruhet kod i ngjashëm posaçërisht për të shkaktuar hedhjen e një përjashtimi kur një tregues nul nuk referohet. Kjo mund të gjendet në teste ose në seksione specifike të kodit. Ne kemi parë kod të ngjashëm shumë herë. Ja, për shembull, si mund të duket kjo në një projekt real:

Void GpuChildThread::OnCrash() ( LOG(INFO)<< "GPU: Simulating GPU crash"; // Good bye, cruel world. volatile int* it_s_the_end_of_the_world_as_we_know_it = NULL; *it_s_the_end_of_the_world_as_we_know_it = 0xdead; }
Prandaj, analizuesi PVS-Studio zbaton disa përjashtime në diagnostikimin V522, në mënyrë që të mos betohet për një kod të tillë. Analizuesi e sheh atë null_pointer_001 nuk është një funksion real. Në kodin real, nuk ka gabime në funksione kur zero shkruhet në një tregues dhe çreferencohet menjëherë. Dhe emri i funksionit i tregon analizuesit se "treguesi null" është atje për një arsye.

Për raste të tilla, përjashtimi A6 zbatohet në diagnostikimin V522. Funksioni sintetik gjithashtu bie nën të. null_pointer_001. Ja sa i rrezikshëm është përjashtimi A6:

Referenca e një ndryshoreje është në një funksion, emri i të cilit përmban një nga fjalët:

gabim
default
përplasje
i pavlefshëm
provë
shkelje
hedhin
përjashtim

Në këtë rast, ndryshores i caktohet 0 nga rreshti i mësipërm.

Testi sintetik përputhej plotësisht me këtë përjashtim. Së pari, emri i funksionit përmban fjalën "null". Së dyti, zero i caktohet një ndryshoreje pikërisht në rreshtin e mëparshëm. Përjashtimi ekspozoi kodin e rremë. Dhe kodi me të vërtetë nuk është real, është një test sintetik.

Për shkak të nuancave të tilla nuk më pëlqejnë testet sintetike!

Unë duhet të itc-benchmarks dhe ankesa të tjera. Për shembull, të gjithë në të njëjtin skedar, ne mund të shohim këtë test:

Void null_pointer_006 () ( int *p; p = (int *)(intptr_t)rand(); *p = 1; /*Mjeti duhet ta zbulojë këtë rresht si gabim*/ /*GABIM: NULL dereferencimi i treguesit*/ )
Funksioni randi mund të kthejë 0, e cila më pas bëhet NULL. Analizuesi PVS-Studio nuk e di ende se çfarë mund të kthehet randi dhe për këtë arsye nuk sheh asgjë të dyshimtë në këtë kod.

I kërkova kolegëve të mi të mësonin analizuesin për të kuptuar më mirë se cili është funksioni randi. Nuk ka ku të shkosh, do të duhet të mprehësh analizuesin me një skedar në mënyrë që të funksionojë më mirë në bazën e provës në fjalë. Kjo është një masë e detyruar, pasi grupe të ngjashme testesh përdoren për të vlerësuar analizuesit.

Por mos kini frikë. Deklaroj se do të vazhdojmë të punojmë për një diagnostifikim vërtet të mirë dhe jo për t'i përshtatur analizuesit në teste. Ndoshta do të retushojmë pak PVS-Studio për standardet itc, por në sfond dhe vetëm në ato vende që kanë të paktën pak kuptim.

Unë dua që zhvilluesit të kuptojnë se shembulli me randi nuk vlerëson asgjë. Ky është një test sintetik, i cili thithet nga gishti. Ata nuk shkruajnë programe të tilla. Nuk ka gabime të tilla.

Nga rruga, nëse funksioni randi do të kthejë jo 0, por 1400 nuk do të jetë më mirë. Megjithatë, një tregues i tillë nuk mund të anulohet. Pra, mosreferencimi i një treguesi null është një rast i veçantë i çuditshëm i kodit krejtësisht të pasaktë që sapo u krijua dhe që nuk ndodh në programet reale.

Unë i di problemet reale të programimit. Për shembull, këto janë gabime shtypi që ne i identifikojmë me qindra, të themi, duke përdorur diagnostikimin V501. Interesante, në standardet itc, nuk vura re një test të vetëm ku të kontrollohej nëse analizuesi mund të zbulonte një gabim shtypi si "if (a.x == a.x)". Asnjë provë e vetme!

Kështu, itc-benchmarks injoron aftësinë e analizuesve për të gjetur gabime shkrimi. Dhe lexuesit e artikujve tanë e dinë se sa të zakonshme janë këto gabime. Por ai përmban, për mendimin tim, teste budallaqe që nuk gjenden në programe reale. Nuk mund ta imagjinoj që në një projekt real serioz mund të hasni një kod të tillë që çon në një tejmbushje të grupit:

Void overrun_st_014 () ( int buf; int index; indeksi = rand(); buf = 1; /*Mjeti duhet ta zbulojë këtë rresht si gabim*/ /*GABIM: tejkalim i buferit */ sink = buf; )
Ndoshta kjo mund të gjendet vetëm në punën laboratorike të studentëve.

Në të njëjtën kohë, e di që në një projekt serioz është e lehtë të takosh një gabim shtypi të formës:

Kthehu (!strcmp (a->v.val_vms_delta.lbl1, b->v.val_vms_delta.lbl1) && !strcmp (a->v.val_vms_delta.lbl1, b->v.val_vms_delta.lbl1));
Analizuesi PVS-Studio