Kujtimi i shpejtësisë së Tony Buzan. Çfarë ndikon në shpejtësinë e RAM

26.03.2019 Televizionet (Smart TV)

Të gjithë i pëlqejnë risitë interesante, por ato nuk shfaqen aq shpesh sa do të dëshironim. Lloji i ri Disqet Intel® Optane™ janë një rast i rrallë. Ne ju tregojmë se çfarë është, pse u shfaq dhe pse përshtaten më mirë Total.

Pak sfond

Intel është i njohur si prodhuesi kryesor i procesorëve për kompjuterë dhe serverë. Sidoqoftë, jo të gjithë e mbajnë mend që historia e kompanisë nuk filloi me mikroprocesorin legjendar Intel 4004: produkti i parë ishte memoria me një kapacitet prej vetëm 64 bit - mund të ruante saktësisht 64 vlera (zero ose një). Ishte në vitin 1968.

Mikroprocesori Intel 4004 u prezantua në 1971

Në ditët e sotme, dy lloje disqesh përdoren për ruajtjen e të dhënave: HDD ose SSD. Të parët janë të ngadaltë, mjaft të zhurmshëm për shkak të dizajnit të tyre mekanik, por të gjerë, të qëndrueshëm dhe shumë të përballueshëm. Këto të fundit janë të shtrenjta, me shumë më pak kapacitet, absolutisht të heshtur, të shpejtë, por në të njëjtën kohë kanë mjaftueshëm sasi e kufizuar rishkruaj ciklet.

SSD me të vërtetë të shpejtë dhe të gjerë u shfaqën relativisht kohët e fundit - në gjysmën e dytë të viteve 2000, dhe u bënë të njohura në mesin e një audiencë të gjerë vetëm në fillim të viteve 2010, kur çmimet e tyre u ulën gradualisht. Deri në këtë pikë, janë bërë të paktën tre përpjekje për të gjetur një zgjidhje se si t'i bëni HDD-të e ngadaltë të funksionojnë më shpejt.

Tre përpjekje për të shpejtuar HDD

Në vitin 2008, u shfaq teknologjia ReadyDrive. Microsoft ofroi përdoruesit e Windows Vista fut një USB flash drive të rregullt në një nga portat USB të kompjuterit tuaj në mënyrë që sistemi të mund ta përdorë atë si një memorie softueri ose, më thjesht, për të përshpejtuar funksionimin e diskut.

Zgjidhja dukej interesante, por nuk u përhap gjerësisht për disa arsye: në atë kohë, disqet flash ishin shumë më të ngadalta, gjerësia e brezit të kufizuar USB 2.0 ndërhynte dhe përdorimi i ReadyDrive në pajisje portative doli të jetë i pakëndshëm.

Pak më vonë, u shfaq një zgjidhje e krijuar për të njëjtin qëllim. Intel- Memorie Turbo. Një modul i vogël memorie NAND (në të vërtetë një SSD shumë "i vogël" 512 MB deri në 2 GB) i lidhur me motherboard nëpërmjet një ndërfaqeje mini-PCIe dhe u përdor gjithashtu si një cache. Skedarët më të kërkuar u transferuan këtu.

Turbo Memory mund të gjendej më shpesh se disqet ReadyBoost, por teknologjia nuk funksionoi as - rritja e shpejtësisë së funksionimit doli të ishte modeste.

SSD dhe HDD hibrid

Përpjekja e tretë për të shpejtuar HDD erdhi në kohën e shfaqjes së ultrabook-ëve të parë, pasi kërkesat për këtë klasë të pajisjeve ishin zyrtarizuar qartë (përsëri nga Intel). Një prej tyre ishte nevoja për të shënuar një numër të caktuar pikësh në test për shpejtësinë e ruajtjes së integruar. Prodhuesit duhej të zgjidhnin SSD që ishin shumë të shtrenjta në atë kohë ose të popullarizoheshin disqet hibride- HDD me memorie flash të integruar prej 8, 16 ose 32 GB.

Përpjekja e fundit mund të quhet e suksesshme, por me kalimin e kohës disqet hibride u largua nga tregu. SSD-të 128 GB dhe 256 GB janë mjaft të lira për t'i zëvendësuar ato.

Nëse problemi me shpejtësinë zgjidhej pak a shumë me sukses, atëherë problemi i volumit mbeti. Zgjidhni sot laptop i përballueshëm- mundim i vërtetë. Ju duhet të ndaleni në opsionin me një HDD të gjerë, por të ngadaltë ose të blini një modifikim më të shtrenjtë me të SSD i shpejtë 128 GB.

Një situatë e ngjashme ndodh kur grumbullohet një buxhet kompjuter në shtëpi: Është zakon të ruhet pjesa më e madhe e të dhënave në HDD, dhe sistemi regjistrohet në një SSD buxhetore, kapaciteti i së cilës zakonisht është i kufizuar në të njëjtat 128 GB. Kjo hapësirë është e mjaftueshme për një sistem dhe nja dy lojëra serioze, por jo më shumë. Dhe këtu hyn Intel Optane.

Evolucioni i metodave të ruajtjes së informacionit mbi 25 vjet

Çfarë është Optane: e shkurtër dhe e qartë

Optane është një familje disqet e ndërtuar mbi teknologjinë 3D X-Point™. Nuk është NAND, i cili përdoret në SSD, jo DRAM, i cili përdoret në kujtesë e gjallë, por diçka krejtësisht ndryshe.

3D X-Point u krijua në partneritet të ngushtë nga Intel dhe Micron. Detajet rreth parimeve të llojit të ri të memories mbahen sekret - në fund të fundit, është një sekret tregtar. Entuziastët dhe ekspertët sugjerojnë se metoda e tranzicionit fazor është në qendër të saj, por ende nuk ka një konfirmim zyrtar.

Megjithatë, të gjitha avantazhet e 3D X-Point mbi llojet e tjera të memories maten dhe regjistrohen me kujdes. Këtu është një listë e më të rëndësishmeve:

Mesatarisht, 3D X-Point është 1000 herë më i shpejtë se NAND në SSD;

Përafërsisht 1000 herë më të qëndrueshme se SSD, gjë që eliminon problemin e kufizimit të numrit të cikleve të rishkrimit;

Pak më e ngadaltë se DRAM, në bazë të së cilës është ndërtuar RAM, por në të njëjtën kohë dukshëm më e lirë;

Punon me të dhëna në nivelin e një qelize të vetme, ndryshe nga SSD, i cili kur shkruhet, akseson faqe të tëra dhe kur fshin, funksionon me blloqe. Kjo rrit IOPS, eliminon nevojën për të fshirë të dhënat e vjetra përpara se të shkruani të dhëna të reja dhe redukton vonesat e aksesit.

Duket se këtu është, një zëvendësim ideal për një SSD, por ka një paralajmërim. Krijimi i memories bazuar në 3D X-Point është ende mjaft i shtrenjtë. Prandaj, kapaciteti pajisje Intel Optane është më i vogël, por kjo nuk i pengon ato të përdoren në mënyrë efektive tani.

Optane Memory dhe Optane SSD

Zgjidhja e serverit Optane SSD është një disk me kartë PCIe 3.0 me 375 GB memorie. SSD-të e serverëve më të besueshëm mund të rishkruhen plotësisht jo më shumë se 10-17 herë në ditë për t'i mbajtur ato të funksionojnë për pesë vjet. Optane SSD mund të rishkruhet 30 herë në ditë për të njëjtën periudhë përdorimi.

Avantazhi i dytë i tij është shpejtësia e qëndrueshme e leximit dhe shkrimit: në 99,99999% të rasteve përdoruesi do të marrë të njëjtin rezultat, ndërsa për SSD ky tregues është në nivelin 95%. Për shumë pyetje kritike për misionin, kjo nuk mjafton.

Duke pasur parasysh mungesën e problemeve me numrin e cikleve të rishkrimit dhe shumë shpejtësi e lartë Optane SSD mund të kombinohet në një grup të vetëm me RAM-in e serverit. Është ideale për detyrat e kërkuara të sotme që lidhen me mësimi i makinës, njohja e modeleve, rrjetet nervore etj.

Optane Memory për desktop dhe kompjutera laptopështë një tabelë M.2 me 16 ose 32 GB memorie të brendshme, e krijuar posaçërisht për të përshpejtuar performancën e kompjuterëve me disqe HDD. Kjo do të thotë, për ato raste kur përdoruesi nuk mund ose nuk dëshiron të blejë një SSD të shtrenjtë dhe të gjerë prej 512 gigabajt ose më shumë.

Optane Memory funksionon saktësisht në të njëjtën mënyrë siç kemi shkruar në fillim të artikullit: memoria vepron si një cache në të cilën ruhen skedarët e përdorur shpesh nga sistemi. Vetëm tani ky cache funksionon me shpejtësi fantastike dhe e kontrollojnë algoritme inteligjente, të cilat shpesh nuk funksionojnë as me skedarë të tërë, por me grupe individuale skedarësh për të kryer një detyrë specifike.

Mund të duket sikur 16 ose 32 GB nuk është shumë, por për caching programet e zyrës Optane Memory ka nevojë për disa qindra megabajt dhe disa gigabajt do të mjaftojnë për lojëra kërkuese.

Procesi i konfigurimit është plotësisht i automatizuar: përdoruesi duhet të përditësohet Drejtues Intel Shpejt deri në versionin 15.5, lidhni Optane Memory me motherboard, shtypni butonin "Aktivizo" dhe prisni 5-7 minuta që makina të rindizet dhe sistemi do të transferojë të gjitha më të kërkuarat nga HDD në Optane, duke i kombinuar të dy komponentët në hapësirë e vetme për ruajtjen e të dhënave.

Për punë me të drejta të plota me memorien Optane, është e rëndësishme që motherboard të ndërtohet në çipa të serive 200 ose 300, dhe procesori është një Core™ i3, i5 dhe i7 i gjeneratës së shtatë ose më vonë ( ). Nëse përdoruesi ka një procesor dhe motherboard më të vjetër me një prizë M.2, atëherë Optane Memory do të identifikohet si një disk i veçantë.

Për çfarë shërben Optane Memory dhe pse është më i mirë se një SSD 128-256 GB

Duke pasur parasysh përfitimet, shfaqen dy raste kryesore të përdorimit për Memory Intel Optane. Para së gjithash është zgjidhje perfekte për të përmirësuar performancën e laptopëve. Në vend të një SSD me kapacitet të vogël, mund të blini një laptop me një HDD terabyte dhe ta shpejtoni atë me Optane, të blerë me paratë që keni kursyer.

Ndoshta, vetë prodhuesit e laptopëve do të miratojnë një skemë të tillë, sepse Optane Memory me një kapacitet prej 16 GB kushton në rangun prej 3-3,5 mijë rubla, dhe çmimet për versionin me 32 GB variojnë nga 5 në 5,5 mijë. Kjo është e krahasueshme me koston e SSD-ve më buxhetore për 120-128 GB dhe 240-256 GB.

Opsioni i dytë është përdorimi i Optane Memory në buxhet kompjuterë lojërash... E teta Brezi i Intel Core tashmë mjaft ju lejon të çlironi aftësitë e kartave video të fuqishme me të ndihmë Core i3-8100: tani ka katër bërthama në vend të dy, plus një shpejtësi të lartë të orës prej 3,6 GHz.

Nëse kurseni në blerjen e një SSD të gjerë, atëherë mund të blini një kartë video të një klase më të lartë, dhe kjo është në lidhje me procesor i mirë- gjëja më e rëndësishme në një PC për lojëra. Në të njëjtën kohë, edhe unë dua ngarkim i shpejtë, dhe më pas lind ideja për të marrë një SSD buxhetore prej 128 GB, por Optane do ta zëvendësojë me sukses edhe me 16 GB memorie.

Përdoruesi nuk duhet të mendojë çdo herë se në cilat dy ose tre lojëra të ruajë ruajtje e shpejtë dhe cilat janë në një HDD të ngadaltë. Me Optane, do të ketë një grup të vetëm dhe gjithçka do të jetë e shpejtë.

Krahasimi i shpejtësisë së kujtesës Optane edhe me SSD i shtrenjtë, pastaj kujtim i ri Intel në përdorim shtëpiak do të tregojë rezultate më mbresëlënëse. Dhe jo në testet e performancës pa shpirt që ngarkojnë disqet nga program të plotë, por në skenarë realë.

Për shembull, pikë referimi krijon për Testi SSD një radhë shumë e gjatë detyrash për t'u ekzekutuar, duke e ngarkuar atë plotësisht. V jeta reale përdoruesi vështirë se mund të imagjinojë më shumë se tre detyra të njëkohshme për diskun. Për SSD është dallim domethënës: nëse me një grup prej 32 instruksionesh në radhë funksionon me kapacitetin e tij maksimal, atëherë kur punoni me një instruksion, performanca e tij bie ndjeshëm.

Optane Memory nuk ka një veçori të tillë: disku arrin performancën e tij maksimale duke filluar nga 1-3 udhëzime. Ka edhe një anë tjetër të medaljes: si më pak memorie në një SSD, aq më i ngadalshëm funksionon. Disqet në gjendje të ngurtë me një kapacitet prej 0,5-1 TB mund të quhet me të vërtetë me shpejtësi të lartë, por versionet për 128 dhe 256 GB, mjerisht, nuk janë. Më pak memorie do të thotë më pak kanale të disponueshme Kontrolluesi SSD... Është si t'u kërkosh dy njerëzve muskuloz të hapin një gropë në vend të tetë.

Më tej - vetëm më interesante. Versionet 64 GB dhe 128 GB të Optane Memory do të vijnë së shpejti dhe drejtuesi i Intel Rapid do të përditësohet në versionin 16. Në të, përdoruesit me përvojë do të jenë në gjendje të zgjedhin në mënyrë të pavarur se çfarë informacioni të ruajnë në kujtesën e një disku të shpejtë.

Intel gjithashtu planifikon të lëshojë një version konsumator të Optane SSD, duke ulur koston e produktit duke eliminuar shumë teknologjitë e serverëve, e cila përdoruesit e zakonshëm për asgjë. Dhe nëse shikoni më tej në të ardhmen, atëherë korporata planifikon të lëshojë komponentin e tretë në familjen Optane - RAM për serverët e bazuar në 3D X-Point.

Shumica e përdoruesve imagjinojnë çfarë ndikon në shpejtësinë e RAM-it... Ajo është përgjegjëse për transferimin e të dhënave dhe sa më i fuqishëm të jetë ky komponent, aq më shpejt do të funksionojnë aplikacionet dhe veçanërisht lojërat. Me volumin e tij të pamjaftueshëm, të gjitha proceset, programet do të ngarkohen për një kohë mjaft të gjatë, ose madje do të rrëzohen plotësisht, deri në një rindezje të paplanifikuar të OS, gjë që do të shkaktojë acarim të vërtetë te përdoruesi.

Parimi i funksionimit dhe karakteristikat kryesore të RAM

Kujtesa

Memoria e aksesit të rastësishëm është një mikroqark në të cilin nuk ka furnizim autonom me energji elektrike. Me fjalë të tjera, nëse kompjuteri është i fikur, atëherë të gjitha informacionet e ruajtura në RAM fshihen. Ndërveprimi i RAM-it me procesorin kryhet përmes cache-së ose kujtesës së nivelit zero.

Shpejtësia e RAM-it varet nga disa parametra, ndër të cilët mund të dallohen lloji dhe frekuenca. Për më tepër, më së shumti tregues i rëndësishëmështë vëllimi. Për kompjuterët modernë, pragu minimal duhet të jetë 2 gigabajt. Kjo për faktin se duke filluar me versionet e Windows Vista, sistemi operativ merr 1 GB për nevojat e tij, dhe në përputhje me rrethanat, për funksionimin e plotë të aplikacioneve, duhet të keni të paktën të njëjtën madhësi. Një vëllim më i vogël, natyrisht, është gjetur (megjithëse nuk ka më bare të tilla në dyqane), por këta kompjuterë tashmë janë të vjetëruar pa shpresë dhe është pothuajse e pamundur të instalohen në to, si dhe programe me burime intensive.

Shumica opsioni më i mirë në ky moment për kompjuter buxhetor do të instalojë 4 gigabajt RAM. Kjo do të sigurojë normale dhe punë e shpejtë në internet, do të bëjë të mundur shikimin dhe instalimin e videove me cilësi të ndryshme lojëra moderne duke përdorur cilësimet e mesme (megjithëse video dhe lojërat varen gjithashtu).

Për përdoruesit më të avancuar që punojnë me grafikë ose modifikojnë audio transmetime video, kërkohet sasia e RAM-it, e cila duhet të jetë nga 8 deri në 16 GB, ndërkohë që nuk duhet të harroni se në këtë rast duhet edhe një e mirë kartë grafike me një çip GDDR5 dhe në të cilin do të ketë të paktën 4 GB RAM. Kur instaloni një sasi më të madhe RAM, për shembull 32 GB, në lidhje me instalimin e kllapave shtesë, në vendet e lira për të (nëse ka), mund të qëndroni për disa vjet.

Shënim: kur instaloni më shumë RAM, nuk duhet të mendoni se kompjuteri do të fluturojë pas kësaj, sepse shpejtësia varet nga procesori dhe komponentët e tjerë. Përveç kësaj, mos harroni se versionet 32-bit sistemet operative mund të përdorë vetëm 3.2 GB RAM, pjesa tjetër do të jetë boshe.

Lloji RAM

Nga ky parametër varet edhe shpejtësia e zhurmës. Në kompjuterët modernë, lloji DDR nuk përdoret më askund, por vetëm me indekset 2,3 ose 4. Kjo duhet të merret parasysh nëse përdoruesi vendos të blejë dhe instalojë një shirit shtesë në një vend të lirë, sepse edhe pse janë e njëjta në gjatësi dhe gjerësi, në lidhjen nga pllaka amë ka një slot, i cili ndodhet në distanca të ndryshme(shih pamjen e ekranit), dhe për këtë arsye nuk mund të instalohet.

Duhet të theksohet se DDR 2 gjendet rrallë dhe për momentin, është instaluar pothuajse kudo. Lloji DDR 3. Lloji më modern i operacionit memorie DDR 4 është jashtëzakonisht i rrallë, kryesisht në ata kompjuterë që janë blerë ose përmirësuar relativisht kohët e fundit. Dhe nëse keni parasysh faktin se gjithçka motherboard duke mbështetur DDR 4, mund ta instaloni vetëm Procesorët Intel, të cilat janë dukshëm më të shtrenjta se AMD, kjo ndikon edhe në popullarizimin e tipit modern të memories. Megjithëse është e sigurt të thuhet se me DDR 4, efikasiteti do të rritet me 1.5-2 herë.

Frekuenca

Ky parametër është gjithashtu i lidhur drejtpërdrejt me. Sa më e lartë të jetë frekuenca, aq më e shpejtë është shpejtësia e zhurmës. Ndër llojet e lartpërmendura të RAM-it, nuk ka më shirita të tillë në të cilët frekuenca do të ishte më e ulët se 1600 MHz, megjithatë, kjo vlerë është modelet e fundit mund të arrijë 3200 MHz.

Përsëri, nëse pronari i kompjuterit vendos të blejë RAM dhe ta instalojë atë në një vend tjetër, ai duhet të marrë parasysh sa vijon:

frekuenca e shiritit të ri duhet të jetë identike me atë të instaluar tashmë, përndryshe ata nuk do të mund të punojnë paralelisht;
këshillohet të instaloni RAM nga një prodhues, sepse ka situata kur disa shirita me të njëjtën frekuencë, por markave të ndryshme mund të bien ndesh me njëri-tjetrin dhe kompjuteri thjesht nuk do të fillojë;
mund të kufizohet gjithashtu nga ky parametër: përpara se të blini një RAM të ri, rishikoni karakteristikat e motherboard në mënyrë që të respektohen të gjitha nuancat dhe kompjuteri të funksionojë;

Rritja e efikasitetit të punës

Ndonjëherë përdoruesi ka një sasi të mjaftueshme RAM të instaluar, ndërsa kompjuteri ngadalësohet dhe personi vendos të blejë RAM shtesë. Në disa raste, kjo mund të mos jetë fare e nevojshme, mund të kryeni vetëm optimizimin:

shikoni në menaxherin e detyrave se sa RAM është e ngarkuar, dhe nëse ka stoqe të mjaftueshme këtu, atëherë ka shumë të ngjarë që nuk ka të bëjë me RAM dhe shirit shtesë nuk do ta zgjidhë problemin;

shkarkoni aplikacionet që nuk janë aktualisht në përdorim dhe kontrolloni gjithashtu listën e programeve që ndodhen në autorun. Nëse përmban aplikacione që rrallë dhe definitivisht nuk nevojiten gjatë nisjes së kompjuterit, hiqni ato gjithashtu nga kjo listë;
, sepse ndonjëherë disa procese mund të ngrijnë në RAM dhe ta rrëmojnë atë, gjë që mund të çojë në frena dhe ngrirje.

Mund të provoni gjithashtu të mbingarkoni RAM-in. Kjo mund të bëhet nga nën BIOS. Por në të njëjtën kohë, vlen të kujtohet se disa dyqane në raste të tilla mund të refuzojnë shërbim garancie(shkëmbim), dhe jeta e shërbimit do të jetë më e vogël se pa kryer këtë veprim.

Në agim teknologji kompjuterike memoria dinamike funksionoi mjaft mirë në frekuencën e procesorit. Përvoja ime e parë në kompjuter ishte me një klon kompjuterik ZX Spectrum. Procesori Z80 përpunonte udhëzimet mesatarisht 4 cikle për operacion, ndërsa dy cikle u përdorën për të kryer rigjenerimin dinamik të memories, që na jep në një frekuencë prej 3,5 MHz, jo më shumë se 875,000 operacione në sekondë.

Sidoqoftë, pas një kohe, frekuencat e procesorit arritën një nivel të tillë kur memoria dinamike nuk mund të përballonte më ngarkesën. Për të kompensuar këtë, u prezantua një lidhje e ndërmjetme në formën e një memorie cache, e cila bëri të mundur që, për shkak të operacioneve të kryera në një sasi të vogël të dhënash, të zbutej diferenca në shpejtësinë e procesorit dhe memories kryesore.

Le të hedhim një vështrim se çfarë është tani RAM-i i kompjuterit dhe çfarë mund të bëhet me të për të rritur shpejtësinë e sistemit kompjuterik.

Shkurtimisht për kujtesën statike dhe dinamike

Kujtesa është ndërtuar në formën e një tabele, e përbërë nga rreshta dhe kolona. Çdo qelizë e tabelës përmban një bit informacioni (ne po diskutojmë kujtesën gjysmëpërçuese, megjithatë, shumë zbatime të tjera janë ndërtuar mbi të njëjtin parim). Çdo tabelë e tillë quhet "bankë". Disa banka mund të vendosen në një mikroqark / modul. Seti i moduleve të memories projektohet në hapësirën lineare të adresave të procesorit, në varësi të thellësisë së bitit të elementeve individuale.

Një qelizë memorie statike është ndërtuar mbi bazën e një shkas, i cili zakonisht është në një nga gjendjet e qëndrueshme "A" ose "B" (A =! B). Numri minimal i transistorëve për një qelizë është 6 copë, ndërsa kompleksiteti i gjurmimit në qeliza me sa duket nuk lejon që të bëhen module me memorie statike prej 1 gig, me çmimin e një moduli konvencional prej 8 gig.

Përndryshe, parimi i funksionimit është identik dhe konsiston në sa vijon:

Marrja fillestare e një linje memorie çon në aksesin në të gjitha përmbajtjet e saj të vendosura në linjën buffer me të cilën vjen punë të mëtejshme, ose ndodh multipleksimi i aksesit të kolonës (qasja e vjetër, e ngadaltë);
- të dhënat e kërkuara transferohen në pajisjen kryesore (zakonisht CPU), ose qelizat e specifikuara modifikohen gjatë operacionit të shkrimit (ka një ndryshim të vogël, për memorien statike është e mundur të modifikohet drejtpërdrejt qeliza e rreshtit të zgjedhur, për memoria dinamike rreshti i buferit modifikohet dhe vetëm atëherë ekzekutohet shkruaj përsëri përmbajtja e të gjithë rreshtit në një lak të veçantë);
- mbyllja dhe ndryshimi i një linje memorie është gjithashtu e ndryshme për tipe te ndryshme memoria, për memorien statike, një ndryshim i menjëhershëm i linjës është i mundur nëse të dhënat nuk kanë ndryshuar, për memorien dinamike është e nevojshme të shkruani përmbajtjen e linjës së tamponit në vend, dhe vetëm atëherë mund të zgjidhni një rresht tjetër.

Nëse në agimin e llogaritjes, çdo operacion leximi ose shkrimi përfundoi me një cikël të plotë memorie:

Zgjedhja e linjës;
- Operacioni i leximit/shkrimit nga një qelizë;
- ndryshimi/zgjedhja e linjës.

Funksionimi modern i punës me mikroqarqe "memorie sinkrone a la DDRX" është si më poshtë:

Zgjedhja e linjës;
- operacionet e leximit / shkrimit të qelizave të linjës në grupe prej 4-8 bit / fjalë (lejohet qasja e shumëfishtë brenda një rreshti);
- mbyllja e një linje me regjistrimin e informacionit në vend;
- ndryshimi/zgjedhja e linjës.

Kjo zgjidhje na lejoi të kursejmë kohën e aksesit në të dhëna kur, pas leximit të vlerës nga qeliza "1", kërkohet të hyjmë në qelizat "2, 3, 4 ose 7" të vendosura në të njëjtin rresht, ose menjëherë pas operacionit të leximit. , është e nevojshme të shkruani vlerën e ndryshuar ...

Mësoni më shumë se si funksionon memoria e grumbullit në lidhje me cache

Kontrolluesi i kujtesës (në chipset ose i integruar në procesor) vendos adresën e bllokut dhe numrin e linjës (pjesën e sipërme të adresës së bllokut) në mikroqarkullin / modulin e kujtesës. Përzgjidhet blloku i duhur (puna e mëtejshme do të konsiderohet brenda kornizës së një blloku) dhe "numri binar" që rezulton deshifrohet në një pozicion pozicional. adresa e vargut, pas së cilës informacioni transferohet në tampon, nga i cili më pas aksesohen të dhënat. Koha në rriqra e nevojshme për këtë operacion quhet tRCD dhe shfaqet në grafikët "9-9-9 / 9-9-9-27" në vendin e dytë.

Pasi të aktivizohet rreshti, mund t'i referoheni "kolonave" për këtë, kontrolluesi i kujtesës transmeton adresën e qelizës në rresht, dhe pas një kohe "CL" (treguar në skemën e treguar më lart "xxx" në 1 vend) të dhënat fillojnë të transmetohen nga çipi i memories në procesor (pse në shumësi? sepse këtu ndërhyn cache) në formën e një pakete prej 4-8 bitësh (për një mikroqark të vetëm) në një linjë cache (madhësia varet nga procesori, vlera tipike është 64 bajt - 8 fjalë nga 64 bit, por atje janë vlera të tjera). Pas një numri të caktuar të cikleve të orës që kërkohen për të transferuar paketën e të dhënave, mund të formoni kërkesën tjetër për të lexuar të dhënat nga qelizat e tjera të linjës së zgjedhur, ose të lëshoni një komandë për mbylljen e linjës, e cila shprehet si tRP e treguar si parametër i tretë nga "xxx -...". Gjatë mbylljes së rreshtit, të dhënat nga buferi shkruhen përsëri në rreshtin e bllokut; pas përfundimit të regjistrimit, mund të zgjidhni një rresht tjetër në këtë bllok. Përveç këtyre tre parametrave, ekziston një kohë minimale gjatë së cilës linja duhet të jetë aktive "tRAS" dhe koha minimale për një cikël të plotë pune me një linjë që ndan dy komanda për të aktivizuar linjën (ndikon në aksesin e rastësishëm).

grossws 19 Prill 2016 në orën 12:40
CL - latente CAS, tRCD - vonesë RAS në CAS, tRP - parapagesë e rreshtit, CAS - strobi i adresës së kolonës, RAS - strobi i adresës së rreshtit.
Shpejtësia e teknologjisë gjysmëpërçuese përcaktohet nga vonesat e elementeve të qarkut. Për të arritur në dalje informacion të besueshëm, ju duhet të prisni kohë të caktuar në mënyrë që të gjithë elementët të marrin një gjendje të qëndrueshme. Varet nga gjendja e tanishme banka e memories ndryshon kohën e hyrjes në të dhëna, por në përgjithësi mund të karakterizohen tranzicionet e mëposhtme:
Nëse blloku është në qetësi (nr linjë aktive), kontrolluesi lëshon një komandë për zgjedhjen e linjës, si rezultat, numri i linjës binar konvertohet në një numër pozicioni dhe përmbajtja e rreshtit lexohet në kohën "tRCD".
Pasi të jetë lexuar përmbajtja e vargut në zonën e tamponit, mund të lëshoni një komandë për zgjedhjen e kolonës, sipas së cilës numri binar i kolonës shndërrohet në një numër pozicioni, në kohën "CL", por në varësi të shtrirjes së sa më poshtë adresat, rendi i transmetimit të bitit mund të ndryshojë.
Para se të ndryshoni / mbyllni rreshtin, është e nevojshme të shkruani të dhënat në vend, pasi gjatë leximit, informacioni në të vërtetë u shkatërrua. Koha e nevojshme për të rivendosur informacionin në linjën "tRP".
Sipas specifikimit të plotë për memorien dinamike, ka shumë më tepër parametra të kohës që përcaktojnë sekuencën dhe vonesën e ndryshimit të sinjaleve të kontrollit. Një prej tyre është "tRCmin", i cili përcakton kohën minimale të ciklit për një rresht, duke përfshirë: zgjedhjen e rreshtit, aksesin e të dhënave dhe kthimin e kthimit.
Sinjali RAS përcakton nëse një adresë rreshti është lëshuar;
Sinjali CAS përcakton nëse një adresë kolone është lëshuar.
Nëse më parë i gjithë kontrolli ishte zhvendosur në anën e kontrolluesit të memories dhe kontrollohej nga këto sinjale, tani modaliteti i komandës është në progres, kur një komandë lëshohet në modul / mikroqark, dhe pas disa koha po shkon transferimi i të dhënave. Për më shumë detaje, është më mirë të lexoni specifikimet e standardit, për shembull, DDR4.
Nëse flasim për punën me dram në përgjithësi, atëherë për leximin masiv zakonisht duket kështu:
Ne vendosëm adresën e linjës,
vendos RAS (dhe hiqet pas një rrahjeje),
prita për tRCD,
vendosim adresën e kolonës me të cilën lexojmë (dhe çdo shirit tjetër vendosim numrin e kolonës tjetër),
vendos CAS,
priti CL, filloi të lexonte të dhënat,
hoqi CAS, lexoni pjesën tjetër të të dhënave (më shumë orë CL).
Gjatë kalimit në rreshtin pasardhës, bëhet parapagesa (RAS + WE), tRP është në pritje, RAS kryhet me adresën e vendosur rreshtave dhe më pas kryhet leximi siç përshkruhet më sipër.
Vonesa e leximit të një qelize të rastësishme rrjedh natyrshëm nga sa më sipër: tRP + tRCD + CL.
Në fakt, kjo varet nga gjendja e mëparshme e "bankës së memories" që po aksesohet.

Është e domosdoshme të mbani mend se RAM DDR ka dy frekuenca:

Frekuenca kryesore e orës përcakton shpejtësinë e transmetimit të komandës dhe kohën;
- Frekuenca efektive e transmetimit të të dhënave (dyfishi i frekuencës së orës, e cila përdoret për të shënuar modulet e memories).

Integrimi i kontrolluesit të memories ka rritur performancën e nënsistemit të memories duke eliminuar lidhjen e ndërmjetme transmetuese. Rritja e kanaleve të kujtesës do të kërkojë që kjo të merret parasysh nga ana e aplikacionit, për shembull, mënyra me katër kanale me një vendndodhje të caktuar skedarësh nuk jep një rritje të performancës (konfigurime 12 dhe 14).

Përpunimi i një elementi të listës së lidhur me hapa të ndryshëm (1 hap = 16 bajt)

Tani pak matematikë

Procesori: Frekuencat e funksionimit të procesorit tani po arrijnë 5 GHz. Sipas prodhuesve, zgjidhjet e qarkut (tubacionet, parashikimet dhe truket e tjera) lejojnë që një instruksion të ekzekutohet për cikël të orës. Për të rrumbullakosur llogaritjet, le të marrim një shpejtësi të orës 4 GHz, e cila na jep një operacion në 0,25 ns.

RAM: le të marrim, për shembull, RAM-in e formatit të ri DDR4-2133 me kohëzgjatje 15-15-15.

CPU
Ftact = 4 GHz
Takti = 0,25 ns (njëkohësisht, koha e ekzekutimit të një operacioni "me kusht")

RAM DDR4-2133
Fakt = 1066 MHz
Fdate = 2133 MHz
ttact = 0,94 ns
tdata = 0,47 ns
SPDmax = 2133 MHz * 64 = 17064 MB / s (shkalla e transferimit të të dhënave)
tRCmin = 50 ns (koha minimale midis dy aktivizimeve të rreshtave)

Koha e marrjes së të dhënave

Nga regjistrat dhe cache, të dhënat mund të sigurohen gjatë një cikli të orës së punës (regjistrat, cache e nivelit 1) ose me një vonesë prej disa ciklesh të orës së procesorit për një memorie të nivelit 2 dhe 3.

Për RAM, situata është më e keqe:

Koha e zgjedhjes së linjës është: 15 clk * 0,94 ns = 14 ns
- koha deri në marrjen e të dhënave nga komanda e përzgjedhjes së kolonës: 15 clk * 0,94 ns = 14 ns
- koha e mbylljes së linjës: 15 clk * 0,94 ns = 14 ns (kush do ta kishte menduar)

Nga ku rrjedh se koha midis një komande që kërkon të dhëna nga një qelizë memorie (nëse nuk është në cache) mund të ndryshojë:

14 ns - të dhënat janë në rreshtin e zgjedhur tashmë;
28 ns - të dhënat janë në një rresht të pazgjedhur, me kusht që rreshti i mëparshëm tashmë i mbyllur (blloku është në gjendje "boshe");
42-50 ns - të dhënat janë në një rresht tjetër, ndërsa linjë aktuale ka nevoje per mbyllje.

Numri i operacioneve që procesori (i lartpërmendur) mund të kryejë gjatë kësaj kohe është nga 56 (14 ns) në 200 (ndryshimi i linjës 50 ns). Duhet të theksohet veçmas se një vonesë e ngarkimit të linjës së cache-it i shtohet kohës ndërmjet komandës së zgjedhjes së kolonës dhe marrjes së të gjithë paketës së të dhënave: 8 bit pakete * 0,47 ns = 3,76 ns. Për një situatë kur të dhënat do të jenë të disponueshme për "programin" vetëm pasi të jetë ngarkuar linja e cache (kush e di se çfarë dhe si vidhosën zhvilluesit e procesorit atje, memoria, sipas specifikimit, ju lejon të dërgoni të dhënat e nevojshme përpara), marrim deri në 15 cikle ore të humbura.

Si pjesë e një pune, kam kryer një studim të shpejtësisë së kujtesës, rezultatet treguan se është e mundur të "shfrytezohet" plotësisht gjerësia e brezit të memories vetëm në operacionet vijuese të aksesit të memories, në rastin e akses të rastësishëm koha e përpunimit rritet (për shembull, një listë e lidhur me një tregues 32-bit dhe tre fjalë të dyfishta, njëra prej të cilave është përditësuar) nga 4-10 (qasja sekuenciale) në 60-120 ns (ndryshimi i linjës), gjë që jep një ndryshim në shpejtësia e përpunimit 12-15 një herë.

Shpejtësia e përpunimit të të dhënave

Për modulin e zgjedhur, ne kemi një gjerësi bande maksimale prej 17064 MB / s. Kjo për një frekuencë prej 4 GHz bën të mundur përpunimin e fjalëve 32-bit për cikël (17064 MB / 4000 MHz = 4.266 byte për cikël). Këtu vendosen kufizimet e mëposhtme:

Pa planifikim të qartë të ngarkesës së cache-it, procesori do të detyrohet të jetë boshe (sa më e lartë të jetë frekuenca, aq më shumë bërthama është vetëm duke pritur për të dhëna);
- në ciklet "lexo modifiko shkrimin" shpejtësia e përpunimit përgjysmohet;
- procesorë me shumë bërthama do të ndajë gjerësinë e brezit të autobusit të kujtesës midis bërthamave dhe për një situatë kur ka kërkesa konkurruese (rast i degjeneruar), performanca e memories mund të përkeqësohet me 200 herë (ndryshimet e linjës) * bërthama X.

Le të numërojmë:

17064 MB / s / 8 bërthama = 2133 MB / s për bërthamë në rastin optimal.
17064 MB / s / (8 bërthama * 200 operacione të anashkaluara) = 10 MB / s për bërthamë për rastin e degjeneruar.

Përkthyer në operacione, marrim 8 procesor bërthamor: nga 15 në 400 operacione për të përpunuar një bajt të dhënash, ose nga 60 në 1600 operacione / orë për të përpunuar një fjalë 32-bit.

Sipas mendimit tim, disi ngadalë. Krahasuar me DDR3-1333 9-9-9, ku koha e ciklit të plotë është afërsisht 50 ns, por oraret ndryshojnë:

Koha e aksesit të të dhënave është reduktuar në 13,5 ns (1,5 ns * 9 cikle ore);
- koha e transmetimit të një pakete prej tetë fjalësh 6 ns (0,75 * 8 në vend të 3,75 ns) dhe me akses të rastësishëm në memorie, ndryshimi në shpejtësinë e transferimit të të dhënave praktikisht zhduket;
- shpejtësia maksimale do të jetë 10,664 MB / s.

Jo gjithçka shkoi shumë larg. Situata shpëton pak nga prania e "bankave" në modulet e memories. Çdo "bankë" është një tabelë e veçantë memorie që mund të aksesohet veçmas, e cila bën të mundur ndryshimin e një rreshti në një bankë gjatë leximit/shkrimit të të dhënave nga një rresht i një tjetri, duke reduktuar kohën e papunësisë lejon "shënimin" e autobusit të shkëmbimit të të dhënave. ndaj kapacitetit në situata të optimizuara.

Në fakt, idetë qesharake shkuan këtu

Tabela e memories përmban një numër të caktuar kolonash të barabartë me 512, 1024, 2048 bit. Duke marrë parasysh kohën e ciklit për aktivizimin e linjave prej 50 ns, marrim kursin e mundshëm të shkëmbimit të të dhënave: "1 / 0.00000005 s * 512 kolona * fjalë 64 bit = 81 920 MB / s" në vend të 17 064 MB / s aktuale. (163 840 dhe 327,680 MB / s për rreshtat me 1,024 dhe 2,048 kolona). Thuaj: "vetëm 5 (4.8) herë më shpejt", të cilës unë do t'i përgjigjem: "ky është kursi i këmbimit kur të gjitha kërkesat konkurruese drejtohen në të njëjtën bankë memorie, dhe gjerësia e brezit të disponueshëm rritet në raport me numrin e bankave, dhe rritja e gjatësisë së rreshtit të secilës tabelë (do të kërkojë një rritje në gjatësi linjë operative), e cila nga ana tjetër mbështetet kryesisht në shpejtësinë e autobusit të shkëmbimit të të dhënave ".

Ndryshimi i mënyrës së shkëmbimit të të dhënave do të kërkojë transferimin e të gjithë përmbajtjes së linjës në cache nivel më të ulët, për të cilën është e nevojshme të ndahen nivelet e cache jo vetëm nga shpejtësia e funksionimit, por edhe nga madhësia e linjës së cache. Kështu, për shembull, pasi kemi zbatuar "gjatësinë" e linjës së cache të nivelit N në (512 kolona * madhësia e fjalës 64) 32 768 bit, ne mund të rrisim numrin total të linjave të cache duke zvogëluar numrin e operacioneve të krahasimit dhe, në përputhje me rrethanat , rrit madhësinë e saj maksimale. Por nëse bëjmë një autobus paralel në cache të kësaj madhësie, mund të marrim një ulje të frekuencës së funksionimit, nga e cila mund të aplikojmë një qasje të ndryshme për organizimin e cache-së, nëse e ndajmë linjën e specifikuar të cache "Jumbo" në blloqe. sipas gjatësisë së linjës së sipërme të cache-it dhe shkëmbimit me pjesë të vogla, kjo do t'ju lejojë të ruani frekuencën e funksionimit duke e ndarë vonesën e hyrjes në faza: kërkimi i një linje cache dhe marrja e "fjalës" së dëshiruar në atë të gjetur. linjë.

Sa i përket shkëmbimit të drejtpërdrejtë midis cache dhe memories kryesore: është e nevojshme të transferohen të dhënat në shkallën e hyrjes në rreshtat e një banke, ose të kesh një diferencë të caktuar për shpërndarjen e kërkesave në banka të ndryshme. Përveç kësaj, ka një kompleksitet me kohën e aksesit në të dhënat e vendosura në zona të ndryshme të linjës, për transmetimin sekuencial, përveç vonesës fillestare që lidhet me marrjen e linjës, ka një vonesë në transmetimin e të dhënave në varësi të sasisë së të dhënat "në paketë" dhe shpejtësia e transferimit. Edhe qasja rambus mund të mos jetë në gjendje të përballojë ngarkesën e shtuar të punës. Situata mund të ruhet duke kaluar në një autobus serial (ndoshta diferencial), duke ulur më tej gjerësinë e të dhënave, ne mund të rrisim shpejtësia e xhiros kanal, unë për të reduktuar kohën ndërmjet transmetimit të bitit të parë dhe të fundit të të dhënave, aplikoni ndarjen e transmetimit të linjës në disa kanale. Që do t'ju lejojë të përdorni më pak frekuenca e orës një kanal.

Le të vlerësojmë shpejtësinë e një kanali të tillë:

1 / 0.00000005 ns = 20 MHz (shkalla e linjës brenda një blloku)
20 MHz * 32 768 bit = 655 360 Mbps
Për transmetimin diferencial me të njëjtën madhësi të autobusit të të dhënave marrim:
655 360 Mbps / 32 kanale = 20 480 Mbps për kanal.

Kjo shpejtësi duket e pranueshme për një sinjal elektrik (10 Gbit / s për një sinjal me sinkronizim të integruar për 15 metra është i disponueshëm, pse të mos menaxhoni 20 Gbit / s me sinkronizim të jashtëm për 1 metër), megjithatë, rritja e mëtejshme e nevojshme në shpejtësia e transmetimit për të reduktuar vonesën e transmetimit ndërmjet pjesës së parë dhe të fundit të informacionit, mund të kërkojë një rritje gjerësia e brezit, me integrimin e mundshëm të një kanali transmetimi optik, por kjo tashmë është një pyetje për qarkun, unë kam pak përvojë me frekuenca të tilla.

dhe pastaj Ostap vuajti

Ndryshimi i konceptit të projektimit të cache-së në memorien kryesore në përdorimin e "memorjes kryesore si një bllok i ndërmjetëm me shpejtësi ultra të lartë" do të lejojë zhvendosjen e parashikimit të ngarkimit të të dhënave nga qarku i kontrolluesit në algoritmin e përpunimit (dhe kush më mirë të e di se ku do të prishet pas një kohe, padyshim jo në kontrolluesin e kujtesës), i cili nga ana tjetër do të rrisë madhësinë e cache niveli i jashtëm pa sakrifikuar performancën.

Nëse shkojmë më tej, mund të ndryshojmë gjithashtu konceptin e orientimit të arkitekturës së procesorit nga "ndërrimi i kontekstit të pajisjes ekzekutive" në " mjedisi i punës programe”. Një ndryshim i tillë mund të përmirësojë ndjeshëm sigurinë e kodit duke përcaktuar programin si një grup funksionesh me pikë të dhëna futja e procedurave individuale, rajoni i disponueshëm i vendosjes së të dhënave për përpunim dhe mundësia e kontrollit të harduerit të mundësisë së thirrjes së një ose një funksioni tjetër nga proceset e tjera. Një ndryshim i tillë do të lejojë gjithashtu përdorim më efikas të përpunuesve me shumë bërthama duke hequr qafe ndërrimin e kontekstit për disa nga thread-ët dhe përdorimin e një thread të veçantë për të përpunuar ngjarjet brenda mjedisit të disponueshëm "proces", i cili do të lejojë përdorimin më efikas të 100+ bërthamave. sistemeve.

P.S.: përdorimi aksidental i markave ose patentave të regjistruara është aksidental. Të gjitha idetë origjinale janë të disponueshme për t'u përdorur nga Marrëveshja e licencës"milingona".