Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ

Arkitektura SMP. Avantazhet dhe disavantazhet

Arkitektura SMP

Arkitektura SMP (symmetric multiprocessing) është një arkitekturë simetrike shumëpërpunuese. Tipari kryesor i sistemeve me arkitekturë SMP është prania e një memorie fizike të përbashkët, të përbashkët nga të gjithë procesorët.

Memoria është një mënyrë e transferimit të mesazheve ndërmjet procesorëve, ndërsa të gjitha pajisjet kompjuterike, kur aksesohen në të, kanë të drejta të barabarta dhe adresim të njëjtë për të gjitha qelizat e memories. Prandaj, arkitektura SMP quhet simetrike.

Përparësitë kryesore të sistemeve SMP:

Thjeshtësia dhe shkathtësia për programim. Arkitektura SMP nuk vendos kufizime në modelin e programimit të përdorur gjatë krijimit të një aplikacioni: zakonisht përdoret modeli i degëve paralele, kur të gjithë procesorët punojnë plotësisht të pavarur nga njëri-tjetri - megjithatë, është e mundur të zbatohen modele që përdorin komunikimin ndërprocesor. Përdorimi i memories së përbashkët rrit shpejtësinë e një shkëmbimi të tillë; përdoruesi gjithashtu ka akses në të gjithë sasinë e memories menjëherë. Për sistemet SMP, ekzistojnë në mënyrë krahasuese mjete efektive paralelizimi automatik.

Lehtësinë e përdorimit. Në mënyrë tipike, sistemet SMP përdorin një sistem ftohjeje të bazuar në ajër të kondicionuar për lehtësinë e mirëmbajtjes.

Relativisht jo cmim i larte.

Të metat:

Sistemet me kujtim i përbashkët të ndërtuara në autobusin e sistemit janë pak të shkallëzuar
Ky pengesë e rëndësishme e sistemit SMP nuk lejon që ato të konsiderohen vërtet premtuese. Shkallueshmëria e dobët shkaktohet nga fakti që autobusi mund të trajtojë vetëm një transaksion në të njëjtën kohë, gjë që rezulton në probleme të zgjidhjes së konfliktit kur procesorë të shumtë janë duke hyrë në të njëjtat zona të memories fizike të përbashkët në të njëjtën kohë.

Arkitektura MPP

Arkitektura MPP (përpunim masiv paralel) - arkitekturë masivisht paralele. tipar kryesor një arkitekturë e tillë është që kujtesa është e ndarë fizikisht. Në këtë rast, sistemi është ndërtuar nga modulet individuale që përmban procesor, bankë lokale memorie operative(OP), dy procesorë komunikimi (rutera) ose një përshtatës rrjeti, ndonjëherë - hard disqet dhe/ose pajisje të tjera hyrëse/dalëse.

Avantazhi kryesor:

Avantazhi kryesor i sistemeve me memorie të veçantë është shkallëzueshmëria e mirë: ndryshe nga sistemet SMP, në makinat me memorie të veçantë, secili procesor ka qasje vetëm në memorien e tij lokale, dhe për këtë arsye nuk ka nevojë për sinkronizim të procesorëve sipas orës. Pothuajse të gjitha rekordet e performancës sot vendosen në makinat e kësaj arkitekture, të përbërë nga disa mijëra procesorë (ASCI Red, ASCI Blue Pacific).

Të metat:

Mungesa e memories së përbashkët zvogëlon ndjeshëm shpejtësinë e shkëmbimit të ndërprocesorëve, pasi nuk ka një mjet të përbashkët për ruajtjen e të dhënave të destinuara për shkëmbim midis procesorëve. Kërkohet një teknikë e veçantë programimi për zbatimin e mesazheve ndër-procesoresh.
çdo procesor mund të përdorë vetëm një sasi të kufizuar të bankës lokale të memories.
Për shkak të këtyre mangësive arkitekturore, kërkohen përpjekje të konsiderueshme për të maksimizuar përdorimin e burimeve të sistemit. Kjo është ajo që përcakton çmimin e lartë software për sisteme masivisht paralele me memorie të veçantë.

Arkitektura PVP

PVP (Parallel Vector Process) është një arkitekturë paralele me procesorë vektorial.
Karakteristika kryesore e sistemeve PVP është prania e procesorëve të veçantë me tubacion vektori, të cilët ofrojnë komanda për të njëjtin lloj përpunimi të vektorëve të të dhënave të pavarura, të cilat ekzekutohen në mënyrë efektive në pajisjet funksionale me tubacion. Në mënyrë tipike, disa procesorë të tillë (1-16) punojnë njëkohësisht me memorie të përbashkët (të ngjashme me SMP) në konfigurimin e shumëprocesorëve. Disa nyje të tilla mund të kombinohen duke përdorur një ndërprerës (të ngjashëm me MPP). Që nga transferimi i të dhënave në formati vektorialështë shumë më i shpejtë se në skalar (shpejtësia maksimale mund të jetë 64 Gb / s, që është 2 rend magnitudë më e shpejtë se në makinat skalare), atëherë problemi i ndërveprimit midis rrjedhave të të dhënave gjatë paralelizimit bëhet i parëndësishëm. Dhe ajo që është e paralelizuar dobët në makinat skalare është e paralelizuar mirë në makinat vektoriale. Kështu, sistemet e arkitekturës PVP mund të jenë makina Qëllimi i përgjithshëm(sistemet me qëllim të përgjithshëm). Megjithatë, për shkak se përpunuesit vektorë janë shumë të shtrenjtë, këto makina nuk do të jenë të disponueshme për publikun.

Arkitektura e grupimeve

Një grup është dy ose më shumë kompjuterë(shpesh quhen nyje), të bashkuara nga teknologjitë e rrjetit bazuar në një arkitekturë autobusi ose një ndërprerës dhe u paraqitet përdoruesve si një burim i vetëm informacioni dhe informatik. Serverët, stacionet e punës dhe madje edhe kompjuterët personalë të zakonshëm mund të zgjidhen si nyje grupore. Përfitimet shëndetësore të grupimit bëhen të dukshme në rast të dështimit të një nyje, duke lejuar që një nyje tjetër në grup të marrë përsipër ngarkesën në nyjen e dështuar dhe përdoruesit nuk do të vërejnë ndërprerjen në akses.

Ligji i Amdahl-it(eng. Ligji i Amdahl-it, ndonjëherë edhe Ligji Amdahl-Wer) - ilustron kufizimin e rritjes së performancës së sistemit informatik me një rritje të numrit të kompjuterëve. Gene Amdals formuloi ligjin në vitin 1967, pasi zbuloi një kufizim thelbësisht të thjeshtë, por të pakapërcyeshëm në përmbajtje, në rritjen e produktivitetit kur paralelizon llogaritjet: fragment ". Sipas këtij ligji, përshpejtimi i ekzekutimit të programit për shkak të paralelizimit të udhëzimeve të tij në një grup kompjuterësh kufizohet nga koha e nevojshme për ekzekutimin e udhëzimeve të tij vijuese.

Shprehje matematikore

Supozoni se ju duhet të zgjidhni një problem llogaritës. Supozoni se algoritmi i tij është i tillë që pjesa e vëllimit të përgjithshëm të llogaritjeve mund të merret vetëm nga llogaritjet vijuese, dhe, në përputhje me rrethanat, pjesa mund të paralelizohet në mënyrë të përkryer (d.m.th., koha e llogaritjes do të jetë në përpjesëtim të zhdrejtë me numrin e nyjeve të përfshira ). Atëherë përshpejtimi që mund të merret në një sistem kompjuterik nga procesorët, në krahasim me një zgjidhje me një procesor, nuk do ta kalojë vlerën

Ilustrim

Tabela tregon se sa herë më shpejt do të ekzekutohet një program me një përqindje llogaritjesh sekuenciale gjatë përdorimit të procesorëve. ... Pra, nëse gjysma e kodit është sekuenciale, atëherë fitimi total nuk do të kalojë kurrë dy.

] Vlera ideologjike

Ligji i Amdahl-it tregon se rritja e efikasitetit llogaritës varet nga algoritmi i problemit dhe kufizohet nga lart për çdo problem me të. Rritja e numrit të procesorëve në një sistem kompjuterik nuk ka kuptim për çdo detyrë.

Për më tepër, nëse marrim parasysh kohën e nevojshme për transferimin e të dhënave midis nyjeve të një sistemi kompjuterik, atëherë varësia e kohës së llogaritjes nga numri i nyjeve do të ketë një maksimum. Kjo imponon një kufizim në shkallëzueshmërinë e sistemit kompjuterik, domethënë, do të thotë që nga një moment i caktuar shtimi i nyjeve të reja në sistem do të jetë rrit koha e llogaritjes së detyrës.

Për sistemet MIMD, tani ekziston një klasifikim i pranuar përgjithësisht i bazuar në metodat e përdorura për të organizuar RAM-in në këto sisteme. Sipas këtij klasifikimi, para së gjithash, ata dallojnë sistemet kompjuterike me shumë procesorë(ose multiprocesorë) ose sisteme kompjuterike me memorie të përbashkët (multiprocesorë, sisteme memorie të zakonshme, sisteme me memorie të përbashkët) dhe sisteme kompjuterike shumëkompjuterike(multicomputers) ose sisteme kompjuterike me memorie të shpërndarë (multicomputers, distributed memory system). Struktura e sistemeve multiprocesorike dhe multikompjuterike është paraqitur në Fig. 1, ku është procesori, është moduli i memories.

Oriz. 1. a) - struktura e multiprocesorit; b) - struktura e multikompjuterit.

Multiprocesorët.

Në multiprocesorët, hapësira e adresave të të gjithë procesorëve është e njëjtë. Kjo do të thotë se nëse e njëjta variabël shfaqet në programet e disa procesorëve multiprocesorë, atëherë për të marrë ose ndryshuar vlerën e kësaj ndryshoreje, këta procesorë do t'i referohen një qelize fizike të memories së përbashkët. Kjo rrethanë ka pasoja pozitive dhe negative.

Nga njëra anë, nuk ka nevojë të zhvendosen fizikisht të dhënat midis programeve komutuese, gjë që eliminon kohën e kaluar në komunikimin ndërprocesor.

Nga ana tjetër, duke qenë se qasja e njëkohshme e disa procesorëve në të dhënat e zakonshme mund të çojë në rezultate të pasakta, nevojiten sisteme për sinkronizimin e proceseve paralele dhe sigurimin e koherencës së kujtesës. Për shkak se procesorët duhet të kenë qasje në memorien e përbashkët shumë shpesh, kërkesat për gjerësinë e brezit të mediave të komunikimit janë jashtëzakonisht të larta.

Kjo rrethanë e fundit kufizon numrin e procesorëve në multiprocesorë në disa dhjetëra. Akuti i problemit të aksesit në memorien e përbashkët mund të hiqet pjesërisht duke e ndarë kujtesën në blloqe që lejojnë paralelizimin e akseseve të memories nga procesorë të ndryshëm.

Vini re një avantazh tjetër të multiprocesorëve - një sistem multiprocesorësh funksionon nën një kopje të vetme të një sistemi operativ (zakonisht i ngjashëm me UNIX) dhe nuk kërkon personalizimi individualçdo nyje procesori.

Shumëprocesorët homogjenë me qasje të barabartë (simetrike) në RAM-in e përbashkët zakonisht quhen sisteme SMP (sisteme me arkitekturë simetrike të shumëprocesorëve). Sistemet SMP u shfaqën si një alternativë ndaj sistemeve të shtrenjta multiprocesorike të bazuara në procesorë me tubacione vektoriale dhe procesorë paralelë vektorë (shih Fig. 2).


multikompjuterë.

Për shkak të thjeshtësisë së arkitekturës së tyre, multikompjuterët janë aktualisht më të përhapurit. Multikompjuterët nuk kanë memorie të përbashkët. Prandaj, komunikimi ndërprocesor në sisteme të tilla zakonisht kryhet përmes rrjeti i komunikimit duke përdorur mesazhe.

Çdo procesor në një multikompjuter ka një hapësirë ​​​​të pavarur adresash. Prandaj, prania e një ndryshoreje me të njëjtin emër në programe procesorë të ndryshëm, çon në adresimin e qelizave fizikisht të ndryshme kujtesa e vet këta procesorë. Kjo rrethanë kërkon lëvizje fizike të të dhënave ndërmjet programeve të ndërrimit në procesorë të ndryshëm. Më shpesh, pjesa kryesore e thirrjeve bëhet nga secili procesor në kujtesën e vet. Prandaj, kërkesat për mjedisin komutues janë dobësuar. Si rezultat, numri i procesorëve në sistemet shumëkompjuterike mund të arrijë disa mijëra, dhjetëra mijëra, madje edhe qindra mijëra.

Performanca maksimale e sistemeve më të mëdha të memories së përbashkët është më e ulët se performanca maksimale e sistemeve më të mëdha të memories së përbashkët; kostoja e sistemeve me memorie të përbashkët është më e lartë se kostoja e sistemeve të ngjashme të performancës me memorie të shpërndarë.

Shumëkompjuterët me memorie të shpërndarë homogjene quhen sisteme kompjuterike me arkitekturë masivisht paralele(Sistemet MPP) - shih Fig. 2.

Diçka ndërmjet sistemeve SMP dhe sistemeve MPP janë sistemet NUMA.


Sistemet e grupimeve (grupet kompjuterike).

Sistemet e grupimeve(grupet kompjuterike) përfaqësojnë më shumë se opsion i lirë Sistemet MPP. Një grup kompjuterik përbëhet nga një koleksion kompjuterësh personalë ose stacionesh pune), të bashkuar nga një rrjet lokal si një mjet komunikimi. Grupet llogaritëse shqyrtohen në detaje më vonë.

Oriz. 2. Klasifikimi i multiprocesorëve dhe multikompjuterëve.

Sistemet SMP

Të gjithë procesorët në një sistem SMP kanë akses simetrik në memorie, d.m.th. Kujtesa e sistemit SMP është memorie UMA. Simetri nënkupton sa vijon: të drejta të barabarta të të gjithë procesorëve për qasje në kujtesë; adresimi i njëjtë për të gjithë elementët e memories; kohë e barabartë e aksesit për të gjithë procesorët në sistem në memorie (duke përjashtuar bllokimet).

Struktura e përgjithshme Sistemi SMP është paraqitur në Fig. 3. Mjedisi i komunikimit të një sistemi SMP është ndërtuar mbi bazën e një autobusi të sistemit me shpejtësi të lartë ose një ndërprerës me shpejtësi të lartë. Përveç kësaj procesorë të njëjtë dhe memoria e përbashkët M, pajisjet I/O janë të lidhura me të njëjtin autobus ose çelës.

Pas thjeshtësisë së dukshme të sistemeve SMP, ka probleme të rëndësishme që lidhen kryesisht me RAM-in. Fakti është se për momentin shpejtësia e RAM-it mbetet shumë prapa shpejtësisë së procesorit. Për të kapërcyer këtë hendek, procesorët modernë janë të pajisur me memorie buferike me shpejtësi të lartë (memorie cache). Shpejtësia e hyrjes në këtë memorie është disa dhjetëra herë më e lartë se shpejtësia e hyrjes në memorien kryesore të procesorit. Sidoqoftë, prania e një cache shkel parimin e qasjes së barabartë në çdo pikë në memorie, pasi të dhënat në memorien e memories së një procesori nuk janë të disponueshme për procesorët e tjerë. Prandaj, pas çdo modifikimi të një kopjeje të një ndryshoreje të vendosur në memorien e cache të një procesori, është e nevojshme të kryhet një modifikim sinkron i vetë kësaj ndryshoreje, i vendosur në memorien kryesore. Në sistemet moderne SMP, koherenca e cache-it mbështetet nga hardueri ose sistemi operativ.

Oriz. 3. Struktura e përgjithshme e sistemit SMP

Sistemet më të famshme SMP janë serverët SMP dhe stacionet e punës nga IBM, HP, Compaq, Dell, Fujitsu, etj. Një sistem SMP funksionon nën një sistem të vetëm operativ (më shpesh UNIX dhe të ngjashme).

Për shkak të gjerësisë së brezit të kufizuar të mjedisit të komunikimit, sistemet SMP nuk shkallëzohen mirë. Aktualisht në sistemet reale përdoren jo më shumë se disa dhjetëra procesorë.

Një veti e njohur e pakëndshme e sistemeve SMP është se kostoja e tyre rritet më shpejt se performanca me rritjen e numrit të procesorëve në sistem.

Sistemet MPP.

Sistemet MPP janë ndërtuar nga nyjet e procesorit që përmbajnë një procesor, një njësi lokale memorie me akses të rastësishëm, një procesor komunikimi ose një përshtatës rrjeti, ndonjëherë disqe të ngurtë dhe/ose pajisje të tjera hyrëse/dalëse. Në fakt, module të tilla janë kompjuterë plotësisht funksionalë (shih Fig. 4.). Qasja në bllokun e RAM-it të këtij moduli ka vetëm procesorin e të njëjtit modul. Modulet ndërveprojnë me njëri-tjetrin përmes një mediumi të caktuar komunikimi. Ekzistojnë dy mundësi për funksionimin e sistemit operativ në sistemet MPP. Në një mishërim, një i plotë sistemi operativ funksionon vetëm në kompjuter kontrollues, dhe në çdo modul individual ekzekutohet një version i shkurtuar shumë i sistemit operativ, duke mbështetur vetëm funksionet bazë të kernelit të sistemit operativ. Në versionin e dytë, një sistem operativ i plotë i ngjashëm me UNIX funksionon në çdo modul. Vini re se nevoja për një sistem operativ (në një formë ose në një tjetër) në secilin procesor të sistemit MPP bën të mundur përdorimin e vetëm një sasie të kufizuar memorie për secilin prej procesorëve.

Krahasuar me sistemet SMP, arkitektura e sistemit MPP eliminon si problemin e mosmarrëveshjes kur qaseni në memorie ashtu edhe problemin e koherencës së cache.

Avantazhi kryesor i sistemeve MPP është shkallëzueshmëria e mirë. Pra, super-kompjuteri i serisë CRAY T3E është i aftë të shkallëzohet deri në 2048 procesorë. Pothuajse të gjitha rekordet e performancës deri më sot janë vendosur në sistemet MPP që përbëhen nga disa mijëra procesorë.

Oriz. 4. Struktura e përgjithshme e sistemit MPP.

Nga ana tjetër, mungesa e memories së përbashkët ul ndjeshëm shpejtësinë e shkëmbimit të ndërprocesorëve në sistemet MPP. Për sistemet MPP, kjo rrethanë nxjerr në pah problemin e efikasitetit të mjedisit të komunikimit.

Përveç kësaj, sistemet MPP kërkojnë një teknikë të veçantë programimi për të zbatuar shkëmbimin e të dhënave ndërmjet përpunuesve. Kjo shpjegon koston e lartë të softuerit për sistemet MPP. Kjo shpjegon gjithashtu faktin se shkrimi i programeve paralele efikase për sistemet MPP është një detyrë më e vështirë sesa shkrimi i të njëjtave programe për sistemet SMP. Për një gamë të gjerë problemesh për të cilat njihen algoritme sekuenciale të vërtetuara mirë, nuk është e mundur të ndërtohen algoritme paralele efikase për sistemet MPP.

Sistemet NUMA.

Logjikisht akses të përgjithshëm të dhënave mund të pajisen edhe me memorie të alokuar fizikisht. Në këtë rast, distanca ndërmjet procesorëve të ndryshëm dhe elementëve të ndryshëm të memories, në përgjithësi, është e ndryshme dhe kohëzgjatja e aksesit të procesorëve të ndryshëm në elementë të ndryshëm memorie është e ndryshme. ato. memoria e sistemeve të tilla është memorie NUMA.

Një sistem NUMA zakonisht ndërtohet mbi bazën e nyjeve homogjene të procesorit, të përbërë nga jo një numër i madh procesorë dhe bllok memorie. Modulet bashkohen së bashku duke përdorur një lloj mjeti komunikimi me shpejtësi të lartë (shih Figurën 5). Mbështetet një hapësirë ​​e vetme adresash, qasja në memorien e largët mbështetet nga hardueri, d.m.th. në kujtesën e moduleve të tjera. Në të njëjtën kohë, qasja në memorien lokale kryhet disa herë më shpejt sesa në memorien e largët. Në thelb, një sistem NUMA është një sistem MPP, ku nyjet SMP përdoren si elementë të veçantë llogaritës.

Ndër sistemet NUMA, dallohen llojet e mëposhtme të sistemeve:

  • Sistemet COMA në të cilat vetëm memoria e memories lokale e procesorit përdoret si memorie kryesore (arkitektura e memories vetëm për cache - COMA);
  • Sistemet CC-NUMA, në të cilat koherenca e memories lokale të memories së përpunuesve të ndryshëm (CAche-koherent NUMA - CC-NUMA) sigurohet në harduer;
  • Sistemet NCC-NUMA në të cilat hardueri nuk mbështet koherencën e memories lokale të memories së përpunuesve të ndryshëm (non-cache koherent NUMA - NCC-NUMA). TE ky lloj për shembull, sistemi Cray T3E.

Oriz. 5. Struktura e përgjithshme e sistemit NUMA.

Disponueshmëria e përgjithshme logjike e memories në sistemet NUMA, nga njëra anë, ju lejon të punoni me një hapësirë ​​​​të vetme adresash dhe, nga ana tjetër, ju lejon të siguroni thjesht shkallëzim të lartë të sistemit. Kjo teknologji aktualisht bën të mundur krijimin e sistemeve që përmbajnë deri në disa qindra procesorë.

Sistemet NUMA prodhohen në masë nga shumë njerëz firmat kompjuterike si serverë me shumë procesorë dhe mbajnë fort lidershipin në klasën e superkompjuterëve të vegjël.

15/02/1995 V. Pyatyonok

Arkitektura e njëprocesoreve Arkitektura e modifikuar e njëprocesori Arkitektura SMP Arkitektura e ruterit SMP e Wellfleet Vështrim i përgjithshëm arkitektonik Detajet e përpunimit të paketave Referencat abstrakte Routerët kanë evoluar nga tre arkitektura të ndryshme: njëprocesori, njëprocesori i modifikuar dhe multiprocesori simetrik. Të treja janë krijuar për të mbështetur aplikacione shumë kritike.

Në zhvillimin e tyre, ruterat përdorën tre arkitektura të ndryshme: njëprocesor, njëprocesor i modifikuar dhe multiprocesor simetrik. Të treja janë krijuar për të mbështetur aplikacione shumë kritike. Megjithatë, thelbi i këtyre kërkesave, domethënë performanca e lartë, e shkallëzueshme, si dhe disponueshmëria e lartë, duke përfshirë tolerancën e plotë të gabimeve dhe rikuperimin e komponentëve ("këmbë e nxehtë"), ato nuk janë në gjendje të përmbushin në të njëjtën masë. Ky artikull diskuton avantazhet e një arkitekture simetrike me shumë procesorë.

Arkitektura me një procesor

Arkitektura me një procesor të vetëm përdor module të shumta të ndërfaqes së rrjetit për të ofruar fleksibilitet shtesë në konfigurimin e nyjeve. Modulet e ndërfaqes së rrjetit lidhen me një njësi të vetme të përpunimit qendror nëpërmjet një autobusi të përbashkët të sistemit. Ky procesor i vetëm kujdeset për të gjitha detyrat e përpunimit. Dhe këto detyra janë për nivel modern zhvillimin rrjetet e korporatave komplekse dhe të ndryshme: filtrimi dhe përcjellja e paketave, modifikimi i nevojshëm i titujve të paketave, përditësimi i tabelave të rrugëtimit dhe adresat e rrjetit, interpretimi i paketave të kontrollit të shërbimit, përgjigjet ndaj kërkesave SNMP, formimi i paketave të kontrollit, ofrimi i shërbimeve të tjera specifike si spoofing, pra vendosja e filtrave specialë për të arritur sigurinë dhe performancën e përmirësuar të rrjetit.

Kjo zgjidhje tradicionale arkitekturore është më e lehta për t'u zbatuar. Megjithatë, nuk është e vështirë të imagjinohen kufizimet që do të ndikojnë në performancën dhe disponueshmërinë e një sistemi të tillë.

Në të vërtetë, të gjitha paketat nga të gjitha ndërfaqet e rrjetit duhet të përpunohen nga një njësi e vetme e përpunimit qendror. Ndërsa ndërfaqet shtesë të rrjetit shtohen, performanca degradon ndjeshëm. Përveç kësaj, secila paketë duhet të udhëtojë dy herë në autobus - nga moduli burimor te procesori, dhe më pas nga procesori në modulin e destinacionit. Një paketë udhëton këtë rrugë edhe nëse është e destinuar për të njëjtën ndërfaqe rrjeti nga ka ardhur. Kjo gjithashtu çon në një rënie të konsiderueshme të performancës pasi numri i moduleve të ndërfaqes së rrjetit rritet. Kështu, ekziston një "fyell i ngushtë" klasik.

I vogël dhe i besueshëm. Nëse CPU dështon, ruteri në tërësi do të ndërpritet. Për më tepër, për një arkitekturë të tillë është e pamundur të zbatohet "rikuperimi i nxehtë" nga një rezervë e elementeve të sistemit të dëmtuar.

Në implementimet moderne të kësaj arkitekture të ruterave, për të zgjidhur kufizimet e performancës, si rregull, përdoret një procesor mjaft i fuqishëm RISC dhe një autobus i sistemit me shpejtësi të lartë. Kjo është një përpjekje thjesht e fuqishme për të zgjidhur problemin - rritjen e produktivitetit për një investim të madh fillestar. Sidoqoftë, zbatime të tilla nuk ofrojnë shkallëzim të performancës, dhe niveli i besueshmërisë së tyre është i paracaktuar nga besueshmëria e procesorit.

Arkitektura e modifikuar e njëprocesori

Për të kapërcyer disa nga disavantazhet e mësipërme të arkitekturës së njëprocesorit, është shpikur një modifikim. Arkitektura themelore ruhet: modulet e ndërfaqes janë të lidhura me një procesor të vetëm nëpërmjet një autobusi të përbashkët të sistemit. Sidoqoftë, secili prej moduleve të ndërfaqes së rrjetit përfshin një procesor të veçantë periferik - në mënyrë që të paktën të shkarkohet pjesërisht CPU.

Procesorët periferikë janë, si rregull, bit-slaces ose mikroprocesorë me qëllime të përgjithshme që filtrojnë dhe drejtojnë paketat e destinuara për ndërfaqen e rrjetit të të njëjtit modul nga i cili hynë në ruter. (Fatkeqësisht, në shumë prej aktualisht implementimet mund ta bëjnë këtë vetëm për disa lloje të paketave, të tilla si kornizat Ethernet, por jo IEEE 802.3.

Njësia qendrore e përpunimit është ende përgjegjëse për detyrat që nuk mund t'i lihen procesorit periferik (përfshirë rrugën ndërmjet moduleve, operacionet në të gjithë sistemin, administrimin dhe menaxhimin). Prandaj, optimizimi i performancës i arritur në këtë mënyrë është mjaft i kufizuar (me drejtësi, duhet të theksohet se në disa raste, me dizajnimin e duhur të rrjetit, mund të arrini rezultate të mira). Në të njëjtën kohë, pavarësisht nga një rënie e lehtë në numrin e paketave të transmetuara në autobusin e sistemit, ai ende mbetet një pengesë shumë e madhe.

Përfshirja e procesorëve periferikë në arkitekturë nuk rrit disponueshmërinë e ruterit në tërësi.

Arkitektura SMP

Arkitektura simetrike me shumë procesorë është e lirë nga disavantazhet e natyrshme në arkitekturat e lartpërmendura. Në këtë rast, fuqia përpunuese shpërndahet plotësisht në të gjitha modulet e ndërfaqes së rrjetit.

Çdo modul i ndërfaqes së rrjetit ka modulin e tij të dedikuar të procesorit që trajton të gjitha detyrat e rrugëtimit. Në këtë rast, të gjitha tabelat e rrugëzimit, tjetra informacionin e nevojshëm dhe softueri që zbaton protokollet kopjohet (d.m.th. kopjohet) në çdo njësi procesori. Kur një njësi procesori merr informacionin e rrugëzimit, ajo përditëson tabelën e vet dhe më pas përhap përditësimet në të gjitha njësitë e tjera të procesorit.

Kjo arkitekturë, natyrisht, siguron shkallëzim pothuajse linear (nëse neglizhojmë kostot e përsëritjes dhe gjerësinë e brezit të kanalit të komunikimit midis moduleve). Kjo, nga ana tjetër, nënkupton perspektivën e një zgjerimi të konsiderueshëm të rrjetit pa një rënie të dukshme të performancës. Nëse është e nevojshme, thjesht duhet të shtoni një modul shtesë të ndërfaqes së rrjetit - në fund të fundit, thjesht nuk ka asnjë procesor qendror në këtë arkitekturë.

Të gjitha paketat përpunohen nga përpunuesit lokalë. Paketat e jashtme (d.m.th., të destinuara për module të tjera) transmetohen përmes kanalit të komunikimit midis procesorëve vetëm një herë. Kjo çon në një reduktim të ndjeshëm të trafikut brenda ruterit.

Për sa i përket disponueshmërisë, sistemi nuk do të dështojë nëse një modul i vetëm procesori prishet. Kjo ndarje do të ndikojë vetëm në ato segmente të rrjetit që janë të lidhur me modulin e dëmtuar të procesorit. Përveç kësaj, një modul i dëmtuar mund të zëvendësohet me një funksional pa fikur ruterin dhe pa prekur të gjitha modulet e tjera.

Përfitimet e arkitekturës SMP njihen nga prodhuesit e kompjuterave. Gjatë disa viteve të fundit, shumë platforma të ngjashme janë shfaqur, dhe vetëm numër i kufizuar sistemet standarde operative, të afta për të përfituar plotësisht nga hardueri, penguan përhapjen e tyre. Prodhuesit e tjerë, duke përfshirë prodhuesit e pajisjeve aktive të rrjetit, përdorin gjithashtu arkitekturën SMP për të krijuar pajisje të specializuara kompjuterike.

Në pjesën tjetër të këtij seksioni, ne do të hedhim një vështrim më të afërt në detajet teknike të arkitekturës së ruterit SMP të Wellfleet.

Arkitektura e ruterit SMP të Wellfleet

Wellfleet, një nga prodhuesit kryesorë të ruterave dhe urave, sigurisht që nuk ka kursyer asnjë shpenzim në vlerësimin dhe testimin e arkitekturave të ndryshme të ruterave që mbështesin të ndryshme globale dhe rrjetet lokale mbi të ndryshme media fizike dhe projektuar për kushte të ndryshme trafiku. Rezultatet e këtyre studimeve u formuluan në formën e një liste kërkesash të konsideruara në hartimin e ruterëve të destinuar për ndërtimin e mjediseve të rrjetit të korporatave për aplikacione shumë kritike. Këtu janë disa nga këto kërkesa - ato që, sipas mendimit tonë, justifikojnë përdorimin e një arkitekture me shumë procesor.

1. Nevoja për performancë të shkallëzuar, disponueshmëri të lartë, fleksibilitet konfigurimi dikton përdorimin e arkitekturës SMP.

2. Niveli i kërkesave për fuqinë llogaritëse të rrugëtimit me shumë protokolle (veçanërisht kur përdoren protokollet moderne të rrugëtimit si TCP/IP OSPF) mund të plotësohet vetëm nga mikroprocesorët modernë të fuqishëm 32-bit. Megjithatë, duke qenë se rutimi përfshin shërbimin e një numri të madh kërkesash të ngjashme paralelisht, kërkohet kalimi i shpejtë midis proceseve të ndryshme, gjë që kërkon vonesë jashtëzakonisht të ulët në ndërrimin e kontekstit, si dhe memorie të integruar të cache.

3. Kërkohet një kapacitet i madh memorie për të ruajtur protokollin dhe softuerin e kontrollit, tabelat e rrugëzimit dhe adresave, statistikat dhe informacione të tjera.

4. Për të siguruar shpejtesi maksimale nevojiten transmetimi ndërmjet rrjeteve dhe moduleve të përpunimit të ruterit, kontrollorët e ndërfaqes së rrjetit me shpejtësi të lartë dhe kontrollorët e komunikimit ndërprocesor me aftësi të integruara akses direkt në memorie (DMA - Qasja e drejtpërdrejtë e memories).

5. Minimizimi i vonesës kërkon të dhëna 32-bit me gjerësi bande të lartë dhe kanale adresash për të gjitha burimet.

6. Kërkesat për rritjen e disponueshmërisë përfshijnë shpërndarjen e fuqisë llogaritëse, nënsistemet e fuqisë së tepërt dhe, si veçori shtesë, por shumë e rëndësishme, kanalet e dyfishta të komunikimit ndërprocesor.

7. Nevoja për të përqafuar gamë të gjerë mjediset e rrjetit - nga një vend i vetëm i largët ose rrjeti i grupit të punës në një organizatë me performancë të lartë me disponueshmëri e lartë shtylla kurrizore - Kërkon një arkitekturë të shkallëzueshme me shumë procesorë.

Pasqyrë e arkitekturës

Figura 2 është një paraqitje skematike e arkitekturës simetrike të shumëprocesorëve të përdorur në të gjithë ruterat modularë të prodhuar nga Wellfleet. Janë tre kryesore elementet arkitekturore: modulet e komunikimit, modulet e procesorit dhe komunikimi ndërprocesor.

Modulet e komunikimit ofrojnë ndërfaqe fizike të rrjetit që lejojnë lidhjet me lokale dhe rrjetet globale pothuajse çdo lloj. Çdo modul komunikimi është i lidhur drejtpërdrejt me modulin e tij të synuar të procesorit përmes një ndërfaqeje komunikimi inteligjente (ILI - Intelligent Link Interface). Paketat e marra nga moduli i komunikimit përcillen në modulin e procesorit të lidhur me të nëpërmjet lidhjes së tyre të drejtpërdrejtë. Procesori përcakton se për cilën ndërfaqe rrjeti janë të destinuara këto paketa, dhe ose i ridrejton ato në një ndërfaqe tjetër rrjeti të të njëjtit modul komunikimi, ose, nëpërmjet një lidhjeje ndërprocesori me shpejtësi të lartë, në një modul tjetër procesori, i cili do ta transmetojë këtë paketë në komunikimin e lidhur. modul.

Le të hedhim një vështrim më të afërt në strukturën e secilit prej komponentëve.

Moduli i procesorit përfshin:

Procesori aktual qendror;

Memorie lokale, e cila ruan protokollet dhe tabelat e rrugëtimit, tabelat e adresave dhe informacione të tjera që përdoren në nivel lokal nga CPU;

Memoria globale, e cila luan rolin e një buferi për paketat e të dhënave "transit" që vijnë nga moduli i komunikimit në modulin e procesorit të lidhur me të ose nga modulet e tjera të procesorit (quhet globale sepse është i dukshëm dhe i disponueshëm për të gjitha modulet e procesorit);

Procesori OMA, i cili siguron akses të drejtpërdrejtë në memorie kur transferon paketat midis buferëve të memories globale të vendosura në module të ndryshme procesori;

Ndërfaqja e komunikimit që siguron lidhje me modulin përkatës të komunikimit;

Kanalet e brendshme të të dhënave 32-bit që lidhin të gjitha burimet e mësipërme për të ofruar maksimumin e mundshëm xhiros dhe vonesa minimale; ofrohen kanale të shumta për të siguruar ekzekutimi i njëkohshëm operacionet nga pajisje të ndryshme kompjuterike (për shembull, procesori CPU dhe DMA) dhe siguron që nuk ka pengesa që ngadalësojnë përcjelljen dhe përpunimin e paketave.

Modele të ndryshme të ruterave Wellfleet përdorin module procesori ACE (Advanced Communication Engine) bazuar në procesorët Motorola 68020 ose 68030, ose modulet Fast Routing Engine (FRE) bazuar në MC68040.

Moduli i komunikimit përfshin:

Lidhës që ofrojnë një ndërfaqe për rrjete specifike (p.sh. sinkron, Ethernet, Token Ring FDDI);

Kontrollorët e komunikimit që transferojnë paketat ndërmjet ndërfaqes fizike të rrjetit dhe memories globale duke përdorur një kanal DMA; kontrollorët e komunikimit janë krijuar gjithashtu për një lloj të caktuar ndërfaqeje rrjeti dhe janë të aftë të transmetojnë paketa me një shpejtësi që përputhet me shpejtësinë e një teli;

Filtrat ( mundësi shtesë për modulet e komunikimit për FDDI dhe Ethernet), të cilat parafiltrojnë paketat hyrëse, duke kursyer burime llogaritëse për përpunim kuptimplotë të skedarëve.

Standardi VMEbus përdoret shpesh si kanal komunikimi ndërprocesor, duke siguruar një xhiro totale prej 320 Mbps.

Modelet më të vjetra përdorin ndërfaqen Parallel Packet Express (PPX) të zhvilluar nga vetë Wellfleet me një gjerësi brezi prej 1 Gbps, duke përdorur katër kanale të pavarura, të tepërta të të dhënave 256 Mbps me shpërndarje dinamike të ngarkesës. Kjo siguron performancë të lartë të përgjithshme dhe arrin atë që arkitektura nuk e bën. pikë e vetme dështimi. Çdo modul procesori është i lidhur me të katër kanalet dhe mund të zgjedhë cilindo prej tyre. Një kanal specifik zgjidhet rastësisht, për çdo paketë, i cili duhet të sigurojë një shpërndarje të barabartë të trafikut midis të gjithëve kanalet e disponueshme... Nëse një nga kanalet e të dhënave PPX bëhet i padisponueshëm, shkarkimi shpërndahet automatikisht midis të tjerëve.

Detajet e përpunimit të paketës

Paketat hyrëse merren, në varësi të rrjetit, nga ky apo ai kontrollues komunikimi. Nëse një filtër shtesë përfshihet në konfigurimin e modulit Comms, disa nga paketat hidhen dhe pjesa tjetër merret. Paketat e pranuara vendosen nga kontrolluesi i komunikimit në buferin e memories globale të modulit të procesorit të lidhur drejtpërdrejt. Për transferimin e shpejtë të paketave, një kanal DMA përfshihet në çdo kontrollues komunikimi.

Pasi në memorien globale, paketat merren nga CPU për rrugëtim. CPU zbulon ndërfaqen e rrjetit dalës, modifikon paketën sipas rastit dhe e kthen atë në memorien globale. Pastaj bëhet një nga dy gjërat:

1. Paketa ridrejtohet në ndërfaqen e rrjetit të modulit të lidhur drejtpërdrejt me të. Kontrolluesi i komunikimit i ndërfaqes së rrjetit egress merr udhëzime nga CPU për të marrë paketat nga memoria globale dhe për t'i dërguar ato në rrjet.

2. Paketa ridrejtohet në ndërfaqen e rrjetit të një moduli tjetër komunikimi. Procesori DMA merr udhëzime nga CPU për të dërguar paketa në një modul tjetër të procesorit dhe i shkarkon ato përmes lidhjes ndërprocesorike në memorien globale të modulit të procesorit të bashkangjitur në ndërfaqen e rrjetit dalës. Kontrolluesi i lidhjes së ndërfaqes së rrjetit egress merr paketat nga memoria globale dhe i dërgon ato në rrjet.

Vendimet e rrugëzimit merren nga CPU në mënyrë të pavarur nga modulet e tjera të procesorit. Çdo modul procesori mban një bazë të dhënash të pavarur të rrugëzimit dhe adresave në memorien e tij lokale, e cila përditësohet kur moduli merr informacione për ndryshimet në tabelat e rrugëzimit ose adresat (në këtë rast, ndryshimet dërgohen në të gjitha modulet e tjera të procesorit).

Funksionimi i njëkohshëm i kontrolluesit të komunikimit, CPU dhe procesorit DMA lejon performancë të lartë të përgjithshme. (Theksojmë se e gjithë kjo ndodh në një pajisje ku përpunimi është i paralelizuar në disa module shumëprocesoresh). Për shembull, imagjinoni një situatë ku kontrolluesi i komunikimit po shtyn paketat në memorien globale ndërsa CPU po përditëson tabelën e rrugëzimit në memorien lokale dhe DMA po e shtyn paketën në lidhjen e ndërprocesorit.

Përmbledhje

Fakti i depërtimit të teknologjive kompjuterike të zhvilluara për një fushë aplikimi në të tjerat, ngjitur, nuk është i ri në vetvete. Megjithatë, secili shembull specifik tërheq vëmendjen e specialistëve. Në arkitekturën e ruterëve të konsideruar në këtë artikull, përveç idesë së shumëpërpunimit simetrik, i krijuar për të ofruar performancë të shkallëzuar dhe një nivel të lartë disponueshmërie, përdoret gjithashtu mekanizmi i kanaleve të të dhënave të dyfishta midis procesorëve (për të njëjtat qëllime). , si dhe ideja e riprodhimit (ose replikimit) të të dhënave, përdorimi i të cilave është më tipik për industrinë e shpërndarë DBMS.

Letërsia

Arkitektura simetrike me shumë procesorë. Wellfleet Communications, 10/1993.

G.G. Baroni, G.M. Ladyzhensky. "Teknologjia e riprodhimit të të dhënave në sistemet e shpërndara", " Sisteme të hapura", Pranverë 1994.

*) Wellfleet vjeshtën e kaluar u bashkua me një tjetër udhëheqës të teknologjisë së rrjetit, SunOptics Communications. Bashkimi çoi në krijimin e një gjiganti të ri të rrjetit - Bay Networks. - Ed.



UMA - Qasje Uniform Memory

5. SMP-arkitektura përdoret në serverë dhe PC të bazuara Procesorët Intel, AMD, Sun, IBM, HP

(+): thjeshtësi, "e punuar" parimet bazë

(-): I gjithë shkëmbimi i procesorit m/d dhe memorjes është real. 1 autobus secili - një pengesë e harkut - kufizimi i performancës, shkallëzueshmëria.

Shembull:

MPP - arkitektura: Përpunim masiv paralel

Një sistem masivisht paralel. Ajo bazohej në transputer- një procesor i fuqishëm universal, një veçori e të cilit ishte prania e 4 lidhjeve (kanaleve të komunikimit). Çdo lidhje përbëhet nga dy pjesë që shërbejnë për transferimin e informacionit në drejtime të kundërta, dhe përdoret për të lidhur transputerët me njëri-tjetrin dhe për të lidhur pajisje të jashtme. Arkitektura: shumë nyje, secila nyje - OP + CPU

Arkitektura klasike MPP: çdo nyje është e lidhur me 4 nyje nëpërmjet një lidhjeje pikë-pikë.

Shembull: Intel Peragon

Arkitektura e grupimeve

Zbatimi i unifikimit të makinerive, i cili duket të jetë një tërësi e vetme për OS, softuerin e sistemit, programet e aplikimit përdoruesit.

Llojet e grupimeve

  1. Sistemet e Disponueshmërisë së Lartë (HA).
  2. Sisteme për llogaritje me performancë të lartë (High Performance, HP, Compute clusters).
  3. Sisteme me shumë fije.
  4. Grupimet e balancimit të ngarkesës. (shpërndarja e ngarkesës llogaritëse)

Shembull: arkitektura e grupit HIVE

Arkitektura 5.NUMA Qasja e memories jo uniforme - qasja jo uniforme e memories

Çdo procesor ka akses në memorien e tij dhe të dikujt tjetër (për të hyrë në memorien e dikujt tjetër, përdoret një rrjet komutues ose edhe një përqindje e nyjës së dikujt tjetër). Qasja në kujtesën e një nyje të huaj mund të mbështetet nga hardueri: special. kontrollorët.



-: e shtrenjtë, shkallëzueshmëri e dobët.

Tani: NUMA ka realizuar aksesin në memorien e huaj në mënyrë programore.

Sistemi kompjuterik NUMA përbëhet nga një grup nyjesh (përmban një ose më shumë procesorë, në të funksionon një kopje e vetme e OS), të cilat janë të ndërlidhura nga një ndërprerës ose një rrjet me shpejtësi të lartë.

Topologjia e lidhjes është e ndarë në disa nivele. Çdo shtresë siguron lidhje në grupe me një numër të vogël nyjesh. Grupe të tilla konsiderohen si nyje të vetme në një nivel më të lartë.

OP është i shpërndarë fizikisht por logjikisht publik.

Në varësi të shtegut të hyrjes në artikullin e të dhënave, koha e kaluar në këtë operacion mund të ndryshojë ndjeshëm.

Shembuj të zbatimeve specifike: cc-NUMA, SOMA, NUMA-Q

Shembull: HP Integrity SuperDome

Blloqe të thjeshtuara të SMP (a) dhe MPP (b)

  1. Pesë arkitekturat kryesore të avionëve me performancë të lartë, të tyre një përshkrim të shkurtër të, shembuj. Krahasimi i arkitekturës së grupimeve dhe NUMA.

Në një grup, çdo procesor ka akses vetëm në memorien e tij, në NUMA jo vetëm në memorien e tij, por edhe në atë të dikujt tjetër (për të hyrë në kujtesën e dikujt tjetër, përdoret një rrjet komutues dhe një procesor i një nyje të huaj).

  1. Arkitektura SMP. Parimet e organizimit. Avantazhet, disavantazhet. Shkallueshmëria në kuptimin "të ngushtë" dhe "të gjerë". Fushëveprimi, shembuj të avionëve në SMP.

Arkitektura SMP (shumpërpunim simetrik)- arkitekturë simetrike me shumë procesorë. Tipari kryesor i sistemeve me arkitekturë SMP është prania e një memorie fizike të përbashkët, të përbashkët nga të gjithë procesorët.

1. Një sistem SMP është ndërtuar në bazë të një autobusi të sistemit me shpejtësi të lartë, në slotet e të cilit janë të lidhura tre lloje blloqesh funksionale: procesorë (CPU), RAM(OP), nënsistemi hyrës/dalës (I/O).

2. Memoria është një mënyrë e transferimit të mesazheve ndërmjet procesorëve.

3. Të gjitha pajisjet kompjuterike, kur hyjnë në memorie, kanë të drejta të barabarta dhe adresim të njëjtë për të gjitha qelizat e memories.



4. Kjo rrethanë e fundit bën të mundur shkëmbimin shumë efikas të të dhënave me pajisje të tjera kompjuterike.

5. SMP përdoret në serverë dhe stacione pune të bazuara në procesorë Intel, AMD, Sun, IBM, HP.

6. Sistemi SMP funksionon nën një OS të vetëm (si UNIX ose Windows). Sistemi operativ shpërndan automatikisht (gjatë funksionimit) proceset ndërmjet procesorëve, por ndonjëherë është e mundur edhe lidhja e qartë.

Parimet e organizimit:

Një sistem SMP përbëhet nga disa procesorë homogjenë dhe një grup memorie të përbashkët.

Një nga qasjet e përdorura shpesh në arkitekturat SMP për të formuar një sistem memorie të shkallëzuar dhe të përbashkët është organizimi i njëtrajtshëm i aksesit në memorie duke organizuar një kanal të shkallëzueshëm të procesorit të memories.

Çdo veprim i aksesit në memorie interpretohet si një transaksion autobusi nga procesori në memorie.

Në SMP, çdo procesor ka të paktën një cache të tijën (dhe ndoshta disa). Mund të themi se një sistem SMP është një kompjuter me disa procesorë peer-to-peer.

Koherenca e cache-it mbështetet nga hardueri.

Çdo gjë tjetër është në një shembull: një memorie, një nënsistem I/O, një sistem operativ.

Fjala "peer" do të thotë se çdo procesor mund të bëjë gjithçka që çdo tjetër. Çdo procesor ka akses në të gjithë memorien, mund të kryejë çdo operacion I/O, të ndërpresë procesorët e tjerë.

Shkallëzueshmëria:

Në kuptimin "të ngushtë": aftësia për të lidhur harduerin brenda kufijve të caktuar (procesorë, memorie, ndërfaqe).

Në kuptimin "e gjerë": rritja lineare e metrikës së performancës me rritjen e pajisjeve.

Përparësitë:

Thjeshtësia dhe shkathtësia për programim. Arkitektura SMP nuk vendos kufizime në modelin e programimit të përdorur gjatë krijimit të një aplikacioni: zakonisht përdoret modeli i degëve paralele, kur të gjithë procesorët punojnë plotësisht të pavarur nga njëri-tjetri - megjithatë, është e mundur të zbatohen modele që përdorin komunikimin ndërprocesor. Përdorimi i memories së përbashkët rrit shpejtësinë e një shkëmbimi të tillë; përdoruesi gjithashtu ka akses në të gjithë sasinë e memories menjëherë.

Lehtësinë e përdorimit. Në mënyrë tipike, sistemet SMP përdorin një sistem ftohjeje të bazuar në ajër të kondicionuar për lehtësinë e mirëmbajtjes.

Çmimi relativisht i ulët.

Avantazhi i konkurencës. Transferimi i nënkuptuar i të dhënave ndërmjet cache-ve nga hardueri SMP është mjeti më i shpejtë dhe më i lirë i komunikimit në çdo arkitekturë paralele me qëllime të përgjithshme. Prandaj, në prani të një numri të madh transaksionesh të shkurtra (tipike, për shembull, të aplikacioneve bankare), kur është e nevojshme të sinkronizoni shpesh aksesin në të dhënat e përbashkëta, arkitektura SMP është zgjedhja më e mirë; çdo arkitekturë tjetër funksionon më keq.

Arkitektura SMP është më e sigurta. Kjo nuk do të thotë që transferimi i të dhënave ndërmjet cache-ve është i dëshirueshëm. Një program paralel do të ekzekutohet gjithmonë më shpejt sa më pak të ndërveprojnë pjesët e tij. Por nëse këto pjesë duhet të ndërveprojnë shpesh, atëherë programi do të funksionojë më shpejt në SMP.

Të metat:

Sistemet SMP janë dobët të shkallëzueshme:

1. Autobusi i sistemit ka një gjerësi bande të kufizuar (megjithëse të lartë) dhe një numër të kufizuar slotash, të ashtuquajturat "bottleneck".

2. Në një kohë, autobusi është i aftë të përpunojë vetëm një transaksion, si rezultat i të cilit ka probleme të zgjidhjes së konflikteve kur disa procesorë hyjnë njëkohësisht në të njëjtat zona të memories fizike të përbashkët. Kur ndodh një konflikt i tillë, varet nga shpejtësia e komunikimit dhe nga numri i elementeve llogaritëse.

E gjithë kjo pengon rritjen e performancës me rritjen e numrit të procesorëve dhe numrit të përdoruesve të lidhur. Në sistemet reale, jo më shumë se 8-16-32 procesorë mund të përdoren në mënyrë efektive.

Zona e aplikimit: për të punuar me aplikacionet bankare

Shembull: Arkitektura Sun Fire T2000. Arkitektura UltraSPARC T1.

  1. Arkitektura SMP. Përmirësimi dhe modifikimi i arkitekturës SMP. SMP në moderne procesorë me shumë bërthama... Koherenca e cache.

Arkitektura SMP (shumpërpunim simetrik)- arkitekturë simetrike me shumë procesorë. Tipari kryesor i sistemeve me arkitekturë SMP është prania e një memorie fizike të përbashkët, të përbashkët nga të gjithë procesorët.

Përmirësimi dhe modifikimi i SMP:

Shembull: Arkitektura QBB e sistemeve të serverëve të serisë GS DEC

Për të rritur performancën e autobusit, u bë një përpjekje për të hequr autobusin, por lini aksesin e kujtesës së përbashkët -> kalimin dhe zëvendësimin e autobusit të përbashkët kaloni lokal(ose një sistem çelsash): çdo procesor është i lidhur me 4 banka memorie në çdo kohë të caktuar.

Çdo përqind punon me një lloj banke memorie,

Kalon në një bankë tjetër memorie

Fillon të punojë me një bankë tjetër memorie.


Oriz. 3.1.

Memoria shërben, veçanërisht, për transferimin e mesazheve ndërmjet procesorëve, ndërsa të gjitha pajisjet kompjuterike, kur aksesohen në të, kanë të drejta të barabarta dhe adresim të njëjtë për të gjitha qelizat e memories. Prandaj, arkitektura SMP quhet simetrike. Rrethana e fundit bën të mundur shkëmbimin shumë efikas të të dhënave me pajisje të tjera kompjuterike. Sistemi SMP është ndërtuar mbi bazën e një autobusi të sistemit me shpejtësi të lartë (SGI PowerPath, Sun Gigaplane, DEC TurboLaser), në slotet e të cilave janë të lidhura blloqet funksionale të llojeve të mëposhtme: procesorë (CPU), nënsistemi hyrës / dalës ( I/O), etj. modulet I/O përdorin autobusë më të ngadaltë (PCI, VME64). Sistemet më të famshme SMP janë serverët SMP dhe stacionet e punës të bazuara në procesorë Intel (IBM, HP, Compaq, Dell, ALR, Unisys, DG, Fujitsu, etj.) I gjithë sistemi funksionon nën një OS të vetëm (zakonisht si UNIX, por Windows NT mbështetet për platformat Intel). Sistemi operativ shpërndan automatikisht (gjatë funksionimit) proceset ndërmjet procesorëve, por ndonjëherë është e mundur edhe lidhja e qartë.

Përparësitë kryesore të sistemeve SMP:

  • thjeshtësia dhe shkathtësia për programim. Arkitektura SMP nuk vendos kufizime në modelin e programimit të përdorur gjatë krijimit të një aplikacioni: zakonisht është një model i degës paralele, kur të gjithë procesorët punojnë të pavarur nga njëri-tjetri. Megjithatë, është e mundur të zbatohen modele duke përdorur komunikimin ndërprocesor. Përdorimi i memories së përbashkët rrit shpejtësinë e një shkëmbimi të tillë; përdoruesi gjithashtu ka akses në të gjithë sasinë e memories menjëherë. Për sistemet SMP, ekzistojnë mjete mjaft efektive të paralelizimit automatik;
  • lehtësinë e përdorimit. Në mënyrë tipike, sistemet SMP përdorin një sistem klimatizimi të bazuar në ajri i ftohur, që lehtëson mirëmbajtjen e tyre;
  • çmim relativisht i ulët.

Të metat:

  • sistemet e përbashkëta të memories shkallëzohen dobët.

Kjo disavantazh i rëndësishëm Sistemet SMP nuk lejojnë që ato të konsiderohen vërtet premtuese. Shkak i keq shkallëzueshmëriaështë se për momentin autobusi është në gjendje të përpunojë vetëm një transaksion, si rezultat i të cilit ka probleme të zgjidhjes së konflikteve kur disa procesorë hyjnë njëkohësisht në të njëjtat zona. memorie fizike e përbashkët... Elementet llogaritëse fillojnë të ndërhyjnë me njëri-tjetrin. Kur ndodh një konflikt i tillë, varet nga shpejtësia e komunikimit dhe nga numri i elementeve llogaritëse. Aktualisht, konfliktet mund të ndodhin me 8-24 procesorë. Për më tepër, autobusin e sistemit ka një gjerësi bande të kufizuar (megjithëse të lartë) (PS) dhe një numër të kufizuar të lojërave elektronike. E gjithë kjo padyshim pengon përfitimet e performancës ndërsa rritet numri i procesorëve dhe numri i përdoruesve të lidhur. Në sistemet reale, mund të përdoren maksimumi 32 procesorë. Për të ndërtuar sisteme të shkallëzueshme të bazuara në SMP, përdoren arkitekturat e grupimeve ose NUMA. Kur punoni me sistemet SMP, të ashtuquajturat paradigma e programimit me memorie të përbashkët (paradigma e kujtesës së përbashkët).

Arkitektura MPP

MPP (përpunim masiv paralel) - arkitekturë masivisht paralele... Karakteristika kryesore e kësaj arkitekture është se memoria është e ndarë fizikisht. Në këtë rast, sistemi është ndërtuar nga module të veçanta që përmbajnë një procesor, një bankë memorie operative lokale (OP). procesorë komunikimi(ruterat) ose përshtatësit e rrjetit , ndonjëherë disqet e ngurtë dhe/ose pajisje të tjera hyrëse/dalëse. Në fakt, module të tilla janë kompjuterë plotësisht funksionalë (shih Figurën 3.2). Vetëm procesorët (CPU) nga i njëjti modul kanë akses në bankën OP nga ky modul. Modulet janë të lidhura me speciale kanalet e komunikimit... Përdoruesi mund të identifikojë numrin logjik të procesorit me të cilin është lidhur dhe të organizojë shkëmbimi i mesazheve me procesorë të tjerë. Ekzistojnë dy variante të funksionimit të sistemit operativ (OS) në makinat me arkitekturë MPP. Në një të plotë sistemi operativ(OS) funksionon vetëm në makinën e kontrollit (përpara), një version shumë i shkurtuar i funksioneve të OS funksionon në çdo modul individual, duke siguruar funksionimin e vetëm të degës së aplikacionit paralel të vendosur në të. Në versionin e dytë, çdo modul drejton një OS të plotë të ngjashëm me UNIX, i cili instalohet veçmas.


Oriz. 3.2.

Avantazhi kryesor i sistemeve të memories së ndarë është i mirë shkallëzueshmëria: ndryshe nga sistemet SMP, në makinat me memorie të veçantë, çdo procesor ka akses vetëm në të tijën memorie lokale, dhe për këtë arsye nuk ka nevojë për sinkronizim të procesorëve sipas orës. Pothuajse të gjitha rekordet e performancës sot vendosen në makina të kësaj arkitekture, të përbërë nga disa mijëra procesorë (

Artikujt kryesorë të lidhur