Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • në shtëpi
  • Lajme
  • Gjuhët e zgjeruara të shënjimit të të dhënave SGML, XML. Shihni se çfarë është "XML" në fjalorë të tjerë Html është një aplikacion standard sgml

Gjuhët e zgjeruara të shënjimit të të dhënave SGML, XML. Shihni se çfarë është "XML" në fjalorë të tjerë Html është një aplikacion standard sgml

Histori

Le të shohim një shembull të një recete të thjeshtë të kuzhinës të etiketuar me XML:

> Bukë e thjeshtë > > Miell > Maja > Ujë të ngrohtë > Kripë > > > > Përziejini të gjithë përbërësit dhe gatuajeni mirë. > > Mbulojeni me një leckë dhe lëreni për një orë në një dhomë të ngrohtë. > > Ziejini sërish, vendoseni në një tepsi dhe futeni në furrë. > > >

Deklarata XML

Rreshti i parë i dokumentit XML quhet Deklarata XML(eng. Deklarata XML) është një varg që tregon versionin XML. Në versionin 1.0 Deklarata XML mund të hiqet, kërkohet në versionin 1.1. Gjithashtu këtu mund të specifikoni kodimin e karaktereve dhe praninë e varësive të jashtme.

Specifikimi kërkon që procesorët XML të mbështesin kodimet Unicode UTF-8 dhe UTF-16 (UTF-32 është opsional). Kodimet e tjera të bazuara në standardin ISO / IEC 8859 njihen si të pranueshme, të mbështetura dhe të përdorura gjerësisht (por jo të nevojshme), kodime të tjera janë gjithashtu të pranueshme, për shembull, rusisht Windows-1251, KOI-8. Shpesh shkronjat jo latine nuk përdoren në etiketa në parim, në këtë rast UTF-8 është një kodim shumë i përshtatshëm - vëllimi, si rregull, është më i vogël se me UTF-16; dekodimi mund të kryhet si për të gjithë dokumentin ashtu edhe për atribute dhe tekste specifike; i gjithë dokumenti nuk përmban karaktere të paligjshme kur përpiqeni të analizoni me kodimin e gabuar.

Elementi rrënjë

Kërkesa sintaksore më e rëndësishme e detyrueshme është që dokumenti të ketë vetëm një element rrënjë(eng. element rrënjë) (i quajtur edhe ndonjëherë element dokumenti(eng. element dokumenti)). Kjo do të thotë që teksti ose të dhëna të tjera për të gjithë dokumentin duhet të pozicionohen midis një etikete të vetme fillestare dhe etiketës përkatëse fundore.

Shembulli më i thjeshtë i mëposhtëm është një dokument XML i mirëformuar:

Shembulli i mëposhtëm nuk është një dokument i vlefshëm XML sepse ka dy element rrënjë:

> Njësia nr. 1 > > Thelbi numër 2 >

Një koment

Një element mund të vendoset kudo në pemë. një koment... Komentet XML vendosen brenda një etikete të veçantë duke filluar me karaktere... Dy karakteret vizë (-) nuk mund të jenë të pranishëm brenda një komenti.

Etiketat brenda një komenti nuk duhet të përpunohen.

Etiketat

Pjesa tjetër e këtij dokumenti XML përbëhet nga mbivendosur elementet disa prej të cilave kanë atributet dhe përmbajtjen. Elementi zakonisht përbëhet nga etiketat e fillimit dhe të fundit që kornizojnë tekstin dhe elementët e tjerë. Etiketa hapëse përbëhet nga emri i artikullit në kllapa këndore, për shembull , a etiketa fundore përbëhet nga i njëjti emër në kllapa këndore, por një prerje përpara shtohet përpara emrit, për shembull,... Emrat e elementeve, si emrat e atributeve, nuk mund të përmbajnë boshllëqe, por mund të jetë në çdo gjuhë të mbështetur nga kodimi i dokumentit XML. Emri mund të fillojë me një shkronjë, nënvizim, dy pika. Pjesa tjetër e karaktereve të emrit mund të jenë të njëjtat karaktere, si dhe numra, vizë, pikë.

XML ka disa entitete të paracaktuara si lt (mund t'i referoheni duke shkruar<) для левой угловой скобки и amp (ссылка - &) для амперсанда. Возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков.

Më poshtë është një shembull i përdorimit të një entiteti të paracaktuar për të shmangur përdorimin e karakterit ampersand në emër:

> AT&T >

Lista e plotë e entiteteve të paracaktuara përbëhet nga & (&),< (<), >(>), "(") dhe "(") - dy të fundit janë të dobishëm për shkrimin e kufijve brenda vlerave të atributeve. Ju mund të përcaktoni entitetet tuaja në një dokument DTD.

Ndonjëherë është e nevojshme të përcaktohet një hapësirë ​​pa ndërprerje, e cila përdoret shumë shpesh në HTML dhe shënohet si. Nuk ka një entitet të tillë të paracaktuar në XML, ai është i shkruar dhe përdorimi i tij shkakton një gabim. Mungesa e kësaj esence shumë të zakonshme për shumë programues është shpesh befasuese dhe kjo krijon disa vështirësi kur migrojnë zhvillimet e tyre HTML në XML.

Referenca sipas numrit të simbolit(eng. referencë e karaktereve numerike) duket si një referencë për një entitet, por në vend të emrit të njësisë ekonomike, tregohet simboli # dhe një numër (në shënimin dhjetor ose heksadecimal), që është numri i karakterit në tabelën e kodit Unicode. Këto janë zakonisht karaktere që nuk mund të kodohen drejtpërdrejt, siç është një shkronjë arabe në një dokument të koduar me ASCII. Ampersand mund të përfaqësohet si më poshtë:

> AT&T >

Ka rregulla të tjera se si të shkruhet një dokument XML i formuar mirë.

Avantazhet dhe disavantazhet

Dinjiteti

Të metat

  • Paqartësia e modelimit.
  • XML nuk përmban mbështetje të gjuhës amtare për llojet e të dhënave. Nuk ka shtypje të fortë, domethënë konceptet e "numrave të plotë", "strings", "data", "booleans", etj.
  • Modeli hierarkik i të dhënave i ofruar nga XML është i kufizuar në krahasim me modelin relacional dhe grafikët e orientuar nga objekti dhe modelin e të dhënave të rrjetit.

Hartimi i XML në Rrjetin Botëror

Ekzistojnë tre mënyra më të zakonshme për të kthyer një dokument XML në një pamje të dukshme nga përdoruesi:

  1. Aplikimi i stileve CSS;
  2. aplikacioni XSL;
  3. Shkrimi i një procesori dokumentesh XML në një gjuhë programimi.

Për të përcaktuar një transformim XSL (XSLT) në anën e klientit, ju duhet deklarata e mëposhtme në XML:

fjalorë XML

Meqenëse XML është një gjuhë mjaft abstrakte, janë zhvilluar fjalorë XML.

Një fjalor i lejon zhvilluesit të bien dakord për një grup të caktuar emrash dhe atributesh për ato etiketa. Një nga fjalorët më të hershëm është XHTML, i cili kuptohet nga shumica e shfletuesve. XHTML përdoret shpesh për të ruajtur dhe modifikuar përmbajtjen në një CMS.

Janë krijuar fjalorë më të specializuar, siç është protokolli i komunikimit SOAP, i cili nuk ka në qendër njeriun dhe mjaft i vështirë për t'u lexuar. Ka fjalorë komercialë si CommerceML, xCBL dhe cXML që përdoren për të përcjellë të dhëna për aktivitetet tregtare, këta fjalorë përfshijnë përshkrime të sistemit të porositjes, furnitorëve, produkteve dhe më shumë.

Zakonisht, kur përshkruan një dokument, një person vjen me një lloj fjalori për veten e tij, i cili më pas përshkruhet me anë të DTD, XSD ose thjesht u shpjegon "në gishta" palëve të interesuara.

Një nga fjalorët e përhapur është FB2 - një fjalor që përshkruan formatin e një libri, me të gjitha llojet e fusnotave, citimeve, madje edhe fotografive.

versionet XML

  • XML 1.0
  • XML 1.1

Shiko gjithashtu

Shënime (redakto)

Letërsia

  • David Hunter, Jeff Rafter, Joe Fausett, Eric van der Vlist, etj. XML. Puna me XML, Botimi i 4-të = Fillimi i XML, Botimi i 4-të. - M .: "Dialektika", 2009. - 1344 f. - ISBN 978-5-8459-1533-7
  • David Hunter, Jeff Rafter et al. XML. Kursi bazë = Fillimi i XML. - M .: Williams, 2009 .-- 1344 f. - ISBN 978-5-8459-1533-7
  • Robert Tabor. Implementimi i shërbimeve XML Web në Microsoft .NET Platform = Microsoft .NET XML Web Services. - M .: Williams, 2002 .-- 464 f. - ISBN 0-672-32088-6

Lidhjet

  • XML në faqen e Konsorciumit World Wide Web (W3C).
  • Specifikimi zyrtar XML 1.0
  • Specifikimi zyrtar XML 1.1
  • Dokumentacioni XML në artikujt, forumet e faqes IBM

vptyu fPVPFTBU

SGML: A JUEN LFP EDSF?

UEZPDOS CHUE YUBEE NPTSOP CHUFTEFYFSH BVVTECHEYBFKHTH SGML. NOPZYE CHYDSCH DPLHNEOFBGY RPUFBCHMSAFUS CH ZHPTNBFE SGML. rPRHMSTOSCHK SSCHL TBNEFLY Web-UVTBOYG HTML SCHMSEFUS RTYMPTSEOYEN SGML. rPSChMSEFUS Chueh VPMSHYE RTYLMBDOSCHI RTPZTBNN LCA TBVPFSCH Në SGML: TEDBLFPTSCH, UTEDUFCHB ZHPTNBFYTPCHBOYS, UYUFENSCH DPLHNEOFPPVPTPFB, YURPMSHHAEYE SGML B LBYUEUFCHE ZHPTNBFB ITBOEOYS DPLHNEOFPCH ... SGML-RTPDHLFSCH CHSCHRHULBAF Adobe, Corel, SoftQuad, Microsoft. h SGML ZPFPCHSFUS Lojze YDBFEMSHUFCHB O "Reilly, FEIOYYUEULBS DPLHNEOFBGYS IBM, Sun Q OSF. pUOPChSchChBEFUS OF SGML YOZHPTNBGYPOOBS FEIOPMPZYPYCHBYSCHI FEIOPMPZYPYCHBYSHI FEIOPMPZYPOOBS FEIOPPMPZYPYCHBYNJT FEIOPMPZYPOOBS FEIOPMPZYPYHPYHNJBYNJUBYTNBGYPOOBS FEIOPMPZYPYHOPYZHNJBYSHBYTNJBGYPOOBS.

rPSCHYCHYBSUS CH OBYUBME CHPUSHNYDEUSFCHI SGML-FEIOPMPZYS RETETSYCHBEF UEKYUBU RETYPD TBUGCHEFB. SFP LFP FBLPE? SFP POB DBEF UCHPYN RPMSh'PCHBFEMSN? LBL A OEK TBVPFBFSH? OB FY J DTHZYE CHPTRPUSCH S RSCHFBAUSH PFCHEFYFSH ЬFPK UFBFSHEK.

UPDETZBOYE





















LBL ME OBVTEM RRETH SGML-FEIOPMPZYA

CHUE OBYUBMPUSH NË YOFTBOEFB. ьFP NPDOPE UMCHP P'OBYUBMP DMS NEOS RRETH RTBLFile FP, UFP DPLKHNEOFSH, LPFPTSCHE S TEZKHMSTOP RYUBM RP TPDKH UCHPEK DESFEMSHOPUFY, UFBMPKFEMSHOPUFDE " DP UYI RPT S RTPUFP OBVYTBM DPLKHNEOFSCH CH T E X-e Y REUBFBM YI RRETH VKHNBZ. iDES DHVMYTPCHBFSH YI CH HTML CHTKHYUOHA PFRBMB UTBKH: OENEDMEOOP CHUOILMB VSCh RTPVMENB UYOITPOYIBGY VHNBTSOPK Y MELFTOPOOK CHETUEFYK FPOZL.

b CHULPTE RPFTEVPCHBMPUSH RETYPDYUEULBS RETEDBYUB DPLHNEOFPCH RPUFPTPOOIN MADS CH LMELFTPOOPK ZHPTNE, UFP, RP UMPTSYCHYEKUS X OBU RTBFBLFYULEE TBVPFBFSH U MS Word X NEOS RP TSDH RTYUYO OE VSCHMP OYLBLPZP TSEMBOYS, L FPNKH TSE FP FPMSHLP HUHZHVYMP VSCH RTPVMENKH UYOITPOYIBGY CHET.

OBYuYF, OHTSOP VSCHMP RTYDHNBFSH URPUPV BCHFPNBFYYUEULPZP RTEPVTBPCHBOYS OBVYTBENSCHI DPLHNEOFPCH B TBMYYUOSCHE ZHPTNBFSCH: T E X-a - LCA REYUBFY ON VHNBZE, HTML - LCA RPNEEEOYS ON WWW UETCHET, Word - LCA PVNEOB kanë TBVPFBAEYNY W Windows. lTPNE FPZP, NOE IPFEMPUSH, YuFPVSch FBLPE UTEDUFCHP PFCHYUBMP EEE TSDH FTEVPCHBOYK:

  • VSHFSH NPDKHMSHOSCHN, YUFPVSH NPTSOP VSCHMP RTY OEPVIPDYNPUFY MEZLP DPVBCHMSFSH OPCHSCHE CHSCHIPDOSH ZHPTNBFSH YMY YNNEOSFSH BMZPTYFNSCH RTEPVYETBCHP;
  • VSCHFSH PFLTSCHFSCHN, VEURMBFOSCHN, LBL NPTSOP NEOSHIE RTYCHSBOOSCHN L LPOLTEFOSCHN RTPZTBNNBN;
  • VSHFSH NPVYMSHOSCHN: TBVPFBFSH, LBL NYOYNKHN, RRETH TBOBOSHI UNIX-RMBFZHPTNBI;
  • VSCHFSH MEZLP THUYZHYGYTKHENSCHN.

RETCHSCHN, UFP RPRBMPUSH NOE RPD THLH RPUME RPIPDB RRETH Altavista, PLBBMUS RBLEF RPD OBCHBOYEN linuxdoc-sgml. PO LBL TBJ RTEDOBOOBYUBMUS DMS ZEOETBGY HTML, T E X Y RTF Yj PDOPZP CHIPDOPZP ZhBKMB. Projekti i Dokumentimit yYTPLP YURPMSHHENSCHK CH TBNLBI Linux, NË YURPMSh'PCHBM CH LBYUEUFCHE CHIPDOPZP ZhPTNBFB OEFOBLPNSCHK NOE DP UYI RPT SUSHL SGML. CHRTPYUEN, OYUEZP UMPTSOPZP CH OEN OE PLBBMPUSH - PO CHEUSHNB OBRPNYOBM JOBLPNSCHK NOE HTML TH CHCHZMSDEM CHRPMOE RPOSFOP. chPF, L RTYNETH, LHUPYEL SGML-DPLHNEOFB:

Struktura e një teksti të TEI

Të gjitha tekstet në përputhje me TEI përmbajnë a Titulli i TEI(e shënuar si a teiHeader element) dhe transkriptimi i tekstit të duhur (i shënuar si a teksti element).

dMS FPZP, UFPVSH OBYUBFSH OB FFPN RYUBFSH, RPFTEVPCHBMPUSH CHUEZP MYISH ABRPNOYFSH OEULPMSHLP PUOPCHOSHI LMENEOFPCH TBNEFLY, OBRTINET

POBUBEF OBYUBMP RBTBZTBZHB, - OBYUBMP RETEUUMEOIS J FR.

OBVTBOOSCHK CH SGML FELUF DBMEE ABRKHULPN PDOPZP ZHYMSHFTB RTEPVTBJHEFUS CH HTML, DTHZPZP - CH T E X, FTEFSHESP - CH RTF, J FBL DBMEE.

SFP FBLPE SGML J JUEN NË IPTPI

FETNYOPMPIS

GML ( Gjuha e përgjithësuar e shënjimit) TBTVBVPFBO CH OEDTBI CHEDEUHEEK LPTRPTBGY IBM. EZP OBUMEDOIL SGML ( Gjuha standarde e përgjithësuar e shënjimit) RTIOSF CH 1986 ZPDKH CH LBYUEUFCHE NETSDHOBTPDOPZP UFBODBTFB DMS PRTEDEMOYS OEBCHYUYNSHI PF KHUFTKUFCH CHCHPDB / CHCHCHPDB, OEBCHYUYUYCHHPDYUPK WPMEE FPUOP, SGML - LFP NEFBSUCCL , FP EUFSH UTEDUFCHP ZhPTNBMSHOPZP PRYUBOYS SZSCHLB, CH DBOOPN UMHYUBE, SSSHLB TBNEFLY .

yUFPTYUEEULY UHMCP TBNEFLB YURPMSHPCHBMPUSH LCA PRYUBOYK BOOPFBGYK YMY DTHZYI PVPOBYUEOYK CHOHFTY FELUFB, RTEDOBOBYUEOOSCHI LCA HLBBOYK UPUFBCHYFEMA YMY "CHETUFBMSHYFEMA YMY "CHETUFBMSHYFEMA YMY "CHETUFBMSHYFEMA YMY "CHETUFBMSHYFEMA YMY "CHETUFBMSHYFEMA YMY "CHETUFBMSHYFEMA YMY "CHETUFBMSHYFEMA YMY "CHETUFBMSHYFEMA YMY "CHETUFBMSHYFEMA" rTYNETSCH CHLMAYUBAF RPDYUETLYCHBOYE CHPMOYUFPK YUETFPK, PVP'OBYUBAEE LKHTUYCH, UREGIBMSHOSCHE YOBULY DMS RTPRHULB ZhTB YMY YI REYUBFY LPOLEYMEEFOSCHN. lPZDB ZhPTNBFYTPCHBOYE Y REYUBFSH FELUFPCH UVBMY BCHFPNBFYYTPCHBOOSCHNY, FFPF FETNYO UVBM PICHBFSCHBFSH CHUE CHYDSCH UREGEYBMSHOSCHI LAPDHR TBNEFLY , CHUFBCHMSENSHI CH'MELFTPOSCHE FELUFSCH DMS HRTBCHMEOIS ZHPTNBFYTPCHBOYEN, REYUBFSHA YMY DTHZPK PVTBVPFLPK.

pVPVEBS, TBNEFLKH, YMY LPDYTPCHLH , PRTEDEMSAF LBL MAVPE UTEDUFCHP UDEMBFSH SCHOSCHN YOFETRTEFBGYA FELUFFB. Në VBOBMSHOPN HTPCHOE Chueh OBREYUBFBOOSCHE FELUFSCH LPDYTPCHBOSCH B FPN UNSCHUME: OBLY RTERYOBOYS, YURPMSHPCHBOYE BZMBCHOSCHI VHLCH, TBURPMPTSEOYE VHLCH RP UFTBOYGE, DBTSE YOFETCHBMSCH NETSDH UMPCHBNY NPTSOP UYUYFBFSH LBLPK H-PF UFEREOY TBNEFLPK, ZHHOLGYS LPFPTPK - RPNPYUSH YUEMPCHELH, YUYFBAEENH FELUF, PRTEDEMYFSH, zde LPOYUBEFUS PODOP UMPCHP Y OBYUYOBEFUS DTHZPE, YMY LBL IDDEOFYZHYGYTPCHBFSH PUPVEOPUFY UVTHLFKHTSCH, FBLYE LBL ABZPMPCHLY, YMY RTPUFCHE UYOFBLUEGYUPYUPYUPDUFLUCHEYY lPDYTPChBOYE FELUFB LPNRSHAFETOPK PVTBVPFLY VMI, W RTYOGYRE, LBL TBUYYZHTPCHLB NBOHULTYRFB kanë RETZBNEOFB - RTPGEUU DEMBOYS SCHOSCHN OESCHOPZP YMY RPDTBHNECHBENPZP, RTPGEUU HLBBOYS RPMSHPCHBFEMA FPZP, LBL DPMTSOP YOFETRTEFYTPCHBFSHUS UPDETTSYNPE FELUFB.

rAP SSSHLPN TBNEFLY RPOINBAF OBVPT UPZMBIEOIK P TBNEFLE, RTEINEOSENSHI DMS LPDYTPCHBOYS FELUFPCH. ssshl TBNEFLY DPMTSEO UREGYZHYGYTPCBFSH, LBLBS TBNEFLB DPRKHUFYNB, LBLBS TBNEFLB PVSBFEMSHOB, LBL PFMYUYUIFSh TBFNEFUFFLB YFMYUYUIFLUFLUSh TBFNE SGML RTEDPUFBCHMSEF TEEEOIS DMS RETCCHHI FTEI ЪBDBYU, PFDEMSHOBS DPLKHNEOFBGYS PVSCHYUOP OEPVIPDYNB DMS RPUMEDOEK.

PUPVEOOPUFFY SGML

fty IBTBLFETYUFILY SGML PFMYUBAF EZP PF RTPYUYI SSCHLPCH TBNEFLY.

PRYUBFEMSHOBS TBNEFLB

UYUFENB U PRYUBFEMSHOPK TBNEFLPK YURPMSHHEF LPDSCH TBNEFLY, LPFPTSCHE RTPUFP RTEDPUFBCHMSAF OBCHBOYS DMS LBFESPTEYBGY YUHUHNEFEK DPL. lPDSCH TBNEFLY, FBLYE LBL YMY \ fundi (lista), RTPUFP IDDEOFIZHYGYTKHAF RPTGYA DPLKHNEOFB J HFCHETTSDBAF, UFP "POB SCHMSEFUS RBTBZTBZHPN", YMJ UFP "LFP - LPOEG OBYUBUMEDOUP. në DTHZPK UFPTPOSCH, UYUFENB kanë RTPGEDHTOPK TBNEFLPK PRTEDEMSEF, LBLBS PVTBVPFLB DPMTSOB CHSCHRPMOSFSHUS B LPOLTEFOPK FPYULE DPLHNEOFB "B FPN NEUFE CHSCHCHBFSH RTPGEDHTH PARA kanë RBTBNEFTBNY 1, b J x", YMY "RETEDCHYOHFSH MECHHA ZTBOYGH ON 2NN MECHEE, RTBCHHA ZTBOYGH - ON 2NN RTBCHEE, RTPRKHUFYFSH PDOH UFTPLKH Y CHUFBFSH RRETH SHPATAVE OPCHA ZTBOYGKH "Y FR. h SGML YOUFTHLGYY, OEPVIPDYNSCHE LCA PVTBVPFLY DPLHNEOFB Y-LBLPK MYVP LPOLTEFOPK GEMSHA (OBRTYNET, ICH ZHPTNBFYTPCHBOYS) YUEFLP PFDEMSAFUS PFDEMSAFUSHPFSHPFUFTFUFUFUZHUFUZHUAE,BYNJUFUFUFUZUAJT,FUZHUFUFUZUAJT,FPFUFUFUZUAJT,FPFUFUFUZUAJT,FPFUFBFUFUZUAJT. pvshchuop POI UPVTBOSCH CHOE DPLKHNEOFB CH PFDEMSHOSHI RTPGEDKHTBI YMY RTPZTBNNBI.

në PRYUBFEMSHOPK, B OE RTPGEDHTOPK, TBNEFLPK PDYO J FPF CE DPLHNEOF NPTSEF VSCHFSH PVTBVPFBO TBOPPVTBOSCHNY RTPZTBNNBNY, LBTSDBS DV LPFPTSCHI NPTSEF RTYNEOSFSH TBMYYUOSCHE YOUFTHLGYY PVTBVPFLY një tharëse EZP YUBUFSN, LPFPTSCHE BMP UYUYFBEF CHBTSOSCHNY. oBRTYNET, RTPZTBNB BOBMYIB UPDETTSYNPZP NPTSEF RPMOPUFSHA YZOPTYTPCHBFSH UOPULY, FPZDB LBL RTPZTBNNB ZhPTNBFYTPBLEN NPTsEBFMSH YBYUCHME TBMYUOSCHE CHYDSCH YOUFTKHLGYK PVTBVPFLY NPZHF BUUPGYITPCHBFSHUS U PDOPK Y FPK TSE YUBUFSHA ZHBKMB. oBRTYNET, PDOB RTPZTBNNB NPTSEF YCHMELBFSH DV DPLHNEOFB ZHBNYMYY MADEK J ZEPZTBZHYYUEULYE OBCHBOYS LCA UPDBOYS YODELUB YMY VBSCH DBOOSCHI, FPZDB LBL DTHZBS, PVTBVBFSCHCHBAEBS FPF CE UBNSCHK FELUF, NPTSEF REYUBFBFSH ZHBNYMYY J OBCHBOYS PFMYYUBAEYNUS YTYZHFPN.

fireshch DPLHNEOFPCH

SGML CHHPDIF RPOSFYE FIRB DPLHNEOFB , Y, UPPFCHEFUFCHOOOP, PRTEDEMEOIS FIRB DPLHNEOFB (Përkufizimi i llojit të dokumentit, DTD). DPLKHNEOFSCH UYUIFBAFUS FYRYJTPCHBOSCHNY, FBL TSE, LBL J DTHZIE PVTBVBFSCHCHBENSCHE LPNRSHAFETBNY PVYAELFSCH. ZJARR DPLKHNEOFB ZhPTNBMSHOP PRTEDEMSEFUS EZP UPUFBCHOSCHNY YUBUFSNY YI UVTHLFKHTPK. PRTEDEMEOYE, OBRTYNET, PFYUEFB NPTSEF VSHFSH FBLYN, UFP PO UPUFFPIF Y ЪBZPMPCHLB Y, CHPNPTSOP, BCHFPTB, ЪB LPFPTSCHNY UMEDHEDEF BOPUFFPUGBMEB mAVPK DPLHNEOF PFUHFUFCHYE BZPMPCHLB W, W UPPFCHEFUFCHYY kanë Fyn ZHPTNBMSHOSCHN PRTEDEMEOYEN, OE VHDEF ZHPTNBMSHOP SCHMSFSHUS PFYUEFPN, FBL CE SAT LBL VHDEF dh SCHMSFSHUS J RPUMEDPCHBFEMSHOPUFSH BVBGECH, B LPFPTPK UMEDHEF BOOPFBGYS, OECHYTBS ON AF ON OBULPMSHLP RPIPTS PFYUEF FBLPK DPLHNEOF kanë FPYULY TEOYS YUYFBFEMS- UEMPCHELB .

rPULPMShLKh DPLKHNEOFSCH PFOPUSFUS L YCHEUFOSCHN FIRBN, SPTSOP YURPMSHPCHBFSH UREGIBMSHOKH RTPZTBNNKH, OBSCHCHBENKHA BOBMYBFPTPN (analizues) LCA FPZP, YUFPVSCH PVTBVPFBFSH DPLHNEOF, HFCHETTSDBAEYK, YUFP PFOPUYFUS IN A LPOLTEFOPNH FYRH, J RTPCHETYFSH, DEKUFCHYFEMSHOP MD Chueh MENEOFSCH, FTEVHENSCHE LCA DBOOPZP FYRB DPLHNEOFPCH, RTYUHFUFCHHAF J OBIPDSFUS B RTBCHYMSHOPK RPUMEDPCHBFEMSHOPUFY. uFP EEE VPMEE CHBTSOP, TBOBOSCHE DPLKHNEOFSCH PDOPZP FIRB NPZHF PVTBVBFSCHBFSHUS KHOYZHYGYTPCHBOOSCHN PVTBBSPN. NPTSOP RYUBFSH VPMEE YOFEMMELFKHBMSHOSCHE RTPZTBNNSCH, YURPMSHHAEE YOBOIS, ЪBLMAYUEOOSCHE CH YOZHPTNBGYPOOPK UVTHLFKHTE DPLKHNEOFB.

OEBCHYUYNPUFSH DBOOSHI

pUOPChOBS GEMSH RTPELFYTPCHBOYS SGML VSCHMB B UPDBOYY ZBTBOFYK FPZP. YUFP DPLHNEOF, BLPDYTPCHBOOSCHK UPZMBUOP EZP RPMPTSEOYSN, VHDEF RETEOPUPDPPKBHBTh dCHB EZP UCHPKUFCHB, PRYUBOOSHCHYE CHCHYE, PFCEYUBAF ЬFPNKH FTEVPCHBOYA RRETH BVUFTBLFOPN HTPCHOE; FTEFSHE UCHPKUFCHP - RRETH HTPCHOE UVTPYEL VBKFPCH (UYNCHPMPCH), LPFPTSCHE UPUFBCHMSAF DPLKHNEOF. SGML RTEDPUFBCHMSEF PVPVEEOOSCHK NEIBOYUN UVTPLPCHPK RPDUFBOPCHLY , FP EUFSH, RTPUFFK NBYYOOP-OEBCHYUYNSCHK URPUPV KHLBBOYS, UFP LPOLTEFOBS UVTPLB UYNCHPMPCH CH DPLKHNEOFE CH NPNEOF PVTBVPFLY DPLKHNEOTSBOF pDOP PYUECHYDOPE RTYNEOOYE FPNKH NEIBOYUNH - PVEUREUEEOE EDYOPK FETNYOPMPZY; DTHZPE, J VPMEE OBYUYFEMSHOPE - RTPFYCHPDEKUFCHYE YCHEUFOPK OEURPUPVOPUFY TBOSCHI LPNRSHAFETOSCHI UYUFEN RPOYNBFSH OBVPTSCH UYNCHPMPCH DTHZ DTHZB, OBRTYNET, PDOPK UYUFENE RTEDUFBCHMSFSH Chueh ZTBZHYYUEULYE UYNCHPMSCH, OEPVIPDYNSCHE RTYMPTSEOYA, RHFEN PRYUBFEMSHOPZP PFPVTBTSEOYS OERETEDBCHBENSCHI UYNCHPMPCH. uFTPLY, PRTEDEMENSCHE FЙN NEIBOYNPN, OBSCHCHBAFUS UHEOPUFSNY (entitete).

n RTEINHEEUFCHBI

SFP DBEF YURPMShPCHBOYE SGML CH TABMSHOPK QIYOI? I RI POP UTBKH DBMP CHP'NPTSOPUFSH RTPYCHPDYFSH DPLKHNEOFSH CH MAVPN FTEVKHENPN CHYDE. xDPVOP PLBBMBMPUSH Y OBRYUBOYE "CHOPTDPCHCHCHI" VHNBTsEL CH RTICHSCHYUOPK UTEDE XEmacs VEH YURPMSHUPCHBOYS Windows. CHUE YURPMSHUPCHBOOSCHE RTPZTBNNSCH - VEURMBFOSCH Y TBURTPUFTBOSAFUS CH YUIPDOSCHI FELUFFBI, UFP RPCHPMYMP HUFBOPCHIFSH YI OB CHUEEI YURPMSHUKHENCHI NOPK UYUYU. rTYUEN PLBBMPUSH, UFP OBYUBFSH TBVPFBFSH U SGML CHECHUE OE UMPTSOP, LBTSDSCHK, LFP IPFSH TB TEDBLFAYTPCHBM WWW UFTBOYULH, OE YURHZBEFUFUS CHEYDB.

rPFPN HTSE, RP NETE RPUFEREOPZP YHYUEOYS SGML, S PUPBOBM, UFP ЬFB FEIOILB DBEF ZTPNBDOPE LPMYUEUFCHP CHPNPTSOPUFEK RP UPBCHOOYUPK

rTPDHLFYCHOPUFSH yuEFLP TBDEMEOSCHE RTPGEUUSCH CHCHPDB YOZHPTNBGYY RHPTNBFYTPCHBOYS RPCHPMSAF BCHFPTKH UPUTEDPFPYUYFSHUS OB YMPTSEOYL PYUYFSHUS OB YUMPTSEOCUMM N

EDYOBS UVIMYUFILB MEZLP CHSCHDETTSYCHBFSH TBMYUOSCHE DPLKHNEOFSCH CH EDYOPN UVIME, YURPMSHUHS EDYOHA FETNYOPMPZYA. eUMY UFYMSH YMY FETNYOSCH OKHTSOP YUNEOIFSH, LFP DEMBEFUS TBPN PE CHUEI DPLHNEOFBI, OE FTPZBS YI UPDETTSYNPE.

rPChFPTOPE YURPMShSPCHBOYEьFPF FETNYO, IPTPYP BOBLPNSCHK RTPZTBNNYUFBN, POBUBEF OBMIYUYE ChP'NPTSOPUFY YURPMSHPCHBFSH DEFBMY UVBTSHI RTPELFPCH CH OPCHNEYUFBN yUBUFSH DPLKHNEOFB, PZHPTNMEOOBS CH CHYDE SGML-LMENEOFB, NPTSEF RETEOPUYFSHUS CH DTHZIE DPLKHNEOFSCH, MEZLP RPCHFPTSFSHUS CH TBOBOSHI NEUFBBI.

dPMZPCHEUOPUFSH YOZHPTNBGY yb-bb FPZP, UFP SGML - RTPUFPK Y UFBODBTFOSCHK ZHPTNBF ITBOEOIS DBOOSHI, PFUHFUFCHHEF OEPVIPDYNPUFSH RETEZHPTNBFYTPCHBFSH YI CHCHYCHDKHBUFFKT yOZHPTNBGYS RTPUFP DPUFHROB OBCHUEZDB. POB OEUEF U UPVPK CHUE OEPVIPDINPE DMS UPUDBOYS DPLHNEOFB.

MHYUEE HRTBCHMEOE DBOSCHNY nga SGML NPTSOP PRTEDEMSFSH YOZHPTNBGYPOSCHE LMENEOFSH Y NBOYRKHMSGY U OYNY U RTPYCHPMSHOPK UVEREOSHA DEFBMSHOPUFY. TBNEYUEOOSCHE LMENEOFSCH NPZHF YNEFSH BFTYVHFSCH, PRTEDEMSAEYE IBTBLFETYUFILY Y UCHPKUFCHB LMENEOFPCH. ьФБ YOZHPTNBGYS OE RTEDOBOBYUEOB DMS REYUBFY, OP NPTSEF RPNPYUSH CH HRTBCHMEOY LMENEOFBNY DBOOSHI. OBRTYNET, BFTYVHF ID (IDEOFYZHYLBFPT) NPTSEF KHOILBMSHOSCHN PVTBSPN IDEOFYZHYGYTPCBFSH PDYO BVJBG, YMY GEMSCHK TBBODEM, RTEJNEYMABOYE

yOZHPTNBGYS
fBL LBL IDEOFYZHYLBFPTSCH SCHMSAFUS NBYYOOP-YUIFBENSCHNY, POI NPZHF UCHSCHCHBFSH NECDKH UPVPK YOZHPTNBGYA YYURPMSHPCHBFSHUSME HYURPMSHOPCHBFSHUSPE HYURPMSHOPCHBFSHUSPE HYURPMSHOPCHBFSHUSPE. ONLINE:
  • lPOFTPMYTPChBFSH VEPRBUOPUFSH DPUFKHRB L YOZHPTNBGY, RPCHPMS FPMSHLP PRTEDEMEOOSCHN MADSN RTPUNBFTYCHBFSH YMY YNNEOSFSH EE.
  • bCHFPNBFYYITPCHBFSH RETENEEEEOYE YOZHPTNBGYY - OBRTYNET, PWOPCHMEOYE DBOOSHI CH PDOPN NEUFE NPTSEF YOYGYYTPCHBFSH PWOPCHMEOYE FPK TSEKHEYZYOZHPN

TBDEMSENPUFSH chPNPTSOPUFSH TBVPFSH UP UVTKHLFKHTYTPCHBOOSCHNY LPNRPOEOFBN DPLKHNEOFB RPJCHPMSEF UVTPYFSH GEMSCHK DPLKHNEOF YY UPUFFCHOCHI YUBUFEYBOZHBOZ ьФП РПъЧПМСОФ РПМШЪПЧБФЭМСН DEMYFSHUS YOZHPTNBGYEK WEB ITS DHVMYTPCHBOYS.

nPWYMSHOPUFSH h YOZHPTNBGYPOOSHI UEFSI, PVYEDYOSAEYI TBOPPVTBOBOSCHE LPNRSHAFETCH rPULPMSHLKH SGML OE BCHYUIF PF BRRBTBFHTSCH Y RTEIMPTSEOIK, NPTSOP MEZLP PVNEOYCHBFSHUS DPLKHNEOFBNY NETSDKH TBMYUOSCHNY UYUFENBNY.

ZYVLPUFSH CH RTEYMPTSEOYY SGML РПъЧПМСОФ YURPMShъPCHBFSH YOZHPTNBGYA DBMELP ЪB TBNLBNY "OBUFPMSHOPK FIRPZTBZHYY". ONLINE:

  • UVTBOYGSCH WWW;
  • YOZHPTNBGYPOSCHE VBBSH DBOOSHI;
  • DYBZOPUFYUEULYE / ЬLURETFOSCHE UYUFENSCH;
  • LMELFTPOOBS RPUFB;
  • ZYRETFELUFPCHBS DPLKHNEOFBGYS;
  • РХВМЙЛБГЙЙ RRETH CD-ROM-it;
  • YOFETBLFYCHOSCHE SMELFTPOSCHE NBOHBMSCH.

pUENX SGML?

rPUENH OE Fjalë? rPFPNKh, UFP LFP YBLTSCHFSCHK ZhPTNBF. rPFPNKh, UFP LFP ZhPTNBF PDOPZP RTYMPCEOIS. rPFPNKH, UFP LFPZP RTEIMPTSEOIS OEF RPD AOILUBNY, U LPFPTSCHNY S TBVPFBA. rPFPNKH, UFP LFP OE FELUFPCHSCHK ZhPTNBF. rPFPNKH, UFP OEF UTEDUFCH BCHFPNBFYUEEULPK ZEOETBGY FBLYI DPLHNEOFPCH. rPFPNKH, UFP OEF FPMLPCHCHI UTEDUFCH HRTBCHMEOYS CHETUYSNYY LPMMELFYCHOPK TBVPFSH. rPFPNKH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSCHUMPCHPK UVTHLFHTSCH, Y OEF CHP'NPTSOPUFY YI UPPFOPUYFSH. rPFPNKH, UFP RTY LLURPTFE RPMKHYUBEFUS UPSHETEOOOP OEHDPCHMEFCHPTYFEMSHOSCHK HTML. rPFPNKH, UFP LBYUEUFCHP CHETUFLY Y REYUBFY OYTSE UTEDOESP.

pUENH OE T E X? rPFPNKH, UFP LFP UMYYLPN OYLPKHTPCHOECHSCHK SZSCHL. EZP OE DBYSH CH THLY OBYUYOBAENH. rPFPNKH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSCHUMPCHPK UVTHLFKHTSCH. rPFPNKH, UFP NBMP T E X-PTYEOFYTPCHBOOSHI TEDBLFPTPCH. rPFPNKH, UFP OEF HDPCHMEFCHPTIFEMSHOSHI UTEDUFCH LURPTFB CH Word.

pUENH OE HTML? rPFPNKH, UFP UBNP RPOSFYE HTML UYMSHOP TBNSCHFP ZPOLPK WWW ЪB LPNNETGYEK Y CHOCOPK RTPYCHPDIFEMEK VTBKHYETPC DTHZ U DTHZPN. rPFPNKH, UFP HTML UVTBDBEF CHUE FEN TCE OEDPUFBFLPN: PTYEOFYTPCHBO RRETH RTEDUFBCHMEOYE, B OE RRETH UVTHLFKHTH. rPFPNKH, UFP PO PYUEOSH VEDEO CHCHTBYFEMSHOSCHNY UTEDUFCHBNY, J PFUHFUFCHHAF ChP'NPTSOPUFY EZP TBUYITEOIS. rPFPNKH, UFP OE TEEEO RTPVMENB LPTTELFOPK TKHUZHYLBGY. rPFPNKH, UFP OEF HDPCHMEFCHPTIFEMSHOSHI UTEDUFCH LURPTFB CH Word.

SGML RTPFYCH WYSIWYG

dMS FEI, LFP RTICHSCHL RPMSH'PCHBFSHUS FPMSHLP "procesor teksti" -BNY, OBRTYNET, MS Word YMY WordPerfect, NPTSEF VSCHFSH YOFETEUOP UPRPUFBCHMEOYE YI U SGML YOFBUNFTKH. FY DCHE ZTHRRSCH RTPZTBNOSHI UTEDUFCH, OEUNPFTS RRETH UIPTSEUFSH TEYBENSCH BDBYU - RTPYCHPDUFCHP DPLKHNEOFFPC - CHEUSHNB DTHBAZ PF DTHYUFTIFT PFMHHP.

Përpunues teksti - LFP YOFEMMELFHBMSHOBS RYYHEBS NBYYOLB. tO PTYEOFYTPCHBO PËR TBVPFH kanë CHYHBMSHOSCHN RTEDUFBCHMEOYEN FELUFB, IBTBLFETYHAEEZPUS OBVPTPN UFYMEK: UFYMEK UYNCHPMPCH (YTYZHF, LEZMSH, OBYUETFBOYE) BVBGECH (LTBUOBS UFTPLB, CHSCHTBCHOYCHBOYE, RPMPTSEOYE RP YYTYOE UFTBOYGSCH) UFTBOYG (LPMPOFYFHMSCH, UOPULY) TBDEMPCH J DPLHNEOFPCH (ZHPTNBF VHNBZY, PZMBCHMEOYE), Y RTPYUYI. Përpunuesi i tekstit OE TBVPFBEF U CHOHFTEOOEK UVTHLFHTPK DPLHNEOFB.

SGML TEDBLFPT, OBRTPFYCH, PTYEOFYTPCHBO RRETH TBVPFH U UPDETTSYNSCHN DPLHNEOFB. dMS SGML TEDBLFPTB, OBRTYNET, TBDEEM - LFP LMENEOF, CH LPFPTSCHK NPZHF CHLMAYUBFSHUS RPDTB'DEMSCH, B OE RTPNETSKHFPL PF PDOPZP BV'BMENOGBLP, OBVT

ьФП РПъЧПМСОФ БЧФПТХ UPUTEDPFPYUIFSHUS RRETH UPDETTSBOY FELUFFB, B OE CHP'YFSHUS U EZP ZhPTNBFYTPCHBOYEN Y CHSCHVPTPN UFIMEK. CHYJHBMSHOBS UFYMYUFILB DPLKHNEOFB PRTEDEMSEFUS RTY EZP LURPTFE CH CHCHEPDOSCHE ZHPTNBFSCH, B OE RTY OBVPTE FELUFB.

p RTPZTBNNOPN PVEUREEOOOYY

yuFPVSCH OBYUBFSH TBVPFBFSH U DPLHNEOFBNY CH SGML RPMSH'PCHBFEMA OHTSOCCH DCHB PUOPCHOSHI UTEDUFCHB: TEDBLFPT Y UTEDUFFCHB LURPTFB (ZHPTNBBFYT).

SGML-TEDBLFPT

SGML-TEDBLFPT PFMYUBEFUS LBL PF RTYCHYUOSHI FELUFPCHCHI TEDBLFPTPCH, FBL J PF "procesor teksti" -PCH. pF RETCHSCHI - OBMYUYEN RPDDETTSLY UVTHLFKHTYTPCHBOOSHI DPLHNEOFPCH, PF CHFPSHI - PFUHFUFCHYEN RPDDETTSLY CHYJHBMSHOPZP ZHPTNBFYTPCHBOYS. TEDBLFPT TBBVYTBEF DTD TEDBLFYTKHENPZP DPLKHNEOFB Y "CHEDEF" RPMSH'PCHBFEMS CH UPPFCHEFUFCHY U OYN. OBRTINET, EUMI DTD RTEDHUNBFTYCHBEF LMENEOF

, CH LPFPTPN NPZKHF CHUFTEYUBFSHUS FPMSHLP LMENEOFSH YMY , FP RPMSh'PCHBFEMA, TEDBLFYTKHAENKH LMENEOF
, VKHDEF RTEDMPTSEOP CHUFBCHYFSH PDYO Y'FYI DCHKHI TBTEYEOOSHI LMENEOFFCH. SGML-TEDBLFPT FBLCE PVSCHYUOP UPDETTSYF UTEDUFCHB OBCHYZBGY RP YETBTIY DPLKHNEOF.

yj YUYUMB RPRHMSTOSHI SGML-TEDBLFPTPCH NPTSOP OBJCHBFSH ArborText ADEPT * Redaktues, SoftQuad Autor / Redaktues, psgml, Adobe FrameMaker + SGML, Corel WordPerfect, J NOPCEUFCHP DTHZYI.

UTEDUFCHB ZhPTNBFYTPCHBOYS

uHEEUFCHKHEF NOPTSEUFCHP UTEDUFCH TBVPFS U SGML FELUFFBNY. VóMSHYHA YI YUBUFSH UPUFBCHMSAF UTEDUFCHB ZhPTNBFYTPCHBOYS - LURPTFB SGML CH DTHZYE ZhPTNBFSH DMS REYUBFY, RTPUNPFTB J F.R. CHSCHIPDOSHE ZHPTNBFSH NPZHF VSCHFSH MAVSCHNY, ABCHYUS MYYSH PF DPUFHROPZP RTPZTBNNOPZP PVEUREUEOYS Y OKHTSD RPMSHUPCHBFEMS. OBRTINET, S YURPMSHJHA LPOCHETFETSH H HTML, RTF L A T E X.

Në vitin 1986, shumë kohë përpara se ideja e krijimit të Uebit të vihej në jetë, gjuha universale, e standardizuar e shënjimit SGML ( Gjuha e standardizuar e përgjithësuar e shënjimit) është miratuar si një standard ndërkombëtar (ISO 8879) për përcaktimin e gjuhëve të shënjimit, megjithëse SGML ekziston që nga fundi i viteve gjashtëdhjetë. Është përdorur për të përshkruar gjuhët e shënjimit duke i lejuar autorit aftësinë për të përcaktuar zyrtarisht çdo element dhe atribut të gjuhës.

HTML fillimisht ishte vetëm një nga aplikacionet SGML. Ai përshkroi rregullat me të cilat duhet të përgatitet informacioni për World Wide Web. Kështu, HTML është një grup recetash SGML të formuluara si përcaktimet e llojit të dokumentit(DTD) që shpjegojnë saktësisht se çfarë nënkuptojnë etiketat dhe elementët. DTD për HTML ruhet në shfletuesin e internetit.

Disavantazhet e gjuhës HTML përfshijnë si më poshtë:

  • HTML ka grup fiks etiketash... Ju nuk mund të krijoni etiketat tuaja që janë të kuptueshme për përdoruesit e tjerë.
  • HTML është ekskluzivisht teknologjia e prezantimit... HTML nuk përmban asnjë informacion në lidhje me kuptimin e përmbajtjes që përmbahet në etiketat.
  • HTML - gjuhë e sheshtë... Kuptimi i etiketave në të nuk është i përcaktuar, kështu që nuk mund të përdoret për të përshkruar hierarkinë e të dhënave.
  • Shfletuesit përdoren si platformë për aplikacione... HTML nuk është mjaftueshëm i fuqishëm për të krijuar aplikacione në internet në nivelin që zhvilluesit e uebit po përpiqen aktualisht. Për shembull, është e pamundur të zhvillohet një aplikacion në HTML për përpunimin dhe rikthimin profesional të dokumenteve.
  • Vëllime të mëdha të trafikut në rrjet... Dokumentet ekzistuese HTML që përdoren si aplikacione mbingarkojnë internetin me sasi të mëdha trafiku në sistemet klient-server. Një shembull do të ishte dërgimi i një dokumenti të madh përmes një rrjeti kur nevojitet vetëm një pjesë e vogël e atij dokumenti.

Kështu, nga njëra anë, HTML është një mjet shumë i përshtatshëm për shënimin e dokumenteve për përdorim në ueb, dhe nga ana tjetër, një dokument i shënuar në HTML ka pak informacion për përmbajtjen e tij. Nëse ky ose ai dokument mbart informacion mjaft të plotë për përmbajtjen e tij, bëhet e mundur që relativisht lehtë të kryhet përpunimi dhe kërkimi automatik i përgjithësuar në skedarin që ruan dokumentin. SGML mund të ruajë informacione rreth përmbajtjes së një dokumenti, por për shkak të kompleksitetit të tij, ai kurrë nuk është përdorur aq gjerësisht sa HTML.

Një grup ekspertësh të SGML, të udhëhequr nga Jon Bosak i Sun Microsystems, kanë filluar punën për të krijuar një nëngrup të SGML që mund të pranohet nga komuniteti i Uebit. U vendos që të hiqen shumë veçori jo thelbësore SGML. Gjuha e rindërtuar në këtë mënyrë u quajt XML. Versioni i thjeshtuar ishte dukshëm më i përballueshëm se origjinali, me vetëm 26 faqe specifikime krahasuar me mbi 500 faqe të specifikimeve SGML.

Le të shqyrtojmë më në detaje strukturën dhe veçoritë e kësaj gjuhe.

XML (Gjuha e shënjimit eXtensible)është një gjuhë shënjimi e rekomanduar nga W3C. XML - format teksti, i destinuar për ruajtjen e të dhënave të strukturuara, për shkëmbimin e informacionit midis programeve, si dhe për krijimin e gjuhëve të specializuara të shënjimit në bazë të tij. XML është një nëngrup i thjeshtuar i gjuhës SGML.

Gjuha XML ka sa vijon dinjitet:

  • Është një format dokumenti me në qendër njeriun që mund të kuptohet si nga njerëzit ashtu edhe nga kompjuterët.
  • Mbështet Unicode.
  • Strukturat bazë të të dhënave si regjistrimet, listat dhe pemët mund të përshkruhen në formatin XML.
  • Është një format vetë-dokumentues që përshkruan strukturën dhe emrat e fushave, si dhe vlerat e fushave.
  • Ka një sintaksë të mirëpërcaktuar dhe kërkesat e analizës, e cila e lejon atë të mbetet e thjeshtë, efikase dhe konsistente.
  • Përdoret gjerësisht për ruajtjen dhe përpunimin e dokumenteve;
  • Është një format i bazuar në standardet ndërkombëtare;
  • Struktura hierarkike e XML është e përshtatshme për të përshkruar pothuajse çdo lloj dokumenti;
  • Është një tekst i thjeshtë, pa licencim dhe asnjë kufizim;
  • Platforma e pavarur;
  • Është një nëngrup i SGML për të cilin është grumbulluar shumë përvojë dhe janë krijuar aplikacione të specializuara;

I famshëm disavantazhet gjuhët përfshijnë sa vijon:

  • Sintaksa XML është e tepërt.
    • Madhësia e dokumentit XML është dukshëm më e madhe se paraqitja binar e të njëjtave të dhëna (rreth 10 herë).
    • Madhësia e një dokumenti XML është dukshëm më e madhe se një dokument në formate alternative të transferimit të të dhënave të tekstit (për shembull JSON, YAML) dhe veçanërisht në formatet e të dhënave që janë optimizuar për një rast përdorimi specifik.
    • Teprica e XML mund të ndikojë në performancën e aplikacionit tuaj. Kostoja e ruajtjes, përpunimit dhe transferimit të të dhënave po rritet.
    • Një numër i madh detyrash nuk kanë nevojë për fuqinë e plotë të sintaksës XML, dhe mund të përdoren zgjidhje shumë më të thjeshta dhe më efikase.
  • Hapësirat e emrave XML janë të vështira për t'u përdorur dhe të vështira për t'u zbatuar në analizuesit XML.
  • XML nuk përmban mbështetje të gjuhës amtare për llojet e të dhënave. Ai nuk përfshin konceptet e "numrave të plotë", "strings", "data", "vlerat boolean", etj.
  • Modeli i të dhënave hierarkike e ofruar nga XML është e kufizuar në krahasim me modelin relacional dhe grafikët e orientuar nga objekti.

Në përgjithësi, XML mund të shihet jo vetëm si një gjuhë e re shënjimi, por edhe si bazë për një familje të tërë teknologjish:

Tabela 9.1. Struktura e familjes XML
XML Udhëzimet teknike XML
DTD Përkufizimi i llojit të dokumentit (skema)
XDR format XML E reduktuar(Skema e Microsoft)
XSD Përkufizimi i skemës XML (Skema W3C)
Hapësira e emrave Metoda për përcaktimin e emrave të elementeve dhe atributeve
XPath Gjuha e rrugës XML
XLink Gjuha e lidhjes XML
XPointer Gjuha XML Pointer
DOM API për modelin e objektit të dokumentit
SAX API e thjeshtë për XML
XSL E zgjerueshme gjuha e fletës së stilit
XSL -FO Formatimi i objekteve XSL
XSLT Gjuha e transformimeve XSL
XPërfshi XML Përfshi sintaksë

Gjuhët e shënjimit: SGML, HTML, XML. Lidhja e tyre me njëri-tjetrin.

HTML fillimisht ishte vetëm një nga aplikacionet SGML. Ai përshkroi rregullat me të cilat duhet të përgatitet informacioni për World Wide Web. Kështu, HTML është një grup recetash SGML, të formuluara si një Përkufizim i Llojit të Dokumentit (DTD), që shpjegojnë saktësisht se çfarë nënkuptojnë etiketat dhe elementët. DTD për HTML ruhet në shfletuesin e internetit.

Kështu, nga njëra anë, HTML është një mjet shumë i përshtatshëm për shënimin e dokumenteve për përdorim në ueb, dhe nga ana tjetër, një dokument i shënuar në HTML ka pak informacion për përmbajtjen e tij. Nëse ky ose ai dokument mbart informacion mjaft të plotë për përmbajtjen e tij, bëhet e mundur që relativisht lehtë të kryhet përpunimi dhe kërkimi automatik i përgjithësuar në skedarin që ruan dokumentin. SGML mund të ruajë informacione rreth përmbajtjes së një dokumenti, por për shkak të kompleksitetit të tij, ai kurrë nuk është përdorur aq gjerësisht sa HTML.

Një grup ekspertësh të SGML, të udhëhequr nga Jon Bosak i Sun Microsystems, kanë filluar punën për të krijuar një nëngrup të SGML që mund të pranohet nga komuniteti i Uebit. U vendos që të hiqen shumë veçori jo thelbësore SGML. Gjuha e rindërtuar në këtë mënyrë u quajt XML. Versioni i thjeshtuar ishte dukshëm më i përballueshëm se origjinali, me vetëm 26 faqe specifikime krahasuar me mbi 500 faqe të specifikimeve SGML.

Përparësitë e XML.

  • Mbështet Unicode.
  • Platforma e pavarur;

Shërbimet e internetit

Shërbimi në internet(shërbim ueb) - një sistem softuerësh që ka një URI dhe ndërfaqet publike të të cilit janë të përcaktuara në XML. Përshkrimi i këtij sistemi softuerik mund të gjendet nga aplikacione të tjera që mund të ndërveprojnë me të në përputhje me këtë përshkrim përmes mesazheve të bazuara në XML dhe të transmetuara duke përdorur protokollet e Internetit. Shërbimi në internet është njësia e modularitetit kur përdoret Arkitektura e orientuar drejt shërbimit aplikacionet.

Arkitektura e orientuar drejt shërbimit(SOA, arkitekturë e orientuar nga shërbimi) është një qasje modulare për zhvillimin e softuerit bazuar në përdorimin e shërbimeve me ndërfaqe të standardizuara.

SOA bazohet në parimet e ripërdorimit të elementeve funksionale të IT, unifikimin e proceseve tipike operacionale. Komponentët e programit mund të shpërndahen nëpër nyje të ndryshme të rrjetit dhe ofrohen si shërbime aplikacioni të pavarura dhe të lidhura lirshëm, të zëvendësueshëm.

Ndërfaqja e komponentëve të programit SOA përmbledh detajet e zbatimit të një komponenti specifik (OS, gjuha e programimit, etj.).

Shërbimet Ueb .NET kanë përfitimet e mëposhtme:

  • Hapja e standardeve... Nuk ka elementë të fshehur ose të paarritshëm në shërbimet e internetit. Çdo aspekt i teknologjisë, nga mënyra se si kërkoni për shërbimet e uebit deri tek mënyra se si i përshkruani dhe si komunikoni me të, përcaktohet nga standardet e disponueshme publikisht.
  • Ndër-platformë... Një gjuhë programimi që ju lejon të krijoni dokumente XML dhe të dërgoni informacione përmes HTTP ju lejon të ndërveproni me çdo shërbim ueb. Është e mundur të merrni një shërbim ueb nga një sistem tjetër përveç .NET.
  • Thjeshtësia.
  • Mbështetje për mesazhe në gjuhë të lexueshme nga njeriu... Kalimi nga standardet binare të përdorura nga COM dhe CORBA në tekstin XML e bëri më të lehtë rregullimin e gabimeve dhe bëri të mundur ndërveprimin me shërbimet e uebit përmes kanaleve të rregullta HTTP.

Zbatimi i shërbimeve të uebit .NET është po aq i thjeshtë sa thirrja e një shërbimi ueb në distancë ose thirrja e një metode në një klasë lokale. Ai e bën këtë duke përdorur mjetet e ofruara nga .NET Framework për të krijuar një shërbim të plotë ueb pa pasur nevojë të mësojë detajet se si funksionojnë standardet si SOAP, WSDL dhe UDDI. Në këtë rast, kryhen veprimet e mëposhtme:

  1. Një shërbim ueb është projektuar si një klasë .NET me atribute që e identifikojnë atë si një shërbim ueb me disa funksionalitete.
  2. Mjedisi .NET gjeneron automatikisht një dokument WSDL që përshkruan se si klienti duhet të ndërveprojë me shërbimin në internet.
  3. Konsumatori gjen shërbimin e krijuar në internet dhe mund të shtojë referencën përkatëse të internetit në projektin Visual Studio .NET.
  4. Mjedisi .NET vërteton automatikisht dokumentin WSDL dhe gjeneron një klasë proxy që lejon konsumatorin të ndërveprojë me shërbimin në internet.
  5. Konsumatori thërret një nga metodat e klasës suaj të shërbimit në internet. Nga këndvështrimi i tij, kjo thirrje nga pamja e jashtme nuk ndryshon nga thirrja e një metode të çdo klase tjetër, megjithëse ndërveprimi në të vërtetë ndodh me klasën proxy, dhe jo me shërbimin në internet.
  6. Klasa proxy konverton parametrat e kaluar në një mesazh SOAP dhe e dërgon atë në shërbimin e uebit.
  7. Më pas, klasa proxy merr përgjigjen SOAP, e konverton atë në llojin e duhur të të dhënave dhe e kthen atë si një tip të rregullt të dhënash .NET.
  8. Konsumatori përdor të dhënat e marra.

Shërbimet e uebit .NET përdorin teknologjinë ASP .NET, e cila është pjesë e .NET Framework. Ai gjithashtu kërkon mbështetje nga serveri Microsoft IIS.

Disavantazhet kryesore të ueb shërbimeve janë performanca më e ulët dhe një madhësi më e madhe e trafikut të rrjetit në krahasim me teknologjitë si RMI, CORBA, DCOM për shkak të përdorimit të mesazheve me tekst XML.

Standardet për Shërbimet e Uebit.

Specifikimi WSDL

Çdo shërbim ueb ofron një dokument të gjuhës së përshkrimit të shërbimit në ueb (WSDL) që përshkruan gjithçka që i nevojitet një klienti për të punuar me atë shërbim. Një dokument WSDL ofron një mënyrë të thjeshtë dhe të qëndrueshme për një zhvillues për të specifikuar sintaksën për thirrjen e çdo metode ueb. Për më tepër, ky dokument ju lejon të përdorni mjete automatike të gjenerimit të klasës proxy si ato të përfshira në Visual Studio .NET dhe .NET Framework. Me këto mjete, përdorimi i një shërbimi ueb është po aq i lehtë sa përdorimi i një klase lokale.

Dokumenti WSDL është në një format të bazuar në XML, sipas të cilit informacioni ndahet në pesë grupe. Tre grupet e para janë përkufizime abstrakte që janë të pavarura nga platforma, rrjeti ose gjuha, ndërsa dy grupet e mbetura përfshijnë përshkrime konkrete.

Protokolli SOAP

Komunikimi ndërmjet ueb shërbimeve dhe klientëve të tyre bëhet përmes mesazheve në formatin XML.

SOAP (Simple Object Access Protocol) është një protokoll mesazhesh për zgjedhjen e shërbimeve në internet.

Ideja themelore e standardit SOAP është që mesazhet duhet të kodohen në një format të standardizuar XML.

Përveç mesazheve SOAP, mund të përdorni metodat HTTP GET dhe POST për të komunikuar me shërbimet .NET.

Përparësitë e përdorimit të formatit SOAP ndaj formateve të tjera për transferimin e të dhënave:

  • Është po aq e lehtë për të koduar strukturat e të dhënave dhe grupet e të dhënave me XML duke përdorur SOAP sa të dhëna të thjeshta skalare.
  • Kur përdorni mesazhe SOAP, ofrohen mjete shtesë për ta bërë të lehtë shtimin, për shembull, funksionalitetin e sigurisë ose të gjurmimit.
  • Paketat e veglave SOAP janë të disponueshme për gjuhë të ndryshme programimi (dhe madje edhe versionet e mëparshme të Microsoft C ++ dhe Visual Basic). Përndryshe, për të siguruar komunikim me shërbimin përmes metodave GET dhe POST të protokollit HTTP, padyshim që do të duhet të ndërtoni në mënyrë të pavarur vargun e pyetjes dhe më pas të analizoni përgjigjen.

Standardi DISCO

Standardi DISCO ofron mënyrën më të thjeshtë për të hyrë në skedarët e manifestit duke grupuar lidhjet në shërbimet e uebit.

Skedari DISCO mund të përfshijë skedarë nga serverë të ndryshëm ueb dhe mbështet "kërkimin dinamik" - kërkimin automatik për një drejtori të skedarëve të shërbimeve të uebit në një server.

Skedarët e Manifestit janë të dobishëm sepse ato bashkojnë shumë shërbime ueb në një listë të vetme, por ato i pengojnë klientët të gjejnë një lloj specifik shërbimi në internet pa specifikuar emrin e kompanisë së zhvilluesit.

Specifikimi UDDI

Specifikimi UDDI (Përshkrimi, Zbulimi dhe Integrimi universal) i shmang këto probleme duke përdorur një depo (depo) të veçantë ku ndërmarrjet dhe organizatat mund të vendosin të dhëna për shërbimet që ofrojnë. Më shumë se 100 kompani (një listë e plotë mund të gjendet në http://www.uddi.org/community.html), duke përfshirë Sun dhe Microsoft, kanë qenë pioniere në krijimin e teknologjisë UDDI. Së bashku, këto kompani zhvilluan një draft specifikim UDDI që u standardizua pas 18 muajsh.

Informacioni në këtë depo duhet të përditësohet manualisht. Për këtë qëllim, disa "deklarata nodale" mbajnë kopje identike të depove UDDI. Këto kompani ofrojnë ruajtje të depove të specifikuara dhe qasje falas në të për të popullarizuar seritë e internetit. Përveç kësaj, Microsoft ka përfshirë një version të UDDI në softuerin e serverit Windows .NET për përdorim në intranetet e korporatave.

Depoja e UDDI përmban informacione për ndërmarrjet që ofrojnë shërbime në internet, llojin e secilit shërbim dhe lidhje me informacionin dhe specifikimet që lidhen me ato shërbime. Vetë UDDI është një shërbim në internet. Për t'u regjistruar ose për të gjetur një shërbim, dërgoni një mesazh SOAP.

WEB - integrim.

Sfida e integrimit në ueb është të bashkojë aplikacionet dhe sistemet e ndryshme të internetit në një mjedis të vetëm të bazuar në ueb.

Praktikohen qasjet e mëposhtme për integrimin në ueb:

· Integrimi në nivel prezantimi. Ky nivel lejon përdoruesin të ndërveprojë me aplikacionin. Integrimi në nivel prezantimi jep qasje në ndërfaqen e përdoruesit të aplikacioneve në distancë.

· Integrimi në nivelin e funksionalitetit. Ky integrim nënkupton ofrimin e aksesit të drejtpërdrejtë në logjikën e biznesit të aplikacioneve. Kjo arrihet nga ndërveprimi i drejtpërdrejtë i aplikacioneve me API(ndërfaqja e programimit të aplikacionit) ose ndërveprimi përmes shërbimet në internet.

· Integrimi në nivelin e të dhënave. Në këtë rast, qasja në një ose më shumë bazat e të dhënave përdoret nga aplikacioni në distancë.

· Integrim kompleks. Zgjidhjet komerciale të integrimit në ueb zakonisht përfshijnë të tre llojet e integrimeve

Përdorimi i integrimit në ueb është i dobishëm për shumë arsye:

· Integrimi në ueb ju lejon të vendosni sisteme informacioni të bazuara në aplikacione të palëve të treta pa pasur nevojë të kuptoni sistemet e tyre mëmë, mjediset softuerike dhe arkitekturat e bazës së të dhënave.

· SOA dhe shërbimet në internet përdorni një gjuhë programimi dhe ndërfaqe të pavarura nga platforma midis aplikacioneve të infrastrukturës së IT të korporatës. Kjo jep përparësi të dukshme në mbështetje, menaxhim, vendosje të rrjeteve të informacionit.

· Integrimi në ueb lejon ndërtimin e funksionalitetit kompleks duke kombinuar komponentë të ndryshëm përmes protokolleve të shërbimit të ueb-it.

· Integrimi në ueb ju lejon të përdorni shërbimet e ueb-it të zhvilluesve.

· Integrimi në ueb ju lejon të zhvilloni API përmes protokolleve të shërbimit në ueb pa programim.

Për integrim në ueb, softuer komercial ose teknologji të njohura si p.sh PHP / Python / Perl, XFormat, SAPUNI etj.

Integrimi i bazuar në XML

Në vend që të zbatoni ndërveprimin midis çdo çifti sistemesh, ju vetëm duhet t'i mësoni secilit prej tyre të "flasë" XML. Me fjalë të tjera, gjithçka zbret në zhvillimin e disa mbështjellësve (mbështjellës - një mbështjellës, një mjet softuerësh për krijimin e një mbështjellësi sistemi për standardizimin e thirrjeve të jashtme dhe ndryshimin e orientimit funksional të sistemit operativ), i cili do të përkthehet nga gjuha standarde XML e një sistemi të integruar në një gjuhë që është e kuptueshme për secilin sistem veçmas.

· Mjetet e zhvillimit dhe bibliotekat standarde për XML ekzistojnë pothuajse në të gjitha platformat dhe për gjuhët më të njohura të programimit;

· Metodat e punës me XML janë mjaft standarde në mënyrë që të njëjtat teknika të mund të përdoren në sisteme të ndryshme;

· Informacioni i formatuar në XML mund të përpunohet jo vetëm nga makinat, por edhe nga njerëzit (gjë që lehtëson shumë korrigjimin e gabimeve).

Në thelb, integrimi i skemës XML nuk është thelbësisht i ndryshëm nga çdo integrim tjetër standard i zakonshëm. Në të njëjtën kohë, ajo ka një numër avantazhesh domethënëse:

· Gjuhët XML nuk varen nga platformat harduerike dhe softuerike, gjë që ju lejon të lidhni sisteme heterogjene;

· Fuqia shprehëse e XML është mjaft e madhe për të përshkruar të dhëna të pothuajse çdo kompleksiteti;

Integrimi i bazuar në XML zbatohet praktikisht brenda protokolleve të mëposhtme:

· XML-RPC... Është një protokoll RPC që transferon të dhëna në formatin XML mbi portin TCP 80, d.m.th. Porta HTTP.

· WDDX(Shkëmbimi i shpërndarë në ueb). Është një mekanizëm për shkëmbimin e strukturave komplekse të të dhënave duke përdorur protokollin HTTP. Protokolli nuk bazohet në struktura, por në ngjarje.

· ebXML(XML e biznesit elektronik) - XML ​​për e-biznes. Qëllimi i tij kryesor është të sigurojë një infrastrukturë të hapur XML që mundëson përdorimin e sigurt global të informacionit të e-biznesit. Shërbimet e internetit (web shërbimet).

XML (eXtensibleMarkupLanguage) është gjuha e shënjimit e rekomanduar nga W3C. XML është një format teksti për ruajtjen e të dhënave të strukturuara, për shkëmbimin e informacionit midis programeve, si dhe për krijimin e gjuhëve të specializuara të shënjimit në bazë të tij. XML është një nëngrup i thjeshtuar i SGML .

Gjuha XML ka sa vijon dinjitet:

  • Është një format dokumenti me në qendër njeriun që mund të kuptohet si nga njerëzit ashtu edhe nga kompjuterët.
  • Mbështet Unicode.
  • Strukturat bazë të të dhënave si regjistrimet, listat dhe pemët mund të përshkruhen në formatin XML.
  • Është një format vetë-dokumentues që përshkruan strukturën dhe emrat e fushave, si dhe vlerat e fushave.
  • Ka një sintaksë të mirëpërcaktuar dhe kërkesat e analizës, e cila e lejon atë të mbetet e thjeshtë, efikase dhe konsistente.
  • Përdoret gjerësisht për ruajtjen dhe përpunimin e dokumenteve;
  • Është një format i bazuar në standardet ndërkombëtare;
  • Struktura hierarkike e XML është e përshtatshme për të përshkruar pothuajse çdo lloj dokumenti;
  • Është një tekst i thjeshtë, pa licencim dhe asnjë kufizim;
  • Platforma e pavarur;
  • Është një nëngrup i SGML për të cilin është grumbulluar shumë përvojë dhe janë krijuar aplikacione të specializuara;

I famshëm disavantazhet gjuhët përfshijnë sa vijon:

· Sintaksa XML është e tepërt.

· Madhësia e dokumentit XML është dukshëm më e madhe se paraqitja binar e të njëjtave të dhëna.

· Madhësia e një dokumenti XML është dukshëm më e madhe se një dokument në formate alternative të transferimit të të dhënave tekstuale (p.sh. JSON, YAML) dhe veçanërisht në formatet e të dhënave të optimizuara për një rast përdorimi specifik.

· Teprica e XML mund të ndikojë në performancën e aplikacionit. Kostoja e ruajtjes, përpunimit dhe transferimit të të dhënave po rritet.

· Një numër i madh detyrash nuk kanë nevojë për fuqinë e plotë të sintaksës XML dhe mund të përdoren zgjidhje shumë më të thjeshta dhe më efikase.

  • Hapësirat e emrave XML janë të vështira për t'u përdorur dhe të vështira për t'u zbatuar në analizuesit XML.
  • XML nuk përmban mbështetje të gjuhës amtare për llojet e të dhënave. Nuk ka koncept të "numrave të plotë", "strings", "data", "booleans", etj.
  • Modeli i të dhënave hierarkike i ofruar nga XML është i kufizuar në krahasim me modelin relacional dhe grafikët e orientuar nga objekti.

Në thelb, XML shërben metagjuhë për të përshkruar strukturën e gjuhëve të tjera. Marrëdhënia midis SGML, XML, HTML dhe disa gjuhëve të tjera është paraqitur në diagramin e mëposhtëm:

Një ndryshim i rëndësishëm midis XML dhe HTML është se ai vendos shumë theks në kontrollin se sa mirë ndiqen rregullat e gjuhës gjatë shënimit të dokumenteve. Në varësi të kësaj, është zakon të ndahet i formuar mirë dhe e vlefshme dokumente XML .

Dokumenti XML konsiderohet i formuar mirë nëse përputhet me të gjitha rregullat e sintaksës XML.

Ekzaminimi realitet dokument merr veprimet e mëposhtme:

  • Verifikon që përdoret vetëm një grup i caktuar përshkruesish.
  • Kontrollimi i përputhshmërisë së plotë të renditjes së elementeve dhe atributeve me përmbajtjen e dokumentit ose rregulla të caktuara.
  • Kontrolli i tipit të të dhënave (arritet duke përdorur skemën e duhur).
  • Kontrolli i integritetit të të dhënave për të siguruar shkëmbim optimal të informacionit në ueb duke përdorur transaksione.

Rregullat bazë të sintaksës ndërtimi i dokumenteve XML.

  • Dokumenti XML përmban një dhe vetëm një element rrënjë që përmban të gjithë elementët e tjerë
  • Elementet fëmijë të përfshira në element rrënjë duhet të vendosen siç duhet.
  • Emrat elementet u binden rregullave:
  • Emri fillon me një shkronjë, nënvizim ose dy pika.
  • Karakteri i parë në emër mund të ndiqet nga shkronja, numra, viza, nënvizime, pika ose dy pika.
  • Emrat nuk mund të fillojnë me XML.

Dokumenti XML ka strukturën e mëposhtme:

  • Rreshti i parë i dokumentit XML quhet shpallje XML. Ky është një varg opsional që tregon versionin e standardit XML (zakonisht 1.0). Këtu mund të specifikohen edhe kodimi i karaktereve dhe varësitë e jashtme.

Artikujt kryesorë të lidhur