Kako postaviti pametne telefone i računala. Informativni portal
  • Dom
  • vijesti
  • Prošireni jezici za označavanje podataka SGML, XML. Pogledajte što je "XML" u drugim rječnicima Html je standardna sgml aplikacija

Prošireni jezici za označavanje podataka SGML, XML. Pogledajte što je "XML" u drugim rječnicima Html je standardna sgml aplikacija

Priča

Pogledajmo primjer jednostavnog kulinarskog recepta s oznakom XML:

> Jednostavan kruh > > Brašno > Kvasac > Topla voda > Sol > > > > Pomiješajte sve sastojke i dobro izmiješajte. > > Pokrijte krpom i ostavite jedan sat u toploj prostoriji. > > Ponovno premijesite, stavite na lim za pečenje i stavite peći. > > >

XML deklaracija

Poziva se prvi redak XML dokumenta XML deklaracija(engl. XML deklaracija) je niz koji označava XML verziju. U verziji 1.0 XML deklaracija može se izostaviti, potrebno je u verziji 1.1. Također ovdje možete odrediti kodiranje znakova i prisutnost vanjskih ovisnosti.

Specifikacija zahtijeva da XML procesori podržavaju Unicode kodiranje UTF-8 i UTF-16 (UTF-32 nije obavezan). Ostala kodiranja temeljena na standardu ISO / IEC 8859 prepoznata su kao prihvatljiva, podržana i široko korištena (ali nisu potrebna), druga kodiranja su također prihvatljiva, na primjer, ruski Windows-1251, KOI-8. Često se nelatinska slova u načelu ne koriste u oznakama, u ovom slučaju UTF-8 je vrlo zgodno kodiranje - u pravilu je volumen manji nego kod UTF-16; dekodiranje se može izvesti i za cijeli dokument i za određene atribute i tekstove; cijeli dokument ne sadrži nedopuštene znakove pri pokušaju raščlanjivanja s pogrešnim kodiranjem.

Korijenski element

Najvažniji obvezni sintaktički uvjet je da dokument ima samo jedan korijenski element(engl. korijenski element) (također se ponekad naziva element dokumenta(engl. element dokumenta)). To znači da tekst ili drugi podaci za cijeli dokument moraju biti pozicionirani između jedne početne korijenske oznake i njezine odgovarajuće završne oznake.

Sljedeći najjednostavniji primjer je dobro oblikovan XML dokument:

Sljedeći primjer nije valjani XML dokument jer ima dva korijenski element:

> Entitet broj 1 > > Esencija broj 2 >

Komentar

Element se može postaviti bilo gdje u stablu. komentar... XML komentari se postavljaju unutar posebne oznake počevši od znakova... Dva znaka crtice (-) ne mogu biti prisutna u komentaru.

Oznake unutar komentara ne smiju se obraditi.

Oznake

Ostatak ovog XML dokumenta sastoji se od ugniježđenih elementi od kojih neki imaju atributima i sadržaj. Element obično se sastoji od početnih i završnih oznaka koje uokviruju tekst i druge elemente. Oznaka za otvaranje sastoji se od ime proizvoda u kutnim zagradama, na primjer , a krajnja oznaka sastoji se od istog naziva u kutnim zagradama, ali se ispred naziva dodaje kosa crta, na primjer,... Nazivi elemenata, kao i nazivi atributa, ne mogu sadržavati praznine, ali može biti na bilo kojem jeziku podržanom kodiranjem XML dokumenta. Ime može početi slovom, podvlakom, dvotočkom. Ostali znakovi imena mogu biti isti znakovi, kao i brojevi, crtica, točka.

XML ima nekoliko unaprijed definiranih entiteta kao što je lt (na njega se možete pozvati pisanjem<) для левой угловой скобки и amp (ссылка - &) для амперсанда. Возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков.

U nastavku je primjer korištenja unaprijed definiranog entiteta kako bi se izbjeglo korištenje znaka ampersand u nazivu:

> AT&T >

Potpuni popis unaprijed definiranih entiteta sastoji se od & (&),< (<), >(>), "(") i "(") - posljednja dva su korisna za pisanje graničnika unutar vrijednosti atributa. Svoje entitete možete definirati u DTD dokumentu.

Ponekad je potrebno definirati razmak bez prekida, koji se vrlo često koristi u HTML-u i označava se kao. U XML-u nema takvog unaprijed definiranog entiteta, napisano je, a njegovo korištenje uzrokuje pogrešku. Nedostatak ove vrlo uobičajene suštine za mnoge programere često je iznenađujući i to stvara određene poteškoće pri migraciji njihovih HTML-programa na XML.

Referenca prema broju simbola(engl. referenca brojčanog znaka) izgleda kao referenca na entitet, ali umjesto naziva entiteta naveden je simbol # i broj (u decimalnom ili heksadecimalnom zapisu), koji je broj znaka u Unicode tablici kodova. To su obično znakovi koji se ne mogu izravno kodirati, kao što je arapsko slovo u ASCII kodiranom dokumentu. Ampersand se može predstaviti na sljedeći način:

> AT&T >

Postoje i druga pravila o tome kako napisati dobro oblikovan XML dokument.

Prednosti i nedostatci

Dostojanstvo

Nedostaci

  • Dvosmislenost modeliranja.
  • XML ne sadrži podršku izvornog jezika za tipove podataka. Nema jakog tipkanja, odnosno pojmova "cijeli brojevi", "nizovi", "datumi", "booleovi" itd.
  • Hijerarhijski model podataka koji nudi XML ograničen je u usporedbi s relacijskim modelom i objektno orijentiranim grafovima i modelom mrežnih podataka.

Mapiranje XML-a na World Wide Webu

Postoje tri najčešća načina pretvaranja XML dokumenta u korisnički vidljivi prikaz:

  1. Primjena CSS stilova;
  2. XSL aplikacija;
  3. Pisanje procesora XML dokumenata u programskom jeziku.

Da biste definirali XSL transformaciju (XSLT) na strani klijenta, potreban vam je sljedeći izraz u XML-u:

XML rječnici

Budući da je XML prilično apstraktan jezik, razvijeni su XML vokabulari.

Rječnik omogućuje programerima da se dogovore oko konačnog skupa naziva oznaka i atributa za te oznake. Jedan od najranijih rječnika je XHTML, koji razumije većina preglednika. XHTML se često koristi za pohranu i uređivanje sadržaja u CMS-u.

Stvoreni su više specijaliziranih rječnika, kao što je SOAP komunikacijski protokol, koji nije usmjeren na čovjeka i koji je prilično težak za čitanje. Postoje komercijalni rječnici kao što su CommerceML, xCBL i cXML koji se koriste za prenošenje podataka za trgovinske aktivnosti, ti rječnici uključuju opise sustava naručivanja, dobavljača, proizvoda i još mnogo toga.

Obično, kada opisuje dokument, osoba dođe do nekakvog rječnika za sebe, koji se zatim opisuje pomoću DTD, XSD ili jednostavno objašnjava "na prste" zainteresiranima.

Jedan od široko rasprostranjenih rječnika je FB2 - rječnik koji opisuje format knjige, sa svim vrstama fusnota, citata, čak i slika.

XML verzije

  • XML 1.0
  • XML 1.1

vidi također

Bilješke (uredi)

Književnost

  • David Hunter, Jeff Rafter, Joe Fausett, Eric van der Vlist, et al. XML. Rad s XML-om, 4. izdanje = Početak XML-a, 4. izdanje. - M .: "Dijalektika", 2009. - 1344 str. - ISBN 978-5-8459-1533-7
  • David Hunter, Jeff Rafter i sur. XML. Osnovni tečaj = Početak XML-a. - M .: Williams, 2009. - 1344 str. - ISBN 978-5-8459-1533-7
  • Robert Tabor. Implementacija XML web usluga na Microsoft .NET platformi = Microsoft .NET XML web usluge. - M .: Williams, 2002. - 464 str. - ISBN 0-672-32088-6

Linkovi

  • XML na web stranici World Wide Web Consortium (W3C).
  • Službena specifikacija XML 1.0
  • XML 1.1 Službena specifikacija
  • XML dokumentacija na IBM stranicama, članci, forumi

vptyu fPVPFTBU

SGML: DA LI YUEN LFP EDSF?

UEZPDOS CHUE YUBEE NPTSOP CHUFTEFYFSH BVVTECHEYBFKHTH SGML. NOPZYE CHYDSCH DPLHNEOFBGY RPUFBCHMSAFUS CH ZHPTNBFE SGML. rPRHMSTOSCHK SSCHL TBNEFLY Web-UVTBOYG HTML SCHMSEFUS RTYMPTSEOYEN SGML. rPSChMSEFUS Chueh VPMSHYE RTYLMBDOSCHI RTPZTBNN LCA TBVPFSCH u SGML: TEDBLFPTSCH, UTEDUFCHB ZHPTNBFYTPCHBOYS, UYUFENSCH DPLHNEOFPPVPTPFB, YURPMSHHAEYE SGML B LBYUEUFCHE ZHPTNBFB ITBOEOYS DPLHNEOFPCH ... SGML-RTPDHLFSCH CHSCHRHULBAF Adobe, Corel, SoftQuad Microsoft. h SGML ZPFPCHSFUS Lojze YDBFEMSHUFCHB O "Reilly, FEIOYYUEULBS DPLHNEOFBGYS IBM, Sun Q OSF. pUOPChSchChBEFUS OF SGML YOZHPTNBGYPOOBS FEIOPMPZYS NOPZYIYUEULBS DPLHNEOFBGYS IBM, Sun Q OSF.

rPSCHYCHYBSUS CH OBYUBME CHPUSHNYDEUSFCHI SGML-FEIOPMPZYS RETETSYCHBEF UEKYUBU RETYPD TBUGCHEFB. SFP LFP FBLPE? SFP POB DBEF UCHPYN RPMSh'PCHBFEMSN? LBL Da li OEK TBVPFBFSH? OB FY J DTHZYE CHPTRPUSCH S RSCHFBAUSH PFCHEFYFSH ʹ̱FPK UFBFSHEK.

UPDETZBOYE





















LBL S OBVTEM O SGML-FEIOPMPZYA

CHUE OBYUBMPUSH NA YOFTBOEFB. ʹFP NPDOPE UMCHP P'OBYUBMP DMS NEOS O RTBLFile FP, UFP DPLKHNEOFSH, LPFPTSCHE S TEZKHMSTOP RYUBM RP TPDKH UCHPEK DESFEMSHOPUFY, UFBMPKH NPTSOPU "DEFEMSHOPUFY" DP UYI RPT S RTPUFP OBVYTBM DPLKHNEOFSCH CH T E X-e Y REUBFBM YI O VKHNBZ. iDES DHVMYTPCHBFSH YI CH HTML CHTKHYUOHA PFRBMB UTBKH: OENEDMEOOP CHUOILMB VSCh RTPVMENB UYOITPOYIBGY VHNBTSOPK Y MELFTOPOOK CHETUEFYK FPOZL.

b CHULPTE RPFTEVPCHBMPUSH RETYPDYUEULBS RETEDBYUB DPLHNEOFPCH RPUFPTPOOIN MADS CH LMELFTPOOPK ZHPTNE, UFP, RP UMPTSYCHYEKUS X OBU RTBFBLFYULEE TBVPFBFSH U MS Word X NEOS RP TSDH RTYUYO OE VSCHMP OYLBLPZP TSEMBOYS, L FPNKH TSE FP FPMSHLP HUHZHVYMP VSCH RTPVMENKH UYOITPOYIBGY CHET.

OBYuYF, OHTSOP VSCHMP RTYDHNBFSH URPUPV BCHFPNBFYYUEULPZP RTEPVTBPCHBOYS OBVYTBENSCHI DPLHNEOFPCH B TBMYYUOSCHE ZHPTNBFSCH: T E X-a - LCA REYUBBFY, LCA REYUBBFZE, LCA REYUBBFZE, LCA REYUBBFZE, LCA REYUBBAY ON, WHNUBBZE ON, WHNUBBAY ON, WHNUBBAY ON, WHNUBBAY ON, WHNUBBAY ON, WHNUBBAYS ON VHNUBCA. lTPNE FPZP, NOE IPFEMPUSH, YuFPVSch FBLPE UTEDUFCHP PFCHYUBMP EEE TSDH FTEVPCHBOYK:

  • VSCHFSH NPDKHMSHOSCHN, YUFPVSCH NPTSOP VSCHMP RTY OEPVIPDYNPUFY MEZLP DPVBCHMSFSH OPCHSCHE CHSCHIPDOSH ZHPTNBFSH YMY YNNEOSFSH BMZPTYFNSCH RTEPVTBCHPCHBOYE;
  • VSCHFSH PFLTSCHFSCHN, VEURMBFOSCHN, LBL NPTSOP NEOSHIE RTYCHSBOOSCHN L LPOLTEFOSCHN RTPZTBNNBN;
  • VSHFSH NPVYMSHOSCHN: TBVPFBFSH, LBL NYOYNKHN, O TBOBOSHI UNIX-RMBFZHPTNBI;
  • VSCHFSH MEZLP THUYZHYGYTKHENSCHN.

RETCHSCHN, UFP RPRBMPUSH NOE RPD THLH RPUME RPIPDB O Altavisti, PLBBMUS RBLEF RPD OBCHBOYEN linuxdoc-sgml. PO LBL TBJ RTEDOBOOBYUBMUS DMS ZEOETBGY HTML, T E X Y RTF Yj PDOPZP CHIPDOPZP ZhBKMB. yYTPLP YURPMSHHENSCHK CH TBNLBI Linux dokumentacijski projekt, ON YURPMSh'PCHBM CH LBYUEUFCHE CHIPDOPZP ZhPTNBFB OEFOBLPNSCHK NOE DP UYI RPT SUSHL SGML. CHRTPYUEN, OYUEZP UMPTSOPZP CH OEN OE PLBBMPUSH - PO CHEUSHNB OBRPNYOBM JOBLPNSCHK NOE HTML TH CHCHZMSDEM CHRPMOE RPOSFOP. chPF, L RTYNETH, LHUPYEL SGML-DPLHNEOFB:

Struktura TEI teksta

Svi TEI-sukladni tekstovi sadrže a TEI zaglavlje(označeno kao a teiHeader element) i transkripciju samog teksta (označeno kao a tekst element).

dMS FPZP, UFPVSH OBYUBFSH OB FFPN RYUBFSH, RPFTEVPCHBMPUSH CHUEZP MYISH ABRPNOYFSH OEULPMSHLP PUOPCHOSHI LMENEOFPCH TBNEFLY, OBRTINET

POBUBEF OBYUBMP RBTBZTBZHB, - OBYUBMP RETEUUMEOIS J FR.

OBVTBOOSCHK CH SGML FELUF DBMEE ABRKHULPN PDOPZP ZHYMSHFTB RTEPVTBJHEFUS CH HTML, DTHZPZP - CH T E X, FTEFSHESP - CH RTF, J FBL DBMEE.

SFP FBLPE SGML J JUEN NA IPTPI

FETNYOPMPIS

GML ( Generalizirani jezik za označavanje) TBTVBVPFBO CH OEDTBI CHEDEUHEEK LPTRPTBGY IBM. EZP OBUMEDOIL SGML ( Standardni generalizirani označni jezik) RTIOSF CH 1986 ZPDKH CH LBYUEUFCHE NETSDHOBTPDOPZP UFBODBTFB DMS PRTEDEMOYS OEBCHYUYNSHI PF KHUFTKUFCH CHCHPDB / CHCHCHPDB, OEBCHYUYUYCHYUPDUF CHHPDUPK WPMEE FPUOP, SGML - LFP NEFBSUCCL , FP EUFSH UTEDUFCHP ZhPTNBMSHOPZP PRYUBOYS SZSCHLB, CH DBOOPN UMHYUBE, SSSHLB TBNEFLY .

yUFPTYUEEULY UHMCP TBNEFLB YURPMSHPCHBMPUSH LCA PRYUBOYK BOOPFBGYK YMY DTHZYI PVPOBYUEOYK CHOHFTY FELUFB, RTEDOBOBYUEOOSCHI LCA HLBBOYK UPUFBCHYFEMA YMY "CHETUFBMSHEYLH" YMY "CHETUFBMSHEYLH" YFFBMSHEYLH" YFPFBMHEYLH" YFPFPOBYOYK UFFBOPM NEFZOPB LFFBOPM BFPZPUB, LFA rTYNETSCH CHLMAYUBAF RPDYUETLYCHBOYE CHPMOYUFPK YUETFPK, PVP'OBYUBAEE LKHTUYCH, UREGIBMSHOSCHE YOBULY DMS RTPRKHULB ZhTB YMY YI REYUBFY LPOLEYMEBEFSCHN. lPZDB ZhPTNBFYTPCHBOYE Y REYUBFSH FELUFPCH UVBMY BCHFPNBFYYTPCHBOOSCHNY, FFPF FETNYO UVBM PICHBFSCHBFSH CHUE CHYDSCH UREGEYBMSHOSCHI LAPDHR TBNEFLY , CHUFBCHMSENSHI CH MELFTPOSCHE FELUFSH DMS HRTBCHMEOYS ZHPTNBFYTPCHBOYEN, REYUBFSHA YMY DTHZPK PVTBVPFLPK.

pVPVEBS, TBNEFLKH, YMY LPDYTPCHLH , PRTEDEMSAF LBL MAVPE UTEDUFCHP UDEMBFSH SCHOSCHN YOFETRTEFBGYA FELUFFB. Na VBOBMSHOPN HTPCHOE Chueh OBREYUBFBOOSCHE FELUFSCH LPDYTPCHBOSCH B FPN UNSCHUME: OBLY RTERYOBOYS, YURPMSHPCHBOYE BZMBCHOSCHI VHLCH, TBURPMPTSEOYE VHLCH RP UFTBOYGE, DBTSE YOFETCHBMSCH NETSDH UMPCHBNY NPTSOP UYUYFBFSH LBLPK H-FP UFEREOY TBNEFLPK, ZHHOLGYS LPFPTPK - RPNPYUSH YUEMPCHELH, YUYFBAEENH FELUF, PRTEDEMYFSH, ZDE LPOYUBEFUS PODOP UMPCHP Y OBYUYOBEFUS DTHZPE, YMY LBL IDDEOFYZHYGYTPCHBFSH PUPVEOPUFY UVTHLFKHTSCH, FBLYE LBL ABZPMPCHLY, YMY RTPUFFCHE UYOFBLUEGYUPYUPYUPDUFFCHE UYOFBLUEY lPDYTPChBOYE FELUFB LPNRSHAFETOPK PVTBVPFLY VMI, W RTYOGYRE, LBL TBUYYZHTPCHLB NBOHULTYRFB imaju RETZBNEOFB - RTPGEUU DEMBOYS SCHOSCHN OESCHOPZP YMY RPDTBHNECHBENPZP, RTPGEUU HLBBOYS RPMSHPCHBFEMA FPZP, LBL DPMTSOP YOFETRTEFYTPCHBFSHUS UPDETTSYNPE FELUFB.

rAP SSSHLPN TBNEFLY RPOINBAF OBVPT UPZMBIEOIK P TBNEFLE, RTEINEOSENSHI DMS LPDYTPCHBOYS FELUFPCH. ssshl TBNEFLY DPMTSEO UREGYZHYGYTPCBFSH, LBLBS TBNEFLB DPRKHUFYNB, LBLBS TBNEFLB PVSBFEMSHOB, LBL PFMYUYUIFSh TBFNEFUFFLB YFMYUYUIFSh TBFNEFLUFLB SGML RTEDPUFBCHMSEF TEEEOIS DMS RETCCHHI FTEI ʺ̱BDBYU, PFDEMSHOBS DPLKHNEOFBGYS PVSCHYUOP OEPVIPDYNB DMS RPUMEDOEK.

PUPVEOOPUFFY SGML

fty IBTBLFETYUFILY SGML PFMYUBAF EZP PF RTPYUYI SSCHLPCH TBNEFLY.

PRYUBFEMSHOBS TBNEFLB

UYUFENB U PRYUBFEMSHOPK TBNEFLPK YURPMSHHEF LPDSCH TBNEFLY, LPFPTSCHE RTPUFP RTEDPUFBCHMSAF OBCHBOYS DMS LBFESPTEYBGY YUHUHNEFEK DPL. lPDSCH TBNEFLY, FBLYE LBL YMJ \ kraj (popis), RTPUFP IDDEOFIZHYGYTKHAF RPTGYA DPLHNEOFB J HFCHETTSDBAF, UFP "POB SCHMSEFUS RBTBZTBZHPN", YMJ UFP "LFP - LPOEG OBYUBUMEDOUZ u DTHZPK UFPTPOSCH, UYUFENB imaju RTPGEDHTOPK TBNEFLPK PRTEDEMSEF, LBLBS PVTBVPFLB DPMTSOB CHSCHRPMOSFSHUS B LPOLTEFOPK FPYULE DPLHNEOFB "B FPN NEUFE CHSCHCHBFSH RTPGEDHTH para imaju RBTBNEFTBNY 1, b J x", YMY „RETEDCHYOHFSH MECHHA ZTBOYGH ON 2NN MECHEE, RTBCHHA ZTBOYGH - na 2NN RTBCHEE, RTPRKHUFYFSH PDOH UFTPLKH Y CHUFBFSH O OPCHA MAČEVIMA ZTBOYGKH "Y FR. h SGML YOUFTHLGYY, OEPVIPDYNSCHE LCA PVTBVPFLY DPLHNEOFB Y-LBLPK MYVP LPOLTEFOPK GEMSHA (OBRTYNET, ICH ZHPTNBFYTPCHBOYS) YUEFLP PFDEMSAFUS PF PRYUBFEMSHOPK CHUPBFBUFTEFTY, CHUPBFEMSHOPK. pvshchuop POI UPVTBOSCH CHOE DPLKHNEOFB CH PFDEMSHOSHI RTPGEDKHTBI YMY RTPZTBNNBI.

u PRYUBFEMSHOPK, B, OE RTPGEDHTOPK TBNEFLPK PDYO J FPF CE DPLHNEOF NPTSEF VSCHFSH PVTBVPFBO TBOPPVTBOSCHNY RTPZTBNNBNY, LBTSDBS DV LPFPTSCHI NPTSEF RTYNEOSFSH TBMYYUOSCHE YOUFTHLGYY PVTBVPFLY sušioniku EZP YUBUFSN, pp LPFPTSCHE UYUYFBEF CHBTSOSCHNY. oBRTYNET, RTPZTBNB BOBMYIB UPDETTSYNPZP NPTSEF RPMOPUFSHA YZOPTYTPCHBFSH UOPULY, FPZDB LBL RTPZTBNNB ZhPTNBFYTPBUYS NPTsEBFMSH YBYUCHME TBMYUOSCHE CHYDSCH YOUFTKHLGYK PVTBVPFLY NPZHF BUUPGYTPCHBFSHUS U PDOPK Y FPK TCE YUBUFSHA ZHBKMB. oBRTYNET, PDOB RTPZTBNNB NPTSEF YCHMELBFSH DV DPLHNEOFB ZHBNYMYY MADEK J ZEPZTBZHYYUEULYE OBCHBOYS LCA UPDBOYS YODELUB YMY VBSCH DBOOSCHI, FPZDB LBL DTHZBS, PVTBVBFSCHCHBAEBS FPF CE UBNSCHK FELUF, NPTSEF REYUBFBFSH ZHBNYMYY J OBCHBOYS PFMYYUBAEYNUS YTYZHFPN.

fireshch DPLHNEOFPCH

SGML CHHPDIF RPOSFYE FIRB DPLHNEOFB , Y, UPPFCHEFUFCHOOOP, PRTEDEMEOIS FIRB DPLHNEOFB (definicija vrste dokumenta, DTD). DPLKHNEOFSCH UYUIFBAFUS FYRYJTPCHBOSCHNY, FBL TSE, LBL J DTHZIE PVTBVBFSCHCHBENSCHE LPNRSHAFETBNY PVYAELFSCH. VATRA DPLKHNEOFB ZhPTNBMSHOP PRTEDEMSEFUS EZP UPUFBCHOSCHNY YUBUFSNY YI UVTHLFKHTPK. PRTEDEMEOYE, OBRTYNET, PFYUEFB NPTSEF VSHFSH FBLYN, UFP PO UPUFFPIF Y ʺ̱BZPMPCHLB Y, CHPNPTSOP, BCHFPTB, ʺB LPFPTSCHNY UMEDHEDEF BOPUFFPUGBMEB mAVPK DPLHNEOF PFUHFUFCHYE BZPMPCHLB W, W ima UPPFCHEFUFCHYY Fyn ZHPTNBMSHOSCHN PRTEDEMEOYEN, OE VHDEF ZHPTNBMSHOP SCHMSFSHUS PFYUEFPN, KPD CE SAT LBL VHDEF DH SCHMSFSHUS J RPUMEDPCHBFEMSHOPUFSH BVBGECH, B LPFPTPK UMEDHEF BOOPFBGYS, OECHYTBS NA NA AF OBULPMSHLP RPIPTS PFYUEF FBLPK DPLHNEOF imaju FPYULY TEOYS YUYFBFEMS- UEMPCHELB .

rPULPMShLKh DPLKHNEOFSCH PFOPUSFUS L YCHEUFOSCHN FIRBN, SPTSOP YURPMSHPCHBFSH UREGIBMSHOKH RTPZTBNNKH, OBSCHCHBENKHA BOBMYBFTPPN (parser), LCA FPZP, YUFPVSCH PVTBVPFBFSH DPLHNEOF, HFCHETTSDBAEYK, YUFP PFOPUYFUS U OBLIKU LPOLTEFOPNH FYRH J RTPCHETYFSH, DEKUFCHYFEMSHOP MJ Chueh MENEOFSCH, FTEVHENSCHE LCA DBOOPZP FYRB DPLHNEOFPCH, J RTYUHFUFCHHAF OBIPDSFUS B RTBCHYMSHOPK RPUMEDPCHBFEMSHOPUFY. uFP EEE VPMEE CHBTSOP, TBOBOSCHE DPLKHNEOFSCH PDOPZP FIRB NPZHF PVTBVBFSCHBFSHUS KHOYZHYGYTPCHBOOSCHN PVTBBSPN. NPTSOP RYUBFSH VPMEE YOFEMMELFKHBMSHOSCHE RTPZTBNNSCH, YURPMSHHAEE YOBOIS, ʺBLMAYUEOOSCHE CH YOZHPTNBGYPOOPK UVTHLFKHTE DPLKHNEOFB.

OEBCHYUYNPUFSH DBOOSHI

pUOPChOBS GEMSH RTPELFYTPCHBOYS SGML VSCHMB B UPDBOYY ZBTBOFYK FPZP, YUFP DPLHNEOF, BLPDYTPCHBOOSCHK UPZMBUOP EZP RPMPTSEOYSN, VHDEF RETEOPUYNSCHN imaju PDOPKZDZBZBZTZBZBZBZBZBZBZBNZBZBZBNFZBZBNBZBZBNZBZBZBZBNZBNZMBUOP EZP RPMPTSEOYSN. dChB EZP UCHPKUFCHB, PRYUBOOSHCHYE, PFCHEYUBAF ʹ̱FPNKH FTEVPCHBOYA O BVUFTBLFOPN HTPCHOE; FTEFSHE UCHPKUFCHP - O HTPCHOE UVTPYUEL VBKFPCH (UYNCHPMPCH), LPFPTSCHE UPUFBCHMSAF DPLKHNEOF. SGML RTEDPUFBCHMSEF PVPVEEOOSCHK NEIBOYUN UVTPLPCHPK RPDUFBOPCHLY , FP EUFSH, RTPUFFK NBYYOOP-OEBCHYUYNSCHK URPUPV KHLBBOYS, UFP LPOLTEFOBS UVTPLB UYNCHPMPCH CH DPLKHNEOFE CH NPNEOF PVTBVPFLY DPLKHNEOTSBOF pDOP PYUECHYDOPE RTYNEOOYE FPNKH NEIBOYNH - PVEUREUEEOE EDYOPK FETNYOPMPZYY; DTHZPE J VPMEE OBYUYFEMSHOPE - RTPFYCHPDEKUFCHYE YCHEUFOPK OEURPUPVOPUFY TBOSCHI LPNRSHAFETOSCHI UYUFEN RPOYNBFSH OBVPTSCH UYNCHPMPCH DTHZ DTHZB, OBRTYNET, PDOPK UYUFENE RTEDUFBCHMSFSH Chueh ZTBZHYYUEULYE UYNCHPMSCH, OEPVIPDYNSCHE RTYMPTSEOYA, RHFEN PRYUBFEMSHOPZP PFPVTBTSEOYS OERETEDBCHBENSCHI UYNCHPMPCH. uFTPLY, PRTEDEMENSCHE FJN NEIBOYNPN, OBSCHCHBAFUS UHEOPUFSNY (entiteti).

n RTEINHEEUFCHBI

SFP DBEF YURPMShPCHBOYE SGML CH TABMSHOPK QIYOI? NOVI POP UTBKH DBMP CHP'NPTSOPUFSH RTPYCHPDYFSH DPLKHNEOFSCH CH MAVPN FTEVKHENPN CHYDE. xDPVOP PLBBMBMPUSH Y OBRYUBOYE "CHOPTDPCHCHCHI" VHNBTsEL CH RTICHCHYUOPK UTEDE XEmacs VEH YURPMSHUPCHBOYS Windows. CHUE YURPMSHUPCHBOOSCHE RTPZTBNNSCH - VEURMBFOSCH Y TBURTPUFTBOSAFUS CH YUIPDOSCHI FELUFFBI, UFP RPCHPMYMP HUFBOPCHIFSH YI OB CHUEEI YURPMSHUKHENCHI NOPK UYUYU. rTYUEN PLBBMBMPUSH, UFP OBYUBFSH TBVPFBFSH U SGML CHCHUE OE UMPTSOP, LBTSDSCHK, LFP IPFSH TB TEDBLFAYTPCHBM WWW UVTBOYULH, OE YURHZBEFUFUS CHEYDB.

rPFPN HTSE, RP NETE RPUFEREOPZP YHYUEOYS SGML, S PUBBOBM, UFP ʹ̱FB FEIOILB DBEF ZTPNBDOPE LPMYUEUFCHP CHPNPTSOPUFEK RP UPBCHOOYUPK

rTPDKHLFYCHOPUFSH yuEFLP TBDEMEOSCHE RTPGEUUSCH CHCHPDB YOZHPTNBGYY RHPTNBFYTPCHBOYS RPCHPMSAF BCHFPTKH UPUTEDPFPYUYFSHUS OB YMPTSEOYL PYUYFSHUS OB YUMPTSEOYLUY NSCHUMMEK

EDYOBS UVIMYUFILB MEZLP CHSCHDETTSYCHBFSH TBMYUOSCHE DPLKHNEOFSCH CH EDYOPN UVIME, YURPMSHUHS EDYOHA FETNYOPMPZYA. eUMY UFYMSH YMY FETNYOSCH OKHTSOP YUNEOIFSH, LFP DEMBEFUS TBPN PE CHUEI DPLHNEOFBI, OE FTPZBS YI UPDETTSYNPE.

rPChFPTOPE YURPMShSPCHBOYEʹFPF FETNYO, IPTPYP BOBLPNSCHK RTPZTBNNYUFBN, POBUBEF OBMIYUYE ChP'NPTSOPUFY YURPMSHPCHBFSH DEFBMY UVBTSHI RTPELFPCH CH OPCHNEYUFBN yUBUFSH DPLKHNEOFB, PZHPTNMEOOBS CH CHYDE SGML-LMENEOFB, NPTSEF RETEOPUYFSHUS CH DTHZIE DPLKHNEOFSCH, MEZLP RPCHFPTSFSHUS CH TBOBOSHI NEUFBI FELUFFB.

dPMZPCHEUOPUFSH YOZHPTNBGY yb-bb FPZP, UFP SGML - RTPUFPK Y UFBODBTFOSCHK ZHPTNBF ITBOEOIS DBOOSHI, PFUHFUFCHHEF OEPVIPDYNPUFSH RETEZHPTNBFYTPCHBFSH YI CHCHYCHDKHBUFFBRKTNO yOZHPTNBGYS RTPUFP DPUFHROB OBCHUEZDB. POB OEUEF U UPVPK CHUE OEPVIPDINPE DMS UPUDBOYS DPLHNEOFB.

MHYUEE HRTBCHMEOE DBOSCHNY od SGML NPTSOP PRTEDEMSFSH YOZHPTNBGYPOSCHE LMENEOFSCH Y NBOYRKHMSGY U OYNY U RTPYCHPMSHOPK UVEREOSHA DEFBMSHOPUFY. TBNEYUEOOSCHE LMENEOFSCH NPZHF YNEFSH BFTYVHFSCH, PRTEDEMSAEYE IBTBLFETYUFILY Y UCHPKUFCHB LMENEOFPCH. ʹFB YOZHPTNBGYS OE RTEDOBOBYUEOB DMS REYUBFY, OP NPTSEF RPNPYUSH CH HRTBCHMEOY LMENEOFBNY DBOOSHI. OBRTYNET, BFTYVHF ID (IDEOFYZHYLBFPT) NPTSEF KHOILBMSHOSCHN PVTBSPN IDEOFYZHYGYTPCBFSH PDYO BVJBG, YMY GEMSCHK TBBODEM, RTEJNEYMABOYE

yOZHPTNBGYS
fBL LBL IDEOFYZHYLBFPTSCH SCHMSAFUS NBYYOOP-YUIFBENSCHNY, POI NPZHF UCHSCHCHBFSH NECDKH UPVPK YOZHPTNBGYA YYURPMSHPCHBFSHUSME HYURPMSHOPCHBFSHUSME HMSTBOBOCHPE. NA LINIJI:
  • lPOFTPMYTPChBFSH VEPRBUOPUFSH DPUFKHRB L YOZHPTNBGY, RPCHPMS FPMSHLP PRTEDEMEOOSCHN MADSN RTPUNBFTYCHBFSH YMY YNNEOSFSH EE.
  • bCHFPNBFYYITPCHBFSH RETENEEEEOYE YOZHPTNBGYY - OBRTYNET, PWOPCHMEOYE DBOOSHI CH PDOPN NEUFE NPTSEF YOYGYYTPCHBFSH PWOPCHMEOYE FPK TSEKHEYZYOZHPTN

TBDEMSENPUFSH chPNPTSOPUFSH TBVPFSH UP UVTKHLFKHTYTPCHBOOSCHNY LPNRPOEOFBN DPLKHNEOFB RPJCHPMSEF UVTPYFSH GEMSCHK DPLKHNEOF YY UPUFFCHOCHI YUBUFEYBOZHBOZ ʹFP RPʺČPMSOF RPMŠʺ̱PČBFÉMSN DEMYFSHUS YOZHPTNBGYEK WEB ITS DHVMYTPCHBOYS.

nPWYMSHOPUFSH h YOZHPTNBGYPOOSHI UEFSI, PVAEDYOSAEYI TBOPPVTBOSCHE LPNRSHAFETSCH. rPULPMSHLKH SGML OE BCHYUIF PF BRRBTBFHTSCH Y RTEIMPTSEOIK, NPTSOP MEZLP PVNEOYCHBFSHUS DPLKHNEOFBNY NETSDKH TBMYUOSCHNY UYUFENBNY.

ZYVLPUFSH CH RTEYMPTSEOYY SGML RPʺČPMSOF YURPMShʺPCHBFSH YOZHPTNBGYA DBMELP ʺ̱B TBNLBNY "OBUFPMSHOPK FIRPZTBZHYY". NA LINIJI:

  • UVTBOYGSCH WWW;
  • YOZHPTNBGYPOSCHE VBBSH DBOOSHI;
  • DYBZOPUFYUEULYE / ʹ̱LURETFOSCHE UYUFENSCH;
  • LMELFTPOOBS RPUFB;
  • ZYRETFELUFPCHBS DPLKHNEOFBGYS;
  • RHVMJLBGJJ O CD-ROM-u;
  • YOFETBLFYCHOSCHE SMELFTPOSCHE NBOHBMSCH.

pUENX SGML?

rPUENH OE Riječ? rPFPNKh, UFP LFP YBLTSCHFSCHK ZhPTNBF. rPFPNKh, UFP LFP ZhPTNBF PDOPZP RTYMPCEOIS. rPFPNKH, UFP LFPZP RTEIMPTSEOIS OEF RPD AOILUBNY, U LPFPTSCHNY S TBVPFBA. rPFPNKH, UFP LFP OE FELUFPCHSCHK ZhPTNBF. rPFPNKH, UFP OEF UTEDUFCH BCHFPNBFYUEEEULPK ZEOETBGY FBLYI DPLHNEOFPCH. rPFPNKH, UFP OEF FPMLPCCHHI UTEDUFCH HRTBCHMEOYS CHETUYSNYY LPMMELFYCHOPK TBVPFSH. rPFPNKH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSCHUMPCHPK UVTHLFHTSCH, Y OEF CHP'NPTSOPUFY YI UPPFOPUIFSH. rPFPNKH, UFP RTY LLURPTFE RPMKHYUBEFUS UPCHETEOOOP OEHDPCHMEFCHPTYFEMSHOSCHK HTML. rPFPNKH, UFP LBYUEUFCHP CHETUFLY Y REYUBFY OYTSE UTEDOESP.

pUENH OE T E X? rPFPNKH, UFP LFP UMYYLPN OYLPKHTPCHOECHSCHK SZSCHL. EZP OE DBYSH CH THLY OBYUYOBAENH. rPFPNKH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSCHUMPCHPK UVTHLFKHTSCH. rPFPNKH, UFP NBMP T E X-PTYEOFYTPCHBOOSHI TEDBLFPTPCH. rPFPNKH, UFP OEF HDPCHMEFCHPTIFEMSHOSHI UTEDUFCH LURPTFB CH Riječ.

pUENH OE HTML? rPFPNKH, UFP UBNP RPOSFYE HTML UYMSHOP TBNSCHFP ZPOLPK WWW ʺB LPNNETGYEK Y CHOPKOPK RTPYCHPDIFEMEK VTBKHYETPC DTHZ U DTHZPN. rPFPNKH, UFP HTML UVTBDBEF CHUE FEN TCE OEDPUFBFLPN: PTYEOFYTPCHBO O RTEDUFBCHMEOYE, B OE O UVTHLFKHTH. rPFPNKH, UFP PO PYUEOSH VEDEO CHCHTBYFEMSHOSCHNY UTEDUFCHBNY, J PFUHFUFCHHAF ChP'NPTSOPUFY EZP TBUYITEOIS. rPFPNKH, UFP OE TEEEO RTPVMENB LPTTELFOPK TKHUZHYLBGY. rPFPNKH, UFP OEF HDPCHMEFCHPTIFEMSHOSHI UTEDUFCH LURPTFB CH Riječ.

SGML RTPFYCH WYSIWYG

dMS FEI, LFP RTICHSCHL RPMSH'PCHBFSHUS FPMSHLP "procesor teksta" -BNY, OBRTYNET, MS Word YMY WordPerfect, NPTSEF VSCHFSH YOFETEUOP UPRPUFBCHMEOYE YI U SGML YOFBUNFTKH. FY DCHE ZTHRRSCH RTPZTBNOSHI UTEDUFCH, OEUNPFTS O UIPTSEUFSH TEYBENSHY BDBYU - RTPYCHPDUFCHP DPLHNEOFFCH - CHEUSHNB DTHBAZ PF DTHYUFTIFTUFH.

Procesor teksta - LFP YOFEMMELFHBMSHOBS RYYHEBS NBYYOLB. tO PTYEOFYTPCHBO O TBVPFH imaju CHYHBMSHOSCHN RTEDUFBCHMEOYEN FELUFB, IBTBLFETYHAEEZPUS OBVPTPN UFYMEK: UFYMEK UYNCHPMPCH (YTYZHF, LEZMSH, OBYUETFBOYE) BVBGECH (LTBUOBS UFTPLB, CHSCHTBCHOYCHBOYE, RPMPTSEOYE RP YYTYOE UFTBOYGSCH) UFTBOYG (LPMPOFYFHMSCH, UOPULY) TBDEMPCH J DPLHNEOFPCH (ZHPTNBF VHNBZY, PZMBCHMEOYE), Y RTPYUYI. Procesor teksta OE TBVPFBEF U CHOHFTEOOEK UVTHLFHTPK DPLHNEOFB.

SGML TEDBLFPT, OBRTPFYCH, PTYEOFYTPCHBO O TBVPFH U UPDETTSYNSCHN DPLHNEOFB. dMS SGML TEDBLFPTB, OBRTYNET, TBDEM - LFP LMENEOF, CH LPFPTSCHK NPZHF CHLMAYUBFSHUS RPDTB'DEMSCH, B OE RTPNETSKHFPL PF PDOPZP BV'BMENOGBCH, OBVTLP

ʹFP RPʺČPMSOF BČFPTH UPUTEDPFPYUIFSHUS O UPDETTSBOY FELUFFB, B OE CHP'YFSHUS U EZP ZhPTNBFYTPCHBOYEN Y CHSCHVPTPN UFIMEK. CHYJHBMSHOBS UFYMYUFILB DPLKHNEOFB PRTEDEMSEFUS RTY EZP LURPTFE CH CHCHEPDOSCHE ZHPTNBFSCH, B OE RTY OBVPTE FELUFB.

p RTPZTBNNOPN PVEUREEOOOYY

yuFPVSCH OBYUBFSH TBVPFBFSH U DPLHNEOFBNY CH SGML RPMSH'PCHBFEMA OHTSOCCH DCHB PUOPCHOSHI UTEDUFCHB: TEDBLFPT Y UTEDUFFCHB LURPTFB (ZHPTNBBFYT).

SGML-TEDBLFPT

SGML-TEDBLFPT PFMYUBEFUS LBL PF RTYCHYUOSHI FELUFPCHCHI TEDBLFPTPCH, FBL J PF "procesor teksta" -PCH. pF RETCHSCHI - OBMYUYEN RPDDETTSLY UVTHLFKHTYTPCHBOOSHI DPLHNEOFPCH, PF CHFPTSHI - PFUHFUFCHYEN RPDDETTSLY CHYJHBMSHOPZP ZHPTNBFYTPCHBOYS. TEDBLFPT TBBVYTBEF DTD TEDBLFYTKHENPZP DPLKHNEOFB Y "CHEDEF" RPMSH'PCHBFEMS CH UPPFCHEFUFCHY U OYN. OBRTINET, EUMI DTD RTEDHUNBFTYCHBEF LMENEOF

, CH LPFPTPN NPZKHF CHUFTEYUBFSHUS FPMSHLP LMENEOFSH YMY , FP RPMSh'PCHBFEMA, TEDBLFYTKHAENKH LMENEOF
, VKHDEF RTEDMPTSEOP CHUFBCHYFSH PDYO Y'FYI DCHKHI TBTEYEOOSHI LMENEOFFCH. SGML-TEDBLFPT FBLCE PVSCHYUOP UPDETTSYF UTEDUFCHB OBCHYZBGY RP YETBTIY DPLKHNEOF.

yj YUYUMB RPRHMSTOSHI SGML-TEDBLFPTPCH NPTSOP OBJCHBFSH ArborText ADEPT * Editor, SoftQuad Autor/Uređivač, psgml, Adobe FrameMaker + SGML, Corel WordPerfect, J NOPCEUFCHP DTHZYI.

UTEDUFCHB ZhPTNBFYTPCHBOYS

uHEEUFCHKHEF NOPTSEUFCHP UTEDUFCH TBVPFS U SGML FELUFFBNY. VóMSHYHA YI YUBUFSH UPUFBCHMSAF UTEDUFCHB ZhPTNBFYTPCHBOYS - LURPTFB SGML CH DTHZYE ZhPTNBFSH DMS REYUBFY, RTPUNPFTB J F.R. CHSCHIPDOSHE ZHPTNBFSH NPZHF VSCHFSH MAVSCHNY, ABCHYUS MYYSH PF DPUFHROPZP RTPZTBNNOPZP PVEUREUEOYS Y OKHTSD RPMSHUPCHBFEMS. OBRTINET, S YURPMSHJHA LPOCHETFETSH H HTML, RTF L A T E X.

Godine 1986, mnogo prije nego što je ideja o stvaranju weba oživjela, univerzalni, standardizirani jezik za označavanje SGML ( Standardizirani generalizirani označni jezik) odobren je kao međunarodni standard (ISO 8879) za definiranje označnih jezika, iako SGML postoji od kasnih šezdesetih. Korišten je za opisivanje označnih jezika dok je autoru omogućio da formalno definira svaki element i atribut jezika.

HTML je izvorno bio samo jedna od SGML aplikacija. Opisao je pravila po kojima se trebaju pripremati informacije za World Wide Web. Dakle, HTML je skup SGML propisa formuliranih kao definicije vrste dokumenta(DTD) koji objašnjavaju što točno znače oznake i elementi. DTD za HTML pohranjen je u web pregledniku.

Nedostaci HTML jezika uključuju sljedeće:

  • HTML ima fiksni skup oznaka... Ne možete kreirati vlastite oznake koje su razumljive drugim korisnicima.
  • HTML je isključivo tehnologija prezentacije... HTML ne nosi informacije o značenju sadržaja sadržanog u oznakama.
  • HTML - ravni jezik... Značenje oznaka u njemu nije definirano, pa se ne može koristiti za opisivanje hijerarhije podataka.
  • Preglednici se koriste kao platforma za aplikacije... HTML nije dovoljno moćan za stvaranje web aplikacija na razini kojoj trenutno teže web programeri. Na primjer, nemoguće je razviti aplikaciju u HTML-u za profesionalnu obradu i dohvat dokumenata.
  • Velike količine mrežnog prometa... Postojeći HTML dokumenti koji se koriste kao aplikacije preopterećuju Internet velikom količinom prometa na sustavima klijent-poslužitelj. Primjer bi bio slanje velikog dokumenta preko mreže kada je potreban samo mali dio tog dokumenta.

Dakle, s jedne strane, HTML je vrlo zgodno sredstvo za označavanje dokumenata za korištenje na webu, a s druge strane, dokument označen u HTML-u ima malo informacija o svom sadržaju. Ako ovaj ili onaj dokument sadrži dovoljno potpune informacije o svom sadržaju, postaje moguće relativno lako izvršiti automatsku generaliziranu obradu i pretraživanje u datoteci koja pohranjuje dokument. SGML može pohraniti informacije o sadržaju dokumenta, ali zbog svoje složenosti nikada se nije koristio tako široko kao HTML.

Grupa stručnjaka za SGML, predvođena Jonom Bosakom iz Sun Microsystemsa, započela je rad na stvaranju podskupa SGML-a koji web zajednica može prihvatiti. Odlučeno je ukloniti mnoge nebitne značajke SGML-a. Tako obnovljen jezik nazvan je XML. Pojednostavljena verzija bila je znatno pristupačnija od originalne, sa samo 26 stranica specifikacija u usporedbi s više od 500 stranica SGML specifikacija.

Razmotrimo detaljnije strukturu i značajke ovog jezika.

XML (eXtensible Markup Language) je jezik za označavanje koji preporučuje W3C. XML - tekstualni format, namijenjen za pohranu strukturiranih podataka, za razmjenu informacija između programa, kao i za stvaranje specijaliziranih označnih jezika na njegovoj osnovi. XML je pojednostavljeni podskup SGML jezika.

XML jezik ima sljedeće dostojanstvo:

  • To je format dokumenta usmjeren na čovjeka koji mogu razumjeti i ljudi i računala.
  • Podržava Unicode.
  • Osnovne strukture podataka kao što su zapisi, popisi i stabla mogu se opisati u XML formatu.
  • To je samodokumentirajući format koji opisuje strukturu i nazive polja kao i vrijednosti polja.
  • Ima dobro definiranu sintaksu i zahtjeve za analizu, što mu omogućuje da ostane jednostavan, učinkovit i dosljedan.
  • Široko se koristi za pohranu i obradu dokumenata;
  • To je format koji se temelji na međunarodnim standardima;
  • Hijerarhijska struktura XML-a prikladna je za opisivanje gotovo svake vrste dokumenta;
  • To je jednostavan tekst, bez licenciranja i bilo kakvih ograničenja;
  • Neovisno o platformi;
  • Je podskup SGML-a za koji je skupljeno puno iskustva i stvorene specijalizirane aplikacije;

Poznati nedostatke jezici uključuju sljedeće:

  • XML sintaksa je suvišna.
    • Veličina XML dokumenta znatno je veća od binarnog prikaza istih podataka (oko 10 puta).
    • Veličina XML dokumenta znatno je veća od dokumenta u alternativnim formatima za prijenos tekstualnih podataka (npr JSON, YAML) a posebno u formatima podataka koji su optimizirani za određeni slučaj uporabe.
    • Zalihost XML-a može utjecati na performanse vaše aplikacije. Troškovi pohrane, obrade i prijenosa podataka rastu.
    • Veliki broj zadataka ne zahtijeva punu snagu XML sintakse, a mogu se koristiti mnogo jednostavnija i učinkovitija rješenja.
  • XML prostore imena je teško koristiti i teško ih je implementirati u XML parsere.
  • XML ne sadrži podršku izvornog jezika za tipove podataka. Ne uključuje koncepte "cijeli brojevi", "nizovi", "datumi", "booleove vrijednosti" itd.
  • Hijerarhijski model podataka koje nudi XML ograničen je u usporedbi s relacijskim modelom i objektno orijentiranim grafovima.

Općenito govoreći, XML se može promatrati ne samo kao novi označni jezik, već i kao osnova za cijelu obitelj tehnologija:

Tablica 9.1. Struktura XML obitelji
XML XML tehničke smjernice
DTD Definicija vrste dokumenta (shema)
XDR XML format Smanjena(Microsoft shema)
XSD Definicija XML sheme (W3C shema)
Imenski prostor Metoda za definiranje naziva elemenata i atributa
XPath Jezik XML puta
XLink Jezik XML veze
XPointer Jezik XML pokazivača
DOM API za objektni model dokumenta
SAKSOFON Jednostavan API za XML
XSL Proširivo jezik lista stilova
XSL -FO Oblikovanje objekata XSL
XSLT Jezik transformacija XSL
XUključi XML uključuje sintaksu

Označni jezici: SGML, HTML, XML. Njihova međusobna povezanost.

HTML je izvorno bio samo jedna od SGML aplikacija. Opisao je pravila po kojima se trebaju pripremati informacije za World Wide Web. Dakle, HTML je skup SGML propisa, formuliranih kao definicija vrste dokumenta (DTD), koji točno objašnjavaju što znače oznake i elementi. DTD za HTML pohranjen je u web pregledniku.

Dakle, s jedne strane, HTML je vrlo zgodno sredstvo za označavanje dokumenata za korištenje na webu, a s druge strane, dokument označen u HTML-u ima malo informacija o svom sadržaju. Ako ovaj ili onaj dokument sadrži dovoljno potpune informacije o svom sadržaju, postaje moguće relativno lako izvršiti automatsku generaliziranu obradu i pretraživanje u datoteci koja pohranjuje dokument. SGML može pohraniti informacije o sadržaju dokumenta, ali zbog svoje složenosti nikada se nije koristio tako široko kao HTML.

Grupa stručnjaka za SGML, predvođena Jonom Bosakom iz Sun Microsystemsa, započela je rad na stvaranju podskupa SGML-a koji web zajednica može prihvatiti. Odlučeno je ukloniti mnoge nebitne značajke SGML-a. Tako obnovljen jezik nazvan je XML. Pojednostavljena verzija bila je znatno pristupačnija od originalne, sa samo 26 stranica specifikacija u usporedbi s više od 500 stranica SGML specifikacija.

Prednosti XML-a.

  • Podržava Unicode.
  • Neovisno o platformi;

Web usluge

Web usluga(web servis) - softverski sustav koji ima URI i čija su javna sučelja definirana u XML-u. Opis ovog softverskog sustava mogu pronaći druge aplikacije koje s njim mogu komunicirati u skladu s ovim opisom putem poruka baziranih na XML-u i prenošenih internetskim protokolima. Web usluga je jedinica modularnosti kada se koristi servisno orijentirana arhitektura aplikacije.

Servisno orijentirana arhitektura(SOA, servisno orijentirana arhitektura) je modularni pristup razvoju softvera koji se temelji na korištenju usluga sa standardiziranim sučeljima.

SOA se temelji na principima ponovne uporabe IT funkcionalnih elemenata, objedinjavanja tipičnih operativnih procesa. Programske komponente mogu se distribuirati na različite mrežne čvorove i nude se kao neovisne i slabo povezane, zamjenjive aplikacijske usluge.

Sučelje SOA programskih komponenti enkapsulira detalje implementacije određene komponente (OS, programski jezik, itd.).

.NET web usluge imaju sljedeće prednosti:

  • Otvorenost standarda... U web servisima nema skrivenih ili nedostupnih elemenata. Svaki aspekt tehnologije, od načina na koji pretražujete web usluge do načina na koji ih opisujete i kako komunicirate s njom, definiran je javno dostupnim standardima.
  • Višeplatformski... Programski jezik koji vam omogućuje stvaranje XML dokumenata i slanje informacija putem HTTP-a omogućuje interakciju s bilo kojom web-uslugom. Moguće je primanje web usluge iz sustava koji nije .NET.
  • Jednostavnost.
  • Podrška za poruke na jeziku čitljivom čovjeku... Prelazak s binarnih standarda korištenih u COM-u i CORBA-i na XML tekst olakšao je ispravljanje pogrešaka i omogućio interakciju s web-uslugama putem uobičajenih HTTP kanala.

Implementacija .NET web usluga je jednostavna kao pozivanje udaljene web usluge ili pozivanje metode na lokalnoj klasi. To čini korištenjem alata koje pruža .NET Framework za stvaranje cjelovite web usluge bez potrebe za učenjem pojedinosti o tome kako funkcioniraju standardi kao što su SOAP, WSDL i UDDI. U tom se slučaju izvode sljedeće radnje:

  1. Web usluga je dizajnirana kao .NET klasa s atributima koji je identificiraju kao web uslugu s nekom funkcionalnošću.
  2. .NET okruženje automatski generira WSDL dokument koji opisuje kako bi klijent trebao komunicirati s web-uslugom.
  3. Korisnik pronalazi generiranu web-uslugu i može dodati odgovarajuću web referencu projektu Visual Studio .NET.
  4. .NET okruženje automatski provjerava valjanost WSDL dokumenta i generira proxy klasu koja omogućuje korisniku interakciju s web-uslugom.
  5. Potrošač poziva jednu od metoda vaše klase web usluge. S njegove točke gledišta, ovaj se poziv izvana ne razlikuje od pozivanja metode bilo koje druge klase, iako se interakcija zapravo događa s proxy klasom, a ne s web-uslugom.
  6. Proxy klasa pretvara proslijeđene parametre u SOAP poruku i šalje je web servisu.
  7. Proxy klasa tada prima SOAP odgovor, pretvara ga u odgovarajući tip podataka i vraća ga kao običan .NET tip podataka.
  8. Potrošač koristi primljene podatke.

.NET web usluge koriste ASP .NET tehnologiju, koja je dio .NET Frameworka. Također zahtijeva podršku od Microsoft IIS poslužitelja.

Glavni nedostaci web servisa su niža izvedba i veća veličina mrežnog prometa u odnosu na tehnologije kao što su RMI, CORBA, DCOM zbog korištenja XML tekstualnih poruka.

Standardi za web usluge.

WSDL specifikacija

Svaka web usluga pruža dokument jezika opisa web usluge (WSDL) koji opisuje sve što je klijentu potrebno za rad s tom uslugom. WSDL dokument pruža jednostavan i dosljedan način za razvojnog programera da specificira sintaksu za pozivanje bilo koje web metode. Štoviše, ovaj dokument vam omogućuje korištenje alata za automatsko generiranje proxy klasa poput onih uključenih u Visual Studio .NET i .NET Framework. Uz ove alate, korištenje web usluge jednako je jednostavno kao korištenje lokalne klase.

WSDL dokument je u XML formatu, prema kojem su informacije podijeljene u pet grupa. Prve tri skupine su apstraktne definicije koje su neovisne o platformi, mreži ili jeziku, dok preostale dvije skupine uključuju konkretne opise.

SOAP protokol

Komunikacija između web servisa i njihovih klijenata odvija se putem poruka u XML formatu.

SOAP (Simple Object Access Protocol) je protokol za razmjenu poruka za odabir web usluga.

Osnovna ideja SOAP standarda je da poruke trebaju biti kodirane u standardiziranom XML formatu.

Osim SOAP poruka, možete koristiti metode HTTP GET i POST za komunikaciju s .NET uslugama.

Prednosti korištenja SOAP formata u odnosu na druge formate za prijenos podataka:

  • XML-kodirati strukture podataka i skupove podataka pomoću SOAP-a jednako je jednostavno kao i jednostavne skalarne podatke.
  • Kada koristite SOAP poruke, pružaju se dodatni alati koji olakšavaju dodavanje, na primjer, funkcionalnosti sigurnosti ili praćenja.
  • SOAP alati dostupni su za različite programske jezike (pa čak i prethodne verzije Microsoft C++ i Visual Basic). Inače, kako biste omogućili komunikaciju s uslugom putem GET i POST metoda HTTP protokola, očito ćete morati sami konstruirati niz upita, a zatim analizirati odgovor.

DISCO standard

DISCO standard pruža najjednostavniji način pristupa datotekama manifesta grupiranjem veza na web usluge.

DISCO datoteka može uključivati ​​datoteke s različitih web poslužitelja i podržava "dinamičko pretraživanje" - automatsko pretraživanje direktorija datoteka web usluga na poslužitelju.

Datoteke manifesta korisne su jer spajaju mnoge web-usluge u jedan popis, ali onemogućuju klijentima da pronađu određenu vrstu web-usluga bez navođenja naziva tvrtke za razvojne programere.

UDDI specifikacija

UDDI specifikacija (univerzalni opis, otkrivanje i integracija) izbjegava ove probleme korištenjem posebnog spremišta (repozitorija) gdje poduzeća i organizacije mogu staviti podatke o uslugama koje pružaju. Više od 100 tvrtki (potpuni popis može se naći na http://www.uddi.org/community.html), uključujući Sun i Microsoft, pioniri su u stvaranju UDDI tehnologije. Te su tvrtke zajedno razvile nacrt UDDI specifikacije koja je standardizirana nakon 18 mjeseci.

Informacije u ovom spremištu moraju se ažurirati ručno. U tu svrhu, neki "čvorni izrazi" čuvaju identične kopije UDDI spremišta. Te tvrtke osiguravaju pohranu navedenog repozitorija i besplatan pristup njemu radi popularizacije web serije. Osim toga, Microsoft je uključio verziju UDDI-a u Windows .NET poslužiteljski softver za korištenje na korporativnim intranetima.

UDDI repozitorij sadrži informacije o poduzećima koje pružaju web usluge, vrsti svake usluge te poveznice na informacije i specifikacije koje se odnose na te usluge. Sam UDDI je web usluga. Da biste se registrirali ili pronašli uslugu, pošaljite SOAP poruku.

WEB - integracija.

Izazov web integracije je spojiti različite web aplikacije i sustave u jedno okruženje temeljeno na webu.

Prakticiraju se sljedeći pristupi web integraciji:

· Integracija na prezentacijskoj razini. Ova razina omogućuje korisniku interakciju s aplikacijom. Integracija na prezentacijskoj razini daje pristup korisničkom sučelju udaljenih aplikacija.

· Integracija na razini funkcionalnosti. Ova integracija podrazumijeva izravan pristup poslovnoj logici aplikacija. To se postiže izravnom interakcijom aplikacija s API(sučelje za programiranje aplikacije) ili interakcija kroz web usluge.

· Integracija na razini podataka. U ovom slučaju, pristup jednom ili više baze podataka koju koristi udaljena aplikacija.

· Kompleksna integracija. Rješenja za komercijalnu web integraciju obično uključuju sve tri vrste integracija

Korištenje web integracije je korisno iz više razloga:

· Web integracija omogućuje vam implementaciju informacijskih sustava temeljenih na aplikacijama trećih strana bez razumijevanja njihovih nadređenih sustava, softverskih okruženja i arhitekture baza podataka.

· SOA i web usluge koristiti programski jezik i platformski neovisna sučelja između aplikacija korporativne IT infrastrukture. To daje očite prednosti u podršci, upravljivosti, postavljanju informacijskih mreža.

· Web integracija omogućuje izgradnju složene funkcionalnosti kombiniranjem različitih komponenti putem protokola web usluga.

· Web integracija vam omogućuje korištenje web usluga razvojnih programera.

· Web integracija omogućuje razvoj API-ja putem protokola web usluga bez programiranja.

Za web integraciju, komercijalni softver ili popularne tehnologije kao što su PHP / Python / Perl, XForms, SAPUN itd.

Integracija temeljena na XML-u

Umjesto implementacije interakcije između svakog para sustava, samo trebate naučiti svaki od njih da "govore" XML. Drugim riječima, sve se svodi na razvoj nekoliko omote (wrapper - omotač, softverski alat za izradu sustavnog omota za standardizaciju vanjskih poziva i promjenu funkcionalne orijentacije operacijskog sustava), koji će sa standardnog XML jezika integriranog sustava prevesti na jezik koji je razumljiv svakom sustavu odvojeno.

· Razvojni alati i standardne biblioteke za XML postoje na gotovo svim platformama i za većinu popularnih programskih jezika;

· Metode rada s XML-om dovoljno su standardne da se iste tehnike mogu koristiti u različitim sustavima;

· Informacije formatirane u XML-u mogu obraditi ne samo strojevi, već i ljudi (što uvelike olakšava otklanjanje pogrešaka).

U osnovi, integracija XML sheme ne razlikuje se bitno od bilo koje druge uobičajene standardne integracije. Istovremeno, ima niz značajnih prednosti:

· XML jezici ne ovise o hardverskim i softverskim platformama, što vam omogućuje povezivanje heterogenih sustava;

· Ekspresivna snaga XML-a dovoljno je velika da opiše podatke gotovo svake složenosti;

Integracija temeljena na XML-u praktički se provodi unutar sljedećih protokola:

· XML-RPC... Riječ je o RPC protokolu koji prenosi podatke u XML formatu preko TCP porta 80, t.j. HTTP port.

· WDDX(Web Distributed Exchange). To je mehanizam za razmjenu složenih struktura podataka pomoću HTTP protokola. Protokol se ne temelji na strukturama, već na događajima.

· ebXML(elektronsko poslovanje XML) - XML ​​za e-poslovanje. Njegova je primarna svrha pružiti otvorenu XML infrastrukturu koja omogućuje sigurnu globalnu upotrebu informacija e-poslovanja. Web usluge (web usluge).

XML (eXtensibleMarkupLanguage) je jezik za označavanje koji preporučuje W3C. XML je tekstualni format za pohranu strukturiranih podataka, za razmjenu informacija između programa, kao i za stvaranje specijaliziranih jezika za označavanje na njegovoj osnovi. XML je pojednostavljeni podskup SGML-a .

XML jezik ima sljedeće dostojanstvo:

  • To je format dokumenta usmjeren na čovjeka koji mogu razumjeti i ljudi i računala.
  • Podržava Unicode.
  • Osnovne strukture podataka kao što su zapisi, popisi i stabla mogu se opisati u XML formatu.
  • To je samodokumentirajući format koji opisuje strukturu i nazive polja kao i vrijednosti polja.
  • Ima dobro definiranu sintaksu i zahtjeve za analizu, što mu omogućuje da ostane jednostavan, učinkovit i dosljedan.
  • Široko se koristi za pohranu i obradu dokumenata;
  • To je format koji se temelji na međunarodnim standardima;
  • Hijerarhijska struktura XML-a prikladna je za opisivanje gotovo svake vrste dokumenta;
  • To je jednostavan tekst, bez licenciranja i bilo kakvih ograničenja;
  • Neovisno o platformi;
  • Je podskup SGML-a za koji je skupljeno puno iskustva i stvorene specijalizirane aplikacije;

Poznati nedostatke jezici uključuju sljedeće:

· XML sintaksa je suvišna.

· Veličina XML dokumenta znatno je veća od binarnog prikaza istih podataka.

· Veličina XML dokumenta znatno je veća od dokumenta u alternativnim formatima za prijenos tekstualnih podataka (npr. JSON, YAML), a posebno u formatima podataka optimiziranim za određeni slučaj uporabe.

· XML redundantnost može utjecati na performanse aplikacije. Troškovi pohrane, obrade i prijenosa podataka rastu.

· Veliki broj zadataka ne zahtijeva punu snagu XML sintakse, a mogu se koristiti mnogo jednostavnija i učinkovitija rješenja.

  • XML prostore imena je teško koristiti i teško ih je implementirati u XML parsere.
  • XML ne sadrži podršku izvornog jezika za tipove podataka. Nema koncept "cijelih brojeva", "nizova", "datuma", "booleova" itd.
  • Hijerarhijski model podataka koji nudi XML ograničen je u usporedbi s relacijskim modelom i objektno orijentiranim grafovima.

U suštini, XML služi metajezika opisati strukturu drugih jezika. Odnos između SGML, XML, HTML i nekih drugih jezika prikazan je na sljedećem dijagramu:

Važna razlika između XML-a i HTML-a je u tome što stavlja veliki naglasak na kontrolu toga koliko se dobro poštuju pravila jezika prilikom označavanja dokumenata. Ovisno o tome, uobičajeno je dodijeliti dobro oblikovana i valjano XML dokumenti .

XML dokument se razmatra dobro oblikovana ako odgovara svim pravilima XML sintakse.

Ispitivanje stvarnost dokument pretpostavlja sljedeće radnje:

  • Provjerava da se koristi samo zadani skup deskriptora.
  • Provjera potpune usklađenosti redoslijeda elemenata i atributa sa sadržajem dokumenta ili određenim pravilima.
  • Kontrola vrste podataka (postignuta korištenjem odgovarajuće sheme).
  • Kontrola integriteta podataka kako bi se osigurala optimalna razmjena informacija putem weba pomoću transakcija.

Osnovna pravila sintakse izrada XML dokumenata.

  • XML dokument sadrži jedan i samo jedan korijenski element koji sadrži sve ostale elemente
  • Dječji elementi sadržane u korijenski element mora biti pravilno ugniježđen.
  • Imena elementi poštuju pravila:
  • Ime počinje slovom, podvlakom ili dvotočkom.
  • Prvi znak u imenu mogu biti praćeni slovima, brojevima, crticama, podvlakama, točkama ili dvotočkama.
  • Nazivi ne mogu započeti s XML-om.

XML dokument ima sljedeću strukturu:

  • Poziva se prvi redak XML dokumenta Obavijest XML. Ovo je izborni niz koji označava verziju XML standarda (obično 1.0). Ovdje se također mogu navesti kodiranje znakova i vanjske ovisnosti.

Vrhunski povezani članci