Kako podesiti pametne telefone i računare. Informativni portal
  • Dom
  • Vijesti
  • Prošireni jezici za označavanje podataka SGML, XML. Pogledajte šta je "XML" u drugim rečnicima Html je aplikacija sgml standarda

Prošireni jezici za označavanje podataka SGML, XML. Pogledajte šta je "XML" u drugim rečnicima Html je aplikacija sgml standarda

Priča

Pogledajmo primjer jednostavnog recepta za kuhanje označenog XML-om:

> jednostavan hleb > > Brašno > Kvasac > toplu vodu > Sol > > > > Pomiješajte sve sastojke i dobro izmiješajte. > > Zatvorite krpom i ostavite jedan sat u toploj prostoriji. > > Ponovo premesite, stavite u pleh i stavite u rernu. > > >

XML deklaracija

Prvi red XML dokumenta se poziva XML deklaracija(engleski) XML deklaracija) je niz koji označava XML verziju. U verziji 1.0 XML deklaracija može biti izostavljen, u verziji 1.1 je obavezan. Također, ovdje se može specificirati kodiranje znakova i prisustvo vanjskih ovisnosti.

Specifikacija zahtijeva da XML procesori moraju podržavati Unicode kodiranja UTF-8 i UTF-16 (UTF-32 je opciono). Ostala kodiranja zasnovana na ISO/IEC 8859 standardu su prepoznata kao važeća, podržana i široko korištena (ali nisu potrebna), druga kodiranja su također prihvatljiva, na primjer, ruski Windows-1251, KOI-8. Često se nelatinska slova u principu ne koriste u oznakama, u ovom slučaju UTF-8 je vrlo zgodno kodiranje - volumen je obično manji nego kod UTF-16; dekodiranje se može izvršiti i za cijeli dokument i za određene atribute i tekstove; cijeli dokument ne sadrži nedozvoljene znakove kada pokušavate raščlaniti s pogrešnim kodiranjem.

Root element

Najvažniji obavezni sintaksički uslov je da dokument ima samo jedan korijenski element(engleski) korijenski element) (također se naziva element dokumenta(engleski) element dokumenta)). To znači da se tekst ili drugi podaci cijelog dokumenta moraju nalaziti između jedne početne korijenske oznake i njene odgovarajuće krajnje oznake.

Sljedeći najjednostavniji primjer je dobro oblikovan XML dokument:

Sljedeći primjer nije važeći XML dokument jer ima dva korijenski element:

> Esencija #1 > > Esencija #2 >

Komentar

Element se može postaviti bilo gdje u stablu - komentar. XML komentari se postavljaju unutar posebne oznake koja počinje znakovima. Dvije crtice (--) ne mogu biti prisutne u komentaru.

Oznake unutar komentara ne bi trebalo obraditi.

oznake

Ostatak ovog XML dokumenta sastoji se od ugniježđenih elementi, od kojih neki imaju atributi i sadržaj. Element obično se sastoji od početnih i završnih oznaka koje prelamaju tekst i druge elemente. Otvaranje oznake obuhvata ime elementa u ugaonim zagradama, na primjer, , a zatvaranje oznake sastoji se od istog imena u uglatim zagradama, ali se ispred imena dodaje kosa crta, na primjer,. Imena elemenata, poput imena atributa, ne mogu sadržavati prostori, ali može biti na bilo kojem jeziku podržanom kodiranjem XML dokumenta. Ime može početi slovom, donjom crtom, dvotočkom. Preostali znakovi imena mogu biti isti znakovi, kao i brojevi, crtica, tačka.

Postoji nekoliko unaprijed definiranih entiteta u XML-u, kao što je lt (na njega se možete pozvati pisanjem<) для левой угловой скобки и amp (ссылка - &) для амперсанда. Возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков.

Sljedeći je primjer korištenja unaprijed definiranog entiteta kako bi se izbjeglo korištenje ampersanda u imenu:

> AT&T >

Kompletna lista unapred definisanih entiteta sastoji se od & (&),< (<), >(>), " (") i " (") - posljednja dva su korisna za pisanje graničnika unutar vrijednosti atributa. Možete definirati svoje entitete u DTD dokumentu.

Ponekad je potrebno definisati razmak bez prekida, koji se vrlo često koristi u HTML-u i označava se kao. U XML-u ne postoji takav unaprijed definirani entitet, on je napisan, a upotreba uzrokuje grešku. Odsustvo ovog vrlo uobičajenog entiteta često je iznenađujuće za mnoge programere i stvara određene poteškoće prilikom migracije njihovog HTML razvoja na XML.

Referenca prema broju simbola(engleski) referenca numeričkih znakova) izgleda kao referenca na entitet, ali umjesto imena entiteta, naznačen je simbol # i broj (u decimalnom ili heksadecimalnom zapisu), što je broj znakova u Unicode tablici kodova. To su obično znakovi koji se ne mogu direktno kodirati, kao što je arapsko slovo u ASCII kodiranom dokumentu. Ampersand se može predstaviti ovako:

> AT&T >

Postoje druga pravila o tome kako napisati važeći XML dokument.

Prednosti i nedostaci

Prednosti

Nedostaci

  • Dvosmislenost simulacije.
  • XML nema podršku za tipove podataka ugrađenu u jezik. Nema snažno kucanje, odnosno koncepte "cijeli brojevi", "stringovi", "datumi", "booleove vrijednosti" itd.
  • Hijerarhijski model podataka koji nudi XML ograničen je u poređenju sa relacionim modelom i objektno orijentisanim grafovima i mrežnim modelom podataka.

Prikaz XML-a na World Wide Webu

Postoje tri najčešća načina transformacije XML dokumenta u obrazac koji se prikazuje korisniku:

  1. Primjena CSS stilova;
  2. Applying XSL ;
  3. Pisanje procesora XML dokumenata u nekom programskom jeziku.

Da biste specificirali XSL transformaciju (XSLT) na strani klijenta, potreban je sljedeći XML izraz:

XML Dictionaries

Pošto je XML prilično apstraktan jezik, razvijeni su XML vokabulari.

Rječnik omogućava programerima da se dogovore oko nekog konačnog skupa imena oznaka i atributa tih oznaka. Jedan od prvih rječnika je XHTML, koji razumije većina pretraživača. XHTML se često koristi za pohranjivanje i uređivanje sadržaja u CMS-u.

Stvoreni su specijalizovaniji vokabulari, kao što je SOAP protokol za prenos podataka, koji nije orijentisan na ljude i prilično je težak za čitanje. Postoje komercijalni rječnici kao što su CommerceML, xCBL i cXML koji se koriste za prijenos podataka orijentiranih na prodaju, ovi rječnici uključuju opis sistema narudžbi, dobavljača, proizvoda i još mnogo toga.

Obično, prilikom opisivanja dokumenta, osoba dođe do nekog rječnika za sebe, koji se zatim opisuje pomoću DTD, XSD ili jednostavno objasni "na prste" zainteresiranima.

Jedan od široko korišćenih rečnika je FB2 - rečnik koji opisuje format knjige, sa svim vrstama fusnota, citata, čak i slika.

XML verzije

  • XML 1.0
  • XML 1.1

vidi takođe

Bilješke

Književnost

  • David Hunter, Jeff Rafter, Joe Faucett, Eric van der Vlist xml. Rad sa XML-om, 4. izdanje = Početak XML-a, 4. izdanje. - M.: "Dijalektika", 2009. - 1344 str. - ISBN 978-5-8459-1533-7
  • David Hunter, Jeff Rafter, itd. xml. Osnovni kurs = Početak XML-a. - M.: Williams, 2009. - 1344 str. - ISBN 978-5-8459-1533-7
  • Robert Tabor. Implementacija Microsoft .NET XML Web Services = Microsoft .NET XML Web Services. - M.: Williams, 2002. - 464 str. - ISBN 0-672-32088-6

Linkovi

  • XML na web lokaciji World Wide Web Consortium (W3C).
  • XML 1.0 zvanična specifikacija
  • XML 1.1 zvanična specifikacija
  • XML dokumentacija na IBM stranicama, članci, forumi

vPTYU fPVVPFTBU

SGML: YUEN YFP EDSF?

UEZPDOS CHUE YUBEE NPTsOP CHUFTEFYFSH BVVTECHYBFHTH SGML. NOPZYE CHYDSCH DPLKHNEOFBGYY RPUFBCHMSAFUS CH ZHPTNBFE SGML. rPRHMSTOSHCHK SHCHL TBNEFLY Web-UFTBOYG HTML SCHMSEFUS RTYMPTSEOEN SGML. рПСЧМСЕФУС ЧУЕ ВПМШЫЕ РТЙЛМБДОЩИ РТПЗТБНН ДМС ТБВПФЩ У SGML: ТЕДБЛФПТЩ, УТЕДУФЧБ ЖПТНБФЙТПЧБОЙС, УЙУФЕНЩ ДПЛХНЕОФППВПТПФБ, ЙУРПМШЪХАЭЙЕ SGML Ч ЛБЮЕУФЧЕ ЖПТНБФБ ИТБОЕОЙС ДПЛХНЕОФПЧ... SGML-РТПДХЛФЩ ЧЩРХУЛБАФ Adobe, Corel, SoftQuad, Microsoft. h SGML ZPFPCHSFUS LOIZY YDBFMSHUFCHB O "Reilly, Feiyuyuyulbs Dlhneofbges IBM, Sun OSF. Puopna sgml festes nyopmpziye chedheyi ntiopuftepysh

rPSCHYCHYBSUS CH OBYUBME CHPUSHNYDEUSFSHCHI SGML-FEIOPMPZYS RETETSYCHBEF UEKYUBU RETYPD TBUGCHEFB. uFP LFP FBLPE? uFP POB DBEF UCHPYN RPMSHJPCHBFEMSN? lBL U OEK TBVPPFBFSh? O FY Y DTHZYE CHPRTPUSCH S RSHCHFBAUSH PFCHEFYFSH FFK UVBFSHEK.

updetzboye





















LBL SA OBVTEM O SGML-FEIOPMPZYA

CHUE OBYUBMPUSH NA YOFTBOEFB. FP NPDOPE UMPCHP POBYUBMP DMS NEOS O RTBLFILE FP, UFP DPLKHNEOFSHCH, LPFPTSCHE S TEZHMSTOP RYUBM RP TPDH UCHPEK DESFEMSHOPUFY, UFBMP NPTSOP Y OHTSOP DEMBFSHNY DPUFH. dP UYI RPT S RTPUFP OBVITBM DPLHNEOFSHCH T E X-e Y REYUBFBM YI O VKhNBZE. IDES DHVMYTPCHBFSH YI CH HTML CHTHYUOHA PFRBMB UTBYH: OENEDMEOOP CHPOYOLMB VS RTPVMENB UYOITPOYBGYY VHNBTsOPK Y LMELFTPOOPK CHETUYK PDOPZP Y FPZP TSE DPLKhNEOFB.

b CHULPTE RPFTEVCHBMPUSH RETYPDYUEULBS RETEDBYUB DPLKHNEOPCH RPUFPTPOOIN MADSN CH LMELFTPOOPK ZHPTNE, UFP, RP UMPTSYCHYEKUS X OBU RTBLFILE, PJOBYUBEF -- H ZHPTNBFE Microsoft Word. tBVPFBFSH U MS Word X NEOS RP TSDH RTYUYO OE VSCHMP OILBLLPZP CEMBOYS, L FPNKh CE LFP FPMSHLP HUHZKHVYMP VSC RTPVMENKH UYOITPOYBGYY CHETUYK.

ъОБЮЙФ, ОХЦОП ВЩМП РТЙДХНБФШ УРПУПВ БЧФПНБФЙЮЕУЛПЗП РТЕПВТБЪПЧБОЙС ОБВЙТБЕНЩИ ДПЛХНЕОФПЧ Ч ТБЪМЙЮОЩЕ ЖПТНБФЩ: T E X-a -- ДМС РЕЮБФЙ ОБ ВХНБЗЕ, HTML -- ДМС РПНЕЭЕОЙС ОБ WWW УЕТЧЕТ, Word -- ДМС ПВНЕОБ У ТБВПФБАЭЙНЙ Ч Windows. LTPNE FPZP, NOY IPFEMPUSH, YUFPVSCH FBLPE UTEDUFCHP PFCHEYUBMP EEE TSDH FTEVPCHBOIK:

  • VSHCHFSH NPDHMSHOSHCHN, YUFPVSCH NPTsOP VSCHMP RTY OEPVIPDYNPUFY MEZLP DPVBCHMSFSH OPCHSHCHE CHSHCHIPDOSHCH ZHPTNBFSCH YMY Yʺ̱NEOSFSH BMZPTYFNSCH RTEPVTB'PCHEUFCHE CH U;
  • VSHCHFSH PFLTSCHFSCHN, VEURMBFOSHCHN, LBL NPTsOP NEOSHIE RTYCHSBOOSCHN L POLTEFOSHCHN RTPZTBNNBN;
  • VSHCHFSH NPVMSHOSCHN: TBVPFBFSH, LBL NYINHN, O TBOSCHI UNIX-RMBFZHPTNBI;
  • VSCFSh MEZLP THUIZHYGYTHENSCHN.

RETCHCHN, UFP RPRBMPUSHNOE RPD THLH RPUME RPIPDB O Altavisti, PLBMUS RBLEF RPD OBCHBOYEN linuxdoc-sgml. NA LBL TB Y RTEDOBOBOBYUBMUS DMS ZEOETBGYY HTML, T E X Y RTF Yb PDOPZP CHIPDOPZP ZHBKMB. yYTPLP YURPMSHKHENSCHK CH TBNLBI Linux dokumentacioni projekat, ON YURPMSHʺ̱PCHBM CH LBYUEUFCHE CHIPDOPZP ZHPTNBFB OYOBLPNSCHKNOE DP UYI RPT SGML . chRTPYUEN, OYYUEZP UMPTSOPZP CH OEN PLBBMPUSH - ON CHEUSHNB OBRPNYOBM OBLPNSCHK NOE HTML Y CHCHZMSDEM CHRPMOE RPOSFOP. hPF, L RTYNETH, LHUPYUEL SGML-DPLHNEOFB:

Struktura TEI teksta

Svi tekstovi usklađeni sa TEI sadrže a TEI zaglavlje(označeno kao a teiHeader element) i transkripciju samog teksta (označeno kao a tekst element).

DMS FPZP, UFPVSCH OBUBFSH OB LFPN RYUBFSH, RPFTEVPCBMPUSH CHUEZP MYYSH OBRPNOYFSH OEULPMSHLP PUOPCHOSCHI MENEOPFC TBNEFLY, OBRTYNET, UFP

POBUBEF OBUBMP RBTBZTBZHB, -- OBUBMP RETEYUMEOYS Y F.R.

obvtbooshchk H SGML FELUF DBMEE BLHULPN PDOPZP ZHIMSHFTTB RTEPVTBHEFUS H HTML, DTXZPZP -- H T E X, FTEFSHEZP -- H RTF, Y FBL DBMEE.

uFP FBLPE SGML Y YUEN NA IPTP

FETNYOPMPZYS

GML ( Generalizirani jezik za označavanje) TBTBVPFBO H OEDTBI CHEDEUKHEEK LPTRPTBGYY IBM. eZP OBUMEDOYL SGML ( Standardni generalizirani markup jezik) RTYOSF CH 1986 ZPDKh Ch LBYUEUFCHE NETSDHOBTPDOPZP UFBODBTFB DMS PRTEDEMEOYS OEBCHYUYNSCHI PF HUFTPKUFCH CHCHPDB / CHCHCHPDB, OEBCHYUYNSCHI PF CHSCHYUYUMYUTEDMSCHFPKKYUYUMYFEMSF vPMEE FPYOP, SGML -- LFP NEFBS , FP EUFSH UTEDUFCHP ZHPTNBMSHOPZP PRYUBOYS SHCHLB, CH DBOOPN UMHYUBE, SHCHLB TBNEFLY .

yUFPTYYUEULY UMPCHP TBNEFLB YURPMSHPHPCHBMPUSH DMS PRYUBOK BOOPFBGYK YMZYYA Pvpyuyok Chokhfty Felufb, rtedeshuyoshchi DMS Khlbboyk Upufbchima "FPZP, LBLEPPEPPOPEPPOPEPPOPPOPPOPEPPOP DIEFPS rTYNETSCH CHLMAYUBAF RPDYUETLYCHBOYE CHPMOYUFPK YuETFPK, PVP-OBYUBAEEE LKhTUYCH, UREGIBMSHOSCHHE OBYULY DMS RTPRHULP ZHTB YIMY YI REYUBFY LPOLTEFOSCHN YTYYZHDBME, Y F. lPZDB ZHPTNBFYTPCHBOYE Y REYUBFSH FELUFPCH UFBMY BCHFPNBFYYTPCHBOOSCHNY, FFPF FETNYO UFBM PICBFSCHBFSH CHUE CHYDSCH UREGYBMSHOSHCHI LPDHR TBNEFLY , CHUFBCHMSENSCHI CH 'MELFTPOOSHCH FELUFSHCH DMS HRTBCHMEOYS ZHPTNBFYTPCHBOYEN, REYUBFSHHA YMY DTHZPK PVTBVPFLPK.

pVPVEBS, TBNEFLH, YMY LPDYTPCHLH , PRTTEDEMSAF LBL MAVPE UTEDUFCHP UDEMBFSH SCHOSCHN YOFETRTEFBGYA FELUFB. оБ ВБОБМШОПН ХТПЧОЕ ЧУЕ ОБРЕЮБФБООЩЕ ФЕЛУФЩ ЛПДЙТПЧБОЩ Ч ЬФПН УНЩУМЕ: ЪОБЛЙ РТЕРЙОБОЙС, ЙУРПМШЪПЧБОЙЕ ЪБЗМБЧОЩИ ВХЛЧ, ТБУРПМПЦЕОЙЕ ВХЛЧ РП УФТБОЙГЕ, ДБЦЕ ЙОФЕТЧБМЩ НЕЦДХ УМПЧБНЙ НПЦОП УЮЙФБФШ Ч ЛБЛПК-ФП УФЕРЕОЙ ТБЪНЕФЛПК, ЖХОЛГЙС ЛПФПТПК -- РПНПЮШ ЮЕМПЧЕЛХ, ЮЙФБАЭЕНХ ФЕЛУФ, ПРТЕДЕМЙФШ, ЗДЕ ЛПОЮБЕФУС PDOP UMPCHP Y OBJUYOBEFUS DTHZPE, YMY LBL YDEOFIZHYGYTPCHBFSH PUPVEOOPUFY UFTHLFHTSC, FBLIE LBL ʺBZPMCHLY, YMY RTPUFSHCHE UYOFBLUIYUEULYE EDYOYGB CHTPOSCHDE RPDYUEOO. лПДЙТПЧБОЙЕ ФЕЛУФБ ДМС ЛПНРШАФЕТОПК ПВТБВПФЛЙ, Ч РТЙОГЙРЕ, ЛБЛ ТБУЫЙЖТПЧЛБ НБОХУЛТЙРФБ У РЕТЗБНЕОФБ, -- РТПГЕУУ ДЕМБОЙС СЧОЩН ОЕСЧОПЗП ЙМЙ РПДТБЪХНЕЧБЕНПЗП, РТПГЕУУ ХЛБЪБОЙС РПМШЪПЧБФЕМА ФПЗП, ЛБЛ ДПМЦОП ЙОФЕТРТЕФЙТПЧБФШУС УПДЕТЦЙНПЕ ФЕЛУФБ.

rpd SJCHLPN TBNEFLY RPOINBAF OBVPT UZMBYEOIK P TBBENEFLE, RTYNEOSENSCHI DMS LPDYTPCHBOYS FELUFPCH. SJCHL TBNEFLY DPMTSEO UREGYZHYGYTPCHBFSH, LBLBS TBNEFLB DPRHUFYNB, LBLBS TBNEFLB PVSBFEMSHOB, LBL PFMYUYFSH TBNEFLH PF FELUFB Y UFP TBNEFLB OBBYUIF. SGML RTEDPUFBCHMSEF TEYOYS DMS RETCHSCHI FTEI BDBYU, PFDEMSHOBS DPLHNEOFBGYS PVSCHUOP OEPVIPDYNB DMS RPUMEDOEK.

pUPVEOOPUFY SGML

fTY IBTBLFETYUFYLY SGML PFMYUBAF EZP PF RTPUYI SHCHLCH TBNEFLY.

PRYUBFEMSHOBS TBNEFLB

UYUFENB U PRYUBFEMSHOPK TBNEFLPK YURPMSHHEF LPDSH TBNEFLY, LPFPTSCHE RTPUFP RTEDPUFBCHMSAF OBCHBOYS DMS LBFEZPTYBGYY YUBUFEK DPLHNEOFB. LPDSH TBNEFLY, FBLIE LBL YMY \end(list) , RTPUFP YDEOFYZHYGYTHAF RPTGYA DPLKHNEOFB Y HFCHETSDBAF, YuFP "POB SCHMSEFUS RBTBZTBZHPN", YMY YuFP "LFP -- LPOEG RPUMEDOIN OBYUBFPZP URYULB" Y F.R. у ДТХЗПК УФПТПОЩ, УЙУФЕНБ У РТПГЕДХТОПК ТБЪНЕФЛПК ПРТЕДЕМСЕФ, ЛБЛБС ПВТБВПФЛБ ДПМЦОБ ЧЩРПМОСФШУС Ч ЛПОЛТЕФОПК ФПЮЛЕ ДПЛХНЕОФБ: "Ч ЬФПН НЕУФЕ ЧЩЪЧБФШ РТПГЕДХТХ PARA У РБТБНЕФТБНЙ 1, b Й x", ЙМЙ "РЕТЕДЧЙОХФШ МЕЧХА ЗТБОЙГХ ОБ 2НН МЕЧЕЕ, РТБЧХА ЗТБОЙГХ -- ОБ 2НН RTBCHEE, RTPRHUFYFSH PDOH UFTPLH Y CHUFBFSH O OPCHA MECHHA ZTBOYGH "Y F.R. h SGML YOUFTHLGYY, OEPVIPDYNSCHHE DMS PVTBVPFLY DPLKHNEOFB U LBPK-MYVP LPOLTEFOPK GEMSHA (OBRTYNET, DMS ZHPTNBFYTPCHBOYS), YuEFLP PFDEMSAFUS PF PF PRYUBFEMSHOPK,TBFUPTBE pVSCHUOP POY UPVTBOSCH CHOE DPLKHNEOFB CH PFDEMSHOSCHI RTPGEDHTBI YMY RTPZTBNNBI.

у ПРЙУБФЕМШОПК, Б ОЕ РТПГЕДХТОПК, ТБЪНЕФЛПК ПДЙО Й ФПФ ЦЕ ДПЛХНЕОФ НПЦЕФ ВЩФШ ПВТБВПФБО ТБЪОППВТБЪОЩНЙ РТПЗТБННБНЙ, ЛБЦДБС ЙЪ ЛПФПТЩИ НПЦЕФ РТЙНЕОСФШ ТБЪМЙЮОЩЕ ЙОУФТХЛГЙЙ ПВТБВПФЛЙ Л ФЕН ЕЗП ЮБУФСН, ЛПФПТЩЕ ПОБ УЮЙФБЕФ ЧБЦОЩНЙ. obrtynet, RTPZTBNNB BOBMYB UPDETTSYNPZP NPTsEF RPMOPUFSHA YZOPTYTPCHBFSH UOPULY, FPZDB LBL RTPZTBNNB ZHPTNBFYTPCHBOYS NPTCEF Y'CHMELBFSH Y UPVYTBFSH YI DMSs REYUUB tBMYUOSCHE CHYDSCH YOUFTHLGIK PVTBVPFLY NPZHF BUUPPGYTPCHBFSHUS U PDOK Y FPK CE YUBUFSHHA ZHBKMB. оБРТЙНЕТ, ПДОБ РТПЗТБННБ НПЦЕФ ЙЪЧМЕЛБФШ ЙЪ ДПЛХНЕОФБ ЖБНЙМЙЙ МАДЕК Й ЗЕПЗТБЖЙЮЕУЛЙЕ ОБЪЧБОЙС ДМС УПЪДБОЙС ЙОДЕЛУБ ЙМЙ ВБЪЩ ДБООЩИ, ФПЗДБ ЛБЛ ДТХЗБС, ПВТБВБФЩЧБАЭБС ФПФ ЦЕ УБНЩК ФЕЛУФ, НПЦЕФ РЕЮБФБФШ ЖБНЙМЙЙ Й ОБЪЧБОЙС ПФМЙЮБАЭЙНУС ЫТЙЖФПН.

FYRSCH DPLHNEOPHR

SGML CHCHPDYF RPOSFYE FIRB DPLHNEOFB , Y, UPPFCHEFUFCHEOOP, PRTEDEMEOYS FIRB DPLHNEOFB (definicija tipa dokumenta, DTD). dplkhneofshch UYUYFBAFUS FYRYYTPCHBOOSCHNY, FBL CE, LBL Y DTHZYE PVTVBFSHCHCHBENSCHE LPNRSHAFETBNY PVYAELFSHCH. FYR DPLKHNEOFB ZHPTNBMSHOP PRTDEDEMSEFUS EZP UPUFBCHNY YUBUFSNY Y YI UFTHLFHTPC. PRTEDEMEOYE, OBRTYNET, PFUEFB NPTSEF VShFSH FBLYN, UFP PO UPUFPYF Yb OBZPMCHLB Y, CHPNPTSOP, BCHFPTB, BL LPFPTSCHNY UMEDHEF BOOPFBGYS Y RPUMEDPCHBFEMSHOPUFSH PDEYOPVZPCHLBSH PDEYOPVZPCHLB. мАВПК ДПЛХНЕОФ Ч ПФУХФУФЧЙЕ ЪБЗПМПЧЛБ, Ч УППФЧЕФУФЧЙЙ У ЬФЙН ЖПТНБМШОЩН ПРТЕДЕМЕОЙЕН, ОЕ ВХДЕФ ЖПТНБМШОП СЧМСФШУС ПФЮЕФПН, ФБЛ ЦЕ ЛБЛ ОЕ ВХДЕФ ЙН СЧМСФШУС Й РПУМЕДПЧБФЕМШОПУФШ БВЪБГЕЧ, ЪБ ЛПФПТПК УМЕДХЕФ БООПФБГЙС, ОЕЧЪЙТБС ОБ ФП, ОБУЛПМШЛП РПИПЦ ОБ ПФЮЕФ ФБЛПК ДПЛХНЕОФ У ФПЮЛЙ ЪТЕОЙС ЮЙФБФЕМС- UEMPCELB.

rPULPMSHLH DPLHNEOFSHCH PFOPUSFUS L Y'CHEUFOSHCHN FIRBN, NPTsOP YURPMSH'PCHBFSH UREGYBMSHOHA RTPZTBNNH, OBSCCHCHBENHA BOBMYIBFTPPN (parser), ДМС ФПЗП, ЮФПВЩ ПВТБВПФБФШ ДПЛХНЕОФ, ХФЧЕТЦДБАЭЙК, ЮФП ПО ПФОПУЙФУС Л ЛПОЛТЕФОПНХ ФЙРХ, Й РТПЧЕТЙФШ, ДЕКУФЧЙФЕМШОП МЙ ЧУЕ ЬМЕНЕОФЩ, ФТЕВХЕНЩЕ ДМС ДБООПЗП ФЙРБ ДПЛХНЕОФПЧ, РТЙУХФУФЧХАФ Й ОБИПДСФУС Ч РТБЧЙМШОПК РПУМЕДПЧБФЕМШОПУФЙ. uFP EEE VPMEE CHBTsOP, TBOSCHE DPLKHNEOFSHCH PDOPZP FIRB NPZHF PVTBVBFSCHCHBFSHUS HOYZHYGYTPCHBOOSCHN PVTBPN. NPTsOP RYUBFSH VPMEE YOFEMMELFHBMSHOSHCHHE RTPZTBNNSHCH, YURPMSHKHAEYE OBBOIS, BLMAYUEOOSHCH YOZHPTNBGYPOOPK UFTHLFHTE DPLKhNEOFB.

oEBCHYUYNPUFSH DBOOSHI

Puopchobs gemsh rtpelfytpchboys SGML VSHMB chBTBOFIK FPZP, YuFP DPLHNEOF, KLPDITPCHOSHK UCMPBUOP RPMPCEISN, VHDEF RETOPK RTASPHZTHDSH ITPHZTHZH WRAS dChB EZP UCHPKUFCHB, PRYUBOOSHCHCHCHYE, PFCHEYUBAF FFPNH FTEVPCHBOYA O BVUFTBLFOPN HTPCHOE; FTEFSHE UCHPKUFCHP -- O HTPCHOE UFTPUEL VBKFPCH (UYNCHPMCHP), LPFPTSCHE UPUFBCHMSAF DPLKhNEOF. SGML RTEDPUFBCHMSEF PVPVEOOOSCHK NEIBOYEN UFTPLCHPK RPDUFBOPCHLY , FP EUFSH, RTPUFPK NBYYOOP-OEEBCHYUINSCHK URPUV HLBBOIS, UFP LPOLTEFOBS UYNCHPMCH CH DPLKHNEOFE H NPNEOF PVTBVPFLY DPLKHNEOFB DPMTSOB ʺ̱BNEOSFSHUS O ELPKZFTHA UPLKh. pDOP PYUECHIDOPE RTYNEOEOYE FFPNH NEIBOYNH -- PVEUREYUEOYE EDYOPK FETNYOPMPZYY; ДТХЗПЕ, Й ВПМЕЕ ЪОБЮЙФЕМШОПЕ, -- РТПФЙЧПДЕКУФЧЙЕ ЙЪЧЕУФОПК ОЕУРПУПВОПУФЙ ТБЪОЩИ ЛПНРШАФЕТОЩИ УЙУФЕН РПОЙНБФШ ОБВПТЩ УЙНЧПМПЧ ДТХЗ ДТХЗБ, ОБРТЙНЕТ, ПДОПК УЙУФЕНЕ РТЕДУФБЧМСФШ ЧУЕ ЗТБЖЙЮЕУЛЙЕ УЙНЧПМЩ, ОЕПВИПДЙНЩЕ РТЙМПЦЕОЙА, РХФЕН ПРЙУБФЕМШОПЗП ПФПВТБЦЕОЙС ОЕРЕТЕДБЧБЕНЩИ УЙНЧПМПЧ. UFTPLY, PRTEDEMSCHE FFYN NEIBOJNPN, OBSCCHCHBAFUUS UHEOPUFSNY (entiteti).

p RTEINHEUEUFFCHBI

uFP DBEF YURPMSHʺ̱PCHBOYE SGML CH TEBMSHOPK TSJOY? NOE POP UTBYKH DBMP CHPʺ̱NPTSOPUFSH RTPYʺ̱CHPDYFSH DPLKHNEOFSHCH H MAVPN FTEVKHENPN CHYDE. xDPVOP PLBMBMPUSH Y OBRJUBOYE "CHPTDPCHSCHI" VHNBCEL CH RTYCHSHCHUOPK UTEDE XEmacs VEY YURPMSHʺ̱CHBOYS Windows. Chue YURPMSHʺ̱PCHBOOSCHE RTPZTBNNSC -- VEURMBFOSC Y TBURTPUFTBOSAPHUS CH YUIPDOSCHI FELUFBI, UFP RPCHPMYMP HUFBOPCHYFSH YI O CHUEI YURPMSHʺ̱KHENSCHI NOPC UYUFENBI. rTYUEN PLBBMPUSH, UFP OBBYUBFSH TBVPFBFSH U SGML CHPCHUE OE UMPTSOP, LBCDSCHK, LFP IPFSh TBB TEDBLFYTPCHBM WWW UFTBOYULH, OE YURKHZBEFUS CHYDB LPOUFTHLGYK .

rPFPN HCE, RP NETE RPUFEREOOPZP Yʺ̱HYUEOYS SGML, S PUPOBM, UFP LFB FEIOYLB DBEF ZTPNBDOPE LPMYUEUFCHP ChPNPTSOPUFEK RP UTBCHOEOYA U FYRYUOPK "OBUFPZTBZH FYRYUOPK "OBUFPZTBZH FYRYUOPK"

rTPDHLFYCHOPUFSH YuEFLP TBDEMEOOOSCHE RTPGEUUSCH CHCHPDB YOZHPTNBGYY Y HER ZHPTNBFYTPCHBOYS RPCHPMSAF BCHFPTH UPUTEDPFPYUYFSHUS O Y'MPTSEOYY NSCHUMEK, OE PFCHMELBSUSH O DCHYZFELUZFFBOLLYU

eJOBS UFYMYUFYLB MEZLP CHSHCHDETSYCHBFSH TBMYUOSCHE DPLHNEOFSHCH H EDYOPN UFIME, YURPMSHEKHS EDYOKHA FETNYOPMPZYA. eUMMY UFYMSH YMY FETNYOSCH OHTSOP Yʺ̱NEOYFSH, FFP DEMBEFUS TBPN PE CHUEI DPLKHNEOFBI, OE FTPZBS YI UPDETSYNPE.

rCHFPTOPE YURPMSH'CHBOYE FFPF FETNYO, IPTPYP ʺ̱OBLPNSCHK RTPZTBNNYUFBN, Pʺ̱OBYUBEF OBMYUYE CHPNPTSOPUFY YURPMSHʺ̱PCHBFSH DEFBMY UFBTSCHI RTPELFCH CH OPCHSCHI, U NYINBMSHOSHCHNYʺ̱NEO. yuBUFSH DPLHNEOFB, PZHPTNMEOOBS CH CHYDE SGML-MMENEOFB, NPCEF RETEOPUIFSHUS CH DTHZYE DPLHNEOFSHCH, MEZLP RPCHFPTSFSHUS CH TBOSCHI NEUFBI FELUFB.

dPMZPCHEYUOPUFSH YOZHPTNBGYY yʺ̱-ʺ̱B FPZP, YuFP SGML -- RTPUFPK Y UFBODBTFOSCHK ZHPTNBF ITBOEOIS DBOOSCHI, PFUHFUFCHHEF OEPVVIPDYNPUFSH RETEZHPTNBFYTPCHBFSH YI CHCHYDH HUFBTECHTBBOYS YI CHYDH HUFBTECHTBBOYS YYFBTECHMBZMNN. YOZHPTNBGYS RTPUFP DPUFKHROB OBCHUEZDB. POB OEUEF U UPVPK CHUE OEPVIPDYNPE DMS UPDBOYS DPLHNEOFB.

mHYUYEE HRTBCHMEOYE DBOOSCHNY y SGML NPTsOP PRTEDEMSFSh YOZHPTNBGYPOOSCHE MENEOFSHCH Y NBOIRHMSGYY U ONYY U RTPYCHPMSHOPK UFEREOSHA DEFBMSHOPUFY. tbneyueooshch MENEOFSHCH NPZHF YNEFSH BFTYVKhFSHCH, PRTEDEMSAEYE IBTBLFETYUFYLY Y UCHPKUFCHB LMENEOFCH. yFB YOZHPTNBGYS OE RTEDOBOBBYUEOB DMS REYUBFY, OP NPTSEF RPNPYUSH CH HRTBCHMEOYY MENEOFBNY DBOOSCHI. OBRTYNET, BFTYVHF ID (YDEOFYZHYLBFPT) NPTCEF KHOILBMSHOSHCHN PVTBPN YDEOFIJYGYTPCHBFSH PDIO BVBG, YMY GEMSHCHK TBDEM, RTYNEYUBOYE, YMMAUFTTBGYA, -- MDBAVDOYE,

YOZHPTNBHYS
fBL LBL YDEOFIZHYLBFPTSCH SCHMSAFUS NBYOOP-YUYFBENSCHNY, POY NPZHF UCHSSCHCHBFSH NETSDH UPVPK YOZHPTNBGYA Y YURPMSH'PCHBFSHUS DMS TB'OPPVTB'OPZP HRTBCHMEOYS. OBRTYNET:
  • lPOFTPMYTPCHBFSH VEʺ̱PRBUOPUFSH DPUFHRB L YOZHPTNBGYY, RPCHPMSS FPMSHLP PTEDEMEOOOSCHN MADSN RTPUNBFTYCHBFSH YMY Yʺ̱NEOSFSH EE.
  • bCHFPNBFYYTPCHBFSH RETENEEEOYE YOZHPTNBGYY -- OBRTYNET, PVOCHMEOYE DBOOSHI H PDOPN NEUFE NPTSEF YOYGYYTPCHBFSH PVOCHMEOYE FPK TSE YOZHPTNBGYY CH DTHZYI RTYMPSEO.

tBEDEMSENPUFSH ChPNPTSOPUFSH TBVPFSCH UP UFTHLFKhTYTPCHBOOSCHNY LPNRPOEOFBNY DPLKHNEOFB RPCHPMSEF UFTPYFSH GEMSHCHK DPLKHNEOF YY UPUFBCHOSCHI YUBUFEK, TBVTPUBOOOSCHI RP PTZBOYBGYBG FP RP'CHPMSEF RPMSh'PCHBFEMSN DEMYFSHUS YOZHPTNBGYEK VEI HER DHVMYTPCHBOYS.

nPVYMSHOPUFSH h YOZHPTNBGIPOOSCHI UEFSI, PVYAEDYOSAEYI TBBOPPVTBOBOSCHE LPNRSHAFETSCH, PRETBGYPOOSCHE UYUFENSCH Y RTYMPTSEOIS, NPVYMSHOPUFSH UFBOCHYFUS LMAYUPN LP CHUEPHEPTVEEK DPUFHROPBGNEKFYFHR. rPULPMSHLKH SGML OE ʺ̱BCHYUYF PF BRRBTBFKhTSCH Y RTYMPTSEOIK, NPTSOP MEZLP PVNEOYCHBFSHUS DPLKHNEOFBNY NETSDH TBMYUOSCHNY UYUFENBNY.

ZYVLPUFSH CH RTYMPTSOYY SGML RPʺ̱CHPMSEF YURPMSHʺ̱PCHBFSH YOZHPTNBGYA DBMELP ʺ̱B TBNLBNY "OBUFPMSHOPK FYRPZTBZHYY". OBRTYNET:

  • UFTBOYGSCH WWW;
  • YOZHPTNBGIPOOSCHE VBSHCH DBOOSCHI;
  • DYBZOPUFYUEULYE / LURETFOSCHHE UYUFENSCH;
  • LMELFTPOOBS RPYUFB;
  • ZYRETFELUFCHBS DPLHNEOFBHYS;
  • RHVMILBGYY O CD-ROM-u;
  • YOFETBLFICHOSCHE LMELFTPOOSCHE NBOHBMSCH.

rPYENH SGML?

rPYENH OE Riječ? rPFPNKh, UFP LFP BLTSCHFShCHK ZHPTNBF. rPFPNKh, UFP LFP ZHPTNBF PDOPZP RTYMPTSEOIS. rPFPNKh, UFP LFPZP RTYMPTSEOIS OEF RPD AOILUBNY, U LPFPTSCHNY S TBVPFBA. rPFPNH, UFP LFP OE FELUFPCHSHCHK ZHPTNBF. rPFPNH, UFP OEF UTEDUFCH BCHFPNBFYUEULPK ZOEETBGYY FBLYI DPLHNEOPCH. rPFPNKH, UFP OEF FPMLPCHSCHI UTEDUFCH HRTBCHMEOYS CHETUYSNY Y LPMMELFICHOPK TBVPFSCH. rPFPNKh, YuFP LFP ZhPTNBF TBNEFLY REYUBFY, BOE UNSCHUMPPK UFTHLFKhTSCH, Y OEF CHPNPTSOPUFY YI UPPFOPUYFSH. rPFPNH, UFP RTY LURPTFE RPMHYUBEFUS UCHETIEOOP OEKHDPCHMEFCHPTYFEMSHOSHCHK HTML. rPFPNH, UFP LBYUEUFCHP CHETUFLY Y REYUBFY OYCE UTEDOEZP.

rPYENH OE T E X? rPFPNH, UFP LFP UMYYLPN OYYLPHTPCHOSCHSHK SHCHL. eZP OE DBYSH CH THLY OBYUYOBAENKH. rPFPNH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, BOE UNSCHUMPPK UFTHLFHTSCH. rPFPNKh, UFP NBMP T E X-PTYEOFYTPCHBOOSCHI TEDBLFPTPCH. rPFPNKh, UFP OEF HDPCHMEFCHPTYFEMSHOSCHI UTEDUFCH LURPTTFB Ch Word.

rPYENH OE HTML? rPFPNKH, UFP UBNP RPOSFIYE HTML UYMSHOP TBNSCHFP ZPOLPK WWW ʺ̱B LPNNETGYEK Y CHPKOPK RTPYʺ̱CHPDYFEMEK VTBHJETCH DTHZ U DTHZPN. rPFPNH, UFP HTML UFTDBEF CHUE FEN CE OEDPUFBFLPN: PTYEOFYTPCHBO O RTEDUFBCHMEOYE, B O OB UFTHLFHTH. rPFPNKh, YuFP PO PYUEOSH VEDEO CHSHCHTBYFEMSHOSHCHNY UTEDUFCHBNY, Y PFUHFUFCHHAF CHPNPTSOPUFY EZP TBUYTEOYS. rPFPNKh, UFP OE TEYEO RTPVMENB LPTTELFOPK THUIZHYLBGYY. rPFPNKh, UFP OEF HDPCHMEFCHPTYFEMSHOSCHI UTEDUFCH LURPTTFB Ch Word.

SGML RTPF WYSIWYG

DMS FEI, LFP RTYCHSHL RPMSHʺ̱PCHBFSHUS FPMSHLP "procesor teksta"-BNY, OBRTYNET, MS Word YMY WordPerfect, NPTSEF VSHCHFSH YOFETEUOP UPRPUFBCHMEOYE YI U SGML YOUFTHNEOFBNY. yFY DCHE ZTHRRSHCH RTPZTBNNOSCHI UTEDUFCH, OEUNPFTS O UIPTSEUFSH TEYBENSCHI OBDBYu -- RTPYJCHPDUFCHP DPLKHNEOPCHP -- CHEUSHNB DTHZ PF DTHZB PFMYUBAFUS RP BTIYFY.

Procesor teksta -- LFP YOFEMMELFHBMSHOBS RYYHEBS NBYYOLB. пО ПТЙЕОФЙТПЧБО ОБ ТБВПФХ У ЧЙЪХБМШОЩН РТЕДУФБЧМЕОЙЕН ФЕЛУФБ, ИБТБЛФЕТЙЪХАЭЕЗПУС ОБВПТПН УФЙМЕК: УФЙМЕК УЙНЧПМПЧ (ЫТЙЖФ, ЛЕЗМШ, ОБЮЕТФБОЙЕ), БВЪБГЕЧ (ЛТБУОБС УФТПЛБ, ЧЩТБЧОЙЧБОЙЕ, РПМПЦЕОЙЕ РП ЫЙТЙОЕ УФТБОЙГЩ), УФТБОЙГ (ЛПМПОФЙФХМЩ, УОПУЛЙ), ТБЪДЕМПЧ Й ДПЛХНЕОФПЧ (ЖПТНБФ ВХНБЗЙ, PZMBCHMEOYE), Y RTPUYI. Procesor teksta OE TBVPFBEF U CHOHFTEOOOK UFTHLFHTPC DPLHNEOFB.

SGML TEDBLFPT, OBRTPFYCH, PTYEOFYTPCHBO O TBVPPFH UPDETTSYNSCHN DPLHNEOFB. DMS SGML TEDBLFPTB, OBRTYNET, TBDEM -- LFP MENEOF, CH LPFPTSCHK NPZHF CHLMAYUBFSHUS RPDTBDEMSCH, B OE RTPNETSHFPL PF PDOPZP BVBGB, OBVTBOOPZP UFYMEN "bZMSTHBLZPL" DDP proces, proces DMSTHBLZP ili DPS.

FP RPCHPMSEF BCHFPTH UPUTEDPFPYUYFSHUS O UPDETTSBOY FELUFB, BOE CHPYFSHUS U EZP ZHPTNBFYTPCHBOYEN Y CHSHCHVPTPN UFYMEK. chYHBMSHOBS UFYMYUFYLB DPLKHNEOFB PRTEDEMSEFUS RTY EZP LURPTFE CH CHCHIPDOSHE ZHPTNBFSCH, B O RTY OBVPTE FELUFB.

p RTPZTBNNNOPN PVEUREYEOYY

uFPVSC OBYUBFSH TBVPFBFSH U DPLKHNEOFBNY H SGML RPMShʺ̱PCHBFEMA OKHTSOSCH DCHB PUOPCHOSHI UTEDUFCHB: TEDBLFPT Y UTEDUFCHB LURPTFB (ZHPTNBFYTPCHBOIS).

SGML-TEDBLFPT

SGML-TEDBLFPT PFMYUBEFUS LBL PF RTYCHSHCHUOSCHI FELUFPCHSCHI TEBLFPTPCH, FBL Y PF "procesor teksta"-FC. pF RETCHSCHI -- OBMYYUYEN RPDDETTSLY UFTHLFHTYTPCHBOOSCHI DPLKHNEOPCHCHI, PF CHFPTSCHI -- PFUHFUFCHYEN RPDDETTSLY CHYHBMSHOPZP ZHPTNBFYTPCHBOYS. tedblfpt tbvytbef DTD tedblfytkhenpzp dplkhneofb y "CHEDEF" RPMShʺ̱Pchbfems h UPPFCHEFUFCHYY U OIN. OBRTYNET, EUMY DTD

, H LPFPTPN NPZKhF CHUFTEYUBFSHUS YMY , FP RPMShJPCHBFEMA, TEDBLFYTHAEENH EMENEOF
. SGML-TEDBLFPT FBLCE PVSCHUOP UPDETCYF UTEDUFCHB OBCHYZBGYY RP YETBTIY DPLHNEOF.

yYUMMB RPRHMSCHI SGML-TEBLFPTPCH NPTsOP OBCHBFSh ArborText ADEPT*Editor , SoftQuad Autor/Editor , psgml , Adobe FrameMaker+SGML , Corel WordPerfect ,

uTEDUFCHB ZHPTNBFYTPCHBOYS

uHEEUFCHHEF NOPTSEUFCHP UTEDUFCH TBVPFSCH U SGML FELUFBNY. VOMSHYHA YI YUBUFSH UPUFBCHMSAF UTEDUFCHB ZHPTNBFYTPCHBOYS -- LLURPTFB SGML CH DTHZYE ZHPTNBFSH DMS REYUBFY, RTPUNPFTB Y F.R. chshchipdosche ZhPTNBFShch NPZKhF VShchFsh MAvshny, bchyus mysh PF DPUFKhROPZP RTPZTBNNOPZP PVEUREYUEOYS Y OHTSD RPMShHPCHBFEMS. OBRTYNET, S YURPMSHKHA LPOCHETFETSCH H HTML, RTF I L A T E X.

Godine 1986, mnogo prije nego što je ideja o stvaranju web mreže oživjela, univerzalni standardizirani jezik za označavanje SGML ( Standardizirani generalizirani markup jezik) je usvojen kao međunarodni standard (ISO 8879) za definisanje markup jezika, iako SGML postoji od kasnih šezdesetih. Korišćen je za opisivanje jezika za označavanje, dok je autoru omogućavao da da formalne definicije svakom elementu i atributu jezika.

HTML jezik je prvobitno bio samo jedna od SGML aplikacija. Opisao je pravila po kojima se informacije pripremaju za World Wide Web. Dakle, HTML jezik je skup SGML propisa, formuliranih u obliku definicije tipa dokumenta(DTD) koji objašnjavaju šta tačno označavaju oznake i elementi. HTML DTD šema je pohranjena u web pretraživaču.

Nedostaci HTML jezika uključuju sljedeće:

  • HTML ima fiksni set oznaka. Ne možete kreirati vlastite oznake koje drugi korisnici razumiju.
  • HTML je isključivo tehnologija prezentacije podataka. HTML ne nosi nikakve informacije o značenju sadržaja sadržanog u oznakama.
  • HTML- "ravnog" jezika. U njemu nije definiran značaj oznaka, pa se ne može koristiti za opisivanje hijerarhije podataka.
  • Preglednici se koriste kao platforma za aplikacije. HTML nema dovoljno snage da kreira web aplikacije na nivou kojem web programeri trenutno teže. Na primjer, nemoguće je razviti aplikaciju za profesionalnu obradu dokumenata i pretraživanje u HTML jeziku.
  • Veliki obim mrežnog saobraćaja. Postojeći HTML dokumenti koji se koriste kao aplikacije preopterećuju Internet velikom količinom saobraćaja u sistemima klijent-server. Primjer bi bio slanje velikog dokumenta preko mreže kada je potreban samo mali dio dokumenta.

Dakle, s jedne strane, HTML jezik je vrlo zgodan alat za označavanje dokumenata za korištenje na webu, a s druge strane, dokument označen u HTML-u ima malo informacija o svom sadržaju. Ako jedan ili drugi dokument nosi dovoljno potpune informacije o svom sadržaju, postaje relativno lako izvršiti automatsku generaliziranu obradu i pretraživanje u datoteci u kojoj se dokument pohranjuje. SGML jezik vam omogućava da pohranite informacije o sadržaju dokumenta, međutim, zbog svoje složenosti, nikada se nije koristio tako široko kao HTML.

Grupa stručnjaka za SGML predvođena Jonom Bosakom iz Sun Microsystems-a započela je rad na stvaranju podskupa SGML-a koji bi mogla usvojiti Web zajednica. Odlučeno je da se uklone mnoge nebitne SGML karakteristike. Tako preuređen jezik nazvan je XML. Utvrđeno je da je pojednostavljena verzija znatno pristupačnija od originala, sa samo 26 stranica specifikacija u poređenju sa preko 500 stranica SGML specifikacija.

Razmotrimo detaljnije strukturu i karakteristike ovog jezika.

XML (eXtensible Markup Language)- W3C preporučeni jezik za označavanje. XML- tekstualni format, dizajniran za pohranjivanje strukturiranih podataka, razmjenu informacija između programa i stvaranje specijaliziranih jezika za označavanje na njegovoj osnovi. XML je pojednostavljeni podskup SGML jezika.

XML jezik ima sljedeće dostojanstvo:

  • Ovo je format dokumenta orijentisan prema ljudima, razumljiv je i osobi i računaru.
  • Podržava Unicode.
  • Osnovne strukture podataka kao što su zapisi, liste i stabla mogu se opisati u XML formatu.
  • To je samodokumentirajući format koji opisuje strukturu i nazive polja, kao i vrijednosti polja.
  • Ima dobro definiranu sintaksu i zahtjeve za raščlanjivanje, što mu omogućava da ostane jednostavan, efikasan i dosljedan.
  • Široko se koristi za skladištenje i obradu dokumenata;
  • To je format zasnovan na međunarodnim standardima;
  • Hijerarhijska struktura XML-a je pogodna za opisivanje gotovo svake vrste dokumenta;
  • To je običan tekst, bez licenciranja i bilo kakvih ograničenja;
  • Nezavisna od platforme;
  • To je podskup SGML-a, za koji je akumulirano mnogo iskustva i kreirane su specijalizovane aplikacije;

Za poznate nedostatke jezici uključuju sljedeće:

  • XML sintaksa je suvišna.
    • Veličina XML dokumenta je značajno veća od binarne reprezentacije istih podataka (oko 10 puta).
    • Veličina XML dokumenta je znatno veća od dokumenta u alternativnim tekstualnim formatima za prijenos podataka (na primjer, JSON, YAML) a posebno u formatima podataka optimiziranim za određeni slučaj upotrebe.
    • XML redundantnost može uticati na performanse aplikacije. Troškovi skladištenja, obrade i prenošenja podataka rastu.
    • Za veliki broj zadataka nije potrebna puna snaga XML sintakse, a mogu se koristiti mnogo jednostavnija i učinkovitija rješenja.
  • XML prostore imena je teško koristiti i teško implementirati u XML parsere.
  • XML nema podršku za tipove podataka ugrađenu u jezik. Ne sadrži koncepte "cijeli brojevi", "stringovi", "datumi", "boolean vrijednosti" itd.
  • Hijerarhijski model podataka koje nudi XML je ograničen u poređenju sa relacionim modelom i objektno orijentisanim grafovima.

Uopšteno govoreći, XML se može posmatrati ne samo kao novi jezik za označavanje, već i kao osnova za čitavu porodicu tehnologija:

Tabela 9.1. Struktura XML porodice
XML Tehničke smjernice za korištenje XML-a
DTD Definicija tipa dokumenta (šema)
XDR XML format Smanjena(Microsoft šema)
XSD Definicija XML sheme (W3C sheme)
Imenski prostor Metoda za određivanje naziva elemenata i atributa
XPath Jezik XML putanje
xLink Jezik XML veze
XPointer XML pokazivač jezik
DOM API za objektni model dokumenta
SAX Jednostavan XML API
XSL proširivo jezik lista stilova
XSL-FO Formatiranje objekata XSL
XSLT Transformirajte jezik XSL
XInclude XML uključuje sintaksu

Markup jezici: SGML, HTML, XML. Njihova međusobna povezanost.

HTML jezik je prvobitno bio samo jedna od SGML aplikacija. Opisao je pravila po kojima se informacije pripremaju za World Wide Web. Dakle, HTML je skup SGML propisa, formuliranih kao definicija tipa dokumenta (DTD), koji objašnjavaju šta tačno oznake i elementi predstavljaju. HTML DTD šema je pohranjena u web pretraživaču.

Dakle, s jedne strane, HTML jezik je vrlo zgodan alat za označavanje dokumenata za korištenje na webu, a s druge strane, dokument označen u HTML-u ima malo informacija o svom sadržaju. Ako jedan ili drugi dokument nosi dovoljno potpune informacije o svom sadržaju, postaje relativno lako izvršiti automatsku generaliziranu obradu i pretraživanje u datoteci u kojoj se dokument pohranjuje. SGML jezik vam omogućava da pohranite informacije o sadržaju dokumenta, ali zbog svoje složenosti nikada se nije koristio tako široko kao HTML.

Grupa stručnjaka za SGML predvođena Jonom Bosakom iz Sun Microsystems-a započela je rad na stvaranju podskupa SGML-a koji bi mogla usvojiti Web zajednica. Odlučeno je da se uklone mnoge nebitne SGML karakteristike. Tako preuređen jezik nazvan je XML. Pojednostavljena verzija se pokazala znatno pristupačnijom od originalne, sa samo 26 stranica specifikacija u poređenju sa preko 500 stranica SGML specifikacija.

Prednosti XML jezika.

  • Podržava Unicode.
  • Nezavisna od platforme;

Web Services

web servis(web servis) - softverski sistem koji ima URI identifikator i čiji su javni interfejsi definisani u XML-u. Opis ovog softverskog sistema mogu pronaći druge aplikacije koje sa njim mogu komunicirati u skladu sa ovim opisom putem poruka zasnovanih na XML-u i prenošenih korištenjem Internet protokola. Web usluga je jedinica modularnosti kada se koristi servisno orijentisana arhitektura aplikacije.

Servisno orijentisana arhitektura(SOA, servisno orijentisana arhitektura) - modularni pristup razvoju softvera zasnovan na korišćenju servisa sa standardizovanim interfejsima.

SOA se zasniva na principima ponovne upotrebe IT funkcionalnih elemenata, objedinjavanja standardnih operativnih procesa. Komponente programa mogu se distribuirati u različitim mrežnim čvorovima i nude se kao nezavisne i slabo povezane, zamjenjive aplikacijske usluge.

Interfejs komponente SOA programa obuhvata detalje implementacije određene komponente (OS, programski jezik, itd.).

.NET web servisi imaju sljedeće prednosti:

  • Otvoreni standardi. U web servisima nema skrivenih ili nedostupnih elemenata. Svaki aspekt tehnologije, od načina na koji se web servis nalazi do načina na koji se opisuje i komunicira s njim, definiran je javnim standardima.
  • cross-platform. Programski jezik koji vam omogućava da kreirate XML dokumente i šaljete informacije putem HTTP-a omogućava vam interakciju sa bilo kojom web uslugom. Moguće je primiti web uslugu iz sistema koji nije .NET.
  • Jednostavnost.
  • Podrška za poruke na jeziku čitljivom za ljude. Prelazak sa binarnih standarda koji se koriste u COM-u i CORBA-i na XML tekst je olakšao ispravljanje grešaka i omogućio interakciju sa web servisima preko normalnih HTTP kanala.

Implementacija .NET web usluga je jednostavna kao pozivanje udaljene web usluge ili pozivanje metode lokalne klase. Ovo se postiže korištenjem alata koje pruža .NET Framework za kreiranje kompletne web usluge bez potrebe za učenjem detalja o tome kako funkcioniraju standardi kao što su SOAP, WSDL i UDDI. Pri tome se izvode sljedeće radnje:

  1. Web usluga je razvijena kao .NET klasa s atributima koji ga identificiraju kao web servis s određenom funkcionalnošću.
  2. .NET okruženje automatski generiše WSDL dokument koji opisuje kako klijent treba da komunicira sa veb uslugom.
  3. Korisnik pronalazi generiranu web uslugu i može dodati odgovarajuću web referencu projektu Visual Studio .NET.
  4. .NET automatski provjerava valjanost WSDL dokumenta i generiše proxy klasu koja omogućava korisniku interakciju s web uslugom.
  5. Potrošač poziva jednu od metoda vaše klase web usluge. Sa njegove tačke gledišta, ovaj poziv se ne razlikuje od pozivanja metode bilo koje druge klase, iako se interakcija zapravo odvija sa proxy klasom, a ne sa web servisom.
  6. Proxy klasa pretvara proslijeđene parametre u SOAP poruku i šalje je web servisu.
  7. Proxy klasa tada prima SOAP odgovor, pretvara ga u odgovarajući tip podataka i vraća ga kao normalan .NET tip podataka.
  8. Potrošač koristi primljene podatke.

.NET web servisi koriste ASP .NET tehnologiju, koja je dio .NET Frameworka. Takođe zahteva podršku od Microsoft IIS servera.

Glavni nedostaci web servisa su niže performanse i veći mrežni promet u odnosu na tehnologije kao što su RMI, CORBA, DCOM zbog korištenja XML tekstualnih poruka.

Standardi za web usluge.

WSDL specifikacija

Svaka web usluga pruža WSDL (Web Service Description Language) dokument koji opisuje sve što je klijentu potrebno za rad s tom uslugom. WSDL dokument pruža jednostavan i dosljedan način za programera da specificira sintaksu za pozivanje bilo koje web metode. Štaviše, ovaj dokument vam omogućava da koristite alate za automatsko generisanje proxy klasa kao što su oni uključeni u okruženja Visual Studio .NET i .NET Framework. Uz ove alate, korištenje web usluge je jednostavno kao korištenje lokalne klase.

WSDL dokument ima format zasnovan na XML-u koji kategorizuje informacije u pet grupa. Prve tri grupe su apstraktne definicije koje su nezavisne od specifičnosti platforme, mreže ili jezika, dok preostale dvije grupe uključuju specifične opise.

SOAP protokol

Komunikacija između web servisa i njihovih klijenata obavlja se putem poruka u XML formatu.

SOAP (Simple Object Access Protocol) je protokol za poruke za odabir web servisa.

Osnovna ideja iza SOAP standarda je da poruke treba da budu kodirane u standardizovanom XML formatu.

Pored SOAP poruka, možete koristiti metode GET i POST HTTP protokola za komunikaciju sa .NET uslugama.

Prednosti korištenja SOAP formata u odnosu na druge formate za prijenos podataka:

  • XML-kodiranje struktura podataka i skupova podataka pomoću SOAP-a je jednostavno kao i kodiranje podataka jednostavnih skalarnih tipova.
  • Kada koristite SOAP poruke, obezbeđeni su dodatni alati za jednostavno dodavanje bezbednosnih funkcija ili funkcija praćenja, na primer.
  • SOAP alati su dostupni za različite programske jezike (pa čak i za prethodne verzije Microsoft C++ i Visual Basic). Inače, da biste omogućili komunikaciju sa uslugom putem GET i POST metoda HTTP protokola, očito ćete morati sami konstruirati string upita, a zatim analizirati odgovor.

DISCO standard

DISCO standard pruža najjednostavniji način pristupa datotekama manifesta, omogućavajući vam da grupišete reference web usluga.

DISCO datoteka može uključivati ​​datoteke s različitih web servera i podržava "dinamičko pretraživanje" - automatsko pretraživanje direktorija datoteka web usluga na serveru.

Manifestne datoteke su korisne jer grupišu mnoge web usluge u jednu listu, ali onemogućavaju klijente da pronađu određenu vrstu web usluge bez navođenja imena kompanije za razvoj.

UDDI specifikacija

UDDI (Univerzalni opis, otkrivanje i integracija) specifikacija izbjegava ove probleme korištenjem posebnog spremišta (repozitorija) gdje preduzeća i organizacije mogu smjestiti podatke o uslugama koje pružaju. Više od 100 kompanija je pionir UDDI tehnologije (kompletna lista se može naći na http://www.uddi.org/community.html), uključujući Sun i Microsoft. Ove kompanije su zajedno razvile nacrt UDDI specifikacije, koja je standardizovana nakon 18 mjeseci.

Informacije u ovom spremištu moraju se ažurirati ručno. U tu svrhu, neki "operateri čvorova" čuvaju identične kopije UDDI spremišta. Ove kompanije obezbeđuju skladištenje navedenog repozitorija i besplatan pristup njemu za promociju web serijala. Osim toga, Microsoft je uključio verziju UDDI-a u Windows .NET serverski softver za korištenje na korporativnim intranetima.

UDDI prodavnica sadrži informacije o preduzećima koja pružaju web usluge, tipu svake usluge i veze do informacija i specifikacija u vezi s tim uslugama. Sam UDDI interfejs je web servis. Za registraciju ili traženje usluge pošaljite SOAP poruku.

WEB - integracija.

Zadatak web integracije je da kombinuje heterogene web aplikacije i sisteme u jedno okruženje zasnovano na Webu.

Prakticiraju se sljedeći pristupi web integraciji:

· Integracija na nivou prezentacije. Ovaj nivo omogućava korisniku interakciju sa aplikacijom. Integracija sloja prezentacije daje pristup korisničkom interfejsu udaljenih aplikacija.

· Integracija na nivou funkcionalnosti. Ova integracija podrazumijeva obezbjeđivanje direktnog pristupa poslovnoj logici aplikacija. Ovo se postiže direktnom interakcijom aplikacija sa API(interfejs za programiranje aplikacije) ili interakcija kroz web usluge.

· Integracija na nivou podataka. U ovom slučaju, pristup jednom ili više baze podataka koristi udaljena aplikacija.

· Sveobuhvatna integracija. Komercijalna rješenja za web integraciju obično uključuju sve tri vrste integracije.

Korištenje web integracije je korisno iz više razloga:

· Web integracija omogućava vam da implementirate informacione sisteme zasnovane na aplikacijama trećih strana bez potrebe da razumete njihove roditeljske sisteme, softverska okruženja i arhitekture baza podataka.

· SOA i web usluge koristiti programski jezik i platformski nezavisna sučelja između korporativnih aplikacija IT infrastrukture. Ovo daje očigledne prednosti u podršci, upravljivosti, postavljanju informacionih mreža.

· Web integracija vam omogućava da dizajnirate složenu funkcionalnost kombinovanjem heterogenih komponenti putem protokola web usluga.

· Web integracija vam omogućava da koristite web usluge programera.

· Web integracija vam omogućava da razvijete interfejse za programiranje aplikacija putem protokola web usluga bez programiranja.

Za web integraciju se obično koristi komercijalni softver ili popularne tehnologije, kao npr PHP/Python/Perl, X Forms, SOAP itd.

Integracija zasnovana na XML-u

Umjesto da implementirate interakciju između svakog para sistema, samo trebate naučiti svakog od njih da "govori" XML jezikom. Drugim riječima, sve se svodi na razvoj nekoliko omoti (wrapper - omotač, softverski alat za kreiranje sistemske ljuske za standardizaciju eksternih poziva i promenu funkcionalne orijentacije trenutnog sistema), koji će sa standardnog XML jezika integrisanog sistema prevesti na jezik razumljiv svakom sistemu posebno.

· razvojni alati i standardne biblioteke za XML postoje na skoro svim platformama i za najpopularnije programske jezike;

· Metode rada sa XML-om su dovoljno standardne da obezbede da se iste tehnike mogu koristiti u različitim sistemima;

Informaciju formatiranu kao XML mogu obraditi ne samo mašine, već i ljudi (što mnogo olakšava otklanjanje grešaka).

U principu, integracija XML šeme se suštinski ne razlikuje od integracije zasnovane na bilo kom drugom uobičajenom standardu. Međutim, ima niz značajnih prednosti:

· XML jezici ne zavise od hardverskih i softverskih platformi, što vam omogućava da povežete heterogene sisteme;

· ekspresivna moć XML-a je dovoljno velika da opiše podatke gotovo svake složenosti;

Integracija zasnovana na XML-u se praktično implementira unutar protokola:

· XML-RPC. Ovo je protokol udaljenog poziva procedure koji šalje podatke u XML formatu preko TCP porta 80, tj. HTTP port.

· WDDX(Web Distributed Exchange). To je mehanizam za razmjenu složenih struktura podataka preko HTTP protokola. Protokol se ne zasniva na strukturama, već na događajima.

· ebXML(elektronsko poslovanje XML) - XML ​​za elektronsko poslovanje. Primarna svrha je da se obezbedi otvorena XML infrastruktura za bezbedno globalno korišćenje informacija e-poslovanja. Web usluge (web usluge).

XML (eXtensibleMarkupLanguage) je jezik za označavanje koji preporučuje W3C. XML je tekstualni format dizajniran za pohranjivanje strukturiranih podataka, razmjenu informacija između programa i stvaranje specijaliziranih jezika za označavanje na njegovoj osnovi. XML je pojednostavljeni podskup SGML jezika .

XML jezik ima sljedeće dostojanstvo:

  • Ovo je format dokumenta orijentisan prema ljudima, razumljiv je i osobi i računaru.
  • Podržava Unicode.
  • Osnovne strukture podataka kao što su zapisi, liste i stabla mogu se opisati u XML formatu.
  • To je samodokumentirajući format koji opisuje strukturu i nazive polja, kao i vrijednosti polja.
  • Ima dobro definiranu sintaksu i zahtjeve za raščlanjivanje kako bi bio jednostavan, efikasan i dosljedan.
  • Široko se koristi za skladištenje i obradu dokumenata;
  • To je format zasnovan na međunarodnim standardima;
  • Hijerarhijska struktura XML-a je pogodna za opisivanje gotovo svake vrste dokumenta;
  • To je običan tekst, bez licenciranja i bilo kakvih ograničenja;
  • Nezavisna od platforme;
  • To je podskup SGML-a za koji je akumulirano mnogo iskustva i kreirane su specijalizovane aplikacije;

Za poznate nedostatke jezici uključuju sljedeće:

· XML sintaksa je suvišna.

· Veličina XML dokumenta je znatno veća od binarnog prikaza istih podataka.

· Veličina XML dokumenta je znatno veća od dokumenta u alternativnim formatima za prenos tekstualnih podataka (npr. JSON, YAML), a posebno u formatima podataka optimizovanim za specifičan slučaj upotrebe.

· XML redundantnost može uticati na performanse aplikacije. Troškovi skladištenja, obrade i prenošenja podataka rastu.

· Za veliki broj zadataka nije potrebna puna snaga XML sintakse, a mogu se koristiti mnogo jednostavnija i učinkovitija rješenja.

  • XML prostore imena je teško koristiti i teško ih je implementirati u XML parsere.
  • XML nema podršku za tipove podataka ugrađenu u jezik. Ne sadrži koncepte "cijeli brojevi", "stringovi", "datumi", "boolean vrijednosti" itd.
  • Hijerarhijski model podataka koji nudi XML ograničen je u poređenju sa relacionim modelom i objektno orijentisanim grafovima.

U suštini, XML služi metajezik da opiše strukturu drugih jezika. Odnos između SGML, XML, HTML i nekih drugih jezika prikazan je na sljedećem dijagramu:

Važna razlika između XML-a i HTML-a je veliki naglasak koji se stavlja na kontrolu koliko se strogo poštuju pravila jezika prilikom označavanja dokumenata. Ovisno o tome, uobičajeno je razlikovati dobro izgrađena i validan XML dokumenti .

Razmatra se XML dokument dobro izgrađena ako se poklapa sa svim pravilima XML sintakse.

Ispitivanje stvarnost dokument uključuje sljedeće korake:

  • Provjera da se koristi samo dati skup deskriptora.
  • Provjera potpune usklađenosti redoslijeda elemenata i atributa sa sadržajem dokumenta ili određenim pravilima.
  • Kontrola tipa podataka (postignuta korištenjem odgovarajuće šeme).
  • Kontrola integriteta podataka kako bi se osigurala optimalna razmjena informacija preko Weba koristeći transakcije.

Osnovna sintaktička pravila izrada XML dokumenata.

  • XML dokument sadrži jedan i samo jedan korijenski element, koji sadrži sve ostale elemente
  • Child elementi sadržano u korijenski element, mora biti pravilno ugniježđen.
  • Imena elementi se pridržavaju pravila:
  • Ime počinje slovom, donjom crtom ili dvotočkom.
  • Nakon prvog znaka, ime može biti slova, brojevi, crtice, donje crte, tačke ili dvotočke.
  • Imena ne mogu početi kombinacijom slova XML.

XML dokument ima sljedeću strukturu:

  • Prvi red XML dokumenta se poziva najava xml. Ovo je opcioni niz koji specificira verziju XML standarda (obično 1.0). Ovdje se također može specificirati kodiranje znakova i vanjske zavisnosti.

Top Related Articles