Cum se configurează smartphone-uri și PC-uri. Portal informativ
  • Acasă
  • știri
  • Limbaje extinse de marcare a datelor SGML, XML. Vedeți ce este „XML” în alte dicționare Html este o aplicație standard sgml

Limbaje extinse de marcare a datelor SGML, XML. Vedeți ce este „XML” în alte dicționare Html este o aplicație standard sgml

Poveste

Să ne uităm la un exemplu de rețetă culinară simplă etichetată XML:

> Pâine simplă > > Făină > Drojdie > Apa calda > Sare > > > > Se amestecă toate ingredientele și se frământă bine. > > Acoperiți cu o cârpă și lăsați o oră într-o cameră caldă. > > Se framanta din nou, se pune pe o tava de copt si se da la cuptor. > > >

Declarație XML

Prima linie a documentului XML este apelată Declarație XML(ing. Declarație XML) este un șir care indică versiunea XML. În versiunea 1.0 Declarație XML poate fi omis, este necesar în versiunea 1.1. Tot aici puteți specifica codificarea caracterelor și prezența dependențelor externe.

Specificația necesită procesoare XML să accepte codificările Unicode UTF-8 și UTF-16 (UTF-32 este opțional). Alte codificări bazate pe standardul ISO / IEC 8859 sunt recunoscute ca acceptabile, acceptate și utilizate pe scară largă (dar nu sunt necesare), alte codificări sunt, de asemenea, acceptabile, de exemplu, rusă Windows-1251, KOI-8. Adesea, literele non-latine nu sunt folosite în etichete în principiu, în acest caz UTF-8 este o codificare foarte convenabilă - volumul, de regulă, este mai mic decât cu UTF-16; decodarea poate fi efectuată atât pentru întregul document, cât și pentru atribute și texte specifice; întregul document nu conține caractere ilegale atunci când se încearcă analizarea cu o codificare greșită.

Element rădăcină

Cea mai importantă cerință sintactică obligatorie este ca documentul să aibă doar una element rădăcină(ing. element rădăcină) (numit și uneori element de document(ing. element de document)). Aceasta înseamnă că textul sau alte date pentru întregul document trebuie să fie poziționate între o singură etichetă rădăcină de început și eticheta de final corespunzătoare.

Următorul exemplu cel mai simplu este un document XML bine format:

Următorul exemplu nu este un document XML valid deoarece are două element rădăcină:

> Entitatea #1 > > Esența #2 >

Un comentariu

Un element poate fi plasat oriunde în arbore. un comentariu... Comentariile XML sunt plasate într-o etichetă specială care începe cu caractere... Cele două cratime (-) nu pot fi prezente într-un comentariu.

Etichetele dintr-un comentariu nu trebuie procesate.

Etichete

Restul acestui document XML constă din imbricate elemente dintre care unele au atributeși conţinut. Element constă de obicei din etichete de început și de sfârșit care încadrează textul și alte elemente. Etichetă de deschidere este format din numele articoluluiîn paranteze unghiulare, de exemplu , A etichetă finală constă din același nume între paranteze unghiulare, dar înaintea numelui este adăugată o bară oblică, de exemplu,... Numele elementelor, ca și numele atributelor, nu pot conține goluri, dar poate fi în orice limbă acceptată de codificarea documentului XML. Numele poate începe cu o literă, subliniere, două puncte. Restul caracterelor numelui pot fi aceleași caractere, precum și numere, cratime, punct.

XML are mai multe entități predefinite, cum ar fi lt (vă puteți referi la el scriind<) для левой угловой скобки и amp (ссылка - &) для амперсанда. Возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков.

Mai jos este un exemplu de utilizare a unei entități predefinite pentru a evita utilizarea caracterului și în nume:

> AT&T >

Lista completă a entităților predefinite constă din & (&),< (<), >(>), "(") și "(") - ultimele două sunt utile pentru scrierea delimitatorilor în interiorul valorilor atributelor. Vă puteți defini entitățile într-un document DTD.

Uneori este necesar să se definească un spațiu care nu se întrerupe, care este foarte des folosit în HTML și este notat ca. Nu există o astfel de entitate predefinită în XML, este scrisă, iar utilizarea acesteia provoacă o eroare. Lipsa acestei esențe foarte comune pentru mulți programatori este adesea surprinzătoare și acest lucru creează unele dificultăți la migrarea dezvoltărilor lor HTML la XML.

Referință prin numărul simbolului(ing. referință de caractere numerice) arată ca o referință la o entitate, dar în loc de numele entității, este indicat simbolul # și un număr (în notație zecimală sau hexazecimală), care este numărul caracterului din tabelul de coduri Unicode. Acestea sunt de obicei caractere care nu pot fi codificate direct, cum ar fi o literă arabă într-un document codificat ASCII. Ampersand poate fi reprezentat astfel:

> AT&T >

Există și alte reguli despre cum să scrieți un document XML bine format.

Avantaje și dezavantaje

Demnitate

Defecte

  • Ambiguitatea modelării.
  • XML nu conține suport pentru limba maternă pentru tipurile de date. Nu are tastare puternică, adică conceptele de „întregi”, „șiruri”, „date”, „booleeni”, etc.
  • Modelul de date ierarhic oferit de XML este limitat în comparație cu modelul relațional și graficele orientate pe obiect și cu modelul de date în rețea.

Cartografierea XML pe World Wide Web

Există trei modalități cele mai comune de a converti un document XML într-o vizualizare vizibilă de utilizator:

  1. Aplicarea stilurilor CSS;
  2. aplicație XSL;
  3. Scrierea unui procesor de documente XML într-un limbaj de programare.

Pentru a defini o transformare XSL (XSLT) pe partea clientului, aveți nevoie de următoarea declarație în XML:

Dicționare XML

Deoarece XML este un limbaj destul de abstract, au fost dezvoltate vocabulare XML.

Un dicționar permite dezvoltatorilor să convină asupra unui set finit de nume de etichete și atribute pentru acele etichete. Unul dintre cele mai vechi vocabulare este XHTML, care este înțeles de majoritatea browserelor. XHTML este adesea folosit pentru a stoca și edita conținut într-un CMS.

Au fost create vocabulare mai specializate, precum protocolul de comunicare SOAP, care nu este centrat pe om și destul de greu de citit. Există vocabulare comerciale, cum ar fi CommerceML, xCBL și cXML, care sunt folosite pentru a transmite date pentru activități comerciale, aceste vocabulare includ descrieri ale sistemului de comandă, furnizori, produse și multe altele.

De obicei, atunci când descrie un document, o persoană vine cu un fel de vocabular pentru sine, care este apoi descris prin intermediul DTD, XSD sau pur și simplu explică „pe degete” părților interesate.

Unul dintre dicționarele răspândite este FB2 - un dicționar care descrie formatul unei cărți, cu tot felul de note de subsol, citate, chiar și imagini.

versiuni XML

  • XML 1.0
  • XML 1.1

Vezi si

Note (editare)

Literatură

  • David Hunter, Jeff Rafter, Joe Fausett, Eric van der Vlist și colab. XML. Lucrul cu XML, ediția a 4-a = XML început, ediția a 4-a. - M .: „Dialectica”, 2009. - 1344 p. - ISBN 978-5-8459-1533-7
  • David Hunter, Jeff Rafter și colab. XML. Curs de bază = XML început. - M .: Williams, 2009 .-- 1344 p. - ISBN 978-5-8459-1533-7
  • Robert Tabor. Implementarea XML Web Services pe platforma Microsoft .NET = Microsoft .NET XML Web Services. - M .: Williams, 2002 .-- 464 p. - ISBN 0-672-32088-6

Legături

  • XML pe site-ul World Wide Web Consortium (W3C).
  • Specificația oficială XML 1.0
  • Specificația oficială XML 1.1
  • Documentație XML pe site-ul IBM articole, forumuri

vptyu fPVPFTBU

SGML: YUEN LFP EDSF?

UEZPDOS CHUE YUBEE NPTSOP CHUFTEFYFSH BVVTECHEYBFKHTH SGML. NOPZYE CHYDSCH DPLHNEOFBGY RPUFBCHMSAFUS CH ZHPTNBFE SGML. rPRHMSTOSCHK SSCHL TBNEFLY Web-UVTBOYG HTML SCHMSEFUS RTYMPTSEOYEN SGML. rPSChMSEFUS Chueh VPMSHYE RTYLMBDOSCHI RTPZTBNN LCA TBVPFSCH În SGML: TEDBLFPTSCH, UTEDUFCHB ZHPTNBFYTPCHBOYS, UYUFENSCH DPLHNEOFPPVPTPFB, YURPMSHHAEYE SGML B LBYUEUPFSCH, Microsoft LBYUEUPLFBCHFPDCH, Microsoft , , , , , , , , , , , , , . h SGML ZPFPCHSFUS Lojze YDBFEMSHUFCHB O "Reilly, FEIOYYUEULBS DPLHNEOFBGYS IBM, Sun Q OSF. pUOPChSchChBEFUS OF SGML YOZHPTNBGYPOOBS FEIOPMPZYS NOPZYI CHEDHEYPUNY NBYEMSHEYI PUOPChSchChBEFUS DE SGML

rPSCHYCHYBSUS CH OBYUBME CHPUSHNYDEUSFCHI SGML-FEIOPMPZYS RETETSEYCHBEF UEKYUBU RETYPD TBUGCHEFB. SFP LFP FBLPE? SFP POB DBEF UCHPYN RPMSh'PCHBFEMSN? LBL OEK TBVPFBFSH? OB FY J DTHZYE CHPTRPUSCH S RSCHFBAUSH PFCHEFYFSH ЬFPK UFBFSHEK.

UPDETZBOYE





















LBL CU OBVTEM DESPRE SGML-FEIOPMPZYA

CHUE OBYUBMPUSH LA YOFTBOEFB. ьFP NPDOPE UMPCHP P'OBYUBMP DMS NEOS DESPRE RTBLFile FP, UFP DPLKHNEOFSH, LPFPTSCHE S TEZKHMSTOP RYUBM RP TPDKH UCHPEK DESFEMSHOPUFY, UFBMPKH NPTSOPUP YOU DP UYI RPT S RTPUFP OBVYTBM DPLKHNEOFSCH CH T E X-e Y REUBFBM YI DESPRE VKHNBZ. iDES DHVMYTPCHBFSH YI CH HTML CHTKHYUOHA PFRBMB UTBKH: OENEDMEOOOP CHOYLMB VSCh RTPVMENB UYOITPOYBGY VHNBTSOPK Y ЬMELFTPOOPK CHETUEFYK FPOZL.

b CHULPTE RPFTEVPCHBMPUSH RETYPDYUEULBS RETEDBYUB DPLHNEOFPCH RPUFPTPOOIN MADSN CH LMELFTPOOPK ZHPTNE, UFP, RP UMPTSYCHYEKUS X OBU RTBFBLFYULEKUS TBVPFBFSH U MS Word X NEOS RP TSDH RTYUYO OE VSCHMP OYLBLPZP TSEMBOYS, L FPNKH TSE FP FPMSHLP HUHZHVYMP VSCH RTPVMENKH UYOITPOYIBGY CHET.

OBYuYF, OHTSOP VSCHMP RTYDHNBFSH URPUPV BCHFPNBFYYUEULPZP RTEPVTBPCHBOYS OBVYTBENSCHI DPLHNEOFPCH B TBMYYUOSCHE ZHPTNBFSCH: T E X-a - LCA REYUBFY PE VHNBZE, HTML - LCA ONBZE, W.CAEEECHE , W.V.CA. lTPNE FPZP, NOE IPFEMPUSH, UFPVSch FBLPE UTEDUFCHP PFCHYUBMP EEE TSDH FTEVPCHBOYK:

  • VSHFSH NPDKHMSHOSCHN, YUFPVSH NPTSOP VSCHMP RTY OEPVIPDYNPUFY MEZLP DPVBCHMSFSH OPCHSCHE CHSCHIPDOSH ZHPTNBFSH YMY YNNEOSFSH BMZPTYFNSCH RTEPVTBCHPCHBOYE;
  • VSCHFSH PFLTSCHFSCHN, VEURMBFOSCHN, LBL NPTSOP NEOSHIE RTYCHSBOOSCHN L LPOLTEFOSCHN RTPZTBNNBN;
  • VSCHFSH NPVYMSHOSCHN: TBVPFBFSH, LBL NYOYNKHN, DESPRE TBOBOSHI UNIX-RMBFZHPTNBI;
  • VSCHFSH MEZLP THUYZHYGYTKHENSCHN.

RETCHSCHN, UFP RPRBMPUSH NOE RPD THLH RPUME RPIPDB DESPRE Altavista, PLBBMUS RBLEF RPD OBCHBOYEN linuxdoc-sgml. PO LBL TBJ Y RTEDOBOBYUBMUS DMS ZEOETBGY HTML, T E X Y RTF Yj PDOPZP CHIPDOPZP ZhBKMB. yYTPLP YURPMSHHENSCHK CH TBNLBI Linux Documentation Project, ON YURPMSh'PCHBM CH LBYUEUFCHE CHIPDOPZP ZhPTNBFB OEFOBLPNSCHK NOE DP UYI RPT SUSHL SGML. CHRTPYUEN, OYUEZP UMPTSOPZP CH OEN OE PLBBMPUSH - PO CHEUSHNB OBRPNYOBM JOBLPNSCHK NOE HTML TH CHCHZMSDEM CHRPMOE RPOSFOP. chPF, L RTYNETH, LHUPYEL SGML-DPLHNEOFB:

Structura unui text TEI

Toate textele conforme TEI conțin A Antet TEI(marcat ca a teiHeader element) și transcrierea textului propriu-zis (marcat ca a text element).

dMS FPZP, UFPVSH OBYUBFSH OB FFPN RYUBFSH, RPFTEVPCHBMPUSH CHUEZP MYISH ABRPNOYFSH OEULPMSHLP PUOPCHOSHI LMENEOFPCH TBNEFLY, OBRTINET

POBUBEF OBYUBMP RBTBZTBZHB, - OBYUBMP RETEUUMEOIS J FR.

OBVTBOOSCHK CH SGML FELUF DBMEE ABRKHULPN PDOPZP ZHYMSHFTB RTEPVTBJHEFUS CH HTML, DTHZPZP - CH T E X, FTEFSHESP - CH RTF, J FBL DBMEE.

SFP FBLPE SGML J JUEN PE IPTPI

FETNYOPMPIS

GML ( Limbajul de marcare generalizat) TBTVBVPFBO CH OEDTBI CHEDEUHEEK LPTRPTBGY IBM. EZP OBUMEDOIL SGML ( Limbajul de marcare generalizat standard) RTIOSF CH 1986 ZPDKH CH LBYUEUFCHE NETSDHOBTPDOPZP UFBODBTFB DMS PRTEDEMOYS OEBCHYUYNSHI PF KHUFTKUFCH CHCHPDB / CHCHCHPDB, OEBCHYUYUYCHYUPDUF CHHPDUPK WPMEE FPUOP, SGML - LFP NEFBSUCCL , FP EUFSH UTEDUFCHP ZhPTNBMSHOPZP PRYUBOYS SZSCHLB, CH DBOOPN UMHYUBE, SSSHLB TBNEFLY .

yUFPTYUEEULY UHMCP TBNEFLB YURPMSHPCHBMPUSH LCA PRYUBOYK BOOPFBGYK YMY DTHZYI PVPOBYUEOYK CHOHFTY FELUFB, RTEDOBOBYUEOOSCHI LCA HLBBOYK UPUFBCHYFEMA YMY "CHETUFBMSHEYLH" FPZP, LBL YNEOOP LPOLTEFBROPETSOPY YURPMSHPCHBUSCHI LCA HLBBOYK UPUFBCHYFEMA YMY "CHETUFBMSHEYLH" FPZP, LBL YNEOOP LPOLTEFBROPETSOPY UFPSHOPTUFOPTU. rTYNETSCH CHLMAYUBAF RPDYUETLYCHBOYE CHPMOYUFPK YUETFPK, PVP'OBYUBAEE LKHTUYCH, UREGIBMSHOSCHE YOBULY DMS RTPRHULB ZhTB YMY YI REYUBFY LPOLEYMEEFOSCHN. lPZDB ZhPTNBFYTPCHBOYE Y REYUBFSH FELUFPCH UVBMY BCHFPNBFYYTPCHBOOSCHNY, FFPF FETNYO UVBM PICHBFSCHBFSH CHUE CHYDSCH UREGEYBMSHOSCHI LAPDHR TBNEFLY , CHUFBCHMSENSHI CH MELFTPOSCHE FELUFSH DMS HRTBCHMEOYS ZHPTNBFYTPCHBOYEN, REYUBFSHA YMY DTHZPK PVTBVPFLPK.

pVPVEBS, TBNEFLKH, YMY LPDYTPCHLH , PRTEDEMSAF LBL MAVPE UTEDUFCHP UDEMBFSH SCHOSCHN YOFETRTEFBGYA FELUFFB. La VBOBMSHOPN HTPCHOE Chueh OBREYUBFBOOSCHE FELUFSCH LPDYTPCHBOSCH B FPN UNSCHUME: OBLY RTERYOBOYS, YURPMSHPCHBOYE BZMBCHOSCHI VHLCH, TBURPMPTSEOYE VHLCH RP UFTBOYGE, DBTSE YOFETCHBMSCH NETSDH UMPCHBNY NPTSOP UYUYFBFSH LBLPK H-FP UFEREOY TBNEFLPK, ZHHOLGYS LPFPTPK - RPNPYUSH YUEMPCHELH, YUYFBAEENH FELUF, PRTEDEMYFSH, zde LPOYUBEFUS PODOP UMPCHP Y OBYUYOBEFUS DTHZPE, YMY LBL IDDEOFYZHYGYTPCHBFSH PUPVEOPUFY UVTHLFKHTSCH, FBLYE LBL ABZPMPCHLY, YMY RTPUFFCHE UYOFBLUEGYUPYUPYUPDUFFCHE UYOFBLUEY lPDYTPChBOYE FELUFB LPNRSHAFETOPK PVTBVPFLY VMI, W RTYOGYRE, LBL TBUYYZHTPCHLB NBOHULTYRFB au RETZBNEOFB - RTPGEUU DEMBOYS SCHOSCHN OESCHOPZP YMY RPDTBHNECHBENPZP, RTPSGEUUTPFELUSH PDTBHNECHBENPZP, RTPSGEUUPT PFFBTPFBSY.

rAP SSSHLPN TBNEFLY RPOINBAF OBVPT UPZMBIEOIK P TBNEFLE, RTEINEOSENSHI DMS LPDYTPCHBOYS FELUFPCH. ssshl TBNEFLY DPMTSEO UREGYZHYGYTPCBFSH, LBLBS TBNEFLB DPRKHUFYNB, LBLBS TBNEFLB PVSBFEMSHOB, LBL PFMYUYUIFSh TBFNEFUFFLB YFMYUYUIFSh TBFNEFLUFLB SGML RTEDPUFBCHMSEF TEEEOYS DMS RETCHCHI FTEI ЪBDBYU, PFDEMSHOBS DPLKHNEOFBGYS PVSCHYUOP OEPVIPDYNB DMS RPUMEDOEK.

PUPVEOOPUFFY SGML

fty IBTBLFETYUFILY SGML PFMYUBAF EZP PF RTPYUYI SSCHLPCH TBNEFLY.

PRYUBFEMSHOBS TBNEFLB

UYUFENB U PRYUBFEMSHOPK TBNEFLPK YURPMSHHEF LPDSCH TBNEFLY, LPFPTSCHE RTPUFP RTEDPUFBCHMSAF OBCHBOYS DMS LBFESPTEYBGY YUHUHNEFEK DPL. lPDSCH TBNEFLY, FBLYE LBL YMY \ end (listă), RTPUFP IDDEOFIZHYGYTKHAF RPTGYA DPLKHNEOFB J HFCHETTSDBAF, UFP „POB SCHMSEFUS RBTBZTBZHPN”, YMJ UFP „LFP - LPOEG OBYUBUMEDOUP. în DTHZPK UFPTPOSCH, UYUFENB au RTPGEDHTOPK TBNEFLPK PRTEDEMSEF, LBLBS PVTBVPFLB DPMTSOB CHSCHRPMOSFSHUS B LPOLTEFOPK FPYULE DPLHNEOFB "B FPN NEUFE CHSCHCHBFSH RTPGEDHTH PARA au RBTBNEFTCHEDCH , - METBNEFTGHECH2", - METBNEFTGHECH 2, - METBNEFTGHEGHE RTPRKHUFYFSH PDOH UFTPLKH Y CHUFBFSH DESPRE OPCHA SWORDS ZTBOYGKH "Y FR. h SGML YOUFTHLGYY, OEPVIPDYNSCHE LCA PVTBVPFLY DPLHNEOFB Y-LBLPK MYVP LPOLTEFOPK GEMSHA (OBRTYNET, ICH ZHPTNBFYTPCHBOYS) YUEFLP PFDEMSAFUS PF PRYUBFEMSHOPK TBNEFLY, LPFYPTFOPK GEMSHA, LFTETYNET. pvshchuop POI UPVTBOSCH CHOE DPLKHNEOFB CH PFDEMSHOSHI RTPGEDKHTBI YMY RTPZTBNNBI.

în PRYUBFEMSHOPK, B OE RTPGEDHTOPK, TBNEFLPK PDYO J FPF CE DPLHNEOF NPTSEF VSCHFSH PVTBVPFBO TBOPPVTBOSCHNY RTPZTBNNBNY, LBTSDBS dv LPFPTSCHI NPTSEF RTYNEOSFSH TBMYFTYUOSFSH TBMYFTYUOSFYFPY TBMYPFYVGYPFYSFY PRYUBVPFBO TBOPPVTBOSCHNY RTPZTBNNBNY. oBRTYNET, RTPZTBNB BOBMYIB UPDETTSYNPZP NPTSEF RPMOPUFSHA YZOPTYTPCHBFSH UOPULY, FPZDB LBL RTPZTBNNB ZhPTNBFYTPBUYS NPTsEBFMSH YBYUCHME TBMYUOSCHE CHYDSCH YOUFTKHLGYK PVTBVPFLY NPZHF BUUPGYTPCHBFSHUS U PDOPK Y FPK TCE YUBUFSHA ZHBKMB. oBRTYNET, PDOB RTPZTBNNB NPTSEF YCHMELBFSH dv DPLHNEOFB ZHBNYMYY Madek J ZEPZTBZHYYUEULYE OBCHBOYS LCA UPDBOYS YODELUB YMY VBSCH DBOOSCHI, FPZDB LBL DTHZBS, PVTBVBFSCHCHBAEBS FPF CE UBNSCHK FELUF, NPTSEF REYUBFBFSH ZHBNYMYY J OBCHBOYS PFMYYUBAEYNUS YTYZHFPN.

fireshch DPLHNEOFPCH

SGML CHHPDIF RPOSFYE FIRB DPLHNEOFB , Y, UPPFCHEFUFCHOOOP, PRTEDEMEOIS FIRB DPLHNEOFB (definiție tip document, DTD). DPLKHNEOFSCH UYUIFBAFUS FYRYJTPCHBOSCHNY, FBL TSE, LBL J DTHZIE PVTBVBFSCHCHBENSCHE LPNRSHAFETBNY PVYAELFSCH. FOC DPLKHNEOFB ZhPTNBMSHOP PRTEDEMSEFUS EZP UPUFBCHOSCHNY YUBUFSNY YI UVTHLFKHTPK. PRTEDEMEOYE, OBRTYNET, PFYUEFB NPTSEF VSHFSH FBLYN, UFP PO UPUFFPIF Y ЪBZPMPCHLB Y, CHPNPTSOP, BCHFPTB, ЪB LPFPTSCHNY UMEDHEDEF BOPUFFPUGBMEB mAVPK DPLHNEOF PFUHFUFCHYE BZPMPCHLB W, W UPPFCHEFUFCHYY au FYN ZHPTNBMSHOSCHN PRTEDEMEOYEN, OE VHDEF ZHPTNBMSHOP SCHMSFSHUS PFYUEFPN, FBL CE SAT LBL VHDEF dH SCHMSFSHUS J RPUMEDPCHBFEMSHOPUFSH BVBGECH, B LPFPTPK UMEDHEF BOOPFBGYS, OECHYTBS ON AF ON OBULPMSHLP RPIPTS PFYUEF FBLPK DPLHNEOF au FPYULY TEOYS YUYFBFEMS- UEMPCHELB .

rPULPMShLKh DPLKHNEOFSCH PFOPUSFUS L YCHEUFOSCHN FIRBN, SPTSOP YURPMSHPCHBFSH UREGIBMSHOKH RTPZTBNNKH, OBSCHCHBENKHA BOBMYBFPTPN (analizator), LCA FPZP, YUFPVSCH PVTBVPFBFSH DPLHNEOF, HFCHETTSDBAEYK, YUFP ÎN A PFOPUYFUS LPOLTEFOPNH FYRH, J RTPCHETYFSH, DEKUFCHYFEMSHOP MJ Chueh MENEOFSCH, HFCHETTSDBAEYK, YUFP ÎNTRE PFOPUYFUS LPOLTEFOPNH FYRH, J RTPCHETYFSH, DEKUFCHYFEMSHOP MJ Chueh MENEOFSCH, HFCHETTSDBAEYK, FTEVHENSCHE LCA LCA FTPCHFPCHPDHPSHPFHBY BFTEVHENSCHE FFTVHENSCHE uFP EEE VPMEE CHBTSOP, TBOBOSCHE DPLKHNEOFSCH PDOPZP FIRB NPZHF PVTBVBFSCHCHBFSHUS KHOYZHYGYTPCHBOOSCHN PVTBBSPN. NPTSOP RYUBFSH VPMEE YOFEMMELFKHBMSHOSCHE RTPZTBNNSCH, YURPMSHHAEE YOBOIS, ЪBLMAYUEOOSCHE CH YOZHPTNBGYPOOPK UVTHLFKHTE DPLKHNEOFB.

OEBCHYUYNPUFSH DBOOSHI

pUOPCHOBS GEMSH RTPELFYTPCHBOYS SGML VSCHMB B UPDBOYY ZBTBOFYK FPZP, YUFP DPLHNEOF, BLPDYTPCHBOOSCHK UPZMBUOP EZP RPMPTSEOYSN, VHDEF RETEOPUYUTENSCHN au PDOOPCHOBY DPLHNEOF YUFP DPLHNEOF, BLPDYTPCHBOOSCHK UPZMBUOP EZP RPMPTSEOYSN, VHDEF RETEOPUYUTENSCHN au PDOOPCHOPK BRBZTBFEPTHOPY BRBZFEPTH. dChB EZP UCHPKUFCHB, PRYUBOOSHCHYE, PFCHEYUBAF ЬFPNKH FTEVPCHBOYA DESPRE BVUFTBLFOPN HTPCHOE; FTEFSHE UCHPKUFCHP - DESPRE HTPCHOE UVTPYUEL VBKFPCH (UYNCHPMPCH), LPFPTSCHE UPUFBCHMSAF DPLKHNEOF. SGML RTEDPUFBCHMSEF PVPVEEOOSCHK NEIBOYUN UVTPLPCHPK RPDUFBOPCHLY , FP EUFSH, RTPUFFK NBYYOOP-OEBCHYUYNSCHK URPUPV KHLBBOYS, UFP LPOLTEFOBS UVTPLB UYNCHPMPCH CH DPLKHNEOFE CH NPNEOF PVTBVPFLY DPLKHNEOTSBOF pDOP PYUECHYDOPE RTYNEOOYE FPNKH NEIBOYNH - PVEUREUEEOE EDYOPK FETNYOPMPZYY; DTHZPE, J VPMEE OBYUYFEMSHOPE - RTPFYCHPDEKUFCHYE YCHEUFOPK OEURPUPVOPUFY TBOSCHI LPNRSHAFETOSCHI UYUFEN RPOYNBFSH OBVPTSCH UYNCHPMPCH DTHZ DTHZB, OBRTYNET, PDOPK UYUFENE RTEDUFBCHMSFSH Chueh ZTBZHYYUEULYE UYNCHPMSCH, OEPVIPDYNSCHE RTYMPTSEOYA, RHFEN PRYUBFEMSHOPZP PFPVTBTSEOYS OERETEDBCHBENSCHI UYNCHPMPCH. uFTPLY, PRTEDEMENSCHE FЙN NEIBOYNPN, OBSCHCHBAFUS UHEOPUFSNY (entitati).

n RTEINHEEUFCHBI

SFP DBEF YURPMShPCHBOYE SGML CH TABMSHOPK QIYOI? NOU POP UTBKH DBMP CHP'NPTSOPUFSH RTPYCHPDYFSH DPLKHNEOFSCH CH MAVPN FTEVKHENPN CHYDE. xDPVOP PLBBMBMPUSH Y OBRYUBOYE "CHOPTDPCHCHCHI" VHNBTsEL CH RTICCHHYUOPK UTEDE XEmacs VEH YURPMSHUPCHBOYS Windows. CHUE YURPMSHUPCHBOOSCHE RTPZTBNNSCH - VEURMBFOSCH Y TBURTPUFTBOSAFUS CH YUIPDOSCHI FELUFFBI, UFP RPCHPMYMP HUFBOPCHIFSH YI OB CHUEEI YURPMSHUKHENCHI NOPK UYUYU. rTYUEN PLBBMPUSH, UFP OBYUBFSH TBVPFBFSH U SGML CHECHUE OE UMPTSOP, LBTSDSCHK, LFP IPFSH TB TEDBLFAYTPCHBM WWW UFTBOYULH, OE YURHZBEFUFUS CHEYDB.

rPFPN HTSE, RP NETE RPUFEREOPZP YHYUEOYS SGML, S PUPBOBM, UFP ЬFB FEIOILB DBEF ZTPNBDOPE LPMYUEUFCHP CHPNPTSOPUFEK RP UPBCHOOYUPK

rTPDKHLFYCHOPUFSH yuEFLP TBDEMEOSCHE RTPGEUUSCH CHCHPDB YOZHPTNBGYY RHPTNBFYTPCHBOYS RPCHPMSAF BCHFPTKH UPUTEDPFPYUYFSHUS OB YMPTSEOYL PYUYFSHUS OB YUMPTSEOYLUY NSCHUMMEK

EDYOBS UVIMYUFILB MEZLP CHSCHDETTSYCHBFSH TBMYUOSCHE DPLKHNEOFSCH CH EDYOPN UVIME, YURPMSHUHS EDYOHA FETNYOPMPZYA. eUMY UFYMSH YMY FETNYOSCH OKHTSOP YNNEOIFSH, LFP DEMBEFUS TBPN PE CHUEI DPLHNEOFBI, OE FTPZBS YI UPDETTSYNPE.

rPChFPTOPE YURPMShSPCHBOYEьFPF FETNYO, ITPPYP OBLPNSCHK RTPZTBNNYUFBN, POBUBEF OBMYUYE ChP'NPTSOPUFY YURPMSHPCHBFSH DEFBMY UVBTSHI RTPELFPCH CH OPCHNEYUFBN yUBUFSH DPLKHNEOFB, PZHPTNMEOOBS CH CHYDE SGML-LMENEOFB, NPTSEF RETEOPUYFSHUS CH DTHZIE DPLKHNEOFSCH, MEZLP RPCHFPTSFSHUS CH TBOBOSHI NEUFBI FELUFFB.

dPMZPCHEUOPUFSH YOZHPTNBGY yb-bb FPZP, UFP SGML - RTPUFPK Y UFBODBTFOSCHK ZHPTNBF ITBOEOIS DBOOSHI, PFUHFUFCHHEF OEPVIPDYNPUFSH RETEZHPTNBFYTPCHBFSH YI CHCHYCHDKHBUFFBRKTNO yOZHPTNBGYS RTPUFP DPUFHROB OBCHUEZDB. POB OEUEF U UPVPK CHUE OEPVIPDINPE DMS UPUDBOYS DPLHNEOFB.

MHYUEE HRTBCHMEOE DBOSCHNY de la SGML NPTSOP PRTEDEMSFSH YOZHPTNBGYPOSCHE LMENEOFSH Y NBOYRKHMSGY U OYNY U RTPYCHPMSHOPK UVEREOSHA DEFBMSHOPUFY. TBNEYUEOOSCHE LMENEOFSCH NPZHF YNEFSH BFTYVHFSCH, PRTEDEMSAEYE IBTBLFETYUFILY Y UCHPKUFCHB LMENEOFPCH. ьФБ YOZHPTNBGYS OE RTEDOBOBYUEOB DMS REYUBFY, OP NPTSEF RPNPYUSH CH HRTBCHMEOY LMENEOFBNY DBOOSHI. OBRTYNET, BFTYVHF ID (IDEOFYZHYLBFPT) NPTSEF KHOILBMSHOSCHN PVTBSPN IDEOFYZHYGYTPCBFSH PDYO BVJBG, YMY GEMSCHK TBBODEM, RTEJNEYMABOYE

yOZHPTNBGYS
fBL LBL IDEOFYZHYLBFPTSCH SCHMSAFUS NBYYOOOP-YUIFBENSCHNY, POI NPZHF UCHSCHCHBFSH NECDKH UPVPK YOZHPTNBGYA YYURPMShPCHBFSHUSME HYURPMSHOPCHBFSHUSME DMSTBBOBPPK. PE NET:
  • lPOFTPMYTPChBFSH VEPRBUOPUFSH DPUFKHRB L YOZHPTNBGY, RPCHPMS FPMSHLP PRTEDEMEOOSCHN MADSN RTPUNBFTYCHBFSH YMY YNNEOSFSH EE.
  • bCHFPNBFYITPCHBFSH RETENEEEEOYE YOZHPTNBGY - OBRTYNET, PWOPCHMEOYE DBOOSHI CH PDOPN NEUFE NPTSEF YOYGYYTPCHBFSH PWOPCHMEOYE FPK TSBHEYTYOZHPTN

TBDEMSENPUFSH chPNPTSOPUFSH TBVPFSH UP UVTKHLFKHTYTPCHBOOSCHNY LPNRPOEOFBN DPLKHNEOFB RPJCHPMSEF UVTPYFSH GEMSCHK DPLKHNEOF YY UPUFFCHOSCHI YUBUFEYTPUGBOOZ ьФП РПъЧПМСОФ РПМШЪПЧБФЭМСН DEMYFSHUS YOZHPTNBGYEK WEB ITS DHVMYTPCHBOYS.

nPWYMSHOPUFSH h YOZHPTNBGYPOOSHI UEFSI, PVAEDYOSAEYI TBOPPVTBOSCHE LPNRSHAFETSCH. rPULPMSHLKH SGML OE BCHYUIF PF BRRBTBFHTSCH Y RTEIMPTSEOIK, NPTSOP MEZLP PVNEOYCHBFSHUS DPLKHNEOFBNY NETSDKH TBMYUOSCHNY UYUFENBNY.

ZYVLPUFSH CH RTEYMPTSEOYY SGML РПъЧПМСОФ YURPMShъPCHBFSH YOZHPTNBGYA DBMELP ЪB TBNLBNY "OBUFPMSHOPK FIRPZTBZHYY". PE NET:

  • UVTBOYGSCH WWW;
  • YOZHPTNBGYPOSCHE VBBSH DBOOSHI;
  • DYBZOPUFYUEULYE / ЬLURETFOSCHE UYUFENSCH;
  • LMELFTPOOBS RPUFB;
  • ZYRETFELUFPCHBS DPLKHNEOFBGYS;
  • РХВМЙЛБГЙЙ DESPRE CD-ROM;
  • YOFETBLFYCHOSCHE SMELFTPOSCHE NBOHBMSCH.

pUENX SGML?

rPUENH OE Word? rPFPNKh, UFP LFP YBLTSCHFSCHK ZhPTNBF. rPFPNKh, UFP LFP ZhPTNBF PDOPZP RTYMPCEOIS. rPFPNKH, UFP LFPZP RTEIMPTSEOIS OEF RPD AOILUBNY, U LPFPTSCHNY S TBVPFBA. rPFPNKH, UFP LFP OE FELUFPCHSCHK ZhPTNBF. rPFPNKH, UFP OEF UTEDUFCH BCHFPNBFYUEEULPK ZEOETBGY FBLYI DPLHNEOFPCH. rPFPNKH, UFP OEF FPMLPCHCHI UTEDUFCH HRTBCHMEOYS CHETUYSNYY LPMMELFYCHOPK TBVPFSH. rPFPNKH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSCHUMPCHPK UVTHLFHTSCH, Y OEF CHP'NPTSOPUFY YI UPPFOPUYFSH. rPFPNKH, UFP RTY LLURPTFE RPMKHYUBEFUS UPCHETEOOOP OEHDPCHMEFCHPTYFEMSHOSCHK HTML. rPFPNKH, UFP LBYUEUFCHP CHETUFLY Y REYUBFY OYTSE UTEDOESP.

pUENH OE T E X? rPFPNKH, UFP LFP UMYYLPN OYLPKHTPCHOECHSCHK SZSCHL. EZP OE DBYSH CH THLY OBYUYOBAENH. rPFPNKH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSCHUMPCHPK UVTHLFKHTSCH. rPFPNKH, UFP NBMP T E X-PTYEOFYTPCHBOOSHI TEDBLFPTPCH. rPFPNKH, UFP OEF HDPCHMEFCHPTIFEMSHOSHI UTEDUFCH LURPTFB CH Cuvânt.

pUENH OE HTML? rPFPNKH, UFP UBNP RPOSFYE HTML UYMSHOP TBNSCHFP ZPOLPK WWW ЪB LPNNETGYEK Y CHOCOPK RTPYCHPDIFEMEK VTBKHYETPC DTHZ U DTHZPN. rPFPNKH, UFP HTML UVTBDBEF CHUE FEN TCE OEDPUFBFLPN: PTYEOFYTPCHBO DESPRE RTEDUFBCHMEOYE, B OE DESPRE UVTHLFKHTH. rPFPNKH, UFP PO PYUEOSH VEDEO CHCHTBYFEMSHOSCHNY UTEDUFCHBNY, J PFUHFUFCHHAF ChP'NPTSOPUFY EZP TBUYITEOIS. rPFPNKH, UFP OE TEEEO RTPVMENB LPTTELFOPK TKHUZHYLBGY. rPFPNKH, UFP OEF HDPCHMEFCHPTIFEMSHOSHI UTEDUFCH LURPTFB CH Cuvânt.

SGML RTPFYCH WYSIWYG

dMS FEI, LFP RTICHSCHL RPMSH'PCHBFSHUS FPMSHLP „procesor de text” -BNY, OBRTYNET, MS Word YMY WordPerfect, NPTSEF VSCHFSH YOFETEUOP UPRPUFBCHMEOYE YI U SGML YOFBUNFTKH. FY DCHE ZTHRRSCH RTPZTBNOSHI UTEDUFCH, OEUNPFTS DESPRE UIPTSEUFSH TEYBENSHY BDBYU - RTPYCHPDUFCHP DPLHNEOFFPCH - CHEUSHNB DTHBAZ PF DTHYUFTIFT PFMHHP.

Procesor de text - LFP YOFEMMELFHBMSHOBS RYYHEBS NBYYOLB. tO PTYEOFYTPCHBO ON TBVPFH au CHYHBMSHOSCHN RTEDUFBCHMEOYEN FELUFB, IBTBLFETYHAEEZPUS OBVPTPN UFYMEK: UFYMEK UYNCHPMPCH (YTYZHF, LEZMSH, OBYUETFBOYE) BVBGECH (LTBUOBS UFTPLB, CHSCHTBCHOYCHBOYE, RPMPTSEOYE RP YYTYOE UFTBOYGSCH) UFTBOYG (LPMPOFYFHMSCH, UOPULY) TBDEMPCH J DPLHNEOFPCH (ZHPTNBF VHNBZY, PZMBCHMEOYE), Y RTPYUYI. Procesor de text OE TBVPFBEF U CHOHFTEOOEK UVTHLFHTPK DPLHNEOFB.

SGML TEDBLFPT, OBRTPFYCH, PTYEOFYTPCHBO DESPRE TBVPFH UPDETTSYNSCHN DPLHNEOFB. dMS SGML TEDBLFPTB, OBRTYNET, TBDEEM - LFP LMENEOF, CH LPFPTSCHK NPZHF CHLMAYUBFSHUS RPDTB'DEMSCH, B OE RTPNETSKHFPL PF PDOPZP BV'BMENOGBP, OBVTLP

ьФП РПъЧПМСОФ БЧФПТХ UPUTEDPFPYUIFSHUS DESPRE UPDETTSBOY FELUFFB, B OE CHP'YFSHUS U EZP ZhPTNBFYTPCHBOYEN Y CHSCHVPTPN UFIMEK. CHYJHBMSHOBS UFYMYUFILB DPLKHNEOFB PRTEDEMSEFUS RTY EZP LURPTFE CH CHCHEPDOSCHE ZHPTNBFSCH, B OE RTY OBVPTE FELUFB.

p RTPZTBNNOPN PVEUREEOOOYY

yuFPVSCH OBYUBFSH TBVPFBFSH U DPLKHNEOFBNY CH SGML RPMSH'PCHBFEMA OHTSOCCH DCHB PUOPCHOSHI UTEDUFCHB: TEDBLFPT Y UTEDUFFCHB LURPTFB (ZHPTNBOBFYT).

SGML-TEDBLFPT

SGML-TEDBLFPT PFMYUBEFUS LBL PF RTYCHYUOSHI FELUFPCHCHI TEDBLFPTPCH, FBL J PF „procesor de text” -PCH. pF RETCHSCHI - OBMYUYEN RPDDETTSLY UVTHLFKHTYTPCHBOOSHI DPLHNEOFPCH, PF CHFPTSHI - PFUHFUFCHYEN RPDDETTSLY CHYJHBMSHOPZP ZHPTNBFYTPCHBOYS. TEDBLFPT TBBVYTBEF DTD TEDBLFYTKHENPZP DPLKHNEOFB Y "CHEDEF" RPMSH'PCHBFEMS CH UPPFCHEFUFCHY U OYN. OBRTINET, EUMI DTD RTEDHUNBFTYCHBEF LMENEOF

, CH LPFPTPN NPZKHF CHUFTEYUBFSHUS FPMSHLP LMENEOFSH YMY , FP RPMSh'PCHBFEMA, TEDBLFYTKHAENKH LMENEOF
, VKHDEF RTEDMPTSEOP CHUFBCHYFSH PDYO Y'FYI DCHKHI TBTEYEOOSHI LMENEOFFCH. SGML-TEDBLFPT FBLCE PVSCHYUOP UPDETTSYF UTEDUFCHB OBCHYZBGY RP YETBTIY DPLKHNEOF.

yj YUYUMB RPRHMSTOSHI SGML-TEDBLFPTPCH NPTSOP OBJCHBFSH ArborText ADEPT * Editor, SoftQuad Autor / Editor, psgml, Adobe FrameMaker + SGML, Corel WordPerfect, J NOPCEUFCHP DTHZYI.

UTEDUFCHB ZhPTNBFYTPCHBOYS

uHEEUFCHKHEF NOPTSEUFCHP UTEDUFCH TBVPFS U SGML FELUFFBNY. VóMSHYHA YI YUBUFSH UPUFBCHMSAF UTEDUFCHB ZhPTNBFYTPCHBOYS - LURPTFB SGML CH DTHZYE ZhPTNBFSH DMS REYUBFY, RTPUNPFTB J F.R. CHSCHIPDOSHE ZHPTNBFSH NPZHF VSCHFSH MAVSCHNY, ABCHYUS MYYSH PF DPUFHROPZP RTPZTBNNOPZP PVEUREUEOYS Y OKHTSD RPMSHUPCHBFEMS. OBRTINET, S YURPMSHJHA LPOCHETFETSH H HTML, RTF L A T E X.

În 1986, cu mult înainte ca ideea de a crea Web-ul să fie adusă la viață, limbajul de markup universal, standardizat SGML ( Limbajul de marcare generalizat standardizat) a fost aprobat ca standard internațional (ISO 8879) pentru definirea limbajelor de marcare, deși SGML există de la sfârșitul anilor șaizeci. A fost folosit pentru a descrie limbaje de marcare, permițând în același timp autorului capacitatea de a defini în mod formal fiecare element și atribut al limbajului.

HTML a fost inițial doar una dintre aplicațiile SGML. El a descris regulile după care ar trebui să fie pregătite informațiile pentru World Wide Web. Astfel, HTML este un set de prescripții SGML formulate ca definițiile tipului de document(DTD) care explică exact ce înseamnă etichetele și elementele. DTD pentru HTML este stocat în browserul web.

Dezavantajele limbajului HTML includ următoarele:

  • HTML are set fix de etichete... Nu vă puteți crea propriile etichete care să fie înțelese de alți utilizatori.
  • HTML este exclusiv tehnologie de prezentare... HTML nu conține informații despre semnificația conținutului conținut în etichete.
  • HTML - limba plată... Semnificația etichetelor din acesta nu este definită, așa că nu poate fi folosită pentru a descrie ierarhia datelor.
  • Browserele sunt folosite ca platformă pentru aplicații... HTML nu este suficient de puternic pentru a crea aplicații web la nivelul pe care dezvoltatorii web se străduiesc în prezent. De exemplu, este imposibil să se dezvolte o aplicație în HTML pentru procesarea și recuperarea profesională a documentelor.
  • Volume mari de trafic de rețea... Documentele HTML existente utilizate ca aplicații supraîncărcă Internetul cu cantități mari de trafic pe sistemele client-server. Un exemplu ar fi trimiterea unui document mare printr-o rețea atunci când este necesară doar o mică parte din acel document.

Astfel, pe de o parte, HTML este un mijloc foarte convenabil de a marca documentele pentru a fi utilizate pe web, iar pe de altă parte, un document marcat în HTML are puține informații despre conținutul său. Dacă acest sau acel document conține informații suficient de complete despre conținutul său, devine posibil să se efectueze relativ ușor procesarea și căutarea generalizată automată în fișierul care stochează documentul. SGML poate stoca informații despre conținutul unui document, dar, datorită complexității sale, nu a fost niciodată folosit la fel de larg ca HTML.

Un grup de experți SGML, condus de Jon Bosak de la Sun Microsystems, a început să lucreze pentru a crea un subset de SGML care să poată fi acceptat de comunitatea web. S-a decis eliminarea multor caracteristici SGML neesențiale. Limbajul astfel reconstruit a fost numit XML. Versiunea simplificată a fost semnificativ mai accesibilă decât originalul, cu doar 26 de pagini de specificații, comparativ cu peste 500 de pagini de specificații SGML.

Să luăm în considerare mai detaliat structura și caracteristicile acestui limbaj.

XML (limbaj de marcare extensibil) este un limbaj de marcare recomandat de W3C. XML - format text, destinat stocării datelor structurate, schimbului de informații între programe, precum și creării de limbaje de marcare specializate pe baza acestuia. XML este un subset simplificat al limbajului SGML.

Limbajul XML are următoarele demnitate:

  • Este un format de document centrat pe om, care poate fi înțeles atât de oameni, cât și de computere.
  • Suporta Unicode.
  • Structurile de bază ale datelor, cum ar fi înregistrările, listele și arborii pot fi descrise în format XML.
  • Este un format de auto-documentare care descrie structura și numele câmpurilor, precum și valorile câmpurilor.
  • Are o sintaxă și cerințe de analiză bine definite, ceea ce îi permite să rămână simplu, eficient și consistent.
  • Folosit pe scară largă pentru stocarea și procesarea documentelor;
  • Este un format bazat pe standarde internaționale;
  • Structura ierarhică a XML este potrivită pentru a descrie aproape orice tip de document;
  • Este un text simplu, fără licențe și orice restricții;
  • Platforma independenta;
  • Este un subset al SGML pentru care s-a acumulat multă experiență și s-au creat aplicații specializate;

faimos dezavantaje limbile includ următoarele:

  • Sintaxa XML este redundantă.
    • Dimensiunea documentului XML este semnificativ mai mare decât reprezentarea binară a acelorași date (de aproximativ 10 ori).
    • Dimensiunea unui document XML este semnificativ mai mare decât a unui document în formate alternative de transfer de date text (de exemplu JSON, YAML) și mai ales în formate de date care sunt optimizate pentru un anumit caz de utilizare.
    • Redundanța XML poate afecta performanța aplicației dvs. Costul stocării, procesării și transferului datelor este în creștere.
    • Un număr mare de sarcini nu necesită întreaga putere a sintaxei XML și pot fi folosite soluții mult mai simple și mai performante.
  • Spațiile de nume XML sunt dificil de utilizat și greu de implementat în parsere XML.
  • XML nu conține suport pentru limba maternă pentru tipurile de date. Nu include conceptele de „numere întregi”, „șiruri”, „date”, „valori booleene” etc.
  • Model ierarhic de date oferit de XML este limitat în comparație cu modelul relațional și graficele orientate pe obiecte.

În general, XML poate fi văzut nu numai ca un nou limbaj de marcare, ci și ca bază pentru o întreagă familie de tehnologii:

Tabelul 9.1. Structura familiei XML
XML Ghid tehnice XML
DTD Definirea tipului de document (schemă)
XDR format XML Redus(schema Microsoft)
XSD Definiție Schema XML (Schema W3C)
Spațiu de nume Metodă de definire a numelor de elemente și atribute
XPath XML Path Language
XLink Limbajul de legătură XML
XPpointer Limbajul Pointer XML
DOM API pentru modelul obiect document
SAX API simplu pentru XML
XSL Extensibil limbajul foii de stil
XSL -FO Formatarea obiectelor XSL
XSLT Limbajul transformărilor XSL
XInclude XML Include Sintaxă

Limbaje de marcare: SGML, HTML, XML. Legătura lor unul cu celălalt.

HTML a fost inițial doar una dintre aplicațiile SGML. El a descris regulile după care ar trebui să fie pregătite informațiile pentru World Wide Web. Astfel, HTML este un set de prescripții SGML, formulate ca Document Type Definition (DTD), care explică exact ce înseamnă etichetele și elementele. DTD pentru HTML este stocat în browserul web.

Astfel, pe de o parte, HTML este un mijloc foarte convenabil de a marca documentele pentru a fi utilizate pe web, iar pe de altă parte, un document marcat în HTML are puține informații despre conținutul său. Dacă acest sau acel document conține informații suficient de complete despre conținutul său, devine posibil să se efectueze relativ ușor procesarea și căutarea generalizată automată în fișierul care stochează documentul. SGML poate stoca informații despre conținutul unui document, dar, datorită complexității sale, nu a fost niciodată folosit la fel de larg ca HTML.

Un grup de experți SGML, condus de Jon Bosak de la Sun Microsystems, a început să lucreze pentru a crea un subset de SGML care să poată fi acceptat de comunitatea web. S-a decis eliminarea multor caracteristici SGML neesențiale. Limbajul astfel reconstruit a fost numit XML. Versiunea simplificată a fost semnificativ mai accesibilă decât originalul, cu doar 26 de pagini de specificații, comparativ cu peste 500 de pagini de specificații SGML.

Avantajele XML.

  • Suporta Unicode.
  • Platforma independenta;

Servicii web

serviciu web(serviciu web) - un sistem software care are un URI și ale cărui interfețe publice sunt definite în XML. Descrierea acestui sistem software poate fi găsită de alte aplicații care pot interacționa cu acesta în conformitate cu această descriere prin mesaje bazate pe XML și transmise folosind protocoale Internet. Serviciul web este unitatea de modularitate atunci când este utilizat Arhitectura orientată spre servicii aplicatii.

Arhitectura orientată spre servicii(SOA, arhitectură orientată pe servicii) este o abordare modulară a dezvoltării software bazată pe utilizarea serviciilor cu interfețe standardizate.

SOA se bazează pe principiile reutilizarii elementelor funcționale IT, unificarea proceselor operaționale tipice. Componentele programului pot fi distribuite pe diferite noduri de rețea și sunt oferite ca servicii de aplicații independente și ușor cuplate, înlocuibile.

Interfața componentelor programului SOA încapsulează detaliile de implementare ale unei anumite componente (OS, limbaj de programare etc.).

Serviciile Web .NET au următoarele beneficii:

  • Deschiderea standardelor... Nu există elemente ascunse sau inaccesibile în serviciile web. Fiecare aspect al tehnologiei, de la modul în care căutați servicii web la modul în care le descrieți și la modul în care comunicați cu ea, este definit de standarde disponibile publicului.
  • Multiplatformă... Un limbaj de programare care vă permite să creați documente XML și să trimiteți informații prin HTTP vă permite să interacționați cu orice serviciu web. Este posibil să primiți un serviciu web de la un alt sistem decât .NET.
  • Simplitate.
  • Suport pentru mesaje într-un limbaj care poate fi citit de om... Trecerea de la standardele binare utilizate în COM și CORBA la textul XML a făcut mai ușoară remedierea erorilor și a făcut posibilă interacțiunea cu serviciile web prin canale HTTP obișnuite.

Implementarea serviciilor web .NET este la fel de simplă ca invocarea unui serviciu web la distanță sau apelarea unei metode pe o clasă locală. Face acest lucru utilizând instrumentele oferite de .NET Framework pentru a crea un serviciu web complet, fără a fi nevoie să învețe detalii despre cum funcționează standardele precum SOAP, WSDL și UDDI. În acest caz, se efectuează următoarele acțiuni:

  1. Un serviciu web este conceput ca o clasă .NET cu atribute care îl identifică ca un serviciu web cu anumite funcționalități.
  2. Mediul .NET generează automat un document WSDL care descrie modul în care clientul ar trebui să interacționeze cu serviciul web.
  3. Consumatorul găsește serviciul web generat și poate adăuga referința web corespunzătoare la proiectul Visual Studio .NET.
  4. Mediul .NET validează automat documentul WSDL și generează o clasă proxy care permite consumatorului să interacționeze cu serviciul web.
  5. Consumatorul apelează una dintre metodele clasei dvs. de servicii web. Din punctul său de vedere, acest apel nu este în exterior diferit de apelarea unei metode din orice altă clasă, deși interacțiunea are loc de fapt cu clasa proxy, și nu cu serviciul web.
  6. Clasa proxy convertește parametrii trecuți într-un mesaj SOAP și îl trimite către serviciul web.
  7. Clasa proxy primește apoi răspunsul SOAP, îl convertește în tipul de date corespunzător și îl returnează ca tip de date .NET obișnuit.
  8. Consumatorul folosește datele primite.

Serviciile web .NET utilizează tehnologia ASP .NET, care face parte din .NET Framework. De asemenea, necesită suport de la serverul Microsoft IIS.

Principalele dezavantaje ale serviciilor web sunt performanța mai scăzută și dimensiunea mai mare a traficului de rețea în comparație cu tehnologii precum RMI, CORBA, DCOM datorită utilizării mesajelor text XML.

Standarde pentru servicii web.

specificația WSDL

Fiecare serviciu web oferă un document Web Service Description Language (WSDL) care descrie tot ceea ce are nevoie un client pentru a lucra cu acel serviciu. Un document WSDL oferă un mod simplu și consistent pentru un dezvoltator de a specifica sintaxa pentru invocarea oricărei metode web. Mai mult, acest document vă permite să utilizați instrumente automate de generare a clasei proxy, cum ar fi cele incluse în Visual Studio .NET și .NET Framework. Cu aceste instrumente, utilizarea unui serviciu web este la fel de ușoară ca și utilizarea unei clase locale.

Documentul WSDL este într-un format bazat pe XML, conform căruia informațiile sunt împărțite în cinci grupuri. Primele trei grupuri sunt definiții abstracte care sunt independente de platformă, rețea sau limbaj, în timp ce celelalte două grupuri includ descrieri concrete.

Protocolul SOAP

Comunicarea între serviciile web și clienții acestora se realizează prin mesaje în format XML.

SOAP (Simple Object Access Protocol) este un protocol de mesagerie pentru selectarea serviciilor web.

Ideea de bază a standardului SOAP este că mesajele ar trebui să fie codificate într-un format XML standardizat.

Pe lângă mesajele SOAP, puteți utiliza metodele HTTP GET și POST pentru a comunica cu serviciile .NET.

Avantajele utilizării formatului SOAP față de alte formate pentru transferul de date:

  • Este la fel de ușor să codificați XML structuri de date și seturi de date folosind SOAP ca și simple date scalare.
  • Când utilizați mesaje SOAP, sunt furnizate instrumente suplimentare pentru a facilita adăugarea, de exemplu, a funcționalității de securitate sau de urmărire.
  • Seturile de instrumente SOAP sunt disponibile pentru diferite limbaje de programare (și chiar versiuni anterioare ale Microsoft C ++ și Visual Basic). În caz contrar, pentru a asigura comunicarea cu serviciul prin metodele GET și POST ale protocolului HTTP, va trebui evident să construiți singur șirul de interogare și apoi să analizați răspunsul.

Standard DISCO

Standardul DISCO oferă cea mai simplă modalitate de a accesa fișierele manifest prin gruparea legăturilor către servicii web.

Fișierul DISCO poate include fișiere de pe diverse servere web și acceptă „căutare dinamică” - căutarea automată a unui director de fișiere de servicii web pe un server.

Fișierele manifest sunt utile deoarece reunesc multe servicii web într-o singură listă, dar împiedică clienții să găsească un anumit tip de serviciu web fără a specifica numele companiei dezvoltatoare.

specificația UDDI

Specificația UDDI (Descriere universală, descoperire și integrare) evită aceste probleme prin utilizarea unui depozit special (repozitiv) în care întreprinderile și organizațiile pot plasa date despre serviciile pe care le oferă. Peste 100 de companii (o listă completă poate fi găsită la http://www.uddi.org/community.html), inclusiv Sun și Microsoft, au fost pionier în crearea tehnologiei UDDI. Împreună, aceste companii au dezvoltat un proiect de specificație UDDI care a fost standardizat după 18 luni.

Informațiile din acest depozit trebuie actualizate manual. În acest scop, unele „instrucțiuni nodale” păstrează copii identice ale depozitului UDDI. Aceste companii oferă stocarea depozitului specificat și acces gratuit la acesta pentru a populariza seria web. În plus, Microsoft a inclus o versiune de UDDI în software-ul de server Windows .NET pentru utilizare pe intraneturile corporative.

Depozitul UDDI conține informații despre întreprinderile care furnizează servicii web, tipul fiecărui serviciu și link-uri către informații și specificații legate de acele servicii. UDDI în sine este un serviciu web. Pentru a vă înregistra sau a găsi un serviciu, trimiteți un mesaj SOAP.

WEB - integrare.

Provocarea integrării web este de a aduce împreună aplicații și sisteme web disparate într-un singur mediu web.

Sunt practicate următoarele abordări ale integrării web:

· Integrare la nivel de prezentare. Acest nivel permite utilizatorului să interacționeze cu aplicația. Integrarea la nivel de prezentare dă acces la interfața de utilizator a aplicațiilor de la distanță.

· Integrare la nivel de funcționalitate. Această integrare presupune asigurarea accesului direct la logica de afaceri a aplicațiilor. Acest lucru se realizează prin interacțiunea directă a aplicațiilor cu API(interfață de programare a aplicației) sau interacțiune prin servicii web.

· Integrare la nivel de date. În acest caz, acces la unul sau mai multe baze de date utilizat de aplicația de la distanță.

· Integrare complexă. Soluțiile comerciale de integrare web includ de obicei toate cele trei tipuri de integrări

Utilizarea integrării web este benefică din mai multe motive:

· Integrare web vă permite să implementați sisteme de informații bazate pe aplicații terțe fără a fi nevoie să înțelegeți sistemele lor părinte, mediile software și arhitecturile bazelor de date.

· SOAși servicii web utilizați un limbaj de programare și interfețe independente de platformă între aplicațiile infrastructurii IT corporative. Acest lucru oferă avantaje evidente în suport, manevrabilitate, desfășurare a rețelelor de informații.

· Integrarea web permite construirea de funcționalități complexe prin combinarea componentelor disparate prin protocoale de servicii web.

· Integrarea web vă permite să utilizați serviciile web pentru dezvoltatori.

· Integrarea web vă permite să dezvoltați API-uri prin protocoale de servicii web fără programare.

Pentru integrarea web, software comercial sau tehnologii populare, cum ar fi PHP / Python / Perl, XForms, SĂPUN etc.

Integrare bazată pe XML

În loc să implementați interacțiunea între fiecare pereche de sisteme, trebuie doar să-i învățați pe fiecare dintre ele să „vorbească” XML. Cu alte cuvinte, totul se reduce la dezvoltarea mai multor ambalaje (wrapper - un wrapper, un instrument software pentru crearea unui wrapper de sistem pentru standardizarea apelurilor externe și schimbarea orientării funcționale a sistemului de operare), care se va traduce din limbajul XML standard al unui sistem integrat într-un limbaj care este ușor de înțeles pentru fiecare sistem separat.

· Instrumente de dezvoltare și biblioteci standard pentru XML există pe aproape toate platformele și pentru cele mai populare limbaje de programare;

· Metodele de lucru cu XML sunt suficient de standard astfel încât aceleași tehnici să poată fi utilizate în sisteme diferite;

· Informațiile formatate în XML pot fi procesate nu numai de mașini, ci și de oameni (ceea ce facilitează foarte mult depanarea).

Practic, integrarea schemei XML nu este fundamental diferită de orice altă integrare standard comună. În același timp, are o serie de avantaje semnificative:

· Limbile XML nu depind de platformele hardware și software, ceea ce vă permite să conectați sisteme eterogene;

· Puterea de expresie a XML este suficient de mare pentru a descrie date de aproape orice complexitate;

Integrarea bazată pe XML este practic implementată în cadrul următoarelor protocoale:

· XML-RPC... Este un protocol RPC care transferă date în format XML prin portul TCP 80, adică Port HTTP.

· WDDX(Schimb distribuit web). Este un mecanism pentru schimbul de structuri complexe de date folosind protocolul HTTP. Protocolul nu se bazează pe structuri, ci pe evenimente.

· ebXML(electronic buisiness XML) - XML ​​​​pentru e-business. Scopul său principal este de a oferi o infrastructură XML deschisă care să permită utilizarea globală sigură a informațiilor de afaceri electronice. Servicii web (servicii web).

XML (eXtensibleMarkupLanguage) este limbajul de marcare recomandat de W3C. XML este un format de text pentru stocarea datelor structurate, pentru schimbul de informații între programe, precum și pentru crearea limbajelor de marcare specializate pe baza acestuia. XML este un subset simplificat al SGML .

Limbajul XML are următoarele demnitate:

  • Este un format de document centrat pe om, care poate fi înțeles atât de oameni, cât și de computere.
  • Suporta Unicode.
  • Structurile de bază ale datelor, cum ar fi înregistrările, listele și arborii pot fi descrise în format XML.
  • Este un format de auto-documentare care descrie structura și numele câmpurilor, precum și valorile câmpurilor.
  • Are o sintaxă și cerințe de analiză bine definite, ceea ce îi permite să rămână simplu, eficient și consistent.
  • Folosit pe scară largă pentru stocarea și procesarea documentelor;
  • Este un format bazat pe standarde internaționale;
  • Structura ierarhică a XML este potrivită pentru a descrie aproape orice tip de document;
  • Este un text simplu, fără licențe și orice restricții;
  • Platforma independenta;
  • Este un subset al SGML pentru care s-a acumulat multă experiență și s-au creat aplicații specializate;

faimos dezavantaje limbile includ următoarele:

· Sintaxa XML este redundantă.

· Dimensiunea documentului XML este semnificativ mai mare decât reprezentarea binară a acelorași date.

· Dimensiunea unui document XML este semnificativ mai mare decât a unui document în formate alternative de transfer de date textuale (de ex. JSON, YAML) și mai ales în formate de date optimizate pentru un anumit caz de utilizare.

· Redundanța XML poate afecta performanța aplicației. Costul stocării, procesării și transferului datelor este în creștere.

· Un număr mare de sarcini nu necesită întreaga putere a sintaxei XML și pot fi utilizate soluții mult mai simple și mai performante.

  • Spațiile de nume XML sunt dificil de utilizat și greu de implementat în parsere XML.
  • XML nu conține suport pentru limba maternă pentru tipurile de date. Nu are conceptul de „întregi”, „șiruri”, „date”, „booleeni”, etc.
  • Modelul de date ierarhic oferit de XML este limitat în comparație cu modelul relațional și graficele orientate pe obiecte.

În esență, XML servește metalimbaj pentru a descrie structura altor limbi. Relația dintre SGML, XML, HTML și alte limbi este prezentată în următoarea diagramă:

O diferență importantă între XML și HTML este că pune mult accent pe controlul cât de bine sunt respectate regulile limbajului la marcarea documentelor. În funcție de aceasta, se obișnuiește să se aloce bine formatși valabil documente XML .

Se ia în considerare documentul XML bine format dacă se potrivește cu toate regulile de sintaxă XML.

Examinare realitate document presupune următoarele acțiuni:

  • Verifică dacă se utilizează numai un anumit set de descriptori.
  • Verificarea conformității deplină a ordinii elementelor și atributelor cu conținutul documentului sau cu anumite reguli.
  • Controlul tipului de date (realizat prin utilizarea schemei adecvate).
  • Controlul integrității datelor pentru a asigura schimbul optim de informații pe Web folosind tranzacții.

Reguli de sintaxă de bază construirea de documente XML.

  • Documentul XML conține unul și numai unul element rădăcină conţinând toate celelalte elemente
  • Elemente copil cuprins în element rădăcină trebuie să fie imbricate corespunzător.
  • Nume elementele respectă regulile:
  • Numele începe cu o literă, liniuță de subliniere sau două puncte.
  • Primul caracter din nume poate fi urmat de litere, cifre, cratime, caractere de subliniere, puncte sau două puncte.
  • Numele nu pot începe cu XML.

Documentul XML are următoarea structură:

  • Prima linie a documentului XML este apelată anunţ XML. Acesta este un șir opțional care indică versiunea standardului XML (de obicei 1.0). Codificarea caracterelor și dependențele externe pot fi, de asemenea, specificate aici.

Top articole similare