Come configurare smartphone e PC. Portale informativo
  • casa
  • notizia
  • Linguaggi di markup dei dati estesi SGML, XML. Guarda cos'è "XML" in altri dizionari Html è un'applicazione sgml standard

Linguaggi di markup dei dati estesi SGML, XML. Guarda cos'è "XML" in altri dizionari Html è un'applicazione sgml standard

Storia

Diamo un'occhiata a un esempio di una semplice ricetta culinaria con tag XML:

> Pane semplice > > Farina > Lievito > Acqua calda > Sale > > > > Amalgamare tutti gli ingredienti e impastare bene. > > Coprire con un panno e lasciare per un'ora in una stanza calda. > > Impastare ancora, mettere su una teglia e infornare. > > >

Dichiarazione XML

Viene chiamata la prima riga del documento XML Dichiarazione XML(ing. Dichiarazione XML) è una stringa che indica la versione XML. Nella versione 1.0 Dichiarazione XML può essere omesso, è richiesto nella versione 1.1. Anche qui è possibile specificare la codifica dei caratteri e la presenza di dipendenze esterne.

La specifica richiede che i processori XML supportino le codifiche Unicode UTF-8 e UTF-16 (UTF-32 è opzionale). Altre codifiche basate sullo standard ISO / IEC 8859 sono riconosciute come accettabili, supportate e ampiamente utilizzate (ma non richieste), sono accettabili anche altre codifiche, ad esempio Russian Windows-1251, KOI-8. Spesso le lettere non latine non vengono utilizzate nei tag in linea di principio, in questo caso UTF-8 è una codifica molto conveniente: il volume, di regola, è inferiore rispetto a UTF-16; la decodifica può essere eseguita sia per l'intero documento che per attributi e testi specifici; l'intero documento non contiene caratteri illegali quando si tenta di analizzare con la codifica errata.

elemento radice

Il requisito sintattico obbligatorio più importante è che il documento ne abbia solo uno elemento radice(ing. elemento radice) (a volte chiamato anche elemento del documento(ing. elemento del documento)). Ciò significa che il testo o altri dati per l'intero documento devono essere posizionati tra un singolo tag radice iniziale e il tag finale corrispondente.

Il seguente esempio più semplice è un documento XML ben formato:

L'esempio seguente non è un documento XML valido perché ne ha due elemento radice:

> Entità n. 1 > > Essenza #2 >

Un commento

Un elemento può essere posizionato ovunque nell'albero. un commento... I commenti XML sono inseriti all'interno di un tag speciale che inizia con caratteri... I due caratteri trattino (-) non possono essere presenti all'interno di un commento.

I tag all'interno di un commento non devono essere elaborati.

tag

Il resto di questo documento XML consiste in annidato elementi alcuni dei quali hanno attributi e contenuto. Elemento di solito consiste in tag di inizio e fine che incorniciano il testo e altri elementi. Tag di apertura consiste di Nome dell'elemento tra parentesi angolari, per esempio , un tag di fineè costituito dallo stesso nome tra parentesi angolari, ma viene aggiunta una barra prima del nome, ad esempio,... I nomi degli elementi, come i nomi degli attributi, non possono contenere lacune, ma può essere in qualsiasi lingua supportata dalla codifica del documento XML. Il nome può iniziare con una lettera, un carattere di sottolineatura, due punti. Il resto dei caratteri del nome possono essere gli stessi caratteri, così come numeri, trattino, punto.

XML ha diverse entità predefinite come lt (puoi fare riferimento ad esso scrivendo<) для левой угловой скобки и amp (ссылка - &) для амперсанда. Возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков.

Di seguito è riportato un esempio di utilizzo di un'entità predefinita per evitare di utilizzare il carattere e commerciale nel nome:

> AT&T >

L'elenco completo delle entità predefinite è costituito da & (&),< (<), >(>), "(") e "(") - gli ultimi due sono utili per scrivere delimitatori all'interno dei valori degli attributi. Puoi definire le tue entità in un documento DTD.

A volte è necessario definire uno spazio unificatore, che è molto spesso utilizzato in HTML ed è indicato come. Non esiste una tale entità predefinita in XML, è scritta e il suo utilizzo provoca un errore. La mancanza di questa essenza molto comune per molti programmatori è spesso sorprendente e questo crea alcune difficoltà durante la migrazione dei loro sviluppi HTML a XML.

Riferimento per numero di simbolo(ing. riferimento a caratteri numerici) sembra un riferimento a un'entità, ma al posto del nome dell'entità viene indicato il simbolo # e un numero (in notazione decimale o esadecimale), che è il numero del carattere nella tabella dei codici Unicode. Di solito si tratta di caratteri che non possono essere codificati direttamente, come una lettera araba in un documento con codifica ASCII. La e commerciale può essere rappresentata come segue:

> AT&T >

Esistono altre regole su come scrivere un documento XML ben formato.

Vantaggi e svantaggi

Dignità

Screpolatura

  • Ambiguità della modellazione.
  • XML non contiene il supporto del linguaggio nativo per i tipi di dati. Non ha una tipizzazione forte, ovvero i concetti di "interi", "stringhe", "date", "booleani", ecc.
  • Il modello dati gerarchico offerto da XML è limitato rispetto al modello relazionale e ai grafici orientati agli oggetti e al modello dati di rete.

Mappatura XML sul World Wide Web

Esistono tre modi più comuni per convertire un documento XML in una vista visibile dall'utente:

  1. Applicare stili CSS;
  2. applicazione XSL;
  3. Scrivere un elaboratore di documenti XML in un linguaggio di programmazione.

Per definire una trasformazione XSL (XSLT) sul lato client, è necessaria la seguente istruzione nell'XML:

Dizionari XML

Poiché XML è un linguaggio abbastanza astratto, sono stati sviluppati vocabolari XML.

Un dizionario consente agli sviluppatori di concordare un insieme finito di nomi di tag e attributi per quei tag. Uno dei primi vocabolari è XHTML, che è compreso dalla maggior parte dei browser. XHTML viene spesso utilizzato per archiviare e modificare i contenuti in un CMS.

Sono stati creati vocabolari più specializzati, come il protocollo di comunicazione SOAP, che non è centrato sull'uomo e piuttosto difficile da leggere. Esistono vocabolari commerciali come CommerceML, xCBL e cXML che vengono utilizzati per comunicare dati per attività commerciali, questi vocabolari includono descrizioni del sistema di ordinazione, fornitori, prodotti e altro.

Di solito, quando si descrive un documento, una persona escogita una sorta di vocabolario per se stessa, che viene quindi descritta mediante DTD, XSD o semplicemente spiegata "sulle dita" alle parti interessate.

Uno dei dizionari più diffusi è FB2 - un dizionario che descrive il formato di un libro, con tutti i tipi di note a piè di pagina, citazioni e persino immagini.

Versioni XML

  • XML 1.0
  • XML 1.1

Guarda anche

Note (modifica)

Letteratura

  • David Hunter, Jeff Rafter, Joe Fausett, Eric van der Vlist, et al. XML. Utilizzo di XML, 4a edizione = Inizio XML, 4a edizione. - M.: "Dialettica", 2009. - 1344 p. - ISBN 978-5-8459-1533-7
  • David Hunter, Jeff Rafter et al. XML. Corso Base = Inizio XML. - M.: Williams, 2009 .-- 1344 p. - ISBN 978-5-8459-1533-7
  • Roberto Tabor. Implementazione di servizi Web XML su piattaforma Microsoft .NET = Servizi Web Microsoft .NET XML. - M.: Williams, 2002 .-- 464 p. - ISBN 0-672-32088-6

Link

  • XML sul sito del World Wide Web Consortium (W3C)
  • Specifiche ufficiali XML 1.0
  • Specifiche ufficiali XML 1.1
  • Documentazione XML sugli articoli del sito IBM, forum

vptyu fPVPFTBU

SGML: YUEN LFP EDSF?

UEZPDOS CHUE YUBEE NPTSOP CHUFTEFYFSH BVVTECHEYBFKHTH SGML. NOPZYE CHYDSCH DPLHNEOFBGY RPUFBCHMSAFUS CH ZHPTNBFE SGML. rPRHMSTOSCHK SSCHL TBNEFLY Web-UVTBOYG HTML SCHMSEFUS RTYMPTSEOYEN SGML. rPSChMSEFUS Chueh VPMSHYE RTYLMBDOSCHI RTPZTBNN LCA TBVPFSCH In SGML: TEDBLFFTSCH, UTEDUFCHB ZHPTNBFYTPCHBOYS, UYUFENSCH DPLHNEOFPPVPTPFB, YURPMSHHAEYE SGML B LBYUEUFCHE ZHPTPNE h SGML ZPFPCHSFUS Lojze YDBFEMSHUFCHB O "Reilly, FEIOYYUEULBS DPLHNEOFBGYS IBM, Sun Q OSF. pUOPChSchChBEFUS OF SGML YOZHPTNBGYPOOBS FEIOPMPZYS NOPZYPU CHEDHYYEMS NBYYOPUFT.

rPSCHYCHYBSUS CH OBYUBME CHPUSHNYDEUSFCHI SGML-FEIOPMPZYS RETETSEYCHBEF UEKYUBU RETYPD TBUGCHEFB. SFP LFP FBLPE? SFP POB DBEF UCHPYN RPMSh'PCHBFEMSN? LBL Do OEK TBVPFBFSH? OB FY J DTHZYE CHPTRPUSCH S RSCHFBAUSH PFCHEFYFSH LFPK UFBFSHEK.

UPDETZBOYE





















LBL CON OBVTEM SU SGML-FEIOPMPZYA

CHUE OBYUBMPUSH A YOFTBOEFB. ьFP NPDOPE UMPCHP P'OBYUBMP DMS NEOS INFORMAZIONI SU RTBLFile FP, UFP DPLKHNEOFSH, LPFPTSCHE S TEZKHMSTOP RYUBM RP TPDKH UCHPEK DESFEMSHOPUFY, UFBMPKH NPTSOPUP YOU DP UYI RPT S RTPUFP OBVYTBM DPLKHNEOFSCH CH T E X-e RYUBFBM YI INFORMAZIONI SU VKHNBZ. iDES DHVMYTPCHBFSH YI CH HTML CHTKHYUOHA PFRBMB UTBKH: OENEDMEOOOP CHOYLMB VSCh RTPVMENB UYOITPOYBGY VHNBTSOPK Y ЬMELFTPOOPK CHETUEFYK FPOZL.

b CHULPTE RPFTEVPCHBMPUSH RETYPDYUEULBS RETEDBYUB DPLHNEOFPCH RPUFPTPOOIN MADSN CH LMELFTPOOPK ZHPTNE, UFP, RP UMPTSYCHYEKUS X OBU RTBFBLFYULEKUS TBVPFBFSH U MS Word X NEOS RP TSDH RTYUYO OE VSCHMP OYLBLPZP TSEMBOYS, L FPNKH TSE FP FPMSHLP HUHZHVYMP VSCH RTPVMENKH UYOITPOYIBGY CHET.

OBYuYF, OHTSOP VSCHMP RTYDHNBFSH URPUPV BCHFPNBFYYUEULPZP RTEPVTBPCHBOYS OBVYTBENSCHI DPLHNEOFPCH B TBMYYUOSCHE ZHPTNBFSCH: T E X-a - LCA REYUBFY ON VHTPBZEY,. lTPNE FPZP, NOE IPFEMPUSH, YuFPVSch FBLPE UTEDUFCHP PFCHYUBMP EEE TSDH FTEVPCHBOYK:

  • VSHFSH NPDKHMSHOSCHN, YUFPVSH NPTSOP VSCHMP RTY OEPVIPDYNPUFY MEZLP DPVBCHMSFSH OPCHSCHE CHSCHIPDOSH ZHPTNBFSH YMY YNNEOSFSH BMZPTYFNSCH RTEPVTBCHPCHBOYE;
  • VSCHFSH PFLTSCHFSCHN, VEURMBFOSCHN, LBL NPTSOP NEOSHIE RTYCHSBOOSCHN L LPOLTEFOSCHN RTPZTBNNBN;
  • VSHFSH NPVYMSHOSCHN: TBVPFBFSH, LBL NYOYNKHN, INFORMAZIONI SU TBOBOSHI UNIX-RMBFZHPTNBI;
  • VSCHFSH MEZLP THUYZHYGYTKHENSCHN.

RETCHSCHN, UFP RPRBMPUSH NOE RPD THLH RPUME RPIPDB INFORMAZIONI SU Altavista, PLBBMUS RBLEF RPD OBCHBOYEN linuxdoc-sgml. PO LBL TBJ RTEDOBOOBYUBMUS DMS ZEOETBGY HTML, T E X Y RTF Yj PDOPZP CHIPDOPZP ZhBKMB. yYTPLP YURPMSHHENSCHK CH TBNLBI Progetto di documentazione Linux, ON YURPMSh'PCHBM CH LBYUEUFCHE CHIPDOPZP ZhPTNBFB OEFOBLPNSCHK NOE DP UYI RPT SUSHL SGML. CHRTPYUEN, OYUEZP UMPTSOPZP CH OEN OE PLBBMPUSH - PO CHEUSHNB OBRPNYOBM JOBLPNSCHK NOE HTML TH CHCHZMSDEM CHRPMOE RPOSFOP. chPF, L RTYNETH, LHUPYEL SGML-DPLHNEOFB:

La struttura di un testo TEI

Tutti i testi conformi a TEI contengono un intestazione TEI(contrassegnato come a teiHeader elemento) e la trascrizione del testo proprio (contrassegnato come a testo elemento).

dMS FPZP, UFPVSH OBYUBFSH OB FFPN RYUBFSH, RPFTEVPCHBMPUSH CHUEZP MYISH ABRPNOYFSH OEULPMSHLP PUOPCHOSHI LMENEOFPCH TBNEFLY, OBRTINET

POBUBEF OBYUBMP RBTBZTBZHB, - OBYUBMP RETEUUMEOIS J FR.

OBVTBOOSCHK CH SGML FELUF DBMEE ABRKHULPN PDOPZP ZHYMSHFTB RTEPVTBJHEFUS CH HTML, DTHZPZP - CH T E X, FTEFSHESP - CH RTF, J FBL DBMEE.

SFP FBLPE SGML J JUEN SU IPTPI

FETNYOPMPIS

GML ( Linguaggio di marcatura generalizzato) TBTVBVPFBO CH OEDTBI CHEDEUHEEK LPTRPTBGY IBM. EZP OBUMEDOIL SGML ( Linguaggio di marcatura generalizzato standard) RTIOSF CH 1986 ZPDKH CH LBYUEUFCHE NETSDHOBTPDOPZP UFBODBTFB DMS PRTEDEMOYS OEBCHYUYNSHI PF KHUFTKUFCH CHCHPDB / CHCHCHPDB, OEBCHYUYUYCHYUPDUF CHHPDUPK WPMEE FPUOP, SGML - LFP NEFBSUCCL , FP EUFSH UTEDUFCHP ZhPTNBMSHOPZP PRYUBOYS SZSCHLB, CH DBOOPN UMHYUBE, SSSHLB TBNEFLY .

yUFPTYUEEULY UHMCP TBNEFLB YURPMSHPCHBMPUSH LCA PRYUBOYK BOOPFBGYK YMY DTHZYI PVPOBYUEOYK CHOHFTY FELUFB, RTEDOBOBYUEOOSCHI LCA HLBBOYK UPUFBCHYFEMA YMY "CHETUFBMSHEYLH" FPZP, LBL YNEOOP LPOLTEPMTSOP VCHEFP DPOLTEFOPE NEUFFB rTYNETSCH CHLMAYUBAF RPDYUETLYCHBOYE CHPMOYUFPK YUETFPK, PVP'OBYUBAEE LKHTUYCH, UREGIBMSHOSCHE YOBULY DMS RTPRHULB ZhTB YMY YI REYUBFY LPOLEYMEEFOSCHN. lPZDB ZhPTNBFYTPCHBOYE Y REYUBFSH FELUFPCH UVBMY BCHFPNBFYYTPCHBOOSCHNY, FFPF FETNYO UVBM PICHBFSCHBFSH CHUE CHYDSCH UREGEYBSHOSCHI LAPDHR TBNEFLY , CHUFBCHMSENSHI CH'MELFTPOSCHE FELUFSCH DMS HRTBCHMEOIS ZHPTNBFYTPCHBOYEN, REYUBFSHA YMY DTHZPK PVTBVPFLPK.

pVPVEBS, TBNEFLKH, YMY LPDYTPCHLH , PRTEDEMSAF LBL MAVPE UTEDUFCHP UDEMBFSH SCHOSCHN YOFETRTEFBGYA FELUFFB. Su VBOBMSHOPN HTPCHOE Chueh OBREYUBFBOOSCHE FELUFSCH LPDYTPCHBOSCH B FPN UNSCHUME: obly RTERYOBOYS, YURPMSHPCHBOYE BZMBCHOSCHI VHLCH, TBURPMPTSEOYE VHLCH RP UFTBOYGE, DBTSE YOFETCHBMSCH NETSDH UMPCHBNY NPTSOP UYUYFBFSH LBLPK H-FP UFEREOY TBNEFLPK, ZHHOLGYS LPFPTPK - RPNPYUSH YUEMPCHELH, YUYFBAEENH FELUF, PRTEDEMYFSH, zde LPOYUBEFUS PODOP UMPCHP Y OBYUYOBEFUS DTHZPE, YMY LBL IDDEOFYZHYGYTPCHBFSH PUPVEOPUFY UVTHLFKHTSCH, FBLYE LBL ABZPMPCHLY, YMY RTPUFFCHE UYOFBLUEGYUPYUPYUPDUFFCHE UYOFBLUEY lPDYTPChBOYE FELUFB LPNRSHAFETOPK PVTBVPFLY VMI, W RTYOGYRE, LBL TBUYYZHTPCHLB NBOHULTYRFB have RETZBNEOFB - RTPGEUU DEMBOYS SCHOSCHN OESCHOPZP YMY RPDTBHNECHBEFPSHPL.

rap SSSHLPN TBNEFLY RPOINBAF OBVPT UPZMBIEOIK P TBNEFLE, RTEINEOSENSHI DMS LPDYTPCHBOYS FELUFPCH. ssshl TBNEFLY DPMTSEO UREGYZHYGYTPCBFSH, LBLBS TBNEFLB DPRKHUFYNB, LBLBS TBNEFLB PVSBFEMSHOB, LBL PFMYUYUIFSh TBFNEFUFFLB YFMYUYUIFSh TBFNEFLUFLB SGML RTEDPUFBCHMSEF TEEEOIS DMS RETCHCHI FTEI ЪBDBYU, PFDEMSHOBS DPLKHNEOFBGYS PVSCHYUOP OEPVIPDYNB DMS RPUMEDOEK.

PUPVEOOPUFFY SGML

fty IBTBLFETYUFILY SGML PFMYUBAF EZP PF RTPYUYI SSCHLPCH TBNEFLY.

PRYUBFEMSHOBS TBNEFLB

UYUFENB U PRYUBFEMSHOPK TBNEFLPK YURPMSHHEF LPDSCH TBNEFLY, LPFPTSCHE RTPUFP RTEDPUFBCHMSAF OBCHBOYS DMS LBFESPTEYBGY YUHUHNEFEK DPL. lPDSCH TBNEFLY, FBLYE LBL YMY \ fine (elenco), RTPUFP IDDEOFIZHYGYTKHAF RPTGYA DPLKHNEOFB J HFCHETTSDBAF, UFP "POB SCHMSEFUS RBTBZTBZHPN", YMJ UFP "LFP - LPOEG OBYUBUMEDOUP. in DTHZPK UFPTPOSCH, UYUFENB hanno RTPGEDHTOPK TBNEFLPK PRTEDEMSEF, LBLBS PVTBVPFLB DPMTSOB CHSCHRPMOSFSHUS B LPOLTEFOPK FPYULE DPLHNEOFB "B FPN NEUFE CHSCHCHCHBFSH RTPSHCHCHBFSH RTPSHETHSED, ZCHHF RTPGEDHTH PARA hanno 1, bTBREDHCHHAS RTPGEDHTH PARA hanno 1 RBTBNREF 2 RTPRKHUFYFSH PDOH UFTPLKH Y CHUFBFSH INFORMAZIONI SU OPCHA SPADE ZTBOYGKH "Y FR. h SGML YOUFTHLGYY, OEPVIPDYNSCHE LCA PVTBVPFLY DPLHNEOFB Y-LBLPK MYVP LPOLTEFOPK GEMSHA (OBRTYNET, ICH ZHPTNBFYTPCHBOYS) YUEFLP PFDEMSAFUS PF PRYUBFEMSHOPK DBNEFLY, LPFBEFTY. pvshchuop POI UPVTBOSCH CHOE DPLKHNEOFB CH PFDEMSHOSHI RTPGEDKHTBI YMY RTPZTBNNBI.

in PRYUBFEMSHOPK, B OE RTPGEDHTOPK, TBNEFLPK PDYO J FPF CE DPLHNEOF NPTSEF VSCHFSH PVTBVPFBO TBOPPVTBOSCHNY RTPZTBNNBNY, LBTSDBS dv LPFPTSCHI NPTSEF RTYNEOSFSH TBHLGYYUOSCHE YFBFTUFCHE oBRTYNET, RTPZTBNB BOBMYIB UPDETTSYNPZP NPTSEF RPMOPUFSHA YZOPTYTPCHBFSH UOPULY, FPZDB LBL RTPZTBNNB ZhPTNBFYTPBUYS NPTsEBFMSH YBYUCHME TBMYUOSCHE CHYDSCH YOUFTKHLGYK PVTBVPFLY NPZHF BUUPGYITPCHBFSHUS U PDOPK Y FPK TSE YUBUFSHA ZHBKMB. oBRTYNET, PDOB RTPZTBNNB NPTSEF YCHMELBFSH dv DPLHNEOFB ZHBNYMYY MADEK J ZEPZTBZHYYUEULYE OBCHBOYS LCA UPDBOYS YODELUB YMY VBSCH DBOOSCHI, FPZDB LBL DTHZBS, PVTBVBFSCHCHBAEBS FPF CE UBNSCHK FELUF, NPTSEF REYUBFBFSH ZHBNYMYY J OBCHBOYS PFMYYUBAEYNUS YTYZHFPN.

fireshch DPLHNEOFPCH

SGML CHHPDIF RPOSFYE FIRB DPLHNEOFB , Y, UPPFCHEFUFCHOOOP, PRTEDEMEOIS FIRB DPLHNEOFB (definizione del tipo di documento, DTD). DPLKHNEOFSCH UYUIFBAFUS FYRYJTPCHBOSCHNY, FBL TSE, LBL J DTHZIE PVTBVBFSCHCHBENSCHE LPNRSHAFETBNY PVYAELFSCH. FIRE DPLKHNEOFB ZhPTNBMSHOP PRTEDEMSEFUS EZP UPUFBCHOSCHNY YUBUFSNY YI UVTHLFKHTPK. PRTEDEMEOYE, OBRTYNET, PFYUEFB NPTSEF VSHFSH FBLYN, UFP PO UPUFFPIF Y ЪBZPMPCHLB Y, CHPNPTSOP, BCHFPTB, ЪB LPFPTSCHNY UMEDHEDEF BOPUFFPUGBMEB mAVPK DPLHNEOF PFUHFUFCHYE BZPMPCHLB W, W UPPFCHEFUFCHYY avere FYN ZHPTNBMSHOSCHN PRTEDEMEOYEN, OE VHDEF ZHPTNBMSHOP SCHMSFSHUS PFYUEFPN, FBL CE SAT LBL VHDEF dH SCHMSFSHUS J RPUMEDPCHBFEMSHOPUFSH BVBGECH, B LPFPTPK UMEDHEF BOOPFBGYS, OECHYTBS ON AF ON OBULPMSHLP RPIPTS PFYUEF FBLPK DPLHNEOF avere FPYULY TEOYS YUYFBFEMS- UEMPCHELB .

rPULPMShLKh DPLKHNEOFSCH PFOPUSFUS L YCHEUFOSCHN FIRBN, SPTSOP YURPMSHPCHBFSH UREGIBMSHOKH RTPZTBNNKH, OBSCHCHBENKHA BOBMYBFPTPPN (analizzatore), LCA FPZP, YUFPVSCH PVTBVPFBFSH DPLHNEOF, HFCHETTSDBAEYK, YUFP PFOPUYFUS IN A LPOLTEFOPNH FYRH, J RTPCHETYFSH, DEKUFCHYFEMSHOP MJ Chueh MENEOFSCH, FTEVHENSCHE LCA DBOSHOPPHUFF,PPHUFF,PHPLUFFFYRB OLF uFP EEE VPMEE CHBTSOP, TBOBOSCHE DPLKHNEOFSCH PDOPZP FIRB NPZHF PVTBVBFSCHBFSHUS KHOYZHYGYTPCHBOOSCHN PVTBBSPN. NPTSOP RYUBFSH VPMEE YOFEMMELFKHBMSHOSCHE RTPZTBNNSCH, YURPMSHHAEE YOBOIS, ЪBLMAYUEOOSCHE CH YOZHPTNBGYPOOPK UVTHLFKHTE DPLKHNEOFB.

OEBCHYUYNPUFSH DBOOSHI

pUOPChOBS GEMSH RTPELFYTPCHBOYS SGML VSCHMB B UPDBOYY ZBTBOFYK FPZP, YUFP DPLHNEOF, BLPDYTPCHBOOSCHK UPZMBUOP EZP RPMPTSEOYSN, VHDEF RETEOPUYNSCHN PDOPK. dCHB EZP UCHPKUFCHB, PRYUBOOSHCHYE CHCHYE, PFCEYUBAF ЬFPNKH FTEVPCHBOYA INFORMAZIONI SU BVUFTBLFOPN HTPCHOE; FTEFSHE UCHPKUFCHP - INFORMAZIONI SU HTPCHOE UVTPYEL VBKFPCH (UYNCHPMPCH), LPFPTSCHE UPUFBCHMSAF DPLKHNEOF. SGML RTEDPUFBCHMSEF PVPVEEOOSCHK NEIBOYUN UVTPLPCHPK RPDUFBOPCHLY , FP EUFSH, RTPUFFK NBYYOOP-OEBCHYUYNSCHK URPUPV KHLBBOYS, UFP LPOLTEFOBS UVTPLB UYNCHPMPCH CH DPLKHNEOFE CH NPNEOF PVTBVPFLY DPLKHNEOTSBOF pDOP PYUECHYDOPE RTYNEOOYE FPNKH NEIBOYNH - PVEUREUEEOE EDYOPK FETNYOPMPZYY; DTHZPE, J VPMEE OBYUYFEMSHOPE - RTPFYCHPDEKUFCHYE YCHEUFOPK OEURPUPVOPUFY TBOSCHI LPNRSHAFETOSCHI UYUFEN RPOYNBFSH OBVPTSCH UYNCHPMPCH DTHZ DTHZB, OBRTYNET, PDOPK UYUFENE RTEDUFBCHMSFSH Chueh ZTBZHYYUEULYE UYNCHPMSCH, OEPVIPDYNSCHE RTYMPTSEOYA, RHFEN PRYUBFEMSHOPZP PFPVTBTSEOYS OERETEDBCHBENSCHI UYNCHPMPCH. uFTPLY, PRTEDEMENSCHE FЙN NEIBOYNPN, OBSCHCHBAFUS UHEOPUFSNY (entità).

n RTEINHEEUFCHBI

SFP DBEF YURPMShPCHBOYE SGML CH TABMSHOPK QIYOI? NUOVO POP UTBKH DBMP CHP'NPTSOPUFSH RTPYCHPDYFSH DPLKHNEOFSCH CH MAVPN FTEVKHENPN CHYDE. xDPVOP PLBBMBMPUSH Y OBRYUBOYE "CHOPTDPCHCHCHI" VHNBTsEL CH RTICHSCHYUOPK UTEDE XEmacs VEH YURPMSHUPCHBOYS Windows. CHUE YURPMSHUPCHBOOSCHE RTPZTBNNSCH - VEURMBFOSCH Y TBURTPUFTBOSAFUS CH YUIPDOSCHI FELUFFBI, UFP RPCHPMYMP HUFBOPCHIFSH YI OB CHUEEI YURPMSHUKHENCHI NOPK UYUYU. rTYUEN PLBBMPUSH, UFP OBYUBFSH TBVPFBFSH U SGML CHECHUE OE UMPTSOP, LBTSDSCHK, LFP IPFSH TB TEDBLFAYTPCHBM WWW UFTBOYULH, OE YURHZBEFUFUS CHEYDB.

rPFPN HTSE, RP NETE RPUFEREOPZP YHYUEOYS SGML, S PUPBOBM, UFP ЬFB FEIOILB DBEF ZTPNBDOPE LPMYUEUFCHP CHPNPTSOPUFEK RP UPBCHOOYUPK

rTPDHLFYCHOPUFSH yuEFLP TBDEMEOSCHE RTPGEUUSCH CHCHPDB YOZHPTNBGYY RHPTNBFYTPCHBOYS RPCHPMSAF BCHFPTKH UPUTEDPFPYUYFSHUS OB YMPTSEOYL PYUYFSHUS OB YUMPTSEOYLUY NSCHUMMEK

EDYOB UVIMYUFILB MEZLP CHSCHDETTSYCHBFSH TBMYUOSCHE DPLKHNEOFSCH CH EDYOPN UFIME, YURPMSHUHS EDYOHA FETNYOPMPZYA. eUMY UFYMSH YMY FETNYOSCH OKHTSOP YUNEOIFSH, LFP DEMBEFUS TBPN PE CHUEI DPLHNEOFBI, OE FTPZBS YI UPDETTSYNPE.

rPChFPTOPE YURPMShSPCHBOYEьFPF FETNYO, IPTPYP OBLPNSCHK RTPZTBNNYUFBN, POBUBEF OBMYUYE ChP'NPTSOPUFY YURPMSHPCHBFSH DEFBMY UVBTSHI RTPELFPCH CH OPCHNEYUFBN yUBUFSH DPLKHNEOFB, PZHPTNMEOOBS CH CHYDE SGML-LMENEOFB, NPTSEF RETEOPUYFSHUS CH DTHZIE DPLKHNEOFSCH, MEZLP RPCHFPTSFSHUS CH TBOBOSHI NEUFBI FELUFFB.

dPMZPCHEUOPUFSH YOZHPTNBGY yb-bb FPZP, UFP SGML - RTPUFPK Y UFBODBTFOSCHK ZHPTNBF ITBOEOIS DBOOSHI, PFUHFUFCHHEF OEPVIPDYNPUFSH RETEZHPTNBFYTPCHBFSH YI CHCHYCHDKHBUFFBRKTNO yOZHPTNBGYS RTPUFP DPUFHROB OBCHUEZDB. POB OEUEF U UPVPK CHUE OEPVIPDINPE DMS UPUDBOYS DPLHNEOFB.

MHYUEE HRTBCCHEOE DBOSCHNY da SGML NPTSOP PRTEDEMSFSH YOZHPTNBGYPOSCHE LMENEOFSCH Y NBOYRKHMSGY U OYNY U RTPYCHPMSHOPK UVEREOSHA DEFBMSHOPUFY. TBNEYUEOOSCHE LMENEOFSCH NPZHF YNEFSH BFTYVKHFSCH, PRTEDEMSAEYE IBTBLFETYUFILY Y UCHPKUFCHB LMENEOFPCH. ьФБ YOZHPTNBGYS OE RTEDOBOBYUEOB DMS REYUBFY, OP NPTSEF RPNPYUSH CH HRTBCHMEOYY LMENEOFBNY DBOOSHI. oBRTYNET, BFTYVHF ID (IDEOFYZHYLBFPT) NPTSEF KHOILBMSHOSCHN PVTBSPN IDEOFYZHYGYTPCBFSH DOP BVJBG, YMY GEMSCHK TBBODEM, RTYNEYMABOYE

yOZHPTNBGYS
fBL LBL IDEOFYZHYLBFPTSCH SCHMSAFUS NBYYOOOP-YUIFBENSCHNY, POI NPZHF UCHSCHCHBFSH NECDKH UPVPK YOZHPTNBGYA YYURPMShPCHBFSHUSME HYURPMSHOPCHBFSHUSME DMSTBBOBPPK. IN LINEA:
  • lPOFTPMYTPChBFSH VEPRBUOPUFSH DPUFKHRB L YOZHPTNBGY, RPCHPMS FPMSHLP PRTEDEMEOOSCHN MADSN RTPUNBFTYCHBFSH YMY YNNEOSFSH EE.
  • bCHFPNBFYITPCHBFSH RETENEEEEOYE YOZHPTNBGY - OBRTYNET, PWOPCHMEOYE DBOOSHI CH PDOPN NEUFE NPTSEF YOYGYYTPCHBFSH PWOPCHMEOYE FPK TSBHEYTYOZHPTN

TBDEMSENPUFSH chPNPTSOPUFSH TBVPFSH UP UVTKHLFKHTYTPCHBOOSCHNY LPNRPOEOFBN DPLKHNEOFB RPJCHPMSEF UVTPYFSH GEMSCHK DPLKHNEOF YY UPUFFCHOSCHI YUBUFEYTPUGBOOZ РПъЧПМСОФ РПМШЪПЧБФЭМСН DEMYFSHUS YOZHPTNBGYEK WEB ITS DHVMYTPCHBOYS.

nPWYMSHOPUFSH h YOZHPTNBGYPOOSHI UEFSI, PVAEDYOSAEYI TBOPPVTBOSCHE LPNRSHAFETSCH. rPULPMSHLKH SGML OE BCHYUIF PF BRRBTBFHTSCH Y RTEIMPTSEOIK, NPTSOP MEZLP PVNEOYCHBFSHUS DPLKHNEOFBNY NETSDKH TBMYUOSCHNY UYUFENBNY.

ZYVLPUFSH CH RTEYMPTSEOYY SGML РПъЧПМСОФ YURPMShъPCHBFSH YOZHPTNBGYA DBMELP ЪB TBNLBNY "OBUFPMSHOPK FIRPZTBZHYY". IN LINEA:

  • UVTBOYGSCH WWW;
  • YOZHPTNBGYPOSCHE VBBSH DBOOSHI;
  • DYBZOPUFYUEULYE / ЬLURETFOSCHE UYUFENSCH;
  • LMELFTPOOBS RPUFB;
  • ZYRETFELUFPCHBS DPLKHNEOFBGYS;
  • РХВМЙЛБГЙЙ INFORMAZIONI SUL CD-ROM;
  • YOFETBLFYCHOSCHE SMELFTPOSCHE NBOHBMSCH.

pUENX SGML?

rPUENH OE Parola? rPFPNKh, UFP LFP YBLTSCHFSCHK ZhPTNBF. rPFPNKh, UFP LFP ZhPTNBF PDOPZP RTYMPCEOIS. rPFPNKH, UFP LFPZP RTEIMPTSEOIS OEF RPD AOILUBNY, U LPFPTSCHNY S TBVPFBA. rPFPNKH, UFP LFP OE FELUFPCHSCHK ZhPTNBF. rPFPNKH, UFP OEF UTEDUFCH BCHFPNBFYUEEULPK ZEOETBGY FBLYI DPLHNEOFPCH. rPFPNKH, UFP OEF FPMLPCHCHI UTEDUFCH HRTBCHMEOYS CHETUYSNYY LPMMELFYCHOPK TBVPFSH. rPFPNKH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSCHUMPCHPK UVTHLFHTSCH, Y OEF CHP'NPTSOPUFY YI UPPFOPUIFSH. rPFPNKH, UFP RTY LLURPTFE RPMKHYUBEFUS UPCHETEOOOP OEHDPCHMEFCHPTYFEMSHOSCHK HTML. rPFPNKH, UFP LBYUEUFCHP CHETUFLY Y REYUBFY OYTSE UTEDOESP.

PUENH OE T E X? rPFPNKH, UFP LFP UMYYLPN OYLPKHTPCHOECHSCHK SZSCHL. EZP OE DBYSH CH THLY OBYUYOBAENH. rPFPNKH, UFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSCHUMPCHPK UVTHLFKHTSCH. rPFPNKH, UFP NBMP T E X-PTYEOFYTPCHBOOSHI TEDBLFPTPCH. rPFPNKH, UFP OEF HDPCHMEFCHPTIFEMSHOSHI UTEDUFCH LURPTFB CH Word.

pUENH OE HTML? rPFPNKH, UFP UBNP RPOSFYE HTML UYMSHOP TBNSCHFP ZPOLPK WWW ЪB LPNNETGYEK Y CHOCOPK RTPYCHPDIFEMEK VTBKHYETPC DTHZ U DTHZPN. rPFPNKH, UFP HTML UVTBDBEF CHUE FEN TCE OEDPUFBFLPN: PTYEOFYTPCHBO INFORMAZIONI SU RTEDUFBCHMEOYE, B OE INFORMAZIONI SU UVTHLFKHTH. rPFPNKH, UFP PO PYUEOSH VEDEO CHCHTBYFEMSHOSCHNY UTEDUFCHBNY, J PFUHFUFCHHAF ChP'NPTSOPUFY EZP TBUYITEOIS. rPFPNKH, UFP OE TEEEO RTPVMENB LPTTELFOPK TKHUZHYLBGY. rPFPNKH, UFP OEF HDPCHMEFCHPTIFEMSHOSHI UTEDUFCH LURPTFB CH Word.

SGML RTPFYCH WYSIWYG

dMS FEI, LFP RTICHSCHL RPMSH'PCHBFSHUS FPMSHLP "elaboratore di testi" -BNY, OBRTYNET, MS Word YMY WordPerfect, NPTSEF VSCHFSH YOFETEUOP URPPUFBCHMEOYE YI U SGML YOFBUNFTKH. FY DCHE ZTHRRSCH RTPZTBNOSHI UTEDUFCH, OEUNPFTS ABOUT UIPTSEUFSH TEYBENSHY BDBYU - RTPYCHPDUFCHP DPLHNEOFFPCH - CHEUSHNB DTHBAZ PF DTHYUFTIFT PFMHHP.

Elaboratore di testi - LFP YOFEMMELFHBMSHOBS RYYHEBS NBYYOLB. tO PTYEOFYTPCHBO ON TBVPFH avere CHYHBMSHOSCHN RTEDUFBCHMEOYEN FELUFB, IBTBLFETYHAEEZPUS OBVPTPN UFYMEK: UFYMEK UYNCHPMPCH (YTYZHF, LEZMSH, OBYUETFBOYE) BVBGECH (LTBUOBS UFTPLB, CHSCHTBCHOYCHBOYE, RPMPTSEOYE RP YYTYOE UFTBOYGSCH) UFTBOYG (LPMPOFYFHMSCH, UOPULY) TBDEMPCH J DPLHNEOFPCH (ZHPTNBF VHNBZY, PZMBCHMEOYE), Y RTPYUYI. Elaboratore di testi OE TBVPFBEF U CHOHFTEOOEK UVTHLFHTPK DPLHNEOFB.

SGML TEDBLFPT, OBRTPFYCH, PTYEOFYTPCHBO INFORMAZIONI SU TBVPFH U UPDETTSYNSCHN DPLHNEOFB. dMS SGML TEDBLFPTB, OBRTYNET, TBDEEM - LFP LMENEOF, CH LPFPTSCHK NPZHF CHLMAYUBFSHUS RPDTB'DEMSCH, B OE RTPNETSKHFPL PF PDOPZP BV'BMENOGBP, OBVTLP

ьФП РПъЧПМСОФ БЧФПТХ UPUTEDPFPYUIFSHUS INFORMAZIONI SU UPDETTSBOY FELUFFB, B OE CHP'YFSHUS U EZP ZhPTNBFYTPCHBOYEN Y CHSCHVPTPN UFIMEK. CHYJHBMSHOBS UFYMYUFILB DPLKHNEOFB PRTEDEMSEFUS RTY EZP LURPTFE CH CHCHEPDOSCHE ZHPTNBFSCH, B OE RTY OBVPTE FELUFB.

p RTPZTBNNOPN PVEUREEOOOYY

yuFPVSCH OBYUBFSH TBVPFBFSH U DPLHNEOFBNY CH SGML RPMSH'PCHBFEMA OHTSOCCH DCHB PUOPCHOSHI UTEDUFCHB: TEDBLFPT Y UTEDUFFCHB LURPTFB (ZHPTNBBFYT).

SGML-TEDBLFPT

SGML-TEDBLFPT PFMYUBEFUS LBL PF RTYCHYUOSHI FELUFPCHCHI TEDBLFPTPCH, FBL J PF "elaboratore di testi" -PCH. pF RETCHSCHI - OBMYUYEN RPDDETTSLY UVTHLFKHTYTPCHBOOSHI DPLHNEOFPCH, PF CHFPTSHI - PFUHFUFCHYEN RPDDETTSLY CHYJHBMSHOPZP ZHPTNBFYTPCHBOYS. TEDBLFPT TBBVYTBEF DTD TEDBLFYTKHENPZP DPLKHNEOFB Y "CHEDEF" RPMSH'PCHBFEMS CH UPPFCHEFUFCHY U OYN. OBRTINET, EUMI DTD RTEDHUNBFTYCHBEF LMENEOF

, CH LPFPTPN NPZKHF CHUFTEYUBFSHUS FPMSHLP LMENEOFSH YMY , FP RPMSh'PCHBFEMA, TEDBLFYTKHAENKH LMENEOF
, VHDEF RTEDMPTSEOP CHUFBCHYFSH PDYO Y'FYI DCHKHI TBTEYEOOSHI LMENEOFFCH. SGML-TEDBLFPT FBLCE PVSCHYUOP UPDETTSIF UTEDUFCHB OBCHYZBGY RP YETBTIY DPLKHNEOF.

yj YUYUMB RPRHMSTOSHI SGML-TEDBLFPTPCH NPTSOP OBJCHBFSH ArborText ADEPT * Editor, SoftQuad autore/editor, psgml, Adobe FrameMaker + SGML, Corel WordPerfect, J NOPCEUFCHP DTHZYI.

UTEDUFCHB ZhPTNBFYTPCHBOYS

uHEEUFCHKHEF NOPTSEUFCHP UTEDUFCH TBVPFS U SGML FELUFFBNY. VóMSHYHA YI YUBUFSH UPUFBCHMSAF UTEDUFCHB ZhPTNBFYTPCHBOYS - LURPTFB SGML CH DTHZYE ZhPTNBFSH DMS REYUBFY, RTPUNPFTB J F.R. CHSCHIPDOSHE ZHPTNBFSH NPZHF VSCHFSH MAVSCHNY, ABCHYUS MYYSH PF DPUFHROPZP RTPZTBNNOPZP PVEUREUEOYS Y OKHTSD RPMSHUPCHBFEMS. OBRTINET, S YURPMSHJHA LPOCHETFETSH H HTML, RTF L A T E X.

Nel 1986, molto prima che prendesse vita l'idea di creare il Web, il linguaggio di markup universale e standardizzato SGML ( Linguaggio di marcatura generalizzato standardizzato) è stato approvato come standard internazionale (ISO 8879) per la definizione dei linguaggi di markup, sebbene SGML esista dalla fine degli anni Sessanta. È stato utilizzato per descrivere i linguaggi di markup consentendo all'autore la possibilità di definire formalmente ogni elemento e attributo del linguaggio.

HTML era originariamente solo una delle applicazioni SGML. Ha descritto le regole in base alle quali dovrebbero essere preparate le informazioni per il World Wide Web. Pertanto, l'HTML è un insieme di prescrizioni SGML formulate come definizioni del tipo di documento(DTD) che spiegano esattamente cosa significano tag ed elementi. La DTD per HTML è memorizzata nel browser web.

Gli svantaggi del linguaggio HTML includono quanto segue:

  • HTML ha set fisso di tag... Non puoi creare i tuoi tag che siano comprensibili ad altri utenti.
  • HTML è esclusivamente tecnologia di presentazione... L'HTML non contiene informazioni sul significato del contenuto contenuto nei tag.
  • HTML - lingua piatta... Il significato dei tag in esso contenuti non è definito, quindi non può essere utilizzato per descrivere la gerarchia dei dati.
  • I browser sono usati come piattaforma per le applicazioni... L'HTML non è abbastanza potente per creare applicazioni web al livello che gli sviluppatori web stanno attualmente cercando. Ad esempio, è impossibile sviluppare un'applicazione in HTML per l'elaborazione e il recupero professionale dei documenti.
  • Grandi volumi di traffico di rete... I documenti HTML esistenti utilizzati come applicazioni sovraccaricano Internet con grandi quantità di traffico sui sistemi client-server. Un esempio potrebbe essere l'invio di un documento di grandi dimensioni su una rete quando è necessaria solo una piccola parte di quel documento.

Pertanto, da un lato, l'HTML è un mezzo molto conveniente per contrassegnare i documenti da utilizzare sul Web e, dall'altro, un documento contrassegnato in HTML ha poche informazioni sul suo contenuto. Se questo o quel documento contiene informazioni sufficientemente complete sul suo contenuto, diventa possibile eseguire con relativa facilità un'elaborazione generalizzata automatica e una ricerca nel file che contiene il documento. SGML può memorizzare informazioni sul contenuto di un documento, ma a causa della sua complessità, non è mai stato utilizzato così ampiamente come HTML.

Un gruppo di esperti SGML, guidati da Jon Bosak di Sun Microsystems, ha iniziato a lavorare per creare un sottoinsieme di SGML che possa essere accettato dalla comunità Web. È stato deciso di rimuovere molte funzionalità SGML non essenziali. Il linguaggio così ricostruito è stato chiamato XML. La versione semplificata era significativamente più economica dell'originale, con solo 26 pagine di specifiche rispetto alle oltre 500 pagine di specifiche SGML.

Consideriamo più in dettaglio la struttura e le caratteristiche di questo linguaggio.

XML (eXtensible Markup Language)è un linguaggio di markup consigliato dal W3C. XML - formato di testo, destinato alla memorizzazione di dati strutturati, allo scambio di informazioni tra programmi, nonché alla creazione di linguaggi di markup specializzati sulla base. XML è un sottoinsieme semplificato del linguaggio SGML.

Il linguaggio XML ha quanto segue dignità:

  • È un formato di documento incentrato sull'uomo che può essere compreso sia dagli umani che dai computer.
  • Supporta Unicode.
  • Strutture dati di base come record, elenchi e alberi possono essere descritte in formato XML.
  • È un formato autodocumentante che descrive la struttura e i nomi dei campi, nonché i valori dei campi.
  • Ha una sintassi ben definita e requisiti di analisi, che gli consentono di rimanere semplice, efficiente e coerente.
  • Ampiamente utilizzato per l'archiviazione e l'elaborazione di documenti;
  • È un formato basato su standard internazionali;
  • La struttura gerarchica di XML è adatta a descrivere quasi ogni tipo di documento;
  • Si tratta di un testo semplice, libero da licenza e da qualsiasi restrizione;
  • Piattaforma indipendente;
  • È un sottoinsieme di SGML per il quale è stata accumulata molta esperienza e sono state create applicazioni specializzate;

Famoso svantaggi le lingue includono quanto segue:

  • La sintassi XML è ridondante.
    • La dimensione del documento XML è significativamente maggiore della rappresentazione binaria degli stessi dati (circa 10 volte).
    • La dimensione di un documento XML è significativamente maggiore di un documento in formati di trasferimento dati di testo alternativi (ad esempio JSON, YAML) e soprattutto in formati di dati ottimizzati per un caso d'uso specifico.
    • La ridondanza di XML può influire sulle prestazioni dell'applicazione. Il costo dell'archiviazione, dell'elaborazione e del trasferimento dei dati è in aumento.
    • Un gran numero di attività non richiede tutta la potenza della sintassi XML ed è possibile utilizzare soluzioni molto più semplici e performanti.
  • Gli spazi dei nomi XML sono difficili da usare e da implementare nei parser XML.
  • XML non contiene il supporto del linguaggio nativo per i tipi di dati. Non include i concetti di "interi", "stringhe", "date", "valori booleani", ecc.
  • Modello dati gerarchico offerto da XML è limitato rispetto al modello relazionale e ai grafici orientati agli oggetti.

In generale, XML può essere visto non solo come un nuovo linguaggio di markup, ma anche come base per un'intera famiglia di tecnologie:

Tabella 9.1. Struttura della famiglia XML
XML Linee guida tecniche XML
DTD Definizione del tipo di documento (schema)
XDR formato XML Ridotto(schema Microsoft)
XSD Definizione dello schema XML (schema W3C)
Spazio dei nomi Metodo per definire i nomi di elementi e attributi
XPath Linguaggio percorso XML
XLink Linguaggio di collegamento XML
XPointer Linguaggio puntatore XML
DOM API per il modello a oggetti documento
SAX API semplice per XML
XSL espandibile linguaggio per fogli di stile
XSL-FO Formattare gli oggetti XSL
XSLT Linguaggio delle trasformazioni XSL
XIncludi Sintassi di inclusione XML

Linguaggi di marcatura: SGML, HTML, XML. La loro connessione con l'altro.

HTML era originariamente solo una delle applicazioni SGML. Ha descritto le regole in base alle quali dovrebbero essere preparate le informazioni per il World Wide Web. Pertanto, l'HTML è un insieme di prescrizioni SGML, formulate come DTD (Document Type Definition), che spiegano esattamente cosa significano tag ed elementi. La DTD per HTML è memorizzata nel browser web.

Pertanto, da un lato, l'HTML è un mezzo molto conveniente per contrassegnare i documenti da utilizzare sul Web e, dall'altro, un documento contrassegnato in HTML ha poche informazioni sul suo contenuto. Se questo o quel documento contiene informazioni sufficientemente complete sul suo contenuto, diventa possibile eseguire con relativa facilità un'elaborazione generalizzata automatica e una ricerca nel file che contiene il documento. SGML può memorizzare informazioni sul contenuto di un documento, ma a causa della sua complessità, non è mai stato utilizzato così ampiamente come HTML.

Un gruppo di esperti SGML, guidati da Jon Bosak di Sun Microsystems, ha iniziato a lavorare per creare un sottoinsieme di SGML che possa essere accettato dalla comunità Web. È stato deciso di rimuovere molte funzionalità SGML non essenziali. Il linguaggio così ricostruito è stato chiamato XML. La versione semplificata era significativamente più economica dell'originale, con solo 26 pagine di specifiche rispetto alle oltre 500 pagine di specifiche SGML.

Vantaggi dell'XML.

  • Supporta Unicode.
  • Piattaforma indipendente;

servizi web

servizio web(servizio web) - un sistema software che ha un URI e le cui interfacce pubbliche sono definite in XML. La descrizione di questo sistema software può essere trovata da altre applicazioni che possono interagire con esso secondo questa descrizione tramite messaggi basati su XML e trasmessi utilizzando protocolli Internet. Il servizio web è l'unità di modularità quando viene utilizzato architettura orientata ai servizi applicazioni.

Architettura orientata ai servizi(SOA, architettura orientata ai servizi) è un approccio modulare allo sviluppo del software basato sull'utilizzo di servizi con interfacce standardizzate.

SOA si basa sui principi di riuso degli elementi funzionali IT, unificazione dei processi operativi tipici. I componenti del programma possono essere distribuiti su diversi nodi di rete e sono offerti come servizi applicativi sostituibili indipendenti e con accoppiamento lasco.

L'interfaccia dei componenti del programma SOA incapsula i dettagli di implementazione di un componente specifico (sistema operativo, linguaggio di programmazione, ecc.).

I servizi Web .NET offrono i seguenti vantaggi:

  • Apertura degli standard... Non ci sono elementi nascosti o inaccessibili nei servizi web. Ogni aspetto della tecnologia, da come cerchi i servizi web a come li descrivi e come comunichi con essi, è definito da standard pubblicamente disponibili.
  • Multipiattaforma... Un linguaggio di programmazione che permette di creare documenti XML e inviare informazioni su HTTP permette di interagire con qualsiasi servizio web. È possibile ricevere un servizio web da un sistema diverso da .NET.
  • Semplicità.
  • Supporto per i messaggi in un linguaggio leggibile dall'uomo... Il passaggio dagli standard binari utilizzati da COM e CORBA al testo XML ha reso più semplice correggere gli errori e ha reso possibile l'interazione con i servizi Web tramite i normali canali HTTP.

L'implementazione di servizi Web .NET è semplice come richiamare un servizio Web remoto o chiamare un metodo su una classe locale. Lo fa sfruttando gli strumenti forniti da .NET Framework per creare un servizio Web completo senza dover apprendere i dettagli di come funzionano standard come SOAP, WSDL e UDDI. In questo caso, vengono eseguite le seguenti azioni:

  1. Un servizio Web è progettato come una classe .NET con attributi che lo identificano come un servizio Web con alcune funzionalità.
  2. L'ambiente .NET genera automaticamente un documento WSDL che descrive come il client dovrebbe interagire con il servizio web.
  3. Il consumatore trova il servizio Web generato e può aggiungere il riferimento Web corrispondente al progetto Visual Studio .NET.
  4. L'ambiente .NET convalida automaticamente il documento WSDL e genera una classe proxy che consente al consumatore di interagire con il servizio web.
  5. Il consumatore chiama uno dei metodi della classe del servizio Web. Dal suo punto di vista, questa chiamata esteriormente non è diversa dalla chiamata a un metodo di qualsiasi altra classe, sebbene l'interazione avvenga effettivamente con la classe proxy e non con il servizio web.
  6. La classe proxy converte i parametri passati in un messaggio SOAP e lo invia al servizio web.
  7. La classe proxy riceve quindi la risposta SOAP, la converte nel tipo di dati appropriato e la restituisce come un normale tipo di dati .NET.
  8. Il consumatore utilizza i dati ricevuti.

I servizi Web .NET utilizzano la tecnologia ASP .NET, che fa parte di .NET Framework. Richiede inoltre il supporto del server Microsoft IIS.

I principali svantaggi dei servizi web sono prestazioni inferiori e dimensioni maggiori del traffico di rete rispetto a tecnologie come RMI, CORBA, DCOM a causa dell'utilizzo di messaggi di testo XML.

Standard per i servizi Web.

Specifiche WSDL

Ciascun servizio Web fornisce un documento WSDL (Web Service Description Language) che descrive tutto ciò di cui un client ha bisogno per lavorare con quel servizio. Un documento WSDL fornisce un modo semplice e coerente per uno sviluppatore di specificare la sintassi per invocare qualsiasi metodo web. Inoltre, questo documento consente di utilizzare strumenti di generazione automatica di classi proxy come quelli inclusi in Visual Studio .NET e .NET Framework. Con questi strumenti, utilizzare un servizio Web è facile come utilizzare una classe locale.

Il documento WSDL è in un formato basato su XML, in base al quale le informazioni sono suddivise in cinque gruppi. I primi tre gruppi sono definizioni astratte indipendenti da piattaforma, rete o linguaggio, mentre i restanti due gruppi includono descrizioni concrete.

protocollo SOAP

La comunicazione tra i servizi web ei loro client avviene tramite messaggi in formato XML.

SOAP (Simple Object Access Protocol) è un protocollo di messaggistica per la selezione dei servizi web.

L'idea di base dello standard SOAP è che i messaggi dovrebbero essere codificati in un formato XML standardizzato.

Oltre ai messaggi SOAP, è possibile utilizzare i metodi HTTP GET e POST per comunicare con i servizi .NET.

I vantaggi dell'utilizzo del formato SOAP rispetto ad altri formati per il trasferimento dei dati:

  • È facile codificare in XML strutture di dati e DataSet utilizzando SOAP quanto semplici dati scalari.
  • Quando si utilizzano i messaggi SOAP, vengono forniti strumenti aggiuntivi per semplificare l'aggiunta, ad esempio, di funzionalità di sicurezza o traccia.
  • Sono disponibili toolkit SOAP per vari linguaggi di programmazione (e anche versioni precedenti di Microsoft C++ e Visual Basic). Diversamente, per poter comunicare con il servizio tramite i metodi GET e POST del protocollo HTTP, dovrai ovviamente costruire tu stesso la stringa di query, e poi analizzare la risposta.

DISCO standard

Lo standard DISCO fornisce il modo più semplice per accedere ai file manifest raggruppando i collegamenti ai servizi Web.

Il file DISCO può includere file da vari server Web e supporta la "ricerca dinamica" - la ricerca automatica di una directory di file di servizi Web su un server.

I file manifest sono utili perché raggruppano molti servizi Web in un unico elenco, ma impediscono ai client di trovare un tipo specifico di servizio Web senza specificare il nome della società di sviluppo.

Specifiche UDDI

La specifica UDDI (Universal Description, Discovery and Integration) evita questi problemi utilizzando un repository speciale (repository) in cui le aziende e le organizzazioni possono inserire i dati sui servizi che forniscono. Più di 100 aziende (un elenco completo è disponibile all'indirizzo http://www.uddi.org/community.html), tra cui Sun e Microsoft, sono state pioniere nella creazione della tecnologia UDDI. Insieme, queste aziende hanno sviluppato una bozza di specifica UDDI che è stata standardizzata dopo 18 mesi.

Le informazioni in questo repository devono essere aggiornate manualmente. A tal fine, alcune "dichiarazioni nodali" conservano copie identiche del repository UDDI. Queste aziende forniscono l'archiviazione del repository specificato e l'accesso gratuito ad esso per divulgare la serie web. Inoltre, Microsoft ha incluso una versione di UDDI nel software del server Windows .NET da utilizzare nelle intranet aziendali.

Il repository UDDI contiene informazioni sulle imprese che forniscono servizi Web, il tipo di ciascun servizio e collegamenti a informazioni e specifiche relative a tali servizi. L'UDDI stesso è un servizio web. Per registrarsi o trovare un servizio, inviare un messaggio SOAP.

WEB - integrazione.

La sfida dell'integrazione web consiste nel riunire applicazioni e sistemi web disparati in un unico ambiente web-based.

Vengono praticati i seguenti approcci all'integrazione web:

· Integrazione a livello di presentazione. Questo livello consente all'utente di interagire con l'applicazione. L'integrazione a livello di presentazione dà accesso all'interfaccia utente delle applicazioni remote.

· Integrazione a livello di funzionalità. Questa integrazione implica l'accesso diretto alla logica di business delle applicazioni. Ciò si ottiene mediante l'interazione diretta delle applicazioni con API(interfaccia di programmazione dell'applicazione) o interazione tramite servizi web.

· Integrazione a livello di dati. In questo caso, accedere a uno o più banche dati utilizzato dall'applicazione remota.

· Integrazione complessa. Le soluzioni di integrazione web commerciale in genere includono tutti e tre i tipi di integrazioni

L'utilizzo dell'integrazione web è vantaggioso per molte ragioni:

· Integrazione web consente di distribuire sistemi informativi basati su applicazioni di terze parti senza doverne comprendere i sistemi principali, gli ambienti software e le architetture di database.

· SOA e servizi web utilizzare un linguaggio di programmazione e interfacce indipendenti dalla piattaforma tra le applicazioni dell'infrastruttura IT aziendale. Ciò offre ovvi vantaggi in termini di supporto, gestibilità, implementazione di reti di informazioni.

· L'integrazione Web consente la costruzione di funzionalità complesse combinando componenti disparate attraverso protocolli di servizi Web.

· L'integrazione Web consente di utilizzare i servizi Web degli sviluppatori.

· L'integrazione Web consente di sviluppare API tramite protocolli di servizi Web senza programmazione.

Per l'integrazione web, software commerciale o tecnologie popolari come PHP / Python / Perl, XForms, SAPONE eccetera.

Integrazione basata su XML

Invece di implementare l'interazione tra ogni coppia di sistemi, devi solo insegnare a ciascuno di loro a "parlare" XML. In altre parole, tutto si riduce allo sviluppo di diversi involucri (wrapper - un wrapper, uno strumento software per creare un wrapper di sistema per standardizzare le chiamate esterne e modificare l'orientamento funzionale del sistema operativo), che tradurrà dal linguaggio XML standard di un sistema integrato in un linguaggio comprensibile per ciascun sistema separatamente.

· Strumenti di sviluppo e librerie standard per XML esistono su quasi tutte le piattaforme e per i linguaggi di programmazione più diffusi;

· I metodi di lavoro con XML sono sufficientemente standard in modo che le stesse tecniche possano essere utilizzate in sistemi diversi;

· Le informazioni formattate in XML possono essere elaborate non solo dalle macchine, ma anche dagli esseri umani (il che facilita enormemente il debug).

Fondamentalmente, l'integrazione dello schema XML non è sostanzialmente diversa da qualsiasi altra integrazione standard comune. Allo stesso tempo, ha una serie di vantaggi significativi:

· I linguaggi XML non dipendono da piattaforme hardware e software, il che consente di collegare sistemi eterogenei;

· La potenza espressiva di XML è sufficientemente ampia da descrivere dati di qualsiasi complessità;

L'integrazione basata su XML è praticamente implementata all'interno dei seguenti protocolli:

· XML-RPC... È un protocollo RPC che trasferisce i dati in formato XML sulla porta TCP 80, ad es. porta HTTP.

· WDDX(Scambio distribuito sul Web). È un meccanismo per lo scambio di strutture dati complesse utilizzando il protocollo HTTP. Il protocollo non si basa su strutture, ma su eventi.

· ebXML(XML per affari elettronici) - XML ​​per l'e-business. Il suo scopo principale è fornire un'infrastruttura XML aperta che consenta un uso globale sicuro delle informazioni di e-business. Servizi web (servizi web).

XML (eXtensibleMarkupLanguage) è il linguaggio di markup consigliato dal W3C. XML è un formato di testo per la memorizzazione di dati strutturati, per lo scambio di informazioni tra programmi e per la creazione di linguaggi di markup specializzati sulla base. XML è un sottoinsieme semplificato di SGML .

Il linguaggio XML ha quanto segue dignità:

  • È un formato di documento incentrato sull'uomo che può essere compreso sia dagli umani che dai computer.
  • Supporta Unicode.
  • Strutture dati di base come record, elenchi e alberi possono essere descritte in formato XML.
  • È un formato autodocumentante che descrive la struttura e i nomi dei campi, nonché i valori dei campi.
  • Ha una sintassi ben definita e requisiti di analisi, che gli consentono di rimanere semplice, efficiente e coerente.
  • Ampiamente utilizzato per l'archiviazione e l'elaborazione di documenti;
  • È un formato basato su standard internazionali;
  • La struttura gerarchica di XML è adatta a descrivere quasi ogni tipo di documento;
  • Si tratta di un testo semplice, libero da licenza e da qualsiasi restrizione;
  • Piattaforma indipendente;
  • È un sottoinsieme di SGML per il quale è stata accumulata molta esperienza e sono state create applicazioni specializzate;

Famoso svantaggi le lingue includono quanto segue:

· La sintassi XML è ridondante.

· La dimensione del documento XML è notevolmente maggiore della rappresentazione binaria degli stessi dati.

· La dimensione di un documento XML è significativamente maggiore di un documento in formati di trasferimento dati testuali alternativi (es. JSON, YAML) e soprattutto in formati dati ottimizzati per un caso d'uso specifico.

· La ridondanza XML può influire sulle prestazioni dell'applicazione. Il costo dell'archiviazione, dell'elaborazione e del trasferimento dei dati è in aumento.

· Un gran numero di attività non richiede tutta la potenza della sintassi XML ed è possibile utilizzare soluzioni molto più semplici e performanti.

  • Gli spazi dei nomi XML sono difficili da usare e da implementare nei parser XML.
  • XML non contiene il supporto del linguaggio nativo per i tipi di dati. Non ha il concetto di "interi", "stringhe", "date", "booleani", ecc.
  • Il modello dati gerarchico offerto da XML è limitato rispetto al modello relazionale e ai grafici orientati agli oggetti.

Essenzialmente, XML serve metalinguaggio per descrivere la struttura di altre lingue. La relazione tra SGML, XML, HTML e alcuni altri linguaggi è mostrata nel diagramma seguente:

Un'importante differenza tra XML e HTML è che pone molta enfasi sul controllo del modo in cui vengono seguite le regole del linguaggio durante il markup dei documenti. A seconda di ciò, è consuetudine assegnare ben formato e valido Documenti XML .

Il documento XML è considerato ben formato se corrisponde a tutte le regole di sintassi XML.

Visita medica realtà documento assume le seguenti azioni:

  • Verifica che venga utilizzato solo un determinato insieme di descrittori.
  • Verifica della piena conformità dell'ordine di elementi e attributi con il contenuto del documento o determinate regole.
  • Controllo del tipo di dati (ottenuto utilizzando lo schema appropriato).
  • Controllo dell'integrità dei dati per garantire uno scambio ottimale di informazioni sul Web utilizzando le transazioni.

Regole di sintassi di base creazione di documenti XML.

  • Il documento XML ne contiene uno e solo uno elemento radice contenente tutti gli altri elementi
  • Elementi figlio contenuto in elemento radice devono essere adeguatamente nidificati.
  • nomi gli elementi obbediscono alle regole:
  • Il nome inizia con una lettera, un carattere di sottolineatura o due punti.
  • Il primo carattere del nome può essere seguito da lettere, numeri, trattini, trattini bassi, punti o due punti.
  • I nomi non possono iniziare con XML.

Il documento XML ha la seguente struttura:

  • Viene chiamata la prima riga del documento XML annuncio XML. Questa è una stringa facoltativa che indica la versione dello standard XML (solitamente 1.0). Anche la codifica dei caratteri e le dipendenze esterne possono essere specificate qui.

Principali articoli correlati