نحوه راه اندازی گوشی های هوشمند و رایانه های شخصی. پرتال اطلاعاتی
  • خانه
  • اخبار
  • زبان های نشانه گذاری داده های گسترده SGML، XML. ببینید «XML» در فرهنگ‌های دیگر چیست. Html یک برنامه استاندارد sgml است

زبان های نشانه گذاری داده های گسترده SGML، XML. ببینید «XML» در فرهنگ‌های دیگر چیست. Html یک برنامه استاندارد sgml است

داستان

بیایید به مثالی از یک دستور العمل ساده که با استفاده از XML علامت گذاری شده است نگاه کنیم:

> نان ساده > > ارد > مخمر > آب گرم > نمک > > > > همه مواد را با هم مخلوط کرده و کاملا ورز دهید. > > با یک پارچه بپوشانید و یک ساعت در اتاق گرم بگذارید. > > دوباره ورز دهید، روی یک ورقه پخت قرار دهید و در فر قرار دهید. > > >

اعلان XML

خط اول سند XML نامیده می شود اعلان XML(انگلیسی) اعلان XML) رشته ای است که نسخه XML را نشان می دهد. در نسخه 1.0 اعلان XMLرا می توان حذف کرد، در نسخه 1.1 مورد نیاز است. رمزگذاری کاراکتر و وجود وابستگی های خارجی نیز می تواند در اینجا نشان داده شود.

این مشخصات به پردازنده‌های XML برای پشتیبانی از رمزگذاری‌های یونیکد UTF-8 و UTF-16 نیاز دارد (UTF-32 اختیاری است). سایر رمزگذاری‌های مبتنی بر استاندارد ISO/IEC 8859 به‌عنوان قابل قبول، پشتیبانی شده و به طور گسترده مورد استفاده قرار می‌گیرند (اما الزامی نیستند)؛ کدگذاری‌های دیگر نیز قابل قبول هستند، به عنوان مثال، روسی Windows-1251، KOI-8. اغلب، حروف غیر لاتین در برچسب ها استفاده نمی شود؛ در این مورد، UTF-8 یک رمزگذاری بسیار راحت است - حجم معمولا کمتر از UTF-16 است. رمزگشایی را می توان هم برای کل سند و هم برای ویژگی ها و متون خاص انجام داد. وقتی تجزیه و تحلیل با رمزگذاری نادرست انجام می شود، کل سند حاوی نویسه های ممنوعه نیست.

عنصر ریشه

مهمترین شرط نحوی اجباری این است که سند فقط یک مورد داشته باشد عنصر ریشه(انگلیسی) عنصر ریشه) (گاهی نیز نامیده می شود عنصر سند(انگلیسی) عنصر سند)). این بدان معنی است که متن یا سایر داده های کل سند باید بین یک تگ ریشه شروع و تگ پایان مربوطه آن قرار گیرد.

ساده ترین مثال زیر یک سند XML است که به خوبی شکل گرفته است:

مثال زیر یک سند XML معتبر نیست زیرا دارای دو است عنصر ریشه:

> نهاد شماره 1 > > نهاد شماره 2 >

یک نظر

یک عنصر را می توان در هر جایی از درخت قرار داد - یک نظر. نظرات XML داخل یک تگ مخصوص قرار می گیرند که با کاراکترها شروع می شود. دو خط فاصله (--) نمی توانند در یک نظر وجود داشته باشند.

برچسب های داخل یک نظر نباید پردازش شوند.

برچسب ها

بقیه این سند XML از تودرتو تشکیل شده است عناصر، که برخی از آنها دارند ویژگی هایو محتوا. عنصرمعمولاً شامل باز و بسته شدن برچسب هایی است که متن و سایر عناصر را در بر می گیرد. برچسب باز کردنشامل نام عنصردر براکت های زاویه ای، به عنوان مثال، ، آ برچسب بسته شدناز همان نام در پرانتزهای زاویه تشکیل شده است، اما قبل از نام، یک اسلش رو به جلو اضافه می شود، برای مثال،. نام عناصر، مانند نام ویژگی، نمی تواند شامل شود فضاها، اما می تواند به هر زبانی باشد که توسط رمزگذاری سند XML پشتیبانی می شود. نام می تواند با یک حرف، زیرخط یا دو نقطه شروع شود. کاراکترهای باقی مانده از نام می توانند همان کاراکترها و همچنین اعداد، خط تیره و نقطه باشند.

چندین موجودیت از پیش تعریف شده در XML وجود دارد، مانند lt (می توانید با نوشتن به آن مراجعه کنید<) для левой угловой скобки и amp (ссылка - &) для амперсанда. Возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков.

در زیر نمونه ای از استفاده از یک موجودیت از پیش تعریف شده برای جلوگیری از استفاده از علامت در نام آورده شده است:

> AT&T >

لیست کامل موجودیت های از پیش تعریف شده شامل &(&)،< (<), >(>)، "(") و "(") - دو مورد آخر برای نوشتن جداکننده ها در مقادیر مشخصه مفید هستند. شما می توانید موجودیت های خود را در یک سند DTD تعریف کنید.

گاهی اوقات لازم است یک فضای بدون شکست تعریف شود، که اغلب در HTML استفاده می شود و به عنوان نشان داده می شود. چنین موجودیت از پیش تعریف شده ای در XML وجود ندارد، نوشته شده است و استفاده از آن باعث خطا می شود. فقدان این موجودیت بسیار رایج اغلب برای بسیاری از برنامه نویسان تعجب آور است و این مشکلاتی را در هنگام انتقال توسعه های HTML آنها به XML ایجاد می کند.

پیوند با شماره نماد(انگلیسی) مرجع کاراکتر عددی) شبیه ارجاع به موجودیت است، اما به جای نام موجودیت، کاراکتر # و یک عدد (به صورت اعشاری یا هگزادسیمال) مشخص شده است که تعداد کاراکتر در جدول کاراکتر یونیکد است. اینها معمولاً کاراکترهایی هستند که نمی توانند مستقیماً رمزگذاری شوند، مانند یک حرف عربی در یک سند رمزگذاری شده با ASCII. آمپرساند را می توان به صورت زیر نشان داد:

> AT&T >

قوانین دیگری در مورد ایجاد یک سند XML معتبر وجود دارد.

مزایا و معایب

مزایای

ایرادات

  • ابهام مدلسازی
  • XML پشتیبانی از نوع داده در زبان را ندارد. تایپ قوی ندارد، یعنی مفاهیم "اعداد صحیح"، "رشته ها"، "تاریخ ها"، "بولی ها" و غیره.
  • مدل داده سلسله مراتبی ارائه شده توسط XML در مقایسه با مدل رابطه ای و نمودار شی گرا و مدل داده شبکه محدود است.

نمایش XML در شبکه جهانی وب

سه روش رایج برای تبدیل یک سند XML به یک فرم قابل نمایش توسط کاربر عبارتند از:

  1. استفاده از سبک های CSS؛
  2. استفاده از XSL;
  3. نوشتن یک کنترل کننده اسناد XML در هر زبان برنامه نویسی.

برای تعیین یک تبدیل XSL (XSLT) در سمت مشتری، دستورالعمل های XML زیر باید وجود داشته باشد:

دیکشنری های XML

از آنجایی که XML یک زبان نسبتاً انتزاعی است، واژگان XML توسعه یافته اند.

یک فرهنگ لغت به توسعه دهندگان اجازه می دهد تا بر روی مجموعه محدودی از نام تگ ها و ویژگی های آن برچسب ها توافق کنند. یکی از اولین واژگان XHTML است که توسط اکثر مرورگرها قابل درک است. XHTML اغلب برای ذخیره و ویرایش محتوا در CMS استفاده می شود.

واژگان تخصصی بیشتری ایجاد شده است، مانند پروتکل انتقال داده SOAP، که برای انسان مناسب نیست و خواندن آن بسیار دشوار است. واژگان تجاری مانند CommerceML، xCBL و cXML وجود دارد که برای انتقال داده های تجارت محور استفاده می شود، این فرهنگ لغت ها شامل توضیحات سیستم سفارش، تامین کنندگان، محصولات و موارد دیگر است.

معمولاً، هنگام توصیف یک سند، یک شخص برای خود واژگانی ارائه می کند که سپس با استفاده از DTD، XSD توصیف می شود، یا به سادگی "در حال پرواز" برای افراد علاقه مند توضیح داده می شود.

یکی از دیکشنری هایی که فراگیر شده است FB2 است - فرهنگ لغتی که قالب یک کتاب را با انواع پاورقی ها، نقل قول ها، حتی تصاویر توصیف می کند.

نسخه های XML

  • XML 1.0
  • XML 1.1

همچنین ببینید

یادداشت

ادبیات

  • دیوید هانتر، جف رافتر، جو فاوست، اریک ون در ولیس و غیره. XML. کار با XML، 4th Edition = Beginning XML، 4th Edition. - م.: دیالکتیک، 2009. - 1344 ص. - شابک 978-5-8459-1533-7
  • دیوید هانتر، جف رافتر و دیگران. XML. دوره پایه = شروع XML. - م.: ویلیامز، 2009. - 1344 ص. - شابک 978-5-8459-1533-7
  • رابرت تابور.پیاده سازی خدمات وب XML بر روی پلت فرم مایکروسافت دات نت = خدمات وب مایکروسافت دات نت XML. - م.: ویلیامز، 2002. - 464 ص. - شابک 0-672-32088-6

پیوندها

  • XML در وب سایت کنسرسیوم وب جهانی (W3C).
  • مشخصات استاندارد XML 1.0 رسمی
  • مشخصات استاندارد رسمی XML 1.1
  • مستندات XML در مقالات و انجمن های وب سایت IBM

vPTYU fPVPFTBU

SGML: YUEN LFP EDSF؟

uEZPDOS CHUE YUBEE NPTsOP CHUFTEFYFSH BVVTECHYBFHTH SGML. noPZIE CHYDSCH DPLHNEOFBGYY RPUFBCHMSAFUS CH ZHTNBFE SGML. rPRHMSTOSCHK SJSCHL TBNEFLY Web-UFTBOYG HTML SCHMSEFUS RTYMPTSEOYEN SGML. rPSCHMSEFUS CHUE VPMSHYE RTYLMBDOSH RTPZTBNN DMS TBVPFSCH U SGML: TEDBLFPTSCH، UTEDUFCHB ZHTNBFYTPCHBOYS، UYUFENSH DPLHNEOFPPVPPTPFB، YURPMSH'HAEYE LBBOHBGN NEOFPCH... SGML-RTPDHLFSCHCHSHCHRKHULBAF Adobe، Corel، SoftQuad، Microsoft. h SGML ZPFPCHSFUS LOYZY YJDBFEMSHUFCHB O"Reilly، FEIOYUUEULBS DPLHNEOFBGYS IBM، Sun Y OSF. pUOPCHCHCHBEFUS درباره SGML YOZHPTNBGYPOOBS FEIOOPHPYOPYFYS Y BCHIBLPUNYUEULYI ZHYTN CHUEZP NYTB.

rPSCHYCHYBSUS CH OBYUBME CHPUSHNYDEUSFSHCHI SGML-FEIOPMPZYS RETETSYCHBEF UEKYUBU RETYPD TBUGCHEFB. YuFP LFP FBLPE؟ YuFP POB DBEF UCHPYN RPMSHЪPCHBFEMSN؟ lBL U OEK TBVPFBFS؟ درباره BFI Y DTHZIE CHPRPTUSCH با RSHCHFBAUSH PFCHEFIFSH LFPC UFBFSHEK.

UPDETSBOYE





















lBL با OBVTEM درباره SGML-FEIOPMPZYA

CHUE OBYUBMPUSH YOFTBOEFB. lFP NPDOPE UMPChP PBOBYUBMP DMS NEOS در مورد RTBLFYLE FP، YuFP DPLHNEOFSHCH، LPFPTSCHE S TEZKHMSTOP RYUBM RP TPDH UCHPEK DESFEMSHOPUFY، UVBMP NPTsOPSHPUNYFROHTsOPSHOPKHNF، UVBMP NPTsOPSHOPHNFSHCH. dP UYI RPT S RTPUFP OBVYTBM DPLKHNEOFSHCH T E X-e Y REYUBFBM YI درباره VKHNBZE. YDES DHVMYTPCHBFSH YI CH HTML CHTHYUOHA PFRBMB UTBH: OENEDMEOOOP CHPJOILMB VSC RTPVMENB UYOITPOYBGYY VKHNBTSOPK Y BMELFTPOOPK CHETUIK PDOPZP Y FPHZPOSE.

b CHULPTE RPFTEVPCHBMPUSH RETYPDYUEULBS RETEDBYUB DPLHNEOPCH RPUFPTPOOYN MADSN CH LMELFTPOOPC ZHTNE، YFP، RP UMPTSYCHYEKUS X OBU RTBLFYLE، POBYBFECH Microsoft Word. tBVPFBFSH Y MS Word X NEOS RP TSDH RTYUYO OE VSHMP OYLBLPZP TSEMBOYS، L FPNH TSE LFP FPMSHLP KHUHZHVYMP VSC RTPVMENKH UYOITPOYBGYY CHETUIK.

ъOBYUIF، OHTsOP VSHMP RTDKHNBFSH URPUPV BCHFPNBFYUEULPZP RTEPVTBBPCHBOYS OBVYTBENSHHI DPLKHNEOPCH CH TBMYUOSHE ZHTNBFSH: T E X-a -- DMS REYYUOSHE ZHTNBFSH S ABOUT WWW Accounting, Word -- DMS PVNEOB U TBVPFBAEYNYH Windows. lTPNE FPZP، NOE IPFEMPUSH، YUFPVSH FBLPE UTEDUFChP PFCHEYUBMP EEE TSDH FTEVPCHBOYK:

  • VShchFSH NPDKHMSHOSCHN، YuFPVSH NPTsOP VSCHMP RTY OEPVIPDYNPUFY MEZLP DPVBCHMSFSH OPCHSHCHESCHSHCHIPDOSH ZHTNBFSH YMY YYNEOSFSH BMZPTYFNSCH RTEPVTHESCHBP
  • VShchFSH PFLTSCHFSHCHN، VEURMBFOSHCHN، LBL NPTsOP NEOSHYE RTYCHSBOOSHCHN L LPOLTEFOSCHN RTPZTBNNBN;
  • VShchFSH NPVYMSHOSHCHN: TBVPFBFSH، LBL NYOINKHN، درباره TBOSCH UNIX-RMBFZhPTNBI;
  • وشفش مزلپ تخوئیژییتنشن.

RETCHSHCHN، YuFP RPRBMPUSHNOE RPD THLH RPUME RPIPDB درباره Altavista، PLBBBMUS RBLEF RPD OBCHBOYEN linuxdoc-sgml. po LBL TBY RTEDOBOBYUBMUS DMS ZEOETBGYY HTML، T E X Y RTF YЪ PDOPZP CHIPDOZP ZhBKMB. yYTPL YURPMSHKHENSHCHK CH TBNLBI پروژه مستندسازی لینوکس، BY YURPMSHЪPCHBM CH LBYUEUFCHE CHIPDOZP ZHTNBFB OEBOBLPNSCHKNOE DP UYI RPT SJSHL SGML. chRTPYUEN، OYUEZP UMPTsOPZP CH OEN OE PLBBBMPUSH -- BY CHEUSHNB OBRPNIOBM OBLPNSCHKNOE HTML Y CHSHZMSDEM CHRPMOYE RPOSPHOP. chPF، L RTYNETH، LHUPYUEL SGML-DPLHNEOFB:

ساختار یک متن TEI

همه متون مطابق با TEI شامل آ سربرگ TEI(به عنوان یک علامت گذاری شده است teiHeaderعنصر) و رونویسی متن مناسب (علامت گذاری شده به عنوان a متنعنصر).

DMS FPZP، YuFPVSH OBYUBFSH درباره LFPN RYUBFSH، RPFTEVPPCHBMPUSH CHUEZP MYYSH OBRPNOYFSH OEULPMSHLP PUOPCHOSHI BMENEOFPCH TBNEFLY، OBRTYNET، YuFP

POBYUBEF OYUBMP RBTBZTBZHB، -- OBUBMP RETAILUYUMEOYS Y F.R.

oBVTBOOSCHK CH SGML FELUF DBMEE ЪBRHULPN PDOPZP ZHYMSHFTB RTEPVTBKHEFUS CH HTML، DTHZPZP -- CH T E X، FTEFSHEZP -- CH RTF، Y FBL DBMEE.

YuFP FBLPE SGML Y YuEN در IPTPY

FETNYOPMPZYS

GML ( زبان نشانه گذاری تعمیم یافته) TTBTBVPFBO CH OEDTBI CHEDEUHEEK LPTRPTBGYY IBM. EZP OBUMEDOIL SGML ( زبان نشانه گذاری تعمیم یافته استاندارد) RTYOSF CH 1986 ZPDH CH LBYUEUFCHE NETSDHOBTPDOPZP UFBODBTTFB DMS PRTEDEMEOYS OEBCHYUYNSHI PF KHUFTPKUFCH CHCHPDB/CHSHCHPDB، OEBCHYUYNSHI PFBODBTTFBCH MEOYS FELUFPCH CH BMELFTPOOPK ZHTNE. vPMEE FPYOP، SGML -- LFP NEFBSJL ، FP EUFSH UTEDUFCHP ZHTTNBMSHOPZP PRYUBOYS SJSHLB، CH DBOOPN UMHYUBE، SJSCHLB TBNEFLY .

yUFPTYYUEULY UMPChP TBNEFLB YURPMSHЪPCHBMPUSH DMS PRYUBOYK BOOPFBGYK YMY DTHZYI PVPOBYOOYK CHOKHFTY FELUFB، RTEDOBOBYOOOSCHY DMS KHLBBOYK UPUFBCHYFEMA YMY "CHETUFPPZPOMPEOLTSHAILNE" OP VSHFSH OBREYUBFBOP YMY ACCOUNTING. رتنتش Chlmayubaf RPDYUTLECHENICHEUFEFS YUTFPK، Pvpyubaeae Lhtuych، Uregybmzhno Knouli DMS RTPRHULB Yi Yi Reubfy Lipro. lPZDB ZHTNBFYTPCHBOYE Y REYUBFSH FELUFPCH UFBMY BCHFPNBFYYTPCHBOOSCHNY، LFPF FETNYO UVBM PICHBFSHCHBFSH CHUE CHYDSCH UREGYBMSHOSHI LPDPCH TBNEFLY ، CHUFBCHMSENSHI CH BMELFTPOOSCH FELUFSCH DMS HRTBCHMEOYS ZHTNBFYTPCHBOYEN، REYUBFSHHA YMY DTHZPK PVTBVPFLPK.

pVPVEBS، TBNEFLH، YMY LPDYTPCHLH , PRTEDEMSAF LBL MAVPE UTEDUFCHP UDEMBFSH SCHOSCHN YOFETRTEFBGYA FELUFB. درباره VBOBMSHOPN HTPCHOE CHUE OBREYUBFBOOSCH FELUFSCH LPDYTPCHBOSH CH LFPN UNSHUME: OBLY RTERYOBOYS، YURPMSHЪPCHBOYE ЪБЗМБЧОСЧШИ ВХЛЧ, VHBOCHBCHBCETSEO NETSDH UMPCHBNY NPTsOP UYFBFSH CH LBLPK-FP UFEREOY TBNEFLPK، ZHOLGYS LPFPTPK -- RPNPYUSH YUEMPCHELH، YUYFBAEENKH FELUF، PRTEDEMYFSH، ZDE LPOYUBEFUS PDOP UMPChP Y OBUYOBEFUS DTHZPE، YMY LBL YDEOFYZHYGYTPCHBFSH PUPVEOOPUFY UFTHLFHTSCH، FBLYE LBL ЪBZPMPCHLY، YMY RTPUFSHCHE UYOFYZHYGYTPCHBFSH RUPVEOOPUFY UFTHLFHTSCH، FBLYE LBL ЪBZPMPCHLY، YMY RTPUFSHCHE UYOFYZHYGYTPUYPOYSE OYK. lPDYTPCHBOYE FELUFB DMS LPNRSHAFETOPK PVTBVPFLY، CH RTYOGYRE، LBL TBUYYZHTPCHLB NBOKHULTYRFB U RETZBNEOFB، -- RTPGEUU DEMBBOYS SCHOSCHN OESCHOPPDZPBHPYPYNE، S RPMSHЪPCHBFEMA FPZP، LBL DPMTSOP YOFETRTEFYTPCHBFSHUS UPDETSINPE FELUFB.

rPD SJSHLPN TBNEFLY RPOINBAF OBVPT UPZMBYEOYK P TBNEFLE، RTYNEOSENSHI DMS LPDYTPCHBOYS FELUFPCH. با OBYUIF. SGML RTEDPUFBCHMSEF TEYEOYS DMS RETCHSCHI FTEI ЪBDБУ، PFDEMSHOBS DPLHNEOFBGYS PVSHYUOP OEPVIPDYNB DMS RPUMEDOEK.

pUPVEOOPUFY SGML

fTY IBTBLFETYUFYLY SGML PFMYUBAF EZP PF RTPYUYI SSHCHLPCH TBNEFLY.

prYUBFEMSHOBS TBNEFLB

uYUFENB U PRYUBFEMSHOPK TBNEFLPK YURPMSHЪHEF LPDSCH TBNEFLY، LPFPTSHCHE RTPUFP RTEDPUFBCHMSAF OBCHBOYS DMS LBFEZPTYBGYY YUBUFEK DPLHNEOFB. lPDSH TBNEFLY، FBLYE LBL YMY \ END (LIST)، RTPUFP Yeeofigygithaf RPTGYA DPLHNEOFB I Khfchetbaf، YuFP "Victory" Pobedfus RBTBZTBZHPN "، YMY YEFP" BFP - orephemedyn ovybfpzp furerlb. U DTHZPK UFPTPOSCH، UYUFENB U RTPGEDHTOPK TBNEFLPK PRTEDEMSEF، LBLBS PVTBVPFLB DPMTSOB CHSHRPMOSFSHUS H LPOLTEFOPK FPULE DPLHNEOFB: "H FPN NEUFE CHSHPGCHBHBTSH", YMY "RETEDCHYOHFSH MECHHA ZTBOYGKH ABOUT 2NN MECHEE, RTBCHHA ZTBOYGH -- ABOUT 2NN RTBCHEE، RTPRKHUFYFSH PDOKH UFTPLH Y CHUFBFSH درباره OPCHHA MECHHA ZTBOYGKH" Y F.R. h SGML YOUFTHLGYY، OEPVIPDYNSCHE DMS PVTBVPFLY DPLHNEOFB U LBLPC-MYVP LPOLTEFOPK GEMSHA (OBRTYNET، DMS ZHTNBFYTPCHBOYS)، YuEFLP PFDEMSAFUS PFDEMSAFUSFBSHOFUSFUBNE چوخفتی دپله نئوفب. pVSHYUOP POY UPVTBOSH CHOE DPLHNEOFB CH PFDEMSHOSHI RTPGEDKHTBI YMY RTPZTBNNBI.

u PRYUBFEMSHOPK، B OE RTPGEDHTOPK، TBNEFLPK PDYO Y FPF TSE DPLHNEOF NPTSEF VSHFSH PVTBVPFBO TBOPPVTBOSCHNY RTPZTBNNBNNY، LBTsDBS YЪ LPFPTSCHI TSE DPLHNEOF NPTSEF VSHFSH PVTBVPFBO BVPFLY L FEN EZP YUBUFSN، LPFPTSHCHE POB UYYFBEF CHBTTSOSCHNY. OBRTYNET، RTPZTBNNB BOBMYJB UPDETSYNPZP NPTSEF RPMOPUFSH YZOPTYTPCHBFSH UPULY، FPZDB LBL RTPZTBNNB ZHTNBFYTPCHBOYS NPTSEF YICHMELBFSH YICHMELBFSH Y UPVIGEPOSHTBUTF Y. TBMYUOSCHYODSH YOUFTHLGYK PVTBVPFLY NPZHF BUUPGYYTPCHBFSHUS U PDOPC Y FPK TSE YUBUFSHA ZHBKMB. OBRTYNET، PDOB RTPZTBNNNB NPTSEF YICHMELBFSH YDPLHNEOFB ZHBNYMYY MADEK Y ZEPZTBZHYUEULYE OBCHBOYS DMS UP'DBOYS YODELUB YMY VBSHCH DBOSHI، FPZTHBSHDBFBCE BNSCHK FELUF، NPTsEF REYUBFBFSH ZHBNYMYYY OBCHBOYS PFMYUBAEINUS YTYZhFPN.

fYRSH DPLHNEOFPCH

SGML CHCHPDYF RPOSFYE FYRB DPLHNEOFB ,Y,UPPFCHEFFUFCHOOOP, PRTEDEMEOYS FYRB DPLHNEOFB (تعریف نوع سند، DTD). dPLKHNEOFSH UYYFBAFUS FYRYYTPCHBOOSCHNY، FBL CE، LBL Y DTHZIE PVTBVBFSCHBENSHCHEN LPNRSHAFETBNY PVYAELFSHCH. fYR DPLHNEOFB ZHTNBMSHOP PRTEDEMSEFUS EZP UPUFBCHOSCHNY YUBUFSNY YI UFTHLFKHTPC. PRTEDEMEOYE، OBRTYNET، PFYUEFB NPTSEF VSCHFSH FBLYN، YuFP PO UPUFPYF YЪBZPMPCHLB Y، CHPNPTsOP، BCHFPTB، ЪB LPFPTSCHNY UMEDHEF BOOPFBGYDPEE BOPFBGYCHNY UMEDHEF . mAVPK DPLHNEOF CH PFUKHFUFCHYE ЪBZPMPCHLB، CH UPPFCHEFUFCHYY U LFYN ZHTNBMSHOSHCHN PRTEDEMEOYEN، OE VHDEF ZHTNBMSHOP SCHMSFSHUS PFYUEFPMSHOP SCHMSFSHUS PFYUEFPMSSH OE FEMSHOPUFSH BVBGECH، JB LPFPTPK UMEDHEF BOOPFBGYS، OECHYTBS درباره FP، OBULPMSHLP RPIPTS درباره PFUEF FBLPK DPLHNEOF U FPYULY ЪTEOYS YUFBFEMS- یومپچلب.

rPULPMSHLH DPLKHNEOFSH PFOPUSFUS L YYCHEUFOSCHN FYRBN، NPTsOP YURPMSHЪPCHBFSH UREGYBMSHOKHA RTPZTBNNH، OBSCHCHBENKHA BOBMYBFPTPPN (تجزیه کننده)، DMS FPZP، YUFPVSH PVTBVPFBFSH DPLHNEOF، KHFCHETTSDBAEIK، UFP PO PFOPUIFUS L LPOLTEFOPNH FYRKH، Y RTPCHETYFSH، DEKUFCHYFEMSHOP MY CHUE BMENEOFPZPHNE OFPCH، RTYUHFUFCHHAF Y OBIPDSFUS CH RTBCHYMSHOPK RPUMEDPCHBFEMSHOPUFY. YuFP EEE VPMEE CHBTsOP، TBOSCH DPLHNEOFSH PDOPZP FYRB NPZHF PVTBVBFSHCHBFSHUS KHOIZHYGYTPCHBOOSCHN PVTBBPN. nPTsOP RYUBFSH VPMEE YOFEMMELPHBMSHOSCH RTPZTBNNSHCH، YURPMSHQHAEYE OBBOYS، ЪBLMAYUEOOSCH YOZHTNBGYPOOPK UFTHLFHTE DPLHNEOFB.

oEBCHYUINPUFSH DBOOSCHI

PUOPCHOBS GESH RPTPELFYTPCHBOYS SGML VSHMB CH UPЪDBOY ZBTBOFYK FPZP، YuFP DPLHNEOF، ЪBLPDYTPCHBOOSCHK UPZMBUOP EZP RPMPTSEOYSN، VKDEF REPPKRNTEOPTBDO EDSH CH DTHZHA VE' RPFETY YOZHPTNBGYY. dChB EZP UCHPKUFCHB، PRYUBOOSCHI CHCHYE، PFCHEYUBAF LFPNH FTEVPCHBOYA درباره BVUFTBLFOPN HTPCHOE; FTEFSHE UCHPKUFChP -- درباره HTPCHOE UFTPYUEL VBKFPCH (UYNCHPMPCH), LPFPTSHCHE UPUFBCHMSAF DPLHNEOF. SGML RTEDPUFBCHMSEF PVPVEOOOSCHK NEIBOIN UFTPLPChPK RPDUFBOPCHLY , FP EUFSH, RTPUFPK NBYOOOP-OEEBCHYUYNSCHK URPUPV KHLBBOYS, YuFP LPOLTEFOBS UFTPLB UYNCHPMPCH CH DPLKHNEOFE CH NPNEOF PVTBVPFLY DPLKHNEOFSHPHABD FTPLH. pDOP PYUECHYDOPE RTYNEOOYE LFPNH NEIBOINH -- PVEUREYOOYE EDYOPK FETNYOPMPZYY; DTHZPE، Y VPMEE OBYUYFEMSHOPE، -- RTPFPYCHPDEKUFCHYE YJCHEUFOPK OEURPUPVOPUFY TBOSHI LPNRSHAFETOSHI UYUFEN RPOINBFSH OBVPTSCH UYNCHPMPCH DTHZ DTHZFDOFDHB، OEURPUPVOPUFY TBOSHI TBJYUEULYE UYNCHPMSCH، OEPVIPDYNSCHE RTYMPTSEOYA، RHFEN PRYUBFEMSHOPZP PFPVTBTTSEOYS OERETEDDBCHBENSCHI UYNCHPMPCH. uFTPLY، PRTEDEMSENSCHE LFYN NEIBOYNPN، OBSCCHBAFUS UHEOPUFSNY (موجودیت ها).

p RTEINHEEUFCHBI

YuFP DBEF YURPMSHЪPCHBOYE SGML CH TEBMSHOPK QYYOY؟ noe POP UTBKH DBMP CHPNPTSOPUFSH RTPYCHPDYFSH DPLKHNEOFSHCH MAVPN FTEVKHENPN CHYDE. xDPVOP PLBBBMPUSH Y OBRYUBOYE "ChPTDPCHSHCHI" VHNBTSEL CH RTYCHSHYUOPK UTEDE XEmacs VEЪ YURPMSHЪPCHBOYS ویندوز. CHUE YURPMSHЪPCHBOOSCH RTPZTBNNNSCH -- VEURMBFOSCH Y TBURTPUFTBOSAFUS CH YUIPDOSHI FELUFBI, YuFP RPЪCHPMYMP KHUFBOPCHYFSH YI درباره CHUEI YURPMSHKHENSHI NOK UYUP. rTYUEN PLBBMPUSH، YuFP OBYUBFSH TBVPFBFSH U SGML CHCHUE OE UMPTsOP، LBTSDSCHK، LFP IPFSH TB TEDBLFYTPCHBM WWW UFTBOYULH، OE YURKHZBEFUS CHCHUE SCHYTHMLGYD.

rPFPN HCE، RP NETE RPUFEREOOPZP YHYUEOYS SGML، S PUBPOBM، YuFP LFB FEIOILB DBEF ZTPNBDOPE LPMYUEUFChP CHPNPTsOPUFEK RP UTTBCHOOYA U FYRYUOPK "OBUFJRPZSHT"

rTPDHLFYCHOPUFSH YuEFLP TBDEMEOOOSCH RTPGEUUSCH CHPDB YOZHPTNBGYY Y EE ​​ZHTNBFYTPCHBOYS RPJCHPMSAF BCHFPTH UPUTEDPFPYYFSHUS درباره YЪMPTSEOYY NSCHUMEK, OE PFCHBUTNBFYTPCHBOYS VPT UFYMEK.

edYOBS UFYMYUFYLB MEZLP CHSHCHDETTSYCHBFSH TBMYUOSCH DPLHNEOFSHCH EDIOPN UFYME، YURPMSHJHS EDYOKHA FETNYOPMPZYA. еUMY UFYMSH YMY FETNYOSCH OCHTSOP YЪNEOIFSH، LFP DEMBEFUS TBBPN PE CHUEI DPLHNEOFBI، OE FTPZBS YI UPDETSINPE.

rPCHFPTOPE YURPMSHЪPCHBOIEьФПФ FETNYO، IPTPYP OBBLPNSHCHK RTPZTBNNNYUFBN، POBYUBEF OBMYUYE CHPNPTsOPUFY YURPMSHЪPCHBFSH DEFBMY UFBTSCHI RTPELFPCH CH OPCHSHCHNEMSHOOCHOSNYNYB. yuBUFSH DPLHNEOFB، PZHTTNMEOOBS CH CHYDE SGML-BMENEOFB، NPTsEF RETEOPUIFSHUS CH DTHZIE DPLHNEOFSHCH، MEZLP RPCHFPTSFSHUS CH TBOSHI NEUFBI FELUFB.

dPMZPCHYUOPUFSH YOZHPTNBGYY yЪ-ЪB FPZP، YuFP SGML -- RTPUFPK Y UFBODBTFOSCHK ZHTNBF ITBOEOYS DBOOSCHI، PFUHFUFCHHEF OEPVIPDYNPUFSH RETEZHPTNBFYTPCHBFSH YI CHCHFBRBBTHT NNOPK RMBFZHTNSCH. yOZhPTNBGYS RTPUFP DPUFHROB OCHUEZDB. pOB OUEEF U UPVPK CHUE OEPVIPDYNPE DMS UPJDBOYS DPLHNEOFB.

mHYUYYEE HRTBCHMEOYE DBOOSCHNYدر SGML NPTsOP PRTEDEMSFSH YOZHPTNBGYPOOSCH BMENEOFSH Y NBOIRKHMSGYY U OINY U RTPYCHPMSHOPK UFEREOSHA DEFBMSHOPUFY. TBNEYOOOSCH BMENEOFSH NPZHF YNEFSH BFTYVKhFSH، PRTEDEMSAEYE IBTBLFETYUFYYY UCHPKUFCHB BMENEOFPCH. bFB YOZHPTNBGYS OE RTEDOBOBYEOB DMS REYUBFY، OP NPTSEF RPNPYUSH HRTBCHMEOYY BMENEOFBNY DBOOSCHI. OBRTYNET، شناسه BFTYVHF (YDEOFYZHYLBFPT) NPTSEF HOILBMSHOSCHN PVTBBPN YDEOFYZHYGYTPCHBFSH PDYO BVBBG، YMY GEMSHK TBDEM، RTYNEYUBOIE، BPKYAVYOBT، BPKYAFYEBT CH LFPN RTYNETE:

yOZhPTNBGYS
fBL LBL YDEOFYZHYLBFPTSCH SCHMSAFUS NBYOOP-YUYFBENSCHNY، POY NPZHF UCHSCHCHBFSH NETSDH UPVPK YOZHPTNBGYA YURPMSHЪPCHBFSHUS DMS TBOPPVTBOPZEKYPYKS در باره:
  • lPOFTPMYTPCHBFSH VE'PRBUOPUFSH DPUFHRB L YOZHPTNBGYY، RPJCHPMSS FPMSHLP PRTEDEMEOOSCHN MADSN RTPUNBFTYCHBFSH YMY YNEOSFSH EE.
  • bChFPNBFYYTPCHBFSH RETENEEEOOYE YOZHPTNBGYY -- OBRTYNET، PVPCHMEOYE DBOOSCHI CH PDOPN NEUFE NPTSEF YOYGYTPCHBFSH PVOPCHMEOYE FPK TSE YOZHPTNBTHZTGYSITY.

TBDEMSENPUFSH Pypnpsopsoph tbvpfs UFTHLFHLFHTPHTPCHOSHNY LPRPOOOFBNY DPLHNEOFB RPCHPMSEF UFTPIFSH DPLHNEOF Yu Upufbchoshchi Yubufuzhchy، TBIVTUBOSOSH RP PTZboybyy. lFP RPЪCHPMSEF RPMSHЪPCHBFEMSN DEMYFSHUS YOZHPTNBGYEK VEYE DHVMYTPCHBOYS.

nPVYMSHOPUFSH h YOZHPTNBGYPOOSCHI UEFSI، PVAEDYOSAEYI TBOPPVTBOSCH LPNRSHAFETSH، PRETBGYPOOSCH UYUFENSH Y RTIMPTSEOYS، NPVYMSHOPUFSH UFBOPCHYFUS LMAYUPYFUS LMAYUPYFUS LPNRSHAFETSH. rPULPMSHLH SGML OE ЪBCHYUYF PF BRRBTBFHTSCH Y RTYMPTSEOYK، NPTsOP MEZLP PVNEOYCHBFSHUS DPLHNEOFBNY NETSDKH TBMYUOSCHNY UYUFENBNY.

ZYVLPUFSH H RTYMPTSEOYY SGML RPЪCHPMSEF YURPMSHЪPCHBFSH YOZHPTNBGYA DBMELP ЪB TBNLBNY "OBUFPMSHOPK FYRPZTBZHYY". در باره:

  • UFTBOYGSCH WWW;
  • یوژپتنبگی پوشه وبشچ دبوشچی;
  • DYBZOPUFYUEULYE / LURETFOSCH UYUFENSCH;
  • LMELFTPOOBS RPYUFB;
  • ZYRETFELUFPCHBS DPLHNEOFBGYS;
  • RHWMYLBYY درباره CD-ROM;
  • YOFETBLFYCHOSHE LMELFTPOOSHE NBOHBMSHCH.

rPYENH SGML؟

rPYENH OE کلمه؟ rPFPNKH، YuFP LFP ЪBLTSCHFSHCHK ZHTNBF. rPFPNH، YuFP LFP ZhPTNBF PDOPZP RTYMPTSEOYS. rPFPNH، YuFP bFPZP RTYMPTSEOYS OEF RPD AOILUBNY، U LPFPTSCHNY S TBVPFBA. rPFPNKH، YuFP LFP OE FELUFPCHSHCHK ZHTNBF. rPFPNH، YuFP OEF UTEDUFCH BChFPNBFYUEULPK ZEOETBGYY FBLYI DPLHNEOFPCH. rPFPNH، YuFP OEF FPMLPCHSCHI UTEDUFCH HRTBCHMEOYS CHETUISNY Y LPMMELFYCHOPK TBVPFSHCH. rPFPNH، YuFP LFP ZhPTNBF TBNEFLY REYUBFY، B OE UNSHUMPCHPK UFTHLFKhTSCH، Y OEF CHNPTSOPUFY یی UPPFOPUYFSH. rPFPNH، YuFP RTY LURPTFFE RPMHYUBEFUS UPCHETYYOOOP OEHDPCHMEFCHPTYFEMSHOSHCHK HTML. rPFPNH، YuFP LBYUEUFChP CHETUFLY Y REYUBFY OJCE UTEDODOEZP.

rPYENH OE T E X؟ rPFPNKH، YuFP LFP UMYILPN OYLPHTPCHOECHSHCHK SJSHL. EZP OE DBYSH CH THLY OBUYOBAYENKH. rPFPNH، YuFP LFP ZhPTNBF TBNEFLY REYUBFY، B OE UNSHUMPCHPK UFTHHLFKhTSCH . rPFPNKH، YuFP NBMP T E X-PTYEOFYTPCHBOOSCHI TEDBLFPTPCH. rPFPNH، YuFP OEF KHDCHMEFCHPTYFEMSHOSHHI UTEDUFCH LURPTFB H Word.

rPYENH OE HTML؟ rPFPNKH، YuFP UBNP RPOSFYE HTML UYMSHOP TBUNSHCHFP ZPOLPK WWW ЪБ LPNNETGYEK Y CHPKOK RTPYCHPDYFEMEC VTBHJETPCH DTHZ U DTHZPN. rPFPNH، YuFP HTML UFTBDBEF CHUE FEN TSE OEDPUFBFLPN: PTYEOFYTPCHBO درباره RTEDUFBCHMEOYE، BOE درباره UFTHLFHTH. rPFPNKH، YuFP PO PUEOSH VEDEO CHSTBIFEMSHOSHNY UTEDUFCHBNY، Y PFUKHFUFCHHAF CHNPTSOPUFY EZP TBUYTEOYS. rPFPNH، YuFP OE TEYEOB RTPVMENB LPTTELFOPK TKHUIZHYLBGYY. rPFPNH، YuFP OEF KHDCHMEFCHPTYFEMSHOSHHI UTEDUFCH LURPTFB H Word.

SGML RTPFPYCH WYSIWYG

dMS FAIRIES، LFP RTYCHSHL RPMSHЪPCHBFSHUS FPMSHLP "پردازنده کلمه"-BNY، OBRTYNET، MS Word YMY WordPerfect، NPTsEF VSHCHFSH YOFETEUOP UPRPUFBCHMEOYE YI U SGML YOUFTHNEOFBB. fY DCH ZTKHRRSCH RTPZTBNNOSHI UTEDUFCH، OEUNPFTS درباره UIPTSEUFSH TEYBENSHHI ЪBDBU -- RTPYCHPDUFCHP DPLKHNEOFPCH -- CHEUSHNB DTHZ PF DTHZB PFMYUBAFUSHRP

واژه پرداز -- LFP YOFEMMELPHHBMSHOBS RYYHEBS NBYYOLB. در PTYEOFYTPCHBO درباره TBVPFH U CHYHBMSHOSCHN RTEDUFBCHMEOYEN FELUFB، IBTBLFETYYHAEEZPUS OBVPTPN UFYMEK: UFYMEK UYNCHPMPCH (YTYZhF، LEZETFBCHMEOYEN FELUFB، STBCHOYCHBOYE، RPMPTSEOYE RP YYTYOE UFTBOYGSHCH، UFTBOYG (LPMPOFYFKHMSHCH، UOPULY)، TBDEMPCH Y DPLHNEOPCH (ZhPTNBF VKHNBZY ، PZMBCHMEOYE)، Y RTPYUYI. واژه پرداز OE TBVPFBEF U CHOKHFTEOOEK UFTKHLFKHTPK DPLKHNEOFB.

SGML TEDBLFPT، OBRTPFYCH، PTYEOFYTPCHBO درباره TBVPFH U UPDETTSYNSCHN DPLHNEOFB. dMS SGML TEDBLFPTB، OBRTYNET، TBDEM -- LFP BMENEOF، CH LPFPTSCHK NPZHF CHLMAYUBFSHUS RPDTBBDEMSH، BOE RTPNETSKHFPL PF PDOPZP BVBBBGB، OBVTBOPZPZPZP HI word processor-a.

ьФП РПЪЧПМСЭФ БЧФПТХ UPUTEDDPFPYUFSHUS درباره UPDETSBOY FELUFB، BOE CHPJIFSHUS U EZP ZHTNBFYTPCHBOYEN Y CHSHCHVPTPN UFYMEK. chYHBMSHOBS UFYMYUFYLB DPLHNEOFB PRTEDEMSEFUS RTY EZP LURPTFFE CH CHCHPDOSH ZHTNBFSHCH، B OE RTY OBVPTE FELUFB.

p RTPZTBNNOPN PVEUREYUEOOYY

YuFPVSH OBYUBFSH TBVPFBFSH U DPLHNEOFBNY CH SGML RPMSHЪPCHBFEMA OHTSOSCH DCHB PUOPCHOSHI UTEDUFCHB: TEDBLFPT Y UTEDUFCHB LURPTFB (ZHTNBFYTPCHBOYS).

SGML-TEDBLFPT

SGML-TEDBLFPT PFMYUBEFUS LBL PF RTYCHSHCHYUSHI FELUFPCHSCHI TEDBLFPTPCH، FBL Y PF "پردازنده کلمه" -PC. pF RETCHSHCHI -- OBMYUYEN RPDDETSLY UFTHLFHTYTPCHBOOSCHI DPLHNEOPCH، PF CHFPTSCHI -- PFUHFUFCHYEN RPDDETSLY CHYHBMSHOPZP ZHTNBFYTPCHBOYS. TEDBLFPT TBYTBEF DTD TEDBLFYTHENPZP DPLHNEOFB Y "CHEDEF" RPMSHЪPCHBFEMS CH UPPFCHEFUFCHYY U OIN. OBRTYNET، EUMY DTD RTEDHUNBFTYCHBEF BMENEOF

, Ch LPFPTPN NPZHF CHUFTEYUBFSHUS FPMSHLP BMENEOFSH YMY , FP RPMSHЪPCHBFEMA, TEDBLFYTHAENKH BMENEOF
، VKhDEF RTEDMPTSEOP CHUFBCHYFSH PDYO YЪ LFYI DCHHI TBTEOOOSCHI BMENEOFPC. SGML-TEDBLFPT FBLCE PVSHYUOP UPDETTSYF UTEDUFCHB OBCHYZBGYY RP YETBTIYY DPLHNEOF.

yYUYUMB RPRKHMSTOSCHI SGML-TEDBLFPTPCH NPTsOP OBCHBFSH ArborText ADEPT*Editor، SoftQuad Author/Editor، psgml، Adobe FrameMaker+SGML، Corel WordPerfect، Y NOPCEUFChP DTHZYI.

uTEDUFCHB ZHTNBFYTPCHBOYS

uHEEUFCHHEF NOPTSEUFCHP UTEDUFCH TBVPFSCH U SGML FELUFBNY. VOMSHYKHA YI YUBUFSH UPUFBCHMSAF UTEDUFCHB ZHTNBFYTPCHBOYS -- LURPTFB SGML CH DTHZIE ZHTNBFSH DMS REYUBFY، RTPUNPFTB Y F.R. CHSHCHIPDOSH ZHPTNBFSH NPZHF VSCHFSH MAVSHNY، ЪBCHYUS MYYSH PF DPUFKHROPZP RTPZTBNNOPZP PVEUREYUEOYS Y OHTSD RPMSHЪPCHBFEMS. OBRTYNET، S YURPMSHYHA LPOCHETFETSHCH HTML، RTF Y L A T E X.

در سال 1986، مدت ها قبل از تحقق ایده ایجاد وب، زبان نشانه گذاری استاندارد جهانی SGML ( زبان نشانه گذاری تعمیم یافته استاندارد شده) به عنوان یک استاندارد بین المللی (ISO 8879) برای تعریف زبان های نشانه گذاری تایید شده است، اگرچه SGML از اواخر دهه شصت وجود داشته است. از آن برای توصیف زبان‌های نشانه‌گذاری استفاده می‌شد و در عین حال به نویسنده اجازه می‌داد تا تعاریف رسمی را برای هر عنصر و ویژگی زبان ارائه دهد.

HTML در اصل تنها یکی از برنامه های SGML بود. او قوانینی را تشریح کرد که براساس آن اطلاعات باید برای شبکه جهانی وب آماده شود. بنابراین، زبان HTML مجموعه ای از مقررات SGML است که به صورت فرموله شده است تعاریف نوع سند(DTD)، توضیح می دهد که دقیقاً برچسب ها و عناصر چیست. طرح HTML DTD در مرورگر وب ذخیره می شود.

از معایب زبان HTML می توان به موارد زیر اشاره کرد:

  • HTML دارد مجموعه ثابت از برچسب ها. شما نمی توانید برچسب های خود را ایجاد کنید که برای سایر کاربران قابل درک باشد.
  • HTML انحصاری است فناوری ارائه داده ها. HTML اطلاعاتی در مورد معنای محتوای موجود در برچسب ها ندارد.
  • HTML - زبان "مسطح".. اهمیت تگ ها در آن تعریف نشده است، بنابراین نمی توان از آن برای توصیف سلسله مراتب داده استفاده کرد.
  • مرورگرها به عنوان بستری برای برنامه ها استفاده می شوند. HTML برای ایجاد برنامه های کاربردی وب در سطحی که توسعه دهندگان وب در حال حاضر برای آن تلاش می کنند به اندازه کافی قدرتمند نیست. به عنوان مثال، توسعه یک برنامه کاربردی برای پردازش حرفه ای و جستجوی اسناد در HTML غیرممکن است.
  • حجم زیادی از ترافیک شبکه. اسناد HTML موجود که به عنوان برنامه‌های کاربردی استفاده می‌شوند، اینترنت را با حجم زیادی از ترافیک در سیستم‌های سرویس گیرنده-سرور بارگذاری می‌کنند. یک مثال می تواند ارسال یک سند بزرگ از طریق شبکه باشد، زمانی که تنها به بخش کوچکی از سند نیاز است.

بنابراین، از یک سو، زبان HTML وسیله ای بسیار مناسب برای علامت گذاری اسناد برای استفاده در وب است و از سوی دیگر، سند علامت گذاری شده در HTML اطلاعات کمی در مورد محتوای آن دارد. اگر یک سند خاص حاوی اطلاعات کافی کامل در مورد محتوای آن باشد، انجام پردازش تعمیم یافته خودکار و جستجو در فایل ذخیره سازی سند نسبتاً آسان امکان پذیر می شود. SGML به شما امکان می دهد اطلاعات مربوط به محتوای یک سند را ذخیره کنید، اما به دلیل پیچیدگی آن، هرگز به اندازه HTML مورد استفاده قرار نگرفته است.

گروهی از کارشناسان SGML، به رهبری Jon Bosak از Sun Microsystems، شروع به کار برای ایجاد زیرمجموعه ای از SGML کردند که می تواند توسط جامعه وب پذیرفته شود. تصمیم گرفته شد که بسیاری از ویژگی های غیر ضروری SGML حذف شوند. زبانی که به این روش بازسازی شد XML نام داشت. نسخه ساده شده به طور قابل توجهی در دسترس تر از نسخه اصلی است، با مشخصات آن تنها 26 صفحه در مقایسه با بیش از 500 صفحه مشخصات SGML.

بیایید نگاهی دقیق تر به ساختار و ویژگی های این زبان بیندازیم.

XML (زبان نشانه گذاری توسعه یافته)- W3C زبان نشانه گذاری را توصیه می کند. XML- قالب متن، برای ذخیره سازی داده های ساخت یافته، برای تبادل اطلاعات بین برنامه ها و همچنین برای ایجاد زبان های نشانه گذاری تخصصی بر اساس آن طراحی شده است. XML یک زیرمجموعه ساده شده از زبان SGML است.

زبان XML دارای موارد زیر است کرامت:

  • این یک قالب سند انسان محور است، هم برای انسان و هم برای رایانه قابل درک است.
  • پشتیبانی از یونیکد
  • فرمت XML می تواند ساختارهای داده اساسی مانند رکوردها، فهرست ها و درختان را توصیف کند.
  • این یک قالب خود مستند است که ساختار و نام فیلدها و همچنین مقادیر فیلدها را توصیف می کند.
  • الزامات نحو و تجزیه را کاملاً تعریف کرده است که به آن اجازه می دهد ساده، کارآمد و سازگار باقی بماند.
  • به طور گسترده برای ذخیره و پردازش اسناد استفاده می شود.
  • این قالب بر اساس استانداردهای بین المللی است.
  • ساختار سلسله مراتبی XML برای توصیف تقریباً هر نوع سندی مناسب است.
  • این یک متن ساده، بدون مجوز و هر گونه محدودیت است.
  • پلت فرم مستقل؛
  • این زیرمجموعه SGML است که تجربه زیادی برای آن جمع آوری شده و برنامه های کاربردی تخصصی ایجاد شده است.

به معروف کاستی هازبان ها شامل موارد زیر است:

  • نحو XML اضافی است.
    • اندازه سند XML به طور قابل توجهی بزرگتر از نمایش دودویی همان داده است (حدود 10 برابر).
    • اندازه یک سند XML به طور قابل توجهی بزرگتر از یک سند در قالب های انتقال داده متنی جایگزین است (به عنوان مثال JSON، YAML) و به ویژه در قالب های داده ای بهینه شده برای یک مورد خاص.
    • افزونگی XML می تواند بر عملکرد برنامه تأثیر بگذارد. هزینه ذخیره سازی، پردازش و انتقال داده ها در حال افزایش است.
    • برای تعداد زیادی از کارها، به قدرت کامل نحو XML نیاز نیست و می توان از راه حل های بسیار ساده تر و کارآمدتر استفاده کرد.
  • استفاده از فضای نام XML دشوار است و پیاده سازی آن در تجزیه کننده های XML دشوار است.
  • XML پشتیبانی از نوع داده در زبان را ندارد. مفاهیم «اعداد صحیح»، «رشته‌ها»، «تاریخ»، «بولیان» و غیره را ندارد.
  • مدل داده سلسله مراتبی XML در مقایسه با مدل رابطه ای و نمودارهای شی گرا محدودیت هایی را ارائه می دهد.

به طور کلی، XML را می توان نه تنها به عنوان یک زبان نشانه گذاری جدید، بلکه به عنوان پایه ای برای یک خانواده کامل از فناوری ها مشاهده کرد:

جدول 9.1. ساختار خانواده XML
XML مشاوره فنی در مورد استفاده از XML
DTD تعریف نوع سند (شما)
XDR فرمت XML کاهش(شما مایکروسافت)
XSD تعریف طرحواره XML (شما W3C)
فضای نام روشی برای تعریف نام عناصر و ویژگی ها
XPath زبان مسیر XML
XLink زبان پیوند XML
XPointer زبان اشاره گر XML
DOM Document Object Model API
SAX API ساده برای XML
XSL قابل گسترش زبان شیوه نامه
XSL-FO قالب بندی اشیاء XSL
XSLT زبان تحول XSL
Xشامل XML شامل نحو

زبان های نشانه گذاری: SGML، HTML، XML. ارتباط آنها با یکدیگر.

HTML در اصل فقط یک برنامه SGML بود. او قوانینی را تشریح کرد که براساس آن اطلاعات باید برای شبکه جهانی وب آماده شود. بنابراین، HTML مجموعه ای از عبارات SGML است که به عنوان یک تعریف نوع سند (DTD) فرموله شده است، که توضیح می دهد که برچسب ها و عناصر به چه معنا هستند. طرح HTML DTD در مرورگر وب ذخیره می شود.

بنابراین، از یک سو، زبان HTML وسیله ای بسیار مناسب برای علامت گذاری اسناد برای استفاده در وب است و از سوی دیگر، سند علامت گذاری شده در HTML اطلاعات کمی در مورد محتوای آن دارد. اگر یک سند خاص حاوی اطلاعات کافی کامل در مورد محتوای آن باشد، انجام پردازش تعمیم یافته خودکار و جستجو در فایل ذخیره سازی سند نسبتاً آسان امکان پذیر می شود. SGML به شما امکان می دهد اطلاعات مربوط به محتوای یک سند را ذخیره کنید، اما به دلیل پیچیدگی آن، هرگز به اندازه HTML مورد استفاده قرار نگرفته است.

گروهی از کارشناسان SGML، به رهبری Jon Bosak از Sun Microsystems، شروع به کار برای ایجاد زیرمجموعه ای از SGML کردند که می تواند توسط جامعه وب پذیرفته شود. تصمیم گرفته شد که بسیاری از ویژگی های غیر ضروری SGML حذف شوند. زبانی که به این روش بازسازی شد XML نام داشت. نسخه ساده شده به طور قابل توجهی در دسترس تر از نسخه اصلی بود، با مشخصات آن تنها 26 صفحه در مقایسه با بیش از 500 صفحه مشخصات SGML.

مزایای زبان XML

  • پشتیبانی از یونیکد
  • پلت فرم مستقل؛

خدمات وب

سرویس وب(وب سرویس) - یک سیستم نرم افزاری که دارای URI است و رابط های عمومی آن در XML تعریف شده است. توضیحات این سیستم نرم افزاری را می توان توسط برنامه های کاربردی دیگر یافت که می توانند مطابق با این توضیحات از طریق پیام های مبتنی بر XML که با استفاده از پروتکل های اینترنتی ارسال می شوند با آن تعامل داشته باشند. وب سرویس واحدی از ماژولار بودن هنگام استفاده است معماری سرویس گرابرنامه های کاربردی.

معماری سرویس گرا(SOA، معماری سرویس گرا) یک رویکرد ماژولار برای توسعه نرم افزار بر اساس استفاده از خدمات با رابط های استاندارد است.

SOA بر اساس اصول استفاده مجدد از عناصر عملکردی فناوری اطلاعات و یکسان سازی فرآیندهای عملیاتی استاندارد است. اجزای برنامه را می توان در گره های مختلف شبکه توزیع کرد و به عنوان سرویس های کاربردی مستقل و با اتصال آزاد و قابل تعویض ارائه می شود.

رابط کامپوننت یک برنامه SOA جزئیات پیاده سازی یک جزء خاص (سیستم عامل، زبان برنامه نویسی و غیره) را در بر می گیرد.

خدمات وب دات نت دارای مزایای زیر است:

  • باز بودن استانداردها. هیچ عنصر پنهان یا غیرقابل دسترس در وب سرویس ها وجود ندارد. هر جنبه ای از فناوری، از نحوه یافتن یک وب سرویس گرفته تا نحوه توصیف و نحوه ارتباط آن، با استانداردهای در دسترس عموم تعریف می شود.
  • کراس پلت فرم. یک زبان برنامه نویسی که به شما امکان می دهد اسناد XML ایجاد کنید و اطلاعات را از طریق HTTP ارسال کنید و به شما امکان می دهد با هر وب سرویس تعامل داشته باشید. امکان دریافت وب سرویس از سیستمی غیر از دات نت وجود دارد.
  • سادگی.
  • پشتیبانی از پیام ها به زبان قابل خواندن توسط انسان. انتقال از استانداردهای باینری مورد استفاده در COM و CORBA به متن XML، تصحیح خطاها را آسان‌تر کرد و امکان تعامل با سرویس‌های وب را از طریق کانال‌های HTTP معمولی فراهم کرد.

پیاده سازی خدمات وب دات نت به سادگی فراخوانی یک وب سرویس راه دور یا فراخوانی یک متد کلاس محلی است. این امر با استفاده از ابزارهای ارائه شده توسط .NET Framework به دست می آید که به شما امکان می دهد بدون نیاز به یادگیری جزئیات نحوه عملکرد استانداردهایی مانند SOAP، WSDL و UDDI یک وب سرویس کامل ایجاد کنید. اقدامات زیر انجام می شود:

  1. یک وب سرویس به عنوان یک کلاس دات نت با ویژگی هایی توسعه یافته است که آن را به عنوان یک وب سرویس با برخی عملکردها شناسایی می کند.
  2. دات نت به طور خودکار یک سند WSDL ایجاد می کند که نحوه تعامل مشتری با وب سرویس را توضیح می دهد.
  3. مصرف کننده وب سرویس ایجاد شده را پیدا می کند و می تواند مرجع وب مربوطه را به پروژه Visual Studio .NET اضافه کند.
  4. دات نت به طور خودکار سند WSDL را تأیید می کند و یک کلاس پروکسی ایجاد می کند که به مصرف کننده اجازه می دهد با وب سرویس تعامل داشته باشد.
  5. مصرف کننده یکی از روش های کلاس وب سرویس شما را فراخوانی می کند. از نظر او، این فراخوانی از نظر ظاهری با فراخوانی یک متد در هر کلاس دیگر تفاوتی ندارد، اگرچه تعامل در واقع با کلاس پروکسی است و نه با وب سرویس.
  6. کلاس پروکسی پارامترهای ارسال شده را به یک پیام SOAP تبدیل کرده و به وب سرویس ارسال می کند.
  7. سپس کلاس پروکسی پاسخ SOAP را دریافت می کند، آن را به نوع داده مناسب تبدیل می کند و آن را به عنوان یک نوع داده معمولی دات نت برمی گرداند.
  8. مصرف کننده از داده های دریافتی استفاده می کند.

سرویس های وب دات نت از فناوری ASP .NET استفاده می کنند که بخشی از NET Framework است. همچنین به پشتیبانی از سرور Microsoft IIS نیاز دارد.

معایب اصلی وب سرویس ها عملکرد کمتر و ترافیک شبکه بزرگتر در مقایسه با فناوری هایی مانند RMI، CORBA، DCOM به دلیل استفاده از پیام های متنی XML است.

استانداردهای خدمات وب

مشخصات WSDL

هر وب سرویس یک سند WSDL (زبان توضیحات وب سرویس) را ارائه می دهد که هر چیزی را که مشتری برای کار با این سرویس نیاز دارد، توصیف می کند. یک سند WSDL راه ساده و ثابتی را برای توسعه‌دهنده فراهم می‌کند تا سینتکس فراخوانی هر روش وب را مشخص کند. علاوه بر این، این سند به شما امکان می دهد از ابزارهایی برای تولید خودکار کلاس های پراکسی استفاده کنید، مانند مواردی که در محیط های Visual Studio .NET و .NET Framework موجود است. به لطف این ابزارها، استفاده از وب سرویس به آسانی استفاده از یک کلاس محلی است.

یک سند WSDL دارای یک قالب مبتنی بر XML است که اطلاعات را به پنج گروه تقسیم می کند. سه گروه اول تعاریف انتزاعی هستند که مستقل از ویژگی های پلت فرم، شبکه یا زبان هستند، در حالی که دو گروه باقی مانده شامل توضیحات خاصی هستند.

پروتکل SOAP

ارتباط بین وب سرویس ها و مشتریان آنها از طریق پیام هایی در قالب XML انجام می شود.

SOAP (پروتکل دسترسی به اشیا ساده) یک پروتکل پیام برای انتخاب خدمات وب است.

ایده اصلی استاندارد SOAP این است که پیام ها باید در قالب استاندارد XML کدگذاری شوند.

علاوه بر پیام‌های SOAP، می‌توانید از روش‌های GET و POST پروتکل HTTP برای تبادل داده با سرویس‌های دات‌نت استفاده کنید.

مزایای استفاده از فرمت SOAP نسبت به فرمت های دیگر برای انتقال داده:

  • رمزگذاری ساختارهای داده و مجموعه داده ها در XML با استفاده از SOAP به آسانی رمزگذاری انواع داده اسکالر ساده است.
  • هنگام استفاده از پیام‌های SOAP، ابزارهای اضافی برای آسان کردن افزودن ویژگی‌های امنیتی یا ردیابی، برای مثال، ارائه می‌شوند.
  • جعبه ابزار SOAP برای زبان های برنامه نویسی مختلف (و حتی برای نسخه های قبلی Microsoft C++ و Visual Basic) وجود دارد. در غیر این صورت، برای برقراری ارتباط با سرویس با استفاده از متدهای GET و POST پروتکل HTTP، بدیهی است که باید رشته query را خودتان بسازید و سپس پاسخ را تجزیه کنید.

استاندارد دیسکو

استاندارد DISCO ساده ترین راه را برای دسترسی به فایل های مانیفست فراهم می کند و به شما امکان می دهد ارجاعات به سرویس های وب را گروه بندی کنید.

یک فایل DISCO می‌تواند شامل فایل‌هایی از وب سرورهای مختلف باشد و از "جستجوی پویا" پشتیبانی می‌کند - جستجوی خودکار فهرست فایل سرویس وب روی سرور.

فایل های مانیفست مفید هستند زیرا چندین سرویس وب را در یک لیست واحد ترکیب می کنند، اما به مشتریان اجازه نمی دهند نوع خاصی از وب سرویس را بدون مشخص کردن نام شرکتی که آن را توسعه داده است جستجو کنند.

مشخصات UDDI

مشخصات UDDI (شرح جهانی، کشف و ادغام) با استفاده از یک ذخیره سازی (مخزن) ویژه که در آن شرکت ها و سازمان ها می توانند داده های مربوط به خدماتی را که ارائه می دهند قرار دهند، از این مشکلات جلوگیری می کند. بیش از 100 شرکت در ایجاد فناوری UDDI پیشگام بوده اند (لیست کامل را می توان در http://www.uddi.org/community.html یافت)، از جمله Sun و Microsoft. این شرکت ها با پیوستن به نیروهای خود، پیش نویس مشخصات UDDI را تهیه کردند که پس از 18 ماه استاندارد شد.

اطلاعات موجود در این مخزن باید به صورت دستی به روز شود. برای این منظور، برخی از "اپراتورهای گره" کپی های یکسانی از مخزن UDDI نگهداری می کنند. این شرکت ها ذخیره سازی مخزن مشخص شده و دسترسی رایگان به آن را برای محبوب کردن خدمات وب فراهم می کنند. علاوه بر این، مایکروسافت نسخه‌ای از UDDI را در نرم‌افزار سرور ویندوز دات‌نت برای استفاده در شبکه‌های داخلی سازمانی گنجانده است.

فروشگاه UDDI حاوی اطلاعاتی درباره شرکت هایی است که خدمات وب ارائه می دهند، نوع هر سرویس، و روابط با اطلاعات و مشخصات مربوط به آن خدمات. رابط UDDI خود یک سرویس وب است. برای ثبت نام یا جستجوی یک سرویس، باید یک پیام SOAP ارسال کنید.

وب - یکپارچه سازی.

هدف از یکپارچه سازی وب، ترکیب برنامه ها و سیستم های وب متفاوت در یک محیط مبتنی بر وب است.

رویکردهای زیر برای یکپارچه سازی وب انجام می شود:

· ادغام در سطح ارائه. این لایه به کاربر اجازه می دهد تا با برنامه تعامل داشته باشد. ادغام در سطح ارائه می دهد دسترسی به رابط کاربری برنامه های راه دور.

· یکپارچه سازی در سطح عملکرد. این ادغام مستلزم دسترسی مستقیم به منطق تجاری برنامه است. این با تعامل مستقیم بین برنامه ها و API(رابط برنامه نویسی برنامه) یا تعامل از طریق خدمات وب.

· یکپارچه سازی در سطح داده ها. در این مورد، دسترسی به یک یا چند پایگاه های داده، توسط برنامه راه دور استفاده می شود.

· یکپارچه سازی جامع. راه حل های یکپارچه سازی وب تجاری معمولاً شامل هر سه نوع ادغام می شود

استفاده از یکپارچه سازی وب به دلایل زیادی سودمند است:

· یکپارچه سازی وببه شما امکان می دهد تا سیستم های اطلاعاتی را بر اساس برنامه های شخص ثالث بدون نیاز به درک سیستم های مادر، محیط های نرم افزاری و معماری پایگاه داده آنها مستقر کنید.

· SOAو خدمات وباز یک زبان برنامه نویسی و رابط های مستقل از پلت فرم بین برنامه های کاربردی زیرساخت فناوری اطلاعات شرکت استفاده کنید. این مزیت های آشکاری را در پشتیبانی، مدیریت و استقرار شبکه های اطلاعاتی فراهم می کند.

· یکپارچه سازی وب به شما امکان می دهد تا با ترکیب اجزای متفاوت از طریق پروتکل های وب سرویس، عملکردهای پیچیده ای ایجاد کنید.

· یکپارچه سازی وب به شما امکان می دهد از خدمات وب توسعه دهنده استفاده کنید.

· یکپارچه سازی وب به شما اجازه می دهد تا رابط های برنامه کاربردی را از طریق پروتکل های وب سرویس بدون برنامه نویسی توسعه دهید.

برای یکپارچه سازی وب معمولاً از نرم افزارهای تجاری یا فناوری های رایج استفاده می شود، مانند PHP/Python/Perl, XForms, صابونو غیره.

ادغام مبتنی بر XML

به جای اجرای تعامل بین هر جفت سیستم، فقط باید به هر یک از آنها یاد دهید که XML "صحبت کنند". به عبارت دیگر، همه چیز به توسعه چند مورد بستگی دارد لفاف ها (wrapper یک wrapper است، یک ابزار نرم افزاری برای ایجاد پوسته سیستم برای استاندارد کردن تماس های خارجی و تغییر جهت عملکردی سیستم موجود)، که از زبان استاندارد XML سیستم یکپارچه به زبان قابل فهم برای هر سیستم ترجمه می شود.

· ابزارهای توسعه و کتابخانه های استاندارد برای XML تقریباً در تمام پلتفرم ها و برای اکثر زبان های برنامه نویسی محبوب وجود دارد.

· روش های کار با XML به اندازه کافی استاندارد هستند به طوری که می توان از تکنیک های مشابه در سیستم های مختلف استفاده کرد.

· اطلاعات فرمت شده در XML نه تنها توسط ماشین ها، بلکه توسط انسان ها نیز قابل پردازش است (که اشکال زدایی را بسیار آسان تر می کند).

در اصل، یکپارچه سازی مبتنی بر طرحواره XML اساساً با یکپارچه سازی مبتنی بر استانداردهای رایج دیگر متفاوت نیست. در عین حال، چندین مزیت قابل توجه دارد:

· زبان های XML به پلتفرم های سخت افزاری و نرم افزاری وابسته نیستند که امکان اتصال سیستم های متفاوت را فراهم می کند.

· قدرت بیان XML به اندازه کافی برای توصیف داده های تقریباً هر پیچیدگی عالی است.

یکپارچه سازی مبتنی بر XML عملاً در چارچوب پروتکل های زیر پیاده سازی می شود:

· XML-RPC. این یک پروتکل فراخوانی روش راه دور با انتقال داده در قالب XML از طریق پورت TCP 80 است. پورت HTTP

· WDDX(مبادله توزیع شده وب). مکانیزمی برای تبادل ساختارهای داده پیچیده از طریق پروتکل HTTP است. پروتکل بر اساس ساختارها نیست، بلکه بر اساس رویدادها است.

· ebXML(XML کسب و کار الکترونیکی) - XML ​​برای تجارت الکترونیک. هدف اصلی ارائه یک زیرساخت XML باز است که استفاده ایمن جهانی از اطلاعات تجارت الکترونیک را تضمین می کند. خدمات وب (وب خدمات).

XML (eXtensibleMarkupLanguage) یک زبان نشانه گذاری پیشنهادی W3C است. XML یک فرمت متنی است که برای ذخیره داده های ساختاریافته، برای تبادل اطلاعات بین برنامه ها و همچنین برای ایجاد زبان های نشانه گذاری تخصصی بر اساس آن طراحی شده است. XML یک زیرمجموعه ساده شده از زبان SGML است .

زبان XML دارای موارد زیر است کرامت:

  • این یک قالب سند انسان محور است، هم برای انسان و هم برای رایانه قابل درک است.
  • پشتیبانی از یونیکد
  • فرمت XML می تواند ساختارهای داده اساسی مانند رکوردها، فهرست ها و درختان را توصیف کند.
  • این یک قالب خود مستند است که ساختار و نام فیلدها و همچنین مقادیر فیلدها را توصیف می کند.
  • الزامات نحو و تجزیه را کاملاً تعریف کرده است که به آن اجازه می دهد ساده، کارآمد و سازگار باقی بماند.
  • به طور گسترده برای ذخیره و پردازش اسناد استفاده می شود.
  • این قالب بر اساس استانداردهای بین المللی است.
  • ساختار سلسله مراتبی XML برای توصیف تقریباً هر نوع سندی مناسب است.
  • این یک متن ساده، بدون مجوز و هر گونه محدودیت است.
  • پلت فرم مستقل؛
  • زیرمجموعه ای از SGML است که تجربه گسترده ای برای آن انباشته شده و برنامه های کاربردی تخصصی ایجاد شده است.

به معروف کاستی هازبان ها شامل موارد زیر است:

· نحو XML اضافی است.

· اندازه یک سند XML به طور قابل توجهی بزرگتر از نمایش دودویی همان داده است.

· اندازه یک سند XML به طور قابل توجهی بزرگتر از فرمت های انتقال داده مبتنی بر متن جایگزین (مانند JSON، YAML) و به ویژه فرمت های داده بهینه شده برای یک مورد خاص است.

· افزونگی XML می تواند بر عملکرد برنامه تأثیر بگذارد. هزینه ذخیره سازی، پردازش و انتقال داده ها در حال افزایش است.

· برای تعداد زیادی کار، به قدرت کامل نحو XML نیازی نیست و می توان از راه حل های بسیار ساده تر و سازنده تر استفاده کرد.

  • استفاده از فضای نام XML دشوار است و پیاده سازی آن در تجزیه کننده های XML دشوار است.
  • XML پشتیبانی از نوع داده در زبان را ندارد. مفاهیم «اعداد صحیح»، «رشته‌ها»، «تاریخ»، «بولیان» و غیره را ندارد.
  • مدل داده سلسله مراتبی ارائه شده توسط XML در مقایسه با مدل رابطه ای و نمودارهای شی گرا محدود است.

در اصل، XML خدمت می کند فرازبان برای توصیف ساختار زبان های دیگر. رابطه بین SGML، XML، HTML و برخی از زبان های دیگر در نمودار زیر نشان داده شده است:

تفاوت مهم بین XML و HTML توجه زیادی به نظارت بر دقت رعایت قوانین زبان هنگام علامت گذاری اسناد است. بسته به این، مرسوم است که متمایز شود درست ساخته شده استو معتبراسناد XML .

یک سند XML در نظر گرفته می شود به درستی ساخته شده است، اگر با تمام قوانین نحو XML مطابقت داشته باشد.

معاینه واقعیتسندشامل انجام اقدامات زیر است:

  • بررسی می کند که آیا فقط از مجموعه معینی از توصیفگرها استفاده شده است یا خیر.
  • بررسی انطباق کامل ترتیب عناصر و صفات با محتویات سند یا قوانین خاص.
  • کنترل انواع داده ها (با استفاده از یک طرحواره مناسب به دست می آید).
  • کنترل یکپارچگی داده ها برای اطمینان از تبادل بهینه اطلاعات از طریق وب با استفاده از تراکنش ها.

قوانین نحوی اساسیساخت اسناد XML

  • سند XML حاوی یک و تنها یک است عنصر ریشهشامل تمام عناصر دیگر
  • عناصر کودکموجود در عنصر ریشه، باید به درستی تودرتو شود.
  • نام هاعناصر از قوانین پیروی می کنند:
  • نام با یک حرف، خط زیر یا دو نقطه شروع می شود.
  • بعد از اولین کاراکتر نام می تواند حروف، اعداد، خط تیره، زیرخط، نقطه یا دو نقطه وجود داشته باشد.
  • نام ها نمی توانند با ترکیب حروف XML شروع شوند.

سند XML دارای ساختار زیر است:

  • خط اول سند XML نامیده می شود اعلامیه XML. این یک رشته اختیاری است که نسخه استاندارد XML (معمولاً 1.0) را نشان می دهد. رمزگذاری کاراکترها و وابستگی های خارجی نیز می توانند در اینجا مشخص شوند.

بهترین مقالات در این زمینه