Un identificator uniform de resursă (uri), scopul său și părțile sale. Schema de operare a serverului WWW

25.04.2019 Recenzii

Un URI (Uniform Resource Identifier) este un șir compact de caractere folosit pentru a identifica o resursă abstractă sau fizică. O resursă este înțeleasă ca orice obiect care aparține unui anumit spațiu. Necesitatea unui URI a fost înțeleasă de dezvoltatorii WWW încă de la începutul sistemului, de atunci trebuia să unească într-un singur mediu informaţional mijloacele care folosesc căi diferite identificarea resurselor informaţionale. A fost dezvoltată o specificație care includea apeluri către FTP, Gopher, WAIS, Usenet, E – mail, Prospero, Telnet, X.500 și, desigur, HTTP (WWW). Ca urmare, a fost elaborată o specificație universală care permite extinderea listei de resurse adresabile datorită apariției de noi scheme.

Unde sunt folosite URI-urile sunt link-uri hipertext care sunt scrise în etichete și ... Graficele încorporate sunt, de asemenea, adresate prin specificația URI în etichete și ... Implementarea unui URI pentru WWW se numește URL (Uniform Resource Locator). Mai precis, o adresă URL este o implementare a unei scheme URI mapate la un algoritm pentru accesarea resurselor prin protocoale de rețea. Există, de asemenea, un URN (Uniform Resource Name), care mapează un URI la un spațiu de nume din rețea.

Apariția URN-urilor provine din dorința de a aborda porțiuni MIME ale unui mesaj de e-mail. Principii de construire a unei adrese WWW. URI s-a bazat pe următoarele principii:

· Extensibilitate - Noile scheme de adresare ar trebui să se potrivească cu ușurință în sintaxa URI existentă.

· Completitudine - ori de câte ori este posibil, oricare dintre schemele existente ar trebui descrisă folosind un URI.

· Lizibilitate - adresa trebuia să fie ușor de citit de către utilizator, ceea ce este în general tipic pentru tehnologia WWW - documentele, împreună cu linkurile, pot fi dezvoltate într-un editor de text obișnuit.

Înainte de a lua în considerare diverse scheme reprezentarea adreselor, iată un exemplu de URI simplu:

http://polyn.net.kiae.su/polyn/index.html

Colonele sunt precedate de identificatorul schemei de adrese - „http”. Acest nume este separat prin două puncte de restul URI-ului, care se numește cale. V în acest caz calea constă din adresa de domeniu a mașinii pe care este instalat serverul HTTP și calea de la rădăcina arborelui serverului la fișierul „index.html”. Pe lângă notația URI completă prezentată mai sus, există una simplificată. Se presupune că, în momentul în care este utilizată, au fost deja definiți mulți parametri ai adresei resursei (protocol, adresa mașinii în rețea, unele elemente de cale). În astfel de ipoteze, autorul paginilor hipertext poate indica doar adresa relativă a resursei, adică. o adresă relativă la anumite resurse subiacente.

Un URL (Uniform Resource Locator) este un subset de scheme URI care identifică o resursă după modul în care este accesată (de exemplu, „locația sa pe web”), mai degrabă decât să o identifice după numele sau alte atribute ale acelei resurse. URL-ul descrie în mod explicit cum să ajungeți la obiect.

Sintaxă: :, Unde:

schema – specific – parte- depinde de schema. În schemă – specifică – parte pe care o puteți folosi valori hexazecimale sub forma:% 5f. Octeții neprintabili trebuie să fie codificați: 00-1F, 7F, 80-FF.

Exemple de adrese URL:

Http://www.ipm.kstu.ru/index.php

Ftp://www.ipm.kstu.ru/

URN (Uniform Resource Name) este un URI privat „urn:” cu un subset al „namespace” care trebuie să fie unic și imuabil chiar și atunci când resursa nu mai există sau este inaccesibilă.

Se presupune că, de exemplu, browserul știe unde să caute această resursă.

Sintaxă: urn: namespace: data1.data2, mai mult – date unde spațiul de nume definește modul în care sunt utilizate datele după al doilea „:”.

Exemplu de URN:

urnă: ISBN: 0–395–36341–6

ISBN - clasificator tematic pentru editori,

0–395–36341–6 – număr specific subiectul unei cărți sau al unei reviste

La primirea URN program client accesează ISBN (directorul de clasificare topică al editorului de pe Internet). Și primește o decriptare a numărului subiectului „0-395-36341-6” (de exemplu: „chimie cuantică”). URN este relativ nou, HTML nu este inclus în versiunile curente și serviciile de directoare nu sunt încă dezvoltate, așa că URN nu este la fel de răspândit ca URL.

Scheme de adresare a resurselor de internet

Există 3 scheme pentru adresarea resurselor de pe Internet. Schema specifică identificatorul său, adresa mașinii, portul TCP, calea în directorul serverului, variabilele și valorile acestora, eticheta.

Schema HTTP... Acesta este aspectul de bază pentru WWW. Schema conține identificatorul său, adresa mașinii, portul TCP, calea în directorul serverului, criteriul de căutare și eticheta.

Sintaxă: http: // [ [:@][:][?]]

http- numele circuitului

utilizator- Nume de utilizator

parola- Parolă de utilizator

gazdă- numele gazdei

port- numarul portului

url – cale- calea către fișier și fișierul în sine

interogare (<имя–поля>=<значение>{&<имя–поля>=<значение>) - șir de interogare

În mod implicit, port = 80.

Iată câteva exemple de URI-uri pentru schema HTTP:

http://polyn.net.kiae.su/polyn/manifest.html

Acesta este cel mai frecvent tip de URI utilizat în documentele WWW. Numele schemei (http) este urmat de o cale constând din adresa de domeniu a mașinii și adresa completă a documentului HTML din arbore. server HTTP.

Adresa IP poate fi folosită și ca adresă a mașinii:

http://144.206.160.40/risk/risk.html

Dacă serverul HTTP rulează pe un alt port TCP decât 80, acest lucru se reflectă în adresa:

http://144.206.130.137:8080/altai/index.html

http://polyn.net.kiae.su/altai/volume4 .html # primul

Schema FTP. Această schemă vă permite să adresați arhivele de fișiere FTP din programele client World Wide Web. În acest caz, programul trebuie să accepte protocolul FTP. În această schemă, este posibil să specificați nu numai numele schemei, adresa arhivei FTP, ci și ID-ul utilizatorului și chiar parola acestuia.

Sintaxă: ftp: // [ [:@][:]

ftp- numele circuitului

utilizator- Nume de utilizator

parola- Parolă de utilizator

gazdă- numele gazdei

port- numarul portului

url – cale- calea către fișier și fișierul în sine

Implicit, port = 21, utilizator = anonim, parola = adresa de e-mail.

Această schemă este folosită cel mai adesea pentru a accesa arhivele FTP publice:

ftp://polyn.net.kiae.su/pub/0index.txt

În acest caz, se înregistrează un link către arhiva „polyn.net.kiae.su” cu identificatorul „anonim” sau „ftp” (acces anonim). Dacă este necesar să specificați ID-ul utilizatorului și parola acestuia, atunci puteți face acest lucru în fața adresei mașinii:

ftp: // nimeni: [email protected]/ utilizatori / local / pub

În acest caz, acești parametri sunt separați de adresa mașinii prin simbolul @ și unul de celălalt prin două puncte.

schema TELNET... Această schemă este utilizată pentru a accesa resursa în modul terminal la distanță. De obicei, clientul invocă un program suplimentar la telnet. Când utilizați această schemă, trebuie să specificați un ID de utilizator, o parolă este permisă.

Sintaxă: telnet: // [ [:@][:]/

telnet- numele circuitului

utilizator- Nume de utilizator

parola- Parolă de utilizator

gazdă- numele gazdei

port- numarul portului

În mod implicit, port = 23.

Exemplu: telnet: // nume: [email protected]

În realitate, accesul se realizează la resurse publice, iar identificatorul și parola sunt în general cunoscute, de exemplu, pot fi găsite în bazele de date Hytelnet.

telnet: // invitat: [email protected]

Din exemplele de mai sus, puteți vedea că specificația adresei de resursă URI este destul de generală și vă permite să identificați aproape orice resursă de internet... În acest caz, numărul de resurse poate fi extins prin crearea de noi scheme.

Serviciu WWW

Serviciul WWW (World Wide Web) - conceput pentru schimbul de informații hipertext, construit după schema „client-server”. Browser ( Internet Explorer, Opera ...) este un client multi-protocol și un interpret HTML. Și ca interpret tipic, clientul îndeplinește diferite funcții în funcție de comenzi (etichete). Gama acestor funcții include nu numai plasarea textului pe ecran, ci și schimbul de informații cu serverul pe măsură ce textul HTML primit este analizat, ceea ce apare cel mai clar la afișarea imaginilor grafice încorporate în text.

Serverul HTTP (Apache, IIS...) se ocupă de solicitările clientului de a obține fișierul. La început, serviciul WWW se baza pe trei standarde:

· HTML (HyperText Markup Lan – guage) - limbaj de marcare hipertext a documentelor;

· URL (Universal Resource Locator) - o modalitate universală de a aborda resursele din rețea;

· HTTP (HyperText Transfer Protocol) - un protocol pentru schimbul de informații hipertext.

Schema de operare a serverului WWW

Un server WWW este o parte a unui intranet global sau care permite utilizatorilor rețelei să acceseze documentele hipertext aflate pe acest server. Pentru a interacționa cu serverul WWW, un utilizator de rețea trebuie să folosească un software specializat - un browser (din browserul englezesc) - un vizualizator.

Să aruncăm o privire mai atentă asupra schemei de operare a serverului WWW:

1. Utilizatorul rețelei lansează un browser, ale cărui funcții includ:

· Stabilirea conexiunii cu serverul;

· Obținerea documentului solicitat;

· Afisarea documentului primit;

· Răspuns la acțiunile utilizatorului - acces la un document nou. După pornirea browserului, la comanda utilizatorului, sau stabilește automat o conexiune cu serverul WWW specificat și îi trimite o solicitare pentru a primi documentul specificat.

2. Serverul WWW caută documentul solicitat și returnează rezultatele în browser.

3. Browserul, după ce a primit documentul, îl afișează utilizatorului și așteaptă reacția acestuia. Opțiuni posibile:

· Introducerea adresei unui nou document;

· Imprimare, căutare, alte operațiuni asupra documentului curent;

· Activarea (apăsarea) unor zone speciale ale documentului primit, numite link-uri și asociate cu adresa noului document. În primul și al treilea caz, există o contestație pentru un nou document.

Și referitor Google play.

Platforma Android se caracterizează printr-un nivel extrem de ridicat de fragmentare, deoarece Google obligă dezvoltatorii de dispozitive să efectueze independent portarea sistemului de operare, furnizarea compatibilitate inversăși acceptă mai multe dispozitive. În consecință, declarațiile lungi if-else sunt adesea folosite pentru a se asigura că cea mai optimă metodă este utilizată în contextul potrivit.

Situația este exact aceeași cu linkurile directe în Android. De-a lungul timpului, au apărut o multitudine de cerințe tehnice care trebuie îndeplinite în funcție de circumstanțe și de contextul utilizatorului. Soluția Branch reunește toate aceste implementări, este un cadru de legătură care funcționează în toate cazurile marginale. Legăturile de ramuri vă permit să rezolvați complexitatea și să utilizați o soluție standard, astfel încât să nu vă faceți griji cu privire la compatibilitate. Vă recomandăm cu tărie să folosiți soluțiile noastre în loc să încercați să recreați funcționalități similare de la zero, deoarece le oferim gratuit.

Această serie de publicații descrie toate mecanismele de legături directe pe care le folosim și explică implementarea lor.

Puteți începe să lucrați pe site start.branch.io sau faceți clic pe butonul de mai jos.

Schema URI Android și filtrul de intenție

În Android 1.0, a fost creat un mecanism de legătură directă bazat pe schema URI. Cu acesta, un dezvoltator își poate înregistra aplicația cu un URI (Uniform Resource Identifier) în sistem de operare pentru un dispozitiv anume după instalarea aplicației. Poate fi folosit orice URI. șir de text fără caractere speciale precum HTTP, pinterest, fb sau myapp. După înregistrare, dacă adăugați „: //” la sfârșitul URI-ului (de exemplu, pinterest: //) și faceți clic pe acest link, se va deschide aplicația Pinterest... Dacă aplicația Pinterest nu este instalată, va apărea o eroare „Pagină nu a fost găsită”.

Cerințe pentru utilizarea schemelor URI în Android

Înregistrați o acțiune pentru a răspunde la un URI cu un filtru de intenție în manifest.
Aplicația trebuie să fie instalată pentru utilizare. Dacă aplicația nu este instalată, va apărea un mesaj de eroare.

Configurarea unei scheme URI în Android

Configurarea aplicației pentru o schemă URI este ușoară. În primul rând, trebuie să selectați o acțiune în aplicația dvs. pe care aplicația dvs. ar trebui să o întreprindă atunci când activați o schemă URI și înregistrați un filtru de intenție pentru aceasta. Adăugați următorul cod la etichetă în manifestul corespunzător acţiunii de deschidere.

Puteți schimba your_uri_scheme la schema URI dorită. În mod ideal, schema ar trebui să fie unică. Dacă se potrivește cu schema URI a unei alte aplicații, atunci când utilizatorul face clic pe link, utilizatorul va vedea selectorul Android. Veți vedea adesea această fereastră dacă aveți mai multe browsere web instalate pe dispozitiv, deoarece toate sunt înregistrate pentru URI-uri HTTP.

Gestionarea linkurilor directe într-o aplicație Android

Va trebui apoi să analizați șirul pentru a citi valorile adăugate de schema URI.

Utilizarea schemelor URI în Android în practică

Există limitări semnificative în modul în care URI-urile gestionează legăturile directe. Nu vă recomandăm să îl folosiți fără modificări semnificative, deoarece dacă nu există nicio aplicație pe dispozitiv, pur și simplu va fi afișat un mesaj de eroare. Pentru utilizare eficientă Schemele URI vor trebui adăugate instrumente suplimentare pentru a gestiona cazurile marginale, cum ar fi atunci când aplicația nu este instalată.

Prin urmare, pentru a oferi suficientă experiență utilizatorului atunci când aplicația nu este instalată, trebuie să includeți schema URI în JavaScript la nivelul clientului, care poate fi executat într-un browser. Acest cod JS va fi găzduit pe serverul dvs. și veți trimite linkul utilizatorilor. Mai jos este un exemplu.

Codul va încerca să deschidă aplicația specificând schema URI ca sursă pentru iFrame, apoi va reveni în siguranță la magazinul Google Play dacă aplicația nu se încarcă.

Concluzie

Urma publicații ulterioare dedicat legăturilor directe în Android.

Legăturile directe în Android sunt foarte complexe, cazurile marginale apar la fiecare pas. S-ar putea să credeți că totul funcționează excelent, până când dintr-o dată un utilizator se plânge că nu deschide link-uri de pe Facebook în Android 4.4.4. De aceea, merită să folosiți programe precum Branch: puteți pur și simplu să uitați toate aceste dificultăți ca un vis urât și să vă obișnuiți cu faptul că link-urile funcționează întotdeauna.

postări asemănatoare

Sunt disponibile linkuri directe, linkuri universale, scheme URI/URL și linkuri pentru aplicații anul trecut toate aceste mecanisme au schimbat semnificativ modul în care conținutul este legat în aplicațiile mobile. Mulți dezvoltatori de aplicații nu au un clar...

În fiecare zi, la Branch lucrăm pentru a aduce procesul de conectare la platforme mobile la perfectiune. Link-urile noastre oferă acces la lucruri precum redirecționări inteligente, afișând utilizatorului...

Pentru a accesa orice resurse de rețea, trebuie să știți unde se află acestea și cum să le accesați. World Wide Web folosește o schemă standardizată de adresare și identificare, ținând cont de experiența de adresare și identificare a e-mailului, Gopher, WAIS, telnet, ftp etc. - URL, Uniform Resource Locator.

URI(Uniform Resource Identifier) (RFC 2396, august 1998) este un șir de caractere compact utilizat pentru a identifica o resursă abstractă sau fizică. O resursă este înțeleasă ca orice obiect care aparține unui anumit spațiu. Include și suprascrie adrese URL definite anterior (RFC 1738 / RFC 1808) și URN (RFC 2141, RFC 2611).

URI-ul este conceput pentru a identifica în mod unic orice resursă.

Unele subseturi de URI-uri:

URNĂ(Nume uniform al resursei) - Un URI privat „urn:” cu un subset al „spațiului de nume” care trebuie să fie unic și imuabil chiar și atunci când resursa nu mai există sau nu este disponibilă.

Se presupune că, de exemplu, browserul știe unde să caute această resursă.

Sintaxă:

urn: namespace: data1.data2, more-data, unde namespace definește modul în care sunt utilizate datele după al doilea „:”.

Exemplu de URN:

urnă: ISBN: 0-395-36341-6

ISBN - clasificator tematic pentru edituri

0-395-36341-6 - un număr specific al subiectului unei cărți sau reviste

La primirea URN-ului, programul client apelează la ISBN (directorul „Topical Classifier for Publishers” de pe Internet). Și primește o decriptare a numărului subiectului „0-395-36341-6” (de exemplu: „chimie cuantică”).

URN este utilizat pe scară largă în rețelele P2P (cum ar fi edonkey).

Exemplu de URN care indică o imagine de disc Adobe Photoshop v8.0 din rețeaua edonkey:

ed2k - indică rețeaua

Adobe Photoshop v8.0.iso - numele fișierului

940769280 - dimensiunea în octeți

- identificatorul fișierului (calculat folosind o funcție hash)

Localizator uniform de resurse URL:

Url(Uniform Resource Locator, RFC 1738) este un localizator unificat de resurse (locator), o modalitate standardizată de a înregistra adresa unei resurse pe WWW și pe Internet. URL-ul are o structură flexibilă și extensibilă pentru a indica locația resurselor în rețea cât mai natural posibil, care identifică o resursă după modul în care este accesată (de exemplu, „locația rețelei”) în loc să o identifice după nume sau alte atribute ale resursa respectivă.

Exemple de adrese URL:

http://www.ipm.kstu.ru/index.php

ftp://www.ipm.kstu.ru/

Un set limitat de caractere ASCII este folosit pentru a reprezenta adresa.

Forma generală adresele pot fi reprezentate astfel:

<схема>://<логин>:<пароль>@<хост>:<порт>/<полный-путь-к-ресурсу >

schema de acces la resurse: http, ftp, gopher, mailto, news, telnet, file, man, info, whatis, ldap, wais etc.

Parola de logare- numele de utilizator și parola utilizate pentru a accesa resursa

gazdă- numele de domeniu al gazdei sau adresa IP a acesteia.

Port- portul gazdă pentru conexiune

calea completă către resursă - clarificarea informațiilor despre locația resursei (depinde de protocol).

Exemple de adrese URL:

http://example.com # cerere pentru pagina de pornire implicită

http://www.example.com/site/map.html # solicitare o pagină dată v directorul specificat

http://example.com:81/script.php # conectați-vă la port non-standard

http://example.org/script.php?key=value # cerere cu transmiterea parametrilor către script

ftp: // utilizator: [email protected]# conectați-vă la serverul ftp cu autorizare

http://192.168.0.1/example/www # conectați prin adresă de rețea

fișier: ///srv/www/htdocs/index.html # deschide fișierul local

gopher: //example.com/1 # conectați-vă la serverul gopher

URL - Localizatorii uniformi de resurse descriu în mod explicit cum să ajungeți la un obiect.

Apariția URL-urilor este o inovație semnificativă pe Internet. Cu toate acestea, din momentul inventării sale și până în prezent, standardul URL are un dezavantaj serios - poate folosi doar un set limitat de caractere, chiar mai puțin decât în ASCII: litere latine, cifre și doar câteva semne de punctuație.

Dacă vrem să folosim caractere chirilice, sau hieroglife sau, să zicem, caractere specifice ale limbii franceze în URL, atunci caracterele de care avem nevoie trebuie să fie recodate într-un mod special.

Pe Wikipedia în limba rusă, vezi exemple în fiecare zi codificare URLîntrucât limba rusă folosește caractere chirilice. De exemplu, o linie ca aceasta:

http://ru.wikipedia.org/wiki/Microcredit

URL codificat ca:

http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0 % B8% D1% 82

Această conversie are loc în două etape: în primul rând, fiecare caracter chirilic este codificat în Unicode (UTF-8) într-o secvență de doi octeți, iar apoi fiecare octet al acestei secvențe este scris în notație hexazecimală:

M → D0 și 9C →% D0% 9C

și → D0 și B8 →% D0% B8

k → D0 și BA →% D0% BA

p → D1 și 80 →% D1% 80 etc.

Fiecare astfel de cod de octet hexazecimal este precedat de un semn de procente (%) conform specificației URL - de unde termenul englezesc „percent-encoding”, care denotă modul în care sunt codificate caracterele în URL-uri și URI.

Deoarece literele tuturor alfabetelor suferă o astfel de transformare, cu excepția latină de bază, atunci adresa URL cu cuvinte în marea majoritate a limbilor (cu excepția engleză, italiană, latină) poate deveni imposibil de citit pentru o persoană.

Toate acestea sunt în conflict cu principiul internaționalismului, proclamat de toate organizațiile de conducere de pe Internet, inclusiv W3C și ISOC. Această problemă este concepută pentru a rezolva standardul IRI (International Resource Identifier) - identificatori internaționali de resurse în care ar fi posibilă utilizarea caracterelor Unicode fără probleme și care, prin urmare, nu ar încălca drepturile altor limbi.

Alte scheme de adrese URL

Schema HTTP.

Schema specifică identificatorul său, adresa mașinii, portul TCP, calea în directorul serverului, variabilele și valorile acestora, eticheta.

Sintaxă:

http: // [ [:@][:][?]]

http - numele schemei

utilizator - nume de utilizator

gazdă - nume de gazdă

port - numărul portului

interogare (<имя-поля>=<значение>{&<имя-поля>=<значение>) - șir de interogare

Definit în RFC 2068. În mod implicit, port = 80.

Exemple:
http://ipm.kstu.ru/internet/index.php

Adresa IP poate fi folosită și ca adresă a mașinii:

http://195.208.44.20/internet/index.php

Dacă serverul HTTP rulează pe un alt port TCP decât 80, acest lucru se reflectă în adresa:

http://195.208.44.20:8080/internet/index.php

http://195.208.44.20/internet/index.php#metka1
Caracterul „#” separă numele documentului de numele etichetei.

Variabilele și valorile lor sunt transmise după cum urmează:
http://ipm.kstu.ru/internet/index.php?var1=value1&vard2=value2

Valorile „var1” și „var2” sunt nume de variabile, iar „valoare1” și „valoare2” sunt valorile acestora.

Schema FTP

Această schemă vă permite să abordați arhivele de fișiere FTP.

Sintaxă:

ftp: // [ [:@][:]

ftp - numele schemei

utilizator - nume de utilizator

parola - parola de utilizator

gazdă - nume de gazdă

port - numărul portului

url-path - calea către fișier și fișierul în sine

Definit în RFC 1738. Implicit, port = 21, utilizator = anonim, parolă = adresă de e-mail, dacă numele este specificat, dar parola nu este, atunci se solicită în dialog.

se pare ca:

//...//[; tip = ], Unde :

Exemple: ftp://ipm.kstu.ru/students/name/

Pentru a specifica un nume de utilizator și o parolă, trebuie să le scrieți astfel:
ftp: // nume: [email protected]: //ipm.kstu.ru/students/name/

În acest caz, acești parametri sunt separați de adresa mașinii prin simbolul „@” și unul de celălalt prin două puncte.

Schema MAILTO

Această schemă este destinată trimiterii de corespondență.

Sintaxă:

mailto: [ {,,...}][?]

mailto - numele schemei

e-mail-1 ( @) - prima adresă de e-mail

utilizator - nume de utilizator

gazdă - nume de gazdă

e-mail-2 - a doua adresă de e-mail

interogare (<имя-поля-заголовка>=<значение>{&<имя-поля-заголовка>=<значение>) - șir de interogare

mailto: [email protected]

În această schemă, câmpurile și valorile lor sunt transmise:

mailto: [email protected] subiect = Subject_Email & body = Text_which_will_be_inserted_in_the_mail

Adresa destinatarului poate fi scrisă și ca valoare a câmpului către:

mailto: [email protected] subiect = Subject_Email & body = Text_which_will_be_inserted_in_the_mail

Ce este HTTP?

Primul document (dar nu standardul) este RFC1945 (Hypertext Transfer Protocol - HTTP / 1.0 T. Berners-Lee, R. Fielding, H. Frystyk mai 1996)

Ultima versiune- RFC2616 (Protocol de transfer hipertext - HTTP / 1.1 R. Fielding, J. Gettys, J. Mogul, H. Frystyk, L. Masinter, P. Leach, T. Berners-Lee iunie 1999)

Hypertext Transfer Protocol - protocol de transfer hipertext, protocol nivel inalt(și anume stratul de aplicare). Folosit de serviciul WWW pentru a transfera pagini Web.

HTTP (HyperText Transfer Protocol, RFC 2616, versiunea actuală este HTTP / 1.1) este un protocol de transfer hipertext. Acest protocol a fost inițial destinat schimbului de documente hipertext, acum capabilitățile sale au fost extinse semnificativ (în special, a fost adăugat suport pentru streaming).

HTTP este un protocol tipic client-server; mesajele sunt schimbate conform schemei „cerere-răspuns” sub formă de comenzi ASCII. O caracteristică a protocolului HTTP este capacitatea de a specifica într-o cerere și într-un răspuns modul de reprezentare a aceleiași resurse prin diverși parametri: format, codificare, limbă etc. Se datorează posibilității de a specifica metoda de codificare a unui mesaj. că clientul și serverul pot face schimb de date binare, deși acest protocol este text.

HTTP este un protocol de nivel de aplicație, dar este folosit și ca „transport” pentru alte protocoale de aplicație precum SOAP, XML-RPC, WebDAV.

Protocolul HTTP definește o modalitate de interacțiune cerere-răspuns între un program client și un program server din interior Tehnologia mondială Wide Web.

Pentru a încărca o pagină web într-un browser client, acesta trimite o solicitare către un program special instalat pe computerul server, numit server http și procesează datele primite de la acesta. În acest caz, funcțiile browserului sunt de a solicita o anumită pagină de la server, de a o obține și de a o afișa pe ecranul utilizatorului. Serverul, pe de altă parte, acceptă cererea, caută documentul solicitat și oferă clientului fie conținutul fișierului găsit, fie un mesaj de eroare dacă un astfel de fișier nu a fost găsit sau accesul la acesta a fost refuzat dintr-un motiv oarecare. . Un punct important pentru a înțelege acest proces este că serverul http nu analizează conținutul documentului transmis. În linii mari, serverului http nu îi pasă ce este în fișierul solicitat, doar îl transferă în browser, iar toată munca de structurare și afișare a informațiilor primite este deja preluată.

Căutarea paginii solicitate se efectuează într-un director specific, care este alocat pe computerul server pentru acest site - un link către acest director este prezent în adresa introdusă de utilizator. În cazul în care apelul se face nu către un anumit document, ci către site în ansamblu, serverul http înlocuiește automat așa-numita „pagină de pornire” în locul numelui fișierului transferat, care se numește index. .htm sau index.html (în unele cazuri - implicit. htm sau default.html). Acest document trebuie să fie localizat în directorul rădăcină desemnat pentru găzduirea site-ului dvs. sau, dacă este specificat altfel, într-un director numit WWW. Toate celelalte fișiere pot fi plasate fie în același director, fie în subdirectoare, ceea ce este uneori convenabil, mai ales când site-ul conține mai multe secțiuni sau titluri tematice.

Pe lângă subfolderele pe care le creați, în care sunteți liber să plasați aproape orice conținut de care aveți nevoie, directorul serverului conține de obicei mai multe directoare care ar trebui menționate separat. În primul rând, acesta este folderul CGI-BIN în care se află scripturile CGI și alte scripturi rulate de pe site-ul dvs. aplicații interactive, precum și mai multe directoare de servicii necesare pentru munca normala Server. În etapa inițială, pur și simplu nu ar trebui să le acordați atenție. Uneori, în același director în care este stocat index.html există un rând fișiere suplimentare: not_found.html - documentul care este afișat în cazul în care serverul http nu a putut găsi fișierul solicitat de utilizator, forbidden.html - afișat ca mesaj de eroare dacă accesul la documentul solicitat este refuzat și, în final, robots.txt - fișierul , care descrie în mod specific regulile de indexare a site-ului dvs. de către motoarele de căutare.

În cele mai multe cazuri, și mai ales când publică o pagină de pornire pe servere care oferă găzduire gratuită, utilizatorilor li se interzice accesul la directoarele de servicii și la folderul CGI-BIN; modificarea conținutului fișierelor not_found și forbidden.html este, de asemenea, imposibilă. Acest lucru ar trebui să fie luat în considerare dacă intenționați să includeți în resursa dvs. orice conținut interactiv care necesită cel puțin capacitatea de a plasa fișiere într-unul dintre folderele de serviciu. În unele cazuri, vi se poate interzice crearea de directoare imbricate pe server, atunci utilizatorul va trebui să se mulțumească cu un singur director alocat nevoilor dumneavoastră.

Din tot ceea ce s-a spus, devine clar că browserul clientului poate primi și procesa informații de la server doar și le poate plasa și modifica doar dacă încărcarea fișierelor pe server este implementată pe baza protocolului HTTP folosind scripturi CGI speciale incluse. în interfața web a serverului. În toate celelalte cazuri, trebuie să utilizați așa-numitul server ftp, către care puteți transfera fișierele necesare folosind un software special, încărcându-le automat în directorul desemnat pentru site-ul dvs. În ambele cazuri, va trebui să vă cunoașteți numele de conectare și parola pentru a accesa sistemul. De asemenea, trebuie amintit că majoritatea programelor de server (în special, Apache pentru platformele compatibile UNIX) disting între litere mici și caz capital caractere, prin urmare toate numele fișierelor și extensiile lor trebuie scrise cu litere mici și întotdeauna în latină, pentru a evita erorile. Acesta din urmă se datorează diferențelor de procesare a codificărilor în limba rusă, tipice pentru anumite servere.

Lucrarea peste protocolul HTTP este după cum urmează: programul client stabilește o conexiune TCP cu serverul (numărul standard de port este 80) și îi emite o solicitare HTTP. Serverul procesează această solicitare și emite un răspuns HTTP către client.

Comunicarea dintre client și serverul Web se realizează prin schimbul de mesaje. Mesajele HTTP sunt împărțite în solicitări de la client la server și răspunsuri de la server la client.

Mesajele de solicitare și răspuns au un format comun. Ambele tipuri de mesaje arată astfel: mai întâi există o linie inițială (start-line), apoi, eventual, unul sau mai multe câmpuri de antet, numite și doar antete, apoi o linie goală (adică o linie formată din caracterele CR și LF), indicând sfârșitul câmpurilor de antet și apoi, eventual, corpul mesajului:

linia de start

câmpul antet 1

câmpul antet 2

câmpul antet N

Conținutul mesajului

Antetele protocolului HTTP

Formatul liniei inițiale a clientului și a serverului este diferit și va fi discutat mai jos. Există patru tipuri de titluri:

Anteturi generale (general-headers), care pot fi prezente atât în cerere, cât și în răspuns;

Anteturi de solicitare, care pot fi prezente doar într-o cerere;

Antete de răspuns, care pot fi prezente doar într-un răspuns;

Anteturile de entitate care se referă la corpul unui mesaj și descriu conținutul acestuia.

Fiecare titlu constă dintr-un titlu, două puncte „:” și o valoare. Cele mai importante rubrici sunt prezentate în Tabelul 1.

tabelul 1

Antetele protocolului HTTP

Titlu	Programare
Anteturile obiectelor
Permite	Enumeră metodele acceptate de server
Codificarea conținutului	Modul în care este codificat corpul mesajului, de exemplu pentru a reduce dimensiunea
Conținut-Lungime	Lungimea mesajului în octeți
Tipul de conținut	Conține desemnarea tipului de conținut MIME a răspunsului. În funcție de valoarea Content-Type, browserul interpretează răspunsul ca o pagină HTML, o imagine gif sau jpeg, un fișier care urmează să fie salvat pe disc sau altceva și ia măsurile corespunzătoare. Unele tipuri de conținut: text / html - text HTML (pagină web); text / simplu - text simplu (similar cu „Notepad”); imagine / jpeg - imagine în format JPEG; imagine / gif - la fel, în format GIF; De asemenea, poate trece codificarea datelor text. De exemplu: set de caractere = windows-1251 set de caractere = koi8-rus Lungimea conținutului - lungimea conținutului răspunsului în octeți (dimensiunea fișierului). Ultima modificare - data și ora la care documentul a fost modificat ultima dată.
ETag	O etichetă unică de resurse pe server care vă permite să comparați resurse
Expiră	Data și ora la care va fi modificată resursa de pe server și trebuie să fie preluată din nou
Modificat ultima dată	Data și ora ultimei modificări a conținutului
Antete de răspuns
Vârstă	Numărul de secunde după care să reîncercați solicitarea pentru a obține conținut nou
Locație	URI-ul resursei de consultat pentru a obține conținutul
Reîncercați-După	Data și ora sau numărul de secunde după care solicitarea trebuie repetată pentru a primi un răspuns cu succes
Server	Numele software-ului server care a răspuns
Antete de solicitare
Accept	O listă de tipuri de conținut acceptate de browser în ordinea preferințelor pentru acest browser, de exemplu: Accept: imagine / gif, imagine / x-xbitmap, imagine / jpeg, image / pjpeg, application / vnd.ms-excel, application / msword, application / vnd. ms-powerpoint, * / * Acest lucru este evident necesar pentru cazul în care serverul poate servi același document în formate diferite. Valoarea acestui parametru este folosită în principal de scripturile CGI pentru a genera un răspuns adaptat pentru un anumit browser.
Accept-Charset	Codificări de caractere în care clientul poate accepta conținut text
Acceptare-Codare	Modul în care serverul poate codifica mesajul
Gazdă	Numărul gazdei și portului de la care se solicită documentul
Dacă-Modificat-Încă Dacă-Se potrivește Dacă-Niciunul-Se potrivește Dacă-Range Dacă-Nemodificat-Dincă	Antete de solicitare pentru acces condiționat la resurse
Gamă	Solicitați o parte dintr-un document
Agent utilizator	Nume software client - valoarea este „numele de cod” al browserului, de exemplu: Mozilla / 4.0 (compatibil; MSIE 5.0; Windows 95; DigExt)
Anteturi generale
Conexiune	Conexiune - poate fi Keep-Alive și aproape. Keep-Alive înseamnă că după emiterea acestui document, conexiunea la server nu este întreruptă și pot fi emise mai multe solicitări. Majoritatea browserelor funcționează în modul Keep-Alive, deoarece vă permite să „descărcați” o pagină html și imagini într-o singură conexiune la server. Odată setat, modul Keep-Alive este menținut până la prima eroare sau până când este indicat în mod explicit în următoarea solicitare Connection: close. close - conexiunea este închisă după ce răspunde la această solicitare.
Data	Data și ora formării mesajului
Pragma	Comenzi specifice implementării pentru conținutul transferat
Transfer-Codare	Metoda de codificare a mesajelor pentru transmitere

În unele anteturi, valoarea este data și ora. Acestea trebuie să fie în formatul descris în RFC 1123, de exemplu:

Corpul mesajului conține informațiile reale care sunt transmise - sarcina utilă a mesajului. Corpul mesajului este o secvență de octeți (octeți). Corpul mesajului poate fi codificat, cu codificarea specificată în antetul obiectului Content-Encoding.

Un mesaj de solicitare de la client la server constă dintr-o linie de solicitare, anteturi (general, cerere, obiect) și, eventual, un corp de mesaj.

Linia de solicitare începe cu o metodă, urmată de identificatorul resursei solicitate, versiunea protocolului și caracterele de final de linie:

<Метод> <Идентификатор> <Версия HTTP>

Metodă specifică metoda de aplicat resursei solicitate. De exemplu, metoda GET spune că clientul dorește să obțină conținutul resursei. Identificatorul identifică resursa solicitată. Versiunea HTTP este indicată printr-o linie ca aceasta:

HTTP /<версия>.<подверсия>

Metode de protocol HTTP

Să ne uităm la principalele metode ale protocolului HTTP.

Metoda OPȚIUNI solicită informații despre opțiunile de conectare (de exemplu, metode, tipuri de documente, codificări) pe care serverul le acceptă pentru resursa solicitată. Această metodă permite clientului să definească opțiuni și/sau cerințe asociate cu resursa, sau capabilitățile serverului, fără a întreprinde nicio acțiune asupra resursei sau a iniția o descărcare.

Dacă răspunsul serverului nu este un mesaj de eroare, atunci anteturile obiectelor conțin informații care pot fi considerate opțiuni de conexiune. De exemplu, antetul Allow listează toate metodele acceptate de server pentru o anumită resursă.

Dacă identificatorul resursei solicitate este un asterisc ("*"), atunci cererea OPȚIUNI este destinată să se adreseze serverului în ansamblu.

Dacă identificatorul resursei solicitate nu este un asterisc, atunci solicitarea OPȚIUNI se aplică opțiunilor disponibile la conectarea la resursa specificată.

Metoda GET vă permite să obțineți orice informație legată de resursa solicitată. În cele mai multe cazuri, dacă ID-ul resursei solicitate indică un document (de exemplu, Document text, imagine grafică, video), apoi serverul returnează conținutul acestui document (conținutul fișierului). Dacă resursa solicitată este o aplicație (program) care generează date, atunci datele generate sunt returnate în corpul mesajului de răspuns, și nu o imagine binară a fișierului executabil. Acesta este folosit, de exemplu, la crearea aplicațiilor CGI. Dacă identificatorul resursei solicitate indică către un director (director, folder), atunci, în funcție de setările serverului, fie conținutul directorului (lista de fișiere), fie conținutul unuia dintre fișierele aflate în acest director (de obicei index.html sau Default.htm). În acest din urmă caz, numele folderului poate fi specificat fie cu simbolul „/” la sfârșit, fie fără acesta. Dacă acest simbol este absent la sfârșitul identificatorului, serverul emite unul dintre răspunsuri cu redirecționare (cu codurile de stare 301 sau 302).

Distingeți între „GET condiționat”, în care mesajul de solicitare include anteturile cererii If-Modified-Since, If-Unmodified-Since, If-Match, If-None-Match sau If-Range. Metoda GET condiționată solicită transferul unui obiect numai dacă îndeplinește condițiile descrise în anteturile date. Metoda GET condiționată este concepută pentru a reduce încărcarea inutilă a rețelei, deoarece vă permite să nu descărcați a doua oară datele deja salvate de client.

Se face, de asemenea, o distincție între „GET parțial”, în care mesajul de solicitare include un antet de cerere Range. Un GET parțial solicită transferul doar a unei părți a obiectului. Metoda GET parțială este concepută pentru a reduce încărcarea inutilă a rețelei, solicitând doar o parte a obiectului când cealaltă parte a fost deja descărcată de client. Valoarea antetului Range este intervalul de octeți de primiți. Octeții sunt numerotați începând de la 0. Octeții de început și de sfârșit ai intervalului sunt separați printr-un caracter „-”. Dacă trebuie să obțineți mai multe intervale, acestea sunt listate separate prin virgule.

Metoda HEAD este identică cu GET, cu excepția faptului că serverul nu returnează corpul mesajului în răspuns. Metainformațiile conținute în anteturile HTTP ale răspunsului la o solicitare HEAD sunt identice cu informațiile furnizate în răspunsul la o solicitare GET. Această metodă poate fi folosită pentru a obține informații despre obiectul de solicitare fără a redirecționa direct corpul obiectului. Metoda HEAD este adesea folosită pentru a testa legăturile hipertext.

Pentru o cerere se folosește metoda POST, în care serverul adresat primește datele incluse în corpul mesajului (obiectul) cererii și le trimite spre procesare către aplicația specificată ca resursă solicitată. POST este conceput pentru a oferi o metodă generică de implementare următoarele funcții:

Adnotarea resurselor existente;

Postarea unui mesaj pe un buletin electronic (BBS), grupuri de știri, liste de corespondență sau un grup similar de articole;

Trecerea unui bloc de date, cum ar fi rezultatul unei intrări într-un formular, unui proces de procesare;

Executarea de interogări către baze de date (DB);

De fapt, funcția îndeplinită de metoda POST este determinată de aplicația indicată de ID-ul resursei solicitate. Alături de metoda GET, metoda POST este utilizată la construirea aplicațiilor CGI. Browserul poate forma cereri cu metoda POST la trimiterea formularelor. Pentru aceasta, elementul FORM document HTML care conține formularul trebuie să aibă un atribut METHOD cu o valoare POST.

O acțiune POST poate efectua o acțiune pe server și nu transmite niciun conținut ca rezultat. În acest caz, în funcție de faptul dacă răspunsul include un corp de mesaj care descrie rezultatul sau nu, codul de stare din răspuns poate fi fie 200 (OK) fie 204 (Fără conținut).

Dacă resursa a fost creată pe server, răspunsul conține un cod de stare 201 (Creat) și include antetul de răspuns Locație.

Corpul mesajului, care este transmis într-o cerere cu metoda PUT, este salvat pe server, iar identificatorul resursei solicitate va fi identificatorul documentului salvat. Dacă identificatorul resursei solicitate indică o resursă deja existentă, atunci obiectul inclus în corpul mesajului este considerat ca versiune modificată resursă aflată pe server. Dacă este creată o nouă resursă, atunci serverul informează agentul utilizator despre aceasta cu un răspuns cu un cod de stare 201 (Creat).

Diferența fundamentală dintre metodele POST și PUT este semnificația diferită a ID-ului resursei solicitate. URI-ul din cererea POST identifică resursa care se ocupă de obiectul inclus în corpul mesajului. Această resursă poate fi o aplicație care primește date. În contrast, URI-ul dintr-o cerere PUT identifică obiectul inclus în cerere ca corp de mesaj, adică agentul utilizator atribuie URI-ul dat resursei incluse.

Metoda DELETE cere serverului să șteargă o resursă care are identificatorul solicitat. O solicitare cu această metodă poate fi respinsă de server dacă utilizatorul nu are permisiunea de a șterge resursa solicitată.

Metoda TRACE este utilizată pentru a returna cererea trimisă la nivel de protocol HTTP. Receptorul cererii (server web) trimite mesajul primit înapoi către client ca corpul unui obiect de răspuns cu un cod de stare 200 (OK). O solicitare TRACE nu trebuie să conțină un corp de mesaj.

TRACE permite clientului să vadă ce primește serverul la celălalt capăt și să folosească acele date pentru testare sau diagnosticare.

Dacă solicitarea are succes, atunci răspunsul conține întregul mesaj de solicitare în corpul mesajului de răspuns, iar antetul obiectului Content-Type este „message / http”.

Codurile de răspuns

După primirea și interpretarea mesajului de solicitare, serverul răspunde cu un mesaj de răspuns HTTP.

Prima linie a răspunsului este linia de stare. Acesta constă dintr-o versiune a protocolului, un cod de stare numeric, o frază explicativă, separate prin spații și caractere de final de linie:

<Версия HTTP> <Код состояния> <Поясняющая фраза>

Versiunea de protocol are aceeași semnificație ca și în cerere.

Elementul Status-Code este un cod întreg din trei cifre (trei cifre) al rezultatului înțelegerii și satisfacerii cererii. Reason-Phrase este o scurtă descriere textuală a codului de stare. Codul de stare este pentru procesarea software-ului, iar fraza explicativă este pentru utilizatori.

Prima cifră a codului de stare identifică clasa răspunsului. Ultimele două cifre nu au un rol specific în clasificare. Există 5 valori pentru prima cifră:

1xx: Coduri de informații - cerere primită, procesarea continuă.

2xx: Coduri de succes - Acțiunea a fost primită, înțeleasă și procesată cu succes.

3xx: Coduri de redirecționare - Trebuie luate măsuri suplimentare pentru a finaliza solicitarea.

4xx: coduri de eroare client - Solicitarea are o eroare de sintaxă sau nu a putut fi finalizată.

5xx: coduri de eroare server - serverul nu poate îndeplini o solicitare validă.

Expresiile de motiv pentru fiecare cod de stare sunt listate în RFC 2068 și sunt recomandate, dar pot fi înlocuite cu echivalente fără a afecta protocolul. De exemplu, în versiunile localizate în limba rusă ale serverelor HTTP, aceste expresii sunt înlocuite cu cele rusești. Tabelul 2 listează codurile de răspuns ale serverului HTTP.

masa 2

Codurile de răspuns ale serverului HTTP

Codul	Expresie explicativă conform RFC 2068	Expresie explicativă echivalentă în rusă
1xx: coduri de informații
	Continua	Continua
2xx: coduri de succes
	O.K	O.K
	Creată	Creat de
	Fara continut	Fara continut
	Resetați conținutul	Resetați conținutul
	Conținut parțial	Conținut parțial
3xx: coduri de redirecționare
	Mutat temporar	Mutat temporar
	Nemodificat	Nemodificat
4xx: coduri de eroare client
	Cerere greșită	Cerere coruptă
	Neautorizat	Neautorizat
	Nu a fost gasit	Nu a fost gasit
	metoda nepermisa	Metoda nu este permisă
	Solicitare Timeout	Cererea a expirat
	Conflict	Conflict
	Lungimea necesară	Lungimea necesară
	Entitatea solicitată este prea mare	Obiectul de solicitare este prea mare
5xx: coduri de eroare ale serverului
	Internal Server Error	Internal Server Error
	Neimplementat	Neimplementat
	Serviciu Indisponibil	Serviciul nu este disponibil
	Versiunea HTTP nu este acceptată	Versiune HTTP neacceptată

Bara de stare este urmată de anteturi (general, răspuns și obiect) și eventual corpul mesajului.

Unul dintre funcții esențiale server web este de a oferi acces la o parte a localului Sistemul de fișiere... Pentru a face acest lucru, în setările serverului este specificat un anumit director, care este rădăcina pentru acest server. Pentru a publica un document, adică pentru a-l pune la dispoziția utilizatorilor care au „vizitat” acest server (a făcut o conexiune cu acesta prin protocolul HTTP), trebuie să copiați acest document în directorul rădăcină Server web sau unul dintre subdirectoarele acestuia. La conectarea prin protocolul HTTP, pe server este creat un proces cu drepturi de utilizator, care, de regulă, nu există în realitate, ci este creat special pentru a vizualiza resursele serverului. Configurarea drepturilor și permisiunilor utilizator dat puteți controla accesul la resursele Web.

Să ne uităm la cel mai simplu exemplu de solicitare HTTP. Dacă introducem adresa http://yandex.ru în fereastra de adrese a browserului, atunci browserul va determina adresa IP a serverului yandex.ru și îi va trimite următoarea solicitare HTTP pe portul 80:

GET http://yandex.ru/ HTTP / 1.0

Accept: imagine / gif, imagine / x-xbitmap, imagine / jpeg, imagine / pjpeg, aplicație / vnd.ms-excel, aplicație / msword, aplicație / vnd.ms-powerpoint, * / *

Accept-Limba: ru

Cookie: yandexuid = 2464977781018373381

User-Agent: Mozilla / 4.0 (compatibil; MSIE 5.5; Windows 98)
Gazdă: yandex.ru

Referer: narod.ru

Conexiune proxy: Keep-Alive

Solicitarea este trimisă necriptată forma text... Cel mai parte principală cererea este situată în prima linie: Acesta este tipul cererii (GET), adresa URL a documentului solicitat (http://yandex.ru) și versiunea protocolului HTTP (HTTP / 1.0). Următorii sunt parametrii de solicitare. Fiecare linie corespunde unui parametru. Linia începe cu numele parametrului, urmat de două puncte și valoarea parametrului.

Accept este tipul de date pe care browserul le poate accepta (codat MIME).

Accept-Language este limba preferată în care browserul dorește să accepte date. User-Agent - tipul de program care a trimis solicitarea.

Gazdă - numele DNS (sau IP) al gazdei căreia îi este adresată cererea.

Cookie - cookie-uri (date care au fost salvate de server pe discul local al clientului când a vizitat ultima dată această gazdă).

Referer - gazda de pe pagina căreia trimitem solicitarea. Deci, de exemplu, dacă ne aflăm pe pagina http://narod.ru și facem clic pe linkul http: //yandex.ru acolo, atunci cererea va fi trimisă gazdei yandex.ru și câmpul de solicitare referitor va conține numele de gazdă al narod.ru.

Setul de parametri de interogare nu este fix. Pe lângă cei de mai sus, pot exista și alți parametri.

Cei mai interesanți parametri sunt referer și cookie. Acești parametri sunt utilizați în principal pentru autentificarea utilizatorului pe server.

cerere GET poate conține date transmise de client către server. Acestea sunt transmise direct prin URL folosind protocolul CGI. Datele sunt separate de adresa URL printr-un „?” și sunt conectate cu semnul „&”:

OBȚINE ?<параметр 1>=<значение 1>&<параметр 2>=<значение 2>&…

Acest tip de transfer de date către server este convenabil, dar are limitări ale volumului. Cantități prea mari de date nu pot fi transferate prin adresa URL. În astfel de scopuri, există un alt tip de solicitare: o cerere POST. O solicitare POST este foarte asemănătoare cu o solicitare GET, cu singura diferență că datele din cererea POST sunt transmise separat de antetul cererii în sine:

Corpul cererii trebuie separat de antet printr-o linie goală. Dacă serverul întâlnește un șir gol într-o solicitare POST, atunci tot ceea ce urmează are în vedere corpul cererii (date transmise). Rețineți următoarele: formatul datelor din corpul solicitării POST este arbitrar. Deși formatul CGI este cel mai frecvent utilizat, nu este necesar. În plus, o solicitare POST nu necesită un corp de solicitare și poate, de asemenea, transfera date printr-o adresă URL.

Pe lângă formatul CGI, uneori așa-numitul. format multipart (formatul datelor transmise este determinat de parametrul Content-Type):

Browsere moderne conțin instrumente pentru dezvoltatorii web pentru a obține câteva informații despre solicitările de postare trimise. Dacă trebuie să vă uitați la antetele doar pentru câteva solicitări, utilizarea acestora va fi mai ușoară și mai rapidă decât alte metode.

Dacă utilizați Firefox, puteți utiliza consola sa web. Afișează anteturile cererii și conținutul celor transmise cookie-uri... Pentru a-l lansa, deschideți meniul browserului, faceți clic pe elementul „Web Development” și selectați „Web Console”. În panoul care apare, activați butonul „Rețea”. Introduceți numele metodei - postați în câmpul de filtrare. În funcție de obiectivele dvs., faceți clic pe butonul de trimitere a formularului cerere solicitată sau reîmprospătați pagina. Consola afișează cererea trimisă. Faceți clic pe el cu mouse-ul pentru a vedea mai multe detalii.

Browserul Google Chrome are instrumente puternice depanare. Pentru a le folosi, faceți clic pe pictograma cu imaginea unei chei, apoi deschideți elementul „Setări și management google Crom ". Selectați „Instrumente” și lansați „Instrumente pentru dezvoltatori”. În bara de instrumente, selectați fila Rețea și trimiteți solicitarea. Găsiți cererea necesară în listă și faceți clic pe ea pentru a studia detaliile.

V browser Opera există instrumente de dezvoltare încorporate pentru Opera Dragonfly. Pentru a le lansa, faceți clic dreapta pe pagina dorită și selectați elementul meniul contextual"Inspectează elementul". Accesați fila Rețea Instrumente pentru dezvoltatori și trimiteți solicitarea dvs. Găsiți-l în listă și extindeți-l pentru a examina antetele serverului și răspunsurile.

Internet Explorer 9 conține un kit numit F12 Developer Tools care oferă informatii detaliate la cererile îndeplinite. Acestea sunt pornite prin apăsarea butonului F12 sau folosind meniul „Service” care conține articolul cu același nume. Pentru a vizualiza cererea, accesați fila „Rețea”. Găsiți interogarea dată în rezumat și faceți dublu clic pentru a extinde detaliile.

Browsere Chromeși Internet Explorer 9 conțin instrumente încorporate care vă permit să examinați o solicitare de post trimisă în detaliu. Pentru detalii complete, folosește-le sau Firefox cu plugin instalat Firebug. Este foarte util pentru examinarea frecventă a interogărilor, de exemplu, la depanarea site-urilor.

Dacă doriți să vedeți o solicitare trimisă de un alt program decât un browser, utilizați depanatorul HTTP Fiddler. Funcționează ca un server proxy și interceptează cererile de la orice program și oferă, de asemenea, informații foarte detaliate despre anteturile și conținutul acestora.

URI (Identificator uniform de resurse) este un identificator de resursă unificat (uniform). URI este un șir de caractere care vă permite să identificați orice resursă: document, imagine, fișier, serviciu, căsuță de e-mail etc. În primul rând, vorbim, desigur, despre resursele Internetului și ale World Wide Web-ului . Un URI oferă o modalitate simplă și extensibilă de a identifica resursele. Extensibilitatea URI înseamnă că mai multe scheme de identificare există deja într-un URI și mai multe vor fi create în viitor.

Relația dintre URI, URL și URN

Diagrama Venn care arată subseturile schemei URI: URL și URN.

URI-ul este fie un URL, un URN sau ambele.

Un URL este un URI care, pe lângă identificarea unei resurse, oferă și informații despre locația acelei resurse.
Un URN este un URI care identifică doar o resursă într-un anumit spațiu de nume (respectiv, într-un context specific), dar nu indică locația acesteia. De exemplu, urna URN: ISBN: 0-395-36341-1 este un URI care indică o resursă (carte) 0-395-36341-1 în spațiul de nume ISBN, dar spre deosebire de o adresă URL, URN-ul nu indică locația acestei resurse: în nu se spune in ce magazin poate fi cumparat sau pe ce site sa il descarci.

Deoarece URI-ul nu indică întotdeauna cum se obține o resursă, spre deosebire de o adresă URL, ci doar o identifică, acest lucru face posibilă descrierea resurselor folosind RDF (Resource Description Framework) care nu pot fi obținute prin Internet (de exemplu, o persoană, o mașină, oraș etc.).

Poveste

În 1990, la Geneva, Elveția, în interiorul zidurilor Consiliului European pentru Cercetare Nucleară, savantul britanic Tim Berners-Lee a inventat URL-ul de localizare a locației resurselor. Deoarece URL-ul este cel mai frecvent utilizat subset de URI, 1990 este considerat a fi anul nașterii URI-urilor. Dar, strict vorbind, conceptul de URI a fost documentat abia în iunie 1994 în RFC 1630.

Noua versiune a URI a fost definită în 1998 în RFC 2396, în același timp cuvântul universalîn titlu a fost schimbat în Uniformă.

Defecte

URL-ul a fost o inovație fundamentală pe Internet, așa că principiile URI au fost documentate pentru a asigura compatibilitatea deplină a URL-ului. De aici provine marele dezavantaj al URI-urilor, moștenirea de la URL-uri. Într-un URI, ca și într-un URL, poate fi folosit doar un set limitat de caractere latine și semne de punctuație (chiar mai puțin decât în ASCII). Cu alte cuvinte, dacă dorim să folosim caractere chirilice, sau hieroglife, sau, să zicem, caractere franceze specifice, în URI, va trebui să codificăm URI-ul în același mod în care Wikipedia codifică URL-urile cu caractere Unicode. De exemplu, o linie ca aceasta:

https://ru.wikipedia.org/wiki/Cyrillic

URL codificat ca:

https://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0%B0

Deoarece literele tuturor alfabetelor sunt supuse unei astfel de transformări, cu excepția celei utilizate în limba engleză Literele latine, apoi URI-urile cu cuvinte în alte limbi (chiar și europene) își pierd capacitatea de a fi percepute de oameni. Și acest lucru este în contradicție gravă cu principiul internaționalismului, proclamat de toate organizațiile de conducere ale Internetului, inclusiv W3C și ISOC. Această problemă este destinată a fi rezolvată prin standardul IRI (ing. Identificator de resurse internaționalizate) - identificatori internaționali de resurse în care ar fi posibilă utilizarea fără probleme a caracterelor Unicode și care nu ar încălca drepturile altor limbi. La fel, creatorul URI-ului, Tim Berners-Lee, a spus că sistemul de nume de domenii care stă la baza URL-urilor este o decizie proastă, impunând resurselor o arhitectură ierarhică care nu este potrivită pentru web-ul hipertext.

Structura URI

URI = [schema ":"] ierarhic - partea [ "?" cerere] [fragment „#”]

În această intrare:

Sistem

schema de accesare a unei resurse (indică adesea un protocol de rețea), de exemplu, http, ftp, fișier, ldap, mailto, urn

Partea ierarhică

conține date, de obicei organizate într-o formă ierarhică, care, atunci când sunt combinate cu date într-o componentă neierarhică Anchetă, servesc la identificarea resursei în domeniul de aplicare al schemei URI. De obicei ierarhic-parte conține calea către resursă (și, eventual, în fața acesteia, adresa serverului pe care se află) sau identificatorul resursei (în cazul URN).

Anchetă

această componentă URI opțională este descrisă mai sus.

Fragment

(de asemenea, o componentă opțională)

Vă permite să identificați indirect o resursă secundară prin referirea la resursa primară și prin specificarea informațiilor suplimentare. O resursă secundară identificabilă poate fi o parte sau un subset al resursei primare, o reprezentare a acesteia sau o altă resursă definită sau descrisă de o astfel de resursă.

Analizarea structurii URI-ului. Pentru așa-numita „parsare” a URI-urilor (ing. analizare), adică pentru a descompune URI-urile în părțile lor constitutive și identificarea lor ulterioară, este cel mai convenabil să folosiți sistemul de expresii regulate, care este acum disponibil în aproape toate limbajele de programare moderne. Următorul model este recomandat pentru analizarea URI-urilor în RFC 3986:

Acest model include 9 grupuri indicate mai sus prin numere (pentru mai multe informații despre modele și grupuri, consultați Expresii regulate), care analizează cel mai complet și mai precis o structură URI tipică, unde:

grupa 2 - schema,
grupa 4 - sursa,
grupa 5 - cale,
grupa 7 - cerere,
grupa 9 - fragment.

Astfel, dacă se utilizează a acestui șablon analizați, de exemplu, un URI tipic ca acesta:

http://www.ics.uci.edu/pub/ietf/uri/#Related

atunci cele 9 grupuri de șabloane de mai sus vor da următoarele rezultate:

http:
//www.ics.uci.edu
www.ics.uci.edu
/ pub / ietf / uri /
nici un rezultat
nici un rezultat
#Legate de
Legate de

Exemple de URI-uri:

URI absolute

https://ru.wikipedia.org/wiki/URI
ftp://ftp.is.co.za/rfc/rfc1808.txt
fișier: // C: \ UserName.HostName \ Projects \ Wikipedia_Articles \ URI.xml
fișier: /// C: /file.wsdl
fișier: ///Users/John/Documents/Projects/Web/MyWebsite/about.html
ldap: /// c = GB? objectClass? unu
mailto: [email protected]
înghiţitură: [email protected]
știri: comp.infosystems.www.servers.unix
date: text / simplu; set de caractere = iso-8859-7,% be% be% be
tel: + 1-816-555-1212
telnet: //192.0.2.16: 80 /
urnă: oază: nume: specificație: docbook: dtd: xml: 4.1.2

2) URI-uri relative

/relative/URI/with/absolute/path/to/resource.txt
//example.org/scheme-relative/URI/with/absolute/path/to/resource.txt
relativ / cale / către / resource.txt
../../../resource.txt
resource.txt
/resource.txt#frag01
# frag01

[șir gol] - este echivalent cu analizarea identificatorului de către parser cu rezultatul [șir gol], adică linkul duce la obiectul implicit din schema implicită

serviciu DNS

DNS înseamnă Domain Name System. Numele de domenii DNS sunt sinonime pentru adrese IP, la fel cum numele din agenda telefonului dvs. sunt sinonime numere de telefon... Sunt simbolice, nu numerice; sunt mai convenabile pentru memorare și orientare; ele poartă o încărcătură semantică. www.irnet.ru → Tabelele DNS → 193.232.70.36 Numele de domenii sunt, de asemenea, unice, adică. nu există două nume de domenii identice în lume. Numele de domenii, spre deosebire de adresele IP, sunt opționale, sunt achiziționate suplimentar.

Orez. 2. Ierarhia în DNS.

Adresele care sunt indicate pe plicuri la livrarea scrisorilor sunt, de asemenea, unice. prin poștă obișnuită... Nu există țări în lume cu aceleași nume. Și dacă numele orașelor se repetă uneori, atunci în combinație cu împărțirea în unități administrative mai mari, cum ar fi districtele și regiunile, ele devin unice. Și numele străzilor nu trebuie repetate în același oraș. Astfel, adresa, pe baza denumirilor geografice și administrative, identifică în mod unic destinația. Domeniile au o ierarhie similară. Numele de domenii sunt separate unele de altele prin puncte: lingvo.yandex.ru, krkime.com.

DNS are următoarele caracteristici:

Administrare distribuită... Diferite persoane sau organizații sunt responsabile pentru diferite părți ale ierarhiei.
Distribuirea stocării informațiilor... Fiecare nod al rețelei trebuie să stocheze în mod necesar doar datele care sunt incluse în el zona de responsabilitate, și (eventual) adrese servere DNS root.
Memorarea în cache a informațiilor... Nod poate stocați unele date în afara zonei lor de responsabilitate pentru a reduce sarcina în rețea.
Structura ierarhica , în care toate nodurile sunt combinate într-un arbore și fiecare nod poate determina fie în mod independent activitatea nodurilor de nivel inferior, fie delega(transferă-le) în alte noduri.
Rezervare... Pentru stocarea și întreținerea nodurilor (zonelor) acestora sunt (de obicei) mai multe servere, separate atât fizic, cât și logic, ceea ce asigură siguranța datelor și continuarea lucrului chiar și în cazul unei defecțiuni a unuia dintre noduri.

Niveluri de domeniu. Există trei niveluri de domenii.

Domenii mai întâi sau nivel superior sunt împărțite în două grupe:

1) Acestea sunt domenii cu afiliere teritorială, de exemplu: .ru .by .ua .de .us etc. Adică acestea sunt domenii care sunt alocate unei anumite țări. Prin intermediul acestora, puteți, de exemplu, să determinați cărei țări îi aparține un anumit site.

2) Al doilea grup de domenii de prim nivel sunt domenii cu un anumit scop. De exemplu: .com - pentru organizații comerciale, .info - pentru site-uri informaționale, .tv - pentru companii de televiziune etc. Aceste domenii pot fi folosite pentru a determina focalizarea specifică a site-ului. Deși, în adevăr, în În ultima vreme sunt din ce în ce mai folosiți pentru orice își doresc și adesea nu se țin de scopul lor.

Domeniile de primul nivel nu pot fi folosite ca adresă a site-ului dvs. Acestea servesc la crearea de domenii al doilea nivel , prin urmare, pe oricare dintre domeniile de nivel întâi, puteți înregistra un domeniu de nivel al doilea. Domeniul de nivel al doilea este format din următoarele elemente: www.site_name.domeniu de prim nivel. De exemplu: www.webmastermix.ru. Este recomandat să folosiți nume de domenii de nivel al doilea pentru adresa site-ului. Ele sunt cel mai bine citite și amintite de oameni, precum și percepute motoare de căutare... Prin urmare, majoritatea site-urilor au nume de domenii la acest nivel.

În plus, există domenii al treilea nivel ... Sunt create pe baza domeniilor de nivel al doilea. Domeniul de nivel al treilea arată astfel: www.forum.webmastermix.ru. După ce ați înregistrat un domeniu de nivel al doilea, puteți crea în mod independent pe baza acestuia câte domenii de nivel al treilea doriți. Puteți înregistra un nume de domeniu pentru site-ul dvs. folosind servicii speciale.

TEHNOLOGII WEB: HTML, JAVASCRIPT

Prima parte a blocului didactic al temei de mai sus a fost dedicată tehnologiilor Internet. Acum începem să studiem tehnologiile utilizate în World Wide Web sau tehnologiile web.

În primul rând, trebuie să înțelegeți conceptele de bază ale tehnologiilor web: site web și pagină web. O pagină web este unitatea logică minimă a World Wide Web, care este un document care este identificat în mod unic printr-o adresă URL unică. Un site web este o colecție de pagini web legate tematic, situate pe același server și deținute de același proprietar. Într-un caz particular, un site web poate fi reprezentat de o singură pagină web. World Wide Web este colecția tuturor site-urilor web.

Baza întregului World Wide Web este limbajul de marcare hipertext HTML - Hyper Text Markup Language (Fig. 3). Servește pentru marcarea logică (semantică) a unui document (pagină web). Uneori, este folosit necorespunzător pentru a controla modul în care conținutul paginilor web este afișat pe un ecran de monitor sau atunci când iese către o imprimantă, ceea ce contrazice fundamental ideologia adoptată pe World Wide Web.

Orez. 3. Tehnologii web

Foile de stil în cascadă (CSS) au scopul de a controla afișarea conținutului pe paginile web. CSS este similar în multe privințe cu stilurile folosite în populare procesor de cuvinte Cuvânt.

Limbajele de scripting sunt folosite pentru a adăuga dinamism paginilor web (meniuri derulante, animație). Limbajul standard de scripting de pe World Wide Web este JavaScript. Nucleul JavaScript este ECMAScript.

HTML, CSS, JavaScript sunt limbi cu care puteți crea orice site web complex. Dar acesta este doar suport lingvistic, în timp ce în browsere documentele sunt reprezentate ca o colecție de obiecte, multe dintre acestea fiind modelul de obiect al browserului (BOM). Modelul obiect al browserului este unic pentru fiecare model și, prin urmare, apar probleme la construirea aplicațiilor între browsere. Prin urmare, Web Consortium a propus Document Object Model (DOM), care este modalitatea standard de reprezentare a paginilor web folosind o colecție de obiecte.

Sintaxa HTML modern este descrisă folosind Extensible Markup Language. XML vă va permite să vă creați propriile limbaje de marcare similare cu HTML sub formă de DTD. Există multe astfel de limbaje: pentru reprezentarea formulelor matematice și chimice, cunoștințe etc.

După cum puteți vedea din cele de mai sus, toate tehnologiile web sunt strâns interconectate. Înțelegerea acestui fapt va facilita înțelegerea scopului unui anumit mecanism utilizat pentru a crea aplicații web.

E-MAIL

Poșta electronică (e-mail, e-mail, din engleza poștă electronică) este o tehnologie și serviciile pe care le oferă pentru trimiterea și primirea mesajelor electronice (numite „scrisori” sau „ e-mailuri") Distribuit rețea de calculatoare... Principala diferență față de alte sisteme de mesagerie este posibilitatea livrării întârziate și un sistem dezvoltat de interacțiune între servere de mail independente.

E-mailul face posibilă trimiterea și primirea mesajelor, răspunderea automată la scrisorile corespondenților folosind adresele acestora, trimiterea simultană de copii ale scrisorii către mai mulți destinatari, redirecționarea scrisorii primite la o altă adresă, utilizarea numelor logice în loc de adrese (numerice sau nume de domenii), creați mai multe subsecțiuni ale căsuței poștale pentru tot felul de corespondență, incluse în litere fișiere text, utilizați sistemul „mail bouncers” pentru a conduce discuții cu un grup de corespondenți și așa mai departe. Pentru a trimite un mesaj poștal prin e-mail, este necesar să indicați adresa căsuței poștale. Căsuța poștală a unui abonat de e-mail este o zonă de pe hard disk server de mail rezervat utilizatorului.

Dezvoltarea tehnologiei Internet a dus la apariția protocoalelor moderne de mesagerie care oferă mari oportunități pentru procesarea scrisorilor, o varietate de servicii și ușurință în utilizare. De exemplu, Protocolul SMTP, lucrând pe principiul client-server, este conceput pentru a trimite mesaje de pe un computer către destinatar. De obicei acces la Server SMTP nu este protejat prin parolă, astfel încât orice server cunoscut din rețea poate fi folosit pentru a trimite e-mailuri. Spre deosebire de serverele pentru trimiterea de scrisori, accesul la serverele pentru stocarea mesajelor este protejat prin parolă. Prin urmare, este necesar să utilizați serverul sau serviciul în care Cont... Aceste servere folosesc protocoalele POP și IMAP, care diferă prin modul în care stochează mesajele.

În conformitate cu protocolul POP3, mesajele care sosesc la o anumită adresă sunt stocate pe server până când sunt descărcate pe computer în timpul următoarei sesiuni. După descărcarea mesajelor, vă puteți deconecta de la rețea și puteți începe să citiți e-mailurile. Astfel, utilizarea e-mailului POP3 este cea mai rapidă și mai convenabilă de utilizat.

Protocolul IMAP este convenabil pentru acele persoane care folosesc o conexiune permanentă la rețea. Mesajele primite de adresă sunt stocate și pe server, dar, spre deosebire de POP3, la verificarea e-mailului, vor fi descărcate mai întâi doar antetele mesajelor. Scrisoarea în sine poate fi citită după selectarea antetului mesajului (va fi descărcată de pe server). Este clar că, cu o conexiune dial-up, lucrul cu poșta folosind acest protocol duce la pierderi inutile de timp.

Există mai multe protocoale pentru primirea și transferul de corespondență între sisteme multi-utilizator.

O scurtă descriere a unora dintre ele:

1) SMTP (Simple Mail Transfer Protocol) este un protocol de rețea conceput pentru transmiterea de e-mail în rețele TCP/IP, iar transmiterea trebuie neapărat inițiată de sistemul de transmitere însuși.

MTA (Mail Transfer Agent) - agentul de transfer de e-mail - este componenta principală a sistemului de transfer de e-mail pe Internet, care reprezintă acest computer de rețea pentru sistemul de e-mail din rețea. De obicei, utilizatorii nu lucrează cu MTA, ci cu MUA (Mail Agent utilizator) - clientul de e-mail. Principiul interacțiunii este prezentat schematic în figură.

2) POP, POP2, POP3 (Post Office Protocol)- trei protocoale destul de simple, neinterschimbabile, dezvoltate pentru a livra corespondență unui utilizator de pe un server central de e-mail, a le șterge de pe acesta și pentru a identifica un utilizator după nume/parolă. POP include SMTP, care este folosit pentru a transfera e-mailuri de la un utilizator. Mesajele de e-mail pot fi primite sub formă de antete, fără a primi întregul mesaj.

După stabilirea conexiunii, protocolul POP3 trece prin trei stări consecutive

Autorizare clientul trece prin procedura de autentificare
Tranzacția client primește informații despre starea cutiei poștale, acceptă și șterge e-mail.
Actualizarea serverului șterge e-mailurile selectate și închide conexiunea.

3) IMAP2, IMAP2bis, IMAP3, IMAP4, IMAP4rev1 (Internet Message Access Protocol) - oferă utilizatorului oportunități bogate de a lucra cu cutiile poștale situate pe un server central

o IMAP stochează corespondența pe server în directoare de fișiere și, de asemenea, oferă clientului posibilitatea de a căuta șiruri în mesaje e-mail pe serverul propriu-zis.

o IMAP2 - folosit în cazuri rare.

o IMAP3 - soluție incompatibilă, neutilizată.

o IMAP2bis - o extensie IMAP2 care permite serverelor să analizeze mesajele în mesaje MIME (Multipurpose Internet Mail Extensions), încă în uz.

o IMAP4 este un IMAP2bis reelaborat și îmbunătățit care poate fi folosit oriunde.

o IMAP4rev1 - Extinde IMAP cu o gamă largă de caracteristici, inclusiv cele utilizate de DMSP (Distributed Mail System for Personal Computers).

4) ACAP (Application Configuration Access Protocol) - un protocol dezvoltat pentru a funcționa cu IMAP4; adaugă posibilitatea de a căuta abonament și abonament la panouri de mesaje, cutii poștale și este folosit pentru a căuta agende.

5) DMSP (sau PCMAIL) este un protocol de primire/trimitere de corespondență, a cărui particularitate este că utilizatorul poate avea mai mult de o stație de lucru în utilizare. Stația de lucru conține informații de stare despre e-mail, directorul prin care are loc schimbul, care, atunci când este conectat la server, este actualizat la starea curentă pe serverul de e-mail.

6) MIME este un standard care definește mecanisme de trimitere a tot felul de informații prin e-mail, inclusiv text în alte limbi decât engleza, pentru care se folosesc codificări de caractere altele decât ASCII, precum și conținut binar de 8 biți, cum ar fi imagini, muzică, filme și programe.

Muncă independentă.

Execută exemplul dat în text (fișă) Salvare în propriul folder pe desktop.

9.2. Lucrul cu un profesor:

În caz de dificultăți sau acțiuni eronate, contactați profesorul pentru a corecta erorile.

Până la sfârșitul lecției, arătați profesorului un raport despre munca efectuată și obțineți un credit pentru această muncă.

9.3. Controlul nivelului inițial și final de cunoștințe:

Testarea pe computer .

Informații similare.

Lucrul cu URI

În fiecare zi folosim Identificatori uniformi de resurse (URI) când cauți ceva pe WWW. URI-urile sunt necesare pentru a identifica și solicita un nou tip de resursă. Folosind URI-uri, puteți accesa nu numai paginile Web, ci și serverul FTP, serviciul Web și fișierele locale.

Termenul este adesea folosit în locul URI Localizator uniform de resurse (URL)... URI este un termen general folosit pentru legăturile către resurse. Adresa URL este URI-ul asociat cu astfel de populare scheme URI cum ar fi http, ftp și mailto. În documentația tehnică, termenul URL nu mai este folosit.

Un alt termen poate fi deja cunoscut de tine - Nume uniform al resursei (URN)... URN este un URI standardizat utilizat pentru a identifica o resursă, indiferent de locația acesteia în rețea.

Să analizăm părțile URI-ului care trimite la o pagină de pe site-ul Global Knowledge:

http://www.globalknowledge.net:80/training/generic.asp?pageid=1078&country=DACH

Prima parte a URI este numită sistem... Schema definește spațiul de nume al URI-ului și poate restrânge sintaxa expresiei după schema. Multe scheme sunt denumite pentru protocoalele respective (cum ar fi http, ftp) pe care le folosesc, dar acest lucru este opțional. În exemplul nostru, identificatorul de schemă este http. Limitator de circuit(// în acest exemplu) separă schema de restul adresei URL.

Delimitatorul de schemă este urmat de numele serverului sau adresa IP în notație zecimală punctată, cum ar fi www.globalknowledge.net.

În spatele numelui serverului sau adresei IP se află numărul portului care definește conexiunea la aplicație specifică pe server. Dacă nu este specificat niciun număr de port, este utilizat numărul de port implicit pentru acel protocol (de exemplu, portul 80 pentru HTTP).

cale definește pagina (și directorul) resursei solicitate. Nu reprezintă neapărat un fișier fizic pe server, dar poate fi generat dinamic. În acest caz, calea arată ca /training/generic.asp.

Din calea prin simbol? a eliminat ultima parte a acestui URI numit interogare... În exemplul nostru, cererea este definită de linia pageid = 1078 și country = DACH. Un șir de interogare poate avea mai multe componente, fiecare dintre acestea specificând o variabilă și o valoare, concatenate cu simbolul &. Mai multe componente de interogare pot fi combinate cu &. Deci, în exemplul nostru, prima componentă este pageid = 1078 cu variabila pageid și o valoare de 1078, iar a doua componentă este country = DACH.

Secțiunile dintr-o resursă pot fi identificate cu fragmente. Fragmente sunt folosite pentru a lega secțiunile dintr-o pagină HTML. În designul web, fragmentele sunt numite și marcaje. Caracterul # separă identificatorul fragmentului de cale. În adresa URL http; // www.microsoft.com/net/basics/glossary.asp#NETFramework, fragmentul este #NETFramework.

Dacă caracterul # este adăugat la șirul de interogare, atunci acesta nu mai este un fragment. Adresa URL poate conține un șir de interogare sau un fragment, dar nu ambele.

Mai multe caractere sunt rezervate în URI - ele nu pot fi incluse în numele de gazdă sau în căile, deoarece sunt caractere delimitare speciale. Următoarele caractere sunt rezervate în URI:

; / ? : @ & = + $ ,

clasa Uri din spațiul de nume System încapsulează un identificator de resursă uniform. Conține proprietăți și metode pentru analizarea, compararea și combinarea URI-urilor.

Puteți crea un obiect Uri pasând un șir URI constructorului:

Uri baseURI = nou Uri ("http: // site");

Dacă aveți deja un obiect Uri de bază, puteți crea un nou URI combinând URI de bază cu un URI relativ:

Uri baseURI = nou Uri ("http: // site"); Uri newURI = nou Uri (baseURI, "my / csharp / web / level2 / 2_2.php");

Dacă URI-ul de bază conține deja o cale, aceasta este ignorată. Doar schema, portul și numele serverului sunt luate ca bază pentru noul URI.

Clasa Uri are mai multe câmpuri statice numai pentru citire pentru a obține unele dintre schemele comune:

Uri.UriSchemeFile

Schema de fișiere este utilizată pentru a accesa fișiere local sau pe resurse partajate de rețea, care pot fi denumite conform convenției de denumire universală ( Convenția Universală de Numire, UNC).

Uri.UriSChemeFtp

FTP cu schema ftp este folosit pentru a prelua fișiere de pe un server ftp și, dimpotrivă, pentru a pune fișiere pe un server ftp.

Uri.UriSchemeGopher

Protocolul Gopher a fost predecesorul HTTP. A oferit capabilități de vizualizare ierarhică pentru informațiile de conținut textual, care era superioară FTP. Dar a fost în curând înlocuit de protocolul HTTP.

Uri.UriSchemeHttp, Uri.UriSchemeHttps

Aceste două scheme sunt bine cunoscute: http și https. Schema https este utilizată pentru schimbul securizat.

Uri.UriSchemeMailto

Schema mailto este folosită pentru a trimite mesaje e-mail.

Uri.UriSchemeNews, Uri.UriSchemeNntp

Schemele de știri și nntp sunt utilizate în grupurile de știri folosind protocolul NNTP.

Clasa Uri are metode statice pentru a verifica dacă schema și numele de gazdă sunt corecte: Uri.CheckSchemeName () returnează adevărat dacă numele schemei este corect și metoda UriCheckHostName () nu numai că validează numele de gazdă, dar returnează și o valoare de enumerare UriHostNameType care indică tipul de gazdă.

Clasa Uri are multe proprietăți numai pentru citire care vă permit să accesați toate părțile unui URI. În următorul tabel, folosim URI-ul de mai sus ca exemplu pentru a demonstra utilizarea proprietăților:

AbsoluteUri	Această proprietate arată URI-ul complet. Dacă numărul de port specificat pentru protocol este egal cu numărul de port implicit, constructorul Uri îl elimină automat. Pentru exemplul nostru, valoarea proprietății AbsoluteUri arată astfel: http://www.globalknowledge.net/t raining / generic.asp? pageid = 1078 & country = DACH... Dacă transmiteți un nume de fișier constructorului clasei Uri, proprietatea AbsoluteUri precede automat numele fișierului cu fișierul: // schema.
Sistem	Schema este prima parte a URI și, în acest caz, această proprietate returnează valoarea http.
Gazdă	Proprietatea gazdă arată numele de gazdă din URI: www.globalknowledge.net
Autoritate	Dacă numărul portului este egal cu valoarea implicită a protocolului, proprietatea Authority afișează același șir ca și proprietatea Host. Dacă se folosește un alt număr de port, atunci proprietatea Autoritate arată și numărul portului.
HostNameType	Tipul de nume de gazdă depinde de numele utilizat. În acest caz, se obține aceeași valoare a enumerației UriHostNameType care a fost discutată mai sus.
Port	Folosind proprietatea Port, se obține numărul portului - 80.
Calea Absolută	O cale absolută începe după numărul portului din URI și se termină înaintea șirului de interogare. În acest caz, este setat la /training/generic.asp.
LocalPath	Calea locală dă valoarea /training/generic.asp. După cum puteți vedea, pentru Solicitare HTTP nu există nicio diferență între AbsolutePath și LocalPath. Diferența apare atunci când URI-ul se referă la o resursă de rețea partajată. Pentru URI-urile fișierului formular: \\ server \ share \ directory \ file.txt, proprietatea LocalPath returnează numai numele directorului și fișierelor, în timp ce proprietatea AbsolutePath include numele serverului și al partajării.
Interogare	Proprietatea Interogare arată linia care urmează calea:? Pageid = 1078 & country = DACH.
PathAndQuery	Proprietatea PathAndQuery oferă o combinație de cale și șir de interogare: /training/generic.asp?pageid=1078&country=DACH.
Fragment	Dacă calea este urmată de un fragment, acesta este returnat în proprietatea Fragment. Calea poate fi urmată doar de un șir de interogare sau fragment. Fragmentul este identificat prin caracterul #
Segmente	Proprietatea Segments returnează o matrice de șiruri formate din cale. În acest caz, avem trei segmente: /, training / și generic.asp.
Informații utilizator	Numele de utilizator setat în URI poate fi citit din proprietatea UserInfo. Transmiterea numelor de utilizator este obișnuită în FTP și, dacă este specificat un utilizator non-anonim, cum ar fi ftp: // [email protected] apoi proprietatea UserInfo va returna myuser.

În plus față de cele enumerate, există mai multe proprietăți care returnează valori booleene, dacă URI-ul reprezintă un fișier, cale UNC, adresă părere sau dacă numărul de port implicit este utilizat pentru acest protocol. Acestea sunt proprietățile IsFile, IsUnc, IsLoopback și, respectiv, IsDefaultPort.

Un identificator uniform de resursă (uri), scopul său și părțile sale. Schema de operare a serverului WWW

Schema URI Android și filtrul de intenție

Cerințe pentru utilizarea schemelor URI în Android

Configurarea unei scheme URI în Android

Gestionarea linkurilor directe într-o aplicație Android

Utilizarea schemelor URI în Android în practică

Concluzie

postări asemănatoare

Top articole similare