Cum se configurează smartphone-uri și PC-uri. Portal informativ
  • Acasă
  • In contact cu
  • Principalele motoare de căutare pe Internet. Motoare de căutare pe Internet: Yandex, Google, Rambler, Yahoo

Principalele motoare de căutare pe Internet. Motoare de căutare pe Internet: Yandex, Google, Rambler, Yahoo

Total

Introducere

Puțini oameni își pot imagina acum internetul fără căutare, rezultate de căutare și sisteme de căutare a informațiilor (IRS) care să organizeze totul. Dar până de curând, toate informațiile de pe Internet se încadrează în mai multe directoare, ale căror nume sunt încă binecunoscute (DMOZ, Yahoo).

Astăzi, volumul de informații de pe internet este atât de mare încât este imposibil să le încadrezi în orice cataloage. Pentru procesarea, stocarea informațiilor și organizarea căutărilor, au fost create și continuă să fie create produse software puternice, pe care le numim motoare de căutare (SE). Fiecare motor de căutare (motor de căutare) are propriile baze de date, algoritmi proprii de procesare, căutare, clasare și afișare a informațiilor.

Motoarele de căutare pe Internet sunt

Următoarea definiție academică a motoarelor de căutare poate fi dată. Un sistem de căutare este un set de programe și mijloace tehnice pentru organizarea unei căutări de utilizator pe Internet, în care, atunci când răspunde la o interogare de text, utilizatorul primește o listă de rezultate relevante (corespunzătoare solicitării).

Emiterea se face sub forma unei liste de link-uri către sursa de informații cu o scurtă descriere (preview), uneori cu o fotografie.

Pentru primul exemplu, să ne amintim de liderul mondial de căutare „Google” și de liderul motorului de căutare Runet „Yandex”. Pe lângă aceste motoare de căutare, puteți numi încă o duzină de motoare de căutare existente, despre care vom vorbi mai jos.

Opinie: Motoarele de căutare Google, Yandex și altele nu sunt generatoare (producători) de conținut, ci sunt agregatoare (acumulatoare) de conținut și, în cea mai mare parte, conținutul altor persoane. Merită să ne amintim că utilizarea conținutului altcuiva pentru a vă crea propriul trafic și pentru a-l monetiza poate fi caracterizată drept „piraterie”, ceea ce, desigur, nu se întâmplă în realitate.

Evaluare

  • iar Google împart primele două locuri de lideri: aproximativ 49% și 45%.
  • Locul al treilea: Caută Mail.ru aproximativ 3%;
  • Alte motoare de căutare plutesc sub 1%.

Mă uit la statisticile de pe Google Analytics:

  • yandex/organic 40,26%
  • google/organic 38,93%
  • mail.ru/organic 0,60%
  • rambler/organic 0,52%
  • bing/organic 0,12%

Statisticile sunt inexorabile: căutările Yandex sunt folosite cel mai mult, iar dacă considerați că 3% este un rezultat bun față de 45%, atunci căutarea Mail.ru poate fi numită a treia cea mai populară.

În acest sens, discuțiile despre popularitatea motoarelor de căutare, altele decât Yandex și Google, pot fi atribuite superstiției, iar promovarea specială a site-urilor în alte motoare de căutare (nu Yandex și Google) nu merită atenție.

Cum funcționează motoarele de căutare

Întrebarea cum funcționează motoarele de căutare este la fel de comună ca întrebarea „ce culoare este cerul”. Dacă cerul este albastru, atunci motoarele de căutare colectează informații pe Internet, le procesează, le clasifică și le trimit utilizatorului pe baza interogării de căutare.

Teoria căutării pe Internet este mult mai extinsă și nu poate fi prezentată în articol. Cu toate acestea, punctele principale ne vor fi utile:

Motoarele de căutare de pe Internet nu stochează documente, adică nu descarcă și încarcă documente complet în depozitele lor;

IRS-urile folosesc internetul ca depozit de documente descentralizat. Motoarele de căutare accesează periodic Internetul, selectează informațiile de care au nevoie pe baza algoritmilor lor și le plasează parțial (informațiile) în baza lor de date (Baza de date). Acest lucru duce la mai multe probleme:

  • Sistemele de recuperare a informațiilor nu folosesc toate informațiile de pe Internet, ci doar o parte a acesteia;
  • Informațiile de pe Internet se schimbă frecvent. Se adaugă aproximativ 1.500 de mii de pagini pe zi, de unde posibila „ieșire goală”;
  • Există un număr mare de duplicate (conținut duplicat). Din păcate, nu am date exacte despre preluari, iar cifra raportată de 25% dintre preluari pare prea mare;
  • Există multă publicitate, care este ocolită și de motoarele de căutare;
  • „Rătăcirea” roboților de căutare în rețea crește foarte mult încărcarea resurselor (nu se aplică motoarelor de căutare);
  • Majoritatea site-urilor sunt comerciale (aproximativ 83%) și au o valoare informațională mică.

Din aceste motive și din alte câteva motive, marea majoritate a sistemelor de regăsire a informațiilor de pe Internet utilizează o schemă de căutare prin cuvinte cheie (motoare de căutare), mai degrabă decât o schemă de căutare clasică bazată pe clasificarea informațiilor.

Caracteristici ale căutării prin cuvinte cheie

În ciuda algoritmilor în schimbare ai motoarelor de căutare, a căror publicitate încearcă să ne convingă că mașinile devin mai inteligente și mai înțelegătoare, baza muncii motoarelor de căutare este căutarea prin cuvinte cheie.

Îmi place această schemă de căutare prin cuvinte cheie.

După cum puteți vedea, munca motoarelor de căutare pe Internet se bazează pe căutarea de noi documente (robot de căutare Spider + Crawler), indexarea documentelor detectate (Indexer) și executarea unei interogări utilizator (Search Engine Results Engine). Numele roboților de căutare utilizați în aceste scopuri sunt enumerate între paranteze.

După cum am spus, majoritatea motoarelor de căutare nu copiază textul integral al documentelor în baza lor de date. Pentru căutare, la indexarea unui document, se creează o imagine de căutare. Pentru a organiza o căutare după , robotul de indexare creează o imagine a documentului folosind așa-numita metodă derivată. Adică, imaginea documentului conține un titlu și un set de cuvinte cheie.

Cu toate acestea, se poate afirma destul de precis că toate IPS acordă atenție următoarelor:

  • Prezența unui cuvânt cheie în document;</li><li>Prezența unei chei în adresa URL sau domeniu;</li><li>Prezența unei chei în subtitrare;</li><li>Numărul total de taste pe pagină (densitate%);</li><li>Prezența cheilor în descriere;</li><li>Ce link-uri web conduc la această pagină;</li><li>Ce link-uri interne există pe această pagină?</li> </ul><h2><span>Clasamentul paginii</span></h2><p>La sfârșitul teoriei, merită menționat. Mai des, clasarea paginilor este menționată în contextul relevanței. Adică, motoarele de căutare trebuie să creeze rezultate de căutare care să se potrivească cât mai bine cu interogarea de căutare. După cum scrie Yandex, nu ar trebui să se piardă nimic (completitudinea ieșirii) și nu trebuie găsit nimic inutil (acuratețea ieșirii). Vedeți cum funcționează acest lucru în practică în fiecare zi.</p><h2>Concluzie</h2><ul><li>Motoarele de căutare pe internet sunt produse software complexe, a căror activitate este susținută de mii de specialiști și resurse materiale enorme.</li><li>Algoritmii motoarelor de căutare sunt ținuți secreti, deși accentul de bază al actualizărilor algoritmilor este disponibil public și poartă nume proprii.</li><li>În ciuda abordărilor diferite de generare a rezultatelor căutării, toate motoarele de căutare se bazează pe principiile generale ale indexării paginilor, care până în prezent rămân de bază pentru promovare.</li> </ul><h2><span>Motorul de căutare Yandex</span></h2><p>Un motor de căutare popular Runet care devine adesea cel mai popular. Conform statisticilor din 2009, Yandex accesează cu crawlere în mod constant 15 milioane de pagini din Runet, procesând 140 mii GB de date text, 1,6 miliarde de imagini unice din 2,1 miliarde de imagini în total.</p><p>Motorul de căutare Yandex a fost creat în 1993. Cuvântul Yandex nu înseamnă nimic, deși este general acceptat că este o transformare a cuvântului „Index” sau a expresiei „un alt indexator”. Astăzi, Yandex.Search procesează un sfert de miliard de solicitări pe zi și, dacă ar fi atât de intruziv, ar fi motorul meu de căutare preferat.</p><h2>Căutați Yandex</h2><p>https://yandex.ru/: Căutarea utilizatorilor Yandex este organizată pe Internet, ținând cont de regiunea utilizatorului. Abilitatea de a căuta după imagini, videoclipuri, hărți, știri, bloguri, produse și dicționare.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-4.png' align="center" width="100%" loading=lazy loading=lazy></p><p>Pentru căutări detaliate, există o limbă de căutare aici (https://yandex.ru/support/search/query-language/).</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-6.png' width="100%" loading=lazy loading=lazy></p><p>Motoarele de căutare pe Internet Yandex</p><h2>motor de căutare Google</h2><p>În motorul de căutare Google, căutarea este organizată fără subiecte (căutare principală) și căutări pe secțiuni: imagini, știri, hărți, videoclipuri, cumpărături, cărți, bilete de avion, finanțe.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-8.png' align="center" width="100%" loading=lazy loading=lazy></p><p>Există setări:</p><p><b>Căutare în condiții de siguranță.</b> Vă permite să blocați conținutul neadecvat și imaginile sexuale din rezultatele căutării Google. Această caracteristică nu garantează protecție 100%, dar ascunde cea mai mare parte a unui astfel de conținut.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-13.png' align="center" width="100%" loading=lazy loading=lazy></p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-9.png' align="center" width="100%" loading=lazy loading=lazy></p><p><b>Setarea numărului de rezultate</b> pe pagină (implicit 10).</p><p><b>Rezultate personale</b>. Găsiți linkuri, imagini și videoclipuri pe Google pe care prietenii tăi le-au distribuit pe rețelele sociale.</p><p><b>Selectarea regiunii</b>. Valoarea implicită este regiunea curentă.</p><p><b>Limbi.</b> Puteți specifica limba de căutare.</p><p><b>Cautare Avansata.</b> Vă permite să căutați folosind parametrii avansați.</p><p><b>Instrumente.</b> Aici puteți selecta limba de căutare, specifica ora la care au apărut informațiile și puteți selecta o potrivire exactă sau întregul rezultat al căutării.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-10.png' width="100%" loading=lazy loading=lazy></p><p>Motoarele de căutare pe internet Google</p><h2>Motor de căutare pentru e-mail</h2><p>https://go.mail.ru/. Aici căutarea este organizată pe Internet (căutare generală), pe videoclipuri și imagini. Există o căutare separată pentru aplicații pentru dispozitive mobile.</p><p> (<span>https://www.bing.com/?scope=web&FORM=Z9LH</span>). Căutare generală, căutare după imagini, videoclipuri, știri, hărți.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-11.png' align="center" width="100%" loading=lazy loading=lazy></p><p><b>Căutare Yahoo în rusă</b>. https://ru.search.yahoo.com/. Căutare pură fără publicitate. Căutați pe internet, folosind imagini și știri. Selectați ora pentru a adăuga informații.</p><h2>Alte motoare de căutare</h2><ul><li>DuckDuckGo (https://duckduckgo.com/) Căutare inteligentă.</li><li>Pipl (https://pipl.com/) Căutați oameni în SUA.</li><li>Găsește sunete ( <span>http://www.findsounds.com/ 11 Instrumente pentru analizarea relevanței paginilor site-ului pentru o interogare de căutare</span></li> </ul> <p>Motorul de căutare este unul dintre straturile cheie ale Internetului, alături de conținut și browser. Motorul de căutare Yandex sau sisteme similare (Google, Bing, DuckDuckGo și altele) permit utilizatorului să caute informații pe World Wide Web prin formularea unei interogări.</p><p>Sarcina unui motor de căutare este să găsească toate documentele, paginile, videoclipurile, adică tot conținutul, pentru această interogare (cuvânt cheie sau expresie).</p><p>Care motor de căutare este cel mai bun? Există opțiuni alternative, altele decât Google și Yandex? Ce motor de căutare pe Internet este mai potrivit pentru scanarea surselor în limba engleză sau, de exemplu, a muzicii? Acesta este exact ceea ce va discuta articolul.</p><h2>Evaluare: lideri de piata</h2><p>Dacă vorbim despre lume în ansamblu, atunci motorul de căutare Google este cel mai popular motor de căutare. Corporația ocupă aproape 70% din piață. Poziția a doua în clasament este ocupată de Bing (cota - 12,26%). Sistemul Baidu se luptă pentru locul doi (6,48% din septembrie 2015). Din când în când își schimbă locul.</p><p>Deci, de exemplu, în 2014, „forțele” au fost distribuite diferit: primul loc a fost ocupat de motorul de căutare Google cu 68,69%, al doilea de Baidu (17,7%), al treilea de Bing cu o capitalizare de piață de 6, 22. %.</p><p>Dar datele globale sunt foarte generalizate. Care motor de căutare este cel mai bun?</p><p>În China, de exemplu, un procent foarte mic din populație scanează cu Google, majoritatea utilizează sistemul intern Soso. În Coreea de Sud, majoritatea locuitorilor folosesc propria lor dezvoltare - motorul de căutare pe internet Naver. Cu toate acestea, în ultimele luni numărul cererilor din acest sistem a început să scadă rapid.</p><p>În Japonia și Taiwan, utilizatorii sunt cel mai probabil să folosească Yahoo!</p><h2>Evaluare: sisteme în limba rusă</h2><p>Care motor de căutare este cel mai bun? În Rusia, clasamentele motoarelor de căutare nu sunt deloc asemănătoare cu cele globale. Liderul de piață pe segmentul de limbă rusă al internetului este Yandex, care este folosit de peste 55% dintre utilizatori.</p><p>Pe locul doi se află Google cu un rezultat de 37,6%. Potrivit serviciului LiveInternet, acoperirea interogărilor de căutare în limba rusă pe World Wide Web a fost distribuită după cum urmează:</p><ol><li>Motoare de căutare universale: Google (37,6%), Bing (0,3%), Yahoo! (0,1%).</li><li>vorbitor de engleză și internațional (AskJeeves, de exemplu).</li><li>Motoare de căutare în limba rusă: Yandex (56,2%), Mail (5,3%), Rambler (0,5%).</li> </ol><h2>DuckDuckGo</h2><p>O conversație despre motoarele de căutare alternative ar trebui să înceapă cu motorul de căutare DuckDuckGo. Acesta este un sistem open source destul de cunoscut și răspândit. Serverele DuckDuckGo sunt situate în Statele Unite ale Americii. Rezultatele căutării sunt destul de extinse, deoarece sistemul folosește nu numai propriii algoritmi, ci și rezultatele altor surse, de exemplu Wikipedia, motorul de căutare Bing și Yahoo!</p><p>Motorul de căutare DuckDuckGo asigură securitate maximă a informațiilor personale ale utilizatorului, confidențialitate și confidențialitate. Sistemul nu colectează date despre utilizatori, nu stochează istoric și limitează pe cât posibil utilizarea cookie-urilor.</p><p>Diferența dintre DuckDuckGo este că acest sistem nu personalizează rezultatele căutării, așa cum fac alte sisteme. În Google sau Yandex, de exemplu, utilizatorul vede doar informații care sunt în concordanță cu preferințele sale. Dar DuckDuckGo creează o imagine reală și vă permite să scăpați de publicitatea specifică intruzivă. Serviciul de căutare caută cu ușurință informații în limbi străine, în timp ce Yandex și Google în mod implicit acordă preferință surselor în limba rusă, chiar dacă interogarea este introdusă în engleză, germană sau altă limbă.</p><p>Sistemul vă permite să personalizați interfața: puteți schimba culorile, fonturile, linkurile și alți parametri în doar câteva clicuri.</p><p>Acest motor de căutare este încă departe de gigantul Google, dar rățușca se dezvoltă, așa că este foarte posibil ca în viitor DuckDuckGo să ocupe una dintre pozițiile de frunte. Echipa a creat un produs excelent care oferă o căutare anonimă, rapidă și funcțională, care merită atenția utilizatorului.</p><h2>Nu Rău</h2><p>Acesta este un sistem care caută în rețeaua Tor anonimă. Motorul de căutare este preinstalat în browserul cu același nume. De ce nu este rău mai bine? „Se duce” acolo unde motoarele de căutare Google sau Yandex nu pot ajunge. În general, în rețeaua Tor există o mulțime de resurse care nu pot fi vizitate pe internetul „obișnuit” (respectator de lege). Acesta este un fel de platformă în cadrul rețelei cu propriile platforme sociale, trackere de torrent, media, bloguri, centre comerciale, forumuri, biblioteci și așa mai departe.</p><p>Apropo, notEvil nu este singurul motor de căutare de acest gen. Există și Look, care este disponibil implicit în același browser Tor, iar TORCH este unul dintre cele mai vechi motoare de căutare din rețeaua anonimă.</p><p><img src='https://i2.wp.com/syl.ru/misc/i/ai/362924/2173269.jpg' width="100%" loading=lazy loading=lazy></p><h2>YaCy</h2><p>Motorul de căutare gratuit YaCy este o abordare complet diferită a organizării căutărilor pe World Wide Web. Sistemul funcționează pe principiul P2P. Aceasta înseamnă că fiecare computer pe care este instalat modulul scanează independent Internetul, iar apoi toate rezultatele obținute sunt colectate într-o singură bază de date care poate fi folosită de toți utilizatorii YaCy.</p><p>Sistemul este complet independent, autonom și asigură anonimatul fiecărui utilizator. YaCy este potrivit pentru susținătorii unui internet deschis care nu este influențat de marile corporații și agenții guvernamentale.</p><p>Motorul de căutare nu este foarte util în viața de zi cu zi, dar în viitor este o alternativă demnă la Google, chiar și din punctul de vedere al organizării procesului de căutare a informațiilor.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2173267.jpg' width="100%" loading=lazy loading=lazy></p><h2>Pipl</h2><p>Pipl este un sistem conceput pentru a căuta informații despre o anumită persoană. Dezvoltatorii susțin că algoritmii motorului de căutare caută oameni mai eficient decât Google sau Yandex, care sunt răspândite în întreaga lume.</p><p>Sursele prioritare sunt profilele de pe rețelele de socializare, comentariile, listele de participanți, bazele de date în care sunt publicate diverse date despre persoane, de exemplu bazele de date ale hotărârilor judecătorești. Dar există și un dezavantaj. Pipl nu are acces la bazele de date rusești, așa că va fi util doar pentru a căuta informații despre cetățenii americani.</p><p><img src='https://i2.wp.com/syl.ru/misc/i/ai/362924/2172783.jpg' width="100%" loading=lazy loading=lazy></p><h2>GăsițiSunete</h2><p>Care motor de căutare este cel mai bun? Dacă trebuie să găsiți muzică sau sunete, atunci, desigur, FindSounds este cel mai bun. Acesta este un motor de căutare specializat cu o listă de etichete. Aici puteți selecta formatul sau calitatea fișierului audio dorit. Toate rezultatele căutării sunt disponibile pentru descărcare.</p><p><img src='https://i0.wp.com/syl.ru/misc/i/ai/362924/2173268.jpg' width="100%" loading=lazy loading=lazy></p><h2>Wolfram|Alfa</h2><p>Acest sistem nu produce pagini care conțin informațiile de care utilizatorul are nevoie, ci un rezultat final. De exemplu, hărți, grafice, tabele, răspunsuri scurte. Serviciul este ideal pentru calcularea datelor și căutarea unor fapte specifice. Motorul de căutare nu înțelege încă toate interogările, dar este în continuă evoluție.</p><p>Cu Wolfram|Alpha este convenabil, de exemplu, să comparați parametrii pentru configurarea unei camere, smartphone sau laptop. De asemenea, calculați nivelul de alcool din sânge (sistemul cere utilizatorului greutatea și înălțimea, cantitatea băută, timpul și apoi spune cât timp va dura până când alcoolul va fi eliminat complet din organism).</p><p>Instrumentul poate converti mărimile pantofilor și îmbrăcămintei, poate număra caloriile, poate vizualiza cursurile de schimb sau poate acorda un instrument muzical.</p><h2>Dogpile</h2><p>Dogpile afișează simultan rezultatele din toate motoarele de căutare obișnuite. Serviciul folosește un algoritm îmbunătățit și, după cum asigură dezvoltatorii, generează cele mai bune rezultate pe Internet. În plus, sunt puține reclame. Puteți încerca să utilizați Dogpile dacă informațiile de care aveți nevoie nu se găsesc în Google sau Yandex standard.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2172777.jpg' width="100%" loading=lazy loading=lazy></p><h2>BoardReader</h2><p>Acest sistem caută informații pe forumuri, sondaje, servicii de întrebări și răspunsuri și comunități sociale, restrângând câmpul de căutare la platformele sociale. Puteți seta filtre: limbă și data publicării, numele site-ului etc.</p><p>Motorul de căutare poate fi util specialiştilor în publicitate care sunt interesaţi de opinia publicului.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2172779.jpg' width="100%" loading=lazy loading=lazy></p><h2>In cele din urma</h2><p>Adesea motoarele de căutare alternative sunt trecătoare. Apar la fel de repede cum mor. Cele mai multe sisteme alternative de astăzi sunt specializate într-o nișă îngustă sau testează un algoritm original în generarea rezultatelor căutării.</p><p>În contextul descrierii motoarelor de căutare alternative, criteriul „mai bine” nu înseamnă deloc „mai bine în toate”. Fiecare dintre serviciile enumerate mai sus oferă unui anumit utilizator ceva care nu este disponibil în Google sau Yandex. În orice caz, familiarizarea cu opțiunile alternative (pe fundalul faptului că sistemul pare să fie practic monopolizat de giganții de căutare) este interesantă și utilă pentru fiecare utilizator.</p> <p>Motoarele de căutare (SE) au fost o parte esențială a Internetului de ceva timp. Astăzi sunt mecanisme uriașe și complexe care nu sunt doar un instrument pentru găsirea oricăror informații necesare, ci și domenii destul de interesante pentru afaceri.</p> <br>Mulți utilizatori de căutare nu s-au gândit niciodată la principiile funcționării lor, cum să proceseze cererile utilizatorilor sau cum sunt construite și funcționează aceste sisteme. Acest material va ajuta oamenii care sunt implicați în optimizare și înțelegerea structurii și principalelor funcții ale motoarelor de căutare. <h2>Funcțiile și conceptul PS</h2> <b>Sistem de căutare</b> este un complex hardware și software care este conceput pentru a îndeplini funcția de căutare pe Internet și răspunde la o solicitare a utilizatorului, care este de obicei specificată sub forma unei fraze text (sau mai precis a unei interogări de căutare), prin emiterea unei referințe enumerați la sursele de informații, pe baza relevanței. Cele mai comune și mai mari motoare de căutare: Google, Bing, Yahoo, Baidu. În Runet - Yandex, Mail.Ru, Rambler. <p>Să aruncăm o privire mai atentă la semnificația interogării de căutare, luând ca exemplu sistemul Yandex.</p><p>Solicitarea trebuie formulată de utilizator în deplină concordanță cu subiectul căutării sale, cât mai simplu și pe scurt posibil. De exemplu, dorim să găsim informații în acest motor de căutare: „cum să alegi o mașină pentru tine”. Pentru a face acest lucru, deschideți pagina principală și introduceți interogarea de căutare „cum aleg o mașină”. Apoi funcțiile noastre se reduc la urmărirea legăturilor furnizate către sursele de informații din rețea.</p><p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/6d6/yandex-auto.png' width="100%" loading=lazy loading=lazy><br></p> <br>Dar chiar și acționând în acest fel, este posibil să nu obținem informațiile de care avem nevoie. Dacă am primit un astfel de rezultat negativ, trebuie doar să ne reformatăm solicitarea, sau baza de date de căutare chiar nu are nicio informație utilă despre acest tip de solicitare (acest lucru este foarte posibil având în vedere parametrii „îngusti” ai solicitării, cum ar fi, de exemplu, „cum să alegi o mașină în Anadyr „). <p>Cea mai de bază sarcină a fiecărui motor de căutare este de a furniza oamenilor exact tipul de informații de care au nevoie. Și este practic imposibil să înveți utilizatorii să creeze tipul „corect” de interogări către motoarele de căutare, adică expresii care să corespundă principiilor lor de funcționare.</p><p>De aceea, dezvoltatorii specialiști de motoare de căutare creează principii și algoritmi pentru munca lor, care ar permite utilizatorilor să găsească informațiile de care sunt interesați. Aceasta înseamnă că sistemul trebuie să „gândească” în același mod în care gândește o persoană atunci când caută informațiile necesare pe Internet.</p><p>Când își introduce interogarea într-un motor de căutare, vrea să găsească ceea ce are nevoie cât mai ușor și rapid posibil. După ce a primit rezultatul, utilizatorul își face evaluarea performanței sistemului, ghidat de mai multe criterii. A reușit să găsească informațiile de care avea nevoie? Dacă nu, de câte ori a trebuit să reformateze textul de interogare pentru a-l găsi? Cât de actualizate au fost informațiile primite? Cât de repede i-a procesat motorul de căutare cererea? Cât de ușor de utilizat au fost furnizate rezultatele căutării? Rezultatul dorit a fost primul sau a fost pe locul 30? Câte „junk” (informații inutile) au fost găsite împreună cu informații utile? Se vor găsi informații relevante pentru el, când folosește PS, într-o săptămână sau într-o lună?</p><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/ceb/rangirovanie.png' width="100%" loading=lazy loading=lazy><br></p> <br>Pentru a obține răspunsurile corecte la astfel de întrebări, dezvoltatorii de căutare îmbunătățesc în mod constant principiile de clasare și algoritmii săi, adăugându-le noi caracteristici și funcții și, prin orice mijloace, încearcă să facă sistemul să funcționeze mai rapid. <h2>Principalele caracteristici ale motoarelor de căutare</h2>Să indicăm principalele caracteristici ale căutării: <h3>Completitudine.</h3>Completitudinea este una dintre cele mai importante caracteristici ale unei căutări, ea reprezintă raportul dintre numărul de documente de informare găsite la cerere și numărul lor total pe Internet aferent unei cereri date. De exemplu, există 100 de pagini pe Internet cu expresia „cum să alegi o mașină”, iar pentru aceeași interogare au fost selectate doar 60 din total, atunci în acest caz caracterul complet al căutării va fi de 0,6. Este clar că, cu cât căutarea în sine este mai completă, cu atât este mai mare probabilitatea ca utilizatorul să găsească exact documentul de care are nevoie, desigur, dacă acesta există. <h3>Precizie.</h3>O altă funcție principală a unui motor de căutare este acuratețea. Acesta determină gradul în care paginile găsite pe Internet se potrivesc cu solicitarea utilizatorului. De exemplu, dacă pentru expresia cheie „cum să alegi o mașină” există o sută de documente, jumătate dintre ele conțin această expresie, iar restul au pur și simplu următoarele cuvinte (cum să alegi corect un radio auto și să-l instalezi într-o mașină ), atunci precizia căutării este egală cu 50/100 = 0,5. <p>Cu cât căutarea este mai precisă, cu atât utilizatorul va găsi mai repede informațiile de care are nevoie, cu atât mai puține „gunoaie” vor fi găsite printre rezultate, cu atât mai puține documente găsite nu vor corespunde sensului cererii.</p><h3>Relevanţă.</h3>Aceasta este o componentă semnificativă a căutării, care se caracterizează prin timpul care trece din momentul în care informațiile sunt publicate pe Internet până când sunt introduse în baza de date index a motorului de căutare. <p>De exemplu, a doua zi după ce au apărut informații despre lansarea unui nou iPad, mulți utilizatori au apelat la căutare cu tipuri relevante de interogări. În cele mai multe cazuri, informațiile despre această știre sunt deja disponibile în căutare, deși a trecut foarte puțin timp de la apariția ei. Acest lucru se datorează motoarelor mari de căutare care au o „bază de date rapidă” care este actualizată de mai multe ori pe zi.</p><h3>Viteza de căutare.</h3>O astfel de funcție precum viteza de căutare este strâns legată de așa-numita „rezistență la sarcină”. Un număr mare de persoane accesează căutarea în fiecare secundă, o astfel de sarcină de lucru necesită o reducere semnificativă a timpului de procesare a unei cereri. Aici interesele atât ale motorului de căutare, cât și ale utilizatorului coincid complet: vizitatorul dorește să obțină rezultate cât mai repede, iar motorul de căutare trebuie să-și proceseze cererea cât mai repede, pentru a nu încetini procesarea solicitărilor ulterioare. <h3>Vizibilitate.</h3>Prezentarea vizuală a rezultatelor este cel mai important element al confortului căutării. Pe baza multor interogări, motorul de căutare găsește mii și, în unele cazuri, milioane de documente diferite. Datorită caracterului vag al compilației frazelor cheie pentru căutare sau a inexactității acesteia, chiar și primele rezultate ale interogării nu conțin întotdeauna doar informațiile necesare. <p>Aceasta înseamnă că o persoană trebuie adesea să efectueze propria căutare printre rezultatele furnizate. Diverse componente ale paginilor cu rezultatele căutării vă ajută să navigați în rezultatele căutării.</p><h2>Istoria dezvoltării motoarelor de căutare</h2>Când Internetul a început să se dezvolte, numărul utilizatorilor săi obișnuiți era mic, iar cantitatea de informații de accesat era relativ mică. Practic, doar specialiştii din domeniile de cercetare au avut acces la această reţea. La acea vreme, sarcina de a găsi informații nu era la fel de urgentă ca acum. <p>Una dintre primele metode de organizare a accesului larg la resursele informaționale a fost crearea directoarelor site-urilor, iar linkurile către acestea au început să fie grupate pe subiecte. Primul proiect a fost resursa Yahoo.com, care a fost deschisă în primăvara anului 1994. Ulterior, când numărul de site-uri din directorul Yahoo a crescut semnificativ, a fost adăugată opțiunea de căutare a informațiilor necesare în director. Nu era încă un sistem de căutare complet, deoarece domeniul de aplicare al unei astfel de căutări era limitat doar la site-urile incluse în acest director și nu absolut toate resursele de pe Internet. Directoarele de link-uri au fost utilizate pe scară largă în trecut, dar în prezent și-au pierdut aproape complet popularitatea.</p><p>La urma urmei, chiar și cataloagele de astăzi, care au un volum enorm, conțin informații doar despre o mică parte a site-urilor de pe Internet. Cel mai faimos și cel mai mare director din lume conține informații pe cinci milioane de site-uri, în timp ce baza de date Google conține informații pe peste 25 de miliarde de pagini.</p><p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/d6d/dmoz.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>Primul motor de căutare real a fost WebCrawler, care a apărut în 1994. <p>În anul următor au apărut AltaVista și Lycos. Mai mult decât atât, primul a fost lider în căutarea de informații pentru o perioadă foarte lungă de timp.</p><p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/e9a/altavista.png' width="100%" loading=lazy loading=lazy><br></p> <br>În 1997, Sergey Brin, împreună cu Larry Page, au creat motorul de căutare Google ca proiect de cercetare la Universitatea Stanford. Astăzi este Google, cel mai popular și popular motor de căutare din lume. <p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/773/Sergey-Brin-and-Larry-Page.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>În septembrie 1997, a fost anunțat (oficial) Yandex PS, care este în prezent cel mai popular sistem de căutare de pe RuNet. <p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/24c/yandex.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>Conform <b>septembrie 2015</b>, cotele motoarelor de căutare din lume sunt distribuite după cum urmează: <ul><li>Google - 69,24%;</li> <li>Bing - 12,26%;</li> <li>Yahoo! - 9,19%;</li> <li>Baidu - 6,48%;</li> <li>AOL - 1,11%;</li> <li>Întrebați - 0,23%;</li> <li>Excitație - 0,00%</li> </ul><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/528/search.png' width="100%" loading=lazy loading=lazy></p><p>Conform <b>decembrie 2016</b>, acțiuni ale motoarelor de căutare în Runet:</p><ul><li>Yandex - 48,40%</li> <li>Google - 45,10%</li> <li>Search.Mail.ru - 5,70%</li> <li>Rambler - 0,40%</li> <li>Bing - 0,30%</li> <li>Yahoo - 0,10%</li> </ul><p><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/e7d/search-runet.png' width="100%" loading=lazy loading=lazy></p> <h2>Cum funcționează un motor de căutare</h2>În Rusia, principalul motor de căutare este Yandex, apoi Google și apoi Poisk@Mail.ru. Toate motoarele de căutare mari au propria lor structură, care este destul de diferită de celelalte. Dar este încă posibil să se identifice elementele de bază comune tuturor motoarelor de căutare. <h3>Modul de indexare.</h3>Această componentă constă din trei programe de robot: <p><b>Păianjen</b>(în engleză spider) este un program conceput pentru a descărca pagini web. Păianjenul descarcă o anumită pagină, extragând simultan toate linkurile din ea. Codul HTML este descărcat din aproape fiecare pagină. Pentru aceasta, roboții folosesc protocoale HTTP.</p><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/a70/spiders.png' width="100%" loading=lazy loading=lazy><br></p> <br>„Pianjen” funcționează după cum urmează. Robotul trimite o cerere către server „get/path/document” și alte comenzi de solicitare HTTP. Ca răspuns, programul robot primește un flux de text care conține informații de tip serviciu și, desigur, documentul în sine. <ul><li>URL-ul paginii descărcate;</li> <li>data la care pagina a fost descărcată;</li> <li>antet de răspuns http server;</li> <li>codul html, „corpul” paginii.</li> </ul><b>Tractor pe şenile</b> păianjen („călător”). Acest program merge automat la toate linkurile care se găsesc pe pagină și, de asemenea, le evidențiază. Sarcina sa este să decidă unde ar trebui să meargă păianjenul, pe baza acestor legături sau pe baza unei anumite liste de adrese. <p><b>Indexator</b>(robot indexer) este un program care analizează paginile pe care păianjenii le-au descărcat.</p><p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/5c3/indexing.png' width="100%" loading=lazy loading=lazy></p> <br>Indexatorul parsează complet pagina în elementele sale componente și le analizează folosind propriile tipuri de algoritmi morfologici și lexicali. <p>Analiza se efectuează pe diverse părți ale paginii, cum ar fi titluri, text, link-uri, stil și caracteristici structurale, etichete html etc.</p><p>Astfel, modulul de indexare face posibilă urmărirea legăturilor unui anumit număr de resurse, descărcarea paginilor, extragerea legăturilor către pagini noi din documentele primite și efectuarea unei analize detaliate a acestora.</p><h3>Bază de date</h3> <b>Bază de date</b>(sau indexul motorului de căutare) este un complex de stocare a datelor, o matrice de informații în care parametrii modificați ai fiecărui document procesat și descărcat de modulul de indexare sunt stocați într-un anumit mod. <h3>Server de căutare</h3>Acesta este cel mai important element al întregului sistem, deoarece viteza și, bineînțeles, calitatea căutării depind direct de algoritmii care stau la baza funcționalității acestuia. <p>Serverul de căutare funcționează după cum urmează:</p><ul><li>Solicitarea care vine de la utilizator este supusă analizei morfologice. Se generează mediul informațional al oricărui document disponibil în baza de date (va fi afișat ulterior ca fragment, adică un câmp informativ de text corespunzător unei cereri date).</li> <li>Datele primite sunt transmise ca parametri de intrare unui modul de clasare specializat. Ele sunt procesate pentru toate documentele și, ca urmare, pentru fiecare astfel de document se calculează propriul rating, care caracterizează relevanța unui astfel de document pentru solicitarea utilizatorului și alte componente.</li> <li>În funcție de condițiile specificate de utilizator, acest rating poate fi ajustat prin altele suplimentare.</li> <li>Apoi este generat fragmentul în sine, adică Pentru orice document găsit, titlul, rezumatul care se potrivește cel mai bine interogării și un link către acest document sunt extrase din tabelul corespunzător, iar formele și cuvintele găsite sunt evidențiate.</li> <li>Rezultatele căutării rezultate sunt transmise persoanei care a efectuat-o sub forma unei pagini pe care sunt afișate rezultatele căutării (SERP).</li> </ul> Toate aceste elemente sunt strâns legate între ele și funcționează, interacționând, formând un mecanism distinct, dar mai degrabă complex de funcționare a PS, necesitând o cheltuială enormă de resurse. <p>Ele au devenit de multă vreme o parte integrantă a internetului rusesc. Motoarele de căutare sunt acum mecanisme uriașe și complexe care reprezintă nu doar un instrument de căutare a informațiilor, ci și zone tentante pentru afaceri.</p><p>Majoritatea utilizatorilor motoarelor de căutare nu s-au gândit niciodată (sau s-au gândit la asta, dar nu au găsit un răspuns) la principiul de funcționare a motoarelor de căutare, la schema de procesare a cererilor utilizatorilor, în ce constau aceste sisteme și cum funcționează...</p><p>Această clasă de master este concepută pentru a răspunde la întrebarea cum funcționează motoarele de căutare. Totuși, aici nu veți găsi factori care influențează clasarea documentelor. Mai mult, nu ar trebui să contați pe o explicație detaliată a algoritmului Yandex. El, potrivit lui Ilya Segalovici, directorul tehnologiei și dezvoltării motorului de căutare Yandex, poate fi recunoscut „sub tortură” doar de Ilya Segalovici însuși...</p><p><b>2. Conceptul și funcțiile unui motor de căutare</b></p><p>Un sistem de căutare este un complex software și hardware conceput să caute pe internet și să răspundă la o solicitare a utilizatorului, specificată sub forma unei fraze text (interogare de căutare), prin producerea unei liste de legături către surse de informații, în ordinea relevanței ( conform cererii). Cele mai mari motoare de căutare internaționale: <a target="_blank" href="http://www.google.com">"Google"</a>, Yahoo , MSN . Pe internetul rusesc, acestea sunt Yandex, Rambler, Aport.</p><p>Să aruncăm o privire mai atentă asupra conceptului de interogare de căutare folosind motorul de căutare Yandex ca exemplu. Interogarea de căutare trebuie formulată de utilizator în conformitate cu ceea ce dorește să găsească, cât mai scurt și simplu posibil. Să presupunem că vrem să găsim informații în Yandex despre cum să alegem o mașină. Pentru a face acest lucru, deschideți pagina principală Yandex și introduceți textul interogării de căutare „cum să alegeți o mașină”. În continuare, sarcina noastră se rezumă la deschiderea legăturilor furnizate la cererea noastră către sursele de informații de pe Internet. Cu toate acestea, este foarte posibil să nu găsim informațiile de care avem nevoie. Dacă se întâmplă acest lucru, atunci fie trebuie să reformulați cererea, fie baza de date a motorului de căutare într-adevăr nu are nicio informație relevantă cu privire la solicitarea noastră (acest lucru se poate întâmpla atunci când solicitați interogări foarte „înguste”, cum ar fi, de exemplu, „cum să alegeți o mașină în Arhangelsk”)</p><p>Scopul principal al oricărui motor de căutare este de a oferi oamenilor exact informațiile pe care le caută. Și învățați utilizatorii să facă cereri „corecte” către sistem, de exemplu. interogările care respectă principiile de funcționare ale motoarelor de căutare sunt imposibile. Prin urmare, dezvoltatorii creează algoritmi și principii de funcționare pentru motoarele de căutare care ar permite utilizatorilor să găsească informațiile pe care le caută.</p><p>Aceasta înseamnă că motorul de căutare trebuie să „gândească” la fel cum gândește utilizatorul atunci când caută informații. Când un utilizator face o solicitare către un motor de căutare, el dorește să găsească ceea ce are nevoie cât mai repede și ușor posibil. Primind rezultatul, evaluează performanța sistemului, ghidat de mai mulți parametri de bază. A găsit ceea ce căuta? Dacă nu l-a găsit, de câte ori a trebuit să reformuleze interogarea pentru a găsi ceea ce căuta? Câte informații relevante ar putea găsi? Cât de repede a procesat motorul de căutare interogarea? Cât de convenabil au fost prezentate rezultatele căutării? Rezultatul pe care îl căutați a fost primul sau al sutelea? Cât gunoi inutile a fost găsit împreună cu informații utile? Informațiile necesare vor fi găsite la accesarea unui motor de căutare, să zicem, într-o săptămână, sau într-o lună?</p><p>Pentru a satisface toate aceste întrebări cu răspunsuri, dezvoltatorii de motoare de căutare îmbunătățesc constant algoritmii și principiile de căutare, adaugă noi funcții și capabilități și încearcă în toate modurile posibile să accelereze funcționarea sistemului.</p><p><b>3. Principalele caracteristici ale motorului de căutare</b></p><p>Să descriem principalele caracteristici ale motoarelor de căutare:</p><ul><li><i>Completitudine</i><p>Completitudinea este una dintre principalele caracteristici ale unui sistem de căutare, care este raportul dintre numărul de documente găsite prin cerere și numărul total de documente de pe Internet care satisfac cererea dată. De exemplu, dacă există 100 de pagini pe Internet care conțin expresia „cum să alegi o mașină” și doar 60 dintre ele au fost găsite pentru interogarea corespunzătoare, atunci caracterul complet al căutării va fi de 0,6. Evident, cu cât căutarea este mai completă, cu atât este mai puțin probabil ca utilizatorul să nu găsească documentul de care are nevoie, cu condiția ca acesta să existe deloc pe Internet.</p></li><li><i>Precizie</i><p>Precizia este o altă caracteristică principală a unui motor de căutare, care este determinată de gradul în care documentele găsite se potrivesc cu interogarea utilizatorului. De exemplu, dacă interogarea „cum să alegi o mașină” conține 100 de documente, 50 dintre ele conțin expresia „cum să alegi o mașină”, iar restul conțin pur și simplu aceste cuvinte („cum să alegi radioul potrivit și să-l instalezi în o mașină”), atunci precizia căutării este considerată egală cu 50/100 (=0,5). Cu cât căutarea este mai precisă, cu atât utilizatorul va găsi mai repede documentele de care are nevoie, cu atât mai puține tipuri de „gunoi” vor fi găsite printre acestea, cu atât mai rar documentele găsite nu vor corespunde cererii.</p></li><li><i>Relevanţă</i><p>Relevanța este o componentă la fel de importantă a căutării, care se caracterizează prin timpul care trece din momentul în care documentele sunt publicate pe Internet și până când sunt introduse în baza de date a indexului motorului de căutare. De exemplu, a doua zi după ce au apărut știri interesante, un număr mare de utilizatori au apelat la motoarele de căutare cu interogări relevante. Obiectiv, a trecut mai puțin de o zi de la publicarea informațiilor de știri pe această temă, dar principalele documente au fost deja indexate și disponibile pentru căutare, datorită existenței așa-numitei „baze de date rapide” a marilor motoare de căutare, care este actualizat de mai multe ori pe zi.</p></li><li><i>Viteza de căutare</i><p>Viteza de căutare este strâns legată de rezistența la sarcină. De exemplu, conform Rambler Internet Holding LLC, astăzi, în timpul programului de lucru, motorul de căutare Rambler primește aproximativ 60 de solicitări pe secundă. Un astfel de volum de muncă necesită reducerea timpului de procesare a unei cereri individuale. Aici coincid interesele utilizatorului și ale motorului de căutare: vizitatorul dorește să obțină rezultate cât mai repede, iar motorul de căutare trebuie să proceseze solicitarea cât mai repede posibil, pentru a nu încetini calculul interogărilor ulterioare.</p></li><li><i>Vizibilitate</i></li> </ul><p><b>4. Scurt istoric al dezvoltării motoarelor de căutare</b><br></p><p>În perioada inițială a dezvoltării Internetului, numărul utilizatorilor săi a fost mic, iar cantitatea de informații disponibile a fost relativ mică. În cea mai mare parte, doar personalul de cercetare avea acces la internet. În acest moment, sarcina de a căuta informații pe internet nu era la fel de urgentă ca acum.</p><p>Una dintre primele modalități de organizare a accesului la resursele informaționale din rețea a fost crearea de directoare deschise de site-uri, link-uri către resurse în care au fost grupate în funcție de subiecte. Primul astfel de proiect a fost site-ul Yahoo.com, care a fost deschis în primăvara anului 1994. După ce numărul de site-uri din catalog a crescut semnificativ, a fost adăugată posibilitatea de a căuta informațiile necesare în catalog. În sensul deplin, nu era încă un motor de căutare, întrucât zona de căutare era limitată doar la resursele prezente în catalog, și nu la toate resursele de pe Internet.</p><p>Directoarele de link-uri au fost utilizate pe scară largă în trecut, dar și-au pierdut aproape complet popularitatea în prezent. Deoarece chiar și cataloagele moderne, uriașe ca volum, conțin informații doar despre o parte neglijabilă a Internetului. Cel mai mare director al rețelei DMOZ (numit și Proiectul Open Directory) conține informații despre 5 milioane de resurse, în timp ce baza de date a motorului de căutare Google este formată din peste 8 miliarde de documente.</p><p>În 1995, au apărut motoarele de căutare Lycos și AltaVista. Acesta din urmă este lider în domeniul căutării de informații pe Internet de mulți ani.</p><p>În 1997, Sergey Brin și Larry Page au creat motorul de căutare Google ca parte a unui proiect de cercetare la Universitatea Stanford. Google este în prezent cel mai popular motor de căutare din lume!</p><p>În septembrie 1997, motorul de căutare Yandex, care este cel mai popular de pe internetul în limba rusă, a fost anunțat oficial.</p><p>În prezent, există trei motoare de căutare principale (internaționale) - Google, Yahoo și, care au propriile baze de date și algoritmi de căutare. Majoritatea celorlalte motoare de căutare (dintre care există un număr mare) folosesc într-o formă sau alta rezultatele celor trei enumerate. De exemplu, căutarea AOL (search.aol.com) utilizează baza de date Google, în timp ce AltaVista, Lycos și AllTheWeb folosesc baza de date Yahoo.</p><p><b>5. Componența și principiile de funcționare a sistemului de căutare</b></p><p>În Rusia, principalul motor de căutare este Yandex, urmat de Rambler.ru, Google.ru, Aport.ru, Mail.ru. Mai mult, în acest moment, Mail.ru utilizează motorul de căutare și baza de date Yandex.</p><p>Aproape toate motoarele de căutare majore au propria lor structură, diferită de celelalte. Cu toate acestea, este posibil să se identifice principalele componente comune tuturor motoarelor de căutare. Diferențele de structură pot fi doar sub forma implementării mecanismelor de interacțiune a acestor componente.</p><p><b><b>Modul de indexare</b> </b></p><p>Modulul de indexare constă din trei programe auxiliare (roboți):</p><p>Spider este un program conceput pentru a descărca pagini web. Păianjenul descarcă pagina și preia toate linkurile interne de pe pagina respectivă. Codul html al fiecărei pagini este descărcat. Roboții folosesc protocoale HTTP pentru a descărca pagini. Păianjenul funcționează după cum urmează. Robotul trimite cererea „get/path/document” și alte comenzi de solicitare HTTP către server. Ca răspuns, robotul primește un flux de text care conține informații de serviciu și documentul în sine.</p><ul><li>Adresa URL a paginii</li><li>data la care pagina a fost descărcată</li><li>Antet http pentru răspunsul serverului</li><li>corpul paginii (cod html)</li> </ul><p>Crawler („călător”) este un program care urmărește automat toate linkurile găsite pe pagină. Selectează toate linkurile prezente pe pagină. Sarcina sa este de a determina unde ar trebui să meargă păianjenul, pe baza unor legături sau pe baza unei liste predeterminate de adrese. Crawler, urmând linkurile găsite, caută documente noi care sunt încă necunoscute motorului de căutare.</p><p>Indexer (robot indexer) este un program care analizează paginile web descărcate de păianjeni. Indexatorul parsează pagina în părțile sale componente și le analizează folosind proprii algoritmi lexicali și morfologici. Sunt analizate diferite elemente ale paginii, cum ar fi text, titluri, link-uri, caracteristici structurale și de stil, etichete HTML pentru servicii speciale etc.</p><p>Astfel, modulul de indexare vă permite să accesați cu crawlere un anumit set de resurse folosind link-uri, să descărcați pagini întâlnite, să extrageți link-uri către pagini noi din documentele primite și să efectuați o analiză completă a acestor documente.</p><p><b><b>Bază de date</b> </b></p><p>O bază de date, sau index al motorului de căutare, este un sistem de stocare a datelor, o matrice de informații în care sunt stocați parametrii special convertiți ai tuturor documentelor descărcate și procesate de modulul de indexare.</p><p><b><b>Server de căutare</b> </b></p><p>Serverul de căutare este cel mai important element al întregului sistem, deoarece calitatea și viteza căutării depind direct de algoritmii care stau la baza funcționării acestuia.</p><p>Serverul de căutare funcționează după cum urmează:</p><ul><li>Solicitarea primită de la utilizator este supusă analizei morfologice. Se generează mediul informațional al fiecărui document conținut în baza de date (care va fi ulterior afișat în formular, adică informații text corespunzătoare solicitării din pagina cu rezultatele căutării).</li><li>Datele primite sunt transmise ca parametri de intrare la un modul special de clasare. Datele sunt prelucrate pentru toate documentele, drept urmare fiecare document are propriul rating care caracterizează relevanța interogării introduse de utilizator și diferitele componente ale acestui document stocate în indexul motorului de căutare.</li><li>În funcție de alegerea utilizatorului, această evaluare poate fi ajustată prin condiții suplimentare (de exemplu, așa-numita „căutare avansată”).</li><li>În continuare, se generează un fragment, adică pentru fiecare document găsit, titlul, un scurt rezumat care se potrivește cel mai bine interogării și un link către documentul în sine sunt extrase din tabelul de documente, iar cuvintele găsite sunt evidențiate.</li><li>Rezultatele căutării rezultate sunt transmise utilizatorului sub forma unei SERP (Search Engine Result Page) – o pagină cu rezultatele căutării.</li> </ul><p>După cum puteți vedea, toate aceste componente sunt strâns legate între ele și funcționează în interacțiune, formând un mecanism clar, destul de complex pentru funcționarea sistemului de căutare, care necesită cantități uriașe de resurse.</p><p><b>6. Concluzie</b></p><p>Acum să rezumam toate cele de mai sus.</p><ul><li>Scopul principal al oricărui motor de căutare este de a oferi oamenilor exact informațiile pe care le caută.</li><li>Principalele caracteristici ale motoarelor de căutare: <ol><li>Completitudine</li><li>Precizie</li><li>Relevanţă</li><li>Viteza de căutare</li><li>Vizibilitate</li> </ol></li><li>Primul motor de căutare cu drepturi depline a fost proiectul WebCrawler, publicat în 1994.</li><li>Sistemul de căutare include următoarele componente: <ol><li>Modul de indexare</li><li>Bază de date</li><li>Server de căutare</li> </ol></li> </ul><p>Sperăm că clasa noastră de master vă va permite să vă familiarizați mai bine cu conceptul de motor de căutare și să înțelegeți mai bine principalele funcții, caracteristici și principii de funcționare ale motoarelor de căutare.</p> <p>Cele mai bune motoare de căutare pe Internet. Motor de căutare pe internet <b> – </b> Acestea sunt programe speciale de căutare instalate pe o întreagă gamă de mașini specializate. În termeni simpli, este același site web cu un set de programe, doar pe un motor de căutare special (server). Cu ajutorul motoarelor de căutare găsiți toate informațiile de care aveți nevoie. Există o mulțime de motoare de căutare.</p> <p>1. <span>Ce este un motor de căutare pe Internet</p> <p>2. Motoare de căutare populare în țara noastră</p> <p>3. Motoare de căutare populare în străinătate</p> <p>4. Motoare de căutare neobișnuite</p> <p>5. Cum să căutați corect informații pe Internet</p> <p>Cel mai <b>cel mai bun p</b><b>sisteme de căutare</b> in tara noastra:</p> <p>http://www.yandex.ru</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/2-Google.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.google.com</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/3-Aport.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.aport.ru</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/4-Rambler.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.rambler.ru/</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/5-Mail.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://go.mail.ru</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/6-Webalta.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.webalta.ru/</p> <p>Cel mai neiubit și mai intruziv motor de căutare de către toți.</p> <h3><span><b>Motoare de căutare populare în străinătate</b> </span></h3> <p>http://www.altavista.com</p> <p>http://www.alltheweb.com</p> <p>http://www. bing.com</p> <p>http://www.google.com <br>http://www.excite.com <br>http://www.lycos.com <br>http://www.mamma.com</p> <p>http://www.yahoo.com</p> <p>http://www.dmoz.com <br>http://www.hotbot.com <br>http://www.dogpile.com <br>http://www.netscape.com <br>http://www.msn.com <br>http://www.webcrawler.com <br>http://www.jayde.com <br>http://www.aol.com <br>http://www.euroseek.com <br>http://www.teoma.com <br>http://www.about.com <br>http://www.ixquick.com <br>http://www.lookle.com <br>http://www.metaeureka.com <br>http://www.searchspot.com <br>http://www.slider.com <br>http://www.allthesites.com <br>http://www.clickey.com <br>http://www.galaxy.com <br>http://brainysearch.com <br>http://www.orura.com</p> <p>Fiecare țară are propriile sale motoare de căutare populare.</p> <h3><span><b>Motoare de căutare neobișnuite</b> </span></h3> <ul><li><b><i>DuckDuckGo</i> </b>(https://duckduckgo.com/) - un motor de căutare hibrid cu o politică de confidențialitate pentru utilizator și interogările sale de căutare.</li> </ul><p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/7-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <ul><li><b><i><span>TinEye</i> </b> </span><b><i>(http://tineye.com/)</i> </b> este un motor de căutare specializat în căutarea de imagini pe Internet. Recent și-a pierdut relevanța după ce Google a introdus aceeași funcție în căutarea de imagini.</li> </ul><p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/8-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <ul><li><b><i>Guenon</i> </b>(http://www.genon.ru/) este un motor de căutare care colectează și creează conținut pe site-ul său web.</li> </ul><p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/9-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>În aproape fiecare motor de căutare, pe lângă caseta de căutare, există <b>link-uri</b> către cele mai populare site-uri de știri și site-uri cu anumite subiecte.</p> <h3><span><b>Cum să căutați corect informații pe Internet</b> </span></h3> <p>Fiecare motor de căutare are propriii algoritmi (reguli) pentru căutarea informațiilor.</p> <p>Pentru a găsi unele informații pe Internet printr-un motor de căutare, trebuie să introduceți în câmpul de căutare <b>cerere</b>. Dacă introduceți un cuvânt, atunci această solicitare vă va oferi mii de link-uri către site-uri unde este menționat acest cuvânt.</p> <p>Prin urmare, este necesar să introduceți o interogare cât mai specifică, constând din două, trei sau mai multe fraze.</p> <p>Să ne uităm la un exemplu de interogare de motor de căutare <b>Yandex</b>.</p> <p>Să presupunem că doriți să găsiți informații despre cumpărarea unui computer. Dacă scrieți un cuvânt în caseta de căutare „ <b>Calculator</b>„, atunci vei primi 133 de milioane de răspunsuri</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/10-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Trebuie să solicitați o cerere mai precisă. Este mai bine să indicați ce computer doriți să cumpărați și unde (în ce oraș).</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/11-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Atunci motorul de căutare vă va oferi mult mai puține răspunsuri la întrebarea dvs.</p> <p>Motorului de căutare nu îi pasă deloc dacă introduceți interogarea cu litere mari sau mici.</p> <p>Yandex face distincție între substantive și adjective, dar ignoră complet terminațiile.</p> <p>De asemenea, este complet indiferent la cazuri, plurale și altele asemenea.</p> <p>Pentru a face căutarea mai precisă, trebuie să puneți interogarea între ghilimele sau să puneți un semn de exclamare înaintea cuvântului.</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/12-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Acum uitați-vă la aceeași interogare, dar fără semnele exclamației.</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/13-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Vedeți diferența? Cu semnele exclamării, numărul răspunsurilor nu este de 2 milioane, ci de 186 de mii.</p> <p>Dacă puneți un semn de exclamare în fața unui cuvânt cu majusculă, vi se vor oferi răspunsuri care conțin acel anumit cuvânt cu majusculă.</p> <p>Dacă cuvântul este la caz nominativ și aveți nevoie de informații despre exact un astfel de cuvânt și exact așa cum l-ați scris, atunci puneți două semne de exclamare în fața acestui cuvânt. De exemplu: <b>!!Minge</b> .</p> <p>Căutarea vă va oferi răspunsuri pentru exact acest cuvânt " <b>Minge</b>„cum ai scris-o. Nu " <b>minge</b>", Nu " <b>bile</b>", și cu majusculă.</p> <p>Dacă scrieți o frază cu cuvântul " <b>pe</b>", atunci Yandex va ignora " <b>pe</b>" De exemplu: " <b>pe raft</b>" Căutarea va fi efectuată numai folosind cuvântul " <b>raft</b> ».</p> <p>Pentru ca el să ia în considerare și să nu o ignore, este necesar înaintea cuvântului „ <b>pe</b>» pune semnul plus – « <b>+pe</b> ».</p> <p>Fiecare motor de căutare are propriul algoritm de căutare, așa că dacă utilizați un anumit motor de căutare și doriți să învățați cum să compuneți corect interogări, trebuie doar să introduceți „ <span><b>regulile de căutare în</b><b>Google</b> </span>" sau " <span><b>regulile de căutare în Yandex</b> </span>", urmați linkul din răspunsul la solicitarea dvs. și citiți informațiile necesare.</p> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy loading=lazy>");</script> </div> <div class="post-social-counters-block"> <div style="margin-top: 12px"> <noindex></noindex> </div> </div> </div> </div> <a name="comments"></a> <h3 class="best-theme-posts-title">Cele mai bune articole pe această temă</h3> <div class="container-fluid"> <div class="best-theme-posts row"> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/ro/sony-xperia-tablet-s---tehnicheskie-harakteristiki-luchshie-planshety-sony-apparatnaya.html"> <div class="img_container"><img src="/uploads/ccdcb76ed5e8d140d08c72c019269f63.jpg" border="0" alt="Cele mai bune tablete Sony Platformă hardware, durata bateriei" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Cele mai bune tablete Sony Platformă hardware, durata bateriei</span> </a> </div> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/ro/vyiti-iz-profilya-android-market-kak-vyiti-iz-akkaunta-google-play-market-vyhodim-iz.html"> <div class="img_container"><img src="/uploads/043e51c7dde5fca4f43c40b9e83301df.jpg" border="0" alt="Cum să vă deconectați de la contul dvs. Google Play Market" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Cum să vă deconectați de la contul dvs. Google Play Market</span> </a> </div> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/ro/kakie-razmery-formatov-a1-a2-a3-a4-v-santimetrah-razmery.html"> <div class="img_container"><img src="/uploads/485f1e137042e403b89a55e99822b003.jpg" border="0" alt="Dimensiunile formatelor A0, A1, A2, A3, A4, A5, ... A10 Foi a1 a2 a3 a4 a5" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Dimensiunile formatelor A0, A1, A2, A3, A4, A5, ... A10 Foi a1 a2 a3 a4 a5</span> </a> </div> </div> </div> </div> <a name="comments"></a> </div> <div class="right-column col-sm-4 col-md-4"> <div class="write"> <span class="tags-title">Categorii:</span> <ul style="height: 286px;" id="right-tags" data-tagscount="18" data-currentmaxtag="10" class="tags"> <li class=""><a href="https://bumotors.ru/ro/category/programs/">Programe</a></li> <li class=""><a href="https://bumotors.ru/ro/category/safety/">Siguranță</a></li> <li class=""><a href="https://bumotors.ru/ro/category/windows-10/">Windows 10</a></li> <li class=""><a href="https://bumotors.ru/ro/category/iron/">Fier</a></li> <li class=""><a href="https://bumotors.ru/ro/category/windows-8/">Windows 8</a></li> <li class=""><a href="https://bumotors.ru/ro/category/vkontakte/">In contact cu</a></li> <li class=""><a href="https://bumotors.ru/ro/category/errors/">Erori</a></li> </ul> </div> <div class="banner"> </div> </div> </div> </div> <div style="clear:both"></div> </div> <div class="footer"> <div class="subscribe"> <div class="main-wrapper container"> <div class="row"> <div class="col-sm-8"> </div> <div class="col-sm-4"> <div class="social"> <a href="https://vk.com/share.php?url=https://bumotors.ru/osnovnye-poiskovye-sistemy-v-internete-poiskovye-sistemy-interneta-yandeks.html" class="vk social-ico"></a> <a href="https://www.facebook.com/sharer/sharer.php?u=https://bumotors.ru/osnovnye-poiskovye-sistemy-v-internete-poiskovye-sistemy-interneta-yandeks.html" class="fb social-ico"></a> <a href="https://www.twitter.com/share?url=https%3A%2F%2Fbumotors.ru%2Fro%2Fosnovnye-poiskovye-sistemy-v-internete-poiskovye-sistemy-interneta-yandeks.html" class="tw social-ico"></a> </div> </div> </div> </div> </div> <div class="info"> <div class="main-wrapper container"> <div class="row"> <span class="footer-info col-xs-12">© 2024 bumotors.ru. Cum se configurează smartphone-uri și PC-uri. Portal informativ.</span> </div> </div> </div> </div> </body> </html>