Cum se configurează smartphone-uri și PC-uri. Portal informativ
  • Acasă
  • Interesant
  • Motoare de căutare celebre pe Internet. Motoare de căutare în Rusia

Motoare de căutare celebre pe Internet. Motoare de căutare în Rusia

Motoarele de căutare (SE) au fost o parte indispensabilă a Internetului de ceva timp. Astăzi sunt mecanisme uriașe și complexe, care nu sunt doar un instrument pentru găsirea oricăror informații necesare, ci și domenii destul de interesante pentru afaceri.


Mulți utilizatori de căutare nu s-au gândit niciodată la principiile muncii lor, la modalitățile de procesare a cererilor utilizatorilor, la modul în care sunt construite și funcționează aceste sisteme. Acest material va ajuta oamenii care sunt implicați în optimizare și să înțeleagă structura și funcțiile de bază ale motoarelor de căutare.

Funcții și concept de PS

Sistem de căutare Este un complex hardware și software care este conceput pentru a îndeplini funcția de căutare pe Internet și răspunde la o solicitare a utilizatorului, care este de obicei stabilită sub forma unei fraze text (sau, mai precis, a unei interogări de căutare), prin emiterea o listă de link-uri către sursele de informare, realizată în funcție de relevanță. Cele mai comune și mai mari motoare de căutare sunt Google, Bing, Yahoo, Baidu. În Runet - Yandex, Mail.Ru, Rambler.

Să aruncăm o privire mai atentă asupra sensului însuși al interogării de căutare, luând ca exemplu sistemul Yandex.

Solicitarea trebuie formulată de utilizator în deplină concordanță cu subiectul căutării sale, cât mai simplu și concis posibil. De exemplu, dorim să găsim informații în acest motor de căutare: „cum să alegi o mașină pentru tine”. Pentru a face acest lucru, deschideți pagina principală și introduceți o interogare de căutare „cum să alegi o mașină”. Apoi, funcțiile noastre se rezumă la urmărirea legăturilor furnizate către sursele de informații din rețea.




Dar chiar și acționând în acest fel, este posibil să nu obțineți informațiile de care avem nevoie. Dacă am primit un astfel de rezultat negativ, trebuie doar să-ți reformezi cererea sau în baza de căutare chiar nu există informații utile despre acest tip de solicitare (acest lucru este foarte posibil cu parametrii de interogare „îngust”, cum ar fi , de exemplu, „cum să alegi o mașină în Anadyr „).

Sarcina cea mai de bază a oricărui motor de căutare este de a oferi oamenilor exact tipul de informații de care au nevoie. Și este practic imposibil să instruiți utilizatorii să creeze tipul „corect” de interogări către motoarele de căutare, adică expresii care să corespundă principiilor lor de lucru.

De aceea, dezvoltatorii motoarelor de căutare creează astfel de principii și algoritmi pentru munca lor, care ar permite utilizatorilor să găsească informațiile de care sunt interesați. Aceasta înseamnă că sistemul trebuie să „gândească” la fel cum gândește o persoană când caută informațiile necesare pe Internet.

Când își introduce interogarea într-un motor de căutare, vrea să găsească ceea ce are nevoie, cât mai ușor și rapid posibil. După ce a primit rezultatul, utilizatorul își face propria evaluare a funcționării sistemului, ghidat de mai multe criterii. A reușit să găsească informațiile de care avea nevoie? Dacă nu, de câte ori a trebuit să reformateze textul de interogare pentru a-l găsi? Cât de relevante au fost informațiile primite? Cât de repede i-a procesat motorul de căutare cererea? Cât de convenabile au fost furnizate rezultatele căutării? Rezultatul dorit a fost primul sau a fost pe locul 30? Câte deșeuri (informații inutile) au fost găsite împreună cu informații utile? Vor exista informații relevante pentru el, când folosește PS, într-o săptămână sau într-o lună?




Pentru a obține răspunsurile corecte la astfel de întrebări, dezvoltatorii de căutare îmbunătățesc constant principiile de clasare și algoritmii săi, adăugându-le noi caracteristici și funcții și, prin orice mijloace, încearcă să facă sistemul să funcționeze mai rapid.

Principalele caracteristici ale motoarelor de căutare

Să desemnăm principalele caracteristici ale căutării:

Completitudine.

Completitudinea este una dintre cele mai importante caracteristici ale unei căutări, este raportul dintre numărul de documente informative găsite la cerere și numărul lor total pe Internet aferent acestei solicitări. De exemplu, există 100 de pagini pe Internet care au expresia „cum să alegi o mașină”, iar pentru aceeași interogare, au fost selectate doar 60 din total, atunci în acest caz caracterul complet al căutării va fi de 0,6. Este clar că, cu cât căutarea în sine este mai completă, cu atât este mai probabil ca utilizatorul să găsească exact documentul de care are nevoie, desigur, dacă acesta există.

Precizie.

O altă funcție principală a unui motor de căutare este acuratețea. Determină gradul de corespondență cu solicitarea utilizatorului a paginilor găsite pe Web. De exemplu, dacă există sute de documente pentru expresia cheie „cum să alegi o mașină”, jumătate dintre ele conțin această expresie, iar restul pur și simplu conțin astfel de cuvinte (cum să alegi corect un radio auto și să-l instalezi într-o mașină " ), atunci precizia căutării este egală cu 50/100 = 0,5.

Cu cât căutarea este mai precisă, cu atât utilizatorul va găsi mai repede informațiile de care are nevoie, cu atât mai puține „gunoaie” vor fi găsite printre rezultate, cu atât mai puține documente găsite nu vor corespunde sensului interogării.

Relevanţă.

Aceasta este o componentă semnificativă a căutării, care se caracterizează prin timpul care trece de la momentul publicării informațiilor pe Internet până la introducerea lor în baza de index a motorului de căutare.

De exemplu, a doua zi după ce au apărut informațiile despre lansarea noului iPad, mulți utilizatori au apelat la căutarea cu tipurile corespunzătoare de interogări. În majoritatea cazurilor, informațiile despre această știre sunt deja disponibile în căutare, deși a trecut foarte puțin timp de la apariția ei. Acest lucru se datorează faptului că marile motoare de căutare au o „bază rapidă”, care este actualizată de mai multe ori pe zi.

Viteza de căutare.

O funcție precum viteza de căutare este strâns legată de așa-numita „rezistență la sarcină”. În fiecare secundă, un număr mare de persoane apelează la căutare, un astfel de volum de muncă necesită o reducere semnificativă a timpului de procesare a unei cereri. Aici, interesele atât ale motorului de căutare, cât și ale utilizatorului coincid complet: vizitatorul dorește să obțină rezultate cât mai repede, iar motorul de căutare trebuie să-și proceseze cererea cât mai repede pentru a nu încetini procesarea solicitărilor ulterioare.

Vizibilitate.

O prezentare clară a rezultatelor este un element esențial al confortului căutării. Pentru multe interogări, motorul de căutare găsește mii și, în unele cazuri, milioane de documente diferite. Din cauza compoziției neclare a frazelor cheie pentru căutare sau a inexactității acesteia, chiar și primele rezultate ale unei interogări nu au întotdeauna doar informațiile necesare.

Aceasta înseamnă că o persoană trebuie adesea să facă propria căutare printre rezultatele furnizate. Diverse componente ale paginilor cu rezultate ale motorului de căutare ajută la navigarea în rezultatele căutării.

Istoria dezvoltării motoarelor de căutare

Când Internetul a început să se dezvolte, numărul utilizatorilor săi obișnuiți era mic, iar cantitatea de informații de accesat era relativ mică. Practic, doar specialiştii din domeniile de cercetare au avut acces la această reţea. La acel moment, sarcina de a găsi informații nu era la fel de urgentă ca acum.

Una dintre cele mai timpurii metode de organizare a accesului larg la resursele informaționale a fost crearea de cataloage de site-uri, iar linkurile către acestea au început să fie grupate pe subiecte. Acest prim proiect a fost resursa Yahoo.com, care a fost deschisă în primăvara anului 1994. Ulterior, când numărul de site-uri din directorul Yahoo a crescut semnificativ, a fost adăugată o opțiune de căutare a informațiilor necesare în director. Nu era încă pe deplin un motor de căutare, deoarece zona unei astfel de căutări era limitată doar la site-urile incluse în acest director și nu la absolut toate resursele de pe Internet. Directoarele de linkuri au fost utilizate pe scară largă anterior, dar acum și-au pierdut aproape complet popularitatea.

La urma urmei, chiar și cataloagele uriașe de astăzi au informații despre o parte nesemnificativă a site-urilor de pe Internet. Cel mai faimos și cel mai mare director din lume are informații pe cinci milioane de site-uri, când baza de date Google conține informații pe peste 25 de miliarde de pagini.




Primul motor de căutare real a fost WebCrawler, care a apărut în 1994.

În anul următor, au apărut AltaVista și Lycos. Mai mult, primul a fost lider în căutarea de informații pentru o perioadă foarte lungă de timp.




În 1997, Sergey Brin, împreună cu Larry Page, au creat motorul de căutare Google ca proiect de cercetare la Universitatea Stanford. Astăzi este Google, cel mai solicitat și popular motor de căutare din lume.




În septembrie 1997, a fost anunțat PS Yandex (oficial), care este în prezent cel mai popular motor de căutare de pe Runet.




Conform datelor de pe septembrie 2015, cotele motoarelor de căutare din lume sunt distribuite după cum urmează:
  • Google - 69,24%;
  • Bing - 12,26%;
  • Yahoo! - 9,19%;
  • Baidu - 6,48%;
  • AOL - 1,11%;
  • Întrebați - 0,23%;
  • Excitație - 0,00%


Conform datelor de pe decembrie 2016, ponderea motoarelor de căutare în Runet:

  • Yandex - 48,40%
  • Google - 45,10%
  • Search.Mail.ru - 5,70%
  • Rambler - 0,40%
  • Bing - 0,30%
  • Yahoo - 0,10%

Cum funcționează motorul de căutare

În Rusia, principalul motor de căutare este Yandex, apoi Google și apoi [email protected]. Toate motoarele de căutare mari au propria lor structură, care este foarte diferită de celelalte. Totuși, putem evidenția elementele de bază comune tuturor motoarelor de căutare.

Modul de indexare.

Această componentă constă din trei programe de robot:

Păianjen(în engleză spider) - un program care este conceput pentru a descărca pagini web. Păianjenul descarcă o anumită pagină, extragând simultan toate linkurile din ea. Codul html este descărcat de aproape fiecare pagină. Pentru a face acest lucru, roboții folosesc protocoale HTTP.




„Pianjenul” funcționează după cum urmează. Robotul trimite cererea către server „get / path / document” și alte comenzi de solicitare HTTP. Ca răspuns, programul robot primește un flux de text care conține informații de tip serviciu și, desigur, documentul în sine.
  • URL-ul paginii descărcate;
  • data la care pagina a fost descărcată;
  • antet de răspuns http server;
  • codul html, „corpul” paginii.
Tractor pe şenile Păianjen („călător”). Acest program merge automat la toate linkurile care se găsesc pe pagină și, de asemenea, le evidențiază. Sarcina sa este de a determina unde ar trebui să meargă păianjenul în viitor, pe baza acestor legături sau pe baza unei anumite liste de adrese.

Indexator(un robot de indexare) este un program care analizează paginile pe care păianjenii le-au descărcat.



Indexatorul parsează complet pagina în elementele sale constitutive și le analizează folosind tipurile morfologice și lexicale de algoritmi.

Analiza este efectuată pe diferite părți ale paginii, cum ar fi titluri, text, link-uri, caracteristici de stil și structura, etichete html etc.

Astfel, modulul de indexare face posibilă urmărirea legăturilor unui anumit număr de resurse, descărcarea paginilor, extragerea masei de linkuri către pagini noi din documentele primite și analiza detaliată a acestora.

Bază de date

Bază de date(sau indexul motorului de căutare) este un complex de stocare a datelor, o serie de informații în care parametrii fiecărui document descărcat și procesat procesat de modulul de indexare sunt stocați într-un anumit mod.

Server de căutare

Acesta este cel mai important element al întregului sistem, deoarece viteza și, bineînțeles, calitatea căutării depind direct de algoritmii care stau la baza funcționalității acestuia.

Motorul de căutare funcționează după cum urmează:

  • Solicitarea care vine de la utilizator este supusă analizei morfologice. Se generează mediul informațional al oricărui document disponibil în baza de date (va fi afișat în continuare sub formă de fragment, adică câmpul de informații al textului corespunzător acestei solicitări).
  • Datele primite sunt transmise ca parametri de intrare la un modul de clasare specializat. Ele sunt procesate pentru toate documentele și, ca urmare, pentru fiecare astfel de document, se calculează propriul rating, care caracterizează relevanța unui astfel de document pentru solicitarea utilizatorului și alte componente.
  • În funcție de condițiile stabilite de utilizator, acest rating poate fi ajustat prin altele suplimentare.
  • Apoi este generat fragmentul în sine, adică pentru orice document găsit, din tabelul corespunzător sunt extrase un titlu, o adnotare care răspunde cel mai bine solicitării și un link către acest document, în timp ce formele și cuvintele găsite sunt evidențiate.
  • Rezultatele căutării rezultate sunt transmise persoanei care a efectuat-o sub forma unei pagini căreia îi sunt date rezultatele căutării (SERP).
Toate aceste elemente sunt strâns interconectate și funcționează, interacționând, formând un mecanism distinct, dar destul de complicat pentru funcționarea PS, care necesită cheltuieli uriașe de resurse.

La prima vedere, poate părea că numai Yandex poate fi mai bun decât Google și nici măcar asta nu este un fapt. Aceste companii investesc sume uriașe de bani în inovare și dezvoltare. Are cineva cu adevărat șanse nu doar să concureze cu liderii, ci și să câștige? Răspunsul lui Lifehacker: „Da!” Există mai multe motoare de căutare care au reușit. Să aruncăm o privire la eroii noștri.

Ce este

Este un motor de căutare open source destul de cunoscut. Serverele sunt situate în SUA. Pe lângă propriul robot, motorul de căutare folosește rezultate din alte surse: Yahoo! Căutați BOSS, Wikipedia, Wolfram | Alpha.

Cu atât mai bine

DuckDuckGo se poziționează ca un motor de căutare care oferă confidențialitate și confidențialitate maximă. Sistemul nu colectează date despre utilizator, nu stochează jurnalele (fără istoric de căutare), utilizarea cookie-urilor este cât se poate de limitată.

DuckDuckGo nu colectează și nu partajează informații personale de la utilizatori. Aceasta este politica noastră de confidențialitate.
Gabriel Weinberg, fondatorul DuckDuckGo

Pentru ce ai nevoie

Toate motoarele de căutare majore încearcă să personalizeze rezultatele căutării pe baza datelor despre persoana din fața monitorului. Acest fenomen se numește „bulă de filtru”: utilizatorul vede doar acele rezultate care sunt de acord cu preferințele sale sau pe care sistemul le consideră ca atare.

DuckDuckGo creează o imagine obiectivă care nu depinde de comportamentul tău trecut pe web și scapă de anunțurile tematice Google și Yandex pe baza interogărilor tale. DuckDuckGo facilitează căutarea informațiilor în limbi străine: Google și Yandex acordă în mod implicit preferință site-urilor în limba rusă, chiar dacă solicitarea este introdusă într-o altă limbă.

Ce este

„” Este un sistem de metacăutare rusesc dezvoltat de absolvenții MSU Viktor Lavrenko și Vladimir Chernyshov. Căută în indexurile Google, Bing, Yandex și altele și are, de asemenea, propriul algoritm de căutare.

Cu atât mai bine

Căutarea în indexurile tuturor motoarelor de căutare majore vă permite să generați rezultate relevante. În plus, „Nigma” împarte rezultatele în mai multe grupuri tematice (clustere) și solicită utilizatorului să restrângă câmpul de căutare, eliminând cele inutile sau evidențiind cele prioritare. Datorită modulelor „Matematică” și „Chimie”, puteți rezolva probleme de matematică chiar în bara de căutare și puteți interoga rezultatele reacțiilor chimice.

Pentru ce ai nevoie

Elimină necesitatea de a căuta aceeași interogare în diferite motoare de căutare. Sistemul cluster facilitează manipularea rezultatelor căutării. De exemplu, Nigma colectează rezultatele din magazinele online într-un cluster separat. Dacă nu intenționați să cumpărați ceva, atunci pur și simplu excludeți acest grup. Alegând grupul „Site-uri în limba engleză”, veți primi rezultate numai în limba engleză. Modulele „Matematică” și „Chimie” îi vor ajuta pe școlari.

Din păcate, proiectul nu este în curs de dezvoltare, deoarece dezvoltatorii și-au mutat activitățile pe piața vietnameză. Cu toate acestea, „Nigma” nu numai că nu este depășit, dar, în unele lucruri, oferă încă un avans pentru Google. Sperăm că dezvoltarea se va relua.

Ce este

not Evil este un motor de căutare pentru rețeaua anonimă Tor. Pentru a-l folosi, trebuie să accesați această rețea, de exemplu, lansând un browser specializat cu același nume. not Evil nu este singurul motor de căutare de acest gen. Există LOOK (căutarea implicită în browserul Tor, accesibilă de pe internetul obișnuit) sau TORCH (unul dintre cele mai vechi motoare de căutare din rețeaua Tor) și altele. Ne-am hotărât pe Not Evil din cauza aluziei clare la Google însuși (doar uitați-vă la pagina de pornire).

Cu atât mai bine

Căutări în care Google, Yandex și alte motoare de căutare sunt închise în principiu.

Pentru ce ai nevoie

Există multe resurse în rețeaua Tor care nu pot fi găsite pe internetul care respectă legea. Și pe măsură ce autoritățile își întăresc controlul asupra conținutului web, numărul acestora va crește. Tor este un fel de rețea în cadrul rețelei: cu propriile rețele sociale, trackere de torrent, media, piețe, bloguri, biblioteci și așa mai departe.

YaCy

Ce este

YaCy este un motor de căutare descentralizat bazat pe rețele P2P. Fiecare computer pe care este instalat modulul software principal scanează Internetul independent, adică este un analog al unui robot de căutare. Rezultatele obținute sunt colectate într-o bază de date comună, care este utilizată de toți participanții la YaCy.

Cu atât mai bine

Este dificil de spus dacă este mai bine sau mai rău aici, deoarece YaCy este o abordare complet diferită a organizării căutării. Absența unui singur server și a unui singur proprietar de companie face ca rezultatele să fie complet independente de preferințele cuiva. Autonomia fiecărui nod exclude cenzura. YaCy este capabil să caute în deep web și în rețele publice neindexate.

Pentru ce ai nevoie

Dacă sunteți un susținător al software-ului open source și al internetului gratuit, care nu este influențat de agențiile guvernamentale și de marile corporații, atunci YaCy este alegerea dvs. Poate fi folosit și pentru a organiza căutări în cadrul unei rețele corporative sau autonome. Și în timp ce YaCy nu este foarte util în viața de zi cu zi, este o alternativă demnă la Google în ceea ce privește procesul de căutare.

Pipl

Ce este

Pipl este un sistem conceput pentru a căuta informații despre o anumită persoană.

Cu atât mai bine

Autorii lui Pipl susțin că algoritmii lor specializați caută mai eficient decât motoarele de căutare „obișnuite”. În special, sursele prioritare de informații sunt profilurile din rețelele sociale, comentariile, listele de participanți și diverse baze de date în care sunt publicate informații despre persoane, cum ar fi bazele de date cu hotărâri judecătorești. Conducerea lui Pipl în acest domeniu a fost validată de Lifehacker.com, TechCrunch și alții.

Pentru ce ai nevoie

Dacă aveți nevoie să găsiți informații despre o persoană care locuiește în Statele Unite, atunci Pipl va fi mult mai eficient decât Google. Bazele de date ale instanțelor ruse sunt aparent inaccesibile unui motor de căutare. Prin urmare, el nu se descurcă atât de bine cu cetățenii Rusiei.

Ce este

Un alt motor de căutare specializat. Caută diverse sunete (casă, natură, mașini, oameni și așa mai departe) în surse deschise. Serviciul nu acceptă solicitări în limba rusă, dar există o listă impresionantă de etichete în limba rusă pe care le puteți căuta.

Cu atât mai bine

Rezultatele sunt doar sunete și nimic mai mult. În setările de căutare, puteți seta formatul dorit și calitatea sunetului. Toate sunetele găsite sunt disponibile pentru descărcare. Există o căutare de sunete după model.

Pentru ce ai nevoie

Dacă trebuie să găsiți rapid sunetul unei împușcături de muschetă, loviturile unei ciocănitoare suge sau țipătul lui Homer Simpson, atunci acest serviciu este pentru dvs. Și am ales asta doar din cererile disponibile în limba rusă. În engleză, spectrul este și mai larg. Dar serios, un serviciu specializat își asumă un public specializat. Dar dacă este util?

Viața motoarelor de căutare alternative este adesea trecătoare. Lifehacker l-a întrebat pe Serghei Petrenko, fostul director general al filialei ucrainene Yandex, despre perspectivele pe termen lung ale unor astfel de proiecte.

În ceea ce privește soarta motoarelor de căutare alternative, este simplu: să fie proiecte foarte de nișă cu un public restrâns, așadar, fără perspective comerciale clare, sau, dimpotrivă, cu claritate deplină a absenței lor.

Dacă te uiți la exemplele din articol, poți vedea că astfel de motoare de căutare fie sunt specializate într-o nișă îngustă, dar solicitată, care, poate doar până acum, nu a crescut suficient pentru a fi vizibilă pe radarele Google sau Yandex, fie testează. o ipoteză originală în clasament.care nu este încă aplicabilă în căutarea obișnuită.

De exemplu, dacă o căutare pe Tor se dovedește brusc a fi solicitată, adică rezultatele de acolo vor fi necesare cel puțin unui procent din audiența Google, atunci, desigur, motoarele de căutare obișnuite vor începe să rezolve problema cum pentru a le găsi și a le arăta utilizatorului. Dacă comportamentul publicului arată că rezultatele par mai relevante pentru o pondere vizibilă de utilizatori într-un număr semnificativ de interogări, date fără a lua în considerare factorii dependenți de utilizator, atunci Yandex sau Google vor începe să ofere astfel de rezultate.

„A fi mai bun” în contextul acestui articol nu înseamnă „a fi mai bun în orice”. Da, în multe aspecte, eroii noștri sunt departe de Google și Yandex (chiar și Bing este departe). Dar, pe de altă parte, fiecare dintre aceste servicii oferă utilizatorului ceva ce giganții industriei de căutare nu pot oferi.

Să aruncăm o privire la cele mai populare motoare de căutare din Rusia și din lume.

Cele mai populare motoare de căutare din Rusia

Yandex.

Yandex este cel mai popular sistem de căutare a informațiilor de pe Runet... În ceea ce privește siguranța, ocupă primul loc! Aleasă de 27 de milioane de oameni.

Serviciul de căutare rusesc Yandex a aparut in 1997. Liderul fără îndoială al părții de limbă rusă a internetului. Are unul dintre cele mai bune motoare de căutare regionale din lume. Există capacitatea de a găsi oameni pe rețelele sociale. Acest sistem are un număr mare de suplimente utile:

  • Yandex.Disk
  • Carduri
  • Program de zboruri, trenuri și autobuze
  • Vremea și multe altele.

Este foarte solicitat în rândul țărilor vecine, deoarece managementul serviciului ține cont de cerințele utilizatorilor din țările CSI.

Poștă

Mail.ru este un serviciu de mail promițător, care are un număr mare de fani.

Nu cu mult timp în urmă, am început să mă poziționez ca motor de căutare. Poate fi setat implicit la încărcarea diferitelor aplicații.

Aport

Un motor de căutare destul de comun în partea de limbă rusă a internetului. În ceea ce privește popularitatea, acest serviciu ocupă locul al doilea în Rusia.


Avantajele motorului de căutare Aport:

  1. Se ia în considerare morfologia limbii ruse.
  2. Puteți evidenția contextul cuvintelor afișate.
  3. Cauta dupa categorie.
  4. Există o funcție de rafinare a rezultatelor căutării în conformitate cu serverele și secțiunile disponibile din catalog.
  5. Oricare dintre solicitări poate fi tradusă în engleză și invers.

Hoinar

Reprezintă primul sistem de regăsire a informațiilor, care a devenit disponibil pe teritoriul Rusiei. Anterior, a fost principalul concurent al „Yandex”, deoarece folosește tehnologia de căutare Yandex. Se ia în considerare morfologia limbii ruse. În ratingul nostru, ea a ocupat un loc al treilea onorabil.


Cele mai populare motoare de căutare din lume

Google

Google este un gigant global. Prin urmare, nu este surprinzător faptul că acest motor de căutare deține cea mai mare parte a traficului mondial.


motor de căutare Google

Problemă live foarte simplă și de înaltă calitate și un număr mare de instrumente utile:

  • Documentație;
  • Bloguri;
  • YouTube;
  • Retele sociale;
  • Google + și o mulțime de lucruri interesante.

Baidu

Baidu este un motor de căutare chinezesc. China este cel mai populat loc de pe pământ. De asemenea, trebuie remarcat faptul că accesul la World Wide Web este complet închis.


Acest „motor de căutare” a fost preferat de milioane de oameni. Vom pleca de la faptul că pur și simplu nu au de ales, dar, cu toate acestea, judecând după recenzii, acest sistem găsește o mulțime de informații interesante și utile.

Bing

Bing este un motor de căutare de la Microsoft. La cerere în Europa și SUA.


Comparativ cu Google, are trafic redus. Setați ca căutare standard în .

Yahoo!

Astăzi este un catalog de resurse și un „motor de căutare” într-o singură persoană, serviciul funcționând ca un proiect independent. În ceea ce privește popularitatea, a ocupat a patra poziție în ratingul nostru.

Beneficiile motorului de căutare Yahoo:

  1. Poate căuta informații de diferite tipuri în limba rusă.
  2. Este folosit un director de link-uri utile către resursele rețelei din diferite țări ale lumii.

AltaVista

Un alt motor de căutare care caută pe internet informațiile de care aveți nevoie. Nivelul de popularitate i-a permis să fie pe a cincea linie.

Beneficiile motorului de căutare AltaVista:

  1. Există sprijin pentru spațiul de limbă rusă.

Lycos

Director comun al resurselor de rețea. Site-ul se bazează pe un motor de căutare împreună cu un rubricator de portaluri web. Oferă link-uri către diverse ediții localizate ale catalogului. Se folosește engleza... În ceea ce privește popularitatea, se află pe locul șase în ratingul nostru.


Motorul de căutare ucrainean Meta

Sistem unificat de căutare de origine ucraineană. Nivelul faimei ia permis să ocupe locul șapte.

Beneficiile motorului de căutare Meta:

  1. Serviciul ia în considerare caracteristicile morfologice ale limbii ruse și ucrainene.
  2. Dacă este necesar, puteți evidenția diferitele cuvinte găsite în context.
  3. De asemenea, va fi posibilă traducerea rezultatelor căutării și a interogărilor de căutare în rusă, ucraineană și engleză.

Căutare FTP

„Motor de căutare de fișiere”. Unul dintre cele mai mari sute de servere FTP din Federația Rusă. Nivelul de popularitate corespunde locului opt.


Ce este

DuckDuckGo este un motor de căutare open source destul de cunoscut. Serverele sunt situate în SUA. Pe lângă propriul robot, motorul de căutare folosește rezultatele din alte surse: Yahoo, Bing, Wikipedia.

Cu atât mai bine

DuckDuckGo se poziționează ca un motor de căutare care oferă confidențialitate și confidențialitate maximă. Sistemul nu colectează date despre utilizator, nu stochează jurnalele (fără istoric de căutare), utilizarea cookie-urilor este cât se poate de limitată.

DuckDuckGo nu colectează și nu partajează informații personale de la utilizatori. Aceasta este politica noastră de confidențialitate.

Gabriel Weinberg, fondatorul DuckDuckGo

Pentru ce ai nevoie

Toate motoarele de căutare majore încearcă să personalizeze rezultatele căutării pe baza datelor despre persoana din fața monitorului. Acest fenomen se numește „bulă de filtru”: utilizatorul vede doar acele rezultate care sunt de acord cu preferințele sale sau pe care sistemul le consideră ca atare.

Formează o imagine obiectivă care nu depinde de comportamentul tău trecut pe web și scapă de publicitatea tematică Google și Yandex, pe baza interogărilor tale. DuckDuckGo facilitează căutarea de informații în limbi străine, în timp ce Google și Yandex în mod implicit acordă preferință site-urilor în limba rusă, chiar dacă cererea este introdusă într-o altă limbă.


Ce este

not Evil este un motor de căutare pentru rețeaua anonimă Tor. Pentru a o folosi, trebuie să mergeți la această rețea, de exemplu lansând una specializată.

not Evil nu este singurul motor de căutare de acest gen. Există LOOK (căutarea implicită în browserul Tor, accesibilă de pe internetul obișnuit) sau TORCH (unul dintre cele mai vechi motoare de căutare din rețeaua Tor) și altele. Ne-am hotărât pe not Evil din cauza indicii clare de la Google (doar uitați-vă la pagina de pornire).

Cu atât mai bine

Căutări în care Google, Yandex și alte motoare de căutare sunt închise în principiu.

Pentru ce ai nevoie

Există multe resurse în rețeaua Tor care nu pot fi găsite pe internetul care respectă legea. Iar numărul lor va crește pe măsură ce guvernul își va înăspri controlul asupra conținutului web. Tor este un fel de rețea în cadrul rețelei cu propriile rețele sociale, trackere de torrent, media, piețe, bloguri, biblioteci și așa mai departe.

3. YaCy

Ce este

YaCy este un motor de căutare descentralizat bazat pe rețele P2P. Fiecare computer pe care este instalat modulul software principal scanează Internetul independent, adică este un analog al unui robot de căutare. Rezultatele obținute sunt colectate într-o bază de date comună, care este utilizată de toți participanții la YaCy.

Cu atât mai bine

Este dificil de spus dacă este mai bine sau mai rău aici, deoarece YaCy este o abordare complet diferită a organizării căutării. Absența unui singur server și a unui singur proprietar de companie face ca rezultatele să fie complet independente de preferințele cuiva. Autonomia fiecărui nod exclude cenzura. YaCy este capabil să caute în deep web și în rețele publice neindexate.

Pentru ce ai nevoie

Dacă sunteți un susținător al open source și al internetului gratuit, care nu este influențat de agențiile guvernamentale și de marile corporații, atunci YaCy este alegerea dvs. Poate fi folosit și pentru a organiza căutări în cadrul unei rețele corporative sau autonome. Și în timp ce YaCy nu este foarte util în viața de zi cu zi, este o alternativă demnă la Google în ceea ce privește procesul de căutare.

4. Pipl

Ce este

Pipl este un sistem conceput pentru a căuta informații despre o anumită persoană.

Cu atât mai bine

Autorii lui Pipl susțin că algoritmii lor specializați caută mai eficient decât motoarele de căutare „obișnuite”. În special, se acordă prioritate profilurilor din rețelele sociale, comentariilor, listelor de participanți și diferitelor baze de date în care sunt publicate informații despre persoane, cum ar fi bazele de date cu hotărâri judecătorești. Conducerea lui Pipl în acest domeniu a fost validată de Lifehacker.com, TechCrunch și alții.

Pentru ce ai nevoie

Dacă aveți nevoie să găsiți informații despre o persoană care locuiește în Statele Unite, atunci Pipl va fi mult mai eficient decât Google. Bazele de date ale instanțelor ruse sunt aparent inaccesibile unui motor de căutare. Prin urmare, el nu se descurcă atât de bine cu cetățenii Rusiei.

Ce este

FindSounds este un alt motor de căutare specializat. Caută în surse deschise diverse sunete: casă, natură, mașini, oameni și așa mai departe. Serviciul nu acceptă interogări în limba rusă, dar există o listă impresionantă de etichete în limba rusă pe care le puteți căuta.

Cu atât mai bine

Rezultatele sunt doar sunete și nimic mai mult. În setări, puteți seta formatul dorit și calitatea sunetului. Toate sunetele găsite sunt disponibile pentru descărcare. Căutarea după model este disponibilă.

Pentru ce ai nevoie

Dacă trebuie să găsiți rapid sunetul unei împușcături de muschetă, loviturile unei ciocănitoare suge sau țipătul lui Homer Simpson, atunci acest serviciu este pentru dvs. Și am ales acest lucru doar din cererile disponibile în limba rusă. În engleză, spectrul este și mai larg.

Serios, un serviciu specializat își asumă un public specializat. Dar dacă este util?

Ce este

Wolfram | Alpha este un motor de căutare computațional. În loc de link-uri către articole care conțin cuvinte cheie, oferă un răspuns gata făcut la cererea unui utilizator. De exemplu, dacă introduceți „comparați populațiile din New York și San Francisco” în engleză în formularul de căutare, Wolfram | Alpha va afișa imediat tabele și grafice cu o comparație.

Cu atât mai bine

Acest serviciu este mai bun decât altele pentru a găsi fapte și a calcula date. Wolfram | Alpha colectează și organizează cunoștințele disponibile pe Web dintr-o varietate de domenii, inclusiv știință, cultură și divertisment. Dacă această bază de date conține un răspuns gata făcut la o interogare de căutare, sistemul îl arată; dacă nu, calculează și afișează rezultatul. În acest caz, utilizatorul vede doar și nimic de prisos.

Pentru ce ai nevoie

Dacă sunteți, de exemplu, student, analist, jurnalist sau cercetător, puteți utiliza Wolfram | Alpha pentru a găsi și a calcula date legate de munca dvs. Serviciul nu înțelege toate solicitările, dar este în continuă evoluție și devine mai inteligent.

Ce este

Metamotorul Dogpile afișează o listă combinată de rezultate din rezultatele căutării de la Google, Yahoo și alte motoare de căutare populare.

Cu atât mai bine

În primul rând, Dogpile afișează mai puține anunțuri. În al doilea rând, serviciul folosește un algoritm special pentru a găsi și afișa cele mai bune rezultate din diferite motoare de căutare. Potrivit dezvoltatorilor Dogpile, sistemul lor generează cele mai complete rezultate de căutare de pe întregul Internet.

Pentru ce ai nevoie

Dacă nu puteți găsi informații în Google sau în alt motor de căutare standard, căutați-le în mai multe motoare de căutare simultan folosind Dogpile.

Ce este

BoardReader este un sistem de căutare de text în forumuri, servicii de întrebări și răspunsuri și alte comunități.

Cu atât mai bine

Serviciul vă permite să restrângeți câmpul de căutare la platformele sociale. Datorită filtrelor speciale, puteți găsi rapid postări și comentarii care corespund criteriilor dvs.: limbă, data publicării și numele site-ului.

Pentru ce ai nevoie

BoardReader poate fi util pentru specialiștii în PR și pentru alți profesioniști media care sunt interesați de opinia masei asupra anumitor probleme.

In cele din urma

Viața motoarelor de căutare alternative este adesea trecătoare. Lifehacker l-a întrebat pe Serghei Petrenko, fostul director general al filialei ucrainene Yandex, despre perspectivele pe termen lung ale unor astfel de proiecte.


Serghei Petrenko

Fost CEO al Yandex.Ukraine.

În ceea ce privește soarta motoarelor de căutare alternative, este simplu: să fie proiecte foarte de nișă cu un public restrâns, așadar, fără perspective comerciale clare, sau, dimpotrivă, cu claritate deplină a absenței lor.

Dacă te uiți la exemplele din articol, poți vedea că astfel de motoare de căutare fie sunt specializate într-o nișă îngustă, dar solicitată, care, poate doar până acum, nu a crescut suficient pentru a fi vizibilă pe radarele Google sau Yandex, fie testează. o ipoteză originală în clasament.care nu este încă aplicabilă în căutarea obișnuită.

De exemplu, dacă o căutare pe Tor se dovedește brusc a fi solicitată, adică rezultatele de acolo vor fi necesare cel puțin unui procent din audiența Google, atunci, desigur, motoarele de căutare obișnuite vor începe să rezolve problema cum pentru a le găsi și a le arăta utilizatorului. Dacă comportamentul publicului arată că rezultatele par mai relevante pentru o pondere vizibilă de utilizatori într-un număr semnificativ de interogări, date fără a lua în considerare factorii dependenți de utilizator, atunci Yandex sau Google vor începe să ofere astfel de rezultate.

„A fi mai bun” în contextul acestui articol nu înseamnă „a fi mai bun în orice”. Da, în multe aspecte, eroii noștri sunt departe de Yandex (chiar și Bing este departe). Dar, pe de altă parte, fiecare dintre aceste servicii oferă utilizatorului ceva ce giganții industriei de căutare nu pot oferi. Cu siguranță cunoașteți și proiecte similare. Distribuie cu noi - vom discuta.

Ele au devenit o parte integrantă a internetului rusesc de mult timp. Motoarele de căutare sunt acum mecanisme uriașe și complexe care reprezintă nu doar un instrument de găsire a informațiilor, ci și zone atractive pentru afaceri.

Majoritatea utilizatorilor motoarelor de căutare nu s-au gândit niciodată (sau s-au gândit, dar nu au găsit un răspuns) la principiul de lucru al motoarelor de căutare, la schema de procesare a cererilor utilizatorilor, în ce constau aceste sisteme și cum funcționează. .

Această clasă de master își propune să răspundă la întrebarea cum funcționează motoarele de căutare. Totuși, aici nu veți găsi factori care influențează clasarea documentelor. Mai mult, nu ar trebui să contați pe o explicație detaliată a algoritmului de operare Yandex. El, potrivit lui Ilya Segalovici, director de tehnologii și dezvoltare a motorului de căutare „Yandex”, poate fi recunoscut doar „sub tortură” de însuși Ilya Segalovici ...

2. Conceptul și funcțiile motorului de căutare

Un motor de căutare este un complex software și hardware conceput să efectueze căutări pe Internet și să răspundă la cererea unui utilizator, specificată sub forma unei fraze text (interogare de căutare), prin emiterea unei liste de link-uri către surse de informații, în ordinea relevanței. (conform cererii). Principalele motoare de căutare internaționale: "Google", „Yahoo”, „MSN”. Pe internetul rusesc, acestea sunt Yandex, Rambler și Aport.

Să aruncăm o privire mai atentă asupra conceptului de interogare de căutare folosind motorul de căutare Yandex ca exemplu. Interogarea de căutare ar trebui să fie formulată de utilizator în conformitate cu ceea ce dorește să găsească, cât mai scurt și simplu posibil. Să presupunem că vrem să găsim informații în Yandex despre cum să alegem o mașină. Pentru a face acest lucru, deschideți pagina principală a „Yandex” și introduceți textul interogării de căutare „cum să alegeți o mașină”. În plus, sarcina noastră este să deschidem link-uri către surse de informații de pe Internet furnizate la cererea noastră. Cu toate acestea, este foarte posibil să nu găsim informațiile de care avem nevoie. Dacă se întâmplă acest lucru, atunci fie trebuie să reformulați cererea, fie nu există într-adevăr informații relevante despre cererea noastră în baza de date a motorului de căutare (acest lucru poate fi atunci când setați interogări foarte „înguste”, cum ar fi „cum să alegeți o mașină în Arkhangelsk ")

Sarcina principală a oricărui motor de căutare este de a oferi oamenilor exact informațiile pe care le caută. Și să învețe utilizatorii să facă cereri „corecte” către sistem, adică. interogările care se potrivesc cu principiile motoarelor de căutare nu sunt posibile. Prin urmare, dezvoltatorii creează algoritmi și principii ale motoarelor de căutare care ar permite utilizatorilor să găsească informațiile pe care le caută.

Aceasta înseamnă că motorul de căutare trebuie să „gândească” felul în care gândește utilizatorul atunci când caută informații. Când un utilizator face o solicitare către un motor de căutare, el dorește să găsească ceea ce are nevoie cât mai repede și ușor posibil. După ce a primit rezultatul, el evaluează activitatea sistemului, ghidat de mai mulți parametri de bază. A găsit ceea ce căuta? Dacă nu, de câte ori a trebuit să reformuleze interogarea pentru a găsi ceea ce căuta? Cât de relevant a fost capabil să găsească informații? Cât de repede a procesat motorul de căutare cererea? Cât de convenabile au fost rezultatele căutării? Rezultatul dorit a fost primul sau al sutelea? Câte deșeuri au fost găsite împreună cu informații utile? Veți găsi informațiile de care aveți nevoie atunci când apelați la un motor de căutare, să zicem, într-o săptămână sau într-o lună?

Pentru a satisface toate aceste întrebări cu răspunsuri, dezvoltatorii motoarelor de căutare îmbunătățesc constant algoritmii și principiile de căutare, adăugând noi funcții și capacități și încearcă în orice mod posibil să accelereze activitatea sistemului.

3. Principalele caracteristici ale motorului de căutare

Să descriem principalele caracteristici ale motoarelor de căutare:

  • Completitudine

    Completitudinea este una dintre principalele caracteristici ale unui motor de căutare, care este raportul dintre numărul de documente găsite la cerere și numărul total de documente de pe Internet care satisfac această solicitare. De exemplu, dacă există 100 de pagini pe Internet care conțin expresia „cum să alegi o mașină” și doar 60 dintre ele au fost găsite pentru interogarea corespunzătoare, atunci caracterul complet al căutării va fi de 0,6. Evident, cu cât căutarea este mai completă, cu atât este mai puțin probabil ca utilizatorul să nu găsească documentul de care are nevoie, cu condiția ca acesta să existe deloc pe Internet.

  • Precizie

    Precizia este o altă caracteristică principală a unui motor de căutare, care este determinată de gradul în care documentele găsite se potrivesc cu solicitarea utilizatorului. De exemplu, dacă interogarea „cum să alegi o mașină” conține 100 de documente, 50 dintre ele conțin expresia „cum să alegi o mașină”, iar restul pur și simplu conțin aceste cuvinte („cum să alegi magnetofonul potrivit și să instalezi este într-o mașină”), atunci precizia căutării este considerată egală cu 50/100 (= 0,5). Cu cât căutarea este mai precisă, cu atât utilizatorul va găsi mai repede documentele de care are nevoie, cu atât mai puține feluri de „gunoi” vor fi întâlnite printre acestea, cu atât mai rar documentele găsite nu se vor potrivi cu solicitarea.

  • Relevanţă

    Relevanța este o componentă la fel de importantă a căutării, care se caracterizează prin timpul care trece de la publicarea documentelor pe Internet până la introducerea lor în baza de index a motorului de căutare. De exemplu, a doua zi după apariția unor știri interesante, un număr mare de utilizatori au apelat la motoarele de căutare cu interogări relevante. Obiectiv, a trecut mai puțin de o zi de la publicarea informațiilor de știri pe această temă, dar principalele documente au fost deja indexate și sunt disponibile pentru căutare, datorită existenței așa-numitei „baze rapide” în marile motoare de căutare, care este actualizat de mai multe ori pe zi.

  • Viteza de căutare

    Viteza de căutare este strâns legată de rezistența la stres. De exemplu, conform Rambler Internet Holding LLC, astăzi, în timpul programului de lucru, motorul de căutare Rambler primește aproximativ 60 de interogări pe secundă. Un astfel de volum de muncă necesită o reducere a timpului de procesare a unei cereri individuale. Aici, interesele utilizatorului și ale motorului de căutare coincid: vizitatorul dorește să obțină rezultate cât mai repede, iar motorul de căutare trebuie să proceseze cât mai repede interogarea pentru a nu încetini calculul următoarelor interogări.

  • Vizibilitate

4. O scurtă istorie a dezvoltării motoarelor de căutare

În perioada inițială a dezvoltării Internetului, numărul utilizatorilor acestuia a fost mic, iar cantitatea de informații disponibile a fost relativ mică. În cea mai mare parte, doar cercetătorii au avut acces la internet. În acest moment, sarcina de a căuta informații pe internet nu era la fel de urgentă ca acum.

Una dintre primele modalități de organizare a accesului la resursele informaționale ale rețelei a fost crearea de cataloage deschise de site-uri, link-uri către resurse în care au fost grupate pe subiecte. Primul astfel de proiect a fost site-ul Yahoo.com, care a fost deschis în primăvara anului 1994. După ce numărul de site-uri din catalog a crescut semnificativ, a fost adăugată posibilitatea de a căuta informațiile necesare în catalog. În sensul deplin, nu era încă un motor de căutare, întrucât zona de căutare era limitată doar la resursele prezente în director, și nu la toate resursele de pe Internet.

Directoarele de link-uri au fost utilizate pe scară largă în trecut, dar și-au pierdut aproape complet popularitatea în prezent. Deoarece chiar și moderne, uriașe ca volum, cataloagele conțin informații doar despre o parte nesemnificativă a internetului. Cel mai mare director al rețelei DMOZ (numit și Proiectul Open Directory) conține informații despre 5 milioane de resurse, în timp ce baza motorului de căutare Google este formată din peste 8 miliarde de documente.

În 1995 au apărut motoarele de căutare Lycos și AltaVista. Ultimul de mulți ani a fost lider în domeniul căutării de informații pe internet.

În 1997, Sergey Brin și Larry Page au creat motorul de căutare Google ca parte a unui proiect de cercetare la Universitatea Stanford. Google este în prezent cel mai popular motor de căutare din lume!

În septembrie 1997, a fost anunțat oficial motorul de căutare Yandex, care este cel mai popular de pe internetul vorbitor de limbă rusă.

În prezent, există trei motoare de căutare principale (internaționale) - Google, Yahoo și, care au propriile baze de date și algoritmi de căutare. Majoritatea celorlalte motoare de căutare (dintre care există un număr mare) folosesc într-o formă sau alta rezultatele celor trei enumerate. De exemplu, căutarea AOL (search.aol.com) utilizează o bază Google, în timp ce AltaVista, Lycos și AllTheWeb folosesc o bază Yahoo.

5. Compoziția și principiile motorului de căutare

În Rusia, principalul motor de căutare este Yandex, apoi - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Mai mult, în acest moment, Mail.ru utilizează motorul de căutare și baza de date Yandex.

Aproape toate motoarele de căutare majore au propria lor structură, care este diferită de altele. Cu toate acestea, este posibil să se evidențieze principalele componente comune tuturor motoarelor de căutare. Diferențele de structură pot fi doar sub forma implementării mecanismelor pentru interacțiunea acestor componente.

Modul de indexare

Modulul de indexare este format din trei programe auxiliare (roboți):

Spider (păianjen) - un program conceput pentru a descărca pagini web. Păianjenul descarcă pagina și extrage toate linkurile interne din pagina respectivă. Codul html al fiecărei pagini este descărcat. Roboții folosesc protocoale HTTP pentru a descărca pagini. „Pianjenul” funcționează după cum urmează. Robotul trimite cererea „get / path / document” și alte comenzi de solicitare HTTP către server. Ca răspuns, robotul primește un flux de text care conține informații de serviciu și documentul în sine.

  • Adresa URL a paginii
  • data la care pagina a fost descărcată
  • antet http de răspuns al serverului
  • corpul paginii (cod html)

Crawler ("călător") spider - un program care accesează automat toate linkurile găsite pe pagină. Evidențiază toate linkurile prezente pe pagină. Sarcina sa este de a determina unde ar trebui să meargă păianjenul, pe baza legăturilor sau pe baza unei liste predefinite de adrese. Crawler, urmând linkurile găsite, caută documente noi care sunt încă necunoscute motorului de căutare.

Indexer este un program care analizează paginile web descărcate de păianjeni. Indexatorul parsează pagina în părțile sale componente și le analizează folosind proprii algoritmi lexicali și morfologici. Sunt analizate diferite elemente ale paginii, cum ar fi text, titluri, link-uri, caracteristici structurale și de stil, etichete html pentru servicii speciale etc.

Astfel, modulul de indexare vă permite să accesați cu crawlere un anumit set de resurse prin link-uri, să descărcați paginile întâlnite, să extrageți link-uri către pagini noi din documentele primite și să efectuați o analiză completă a acestor documente.

Bază de date

O bază de date, sau un index al unui motor de căutare, este un sistem de stocare a datelor, o matrice de informații care stochează parametrii special convertiți ai tuturor documentelor descărcate și procesate de modulul de indexare.

Server de căutare

Serverul de căutare este un element esențial al întregului sistem, deoarece calitatea și viteza căutării depind direct de algoritmii care stau la baza funcționării acestuia.

Motorul de căutare funcționează după cum urmează:

  • Solicitarea primită de la utilizator este supusă analizei morfologice. Se generează mediul informațional al fiecărui document conținut în baza de date (care va fi ulterior afișat ca informații text corespunzătoare solicitării în pagina cu rezultatele căutării).
  • Datele primite sunt transmise ca parametri de intrare la un modul special de ranging. Are loc prelucrarea datelor pentru toate documentele, în urma căreia, pentru fiecare document, se calculează propriul rating, care caracterizează relevanța interogării introduse de utilizator și diferitele componente ale acestui document stocate în indexul motorului de căutare. .
  • În funcție de alegerea utilizatorului, acest rating poate fi ajustat prin condiții suplimentare (de exemplu, așa-numita „căutare avansată”).
  • În continuare, se generează un fragment, adică pentru fiecare document găsit, din tabelul de documente sunt extrase titlul, o scurtă adnotare care se potrivește cel mai bine cu cererea și un link către documentul în sine, iar cuvintele găsite sunt evidențiate.
  • Rezultatele căutării rezultate sunt transmise utilizatorului sub forma unei SERP (Search Engine Result Page) - pagină cu rezultatele căutării.

După cum puteți vedea, toate aceste componente sunt strâns legate între ele și funcționează în interacțiune, formând un mecanism clar, destul de complex pentru funcționarea motorului de căutare, care necesită o cantitate imensă de resurse.

6. Concluzie

Acum să rezumam toate cele de mai sus.

  • Sarcina principală a oricărui motor de căutare este de a oferi oamenilor exact informațiile pe care le caută.
  • Principalele caracteristici ale motoarelor de căutare:
    1. Completitudine
    2. Precizie
    3. Relevanţă
    4. Viteza de căutare
    5. Vizibilitate
  • Primul motor de căutare cu drepturi depline a fost proiectul WebCrawler, publicat în 1994.
  • Motorul de căutare include următoarele componente:
    1. Modul de indexare
    2. Bază de date
    3. Server de căutare

Sperăm că clasa noastră de master vă va permite să cunoașteți mai multe despre conceptul de motoare de căutare, să învățați mai bine principalele funcții, caracteristici și principiul de funcționare al motoarelor de căutare.

Top articole similare