Kako postaviti pametne telefone i računala. Informativni portal
  • Dom
  • U kontaktu s
  • Glavne tražilice na Internetu. Internetske tražilice: Yandex, Google, Rambler, Yahoo

Glavne tražilice na Internetu. Internetske tražilice: Yandex, Google, Rambler, Yahoo

Ukupno

Uvod

Malo ljudi sada može zamisliti internet bez pretraživanja, rezultata pretraživanja i organiziranja svih tih tražilica informacija (ISS). No, donedavno su se sve informacije na Internetu uklapale u nekoliko imenika za čije se ime još uvijek čuje (DMOZ, Yahoo).

Danas je količina informacija na internetu tolika da ih nije moguće uklopiti ni u kakve kataloge. Za obradu, pohranu informacija, organiziranje pretraživanja stvoreni su i stvaraju se moćni softverski proizvodi koje nazivamo tražilicama (SE). Svaka tražilica (tražilica) ima svoje baze podataka, svoje algoritme za obradu, pretraživanje, rangiranje i izdavanje informacija.

Internetske tražilice su

Tražilicama možete dati sljedeću akademsku definiciju. Tražilica je skup programa i tehničkih sredstava za organiziranje pretraživanja korisnika na Internetu, u kojem korisnik na tekstualni upit dobiva popis relevantnih (koje odgovaraju upitu) rezultata.

Izdavanje se vrši u obliku popisa poveznica na izvor informacija s kratkim opisom (pregled), ponekad i fotografijom.

Za prvi primjer, prisjetimo se svjetskog lidera pretraživanja "Google" i lidera Runeta, tražilice "Yandex". Osim ovih tražilica, možete imenovati još desetak postojećih tražilica o kojima ćemo u nastavku.

Mišljenje: Tražilice Google, Yandex i druge nisu generatori (proizvođači) sadržaja, već agregatori (akumulatori) sadržaja i, uglavnom, sadržaja drugih ljudi. Vrijedno je zapamtiti da se korištenje tuđeg sadržaja za stvaranje vlastitog prometa i njegovo unovčavanje može okarakterizirati kao "piratstvo", što se, naravno, u praksi ne događa.

Ocjena

  • i Google dijele prva dva mjesta vodećih: oko 49% i 45%.
  • Treće mjesto: Traži Mail.ru oko 3%;
  • Ostale tražilice lebde ispod 1%.

Gledajući statistiku Google Analyticsa:

  • yandex / organski 40,26%
  • google / organski 38,93%
  • mail.ru / organski 0,60%
  • rambler / organski 0,52%
  • bing / organski 0,12%

Statistika je neumoljiva: najviše se koriste pretraživanja Yandexa, a ako uzmemo u obzir da je 3% dobar rezultat u odnosu na 45%, onda je treća najpopularnija pretraga Mail.ru.

S tim u vezi, rasuđivanje o popularnosti tražilica osim Yandexa i Googlea može se pripisati praznovjerju, te posebnoj promociji web stranica u drugim tražilicama (ne Yandexu i Googleu) koje ne zaslužuju pozornost.

Kako rade tražilice

Pitanje kako funkcioniraju tražilice jednako je općenito kao i pitanje "koje je boje nebo". Ako je nebo plavo, onda tražilice prikupljaju informacije na internetu, obrađuju ih, rangiraju i daju korisniku prema upitu za pretraživanje.

Teorija pretraživanja interneta puno je opsežnija i ne može se navesti u članku. Međutim, glavne točke će dobro doći:

Internetske tražilice ne pohranjuju dokumente, odnosno ne preuzimaju i ne učitavaju dokumente u potpunosti u svoja spremišta;

Porezna uprava koristi internet kao decentralizirano spremište dokumenata. Tražilice povremeno indeksiraju internet, odabiru informacije koje su im potrebne, prema svojim algoritmima, te ih djelomično stavljaju (informacije) u moju bazu podataka (Bazu podataka). Dakle, postoji nekoliko problema:

  • Porezna uprava za izdavanje ne koristi sve podatke na Internetu, već samo dio;
  • Internetske informacije se često mijenjaju. Dnevno se doda oko 1500 tisuća stranica, pa otuda mogući "prazni broj";
  • Postoji veliki broj duplikata (duplikat sadržaja). Nažalost, nemam točne podatke o uzimanjima, a čini se da je brojka od 25% preuzimanja precijenjena;
  • Mnogo reklama, koje također zaobilaze tražilice;
  • "Lutanje" pretraživača robota u mreži višestruko povećava opterećenje neresursa (ne odnosi se na tražilice);
  • Većina stranica je komercijalna (oko 83%) i imaju malu informativnu vrijednost.

Iz ovih i nekih drugih razloga, velika većina ISS-a na Internetu koristi tražilicu, a ne klasičnu shemu pretraživanja za klasifikaciju informacija.

Značajke pretraživanja ključnih riječi

Unatoč promjenjivim algoritmima tražilica, čije oglašavanje nas pokušava uvjeriti da strojevi postaju sve pametniji i inteligentniji, pretraživanja po ključnim riječima u središtu su tražilica.

Sviđa mi se ova shema pretraživanja ključnih riječi.

Kao što vidite, rad internetskih tražilica temelji se na traženju novih dokumenata (search robot Spider + Crawler), indeksiranju otkrivenih dokumenata (Indexer) i izvršavanju korisničkog upita (Search Engine Results Engine). Nazivi robota za pretraživanje koji se koriste u ove svrhe navedeni su u zagradama.

Kao što sam rekao, većina tražilica ne kopira cijeli tekst dokumenata u svoju bazu podataka. Za pretraživanje, prilikom indeksiranja dokumenta, kreira se njegova slika za pretraživanje. Kako bi organizirao pretraživanje po, robot za indeksiranje stvara sliku dokumenta koristeći tzv. izvedenu metodu. Odnosno, naslov i skup ključnih riječi naznačeni su na slici dokumenta.

Međutim, može se sasvim točno tvrditi da sve porezne uprave obraćaju pažnju na sljedeće:

  • Prisutnost ključne riječi u dokument;</li><li>Prisutnost ključa u URL-u ili domeni;</li><li>Prisutnost ključa u podnaslovu;</li><li>Ukupan broj tipki na stranici (gustoća%);</li><li>Prisutnost ključeva u opisu (opisu);</li><li>Koje web veze vode na ovu stranicu;</li><li>Koje interne veze postoje na ovoj stranici.</li> </ul><h2><span>Rangiranje stranica</span></h2><p>Na kraju teorije vrijedi spomenuti. Češće se na SERP rangiranje spominje u kontekstu relevantnosti. Odnosno, tražilice bi trebale graditi rezultate pretraživanja prema najtočnijem podudaranju s upitom za pretraživanje. Kao što Yandex piše, ništa se ne smije izgubiti (potpunost problema) i ništa dodatno ne treba pronaći (točnost problema). Kako se to događa u praksi, vidite svaki dan.</p><h2>Zaključak</h2><ul><li>Internetske tražilice složeni su softverski proizvodi čiji rad osiguravaju tisuće stručnjaka i ogromni materijalni resursi.</li><li>Algoritmi tražilice čuvaju se u tajnosti, iako su osnovni naglasci ažuriranja algoritama javni i imaju vlastita imena.</li><li>Unatoč različitom pristupu formiranju rezultata pretraživanja, sve tražilice temelje se na općim principima indeksiranja stranica, koji su do danas ostali osnovni za promociju.</li> </ul><h2><span>Yandex tražilica</span></h2><p>Popularna Runet tražilica, koja često postaje najpopularnija. Prema statistici iz 2009., Yandex neprestano indeksira 15 milijuna stranica Runeta, obrađujući 140 tisuća GB tekstualnih podataka, 1,6 milijardi jedinstvenih slika od ukupno 2,1 milijarde slika.</p><p>Yandex tražilica nastala je 1993. godine. Riječ Yandex ne znači ništa, iako se općenito vjeruje da je riječ o transformaciji riječi "Index", odnosno izraza "još jedan indekser". Danas Yandex.Poisk obrađuje četvrt milijarde zahtjeva dnevno, a da je tako nametljiv, bila bi mi najdraža tražilica.</p><h2>Yandex pretraživanje</h2><p>https://yandex.ru/: pretraživanje korisnika Yandexa organizirano je putem interneta, uzimajući u obzir regiju korisnika. Mogućnost pretraživanja po slikama, videima, kartama, vijestima, blogovima, proizvodima i rječnicima.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-4.png' align="center" width="100%" loading=lazy loading=lazy></p><p>Za fino pretraživanje, ovdje postoji jezik za pretraživanje (https://yandex.ru/support/search/query-language/).</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-6.png' width="100%" loading=lazy loading=lazy></p><p>tražilice Internet Yandex</p><h2>Google tražilica</h2><p>U Google tražilici pretraživanje je organizirano bez predmeta (glavno pretraživanje) i pretraživanje po odjeljcima: slike, vijesti, karte, video, kupnje, knjige, zrakoplovne karte, financije.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-8.png' align="center" width="100%" loading=lazy loading=lazy></p><p>Postoje postavke:</p><p><b>Sigurno pretraživanje.</b> Omogućuje vam blokiranje neprikladnog sadržaja i seksualno eksplicitnih slika iz Google rezultata pretraživanja. Ova značajka ne jamči 100% zaštitu, ali skriva većinu ovog sadržaja.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-13.png' align="center" width="100%" loading=lazy loading=lazy></p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-9.png' align="center" width="100%" loading=lazy loading=lazy></p><p><b>Postavljanje broja rezultata</b> po stranici (zadano 10).</p><p><b>Osobni rezultati</b>... Pronađite veze, slike i videozapise na Googleu koje su vaši prijatelji podijelili s vama na društvenim mrežama.</p><p><b>Odabir regije</b>... Zadana je trenutna regija.</p><p><b>Jezici.</b> Možete odrediti jezik pretraživanja.</p><p><b>Napredno pretraživanje.</b> Omogućuje pretraživanje po naprednim opcijama.</p><p><b>Alati.</b> Ovdje možete odabrati jezik pretraživanja, naznačiti vrijeme kada se informacije pojavljuju i odabrati točno podudaranje ili cijeli problem.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-10.png' width="100%" loading=lazy loading=lazy></p><p>tražilice Internet Google</p><h2>Tražilica pošte</h2><p>https://go.mail.ru/. Ovdje je pretraga organizirana na Internetu (opća pretraga), po videu i slikama. Postoji posebna pretraga aplikacija za mobilne uređaje.</p><p> (<span>https://www.bing.com/?scope=web&FORM=Z9LH</span>). Općenito pretraživanje, pretraživanje po slikama, videima, vijestima, kartama.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-11.png' align="center" width="100%" loading=lazy loading=lazy></p><p><b>Yahoo pretraga na ruskom</b>... https://ru.search.yahoo.com/. Čista pretraga bez oglasa. Traži na internetu, po slikama i vijestima. Izbor vremena za dodavanje informacija.</p><h2>Druge tražilice</h2><ul><li>DuckDuckGo (https://duckduckgo.com/) Pametno pretraživanje.</li><li>Pipl (https://pipl.com/) Tražite ljude u SAD-u.</li><li>Zvukovi nalaza ( <span>http://www.findsounds.com/ 11 Alati za analizu relevantnosti stranica web-mjesta za upit za pretraživanje</span></li> </ul> <p>Tražilica je jedna od ključnih razina interneta zajedno sa sadržajem i preglednikom. "Yandex" -pretraga ili slični sustavi ("Google", "Bing", DuckDuckGo i drugi) omogućuju korisniku pretraživanje informacija na World Wide Webu formuliranjem zahtjeva.</p><p>Zadatak tražilice je pronaći za ovaj upit (ključnu riječ ili frazu) sve dokumente, stranice, video zapise, odnosno sav sadržaj.</p><p>Koja je najbolja tražilica? Postoje li alternativne opcije osim Googlea i Yandexa? Koja je internetska tražilica prikladnija za indeksiranje izvora na engleskom jeziku ili, na primjer, glazbe? Upravo o tome će biti riječi u članku.</p><h2>Ocjena: tržišni lideri</h2><p>Ako govorimo o svijetu u cjelini, onda je "Google" -pretraga najpopularnija tražilica. Korporacija zauzima gotovo 70% tržišta. Drugo mjesto u ocjeni zauzima Bing (udio - 12,26%). Sustav Baidu bori se za drugo mjesto (6,48% u rujnu 2015.). S vremena na vrijeme mijenjaju mjesta.</p><p>Tako su, primjerice, 2014. godine "sile" drugačije raspoređene: prvo mjesto zauzeo je Google - pretraživanje sa 68,69%, drugo - Baidu (17,7%), treće - Bing s tržišnom kapitalizacijom od 6, 22%.</p><p>Ali globalni podaci su vrlo generalizirani. Koja je najbolja tražilica?</p><p>U Kini, na primjer, vrlo mali postotak stanovništva koristi Google, većina njih koristi domaći Soso sustav. U Južnoj Koreji većina stanovnika koristi vlastiti razvoj - internetsku tražilicu Naver. Istina, u posljednjih nekoliko mjeseci broj zahtjeva u ovom sustavu počeo je naglo opadati.</p><p>U Japanu i Tajvanu korisnici će češće koristiti Yahoo!</p><h2>Ocjena: sustavi koji govore ruski</h2><p>Koja je najbolja tražilica? U Rusiji rang tražilica uopće nije sličan globalnom. Tržišni lider u ruskom govornom segmentu interneta je Yandex, koji koristi više od 55% korisnika.</p><p>Google je na drugom mjestu s ocjenom od 37,6%. Prema usluzi LiveInternet, pokrivenost upita za pretraživanje na ruskom jeziku na World Wide Webu raspoređena je na sljedeći način:</p><ol><li>Univerzalne tražilice: Google (37,6%), Bing (0,3%), Yahoo! (0,1%).</li><li>Govorni engleski i međunarodni (AskJeeves, na primjer).</li><li>Sustavi pretraživanja na ruskom jeziku: Yandex (56,2%), Mail (5,3%), Rambler (0,5%).</li> </ol><h2>DuckDuckGo</h2><p>Trebali bismo početi razgovarati o alternativnim tražilicama s tražilicom DuckDuckGo. To je prilično poznat i raširen sustav otvorenog koda. DuckDuckGo poslužitelji nalaze se u Sjedinjenim Američkim Državama. Rezultati pretraživanja su prilično opsežni, budući da sustav koristi ne samo vlastite algoritme, već i rezultate nekih drugih izvora, na primjer, "Wikipedia", tražilicu "Bing" i Yahoo!</p><p>DuckDuckGo tražilica osigurava maksimalnu sigurnost osobnih podataka, privatnosti i povjerljivosti korisnika. Sustav ne prikuplja nikakve podatke o korisnicima, ne pohranjuje povijest i maksimalno ograničava korištenje kolačića.</p><p>Razlika s DuckDuckGo je u tome što ovaj sustav ne personalizira rezultate pretraživanja, kao što to čine drugi sustavi. U "Google" ili "Yandex", na primjer, korisnik vidi samo one informacije koje su u skladu s njegovim preferencijama. Ali DuckDuckGo stvara pravu sliku i omogućuje vam da se riješite nametljivih specifičnih oglasa. Usluga pretraživanja lako traži informacije na stranim jezicima, dok Yandex i Google prema zadanim postavkama daju prednost izvorima na ruskom jeziku, čak i ako je zahtjev upisan na engleskom, njemačkom ili drugom jeziku.</p><p>Možete prilagoditi sučelje u sustavu: možete promijeniti shemu boja, fontove, veze i druge parametre u samo nekoliko klikova.</p><p>Ova tražilica još je daleko od divovskog Googlea, ali patka se razvija, pa je sasvim moguće da će DuckDuckGo u budućnosti zauzeti jednu od vodećih pozicija. Tim je napravio izvrstan proizvod koji omogućuje anonimna, brza i funkcionalna pretraživanja koja zaslužuju pažnju korisnika.</p><h2>NotEvil</h2><p>To je sustav koji pretražuje anonimnu Tor mrežu. Tražilica je unaprijed instalirana u istoimenom pregledniku. Zašto nije Evil bolje? "Ide" tamo gdje Google ili Yandex tražilica ne može doći. Općenito, na Tor mreži postoji puno resursa koji se ne mogu posjetiti na "običnom" (zakonom) Internetu. Ovo je svojevrsno mjesto unutar mreže s vlastitim društvenim platformama, torrent trackerima, medijima, blogovima, trgovačkim centrima, forumima, knjižnicama i tako dalje.</p><p>Usput, notEvil nije jedina tražilica te vrste. Tu je i Look, koji je standardno dostupan u istom Tor pregledniku, a TORCH je jedna od najstarijih tražilica na anonimnom webu.</p><p><img src='https://i2.wp.com/syl.ru/misc/i/ai/362924/2173269.jpg' width="100%" loading=lazy loading=lazy></p><h2>YaCy</h2><p>Besplatna tražilica YaCy potpuno je drugačiji pristup organiziranju pretraživanja na World Wide Webu. Sustav radi na P2P principu. To znači da svako računalo na koje je modul instaliran samostalno skenira internet, a zatim se svi dobiveni rezultati skupljaju u jedinstvenu bazu podataka koju mogu koristiti svi korisnici YaCyja.</p><p>Sustav je potpuno neovisan, autonoman i osigurava anonimnost svakog korisnika. YaCy je prikladan za pristaše otvorenog interneta na koji ne utječu velike korporacije i vladine agencije.</p><p>U svakodnevnom životu tražilica još nije od velike koristi, ali dugoročno je dostojna alternativa Googleu, čak i sa stajališta organizacije procesa pretraživanja informacija.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2173267.jpg' width="100%" loading=lazy loading=lazy></p><h2>Pipl</h2><p>Pipl je sustav dizajniran za traženje informacija o određenoj osobi. Programeri tvrde da algoritmi tražilice traže ljude učinkovitije od Googlea ili Yandexa, koji su rasprostranjeni u cijelom svijetu.</p><p>Prioritetni izvori su profili na društvenim mrežama, komentari, popisi sudionika, baze podataka u kojima se objavljuju različiti podaci o osobama, primjerice baze sudskih odluka. Ali postoji i nedostatak. Ruske baze podataka nisu dostupne za Pipl, pa će biti korisne samo za pronalaženje informacija o američkim državljanima.</p><p><img src='https://i2.wp.com/syl.ru/misc/i/ai/362924/2172783.jpg' width="100%" loading=lazy loading=lazy></p><h2>FindSounds</h2><p>Koja je najbolja tražilica? Ako trebate pronaći glazbu ili zvukove, onda je, naravno, FindSounds najbolji. Ovo je specijalizirana tražilica koja ima popis oznaka. Ovdje možete odabrati željeni format audio datoteke ili njezinu kvalitetu. Svi rezultati pretraživanja dostupni su za preuzimanje.</p><p><img src='https://i0.wp.com/syl.ru/misc/i/ai/362924/2173268.jpg' width="100%" loading=lazy loading=lazy></p><h2>Wolfram | Alfa</h2><p>Ovaj sustav ne daje stranice na kojima se nalaze informacije koje su korisniku potrebne, već gotov rezultat. Na primjer, karte, grafikoni, tablice, kratki odgovori. Usluga je savršeno prikladna za izračun podataka i traženje konkretnih činjenica. Tražilica još ne razumije sve zahtjeve, ali se stalno razvija.</p><p>Uz Wolfram | Alpha, prikladno je, na primjer, usporediti parametre za postavljanje kamere, pametnog telefona ili prijenosnog računala. Također izračunajte razinu alkohola u krvi (sustav od korisnika traži težinu i visinu, popijenu količinu, vrijeme, a zatim javlja koliko će alkohola u potpunosti biti izlučeno iz organizma).</p><p>Alat može pretvoriti veličine cipela i odjeće, brojati kalorije, gledati tečajeve valuta ili ugađati glazbeni instrument.</p><h2>Dogpile</h2><p>Dogpile prikazuje rezultate iz svih uobičajenih tražilica odjednom. Usluga koristi poboljšani algoritam i, kako uvjeravaju programeri, generira najbolje rezultate na Internetu. Također, ovdje ima malo reklama. Možete pokušati upotrijebiti Dogpile ako se informacije koje vam trebaju ni na koji način ne nalaze u standardnom Googleu ili Yandexu.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2172777.jpg' width="100%" loading=lazy loading=lazy></p><h2>BoardReader</h2><p>Ovaj sustav traži informacije na forumima, anketama, uslugama pitanja i odgovora, društvenim zajednicama, sužavajući polje pretraživanja na društvene platforme. Možete postaviti filtere: jezik i datum izdanja, naziv stranice i slično.</p><p>Tražilica može biti korisna za stručnjake za oglašavanje koje zanima mišljenje publike.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2172779.jpg' width="100%" loading=lazy loading=lazy></p><h2>Konačno</h2><p>Alternativne tražilice često su prolazne. Pojavljuju se čim umiru. Većina alternativnih sustava danas se specijalizirala za neku usku nišu ili testirala izvorni algoritam u formiranju rezultata pretraživanja.</p><p>U kontekstu opisivanja alternativnih tražilica, kriterij "bolje" ne znači "uopće bolje". Svaka od gore navedenih usluga daje određenom korisniku nešto što nije dostupno u Googleu ili Yandexu. U svakom slučaju, svakom je korisniku zanimljivo i korisno upoznati se s alternativnim opcijama (s obzirom na činjenicu da se čini da je sustav praktički monopoliziran od strane pretraživačkih divova).</p> <p>Tražilice (SE) su već duže vrijeme neizostavan dio interneta. Danas su to ogromni i složeni mehanizmi, koji nisu samo alat za pronalaženje svih potrebnih informacija, već i prilično uzbudljiva područja za poslovanje.</p> <br>Mnogi korisnici pretraživanja nikada nisu razmišljali o principima svog rada, o načinima obrade korisničkih zahtjeva, o tome kako su ti sustavi izgrađeni i funkcioniraju. Ovaj materijal pomoći će ljudima koji se bave optimizacijom i razumjeti strukturu i osnovne funkcije tražilica. <h2>Funkcije i koncept PS-a</h2> <b>Sustav pretraživanja</b> Je hardversko-softverski kompleks koji je dizajniran za obavljanje funkcije pretraživanja na Internetu, a na zahtjev korisnika, koji se obično postavlja u obliku tekstualne fraze (ili, točnije, upita za pretraživanje), odgovara izdavanjem popis poveznica na izvore informacija, proveden prema relevantnosti. Najčešće i najveće tražilice su Google, Bing, Yahoo, Baidu. U Runetu - Yandex, Mail.Ru, Rambler. <p>Pogledajmo pobliže samo značenje upita za pretraživanje, uzimajući za primjer sustav Yandex.</p><p>Zahtjev mora biti formuliran od strane korisnika u potpunosti u skladu s predmetom svoje pretrage, što jednostavnije i sažetije. Na primjer, želimo pronaći informacije u ovoj tražilici: "kako odabrati automobil za sebe." Da biste to učinili, otvorite glavnu stranicu i unesite upit za pretraživanje "kako odabrati automobil". Tada se naše funkcije svode na praćenje danih poveznica na izvore informacija na mreži.</p><p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/6d6/yandex-auto.png' width="100%" loading=lazy loading=lazy><br></p> <br>Ali čak i postupajući na ovaj način, možda nećete dobiti informacije koje su nam potrebne. Ako smo dobili ovako negativan rezultat, samo trebate ponovno formirati svoj zahtjev, ili u bazi pretraživanja zaista nema korisnih informacija o ovoj vrsti zahtjeva (to je sasvim moguće uz zadane "uske" parametre upita, kao npr. , na primjer, "kako odabrati automobil u Anadyru "). <p>Najosnovniji zadatak svake tražilice je dostaviti ljudima upravo onu vrstu informacija koja im je potrebna. I praktički je nemoguće osposobiti korisnike da kreiraju "ispravan" tip upita tražilicama, odnosno fraze koje će odgovarati njihovim principima rada.</p><p>Zato programeri tražilica prave takve principe i algoritme za svoj rad koji bi korisnicima omogućili da pronađu informacije koje ih zanimaju. To znači da sustav mora “razmišljati” na isti način kao što čovjek razmišlja kada traži potrebne informacije na internetu.</p><p>Kada unese svoj upit u tražilicu, želi što lakše i brže pronaći ono što mu treba. Nakon što je dobio rezultat, korisnik daje vlastitu procjenu rada sustava, vođen nekoliko kriterija. Je li uspio pronaći potrebne informacije? Ako nije, koliko je puta morao preoblikovati tekst upita da ga pronađe? Koliko su relevantne bile informacije koje je dobio? Koliko brzo je tražilica obradila njegov zahtjev? Koliko su prikladni bili rezultati pretraživanja? Je li željeni rezultat bio prvi ili je bio na 30. mjestu? Koliko je smeća (nepotrebnih informacija) pronađeno zajedno s korisnim informacijama? Hoće li biti relevantnih informacija za njega, prilikom korištenja PS-a, za tjedan dana ili za mjesec dana?</p><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/ceb/rangirovanie.png' width="100%" loading=lazy loading=lazy><br></p> <br>Kako bi dobili prave odgovore na takva pitanja, programeri pretraživanja neprestano poboljšavaju principe rangiranja i njegove algoritme, dodajući im nove značajke i funkcije te na svaki način pokušavaju ubrzati rad sustava. <h2>Glavne karakteristike tražilica</h2>Označimo glavne karakteristike pretraživanja: <h3>Potpunost.</h3>Potpunost je jedna od najvažnijih karakteristika pretraživanja, to je omjer broja informacijskih dokumenata pronađenih na zahtjev prema njihovom ukupnom broju na Internetu koji se odnosi na ovaj zahtjev. Na primjer, na Internetu postoji 100 stranica koje imaju izraz "kako odabrati automobil", a za isti upit odabrano je samo 60 od ukupnog broja, tada će u ovom slučaju kompletnost pretraživanja biti 0,6. Jasno je da što je sama pretraga potpunija, veća je vjerojatnost da će korisnik pronaći upravo onaj dokument koji mu je potreban, naravno ako uopće postoji. <h3>Točnost.</h3>Druga primarna funkcija tražilice je točnost. Određuje stupanj usklađenosti s korisničkim zahtjevom pronađenih stranica na webu. Na primjer, ako postoje stotine dokumenata za ključnu frazu "kako odabrati automobil", polovica njih sadrži ovu frazu, a ostali jednostavno sadrže takve riječi (kako pravilno odabrati auto radio i instalirati ga u automobil " ), tada je točnost pretraživanja jednaka 50/100 = 0,5. <p>Što je pretraga preciznija, prije će korisnik pronaći potrebne informacije, manje će se različitog "smeća" naći među rezultatima, što manje pronađenih dokumenata neće odgovarati značenju upita.</p><h3>Relevantnost.</h3>Ovo je značajna komponenta pretraživanja koju karakterizira vrijeme koje protekne od trenutka objave informacija na Internetu do upisa u indeksnu bazu tražilice. <p>Na primjer, dan nakon što su se pojavile informacije o izlasku novog iPada, mnogi su se korisnici okrenuli pretraživanju s odgovarajućim vrstama upita. U većini slučajeva informacije o ovoj vijesti već su dostupne u pretrazi, iako je od njezine pojave prošlo vrlo malo vremena. To je zbog činjenice da velike tražilice imaju "brzu bazu", koja se ažurira nekoliko puta dnevno.</p><h3>Brzina pretraživanja.</h3>Funkcija kao što je brzina pretraživanja usko je povezana s takozvanim "otporom opterećenja". Svake sekunde se ogroman broj ljudi okreće pretraživanju, takvo opterećenje zahtijeva značajno smanjenje vremena obrade jednog zahtjeva. Ovdje se interesi i tražilice i korisnika potpuno poklapaju: posjetitelj želi što brže dobiti rezultate, a tražilica mora što brže obraditi njegov zahtjev kako ne bi usporila obradu naknadnih zahtjeva. <h3>Vidljivost.</h3>Jasna prezentacija rezultata bitan je element pogodnosti pretraživanja. Za mnoge upite tražilica pronalazi tisuće, au nekim slučajevima i milijune različitih dokumenata. Zbog nejasnog sastava ključnih fraza za pretraživanje ili njegove netočnosti, čak ni prvi rezultati upita nemaju uvijek samo potrebne podatke. <p>To znači da osoba često mora sama tražiti među ponuđenim rezultatima. Različite komponente stranica s rezultatima tražilice pomažu u kretanju kroz rezultate pretraživanja.</p><h2>Povijest razvoja tražilica</h2>Kada se internet prvi put počeo razvijati, broj njegovih redovitih korisnika bio je mali, a količina informacija kojoj je trebalo pristupiti bila je relativno mala. U osnovi, samo stručnjaci u istraživačkim područjima imali su pristup ovoj mreži. U to vrijeme zadatak pronalaženja informacija nije bio tako hitan kao sada. <p>Jedna od najranijih metoda organiziranja širokog pristupa informacijskim resursima bila je izrada kataloga stranica, a poveznice na njih počele su se grupirati po predmetima. Ovaj prvi projekt bio je resurs Yahoo.com, koji je otvoren u proljeće 1994. godine. Nakon toga, kada se broj stranica u Yahoo imeniku značajno povećao, dodana je opcija za traženje potrebnih informacija u imeniku. To još nije bila u potpunosti tražilica, budući da je područje takve pretrage bilo ograničeno samo na stranice uključene u ovaj imenik, a ne na apsolutno sve resurse na Internetu. Imenici veza bili su naširoko korišteni ranije, ali sada su gotovo potpuno izgubili svoju popularnost.</p><p>Uostalom, i današnji ogromni katalozi sadrže podatke o neznatnom dijelu stranica na internetu. Najpoznatiji i najveći imenik na svijetu ima informacije na pet milijuna stranica, dok Google baza podataka sadrži informacije na više od 25 milijardi stranica.</p><p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/d6d/dmoz.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>Prva prava tražilica bila je WebCrawler, koja se pojavila davne 1994. godine. <p>AltaVista i Lycos pojavili su se sljedeće godine. Štoviše, prvi je dugo bio lider u traženju informacija.</p><p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/e9a/altavista.png' width="100%" loading=lazy loading=lazy><br></p> <br>Godine 1997. Sergey Brin je zajedno s Larryjem Pageom stvorio tražilicu Google kao istraživački projekt na Sveučilištu Stanford. Danas je to Google, najtraženija i najpopularnija tražilica na svijetu. <p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/773/Sergey-Brin-and-Larry-Page.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>U rujnu 1997. objavljen je (službeno) PS Yandex, koji je trenutno najpopularnija tražilica na Runetu. <p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/24c/yandex.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>Prema podacima o <b>rujna 2015</b>, udjeli tražilica u svijetu raspoređeni su na sljedeći način: <ul><li>Google - 69,24%;</li> <li>Bing - 12,26%;</li> <li>Yahoo! - 9,19%;</li> <li>Baidu - 6,48%;</li> <li>AOL - 1,11%;</li> <li>Pitati - 0,23%;</li> <li>Uzbuditi - 0,00%</li> </ul><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/528/search.png' width="100%" loading=lazy loading=lazy></p><p>Prema podacima o <b>prosinca 2016</b>, udio tražilica u Runetu:</p><ul><li>Yandex - 48,40%</li> <li>Google - 45,10%</li> <li>Search.Mail.ru - 5,70%</li> <li>Rambler - 0,40%</li> <li>Bing - 0,30%</li> <li>Yahoo - 0,10%</li> </ul><p><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/e7d/search-runet.png' width="100%" loading=lazy loading=lazy></p> <h2>Kako radi tražilica</h2>U Rusiji je glavna tražilica Yandex, zatim Google, a zatim Search@Mail.ru. Sve velike tražilice imaju svoju strukturu, koja se jako razlikuje od ostalih. Ipak, možemo izdvojiti osnovne elemente zajedničke svim tražilicama. <h3>Modul za indeksiranje.</h3>Ova komponenta se sastoji od tri robotska programa: <p><b>Pauk</b>(na engleskom spider) - program koji je dizajniran za preuzimanje web stranica. Pauk preuzima određenu stranicu, istovremeno izvlačeći sve veze s nje. HTML kod se preuzima sa gotovo svake stranice. Da bi to učinili, roboti koriste HTTP protokole.</p><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/a70/spiders.png' width="100%" loading=lazy loading=lazy><br></p> <br>"Pauk" funkcionira na sljedeći način. Robot šalje zahtjev poslužitelju "get / path / document" i druge naredbe HTTP zahtjeva. Kao odgovor, program robota prima tok teksta koji sadrži informacije o vrsti usluge i, naravno, sam dokument. <ul><li>URL preuzete stranice;</li> <li>datum kada je stranica preuzeta;</li> <li>zaglavlje http odgovora poslužitelja;</li> <li>html-kod, "tijelo" stranice.</li> </ul><b>Crawler</b>("Putujući" pauk). Ovaj program automatski ide na sve poveznice koje se nalaze na stranici i također ih ističe. Njegov je zadatak odrediti kamo bi pauk trebao ići u budućnosti, na temelju ovih poveznica ili na temelju zadanog popisa adresa. <p><b>Indekser</b>(robot indekser) je program koji analizira stranice koje su pauci preuzeli.</p><p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/5c3/indexing.png' width="100%" loading=lazy loading=lazy></p> <br>Indeksator u potpunosti analizira stranicu na njezine sastavne elemente i analizira ih koristeći svoje morfološke i leksičke vrste algoritama. <p>Analiza se provodi na različitim dijelovima stranice, kao što su naslovi, tekst, veze, stilske i strukturne značajke, html oznake itd.</p><p>Dakle, modul indeksiranja omogućuje praćenje poveznica zadanog broja resursa, preuzimanje stranica, izdvajanje mase linkova na nove stranice iz primljenih dokumenata i njihovu detaljnu analizu.</p><h3>Baza podataka</h3> <b>Baza podataka</b>(ili indeks tražilice) je kompleks za pohranu podataka, niz informacija u kojem se na određeni način pohranjuju parametri svakog preuzetog i obrađenog dokumenta koji modul za indeksiranje obrađuje. <h3>Poslužitelj za pretraživanje</h3>Ovo je najvažniji element cijelog sustava, jer brzina i, naravno, kvaliteta pretraživanja izravno ovise o algoritmima koji su u osnovi njegove funkcionalnosti. <p>Tražilica radi na sljedeći način:</p><ul><li>Zahtjev koji dolazi od korisnika podvrgava se morfološkoj analizi. Generira se informacijsko okruženje bilo kojeg dokumenta dostupnog u bazi podataka (dalje će se prikazati kao isječak, tj. informacijsko polje teksta koji odgovara ovom zahtjevu).</li> <li>Primljeni podaci prosljeđuju se kao ulazni parametri u specijalizirani modul za rangiranje. Oni se obrađuju za sve dokumente, a kao rezultat toga, za svaki takav dokument izračunava se vlastita ocjena koja karakterizira relevantnost takvog dokumenta za zahtjev korisnika i ostale komponente.</li> <li>Ovisno o uvjetima koje postavlja korisnik, ova se ocjena može prilagoditi dodatnim.</li> <li>Tada se generira sam isječak, t.j. za svaki pronađeni dokument iz odgovarajuće se tablice izdvaja naslov, bilješka koja najbolje odgovara zahtjevu i poveznica na ovaj dokument, dok su pronađeni oblici riječi i riječi istaknuti.</li> <li>Rezultati dobivene pretrage prenose se osobi koja ju je izvršila u obliku stranice na kojoj se daju rezultati pretraživanja (SERP).</li> </ul> Svi su ti elementi međusobno usko povezani i funkcioniraju, međusobno djeluju, tvoreći poseban, ali prilično kompliciran mehanizam za funkcioniranje PS-a, koji zahtijeva velike izdatke sredstava. <p>Oni su već dugo postali sastavni dio ruskog interneta. Tražilice su danas ogromni i složeni mehanizmi koji ne predstavljaju samo alat za pronalaženje informacija, već i atraktivna područja za poslovanje.</p><p>Većina korisnika tražilica nikada nije razmišljala (ili razmišljala, ali nije pronašla odgovor) o principu rada tražilica, o shemi obrade korisničkih zahtjeva, o tome od čega se ti sustavi sastoje i kako funkcioniraju.. .</p><p>Ova majstorska klasa ima za cilj odgovoriti na pitanje kako funkcioniraju tražilice. Međutim, ovdje nećete pronaći čimbenike koji utječu na rangiranje dokumenata. Štoviše, ne biste trebali računati na detaljno objašnjenje algoritma rada Yandexa. On je, prema Ilya Segalovich, direktor tehnologije i razvoja tražilice "Yandex", može se prepoznati samo "pod mučenjem" od strane samog Ilye Segalovicha ...</p><p><b>2. Pojam i funkcije tražilice</b></p><p>Tražilica je softverski i hardverski kompleks dizajniran za obavljanje pretraživanja na Internetu i odgovaranje na zahtjev korisnika, naveden u obliku tekstualnog izraza (upita za pretraživanje), izdavanjem popisa poveznica na izvore informacija, prema relevantnosti. (u skladu sa zahtjevom). Glavne međunarodne tražilice: <a target="_blank" href="http://www.google.com">"Google"</a>, "Yahoo", "MSN". Na ruskom internetu to su Yandex, Rambler i Aport.</p><p>Pogledajmo pobliže koncept upita za pretraživanje koristeći Yandex tražilicu kao primjer. Upit za pretraživanje korisnik treba formulirati u skladu s onim što želi pronaći, što kraće i jednostavnije. Recimo da želimo u Yandexu pronaći informacije o tome kako odabrati automobil. Da biste to učinili, otvorite glavnu stranicu "Yandex" i unesite tekst upita za pretraživanje "kako odabrati automobil". Nadalje, naš je zadatak otvoriti poveznice na izvore informacija na Internetu dostavljene na naš zahtjev. Međutim, vrlo je moguće ne pronaći informacije koje su nam potrebne. Ako se to dogodi, ili trebate preformulirati svoj zahtjev ili zaista nema relevantnih informacija o našem zahtjevu u bazi podataka tražilice (to može biti kada postavljate vrlo "uske" upite, kao što je "kako odabrati automobil u Arkhangelsku ")</p><p>Primarni zadatak svake tražilice je dostaviti ljudima točno one informacije koje traže. I naučiti korisnike da postavljaju "ispravne" zahtjeve prema sustavu, odn. upiti koji odgovaraju principima tražilica nisu mogući. Stoga programeri stvaraju algoritme i principe tražilica koji bi korisnicima omogućili da pronađu informacije koje traže.</p><p>To znači da tražilica mora "razmišljati" na način na koji korisnik razmišlja kada traži informacije. Kada korisnik uputi zahtjev tražilici, želi što brže i lakše pronaći ono što mu je potrebno. Nakon što je dobio rezultat, on ocjenjuje rad sustava, vodeći se nekoliko osnovnih parametara. Je li pronašao ono što je tražio? Ako nije, koliko je puta morao preformulirati upit da pronađe ono što je tražio? Koliko je relevantan mogao pronaći informacije? Koliko je brzo tražilica obrađivala zahtjev? Koliko su rezultati pretraživanja bili zgodni? Je li željeni rezultat bio prvi ili stoti? Koliko je smeća pronađeno zajedno s korisnim informacijama? Hoćete li pronaći potrebne informacije kada se okrenete tražilici, recimo, za tjedan dana ili za mjesec dana?</p><p>Kako bi odgovorili na sva ova pitanja, programeri tražilica neprestano poboljšavaju algoritme i principe pretraživanja, dodaju nove funkcije i mogućnosti te na sve moguće načine pokušavaju ubrzati rad sustava.</p><p><b>3. Glavne karakteristike tražilice</b></p><p>Opišimo glavne karakteristike tražilica:</p><ul><li><i>Potpunost</i><p>Potpunost je jedna od glavnih karakteristika tražilice, a to je omjer broja dokumenata pronađenih na zahtjev i ukupnog broja dokumenata na Internetu koji zadovoljavaju taj zahtjev. Na primjer, ako na Internetu postoji 100 stranica koje sadrže izraz "kako odabrati automobil", a pronađeno ih je samo 60 za odgovarajući upit, tada će kompletnost pretraživanja biti 0,6. Očito, što je pretraga potpunija, manja je vjerojatnost da korisnik neće pronaći dokument koji mu je potreban, pod uvjetom da on uopće postoji na internetu.</p></li><li><i>Točnost</i><p>Točnost je još jedna glavna karakteristika tražilice, koja je određena stupnjem u kojem pronađeni dokumenti odgovaraju zahtjevu korisnika. Na primjer, ako upit "kako odabrati automobil" sadrži 100 dokumenata, 50 njih sadrži izraz "kako odabrati automobil", a ostali jednostavno sadrže ove riječi ("kako odabrati pravi magnetofon i instalirati to u automobilu”), tada se točnost pretraživanja smatra jednakom 50/100 (= 0,5). Što je pretraga preciznija, korisnik će brže pronaći potrebne dokumente, manje će se među njima naići na razne vrste "smeća", rjeđe pronađeni dokumenti neće odgovarati zahtjevu.</p></li><li><i>Relevantnost</i><p>Relevantnost je jednako važna komponenta pretraživanja koju karakterizira vrijeme koje protekne od trenutka objave dokumenata na Internetu do upisa u indeksnu bazu tražilice. Primjerice, sljedeći dan nakon pojave zanimljivih vijesti, veliki broj korisnika obratio se tražilicama s relevantnim upitima. Objektivno, nije prošlo manje od jednog dana od objave vijesti o ovoj temi, ali glavni dokumenti su već indeksirani i dostupni su za pretraživanje, zahvaljujući postojanju tzv. "brze baze" u velikim tražilicama, koji se ažurira nekoliko puta dnevno.</p></li><li><i>Brzina pretraživanja</i><p>Brzina pretraživanja usko je povezana s njegovom otpornošću na stres. Na primjer, prema Rambler Internet Holding LLC, danas, tijekom radnog vremena, tražilica Rambler prima oko 60 upita u sekundi. Takvo opterećenje zahtijeva smanjenje vremena obrade pojedinačnog zahtjeva. Ovdje se interesi korisnika i tražilice poklapaju: posjetitelj želi što brže dobiti rezultate, a tražilica mora što brže obraditi upit kako ne bi usporila izračun sljedećih upita.</p></li><li><i>Vidljivost</i></li> </ul><p><b>4. Kratka povijest razvoja tražilica</b><br></p><p>U početnom razdoblju razvoja Interneta broj njegovih korisnika bio je mali, a količina dostupnih informacija relativno mala. Većinom su samo istraživači imali pristup internetu. U to vrijeme zadatak traženja informacija na internetu nije bio tako hitan kao sada.</p><p>Jedan od prvih načina organiziranja pristupa informacijskim resursima mreže bilo je stvaranje otvorenih kataloga stranica, poveznice na resurse u kojima su grupirane prema predmetu. Prvi takav projekt bila je stranica Yahoo.com koja je otvorena u proljeće 1994. godine. Nakon što se broj stranica u katalogu značajno povećao, dodana je mogućnost pretraživanja potrebnih informacija u katalogu. U punom smislu, to još nije bila tražilica, budući da je područje pretraživanja bilo ograničeno samo na resurse prisutne u imeniku, a ne na sve internetske resurse.</p><p>Imenici veza bili su naširoko korišteni u prošlosti, ali su u današnje vrijeme gotovo potpuno izgubili svoju popularnost. Budući da čak i moderni, ogromni po svom obimu, katalozi sadrže podatke samo o neznatnom dijelu interneta. Najveći imenik DMOZ mreže (koji se naziva i Open Directory Project) sadrži informacije o 5 milijuna resursa, dok se baza Google tražilice sastoji od više od 8 milijardi dokumenata.</p><p>1995. godine pojavile su se tražilice Lycos i AltaVista. Posljednji je dugi niz godina bio lider u području pretraživanja informacija na Internetu.</p><p>Godine 1997. Sergey Brin i Larry Page stvorili su tražilicu Google kao dio istraživačkog projekta na Sveučilištu Stanford. Google je trenutno najpopularnija tražilica na svijetu!</p><p>U rujnu 1997. službeno je objavljena tražilica Yandex, koja je najpopularnija na internetu na ruskom govornom području.</p><p>Trenutno postoje tri glavne tražilice (međunarodne) - Google, Yahoo i, koje imaju vlastite baze podataka i algoritme pretraživanja. Većina ostalih tražilica (kojih je velik broj) koristi u ovom ili onom obliku rezultate tri navedene. Na primjer, AOL pretraživanje (search.aol.com) koristi Google bazu, dok AltaVista, Lycos i AllTheWeb koriste Yahoo bazu.</p><p><b>5. Sastav i principi tražilice</b></p><p>U Rusiji je glavna tražilica Yandex, zatim - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Štoviše, u ovom trenutku Mail.ru koristi tražilicu i bazu podataka Yandex.</p><p>Gotovo sve glavne tražilice imaju vlastitu strukturu koja se razlikuje od ostalih. Ipak, moguće je izdvojiti glavne komponente zajedničke svim tražilicama. Razlike u strukturi mogu biti samo u obliku implementacije mehanizama za interakciju ovih komponenti.</p><p><b><b>Modul za indeksiranje</b> </b></p><p>Modul za indeksiranje sastoji se od tri pomoćna programa (roboti):</p><p>Spider (pauk) - program dizajniran za preuzimanje web stranica. Pauk preuzima stranicu i izvlači sve interne veze s te stranice. Preuzima se html kod svake stranice. Roboti koriste HTTP protokole za preuzimanje stranica. "Pauk" radi na sljedeći način. Robot šalje poslužitelju zahtjev "get / path / document" i neke druge naredbe HTTP zahtjeva. Kao odgovor, robot prima tekstualni tok koji sadrži informacije o usluzi i sam dokument.</p><ul><li>URL stranice</li><li>datum kada je stranica preuzeta</li><li>http zaglavlje odgovora poslužitelja</li><li>tijelo stranice (html kod)</li> </ul><p>Crawler ("putujući" pauk) - program koji automatski indeksira sve linkove pronađene na stranici. Ističe sve veze prisutne na stranici. Njegov je zadatak odrediti kamo bi pauk trebao ići sljedeći, na temelju poveznica ili na temelju unaprijed definiranog popisa adresa. Crawler, prateći pronađene poveznice, traži nove dokumente koji tražilici još uvijek nisu poznati.</p><p>Indexer je program koji analizira web stranice koje su preuzeli pauci. Indeksator analizira stranicu na sastavne dijelove i analizira ih koristeći vlastite leksičke i morfološke algoritme. Analiziraju se različiti elementi stranice, poput teksta, naslova, poveznica, strukturnih i stilskih značajki, posebnih servisnih html oznaka itd.</p><p>Dakle, modul indeksiranja omogućuje vam indeksiranje zadanog skupa resursa putem poveznica, preuzimanje stranica na koje naiđete, izdvajanje poveznica na nove stranice iz primljenih dokumenata i potpunu analizu tih dokumenata.</p><p><b><b>Baza podataka</b> </b></p><p>Baza podataka ili indeks tražilice je sustav za pohranu podataka, informacijski niz koji pohranjuje posebno konvertirane parametre svih dokumenata koje preuzima i obrađuje modul za indeksiranje.</p><p><b><b>Poslužitelj za pretraživanje</b> </b></p><p>Poslužitelj pretraživanja bitan je element cjelokupnog sustava, budući da kvaliteta i brzina pretraživanja izravno ovise o algoritmima koji su u osnovi njegovog funkcioniranja.</p><p>Tražilica radi na sljedeći način:</p><ul><li>Zahtjev zaprimljen od korisnika podvrgava se morfološkoj analizi. Generira se informacijsko okruženje svakog dokumenta sadržanog u bazi podataka (koji će se naknadno prikazati kao tekstualna informacija koja odgovara zahtjevu na stranici s rezultatima pretraživanja).</li><li>Primljeni podaci se kao ulazni parametri prosljeđuju posebnom modulu za određivanje raspona. Obrađuju se podaci za sve dokumente, uslijed čega se za svaki dokument izračunava vlastita ocjena koja karakterizira relevantnost upita koji je unio korisnik i različitih komponenti tog dokumenta pohranjenih u indeksu tražilice.</li><li>Ovisno o izboru korisnika, ova se ocjena može prilagoditi dodatnim uvjetima (npr. tzv. "napredna pretraga").</li><li>Zatim se generira isječak, odnosno za svaki pronađeni dokument iz tabele dokumenata se izdvaja naslov, kratka bilješka koja najbolje odgovara zahtjevu i poveznica na sam dokument, a pronađene riječi su istaknute.</li><li>Rezultirajući rezultati pretraživanja se prenose korisniku u obliku SERP (Search Engine Result Page) - stranice s rezultatima pretraživanja.</li> </ul><p>Kao što možete vidjeti, sve su te komponente usko povezane jedna s drugom i djeluju u interakciji, tvoreći jasan, prilično složen mehanizam za rad tražilice, što zahtijeva veliku potrošnju resursa.</p><p><b>6. Zaključak</b></p><p>Sada sumirajmo sve navedeno.</p><ul><li>Primarni zadatak svake tražilice je dostaviti ljudima točno one informacije koje traže.</li><li>Glavne karakteristike tražilica: <ol><li>Potpunost</li><li>Točnost</li><li>Relevantnost</li><li>Brzina pretraživanja</li><li>Vidljivost</li> </ol></li><li>Prva punopravna tražilica bio je projekt WebCrawler, objavljen 1994. godine.</li><li>Tražilica uključuje sljedeće komponente: <ol><li>Modul za indeksiranje</li><li>Baza podataka</li><li>Poslužitelj za pretraživanje</li> </ol></li> </ul><p>Nadamo se da će vam naša majstorska klasa omogućiti da bolje upoznate koncept tražilica, da bolje upoznate glavne funkcije, karakteristike i princip rada tražilica.</p> <p>Najbolje tražilice na internetu. Internetska tražilica <b> – </b> to su posebni programi za pretraživanje instalirani na čitav kompleks specijaliziranih strojeva. I to na jednostavan način - ovo je ista stranica sa skupom programa, samo na posebnoj tražilici (poslužitelju). Upravo uz pomoć tražilica možete pronaći sve potrebne informacije. Postoji puno tražilica.</p> <p>1. <span>Što je internetska tražilica</p> <p>2. Popularne tražilice u našoj zemlji</p> <p>3. Popularne tražilice u inozemstvu</p> <p>4. Neobične tražilice</p> <p>5. Kako pravilno tražiti informacije na Internetu</p> <p>Najviše <b>najbolji n</b><b>sustavi pretraživanja</b> u našoj zemlji:</p> <p>http://www.yandex.ru</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/2-Google.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.google.com</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/3-Aport.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.aport.ru</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/4-Rambler.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.rambler.ru/</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/5-Mail.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://go.mail.ru</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/6-Webalta.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.webalta.ru/</p> <p>Najneomiljenija i najnametljivija tražilica.</p> <h3><span><b>Popularne tražilice u inozemstvu</b> </span></h3> <p>http://www.altavista.com</p> <p>http://www.alltheweb.com</p> <p>http: // www. bing.com</p> <p>http://www.google.com <br>http://www.excite.com <br>http://www.lycos.com <br>http://www.mamma.com</p> <p>http://www.yahoo.com</p> <p>http://www.dmoz.com <br>http://www.hotbot.com <br>http://www.dogpile.com <br>http://www.netscape.com <br>http://www.msn.com <br>http://www.webcrawler.com <br>http://www.jayde.com <br>http://www.aol.com <br>http://www.euroseek.com <br>http://www.teoma.com <br>http://www.about.com <br>http://www.ixquick.com <br>http://www.lookle.com <br>http://www.metaeureka.com <br>http://www.searchspot.com <br>http://www.slider.com <br>http://www.allthesites.com <br>http://www.clickey.com <br>http://www.galaxy.com <br>http://brainysearch.com <br>http://www.orura.com</p> <p>Svaka zemlja ima svoje popularne tražilice.</p> <h3><span><b>Neobične tražilice</b> </span></h3> <ul><li><b><i>DuckDuckGo</i> </b>(https://duckduckgo.com/) je hibridna tražilica s politikom privatnosti korisnika i njegovih pretraživanja.</li> </ul><p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/7-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <ul><li><b><i><span>TinEye</i> </b> </span><b><i>(http://tineye.com/)</i> </b> je tražilica specijalizirana za pronalaženje slika na internetu. Nedavno je izgubio na važnosti nakon što je Google uveo istu funkciju u svoju pretragu slika.</li> </ul><p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/8-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <ul><li><b><i>Guénon</i> </b>(http://www.genon.ru/) je tražilica koja prikuplja i stvara sadržaj na svojoj web stranici.</li> </ul><p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/9-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>U gotovo svakoj tražilici, osim okvira za pretraživanje, postoje <b>poveznice</b> na najpopularnije stranice s vijestima i web-mjesta određene teme.</p> <h3><span><b>Kako pravilno tražiti informacije na Internetu</b> </span></h3> <p>Svaka tražilica ima svoje algoritme (pravila) za pronalaženje informacija.</p> <p>Da biste pronašli neke informacije na Internetu putem tražilice, morate unijeti u polje za pretraživanje <b>upit</b>... Ako unesete bilo koju riječ, tada ćete za ovaj zahtjev dobiti tisuće poveznica na stranice na kojima se ta riječ spominje.</p> <p>Stoga je potrebno unijeti što konkretniji upit koji se sastoji od dvije, tri ili više fraza.</p> <p>Pogledajmo primjer upita tražilice <b>Yandex.</b>.</p> <p>Recimo da želite pronaći informacije o kupnji računala. Ako upišete jednu riječ u okvir za pretraživanje " <b>Računalo</b>“, Tada ćete dobiti 133 milijuna odgovora</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/10-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Potrebno je postaviti konkretniji zahtjev. Bolje je naznačiti koje računalo želite kupiti i gdje (u kojem gradu).</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/11-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Tada će vam tražilica dati puno manje odgovora na vaš upit.</p> <p>Tražilicu nije baš briga kojim slovima upisujete svoj upit - velikim ili malim.</p> <p>Yandex razlikuje imenice i pridjeve, ali potpuno zanemaruje završetke.</p> <p>Također je potpuno ravnodušan prema padežima, množini i slično.</p> <p>Da bi pretraživanje bilo preciznije, potrebno je upit staviti u navodnike ili staviti uskličnik ispred riječi.</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/12-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Sada pogledajte isti upit, ali bez uskličnika.</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/13-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Vidite li razliku? Uz uskličnike, broj odgovora nije 2 milijuna, već 186 tisuća.</p> <p>Ako ispred riječi s velikim slovom stavite uskličnik, dobit ćete odgovore u kojima se upravo ta riječ nalazi s velikim slovom.</p> <p>Ako je riječ u nominativu, a trebate podatke o točno takvoj riječi, i to točno onako kako ste je napisali, tada ispred ove riječi stavite dva uskličnika. Na primjer: <b>!!Lopta</b> .</p> <p>Pretraživanje će vam dati odgovore za ovu određenu riječ " <b>Lopta</b>„Način na koji si to napisao. ne " <b>Lopta</b>", ne" <b>loptice</b>“, I to velikim slovom.</p> <p>Ako napišete frazu s riječju " <b>na</b>", Yandex će zanemariti" <b>na</b>". Na primjer: " <b>Na polici</b>". Pretraživanje će se izvršiti samo po riječi " <b>polica</b> ».</p> <p>Kako bi on to uzeo u obzir, a ne zanemario, potrebno je prije riječi “ <b>na</b>"Stavi plus znak -" <b>+ uključeno</b> ».</p> <p>Svaka tražilica ima svoj algoritam pretraživanja, pa ako koristite određenu tražilicu i želite naučiti kako pravilno sastaviti upite, samo trebate upisati u okvir za pretraživanje " <span><b>pravila pretraživanja u</b><b>Google</b> </span>" ili " <span><b>Yandex pravila pretraživanja</b> </span>», Slijedite poveznicu kako biste odgovorili na vaš zahtjev i pročitali potrebne informacije.</p> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy loading=lazy>");</script> </div> <div class="post-social-counters-block"> <div style="margin-top: 12px"> <noindex></noindex> </div> </div> </div> </div> <a name="comments"></a> <h3 class="best-theme-posts-title">Vrhunski povezani članci</h3> <div class="container-fluid"> <div class="best-theme-posts row"> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/hr/fallout-4-izmenenie-vneshnosti-konsol-otlichaetsya-dvizhenie-myshi-po.html"> <div class="img_container"><img src="/uploads/686669656a5df8de6a6f9d463fe60026.jpg" border="0" alt="Različiti pokreti miša okomito i vodoravno" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Različiti pokreti miša okomito i vodoravno</span> </a> </div> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/hr/kak-szhat-tekstury-v-fallout-4-ruchnaya-nastroika-grafiki.html"> <div class="img_container"><img src="/uploads/d7c98012600dd0a7e0e0c14fa8d2e1eb.jpg" border="0" alt="Kako komprimirati teksture u Fallout 4" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Kako komprimirati teksture u Fallout 4</span> </a> </div> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/hr/nizkie-nastroiki-grafiki-fallout-4-ostalos-tolko-ponyat-nuzhnyi-uroven.html"> <div class="img_container"><img src="/uploads/da3d853bd41405e0322c2a1e985df14b.jpg" border="0" alt="Ostaje samo razumjeti potrebnu razinu" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Ostaje samo razumjeti potrebnu razinu</span> </a> </div> </div> </div> </div> <a name="comments"></a> </div> <div class="right-column col-sm-4 col-md-4"> <div class="write"> <span class="tags-title">Kategorije:</span> <ul style="height: 286px;" id="right-tags" data-tagscount="18" data-currentmaxtag="10" class="tags"> <li class=""><a href="https://bumotors.ru/hr/category/programs/">Programi</a></li> <li class=""><a href="https://bumotors.ru/hr/category/safety/">Sigurnost</a></li> <li class=""><a href="https://bumotors.ru/hr/category/windows-10/">Windows 10</a></li> <li class=""><a href="https://bumotors.ru/hr/category/iron/">Željezo</a></li> <li class=""><a href="https://bumotors.ru/hr/category/windows-8/">Windows 8</a></li> <li class=""><a href="https://bumotors.ru/hr/category/vkontakte/">U kontaktu s</a></li> <li class=""><a href="https://bumotors.ru/hr/category/errors/">Pogreške</a></li> </ul> </div> <div class="banner"> </div> </div> </div> </div> <div style="clear:both"></div> </div> <div class="footer"> <div class="subscribe"> <div class="main-wrapper container"> <div class="row"> <div class="col-sm-8"> </div> <div class="col-sm-4"> <div class="social"> <a href="" class="vk social-ico"></a> <a href="https://facebook.com/" class="fb social-ico"></a> <a href="https://twitter.com/" class="tw social-ico"></a> </div> </div> </div> </div> </div> <div class="info"> <div class="main-wrapper container"> <div class="row"> <span class="footer-info col-xs-12">© 2021 bumotors.ru. Kako postaviti pametne telefone i računala. Informativni portal.</span> </div> </div> </div> </div> </body> </html>