Come configurare smartphone e PC. Portale informativo
  • casa
  • In contatto con
  • I principali motori di ricerca su Internet. Motori di ricerca su Internet: Yandex, Google, Rambler, Yahoo

I principali motori di ricerca su Internet. Motori di ricerca su Internet: Yandex, Google, Rambler, Yahoo

Totale

introduzione

Poche persone oggi possono immaginare Internet senza la ricerca, i risultati delle ricerche e i sistemi di ricerca delle informazioni (IRS) che organizzano il tutto. Ma fino a poco tempo fa tutte le informazioni su Internet rientravano in diverse directory, i cui nomi sono ancora ben noti (DMOZ, Yahoo).

Oggi il volume delle informazioni su Internet è così enorme che è impossibile inserirle in qualsiasi catalogo. Per elaborare, archiviare informazioni e organizzare le ricerche, sono stati creati e continuano a essere creati potenti prodotti software, che chiamiamo motori di ricerca (SE). Ogni motore di ricerca (motore di ricerca) ha i propri database, i propri algoritmi per l'elaborazione, la ricerca, il posizionamento e la visualizzazione delle informazioni.

I motori di ricerca su Internet lo sono

Si può dare la seguente definizione accademica di motori di ricerca. Un sistema di ricerca è un insieme di programmi e mezzi tecnici per organizzare la ricerca di un utente su Internet, in cui, quando risponde a una query di testo, l'utente riceve un elenco di risultati rilevanti (corrispondenti alla richiesta).

L'emissione avviene sotto forma di un elenco di collegamenti alla fonte di informazione con una breve descrizione (anteprima), a volte con una foto.

Per il primo esempio, ricordiamo il leader della ricerca mondiale "Google" e il leader del motore di ricerca Runet "Yandex". Oltre a questi motori di ricerca, puoi nominare una dozzina di altri motori di ricerca esistenti, di cui parleremo di seguito.

Opinione: i motori di ricerca Google, Yandex e altri non sono generatori (produttori) di contenuti, ma sono aggregatori (accumulatori) di contenuti e, per la maggior parte, di contenuti di altre persone. Vale la pena ricordare che l’utilizzo dei contenuti di qualcun altro per creare il proprio traffico e monetizzarlo può essere definito “pirateria”, cosa che, ovviamente, non avviene nella realtà.

Valutazione

  • e Google condividono i primi due posti di leader: circa il 49% e il 45%.
  • Terzo posto: Cerca Mail.ru circa il 3%;
  • Gli altri motori di ricerca fluttuano sotto l'1%.

Guardo le statistiche su Google Analytics:

  • yandex/organico 40,26%
  • google/organico 38,93%
  • mail.ru/organic 0,60%
  • escursionistico/biologico 0,52%
  • bing/organico 0,12%

Le statistiche sono inesorabili: le ricerche Yandex vengono utilizzate soprattutto e se si considera che il 3% è un buon risultato rispetto al 45%, la ricerca Mail.ru può essere definita la terza più popolare.

A questo proposito, le discussioni sulla popolarità dei motori di ricerca diversi da Yandex e Google possono essere attribuite alla superstizione e la promozione speciale dei siti in altri motori di ricerca (non Yandex e Google) non merita attenzione.

Come funzionano i motori di ricerca

La domanda su come funzionano i motori di ricerca è comune quanto la domanda “di che colore è il cielo”. Se il cielo è azzurro, i motori di ricerca raccolgono informazioni su Internet, le elaborano, le classificano e le inviano all'utente in base alla query di ricerca.

La teoria della ricerca su Internet è molto più ampia e non può essere presentata nell'articolo. Tuttavia, i punti principali ci saranno utili:

I motori di ricerca Internet non archiviano documenti, ovvero non scaricano e caricano completamente i documenti nei propri archivi;

Gli IRS utilizzano Internet come archivio di documenti decentralizzato. I motori di ricerca scansionano periodicamente Internet, selezionano le informazioni di cui hanno bisogno in base ai loro algoritmi e le inseriscono parzialmente (le informazioni) nel loro database (Database). Ciò porta a diversi problemi:

  • I sistemi di recupero delle informazioni non utilizzano tutte le informazioni presenti in Internet, ma solo parte di esse;
  • Le informazioni su Internet cambiano frequentemente. Vengono aggiunte circa 1.500mila pagine al giorno, da qui il possibile “output vuoto”;
  • È presente un gran numero di duplicati (contenuti duplicati). Purtroppo non dispongo di dati esatti sulle riprese, e la cifra riportata del 25% delle riprese mi sembra troppo alta;
  • C'è molta pubblicità, che viene bypassata anche dai motori di ricerca;
  • Il "vagare" dei robot di ricerca sulla rete aumenta notevolmente il carico sulle risorse (non si applica ai motori di ricerca);
  • La maggior parte dei siti sono commerciali (circa l'83%) e hanno scarso valore informativo.

Per questi e altri motivi, la stragrande maggioranza dei sistemi di recupero delle informazioni su Internet utilizza uno schema di ricerca per parole chiave (motori di ricerca), piuttosto che un classico schema di ricerca basato sulla classificazione delle informazioni.

Funzionalità della ricerca per parole chiave

Nonostante i cambiamenti negli algoritmi dei motori di ricerca, la cui pubblicità cerca di convincerci che le macchine stanno diventando più intelligenti e comprensive, la base del lavoro dei motori di ricerca è la ricerca per parole chiave.

Mi piace questo schema di ricerca per parole chiave.

Come puoi vedere, il lavoro dei motori di ricerca Internet si basa sulla ricerca di nuovi documenti (robot di ricerca Spider + Crawler), sull'indicizzazione dei documenti rilevati (Indexer) e sull'esecuzione di una query dell'utente (Search Engine Results Engine). I nomi dei robot di ricerca utilizzati per questi scopi sono elencati tra parentesi.

Come ho detto, la maggior parte dei motori di ricerca non copia il testo completo dei documenti nel proprio database. Per la ricerca, quando si indicizza un documento, viene creata un'immagine di ricerca. Per organizzare una ricerca per , il robot di indicizzazione crea un'immagine del documento utilizzando il cosiddetto metodo derivato. Cioè, l'immagine del documento contiene un titolo e una serie di parole chiave.

Tuttavia, si può affermare in modo abbastanza accurato che tutti gli IPS prestano attenzione a quanto segue:

  • Presenza di una parola chiave in documento;</li><li>La presenza di una chiave nell'URL o nel dominio;</li><li>La presenza di una chiave nel sottotitolo;</li><li>Numero totale di tasti sulla pagina (densità%);</li><li>Presenza delle chiavi nella descrizione;</li><li>Quali collegamenti web portano a questa pagina;</li><li>Quali collegamenti interni sono presenti in questa pagina?</li> </ul><h2><span>Classifica delle pagine</span></h2><p>Alla fine della teoria, vale la pena menzionarlo. Più spesso, il posizionamento delle pagine nelle SERP viene menzionato nel contesto della pertinenza. Cioè, i motori di ricerca devono creare risultati di ricerca che corrispondano il più fedelmente possibile alla query di ricerca. Come scrive Yandex, non si dovrebbe perdere nulla (completezza dell'output) e non si dovrebbe trovare nulla di superfluo (accuratezza dell'output). Puoi vedere come funziona nella pratica ogni giorno.</p><h2>Conclusione</h2><ul><li>I motori di ricerca su Internet sono prodotti software complessi, il cui lavoro è supportato da migliaia di specialisti e da enormi risorse materiali.</li><li>Gli algoritmi dei motori di ricerca sono tenuti segreti, sebbene il focus sottostante degli aggiornamenti degli algoritmi sia pubblicamente disponibile e porti nomi propri.</li><li>Nonostante i diversi approcci alla generazione dei risultati di ricerca, tutti i motori di ricerca si basano sui principi generali dell'indicizzazione delle pagine, che fino ad oggi rimangono fondamentali per la promozione.</li> </ul><h2><span>Motore di ricerca Yandex</span></h2><p>Un popolare motore di ricerca Runet che spesso diventa il più popolare. Secondo le statistiche del 2009, Yandex esegue costantemente la scansione di 15 milioni di pagine della Runet, elaborando 140mila GB di dati di testo, 1,6 miliardi di immagini uniche su 2,1 miliardi di immagini in totale.</p><p>Il motore di ricerca Yandex è stato creato nel 1993. La parola Yandex non significa nulla, anche se è generalmente accettato che si tratti di una trasformazione della parola “Indice” o della frase “ancora un altro indicizzatore”. Oggi Yandex.Search elabora un quarto di miliardo di richieste al giorno e, se fosse così invadente, sarebbe il mio motore di ricerca preferito.</p><h2>Cerca Yandex</h2><p>https://yandex.ru/: la ricerca degli utenti Yandex è organizzata su Internet, tenendo conto della regione dell'utente. Possibilità di ricerca per immagini, video, mappe, notizie, blog, prodotti e dizionari.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-4.png' align="center" width="100%" loading=lazy loading=lazy></p><p>Per ricerche dettagliate, è disponibile una lingua di ricerca qui (https://yandex.ru/support/search/query-lingual/).</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-6.png' width="100%" loading=lazy loading=lazy></p><p>Motori di ricerca Internet Yandex</p><h2>Motore di ricerca Google</h2><p>Nel motore di ricerca Google la ricerca è organizzata senza argomenti (ricerca principale) e ricerca per sezioni: immagini, notizie, mappe, video, shopping, libri, biglietti aerei, finanza.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-8.png' align="center" width="100%" loading=lazy loading=lazy></p><p>Ci sono impostazioni:</p><p><b>Ricerca sicura.</b> Ti consente di bloccare contenuti inappropriati e immagini sessuali dai risultati di ricerca di Google. Questa funzionalità non garantisce una protezione al 100%, ma nasconde la maggior parte di tali contenuti.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-13.png' align="center" width="100%" loading=lazy loading=lazy></p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-9.png' align="center" width="100%" loading=lazy loading=lazy></p><p><b>Impostazione del numero di risultati</b> per pagina (predefinito 10).</p><p><b>Risultati personali</b>. Trova su Google link, immagini e video che i tuoi amici hanno condiviso con te sui social network.</p><p><b>Selezione della regione</b>. L'impostazione predefinita è la regione corrente.</p><p><b>Le lingue.</b>È possibile specificare la lingua di ricerca.</p><p><b>Ricerca Avanzata.</b> Consente di effettuare ricerche utilizzando parametri avanzati.</p><p><b>Utensili.</b> Qui puoi selezionare la lingua di ricerca, specificare l'ora in cui sono apparse le informazioni e selezionare una corrispondenza esatta o l'intero risultato della ricerca.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-10.png' width="100%" loading=lazy loading=lazy></p><p>Motori di ricerca Internet Google</p><h2>Motore di ricerca della posta</h2><p>https://go.mail.ru/. Qui la ricerca è organizzata su Internet (ricerca generale), per video e immagini. Esiste una ricerca separata per le applicazioni per dispositivi mobili.</p><p> (<span>https://www.bing.com/?scope=web&FORM=Z9LH</span>). Ricerca generale, ricerca per immagini, video, notizie, mappe.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-11.png' align="center" width="100%" loading=lazy loading=lazy></p><p><b>Ricerca Yahoo in russo</b>. https://ru.search.yahoo.com/. Ricerca pura senza pubblicità. Cerca in Internet, utilizzando immagini e notizie. Seleziona l'ora in cui aggiungere le informazioni.</p><h2>Altri motori di ricerca</h2><ul><li>DuckDuckGo (https://duckduckgo.com/) Ricerca intelligente.</li><li>Pipl (https://pipl.com/) Cerca persone negli Stati Uniti.</li><li>Trovasuoni ( <span>http://www.findsounds.com/ 11 Strumenti per analizzare la pertinenza delle pagine del sito rispetto a una query di ricerca</span></li> </ul> <p>Il motore di ricerca è uno degli strati chiave di Internet, insieme ai contenuti e al browser. Il motore di ricerca Yandex o sistemi simili (Google, Bing, DuckDuckGo e altri) consentono all'utente di cercare informazioni sul World Wide Web formulando una query.</p><p>Il compito di un motore di ricerca è trovare tutti i documenti, le pagine, i video, cioè tutto il contenuto, per questa query (parola chiave o frase).</p><p>Quale motore di ricerca è il migliore? Esistono opzioni alternative, qualcosa di diverso da Google e Yandex? Quale motore di ricerca Internet è più adatto per la scansione di fonti in lingua inglese o, ad esempio, di musica? Questo è esattamente ciò di cui parlerà l'articolo.</p><h2>Voto: leader di mercato</h2><p>Se parliamo del mondo nel suo insieme, il motore di ricerca Google è il motore di ricerca più popolare. La società occupa quasi il 70% del mercato. La seconda posizione in classifica è occupata da Bing (quota - 12,26%). Il sistema Baidu è in lotta per il secondo posto (6,48% a settembre 2015). Di tanto in tanto cambiano posto.</p><p>Così, ad esempio, nel 2014, le “forze” erano distribuite diversamente: il primo posto era occupato dal motore di ricerca Google con il 68,69%, il secondo da Baidu (17,7%), il terzo da Bing con una capitalizzazione di mercato di 6,22 %.</p><p>Ma i dati globali sono molto generalizzati. Quale motore di ricerca è il migliore?</p><p>In Cina, ad esempio, una percentuale molto piccola della popolazione esegue la scansione con Google; la maggioranza utilizza il sistema nazionale Soso. In Corea del Sud, la maggior parte dei residenti utilizza il proprio sviluppo: il motore di ricerca Internet Naver. Tuttavia, negli ultimi mesi il numero di richieste in questo sistema ha iniziato a diminuire rapidamente.</p><p>In Giappone e Taiwan, gli utenti sono più propensi a utilizzare Yahoo!</p><h2>Valutazione: sistemi in lingua russa</h2><p>Quale motore di ricerca è il migliore? In Russia il posizionamento sui motori di ricerca non è affatto simile a quello globale. Il leader di mercato nel segmento Internet in lingua russa è Yandex, utilizzato da oltre il 55% degli utenti.</p><p>Al secondo posto c'è Google con un risultato del 37,6%. Secondo il servizio LiveInternet, la copertura delle query di ricerca in lingua russa sul World Wide Web è stata distribuita come segue:</p><ol><li>Motori di ricerca universali: Google (37,6%), Bing (0,3%), Yahoo! (0,1%).</li><li>Di lingua inglese e internazionale (AskJeeves, per esempio).</li><li>Motori di ricerca in lingua russa: Yandex (56,2%), Mail (5,3%), Rambler (0,5%).</li> </ol><h2>DuckDuckGo</h2><p>Una conversazione sui motori di ricerca alternativi dovrebbe iniziare con il motore di ricerca DuckDuckGo. Si tratta di un sistema open source abbastanza conosciuto e diffuso. I server DuckDuckGo si trovano negli Stati Uniti d'America. I risultati della ricerca sono piuttosto estesi, poiché il sistema utilizza non solo i propri algoritmi, ma anche i risultati di altre fonti, ad esempio Wikipedia, il motore di ricerca Bing e Yahoo!</p><p>Il motore di ricerca DuckDuckGo garantisce la massima sicurezza delle informazioni personali, della privacy e della riservatezza dell'utente. Il sistema non raccoglie alcun dato sugli utenti, non memorizza la cronologia e limita il più possibile l'uso dei cookie.</p><p>La differenza tra DuckDuckGo è che questo sistema non personalizza i risultati della ricerca, come fanno altri sistemi. In Google o Yandex, ad esempio, l'utente vede solo le informazioni che corrispondono alle sue preferenze. Ma DuckDuckGo crea un'immagine reale e ti consente di sbarazzarti della pubblicità specifica e invadente. Il servizio di ricerca cerca facilmente informazioni in lingue straniere, mentre Yandex e Google preferiscono per impostazione predefinita le fonti in lingua russa, anche se la query viene inserita in inglese, tedesco o in un'altra lingua.</p><p>Il sistema ti consente di personalizzare l'interfaccia: puoi modificare colori, caratteri, collegamenti e altri parametri in pochi clic.</p><p>Questo motore di ricerca è ancora lontano dal gigante Google, ma l'anatroccolo si sta sviluppando, quindi è del tutto possibile che in futuro DuckDuckGo prenderà una delle posizioni di leader. Il team ha creato un prodotto eccellente che fornisce una ricerca anonima, veloce e funzionale che merita l'attenzione dell'utente.</p><h2>Non malvagio</h2><p>Questo è un sistema che cerca nella rete Tor anonima. Il motore di ricerca è preinstallato nel browser con lo stesso nome. Perché non è meglio il Male? “Va” dove i motori di ricerca Google o Yandex non possono arrivare. In generale, ci sono molte risorse sulla rete Tor che non possono essere visitate su Internet "normale" (rispettoso della legge). Questa è una sorta di piattaforma all'interno della rete con le proprie piattaforme social, tracker torrent, media, blog, centri commerciali, forum, biblioteche e così via.</p><p>A proposito, notEvil non è l'unico motore di ricerca del suo genere. C'è anche Look, disponibile per impostazione predefinita nello stesso browser Tor, e TORCH è uno dei motori di ricerca più antichi della rete anonima.</p><p><img src='https://i2.wp.com/syl.ru/misc/i/ai/362924/2173269.jpg' width="100%" loading=lazy loading=lazy></p><h2>YaCy</h2><p>Il motore di ricerca gratuito YaCy offre un approccio completamente diverso all'organizzazione delle ricerche sul World Wide Web. Il sistema funziona secondo il principio P2P. Ciò significa che ogni computer su cui è installato il modulo esegue la scansione di Internet in modo indipendente, quindi tutti i risultati ottenuti vengono raccolti in un unico database che può essere utilizzato da tutti gli utenti YaCy.</p><p>Il sistema è completamente indipendente, autonomo e garantisce l'anonimato di ciascun utente. YaCy è adatto ai sostenitori di un Internet aperto che non sia influenzato dalle grandi aziende e dalle agenzie governative.</p><p>Il motore di ricerca non è molto utile nella vita di tutti i giorni, ma in futuro sarà una degna alternativa a Google, anche dal punto di vista dell'organizzazione del processo di ricerca delle informazioni.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2173267.jpg' width="100%" loading=lazy loading=lazy></p><h2>Pipl</h2><p>Pipl è un sistema progettato per cercare informazioni su una persona specifica. Gli sviluppatori sostengono che gli algoritmi del motore di ricerca cercano le persone in modo più efficiente rispetto a Google o Yandex, che sono diffusi in tutto il mondo.</p><p>Le fonti prioritarie sono profili sui social network, commenti, elenchi di partecipanti, database in cui vengono pubblicati vari dati sulle persone, ad esempio database di decisioni giudiziarie. Ma c'è anche uno svantaggio. Pipl non ha accesso ai database russi, quindi sarà utile solo per cercare informazioni sui cittadini statunitensi.</p><p><img src='https://i2.wp.com/syl.ru/misc/i/ai/362924/2172783.jpg' width="100%" loading=lazy loading=lazy></p><h2>Trovasuoni</h2><p>Quale motore di ricerca è il migliore? Se hai bisogno di trovare musica o suoni, ovviamente FindSounds è il migliore. Questo è un motore di ricerca specializzato con un elenco di tag. Qui è possibile selezionare il formato o la qualità del file audio desiderato. Tutti i risultati della ricerca sono disponibili per il download.</p><p><img src='https://i0.wp.com/syl.ru/misc/i/ai/362924/2173268.jpg' width="100%" loading=lazy loading=lazy></p><h2>Wolfram|Alfa</h2><p>Questo sistema non produce pagine che contengono le informazioni di cui l'utente ha bisogno, ma un risultato finito. Ad esempio mappe, grafici, tabelle, risposte brevi. Il servizio è ideale per il calcolo dei dati e la ricerca di fatti specifici. Il motore di ricerca non comprende ancora tutte le query, ma è in continua evoluzione.</p><p>Con Wolfram|Alpha è conveniente, ad esempio, confrontare i parametri per la configurazione di una fotocamera, uno smartphone o un laptop. Calcolare anche il livello di alcol nel sangue (il sistema chiede all'utente peso e altezza, quanto ha bevuto, tempo e poi comunica quanto tempo occorrerà affinché l'alcol venga completamente eliminato dall'organismo).</p><p>Lo strumento può convertire le taglie di scarpe e vestiti, contare le calorie, visualizzare i tassi di cambio o accordare uno strumento musicale.</p><h2>Cucchiaio di cani</h2><p>Dogpile visualizza i risultati di tutti i motori di ricerca più comuni contemporaneamente. Il servizio utilizza un algoritmo migliorato e, come assicurano gli sviluppatori, genera i migliori risultati su Internet. Inoltre, ci sono pochi annunci pubblicitari. Puoi provare a utilizzare Dogpile se le informazioni che ti servono non si trovano in Google o Yandex standard.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2172777.jpg' width="100%" loading=lazy loading=lazy></p><h2>BoardReader</h2><p>Questo sistema cerca informazioni su forum, sondaggi, servizi di domande e risposte e comunità sociali, restringendo il campo di ricerca alle piattaforme social. Puoi impostare filtri: lingua e data di pubblicazione, nome del sito, ecc.</p><p>Il motore di ricerca può essere utile agli specialisti della pubblicità interessati all'opinione del pubblico.</p><p><img src='https://i1.wp.com/syl.ru/misc/i/ai/362924/2172779.jpg' width="100%" loading=lazy loading=lazy></p><h2>Finalmente</h2><p>Spesso i motori di ricerca alternativi sono fugaci. Appaiono con la stessa rapidità con cui muoiono. La maggior parte dei sistemi alternativi oggi è specializzata in una nicchia ristretta o testa un algoritmo originale nella generazione dei risultati di ricerca.</p><p>Nel contesto della descrizione dei motori di ricerca alternativi, il criterio “migliore” non significa affatto “migliore in tutto”. Ciascuno dei servizi sopra elencati offre a un utente specifico qualcosa che non è disponibile in Google o Yandex. In ogni caso, conoscere opzioni alternative (sulla base del fatto che il sistema sembra essere praticamente monopolizzato dai giganti della ricerca) è interessante e utile per ogni utente.</p> <p>I motori di ricerca (SE) sono ormai da tempo una parte essenziale di Internet. Oggi sono meccanismi enormi e complessi che non sono solo uno strumento per trovare tutte le informazioni necessarie, ma anche aree piuttosto interessanti per gli affari.</p> <br>Molti utenti delle ricerche non hanno mai pensato ai principi del loro funzionamento, a come elaborare le richieste degli utenti o a come questi sistemi sono costruiti e funzionano. Questo materiale aiuterà le persone coinvolte nell'ottimizzazione e nella comprensione della struttura e delle funzioni principali dei motori di ricerca. <h2>Funzioni e concetto di PS</h2> <b>Sistema di ricerca</b>è un complesso hardware e software progettato per svolgere la funzione di ricerca su Internet e risponde a una richiesta dell'utente, che di solito viene specificata sotto forma di una frase di testo (o più precisamente di una query di ricerca), emettendo un riferimento elenco delle fonti di informazione, in base alla pertinenza. I motori di ricerca più comuni e più grandi: Google, Bing, Yahoo, Baidu. In RuNet: Yandex, Mail.Ru, Rambler. <p>Diamo uno sguardo più da vicino al significato della query di ricerca, prendendo come esempio il sistema Yandex.</p><p>La richiesta deve essere formulata dall'utente in piena coerenza con l'oggetto della ricerca, nel modo più semplice e sintetico possibile. Ad esempio, vogliamo trovare informazioni in questo motore di ricerca: "come scegliere un'auto per te". Per fare ciò, apri la pagina principale e inserisci la query di ricerca "come scegliere un'auto". Quindi le nostre funzioni si riducono a seguire i collegamenti forniti alle fonti di informazione sulla rete.</p><p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/6d6/yandex-auto.png' width="100%" loading=lazy loading=lazy><br></p> <br>Ma anche agendo in questo modo, potremmo non ottenere le informazioni di cui abbiamo bisogno. Se riceviamo un risultato così negativo, dobbiamo solo riformattare la nostra richiesta, altrimenti il ​​database di ricerca non ha davvero alcuna informazione utile su questo tipo di richiesta (questo è del tutto possibile dati i parametri "ristretti" della richiesta, come, ad esempio, “come scegliere un'auto ad Anadyr "). <p>Il compito fondamentale di ogni motore di ricerca è fornire alle persone esattamente il tipo di informazioni di cui hanno bisogno. Ed è praticamente impossibile insegnare agli utenti a creare il tipo di query “corrette” per i motori di ricerca, cioè frasi che corrispondano ai loro principi operativi.</p><p>Ecco perché gli sviluppatori specializzati di motori di ricerca creano principi e algoritmi per il loro lavoro che consentano agli utenti di trovare le informazioni a cui sono interessati. Ciò significa che il sistema deve “pensare” nello stesso modo in cui pensa una persona quando cerca le informazioni necessarie su Internet.</p><p>Quando inserisce la sua richiesta in un motore di ricerca, vuole trovare ciò di cui ha bisogno nel modo più semplice e veloce possibile. Dopo aver ricevuto il risultato, l’utente valuta le prestazioni del sistema, guidato da diversi criteri. È riuscito a trovare le informazioni di cui aveva bisogno? In caso contrario, quante volte ha dovuto riformattare il testo della query per trovarlo? Quanto erano aggiornate le informazioni ricevute? Quanto velocemente il motore di ricerca ha elaborato la sua richiesta? Quanto sono stati facili da usare i risultati della ricerca forniti? Il risultato desiderato era il primo o era al 30° posto? Quanta “spazzatura” (informazioni non necessarie) è stata trovata insieme a informazioni utili? Si troveranno informazioni rilevanti per lui, quando utilizza il PS, in una settimana o in un mese?</p><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/ceb/rangirovanie.png' width="100%" loading=lazy loading=lazy><br></p> <br>Per ottenere le risposte giuste a tali domande, gli sviluppatori di ricerca migliorano costantemente i principi del ranking e i suoi algoritmi, aggiungendovi nuove caratteristiche e funzioni e cercando in ogni modo di far funzionare il sistema più velocemente. <h2>Principali caratteristiche dei motori di ricerca</h2>Indichiamo le principali caratteristiche della ricerca: <h3>Completezza.</h3>La completezza è una delle caratteristiche più importanti di una ricerca; rappresenta il rapporto tra il numero di documenti informativi trovati su richiesta e il loro numero totale su Internet relativo a una determinata richiesta. Ad esempio, su Internet ci sono 100 pagine con la frase “come scegliere un'auto”, e per la stessa query ne sono state selezionate solo 60 del totale, quindi in questo caso la completezza della ricerca sarà 0,6. È chiaro che quanto più completa è la ricerca stessa, tanto maggiore è la probabilità che l'utente trovi esattamente il documento di cui ha bisogno, ovviamente, sempre che esista. <h3>Precisione.</h3>Un'altra funzione principale di un motore di ricerca è la precisione. Determina il grado in cui le pagine trovate su Internet corrispondono alla richiesta dell’utente. Ad esempio, se ci sono un centinaio di documenti per la frase chiave "come scegliere un'auto", metà di essi contengono questa frase e il resto contiene semplicemente le seguenti parole (come scegliere correttamente un'autoradio e installarla in un'auto ), la precisione della ricerca è pari a 50/100 = 0,5. <p>Più accurata è la ricerca, prima l'utente troverà le informazioni di cui ha bisogno, meno tra i risultati si troveranno “spazzature” varie, meno documenti trovati non corrisponderanno al significato della richiesta.</p><h3>Rilevanza.</h3>Si tratta di una componente significativa della ricerca, caratterizzata dal tempo che trascorre dal momento in cui le informazioni vengono pubblicate su Internet fino al momento in cui vengono inserite nel database dell'indice del motore di ricerca. <p>Ad esempio, il giorno dopo la pubblicazione delle informazioni sul rilascio di un nuovo iPad, molti utenti si sono rivolti alla ricerca con tipi di query pertinenti. Nella maggior parte dei casi, le informazioni su questa notizia sono già disponibili nella ricerca, anche se è trascorso pochissimo tempo dalla sua comparsa. Ciò è dovuto al fatto che i grandi motori di ricerca dispongono di un “database veloce” che viene aggiornato più volte al giorno.</p><h3>Velocità di ricerca.</h3>Una funzione come la velocità di ricerca è strettamente correlata alla cosiddetta "resistenza al carico". Un numero enorme di persone accede alla ricerca ogni secondo; tale carico di lavoro richiede una significativa riduzione del tempo necessario per elaborare una richiesta. Qui gli interessi sia del motore di ricerca che dell'utente coincidono completamente: il visitatore vuole ottenere risultati il ​​più rapidamente possibile e il motore di ricerca deve elaborare la sua richiesta il più rapidamente possibile per non rallentare l'elaborazione delle richieste successive. <h3>Visibilità.</h3>La presentazione visiva dei risultati è l'elemento più importante per la comodità della ricerca. Sulla base di numerose query, il motore di ricerca trova migliaia, e in alcuni casi milioni, di documenti diversi. A causa della vaghezza della compilazione delle frasi chiave per la ricerca o della sua inesattezza, anche i primissimi risultati della ricerca non sempre contengono solo le informazioni necessarie. <p>Ciò significa che spesso una persona deve condurre la propria ricerca tra i risultati forniti. Vari componenti delle pagine dei risultati di ricerca ti aiutano a navigare nei risultati di ricerca.</p><h2>Storia dello sviluppo dei motori di ricerca</h2>Quando Internet iniziò a svilupparsi, il numero dei suoi utenti abituali era piccolo e la quantità di informazioni a cui accedere era relativamente piccola. In sostanza, solo gli specialisti nei campi di ricerca avevano accesso a questa rete. A quel tempo, il compito di trovare informazioni non era così urgente come lo è adesso. <p>Uno dei primissimi metodi per organizzare un ampio accesso alle risorse informative è stata la creazione di directory dei siti e i collegamenti ad esse hanno iniziato a essere raggruppati per argomento. Il primo progetto è stata la risorsa Yahoo.com, aperta nella primavera del 1994. Successivamente, quando il numero di siti nella directory Yahoo è aumentato in modo significativo, è stata aggiunta la possibilità di cercare le informazioni necessarie nella directory. Non era ancora un sistema di ricerca completo, poiché lo scopo di tale ricerca era limitato solo ai siti inclusi in questa directory e non assolutamente a tutte le risorse su Internet. Le directory di collegamento erano ampiamente utilizzate in passato, ma oggigiorno hanno perso quasi completamente la loro popolarità.</p><p>Dopotutto, anche i cataloghi di oggi, che sono enormi in termini di volume, contengono informazioni solo su una piccola parte dei siti su Internet. La directory più famosa e più grande del mondo contiene informazioni su cinque milioni di siti, mentre il database di Google contiene informazioni su oltre 25 miliardi di pagine.</p><p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/d6d/dmoz.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>Il primo vero motore di ricerca è stato WebCrawler, apparso nel 1994. <p>L'anno successivo apparvero AltaVista e Lycos. Inoltre, il primo è stato per molto tempo leader nella ricerca di informazioni.</p><p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/e9a/altavista.png' width="100%" loading=lazy loading=lazy><br></p> <br>Nel 1997, Sergey Brin, insieme a Larry Page, ha creato il motore di ricerca Google come progetto di ricerca presso l'Università di Stanford. Oggi è Google, il motore di ricerca più popolare e frequentato al mondo. <p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/773/Sergey-Brin-and-Larry-Page.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>Nel settembre 1997 è stato annunciato (ufficialmente) Yandex PS, che attualmente è il sistema di ricerca più popolare su RuNet. <p> <br><img src='https://i0.wp.com/uniofweb.ru/upload/medialibrary/24c/yandex.jpg' width="100%" loading=lazy loading=lazy><br></p> <br>Secondo <b>Settembre 2015</b>, le quote dei motori di ricerca nel mondo sono così distribuite: <ul><li>Google - 69,24%;</li> <li>Bing - 12,26%;</li> <li>Yahoo! -9,19%;</li> <li>Baidu - 6,48%;</li> <li>AOL – 1,11%;</li> <li>Chiedi - 0,23%;</li> <li>Emoziona - 0,00%</li> </ul><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/528/search.png' width="100%" loading=lazy loading=lazy></p><p>Secondo <b>Dicembre 2016</b>, condivisioni dei motori di ricerca in Runet:</p><ul><li>Yandex-48,40%</li> <li>Google - 45,10%</li> <li>Search.Mail.ru - 5,70%</li> <li>Escursionista - 0,40%</li> <li>Bing-0,30%</li> <li>Yahoo - 0,10%</li> </ul><p><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/e7d/search-runet.png' width="100%" loading=lazy loading=lazy></p> <h2>Come funziona un motore di ricerca</h2>In Russia, il motore di ricerca principale è Yandex, poi Google e poi Poisk@Mail.ru. Tutti i grandi motori di ricerca hanno una propria struttura, che è abbastanza diversa dagli altri. Ma è comunque possibile individuare gli elementi base comuni a tutti i motori di ricerca. <h3>Modulo di indicizzazione.</h3>Questo componente è costituito da tre programmi del robot: <p><b>Ragno</b>(in inglese spider) è un programma progettato per scaricare pagine web. Lo spider scarica una pagina specifica, estraendo contemporaneamente tutti i collegamenti da essa. Il codice HTML viene scaricato da quasi tutte le pagine. Per questo, i robot utilizzano i protocolli HTTP.</p><p> <br><img src='https://i2.wp.com/uniofweb.ru/upload/medialibrary/a70/spiders.png' width="100%" loading=lazy loading=lazy><br></p> <br>"Spider" funziona come segue. Il robot invia una richiesta al server "get/path/document" e altri comandi di richiesta HTTP. In risposta, il programma robot riceve un flusso di testo che contiene informazioni sul tipo di servizio e, ovviamente, il documento stesso. <ul><li>URL della pagina scaricata;</li> <li>data in cui è stata scaricata la pagina;</li> <li>intestazione della risposta http del server;</li> <li>codice html, “corpo” della pagina.</li> </ul><b>Cingolato</b>(ragno “viaggiatore”). Questo programma va automaticamente a tutti i collegamenti che si trovano nella pagina e li evidenzia. Il suo compito è decidere dove dirigere lo spider in base a questi collegamenti o in base a un determinato elenco di indirizzi. <p><b>Indicizzatore</b>(robot indicizzatore) è un programma che analizza le pagine scaricate dagli spider.</p><p> <br><img src='https://i1.wp.com/uniofweb.ru/upload/medialibrary/5c3/indexing.png' width="100%" loading=lazy loading=lazy></p> <br>L'indicizzatore analizza completamente la pagina nei suoi elementi componenti e li analizza utilizzando i propri algoritmi morfologici e lessicali. <p>L'analisi viene effettuata su varie parti della pagina, come intestazioni, testo, link, caratteristiche di stile e struttura, tag html, ecc.</p><p>Pertanto, il modulo di indicizzazione consente di seguire i collegamenti di un determinato numero di risorse, scaricare pagine, estrarre collegamenti a nuove pagine dai documenti ricevuti ed eseguirne un'analisi dettagliata.</p><h3>Banca dati</h3> <b>Banca dati</b>(o indice del motore di ricerca) è un complesso di archiviazione di dati, un insieme di informazioni in cui vengono memorizzati in un certo modo i parametri modificati di ciascun documento elaborato dal modulo di indicizzazione e scaricato. <h3>Cerca nel server</h3>Questo è l'elemento più importante dell'intero sistema, perché la velocità e, ovviamente, la qualità della ricerca dipendono direttamente dagli algoritmi alla base della sua funzionalità. <p>Il server di ricerca funziona come segue:</p><ul><li>La richiesta che arriva dall'utente è soggetta ad analisi morfologica. Viene generato l'ambiente informativo di qualsiasi documento disponibile nel database (verrà successivamente visualizzato come snippet, ovvero un campo informativo di testo corrispondente ad una determinata richiesta).</li> <li>I dati ricevuti vengono passati come parametri di input a un modulo di classificazione specializzato. Vengono elaborati per tutti i documenti e, di conseguenza, per ciascuno di questi documenti viene calcolata la propria valutazione, che caratterizza la pertinenza di tale documento rispetto alla richiesta dell'utente e altri componenti.</li> <li>A seconda delle condizioni specificate dall'utente, questa valutazione potrebbe essere modificata con altre.</li> <li>Quindi viene generato lo snippet stesso, ad es. Per ogni documento trovato, il titolo, l'abstract che meglio corrisponde alla query e un collegamento a questo documento vengono estratti dalla tabella corrispondente e le forme e le parole delle parole trovate vengono evidenziate.</li> <li>I risultati della ricerca risultante vengono trasmessi alla persona che l'ha eseguita sotto forma di una pagina in cui vengono visualizzati i risultati della ricerca (SERP).</li> </ul> Tutti questi elementi sono strettamente correlati tra loro e funzionano, interagendo, formando un meccanismo distinto, ma piuttosto complesso per il funzionamento del PS, che richiede un enorme dispendio di risorse. <p>Sono diventati da tempo parte integrante dell'Internet russa. I motori di ricerca sono oggi meccanismi enormi e complessi che rappresentano non solo uno strumento di ricerca di informazioni, ma anche aree allettanti per le imprese.</p><p>La maggior parte degli utenti dei motori di ricerca non ha mai pensato (o ci ha pensato, ma non ha trovato risposta) al principio di funzionamento dei motori di ricerca, allo schema di elaborazione delle richieste degli utenti, in cosa consistono questi sistemi e come funzionano...</p><p>Questa master class è progettata per rispondere alla domanda su come funzionano i motori di ricerca. Tuttavia, qui non troverai fattori che influenzano la classificazione dei documenti. Inoltre, non dovresti contare su una spiegazione dettagliata dell'algoritmo Yandex. Lui, secondo Ilya Segalovich, direttore della tecnologia e dello sviluppo del motore di ricerca Yandex, può essere riconosciuto solo "sotto tortura" dallo stesso Ilya Segalovich...</p><p><b>2. Concetto e funzioni di un motore di ricerca</b></p><p>Un sistema di ricerca è un complesso software e hardware progettato per effettuare ricerche in Internet e rispondere a una richiesta dell'utente, specificata sotto forma di frase di testo (query di ricerca), producendo un elenco di collegamenti a fonti di informazione, in ordine di pertinenza ( secondo la richiesta). I più grandi motori di ricerca internazionali: <a target="_blank" href="http://www.google.com">"Google"</a>, Yahoo, MSN. Su Internet russo questi sono Yandex, Rambler, Aport.</p><p>Diamo uno sguardo più da vicino al concetto di query di ricerca utilizzando come esempio il motore di ricerca Yandex. La query di ricerca deve essere formulata dall'utente in base a ciò che desidera trovare, nel modo più breve e semplice possibile. Diciamo che vogliamo trovare informazioni in Yandex su come scegliere un'auto. Per fare ciò, apri la pagina principale di Yandex e inserisci il testo della query di ricerca "come scegliere un'auto". Successivamente, il nostro compito si riduce all'apertura dei collegamenti forniti su nostra richiesta a fonti di informazione su Internet. Tuttavia, è del tutto possibile che non troveremo le informazioni di cui abbiamo bisogno. Se ciò accade, allora o devi riformulare la tua richiesta, oppure il database del motore di ricerca in realtà non ha alcuna informazione rilevante sulla nostra richiesta (questo può accadere quando si pongono domande molto “ristrette”, come, ad esempio, “come scegliere un’auto ad Arcangelo”)</p><p>L'obiettivo principale di qualsiasi motore di ricerca è fornire alle persone esattamente le informazioni che stanno cercando. E insegnare agli utenti a effettuare richieste “corrette” al sistema, ad es. le query conformi ai principi di funzionamento dei motori di ricerca sono impossibili. Pertanto, gli sviluppatori creano algoritmi e principi operativi per i motori di ricerca che consentano agli utenti di trovare le informazioni che stanno cercando.</p><p>Ciò significa che il motore di ricerca deve “pensare” nello stesso modo in cui pensa l’utente quando cerca informazioni. Quando un utente effettua una richiesta ad un motore di ricerca, desidera trovare ciò di cui ha bisogno nel modo più rapido e semplice possibile. Ricevendo il risultato, valuta le prestazioni del sistema, guidato da diversi parametri di base. Ha trovato quello che cercava? Se non lo trovava, quante volte ha dovuto riformulare la domanda per trovare quello che stava cercando? Quante informazioni rilevanti potrebbe trovare? Quanto velocemente il motore di ricerca ha elaborato la richiesta? Quanto sono stati convenienti i risultati della ricerca presentati? Il risultato che cercavi era il primo o il centesimo? Quanta spazzatura inutile è stata trovata insieme a informazioni utili? Le informazioni necessarie verranno trovate quando si accede a un motore di ricerca, diciamo, tra una settimana o un mese?</p><p>Per soddisfare tutte queste domande con le risposte, gli sviluppatori dei motori di ricerca migliorano costantemente gli algoritmi e i principi di ricerca, aggiungendo nuove funzioni e capacità e cercando in ogni modo possibile di accelerare il funzionamento del sistema.</p><p><b>3. Principali caratteristiche di un motore di ricerca</b></p><p>Descriviamo le principali caratteristiche dei motori di ricerca:</p><ul><li><i>Completezza</i><p>La completezza è una delle caratteristiche principali di un sistema di ricerca, ovvero il rapporto tra il numero di documenti trovati dalla richiesta e il numero totale di documenti su Internet che soddisfano la richiesta data. Ad esempio, se su Internet sono presenti 100 pagine contenenti la frase "come scegliere un'auto" e per la query corrispondente ne sono state trovate solo 60, la completezza della ricerca sarà 0,6. Ovviamente, più la ricerca è completa, meno è probabile che l'utente non trovi il documento di cui ha bisogno, a condizione che esista su Internet.</p></li><li><i>Precisione</i><p>La precisione è un'altra caratteristica principale di un motore di ricerca, che è determinata dal grado in cui i documenti trovati corrispondono alla query dell'utente. Ad esempio, se la query “come scegliere un'auto” contiene 100 documenti, 50 di essi contengono la frase “come scegliere un'auto” e il resto contiene semplicemente queste parole (“come scegliere la radio giusta e installarla in un’auto”), allora la precisione della ricerca è considerata pari a 50/100 (=0,5). Più accurata è la ricerca, più velocemente l'utente troverà i documenti di cui ha bisogno, meno si troveranno tra loro vari tipi di "spazzatura", meno spesso i documenti trovati non corrisponderanno alla richiesta.</p></li><li><i>Rilevanza</i><p>La pertinenza è una componente altrettanto importante della ricerca, caratterizzata dal tempo che trascorre dal momento in cui i documenti vengono pubblicati su Internet fino al loro inserimento nel database dell'indice del motore di ricerca. Ad esempio, il giorno successivo alla pubblicazione di notizie interessanti, un gran numero di utenti si è rivolto ai motori di ricerca con query pertinenti. Oggettivamente è passato meno di un giorno dalla pubblicazione delle notizie sull'argomento, ma i principali documenti sono già stati indicizzati e disponibili per la ricerca, grazie all'esistenza del cosiddetto “database veloce” dei grandi motori di ricerca, che viene aggiornato più volte al giorno.</p></li><li><i>Velocità di ricerca</i><p>La velocità di ricerca è strettamente correlata alla sua resistenza al carico. Ad esempio, secondo Rambler Internet Holding LLC, oggi, durante l'orario lavorativo, il motore di ricerca Rambler riceve circa 60 richieste al secondo. Tale carico di lavoro richiede la riduzione del tempo di elaborazione di una singola richiesta. Qui gli interessi dell'utente e del motore di ricerca coincidono: il visitatore vuole ottenere risultati il ​​più rapidamente possibile, e il motore di ricerca deve elaborare la richiesta il più rapidamente possibile, per non rallentare il calcolo delle query successive.</p></li><li><i>Visibilità</i></li> </ul><p><b>4. Breve storia dello sviluppo dei motori di ricerca</b><br></p><p>Nel periodo iniziale dello sviluppo di Internet, il numero degli utenti era piccolo e la quantità di informazioni disponibili era relativamente piccola. Nella maggior parte dei casi solo il personale di ricerca aveva accesso a Internet. A quel tempo, il compito di cercare informazioni su Internet non era così urgente come lo è adesso.</p><p>Uno dei primi modi per organizzare l'accesso alle risorse informative della rete è stata la creazione di directory aperte di siti, collegamenti a risorse in cui erano raggruppati per argomento. Il primo progetto di questo tipo è stato il sito web Yahoo.com, inaugurato nella primavera del 1994. Dopo che il numero di siti nel catalogo è aumentato in modo significativo, è stata aggiunta la possibilità di cercare le informazioni necessarie nel catalogo. In senso pieno non era ancora un motore di ricerca, poiché l'area di ricerca era limitata solo alle risorse presenti nel catalogo e non a tutte le risorse Internet.</p><p>Le directory di collegamento erano ampiamente utilizzate in passato, ma oggi hanno perso quasi completamente la loro popolarità. Poiché anche i cataloghi moderni, di volume enorme, contengono informazioni solo su una parte trascurabile di Internet. La più grande directory della rete DMOZ (chiamata anche Open Directory Project) contiene informazioni su circa 5 milioni di risorse, mentre il database del motore di ricerca di Google è composto da oltre 8 miliardi di documenti.</p><p>Nel 1995 apparvero i motori di ricerca Lycos e AltaVista. Quest'ultimo è da molti anni leader nel campo della ricerca di informazioni su Internet.</p><p>Nel 1997, Sergey Brin e Larry Page hanno creato il motore di ricerca Google come parte di un progetto di ricerca presso l'Università di Stanford. Google è attualmente il motore di ricerca più popolare al mondo!</p><p>Nel settembre 1997 è stato annunciato ufficialmente il motore di ricerca Yandex, il più popolare su Internet in lingua russa.</p><p>Attualmente esistono tre principali motori di ricerca (internazionali): Google, Yahoo e, che dispongono dei propri database e algoritmi di ricerca. La maggior parte degli altri motori di ricerca (di cui ce ne sono un gran numero) utilizzano in una forma o nell'altra i risultati dei tre elencati. Ad esempio, la ricerca AOL (search.aol.com) utilizza il database di Google, mentre AltaVista, Lycos e AllTheWeb utilizzano il database di Yahoo.</p><p><b>5. Composizione e principi di funzionamento del sistema di ricerca</b></p><p>In Russia, il motore di ricerca principale è Yandex, seguito da Rambler.ru, Google.ru, Aport.ru, Mail.ru. Inoltre, al momento Mail.ru utilizza il motore di ricerca e il database Yandex.</p><p>Quasi tutti i principali motori di ricerca hanno una propria struttura, diversa dagli altri. È possibile tuttavia individuare le principali componenti comuni a tutti i motori di ricerca. Le differenze nella struttura possono essere solo sotto forma di implementazione dei meccanismi di interazione di questi componenti.</p><p><b><b>Modulo di indicizzazione</b> </b></p><p>Il modulo di indicizzazione è composto da tre programmi ausiliari (robot):</p><p>Spider è un programma progettato per scaricare pagine web. Lo spider scarica la pagina e recupera tutti i collegamenti interni da quella pagina. Viene scaricato il codice html di ogni pagina. I robot utilizzano i protocolli HTTP per scaricare le pagine. Il ragno funziona come segue. Il robot invia la richiesta "get/path/document" e alcuni altri comandi di richiesta HTTP al server. In risposta, il robot riceve un flusso di testo contenente informazioni sul servizio e il documento stesso.</p><ul><li>URL della pagina</li><li>data in cui la pagina è stata scaricata</li><li>Intestazione http della risposta del server</li><li>corpo della pagina (codice html)</li> </ul><p>Crawler (spider “viaggiatore”) è un programma che segue automaticamente tutti i link presenti nella pagina. Seleziona tutti i collegamenti presenti nella pagina. Il suo compito è determinare dove dovrebbe andare lo spider, in base a collegamenti o ad un elenco predeterminato di indirizzi. Il crawler, seguendo i link trovati, ricerca nuovi documenti ancora sconosciuti al motore di ricerca.</p><p>Indexer (indicizzatore robot) è un programma che analizza le pagine web scaricate dagli spider. L'indicizzatore analizza la pagina nelle sue parti componenti e le analizza utilizzando i propri algoritmi lessicali e morfologici. Vengono analizzati vari elementi della pagina, come testo, intestazioni, collegamenti, caratteristiche strutturali e di stile, tag HTML di servizi speciali, ecc.</p><p>Pertanto, il modulo di indicizzazione consente di eseguire la scansione di un determinato insieme di risorse utilizzando i collegamenti, scaricare le pagine incontrate, estrarre collegamenti a nuove pagine dai documenti ricevuti ed eseguire un'analisi completa di questi documenti.</p><p><b><b>Banca dati</b> </b></p><p>Un database, o indice di un motore di ricerca, è un sistema di archiviazione dei dati, una matrice di informazioni in cui vengono memorizzati parametri appositamente convertiti di tutti i documenti scaricati ed elaborati dal modulo di indicizzazione.</p><p><b><b>Cerca nel server</b> </b></p><p>Il server di ricerca è l'elemento più importante dell'intero sistema, poiché la qualità e la velocità della ricerca dipendono direttamente dagli algoritmi che sono alla base del suo funzionamento.</p><p>Il server di ricerca funziona come segue:</p><ul><li>La richiesta ricevuta dall'utente viene sottoposta ad analisi morfologica. Di ogni documento contenuto nel database viene generato l'ambiente informativo (che verrà successivamente visualizzato in form, ovvero informazioni testuali corrispondenti alla richiesta nella pagina dei risultati della ricerca).</li><li>I dati ricevuti vengono passati come parametri di input a uno speciale modulo di classificazione. I dati vengono elaborati per tutti i documenti, per cui ogni documento ha una propria valutazione che caratterizza la pertinenza della query inserita dall'utente e i vari componenti di questo documento memorizzati nell'indice del motore di ricerca.</li><li>A seconda della scelta dell’utente, questa valutazione può essere modificata mediante condizioni aggiuntive (ad esempio, la cosiddetta “ricerca avanzata”).</li><li>Successivamente viene generato uno snippet, ovvero per ogni documento trovato, dalla tabella dei documenti vengono estratti il ​​titolo, un breve abstract che meglio corrisponde alla query, un collegamento al documento stesso e le parole trovate vengono evidenziate.</li><li>I risultati della ricerca risultanti vengono trasmessi all'utente sotto forma di SERP (Search Engine Result Page) – una pagina dei risultati di ricerca.</li> </ul><p>Come puoi vedere, tutti questi componenti sono strettamente correlati tra loro e lavorano in interazione, formando un meccanismo chiaro e piuttosto complesso per il funzionamento del sistema di ricerca, che richiede enormi quantità di risorse.</p><p><b>6. Conclusione</b></p><p>Ora riassumiamo tutto quanto sopra.</p><ul><li>L'obiettivo principale di qualsiasi motore di ricerca è fornire alle persone esattamente le informazioni che stanno cercando.</li><li>Principali caratteristiche dei motori di ricerca: <ol><li>Completezza</li><li>Precisione</li><li>Rilevanza</li><li>Velocità di ricerca</li><li>Visibilità</li> </ol></li><li>Il primo motore di ricerca a tutti gli effetti è stato il progetto WebCrawler, pubblicato nel 1994.</li><li>Il sistema di ricerca include i seguenti componenti: <ol><li>Modulo di indicizzazione</li><li>Banca dati</li><li>Cerca nel server</li> </ol></li> </ul><p>Ci auguriamo che la nostra master class ti permetta di acquisire maggiore familiarità con il concetto di motore di ricerca e di comprendere meglio le principali funzioni, caratteristiche e principi di funzionamento dei motori di ricerca.</p> <p>I migliori motori di ricerca su Internet. Motore di ricerca su Internet <b> – </b> Si tratta di programmi di ricerca speciali installati su tutta una serie di macchine specializzate. In termini semplici, è lo stesso sito Web con una serie di programmi, solo su uno speciale motore di ricerca (server). È con l'aiuto dei motori di ricerca che trovi tutte le informazioni di cui hai bisogno. Ci sono molti motori di ricerca.</p> <p>1. <span>Cos'è un motore di ricerca su Internet</p> <p>2. Motori di ricerca popolari nel nostro paese</p> <p>3. Motori di ricerca popolari all'estero</p> <p>4. Motori di ricerca insoliti</p> <p>5. Come cercare correttamente informazioni su Internet</p> <p>Più <b>migliore pag</b><b>sistemi di ricerca</b> nel nostro Paese:</p> <p>http://www.yandex.ru</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/2-Google.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.google.com</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/3-Aport.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.aport.ru</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/4-Rambler.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.rambler.ru/</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/5-Mail.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://go.mail.ru</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/6-Webalta.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>http://www.webalta.ru/</p> <p>Il motore di ricerca più poco amato e invadente da tutti.</p> <h3><span><b>Motori di ricerca popolari all'estero</b> </span></h3> <p>http://www.altavista.com</p> <p>http://www.alltheweb.com</p> <p>http://www. bing.com</p> <p>http://www.google.com <br>http://www.excite.com <br>http://www.lycos.com <br>http://www.mamma.com</p> <p>http://www.yahoo.com</p> <p>http://www.dmoz.com <br>http://www.hotbot.com <br>http://www.dogpile.com <br>http://www.netscape.com <br>http://www.msn.com <br>http://www.webcrawler.com <br>http://www.jayde.com <br>http://www.aol.com <br>http://www.euroseek.com <br>http://www.teoma.com <br>http://www.about.com <br>http://www.ixquick.com <br>http://www.lookle.com <br>http://www.metaeureka.com <br>http://www.searchspot.com <br>http://www.slider.com <br>http://www.allthesites.com <br>http://www.clickey.com <br>http://www.galaxy.com <br>http://brainysearch.com <br>http://www.orura.com</p> <p>Ogni paese ha i propri motori di ricerca popolari.</p> <h3><span><b>Motori di ricerca insoliti</b> </span></h3> <ul><li><b><i>DuckDuckGo</i> </b>(https://duckduckgo.com/) - un motore di ricerca ibrido con una politica sulla privacy per l'utente e le sue query di ricerca.</li> </ul><p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/7-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <ul><li><b><i><span>TinEye</i> </b> </span><b><i>(http://tineye.com/)</i> </b>è un motore di ricerca specializzato nella ricerca di immagini su Internet. Recentemente ha perso la sua rilevanza dopo che Google ha introdotto la stessa funzione nella ricerca di immagini.</li> </ul><p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/8-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <ul><li><b><i>Guénon</i> </b>(http://www.genon.ru/) è un motore di ricerca che raccoglie e crea contenuti sul proprio sito web.</li> </ul><p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/9-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>In quasi tutti i motori di ricerca, oltre alla casella di ricerca, sono presenti <b>collegamenti</b> ai siti di notizie più popolari e ai siti di determinati argomenti.</p> <h3><span><b>Come cercare correttamente informazioni su Internet</b> </span></h3> <p>Ogni motore di ricerca ha i propri algoritmi (regole) per la ricerca delle informazioni.</p> <p>Per trovare alcune informazioni su Internet tramite un motore di ricerca, è necessario inserire nel campo di ricerca <b>richiesta</b>. Se inserisci una parola, questa richiesta ti fornirà migliaia di collegamenti a siti in cui viene menzionata questa parola.</p> <p>Pertanto è necessario inserire una query il più specifica possibile, composta da due, tre o più frasi.</p> <p>Diamo un'occhiata ad un esempio di una query del motore di ricerca <b>Yandex</b>.</p> <p>Supponiamo che tu voglia trovare informazioni sull'acquisto di un computer. Se scrivi una parola nella casella di ricerca “ <b>Computer</b>", otterrai 133 milioni di risposte</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/10-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>È necessario fare una richiesta più specifica. È meglio indicare quale computer desideri acquistare e dove (in quale città).</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/11-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Quindi il motore di ricerca ti darà molte meno risposte alla tua domanda.</p> <p>Al motore di ricerca non interessa affatto se inserisci la tua query in maiuscolo o minuscolo.</p> <p>Yandex distingue tra nomi e aggettivi, ma ignora completamente le desinenze.</p> <p>È anche completamente indifferente ai casi, ai plurali e simili.</p> <p>Per rendere la ricerca più accurata, è necessario racchiudere la query tra virgolette o inserire un punto esclamativo davanti alla parola.</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/12-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Ora guarda la stessa query, ma senza i punti esclamativi.</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/13-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy loading=lazy></p> <p>Vedi la differenza? Con i punti esclamativi il numero di risposte non è di 2 milioni, ma di 186mila.</p> <p>Se metti un punto esclamativo davanti a una parola con la lettera maiuscola, ti verranno fornite risposte in cui compare quella determinata parola con la lettera maiuscola.</p> <p>Se la parola è al caso nominativo e hai bisogno di informazioni esattamente su quella parola, ed esattamente come l'hai scritta, metti due punti esclamativi davanti a questa parola. Per esempio: <b>!!Palla</b> .</p> <p>La ricerca ti darà risposte esattamente per questa parola " <b>Palla</b>"come l'hai scritto tu. Non " <b>palla</b>", Non " <b>palle</b>", e con la lettera maiuscola.</p> <p>Se scrivi una frase con la parola " <b>SU</b>", Yandex ignorerà " <b>SU</b>" Per esempio: " <b>sul ripiano</b>" La ricerca verrà effettuata esclusivamente utilizzando la parola " <b>mensola</b> ».</p> <p>Affinché lui ne tenga conto e non lo ignori, è necessario prima della parola “ <b>SU</b>» mettere un segno più – « <b>+su</b> ».</p> <p>Ogni motore di ricerca ha il proprio algoritmo di ricerca, quindi se utilizzi un motore di ricerca specifico e vuoi imparare come comporre correttamente le query, devi solo digitare " <span><b>regole di ricerca in</b><b>Google</b> </span>" O " <span><b>regole di ricerca in Yandex</b> </span>", segui il link alla risposta alla tua richiesta e leggi le informazioni necessarie.</p> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy loading=lazy>");</script> </div> <div class="post-social-counters-block"> <div style="margin-top: 12px"> <noindex></noindex> </div> </div> </div> </div> <a name="comments"></a> <h3 class="best-theme-posts-title">I migliori articoli sull'argomento</h3> <div class="container-fluid"> <div class="best-theme-posts row"> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/it/kak-na-iphone-zapisyvat-razgovory-instrukciya-gde-v-aifone.html"> <div class="img_container"><img src="/uploads/ce78d38835cfd407c9055a4c9fef6cd8.jpg" border="0" alt="Come registrare conversazioni su iPhone - istruzioni" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Come registrare conversazioni su iPhone - istruzioni</span> </a> </div> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/it/metadannye-kak-uznat-gde-byla-sdelana-fotografiya-kak-tochno.html"> <div class="img_container"><img src="/uploads/c763c2d84614adb0945d306b748f96ea.jpg" border="0" alt="Come scoprire esattamente dove è avvenuta la sparatoria e nascondere la propria posizione Come trovare la posizione di una persona da una fotografia" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Come scoprire esattamente dove è avvenuta la sparatoria e nascondere la propria posizione Come trovare la posizione di una persona da una fotografia</span> </a> </div> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/it/chto-delat-esli-na-monitore-nechetkoe-izobrazhenie-nech-tkoe-mutnoe.html"> <div class="img_container"><img src="/uploads/57dbd320a7bf7403b9a151067b470f4e.jpg" border="0" alt="Finestra del programma sfocata (nuvolosa, sfocata): come risolvere Il monitor non viene visualizzato chiaramente" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Finestra del programma sfocata (nuvolosa, sfocata): come risolvere Il monitor non viene visualizzato chiaramente</span> </a> </div> </div> </div> </div> <a name="comments"></a> </div> <div class="right-column col-sm-4 col-md-4"> <div class="write"> <span class="tags-title">Categorie:</span> <ul style="height: 286px;" id="right-tags" data-tagscount="18" data-currentmaxtag="10" class="tags"> <li class=""><a href="https://bumotors.ru/it/category/programs/">Programmi</a></li> <li class=""><a href="https://bumotors.ru/it/category/safety/">Sicurezza</a></li> <li class=""><a href="https://bumotors.ru/it/category/windows-10/">Windows 10</a></li> <li class=""><a href="https://bumotors.ru/it/category/iron/">Ferro</a></li> <li class=""><a href="https://bumotors.ru/it/category/windows-8/">Windows 8</a></li> <li class=""><a href="https://bumotors.ru/it/category/vkontakte/">In contatto con</a></li> <li class=""><a href="https://bumotors.ru/it/category/errors/">Errori</a></li> </ul> </div> <div class="banner"> </div> </div> </div> </div> <div style="clear:both"></div> </div> <div class="footer"> <div class="subscribe"> <div class="main-wrapper container"> <div class="row"> <div class="col-sm-8"> </div> <div class="col-sm-4"> <div class="social"> <a href="https://vk.com/share.php?url=https://bumotors.ru/osnovnye-poiskovye-sistemy-v-internete-poiskovye-sistemy-interneta-yandeks.html" class="vk social-ico"></a> <a href="https://www.facebook.com/sharer/sharer.php?u=https://bumotors.ru/osnovnye-poiskovye-sistemy-v-internete-poiskovye-sistemy-interneta-yandeks.html" class="fb social-ico"></a> <a href="https://www.twitter.com/share?url=https%3A%2F%2Fbumotors.ru%2Fit%2Fosnovnye-poiskovye-sistemy-v-internete-poiskovye-sistemy-interneta-yandeks.html" class="tw social-ico"></a> </div> </div> </div> </div> </div> <div class="info"> <div class="main-wrapper container"> <div class="row"> <span class="footer-info col-xs-12">© 2023 bumotors.ru. Come configurare smartphone e PC. Portale informativo.</span> </div> </div> </div> </div> </body> </html>