Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ

Motorë kërkimi. Gjetja e informacionit në ueb

Një mjek pasuniversitar mund të gjejë në internet artikuj shkencorë për të shkruar një përmbledhje të literaturës së një teze doktorature mjekësore, artikuj në një gjuhë të huaj për përgatitjen për provimin minimal të kandidatit, një përshkrim të metodave moderne të kërkimit dhe shumë më tepër ...

Si të kërkoni informacion në internet duke përdorur motorët e kërkimit do të diskutohet në këtë artikull.

Për ata që nuk janë ende shumë të përgatitur në koncepte të tilla si një faqe, një server, po ju jap disa informacione bazë për internetin.

Interneti është një grup faqesh të vendosura në serverë, të bashkuar nga kanale komunikimi (linja telefonike, fibër optike dhe satelitore).

Një sajt është një koleksion dokumentesh në format html (faqe faqesh) të lidhura me hiperlidhje.

Një faqe e madhe (për shembull, "Medlink" - drejtoria tematike mjekësore http://www.medlinks.ru - përbëhet nga 30,000 faqe, dhe sasia e hapësirës në disk që zë në server është rreth 400 MB).
Një sajt i vogël përbëhet nga disa dhjetëra - qindra faqe dhe zë 1 - 10 Mb (për shembull, faqja ime "Doktor-student i diplomuar" më 25 korrik 2004 përbëhej nga 280 faqe .htm dhe zinte 6 Mb në server).

Një server është një kompjuter i lidhur me internetin dhe që punon gjatë gjithë orës. Serveri mund të presë njëkohësisht nga disa qindra në disa mijëra sajte.

Faqet e vendosura në një kompjuter server mund të shikohen dhe kopjohen nga përdoruesit e internetit.

Për të siguruar akses të pandërprerë në faqe, serveri furnizohet me energji me energji të pandërprerë, dhe dhoma ku funksionojnë serverët (qendra e të dhënave) është e pajisur me një sistem automatik të fikjes së zjarrit dhe organizohet një detyrë e personelit teknik gjatë gjithë kohës. .

Për më shumë se 10 vjet të ekzistencës së tij, Runet (Interneti rusisht-folës) është bërë një strukturë e rregullt dhe kërkimi i informacionit në Ueb është bërë më i parashikueshëm.

Mjeti kryesor për gjetjen e informacionit në internet janë motorët e kërkimit.

Motori i kërkimit përbëhet nga një program merimangë që zvarritet në faqet e internetit dhe një bazë të dhënash (indeks), i cili përmban informacione për faqet e vizituara.

Me kërkesë të webmasterit, një robot merimangë hyn në sit dhe shikon faqet e faqes, duke futur informacione rreth faqeve të faqes në indeksin e motorit të kërkimit. Një motor kërkimi mund të gjejë një sajt vetë, edhe nëse webmaster i tij nuk ka aplikuar për regjistrim. Nëse një lidhje në një sajt haset diku në rrugën e një motori kërkimi (në një faqe tjetër, për shembull), atëherë ajo do të indeksojë menjëherë sajtin.

Merimanga nuk kopjon faqet e faqes në indeksin e motorit të kërkimit, por ruan informacione në lidhje me strukturën e secilës faqe të faqes - për shembull, cilat fjalë ndodhin në dokument dhe në çfarë rendi, adresat e hiperlidhjeve e faqeve të faqes, madhësia e dokumentit në kilobajt, data e krijimit të tij dhe shumë më tepër. Prandaj, indeksi i motorit të kërkimit është disa herë më i vogël se vëllimi i informacionit të indeksuar.

Çfarë dhe si kërkon një motor kërkimi në internet?

Motori i kërkimit u shpik nga njerëzit për t'i ndihmuar ata të kërkojnë informacion. Çfarë është informacioni në kuptimin tonë njerëzor dhe përfaqësimin vizual? Ato nuk janë erëra apo tinguj, jo ndjesi apo imazhe. Këto janë vetëm fjalë, tekst. Kur kërkojmë diçka në internet, kërkojmë fjalë - një pyetje kërkimi dhe si përgjigje shpresojmë të marrim një tekst që përmban pikërisht këto fjalë. Sepse ne e dimë se motori i kërkimit do të kërkojë pikërisht fjalët që kemi kërkuar në grupin e informacionit. Sepse kështu u konceptua për të kërkuar fjalë.

Motori i kërkimit nuk kërkon fjalë në internet, por në indeksin e tij. Indeksi i motorit të kërkimit përmban informacione vetëm për një numër të vogël faqesh interneti. Ka motorë kërkimi që indeksojnë vetëm faqet në anglisht dhe ka motorë kërkimi që listojnë vetëm faqet në gjuhën ruse në indeksin e tyre.

(indeksi përmban faqe në anglisht, gjermanisht dhe gjuhë të tjera evropiane)

Motorët e kërkimit Runet(indeksi përmban faqe në Rusisht)

Karakteristikat e disa motorëve të kërkimit në Runet

Motori i kërkimit Google nuk merr parasysh morfologjinë e gjuhës ruse. Për shembull, Google i konsideron fjalët "disertacion" dhe "disertacion" të ndryshme.

Është e nevojshme të shikoni jo vetëm faqen e parë të rezultatit të pyetjes së kërkimit, por edhe pjesën tjetër.

Sepse shpesh faqet që përmbajnë informacione vërtet të nevojshme për përdoruesin ndodhen në faqet 4 - 10 të rezultatit të pyetjes së kërkimit.

Pse ndodh? Së pari, shumë ndërtues të faqeve të internetit nuk i optimizojnë faqet e tyre të faqes për motorët e kërkimit, për shembull, ata nuk përfshijnë meta etiketat në faqet e tyre të faqes.

Meta etiketat janë elementë shërbimi të një dokumenti ueb që nuk janë të dukshëm në ekran, por janë të rëndësishëm kur motorët e kërkimit gjejnë faqen tuaj. Meta etiketat e bëjnë më të lehtë kërkimin për motorët e kërkimit, në mënyrë që të mos kenë nevojë të futen thellë në dokument dhe të analizojnë të gjithë tekstin e faqes për të krijuar një pamje të caktuar rreth tij. Meta etiketa më e rëndësishme është meta EMRI = "fjalë kyçe" - fjalë kyçe të faqes së faqes. Nëse një fjalë nga teksti kryesor i dokumentit nuk konsiderohet si "kërkim i bezdisshëm" dhe është në "fjalë kyçe" ndër 50 të parat, atëherë pesha e kësaj fjale në pyetje rritet, domethënë dokumenti merr një rëndësi më të madhe. .

Së dyti, ekziston një konkurrencë e ashpër midis webmasterëve të faqeve për pozicionet e para në rezultatin e një pyetje kërkimi.

Sipas statistikave, 80% e vizitorëve në faqe vijnë nga motorët e kërkimit. Herët a vonë, webmasterët e kuptojnë këtë dhe fillojnë t'i përshtatin faqet e tyre me ligjet e motorëve të kërkimit.

Fatkeqësisht, disa nga krijuesit e faqeve përdorin një metodë të pandershme për të promovuar faqen e tyre përmes motorëve të kërkimit - të ashtuquajturën "spam kërkimi" për të krijuar atë që duket të jetë një përputhje midis përmbajtjes së meta-etiketave dhe pjesës tjetër të tekstit të faqe - vendosin fjalë të fshehura në faqet e faqes, të shtypura në ngjyrën e sfondit, në mënyrë që të mos ndërhyjnë me vizitorët e faqes. Sidoqoftë, krijuesit e motorëve të kërkimit mbajnë gjurmët e mashtrimeve të tilla dhe faqja e "kërkuesit të spamerit" bie nga lartësitë e arritura deri në fund.

Në internet, metaforat dhe krahasimet figurative kanë pak përdorim. Ata shtrembërojnë të vërtetën, largojnë përdoruesit e internetit nga informacioni i saktë dhe i paqartë. Sa më pak artistikë dhe më shumë saktësi në stilin e autorit të faqes, aq më të larta pozitat në rezultatet e kërkimit zë faqja.

Nga ana tjetër, nëse dëshironi që një motor kërkimi të gjejë artikuj për ju në internet, mendoni si një makinë, bëhuni një makinë. Të paktën për një kohë. Në momentin e kërkimit.

Motorë kërkimi

Motorët e kërkimit ju lejojnë të gjeni dokumente WWW që lidhen me një temë të caktuar ose të pajisur me fjalë kyçe ose kombinime të tyre. Motorët e kërkimit trajtojnë dy metoda kërkimi:

· Nga hierarkia e koncepteve;

· Me fjalë kyçe.

Serverët e kërkimit plotësohen automatikisht ose manualisht. Motori i kërkimit zakonisht ka lidhje me pjesën tjetër të motorëve të kërkimit dhe u dërgon atyre një kërkesë kërkimi me kërkesë të përdoruesit.

Ekzistojnë dy lloje të motorëve të kërkimit.

1. Motorë kërkimi "Teksti i plotë" që indeksojnë çdo fjalë në një faqe interneti, duke përjashtuar fjalët ndaluese.

2. Motorët e kërkimit "Abstract" që krijojnë një abstrakt të çdo faqeje.

Për webmasterët, makinat me tekst të plotë janë më të dobishme, pasi çdo fjalë që shfaqet në një faqe interneti analizohet për të përcaktuar rëndësinë e saj me kërkesat e përdoruesve. Megjithatë, makinat abstrakte mund të indeksojnë faqet më mirë se ato me tekst të plotë. Varet nga algoritmi i nxjerrjes së informacionit, për shembull, nga shpeshtësia e përdorimit të të njëjtave fjalë.

Karakteristikat kryesore të motorëve të kërkimit.

1. Madhësia e motorit të kërkimit përcaktohet nga numri i faqeve të indeksuara. Megjithatë, në çdo kohë, lidhjet e ofruara në përgjigje të kërkesave të përdoruesve mund të jenë të moshave të ndryshme. Arsyet pse ndodh kjo:

· Disa motorë kërkimi indeksojnë menjëherë faqen me kërkesë të përdoruesit dhe më pas vazhdojnë të indeksojnë faqet që nuk janë indeksuar ende.

· Të tjerët kanë më shumë gjasa të indeksojnë faqet e internetit më të njohura.

2.Data e indeksimit. Disa motorë kërkimi tregojnë datën kur dokumenti është indeksuar. Kjo e ndihmon përdoruesin të përcaktojë se kur dokumenti u shfaq në ueb.

3. Thellësia e indeksimit tregon se sa faqe pas asaj të specifikuar do të indeksojë motori i kërkimit. Shumica e makinave nuk kanë kufij të thellësisë së indeksimit. Arsyet pse jo të gjitha faqet mund të indeksohen:

· Përdorimi i gabuar i strukturave të kornizës.

Përdorimi i hartës së faqes pa dyfishim të lidhjeve të rregullta

4. Puna me korniza. Nëse roboti i kërkimit nuk di të punojë me strukturat e kornizës, atëherë shumë struktura me korniza do të mungojnë gjatë indeksimit.

5. Frekuenca e lidhjeve. Motorët kryesorë të kërkimit mund të përcaktojnë popullaritetin e një dokumenti nga sa shpesh referohet. Disa makina, mbi bazën e të dhënave të tilla, "përfundojnë" nëse ia vlen apo jo të indeksohet një dokument.

6. Frekuenca e përditësimit të serverit. Nëse serveri përditësohet shpesh, motori i kërkimit do ta riindeksojë atë më shpesh.

7. Kontrolli i indeksimit. Tregon se me çfarë mjetesh mund të kontrollohet motori i kërkimit.

8 ridrejtim. Disa sajte i ridrejtojnë vizitorët nga një server në tjetrin dhe ky parametër tregon se si kjo do të lidhet me dokumentet e gjetura.

9. Ndalo fjalët. Disa motorë kërkimi nuk përfshijnë fjalë të caktuara në indekset e tyre ose mund të mos i përfshijnë ato fjalë në pyetjet e përdoruesve. Këto fjalë zakonisht konsiderohen si parafjalë ose fjalë të përdorura zakonisht.

10. Dënimet e spamit. Aftësia për të bllokuar mesazhet e padëshiruara.

11. Fshirja e të dhënave të vjetra. Një parametër që përcakton veprimet e webmasterit kur serveri mbyllet ose zhvendoset në një adresë tjetër.

Shembuj të motorëve të kërkimit.

1. Altavista. Sistemi u hap në dhjetor 1995. Ai është në pronësi të kompanisë DEC. Që nga viti 1996 ai ka punuar me Yahoo. AltaVista është zgjidhja më e mirë për kërkime me porosi ... Megjithatë, renditja e rezultateve sipas kategorive gropat nuk janë ekzekutuar dhe ju duhet të rishikoni manualisht informacionin e dhënë. AltaVista nuk ofron një mjet për të tërhequr listat e pikave të nxehta, lajmet ose aftësi të tjera të kërkimit të përmbajtjes.

2.Excite Search. Nisur në fund të vitit 1995. Shtator 1996 - blerë nga WebCrawler. Kjo nyjë ka një lesh të fuqishëm kërkiminizm, aftësia për të personalizuar automatikishtinformacionin e dhënë, si dhe kualifikimet e përpiluaranga personeli i kualifikuar për të përshkruar grupin e nyjeve. eksitojnë ndryshon nga faqet e tjera të kërkimit në atëju lejon të kërkoni shërbime lajmesh dhe të publikoni komente faqet e internetit. Motori i kërkimit përdor mjetetKërkimi standard i fjalëve kyçe dhe heuristikmetodat e kërkimit të përmbajtjes. Falë këtij kombinimi,ju mund të gjeni faqe që përputhen me kuptimin Web, nëse nuk përmbajnë një çelës të specifikuar nga përdoruesi jashtë fjalëve. Disavantazhi i Excite është një ndërfaqe disi kaotike.

3.HotBot. Nisur në maj 1996. Në pronësi të Wired. Bazuar në teknologjinë e motorit të kërkimit Berkeley Inktomi. HotBot është një bazë të dhënash dokumentesh e indeksuar me tekst të plotë dhe një nga motorët e kërkimit më gjithëpërfshirës në ueb. Kufizimet e kërkimit dhe kërkimit të tij boolean në çdo rajon ose faqe interneti e ndihmojnë përdoruesin të gjejë informacionin që i nevojitet ndërsa filtron informacionin e panevojshëm. HotBot ofron mundësinë për të zgjedhur parametrat e kërkuar të kërkimit nga listat rënëse.

4.InfoSeek. Nisur para vitit 1995 dhe është lehtësisht i aksesueshëm. Aktualisht përmban rreth 50 milionë URL. Infoseek ka një ndërfaqe të dizajnuar mirë dhe mjete të shkëlqyera kërkimi. Shumica e përgjigjeve ndaj pyetjeve shoqërohen me lidhje "temash të lidhura", dhe çdo përgjigje pasohet nga lidhje "faqe të ngjashme". Baza e të dhënave e motorit të kërkimit të faqeve të indeksuara sipas tekstit të plotë. Përgjigjet renditen sipas dy treguesve: shpeshtësia e shfaqjes së një fjale ose frazash në faqe tsakh, si dhe vendndodhjen e fjalëve ose frazave në faqe. Ekziston një direktori ueb e ndarë në 12 kategori me qindra nënkategori që mund të kërkohen. Çdo faqe e katalogut përmban një listë të re nyjet e paraqitura.

5. Lycos. Punon që nga maji i vitit 1994. Është i njohur dhe i përdorur gjerësisht. Ai përfshin një drejtori me një numër të madh URL-sh. dhe motori i kërkimit Point me teknologjinë e analizës statistikore të përmbajtjes së faqes, në krahasim me indeksimin me tekst të plotë. Lycos përmban lajme, rishikime faqesh, lidhje me faqet e njohura, harta të qyteteve dhe mjete për gjetjen e adresave, nga imazhe dhe tinguj dhe videoklipe. Lycos rendit përgjigjet sipas shkallës së korrespondencësrezultatet e një pyetje sipas disa kritereve, për shembull, nga numri ilu termat e kërkimit të gjetura në shënimin e dokumentitpolic, intervali ndërmjetbëni fjalë në një frazë specifike të dokumentit, vendndodhjenkushtet në dokument.

6. WebCrawler. U hap më 20 prill 1994 si një projekt i Universitetit të Uashingtonit. Kërkuesi i uebit ofron mundësi sintaksë për specifikimin e pyetjeve, si dhe një përzgjedhje të madhe shënimet e nyjeve me një ndërfaqe të pakomplikuar.


Pas çdo përgjigjeje, WebCrawler do të pengojë një piktogram të vogël me një vlerësim të përafërt të përputhjes me kërkesën. Coma Togo shfaq një faqe me një përmbledhje të shkurtër për secilën përgjigje, URL-në e saj të plotë, një rezultat të saktë të përputhjes dhe gjithashtu përdor kjo përgjigje në pyetje është modeluar si fjalë kyçe të saj.Një ndërfaqe grafike për personalizimin e pyetjeve në Zvarritësi i uebit nr. N e lejohetpërdorimi i shkronjave të egra, dhe është gjithashtu e pamundurcaktoni peshë fjalëve kyçe.Nuk ka asnjë mënyrë për të kufizuar fushën e kërkimitzonë specifike.

7. Yahoo. Drejtoria më e vjetër e Yahoo u lançua në fillim të vitit 1994. I njohur gjerësisht, i përdorur shpesh dhe më i respektuari. Në mars 1996, u lançua katalogu Yahooligans për fëmijë. Shfaqen drejtoritë rajonale dhe kryesore të Yahoo. Yahoo bazohet në abonim. Ai mund të shërbejë si pikënisje për çdo kërkim në internet, pasi përdor sistemin e tij të klasifikimit për të gjetur një faqe me informacion të mirëorganizuar. Përmbajtja e uebit është e ndarë në 14 kategori të përgjithshme, të listuara në faqen kryesore të Yahoo!. Në varësi të specifikave të kërkesës së përdoruesit, është e mundur ose të punohet me këto kategori për t'u njohur me nënkategoritë dhe listat e nyjeve, ose të kërkohen fjalë dhe terma specifikë në të gjithë bazën e të dhënave. Përdoruesi gjithashtu mund të kufizojë kërkimin në çdo seksion ose nënseksion të Yahoo! Për shkak të faktit se klasifikimi i nyjeve kryhet nga njerëzit, dhe jo nga një kompjuter, cilësia e lidhjeve është zakonisht shumë e lartë. Megjithatë, rafinimi i një kërkimi në rast dështimi është i vështirë. Për Yahoo ! motor kërkimi i përfshirë AltaVista, kështu që nëse kërkimi juaj dështon në Yahoo! ndodh automatikisht përsëritje duke përdorur një motor kërkimi AltaVista ... Rezultatet më pas transferohen në Yahoo!. Yahoo! ofron mundësinë për të dërguar pyetje për të kërkuar adresat e emailit në Usenet dhe Fourl 1.

Motorët e kërkimit rusë përfshijnë:

1. Rambler Ky është një motor kërkimi në gjuhën ruse. Seksionet e listuara në faqen kryesore të Rambler mbulojnë burimet e Uebit në gjuhën ruse. Ekziston një klasifikues informacioni. Një mundësi e përshtatshme për të punuar është të ofroni një listë të vendeve më të vizituara për secilën temën e propozuar.

2. Kërkimi i Aportit. Aport renditet ndër motorët kryesorë të kërkimit të certifikuar Microsoft si motorë kërkimi lokalsistemet për versionin rus Microsoft Internet Explorer. Një nga avantazhet e Aport është përkthimi në internet anglisht-rusisht dhe rusisht-anglisht i pyetjeve dhe rezultateve të kërkimit, gjë që bën të mundur kërkimin në burimet ruse të Internetit. pa ditur as gjuhën ruse. Për më tepër ju mund të kërkoni për informacion tion duke përdorur shprehje, qoftë edhe për fjali.Ndër vetitë kryesore të motorit të kërkimit Aport, ju mundndani sa vijon:

Përkthimi i pyetjes dhe rezultatet e kërkimit nga rusishtja në anglishtgjuha qiellore dhe anasjelltas;

Kontroll automatik i gabimeve drejtshkrimore të kërkesës;

Shfaqja informative e rezultateve të kërkimit për faqet e gjetura;

Aftësia për të kërkuar në çdo formë gramatikore;


gjuhë e avancuar e pyetjeve për profesionistët përdoruesit nacional.

Karakteristikat e tjera të kërkimit përfshijnëmbështetje e pesë faqeve kryesore të kodit (operacion të ndryshëmsisteme) për gjuhën ruse, duke përdorur teknologjinë e kërkimitkemi kufizime në Url dhe data e dokumenteve, zbatimi i kërkimitsipas titujve, komenteve dhe titraveshkoni te fotot, etj., ruani parametrat e kërkimit dhe përcaktoni një numër i kufizuar i kërkesave të mëparshme të përdoruesve, të kombinuara kopjet e dokumentit të vendosura në serverë të ndryshëm.

3. Lista. ru ( http://www.list.ru) Me zbatimin e tij, ky server ka shumëtë përbashkëta me sistemin anglishtfolës Yahoo!. Faqja kryesore e serverit përmban lidhje me kategoritë më të njohura të kërkimit.


Lista e lidhjeve me kategoritë kryesore të katalogut zë pjesën qendrore. Kërkimi në katalog zbatohet në atë mënyrë që si rezultat i pyetjes, mund të gjenden si faqet individuale ashtu edhe kategoritë. Nëse kërkimi është i suksesshëm, URL-ja, titulli, përshkrimi, fjalë kyçe shfaqen. Lejohet të përdoret Yandex. MElidhja "Strukturakatalogu "hap në një dritare të veçantë kategorinë e plotë të katalog. Është zbatuar aftësia për të kaluar nga rubrikatori në çdo nënkategori të zgjedhur. Ndarja tematike më e detajuartitulli aktual përfaqësohet nga një listë lidhjesh. Katalogu është i organizuar kështu në mënyrë të tillë që të gjitha vendet të përfshihen në nivelet më të ulëta të strukturësturnet janë paraqitur në titujt.Lista e shfaqur e burimeve është renditur sipas alfabetit, por ju mund të zgjidhni të renditni: sipas kohës shtesat e reja, nga kalimet, nga radha e shtimit në katalog, ngapopullaritet në mesin e vizitorëve të drejtorisë.

4. Yandex. Produktet softuerike të serisë Yandex përfaqësojnë një grup mjetesh për indeksimin e tekstit të plotë dhe kërkimin e të dhënave të tekstit, duke marrë parasysh morfologjinë e gjuhës ruse. Yandex përfshin module për analizë dhe sintezë morfologjike, indeksim dhe kërkim, si dhe një grup modulesh ndihmëse si analizues dokumentesh, gjuhë shënjimi, konvertues formatesh, merimangë.

Algoritmet për analizën dhe sintezën morfologjike, bazuar në një fjalor bazë, janë në gjendje të normalizojnë fjalët, domethënë të gjejnë formën e tyre fillestare, si dhe të ndërtojnë hipoteza për fjalët që nuk përfshihen në fjalorin bazë. Sistemi i indeksimit të tekstit të plotë ju lejon të krijoni një indeks kompakt dhe të kryeni shpejt kërkime bazuar në operatorët logjikë.

Yandex është krijuar për të punuar me tekste në rrjetin lokal dhe global, dhe gjithashtu mund të lidhet si modul me sisteme të tjera.

Elementi kryesor i internetit modern është motorët e kërkimit ose motorët e kërkimit, Yandex, Rambler, Google dhe të tjerë. Në internet ka një det informacionesh të ndryshme dhe janë motorët e kërkimit që ndihmojnë përdoruesin të gjejë shpejt informacionin që i nevojitet.

Ekziston një listë e termave të rëndësishëm në tekstet shkollore ose librat shkencorë - një indeks alfabetik i lëndës ose indeks. Indeksi rendit termat më të rëndësishëm në këtë libër (fjalë kyçe) dhe numrat e faqeve në të cilat ato shfaqen.

Motorët e kërkimit punojnë në një parim të ngjashëm. Në thelb, kur një përdorues fut një term kërkimi (fjalë kyçe), ai ose ajo i referohet Indeksit të Subjekteve të Internetit ose indeksit - një listë e të gjitha fjalëve kyçe në internet, duke treguar faqet ku ato shfaqen.

Motori i kërkimitËshtë një program që përpilon dhe ruan indeksin e lëndës së internetit (indeksin), dhe gjithashtu gjen fjalët kyçe të specifikuara në të.

Fazat e përpilimit dhe kërkimit të indeksit:

Mbledhja e adresave të faqeve të internetit në internet

Një listë fillestare e adresave të faqeve të internetit ngarkohet në një motor kërkimi. Pastaj motori i kërkimit, ose më saktë pjesa përbërëse e tij - robot kërkimi, mbledh të gjitha lidhjet e hipertekstit nga secila prej faqeve të specifikuara në faqet e tjera dhe shton të gjitha adresat e gjetura në lidhjet në listën e saj origjinale të adresave. Kështu, lista origjinale po rritet me shpejtësi.

Pompimi i faqeve

Një robot kërkues ose një merimangë zvarritet faqet, shkarkon materiale teksti prej tyre dhe e ruan atë në disqet e kompjuterëve të tij, më pas e transferon atë te roboti i indeksit për indeksim.

Përpilimi i indeksit

Për të filluar, teksti i faqes së indeksuar pastrohet nga çdo element jo tekstual (grafika, shënimi HTML, etj.). Më tej, fjalët e zgjedhura nga teksti reduktohen në rrjedhat e tyre ose në rasën emërore. Rrjedhat e mbledhura të fjalëve janë renditur sipas rendit alfabetik, duke treguar numrat e faqeve ku merret baza, dhe numrat e hyrjes, ku ishte baza në këtë faqe.

Kërko

Kur një përdorues fut një fjalë në vargun e pyetjeve, motori i kërkimit shikon indeksin. Gjen të gjithë numrat e faqeve që lidhen me një fjalë të caktuar dhe i tregon përdoruesit rezultatin e kërkimit (listën e faqeve).

Cilësia e motorit të kërkimit

Cilësia e kërkimit është sinonim me të. rëndësinë. Në lidhje me motorët e kërkimit, fjala relevante(relevant) është pothuajse termi kryesor. Rëndësia e rezultateve të kërkimit të motorit të kërkimit do të thotë që ato rezultate përmbajnë faqe që janë të rëndësishme për kuptimin e pyetjes së kërkimit. Rëndësia ose cilësia e një kërkimi është një gjë e ndërlikuar.

Një tjetër kriter i rëndësishëm për cilësinë e punës së motorit të kërkimit është saktësinë.

SaktësiaËshtë një masë e cilësisë së rezultateve të kthyera, ajo llogaritet si numri i faqeve përkatëse në vëllimin total të faqeve të shfaqura në rezultatet e kërkimit. Sidoqoftë, jo vetëm saktësia e kërkimit është e rëndësishme, por edhe duke filluar rezultatet e kërkimit.

Rangimi- vendndodhjen e rezultateve të kërkimit sipas rëndësisë.

Është e pamundur të thuhet se cili motor kërkimi është më i mirë. Përdoruesi është më mirë me një motor kërkimi që jep rezultatet më të rëndësishme dhe të sakta. Për një pronar faqesh, është mirë që makina në të cilën faqja është e dukshme dhe e cila sjell numrin më të madh të vizitorëve të synuar.

çfarë është ajo

DuckDuckGo është një motor kërkimi mjaft i njohur me burim të hapur. Serverët janë të vendosur në SHBA. Përveç robotit të vet, motori i kërkimit përdor rezultatet e burimeve të tjera: Yahoo, Bing, Wikipedia.

Sa më mirë

DuckDuckGo pozicionohet si një motor kërkimi që ofron privatësi dhe konfidencialitet maksimal. Sistemi nuk mbledh asnjë të dhënë përdoruesi, nuk ruan regjistrat (pa histori kërkimi), përdorimi i cookies është sa më i kufizuar që të jetë e mundur.

DuckDuckGo nuk mbledh ose ndan informacione personale nga përdoruesit. Kjo është politika jonë e privatësisë.

Gabriel Weinberg, themeluesi i DuckDuckGo

Pse ju duhet

Të gjithë motorët kryesorë të kërkimit përpiqen të personalizohen bazuar në të dhënat për personin përpara monitorit. Ky fenomen quhet "flluska e filtrit": përdoruesi sheh vetëm ato rezultate që përputhen me preferencat e tij ose që sistemi i konsideron si të tilla.

DuckDuckGo krijon një pamje objektive që nuk varet nga sjellja juaj e kaluar në ueb dhe heq qafe reklamat tematike të Google dhe Yandex bazuar në pyetjet tuaja. DuckDuckGo e bën të lehtë kërkimin e informacionit në gjuhë të huaja: Google dhe Yandex si parazgjedhje u japin përparësi faqeve në gjuhën ruse, edhe nëse kërkesa është futur në një gjuhë tjetër.


çfarë është ajo

jo Evil është një motor kërkimi për rrjetin anonim Tor. Për ta përdorur atë, duhet të shkoni në këtë rrjet, për shembull, duke ekzekutuar një të specializuar me të njëjtin emër.

jo Evil nuk është i vetmi motor kërkimi i këtij lloji. Ekziston LOOK (kërkimi i paracaktuar në shfletuesin Tor, i aksesueshëm nga interneti i rregullt) ose TORCH (një nga motorët më të vjetër të kërkimit në rrjetin Tor) dhe të tjera. Ne u vendosëm për jo të keqen për shkak të aludimit të qartë të Google (thjesht shikoni faqen fillestare).

Sa më mirë

Kërkimet ku Google, Yandex dhe motorët e tjerë të kërkimit janë të mbyllura në parim.

Pse ju duhet

Ka shumë burime në rrjetin Tor që nuk mund të gjenden në internetin që i bindet ligjit. Dhe numri i tyre do të rritet ndërsa qeveria forcon kontrollin e saj mbi përmbajtjen e Uebit. Tor është një lloj rrjeti brenda Rrjetit me rrjetet e veta sociale, gjurmues torrent, media, tregje, blogje, biblioteka, etj.

3. YaCy

çfarë është ajo

YaCy është një motor kërkimi i decentralizuar i bazuar në rrjetet P2P. Çdo kompjuter në të cilin është instaluar moduli kryesor i softuerit skanon internetin në mënyrë të pavarur, domethënë është një analog i një roboti kërkimi. Rezultatet e marra janë mbledhur në një bazë të dhënash të përbashkët, e cila përdoret nga të gjithë pjesëmarrësit në YaCy.

Sa më mirë

Është e vështirë të thuhet nëse është më mirë apo më keq këtu, pasi YaCy është një qasje krejtësisht e ndryshme për organizimin e kërkimit. Mungesa e një serveri të vetëm dhe një pronari kompanie i bën rezultatet plotësisht të pavarura nga preferencat e dikujt. Autonomia e secilës nyje përjashton censurën. YaCy është i aftë të kërkojë në ueb të thellë dhe në rrjete publike jo të indeksuar.

Pse ju duhet

Nëse jeni përkrahës i burimit të hapur dhe internetit falas, i cili nuk ndikohet nga agjencitë qeveritare dhe korporatat e mëdha, atëherë YaCy është zgjedhja juaj. Mund të përdoret gjithashtu për të organizuar kërkime brenda një korporate ose një rrjeti tjetër autonom. Dhe ndërsa YaCy nuk është shumë i dobishëm në jetën e përditshme, ai është një alternativë e denjë për Google për sa i përket procesit të kërkimit.

4. Pipl

çfarë është ajo

Pipl është një sistem i krijuar për të kërkuar informacione për një person specifik.

Sa më mirë

Autorët e Pipl pretendojnë se algoritmet e tyre të specializuara kërkojnë në mënyrë më efikase sesa motorët e kërkimit "të rregullt". Në veçanti, burimet prioritare të informacionit janë profilet e mediave sociale, komentet, listat e anëtarëve dhe bazat e ndryshme të të dhënave ku publikohen informacione për persona, si p.sh. bazat e të dhënave të vendimeve gjyqësore. Udhëheqja e Pipl në këtë fushë është vërtetuar nga Lifehacker.com, TechCrunch dhe të tjerë.

Pse ju duhet

Nëse keni nevojë të gjeni informacione për një person që jeton në Shtetet e Bashkuara, atëherë Pipl do të jetë shumë më efektiv se Google. Bazat e të dhënave të gjykatave ruse janë me sa duket të paarritshme për një motor kërkimi. Prandaj, ai nuk përballet aq mirë me qytetarët e Rusisë.

çfarë është ajo

FindSounds është një tjetër motor kërkimi i specializuar. Kërkon tinguj të ndryshëm (shtëpi, natyrë, makina, njerëz etj.) në burime të hapura. Shërbimi nuk i mbështet kërkesat në Rusisht, por ekziston një listë mbresëlënëse e etiketave në gjuhën ruse që mund të kërkoni.

Sa më mirë

Rezultatet janë vetëm tinguj dhe asgjë më shumë. Në cilësimet e kërkimit, mund të vendosni formatin e dëshiruar dhe cilësinë e zërit. Të gjithë tingujt e gjetur janë të disponueshëm për shkarkim. Ekziston një kërkim për tingujt sipas modelit.

Pse ju duhet

Nëse ju duhet të gjeni shpejt tingullin e një goditjeje musket, goditjet e një qukapiku thithës ose klithmën e Homer Simpson, atëherë ky shërbim është për ju. Dhe ne e zgjodhëm këtë vetëm nga kërkesat e disponueshme në gjuhën ruse. Në anglisht, spektri është edhe më i gjerë.

Por seriozisht, një shërbim i specializuar merr një audiencë të specializuar. Por çfarë nëse ju vjen në ndihmë?

çfarë është ajo

Wolfram | Alpha është një motor kërkimi kompjuterik. Në vend të lidhjeve me artikujt që përmbajnë fjalë kyçe, ai ofron një përgjigje të gatshme ndaj kërkesës së një përdoruesi. Për shembull, nëse futni "krahaso popullatat e Nju Jorkut dhe San Franciskos" në anglisht në formularin e kërkimit, Wolfram | Alpha do të shfaqë menjëherë tabela dhe grafikë me një krahasim.

Sa më mirë

Ky shërbim është më i mirë se të tjerët për gjetjen e fakteve dhe llogaritjen e të dhënave. Wolfram | Alpha mbledh dhe organizon njohuritë e disponueshme në ueb nga një sërë fushash, duke përfshirë shkencën, kulturën dhe argëtimin. Nëse kjo bazë të dhënash përmban një përgjigje të gatshme për një pyetje kërkimi, sistemi e shfaq atë; nëse jo, ai llogarit dhe shfaq rezultatin. Në këtë rast, përdoruesi sheh vetëm informacionin e nevojshëm dhe asgjë të tepërt.

Pse ju duhet

Nëse jeni, për shembull, një student, analist, gazetar ose shkencëtar kërkimor, mund të përdorni Wolfram | Alpha për të gjetur dhe llogaritur të dhëna në lidhje me punën tuaj. Shërbimi nuk i kupton të gjitha kërkesat, por vazhdimisht po evoluon dhe bëhet më i zgjuar.

çfarë është ajo

Motori metakërkues Dogpile shfaq një listë të kombinuar të rezultateve nga rezultatet e kërkimit nga Google, Yahoo dhe motorë të tjerë të njohur kërkimi.

Sa më mirë

Së pari, Dogpile shfaq më pak reklama. Së dyti, shërbimi përdor një algoritëm të veçantë për të gjetur dhe shfaqur rezultatet më të mira nga motorë të ndryshëm kërkimi. Sipas zhvilluesve të Dogpile, sistemi i tyre gjeneron rezultatet më të plota të kërkimit në të gjithë Internetin.

Pse ju duhet

Nëse nuk mund të gjeni informacion në Google ose në një motor tjetër kërkimi standard, kërkojeni atë në disa motorë kërkimi menjëherë duke përdorur Dogpile.

çfarë është ajo

BoardReader është një sistem për kërkimin e tekstit në forume, shërbime pyetjesh dhe përgjigjesh dhe komunitete të tjera.

Sa më mirë

Shërbimi ju lejon të ngushtoni fushën e kërkimit në platformat sociale. Falë filtrave specialë, mund të gjeni shpejt postime dhe komente të përdoruesve që përputhen me kriteret tuaja: gjuhën, datën e publikimit dhe emrin e faqes.

Pse ju duhet

BoardReader mund të jetë i dobishëm për specialistët e PR dhe profesionistët e tjerë të medias, të cilët janë të interesuar për mendimin e një publiku masiv për çështje të caktuara.

Së fundi

Jeta e motorëve alternativë të kërkimit është shpesh e shkurtër. Lifehacker pyeti Sergei Petrenko, ish-drejtorin e përgjithshëm të degës ukrainase të Yandex, për perspektivat afatgjata të projekteve të tilla.


Sergej Petrenko

Ish CEO i Yandex.Ukraine.

Sa i përket fatit të motorëve alternative të kërkimit, është e thjeshtë: të jenë projekte shumë të veçanta me një audiencë të vogël, pra, pa perspektiva të qarta tregtare, ose, anasjelltas, me qartësi të plotë të mungesës së tyre.

Nëse shikoni shembujt në artikull, mund të shihni se motorë të tillë kërkimi ose specializohen në një vend të ngushtë, por të kërkuar, i cili, ndoshta vetëm deri më tani, nuk është rritur aq sa të jetë i dukshëm në radarët e Google ose Yandex, ose po testojnë një hipotezë origjinale në renditje.e cila ende nuk është e zbatueshme në kërkimin e rregullt.

Për shembull, nëse një kërkim në Tor papritmas rezulton të jetë i kërkuar, domethënë, rezultatet nga atje do të nevojiten të paktën nga një përqindje e audiencës së Google, atëherë, natyrisht, motorët e zakonshëm të kërkimit do të fillojnë të zgjidhin problemin se si për t'i gjetur dhe treguar ato përdoruesit. Nëse sjellja e audiencës tregon se rezultatet duken më të rëndësishme për një pjesë të dukshme të përdoruesve në një numër të dukshëm pyetjesh, të dhënash pa marrë parasysh faktorët e varur nga përdoruesi, atëherë Yandex ose Google do të fillojnë të japin rezultate të tilla.

“Të jesh më i mirë” në kontekstin e këtij artikulli nuk do të thotë “të jesh më i mirë në çdo gjë”. Po, në shumë aspekte heronjtë tanë janë larg Google dhe Yandex (madje Bing është shumë larg). Por nga ana tjetër, secili prej këtyre shërbimeve i jep përdoruesit diçka që gjigantët e industrisë së kërkimit nuk mund ta ofrojnë. Me siguri edhe ju njihni projekte të ngjashme. Ndani me ne - ne do të diskutojmë.

Motorët e kërkimit janë një nga mënyrat kryesore për të gjetur informacion në internet. Motorët e kërkimit zvarriten çdo ditë në ueb: ata vizitojnë faqet e internetit dhe i futin ato në bazat e të dhënave gjigante. Kjo i lejon përdoruesit të shkruajë disa fjalë kyçe, të shtypë "dorëzo" dhe të shohë se cilat faqe po plotësojnë kërkesën e tyre.

Të kuptuarit se si funksionojnë motorët e kërkimit është thelbësor për webmasterët. Për ta, struktura e saktë e dokumenteve dhe e gjithë serverit ose faqes nga pikëpamja e motorëve të kërkimit është jashtëzakonisht e rëndësishme. Pa këtë, dokumentet nuk do të shfaqen mjaft shpesh në përgjigje të pyetjeve të përdoruesve në një motor kërkimi, ose mund të mos indeksohen fare.

Webmasterët duan të rrisin renditjen e faqeve të tyre, dhe kjo është e kuptueshme: në fund të fundit, për çdo kërkesë për një motor kërkimi, mund të lëshohen qindra e mijëra lidhje me dokumentet që korrespondojnë me të. Në shumicën e rasteve, vetëm 10 lidhjet e para kanë lidhje të mjaftueshme me pyetjen.

Natyrisht, ju dëshironi që dokumenti të jetë në dhjetëshen e parë, pasi shumica e përdoruesve rrallë shikojnë lidhjet që pasojnë dhjetëshen më të mirë. Me fjalë të tjera, nëse lidhja me dokumentin është e njëmbëdhjeta, atëherë është po aq e keqe sikur të mos ekzistonte fare.

Motorët kryesorë të kërkimit

Cilët nga qindra motorë kërkimi janë vërtet të rëndësishëm për një webmaster? Epo, sigurisht, i njohur gjerësisht dhe i përdorur shpesh. Por në të njëjtën kohë, duhet të keni parasysh audiencën për të cilën është krijuar serveri juaj. Për shembull, nëse serveri juaj përmban informacion shumë të specializuar në lidhje me metodat më të fundit të mjeljes së lopëve, atëherë ndoshta nuk duhet të mbështeteni në motorët e përgjithshëm të kërkimit. Në këtë rast, unë do t'ju këshilloja të shkëmbeni lidhje me kolegët tuaj që merren me çështje të ngjashme 🙂 Pra, së pari, le të përcaktojmë terminologjinë.

Ekzistojnë dy lloje të bazave të të dhënave informative për faqet e internetit: motorët e kërkimit dhe drejtoritë.

Motorët e kërkimit: (merimangat, zvarritësit) po eksplorojnë vazhdimisht Ueb-in për të rimbushur bazat e të dhënave të dokumenteve të tyre. Kjo zakonisht nuk kërkon ndonjë përpjekje nga ana e personit. Një shembull do të ishte motori i kërkimit Altavista.

Për motorët e kërkimit, ndërtimi i çdo dokumenti është mjaft i rëndësishëm. Titulli, meta-etiketat dhe përmbajtja e faqes kanë një rëndësi të madhe.

Drejtoritë: ndryshe nga motorët e kërkimit, informacioni futet në një drejtori me iniciativën e një personi. Faqja e shtuar duhet të jetë e lidhur ngushtë me kategoritë e pranuara në katalog. Një shembull i një drejtorie është Yahoo. Ndërtimi i faqeve nuk ka rëndësi. Më tej do të fokusohemi kryesisht në motorët e kërkimit.

Altavista

Sistemi u hap në dhjetor 1995. Ai është në pronësi të kompanisë DEC. Që nga viti 1996 ai ka punuar me Yahoo.

Eksitoni Kërkimin

I lançuar në fund të vitit 1995, sistemi ka evoluar me shpejtësi. Korrik 1996 bleu Magellan, shtator 1996 bleu WebCrawler. Megjithatë, të dy e përdorin atë veçmas nga njëri-tjetri. Ndoshta në të ardhmen ata do të punojnë së bashku.

Ekziston gjithashtu një katalog në këtë sistem - Excite Reviews. Hyrja në këtë drejtori është një fat, pasi jo të gjitha faqet janë të listuara atje. Megjithatë, informacioni nga kjo direktori nuk përdoret nga motori i kërkimit si parazgjedhje, por është e mundur të kontrollohet pasi të shikoni rezultatet e kërkimit.

HotBot

Nisur në maj 1996. Në pronësi të Wired. Bazuar në teknologjinë e motorit të kërkimit Berkeley Inktomi.

InfoSeek

I lançuar pak më herët se 1995, është i njohur, duket i shkëlqyeshëm dhe është lehtësisht i aksesueshëm. Ultrasmart / Ultraseek aktualisht përmban rreth 50 milion URL.

Opsioni i parazgjedhur i kërkimit është Ultrasmart. Në këtë rast, të dy drejtoritë kërkohen. Me opsionin Ultraseek, rezultatet e pyetjes kthehen pa informacion shtesë. Teknologjia vërtet e re e kërkimit lejon gjithashtu kërkime më të lehta dhe një mori veçorish të tjera që mund të lexoni rreth InfoSeek. Ekziston një drejtori InfoSeek Select e ndarë nga motori i kërkimit.

Lycos

Që nga maji 1994, një nga motorët më të vjetër të kërkimit, Lycos, ka funksionuar. I njohur gjerësisht dhe i përdorur shpesh. Ai përfshin motorin e kërkimit Point (që funksionon që nga viti 1995) dhe katalogun A2Z (që funksionon që nga shkurti 1996).

OpenText

Sistemi OpenText u shfaq pak më herët se 1995. Në qershor 1996, ajo filloi të bashkëpunojë me Yahoo. Ajo gradualisht po humbet pozicionin e saj dhe së shpejti do të pushojë së përfshirë në numrin e motorëve kryesorë të kërkimit.

Kërkuesi i uebit

U hap më 20 prill 1994 si një projekt kërkimor në Universitetin e Uashingtonit. Blerë nga America Online në mars 1995. Ekziston një katalog i përzgjedhjes së WebCrawler.

Yahoo

Drejtoria më e vjetër e Yahoo u lançua në fillim të vitit 1994. I njohur gjerësisht, i përdorur shpesh dhe më i respektuari. Në mars 1996, u lançua një tjetër drejtori Yahoo, Yahooligans for Kids. Ka gjithnjë e më shumë drejtori rajonale dhe kryesore të Yahoo.

Për shkak se Yahoo është një përdorues i bazuar në abonim, disa sajte mund të mos jenë të listuara. Nëse një kërkim në Yahoo nuk jep ndonjë rezultat të përshtatshëm, përdoruesit mund të përdorin motorin e kërkimit. Kjo është shumë e lehtë për t'u bërë. Kur bëhet një kërkesë në Yahoo, drejtoria e përcjell atë te ndonjë nga motorët kryesorë të kërkimit. Lidhjet e para në listën e plotësimit të kërkesës janë adresat nga drejtoria, dhe më pas janë adresat e marra nga motorët e kërkimit, veçanërisht nga Altavista.

Karakteristikat e motorëve të kërkimit

Çdo motor kërkimi ka një numër karakteristikash. Këto veçori duhet të merren parasysh kur krijoni faqet tuaja.

Lloji i motorit të kërkimit

Motorët e kërkimit "Tekst të plotë" indeksojnë çdo fjalë në një faqe interneti, duke përjashtuar disa fjalë ndalese. Motorët e kërkimit "abstrakt" krijojnë një ekstrakt të çdo faqeje.

Për webmasterët, makinat me tekst të plotë janë më të dobishme, pasi çdo fjalë që shfaqet në një faqe interneti analizohet për të përcaktuar rëndësinë e saj me kërkesat e përdoruesve. Sidoqoftë, për motorët abstraktë të kërkimit mund të ndodhë që faqet të indeksohen më mirë sesa për ato me tekst të plotë. Kjo mund të vijë nga algoritmi i nxjerrjes, për shembull, frekuenca e të njëjtave fjalë në faqe.

Permasa

Madhësia e një motori kërkimi përcaktohet nga numri i faqeve të indeksuara. Për shembull, në një motor kërkimi me një madhësi të madhe, pothuajse të gjitha faqet tuaja mund të indeksohen, me një vëllim mesatar, serveri juaj mund të indeksohet pjesërisht dhe me një vëllim të vogël, faqet tuaja mund të mos përfshihen në drejtoritë e motor kërkimi fare.

Periudha e rinovimit

  • disa motorë kërkimi indeksojnë menjëherë faqen me kërkesë të përdoruesit dhe më pas vazhdojnë të indeksojnë faqet që nuk janë ende të indeksuara
  • të tjerët kanë më shumë gjasa të "zvarriten" në faqet më të njohura të internetit sesa në të tjerat

Data e indeksimit të dokumentit

Disa motorë kërkimi tregojnë datën kur një dokument i caktuar është indeksuar. Kjo e ndihmon përdoruesin të kuptojë se sa "i freskët" është dhënë lidhja nga motori i kërkimit. Të tjerët i lënë përdoruesit vetëm të hamendësojnë për të.

Faqet e dorëzuara

Idealisht, motorët e kërkimit duhet të gjejnë çdo faqe në çdo server si rezultat i ndjekjes së lidhjeve. Pamja reale duket ndryshe. Faqet e serverit shfaqen shumë më herët në indekset e motorëve të kërkimit, nëse i specifikoni drejtpërdrejt (Shto URL).

Faqe të padorëzuara

Nëse specifikohet të paktën një faqe e serverit, atëherë motorët e kërkimit do të gjejnë patjetër faqet e ardhshme nga lidhjet nga ajo e specifikuar. Megjithatë, kjo kërkon më shumë kohë. Disa makina indeksojnë të gjithë serverin menjëherë, por shumica ende, pasi kanë shkruar faqen e specifikuar në indeks, e lënë serverin të indeksojë për të ardhmen.

Thellësia e indeksimit

Ky parametër vlen vetëm për faqet që nuk janë të listuara. Ai tregon se sa faqe pas asaj të specifikuar do të indeksojë motori i kërkimit.

Shumica e makinave të mëdha nuk kanë kufij të thellësisë së indeksimit. Në praktikë, kjo nuk është plotësisht e vërtetë. Këtu janë disa arsye pse jo të gjitha faqet mund të indeksohen:

  • përdorimi jo tepër i kujdesshëm i strukturave të kornizës (pa lidhje të kopjuara në skedarin e kontrollit (korniza)
  • duke përdorur hartën e imazheve pa i dubluar ato me lidhje të rregullta

Mbështetja e kornizës

Nëse roboti i kërkimit nuk di të punojë me strukturat e kornizës, atëherë shumë struktura me korniza do të mungojnë gjatë indeksimit.

Mbështetje për ImageMap

Ky është afërsisht i njëjti problem si me strukturat e kornizës së serverit.

Drejtoritë dhe serverët e mbrojtur me fjalëkalim

Disa motorë kërkimi mund të indeksojnë serverë të tillë nëse atyre u jepet një emër përdoruesi dhe fjalëkalim. Pse është e nevojshme kjo? Kështu që përdoruesit mund të shohin se çfarë është në serverin tuaj. Kjo ju lejon të paktën të dini se një informacion i tillë është atje, dhe ndoshta ata më pas do të abonohen në informacionin tuaj.

Frekuenca e lidhjes

Motorët kryesorë të kërkimit mund të përcaktojnë popullaritetin e një dokumenti nga sa shpesh lidhet nga diku tjetër në ueb. Disa makina, bazuar në të dhëna të tilla, "bëjnë një përfundim" nëse ia vlen apo jo të shpenzoni kohë për të indeksuar një dokument të tillë.

Aftësia për të mësuar

Nëse serveri përditësohet shpesh, atëherë motori i kërkimit do ta riindeksojë atë më shpesh, nëse rrallë - më rrallë.

Kontrolli i indeksimit

Tregon se çfarë mjetesh mund të kontrollohen nga një motor kërkimi i caktuar. Të gjithë motorët kryesorë të kërkimit ndjekin udhëzimet e skedarëve robots.txt. Disa gjithashtu mbështesin kontrollin duke përdorur etiketat META nga vetë dokumentet që indeksohen.

Ridrejto

Disa sajte i ridrejtojnë vizitorët nga një server në tjetrin dhe ky parametër tregon se cila URL do të lidhet me dokumentet tuaja. Kjo është e rëndësishme sepse nëse motori i kërkimit nuk e përpunon ridrejtimin, atëherë mund të shfaqen probleme me skedarë që nuk ekzistojnë.

Ndaloni fjalët

Disa motorë kërkimi nuk përfshijnë fjalë të caktuara në indekset e tyre ose mund të mos i përfshijnë ato fjalë në pyetjet e përdoruesve. Fjalë të tilla zakonisht konsiderohen si parafjalë ose thjesht fjalë të përdorura shumë shpesh. Dhe mos i përfshini ato për të kursyer hapësirë ​​në media. Për shembull, Altavista injoron fjalën web dhe për kërkesat e zhvilluesve të uebit, vetëm fjala e dytë do të kthehet. Ka mënyra për ta shmangur këtë.

Ndikimi në algoritmin për përcaktimin e rëndësisë

Motorët e kërkimit sigurojnë që të përdorin vendndodhjen dhe shpeshtësinë e fjalëve kyçe në dokument. Sidoqoftë, mekanizmat shtesë për rritjen e rëndësisë janë të ndryshëm për çdo automjet. Ky parametër tregon se çfarë lloj mekanizmash ekzistojnë për një makinë të caktuar.

Gjobat e padëshiruara

Të gjithë motorët kryesorë të kërkimit "nuk u pëlqejnë" kur një sajt përpiqet të rrisë renditjen e tij, për shembull, duke e specifikuar vazhdimisht veten përmes "Shto URL" ose duke përmendur të njëjtën fjalë kyçe disa herë, etj. Në shumicën e rasteve, veprime të tilla (spaming, grumbullim ) dënohen, dhe vlerësimi i faqes, përkundrazi, bie.

Artikujt kryesorë të lidhur