Kako podesiti pametne telefone i računare. Informativni portal
  • Dom
  • Windows 8
  • Pregled programa za pretraživanje dokumenata i podataka. Profesionalna pretraga informacija na Internetu Profesionalna pretraga informacija na Internetu

Pregled programa za pretraživanje dokumenata i podataka. Profesionalna pretraga informacija na Internetu Profesionalna pretraga informacija na Internetu

Do sredine 2015. globalni internet je već povezao 3,2 milijarde korisnika, odnosno skoro 43,8% stanovništva planete. Poređenja radi: prije 15 godina samo 6,5% stanovništva bilo je korisnika interneta, odnosno broj korisnika se povećao više od 6 puta! Ali ono što je impresivnije nisu kvantitativni, već kvalitativni pokazatelji ekspanzije primjene internetskih tehnologija u različitim područjima ljudske djelatnosti: od globalnih komunikacija društvenih mreža do kućnih internetskih stvari. Mobilni internet je korisnicima pružio mogućnost da budu onlajn van kancelarije i kod kuće: na putu, van grada, u prirodi.
Trenutno postoje stotine sistema za pretraživanje informacija na Internetu. Najpopularniji od njih dostupni su velikoj većini korisnika jer su besplatni i laki za korištenje: Google, Yandex, Nigma, Yahoo!, Bing..... Za iskusnije korisnike sučelja za “napredno pretraživanje” i specijalizirana “ dostupne su pretrage društvenih mreža. , prema tokovima vijesti i oglasima o kupovini i prodaji... Ali svi ovi divni pretraživači imaju značajan nedostatak, koji sam već naveo kao prednost: besplatni su.
Ako investitori ulažu milijarde dolara u razvoj pretraživača, onda se postavlja sasvim prikladno pitanje: gdje zarađuju?
I zarađuju novac, posebno tako što kao odgovor na zahtjeve korisnika daju ne toliko informacija koje bi bile korisne sa stanovišta korisnika, koliko onih koje vlasnici pretraživača smatraju korisnim za korisnika. To se radi manipuliranjem redoslijeda u kojem se prikazuju liste odgovora na upite za pretraživanje korisnika. Ovdje postoji otvoreno reklamiranje određenih internet resursa, i skriveno manipuliranje relevantnošću odgovora na osnovu komercijalnih, političkih i ideoloških interesa vlasnika pretraživača.
Stoga je među profesionalnim stručnjacima za traženje informacija na Internetu vrlo relevantan problem relevantnosti rezultata pretraživača.
Relevantnost je korespondencija dokumenata koje pronalazi sistem za pronalaženje informacija informacijskim potrebama korisnika, bez obzira na to koliko je ta potreba za informacijama potpuno i tačno izražena u tekstu samog zahtjeva za informacijama. Ovo je omjer količine korisnih informacija i ukupne količine primljenih informacija. Grubo govoreći, ovo je efikasnost pretraživanja.
Stručnjaci koji vrše kvalifikovanu pretragu informacija na Internetu moraju uložiti određene napore da filtriraju rezultate pretraživanja, uklanjajući nepotrebnu informacijsku „buku“. A za to se koriste alati za pretraživanje na profesionalnom nivou.
Jedan od ovih profesionalnih sistema je ruski program FileForFiles & SiteSputnik (SiteSputnik).
Developer Alexey Mylnikov iz Volgograda.

"Program FileForFiles & SiteSputnik (SiteSputnik) je dizajniran da organizuje i automatizuje profesionalnu pretragu, prikupljanje i praćenje informacija objavljenih na Internetu. Posebna pažnja posvećena je dobijanju novih dolaznih informacija o temama od interesa. Implementirano je nekoliko funkcija analize informacija."


Praćenje i kategorizacija tokova informacija


Prvo par riječi o praćenje tokova informacija, čiji je poseban slučaj praćenje medija i društvenih mreža:

  • korisnik naznači Izvore koji mogu sadržati potrebne informacije i Pravila za odabir ovih informacija;

  • program preuzima sveže linkove sa izvora, oslobađa njihov sadržaj od smeća i ponavljanja i raspoređuje ih u sekcije prema Pravilima.

  • Da biste uživo vidjeli jednostavan, ali stvaran proces praćenja, koji uključuje 6 izvora i 4 naslova:
  • otvorite demo verziju programa;


  • zatim u prozoru koji se pojavi kliknite na dugme Zajedno;

  • i kada WebsiteSputnik sprovesti ovaj projekat u realnom vremenu, vi:
    — na listi “Clean Stream” vidjet ćete sve nove informacije iz izvora,
    — u odjeljku „Nakon zahtjeva“ - samo ekonomske i finansijske vijesti koje zadovoljavaju pravilo,
    - u rubrikama "O predsjedniku", "O premijeri" i "Centralnoj banci", - informacije o relevantnim objektima.

  • U stvarnim projektima možete koristiti gotovo bilo koji broj izvora i rubrika.
    Svoje prve radne projekte možete kreirati za nekoliko sati i poboljšati ih tokom rada.
    Opisana obrada informacija dostupna je u paketu SiteSputnik Pro+News i novijim.

2. Jednostavno i grupno pretraživanje, prikupljanje informacija

Da se upoznaju sa mogućnostima SiteSputnik Pro(osnovna verzija programa) :

  • otvorite demo verziju programa;

  • unesite svoj prvi zahtjev, na primjer, svoje puno ime, kao što sam ja učinio:

    i kliknite na dugme Traži.


  • Program (pogledajte znak koji je napravio SiteSputnik) će se anketirati za nekoliko sekundi 7 izvori, otvoriće se u njima 24 stranice za pretraživanje, naći će 227 relevantni linkovi, će ukloniti duple linkove i od preostalih 156 jedinstven lista linkova "Udruženje".

    Ime
    Izvor

    Naručeno
    stranice

    Preuzeto
    stranice

    Pronađen
    linkovi

    Vrijeme
    traži

    Efikasnost
    traži

    Linkovi
    Novo

    Efikasnost
    Novo
    Yandex 5 5 50 0:00:05 32% 0 0
    Google 5 5 44 0:00:03 28% 0 0
    Yahoo 5 5 50 0:00:05 32% 0 0
    Rambler 5 4 56 0:00:07 36% 0 0
    MSN (Bing) 5 3 23 0:00:04 15% 0 0
    Yandex.Blogs 5 1 1 0:00:01 1% 0 0
    Google.Blogs 5 1 3 0:00:01 2% 0 0
    Ukupno: 35 24 227 0:00:26 0 0
    Ukupno: broj jedinstvenih linkova - 156 , dupli linkovi - 46 %.

  • (! ) Ponovite svoj zahtjev nakon nekoliko sati ili dana i vidjet ćete samo nove veze koji se pojavio u Izvorima za ovaj vremenski period. U posljednje dvije kolone tabele možete vidjeti koliko je novih linkova donio svaki Izvor i njegovu efikasnost u smislu “novosti”. Kada se upit izvršava više puta, lista koja sadrži samo nove veze , kreira se u odnosu na sva prethodna izvršenja ovog zahtjeva. Čini se da je ovo elementarna i neophodna funkcija, ali autor ne poznaje niti jedan program u kojem se implementira.

  • (!! ) Opisane mogućnosti su podržane ne samo za pojedinačne zahtjeve, već i za cijele zahteva pakete :

    Paket koji vidite sastoji se od sedam različitih upita koji prikupljaju informacije o Vasiliju Šukšinu iz nekoliko izvora, uključujući pretraživače, Wikipediju, tačnu pretragu u Yandex vijestima, metapretragu i traženje spominjanja na TV i radio stanicama. Za scenario TV i radio uključuje: "Prvi kanal", "TV Rusija", NTV, RBC TV, "Eho Moskve", radio kompaniju "Mayak", ... i druge izvore informacija. Svaki izvor ima svoju dubinu pretraživanja ili pregledavanja stranica. Naveden je u trećoj koloni.

    Skupna pretraga vam omogućava da izvršite sveobuhvatna pretraživanja jednim klikom prikupljanje informacija na zadatu temu.
    Odvojena lista nove veze, nakon ponovljenih izvršavanja paketa, sadržat će samo veze koje prethodno nisu pronađene.
    Zapamtite šta ste i kada pitali internet i šta vam je on odgovorio Nema potrebe- sve se automatski sprema u biblioteke i baze podataka programa.
    Ponavljam da su mogućnosti opisane u ovom paragrafu u potpunosti uključene u paket SiteSpunik Pro.


  • Više detalja u uputstvima: SiteSputnik Pro za početnike.

3. Nadzor objekata i pretraživanja

Često se korisnik suočava sa sljedećim zadatkom. Morate saznati šta je na Internetu o određenom objektu: osobi ili kompaniji. Na primjer, kada zapošljavate novog radnika ili kada se pojavi nova strana, uvijek znate puno ime, naziv firme, brojeve telefona, INN, OGRN ili OGRNIP, možete uzeti i ICQ, Skype i neke druge podatke. Zatim, korištenjem poziva posebne programske funkcije WebsiteSputnik "Prikupljanje informacija o objektu“ (oprema SiteSputnik Pro+Objects):

Upisujete podatke koje znate i jednim klikom miša izvodite precizan I pun tražiti linkove koji sadrže određene informacije. Pretraga se vrši na nekoliko pretraživača odjednom, koristeći sve detalje odjednom, koristeći nekoliko mogućih kombinacija detalja snimanja odjednom: zapamtite kako možete zapisati telefonski broj na različite načine. Nakon određenog vremenskog perioda, bez dosadnog rutinskog posla, dobićete listu linkova, očišćenu od ponavljanja i, što je najvažnije, poredanu po relevantnosti za predmet koji tražite. Relevantnost (značajnost) se postiže činjenicom da će prvi u rezultatima pretrage SiteSputnik biti oni linkovi na kojima velika količina pojedinosti koje ste naveli, a ne one koji su napredovali u rezultatima pretraživača Webmastera.

Bitan .
Program SiteSputnik je bolji od ostalih programa u izdvajanju pravi, ali ne službeni informacije o objektu. Na primjer, u službenoj bazi podataka mobilnog operatera može biti zabilježeno da telefon pripada Vasiliju Terehinu, ali u stvarnosti ovaj telefon sadrži informaciju da je Aleksandar prodao automobil Ford Focus 2013. godine, što je dodatna informacija za razmatranje.

Praćenje pretrage .
Praćenje pretraživanja znači sljedeće. Ako trebate pratiti pojavu nove veze, po datom objektu ili proizvoljno paket upita, onda samo trebate periodično ponavljati odgovarajuću pretragu. Isto kao i za jednostavan zahtjev, program SiteSputnikće kreirati "Novu" listu, u koju će postaviti samo one linkove koji nisu pronađeni ni u jednoj od prethodnih pretraga.

Praćenje pretrage zanimljivo ne samo po sebi. Može biti uključeno u praćenje medija, društvenih mreža i drugih izvora vesti, što je pomenuto u stavu 1. Za razliku od drugih programa, u kojima je moguće dobiti nove informacije samo iz RSS feedova, u programu WebsiteSputnik može se koristiti za ovo pretraživanja ugrađene u web stranice I tražilice . Također moguće emulacija(samostvaranje) nekoliko RSS kanali sa proizvoljnih stranica, štaviše, emulacija RSS feed-a na zahtjev, pa čak i grupe zahtjeva.


  • Da biste izvukli maksimum iz programa, koristite njegove glavne funkcije, a to su:

    • zatražiti pakete, pakete sa parametrima, koristiti asembler (assembler), operaciju "analitičkog spajanja" rezultata nekoliko zadataka, po potrebi primijeniti osnovne funkcije pretraživanja na nevidljivom Internetu;

    • povežite svoje izvore sa izvorima informacija ugrađenim u program : druge pretraživače i pretrage ugrađene u web stranice, postojeće RSS feedove koje ste kreirali vlastiti RSS feedovi With proizvoljno stranice, koristite funkciju pretraživanja za nove izvore;

    • koristite sljedeće vrste funkcija praćenje: Mediji, društvene mreže i drugi izvori, monitoring komentari na vijesti i poruke, pratiti pojavu novih informacija na postojećim stranicama;

    • angažovati Kategorije , Eksterne funkcije, Task Scheduler, mailing lista, više računara, Project Instructor, instalirajte alarm Da biste vas obavijestili o pojavi značajnih događaja, koristite druge funkcije navedene u nastavku.



4. Program SiteSputnik (SiteSputnik): opcije i karakteristike

- Program SiteSputnik se konstantno usavršava u sljedećim oblastima: "Moram pronaći sve i sa garancijom".
"Softver za ispitivanje za Internet", - još jedna definicija Korisnika za dodjelu programa.

A. Funkcije za traženje i prikupljanje informacija.

. Zatražite paket - izvršavanje nekoliko upita odjednom, kombinirajući rezultate pretraživanja ili zasebno. Prilikom generisanja kombinovanog rezultata, više puta pronađene veze se uklanjaju. Više detalja o paketima možete pronaći u uvodu u SiteSputnik, a vizuelno u videu: joint I odvojeno izvršenje zahtjeva. Nema analoga u domaćim i stranim razvojima.

. Paketi sa parametrima. Bilo koji upiti i paketi upita dizajnirani za rješavanje standardnih zadataka pretraživanja, na primjer, pretraživanje po broj telefona, puno ime ili e-mail, - može se parametrizovati, sačuvati i izvršiti iz biblioteke gotovih upita uz zamjenu stvarnih (potrebnih) vrijednosti parametara. Svaki paket sa parametrima je poseban forma za naprednu pretragu . Može koristiti ne jedan, već nekoliko pretraživača. Možete kreirati forme koje su vrlo složene u svojoj funkcionalnoj namjeni. Izuzetno je važno da forme mogu kreirati sami korisnici, bez učešća autora programa ili programera. Ovo je vrlo jednostavno napisano u uputama, više detalja u zasebnoj publikaciji o parametrizaciji pretraživanja i na forumu, jasno u videu: potražite sve opcije za snimanje broja odjednom mobilni telefon i prema nekoliko opcija za snimanje adrese Email. Nema analoga.

. Asembler NOVO- sastavljanje zadatka pretraživanja od nekoliko gotovih : zahtjevi, paketi zahtjeva i paketi parametara. Paketi mogu sadržavati druge pakete u svom tekstu. Dubina ugniježđenja paketa je neograničena. Možete kreirati nekoliko zadataka pretraživanja, na primjer, o nekoliko pravnih i fizičkih lica, i izvršavati te zadatke istovremeno. Više detalja na forumu i u posebnoj publikaciji o Assembleru, jasno na video. Nema analoga.

. Metatraga - izvršavanje određenog zahteva istovremeno na zadatoj „dubini“ pretrage za svaki od njih. Metatraga je moguća pomoću ugrađenih pretraživača, koji uključuju Yandex, Rambler, Google, Yahoo, MSN (Bing), Mail, Yandex i Google blogove, te povezane alate za pretraživanje. Rad sa više pretraživača izgleda kao da radite sa njima jedan pretraživač . Ponovno pronađeni linkovi se brišu. Vizuelna metapretraga na tri povezane društvene mreže: VKontakte, Twitter i Youtube - prikazano na video.

. Metatraga na sajtu - kombinovanje pretrage sajtova u Google, Yahoo, Yandex, MSN (Bing). Jasno uključeno video.

. Metatraga u uredskim dokumentima - kombinovanje pretrage u PDF, XLS, DOC, RTF, PPT, FLASH fajlovima u Google, Yahoo, Yandex, MSN (Bing). Možete odabrati bilo koju kombinaciju formata datoteka.

. Metatraga za keš kopije linkovi u Yandex, Google, Yahoo, MSN (Bing). Sastavlja se lista čija svaka stavka sadrži sve isječke koje je svaki pretraživač pronašao za svaku vezu. Nema analoga.

. Duboka pretraga za Yandex, Google i Rambler vam omogućava da u jednu listu kombinujete sve linkove iz redovne pretrage i sve linkove, redom, sa lista „Više sa sajta“, „Dodatni rezultati sa sajta“ i „Traži na sajtu (Ukupno ...)”. Pročitajte više o dubokoj pretrazi na forumu. Nema analoga.

. Tačna i potpuna pretraga . To znači sljedeće. S jedne strane, svaki upit se može izvršiti na tom i samo na izvoru na čijem je jeziku upita napisan. Ovo tačna pretraga. S druge strane, ovakvih zahtjeva i izvora može postojati proizvoljan broj. Ovo obezbeđuje puna pretraga. Pročitajte više u zasebnom postu o proceduralnim pretragama. Nema analoga.

. Pretraživanje nevidljivog interneta .

    Uključuje sljedeće osnovne karakteristike:

    Poseban paket zahtjeva koji Korisnik može poboljšati,
    - potražite nevidljive veze pomoću pauka,
    - pretražujte nevidljive linkove u blizini vidljivog linka ili foldera po “slici i sličnosti”,
    - posebne pretrage otvorenih foldera,
    - pretražujte nevidljive veze i mape sa standardnim nazivima koristeći posebne rječnike,
    - korištenje vlastitih pretraživanja ugrađenih u web stranice.

    Više detalja u zasebnoj publikaciji na SiteSputnik Invisible. Osnovne funkcije su „dobro poznate u uskim krugovima“, ali način na koji se koriste nema analoga. Suština ove metode je da se izgradi mapa sajta vidljiva sa Interneta (drugim rečima, materijalizacija vidljivog Interneta), i to samo na osnovu vidljivih linkova i traženje nevidljivih linkova u odnosu na njih. Pretraživanje već vidljivih linkova pomoću „nevidljivih“ metoda se ne vrši.

B. Funkcije praćenja informacija.

. Monitoring za pojavljivanje na internetu novo linkove na zadatu temu. Monitor izgled novo veze se mogu koristiti pomoću cijelih brojeva zahteva pakete , koji uključuju bilo koju od gore navedenih metoda pretraživanja, umjesto pojedinačnih naslovnih stranica pretraživača. Realizovano spajanje i raskrsnica novo linkovi iz više odvojenih pretraga. Više detalja u publikaciji o monitoringu (vidi § 1) i na forumu. Nema analoga.

. Kolektivna obrada informacija . Kreacija korporativna ili profesionalna mreža za kolektivno prikupljanje, praćenje i analizu informacija. Učesnici i kreatori takve mreže su zaposleni u korporaciji, članovi profesionalne zajednice ili interesne grupe. Geografska lokacija učesnika nije bitna. Više detalja u posebnoj publikaciji o organizovanju mreže za kolektivno prikupljanje, praćenje i analizu informacija.

. Monitoring veze (web stranice) za otkrivanje promjena u njihovom sadržaju (sadržaju). Beta verzija. Pronađene promjene su označene bojom i posebnim simbolima. Više detalja u posebnoj publikaciji o monitoringu (vidi § 2 i 3).

IN. Funkcije analize informacija.

. Kategorije materijala već gore opisano. Više detalja možete pronaći u posebnoj publikaciji o Rubrikama. Pravila za unos Rubrika vam omogućavaju da odredite ključne riječi i razmak između njih, postavite logičko “I”, “ILI” i “NE”, primijenite strukturu zagrada na više nivoa i rječnike (umetnite datoteke) na koje se mogu primijeniti logičke operacije.

. VF tehnologija - gotovo proizvoljno proširenje mogućnosti kategorizacije materijala kroz implementaciju eksternih funkcija koje su organski integrisane u Pravila za unos Rubrika i koje programer može implementirati samostalno bez učešća autora programa.

. Numerička analiza popunjenost Rubriksa, montaža alarm i obavještavanje o nastanku značajnih događaja isticanjem Rubrika u boji i/ili slanjem izvještaja o alarmu putem e-maila.

. činjenična relevantnost. Postoji mogućnost sređivanja linkova blizu znacaja ove veze u odnosu na problem koji se rješava, zaobilazeći trikove webmastera koji raznim metodama povećavaju rangiranje stranica u pretraživačima. Ovo se postiže analizom rezultata izvršavanja nekoliko „različitih“ upita na datu temu. U doslovnom smislu riječi, linkovi koji sadrže maksimalno tražene informacije . Pročitajte više u opisu kako pronaći optimalnog dobavljača i na forumu. Nema analoga.

. Izračunavanje odnosa objekata - traženje linkova, resursa (sajtova), foldera i domena na kojima se objekti istovremeno pominju. Najčešći objekti su ljudi i firme. Za traženje veza mogu se koristiti svi programski alati navedeni na ovoj stranici SiteSputnik, što značajno povećava efikasnost posla koji obavljate. Operacija se izvodi na bilo kojem broju objekata. Više detalja u uvodu programa, kao i u opisu nove funkcije "objekti i njihove veze". Nema analoga.

. Formiranje, integracija i ukrštanje tokova informacija na razne teme, poređenje tema. Više detalja u posebnom postu na temama.

. Izrada web mapa web stranice, resursi, folderi i objekti koji se pretražuju na osnovu linkova pronađenih na Internetu koristeći Google, Yahoo, Yandex, MSN (Bing) i Altavista koji pripadaju stranici. Stručnjaci mogu saznati: da li je vidljivo "ekstra" informacije s interneta na njihovim web stranicama, kao i istraživanje web stranica konkurenata na ovu temu. Web sitemap je materijalizacija vidljivog interneta . Više detalja u zasebnoj publikaciji o izradi web mapa, vizualno na video. Nema analoga.

. Pronalaženje novih izvora informacija na datu temu, koja se zatim može koristiti za praćenje pojave novih relevantnih informacija. Više detalja na.

G. Servisne funkcije.

. Task Scheduler obezbeđuje posao Zakazano: izvršava određene programske funkcije u datom trenutku. Više detalja u posebnoj publikaciji o Planeru.

. Instruktor projekta NOVO- Ovo je asistent kreiranje i održavanje Projekti za traženje, prikupljanje, praćenje i analizu informacija (kategorizacija i signalizacija). Više detalja na forumu.

. Automatsko arhiviranje. IN baze podataka Svi rezultati vašeg rada se automatski pamte, a to su: zahtjevi, paketi zahtjeva, protokoli pretraživanja i praćenja, bilo koja od gore navedenih funkcija i rezultati njihovog izvršavanja. Može struktura rad na temama i podtemama.

. Baza podataka uključuje sortiranje, jednostavnu pretragu i prilagođeno pretraživanje po SQL upitu. Za potonje postoji čarobnjak za sastavljanje SQL upita. Koristeći ove alate, možete pronaći i pregledati posao koji ste radili jučer, prošli mjesec, prije godinu dana, definirati temu kao kriterij pretraživanja ili postaviti drugi kriterij pretraživanja na osnovu sadržaja baze podataka.

. Tehnička ograničenja tražilice. Neka ograničenja, kao što je dužina niza upita, mogu se prevazići. Osigurava izvršavanje ne jednog, već nekoliko upita, kombinirajući rezultate pretraživanja ili odvojeno. Možete pročitati o načinu da se prevaziđe kršenje zakona aditivnosti za glavne pretraživače. Za jednu riječ ili jednu frazu stavljenu pod navodnike implementirano je pretraživanje osjetljivo na velika i mala slova u pretraživačima, posebno pretraživanje po skraćenici.

Ugrađeni Pretraživač . Navigator po stranici. Multicolor marker za isticanje ključnih i proizvoljnih riječi. Bilisting i N-listing iz generiranih dokumenata.

. Istovar izvori vijesti u tabelarni prikaz fokusiran uvoz u Excel, MySQL, Access, Kronos i drugim aplikacijama.


5. Instalacija i pokretanje Programa, zahtjevi računara.

Da instalirate i pokrenete program:

  • Preuzmite datoteku, kopirajte fasciklu FileForFiles iz nje na svoj tvrdi disk, na primjer, na D:\;

  • Demo verzija programa Instalirat će se i otvoriće se.

  • Program će raditi na bilo kojem računaru s bilo kojom verzijom Windows instaliranog.

    Šta je ovo

    DuckDuckGo je prilično poznat pretraživač otvorenog koda. Serveri se nalaze u SAD-u. Pored sopstvenog robota, pretraživač koristi rezultate iz drugih izvora: Yahoo, Bing, Wikipedia.

    Bolje

    DuckDuckGo se pozicionira kao pretraživač koji pruža maksimalnu privatnost i povjerljivost. Sistem ne prikuplja nikakve podatke o korisniku, ne pohranjuje logove (nema historije pretraživanja), a korištenje kolačića je maksimalno ograničeno.

    DuckDuckGo ne prikuplja niti dijeli lične podatke korisnika. Ovo je naša politika privatnosti.

    Gabriel Weinberg, osnivač DuckDuckGo

    Zašto ti ovo treba

    Svi glavni pretraživači pokušavaju personalizirati rezultate pretraživanja na osnovu podataka o osobi ispred monitora. Ovaj fenomen se naziva „mjehurić filtera“: korisnik vidi samo one rezultate koji su u skladu s njegovim preferencijama ili koje sistem smatra takvim.

    Formira objektivnu sliku koja ne zavisi od vašeg dosadašnjeg ponašanja na internetu i eliminiše Google i Yandex tematsko oglašavanje na osnovu vaših upita. Uz DuckDuckGo lako je pretraživati ​​informacije na stranim jezicima, dok Google i Yandex po defaultu daju prednost stranicama na ruskom jeziku, čak i ako je upit unesen na drugom jeziku.


    Šta je ovo

    not Evil je sistem koji pretražuje anonimnu Tor mrežu. Da biste ga koristili, morate otići na ovu mrežu, na primjer pokretanjem specijaliziranog .

    not Evil nije jedini pretraživač te vrste. Postoji LOOK (podrazumevana pretraga u Tor pretraživaču, dostupna sa redovnog interneta) ili TORCH (jedan od najstarijih pretraživača na Tor mreži) i drugi. Odlučili smo se da nije Evil zbog jasnog nagoveštaja od Gugla (samo pogledajte početnu stranicu).

    Bolje

    Pretražuje gdje su Google, Yandex i drugi pretraživači općenito zatvoreni.

    Zašto ti ovo treba

    Tor mreža sadrži mnoge resurse koji se ne mogu naći na Internetu koji poštuje zakon. A njihov broj će rasti kako se vladina kontrola nad sadržajem interneta pooštrava. Tor je svojevrsna mreža unutar Interneta sa vlastitim društvenim mrežama, torrent trackerima, medijima, trgovačkim platformama, blogovima, bibliotekama i tako dalje.

    3. YaCy

    Šta je ovo

    YaCy je decentralizirana tražilica koja radi na principu P2P mreža. Svaki računar na kojem je instaliran glavni softverski modul samostalno skenira internet, odnosno analogan je robotu za pretraživanje. Dobijeni rezultati se prikupljaju u zajedničku bazu podataka koju koriste svi YaCy učesnici.

    Bolje

    Teško je reći da li je ovo bolje ili gore, budući da je YaCy potpuno drugačiji pristup organizaciji pretraživanja. Odsustvo jednog servera i vlasničke kompanije čini rezultate potpuno nezavisnim od nečijih preferencija. Autonomija svakog čvora eliminira cenzuru. YaCy je sposoban za pretraživanje dubokog weba i neindeksiranih javnih mreža.

    Zašto ti ovo treba

    Ako ste pobornik softvera otvorenog koda i besplatnog interneta, koji ne podliježe utjecaju vladinih agencija i velikih korporacija, onda je YaCy vaš izbor. Također se može koristiti za organiziranje pretraživanja unutar korporativne ili druge autonomne mreže. I iako YaCy nije previše koristan u svakodnevnom životu, on je dostojna alternativa Googleu u smislu procesa pretraživanja.

    4. Pipl

    Šta je ovo

    Pipl je sistem dizajniran za traženje informacija o određenoj osobi.

    Bolje

    Autori Pipl-a tvrde da njihovi specijalizovani algoritmi pretražuju efikasnije od „običnih” pretraživača. Posebno se daje prioritet profilima na društvenim mrežama, komentarima, listama članova i raznim bazama podataka koje objavljuju informacije o ljudima, kao što su baze podataka sudskih odluka. Piplovo vodstvo u ovoj oblasti potvrđuju procjene Lifehacker.com, TechCrunch i drugih publikacija.

    Zašto ti ovo treba

    Ako trebate pronaći informacije o osobi koja živi u SAD-u, onda će Pipl biti mnogo efikasniji od Googlea. Baze podataka ruskih sudova očigledno su nedostupne pretraživaču. Stoga se ne nosi tako dobro sa ruskim građanima.

    Šta je ovo

    FindSounds je još jedan specijalizovani pretraživač. Pretražuje različite zvukove u otvorenim izvorima: kuća, priroda, automobili, ljudi itd. Usluga ne podržava upite na ruskom, ali postoji impresivna lista oznaka na ruskom jeziku koje možete koristiti za pretraživanje.

    Bolje

    Izlaz sadrži samo zvukove i ništa dodatno. U postavkama možete podesiti željeni format i kvalitet zvuka. Svi pronađeni zvukovi dostupni su za preuzimanje. Postoji pretraga po uzorku.

    Zašto ti ovo treba

    Ako trebate brzo pronaći zvuk pucnjave muškete, udarce djetlića koji sisa ili krik Homera Simpsona, onda je ova usluga za vas. A mi smo ovo odabrali samo iz dostupnih upita na ruskom jeziku. Na engleskom je spektar još širi.

    Ozbiljno, specijalizovana usluga zahteva specijalizovanu publiku. Ali šta ako i vama dobro dođe?

    Šta je ovo

    Wolfram|Alpha je kompjuterski pretraživač. Umjesto linkova na članke koji sadrže ključne riječi, on daje gotov odgovor na zahtjev korisnika. Na primjer, ako unesete „uporedi stanovništvo New Yorka i San Francisca“ u formular za pretragu na engleskom, Wolfram|Alpha će odmah prikazati tabele i grafikone sa poređenjem.

    Bolje

    Ova usluga je bolja od ostalih za pronalaženje činjenica i izračunavanje podataka. Wolfram|Alpha prikuplja i organizira znanje dostupno na webu iz raznih oblasti, uključujući nauku, kulturu i zabavu. Ako ova baza podataka sadrži gotov odgovor na upit za pretragu, sistem ga prikazuje; ako ne, izračunava i prikazuje rezultat. U ovom slučaju korisnik ne vidi samo ništa suvišno.

    Zašto ti ovo treba

    Ako ste student, analitičar, novinar ili istraživač, na primjer, možete koristiti Wolfram|Alpha da pronađete i izračunate podatke koji se odnose na vaš rad. Usluga ne razumije sve zahtjeve, ali se stalno razvija i postaje sve pametnija.

    Šta je ovo

    Dogpile metasearch engine prikazuje kombinovanu listu rezultata iz rezultata pretrage sa Google, Yahoo i drugih popularnih sistema.

    Bolje

    Prvo, Dogpile prikazuje manje oglasa. Drugo, usluga koristi poseban algoritam za pronalaženje i prikazivanje najboljih rezultata sa različitih pretraživača. Prema Dogpile programerima, njihovi sistemi generiraju najkompletnije rezultate pretraživanja na cijelom Internetu.

    Zašto ti ovo treba

    Ako ne možete pronaći informacije na Google-u ili nekom drugom standardnom pretraživaču, potražite ih u nekoliko pretraživača odjednom koristeći Dogpile.

    Šta je ovo

    BoardReader je sistem za pretraživanje teksta na forumima, servisima pitanja i odgovora i drugim zajednicama.

    Bolje

    Usluga vam omogućava da suzite polje pretraživanja na društvene platforme. Zahvaljujući posebnim filterima, možete brzo pronaći objave i komentare koji odgovaraju vašim kriterijima: jezik, datum objavljivanja i naziv stranice.

    Zašto ti ovo treba

    BoardReader može biti koristan za PR stručnjake i druge stručnjake za medije koji su zainteresirani za mišljenje mase o određenim pitanjima.

    Konačno

    Život alternativnih pretraživača je često prolazan. Lifehacker je upitao bivšeg generalnog direktora ukrajinskog ogranka Yandexa Sergeja Petrenka o dugoročnim izgledima takvih projekata.


    Sergej Petrenko

    Bivši generalni direktor Yandex.Ukraine.

    Što se tiče sudbine alternativnih pretraživača, ona je jednostavna: biti vrlo nišni projekti s malom publikom, dakle bez jasnih komercijalnih izgleda ili, obrnuto, s potpunom jasnoćom njihovog odsustva.

    Ako pogledate primjere u članku, možete vidjeti da su takve tražilice ili specijalizirane za usku, ali popularnu nišu, koja, možda, još nije dovoljno narasla da bi bila uočljiva na radarima Googlea ili Yandexa, ili se testiraju originalna hipoteza u rangiranju, koja još nije primjenjiva u redovnom pretraživanju.

    Na primjer, ako se odjednom pokaže da je pretraga na Tor-u tražena, odnosno da su rezultati odatle potrebni barem jednom postotku Googleove publike, tada će, naravno, obični pretraživači početi rješavati problem kako pronađite ih i pokažite ih korisniku. Ako ponašanje publike pokaže da se za značajan dio korisnika u značajnom broju upita rezultati dati bez uzimanja u obzir faktora koji ovise o korisniku čine relevantnijim, tada će Yandex ili Google početi proizvoditi takve rezultate.

    “Budi bolji” u kontekstu ovog članka ne znači “biti bolji u svemu”. Da, u mnogim aspektima naši heroji su daleko od Yandexa (čak i od Binga). Ali svaka od ovih usluga daje korisniku nešto što giganti u industriji pretraživanja ne mogu ponuditi. Sigurno i vi poznajete slične projekte. Podijelite s nama - razgovarajmo.

    Uvod

    Trenutno, Internet objedinjuje stotine miliona servera na kojima se nalaze milijarde različitih sajtova i pojedinačnih fajlova koji sadrže različite vrste informacija. Ovo je ogromno skladište informacija. Postoje različite metode za traženje informacija na Internetu.

    Traži po poznatoj adresi. Potrebne adrese se preuzimaju iz imenika. Znajući adresu, samo je unesite u adresnu traku pretraživača.

    Primer 1. www.gov.ru je server ruskih državnih organa.

    Konstrukcija adrese od strane korisnika. Poznavajući sistem za formiranje Internet adresa, možete konstruisati adrese kada tražite web stranice.

    Ključnoj riječi (naziv kompanije, preduzeća, organizacije ili obična engleska imenica) morate dodati tematski ili geografski domen i povezati svoju intuiciju.

    Primjer 2. Adrese komercijalnih web stranica:

    www.samsung.com (kompanija SAMSUNG),

    www.mtv.com (MTV muzičke vijesti).

    Primjer 3. Adrese obrazovnih institucija:

    www.ntu.edu (Nacionalni univerzitet SAD).

    Internet pretraživači

    Za traženje informacija na Internetu razvijeni su posebni sistemi za pronalaženje informacija. Pretraživači imaju redovnu adresu i prikazuju se kao web stranica koja sadrži posebne alate za organiziranje pretraživanja (string za pretraživanje, predmetni direktorij, veze). Da biste pozvali pretraživač, jednostavno unesite njegovu adresu u adresnu traku pretraživača.

    Prema statističkom servisu LiveInternet.ru, distribucija pretraživača u Rusiji je otprilike sljedeća:

    2) Google – 35,0%

    3) Pretraži Mail.ru – 8,3%

    4) Rambler – 0,9%

    Prema načinu organizovanja informacija, sistemi za pronalaženje informacija dijele se na dva tipa: klasifikacijski (rubrikatori) i rječnik.

    kategorije (klasifikatori)- pretraživači koji koriste hijerarhijsku (stablo) organizaciju informacija. Prilikom traženja informacija, korisnik pregledava tematske naslove, postepeno sužavajući polje za pretragu (na primjer, ako trebate pronaći značenje riječi, prvo morate pronaći rječnik u klasifikatoru, a zatim pronaći željenu riječ u to).



    Pretraživači rječnika- Ovo su moćni automatski softverski i hardverski sistemi. Uz njihovu pomoć, informacije se pregledavaju (skeniraju) na Internetu. Podaci o lokaciji ove ili one informacije unose se u posebne indeksne imenike. Kao odgovor na zahtjev, vrši se pretraga prema nizu upita. Kao rezultat, korisniku se nude one adrese (URL-ovi) na kojima je tražena riječ ili grupa riječi pronađena u trenutku skeniranja. Odabirom bilo koje od predloženih adresa veze možete otići na pronađeni dokument. Većina modernih pretraživača je mješovita.

    Najpoznatiji i najpopularniji pretraživači:

    Postoje sistemi koji su specijalizovani za traženje izvora informacija u različitim oblastima.

    https://my.mail.ru

    https://ru-ru.facebook.com

    https://twitter.com

    https://www.tumblr.com

    https://www.instagram.com, itd.

    Pretraživači predmeta:

    Softver za pretragu:

    Katalozi (tematske zbirke linkova sa napomenama):

    http://www.atrus.ru

    Pravila za izvršavanje zahtjeva

    Odjeljak za pomoć svake tražilice pruža informacije o tome kako pretraživati ​​i kako konstruirati string upita. Ispod su informacije o tipičnom, “prosječnom” jeziku upita.

    Jednostavan zahtjev

    Unesite jednu riječ koja definira temu pretraživanja. Na primjer, u tražilicu Rambler.ru dovoljno je unijeti: automatizacija.

    Pronađeni su dokumenti koji sadrže riječi navedene u zahtjevu. Prepoznaju se svi oblici ruskih riječi; po pravilu se zanemari velika i mala slova.

    U upitu možete koristiti znak "*" ili "?". Potpišite "?" u ključnoj riječi zamjenjuje se jedan znak, umjesto kojeg se može zamijeniti bilo koje slovo, a znak “*” je niz znakova.

    Na primjer, upit automatski* će vam omogućiti da pronađete dokumente koji uključuju riječi automatski, automatizacija itd.

    Složen zahtjev

    Često postoji potreba za kombinovanjem ključnih reči da bi se dobile konkretnije informacije. U ovom slučaju se koriste dodatne riječi za povezivanje, funkcije, operatori, simboli, kombinacije operatora, razdvojene zagradama.

    Na primjer, upit muzika & (beatles beatles) znači da korisnik traži dokumente koji sadrže riječi muzika i bitlsi ili muzika i bitlsi.

    Lista tražilica i direktorija

    Adresa Opis
    www.excite.com Tražilica s recenzijama web stranica i vodičima
    www.alta-vista.com Server za pretraživanje, dostupne napredne mogućnosti pretraživanja
    www.hotbot.com Search server
    www.ifoseek.com Search server (jednostavan za korištenje)
    www.ipl.org Internet Publik biblioteka, javna biblioteka koja djeluje u okviru projekta World Village
    www.wisewire.com WiseWire - organizacija pretraživanja koristeći umjetnu inteligenciju
    www.webcrawler.com WebCrawler - server za pretraživanje, jednostavan za korištenje
    www.yahoo.com CatalogWeb i interfejs za pristup pretraživanju punog teksta na AltaVista serveru
    www.aport.ru Aport - server za pretraživanje na ruskom jeziku
    www.yandex.ru Yandex - server za pretraživanje na ruskom jeziku
    www.rambler.ru Rambler - server za pretraživanje na ruskom jeziku
    Resursi Internet pomoći
    www.yellow.com Yellow Pages Internet
    monk.newmail.ru Pretraživači raznih profila
    www.top200.ru Top 200 web stranica
    www.allru.net
    www.ru Katalog ruskih Internet resursa
    www.allru.net/z09.htm Obrazovni resursi
    www.students.ru Ruski studentski server
    www.cdo.ru/index_new.asp Centar za učenje na daljinu
    www.open.ac.uk UK Open University
    www.ntu.edu Američki nacionalni univerzitet
    www.translate.ru Elektronski prevodilac teksta
    www.pomorsu.ru/guide.library.html Lista veza do mrežnih biblioteka
    www.elibrary.ru Naučna elektronska biblioteka
    www.citforum.ru Digitalna biblioteka
    www.infamed.com/psy Psihološki testovi
    www.pokoleniye.ru Web stranica Federacije Internet obrazovanja
    www.metod.narod.ru Obrazovni resursi
    www.spb.osi.ru/ic/distant Učenje na daljinu na internetu
    www.examen.ru Ispiti i testovi
    www.kbsu.ru/~book/ Udžbenik informatike
    Mega.km.ru Enciklopedije i rječnici

    Profesionalna pretraga informacija na internetu

    Pretraživanje informacija jedan je od najčešćih, a ujedno i najtežih zadataka s kojima se svaki korisnik mora suočiti na internetu. Međutim, ako je za običnog člana internetske zajednice poznavanje metoda efikasnog pronalaženja informacija poželjan, ali daleko od obaveznog kvaliteta, onda je za informatičke stručnjake sposobnost brzog snalaženja u internetskim resursima i pronalaženja potrebnih izvora jedna od osnovnih kvalifikacija. vještine.

    Razlog za poteškoće koje nastaju prilikom traženja informacija na Internetu određuju dva glavna faktora. Prvo, broj izvora na Internetu je izuzetno velik. Krajem 2001. godine, najgrublje procene su ukazivale na procenjenu cifru od 7,5 milijardi dokumenata koji se nalaze na serverima širom sveta. Drugo, niz informacija na Internetu nije samo kolosalan po obimu, već je i izuzetno dinamičan. Za pola minuta koliko ste proveli čitajući prve redove ovog odeljka, u virtuelnom univerzumu se pojavilo stotinjak novih ili izmenjenih dokumenata, desetine su preseljene na nove adrese, a nekoliko je zauvek prestalo da postoji. Internet nikada ne „spava“, kao što nikada ne „spava“ naša planeta, po kojoj se neprestano kotrlja talas ljudskih poslovnih aktivnosti u potpunom skladu sa promjenom vremenskih zona.

    Za razliku od stabilne i kontrolisane zbirke dokumenata u biblioteci, na Internetu imamo posla sa gigantskim i stalno promenljivim informacionim nizom, potraga za podacima u kojima je veoma, veoma složen proces. Situacija često vrlo podsjeća na dobro poznati problem pronalaženja igle u plastu sijena, a ponekad informacije velike vrijednosti ostaju nepotražene isključivo zbog teškoća pronalaženja.

    Većina korisnika globalnih kompjuterskih mreža u jednom ili drugom stepenu poseduje veštine istraživanja informacija. I amateri i profesionalci često koriste iste alate. Međutim, rezultati pretraživanja i vrijeme utrošeno na njih uvelike variraju.

    Svrha ovog odjeljka je da se detaljno upoznate s alatima i metodama pronalaženja informacija i razvijete stabilne vještine za profesionalnu pretragu na Internetu za sve vrste podataka: od tekstova u bilo kojem formatu, do videa i animacije.

    STRUČNA PRETRAGA INFORMACIJA NA INTERNETU

    Pretraživanje Interneta je važan element rada na Internetu. Malo ko sa sigurnošću zna tačan broj web resursa na savremenom Internetu. U svakom slučaju, broj se kreće u milijardama. Da biste mogli koristiti informacije koje su vam potrebne u datom trenutku, bez obzira na posao ili zabavu, prvo ih morate pronaći u ovom okeanu resursa koji se stalno obnavlja.

    Da bi pretraživanje Interneta bilo uspješno, moraju biti ispunjena dva uslova: upiti moraju biti dobro formulisani i postavljati na odgovarajućim mjestima. Drugim riječima, od korisnika se traži, s jedne strane, da može svoja interesovanja za pretraživanje prevesti na jezik upita za pretraživanje, as druge strane dobro poznavanje pretraživača, dostupnih alata za pretraživanje, njihovih prednosti i nedostatke, što će mu omogućiti da odabere najprikladnije alate za pretraživanje u svakom konkretnom slučaju.

    Trenutno ne postoji jedinstveni resurs koji zadovoljava sve zahtjeve pretraživanja Interneta. Stoga, ako svoju pretragu shvatite ozbiljno, neizbježno morate koristiti različite alate, koristeći svaki u najprikladnijem slučaju.

    Basic Alati za internet pretragumogu se podijeliti u sljedeće glavne grupe:

    Tražilice;

    Web imenici;

    Resursi pomoći;

    Lokalni programi za pretraživanje interneta.

    Najpopularniji alati za pretraživanje sutražilice– takozvani internet pretraživači (Search Engines). Prva tri lidera na globalnom nivou su prilično stabilna - Google, Yahoo! i Bing. U mnogim zemljama, na ovu listu su dodani njihovi lokalni pretraživači, optimizovani za rad sa lokalnim sadržajem. Uz njihovu pomoć, teoretski možete pronaći bilo koju određenu riječ na stranicama mnogih milijuna web-mjesta. Sa tačke gledišta korisnika, glavni nedostatak pretraživača je neizbežno prisustvoinformacioni šumu rezultatima. Ovo je uobičajeno ime za rezultate koji su iz ovog ili onog razloga uključeni u listu pretraživanja i ne odgovaraju zahtjevu.

    Uprkos mnogim razlikama, svi internet pretraživači rade na sličnim principima i, sa tehničke tačke gledišta, sastoje se od sličnih podsistema. Prvi strukturni dio tražilice su posebni programi koji se koriste za automatsko pretraživanje i naknadno indeksiranje web stranica. Takvi programi se obično nazivaju pauci ili botovi. Gledaju kod web stranica, pronalaze linkove koji se nalaze na njima i na taj način otkrivaju nove web stranice. Postoji alternativni način da se web lokacija uključi u indeks. Mnogi pretraživači nude vlasnicima resursa mogućnost da samostalno dodaju web lokaciju u svoju bazu podataka. Međutim, web stranice se zatim preuzimaju, analiziraju i indeksiraju. Oni ističu strukturne elemente, pronalaze ključne riječi i određuju njihove veze s drugim stranicama i web stranicama. Izvode se i druge operacije čiji je rezultat formiranje baze podataka indeksa tražilice. Ova baza podataka je drugi glavni element svakog pretraživača. Trenutno ne postoji jedinstvena apsolutno potpuna indeksna baza podataka koja bi sadržavala informacije o svim internet sadržajima. Budući da različite tražilice koriste različite programe za pretraživanje web stranica i grade svoj indeks korištenjem različitih algoritama, baze podataka indeksa tražilica mogu značajno varirati. Neke stranice indeksira više pretraživača, ali uvijek postoji određeni postotak resursa uključenih u bazu podataka samo jedne tražilice. Prisutnost takvog originalnog dijela indeksa koji se ne preklapa u svakoj tražilici omogućava nam da izvučemo važan praktični zaključak: ako koristite samo jednu tražilicu, čak i najveću, sigurno ćete izgubiti određeni postotak korisnih veza. .

    Sljedeći dio internet pretraživača su stvarni programi za pretraživanje i sortiranje. Ovi programi rješavaju dva glavna zadatka: prvo pronalaze stranice i datoteke u bazi podataka koji odgovaraju dolaznom zahtjevu, a zatim sortiraju rezultirajući niz podataka u skladu s različitim kriterijima. Uspjeh u postizanju ciljeva pretraživanja u velikoj mjeri zavisi od efikasnosti njihovog rada.

    Posljednji element internet pretraživača je korisnički interfejs. Pored uobičajenih zahtjeva za estetiku i praktičnost za bilo koju web stranicu, sučelja pretraživača imaju još jedan važan zahtjev: moraju ponuditi različite alate za sastavljanje i razjašnjavanje upita, kao i sortiranje i filtriranje rezultata. Prednosti pretraživača su odlična pokrivenost izvora, relativno brzo ažuriranje sadržaja baze podataka i dobar izbor dodatnih funkcija.

    Glavni alat za rad sa pretraživačima je upit.

    Za pretraživanje interneta koriste se i posebne aplikacije koje su instalirane na lokalnom računalu. To mogu biti jednostavni programi ili prilično složeni kompleksi za pretraživanje i analizu podataka. Najčešći su dodaci za pretraživanje za pretraživače, paneli pretraživača dizajnirani za rad sa određenim servisom pretraživanja i paketi za metapretragu sa mogućnostima za analizu rezultata.

    Web imenici – to su resursi u kojima su stranice podijeljene u tematske kategorije. Ako korisnik radi sa pretraživačima samo putem upita, onda je u katalogu moguće pregledati tematske dijelove u cijelosti. Druga fundamentalna razlika između direktorija i automatskih pretraživača je u tome što su, po pravilu, ljudi direktno uključeni u njihovo popunjavanje, pregledavanje resursa i razvrstavanje stranice u jednu ili drugu kategoriju. Web imenici se obično dijele na univerzalne i tematske. Univerzalni pokušavaju da pokriju što više tema. Tamo možete pronaći bilo šta: od web stranica o poeziji do kompjuterskih resursa. Drugim riječima, njihova širina pretraživanja je maksimalna. Tematski direktoriji su specijalizirani za određenu temu, pružajući maksimalnu dubinu pretraživanja smanjujući širinu pokrivenosti resursa.

    Prednosti direktorija su relativno visok kvalitet resursa, budući da svaki sajt u njemu pregledava i bira osoba. Tematsko grupisanje web lokacija omogućava vam da prikladno uredite web stranice sličnih tema. Ovaj način rada je dobar za otkrivanje stranica koje su vam nove na temu od interesa - precizniji je od korištenja tražilice. Preporuča se korištenje web kataloga za prvo upoznavanje bilo koje predmetne oblasti, kao i traženje nejasnih upita - imat ćete priliku "lutati" po odjeljcima kataloga i preciznije odrediti šta vam je točno potrebno.

    Nedostaci web imenika su poznati. Prije svega, riječ je o sporom nadopunjavanju baze podataka, budući da je za uključivanje stranice u katalog potrebno ljudsko učešće. U smislu efikasnosti, web imenik nije rival pretraživačima. Osim toga, web imenici su znatno inferiorniji u odnosu na tražilice u smislu veličine baze podataka.

    Kada govorimo o pretraživanju Interneta, ne možemo zanemariti niz pojmova koji su usko vezani za ovu oblast i često se koriste za opisivanje i evaluaciju pretraživača. Na primjer:širina i dubina Internet pretraga. Široka pretraga je ona koja obuhvata što više izvora informacija. U ovom slučaju, barem spominjanje jedne ili druge stranice pogodne za zahtjev smatra se dovoljnim. Dubina pretrage odnosi se na detalje indeksiranja i naknadnog pretraživanja svakog određenog resursa. Na primjer, mnogi pretraživači različito pristupaju indeksiranju različitih stranica. Velike i popularne stranice su indeksirane u maksimalnoj mjeri, roboti se trude da ne propuste nijednu stranicu takvog resursa. Istovremeno, na drugim stranicama mogu se indeksirati samo naslovna stranica i nekoliko stranica sa sadržajem. Ove okolnosti prirodno utiču na naknadne pretrage. Dubinsko pretraživanje funkcionira po principu “bolje je uključiti nepotrebne informacije u rezultate nego propustiti bilo koji podatak relevantan za temu pretraživanja.”

    Vrlo često možete naići na koncepte kao što su globalno i lokalno Internet pretraga. Lokalna internetska pretraživanja uzimaju u obzir geografsku lokaciju korisnika i daju prednost rezultatima koji su na neki način povezani sa određenom zemljom ili lokalitetom. Tokom globalne pretrage, ove informacije se ne uzimaju u obzir, a pretraga se vrši u svim dostupnim resursima.

    Prilikom sastavljanja upita na internet pretraživačima rade različiti načini pretraživanja. Tipični načini pretraživanja koji se nalaze na većini internetskih mašina uključuju: jednostavno i napredno traži. Jednostavna pretraga vam omogućava da navedete samo jednu funkciju pretraživanja u jednom zahtjevu. Napredna pretraga omogućava kreiranje upita iz nekoliko uslova, povezujući ih logičkim operatorima.

    Da biste precizirali upite za pretraživanje, razne filteri . Filteri su ona ili druga pomoćna sredstva za sastavljanje upita koja se ne odnose na sadržajnu stranu uslova upita, ali ograničavaju rezultate pretraživanja nekom formalnom karakteristikom. Tako, na primjer, kada koristi filter tipa datoteke prilikom pretraživanja, korisnik ne daje sistemu informacije koje se odnose na temu njegovog zahtjeva, već jednostavno ograničava dobivene rezultate na određeni tip datoteke koji je naveden u uvjetu njegovog zahtjeva.

    Za većinu korisnika, univerzalni pretraživači su glavno, a često i jedino sredstvo pretraživanja Interneta. Nude dobru pokrivenost izvora, kao i skup alata dovoljnih za rješavanje osnovnih problema pretraživanja.

    Tržište univerzalnih pretraživača je prilično veliko. Pokušali smo analizirati najpoznatije pretraživače, a rezultate prikazali u tabeli 1.

    Prilikom odabira univerzalne tražilice, kvaliteta resursa pronađenih uz njegovu pomoć igra važnu ulogu. Možete odrediti željenu tražilicu za određene zadatke koristeći „metodu markera“. Njegova suština je da se prvo sastavlja određeni tematski upit za pretraživanje, nakon čega se anketira grupa ljudi - stručnjaka u ovoj oblasti kako bi se identificirali najbolji, po njihovom mišljenju, Internet resursi na odabranu temu. Na osnovu podataka ankete, generira se lista markerskih lokacija za koje se garantuje da su relevantne za zahtjev i sadrže visokokvalitetne informacije. Zahtjev se zatim šalje testiranim pretraživačima. Logika procene je jednostavna: što su lokacije markera više locirane u rezultatima pretrage, to je određeni resurs pogodniji za traženje informacija o temi testa.



    Reći da u naše vrijeme informatičke tehnologije i beskrajnog rasta količine podataka dostupnih kako pojedincu tako i društvu, postoje mnogi problemi s obradom informacija i traženjem za njima, već je blasfemija. Ko ne pokreće ovu temu? A da vas ne opterećujem subjektivnim, a dijelom i objektivnim sudovima iz različitih izvora informacija o problemu, preći ću direktno na njegovo rješenje. Danas ćemo pričati o pretrazi. Odnosno, o programima i ozbiljnim informacionim sistemima koji traže dokumente i podatke koji su nam potrebni.

    Nadogradite "direktnu pretragu"

    Ne tako davno, kada su stabla bila velika, a nije bilo mnogo informacija čak ni na lokalnoj mreži preduzeća, svako pretraživanje se vršilo jednostavnim pretraživanjem kroz pregršt dostupnih datoteka i uzastopnim provjeravanjem njihovih imena i sadržaja. Takvo pretraživanje se naziva direktno, a programi (uslužni programi) koji koriste tehnologiju direktnog pretraživanja tradicionalno su prisutni u svim operativnim sistemima i paketima alata. Ali čak ni snaga modernih kompjutera nije dovoljna za brzu i adekvatnu pretragu u gigantskim količinama podataka tokom direktnog pretraživanja. Pretraživanje nekoliko stotina dokumenata na disku i pretraživanje ogromne biblioteke i nekoliko desetina poštanskih sandučića dvije su različite stvari. Stoga, programi za direktnu pretragu danas očito blede u pozadini – kada su u pitanju univerzalni alati.

    Naravno, ova vrsta pretrage nije dugo bila tražena u korporativnom sektoru. Volumen nije isti. Stoga su već dugi niz godina, a odnedavno jasno, tehnologije sposobne za brzo i precizno traženje dokumenata različitih formata i iz različitih izvora više nego relevantne. Ne tako davno, Microsoftov “otac” Bill Gates, očito zavidan na fenomenalnom uspjehu internet pretraživača Google, na jednoj od konferencija za štampu najavio je želju softverske industrije (i ne samo) da doprinese na svaki mogući način, razviti i produbiti kreiranje pretraživača i tehnologija. Ali prerano je za kreiranje bilo kakvog programa koji fenomenalno radi od Microsofta ili konkurentnog servera na Internetu (MSN još uvijek ne stiže do Googlea). Stoga, okrenimo se postojećim razvojima. Indeks, upit, relevantnost

    Moderne tehnologije su zasnovane na dva osnovna procesa. Prvo, to je indeksiranje dostupnih informacija i obrada zahtjeva s naknadnim izlazom rezultata. Što se prvog tiče, svaki program (bilo da se radi o desktop pretraživaču, korporativnom informacionom sistemu ili pretraživaču na Internetu) kreira vlastito područje pretraživanja. Odnosno, obrađuje dokumente i generiše indeks tih dokumenata (organizovanu strukturu koja sadrži informacije o obrađenim podacima). Ubuduće, kreirani indeks se koristi za rad - brzo dobijanje liste potrebnih dokumenata prema zahtjevu. Ono što slijedi, iako nimalo jednostavno u tehnološkom smislu, sasvim je razumljivo prosječnom korisniku. Program obrađuje zahtjev (koristeći frazu ključne riječi) i prikazuje listu dokumenata koji sadrže ovu ključnu riječ. Budući da su informacije sadržane u strukturiranom indeksu, obrada upita je mnogo brža (desetine i stotine puta!) nego u slučaju direktnog pretraživanja (odabir dokumenata se ne vrši nabrajanjem datoteka, već analizom tekstualnih informacija u indeks).

    Program prikazuje pronađene dokumente u rezultujućoj listi prema relevantnosti – usklađenosti dokumenta sa tekstom upita. U različitim tehnologijama, naravno, postoje različite metode za traženje i određivanje relevantnosti dokumenta (broj „pojavljivanja“ riječi i učestalost njenog spominjanja u dokumentu, omjer ovih parametara i ukupnog broja riječi u dokumentu, udaljenost između riječi fraze upita u pretraživanim datotekama i tako dalje). Na osnovu ovih parametara određuje se „težina” dokumenta i, u zavisnosti od toga, određena datoteka se pojavljuje u listi rezultata na određenoj poziciji. U slučaju pretraživanja interneta, situacija je još složenija. Zaista, u ovom slučaju se moraju uzeti u obzir mnogi drugi faktori (Googleov rang stranice je primjer za to). Ali ovo je tema za poseban članak, pa nećemo dirati internet. Pregled pretraživača

    Ovaj materijal ispituje mogućnosti nekoliko popularnih programa za pretraživanje koji se mogu pohvaliti i pristojnim brzinama i dobrom funkcionalnošću. Ali pokazivati ​​se u brošurama je jedno, a stajati pod pogledom stručnjaka sasvim drugo. I nije bilo više stručnjaka, ni manje kancelarije pune ljudi koji su voleli da se petljaju sa softverom radi njegove upotrebljivosti. Na eksperimentalnom računaru (Athlon 2,2 MHz, sa RAM 1 GB, 160 GB IDE hard disk Seagate 7200 rpm i Windows XP) instaliran je set programa: dtSearch Desktop, Ishcheika Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Za testove je sastavljena tekstualna baza dokumenata u doc, txt i html formatima ukupne veličine ni više ni manje, već 20 gigabajta. Grupa drugova pod vodstvom vašeg poniznog sluge testirala je, upoređivala i dijelila svoje subjektivne utiske o svakom softveru. U nastavku pročitajte sažetak nalaza. dtSearch Desktop

    Program koji, prema riječima programera, tvrdi da je najbrži, najpovoljniji i najbolji pretraživač. Kao, općenito, svi ostali iz ove recenzije. Interfejs dtSearch je prilično jednostavan, ali neki prozori ili kartice su pomalo preopterećeni elementima, što ga čini teškim za korištenje. Ali u stvarnosti nema posebnih poteškoća. Jedina zaista neugodna stvar je nedostatak softverske podrške za ruski jezik (unatoč činjenici da program može pretraživati ​​dokumente na nekoliko jezika, njegovo sučelje je isključivo engleski).

    Ali dtSearch je jedan od rijetkih programa koji mogu indeksirati web stranice na korisnički specificiranu "dubinu" (iako, uzimajući u obzir "dodatnu kupovinu" dtSearch Spider kompleta dodataka). Ovo je dodatak podršci disk datoteka različitih tekstualnih formata i e-poruka iz Outlook poštanskog sandučeta. Istovremeno, program ne može raditi s bazama podataka, koje su tako ukusan zalogaj za pretraživače zbog velike količine informacija sadržanih u njima i njihove široke distribucije u kompanijama, a time i u korporativnim mrežama. Pokazalo se da je brzina indeksiranja dtSearch dokumenata na odgovarajućem nivou. Gledajući unaprijed, reći ću da se ovaj program nosio sa indeksiranjem zadate količine informacija na nivou sa drugim konkurentom - iSYS -om i s njim podijelio drugo mjesto na listi najbržih sistema. dtSearch je indeksirao test 20 gigabajta informacija za 6 sati i 13 minuta, kreirajući indeks od 7,9 GB za potrebe naknadnog pretraživanja.

    Što se tiče mogućnosti pretraživanja, ovdje su one na odgovarajućem nivou. Prvo, dtSearch ima morfološko pretraživanje (traženje riječi u svim njenim morfološkim oblicima). Koristeći ovu priliku, oslobađate se, recimo, misli poput “u kom slučaju je određena riječ korištena u dokumentu koji mi je trebao?” Upotreba morfološkog pretraživanja je gotovo uvijek opravdana, pa bi trebala biti prisutna u svakom profesionalnom pretraživaču.

    Pretraga po zvuku je nestandardna funkcija čak i za profesionalne pretraživače. Njegova suština je da će program tražiti riječi koje zvuče isto kao i riječ koju ste unijeli. A što je najbolje, ova funkcija radi i za ruski jezik! Na primjer, kada unesete riječ "uho" u upit za pretraživanje, vidjet ćete ne samo riječi "uho", već i "uho" kao rezultat.

    Pretraživanje s ispravljanjem grešaka je vrlo važna funkcija. Koristi se za traženje riječi koje sadrže sintaktičke greške - to mogu biti ili greške u kucanju ili greške u dokumentima dobivenim korištenjem sistema za prepoznavanje znakova, na primjer. Jednostavan primjer - tražite riječ tastatura. Neki dokument sadrži riječ „tastatura“, očigledno je da je to zapravo riječ „tastatura“, osoba je samo napravila grešku pri kucanju. Dakle, pretraga za ispravljanje grešaka će otkriti i uključiti dokument sa riječju "tastatura" u rezultat. Postoji i postavka u dtSearch koja vam omogućava da odredite stepen mogućih pogrešnih znakova.

    Pretražujte koristeći sinonime. Ova funkcija koristi listu sinonima za različite riječi. Tako, na primjer, unošenjem riječi "brzo", program će pronaći i riječi "velika brzina" i druge koje su sinonimi za riječ "brzo", ako su, naravno, prisutne na listi sinonima . Program dtSearch ne isporučuje gotovu listu sinonima, međutim, moguće je koristiti liste na Internetu (prema tome, potrebna je veza, što nije uvijek zgodno), ili možete kreirati vlastitu listu sinonima .

    Pored navedenih mogućnosti, dtSearch može pretraživati ​​pomoću fraza koje se sastoje od riječi povezanih logičkim operacijama. Svakoj riječi u upitu može se dodijeliti vlastita "težina", odnosno značaj. Korisna opcija je korištenje rječnika koji se sastoji od nevažnih riječi kako ih ne biste uzimali u obzir prilikom pretraživanja, ali je i ovaj rječnik prazan i morate ga sami popuniti.

    Dalje, pogledajmo mogućnosti programa pri radu na mreži. Zapravo, dtSearch ne nudi nikakve posebne mogućnosti za rad sa mrežom. Međutim, sasvim je moguće koristiti ga na mreži. Alternativno, možete kreirati neku vrstu indeksa i staviti ga u javni (dijeljeni) folder. Sam program se može instalirati na računar svakog korisnika, ili se može staviti u folder otvoren za javni pristup, a prečice se mogu kreirati na poseban način za svakog korisnika posebno, koristeći parametre komandne linije, čija je namena opisana u datoteci pomoći koju ste dobili uz program. Također je moguće automatski instalirati program na mrežu pomoću MSI datoteke. Ovo će uzeti u obzir postavke za svakog povezanog korisnika.

    Generalno, to je dobar program iz kategorije profesionalnih pretraživača. Možda se kvalificira za dobru ocjenu, ali stjecanje povjerenja i poštovanja korisnika možda neće biti lako za dtSearch zbog određenih faktora (nije sve glatko sa sučeljem, ruski korisnici su uskraćeni, nema svijetlih karakteristika za rad s mrežom) . Što se tiče direktnog traženja dokumenata, program nije imao problema sa ruskim tekstom. Kako ih nije bilo sa deklarisanom morfologijom, ili sa nejasnom pretragom. Sistem je sasvim adekvatno pronašao potrebne dokumente kako jednostavnim upitom od jedne riječi tako i korištenjem par pasusa ili dokumenta kao ključne fraze.

    Zvanična stranica:
    Veličina distribucije: 23 Mb Bloodhound Prof Deluxe

    Na osnovu imena možete pretpostaviti da u ovom programu postoji podrška za ruski jezik. Ovo je već lepo. Što se tiče interfejsa, generalno gledano, pomalo je neobičan, ali je po izgledu veoma atraktivan. Druga stvar je pogodnost. Vrlo kontroverzan kriterij, ali ipak, vjerovatno, višeprozorsko rješenje nije najuspješnija opcija (zahtjev se unosi u jedan prozor, rezultat se prikazuje u drugom i slično).

    Snoop koristi iste indekse za brzu pretragu, ali indeksiranje je mnogo sporije od ostalih programa. Ovo je vrlo čudno, pogotovo ako se uzme u obzir da su njegove mogućnosti za obradu upita pretraživanja vrlo slabe, pa samim tim struktura indeksa nije složena. Najvjerovatnije je to zbog neoptimiziranih algoritama. Ovaj program se pokazao kao jasan autsajder u indeksiranju i brzini pretraživanja: vrijeme utrošeno na kreiranje indeksa bilo je šest puta duže od istog dtSearch-a i iSYS-a. Indeksiranje 20 gigabajta tekstova za krvoslednika rezultiralo je 38 sati i 46 minuta rada. A stvoreno „područje pretraživanja“ zauzimalo je istu veličinu na tvrdom disku kao i originalni podaci s malim minusom - 19 gigabajta.

    Bloodhound se može predstaviti kao alternativa standardnoj pretrazi u Windowsu; malo je vjerovatno da će biti sposoban za više. Na činjenicu da je primarni zadatak Snoopera najjednostavnija pretraga datoteka ukazuje ne samo mali broj funkcija za analizu teksta upita za pretraživanje i napredno pretraživanje po atributima datoteke, već čak i prozor rezultata koji pruža direktne veze do pronađene datoteke, kao i na foldere koji sadrže ove datoteke. Prozor rezultata nije previše informativan u smislu da možete pročitati cijeli pronađeni fajl samo pokretanjem, odnosno nema ugrađeni preglednik datoteka. Ali prikazuje se izvod iz datoteke u kojoj je tražena riječ pronađena; općenito, ova shema prikaza vrlo podsjeća na internet pretraživače.

    Govoreći o specifičnim mogućnostima za obradu upita za pretraživanje, vrijedno je napomenuti da ne postoji takva stvar kao što je "tekst za pretraživanje"; maksimum koji se može pretraživati ​​je fraza, makar samo zato što nema višerednog polja za unos teksta. Međutim, možete analizirati unesenu frazu, a Snoop nam nudi standardni set pretraživanja ovdje: logičke operacije, pretraživanje maske i pretraživanje citata... ne puno. Program sadrži neke rudimente morfološke pretrage, ali je vjerovatno toliko grub da najvjerovatnije ometa ispravan rad (tokom testiranja uočeno je mnogo grešaka sa pogrešnom upotrebom morfologije).

    Ali program vam omogućava da odredite atribute datoteke prilikom pretraživanja (datum dokumenta, naziv datoteke, naziv mape), a u ovim upitima možete koristiti i isti skup pretraživanja. Takođe možete tražiti slova navodeći parametre (Od, Predmet..., itd.).

    Dakle, shvatili smo samu pretragu, šta je još zanimljivo u programu, za koji je dobio toliko nagrada, prema informacijama sa službene stranice? Teško je reći šta je tu tako posebno; najvjerovatnije je sučelje Bloodhounda atraktivno (baš po izgledu, da ne spominjemo upotrebljivost).

    Operacije sa indeksima su vrlo standardne; zgodna karakteristika je mogućnost ažuriranja indeksa prema rasporedu. Pored toga, indeksi se mogu koristiti i na mreži. Od sada nam treba više detalja.

    Unatoč primitivnosti upita za pretraživanje, program se može koristiti za pretraživanje datoteka, pa se njegova upotreba može opravdati u mrežama. Iako je ovo natezanje, budući da je u velikoj mreži prioritet brzo traženje podataka pomoću složenih upita za pretraživanje zbog ogromne količine informacija - a očito postoje problemi sa brzinom pretraživanja i programa. Moram reći da je rad s mrežom u Izhishiki osmišljen kako treba. Posebna aplikacija je dizajnirana posebno za to - Bloodhound Server. Radi na isti način kao i jednostavno Snooper (imaju jednu tražilicu), samo za dokumente koji se nalaze na centralnom serveru ili na zajedničkim resursima na korporativnoj mreži. Snooper Server kreira nove indekse na zajedničkim resursima ili koristi prethodno kreirane. Svaki korisnik korporativne mreže može se povezati na Search Server i koristiti ga za pristup bilo kojem dokumentu (koji se nalazi u trenutnom indeksu) koristeći Internet pretraživač. Slažem se, ova shema je izuzetno zgodna: ispada da se datoteke na vašoj vlastitoj mreži mogu pretraživati ​​na isti način kao i informacije na Internetu putem, na primjer, Googlea.

    Procjenjujući sve prednosti i nedostatke ovog programa, nameće se zaključak da njegove mogućnosti najvjerovatnije nisu dovoljne za korporativne mreže (uprkos dobroj organizaciji rada sa mrežom), ali za kućni računar ili čak za kućnu mrežu jesu. , u principu, , moglo bi se pojaviti. Iako ni brzina rada ni mogućnosti pretraživanja ne ulijevaju optimizam...

    Zvanična web stranica na ruskom:
    Veličina distribucije: 6 MbGoogle Desktop Search + GDS Enterprise

    Naravno, nismo mogli zanemariti tako poznatog programera. Ime Google već govori mnogo. Ljudi koji godinama koriste najmoćniji internet pretraživač zasigurno će se bez ikakve sumnje odlučiti da instaliraju upravo ovaj pretraživač na svoje računalo. Pomislite samo: Google na svom kućnom računaru! Međutim, bez prepuštanja provokacijama sa naširoko promoviranim brendom, pokušajmo trezveno, i što je najvažnije objektivno, razmotriti mogućnosti „desktop“ tražilice iz Googlea.

    Prva stvar koja vam upada u oči je nedostatak vlastite školjke za program. Google Desktop Search se i dalje nalazi u prozoru pretraživača, odnosno cijeli interfejs desktop verzije je naslijeđen od softvera starijeg Internet brata. Da li je ovo dobro ili loše je sporno: neki ljudi vole minimalizam u dizajnu ovog pretraživača, dok drugi žele da vide punopravnu aplikaciju ispunjenu svim vrstama dugmadi i tako dalje.

    Šta vam upada u oči odmah nakon dizajna? I činjenica da ovaj isti Google Desktop Search počinje da indeksira sve na računaru, bez ikakvog zahtjeva! A ono što je najzanimljivije je da je nemoguće odabrati putanje za indeksiranje koristeći Google Desktop Search. Morat ćete preuzeti poseban program (TweakGDS), koji će vam omogućiti da donekle proširite postavke Google Desktopa, uključujući navođenje mjesta potrebnih za indeksiranje. Iako, dok sve ovo shvatite, on će već indeksirati standardni čvrsti disk, tako da će ova postavka vjerojatnije biti potrebna kada radite s velikim količinama podataka, što je vrlo važno kada se koristi u korporativnim mrežama (Enterprise verzije) . Međutim, nije činjenica da će nakon preuzimanja TweakGDS-a vaši problemi biti riješeni. Na kraju krajeva, za rad je potreban Microsoft .NET Framework i Microsoft Scripting Runtime. Aha... instalacija, kao i pristup postavkama, mogli su biti jednostavniji, iako programeri vjerovatno mogu razumjeti: zašto pisati nešto novo kada postoji gotova tražilica, portovana na lokalni računar i pustiti korisnik „uživaj“, a poznato ime će od „ovoga“ napraviti još jedno remek-delo. Hajde, završimo ovu lirsku digresiju i pređimo na potragu.

    Što se tiče analize upita za pretraživanje i isporuka rezultata, ovdje je sve apsolutno identično Googleu na Internetu: isti sistem za prikazivanje rezultata, isti standardni skup logičkih operacija za upite za pretraživanje. Općenito, Google Desktop Search, kao i prethodni program, namijenjen je isključivo traženju datoteka - on, naravno, nema interni preglednik za te datoteke. Broj formata datoteka koje podržava Google Desktop Search je sasvim dovoljan, a lijepo je i to što pretražuje posjećene Internet stranice, uzimajući podatke iz keša. Brzine pretraživanja i indeksiranja su sasvim prihvatljive. Istina, za kućnu upotrebu. Google Desktop Search se izborio sa impresivnih 20 gigabajta tekstova za 8 sati i 17 minuta. Provođenje nekoliko dana na obradu informacija iz korporativne mreže velikog preduzeća nije nešto što bi bilo koji sistemski administrator želio da radi. Pozitivna strana: veličina kreiranog indeksa bila je na istom nivou (4,5 GB) kao i drugi pretraživač testiran u ovoj recenziji - SearchInform.

    Velika prednost (ili nedostatak - vi odlučujete) Google Desktop Search-a je ta što podržava dodatke, što može mnogo toga promijeniti na bolje. Druga stvar je što povezivanje dodataka i njihovo postavljanje toliko komplicira zadatak instaliranja tražilice da se počinjete pitati je li sve to potrebno kada možete instalirati normalan, punopravni program u kojem će već sve biti prisutno. Uostalom, da biste koristili svaku funkciju, morat ćete instalirati novi dodatak. Čak i da bi program u potpunosti radio s arhivama, potreban je poseban gadget. Fascinantno je i zavodljivo što su svi ovi dodatni moduli besplatni. Međutim, ako ne uzmete u obzir desktop verziju tražilice, onda kompetentna konfiguracija GDS Enterprisea možda neće biti u vašoj moći - uostalom, nije uzalud što stručnjaci iz Googlea nude svoje usluge za postavljanje vlastitog softver za vašu mrežu za samo 10.000 USD.

    Ako prođete kroz proceduru postavljanja i instalacije (ili platite 10.000 USD timu za brzu reakciju iz Google-a), shvatit ćete da je složenost instalacije više nego nadoknađena vrlo fleksibilnim postavkama kada se koriste u korporativnim mrežama. Važan aspekt korištenja Google Desktopa na korporativnoj mreži je korištenje grupnih politika, koje omogućavaju postavljanje postavki za svakog korisnika.

    Da rezimiramo, najrazumnija upotreba ovog programa je kućni ili radni računar. Uostalom, za običan računar dovoljno je samo instalirati program - on će sam učiniti ostalo (neće vas ništa ni pitati).

    Međutim, Google Desktop Search Enterprise će biti prihvatljiv u slučajevima kada postoji hitna potreba za fleksibilnom konfiguracijom mrežne politike za korištenje tražilice, dok će mogućnost obrade upita za pretraživanje biti na drugom mjestu po važnosti, a po vremenu (ili novcu). ) utrošen na postavljanje programa biće na prvom mjestu.

    Zvanična stranica:
    Veličina distribucije uključujući TweakGDS: 1,2 MbCopernic Desktop Search

    Kliknite na sliku za uvećanje

    Sučelje programa izaziva izuzetno pozitivne emocije - sve je urađeno u skladu s općeprihvaćenim standardima, ništa suvišno, jednom riječju, ugodan dizajn. Za početnike, razumevanje interfejsa Copernic Desktop Search biće veoma lako. Iako je pomalo zbunjujuće to što su dizajneri jasno kreirali programsko sučelje uzimajući u obzir činjenicu da će program raditi u standardnoj Windows XP temi. Kada koristite klasičnu temu, program ne izgleda tako lijepo. Ali ovo je više stvar ukusa.

    Prilikom prvog pokretanja, program od vas traži da kreirate indekse za pretragu. Činilo se pomalo neuobičajenim da nakon odabira foldera za indeksiranje, program nije ponudio da se pritisne nijedno dugme, kao što je "Pokreni indeksiranje", a indeksiranje se nije pokrenulo automatski, tek tada se primijetilo da Copernic pokušava pokrenuti indeksiranje dok računar bio neaktivan. Morat ćete malo dublje kopati u opcije programa da biste sve ispravno konfigurirali. Treba napomenuti da postoje prilično široke mogućnosti za podešavanje automatskog kreiranja indeksa: ugrađeni planer, mogućnost indeksiranja dok je računar u stanju mirovanja, u pozadini, sa niskim prioritetom. Indeksiranje nije bilo prebrzo - 10 sati i 51 minut - ovo je sporije nego u drugim pretraživačima (osim Isle of Bloodhounda, ali Copernic je i dalje za red veličine brži od razvoja iSleuthHound Technologies.

    Sada o strukturi indeksa. Općenito, tu nema ništa posebno. Moguće je odabrati tipove datoteka, kako u općem, tako iu detaljnom obliku. Odnosno, u početku možete odabrati šta želite da indeksirate - dokumente, slike, video zapise, muziku. Na drugoj kartici prozora sa opcijama, moći ćete da odaberete određene tipove datoteka prema ekstenziji. Dodatno, možete konfigurirati indeks tako da, na primjer, slike manje od 16x16 ne budu indeksirane ili zvučne datoteke kraće od 10 sekundi ne budu indeksirane. Osim indeksiranja fajlova iz foldera, Copernic može raditi sa e-mailovima i kontaktima iz adresara Microsoft Outlook-a i Microsoft Outlook Express-a, a moguće je indeksirati Favorite i History iz Internet Explorera.

    Što se tiče mogućnosti pretraživanja, one su ovdje vrlo slabe. Tokom testova je čak otkriveno da program ne traži dokumente u txt i html formatima na ruskom jeziku, što vam omogućava da ih pronađete samo po naslovima, a ne po sadržaju. Jedina stvar koju program pruža za poboljšanje efikasnosti pretraživanja je korištenje standardnog skupa logičkih operacija, a čak i tada je ova karakteristika otkrivena eksperimentalno, jer nije dokumentovana. Inače, pomoć programa također nije u redu - dostupna je samo putem interneta, što je, vidite, vrlo nezgodno, a na Internetu nema previše informacija o pomoći. Očigledno, programeri su odlučili da jednostavno sučelje programa ne podrazumijeva prisutnost normalne pomoći. Nastavljajući razgovor o mogućnostima pretraživanja, treba napomenuti da, uprkos slaboj analizi upita, program pruža zanimljiv sistem pretraživanja - korisnik može odabrati vrstu datoteka (slike, video zapisi, muzika, itd.), ući u pretragu upit i odabir atributa specifičnih za odabranu vrstu datoteke. Na primjer, za zvučne datoteke, to mogu biti vrijednosti iz mp3 oznaka (izvođač, album, datum, itd.), Za slike, na primjer, možete odabrati njihovu veličinu (prema rezoluciji), općenito, svaka vrsta ima svoju vlastita podešavanja. Nakon traženja određene vrste datoteke, program će prikazati vrlo informativnu listu u prozoru s rezultatima, a ako vaš zahtjev uključuje datoteke drugih tipova, možete ih otvoriti klikom na određeni link.

    Posebno je vrijedno spomenuti prozor za prikaz rezultata. Ispod liste pronađenih datoteka prikazuje se sadržaj ovih datoteka (slična šema se često koristi u klijentima e-pošte). Istina, pregled teksta se može obaviti samo u izvornom formatu, a ne postoji način prikaza običnog teksta, što nije uvijek zgodno, jer otvaranje dokumenta u ovom slučaju oduzima više vremena. Ali, s obzirom na to da Copernic može pretraživati ​​slike i muziku, moguće je pregledati ove multimedijalne datoteke.

    Opisani su osnovni principi rada ovog programa, sada da vidimo šta nam Copernic Desktop Search može ponuditi za rad sa mrežom... U principu, možete gledati jako dugo, ali teško da ćete moći nešto vidjeti . Drugim riječima, ovaj program nije trebao biti zasnovan na mreži. Copernic Desktop Search je isključivo kućni pretraživač.

    Očigledno, jedina (najlogičnija) primjena ovog programa je kućni računar. Ovdje će se u potpunosti nositi sa svim jednostavnim korisničkim upitima za pretraživanje koji se sastoje od jedne ili dvije riječi, pronaći će potrebne informacije i podjelu pretraživanja po tipu datoteke i podršku za multimedijske datoteke zajedno s pozadinskim indeksiranjem u režimu niskog prioriteta, zajedno s ugodnim interfejs, samo daju snagu programu da stekne poverenje među neiskusnim korisnicima.

    Službena stranica
    Veličina distribucije: 2,6 MbISYS Desktop

    Kliknite na sliku za uvećanje

    Veoma moćan program. Po stepenu opremljenosti sa svim vrstama funkcija, on je negdje blizu sljedećeg SearchInform sistema za pretraživanje na listi. Štaviše, veličina instalacione datoteke je veća od 40Mb! Teško je reći šta bi se moglo ugurati u takve dimenzije, jer isti SearchInform, sa sličnom funkcionalnošću, zauzima 15Mb.

    Proces instalacije ovdje također nije baš prijatan, odnosno čak ni proces instalacije. Čak i prije preuzimanja programa, od vas će se tražiti da se registrujete, inače nema načina. Zatim, interfejs. Urađen je jako lijepo, ništa nepotrebno ne upada u oči, međutim, ovo su utisci osobe koja je već donekle navikla. Početniku neće biti lako shvatiti gdje i šta se nalazi, gdje kliknuti i gdje na kraju potražiti. Preporučljivo je pročitati pomoć prije početka rada - uštedjet ćete mnogo živaca i vremena. Uz sve ostalo je i potpuni nedostatak podrške za ruski jezik u programu. Nije dobro. Osim toga, prozori ovdje nisu preopterećeni kontrolama, ali smo to morali platiti multimodulima i korištenjem dodatnih prozora. Na primjer, upiti za pretraživanje se unose pokretanjem jednog programa, a upravljanje indeksom se vrši pomoću drugog programa. Ovdje se također unose upiti za pretraživanje u posebnim iskačućim prozorima. Teško je reći šta je bolje - preopterećeno sučelje ili sveprisutni višeprozori; prije, to je stvar ukusa.

    Kada je u pitanju kreiranje indeksa, program pruža mogućnosti za pojednostavljenje procesa postavljanja opcija za novi indeks. Ove karakteristike uključuju nekoliko gotovih šablona za kreiranje indeksa za fasciklu „Moji dokumenti“, „Pošta“, „Pošta i dokumenti“, „Specifična fascikla“, „Folder sa izborom tipova datoteka“ itd. Takvi predlošci pojednostavljuju kreiranje indeksa u prvoj fazi. Uslužni program za rad sa indeksima nema baš dobro sučelje, što je zastrašujuće s nekom složenošću (ovo je vrlo subjektivna procjena, da budem iskren), međutim, ako pogledate, pruža mnogo korisnih opcija i općenito , njegova upotreba ne izaziva velike poteškoće. ISYS Desktop može indeksirati podatke iz različitih izvora podataka, a također pruža mnoge fleksibilne postavke za takvo indeksiranje. Dodatne karakteristike indeksiranja uključuju: podršku za SQL, FTP, TRIM Context, WORLDOX 2002, skripte. Prilikom kreiranja indeksa, ako ste odabrali stavku "Folder sa izborom tipova datoteka", imate mogućnost da ručno odaberete tipove datoteka za indeksiranje (po ekstenziji). Mora se reći da jednostavno postoji ogroman broj podržanih tipova datoteka, ali nećete moći dodati svoj tip (ekstenziju) na postojeću listu. Također možete primijetiti prisustvo planera indeksiranja. Kreiranje indeksa i obrada 20 gigabajta informacija ISYS Desktop-u je trajalo 6 sati i 13 minuta, što je na kraju pokazalo dobro vrijeme i veličinu kreirane datoteke - 7,9 GB.

    Mogućnosti pretraživanja ovog programa su prilično dobre. Ono što se koristi u ISYS-u mnogo je moćnije od konvencionalne podrške za logičke operacije. Među naprednim mogućnostima pretraživanja, program nudi upotrebu sinonima i filtera za sortiranje (po putanji, nazivu i datumu kreiranja datoteke). Skup logičkih operatora je nešto širi od standardnog skupa. Osim logičkih operacija, program vam omogućava rad s mnogim drugim operatorima, koji u principu mogu zamijeniti neke vrste pretraživanja; na primjer, pretraživanje s raščlanjivanjem može se u potpunosti zamijeniti upotrebom posebnih operatora. Bio sam jako iznenađen što program nema pretragu pomoću morfologije. Ovo je ozbiljan propust, jer je efikasnost pretraživanja znatno poboljšana upotrebom morfološke analize. Osim toga, ne postoji lista značajnih riječi, ali postoji opsežna lista beznačajnih riječi. Najavljene su i funkcije pretraživanja kao što su "približna pretraga" i "heuristička analiza".

    ISYS pruža izbor između nekoliko tipova upita za pretragu, odnosno vizuelnih. To se radi pomoću različitih tipova prozora za unos upita za pretraživanje, međutim, u stvari, niti jedan prozor ne dozvoljava korištenje tehnologija koje nisu gore navedene.

    Rezultati pretrage su vrlo informativni i prikazuju se kao lista dokumenata sortiranih po relevantnosti. U nastavku se prikazuje pregled odabranog dokumenta. Za razliku od Copernic Desktop Search-a, pregled je ovdje dostupan samo u obliku običnog teksta; nije bilo moguće prikazati dokumente u njihovom izvornom formatu, bilo da je riječ o Wordu, Html-u ili PDF-u, iako to, u principu, nije previše kritično. Program vam omogućava da pronađene dokumente podijelite u grupe prema određenim kriterijima (podrazumevano su podijeljeni po relevantnosti). Takođe možete pregledati već pronađene dokumente odabirom pojedinačnih fascikli (ovo je zgodno kada rezultat daje veoma veliki broj dokumenata).

    Korišćenje programa na korporativnoj mreži je takođe vrlo opravdano, jer pruža dobre mogućnosti za organizovanje pretraživanja mreže. Sistem pretraživanja se zasniva na kreiranju javnog indeksa koji sadrži indeksirane podatke iz javno dostupnih onlajn izvora.

    U stvari, program iz ISYS-a je vrijedan pažnje, barem upoznavanja s njim. Ovaj program je zreo projekt sa ogromnim brojem funkcija (ne uvijek i ne trebaju svima, naravno, ali ipak). Šanse da će program imati neka poboljšanja u pogledu obrade upita za pretraživanje su nepoznate, ali se trenutno može preporučiti za gotovo univerzalnu upotrebu. A s obzirom na to da je još uvijek pretežak za kućne sisteme, glavna mjesta za njegovu instalaciju su korporativne mreže.

    Zvanična stranica:
    Veličina distribucije: 40 MbSearchInform

    Kliknite na sliku za uvećanje

    Vjerovatno ne vrijedi odmah početi s opisom SearchInform interfejsa. Prvo bismo trebali opisati proces instalacije, odnosno jedan od njegovih detalja: ne možete instalirati program bez internet veze. Činjenica je da prije prvog pokretanja program zahtijeva registraciju korisnika (besplatno) i šalje sve unesene podatke na server. Očigledno, programeri su morali poduzeti takve mjere u borbi protiv piraterije, ali to nije imalo pozitivan učinak na jednostavnost instalacije.

    Sučelje programa je dizajnirano u skladu sa svim općeprihvaćenim pravilima, međutim, na prvi pogled je pomalo glomazno. Korišćenjem programa po prvi put, čini se da je previše komplikovano, ponekad nije lako zapamtiti u kom meniju ili na kojoj kartici se nalazi željena opcija, međutim, dužim korišćenjem sučelje više ne deluje tako strašno složeno . Glavna stvar je prvo pročitati certifikat.

    Nakon što ste malo razumjeli sučelje, možete početi kreirati indeks. Sam proces je vrlo jednostavan, a brzina indeksiranja, čak i na oko, znatno je veća od svih ostalih pretraživača u recenziji. Čisti brojevi testova pokazuju da je SearchInform duplo brži od dtSearch-a i iSYS-a u smislu brzine indeksiranja! Program je indeksirao dostavljene podatke u količini od 20 gigabajta u rekordnom vremenu od 3 sata i 17 minuta. A veličina kreiranog indeksa se pokazala najmanjih 4,4 GB - 100 megabajta manje od Google Desktop Searcha.

    Program podržava, pored običnih fajlova i foldera, i indeksiranje e-pošte, povezivanje i indeksiranje baza podataka (!) i drugih eksternih izvora (DMS, CRM), odmah prilikom indeksiranja možete odrediti rečnik za sprovođenje morfološke pretrage, kao i sve atribute mogu biti indeksirane datoteke. Nakon kreiranja indeksa, kada pokušate da izvršite prvu probnu pretragu dokumenata, možda ćete postati pomalo zbunjeni: "ovdje postoje dvije vrste pretraživanja, ali koja mi treba?" Kao što je ranije spomenuto, glavna stvar je pročitati pomoć, tada će sve postati jasno. Program zapravo može izvršiti dvije vrste pretraživanja - pretraživanje po frazi i traženje dokumenata sličnih sadržaju tekstu upita.

    Gore je dat opis svih glavnih funkcija za analizu upita pretraživanja, tako da ćemo sada navesti samo mogućnosti pretraživanja koje pruža ovaj program. Počnimo s pretraživanjem fraza: naravno, morfološko pretraživanje, pretraživanje citata, logičke operacije, pretraživanje raščlanjivanjem riječi (pretraga na početku riječi, na kraju, u srednjem dijelu ili potpuno podudaranje), mješovito pretraživanje citata ( kada sve riječi iz upita moraju biti prisutne u dokumentu, ali ne nužno po unesenom redoslijedu), pretraživanje s ispravljanjem grešaka, korištenjem sinonima, „pretraga gotovo citata“ (traži unesenu frazu kao citat, ali mogu i druge riječi biti prisutan između unesenih riječi) itd. Neke od navedenih opcija imaju svoje specifične postavke. Osim toga, moguće je koristiti rječnik nevažnih riječi, a program već ima gotovu listu ovih riječi; možete koristiti i rječnik prioritetnih riječi za pretraživanje (naravno, morat ćete ga popuniti sebe).

    Ovdje smo, u principu, ukratko pregledali sve glavne karakteristike pretraživanja fraza.

    Idemo dalje na razmatranje karakteristika ovog programa - traženje sličnih dokumenata. Programeri tvrde da ovo nipošto nije jednostavna pretraga teksta, već je upravo "traga za sličnim" - upravo tako je svuda opisano, ali dobro, možete to nazvati kako god želite - glavna stvar je . Brza pretraga na Internetu može brzo otkriti da je takozvana "slična pretraga" novi razvoj u oblasti analize teksta. Ovaj sistem vam omogućava da pronađete tekstove koji su slični u semantičkom sadržaju. Najprijatnije je bilo to što se nakon provođenja testnih upita za pretraživanje pokazalo da se teorija prilično dobro poklapa s praksom! Program zapravo traži dokumente sličnog sadržaja i prikazuje ih na listi, sortirajući ih po postotku sličnosti.

    Dalje, pogledajmo šta SearchInform (posebno njegova korporativna verzija SearchInform Corporate) nudi za rad na korporativnoj mreži. Postoje dvije vrste aplikacija: strana servera i strana korisnika. Serverski dio samostalno obrađuje navedene indekse, a korisnici ih mogu koristiti za pretraživanje, ovisno o pravima pristupa koja su im dodijeljena. Korisnici se mogu konfigurisati automatski koristeći Windows naloge (profesionalno rečeno, SearchInform koristi NTFS Windows autentifikaciju) ili ručno (korisnici će se morati posebno dodati). Svakom korisniku se može dozvoliti ili zabraniti pristup određenim indeksima, a korisnici se također mogu kombinirati u grupe. Općenito, SearchInform-ova podešavanja za rad na mreži su ispred Google-a u pogledu fleksibilnosti, a Ishhound Server-a u smislu pogodnosti i jednostavnosti.

    Zvanična stranica:
    Veličina distribucije: 14,7 Mb Poređenje brzina indeksiranja

    Sistem pretraživanjaVrijeme indeksiranjaVeličina indeksa
    Bloodhound Prof Deluxe 4.538 sati 46 minuta19 GB
    Isys Desktop 7.06 sati 13 minuta7,9 GB
    DtSearch 7.06 sati 3 minute8,6 GB
    Google Desktop Search Enterprise8 sati 17 minuta4,5 GB
    Copernic Desktop Search *10 sati 51 minuta7 GB
    SearchInform 1.5.023 sata 17 minuta4,4 GB

    * Većinu dokumenata.html i .txt koji sadrže ruski tekst, iako su bili indeksirani, bilo je nemoguće pronaći osim po njihovim imenima.

    Svi programi su vrijedni pažnje.

    Na osnovu testova i pažljivog pregleda svakog programa predstavljenog u pregledu, mogu se izvući određeni zaključci. Dakle, Google Desktop Search Copernic Desktop Search je sasvim prikladan za neiskusnog korisnika kao sistem za pretraživanje kućnih informacija. Dobro se nose s jednostavnim upitima, ne preopterećuju korisnika postavkama i, štoviše, potpuno su besplatni. Google-ov pokušaj da uđe na tržište korporativnih pretraživača još nije previše opravdan: da bi ispravno funkcionisao, program mora biti opremljen dodatnim modulima, a nije ga lako postaviti. Stoga, samorazumljivi nazivi Desktop Search, Copernic i Google zadržavaju iza sebe nišu "desktop" pretraživača.

    Istina, moćnija rješenja - dtSearch, iSYS i SearchInform također nisu sigurna i nude korisnicima svoje "desktop" verzije. Ali po razumnoj cijeni, za razliku od besplatnog softvera iz Googlea i Copernica. Naravno, morate platiti snagu, brzinu i funkcionalnost. Ali glavni fokus programera dtSearch, iSYS i SearchInform je, naravno, na korporativnom sektoru. Umrežavanje, funkcionalnost, indeksiranje i brzina pretraživanja ono su što ove proizvode razlikuje od njihovih “konkurenta”. Na osnovu rezultata testiranja utvrđen je favorit - SearchInform. Program pruža mogućnost pretraživanja sličnih dokumenata, ima najbrže indeksiranje i brzinu pretraživanja te ima dobar skup funkcija.

Najbolji članci na ovu temu