Zabrana indeksiranja robota txt. Skrivanje poveznica sa skriptama

03.05.2019 Sigurnost

Svrha ovog vodiča je pomoći webmasterima i administratorima da koriste robots.txt.

Uvod

Robot Exception Standard je inherentno vrlo jednostavan. Ukratko, funkcionira ovako:

Kada usklađeni robot posjeti web-mjesto, prvo traži datoteku pod nazivom “/robots.txt”. Ako se takva datoteka pronađe, Robot u njoj traži upute koje zabranjuju indeksiranje nekih dijelova stranice.

Gdje staviti svoju robots.txt datoteku

Robot jednostavno traži URL "/robots.txt" na vašoj web-lokaciji, na kojoj se nalazi stranica u ovom slučaju Je određeni host na određenom portu.

URL web-mjesta	Url robots datoteka.txt
http://www.w3.org/	http://www.w3.org/robots.txt
http://www.w3.org:80/	http://www.w3.org:80/robots.txt
http://www.w3.org:1234/	http://www.w3.org:1234/robots.txt
http://w3.org/	http://w3.org/robots.txt

Na web mjestu može postojati samo jedna datoteka "/robots.txt". Na primjer, ne biste trebali stavljati svoju robots.txt datoteku u prilagođene poddirektorije - u svakom slučaju, roboti ih tamo neće tražiti. Ako želite biti u mogućnosti stvoriti robots.txt datoteke u poddirektorijumima, onda vam je potreban način da ih programski prikupite u jednu datoteku robots.txt koja se nalazi u korijenu vaše stranice. Umjesto toga možete koristiti.

Zapamtite da su URL-ovi osjetljivi na velika i mala slova i naziv datoteke “/robots.txt” mora biti napisan u potpunosti malim slovima.

Netočna lokacija robots.txt
http://www.w3.org/admin/robots.txt
http://www.w3.org/~timbl/robots.txt	Datoteka se ne nalazi u korijenu stranice
ftp://ftp.w3.com/robots.txt	Roboti ne indeksiraju ftp
http://www.w3.org/Robots.txt	Naziv datoteke nije malim slovima

Kao što vidite, datoteka robots.txt treba biti smještena isključivo u korijenu stranice.

Što napisati u datoteku robots.txt

Datoteka robots.txt obično je napisana nešto poput:

Korisnički agent: *
Zabraniti: / cgi-bin /
Disallow: /tmp/
Disallow: / ~ joe /

U ovom primjeru zabranjeno je indeksiranje tri imenika.

Imajte na umu da je svaki direktorij naveden u zasebnom retku - ne možete napisati "Disallow: / cgi-bin / / tmp /". Također ne možete podijeliti jednu naredbu Disallow ili User-agent u nekoliko redaka, jer prijelom reda se koristi za odvajanje instrukcija jedne od druge.

Ne mogu se koristiti ni regularni izrazi i zamjenski znakovi. Zvjezdica (*) u izjavi User-agent označava bilo kojeg robota. Upute poput "Disallow: * .gif" ili "User-agent: Ya *" nisu podržane.

Konkretne upute u robots.txt ovise o vašoj web-lokaciji i onome što želite blokirati od indeksiranja. Evo nekoliko primjera:

Zabranite indeksiranje cijele stranice od strane svih robota

Korisnički agent: *
Zabraniti: /

Dopusti svim robotima da indeksiraju cijelo web-mjesto

Korisnički agent: *
Zabraniti:

Ili možete jednostavno stvarati prazna datoteka"/Robots.txt".

Zatvorite samo nekoliko direktorija iz indeksiranja

Korisnički agent: *
Zabraniti: / cgi-bin /
Disallow: /tmp/
Disallow: / privatno /

Zabrani indeksiranje stranice samo za jednog robota

Korisnički agent: BadBot
Zabraniti: /

Dopusti indeksiranje web mjesta za jednog robota i zabrani sve ostale

Korisnički agent: Yandex
Zabraniti:

Korisnički agent: *
Zabraniti: /

Zabrani indeksiranje svih datoteka osim jedne

Ovo nije lako jer ne postoji izjava “Allow”. Umjesto toga, možete premjestiti sve datoteke osim one kojoj želite dopustiti indeksiranje u poddirektorij i zabraniti njeno indeksiranje:

Korisnički agent: *
Disallow: /docs/

Ili možete odbiti sve datoteke zabranjene za indeksiranje:

Korisnički agent: *
Disallow: /private.html
Zabraniti: /foo.html
Disallow: /bar.html

Bilo koja stranica na stranici može se otvoriti ili zatvoriti radi indeksiranja tražilicama. Ako je stranica otvorena, tražilica je dodaje u svoj indeks, ako je zatvorena, onda je robot ne posjećuje i ne uzima u obzir Rezultati pretraživanja.

Prilikom izrade stranice važno je na programskoj razini zatvoriti sve stranice od indeksiranja koje iz bilo kojeg razloga ne bi smjele vidjeti korisnici i tražilice.

Ove stranice uključuju administrativni dio stranice (admin panel), stranice s raznim servisnim informacijama (na primjer, s osobnim podacima registriranih korisnika), stranice s višerazinskim obrascima (npr. složenih oblika registracija), obrasci Povratne informacije itd.

Primjer:
Korisnički profil na forumu o tražilice ah tražilice.

Također je obavezno zatvoriti iz indeksiranja stranice čiji se sadržaj već koristi na drugim stranicama, a takve se stranice nazivaju duplikatima. Potpuni ili djelomični duplikati uvelike pesimiziraju stranicu jer povećavaju količinu nejedinstvenog sadržaja na stranici.

Kao što vidite, sadržaj na obje stranice se preklapa. Stoga su stranice kategorija na WordPress stranicama zatvorene od indeksiranja ili se na njima prikazuju samo nazivi postova.

Isto vrijedi i za stranice s oznakama – takve se stranice često nalaze u strukturi WordPress blogova. Oblak oznaka olakšava navigaciju web-mjestom i omogućuje korisnicima da brzo pronađu informacije od interesa. Međutim, one su djelomične duplikate drugih stranica, što znači da se moraju zatvoriti iz indeksiranja.

Drugi primjer je trgovina na CMS OpenCart.

Stranica kategorije proizvoda http://www.masternet-instrument.ru/Lampy-energosberegajuschie-c-906_910_947.html.

Stranica proizvoda obuhvaćenih popustom http://www.masternet-instrument.ru/specials.php.

Ove stranice imaju sličan sadržaj jer sadrže mnoge iste proizvode.

Posebno kritično za duplicirani sadržaj različite stranice stranica pripada Googleu. Po veliki broj duplikati u Googleu, možete zaraditi određene sankcije do privremenog isključenja stranice iz rezultata pretraživanja.

Drugi slučaj kada se sadržaj stranica ne bi trebao "prikazati" tražilici su stranice s nejedinstvenim sadržajem. Tipičan primjer su upute za lijekove u internetskoj ljekarni. Sadržaj na stranici s opisom lijeka http://www.piluli.ru/product271593/product_info.html nije jedinstven i objavljen je na stotinama drugih stranica.

Gotovo ga je nemoguće učiniti jedinstvenim, budući da je prepisivanje ovako specifičnih tekstova nezahvalan i zabranjen zadatak. Najbolje rješenje u tom slučaju stranica će biti zatvorena od indeksiranja ili će biti napisano pismo tražilicama sa zahtjevom da budu lojalni nejedinstvenom sadržaju sadržaja koji se iz ovog ili onog razloga ne može učiniti jedinstvenim.

Kako blokirati indeksiranje stranica

Klasični alat za zatvaranje stranica iz indeksiranja je datoteka robots.txt. Nalazi se u korijenskom direktoriju vaše stranice i kreiran je posebno da pokaže robotima za pretraživanje koje stranice ne bi trebali posjećivati. Ovo je normalno tekstualnu datoteku, koji možete uređivati u bilo kojem trenutku. Ako nemate datoteku robots.txt ili ako je prazna, tražilice će indeksirati sve stranice koje pronađu prema zadanim postavkama.

Struktura datoteke robots.txt prilično je jednostavna. Može se sastojati od jednog ili više blokova (uputa). Svaka se instrukcija, pak, sastoji od dva retka. Prvi red se zove User-agent i definira koja tražilica treba slijediti ovu uputu. Ako želite onemogućiti indeksiranje za sve tražilice, prvi redak trebao bi izgledati ovako:

Ako želite zabraniti indeksiranje stranica samo za jednu tražilicu, na primjer, za Yandex, prvi redak izgleda ovako:

Drugi redak instrukcije zove se Disallow. Da biste zabranili sve stranice na web mjestu, napišite sljedeće u ovaj redak:

Da biste omogućili indeksiranje svih stranica, drugi red bi trebao izgledati ovako:

U retku Disallow možete odrediti određene mape i datoteke koje će se zatvoriti iz indeksiranja.

Na primjer, da biste zabranili indeksiranje mape slika i cijelog njenog sadržaja, napišite:

Kako bismo "sakrili" određene datoteke od tražilica, navodimo ih:

Korisnički agent: *
Zabraniti: /myfile1.htm
Zabraniti: /myfile2.htm
Zabraniti: /myfile3.htm

Ovo su osnovna načela strukture datoteke robots.txt. Oni će vam pomoći da zatvorite pojedinačne stranice i mape na vašoj web-lokaciji iz indeksiranja.

Drugi, manje uobičajen način zabrane indeksiranja je Robots meta tag. Ako želite zatvoriti stranicu od indeksiranja ili spriječiti tražilice da indeksiraju veze postavljene na nju, trebate upisati ovu oznaku u njezin HTML kod. Mora se postaviti u područje HEAD, prije oznake .</p> <p>Meta oznaka Robots ima dva parametra. INDEX je parametar odgovoran za indeksiranje same stranice, a FOLLOW je parametar koji dopušta ili zabranjuje indeksiranje linkova koji se nalaze na ovoj stranici.</p> <p>Da biste zabranili indeksiranje, umjesto INDEX i FOLLOW napišite NOINDEX odnosno NOFOLLOW.</p> <p>Stoga, ako želite zatvoriti stranicu od indeksiranja i spriječiti tražilice da razmatraju veze na njoj, morate dodati sljedeći redak svom kodu:</p> <blockquote><p><meta name=“robots” content=“noindex,nofollow”></p> </blockquote> <p>Ako ne želite sakriti stranicu od indeksiranja, ali trebate "sakriti" veze na njoj, meta tag Robots će izgledati ovako:</p> <blockquote><p><metaname=“robots” content=“index,nofollow”></p> </blockquote> <p>Ako, naprotiv, trebate sakriti stranicu od tražilice, ali u isto vrijeme uzeti u obzir veze, ova oznaka će izgledati ovako:</p> <blockquote><p><meta name=“robots” content=“noindex,follow”></p> </blockquote> <p>Većina modernih CMS-a pruža mogućnost zatvaranja nekih stranica od indeksiranja izravno s administrativne ploče web-mjesta. Time se izbjegava potreba za razumijevanjem koda i ručnim konfiguriranjem ovih parametara. Međutim, gore navedene metode bile su i ostale najuniverzalniji i najpouzdaniji alati za zabranu indeksiranja.</p> <p>Tehnički aspekti stvorene stranice ne igraju ništa manje <a href="https://bumotors.ru/hr/v-obektno-orientirovannyh-yazykah-programmirovaniya-peremennye-igrayut.html">važna uloga</a> za promociju web stranice u tražilicama nego njezin sadržaj. Jedan od najvažnijih tehničkih aspekata je indeksiranje stranice, odnosno određivanje područja stranice (datoteke i direktorije) koje roboti tražilice mogu, ali i ne moraju indeksirati. U te svrhe koristi se robots.txt - to jest <a href="https://bumotors.ru/hr/kak-udalit-zablokirovannye-faily-s-kompyutera-programmy-dlya-udaleniya-ne.html">posebna datoteka</a> koji sadrži naredbe za robote tražilice. <a href="https://bumotors.ru/hr/pravilnaya-nastroika-faila-podkachki-dlya-windows-7-fail-podkachki-kakoi-razmer.html">Ispravna datoteka</a> robots.txt za Yandex i Google pomoći će u izbjegavanju mnogih neugodnih posljedica povezanih s indeksiranjem web mjesta.</p><h3><b>2. Koncept datoteke robots.txt i zahtjevi za nju</b></h3><p>Datoteka /robots.txt namijenjena je da uputi sve pauke da indeksiraju <a href="https://bumotors.ru/hr/spisok-informacionnyh-baz-pust-chto-delat-oshibki-pri-sozdanii-bazy.html">informacijski poslužitelji</a> kako je definirano u ovoj datoteci, tj. samo one direktorije i datoteke poslužitelja koji nisu opisani u /robots.txt. Ova datoteka mora sadržavati 0 ili više zapisa koji su pridruženi jednom ili drugom robotu (kako je određeno vrijednošću polja agent_id) i naznačiti za svakog robota ili za sve odjednom što ih točno ne treba indeksirati.</p><p>Sintaksa datoteke omogućuje vam postavljanje zabranjenih područja indeksiranja, kako za sve tako i za određene robote.</p><p>Postoje posebni zahtjevi za datoteku robots.txt, nepoštovanje kojih može dovesti do pogrešnog čitanja tražilice od strane robota ili čak do nesposobnosti. <a href="https://bumotors.ru/hr/otkrytie-faila-vvod-dannyh-iz-faila-i-vyvod-v-fail.html">ove datoteke</a>.</p><p>Primarni zahtjevi:</p><ul><li>sva slova u nazivu datoteke moraju biti velika, odnosno moraju biti mala:</li><li>robots.txt - ispravan,</li><li>Robots.txt ili ROBOTS.TXT je pogrešan;</li><li>datoteka robots.txt mora biti generirana u <a href="https://bumotors.ru/hr/csv-fail-konvertirovat-v-xls-import-i-eksport-tekstovyh-failov-v.html">tekstualni format</a> Unix. Prilikom kopiranja ove datoteke na web-mjesto, ftp klijent mora biti konfiguriran na <a href="https://bumotors.ru/hr/kak-ubrat-tekstovyi-rezhim-na-windows-7-vklyuchenie-i-vyklyuchenie-testovogo.html">tekstualni način</a> dijeljenje datoteka;</li><li>datoteka robots.txt mora se nalaziti u korijenskom direktoriju stranice.</li> </ul><h3><b>3. Sadržaj datoteke robots.txt</b></h3><p>Datoteka robots.txt uključuje dva unosa: "User-agent" i "Disallow". Nazivi ovih zapisa ne razlikuju velika i mala slova.</p><p>Neke tražilice također podržavaju <a href="https://bumotors.ru/hr/kak-zapisat-razgovor-na-honor-7-video-zapis-razgovorov-na-androide.html">dodatni unosi</a>... Na primjer, Yandex tražilica koristi Host zapis za određivanje glavnog ogledala web-mjesta (glavno zrcalo stranice je stranica koja se nalazi u indeksu tražilica).</p><p>Svaki unos ima svoju svrhu i može se susresti nekoliko puta, ovisno o broju stranica i/ili direktorija koje treba zatvoriti iz indeksiranja i broju robota kojima pristupate.</p><p>Trebalo <a href="https://bumotors.ru/hr/faily-sozdannye-v-prilozhenii-access-imeyut-rasshirenie-kakoi-format-faila.html">sljedećem formatu</a> redovi datoteke robots.txt:</p><p><b>naziv_upisa</b>[neobavezno</p><p>razmaci] <b>: </b>[neobavezno</p><p>razmaci] <b>značenje</b>[neobavezni razmaci]</p><p>Da bi se datoteka robots.txt smatrala valjanom, najmanje jedna direktiva "Disallow" mora biti prisutna nakon svakog unosa "User-agent".</p><p>Potpuno prazna datoteka robots.txt je ekvivalentna bez robots.txt, što pretpostavlja da je cijelo web-mjesto dopušteno indeksirati.</p><h4><b>Unos korisničkog agenta</b></h4><p>Zapis "User-agent" mora sadržavati naziv robota za pretraživanje. U ovom unosu možete svakom konkretnom robotu reći koje stranice web-mjesta treba indeksirati, a koje ne.</p><p>Primjer zapisa "User-agent", gdje se poziv upućuje svim tražilicama bez iznimke i koristi se simbol "*":</p><p>Primjer zapisa "User-agent", gdje se poziv upućuje samo robotu tražilice Rambler:</p><p>Korisnički agent: StackRambler</p><p>Svaki robot tražilice ima svoje ime. Postoje dva glavna načina da ga prepoznate (ime):</p><p>na web stranicama mnogih tražilica postoji specijalizirani odjeljak "pomoć webmasteru", u kojem se često navodi ime robota za pretraživanje;</p><p>Kada se gledaju zapisi web poslužitelja, posebice kada se gledaju učitavanja datoteke § robots.txt, možete vidjeti mnogo imena u kojima su prisutni nazivi tražilica ili dio njih. Stoga samo trebate odabrati željeni naziv i unijeti ga u datoteku robots.txt.</p><h4><b>Zabrani snimanje</b></h4><p>Zapis "Disallow" mora sadržavati upute koje robotu za pretraživanje iz zapisa "User-agent" pokazuju koje datoteke i/ili direktorije je zabranjeno indeksirati.</p><p>Smatrati <a href="https://bumotors.ru/hr/chto-takoe-border-v-css-primery-s-razlichnymi-granicami-ramok-css-border.html">razni primjeri</a> Zabrani zapise.</p><p>Primjer unosa robots.txt (dopusti sve za indeksiranje):</p><p><b>Zabraniti:</b></p><p>Primjer (stranici je potpuno zabranjeno. Za to koristite simbol "/"): Disallow: /</p><p>Primjer (datoteka "page.htm" koja se nalazi u korijenskom direktoriju i datoteka "page2.htm" koja se nalazi u direktoriju "dir" zabranjene su za indeksiranje):</p><p><b>Disallow: /page.htm</b></p><p><b>Disallow: /dir/page2.htm</b></p><p>Primjer (direktoriji "cgi-bin" i "forum" i stoga cijeli sadržaj ovog direktorija zabranjeni su za indeksiranje):</p><p><b>Zabraniti: / cgi-bin /</b></p><p><b>Disallow: / forum /</b></p><p>Moguće je zatvoriti indeksiranjem većeg broja dokumenata i (ili) direktorija koji počinju istim znakovima koristeći samo jedan "Disallow" unos. Da biste to učinili, morate napisati početne identične znakove bez završne kose crte.</p><p>Primjer (direktorij "dir" je zabranjen za indeksiranje, kao i sve datoteke i direktorije koji počinju slovima "dir", tj. datoteke: "dir.htm", "direct.htm", direktoriji: "dir", "directory1 "," Direktorij2 ", itd.):</p><h4><b>Dopusti ulaz</b></h4><p>Opcija "Dopusti" se koristi za označavanje izuzimanja iz neindeksiranih direktorija i stranica koje su specificirane unosom "Disallow".</p><p>Na primjer, postoji unos koji izgleda ovako:</p><p>Disallow: / forum /</p><p>Ali u isto vrijeme, stranicu 1 potrebno je indeksirati u / forum / direktoriju. Zatim su vam potrebne sljedeće linije u datoteci robots.txt:</p><p>Disallow: / forum /</p><p>Dopusti: / forum / stranica1</p><h4><b>Zapis Sitemapa</b></h4><p>Ovaj unos ukazuje na lokaciju karte web-lokacije u <a href="https://bumotors.ru/hr/xml-format-chem-otkryt-i-redaktirovat-kak-izmenit-fail.html">xml formatu</a> koju koriste roboti za pretraživanje. Ovaj unos označava put do ove datoteke.</p><p>Mapa stranice: http://site.ru/sitemap.xml</p><h4><b>Zapis domaćina</b></h4><p>Unos "host" koristi tražilica Yandex. Potrebno je odrediti glavno zrcalo stranice, odnosno ako stranica ima ogledala (zrcalo je djelomično ili <a href="https://bumotors.ru/hr/kak-obezopasit-svoi-smartfon-i-sdelat-bekap-proshivki.html">cijeli primjerak</a> mjesto. Prisutnost dupliciranih resursa ponekad je neophodna vlasnicima vrlo posjećenih stranica kako bi povećali pouzdanost i dostupnost njihove usluge), a zatim pomoću direktive "Host" možete odabrati naziv pod kojim želite biti indeksirani. Inače će Yandex sam odabrati glavno ogledalo, a ostalim imenima bit će zabranjeno indeksiranje.</p><p>Radi kompatibilnosti s alatima za indeksiranje koji ne prihvaćaju direktivu Host prilikom obrade datoteke robots.txt, dodajte unos "Host" odmah nakon unosa Disallow.</p><p>Primjer: www.site.ru - glavno ogledalo:</p><p><b>Domaćin: www.site.ru</b></p><h4><b>Unos s odgodom puzanja</b></h4><p>Ovaj unos percipira Yandex. To je naredba za robota da napravi intervale od određenog vremena (u sekundama) između indeksiranja stranica. Ponekad je potrebno zaštititi mjesto od preopterećenja.</p><p>Dakle, sljedeći unos znači da Yandex robot mora prijeći s jedne stranice na drugu ne prije 3 sekunde kasnije:</p><h4><b>Komentari (1)</b></h4><p>Svaki redak u robots.txt koji počinje znakom "#" smatra se komentarom. Dopušteno je koristiti komentare na kraju redaka s direktivama, ali neki roboti možda neće ispravno prepoznati ovaj redak.</p><p>Primjer (komentar je u istom retku zajedno s direktivom):</p><p><b>Disallow: / cgi-bin / # komentar</b></p><p>Komentar je preporučljivo staviti u poseban redak. Bijeli prostor na početku retka je dopušten, ali se ne preporučuje.</p><h3><b>4. Uzorak datoteka robots.txt</b></h3><p>Primjer (komentar je u zasebnom retku): <br><b>Disallow: / cgi-bin / # komentar</b></p><p>Primjer datoteke robots.txt koja svim robotima omogućuje indeksiranje cijele stranice:</p><p>Domaćin: www.site.ru</p><p>Primjer datoteke robots.txt koja svim robotima zabranjuje indeksiranje web-mjesta:</p><p>Domaćin: www.site.ru</p><p>Primjer datoteke robots.txt koja svim robotima zabranjuje indeksiranje direktorija "abc", kao i svih direktorija i datoteka koje počinju znakovima "abc".</p><p>Domaćin: www.site.ru</p><p>Primjer datoteke robots.txt koja zabranjuje indeksiranje stranice "page.htm" koja se nalazi u korijenskom direktoriju stranice od strane robota za pretraživanje "googlebot":</p><p>Korisnički agent: googlebot</p><p>Disallow: /page.htm</p><p>Domaćin: www.site.ru</p><p>Primjer datoteke robots.txt koja onemogućuje indeksiranje:</p><p>- za robota "googlebot" - stranica "page1.htm" koja se nalazi u direktoriju "imenik";</p><p>- za Yandex robota - svi direktoriji i stranice koji počinju sa simbolima "dir" (/ dir /, / direct /, dir.htm, direction.htm, itd.) i nalaze se u korijenskom direktoriju web-mjesta.</p><p>Korisnički agent: googlebot</p><p>Disallow: /directory/page1.htm</p><p>Korisnički agent: Yandex</p><h3>5. Pogreške povezane s datotekom robots.txt</h3><p>Jedna od najčešćih pogrešaka je obrnuta sintaksa.</p><p><b>Nije ispravno:</b></p><p>Zabraniti: Yandex</p><p><b>Pravo:</b></p><p>Korisnički agent: Yandex</p><p><b>Nije ispravno:</b></p><p>Disallow: / dir / / cgi-bin / / forum /</p><p><b>Pravo:</b></p><p>Zabraniti: / cgi-bin /</p><p>Disallow: / forum /</p><p>Ako pri obradi greške 404 (dokument nije pronađen) web poslužitelj izda posebnu stranicu, a datoteka robots.txt nedostaje, tada je moguća situacija kada se robotu za pretraživanje pri zahtjevu za datoteku robots.txt da ista <a href="https://bumotors.ru/hr/ne-mogu-zaiti-na-stranicu-ispolzuem-specialnyi-skript-chto-delat-esli-voiti.html">posebna stranica</a> koja ni na koji način nije kontrolna datoteka indeksiranja.</p><p>Pogreška u vezi s slučajem robots.txt. Na primjer, ako trebate zatvoriti direktorij "cgi-bin", tada u unosu "Disallow" ne možete napisati naziv direktorija velikim slovima "cgi-bin".</p><p><b>Nije ispravno:</b></p><p>Zabraniti: / CGI-BIN /</p><p><b>Pravo:</b></p><p>Zabraniti: / cgi-bin /</p><p>Pogreška povezana s izostankom otvorne kose crte prilikom zatvaranja direktorija iz indeksiranja.</p><p><b>Nije ispravno:</b></p><p>Disallow: page.HTML</p><p><b>Pravo:</b></p><p>Disallow: /page.html</p><p>Kako biste izbjegli najčešće pogreške, možete provjeriti datoteku robots.txt pomoću Yandex.Webmaster alata ili Alata za <a href="https://bumotors.ru/hr/kak-otkryt-gostevoi-dostup-k-yandeks-metrike-poshagovo-kak-otkryt-gostevoi.html">Google webmasteri</a>... Provjera se provodi nakon preuzimanja datoteke.</p><h3>6. Zaključak</h3><p>Dakle, prisutnost datoteke robots.txt, kao i njezina kompilacija, može utjecati na promociju stranice u tražilicama. Bez poznavanja sintakse datoteke robots.txt, možete zabraniti indeksiranje mogućih promoviranih stranica, kao i cijele stranice. I obrnuto, kompetentna kompilacija ove datoteke može uvelike pomoći u promicanju resursa, na primjer, možete zatvoriti dokumente od indeksiranja koji ometaju promociju željenih stranica.</p> <p>Želite li znati kako spriječiti indeksiranje vaše stranice u robots.txt i drugim alatima? Tada je predstavljeni materijal samo za vas.</p> <p>Naravno, vlasnici web stranica se bore za što brže indeksiranje svojih resursa od strane tražilica. Ali postoje slučajevi kada je potrebno zabraniti indeksiranje web-mjesta tako da bot za pretraživanje ne posjećuje resurs neko vrijeme. Takvi slučajevi mogu biti:</p> <ul><li>nedavno kreiranje stranice, kada na njoj još uvijek nema korisnih informacija;</li> <li>potreba za ažuriranjima (na primjer, promjena u dizajnu stranice);</li> <li>prisutnost skrivenih ili tajnih dijelova ili <a href="https://bumotors.ru/hr/chitat-poleznoe-v-kontakte-poleznye-sovety-dlya-doma.html">korisni linkovi</a> koje ne bih volio da se prosljeđuje botovima za pretraživanje.</li> </ul><p><i><b>Možete zatvoriti cijelu stranicu ili njezine pojedine dijelove:</b> </i></p> <ul><li>zaseban odlomak ili poveznica;</li> <li>obrasci za unos podataka;</li> <li>administratorski dio;</li> <li>stranicama <a href="https://bumotors.ru/hr/vosstanovlenie-uchetnoi-zapisi-gugl-vyvody-po-vosstanovleniyu-akkaunta-google.html">korisnički profili</a> i registracije;</li> <li>duplicirane stranice;</li> <li>oblak oznaka itd.</li> </ul><blockquote><p>Postoji mnogo načina na koje možete blokirati indeksiranje web-mjesta. Uređivanje vaše robots.txt datoteke jedan je od njih. Razmotrit ćemo ovu metodu i još dvije najpopularnije i jednostavne.</p> </blockquote> <h3>Kako zatvoriti web mjesto iz indeksiranja za Yandex, Google i sve tražilice u robots.txt</h3> <p><i>Uređivanje vaše datoteke robots.txt jedan je od najsigurnijih i najbržih načina</i> postavite ovu zabranu za tražilice na neko vrijeme ili zauvijek. Što trebam učiniti:</p> <ol><li>Napravite robots.txt datoteku. Da biste to učinili, morate stvoriti redoviti <a href="https://bumotors.ru/hr/skachat-programmu-dlya-redaktirovaniya-tekstovyh-dokumentov-luchshie-tekstovye.html">Tekstualni dokument</a> s ekstenzijom .txt, nazovite ga "robots".</li> <li>Učitajte kreiranu datoteku u <a href="https://bumotors.ru/hr/chto-znachit-koren-papki-kornevaya-direktoriya.html">korijenska mapa</a> vaš blog. Ako je stranica izrađena na <a href="https://bumotors.ru/hr/kak-sozdat-svoi-blog-i-zarabotat-ustanovka-i-nastroika-wordpress-kakimi-dvizhkami.html">WordPress motor</a>, tada se ova mapa može pronaći gdje se nalaze mape wp-includes, wp-content itd.</li> <li>Izravno postavljanje zabrane indeksiranja za tražilice.</li> </ol><p>Zabrana indeksiranja stranica može se postaviti i za određene tražilice i za sve tražilice. Pogledat ćemo različite opcije.</p> <p><br><img src='https://i1.wp.com/masterproseo.ru/wp-content/uploads/2016/08/robots.jpg' align="center" width="100%" loading=lazy loading=lazy></p><p>Da biste blokirali indeksiranje web-mjesta od strane Googleovih robota za pretraživanje, morate napisati sljedeće u datoteci robots.txt:</p> <ol><li>Korisnički agent: Googlebot</li> <li>Zabraniti: /</li> </ol><p><i>Kako bi se provjerilo je li stranica zatvorena od indeksiranja, kreira se račun i željena stranica se dodaje u Google Webmaster</i>... Ovdje je osigurana funkcija provjere.</p> <p>Tada će se prikazati rezultati. Ako je web-mjestu zabranjeno indeksiranje, pisat će "Blokirano po retku" i naznačiti koji redak blokira indeksiranje. Ako su bilo kakve radnje za zabranu indeksiranja od strane Google pretraživača izvršene pogrešno, tada će se potpisati znak "Dopušteno".</p> <blockquote><p>Imajte na umu da to nije moguće s tražilicom robots.txt <a href="https://bumotors.ru/hr/soobshchenie-o-poiskovoi-sisteme-google-istoriya-google-gugl-kompanii-s-mirovym.html">google sustav</a> zabraniti indeksiranje 100%. Ovo je svojevrsna preporuka za Google, jer će on sam odlučiti hoće li indeksirati poseban dokument ili ne.</p> </blockquote> <p><b>Da biste blokirali indeksiranje materijala web-mjesta od strane Yandexa, unesite sljedeće u datoteku robots.txt:</b></p> <ol><li>Korisnički agent: Yandex</li> <li>Zabraniti: /</li> </ol><p>Da biste provjerili status resursa, morate ga dodati u Yandex Webmaster, gdje zatim trebate unijeti nekoliko stranica sa svoje stranice i kliknuti gumb "Provjeri". Ako je sve uspjelo, linija će prikazati natpis "Zabranjeno pravilom".</p> <p><i>Također možete postaviti zabranu indeksiranja vaše stranice za sve tražilice u isto vrijeme. Da biste to učinili, ponovno otvorite datoteku robots.txt i u nju upišite sljedeći redak</i>:</p> <ol><li>Korisnički agent: *</li> <li>Zabraniti: /</li> </ol><blockquote><p>Provjera zabrane indeksiranja za Google i Yandex vrši se prema gornjoj shemi u Google Webmasteru odnosno Yandex Webmasteru.</p> </blockquote> <p>Da biste vidjeli svoju robots.txt datoteku, morate otići na yourdomain.com/robots.txt. Ovdje će biti prikazano sve što je napisano. Događa se da se pojavi pogreška 404. To znači da je nešto pogrešno učinjeno prilikom prijenosa datoteke.</p> <p><br><img src='https://i0.wp.com/masterproseo.ru/wp-content/uploads/2016/08/robots-allow-disallow.jpg' align="center" width="100%" loading=lazy loading=lazy></p><h3>Spriječite indeksiranje resursa pomoću alatne trake</h3> <p>Način zatvaranja stranice od indeksiranja pomoću alatne trake prikladan je samo za one resurse koji su napravljeni na WordPressu.</p> <p>Postupak je jednostavan i brz:</p> <ul><li>Otvorite "Upravljačku ploču", idite na "Postavke" - "Čitanje";</li> <li>Označite okvir "Preporučite tražilicama da ne indeksiraju web-mjesto".</li> <li>Spremi promjene.</li> </ul><p><b>Izvođenje ovih radnji samo je preporuka za tražilice</b>... I sami odlučuju hoće li materijali za izvore biti indeksirani ili ne. Postavke vidljivosti stranice čak uključuju <a href="https://bumotors.ru/hr/sravnitelnye-testy-kompyuterov-specialnoe-testirovanie.html">poseban niz</a>: « <a href="https://bumotors.ru/hr/poiskovye-mashiny-poisk-informacii-v-web.html">Tražilice</a> oni sami odlučuju hoće li slijediti vaš zahtjev." Napominjemo da Yandex obično "pokorava", a Google može djelovati po vlastitom nahođenju i u nekim slučajevima ipak indeksirati stranicu, unatoč preporuci.</p> <h2>Ručno zatvaranje stranice od indeksiranja</h2> <p>U izvornom kodu, kada se stranica ili cijeli resurs zatvori iz indeksiranja, pojavljuje se redak <meta name=»robots» content=»noindex,follow» /></p> <p>Upravo ova linija poručuje tražilicama da nema potrebe za indeksiranjem pojedinačnih materijala ili resursa. Ovu liniju možete ručno napisati bilo gdje na web mjestu. Glavna stvar je da se prikazuje na svim stranicama.</p> <p><i><b>Ova metoda je također prikladna za zatvaranje svakog nepotrebnog dokumenta iz indeksiranja.</b> </i></p> <p>Nakon dovršetka ažuriranja, morate provjeriti je li sve uspjelo. Da biste to učinili, morate otvoriti <a href="https://bumotors.ru/hr/pochemu-kompyuter-ne-mozhet-prosmotret-kod-elementa-kak-posmotret.html">izvor</a> preko <a href="https://bumotors.ru/hr/deistvie-primenyaemoe-po-hokkeyu-ctrl-x-goryachie-klavishi-na-klaviature.html">CTRL tipke</a>+ U i pogledajte sadrži li točan redak. Njegova prisutnost potvrđuje uspješnu operaciju zatvaranja iz indeksiranja. Osim toga, možete provjeriti u Yandex Webmasteru i Google Webmasteru.</p> <p>Dakle, razmotrili smo najjednostavniji i <a href="https://bumotors.ru/hr/pyat-sposobov-bystree-zaryadit-smartfon-vklyuchit-bystruyu-zaryadku-ili.html">brze načine</a>, što vam omogućuje da zatvorite cijelu stranicu ili pojedinačne materijale resursa iz indeksiranja <a href="https://bumotors.ru/hr/kak-funkcioniruyut-poiskovye-mashiny-i-kak-pravilno-stroit-zaprosy.html">tražilice</a>... I, kako se pokazalo, robots.txt je jedna od lakih i relativno pouzdanih metoda.</p> <p>Nedavno je sa mnom podijelio opažanje da mnoge stranice koje nam dođu na reviziju često imaju iste pogreške. Štoviše, ove se pogreške ne mogu uvijek nazvati trivijalnim - čine ih čak i napredni webmasteri. Tako je nastala ideja za pisanje niza članaka s uputama za praćenje i popravljanje <a href="https://bumotors.ru/hr/ne-udaetsya-aktivirovat-windows-8-kod-oshibki-0x8007007b-standartnoi-sposob.html">slične pogreške</a>... Prvi na redu je vodič za postavljanje indeksiranja web mjesta. Dajem riječ autoru.</p> <p>Za dobro indeksiranje stranice i bolje rangiranje stranice, potrebno je da tražilica indeksira ključne promovirane stranice stranice, a na samim stranicama može točno istaknuti glavni sadržaj, a da se ne zbuni u obilju servisnih i pomoćnih informacija. <br>Web stranice koje nam dolaze na analizu imaju dvije vrste pogrešaka:</p> <p>1. Kada promoviraju stranicu, njihovi vlasnici ne razmišljaju o tome što bot za pretraživanje vidi i dodaje u indeks. U tom slučaju može nastati situacija kada indeks sadrži više stranica smeća nego promoviranih stranica, a same stranice su preopterećene.</p> <p>2. Naprotiv, vlasnici su bili previše revni da očiste mjesto. Zajedno s <a href="https://bumotors.ru/hr/gde-knopka-option-otobrazhenie-podrobnoi-informacii-o-seti-zakrytie-nenuzhnyh.html">nepotrebne informacije</a> podaci važni za promociju i ocjenu stranica također se mogu sakriti.</p> <p>Danas želimo razmotriti što je doista vrijedno sakriti od robota za pretraživanje i kako to najbolje učiniti. Krenimo od sadržaja stranica.</p> <h2>Sadržaj</h2> <h3>Problemi u vezi sa zatvaranjem sadržaja na stranici:</h3> <p>Stranicu roboti za pretraživanje ocjenjuju sveobuhvatno, a ne samo tekstualnim pokazateljima. Ponesene zatvaranjem raznih blokova, često se brišu informacije važne za procjenu korisnosti i rangiranje.</p> <p><b>Navedimo primjer najviše <a href="https://bumotors.ru/hr/oshibka-internal-server-error-chto-eto-i-kak-s-nei-borotsya-obzor-samyh-chastyh.html">česte greške</a>: </b><br>- zaglavlje stranice je skriveno. Obično je kuća <a href="https://bumotors.ru/hr/kak-skryt-kontaktnuyu-informaciyu-vk-kak-skryt-stranicu-vkontakte-ot.html">Kontakt informacije</a>, poveznice. Ako je zaglavlje stranice zatvoreno, tražilice možda neće znati da ste se pobrinuli za posjetitelje i plasirali ih <a href="https://bumotors.ru/hr/kak-podobrat-k-materinskoi-plate-blok-pitaniya-kak-vybrat-blok-pitaniya.html">važna informacija</a> na istaknutom mjestu;</p> <p>- filteri, obrazac za pretraživanje, sortiranje su skriveni od indeksiranja. Prisutnost takvih mogućnosti u internetskoj trgovini važan je komercijalni pokazatelj koji je bolje prikazan, a ne skriven. <br>- podaci o plaćanju i dostavi su skriveni. To je učinjeno kako bi se poboljšala jedinstvenost kartica proizvoda. Ali to je također informacija koja bi trebala biti na kartici proizvoda visoke kvalitete. <br>- izbornik je "izrezan" sa stranica, što narušava procjenu jednostavnosti navigacije po stranici.</p> <p><b>Zašto je dio sadržaja zatvoren na stranici?</b><br>Obično postoji nekoliko ciljeva: <br>- usredotočiti se na glavni sadržaj na stranici uklanjanjem pomoćnih informacija, servisnih blokova, izbornika iz indeksa; <br>- učiniti stranicu jedinstvenijom i korisnijom uklanjanjem duplih blokova na stranici; <br>- ukloniti "dodatni" tekst, povećati relevantnost teksta stranice.</p> <p><b>Sve se to može postići bez skrivanja dijela sadržaja!</b><br><i>Imate li jako velik jelovnik?</i><br>Prikažite na stranicama samo one stavke koje su izravno povezane s odjeljkom.</p> <p><i>Mnogo izbora u filterima?</i><br>Ispisujte samo popularne u glavnom kodu. Ostatak opcija učitajte samo ako korisnik klikne gumb "prikaži sve". Da, ovdje se koriste skripte, ali nema prijevare - skripta se pokreće na zahtjev korisnika. Tražilica će moći pronaći sve stavke, ali kada se procijene, one neće dobiti istu vrijednost kao glavni sadržaj stranice.</p> <p><i>Na stranici <a href="https://bumotors.ru/hr/samyi-bolshoi-blok-pitaniya-kak-pravilno-vybrat-bloki-pitaniya.html">veliki blok</a> s vijestima?</i><br>Smanjite njihov broj, prikažite samo naslove ili jednostavno uklonite blok vijesti ako korisnici rijetko slijede veze u njemu ili ako na stranici ima malo glavnog sadržaja.</p> <p>Roboti za pretraživanje, iako daleko od idealnih, neprestano se poboljšavaju. Google već prikazuje skrivanje skripti od indeksiranja kao pogrešku u <a href="https://bumotors.ru/hr/kak-otklyuchit-stroku-poiska-gugl-android-7-kak-ubrat-poisk-gugl-na-androide.html">google paneli</a> <a href="https://bumotors.ru/hr/proverka-optimizacii-dlya-mobilnyh-ustroistv-proverka.html">Search Console</a>(kartica "Blokirani resursi"). Neprikazivanje dijela sadržaja robotima doista može biti korisno, ali ovo nije metoda optimizacije, već privremene "štake" koje treba koristiti samo kada je to prijeko potrebno.</p> <p><b>Preporučujemo:</b><br>- tretirajte skrivanje sadržaja kao "štaku" i pribjegavajte mu samo u ekstremnim situacijama, pokušavajući modificirati samu stranicu; <br>- uklanjanje dijela sadržaja sa stranice, fokusiranje ne samo na tekstualne pokazatelje, već i procjenu pogodnosti i informacija koje utječu; <br>- prije skrivanja sadržaja, provedite eksperiment na nekoliko testnih stranica. Botovi za pretraživanje znaju kako analizirati stranice i vaši strahovi o smanjenju relevantnosti mogu biti uzaludni.</p> <p><b>Pogledajmo metode koje se koriste za skrivanje sadržaja:</b></p> <h3>Oznaka bez indeksa</h3> <p>Ova metoda ima nekoliko nedostataka. Prije svega, ovu oznaku uzima u obzir samo Yandex, pa je beskorisna za skrivanje teksta od Googlea. Osim toga, važno je razumjeti da oznaka zabranjuje indeksiranje i prikazivanje samo teksta u rezultatima pretraživanja. Ostatak sadržaja, poput poveznica, nije pokriven.</p> <p>Podrška za Yandex zapravo ne pokriva kako noindex funkcionira. Malo <a href="https://bumotors.ru/hr/cennaya-informaciya-kriterii-otbora-bolshaya-enciklopediya.html">više informacija</a> nalazi se u jednoj od rasprava na službenom blogu.</p> <p><b>Pitanje korisnika:</b></p> <blockquote><p>“Mehanika djelovanja i utjecaj na rangiranje oznake nisu u potpunosti shvaćeni. <noindex>tekst</noindex>... Zatim ću objasniti zašto su toliko zbunjeni. A sada - postoje 2 hipoteze, želio bih pronaći istinu.</p> <p># 1 Noindex uopće ne utječe na rang/relevantnost stranice</p> <p>Pod ovom pretpostavkom: jedino što radi je blokiranje nekog sadržaja da se ne pojavi u rezultatima pretraživanja. U tom se slučaju cijela stranica smatra cjelinom, uključujući zatvorene blokove, relevantnost i povezane parametre (jedinstvenost, usklađenost, itd.) jer se izračunava prema svim sadržajima u kodu, čak i zatvorenim.</p> <p># 2 Noindex utječe na rangiranje i relevantnost, budući da sadržaj zatvoren u oznaci uopće nije ocijenjen. Sukladno tome, točno je suprotno. Stranica će biti rangirana prema sadržaju koji je otvoren za robote."</p> </blockquote> <p><b>Kada bi oznaka mogla biti korisna:</b><br>- ako postoji sumnja da je stranica smanjena u rezultatima pretraživanja Yandexa zbog prevelike optimizacije, ali u isto vrijeme zauzima TOP pozicije za važne fraze u Googleu. Morate razumjeti da je ovo brzo i privremeno rješenje. Ako cijela stranica potpada pod "Baden-Baden", noindex, kao što su predstavnici Yandexa više puta potvrdili, neće pomoći; <br>- sakriti generala <a href="https://bumotors.ru/hr/informacionnaya-bezopasnost-organov-vnutrennih-del-zashchita-informacii-v.html">servisne informacije</a> koje ste dužni navesti na stranici zbog korporativnih ili zakonskih propisa; <br>- da ispravite isječke u Yandexu ako sadrže neželjeni sadržaj.</p> <h3>Skrivanje sadržaja pomoću AJAX-a</h3> <p>Ovaj <a href="https://bumotors.ru/hr/nex-chem-otkryt-est-li-universalnyi-metod-otkrytiya-neizvestnyh-failov.html">univerzalna metoda</a>... Omogućuje vam skrivanje sadržaja s Yandexa i Googlea. Ako želite očistiti stranicu od sadržaja koji razvodnjava relevantnost, bolje ga je upotrijebiti. Predstavnici PS-a, naravno, ne pozdravljaju ovu metodu i preporučuju je <a href="https://bumotors.ru/hr/kak-rabotayut-poiskovye-roboty-poiskovye-roboty.html">roboti za pretraživanje</a> vidjeli isti sadržaj kao i korisnici. <br>Tehnologija <a href="https://bumotors.ru/hr/ajax-chto-eto-takoe-vliyanie-na-seo-preimushchestva-i-nedostatki-tehnologii.html">pomoću AJAX-a</a> je široko rasprostranjena i ako se ne upustite u eksplicitno prikrivanje, ne prijete vam sankcije za njegovo korištenje. Nedostatak ove metode je što i dalje morate blokirati pristup skriptama, iako Yandex i Google to ne preporučuju.</p> <h2>Stranice stranice</h2> <p>Za <a href="https://bumotors.ru/hr/uspeshnoe-prodvizhenie-v-socialnyh-setyah-prodvizhenie-biznesa-v-socialnyh.html">uspješna promocija</a> važno je ne samo riješiti se <a href="https://bumotors.ru/hr/prilozhenie-dlya-avtomaticheskoi-ochistki-operativnoi-pamyati-android.html">nepotrebne informacije</a> na stranicama, ali i jasno <a href="https://bumotors.ru/hr/chto-znachit-relevantnyi-chto-takoe-relevantnost-poiska-indeks-poiskovoi.html">indeks pretraživanja</a> stranice s beskorisnih stranica za smeće. <br>Prvo, to će ubrzati indeksiranje glavnih promoviranih stranica web-mjesta. Drugo, prisutnost u indeksu <a href="https://bumotors.ru/hr/samoe-bolshoe-chislo-prosmotrov-na-yutube-pyat-samyh-prosmatrivaemyh-video-na.html">veliki broj</a> neželjene stranice negativno će utjecati na ocjenu i promociju stranice.</p> <p><b>Odmah nabrojimo stranice koje je poželjno sakriti:</b></p> <p>- stranice za registraciju prijava, košarice korisnika; <br>- rezultati pretraživanja stranice; <br>- osobni podaci korisnika; <br>- stranice s rezultatima usporedbe proizvoda i slično <a href="https://bumotors.ru/hr/operacionnaya-sistema-sluzhit-dlya-funkcii-raboty-os-primery.html">pomoćni moduli</a>;<br>- stranice generirane filterima pretraživanja i sortiranjem; <br>- stranice administrativnog dijela stranice; <br>- tiskane verzije.</p> <p><b>Razmotrimo načine na koje možete zatvoriti stranice iz indeksiranja.</b></p> <h3>Zatvori u robots.txt</h3> <p>Ovo nije najbolja metoda.</p> <p>Prvo, datoteka robots nije dizajnirana za borbu protiv duplikata i čišćenje stranica od neželjenih stranica. U ove svrhe bolje je koristiti druge metode.</p> <p>Drugo, datoteka robota nije jamstvo da stranica neće biti indeksirana.</p> <p>Evo što Google piše o tome u svojoj pomoći:</p> <h3>Noindex meta oznaka</h3> <p>Kako biste osigurali da su stranice isključene iz indeksa, najbolje je koristiti ovu meta oznaku.</p> <p>Ispod je varijanta meta oznake koju obje tražilice razumiju:</p><p> <meta name="robots" content="noindex, nofollow"> </p><p><b>Važna točka!</b></p> <p>Da bi Googlebot vidio meta oznaku noindex, morate otvoriti pristup stranicama koje su zatvorene u datoteci robots.txt. Ako se to ne učini, robot možda jednostavno neće ići na ove stranice.</p> <h3>Zaglavlja oznaka X-Robots</h3> <p>Značajna prednost ove metode je da se zabrana može postaviti ne samo u kodu stranice, već i kroz root .htaccess datoteku.</p> <p>Ova metoda nije baš uobičajena na ruskom internetu. Vjerujemo da je glavni razlog ove situacije taj što Yandex koristi ovu metodu <a href="https://bumotors.ru/hr/kak-i-gde-hranit-dannye-v-techenie-dolgogo-vremeni-rezervnoe.html">dugo vremena</a> nije podržao. <br>Ove godine zaposlenici Yandexa napisali su da je metoda sada podržana.</p> <p>Odgovor podrške ne može se nazvati detaljnim))). Prije nego što nastavite sa zabranom indeksiranja pomoću oznake X-Robots-Tag, bolje je provjeriti funkcionira li ova metoda za Yandex. Još nismo postavili svoje eksperimente na ovu temu, ali ćemo to možda učiniti u bliskoj budućnosti.</p> <h3>Zaštita lozinkom</h3> <p>Ako trebate sakriti cijelu stranicu, na primjer, testnu verziju, također preporučujemo korištenje ove metode. Možda je jedini nedostatak to što može biti teško skenirati domenu skrivenu pod lozinkom ako je potrebno.</p> <h3>Uklonite neželjene stranice pomoću AJAX-a</h3> <p>Poanta nije samo zabraniti indeksiranje stranica generiranih filterima, sortiranjem itd., već ne i kreirati <a href="https://bumotors.ru/hr/kak-voiti-na-zablokirovannuyu-stranicu-tor-i-emu-podobnye.html">slične stranice</a> na stranici.</p> <p>Na primjer, ako je korisnik u filteru pretraživanja odabrao skup parametara za koji niste kreirali <a href="https://bumotors.ru/hr/kak-udalit-otdelnuyu-stranicu-v-vorde-kak-udalit-stranicu.html">zasebna stranica</a>, promjene u proizvodima prikazanim na stranici događaju se bez promjene samog URL-a.</p> <p>Poteškoća s ovom metodom je u tome što se obično ne može primijeniti na sve slučajeve odjednom. Neke od generiranih stranica koriste se za promociju.</p> <p>Na primjer, filtrirajte stranice. Za "frižider + Samsung + bijela" trebamo stranicu, ali za "frižider + Samsung + bijeli + dva odjeljka + bez mraza" - više ne.</p> <p>Stoga morate napraviti alat koji uključuje stvaranje iznimaka. To komplicira zadatak programera.</p> <h3>Koristite metode zabrane indeksiranja iz algoritama pretraživanja</h3> <p><b>"Parametri URL-a" u <a href="https://bumotors.ru/hr/skachat-prilozhenie-nastroika-sistemy-android-planshet-otklyuchi-google-search-i-drugoi.html">Google pretraživanje</a> Konzola</b></p> <p>Ovaj alat vam omogućuje da odredite kako identificirati pojavu u <a href="https://bumotors.ru/hr/stranichnye-bloki-pravilo-page-kak-izmenit-url-stranic-v-wordpress.html">URL-ovi stranica</a> novim parametrima.</p> <p><b>Direktiva Clean-param u robots.txt</b></p> <p>U Yandexu se slična zabrana za URL parametre može postaviti pomoću direktive Clean-param. <br>Možete čitati o tome.</p> <p>Kanonske adrese kao prevencija smeća stranica na stranici <br>Ova meta oznaka stvorena je posebno za borbu protiv duplikata i neželjenih stranica na web mjestu. Preporučujemo da ga propišete na cijeloj web stranici kao prevenciju pojavljivanja duplikata i smeća stranica u indeksu.</p> <h3>Alati za točkasto brisanje stranica iz Yandex i Google indeksa</h3> <p>Ako se dogodila situacija kada hitno trebate izbrisati podatke iz indeksa, bez čekanja da se vidi vaša zabrana <a href="https://bumotors.ru/hr/sovremennye-problemy-nauki-i-obrazovaniya-sushchnostnaya-harakteristika-opytno-eksperimentalnoi-raboty.html">posao traženja</a>, možete koristiti alate s ploče Yandex.Webmaster i Google Search Console.</p> <p>U Yandexu, ovo je "Ukloni URL":</p> <p>U Google Search Consoleu "Ukloni URL":</p> <h2>Interne veze</h2> <p>Interne veze su zatvorene od indeksiranja kako bi se interne težine preraspodijelile na glavne promovirane stranice. Ali poanta je: <br>- takva preraspodjela može loše utjecati na <a href="https://bumotors.ru/hr/naznachenie-sistem-svyazi-obshchie-svedeniya-o-sistemah-svyazi.html">opće veze</a> između stranica; <br>- veze iz šablonskih prolaznih blokova obično imaju manju težinu ili se uopće ne računaju.</p> <p>Razmotrite opcije koje se koriste za skrivanje veza:</p> <h3>Oznaka bez indeksa</h3> <p>Ova oznaka je beskorisna za skrivanje veza. Primjenjuje se samo na tekst.</p> <h3>Rel = "nofollow" atribut</h3> <p>Trenutno vam atribut ne dopušta uštedu težine na stranici. Korištenje rel = ”nofollow” jednostavno gubi na težini. Samo po sebi, korištenje oznake za interne veze ne čini se baš logičnim.</p> <h3>Skrivanje poveznica sa skriptama</h3> <p>Ovo je zapravo jedina radna metoda kojom možete sakriti linkove od tražilica. Možete koristiti Ajax i učitavati blokove veza nakon učitavanja stranice ili dodati veze zamjenom oznake sa skriptom <span>na <a>... Važno je to uzeti u obzir <a href="https://bumotors.ru/hr/kakie-pravila-effektivnogo-poiska-informacii-v-internete-itak-algoritm.html">algoritmi pretraživanja</a> mogu prepoznati skripte.</p> <p>Kao i kod sadržaja, ovo je štaka koja ponekad može riješiti problem. Ako niste sigurni da ćete dobiti pozitivan učinak od bloka skrivenih veza, bolje je ne koristiti takve metode.</p> <h2>Zaključak</h2> <p>Uklanjanje glomaznih blokova od kraja do kraja sa stranice zaista može imati pozitivan učinak na rangiranje. Bolje je to učiniti skraćivanjem stranice i prikazivanjem samo sadržaja koji je posjetiteljima potreban. Skrivanje sadržaja od tražilice je štaka koju bi trebalo koristiti samo u slučajevima kada je nemoguće smanjiti blokove koji se prožimaju na druge načine.</p> <p>Kada uklanjate dio sadržaja sa stranice, nemojte zaboraviti da za rangiranje nisu važni samo kriteriji teksta, već i cjelovitost informacija i komercijalni čimbenici.</p> <p>Slična je situacija i s internim poveznicama. Da, ponekad može biti korisno, ali umjetna preraspodjela mase linkova na stranici je kontroverzna metoda. Mnogo je sigurnije i pouzdanije jednostavno odbaciti veze za koje niste sigurni.</p> <p>Sa stranicama stranice sve je nedvosmislenije. Važno je osigurati da bezvrijedne stranice od male koristi ne završe u indeksu. Postoji mnogo metoda za to koje smo prikupili i opisali u ovom članku.</p> <p>Uvijek možete poslušati naš savjet <a href="https://bumotors.ru/hr/mozhno-li-posle-formatirovaniya-diska-vosstanovit-dannye-tehnicheskie-aspekty.html">tehnički aspekti</a> optimizaciju, ili naručite promociju po sistemu ključ u ruke, koja uključuje.</p> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy loading=lazy>");</script> </div> <div class="post-social-counters-block"> <div style="margin-top: 12px"> <noindex></noindex> </div> </div> </div> </div> <a name="comments"></a> <h3 class="best-theme-posts-title">Vrhunski povezani članci</h3> <div class="container-fluid"> <div class="best-theme-posts row"> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/hr/fallout-4-izmenenie-vneshnosti-konsol-otlichaetsya-dvizhenie-myshi-po.html"> <div class="img_container"><img src="/uploads/686669656a5df8de6a6f9d463fe60026.jpg" border="0" alt="Različiti pokreti miša okomito i vodoravno" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Različiti pokreti miša okomito i vodoravno</span> </a> </div> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/hr/kak-szhat-tekstury-v-fallout-4-ruchnaya-nastroika-grafiki.html"> <div class="img_container"><img src="/uploads/d7c98012600dd0a7e0e0c14fa8d2e1eb.jpg" border="0" alt="Kako komprimirati teksture u Fallout 4" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Kako komprimirati teksture u Fallout 4</span> </a> </div> <div class="theme-post col-sm-4"> <a href="https://bumotors.ru/hr/nizkie-nastroiki-grafiki-fallout-4-ostalos-tolko-ponyat-nuzhnyi-uroven.html"> <div class="img_container"><img src="/uploads/da3d853bd41405e0322c2a1e985df14b.jpg" border="0" alt="Ostaje samo razumjeti potrebnu razinu" width="320" height="180" / loading=lazy loading=lazy></div> <span class="theme-post-link">Ostaje samo razumjeti potrebnu razinu</span> </a> </div> </div> </div> </div> <a name="comments"></a> </div> <div class="right-column col-sm-4 col-md-4"> <div class="write"> <span class="tags-title">Kategorije:</span> <ul style="height: 286px;" id="right-tags" data-tagscount="18" data-currentmaxtag="10" class="tags"> <li class=""><a href="https://bumotors.ru/hr/category/programs/">Programi</a></li> <li class=""><a href="https://bumotors.ru/hr/category/safety/">Sigurnost</a></li> <li class=""><a href="https://bumotors.ru/hr/category/windows-10/">Windows 10</a></li> <li class=""><a href="https://bumotors.ru/hr/category/iron/">Željezo</a></li> <li class=""><a href="https://bumotors.ru/hr/category/windows-8/">Windows 8</a></li> <li class=""><a href="https://bumotors.ru/hr/category/vkontakte/">U kontaktu s</a></li> <li class=""><a href="https://bumotors.ru/hr/category/errors/">Pogreške</a></li> </ul> </div> <div class="banner"> </div> </div> </div> </div> <div style="clear:both"></div> </div> <div class="footer"> <div class="subscribe"> <div class="main-wrapper container"> <div class="row"> <div class="col-sm-8"> </div> <div class="col-sm-4"> <div class="social"> <a href="" class="vk social-ico"></a> <a href="https://facebook.com/" class="fb social-ico"></a> <a href="https://twitter.com/" class="tw social-ico"></a> </div> </div> </div> </div> </div> <div class="info"> <div class="main-wrapper container"> <div class="row"> <span class="footer-info col-xs-12">© 2021 bumotors.ru. Kako postaviti pametne telefone i računala. Informativni portal.</span> </div> </div> </div> </div> </body> </html>