Duplicirani sadržaj: uzroci i rješenja. Duplicirani sadržaj

27.04.2019 OS

Duplikat sadržaja je jedan od glavnih problema niskog rangiranja web stranice na pretraživačima. Ovaj problem je uzrokovan prisustvom stranica koje su potpuno ili djelomično identične jedna drugoj. Naravno, za pretraživače prisustvo neželjenih stranica na web stranici predstavlja ozbiljan problem, jer moraju trošiti snagu servera da ih obrađuju. Nema smisla da pretraživači troše fizičke resurse na indeksiranje takvog beskorisnog sadržaja. Stoga se bore protiv takvih stranica primjenom filtera na njih ili snižavanjem rangiranja, što dovodi do niskih pozicija za promovirane upite.

Duplikati i SEO

Prisustvo duplikata stranica na web stranici dovodi do sljedećeg:

Na ovim beskorisnim stranicama se troši korisni link.
Duplicirana stranica se zamjenjuje nakon sljedećeg ažuriranja landing page i ona gubi tlo pod nogama.
Duplikat sadržaja smanjuje jedinstvenost svih stranica na kojima je objavljen.
Kako se pretraživač bori protiv takvih stranica tako što ih uklanja iz pretraživanja, može također isključiti stranicu koja se promovira.

Klasifikacija duplikata i rješenja za njihovo uklanjanje

Duplikati mogu biti potpuni ili djelomični. Potpuni duplikati su kada su stranice potpuno identične. Prema tome, djelomični duplikati su kada se stranice ne podudaraju u potpunosti. Potpuni duplikati se eliminiraju putem robots.txt i postavljanjem 301 preusmjeravanja. Djelomični duplikati se eliminišu unošenjem potrebnih izmjena na stranici.

Evo liste kontrolnih lista kroz koje morate proći kako biste identificirali i riješili problem duplikata:

Pronađite duplikate početna stranica site. Na primjer, mogu postojati sljedeće opcije početne stranice: http://www.domen.com/, http://www.domen.com/index.php, http://www.domen.com, http:/ /domen.com/, https://www.domen.com/, http://www.domen.com/index.html. Kao što vidite, postoji mnogo opcija, ali optimalna opcija je http://www.domen.com/. Da bi se eliminisale druge kopije glavne stranice, koristi se 301 preusmjeravanje i zatvaranje u robots.txt (u slučaju struktura kao što je https://www.domen.com/.
Provjera osnovne (zlato) SEO pravila) - svaka stranica treba da bude dostupna samo na jednoj adresi. Adrese se ne mogu razlikovati na sljedeći način: http://www.domen.com/stranica1/stranica2/ i http://www.domen.com/stranica2/stranica1/.
Provjera prisutnosti varijabli u URL-u. Oni ne bi trebali biti u adresi stranice. Na primjer, generiranje URL-ova poput: http://www.domen.ru/index.php?dir=4567&id=515 je greška. Tačan URL bi bio: http://www.domen.ru/dir/4567/id/515.
Provjera prisutnosti identifikatora sesije u URL-ovima. Na primjer, URL-ovi poput http://www.domen.ru/dir/4567/id/515.php?PHPSESSID=3451 su neprihvatljivi. Takvi URL-ovi sadrže beskonačan broj kopija svake stranice. Stoga je potrebno zatvoriti sve identifikatore sesije u robots.txt.

Duplikat sadržaja je djelomično ili potpuno identičan tekst, slike i drugi elementi sadržaja web stranice, dostupni na različitim adresama stranica (URL). Prisustvo duplikata može značajno zakomplikovati promocija na pretraživačima site.

Prema mišljenju stručnjaka, dupli sadržaj je najčešća greška interna optimizacija, prisutan na svakom drugom web resursu.

Kako provjeriti postoje li duplikati na vašoj web stranici i kako ih se riješiti? O tome ćemo vam reći u novom broju našeg biltena.

Šta su duplikati?

Takvi mogu biti jasni ili nejasni (ili potpuni ili nepotpuni).

Čisti izvodi – kopirajte stranice sa potpuno istim sadržajem meta tag Description I naslov Naslov, dostupan na različitim adresama. Na primjer, kod originalna stranica Mogu se pojaviti sljedeći duplikati:

ogledalo sa ili bez WWW;
stranice sa različitim ekstenzijama (.html, .htm, index.php, GET parametar “?a=b” itd.);
verzija za štampanje;
RSS verzija;
isti URL obrazac nakon promjene motora;
i tako dalje.

Zamućeni izvodi – djelomično identičan sadržaj na različitim URL-ovima.

Primjeri takvih duplikata uključuju sljedeće:

kartice sličnih proizvoda s duplikatima ili opisima koji nedostaju;
najave članaka, vijesti, proizvoda u različitim odjeljcima, na tag stranicama i paginaciji;
arhive datuma bloga;
stranice na kojima blokovi s kraja na kraj po obimu premašuju glavni sadržaj;
stranice iz različiti tekstovi, ali identičan Naslov i Opis.

Zašto su duplikati opasni za promociju?

1. Teško je indeksirati stranicu (i odrediti glavnu stranicu)

Zbog duplikata, broj stranica u bazi podataka tražilice može se povećati nekoliko puta; neke stranice možda neće biti indeksirane, jer je robotu za pretraživanje dodijeljena fiksna kvota stranica za indeksiranje stranice.

Postaje teže odrediti glavnu stranicu koja će se pojaviti u rezultatima pretraživanja: izbor robota se možda neće podudarati s izborom webmastera.

2. Glavna stranica u rezultatima pretrage može se zamijeniti dvostrukom

Ako dvojnik prima dobar promet i metriku ponašanja, onda sa sljedećim ažuriranjem može zamijeniti glavnu (promoviranu) stranicu u rezultatima pretraživanja. U ovom slučaju, pozicije u pretrazi će se „ogibati“, jer duplikat neće imati popularnost veza.

3. Gubitak vanjskih linkova na glavnu stranicu

4. Opasnost od pada ispod PS filtera

I Yandex i Google se bore s nejedinstvenim sadržajem, pa se stoga mogu primijeniti na "začepljenu" stranicu AGS filteri i Panda.

5. Gubitak značajnih stranica u indeksu

Nepotpuni duplikati (stranice kategorija, vijesti, kartice proizvoda, itd.) zbog svoje niske jedinstvenosti imaju šansu da uopće ne budu uključeni u indeks tražilice. Na primjer, to se može dogoditi s nekim karticama proizvoda koje algoritam pretraživanja smatraju duplikatima.

Kako pronaći i ukloniti duplikate na web stranici

Kao vlasnik web stranice, čak i bez posebnih znanja i vještina, možete samostalno pronaći duplikate na svom resursu. U nastavku su upute za pronalaženje i uklanjanje duplikata sadržaja.

Potražite kompletne snimke

Većina brz način pronađite kompletne duplikate na stranici - pratite utakmice Oznake naslova i Opis. Da biste to učinili, možete koristiti Google webmaster panel ili uslugu Xenu, popularnu među optimizatorima. Pretraživanje se vrši među indeksiranim stranicama.

Nedostaci: ne mogu se (i trebaju) svi duplikati izbrisati (na primjer, verzije stranica s reklamnim oznakama); radno intenzivan posao koji zahteva velike količine stranicama puno vremena. Ne isključuje pojavu novih duplikata. Težina duplikata se ne prenosi na glavnu stranicu.

Prednosti: ne zahtijeva posebne vještine programiranja.

6. Gotova rješenja za popularni CMS

Programeri popularnog CMS-a su obezbijedili niz rješenja za sprječavanje duplikata. Istovremeno, webmasteri moraju pažljivo postaviti postavke kada rade s motorom. Ako ste nešto previdjeli, a duplikati se i dalje pojavljuju, nikad nije kasno da sve ispravite i eliminišete kopije. Jasna uputstva za podešavanje motora i korišćenje SEO dodataka mogu se naći na specijalizovanim blogovima i forumima za WordPress, Joomla, Drupal, Bitrix, kao i druge široko zastupljene CMS-ove.

Korisni SEO dodaci za borbu protiv duplikata:

WordPress: Sve u jednom SEO paketu, Clearfy;
Drupal: Globalno preusmjeravanje, naslov stranice;
Joomla: Canonical Links All in One, JL No Dubles.

7. Borite se na nivou motora

Univerzalno rješenje za širok spektar CMS-ova je spriječiti pojavu novih duplikata na razini motora. Potrebno je postaviti uslov pod kojim se u procesu obrade adresa CMS linkoviće razlikovati "dobro" od "lošeg" i prikazati u liniji pretraživača samo one koje su dozvoljene pravilom. Ovo će izbjeći formiranje sinonimnih stranica (sa i bez znaka “/”, sa nepotrebnim .html završetkom, GET parametrima, itd.), ali neće zaštititi od duplikata ako stranice nemaju jedinstveni naslov i opis.

Za implementaciju ovu metodu Sljedeće pravilo mora biti uključeno u .htaccess fajl:

RewriteEngine na RewriteCond %(REQUEST_FILENAME) !-d RewriteCond %(REQUEST_FILENAME) !-f RewriteRule ^(.*)$ index.php

Osim toga, trebali biste implementirati neophodne provere u samom motoru.

Metoda je drugačija visoka složenost i zahtijeva kontaktiranje stručnjaka za razvoj.

Protiv: izuzetno visok stepen složenosti.
Prednosti: sprečava pojavu sinonimnih stranica.

Pronalaženje nepotpunih duplikata

1. Pretražujte koristeći Google webmaster ili Xenu uslugu

Algoritam radnji u ovim servisima je potpuno isti kao i za traženje kompletnih duplikata. Jedina razlika je u tome što je među pronađenim duplikatima potrebno odabrati one stranice koje imaju identičan Naslov i/ili Opis, ali potpuno drugačiji sadržaj.

Kao rezultat Google pretrage, pronašli smo grupu nepotpunih duplikata (slika 2).

Rice. 2. Potpuno drugačije vijesti sa dupliranim metapodacima

2. Pretražite u Yandex ili Google traci za pretraživanje

Stranice sa djelimično sličnim sadržajem, ali različitim metapodacima ne mogu se identificirati korištenjem gornje metode. U ovom slučaju, morat ćete raditi ručno.

Za početak, provizorno identificirajte područja rizika:

oskudan sadržaj (blokovi od kraja do kraja po obimu premašuju glavni tekst stranice);
kopirani sadržaj (opisi sličnih proizvoda);
presjek sadržaja (najave, kategorije/poddirektoriji, filteri, sortiranje).

Odaberite nekoliko stranica iz svake grupe.

Da bismo jasno ilustrirali primjer, koristili smo jednu od kartica proizvoda na web stranici trgovine namještajem koja je bila revidirana u našem odjeljku „Stručnost“. Vjerovatnoća da se ovdje pojave duplikati je prilično velika, jer na kartama dominiraju slike i blokovi s kraja na kraj, a jedinstveni sadržaj svedeno na minimum.

Označavamo u liniji Google pretraga fragment teksta iz opisa proizvoda, stavljen pod navodnike, i domen sajta sa operatorom site: (slika 3).

Mnogi vlasnici web stranica fokusiraju se prvenstveno na osiguravanje da je sadržaj jedinstven u usporedbi s drugim resursima. Međutim, ne biste trebali izgubiti iz vida prisustvo duplikata sadržaja unutar iste stranice. Ovo takođe ima snažan uticaj na rangiranje.

Šta je duplirani sadržaj

Ponavljajući ili duplicirani sadržaj su obimni blokovi teksta koji se poklapaju unutar stranice. različite stranice. Ovo nije nužno učinjeno sa zlonamjernom namjerom - češće se to događa iz tehničkih razloga, o čemu će se detaljnije govoriti u nastavku.

Opasnost je u tome što se često duplirani sadržaj ne može vidjeti golim okom, ali ga pretraživač savršeno vidi i reagira u skladu s tim.

Odakle dolazi duplirani sadržaj i gdje je najčešći?

Glavni razlozi za ovu pojavu:

Promjena strukture stranice;
Namjena u specifične svrhe(recimo, štampane verzije);
Pogrešne radnje programera i webmastera;
Problemi sa CMS-om.

Na primjer, dešava se uobičajena situacija: replytocom (odgovor na komentar) u WordPressu automatski generiše nove stranice s različitim URL-ovima, ali ne i sadržajem.

Tipično, dupli sadržaj se uočava prilikom kreiranja najava članaka na drugim stranicama sajta, objavljivanja recenzija, kao i kada postoje identični opisi proizvoda, kategorija i naslova.

Zašto je dupliranje sadržaja loše

Ponovljeni sadržaj ima analogiju iz oblasti ekonomije - prekoračenje u banci. Tu se troši takozvani puzajući budžet. Ovo je broj stranica resursa koje se mogu indeksirati u određenom vremenskom periodu. pretraživač. Resurs je vrlo vrijedan i bolje ga je potrošiti na zaista važne i relevantne stranice nego na desetine duplikata identičnog teksta.

Dakle, dupli sadržaj pogoršava optimizaciju pretraživača. Osim toga, oni su izgubljeni prirodne veze i link juice unutar stranice je pogrešno distribuiran. I zaista relevantne stranice su zamijenjene.

Kako pronaći duplirani sadržaj na web stranici (ručno, programi i usluge)

Postoji specijalni programi za analizu resursa. Od njih, korisnici posebno ističu Netpeak Spider. Ona traži pune kopije stranice, podudaranja u naslovu ili opisu, naslovi. Druga opcija je Screaming Frog, koja ima sličnu funkcionalnost i suštinski se razlikuje samo po interfejsu. Tu je i Xenu's Link Sleuth aplikacija, koja radi na sličan način kao pretraživač i sposobna je prilično efikasno da pročešlja web lokaciju u potrazi za duplikatima.

Nažalost, ne postoje alati koji mogu u potpunosti pratiti sve duplikate teksta. Stoga ćete najvjerovatnije morati izvršiti ručnu provjeru. Evo liste mogućih faktora koji su izazvali problem:

Shvatili smo kako pronaći duplirani sadržaj. A najbolji pomagači U borbi protiv toga, to su 301 preusmjeravanje, Canonical URL oznake, upute u robots.txt, te parametri Nofollow i Noindex kao dio meta oznake “robots”.

Jedan od načina da brzo rešenje provjerite ima li dupliciranog sadržaja na web stranici pomoću napredne pretrage u Yandexu ili Googleu. Morate unijeti adresu stranice i dio teksta sa stranice koju ste odlučili provjeriti. Također možete koristiti brojne programe da provjerite jedinstvenost teksta:

Text.Ru;
eTXT Anti-plagijat;
Advego Plagiatus;
Content-Watch.

Kako se nositi s duplim sadržajem i očistiti ga

Još uvijek isto referentni sistem Google daje niz savjeta kako spriječiti pojavu ovog problema.

301. Kada pravite strukturne promjene na resursu, morate specificirati 301 preusmjeravanje u htaccess datoteci.
Koristi jedinstveni standard linkovi.
Sadržaj za određenu regiju najbolje je postaviti na domene vrhunski nivo nego na poddomenama ili poddirektorijumima.
Postavite željenu metodu indeksiranja koristeći Search Console.
Nemojte koristiti šablone. Umjesto postavljanja autorskog teksta na svaku stranicu, bolje je napraviti link koji će voditi na posebnu stranicu sa ovim tekstom.
Kada razvijate nove stranice, provjerite jesu li zatvorene od indeksiranja dok ne budu potpuno spremne.
Shvatite kako se tačno prikazuje vaš sadržaj - mogu postojati razlike u prikazu na blogovima i forumima.
Ako na web stranici ima mnogo sličnih članaka, bolje je ili spojiti njihov sadržaj u jednu cjelinu ili jedinstveni svaki od njih.

Pretraživači ne izriču nikakve sankcije prema sajtovima koji imaju dupliran sadržaj iz tehničkih razloga (za razliku od onih koji to rade namjerno kako bi manipulirali rezultatima pretraživanja ili zavarali posjetitelje).

Nakon što su duplikati izbrisani, ostaje samo da ih uklonite Rezultati pretrage. Yandex to radi sam, pod uslovom da je datoteka robots.txt ispravno konfigurisana. Što se tiče Googlea: morat ćete ručno postaviti pravila u Webmasteru, na kartici “URL Parameters”.

Zaključak

Borba protiv dupliranja sadržaja na web stranici važan je aspekt aktivnosti vlasnika bilo koje web stranice. Postoji dosta razloga za njegovu pojavu, a isto toliko načina da se ona otkloni.

Međutim, glavno pravilo ostaje: objavljujte isključivo originalni sadržaj, bez obzira na vrstu stranice. Čak i ako se radi o velikom lancu trgovine sa hiljadama stranica.

PRIMAJTE NAJAVE SLIČNIH OBJAVA NA SVOJ E-MAIL

Pretplatite se i primajte ne više od jednom sedmično nešto zanimljivo iz svijeta internet marketinga, SEO-a, promocije web stranica, online trgovina, zarađivanja novca na web stranicama.

Duplikat sadržaja pogoršava indeksiranje web stranice

“Različiti putevi vode do različitih mjesta, a samo jedan od njih je pravi.”

Zdravo, prijatelji! Dugo sam planirao da o ovoj temi razgovaram na stranicama svoje web stranice, pa sam, nakon što sam proučio dosta materijala o dupliciranju sadržaja i njegovim uzrocima, posljedicama i načinima otklanjanja ove negativne pojave, odlučio iznijeti svoje mišljenje o tome problem na mom skromnom resursu.

Budite strpljivi i pažljivo proučite sve preporuke u članku, a zatim provjerite status svojih resursa. Ako želite da vidite odlično rangiranje stranica vaše web stranice u pretraživačima, striktno ih pratite.

Ne tražeći sve mogući načini otklanjajući uzroke dupliciranja sadržaja, ipak ću predložiti da se najviše proučava važne tačke ovo pitanje.

Ako redovni korisnik(a ponekad i sam webmaster) možda neće primijetiti duplirani sadržaj na web stranici, ali pretraživači će to odmah otkriti. Njihova reakcija će biti jasna: sadržaj sa ovih stranica prestaće da bude jedinstven. A to već nije dobro, jer će negativno uticati na njihov rang.

Osim toga, dupliciranje zamagljuje težinu veze, na određenu objavu koju ste optimizacijom pokušali promovirati na TOP, poput odredišne stranice. Duplikati će jednostavno uništiti sve pokušaje optimizacije, a efekat međusobnog povezivanja će biti minimalan.

Šta je duplirani sadržaj?

1. Sadržaj koji je neko ili vi lično kopirao i objavljen na resursima trećih strana.

Na internetu možete pročitati mnogo članaka o tome kako se nositi s ukradenim sadržajem, jedna od opcija je i moj članak. Da li je moguće istrijebiti je retoričko pitanje i danas, po mom mišljenju, kardinalne odluke Ovaj problem ne postoji na internetu. Postoji samo nekoliko manje ili više efikasnih tehnika.

2. Sadržaj je duplikat koji webmaster kreira vlastitim rukama.

Potpuni (ili nepotpuni) duplikat prilikom distribucije informacija (ili, kako ih još zovu, najava) na posebnim stranicama i forumima. Ako želite da dobijete duplikat svog unosa na Internetu, duplirajte ga na nekom pristojnom resursu - rezultat će skoro uvek biti trenutan. Duplikat je moguć direktno na stranicama stranice. Jeste li ikada vidjeli dvije identične stranice na svojoj web stranici kada ste kreirali samo jednu? Zašto se ovo dešava? Razlozi uključuju uređivanje unosa ili spremanje nedovršenih u skice, a zatim nenamjerno kreiranje duplikata. Webmaster, a da to sam ne primijeti i naknadno ne pregleda sve svoje unose, kako ne bi otkrio duplikat, živi sretno do kraja života, ne sluteći da ima "blizance", "trojke" itd.

3. Dupliranje iz tehničkih razloga - pojava duplikata za koje je kriv CMS.

Ove greške se pojavljuju zato što programeri CMS-a ne razmišljaju kao pretraživači ili pretraživači, već misle kao što bi programeri web stranica trebali; Mnogi ljudi su krivi za to - Joomla, na primjer.

Da objasnim malo. Pretpostavimo da imate članak sa ključna fraza "duplicirani sadržaj". Trebalo bi da se nalazi na stranici sa sljedećom adresom: http://domain.ru/duplication of content/, ali bi isti sadržaj mogao biti prikazan, na primjer, ovako: http://domain.ru/article-category/duplication of content/. A ako uzmemo u obzir i druga umnožavanja, stranice, na primjer: http://domain.ru/duplication of content/?source=rss. Svi ovi URL-ovi su različite adrese za bilo koju, ali iste za korisnika (čitača). Ove razlike omogućavaju webmasteru da prati odakle je korisnik došao, ali također mogu uzrokovati štetu ako se ne rade ispravno. potrebna podešavanja indeksiranje.

Poznato je da web stranice rade zahvaljujući postojeći sistem Baza podataka. Postoji samo jedna verzija određenog članka (ID) u bazi podataka, ali skripte stranice dozvoljavaju prikaži ovaj članak iz baze podataka na različitim stranicama (URL). Ali pretraživačima je potreban dokument (URL) - samo je to jedinstveni identifikator i ništa više!

4. Fuzzy uzima.

Poseban tip umnožavanja koji se javlja uglavnom u online trgovinama, gdje se stranice s karticama proizvoda razlikuju samo u nekoliko rečenica s opisom, a sav ostatak sadržaja, koji se sastoji od blokova s kraja na kraj i drugih elemenata, je isti . Teško je kriviti webmastera, iako postoje neke opcije za njihovo uklanjanje.

Dakle, pozabavili smo se uzrocima i posljedicama duplih sadržaja. Sada pređimo na rješavanje problema. Prije svega, hajde da saznamo

Kako otkriti duple stranice?

1. Ručna metoda.

1) Ako vaš sadržaj nije prevelik, samo skrolujte kroz stranicu u admin panelu „Svi unosi» i, ako se pronađu duplikati, obrišite nepotrebne.

2) Da biste saznali prisutnost duplikata, možete koristiti usluge pretraživača "Yandex Webmaster" ili Google Webmaster Tools.

Na primjer, u Webmaster Tools otvorite stranicu “Alati za webmastere” - “Optimizacija” - “HTML optimizacija”: Ako postoje greške i duplikati, čarobnjak će vam sve pokazati. Shvatite to pomoću klikova, eliminišite greške i duplikate, istovremeno.

3) Koristite prozore za pretragu sistema direktno (približna metoda). Za svaku od njih unesite unos obrasca stranica: domain.ru i uporedi njihove rezultate. Ako se ne razlikuju mnogo, onda vaše dupliranje nije tako loše.

4) Postoji jedan efikasan način za pronalaženje duplikata - pretraživanje po fragmentima teksta. To se radi jednostavno: u prozoru za pretragu bilo kojeg sistema unesite fragment teksta Vaš unos (članak) u 10-20 riječi (po mogućnosti iz sredine) i analizirajte rezultat. Prisustvo dvije ili više stranica u rezultatima pretrage znači da postoje duplikati za ovaj opus. Ako ne, možete se malo radovati :).

Teško je ako stranica ima mnogo stranica. Gornja provjera može postati nepodnošljiva rutinski rad. Ako želite da minimizirate vremenske troškove, koristite program Xenu's Link Sleuth.

Da biste provjerili stranicu, morate je otvoriti novi projekat, odabirom “Check URL” iz “File” menija, unesite adresu i kliknite na “OK”. Nakon toga, program će početi obraditi sve URL-ove web stranice. Po završetku verifikacije potrebno je da eksportujete primljene podatke na bilo koji pogodan editor i počnite tražiti duplikate.

Kome treba link za preuzimanje fajla ovog programa, pišite u komentarima, poslaću vam ga na e-mail.

Dakle, saznali smo koji (glavni) razlozi dovode do dupliranja sadržaja. Sada odredimo kako to eliminirati.

Načini za uklanjanje duplikata sadržaja

Kanonski URL-ovi - konceptualno rješenje problema

Ako nemate opciju () za uklanjanje duplikata, problem se može riješiti pomoću oznake canonica l (koristi se za nejasne kopije). Kanonska oznaka je također pogodna za verzije stranice za štampanje iu drugim sličnim slučajevima. Primjenjuje se vrlo jednostavno - atribut rel=”canonical” je specificiran za sve kopije, ali ne i za glavnu stranicu, koja je najrelevantnija. Kôd bi trebao izgledati otprilike ovako: link rel=”canonical” href=”http://domain.ru/page-copy”/ i biti unutar oznake head.

Za korisnike sa WordPress engine Postoji sjajna prilika da sve ovo uradite automatski tako što ćete instalirati sve u jednom seo pack dodatak ili slično. U postavkama je ova operacija postavljena sa sljedećim oznakama:

Postavljanje disallow funkcija u datoteci robots.txt vaše web stranice

Iako postavljanje odbijanja stranica za indeksiranje nije uvijek efikasan način od duplikata, budući da ih pretraživači ponekad uspijevaju zaobići, ipak će pravilno konfiguriran robot.txt uvelike olakšati zadatak izbjegavanja.

WITHwwwili bezwww

Kako će izgledati stranice Vašeg sajta - samo uz to koristeći http ili http.www? Nesigurnost će stvoriti dupliciranje. Odmah nakon kreiranja stranice odredite koji ćete protokol za prijenos hiperteksta koristiti. Da biste to učinili, unesite svoj izbor u Yandex i Google webmaster panele (u Googleu se to može učiniti za obje verzije, ali ćete morati potvrditi prava na obje adrese). Možete ga ostaviti kao zadano ili "izbor robota za pretraživanje", ali je bolje da ga jasno definirate.

Postavljanje preusmjeravanja

301 preusmjeravanje je odlično za spajanje stranica za kopiranje čiji se URL-ovi razlikuju po prisutnosti i odsustvu www. Kao što ste već shvatili (pogledajte snimak ekrana iznad), postavljanje preusmjeravanja na WordPress je također pojednostavljeno pomoću dodatka. U suštini, ako ste se vi i robot za pretraživanje „odlučili“ o svom izboru – sa ili bez www ili bez njega postojaće glavna domena, postavljanje preusmjeravanja za sve stranice nije potrebno. Međutim, tema postavljanja preusmjeravanja i njegove izvodljivosti tema je posebnog članka.

Rezultati i zaključci

ne dozvolite dupliranje stranica (sadržaja) na vašim resursima, jer duplikati dovode do ozbiljnog smanjenja relevantnosti stranica, što otežava njihovo dovođenje u prvi plan u rezultatima pretrage (TOP);
Većina problema s umnožavanjem sadržaja ima rješenje - koristite sva moguća sredstva da to učinite;
Stalno pratite proces indeksiranja vašeg sadržaja i ne kreirajte duplikate na njemu

To je to, dragi čitaoče. Ako imate nešto da me dodate ili ispravite, postavite pitanje - iskoristite priliku!

Ne baš na temu, ali o blizancima.

(Posjećeno 28 puta, 1 posjeta danas)

Sigurno ste više puta čuli frazu „duplicirani sadržaj“ i vi, kao iskusni vlasnik web stranice, nikada ne biste objavili isti sadržaj dvaput, zar ne?

Duplikat sadržaja može se uporediti sa prekoračenjem u banci. Tek tada gubite svoj dragocjeni budžet za puzanje.

Budžet indeksiranja je broj stranica na web stranici koji robot za pretragu može skenirati određeni vremenski period. Zato je toliko važno da ga potrošimo na stranice koje su nam potrebne.

Manifestirajući se u različitim oblicima, duplirani sadržaj može biti jedan od najneuhvatljivijih i najnevidljivijih problema koji mogu negativno utjecati na rangiranje i promociju web stranice. Njegov izgled se često povezuje sa karakteristikama arhitekture sajta ili ograničenjima CMS-a.

Nažalost, ne postoji takva provera Google Webmaster e, koji bi lako mogao otkriti duplirani sadržaj. Čak i najnapredniji alati treće strane oni se ne nose uvijek dobro sa ovim zadatkom, posebno kada je izvor problema unutrašnji. Ručna provjera ne može se izbjeći.

Evo liste sa 8 potencijalnih razloga za pojavu duplikata stranica na sajtu:

HTTP i HTTPS stranice

Jedan od mnogih brze provjereČinjenica da imate dvije verzije stranice dostupne za indeksiranje je pokušaj da joj pristupite koristeći i HTTP i HTTPS protokole. Ako se obje verzije otvore, očito je da je vaš programer prebacio stranicu na HTTPS i nije postavio 301 preusmjeravanje sa HTTP verzije.

Prije nego što je Google počeo aktivno ohrabrivati webmastere da svoje web stranice u potpunosti prebace na HTTPS, mnogi su omogućili HTTPS samo na odvojene stranice kome je bilo potrebno dodatnu sigurnost, na primjer, stranice za prijavu ili stranice za transakcije. Ako je programer koristio relativne veze, onda svaki put kada robot za pretraživanje posjeti zaštićene stranice, prisiljen je dodati HTTPS svim URL-ovima, što na kraju dovodi do duplih stranica.

Na isti način morate provjeriti da li stranica ima dvije verzije stranica, i sa WWW i bez WWW. Ovaj problem možete riješiti postavljanjem 301 preusmjeravanja i navođenjem željene domene (glavnog ogledala) u Google Webmasteru.

Web stranice koje kradu vaš sadržaj

Dok ne postoji zakon koji će vam vratiti ukradeni sadržaj, postoje samo načini na koje možete koristiti kod kako biste otežali lopovima koji pokušavaju da odaju vaš sadržaj kao svoj. Da biste to učinili, uvijek koristite apsolutne veze na svojoj web stranici umjesto relativnih:

Apsolutne veze: http://seo.artox-media.ru/wiki/dublirovannyi-kontent.html (počinje protokolom i sadrži naziv stranice).
Relativni linkovi:/wiki/dublirovannyi-kontent.html (počinje od korijena stranice ili trenutnog dokumenta).

Zašto je to važno? Kada koristite relativne URL-ove, vaš pretraživač pretpostavlja da veza upućuje na stranicu na kojoj se već nalazite. Neki programeri preferiraju relativne URL-ove jer olakšavaju proces kodiranja.

Ako programer ne želi da prepiše cijelu stranicu, mogu se koristiti kanonske oznake koje se sami pozivaju. Kada se vaš sadržaj objavi na drugoj stranici, kanonske oznake mogu ostati, pomažući Googleu da utvrdi da je vaša web lokacija izvorni izvor sadržaja.

Da biste saznali da li je vaš sadržaj ukraden, možete koristiti bilo koji od njih besplatne usluge(na primjer, Siteliner, Copyscape. Etxt, AdvegoPlagiatus, itd.)

Napuštene poddomene

Recimo da ste se odlučili protiv poddomena i umjesto toga odlučili koristiti poddirektorij. Ili, na primjer, kreirali ste potpuno novu web stranicu. U svakom slučaju, vaš stari sadržaj može biti dostupan i, štoviše, može loše uticati na rangiranje novih stranica. Da biste riješili problem, najbolje je koristiti 301 preusmjeravanje s ove poddomene na novu stranicu/direktorij. Ovo je posebno važno ako vaš stari resurs ima veliku masu veza.

Skrivene stranice u izradi

Odlučili ste ažurirati svoj dizajn? Pripremate li svoju web stranicu za velike promjene? Ako prije toga niste blokirali indeksiranje svojih testnih stranica (a još više dev verzije stranice), onda niste imuni na činjenicu da ih robot neće otkriti.

Uobičajena je zabluda da nikome nikada neće pasti na pamet da unese neki izmišljeni URL na vašoj web stranici http://razrabotka.sait.ru/ u liniju preglednika; ako nigdje u kodu nema veze do njega, čini se da je ovo jednostavno je nerealno. Ali to nije istina! Google stalno traži i indeksira nove web stranice, uključujući i one u razvoju. Sve ovo može uticati na rezultate rangiranja i takođe dovesti u zabludu korisnike.

Ovo ne samo da uzrokuje ogromnu štetu web lokaciji u smislu privatnosti i sigurnosti, već može uzrokovati i ozbiljnu štetu budžetu za puzanje. Ovo je lako izbjeći: koristite meta oznaku robots s noindexom na svim test stranicama ili ih blokirajte u datoteci robots.txt.

ili

Obje opcije znače zabranu indeksiranja teksta i praćenja linkova na stranici.

Zapamtite da kada prebacujete stranice iz dev moda u način rada uživo, morate ukloniti ove direktive blokiranja iz koda.

Dinamički generirani parametri u URL-u

Najčešće se dinamički URL-ovi generišu na osnovu filtera koji se koriste na sajtu. Kako tačno izgledaju ovi URL-ovi?

URL 1: www.shop.com/chocolate/cake/vanilla
URL 2: www.shop.com/chocolate/cake/vanilla%8in
URL 3: www.shop.com/chocolate/cake/vanilla%8in=marble

Ovo je jednostavan primjer, međutim, vaš CMS može dodati razni parametri filtrira i generira nepotrebno duge nizove URL-ova koje može indeksirati web pretraživač.

Na ovaj način, Google može kreirati i indeksirati beskrajne kombinacije URL-ova koje korisnik ni ne zahtijeva.

IN u ovom slučaju, primijenite kanonsku oznaku sa vašim željenim URL-om i konfigurirajte postavke indeksiranja URL-a u Google Webmasteru.

Možete preskočiti ovaj korak i blokirati određene URL-ove u datoteci robots.txt pomoću znaka (*) kako biste spriječili indeksiranje bilo čega što je uključeno u indeks. specificirani direktorij. Na primjer: Disallow:/chocolate/cake/*

Mirror poddirektorijumi

Da li vaše poslovanje posluje u nekoliko regija? Neke kompanije odlučuju kreirati glavnu odredišnu stranicu koja omogućava korisnicima da odaberu regiju koja im najviše odgovara, a zatim ih preusmjerava na odgovarajući poddirektorij. Na primjer:

URL 1: www.wonderfullywhisked.com/fr
URL 2: www.wonderfullywhisked.com/de

Iako ovo može izgledati logično, razmislite da li zaista postoji potreba za ovim podešavanjem. Uostalom, dok ciljate različitu publiku, postoji šansa da će oba poddirektorija u potpunosti duplicirati jedan drugog u sadržaju. Da biste riješili ovaj problem, koristite Google Webmaster za postavljanje geografskog ciljanja.

Sindikacija sadržaja

Sindikacija sadržaja - ponovo koristiti isti sadržaj na različitim resursima kako biste promovirali svoju web stranicu/brend/sadržaj i privukli dodatni promet.

Sindikacija je na odličan način uvesti nova publika Međutim, s vašom web lokacijom vrijedi definirati pravila ko će ponovo objaviti vaš sadržaj.

U idealnom slučaju, od izdavača bi trebalo tražiti da koriste atribut “rel=canonical” na stranici sa sadržajem za označavanje tražilice da je vaša web stranica izvorni izvor sadržaja. Osim toga, oni također mogu spriječiti indeksiranje sadržaja, što će pomoći u rješavanju potencijalnih problema s dupliranjem u rezultatima pretraživanja.

Uostalom, izdavači se mogu vratiti na originalni članak, navodeći vas kao izvorni izvor.

Povezani sadržaj

Sličan sadržaj može uzrokovati isto toliko štete kao i duplirani sadržaj. IN Google definicija fraza "suštinski slično" pojavljuje se čak iu vezi sa dupliranim sadržajem. I iako se dijelovi materijala mogu razlikovati u sintaksi, opšte pravilo je da ako možete izvući iste informacije od njih, onda nema razloga da oboje postoje na web stranici. Ovdje je odlično rješenje problema korištenje kanonske oznake ili razmatranje spajanja ovih dijelova sadržaja u jedan.

zaključci

Vrlo je važno pratiti pojavu dupliranog sadržaja na stranici kako biste izbjegli trošenje vašeg budžeta za indeksiranje, jer to sprječava robota da pretražuje i indeksira nove stranice koje su vam potrebne. U ovom slučaju, najbolji alati Vaš arsenal može uključivati kanonske oznake, 301 preusmjeravanja, nofollow/noindex atribute u meta oznaci “robots” i direktive u datoteci robots.txt. Radite na identifikaciji i uklanjanju dupliciranog sadržaja dodavanjem ovih kontrolnih tačaka vašoj SEO reviziji.