Kako postaviti pametne telefone i računala. Informativni portal
  • Dom
  • Programi
  • Duplicirani sadržaj. Duplicirani sadržaj

Duplicirani sadržaj. Duplicirani sadržaj

Dvostruki sadržaj jedan je od glavnih problema niskog rangiranja web stranice u tražilicama. Ovaj problem je uzrokovan prisutnošću na stranici stranica koje su potpuno ili djelomično identične jedna drugoj. Naravno, za tražilice prisutnost bezvrijednih stranica na web stranici predstavlja ozbiljan problem, budući da moraju trošiti snagu poslužitelja da ih obrade. Nema smisla da tražilice troše fizičke resurse na indeksiranje takvog beskorisnog sadržaja. Stoga se protiv takvih stranica bore primjenom filtra na njih ili snižavanjem rangiranja, što dovodi do niskih pozicija za promovirane upite.

Duplikati i SEO

Prisutnost dupliciranih stranica na web mjestu dovodi do sljedećeg:

  • Korisni sok veza se troši na ove beskorisne stranice.
  • Nakon sljedećeg ažuriranja, duplicirana stranica istiskuje ciljnu stranicu i gubi poziciju.
  • Dvostruki sadržaj smanjuje jedinstvenost svih stranica na kojima je objavljen.
  • Budući da se tražilica bori protiv takvih stranica uklanjajući ih iz pretraživanja, također može isključiti stranicu koja se promovira.

Klasifikacija duplikata i rješenja za njihovo uklanjanje

Duplikati mogu biti potpuni ili djelomični. Potpuni duplikati su kada su stranice potpuno identične. Sukladno tome, djelomični duplikati su kada se stranice ne podudaraju u potpunosti. Potpuni duplikati eliminiraju se kroz robots.txt i postavljanjem 301 preusmjeravanja. Djelomični duplikati uklanjaju se potrebnim izmjenama na stranici.

Evo popisa kontrolnih popisa koje morate proći kako biste identificirali i riješili problem duplikata:

  • Potražite duplikate glavne stranice web mjesta. Na primjer, mogu postojati sljedeće opcije početne stranice: http://www.domen.com/, http://www.domen.com/index.php, http://www.domen.com, http:/ /domen. com/, https://www.domen.com/, http://www.domen.com/index.html. Kao što vidite, postoji mnogo opcija, ali optimalna opcija je http://www.domen.com/. Kako bi se uklonile druge kopije glavne stranice, koristi se 301 preusmjeravanje i zatvaranje u robots.txt (u slučaju struktura poput https://www.domen.com/.
  • Provjera temeljnog (zlatnog pravila SEO-a) - svaka stranica treba biti dostupna samo na jednoj adresi. Adrese ne mogu varirati kako slijedi: http://www.domen.com/stranica1/stranica2/ i http://www.domen.com/stranica2/stranica1/.
  • Provjera prisutnosti varijabli u URL-u. Ne smiju biti u adresi stranice. Na primjer, generiranje URL-ova poput: http://www.domen.ru/index.php?dir=4567&id=515 je pogreška. Ispravan URL bi bio: http://www.domen.ru/dir/4567/id/515.
  • Provjera prisutnosti identifikatora sesije u URL-ovima. Na primjer, URL-ovi poput http://www.domen.ru/dir/4567/id/515.php?PHPSESSID=3451 su neprihvatljivi. Takvi URL-ovi sadrže beskonačan broj kopija svake stranice. Stoga je potrebno zatvoriti sve identifikatore sesije u robots.txt.

Pozdrav prijatelji! Dvostruki sadržaj na web stranici kroničan je u e-trgovini. Čini se da svaka platforma, bez obzira na to koliko je optimizirana za , stvara neki oblik materijala koji se ponavlja, sprječavajući stranicu da postigne vrhunsku izvedbu.

Kako dvostruki sadržaj na web stranici ubija SEO

Prvo, shvatimo što je duplicirani sadržaj. Možda nije točno ono što mislite.

Suprotno uvriježenom mišljenju, ne postoje kazne za duplicirani sadržaj. Još 2008. Google je na svom blogu napisao: “Postavimo sve na svoje mjesto jednom zauvijek, dečki. Jednostavno ne postoji takva stvar kao što je kazna za duplicirani sadržaj.”

Pa ipak postoji vrlo stvaran, ali manje vidljiv problem s ovom vrstom sadržaja. Algoritamsko slabljenje ili pogoršanje performansi događa se na svim vrstama stranica koje sadrže sadržaj koji se ponavlja.

Dvostruki sadržaj na web-mjestu natječe se sam sa sobom za ključne riječi iste teme i dijeli težinu veze između dvije ili više stranica.

Dvije stvari izravno ukazuju na važnost u tražilicama:

  1. relevantnost
  2. vlast

Imati više od jedne stranice koja cilja istu stvar čini ih sve manje relevantnim za tražilice, jer im je teško odrediti koju će stranicu rangirati. A budući da je više stranica povezano istim ključevima, veze koje bi mogle podržati jednu stranicu umjesto toga slabo podržavaju svaku od tih stranica, ne donoseći nikakvu korist nijednoj od njih.

Slabljenje u ovom slučaju znači slabije signale koje stranica šalje tražilicama, što utječe na njezinu sposobnost rangiranja.

Zašto za to nema kazni?

U svijetu Googlea, kazne ručno dodjeljuje stvarna osoba u odjelu za web kvalitetu sustava kada određena stranica ili web mjesto potpada pod utvrđenu definiciju neželjene pošte. Netko mora fizički sankcionirati resurs ako je to doista kazna. Slabljenje je algoritamske prirode i teže ga je otkriti jer vas Google na to neće upozoriti, kao što je slučaj s ručno postavljenom kaznom putem Google Search Consolea.

Neželjena dejstva

Problem s uklanjanjem dupliciranog sadržaja je taj što jednostavno brisanje stranica može imati nekoliko neželjenih učinaka.

U nekim slučajevima, vaši kupci trebaju vidjeti ove stranice. Razvrstane rešetke pregledavanja, stranice popisa želja, stranice za ispis itd. tehnički mogu biti dvostruki sadržaj. Uklanjanje ovih stranica moglo bi naštetiti vašem klijentu, a možda i vašem prihodu.

Autoritet veze

Svaki indeksirani URL ima određenu težinu. Jednostavno ubijanje stranica u konačnici rezultira gubitkom autoriteta veze, a ironično, pokušavajući pomoći svom SEO-u, zapravo ćete ga povrijediti.

Cilj je točno odrediti što trebate postići:

  1. Želite li ukloniti stranicu za tražilice, ali je zadržati za kupce?
  2. Trebate li eliminirati stranicu i za kupce i za tražilice?
  3. Je li važnije odmah se riješiti stranice (zbog pravnih ili drugih razloga), bez obzira na njezin utjecaj na SEO, ili pokušavate poboljšati SEO kroz planirane akcije?

Sljedeća tablica pomoći će vam u procesu donošenja odluke.

7 načina da se riješite dupliciranog sadržaja

Prvi na listi je 301 redirect, zvijezda SEO-a. Kad god je to moguće, koristite ovu metodu za uklanjanje dupliciranog sadržaja, jer je to jedini način da postignete kombinaciju preusmjeravanja bota i klijenta, prosljeđivanjem veze na novi URL i uklanjanjem starog. Za razliku od nekih drugih opcija, 301 preusmjeravanje je naredba tražilicama, a ne samo zahtjev koji se može ignorirati.

Ako vaš razvojni tim izbjegava ovu metodu ili ako kupci moraju nastaviti vidjeti stranicu koju tražilice smatraju dvostrukim sadržajem, isprobajte Canonical oznake kao zamjenu. Oni i dalje zahtijevaju podršku programera, ali će zahtijevati manje testiranja tijekom implementacije i manje korištenja resursa poslužitelja kako bi ih održali na životu. Međutim, imajte na umu da Google može ignorirati kanonske oznake ako misli da ste pogriješili ili jednostavno smatra da ih nema potrebe poštovati iz nekog algoritamskog razloga.

Treće na popisu je preusmjeravanje 302, iako je samo na popisu jer je povezano sa svemogućim preusmjeravanjem 301. Prema Googleovom inženjeru Johnu Muelleru, preusmjeravanja 302 preusmjeravaju autoritet veze, ali 99% vremena nema razloga testirati tu teoriju jer 301 preusmjeravanje daje više za isti trud. Razlog za korištenje 302 preusmjeravanja može biti situacija u kojoj je potrebno privremeno preusmjeravanje i Google ne treba deindeksirati stranicu jer će se uskoro vratiti.

Izbrisani sadržaj je štetan

Preostale četiri metode samo deindeksiraju sadržaj. Oni ne preusmjeravaju niti kupca, niti prenose ovlasti veze na drugu stranicu. Stoga ih upotrijebite ako su jedina održiva opcija, jer uništavanje stranica bez preusmjeravanja s njih troši resurse veza.

Autoritet veze— najvrjedniji proizvod koji je teško pronaći u prirodnom pretraživanju. Možete stvoriti izvrstan sadržaj, možete optimizirati svoj na svojoj web stranici, stavljajući autoritet tamo gdje je potreban. Ali etično povećanje težine vaše veze, uz doista raznoliku i renomiranu kolekciju vanjskih stranica, zahtijeva rijetku kombinaciju sreće, digitalnog dosega, odnosa s medijima, izvanmrežnog marketinga itd. Malo je mjesta koja su to uspjela učiniti.

Ako trebate ugasiti stranicu, odlučite trebate li je se riješiti isključivo zbog SEO razloga (npr. duplicirani sadržaj) ili iz pravnih razloga (npr. nitko je više ne smije vidjeti). Ako ga samo želite privremeno isključiti iz Googlea, to možete brzo i jednostavno učiniti u Google Search Consoleu pomoću alata za uklanjanje URL-ova (Google indeks > Ukloni URL-ove). Korisnicima će stranica i dalje biti vidljiva prilikom pregledavanja, ali će je Google odmah ukloniti iz indeksiranja.

Budite oprezni s ovim alatom. Ako se nepravilno koristi, može deindeksirati cijelu vašu stranicu.
Jedini način da se stranica isključi iz pristupa ljudima i botovima je da se ona ukloni s poslužitelja, čime se uzrokuje da URL izbaci pogrešku 404 Datoteka nije pronađena ili, koristeći preusmjeravanje 301, preusmjeri na novi URL.

Meta oznake noindex za robote i tim roboti.txt disallow je zadnji na ovom popisu iz više razloga:

To je sve za danas, sretno svima i vidimo se opet!

Tražilice poput Googlea suočavaju se s problemom - a zove se "dvostruki sadržaj". Sadržaj se naziva duplikatom ako se pojavljuje u sličnom obliku na različitim mjestima na globalnom internetu (na različitim URL-ovima), zbog čega tražilice ne znaju koji URL prikazati u rezultatima pretraživanja. To može imati negativan utjecaj na rangiranje web stranice, a kada se ljudi počnu povezivati ​​na različite verzije istog sadržaja, problem se samo pogoršava.

Ovaj će vam članak pomoći razumjeti uzroke dupliciranog sadržaja i dati vam uvid u to što je potrebno učiniti u svakom konkretnom slučaju.

Što je duplicirani sadržaj?

Dvostruki sadržaj može se usporediti s raskrižjem na kojem prometni znakovi pokazuju u različitim smjerovima za istu lokaciju: kojom rutom trebate ići? Da stvar bude gora, krajnje odredište je također drugačije, samo malo. Kao čitatelju, nije vam stalo koliko ste dobili ono po što ste došli, ali tražilica mora odabrati koju će stranicu prikazati u rezultatima pretraživanja jer, naravno, ne želi ponavljati isti sadržaj.

Recimo da se vaš članak o "ključnoj riječi x" pojavljuje nepromijenjen na adresama I http://www.example.com/article-category/keyword-x/. Situacija nije nevjerojatna: to se događa u mnogim modernim sustavima za upravljanje sadržajem. Onda je, recimo, vaš članak preuzelo nekoliko blogera, neki povezujući na prvi URL, a drugi na drugi. Ovo je upravo trenutak kada problem tražilice pokazuje svoju pravu prirodu - tiče se i vas. Dvostruki sadržaj je vaš problem jer te veze promiču različite URL-ove. Ako su povezivali na isti URL, šanse za rangiranje "ključne riječi x" bile bi veće.

1 Razlozi za duplicirani sadržaj

Postoje deseci razloga zašto se pojavljuje dupli sadržaj. Većina njih je tehničke prirode: rijetko se događa da osoba odluči objaviti isti sadržaj na dva različita mjesta, a da nije jasno koji je od njih originalan – većini nas to se čini neprirodnim. Međutim, postoji mnogo tehničkih razloga, a oni proizlaze uglavnom iz razloga što programeri razmišljaju na svoj način - ne kao preglednici, pa čak ni kao korisnici, da ne spominjemo pauke pretraživanja - oni razmišljaju kao programeri. Uzmimo, na primjer, ranije spomenuti članak koji se nalazi na http://www.example.com/keyword-x/ i http://www.example.com/article-category/keyword-x/. Pitate li programere za mišljenje, uvjerit će vas da ovdje postoji samo jedan članak.

1.1 Pogrešno razumijevanje koncepta URL-a

Ne, programeri nisu ludi, samo govore drugim jezikom. Najvjerojatnije će stranica biti podržana CMS sustavom za upravljanje sadržajem, a njena baza podataka sadržavat će samo jedan članak, ali će softver web stranice omogućiti pristup ovom članku putem više URL-ova. Do nesporazuma dolazi jer je s gledišta programera jedinstveni identifikator za članak ID koji mu je dodijeljen u bazi podataka, a ne neka vrsta URL-a. Ali za tražilicu, URL je jedinstveni identifikator sadržaja. Ako programerima objasnite situaciju, oni će početi shvaćati bit problema, a nakon čitanja članka možete im čak dati i gotovo rješenje.

1.2 ID-ovi sesija

Često želite pratiti radnje svojih posjetitelja i omogućiti im, na primjer, spremanje željenih artikala u svoju košaricu. Da biste to postigli morate im omogućiti "seansu". Sesija je kratka povijest aktivnosti posjetitelja na vašoj stranici, koja može uključivati ​​prethodno navedene stavke u košarici i slično. Da biste spremili sesiju aktivnosti korisnika (dok se on i dalje pomiče stranicama stranice), morate negdje pohraniti jedinstveni identifikator sesije, koji se također naziva ID sesije. Najčešće rješenje je korištenje kolačića, no tražilice ih obično ne spremaju.

U tom slučaju neki sustavi prestaju koristiti ID-ove sesije u URL-u. To znači da je URL-u svake interne veze na web-mjestu dodijeljen ID sesije, a budući da je taj ID jedinstven za sesiju, to dovodi do stvaranja novih URL-ova i stoga dupliciranog sadržaja.

1.3 URL parametri koji se koriste za praćenje i sortiranje

Drugi razlog za duplicirani sadržaj je korištenje URL parametara koji ne mijenjaju sadržaj same stranice, kao što je veza za praćenje. Vidite, za tražilicu, URL-ovi http://www.example.com/keyword–x/ I http://www.example.com/keyword-x/? izvor=rss su različiti. To vam može omogućiti da pratite koji je resurs doveo posjetitelje, ali vam u isto vrijeme otežava rangiranje - što je vrlo neželjena posljedica!

To se, naravno, ne odnosi samo na parametre praćenja, već na sve parametre koji se mogu dodati URL-u, a koji ne mijenjaju suštinski važan dio sadržaja. I nije važno za što se ovaj parametar koristi, bile to "promjene u sortiranju za kategoriju proizvoda" ili "prikazivanje druge bočne trake" - bilo koji od njih uzrokuje pojavu dupliciranog sadržaja.

1.4 Scrappers i prijenos sadržaja

Većinom je duplicirani sadržaj ili vaša ili vaša vlastita krivnja. Međutim, ponekad vaš sadržaj dijele druge web stranice, s ili bez vašeg pristanka. Ne povezuju se uvijek s izvornim izvorom, zbog čega se tražilica bavi još jednom verzijom istog članka. Što vaša stranica postaje popularnija, privlači više skrapera, čineći problem sve gorim i gorim.

1.5 Redoslijed parametara

Još jedan uobičajeni razlog je taj što CMS ne koristi lijepe čiste URL-ove, već URL poput / ?id=1&cat=2, u kojem se "ID" odnosi na članak, a "mačka" na kategoriju. URL /?cat=2&id=1 prikazat će isti rezultat većini sustava web stranica, ali će tražilici rezultati biti potpuno drugačiji.

1.6 Paginacija komentara

U mom omiljenom WordPressu, kao iu nekim drugim sustavima za upravljanje sadržajem, postoji opcija za paginaciju komentara. To dovodi do dupliciranog sadržaja na URL-u članka, budući da se /stranica-komentara-1/, /stranica-komentara-2/ itd. dodaju URL-u članka.

1.7 Verzija stranica za ispis

Ako sustav za upravljanje sadržajem stvori verziju stranica za ispis i na njih se povežete iz svog članka, Google će ih vjerojatno pronaći (naravno, osim ako nisu namjerno blokirane). Sada si iskreno odgovorite: koju biste verziju radije vidjeli u rezultatima Google pretraživanja? Verziju s vašim oglasima i popratnim sadržajem ili onu sa samo člankom?

1.8 sa i bez WWW

Taj je razlog star koliko i svijet, ali ako su dostupne obje verzije WWW-a i bez WWW-a, tražilice tu i tamo (iako ne često) i dalje percipiraju odgovarajući sadržaj kao dupliciran. Drugi razlog (ne tako popularan, ali s kojim sam se također susreo) je HTTP i duplicirani sadržaj.

2 Idejno rješenje: "kanonski" URL

Kao što smo već naučili, kada više URL-ova upućuje na isti sadržaj, javlja se problem, no on se ipak može riješiti. Jedna osoba koja radi na publikaciji ne bi trebala imati problema objasniti koji bi trebao biti "ispravan" URL za određeni članak, ali ako pitate tri osobe iz iste tvrtke, možete dobiti potpuno različite odgovore...

Ovaj problem se može riješiti samo pomoću adresiranja, jer, kako god bilo, može postojati samo jedan URL. Takav "ispravan" URL za određeni sadržaj tražilice smatraju kanonskim.

Ironična primjedba

Kanonski“ je pojam proizašao iz rimokatoličke tradicije prema kojoj je nastao popis svetih knjiga koji je prihvaćen kao vjerodostojan. Postali su poznati kao kanonsko evanđelje Novog zavjeta. Ironično, Rimokatoličkoj crkvi trebalo je gotovo 300 godina i mnogo bitaka da uspostavi ovaj kanonski popis. Na kraju su se složili oko četiri verzije iste priče...

3 Identificiranje problema s dvostrukim sadržajem

Možda ne znate što je uzrokovalo pojavljivanje vašeg dupliciranog sadržaja, je li to web mjesto ili sam sadržaj? Postoji nekoliko načina da to saznate.

3.1 Google Search Console

Google Search Console izvrstan je alat za prepoznavanje dupliciranog sadržaja. Idite na Search Console za svoju stranicu, zatim Search View -> HTML Improvements, i vidjet ćete sljedeće:

Gotovo je uvijek loša stvar imati stranice s dvostrukim naslovima ili deskriptorima. Nakon klika, pronaći će se URL-ovi s dvostrukim naslovima ili oznakama, što će vam pomoći da identificirate problem. U slučaju da imate članak poput onog koji smo ranije spomenuli (ključna riječ X) i pojavljuje se u dvije kategorije, može imati različite naslove. Na primjer, "Ključna riječ X – Kategorija X – Primjer web-mjesta" i "Ključna riječ X – Kategorija Y – Primjer web-mjesta". Google ove naslove neće smatrati duplikatima, ali ih je moguće pronaći pretraživanjem.

3.2 Traženje naslova ili isječaka

Postoji nekoliko operatora pretraživanja koji su vrlo korisni u slučajevima kao što je gore opisani. Ako želite pronaći sve URL-ove vaše web stranice koji sadrže članak "ključna riječ X", trebate unijeti sljedeći izraz u Google pretraživanje:

site:example.com intitle:"Ključna riječ X"

Google će vam zatim prikazati sve stranice identificirane na example.com koje sadrže navedenu ključnu riječ. Što je naslov precizniji, to će biti lakše ukloniti dvostruki sadržaj. Ovu metodu možete koristiti za prepoznavanje dupliciranog sadržaja na internetu. Ako je, na primjer, puni naslov vašeg članka "Ključna riječ X - zašto je to cool", upotrijebili biste izraz:

intitle:"Ključna riječ X - zašto je to cool"

A Google će vam dati sve stranice koje spadaju pod ovaj naslov. Ponekad ima smisla pretražiti čak i samo jednu ili dvije pune rečenice vašeg članka, budući da neka strugala mogu promijeniti naslov. U nekim slučajevima takvo pretraživanje može rezultirati prikazivanjem sljedeće obavijesti na posljednjim stranicama Google pretraživanja:

Ovo je znak da je Google već zauzet uklanjanjem dupliciranog sadržaja. Ali to još uvijek nije dovoljno, stoga vrijedi slijediti poveznicu i pogledati sve ostale rezultate da vidite mogu li se barem neki od njih ispraviti.

4 Praktična rješenja u vezi s duplim sadržajem

Nakon što odlučite koji je URL kanonski za određeni dio vašeg sadržaja, trebate prijeći na proces kanonikalizacije ("da, znam" pokušajte to izgovoriti tri puta brzo i naglas). To znači da moramo obavijestiti tražilice o kanonskoj verziji stranice i omogućiti im da je pronađu što je brže moguće. Postoje četiri moguća rješenja, prema redoslijedu prednosti, to su:

  1. Nemojte stvarati dupli sadržaj
  2. Preusmjerite duplicirani sadržaj na kanonski URL
  3. Dodajte atribut rel=canonical stranici s dvostrukim sadržajem
  4. Dodajte HTML poveznicu sa stranice s dvostrukim sadržajem na kanonsku verziju stranice

4.1 Kako izbjeći dupli sadržaj

Neki od gore navedenih razloga za duplicirani sadržaj mogu se lako ukloniti:

  • Imaju li vaši URL-ovi ID-ove sesije?Često ih jednostavno možete isključiti u postavkama sustava.
  • Imate li verzije stranica za ispis? Nema potrebe za njima: samo trebate koristiti CSS stilove za ispis.
  • Koristite li paginaciju komentara u WordPressu? Samo trebate onemogućiti ovu značajku (u odjeljku postavki na 99% stranica).
  • Ostaje li redoslijed parametara isti? Recite svom programeru da napiše skriptu koja će uvijek poredati parametre (često se naziva "URL tvornica").
  • Ima li problema s praćenjem veza? U većini slučajeva možete primijeniti praćenje hashtagova umjesto korištenja parametara.
  • Imate li problema s "WWW i ne-WWW"? Odaberite jednu, a zatim preusmjerite na preostalu adresu. Također možete podesiti postavke koristeći Google Webmaster Tools, ali morate posjedovati obje verzije naziva domene.

Čak i ako rješavanje vašeg problema nije lako, trud se možda isplati. Cilj bi trebao biti spriječiti dupli sadržaj jer je to daleko najbolje rješenje.

4.2 301 preusmjeravanje dupliciranog sadržaja

Postoje trenuci kada jednostavno nije moguće u potpunosti izbjeći sustav od korištenja netočnih URL-ova (za sadržaj), ali to mogu biti slučajevi u kojima se mogu koristiti preusmjeravanja. Ako mislite da ovo nema smisla (mogu vas razumjeti), samo zapamtite ovo kada razgovarate s programerima. Dok radite na rješavanju problema s dupliciranim sadržajem, provjerite jeste li preusmjerili sav duplicirani sadržaj sa starih URL-ova na kanonske URL-ove.

4.3 Korištenje poveznica

Ponekad, čak i ako znate da je URL pogrešan, ne želite se ili ne možete riješiti duple verzije članka. Kako bi riješili ovaj problem, tražilice predstavljaju kanonski element veze koji se nalazi u dijelu zaglavlja vaše stranice i izgleda ovako:

veza rel=”canonical” href=”http://example.com/wordpress/seo-plugin/

Atribut href kanonske veze je mjesto gdje svom članku dodjeljujete točan kanonski URL. Kada tražilica koja podržava kanonske veze naiđe na takav element, ona izvodi 301 preusmjeravanje, čime se praktički sva vrijednost koju je stranica zaradila daje njenoj kanonskoj verziji.

Istina je da će biti brže izravno koristiti preusmjeravanje 301 i stoga, ako imate izbora, morate mu dati prednost.

Zasigurno ste više puta čuli izraz "dvostruki sadržaj" i vi, kao iskusni vlasnik web stranice, nikada ne biste dva puta objavili isti sadržaj, zar ne?

Dvostruki sadržaj može se usporediti s bankovnim prekoračenjem. Samo tada uzalud trošite svoj vrijedni proračun za indeksiranje.

Proračun indeksiranja je broj stranica na web stranici koje robot za pretraživanje može indeksirati u određenom vremenskom razdoblju. Zato je jako važno potrošiti ga na stranice koje su nam potrebne.

Manifestirajući se u različitim oblicima, dvostruki sadržaj može biti jedan od najneuhvatljivijih i najnevidljivijih problema koji može negativno utjecati na rangiranje i promociju web stranice. Njegov izgled često je povezan sa značajkama arhitekture stranice ili ograničenjima CMS-a.

Nažalost, u Google Webmasteru ne postoji alat za provjeru koji bi lako otkrio dvostruki sadržaj. Čak ni najnapredniji alati trećih strana ne obavljaju uvijek dobro ovaj zadatak, osobito kada je izvor problema unutarnji. Ručna provjera se ne može izbjeći.

Ovdje je popis s 8 mogućih razloga za pojavu dupliciranih stranica na web mjestu:

HTTP i HTTPS stranice

Jedna od najbržih provjera imate li dvije verzije stranice dostupne za indeksiranje jest da joj pokušate pristupiti pomoću HTTP i HTTPS protokola. Ako se otvore obje verzije, očito je da je vaš programer prebacio web mjesto na HTTPS i nije postavio preusmjeravanje 301 s HTTP verzije.

Prije nego što je Google počeo aktivno poticati webmastere da svoje web stranice u potpunosti prebace na HTTPS, mnogi su omogućili HTTPS samo na određenim stranicama koje su trebale dodatnu sigurnost, kao što su stranice za prijavu ili transakcijske stranice. Ako je programer koristio relativne veze, svaki put kada robot za pretraživanje posjeti zaštićene stranice, prisiljen je dodati HTTPS svim URL-ovima, što u konačnici dovodi do dupliciranih stranica.

Na isti način treba provjeriti ima li stranica dvije verzije stranica, sa WWW i bez WWW. Ovaj problem možete riješiti postavljanjem 301 preusmjeravanja i navođenjem željene domene (glavnog ogledala) u Google Webmasteru.

Web stranice koje kradu vaš sadržaj

Sve dok ne postoji zakon koji vam ukradeni sadržaj vraća, postoje samo načini na koje možete upotrijebiti kod kako biste otežali posao lopovima koji pokušavaju vaš sadržaj predstaviti kao svoj. Da biste to učinili, uvijek koristite apsolutne veze na svojoj web stranici umjesto relativnih:

Apsolutne veze: http://seo.artox-media.ru/wiki/dublirovannyi-kontent.html (počinje protokolom i sadrži naziv stranice).
Relativne veze:/wiki/dublirovannyi-kontent.html (počinje od korijena stranice ili trenutnog dokumenta).

Zašto je to važno? Kada koristite relativne URL-ove, vaš preglednik pretpostavlja da veza upućuje na stranicu na kojoj se već nalazite. Neki programeri preferiraju relativne URL-ove jer olakšavaju proces kodiranja.

Ako programer ne želi ponovno napisati cijelu web-lokaciju, mogu se koristiti samoreferencirajuće kanonske oznake. Kada se vaš sadržaj objavi na drugoj web stranici, kanonske oznake mogu ostati, pomažući Googleu da utvrdi da je vaša web stranica izvorni izvor sadržaja.

Da biste saznali da je vaš sadržaj ukraden, možete koristiti bilo koji od besplatnih servisa (primjerice, Siteliner, Copyscape. Etxt, AdvegoPlagiatus itd.)

Napuštene poddomene

Recimo da ste se odlučili protiv poddomene i umjesto toga odlučili koristiti poddirektorij. Ili ste, na primjer, izradili potpuno novu web stranicu. U svakom slučaju, vaš stari sadržaj može biti dostupan i, štoviše, može loše utjecati na rangiranje novih stranica. Da biste riješili problem, najbolje je koristiti 301 preusmjeravanje s ove poddomene na novu stranicu/direktorij. Ovo je posebno važno ako vaš stari resurs ima veliku masu veza.

Skrivene stranice u izradi

Odlučili ste ažurirati svoj dizajn? Pripremate li svoju web stranicu za velike promjene? Ako prije toga niste blokirali indeksiranje svojih testnih stranica (a još više dev verzije web-mjesta), tada niste imuni na činjenicu da ih robot neće otkriti.

Postoji uobičajena zabluda da nitko nikada neće pasti na pamet unijeti neki fiktivni URL na vašoj web stranici http://razrabotka.sait.ru/ u redak preglednika; ako nigdje u kodu ne postoji poveznica na njega, čini se da ovo jednostavno je nerealno. Ali to nije istina! Google neprestano traži i indeksira nove web stranice, uključujući i one u razvoju. Sve to može utjecati na rezultate rangiranja i dovesti korisnike u zabludu.

Ovo ne samo da uzrokuje veliku štetu web-mjestu u smislu privatnosti i sigurnosti, već također može uzrokovati ozbiljnu štetu proračunu za indeksiranje. To je lako izbjeći: koristite meta oznaku robots s noindex na svim testnim stranicama ili ih blokirajte u datoteci robots.txt.


ili

Obje opcije znače zabranu indeksiranja teksta i praćenja poveznica na stranici.

Imajte na umu da kada migrirate stranice iz dev moda u live mode, trebate ukloniti ove blokirajuće direktive iz koda.

Dinamički generirani parametri u URL-u

Najčešće se dinamički URL-ovi generiraju na temelju filtara koji se koriste na stranici. Kako točno ti URL-ovi izgledaju?

URL 1: www.shop.com/chocolate/cake/vanilla
URL 2: www.shop.com/chocolate/cake/vanilla%8in
URL 3: www.shop.com/chocolate/cake/vanilla%8in=marble

Ovo je jednostavan primjer, no vaš CMS može dodati različite opcije filtra i generirati nepotrebno duge URL nizove koji mogu biti uključeni u proces indeksiranja.

Na taj način Google može stvoriti i indeksirati beskonačne kombinacije URL-ova koje korisnik niti ne zahtijeva.

U tom slučaju primijenite kanonsku oznaku koja označava željeni URL i konfigurirajte postavke indeksiranja URL-a u Google Webmasteru.

Možete preskočiti ovaj korak i blokirati određene URL-ove u svojoj robots.txt datoteci pomoću znaka (*) kako biste spriječili da bilo što unutar navedenog direktorija bude indeksirano. Na primjer: Disallow:/chocolate/cake/*

Mirror poddirektorije

Posluje li vaša tvrtka u nekoliko regija? Neke tvrtke odlučuju izraditi glavnu odredišnu stranicu koja korisnicima omogućuje odabir regije koja im najviše odgovara, a zatim ih preusmjerava na odgovarajući poddirektorij. Na primjer:

URL 1: www.wonderfullywhisked.com/fr
URL 2: www.wonderfullywhisked.com/de

Iako se ovo može činiti logičnim, razmislite postoji li doista potreba za ovom postavom. Uostalom, dok ciljate na različite publike, postoji mogućnost da će se oba poddirektorija potpuno duplirati sadržajem. Kako biste riješili ovaj problem, upotrijebite Google Webmaster za postavljanje geografskog ciljanja.

Sindikacija sadržaja

Sindikacija sadržaja je ponovna upotreba istog sadržaja na različitim resursima u svrhu promicanja vaše web stranice/robne marke/sadržaja i privlačenja dodatnog prometa.

Distribucija je sjajan način da svoju stranicu predstavite novoj publici, ali vrijedi postaviti smjernice za to tko će ponovno objaviti vaš sadržaj.

U idealnom slučaju, trebali biste tražiti od izdavača da koriste atribut "rel=canonical" na stranici sa sadržajem kako bi tražilicama pokazali da je vaša web stranica izvorni izvor sadržaja. Osim toga, također mogu spriječiti indeksiranje sadržaja, što će pomoći u rješavanju potencijalnih problema s dupliciranjem u rezultatima pretraživanja.

Uostalom, izdavači se mogu vratiti na izvorni članak, navodeći vas kao izvorni izvor.

Povezani sadržaj

Sličan sadržaj može uzrokovati jednaku štetu kao i dvostruki sadržaj. Googleova definicija dupliciranog sadržaja čak uključuje i izraz "u suštini sličan". Iako se dijelovi materijala mogu razlikovati u sintaksi, opće je pravilo da ako iz njih možete prikupiti iste informacije, nema razloga da oboje postoje na web stranici. Ovdje je izvrsno rješenje problema korištenje kanonske oznake ili razmatranje spajanja ovih dijelova sadržaja u jedan.

zaključke

Vrlo je važno pratiti pojavu dupliciranog sadržaja na web stranici kako biste izbjegli iskorištenje proračuna za indeksiranje jer to sprječava robota u pretraživanju i indeksiranju novih stranica koje su vam potrebne. U ovom slučaju, najbolji alati u vašem arsenalu su kanonske oznake, 301 preusmjeravanja, atributi nofollow/noindex u meta oznaci "robots" i direktive u datoteci robots.txt. Radite na prepoznavanju i uklanjanju dupliciranog sadržaja dodavanjem ovih kontrolnih točaka u vašu SEO reviziju.

Dvostruki sadržaj pogoršava indeksiranje stranice

“Različiti putevi vode na različita mjesta, a samo je jedan od njih pravi.”

Pozdrav prijatelji! Dugo sam planirao raspravljati o ovoj temi na stranicama svoje web stranice, pa sam, nakon što sam proučio dosta materijala o dupliciranju sadržaja i njegovim uzrocima, posljedicama i načinima uklanjanja ove negativne pojave, odlučio iznijeti svoja razmišljanja o tome problem na mom skromnom resursu.

Budite strpljivi i pažljivo proučite sve preporuke u članku, a zatim provjerite status svojih resursa. Ako želite vidjeti izvrsno rangiranje stranica vaše web stranice u tražilicama, striktno ih slijedite.

Ne pretendirajući na pružanje svih mogućih načina za uklanjanje uzroka dupliciranja sadržaja, ipak ću predložiti proučavanje najvažnijih točaka ovog broja.

Ako običan korisnik (a ponekad čak i sam webmaster) možda ne primijeti dupli sadržaj na stranici, tražilice će to odmah otkriti. Njihova reakcija bit će jasna: sadržaj s ovih stranica prestat će biti jedinstven. A to već nije dobro, jer će negativno utjecati na njihov plasman.

Osim toga, dupliciranje zamagljuje težinu veze, na određenu objavu koju ste optimizacijom pokušali promovirati u TOP, poput landing stranice. Duplikati će jednostavno uništiti sve pokušaje optimizacije, a učinak međusobnog povezivanja bit će minimalan.

Što je duplicirani sadržaj?

1. Sadržaj koji je kopirao netko ili vi osobno i objavljen na resursima trećih strana.

Na internetu možete pročitati mnoge članke o tome kako se nositi s ukradenim sadržajem, a jedna od opcija je i moj članak. Može li se istrijebiti je retoričko pitanje i danas, po mom mišljenju, na internetu nema temeljnih rješenja za ovaj problem. Postoji samo nekoliko više ili manje učinkovitih tehnika.

2. Sadržaj je duplikat koji webmaster izrađuje vlastitim rukama.

Potpuni (ili nepotpuni) duplikat prilikom distribucije informacija (ili, kako se još nazivaju, najava) na posebnim stranicama i forumima. Ako želite dobiti duplikat svog unosa na Internetu, duplicirajte ga na nekom pristojnom izvoru - rezultat će gotovo uvijek biti trenutačni. Duplikat je moguć izravno na stranicama web mjesta. Jeste li ikada vidjeli dvije identične stranice na svojoj web stranici, a stvorili ste samo jednu? Zašto se ovo događa? Razlozi uključuju uređivanje unosa ili spremanje nedovršenih u skice, a zatim nenamjerno stvaranje duplikata. Webmaster, a da to sam nije primijetio i bez naknadnog pregledavanja svih svojih unosa, kako ne bi otkrio duplikat, živi sretno do kraja života, ne sumnjajući da ima "blizance", "trojke" itd.

3. Dupliciranje iz tehničkih razloga – pojava duplikata za što je kriv CMS.

Ove se pogreške pojavljuju jer programeri CMS-a ne razmišljaju kao preglednici ili pauci za pretraživanje, već razmišljaju onako kako bi programeri web stranica trebali; Mnogi su ljudi krivi za to - Joomla, na primjer.

Da malo pojasnim. Recimo da imate članak s ključnom riječi "duplicirani sadržaj". Trebao bi se nalaziti na stranici sa sljedećom adresom: http://domain.ru/dupliciranje sadržaja/, ali se isti sadržaj može prikazati, na primjer, ovako: http://domain.ru/article-category/dupliciranje sadržaja/. A ako uzmemo u obzir i druge duplikacije, stranice, na primjer: http://domain.ru/dupliciranje sadržaja/?source=rss. Svi ovi URL-ovi su različite adrese za bilo koji, ali isti za korisnika (čitatelja). Ove razlike omogućuju webmasteru da prati odakle je korisnik došao, ali također mogu uzrokovati štetu ako nisu napravljene potrebne postavke indeksiranja.

Poznato je da web stranice rade zahvaljujući postojećem sustavu baze podataka. Postoji samo jedna verzija određenog članka (ID) u bazi podataka, ali skripte stranice dopuštaju prikazati ovaj članak iz baze podataka na različitim stranicama (URL). Ali tražilice trebaju dokument (URL) - samo je to jedinstveni identifikator i ništa drugo!

4. Nejasna preuzimanja.

Posebna vrsta dupliciranja koja se javlja uglavnom u online trgovinama, gdje se stranice s karticama proizvoda razlikuju samo u nekoliko rečenica s opisom, a sav ostali sadržaj, koji se sastoji od end-to-end blokova i drugih elemenata, je isti . Teško je okriviti webmastera, iako postoje neke mogućnosti za njihovo uklanjanje.

Dakle, pozabavili smo se uzrocima i posljedicama dupliciranog sadržaja. Sada prijeđimo na rješavanje problema. Prije svega, saznajmo

Kako otkriti duplicirane stranice?

1. Ručna metoda.

1) Ako vaš sadržaj nije prevelik, samo se pomičite kroz stranicu u administratorskoj ploči „Svi unosi» i, ako se pronađu duplikati, izbrišite nepotrebne.

2) Da biste saznali prisutnost duplikata, možete koristiti usluge tražilica "Yandex Webmaster" ili Google Webmaster Tools.

Na primjer, u alatima za webmastere otvorite stranicu “Alati za webmastere” - “Optimizacija” - “HTML optimizacija”: Ako postoje pogreške i duplikati, čarobnjak će vam pokazati sve. Shvatite to s klikovima, uklonite pogreške i duplikate, u isto vrijeme.

3) Koristite izravno prozore za pretraživanje sustava (približna metoda). Unesite za svaki od njih unos obrasca web mjesto: domain.ru i usporediti njihove rezultate. Ako nisu jako različiti, onda vaše dupliciranje i nije tako loše.

4) Postoji jedan učinkovit način za pronalaženje duplikata - pretraživanje fragmenata teksta. To se radi jednostavno: u prozor za pretraživanje bilo kojeg sustava unesite tekstualni fragment vašeg posta (članka) od 10-20 riječi (po mogućnosti iz sredine) i analizirajte rezultat. Prisutnost dvije ili više stranica u rezultatima pretraživanja znači da postoje duplikati za ovaj opus. Ako ne, možete se malo veseliti :).

Teško je ako web mjesto ima mnogo stranica. Gornja provjera može postati nepodnošljiv posao. Ako želite minimizirati vremenske troškove, koristite program Xenu's Link Sleuth.

Za provjeru stranice potrebno je otvoriti novi projekt odabirom “Provjeri URL” iz izbornika “Datoteka”, unijeti adresu i kliknuti “OK”. Nakon toga program će započeti s obradom svih URL-ova stranica. Nakon dovršetka provjere potrebno je izvesti primljene podatke u bilo koji prikladan uređivač i započeti traženje duplikata.

Kome treba link za preuzimanje datoteke ovog programa neka napiše u komentarima, poslat ću vam na e-mail.

Dakle, saznali smo koji (glavni) razlozi dovode do dupliciranog sadržaja. Sada odredimo kako to eliminirati.

Načini uklanjanja dupliciranog sadržaja

Kanonski URL-ovi – konceptualno rješenje problema

Ako nemate opciju () za uklanjanje duplikata, problem se može riješiti pomoću oznake kanonika l (koristi se za nejasne kopije). Kanonska oznaka također je prikladna za verzije stranica za ispis i u drugim sličnim slučajevima. Primjenjuje se vrlo jednostavno - atribut rel=”canonical” naveden je za sve kopije, ali ne i za glavnu stranicu, koja je najrelevantnija. Kôd bi trebao izgledati otprilike ovako: link rel=”canonical” href=”http://domain.ru/page-copy”/ i biti unutar oznake head.

Za korisnike s WordPress motorom, postoji izvrsna prilika da sve to rade automatski instaliranjem all in one seo pack plugina ili sličnog. U postavkama je ova operacija postavljena sa sljedećim oznakama:

Postavljanje funkcija onemogućavanja u datoteci robots.txt vaše web stranice

Iako postavljanje zabranjujućih stranica za indeksiranje nije uvijek učinkovit način za sprječavanje duplikata, budući da ih tražilice ponekad uspiju zaobići, ispravno konfiguriran robot.txt uvelike će olakšati zadatak njihovog sprječavanja.

Swwwili bezwww

Kako će izgledati stranice vaše web stranice - koristeći samo http ili http.www? Neizvjesnost će stvoriti dupliranje. Odmah nakon izrade stranice odredite koji ćete protokol za prijenos hiperteksta koristiti. Da biste to učinili, unesite svoj izbor u ploče webmastera Yandex i Google (u Googleu se to može učiniti za obje verzije, ali morat ćete potvrditi prava na obje adrese). Možete ga ostaviti kao zadano ili "izbor robota za pretraživanje", ali bolje je da to jasno definirate.

Postavljanje preusmjeravanja

Preusmjeravanje 301 izvrsno je za spajanje kopiranih stranica čiji se URL-ovi razlikuju u prisutnosti i odsutnosti www. Kao što ste već shvatili (pogledajte gornju sliku zaslona), postavljanje preusmjeravanja na WordPress također je pojednostavljeno korištenjem dodatka. U biti, ako ste vi i robot za pretraživanje "odlučili" o svom izboru - sa ili bez www ili bez njega bit će glavna domena, postavljanje preusmjeravanja za sve stranice nije potrebno. No, tema postavljanja preusmjeravanja i njegove izvedivosti tema je zasebnog članka.

Rezultati i zaključci

  • nemojte dopustiti dupliciranje stranica (sadržaja) na svojim resursima, jer duplikati dovode do ozbiljnog smanjenja relevantnosti stranica, što otežava njihovo dovođenje u prvi plan u rezultatima pretraživanja (TOP);
  • Većina problema s umnožavanjem sadržaja ima rješenje - upotrijebite sva moguća sredstva da to učinite;
  • Konstantno nadzirite proces indeksiranja vašeg sadržaja i ne stvarajte duplikate na njemu

To je to, dragi čitatelju. Ako me imate što dodati ili ispraviti, postavite pitanje - riskirajte!

Nije baš na temu, ali o blizancima.

(Posjećeno 28 puta, 1 posjeta danas)

Najbolji članci na temu