Cum se configurează smartphone-uri și PC-uri. Portal informativ
  • Acasă
  • Programe
  • Conținutul duplicat este cea mai frecventă greșeală de optimizare internă.

Conținutul duplicat este cea mai frecventă greșeală de optimizare internă.

Conținut (conținut în limba engleză - conținut) - informații, și anume, text, imagini, videoclipuri, fișiere care se află pe site.
Ar trebui să fie:
  1. Oferirea celui mai complet și mai ușor de înțeles răspuns, rezolvarea problemei unei persoane: fie că este vorba de a te înveseli, de a pune capăt unei dileme dificile sau de a cumpăra un produs de calitate.
  2. Fără a utiliza fragmente ascunse precum:
  • text de aceeași culoare cu fundalul,
  • textul este ascuns în spatele imaginii,
  • dimensiunea fontului este 0.
  • Structurat și proiectat divers, și anume ușor de perceput vizual:
    • gândurile principale sunt evidențiate în culoare sau îndrăznețe pentru ca utilizatorul să se concentreze asupra lor. Nu uitați că paginile web nu sunt citite, ci întrezărite.
    • prin structura articolului,
    • propozițiile sunt combinate în paragrafe între care există o linie goală,
    • liste folosite, citate, tabele,
    • poze aplicate, infografice, videoclipuri, inregistrari audio. Imaginile joacă un rol important. Deci, un cititor al acestui blog a cerut să traducă simbolurile din captura de ecran, care a arătat editorul Blogger.
  • Unic și original (nu poate fi restaurat de pe site-urile decedate sau preluat din resurse sub filtre). Motoarele de căutare monitorizează îndeaproape acest lucru, este extrem de nedorit să se trateze duplicatele și să se aplice sancțiuni pentru utilizarea materialelor similare. Imaginați-vă o situație: cereți o cerere și vedeți același răspuns în rezultatele căutării. Studiul mai multor surse care au dezvăluit în mod diferit subiectul vă va permite să vă formați o înțelegere mai precisă și mai largă a problemei. Este posibil să verificați unicitatea textului inserând un fragment din acesta între ghilimele () în formularul de căutare.
  • Dublarea conținutului poate fi observată nu numai la plasarea datelor pe diferite site-uri, ci și la repetarea informațiilor pe două sau mai multe dintr-un proiect web. Iată un experiment pe devvver.ru despre negativul duplicaturilor interne și despre modul în care concurenții pot profita de el.

    Luați în considerare ce instrumente avem în lupta împotriva acestei boli.

    Link-uri de pagini

    Singurul O modalitate sută la sută de a preveni indexarea unei pagini este să nu postezi linkuri către ea și să nu o adaugi la suplimentele Yandex, Google etc.

    Fișierul Robots.txt

    Un fișier text robots.txt (de exemplu) este un instrument excelent pentru gestionarea indexării. Ajută Yandex, Google. Dar dacă Google găsește un link către o adresă URL care este închisă în robots.txt, o va adăuga la rezultatele căutării.

    Din această cauză, trebuie să intri aici doar acele documente web la care nu se poate ajunge în alt mod, De exemplu, . Și, desigur, harta site-ului pentru o indexare mai bună și mai rapidă a paginilor populare.

    Antet HTTP

    Adresa URL nu va fi indexată dacă arată 404 sau 301. Și pentru Google, de asemenea, atunci când linia este prezentă

    X-Robots-Tag: noindex

    Etichete meta roboți

    Acest instrumentul principal pentru că funcționează pentru Yandex și Google în același mod. Pe pagină, accesul la conținutul căruia ar trebui refuzat, este indicat:

    Rel = atribut „canonic”.

    Necesar atributul rel = „canonic” sugerează cel preferat din mai multe documente web cu conținut foarte asemănător, de exemplu, http://site/2010/07/kontent..html? showComment. Al doilea motor de căutare îl va ignora deoarece se va trimite la linia:

    Yandex.Webmaster

    media = "printare"

    Nu este nevoie să creați o versiune tipărită separată. Stilurile pot fi ajustate cu.

    Eliminarea dublurilor din index din greșeală

    În ciuda măsurilor luate, roboții de căutare pot indexa pagini nedorite. Prin solicitarea

    Vizualizați toate SERP-urile, în special cele cu rezultate Google omise. În mod ideal, această inscripție nu ar trebui să fie:

    Rezultatele omise trebuie eliminate manual. Pentru Yandex vom folosi formularul de ștergere a paginii, iar pentru Google trebuie să mergem la „Instrumente pentru webmasteri” - „Optimizare” - „Eliminați adresele URL” - „Creați o nouă solicitare de ștergere”.

    Conținutul duplicat este una dintre principalele probleme cu clasamentele scăzute ale motoarelor de căutare. Această problemă este cauzată de prezența pe site a unor pagini care sunt complet sau parțial identice între ele. Desigur, pentru motoarele de căutare, prezența paginilor de gunoi pe un site este o problemă serioasă, deoarece trebuie să cheltuiți puterea serverului pentru procesarea lor. Nu are sens ca motoarele de căutare să risipească resurse fizice indexând astfel de conținut inutil. Prin urmare, se luptă cu astfel de site-uri, impunându-le un filtru sau subestimează clasamentul, ceea ce duce la poziții scăzute pe interogările promovate.

    Duplicate și SEO

    Prezența paginilor duplicate pe site duce la următoarele:

    • Puterea utilă a legăturilor este pulverizată pe aceste pagini inutile.
    • Pagina duplicată după următoarea actualizare înlocuiește pagina țintă și își pierde poziția.
    • Conținutul duplicat reduce unicitatea tuturor paginilor pe care este găzduit.
    • Deoarece motorul de căutare se luptă cu astfel de pagini, eliminându-le din căutare - poate exclude și pagina promovată.

    Duplicați clasificarea și soluțiile pentru a le elimina

    Duplicatele pot fi complete și parțiale. Dublatele complete sunt atunci când paginile sunt complet identice. În consecință, dublurile parțiale sunt atunci când paginile nu se potrivesc complet. Dublatele complete sunt eliminate prin robots.txt și setarea redirecționărilor 301. Dublatele parțiale sunt eliminate prin efectuarea modificărilor necesare pe site.

    Iată o listă de liste de verificare pe care trebuie să le parcurgeți pentru a identifica și rezolva problema duplicaturilor:

    • Căutați duplicate ale paginii principale a site-ului. De exemplu, ar putea exista următoarele opțiuni pentru pagina de pornire: http://www.domen.com/, http://www.domen.com/index.php, http://www.domen.com, http: / / domen. com /, https://www.domen.com/, http://www.domen.com/index.html. După cum puteți vedea, există multe opțiuni, dar opțiunea optimă este http://www.domen.com/. Pentru a elimina copiile rămase ale paginii principale, se utilizează o redirecționare 301 și o închidere în robots.txt (în cazul construcțiilor precum https://www.domen.com/.
    • Verificarea principiilor fundamentale (regula de aur SEO) - Fiecare pagină ar trebui să fie accesibilă doar de la o singură adresă URL. Adresele nu pot fi modificate astfel: http://www.domen.com/stranica1/stranica2/ si http://www.domen.com/stranica2/stranica1/.
    • Verificarea prezenței variabilelor în url. Ei, în adresa paginii, nu ar trebui să fie. De exemplu, generarea de adrese URL precum: http://www.domen.ru/index.php?dir=4567&id=515 este o eroare. Următoarea opțiune URL va fi corectă: http://www.domen.ru/dir/4567/id/515.
    • Verificarea prezenței identificatorilor de sesiune în URL-uri. De exemplu, adrese URL precum http://www.domen.ru/dir/4567/id/515.php?PHPSESSID=3451 nu sunt permise. Astfel de adrese URL conțin un număr infinit de copii ale fiecărei pagini. Prin urmare, este necesar să închideți toate ID-urile de sesiune din robots.txt.

    Mulți proprietari de site-uri se concentrează în primul rând pe a face conținutul unic în comparație cu alte resurse. Cu toate acestea, nu treceți cu vederea prezența conținutului duplicat în cadrul aceluiași site. Acest lucru are, de asemenea, un impact puternic asupra clasamentelor.

    Ce este conținutul duplicat

    Conținutul duplicat sau duplicat este un bloc mare de text care coincide în cadrul site-ului pe diferite pagini. Acest lucru nu se face neapărat cu intenții rău intenționate - apare adesea din motive tehnice, care sunt discutate în detaliu mai jos.

    Pericolul este că adesea conținutul duplicat nu poate fi văzut cu ochiul liber, dar motorul de căutare îl vede perfect și reacționează în consecință.

    De unde provine conținutul duplicat și unde este mai frecvent

    Principalele motive pentru acest fenomen:

    • Modificarea structurii site-ului;
    • Utilizare intenționată într-un scop specific (să zicem, o versiune tipărită);
    • Acțiuni eronate ale programatorilor și webmasterilor;
    • Probleme CMS.

    De exemplu, apare o situație comună: replytocom (răspuns la un comentariu) în WordPress generează automat pagini noi cu URL-uri diferite, dar nu și conținut.

    De obicei, conținutul duplicat este observat atunci când se creează anunțuri de articole pe alte pagini ale site-ului, se postează recenzii, precum și cu aceleași descrieri de mărfuri, categorii, titluri.

    De ce conținutul duplicat este rău

    Conținutul duplicat are un analog din domeniul economiei - descoperirea de cont bancară. Acesta este singurul loc unde se cheltuiește așa-numitul buget de crawling. Acesta este numărul de pagini ale unei resurse pe care un motor de căutare le poate scana pentru o anumită perioadă de timp. Resursa este foarte valoroasă și este mai bine să o cheltuiți pe pagini cu adevărat importante și relevante decât pe zeci de duplicate de text identic.

    Astfel, conținutul duplicat degradează clasamentul motoarelor de căutare. În plus, legăturile naturale se pierd și puterea linkurilor este distribuită incorect în cadrul site-ului. De asemenea, înlocuiește paginile cu adevărat relevante.

    Cum să găsiți conținut duplicat pe site (manual, programe și servicii)

    Există programe speciale pentru analiza resurselor. Dintre acestea, utilizatorii evidențiază în special Netpeak Spider. Acesta caută copii complete ale paginilor, potriviri după titlu sau descriere, titluri. O altă opțiune este Screaming Frog, care are o funcționalitate similară și de fapt diferă doar în interfață. Există și aplicația Xenu`s Link Sleuth, care funcționează în mod similar cu un motor de căutare și este capabilă să pieptene site-ul pentru duplicate de o calitate destul de înaltă.

    Din păcate, nu există instrumente care să poată urmări complet tot textul duplicat. Prin urmare, cel mai probabil, va trebui să faceți o verificare manuală. Iată o listă cu posibilii factori care cauzează problema:


    Am aflat cum să găsești conținut duplicat. Și cei mai buni ajutători în combaterea acesteia sunt redirecționările 301, etichetele URL canonice, instrucțiunile robots.txt și parametrii Nofollow și Noindex ca parte a metaetichetei robots.

    Una dintre modalitățile rapide de a verifica dacă există conținut duplicat pe site este o căutare avansată în Yandex sau Google. Trebuie să introduceți adresa site-ului și o bucată de text din pagina pe care ați decis să o verificați. De asemenea, puteți utiliza numeroase programe pentru a verifica unicitatea textului:

    • Text.Ru;
    • eTXT Anti-Plagiat;
    • Advego Plagiatus;
    • Vizionare conținut.

    Cum să tratați și să curățați conținutul duplicat

    Tot același sistem de ajutor Google oferă o serie de sfaturi pentru a preveni apariția acestei probleme.

    • 301. În cazul modificărilor structurale ale resursei, este necesar să se indice redirecționarea 301 în fișierul htaccess.
    • Utilizați un singur standard de referință.
    • Conținutul specific regiunii este mai bine plasat pe domeniile de nivel superior decât pe subdomenii sau subdirectoare.
    • Setați metoda de indexare preferată folosind Search Console.
    • Nu folosiți șabloane. În loc să plasați text de protecție a drepturilor de autor pe fiecare pagină, este mai bine să faceți un link care să ducă la o pagină separată cu acest text.
    • Când dezvoltați pagini noi, asigurați-vă că acestea sunt închise de la indexare până când sunt gata.
    • Înțelegeți exact cum este afișat conținutul dvs. - pot exista diferențe de afișare în bloguri și forumuri.
    • Dacă există multe articole similare pe site, este mai bine fie să le combinați conținutul într-un singur întreg, fie să le unificați pe fiecare.

    Motoarele de căutare nu prevăd nicio sancțiune în legătură cu site-urile care au conținut duplicat din motive tehnice (spre deosebire de cei care o fac în mod deliberat pentru a manipula rezultatele căutării sau a induce în eroare vizitatorii).

    După ce duplicatele sunt eliminate, rămâne să le eliminați din rezultatele căutării. Yandex face acest lucru pe cont propriu, cu condiția ca fișierul robots.txt să fie configurat corect. Cât despre Google: acolo va trebui să înregistrezi manual regulile în Webmaster, pe fila „Parametri URL”.

    Concluzie

    Combaterea conținutului duplicat de pe un site web este un aspect important al activității oricărui proprietar de site web. Există destul de multe motive pentru apariția sa și există tot atâtea modalități de a o elimina.

    Cu toate acestea, regula principală rămâne: postați exclusiv conținut original, indiferent de tipul de site. Chiar dacă este un mare magazin online cu mii de pagini.

    PRIMIȚI ANUNȚURI CU POSTĂRI SIMILARE PRIN POSTA

    Aboneaza-te si primesti, nu mai mult de o data pe saptamana, ceva interesant din lumea marketingului pe Internet, SEO, promovarea site-urilor, magazine online, a face bani pe site-uri.

    Conținutul duplicat se referă de obicei la blocuri mari de informații din unul sau mai multe domenii, al căror conținut este fie complet același, fie foarte asemănător. De regulă, în acest caz, scopul este să nu inducă în eroare utilizatorul. Conținutul duplicat poate fi utilizat fără intenție rău intenționată, de exemplu:

    • pagini de forum în versiuni obișnuite ale site-urilor și versiuni pentru dispozitive mobile;
    • produsele din magazinul online afișate la clic pe diferite URL-uri;
    • versiuni ale paginilor pentru imprimare.

    Dacă site-ul dvs. conține mai multe pagini cu aproape același conținut, puteți specifica adresa URL preferată pentru Google. Acest lucru se poate face în mai multe moduri. Această procedură se numește „normalizare”.

    Cu toate acestea, în unele cazuri, conținutul este duplicat în mod deliberat în diferite domenii pentru a manipula clasamentele motoarelor de căutare sau pentru a crește traficul. Utilizarea unor astfel de tehnici înșelătoare poate lăsa o impresie negativă asupra utilizatorilor, deoarece aceștia vor vedea în mare parte același conținut repetitiv în rezultatele căutării.

    Google face tot posibilul să indexeze și să afișeze pagini cu informații unice. De exemplu, dacă site-ul dvs. are o versiune „standard” și „tipărită” a fiecărui articol care nu este marcată cu metaeticheta noindex, numai una dintre ele va apărea în rezultatele căutării. În rarele ocazii în care Google consideră că este afișat conținut duplicat pentru a manipula clasamentele sau a induce în eroare utilizatorii, vom actualiza indexul și clasamentele site-urilor în cauză. Ca urmare, clasamentul site-ului poate scădea sau site-ul poate fi eliminat complet din indexul Google și va fi indisponibil pentru căutare.

    Mai jos sunt instrucțiuni despre cum să evitați problemele de conținut duplicat și să determinați utilizatorii să vadă conținutul dorit.

    • Folosiți 301. Dacă ați schimbat structura site-ului dvs., utilizați o redirecționare 301 ("redirecționare permanentă") în fișierul dvs. .htaccess pentru a redirecționa rapid utilizatorii, crawler-ul Google și diferiți spider. (Pentru Apache, acest lucru se poate face prin fișierul .htaccess. Pentru IIS, prin consola de administrare.)

    • Fii consistent... Încercați să utilizați legăturile interne în mod constant. De exemplu, nu creați un link către http://www.example.com/page/, http://www.example.com/page și http://www.example.com/page/index.htm.

    • Utilizați domenii de nivel superior... Pentru a ne ajuta să selectăm cea mai potrivită versiune a unui document, folosiți domenii de nivel superior ori de câte ori este posibil pentru a afișa conținut specific țării. De exemplu, conținutul legat de Rusia este recomandat să fie plasat pe site-ul http://www.example.ru, și nu pe site-ul http://www.example.com/ru sau http://en.example. com.

    • Aveți grijă când sindicați... Dacă furnizați conținutul dvs. către alte site-uri, atunci la fiecare interogare de căutare Google va afișa întotdeauna versiunea pe care o consideră cea mai potrivită pentru utilizatori. Această versiune nu este neapărat aceeași versiune pe care ați alege-o. Cu toate acestea, merită să vă asigurați că toate site-urile care găzduiesc conținutul dvs. au un link către articolul original. De asemenea, puteți cere proprietarilor de site-uri care folosesc materialul dvs. sindicalizat să îl blocheze folosind metaeticheta noindex, astfel încât motoarele de căutare să nu includă versiunile lor în index.

    • Utilizați Search Console pentru a notifica Google despre metoda dvs. de indexare preferată.În special, puteți specifica domeniul principal (de exemplu, http://www.example.com sau http://example.com).

    • Evită repetările... De exemplu, în loc să puneți întregul text al drepturilor de autor în partea de jos a fiecărei pagini, includeți numai elementele de bază cu un link către pagina detaliată. De asemenea, puteți utiliza instrumentul Parametri URL pentru a alege modul preferat în care Google gestionează parametrii URL.

    • Nu utilizați stub-uri de software. Utilizatorii nu sunt interesați de paginile goale. De exemplu, nu publicați pagini al căror conținut nu este încă gata. Dacă nu vă puteți lipsi de paginile cu substituent, blocați-le cu metaeticheta noindex, astfel încât să nu fie indexate.

    • Explorați sistemul dvs. de management al conținutului... Familiarizați-vă cu modul în care este afișat conținutul pe site-ul dvs. Blogurile, forumurile și alte sisteme similare afișează adesea același conținut în mai multe formate. De exemplu, o postare de blog poate apărea pe pagina principală a blogului, pe o pagină cu arhive sau pe o pagină cu alte postări - și întotdeauna sub același titlu.

    • Reduceți cantitatea de conținut asociat... Dacă site-ul dvs. are multe pagini similare, adăugați conținut unic la fiecare dintre ele sau combinați-le într-una singură. Să presupunem că aveți un site de călătorie cu pagini separate pentru două orașe care prezintă aceleași informații. Puteți plasa o pagină cu o descriere a ambelor orașe sau puteți adăuga materiale unice fiecăruia.

    Google nu recomandă blocarea accesului crawlerelor motoarelor de căutare a conținutului duplicat folosind un fișier robots.txt sau alte mijloace. Dacă motoarele de căutare nu pot accesa cu crawlere paginile cu astfel de conținut, atunci nu vor putea detecta automat că diferite adrese URL au același conținut și le vor trata ca pagini unice. Cel mai bine este să permiteți accesarea cu crawlere a acestor adrese URL, dar marcați-le ca copii exacte folosind un link rel = „canonic”, un instrument de procesare a parametrilor URL sau redirecționări 301. Dacă aveți mai multe copii încetinește semnificativ accesarea cu crawlere a paginii, ajustați rata de accesare cu crawlere în Search Console.

    Prezența conținutului duplicat pe site nu constituie o bază pentru a întreprinde vreo acțiune în legătură cu acesta. Astfel de măsuri sunt aplicate numai dacă sunt făcute cu scopul de a induce în eroare utilizatorii sau de a manipula rezultatele căutării. Dacă întâmpinați probleme cu conținutul duplicat, dar nu ați urmat sfaturile de mai sus, atunci vom alege versiunea conținutului de afișat în rezultatele căutării, la discreția noastră.

    Cu toate acestea, dacă rezultatele auditului nostru arată că ați folosit înșelăciune și site-ul dvs. a fost eliminat din rezultatele căutării noastre, vă rugăm să examinați site-ul cu atenție. Consultați Ghidul nostru pentru webmasteri și faceți modificările necesare. După ce vă asigurați că site-ul îndeplinește cerințele, trimiteți-ne o solicitare.

    În unele cazuri, algoritmii Google pot selecta adresa URL a unui site terță parte care a postat copii ale conținutului dvs. fără permisiune. Dacă conținutul dvs. a fost postat pe alt site cu încălcarea drepturilor de autor, cereți proprietarului să elimine acel conținut. De asemenea, puteți cere Google să elimine pagina care încalcă drepturile de autor din rezultatele căutării. Pentru a face acest lucru, trebuie să depuneți o notificare de încălcare a Digital Millennium Copyright Act din SUA.

    A fost aceasta utila?

    Cum poți îmbunătăți acest articol?

    Conținutul duplicat degradează indexarea site-ului

    „Drumuri diferite duc în locuri diferite și doar unul dintre ele este corect”.

    Bună prieteni! De mult am de gând să dezvălui acest subiect pe paginile site-ului meu, prin urmare, după ce am studiat o mulțime de materiale despre duplicarea conținutului și cauzele, consecințele și modalitățile sale de a elimina acest fenomen negativ, am decis să-mi exprim părerile despre această problemă. pe modesta mea resursă.

    Vă rugăm să aveți răbdare și să studiați cu atenție toate recomandările articolului, apoi verificați starea resurselor dvs. Dacă doriți să vedeți un clasament excelent al paginilor site-urilor dvs. în motoarele de căutare - urmați-le cu strictețe.

    Fără a pretinde că sunt toate modalitățile posibile de a elimina cauzele conținutului duplicat, îmi propun totuși să studiez cele mai importante puncte ale acestei probleme.

    Dacă un utilizator obișnuit (și uneori webmasterul însuși) poate să nu observe conținutul duplicat al site-ului, atunci motoarele de căutare vor determina imediat acest lucru. Reacția lor va fi lipsită de ambiguitate: conținutul din aceste pagini va înceta să mai fie unic... Și acest lucru nu este deja bun, deoarece le va afecta negativ clasamentul.

    De asemenea, duplicarea estompează greutatea legăturii, la o anumită postare, pe care, optimizând, ai încercat să o promovezi în TOP, ca pe o pagină de destinație. Dublatele vor ruina pur și simplu toate încercările de optimizare, iar efectul de legătură va fi minim.

    Ce sunt conținutul duplicat?

    1. Conținut copiat de cineva sau personal de dvs. și postat pe resurse terțe.

    Puteți citi multe articole pe Internet despre cum să faceți față conținutului furat, una dintre opțiuni este articolul meu. Este posibil să o exterminăm este o întrebare retorică și astăzi, în opinia mea, nu există soluții cardinale la această problemă pe Internet. Există doar câteva trucuri mai mult sau mai puțin eficiente.

    2. Conținut-duplicat, care este creat de webmaster cu propriile sale mâini.

    Dublat complet (sau incomplet) atunci când se distribuie informații (sau așa cum sunt numite - anunțuri) pe site-uri și forumuri speciale. Dacă doriți să obțineți un duplicat al înregistrării dvs. pe Internet - duplicați-l pe o resursă decentă - rezultatul, aproape întotdeauna, va fi imediat. O duplicare este posibilă direct pe paginile site-ului. Ați văzut vreodată două pagini identice pe resursa dvs. când ați creat doar una? De ce se întâmplă asta? Motive pentru editarea notelor sau salvarea celor neterminate în schițe și apoi, din neatenție, crearea unui duplicat. Webmasterul, fără să-l observe el însuși și, ulterior, nu se uită prin toate înregistrările sale, ca să nu găsească un duplicat, trăiește fericiți pentru totdeauna, nebănuind că are „gemeni”, „tripleți” etc.

    3. Dublare din motive tehnice – apariția unor duplicate în care CMS-ul este de vină.

    Aceste erori apar din faptul că dezvoltatorii CMS nu gândesc ca browserele sau păianjenii de căutare, ci gândesc așa cum se cuvine dezvoltatorilor de motoare de site-uri web; mulți păcătuiesc asta - Joomla, de exemplu.

    Lasă-mă să explic puțin. Să presupunem că aveți un articol cu ​​o expresie cheie „Conținut duplicat”... Ar trebui să fie localizat pe o pagină cu următoarea adresă :, http://domain.ru/ duplicare conținut /, dar același conținut poate fi afișat, de exemplu, astfel: http://domain.ru/article-category/ duplicare conținut /... Și dacă luăm în considerare și alte duplicari, pagini, de exemplu: http: //domain.ru/ duplicare conținut /? sursa = rss... Toate aceste adrese URL sunt adrese diferite pentru oricare, dar aceleași pentru utilizator (cititor). Aceste diferențe permit webmasterului să urmărească de unde a venit utilizatorul, dar pot fi dăunătoare dacă nu sunt făcute setările necesare de indexare.

    Se știe că site-urile web funcționează datorită sistemului de baze de date existent. Există o singură versiune a unui articol specific (ID) în baza de date, dar scripturile site-ului permit scoateți acest articol din baza de date pe diferite pagini (url)... Dar motoarele de căutare au nevoie de un document (URL) - doar că este un identificator unic și nimic altceva!

    4. Luări neclare.

    Un tip special de duplicare, care se găsește în principal pe magazinele online, unde paginile cu carduri de produse diferă doar în câteva propoziții cu descrieri, iar tot restul conținutului, constând din blocuri transversale și alte elemente, este același. Este greu să dai vina pe webmaster, deși există câteva opțiuni pentru eliminarea acestora.

    Deci, ne-am dat seama care sunt cauzele și consecințele conținutului duplicat. Acum să trecem la rezolvarea problemelor. În primul rând, să aflăm

    Cum pot găsi pagini duplicat?

    1. Metoda manuală.

    1) Dacă conținutul dvs. nu este prea mare, doar parcurgeți pagina din panoul de administrare „Toate intrările”Și, dacă se găsesc duplicate, ștergeți-le pe cele inutile.

    2) Pentru a afla prezența duplicatelor, puteți utiliza serviciile motoarelor de căutare „Yandex-webmaster” sau Google Webmaster Tools.

    De exemplu, în Instrumentele pentru webmasteri, deschideți pagina „Instrumente pentru webmasteri” - „Optimizare” - „Optimizare HTML”: dacă există erori și duplicate, vrăjitorul vă va arăta totul. Faceți față clicurilor, eliminați erorile și duplicatele, în același timp.

    3) Utilizați direct ferestrele de căutare a sistemului (metodă aproximativă). Introduceți pentru fiecare dintre ele o înregistrare a formularului site: domain.ruși comparați rezultatele acestora. Dacă nu sunt foarte diferite, atunci duplicarea dvs. nu este atât de rea.

    4) Există o modalitate eficientă de a găsi duplicate - căutarea prin fragmente de text. Acest lucru se face simplu: în caseta de căutare a oricărui sistem, introduceți un fragment de text din intrarea dvs. (articol) cu dimensiunea de 10-20 de cuvinte (de preferință de la mijloc) și analizați rezultatul. Prezența a două sau mai multe pagini în SERP înseamnă că există duplicate pentru acest opus. Daca nu, poti fi putin fericit :).

    Este dificil dacă site-ul a acumulat multe pagini. Verificarea de mai sus poate deveni o corvoadă intolerabilă. Dacă doriți să minimizați cheltuielile de timp - utilizați programul Detectiv-ul lui Xenu.

    Pentru a verifica site-ul, trebuie să deschideți un nou proiect selectând „Verificare URL” din meniul „Fișier”, introduceți adresa și faceți clic pe „OK”. După aceea, programul va începe să proceseze toate adresele URL ale site-ului. La sfârșitul verificării, trebuie să exportați datele primite în orice editor convenabil și să începeți să căutați duplicate.

    Cine are nevoie de un link pentru a descărca fișierul acestui program, dezabonează-te în comentarii, îl voi trimite pe e-mail-ul tău.

    Deci, ne-am dat seama care sunt motivele (principale) care duc la conținut duplicat. Acum să definim modalitățile de a o elimina.

    Modalități de a elimina conținutul duplicat

    URL-urile canonice sunt o soluție conceptuală la problemă

    Dacă nu aveți opțiunea de a () elimina duplicatele, problema poate fi rezolvată folosind eticheta canonica l (folosit pentru copii neclare). Eticheta canonică este potrivită și pentru versiuni pagini de tipărit si in alte cazuri similare. Este folosit foarte simplu - pentru toate copiile este specificat atributul rel = „canonic”, dar pentru pagina principală, care este cea mai relevantă, nu este. Codul ar trebui să arate cam așa: link rel = "canonical" href = "http: //domain.ru/copy page" / și să fie în eticheta head.

    Pentru utilizatorii cu motor WordPress, există o oportunitate excelentă de a face toate acestea în mod automat instalând pluginul all in one seo pack sau similar. În setări, această operație este setată de etichete:

    Configurarea funcțiilor de interzicere în fișierul robots.txt al site-ului dvs

    Deși configurarea paginilor prohibitive pentru indexare nu este întotdeauna o modalitate eficientă de a evita duplicatele, deoarece motoarele de căutare reușesc uneori să le ocolească, un robot.txt configurat corespunzător va facilita foarte mult sarcina de a le evita.

    CUwwwsau fărăwww

    Cum vor arăta paginile site-ului dvs. - folosind doar http sau http.www? Incertitudinea va crea dublare. Imediat după crearea site-ului, stabiliți ce protocol de transport hipertext veți folosi. Pentru a face acest lucru, în panoul pentru webmasteri Yandex și Google, puneți alegerea dvs. (în Google, acest lucru se poate face pentru ambele versiuni, dar va trebui să confirmați drepturile la ambele adrese). Îl poți lăsa implicit sau pe „alegerea unui robot de căutare”, dar este mai bine să fie clar definit.

    Configurarea unei redirecționări

    O redirecționare 301 este excelentă pentru a lipi pagini de copiere cu adrese URL care au sau nu www. După cum ați înțeles deja (vezi captura de ecran de mai sus), configurarea unei redirecționări pe WordPress este, de asemenea, simplificată folosind un plugin. De fapt, dacă tu și robotul de căutare v-ați „hotărât” cu alegerea dvs. - cu sau fără www, va exista un domeniu principal, nu este necesară configurarea unei redirecționări pentru toate paginile. Cu toate acestea, subiectul instalării unei redirecționări și oportunitatea acesteia este un subiect pentru un articol separat.

    Rezultate și concluzii

    • nu permiteți duplicarea paginilor (conținutului) pe resursele dvs., deoarece duplicatele duc la o scădere serioasă a relevanței paginilor, ceea ce face dificilă ducerea acestora în pozițiile de frunte în rezultatele căutării (TOP);
    • problemele cu conținut duplicat în cea mai mare parte au o soluție - utilizați toate mijloacele posibile pentru aceasta;
    • monitorizați în mod constant procesul de indexare a conținutului dvs. și nu creați duplicate pe acesta

    Asta e tot, dragă cititor. Dacă aveți ceva de adăugat sau de corectat, puneți o întrebare - riscați!

    Nu tocmai subiectul, ci despre gemeni.

    (Vizitat de 28 de ori, 1 vizite astăzi)

    Top articole similare