Përmbajtja e kopjuar: arsyet dhe zgjidhjet. Përmbajtja e kopjuar

27.04.2019 OS

Përmbajtja e kopjuar është një nga problemet kryesore me renditjen e ulët të motorëve të kërkimit. Ky problem shkaktohet nga prania në faqen e faqeve që janë plotësisht ose pjesërisht identike me njëra-tjetrën. Natyrisht, për motorët e kërkimit, prania e faqeve të mbeturinave në një faqe është një problem serioz, pasi duhet të shpenzoni fuqinë e serverit në përpunimin e tyre. Nuk ka kuptim që motorët e kërkimit të harxhojnë burime fizike duke indeksuar një përmbajtje të tillë të padobishme. Prandaj, ata luftojnë me faqe të tilla, duke vendosur një filtër mbi to, ose nënvlerësojnë renditjen, gjë që çon në pozicione të ulëta në pyetjet e promovuara.

Dublikatat dhe SEO

Prania e faqeve të kopjuara në sit çon në sa vijon:

Fuqia e dobishme e lidhjeve shpërndahet në këto faqe të padobishme.
Faqja e kopjuar pas përditësimit tjetër zhvendoset faqe e uljes dhe ajo po humbet terren.
Përmbajtja e kopjuar zvogëlon veçantinë e të gjitha faqeve në të cilat është pritur.
Ndërsa motori i kërkimit lufton me faqe të tilla, duke i hequr ato nga kërkimi - ai mund të përjashtojë gjithashtu faqen e promovuar.

Klasifikimi i dyfishtë dhe zgjidhjet për eliminimin e tyre

Dublikatat mund të jenë të plota dhe të pjesshme. Dublikatat e plota janë kur faqet janë plotësisht identike. Prandaj, dublikatat e pjesshme janë kur faqet nuk përputhen plotësisht. Dublikatat e plota eliminohen përmes robots.txt dhe vendosjes së 301 ridrejtimeve. Dublikatat e pjesshme eliminohen duke bërë modifikimet e nevojshme në sajt.

Këtu është një listë e listave kontrolluese që duhet të kaloni për të identifikuar dhe zgjidhur problemin e dublikatave:

Gjeni dublikatë faqja kryesore faqe. Për shembull, mund të ketë opsionet e mëposhtme të faqes kryesore: http://www.domen.com/, http://www.domen.com/index.php, http://www.domen.com, http: / / domen. com /, https://www.domen.com/, http://www.domen.com/index.html. Siç mund ta shihni, ka shumë opsione, por opsioni optimal është http://www.domen.com/. Për të eliminuar kopjet e mbetura të faqes kryesore, përdoret një ridrejtim dhe mbyllje 301 në robots.txt (në rastin e ndërtimeve si https://www.domen.com/.
Kontrollimi i bazës (ari Rregullat e SEO) - çdo faqe duhet të jetë e aksesueshme vetëm në një adresë. Adresat nuk mund të ndryshojnë si më poshtë: http://www.domen.com/stranica1/stranica2/ dhe http://www.domen.com/stranica2/stranica1/.
Kontrollimi i pranisë së variablave në url. Ata, në adresën e faqes, nuk duhet të jenë. Për shembull, krijimi i url-ve si: http://www.domen.ru/index.php?dir=4567&id=515 është një gabim. Opsioni i mëposhtëm i URL-së do të jetë i saktë: http://www.domen.ru/dir/4567/id/515.
Kontrollimi i pranisë së identifikuesve të sesioneve në url. Për shembull, URL-të si http://www.domen.ru/dir/4567/id/515.php?PHPSESSID=3451 nuk lejohen. Url të tilla përmbajnë një numër të pafund kopjesh të secilës faqe. Prandaj, është e nevojshme të mbyllni të gjitha ID-të e sesioneve në robots.txt.

Përmbajtja e kopjuar është pjesërisht ose plotësisht i njëjti tekst, imazhe dhe elementë të tjerë të përmbajtjes së faqes, të disponueshme në adresa të ndryshme faqesh (URL). Prania e dublikatave mund të jetë shumë e vështirë promovimi i motorit të kërkimit faqe.

Sipas ekspertëve, përmbajtja e kopjuar është gabimi më i zakonshëm optimizimi i brendshëm i pranishëm në çdo burim të dytë të internetit.

Si të kontrolloni nëse ka dublikatë në faqen tuaj dhe si të shpëtoni prej tyre? Ne do t'ju tregojmë për këtë në numrin e ri të buletinit tonë.

Cilat janë dublikatat

Dublikatat janë të qarta dhe të paqarta (ose të plota dhe jo të plota).

Marrje të qarta - kopjoni faqe me të njëjtën përmbajtje, përmbajtje etiketa e përshkrimit meta dhe Titulli i titullit në dispozicion në adresa të ndryshme. Për shembull, në faqe origjinale mund të shfaqen dublikatat e mëposhtme:

pasqyrë me ose pa WWW;
faqe me shtesa të ndryshme (.html, .htm, index.php, parametri GET "? a = b", etj.);
versioni i printuar;
version për RSS;
forma e mëparshme e URL-së pas ndryshimit të motorit;
etj.

Merr fuzzy - përmbajtje pjesërisht identike në URL të ndryshme.

Shembuj të kopjimeve të tilla përfshijnë opsionet e mëposhtme:

kartat e të njëjtit lloj mallrash me një përshkrim të kopjuar ose që mungon;
njoftime të artikujve, lajmeve, mallrave në tituj të ndryshëm, në faqet e etiketave dhe faqeve;
arkivat e datave në blog;
faqet ku blloqet nga fundi në fund tejkalojnë përmbajtjen kryesore në vëllim;
faqet me tekste të ndryshme por titull dhe përshkrim identik.

Pse dublikatat janë të rrezikshme për promovim

1. Është e vështirë të indeksosh sitin (dhe përkufizimin e faqes kryesore)

Për shkak të dublikatave, numri i faqeve në bazën e motorit të kërkimit mund të rritet disa herë, disa faqe mund të mos indeksohen, pasi robotit të kërkimit i është caktuar një kuotë fikse për numrin e faqeve për të anashkaluar sitin.

Përkufizimi i faqes kryesore, e cila do të përfshihet në rezultatet e kërkimit, bëhet më e ndërlikuar: zgjedhja e një roboti mund të mos përkojë me zgjedhjen e një webmaster.

2. Faqja kryesore në rezultatet e kërkimit mund të zëvendësohet me një dublikatë

Nëse dyfishi do të marrë trafik i mirë dhe matjet e sjelljes, pastaj me përditësimin e radhës mund të zëvendësojë faqen kryesore (të promovuar) në rezultatet e kërkimit. Në të njëjtën kohë, pozicionet në kërkim do të "varen", sepse kopjimi nuk do të ketë popullaritet të lidhjes.

3. Humbja e lidhjeve të jashtme në faqen kryesore

4. Rrezik për të rënë nën filtrin PS

Të dy Yandex dhe Google po luftojnë me përmbajtje jo unike, dhe për këtë arsye mund të aplikohen në një faqe "të bllokuar". Filtrat AGS dhe Panda.

5. Humbje e faqeve të rëndësishme në indeks

Dublikatat e pakompletuara (faqet e kategorive, lajmet, kartat e produkteve, etj.) për shkak të unikitetit të tyre të ulët kanë një shans të mos futen fare në indeksin e motorit të kërkimit. Për shembull, kjo mund të ndodhë me një pjesë të kartave të produktit që algoritmi i kërkimit e konsideron si dublikatë.

Si të gjeni dhe eliminoni dublikatat në faqe

Si pronar i faqes, edhe pa njohuri dhe aftësi të veçanta, ju mund të gjeni në mënyrë të pavarur kopje në burimin tuaj. Më poshtë janë udhëzimet për gjetjen dhe heqjen e përmbajtjes së kopjuar.

Kërkoni për marrjen e plotë

Shumica mënyrë e shpejtë gjeni kopje të plota në sit - gjurmoni ndeshjen Etiketat e titujve dhe Përshkrimi. Për ta bërë këtë, mund të përdorni panelin e webmasterit të Google ose shërbimin Xenu, i cili është i njohur me optimizuesit. Kërkimi kryhet midis faqeve të indeksuara.

Kundër: jo të gjitha dublikatat mund (dhe duhet) të fshihen (për shembull, versionet e faqeve me etiketa reklamuese); punë që kërkon kohë që kërkon një numër i madh faqet kërkojnë kohë. Nuk përjashton shfaqjen e marrjeve të reja. Pesha me dublikatë nuk transferohet në faqen kryesore.

Pro: nuk kërkon ndonjë aftësi të veçantë programimi.

6. Zgjidhje të gatshme për CMS të njohura

Zhvilluesit e CMS-ve të njohura kanë ofruar një sërë zgjidhjesh për të parandaluar dublikatat. Në të njëjtën kohë, kur punoni me motorin, webmasterët duhet të vendosin me kujdes cilësimet. Nëse keni humbur diçka dhe përsëri shfaqen dublikatë, nuk është kurrë vonë për të rregulluar gjithçka dhe për të eliminuar kopjet. Udhëzime të qarta se si të konfiguroni motorin dhe të përdorni shtojcat SEO mund të gjenden në bloge dhe forume të specializuara për WordPress, Joomla, Drupal, Bitrix, si dhe CMS të tjera të paraqitura gjerësisht.

Shtojca të dobishme SEO për trajtimin e dublikatave:

WordPress: Të gjitha në një paketë SEO, Clearfy;
Drupal: Ridrejtimi global, Titulli i faqes;
Joomla: Lidhje kanonike të gjitha në një, JL Pa duble.

7. Lufta në nivelin e motorit

Një zgjidhje universale për një shumëllojshmëri të gjerë CMS është parandalimi i shfaqjes së dublikatave të reja në nivelin e motorit. Është e nevojshme të vendoset një kusht nën të cilin gjatë përpunimit të adresës Lidhje CMS do të dallojë "e mirë" nga "e keqe" dhe do të shfaqë vetëm ato që lejohen nga rregulli në shiritin e shfletuesit. Kjo do të shmangë formimin e faqeve sinonime (me dhe pa shenjën "/", me fund të panevojshëm.html, parametra GET, etj.), por nuk do të mbrojë nga dublikatat nëse Titulli dhe Përshkrimi nuk janë unikë për faqet.

Për zbatimin kjo metodë Skedari htaccess duhet të përfshijë rregullin e mëposhtëm:

RewriteEngine në RewriteCond% (REQUEST_FILENAME)! -D RewriteCond% (REQUEST_FILENAME)! -F RewriteRule ^ (. *) $ Index.php

Përveç kësaj, ju duhet të zbatoni kontrollet e nevojshme në vetë motorin.

Metoda është e ndryshme kompleksiteti i lartë dhe kërkon kontaktimin e specialistëve të zhvillimit.

Kundër: shkalla jashtëzakonisht e lartë e vështirësisë.
Pro: Parandalon shfaqjen e faqeve sinonimike.

Gjetja e nevojave jo të plota

1. Ne kërkojmë duke përdorur webmasterin e Google ose shërbimin Xenu

Algoritmi i veprimeve në këto shërbime është absolutisht i njëjtë me kërkimin e kopjimeve të plota. I vetmi ndryshim është se midis dublikatave të gjetura është e nevojshme të zgjidhni ato faqe që kanë Titull dhe / ose Përshkrimi identik, por përmbajtje krejtësisht të ndryshme.

Si rezultat i një kërkimi në Google, gjetëm një grup dublikatash jo të plota (Fig. 2).

Oriz. 2. Lajme krejtësisht të ndryshme me meta të dhëna të kopjuara

2. Ne kërkojmë në shiritin e kërkimit të Yandex ose Google

Faqet me përmbajtje pjesërisht të ngjashme, por meta të dhëna të ndryshme nuk mund të zbulohen duke përdorur metodën e mësipërme. Në këtë rast, do t'ju duhet të punoni me dorë.

Së pari, nënvizoni me kusht zonat e rrezikut:

përmbajtje e dobët (blloqet nga fundi në fund tejkalojnë tekstin kryesor të faqes për sa i përket vëllimit);
përmbajtje e kopjuar (përshkrime të produkteve të ngjashme);
kryqëzimi i përmbajtjes (njoftimet, titujt / nëndrejtoritë, filtrat, renditja).

Zgjidhni shumë faqe nga secili grup.

Për një ilustrim të qartë të një shembulli, ne përdorëm një nga kartat e produktit në faqen e internetit të një dyqani mobiljesh, e cila u auditua në seksionin tonë "Ekspertiza". Mundësia e shfaqjes së kopjimeve këtu është mjaft e lartë, pasi fotografitë dhe blloqet e brendshme mbizotërojnë në karta, dhe përmbajtje unike reduktuar në minimum.

Ne tregojmë në rresht kërkim në Google një fragment të tekstit nga përshkrimi i produktit, i mbyllur në thonjëza dhe domeni i faqes me operatorin e sitit: (Fig. 3).

Shumë pronarë të faqeve fokusohen kryesisht në bërjen e përmbajtjes unike kur krahasohen me burimet e tjera. Megjithatë, mos e neglizhoni praninë e përmbajtjes së kopjuar brenda të njëjtit sajt. Kjo gjithashtu ka një ndikim të fortë në renditje.

Çfarë është përmbajtja e kopjuar

Përmbajtja e kopjuar ose e kopjuar është një bllok i madh teksti që përkon brenda sajtit. faqe të ndryshme... Kjo nuk bëhet domosdoshmërisht me qëllim të keq - shpesh lind për arsye teknike, të cilat diskutohen në detaje më poshtë.

Rreziku është se shpesh përmbajtja e dyfishuar nuk mund të shihet me sy të lirë, por motori i kërkimit e sheh atë në mënyrë të përsosur dhe reagon në përputhje me rrethanat.

Nga vjen përmbajtja e kopjuar dhe ku është më e zakonshme

Arsyet kryesore për këtë fenomen:

Ndryshimi i strukturës së sitit;
Përdorimi i qëllimshëm në qëllime specifike(të themi, versionet e printuara);
Veprimet e gabuara të programuesve dhe webmasterëve;
Probleme me CMS.

Për shembull, ndodh një situatë e zakonshme: replytocom (përgjigja ndaj një komenti) në WordPress gjeneron automatikisht faqe të reja me URL të ndryshme, por jo përmbajtje.

Zakonisht, përmbajtja e kopjuar vërehet kur krijohen njoftime për artikuj në faqet e tjera të faqes, postimi i rishikimeve, si dhe me të njëjtat përshkrime të mallrave, kategorive, titujve.

Pse përmbajtja e kopjuar është e keqe

Përmbajtja e kopjuar ka një analog nga sfera e ekonomisë - mbitërheqja bankare. Ky është i vetmi vend ku shpenzohet i ashtuquajturi buxhet zvarritës. Ky është numri i faqeve të një burimi që do të jetë në gjendje të skanojë për një periudhë të caktuar kohe. motor kërkimi... Burimi është shumë i vlefshëm dhe është më mirë ta shpenzoni në faqe vërtet të rëndësishme dhe të rëndësishme sesa në dhjetëra kopje të tekstit identik.

Kështu, përmbajtja e kopjuar degradon renditjen e motorëve të kërkimit. Përveç kësaj, janë të humbur lidhjet natyrore dhe pesha e lidhjes është shpërndarë gabimisht brenda sajtit. Ai gjithashtu zëvendëson faqet vërtet të rëndësishme.

Si të gjeni përmbajtje të kopjuar në faqe (me dorë, programe dhe shërbime)

ekziston programe të veçanta për analizën e burimeve. Nga këto, përdoruesit theksojnë veçanërisht Netpeak Spider. Ajo është në kërkim kopje të plota faqet, ndeshjet sipas titullit ose përshkrimit, titujt. Një tjetër opsion është Screaming Frog, i cili ka funksionalitet të ngjashëm dhe në fakt ndryshon vetëm në ndërfaqe. Ekziston edhe aplikacioni Xenu`s Link Sleuth, i cili funksionon në mënyrë të ngjashme me një motor kërkimi dhe është në gjendje të krehë faqen për dublikata të një cilësie mjaft të lartë.

Fatkeqësisht, nuk ka mjete që mund të gjurmojnë plotësisht të gjithë tekstin e kopjuar. Prandaj, ka shumë të ngjarë, do t'ju duhet të bëni një kontroll manual. Këtu është një listë e faktorëve të mundshëm që shkaktojnë problemin:

Kuptova se si të gjesh përmbajtje të kopjuar. A ndihmësit më të mirë për ta luftuar atë, këto janë 301 ridrejtime, etiketa URL kanonike, indikacione në robots.txt dhe parametra Nofollow dhe Noindex si pjesë e meta-etiketës "robots".

Një mënyrë për të me nxitim kontrolloni nëse ka përmbajtje të kopjuar në faqe, është kërkimi i avancuar në Yandex ose Google. Duhet të futni adresën e faqes dhe një pjesë të tekstit nga faqja që keni vendosur të kontrolloni. Ju gjithashtu mund të përdorni programe të shumta për të kontrolluar veçantinë e tekstit:

Teksti.Ru;
eTXT Anti-Plagjiaturë;
Advego Plagiatus;
Përmbajtja-Shikoni.

Si të trajtoni dhe pastroni përmbajtjen e kopjuar

Perseri i njejte sistemi i referencës Google ofron një sërë këshillash për të parandaluar shfaqjen e këtij problemi.

301. Në rast të ndryshimeve strukturore të burimit, është e nevojshme të tregohet ridrejtimi 301 në skedarin htaccess.
Përdorni standard uniform lidhjet.
Përmbajtja specifike për rajonin vendoset më së miri në domene niveli më i lartë sesa në nënfushat ose nëndrejtoritë.
Vendosni metodën tuaj të preferuar të indeksimit duke përdorur Search Console.
Mos përdorni shabllone. Në vend që të vendosni tekst për mbrojtjen e të drejtës së autorit në çdo faqe, është më mirë të bëni një lidhje që do të çojë në një faqe të veçantë me këtë tekst.
Kur zhvilloni faqe të reja, sigurohuni që ato të jenë të mbyllura nga indeksimi derisa të jenë gati.
Kuptoni saktësisht se si shfaqet përmbajtja juaj - mund të ketë dallime në shfaqje në blogje dhe forume.
Nëse ka shumë artikuj të ngjashëm në faqe, është më mirë ose të kombinoni përmbajtjen e tyre në një tërësi, ose të unifikoni secilën prej tyre.

Motorët e kërkimit nuk ofrojnë asnjë sanksion në lidhje me faqet që kanë përmbajtje të kopjuar për arsye teknike (në krahasim me ata që e bëjnë atë qëllimisht për të manipuluar rezultatet e kërkimit ose për të mashtruar vizitorët).

Pasi të hiqen kapjet, mbetet t'i hiqni ato rezultatet e kërkimit... Yandex e bën këtë vetë, me kusht që skedari robots.txt të konfigurohet siç duhet. Sa për Google: atje do të duhet të regjistroni manualisht rregullat në Webmaster, në skedën "Parametrat URL".

konkluzioni

Luftimi i përmbajtjes së kopjuar në një faqe interneti është një aspekt i rëndësishëm i aktivitetit të çdo pronari të faqes në internet. Ka mjaft arsye për shfaqjen e tij, dhe ka po aq mënyra për ta eliminuar atë.

Megjithatë, rregulli kryesor mbetet: postoni përmbajtje ekskluzivisht origjinale, pavarësisht nga lloji i faqes. Edhe nëse është një dyqan i madh në internet me mijëra faqe.

MERRNI NJOFTIMET PËR POSTIME TË NGJASHME ME POSTE

Abonohuni dhe merrni, jo më shumë se një herë në javë, diçka interesante nga bota e marketingut në internet, SEO, promovimi i faqeve në internet, dyqanet online, fitimi i parave në faqet e internetit.

Përmbajtja e kopjuar degradon indeksimin e faqes

"Rrugë të ndryshme të çojnë në vende të ndryshme dhe vetëm njëra prej tyre është e saktë."

Përshëndetje miq! Unë kam kohë që do ta zbuloj këtë temë në faqet e faqes sime, prandaj, pasi kam studiuar shumë materiale mbi dyfishimin e përmbajtjes dhe shkaqet, pasojat dhe mënyrat e eliminimit të këtij fenomeni negativ, vendosa të shpreh mendimet e mia për këtë problem. në burimin tim modest.

Jini të durueshëm dhe studioni me kujdes të gjitha rekomandimet e artikullit dhe më pas kontrolloni statusin e burimeve tuaja. Nëse dëshironi të shihni një renditje të shkëlqyer të faqeve të faqeve tuaja në motorët e kërkimit - ndiqni rreptësisht ato.

Pa pretenduar të jetë gjithçka mënyrat e mundshme duke eliminuar shkaqet e përmbajtjes së kopjuar, unë, megjithatë, sugjeroj të studiojmë më së shumti pika të rëndësishme kjo pyetje.

Nëse përdorues i rregullt(dhe nganjëherë vetë webmaster) mund të mos e vërejë përmbajtjen e kopjuar të faqes, atëherë motorët e kërkimit do ta përcaktojnë menjëherë këtë. Reagimi i tyre do të jetë i paqartë: përmbajtja nga këto faqe do të pushojë së qeni unike... Dhe kjo tashmë nuk është mirë, pasi do të ndikojë negativisht në renditjen e tyre.

Gjithashtu, dyfishim turbullon peshën e lidhjes, në një postim specifik, të cilin, ndërsa e optimizonit, u përpoqët ta promovoni në TOP, si një faqe uljeje. Dublikatat thjesht do të shkatërrojnë të gjitha përpjekjet për ta optimizuar atë dhe efekti i lidhjes do të jetë minimal.

Cilat janë përmbajtjet e kopjuara?

1. Përmbajtja e kopjuar nga dikush ose personalisht nga ju dhe e postuar në burime të palëve të treta.

Ju mund të lexoni shumë artikuj në internet se si të merreni me përmbajtjen e vjedhur, një nga opsionet është artikulli im. A është e mundur të shfaroset - një pyetje retorike dhe sot, për mendimin tim, vendimet kardinale nuk ka një problem të tillë në internet. Ka vetëm disa truke pak a shumë efektive.

2. Përmbajtja-kopjuar, e cila krijohet nga webmaster me duart e veta.

Dublikatë e plotë (ose e paplotë) kur shpërndani informacion (ose siç quhen - njoftime) në faqe dhe forume speciale. Nëse dëshironi të merrni një kopje të regjistrimit tuaj në internet - kopjoni atë në ndonjë burim të mirë - rezultati, pothuajse gjithmonë, do të jetë i menjëhershëm. Një dublikatë është e mundur direkt në faqet e faqes. A keni parë ndonjëherë dy faqe identike në burimin tuaj kur keni krijuar vetëm një? Pse po ndodh kjo? Arsyet për redaktimin e shënimeve ose ruajtjen e atyre të papërfunduara në drafte, dhe më pas, pa dashje, krijimin e një dublikate. Administratori i faqes, pa e vënë re vetë dhe më vonë duke mos parë të gjitha regjistrimet e tij, për të mos gjetur një dublikatë, jeton i lumtur, duke mos dyshuar se ka "binjakë", "trinjakë" etj.

3. Dyfishim për arsye teknike - shfaqja e dublikatave në të cilat fajësohet CMS.

Këto gabime shfaqen nga fakti se zhvilluesit e CMS nuk mendojnë si shfletuesit apo merimangat e kërkimit, por mendojnë ashtu siç u ka hije zhvilluesve të motorëve të faqeve të internetit; shumë mëkatojnë këtë - Joomla, për shembull.

Më lejoni të shpjegoj pak. Supozoni se keni një artikull me fraza kyçe "Përmbajtje e kopjuar"... Ai duhet të jetë i vendosur në një faqe me adresën e mëposhtme: http://domain.ru/ dyfishim i përmbajtjes /, por e njëjta përmbajtje mund të shfaqet, për shembull, si kjo: http: //domain.ru/article-category/ dyfishim i përmbajtjes /... Dhe nëse marrim parasysh dyfishime të tjera, faqe, për shembull: http: //domain.ru/ dyfishimi i përmbajtjes /? burimi = rss... Të gjitha këto url janë adresa të ndryshme për cilindo, por të njëjta për përdoruesin (lexuesin). Këto dallime i lejojnë webmasterit të gjurmojë se nga ka ardhur përdoruesi, por ato mund të jenë të dëmshme nëse nuk bëhen. cilësimet e dëshiruara indeksimi.

Uebsajtet dihet se funksionojnë falë sistemin ekzistues Baza e të dhënave. Ekziston vetëm një version i një artikulli specifik (ID) në bazën e të dhënave, por skriptet e faqes lejojnë nxirre këtë artikull nga baza e të dhënave në faqe të ndryshme (url)... Por motorët e kërkimit kanë nevojë për një dokument (URL) - vetëm ai është një identifikues unik dhe asgjë tjetër!

4. Merr fuzzy.

Një lloj i veçantë dublikimi, i cili gjendet kryesisht në dyqanet online, ku faqet me kartat e produkteve ndryshojnë vetëm në disa fjali me përshkrime, dhe e gjithë përmbajtja tjetër, e përbërë nga blloqe tërthore dhe elementë të tjerë, është e njëjtë. Është e vështirë të fajësosh webmasterin, megjithëse ka disa opsione për t'i eliminuar ato.

Pra, ne kuptuam shkaqet dhe pasojat e përmbajtjes së kopjuar. Tani le të kalojmë në zgjidhjen e problemeve. Para së gjithash, le të zbulojmë

Si mund të gjej faqe të kopjuara?

1. Metoda manuale.

1) Nëse përmbajtja juaj nuk është shumë e madhe, thjesht lëvizni nëpër faqe në panelin e administratorit "Të gjitha hyrjet“Dhe, nëse gjenden ndonjë dublikatë, fshini ato të panevojshme.

2) Për të zbuluar praninë e kopjimeve, mund të përdorni shërbimet e motorëve të kërkimit "Yandex-webmaster" ose Google Webmaster Tools.

Për shembull, në Webmaster Tools hapni faqen "Mjetet për Webmasters" - "Optimization" - "HTML Optimization": nëse ka gabime dhe dublikatë, magjistari do t'ju tregojë gjithçka. Merreni me klikimet, eliminoni gabimet dhe dublikatat, në të njëjtën kohë.

3) Përdorni drejtpërdrejt dritaret e kërkimit të sistemit (metodë e përafërt). Vendosni për secilën prej tyre një procesverbal të formularit faqja: domain.ru dhe krahasoni rezultatet e tyre. Nëse ato nuk janë shumë të ndryshme, atëherë dyfishimi juaj nuk është aq i keq.

4) Ekziston një mënyrë efektive për të gjetur kopje - kërkimi përmes fragmenteve të tekstit. Kjo bëhet thjesht: në kutinë e kërkimit të çdo sistemi, futni fragment teksti hyrjen tuaj (artikullin) në madhësinë 10-20 fjalë (mundësisht nga mesi) dhe analizoni rezultatin. Prania e dy ose më shumë faqeve në SERP do të thotë se ka dublikatë për këtë opus. Nëse jo, mund të jesh pak i lumtur :).

Është e vështirë nëse faqja ka grumbulluar shumë faqe. Kontrolli i mësipërm mund të bëhet i padurueshëm punë rutinë... Nëse dëshironi të minimizoni shpenzimet tuaja të kohës - përdorni programin Sleuth i lidhjes së Xenu.

Për të kontrolluar faqen, duhet të hapni projekt i ri duke zgjedhur "Kontrollo URL-në" nga menyja "File", futni adresën dhe shtypni "OK". Pas kësaj, programi do të fillojë të përpunojë të gjitha URL-të e faqes. Në fund të kontrollit, ju duhet të eksportoni të dhënat e marra në ndonjë redaktues i përshtatshëm dhe filloni të kërkoni për kopje.

Kush ka nevojë për një lidhje për të shkarkuar skedarin e këtij programi, çabonohuni në komente, unë do ta dërgoj në emailin tuaj.

Pra, ne kuptuam se cilat arsye (kryesore) çojnë në përmbajtje të kopjuar. Tani le të përcaktojmë mënyrat për ta eliminuar atë.

Mënyrat për të eliminuar përmbajtjen e kopjuar

URL-të kanonike janë një zgjidhje konceptuale për problemin

Nëse nuk keni opsionin për të () hequr dublikatat, problemi mund të zgjidhet duke përdorur etiketën kanonika l (përdoret për kopje të paqarta). Etiketa kanonike është gjithashtu e përshtatshme për versione faqe për të printuar dhe në raste të tjera të ngjashme. Përdoret shumë thjesht - për të gjitha kopjet specifikohet atributi rel = "kanonik", por për faqen kryesore, e cila është më e rëndësishme, nuk është. Kodi duhet të duket diçka si kjo: lidhja rel = "kanonike" href = "http: //domain.ru/copy faqe" / dhe të jetë brenda etiketës së kokës.

Për përdoruesit me Motori WordPress ekziston një mundësi e shkëlqyeshme për t'i bërë të gjitha këto automatikisht duke instaluar shtojcën e paketës SEO të gjitha në një ose të ngjashme. Në cilësimet, ky operacion caktohet nga etiketat:

Konfigurimi i veçorive të moslejimit në skedarin robots.txt të faqes suaj

Megjithëse krijimi i faqeve të mohimit për indeksimin nuk është gjithmonë mënyrë efektive nga dublikatat, meqenëse motorët e kërkimit ndonjëherë arrijnë t'i anashkalojnë ato, megjithatë, një robot.txt i konfiguruar siç duhet do ta lehtësojë shumë detyrën për t'i shmangur ato.

MEwwwose pawww

Si do të duken faqet e faqes suaj - vetëm me duke përdorur http ose http.www? Pasiguria do të krijojë dyfishim. Menjëherë pas krijimit të faqes, përcaktoni se cilin protokoll transporti hiperteksti do të përdorni. Për ta bërë këtë, në panelin e webmasterëve Yandex dhe Google, vendosni zgjedhjen tuaj (në Google, kjo mund të bëhet për të dy versionet, por do t'ju duhet të konfirmoni të drejtat për të dy adresat). Mund ta lini si parazgjedhje ose në "zgjedhjen e një roboti kërkimi", por është më mirë të përcaktohet qartë.

Vendosja e një ridrejtimi

Një ridrejtim 301 është i shkëlqyeshëm për ngjitjen e faqeve të kopjimit me URL që kanë ose nuk kanë www. Siç e keni kuptuar tashmë (shih pamjen e ekranit më lart), vendosja e një ridrejtimi në WordPress thjeshtohet gjithashtu duke përdorur një shtojcë. Në fakt, nëse ju dhe roboti i kërkimit e keni "marrë mendjen" me zgjedhjen tuaj - me ose pa www, do të ketë një domen kryesor, vendosja e një ridrejtimi për të gjitha faqet nuk është e nevojshme. Sidoqoftë, tema e vendosjes së një ridrejtimi dhe përshtatshmëria e tij është një temë për një artikull të veçantë.

Rezultatet dhe përfundimet

mos lejoni dyfishimin e faqeve (përmbajtjes) në burimet tuaja, pasi dublikatat çojnë në një rënie serioze të rëndësisë së faqeve, gjë që e bën të vështirë sjelljen e tyre në pozicionet kryesore në rezultatet e kërkimit (TOP);
problemet me përmbajtjen e kopjuar në pjesën më të madhe kanë një zgjidhje - përdorni të gjitha mjetet e mundshme për këtë;
monitoroni vazhdimisht procesin e indeksimit të përmbajtjes tuaj dhe mos krijoni dublikatë në të

Kjo është e gjitha, i dashur lexues. Nëse keni diçka për të më shtuar ose korrigjuar, bëni një pyetje - shfrytëzoni një shans!

Jo krejt tema, por për binjakët.

(Vizituar 28 herë, 1 vizitë sot)

Me siguri, e keni dëgjuar më shumë se një herë frazën "përmbajtje kopjuar" dhe ju, si një pronar me përvojë uebsajti, nuk do të postonit kurrë të njëjtën përmbajtje dy herë, apo jo?

Përmbajtja e kopjuar mund të krahasohet me një mbitërheqje bankare. Vetëm atëherë po humbisni buxhetin tuaj të vlefshëm të zvarritjes.

Buxheti zvarritës është numri i faqeve në sajtin që robot kërkimi mund të skanojë për një periudhë të caktuar kohe. Prandaj, është kaq e rëndësishme ta shpenzojmë atë në faqet që na duhen.

Duke u shfaqur në forma të ndryshme, përmbajtja e kopjuar mund të bëhet një nga problemet më të pakapshme dhe të padukshme që mund të ndikojë negativisht në renditjen dhe promovimin e një faqeje. Pamja e saj shpesh shoqërohet me veçoritë e arkitekturës së sitit ose kufizimet e CMS.

Fatkeqësisht, nuk ka një kontroll të tillë Google Webmaster e që mund të zbulonte lehtësisht përmbajtjen e kopjuar. Edhe më të avancuarit mjete të palëve të treta mos e bëni gjithmonë mirë këtë, veçanërisht kur burimi i problemit është brenda. Kontroll manual nuk mund të shmanget.

Këtu është një listë me 8 arsye të mundshme për shfaqjen e faqeve të kopjuara në sit:

Faqet HTTP dhe HTTPS

Një nga më kontrolle të shpejta Fakti që ju keni dy versione të faqes në dispozicion për indeksim është të përpiqeni ta aksesoni atë duke përdorur protokollet HTTP dhe HTTPS. Nëse hapen të dy versionet, është e qartë se zhvilluesi juaj e ka kaluar sitin në HTTPS dhe nuk ka vendosur një ridrejtim 301 nga versioni HTTP.

Përpara se Google të fillonte të inkurajonte në mënyrë aktive webmasterët që t'i zhvendosnin faqet e tyre tërësisht në HTTPS, shumë prej tyre aktivizuan vetëm HTTPS faqe të veçanta që kishte nevojë siguri shtesë të tilla si faqet e hyrjes ose faqet e transaksioneve. Nëse zhvilluesi ka përdorur lidhje relative, atëherë sa herë që zvarritësi viziton faqet e mbrojtura, detyrohet të shtojë HTTPS në të gjitha URL-të, gjë që përfundimisht çon në shfaqjen e faqeve të kopjuara.

Në të njëjtën mënyrë, duhet të kontrolloni nëse faqja ka dy versione faqesh si me WWW ashtu edhe pa WWW. Ju mund ta zgjidhni këtë problem duke vendosur një ridrejtim 301 dhe duke specifikuar domenin tuaj të preferuar (pasqyrën kryesore) në Google Webmaster.

Faqet e internetit që vjedhin përmbajtjen tuaj

Derisa të ekzistojë legjislacioni për t'ju kthyer përmbajtjen e vjedhur, ka vetëm mënyra se si mund të përdorni kodin për ta bërë më të vështirë për hajdutët që përpiqen të kalojnë përmbajtjen tuaj si të tyren. Për ta bërë këtë, përdorni gjithmonë lidhje absolute në faqe në vend të atyre relative:

Lidhje absolute: http://seo.artox-media.ru/wiki/dublirovannyi-kontent.html (fillon me specifikimin e protokollit dhe përmban emrin e faqes).
Lidhjet relative:/wiki/dublirovannyi-kontent.html (origjinon nga rrënja e faqes ose dokumenti aktual).

Pse është e rëndësishme? Kur përdorni URL relative, shfletuesi juaj supozon se lidhja tregon një faqe në të cilën jeni tashmë. Disa zhvillues preferojnë URL-të përkatëse sepse e bëjnë më të lehtë shkrimin e kodit.

Nëse zhvilluesi nuk dëshiron të rishkruajë të gjithë sitin, mund të përdorni etiketat kanonike vetë-referuese. Kur përmbajtja juaj postohet në një sajt tjetër, etiketat kanonike mund të mbeten, duke ndihmuar Google të përcaktojë se faqja juaj është burimi origjinal i përmbajtjes.

Për të zbuluar nëse përmbajtja juaj është vjedhur, mund të përdorni ndonjë prej tyre shërbime falas(p.sh. Siteliner, Copyscape. Etxt, AdvegoPlagiatus, etj.)

Nëndomenet e braktisura

Le të themi se keni hequr një nëndomain dhe keni vendosur të përdorni një nëndrejtori në vend të kësaj. Ose, për shembull, ju keni krijuar një faqe interneti krejtësisht të re. Në çdo rast, përmbajtja juaj e vjetër mund të jetë e disponueshme dhe, për më tepër, mund të ketë një efekt të keq në renditjen e faqeve të reja. Për të zgjidhur problemin, është më mirë të përdorni një ridrejtim 301 nga ky nëndomain në faqen / drejtorinë e re. Kjo është veçanërisht e rëndësishme nëse faqja juaj e vjetër ka shumë lidhje.

Faqet e fshehura në ndërtim e sipër

A keni vendosur të përditësoni dizajnin tuaj? Përgatitni faqen tuaj të internetit për një ndryshim të madh? Nëse më parë nuk i keni mbyllur faqet tuaja të provës (dhe aq më tepër versionet e zhvilluesit të faqes) nga indeksimi, atëherë nuk jeni të siguruar që roboti nuk do t'i zbulojë ato.

Ekziston një keqkuptim i zakonshëm që askush nuk do të hamendësojë të futë një URL fiktive në faqen tuaj të internetit http://razrabotka.sait.ru/ në linjën e shfletuesit, nëse nuk ka asnjë lidhje me të askund në kod, duket se kjo është thjesht joreale. Por ky nuk është rasti! Google vazhdimisht kërkon dhe indekson faqe të reja ueb, duke përfshirë ato në zhvillim. E gjithë kjo mund të ndikojë në rezultatet e renditjes, si dhe të mashtrojë përdoruesit.

Jo vetëm që kjo merr një taksë të madhe në sajt për sa i përket privatësisë dhe sigurisë, por gjithashtu mund të shkaktojë kërdi në buxhetin e zvarritur. Shmangia e kësaj është e thjeshtë: përdorni një meta etiketë robotësh me noindex në të gjitha faqet e testimit ose bllokojini ato në skedarin tuaj robots.txt.

ose

Të dy opsionet tregojnë një ndalim të indeksimit të tekstit dhe klikimit në lidhjet në faqe.

Mos harroni se kur migroni faqet nga modaliteti i devijimit në "live", duhet t'i hiqni këto direktiva bllokuese nga kodi juaj.

Parametrat e URL-së të krijuara në mënyrë dinamike

Më shpesh, URL-të dinamike krijohen bazuar në filtrat e përdorur në sit. Si duken saktësisht URL të tilla?

URL 1: www.shop.com/chocolate/cake/vanilla
URL 2: www.shop.com/chocolate/cake/vanilla%8in
URL 3: www.shop.com/chocolate/cake/vanilla%8in=merble

Ky është një shembull i thjeshtë, megjithatë, CMS-ja juaj mund të shtojë parametra të ndryshëm filtron dhe gjeneron vargje të panevojshme të gjata URL-sh që mund të marrin pjesë në procesin e zvarritjes nga roboti i kërkimit.

Në këtë mënyrë Google mund të krijojë dhe indeksojë kombinime të pafundme të URL-ve që përdoruesi as nuk i kërkon.

V në këtë rast, aplikoni etiketën kanonike që tregon URL-në tuaj të preferuar dhe konfiguroni parametrat e zvarritjes së URL-së në Google Webmaster.

Mund ta kaloni këtë hap dhe të bllokoni URL specifike në robots.txt duke përdorur karakterin (*) për të parandaluar indeksimin e çdo gjëje. drejtoria e specifikuar... Për shembull: Mos lejo: / çokollatë / tortë / *

Nëndrejtoritë e pasqyruara

A operon biznesi juaj në disa rajone? Disa biznese zgjedhin të krijojnë një faqe bazë fillestare që i lejon përdoruesit të zgjedhin rajonin që funksionon më mirë për ta dhe më pas i ridrejton në nëndrejtorinë e duhur. Për shembull:

URL 1: www.wonderfullywhisked.com/fr
URL 2: www.wonderfullywhisked.com/de

Edhe pse kjo mund të duket logjike, merrni parasysh nëse ka vërtet nevojë për këtë cilësim. Në të vërtetë, ndërkohë që synoni audienca të ndryshme, ekziston mundësia që të dy nëndrejtoritë të kopjojnë plotësisht njëri-tjetrin në përmbajtje. Për të zgjidhur këtë problem, përdorni Google Webmaster për të konfiguruar gjeotargeting.

Përmbajtje sindikale

Përmbajtja e sindikatës - ripërdorim të njëjtën përmbajtje në burime të ndryshme për të promovuar faqen / markën / përmbajtjen tuaj dhe për të tërhequr trafik shtesë.

Sindikata është në një mënyrë të shkëlqyer për të njohur audiencë e re me faqen tuaj, megjithatë, ia vlen të përcaktoni rregulla se kush do të ripublikojë përmbajtjen tuaj.

Në mënyrë ideale, duhet t'u kërkoni botuesve të përdorin atributin "rel = kanonik" në faqen e përmbajtjes për të treguar Motorë kërkimi se faqja juaj e internetit është burimi origjinal i përmbajtjes. Përveç kësaj, ata gjithashtu mund të bllokojnë përmbajtjen nga indeksimi, gjë që do të zgjidhë çështjet e mundshme të dyfishimit në rezultatet e kërkimit.

Në fund të fundit, botuesit mund të lidhen me artikullin origjinal me ju të vlerësuar si burim origjinal.

Përmbajtje të ngjashme

Përmbajtje të ngjashme mund të bëjnë po aq dëm sa përmbajtja e kopjuar. V Përkufizimi i Google në lidhje me përmbajtjen e kopjuar shfaqet edhe shprehja "thelbësisht e ngjashme". Dhe le që pjesët e materialit të jenë të ndryshme në sintaksë, rregull i përgjithshëmështë se nëse mund të mbledhësh të njëjtin informacion prej tyre, atëherë nuk ka asnjë arsye që të dy të ekzistojnë në faqen e internetit. Këtu, një zgjidhje e shkëlqyer për problemin është të përdorni një etiketë kanonike ose të konsideroni kombinimin e këtyre pjesëve të përmbajtjes në një.

konkluzionet

Është shumë e rëndësishme të monitoroni paraqitjen e përmbajtjes së kopjuar në faqe për të shmangur humbjen e buxhetit tuaj zvarritës, sepse kjo e pengon robotin të kërkojë dhe të indeksojë faqet e reja dhe të nevojshme nga roboti. Në këtë rast, mjetet më të mira arsenali juaj mund të përfshijë etiketa kanonike, ridrejtime 301, atribute nofollow / noindex në meta-etiketën "robots" dhe direktiva në skedarin tuaj robots.txt. Punoni në identifikimin dhe heqjen e përmbajtjes së kopjuar duke shtuar këto pika kontrolli në auditimin tuaj të SEO.