Duplicate Content? Nog 1 keer: Hoe zit het met Dubbele Content (SEO)?

Share on facebook
Share on google
Share on twitter
Share on linkedin
Blog-No Crap Online Duplicate Content

Bij het maken van content voor je website word je vaak bang gemaakt met de dreiging van strafpunten van Google voor Duplicate Content waardoor je met je website minder hoog scoort in de zoekresultaten. Wat is het nu precies en is het echt zo erg? In dit artikel leg ik uit wat duplicate content is, wat het effect is op de zoekresultaten en hoe je duplicate content kunt voorkomen en of die bangmakerij terecht is.

Wat is Duplicate Content?

Duplicate Content, zoals het internationaal en in SEO-kringen wordt genoemd, is dubbele content of dubbele inhoud. Dit kan content zijn op je website of buiten je website. In dit artikel gebruikt ik de termen door elkaar maar weet dat duplicate content en dubbele content hetzelfde betekenen.

SEO Duplicate Content

Duplicate content is a term used in the field of search engine optimization to describe content that appears on more than one web page. The duplicate content can be substantial parts of the content within or across domains and can be either exactly duplicate or closely similar.[1] When multiple pages contain essentially the same content, search engines such as Google and Bing can penalize or cease displaying the copying site in any relevant search results.

Duplicate content – Wikipedia

Bovenstaande Wikipedia paragraaf zegt dat duplicate content betekent dat er zich op het internet meer dan 1 pagina met dezelfde inhoud bevindt.

Google ziet een pagina als duplicate content (met dezelfde inhoud), als een bezoeker dit ervaart als dezelfde inhoud en als Google dit ook ziet als een pagina met dezelfde inhoud.

Duplicate Content = 100% dezelfde inhoud?

Als Google iets voor dubbele content aanziet, hoeft het niet eens 100% dezelfde inhoud te zijn. Zelfs als ‘maar’ 80% van de inhoud van een pagina gelijk is aan de inhoud van een andere pagina, wordt dit als duplicate content ervaren door een bezoeker en dus ook als dubbele content door Google gezien.

Interne en externe duplicate content

Dubbele content kan zowel intern als extern zijn. Interne duplicate content bevindt zich binnen je eigen website. Externe duplicate content bevindt zich op meerdere sites, waaronder natuurlijk jouw site.

Interne duplicate content

Internet dubbele content bevindt zich dus binnen je eigen site. Dit betekent dat er meer dan 1 pagina is met dezelfde content. Dit kan komen doordat je een pagina per ongeluk kopieert en de kopie blijft ‘live’ staan. Of dat je te veel tekst overneemt van een andere pagina.
De meest voorkomende reden is echter dat een pagina meer dan 1 unieke link (URL) heeft. Dan kan je op meerdere manieren naar dezelfde pagina komen.

http/https en www. en zonder www.

Stel, je hebt een pagina met de naam Pagina1 en de link voor deze pagina is https://www.jouwdomein.nl/Pagina1. Dat is een unieke link want er is maar 1 pagina met deze link.
Maar, wat gebeurt er nou als je ook op je site kunt komen zonder www? Dan kan je naar https://jouwdomein.nl/Pagina1. Je kunt dus op dezelfde pagina komen met 2 unieke linkjes. Oei! Ineens heb je dubbele content en je hebt niet eens iets raars gedaan.

En, wat dat je van http en https? We weten allemaal dat we https (dat slotje in je adresbalk) moeten gebruiken maar voor het gemak kan je ook nog steeds met http naar je site komen. Nog weer 2 varianten van dezelfde pagina en dan ook nog voor www. en zonder www. Snap je ‘m?

Dit zijn de vier mogelijkheden die je dan hebt om naar die ene pagina te komen:

https://www.jouwdomein.nl/Pagina1
http://www.jouwdomein.nl/Pagina1
https://jouwdomein.nl/Pagina1
http://jouwdomein.nl/Pagina1

Vier manieren om naar dezelfde pagina te verwijzen.

Categorieen en tags

En wat dacht je van blogartikelen met categorieën en tags? Tags en categorieën worden meegenomen in de link en vaak heeft een artikel meer dan 1 categorie en 1 tag. Weer een aantal unieke links erbij zoals je hieronder ziet:

https://www.jouwdomein.nl/categorie1/Artikel1
http://www.jouwdomein.nl/categorie1/Artikel1
https://jouwdomein.nl/categorie1/Artikel1
http://jouwdomein.nl/categorie1/Artikel1

https://www.jouwdomein.nl/categorie2/Artikel1
http://www.jouwdomein.nl/categorie2/Artikel1
https://jouwdomein.nl/categorie2/Artikel1
http://jouwdomein.nl/categorie2/Artikel1

Dat zijn al 8 unieke links naar dezelfde pagina. Hoeveel heb je er als een blogartikel 3 categorieën heeft en 3 tags? Ik ben de draad al kwijt.

Wil je dat ik nog even doorga? Ik denk dat je mijn punt inmiddels snapt. Dubbele content is eerder regel dan uitzondering.

Parameters

Dan heb je ook nog de ‘parameters’. Heb je wel eens gezien wat bijvoorbeeld Facebook van een link naar je site maakt?

Facebook URL parameters
Een voorbeeld van de parameters die Facebook meegeeft een een link die gedeeld is op Facebook.

Er wordt allerlei informatie achteraan meegestuurd. Dat zijn de zogenaamde parameters. Sommige functionaliteit binnen je site doet het zelfde. Om je website goed te laten werken, worden parameters meegestuurd. Die parameters zijn elke keer anders en deze links worden dus elke keer gezien als een unieke link naar je pagina.

Het is dus niet heel moeilijk om interne ‘dubbele’ content in Google’s ogen te hebben. Het is feitelijk dezelfde pagina maar deze heeft verschillende adressen of unieke links. Moeilijk he? En als je bovenstaande leest, lijkt het vrijwel onmogelijk om dit te voorkomen op je website. Wacht maar, er komen wat tips.

Externe duplicate content

Externe duplicate content is wanneer er twee of meer versies van dezelfde pagina rondzwerven op het internet. De meest voorkomende reden is dat een pagina domweg gekopieerd is. Dit mag natuurlijk niet, dit heet plagiaat.
Je kunt eenvoudig checken of je plagiaat aan het plegen bent.

Gekopieerde tekst kan ook voorkomen als je bijvoorbeeld, leverancier bent van een bepaald product en je de product beschrijvingen mag gebruiken van de producent. Als jij die mag gebruiken, mogen alle andere leveranciers het ook gebruiken en voor het gemak kopieert iedereen die zelfde tekst maar met alle gevolgen van dien. Het resultaat? Yep, dubbele content!

Een andere manier waarop je dubbele content kunt krijgen is zogenaamde ‘syndication’, als er iets opnieuw gepost wordt vanaf een andere website.

Wat is het effect van duplicate content op de zoekresultaten?

Je hoort het veel: “Als je dubbele content hebt dan krijg je strafpunten van Google!”

Er is geen direct effect op je zoekresultaten

De waarheid ligt iets genuanceerder. Je krijgt GEEN strafpunten van Google voor dubbele content volgens Google’s John Mueller. Dit betekent dat er geen DIRECT effect is op je zoekresultaten.

Maar…..

Er is wel een indirect effect op je zoekresultaten

Google laat bij een zoekopdracht altijd de meest relevante zoekopdrachten zien. Stel dat er nou 10 pagina’s zijn met dezelfde inhoud, dan houdt de persoon die zoekt, als snel op want het wordt een beetje vervelend zo. Daarom probeert Google verschillende zoekresultaten te tonen door de dubbele versies niet te tonen.

Als jij dezelfde content op je eigen site hebt staan, indexeert Google er maar een. So far, so good. Het nadeel van dubbele content is dat je lager kan scoren in Google. Dit heeft te maken met Linksap en Crawlbudget.

Linksap

De links naar pagina’s hebben een bepaalde waarde ‘linksap’ (link juice) genoemd

Link juice is a non-technical SEO term used to reference the SEO value of a hyperlink to a particular website or webpage.

What is Link Juice? The Crazy Egg Glossary

Onderstaande video is er een uit mijn programma ‘SEO Hacks’ die heel kort uitlegt wat linksap nu eigenlijk is.

SEO Hack over Linksap

Je hebt dus een beperkte hoeveelheid linksap. En hoe meer pagina’s je hebt, hoe meer je je linksap moet verdelen over de pagina’s. Zie het als een pak sinaasappelsap verdelen tussen 3 kinderen of tussen 10. Bij 10 kinderen krijg ieder kind minder sap. Simpelweg: hoe meer linksap een pagina krijgt, hoe beter deze scoort. Met dubbele content op je eigen site, zit je jezelf dus in de weg omdat de pagina’s dan minder linksap krijgen.

Crawl budget

Crawl Budget is the number of pages Googlebot crawls and indexes on a website within a given timeframe.

Backlinko

Het crawlbudget is het aantal pagina’s van jouw site dat Google per dag ongeveer maximaal indexeert binnen een bepaalde tijd.

Als je budget 100 website pagina’s is en je site heeft er 200, dan kan het even duren voordat al je pagina’s worden geïndexeerd door de Google bot. Nieuwe pagina’s, berichten en wijzigingen worden minder snel zichtbaar als je dubbele content (en dus meer pagina’s hebt).

Je kunt je crawl budget vergroten door o.a. je site sneller te maken zodat Google in de beschikbare tijd meer pagina’s kan crawlen en indexeren. Ook kan je interne links (= linkjes tussen je eigen pagina’s) gebruiken omdat Google pagina’s met interne en externe links prioriteit geeft. Het is alleen niet erg realistisch om backlinks (externe links) naar al je pagina’s te hebben. Dus dan wordt het belang van interne links groter. Interne linkjes heb je zelf controle over, externe linkjes niet. Die moeten je gegund worden door externe partijen.

Google toont de ‘originele’ pagina in de zoekresultaten

Google probeert altijd de originele pagina in de zoekresultaten te tonen. Helaas heeft Google het niet altijd bij het rechte eind en kan voorkeur geven aan groter/beter scorende sites. Dat is jammer, als het om jouw originele content gaat.

Je kan, als je merkt dat je duplicate content hebt, je tekst aanpassen. Pas de structuur van de tekst aan, verander zinnen, gebruik andere woorden en voeg tekst toe. Alles om ervoor te zorgen dat de content niet meer als hetzelfde gezien wordt als een andere pagina.

Het is zeker van belang dat je jouw nieuwe content zo snel mogelijk geïndexeerd krijgt zodat Google weet dat het van jou is. Dit kun je met de hand doen binnen Google Search Console of als je WordPress hebt, binnen de SEO plugin RankMath.

Als jouw hele site bestaat uit pagina’s met duplicate content dan heb je een groot probleem. Ik denk dat als dit zo is, je dit ook wel weet want die content is er niet zomaar op gekomen. Als Google dit merkt dan kan het een negatief effect hebben op hoe je site rankt (ranken is scoren in de zoekresultaten). Er volgt dan zeker een penalty omdat Google dit ziet als manipulatie van de zoekresultaten en misleiding. Yep, daar zijn die strafpunten die altijd genoemd worden en waar je niet op zit te wachten.
Als je echt pech heb wordt je helemaal uit de zoekresultaten gegooid en dat kan nooit de bedoeling zijn, toch?

Hoe voorkom je dubbele content en hoe los je het op?

Binnen je eigen site heb je meestal wel een goed idee van de content die je hebt en of je dubbele content hebt. Buiten je site wordt het moeilijker.
Kijk voor de gein eens op WorldWideWebSize.com wat het actuele aantal geïndexeerde pagina’s op het internet is. Mind blowing!
Je kunt dit nooit met de hand gaan controleren.

Gelukkig zijn er tools die je kunnen helpen.
Eerder in dit artikel noemde ik al de plagiaatchecker van Grammarly. Je kunt ook de duplicate content checker van SEO Review Tools bekijken.
Het makkelijke van deze tool is dat je een linkje kunt invoeren en dan gaat de tool voor je op het internet speuren of er duplicate content is.

Eigen site checken voor duplicate content
Even mijn eigen site checken voor duplicate content – OEPS!

Zoals je ziet bleek ik duplicate content binnen mijn eigen websites te hebben. Oeps! Dit heb ik natuurlijk meteen opgelost door 1 pagina niet te indexeren en bij de andere aan te geven welke het origneel is.

Hoe voorkom je nu die dubbele content of hoe los je het op? Ik geef je een aantal opties die het makkelijkst te implementeren zijn.

Canonical Tags/URL

Canonical Tag in de broncode van een pagina
Canonical Tag in de broncode van een pagina

Met een Canonical Tag geef je aan welke pagina het origineel is.
De duplicaten blijven dan nog wel gewoon bestaan. Soms herhaal je tekst op je pagina’s. De hele pagina verwijderen is dan natuurlijk geen optie. Met een Canonical Tag geef je dan aan welke van de pagina’s het belangrijkst is.

Zo heb ik op de pagina over mij en op mijn homepage een heel stuk dezelfde tekst staan. De homepage heb ik aangegeven als ‘origineel’.

Gebruik je de WordPress Plugin Rankmath dan voer je in het Canonical URL veld de link in van de ‘originele pagina’, oftewel de pagina die het belangrijkst is. De Canonical Tags worden dan automatisch aangemaakt. Vaak worden in je CMS (zoals WordPress) canonical tags al aangemaakt. Denk hierbij aan categorieën en tags in blogartikelen. Dubbelcheck wel of dit inderdaad zo is!

Canonical URL in RankMath
Canonical URL in RankMath.

Een goede SEO plugin maakt de tag ook aan voor al je pagina’s en berichten. Hij verwijst dan feitelijk naar zichzelf. Dan hoef je alleen maar aan te geven als een pagina een ‘kopie’ is.

Doorverwijzen – Redirects

Je kunt dubbele pagina’s ook doorverwijzen naar de originele pagina met een 301 redirect. Een 301-redirect geeft aan dat dit een permanente doorverwijzing is. Dit gebruik je als een link al ergens op het internet rondzwerft en je weet dat mensen deze link gebruiken. Als je een van de twee pagina’s niet in stand wilt houden, kun je dus een 301-redirect gebruiken. Het origineel bewaar je en de kopie kun je verwijderen.

NoIndex – uitsluiten

Door het ingeven van de Meta-tags NoIndex vertel je de zoekmachines dat de pagina niet geïndexeerd moet worden en dus niet in de zoekresultaten hoeft voor te komen.

Meta-tags in RankMath
Meta-tags in RankMath

Dit kun je gebruiken als je andere versies van de content wilt blijven gebruiken. No Index gebruik je voor pagina’s die je niet op het internet wilt laten rondslingeren. Denk hierbij aan bedanktpagina’s na inschrijving voor een weggever of na een aankoop. Bezoekers mogen hier nooit direct vanuit de zoekresultaten op komen. Het is ook heel aannemelijk dat dit soort pagina content heeft die al op de voorliggende pagina gebruikt is (landingspagina of verkooppagina).

Parameters

Ik had de parameters al eerder in dit artikel genoemd. Door bij al je pagina’s aan te geven welke de ‘Canonical’ is, omzeil je dit probleem. Dan weet Google dat de ‘schone’ link het origineel is en de link met de parameters de duplicate content die dan niet wordt geindexeerd. Een goede SEO plugin zoals RankMath of Yoast SEO doet dit voor je (zie eerder in dit artikel).

Heb je nog steeds Duplicate Content?

Het duizelt je waarschijnlijk na al deze informatie.

Wat een gedoe hè, om al die duplicate content? Terwijl je eigenlijk alleen maar een pagina of artikel online wilde zeten.

Het is belangrijk om op te letten dat je geen dubbele content maakt of publiceert. Maak het hier op letten en oplossen alleen geen dagtaak. Je hebt waarschijnlijk genoeg andere dingen te doen dan de hele dag met SEO bezig te zijn en je zorgen te maken over duplicate content en het hoger scoren in Google.

Doe wat je kan doen.

Uiteindelijk gaat het om de ervaring van jouw potentiele klant op jouw website. Het is fijn dat Google dan een beetje mee werkt, maar dit moet niet de hoofd focus zijn.

In het bovenstaande artikel heb ik je uitgelegd wat duplicate content is en hoe je het kan voorkomen of oplossen.

Heb je er wat mee kunnen doen of heeft het je duplicate content opgelost? Ik hoor het graag hieronder in de reacties.

Lukt het je niet of heb je even een duwtje in de goede richting nodig?
Neem dan even contact met me op.

Melding krijgen bij reacties?
Abonneren op
guest
0 Reacties
Inline Feedbacks
Bekijk alle reacties

49 NO-NONSENSE WEBSITE HACKS

49 praktische hacks in een duidelijke pdf om je site onweerstaanbaar te maken.
Populaire Artikelen
Laatste Artikelen
© Copyright 2014 -​ 2021