01-11-2018

Duplicate content voorkomen…

Duplicate content: de oorzaken en gevolgen

duplicaatDuplicate content en SEO zijn als water en vuur; een ideale match is het nooit geweest. Toch is bij veel mensen niet bekend waarom de combinatie zo ongelukkig kan zijn. Hoewel we dat haarfijn gaan uitleggen in dit artikel, lichten we alvast een tipje van de sluier op.

Waar zoekmachines zoals Google van houden, zijn websites met relevante backlinks van hoge kwaliteit (lees hier hoe je die kunt krijgen). Waar ze niet van houden, is duplicate content en daarom bestraffen ze pagina’s die duplicate content bevatten met een daling in de zoekresultaten. Sterker nog, sinds de Google Panda-update in 2011 en de daaropvolgende Penguin-updates in de jaren erna wordt niet alleen de ranking van losse pagina’s, maar die van je gehele website bedreigd. Google Panda herkent kwalitatief lage content waardoor alleen de beste pagina’s nog kans maken op een hoge score in Google. Het tonen van de beste resultaten is immers prioriteit nummer één voor zoekmachines.

Wij adviseren je om je in te lezen in het onderwerp om de grootste valkuilen te vermijden. Wil je weten wat duplicate content is, en wat de oorzaken zijn én hoe je de nare gevolgen van duplicate content kan voorkomen? Lees dan snel verder!

Duplicate content: wat is het?

afkijken

De naam zegt het al: duplicate content is content die gedupliceerd is. In eenvoudiger Nederlands: content op verschillende webpagina’s die inhoudelijk nagenoeg hetzelfde is. In jip-en-janneketaal: je maakt je (bewust of onbewust) schuldig aan duplicate content wanneer je op jouw website twee keer dezelfde tekst of de tekst van een andere website gebruikt. Oftewel: de content is te bereiken via verschillende URL’s. Treedt dit op binnen je eigen website, dan is er sprake van interne duplicate content. Dit zie je vaak bij een webshop die veelal dezelfde soort producten verkoopt. Gebruik je teksten van andere websites of omgekeerd, dan spreken we over externe duplicate content.

Met content wordt in dit geval namelijk puur en alleen op tekst gedoeld. Zaken als afbeeldingen, video’s, templates of programmeercode vallen hier niet onder en vormen op SEO-gebied dus minder snel een bedreiging. Nu ontstaat duplicate content niet enkel door het kopiëren van bestaande teksten. Ook de technische instellingen van je website hebben invloed op het wel of niet ontstaan van dubbele content.

Wanneer is content nu duplicated? Ruwe schattingen laten zien dat Google’s alarmbellen gaan rinkelen bij webpagina’s met een inhoud die voor pakweg driekwart gelijkwaardig is. Het is dus verstandig om op safe te spelen en te zorgen dat jouw webpagina’s hier ruimschoots onderblijven.

Maar pas op: het algoritme van Google ‘ziet’ ook elke unieke URL (het digitale adres van een webpagina) als een aparte pagina. Veel websites bevatten diverse URL’s die naar precies dezelfde content verwijzen. De beheerders van deze websites lopen dus het risico in de zoekresultaten gestraft te worden voor duplicate content, terwijl ze zich hier niet eens bewust van zijn!

Duplicate content: de oorzaken

Het probleem van duplicate content gaat verder dan een website die content van een andere website gebruikt. Ook binnen een en dezelfde website (en dus hetzelfde domein) kan duplicate content optreden zonder dat de beheerder van de website zich ervan bewust is. Hoe dit precies zit, leggen we hieronder verder uit.

Dezelfde website

Een website maakt zich tegenwoordig helaas al snel schuldig aan duplicate content. Sommige bezoekers zoeken een website op via een www-adres, terwijl andere gebruikers een http-adres intypen in het browserveld. Of wat te denken van beveiligde websites, die veelal een https-adres gebruiken. Zonet gaven we al aan dat Google elke unieke URL als een aparte pagina ziet. Wanneer deze verschillende URL’s verwijzen naar dezelfde content, is er in de ogen van de zoekmachine dus sprake van duplicate content.

Ook websites met content in de vorm van bijvoorbeeld een webpagina-variant, PDF-variant en printvariant lopen een verhoogd risico. Hoewel deze websites niets anders doen dan de bezoeker van zoveel mogelijk gemakken proberen te voorzien, ziet Google op 3 verschillende pagina’s dezelfde inhoud. Duplicate content dus!

Uiteenlopende websites

Tegenwoordig is het een goed gebruik om niet alleen artikelen voor je eigen website te schrijven, maar ook af en toe als gastauteur op te treden op een andere website. Zo creëer je exposure voor je eigen website en kan de andere website tijdelijk beschikken over jouw kennis en expertise. Omgekeerd kun je voor je eigen website ook gebruik maken van een gastauteur. Bijvoorbeeld om de continuïteit in je berichten te waarborgen en een extra groot publiek te bereiken. Dit is dus een prima manier om meer uit je website te halen.

De problemen starten wanneer hetzelfde artikel op meerdere websites terug te vinden is. Hoe voordelig dit in eerste instantie ook lijkt in verband met een groot bereik naar je doelgroep, hoe nadelig dit uitpakt wanneer Google de ranking van jouw website laat dalen. Dergelijke problemen komen ook vaak voor bij specificaties van diensten en producten. Omdat iedereen de informatie één op één van de aanbieder overneemt, ontstaat er een enorme brij aan duplicate content op de digitale snelweg.

Tot slot kan het soms voorkomen dat een concurrent jouw artikel ongevraagd op zijn website plaatst. Logischerwijs ziet Google dit als duplicate content. Pas hier dus mee op en zorg dat je altijd zélf je artikelen schrijft!

Dit is ook de reden dat veel grote bedrijven gebruik maken van copywriters. Door hen simpelweg unieke product-, categorie- en andere webteksten te laten schrijven, voorkom je duplicate content. Naast dat dit je ranking in Google verbetert, kun je je onderneming met deze teksten ook onderscheiden van de concurrentie. Met zelfgeschreven teksten creëer je een eigen identiteit en kun je laten zien welke expertise je in huis hebt.

Duplicate content: de gevolgen

Inmiddels nemen we aan dat je voldoende op de hoogte bent van de oorzaken van duplicate content. En hoewel jij dat leuk en aardig vindt, wil je vooral weten wat nu precies de nare gevolgen van duplicate content kunnen zijn. Fasten your seatbelts, want dat gaan we je vertellen!

Onzichtbaar in de zoekmachines

Google legt de focus op content met een hoge mate van relevantie voor de gebruiker. Mensen die informatie zoeken in zoekmachines, hebben er immers niets aan als ze meerdere keren dezelfde tekst tegenkomen. Duplicate content wordt door Google dan ook genegeerd; er wordt slechts één website getoond in de lijst met zoekresultaten.

Daarom is het minder erg wanneer er sprake is van duplicate content binnen je eigen website, want je bent er nog altijd van verzekerd dat Google in ieder geval in de zoekresultaten naar jou linkt. Toch kan het dan voorkomen dat Google een URL weergeeft die jij zelf niet als eerste zou hebben gekozen. Het is daarom altijd veiliger om duplicate content binnen je website te vermijden.

Maar wat nu als er sprake is van duplicate content op twee verschillende websites die niets met elkaar te maken hebben? Voor Google is het soms lastig om te bepalen welke versie van een artikel het eerste werd geschreven. Heeft iemand anders klakkeloos teksten van jouw website gekopieerd? Dan wordt hij of zij een ‘scraper’ genoemd. Dit heb je zelf dus niet in de hand. Wanneer Google daar eenmaal achter komt, wordt de website die een artikel simpelweg heeft overgenomen daarvoor niet langer beloond met een positie in de zoekresultaten. Sterker nog, als blijkt dat deze website geen onderscheidend vermogen heeft en niets anders doet dan het moedwillig kopiëren van content van andere sites, bestraft Google de website met diverse vervelende maatregelen.

Indexeerlimiet

Hoe meer autoriteit Google een website toekent, hoe hoger de zogenaamde PageRank van de website zal zijn. En hoe hoger de PageRank van een website, hoe hoger de limiet die gesteld wordt aan het aantal pagina’s dat geïndexeerd wordt door Googlebot. In de praktijk betekent dit dat een website met veel duplicate content door alle dubbele pagina’s zijn limiet sneller bereikt zal hebben, waardoor andere pagina’s niet in de zoekmachine worden opgenomen.

Lagere indexeertijd

Het algoritme van Google spendeert doorgaans de nodige tijd aan het indexeren van webpagina’s. Wanneer een website echter veel duplicate content blijkt te hebben, vindt Google dit echter zonde van de tijd. Waarom zou een zoekmachine tijd verkwisten aan het indexeren van pagina’s die toch niet in de zoekresultaten worden getoond? Google stopt in een dergelijk geval dan ook simpelweg met indexeren, waardoor voor een website het gevaar dreigt dat ook waardevolle pagina’s niet worden geïndexeerd. En dit heeft natuurlijk een negatieve invloed op de ranking.

Zwaarste straf

Sommige websites hebben maar één doel: op wat voor manier dan ook een zo hoog mogelijke positie in de zoekresultaten verkrijgen. Deze websites blinken zelden uit in unieke content die daadwerkelijk van toegevoegde waarde is voor de lezer, maar nemen de content van andere sites eenvoudigweg letterlijk over. Daar waar Google normaliter alleen pagina’s met duplicate content weert uit de zoekresultaten, maakt men graag een uitzondering voor dergelijke sites, waarbij de website in zijn geheel permanent wordt verwijderd uit de zoekresultaten. Dit gebeurt echter niet zomaar; alleen sites die overduidelijk dubbele motieven hebben worden op deze strenge wijze bestraft. Zo zijn er de nodige websites geweest die de gevolgen van dit beleid na de Penguin- en Panda-update van Google aan den lijve ondervonden hebben.

Hoe kun je duplicate content voorkomen?

Voorkomen is natuurlijk altijd beter dan genezen. Je kunt duplicate content op een aantal manieren voorkomen:

  • Zonet zeiden we het al: schrijf je eigen teksten en kopieer niets van andere websites. Dit is de meest simpele manier om dubbele content te voorkomen én je profileert jezelf als expert. Vind je het lastig om je eigen teksten te schrijven? Besteed dit dan uit aan een copywriter of tekstbureau. Het kost misschien iets meer tijd en geld, maar uiteindelijk levert het je veel meer op.
  • Gebruik de canonical-tag. In webshops komt het vaak voor dat hetzelfde product onder meerdere categorieën valt. Een wollen trui staat bijvoorbeeld onder ‘truien’ en ‘winterkleding’. De content is identiek, alleen hebben beide pagina’s wel een unieke URL. Door een canonical-tag toe te voegen aan de pagina’s die duplicate content bevatten, vertel je Google als het ware waar de originele teksten te vinden zijn.
  • Stel redirects in. Met een redirect vertel je eigenlijk dat de content van de ene pagina is verplaatst naar de andere pagina. Je kunt het zien als een adreswijziging die je doorgeeft wanneer je bent verhuisd. Om duplicate content te voorkomen, voeg je een 301-tag toe aan de ongewenste pagina’s. Op deze manier verwijs je bezoekers direct naar de nieuwe URL en wordt de oude informatie verwijderd uit de Google index.

Hoe spoor je duplicate content op?

Je weet nu wat duplicate content is en wat de oorzaken en gevolgen hiervan zijn. Maar het belangrijkste missen we nog: hoe spoor je duplicate content op? Een handig programma hiervoor is Copyscape. Dit is een gratis tool waarmee je via enkele muisklikken kunt ontdekken in hoeverre bepaalde teksten overeenkomen met andere websites. Je hoeft hier alleen maar de desbetreffende URL in te voeren en je krijgt direct een overzicht van alle interne en externe gekopieerde content. Ook Siteliner is een tool die je hiervoor kunt gebruiken, echter is deze met name geschikt voor het opsporen van interne duplicate content.

Vooral omvangrijke websites doen er goed aan om regelmatig even te controleren of hun website duplicate content bevat. Zo voorkom je problemen en zorg je ervoor dat je website up to date blijft.

Hoe erg is duplicate content?

no-duplicate-contentUit bovenstaand verhaal kun je afleiden dat duplicate content een grote risicofactor vormt voor je positie in de zoekresultaten van Google. Hoewel duplicate content op je eigen website soms per ongeluk kan voorkomen, is er met de kennis die je hebt na het lezen van dit artikel eigenlijk geen excuus meer om dit te laten gebeuren. Vele websites met duplicate content zijn je voorgegaan; leer van hun fouten!

In een enkel geval kunnen de nare gevolgen van duplicate content uitblijven. Dit is wanneer een door jou geschreven artikel geplaatst wordt op een andere website, maar pas nadat je het artikel eerst op je eigen site hebt geplaatst. Zolang bij Google bekend is dat jouw website de originele versie van het artikel vertegenwoordigt, zal dit verder geen gevolgen hebben voor je positie in de zoekmachines. Tegelijkertijd creëer je meer exposure voor je website en bereik je een breder publiek dan wanneer het artikel alleen op je eigen site te bewonderen zou zijn geweest. Zo zie je maar; zolang je je netjes aan de regels houdt, is Google helemaal de kwaadste niet!

Vind je dit een interessant bericht? Deel het!