SEO TIP: Få bugt med Duplicate Content
Duplicate Content (ofte bare forkortet til DC) er et udtryk, der bruges om helt eller næsten identisk indhold, som kan crawles og indekseres via mere end en URL.
Det giver ikke mening for Google at indeksere det samme indhold, de samme artikler eller produkter med samme identiske beskrivelser og priser mange gange. Det fylder bare unødigt op i deres indeks, og kan føre til søgeresultater med for meget af det samme frem for et varieret svar.
Derfor forsøger Google løbende at identificere det, de opfatter som Duplicate Content og filtrerer det ud af deres indeks. Og som jeg har skrevet et par gange tidligere, kan det have en meget negativ påvirkning på hele dit website – også dine gode unikke sider – hvis Google filtrerer indhold ud.
Det er derfor meget vigtigt, at du gør alt, hvad du kan for at undgå Duplicate Content.
Gratis uddrag fra Grundbog i SEO
Teksten i nedenstående indlæg er et uddrag fra min nye bog: Grundbog i SEO.
Bogen er fuld af effektive SEO-tips som disse – ikke bare i forhold til teknisk SEO men også til stærke strategier, brugbare analyser, linkbuilding, optimering af indhold, user engagement, effektmåling og (SEO-) sikker flytning af websites.
Og bare rolig – selvom du ikke er søgemaskinenørd, måske lidt uerfaren med SEO, eller ikke er den store tekniske ekspert, så kan du få en masse ud af bogen.
Følger du bare en lille del af de mange gode råd vil jeg garantere dig, at dit website bliver dobbelt dså godt optimeret som 80% af dine konkurrenter!
Og måske bedst af alt – lige nu har jeg et rigtig godt tilbud – du kan få både e-bogen og den trykte version af bogen for kun 599,- (+moms). Det er 33% rabat og hvis du bestiller i dag kan du nå at få den inden jul.
Duplicate Content (DC) er en af de største SEO-udfordringer
DC er en af de helt store tekniske SEO-udfordringer. Og i de senere år er det blevet endnu værre. Det er ikke fordi, hjemmesider nødvendigvis har mere Duplicate Content i dag end tidligere, men fordi Google er blevet meget bedre til at filtrere det ud.
Duplicate Content filtrering er en meget kompleks og teknisk udfordrende opgave for Google. I praksis skal hver af de mange milliarder sider Google har indekseret sammenlignes med hinanden for at finde identiske versioner.
Og for at gøre det hele endnu mere kompliceret, leder Google ikke blot efter sider, der er 100% identiske, men også sider, hvor den væsentlige del af det unikke indhold, er det.
Derfor foregår processen med DC-filtrering ikke med det samme, når Google crawler og indekserer dit website, men kører som et selvstændigt program ved siden af.
Det betyder, at du kan opleve, at du teknisk set har DC på dit website, men at der ikke er akutte problemer med det i Google. Så tænker du måske, at det nok er ok, men pas på med det!
For DC kan i praksis virke som en landmine under din SEO-strategi. Den ene dag er alting fint. Du ranker godt i Google og får masser af trafik. Den neste dag har Google identificeret DC på dit website, filtreret siderne ud og pludselig falder din trafik dramatisk. Det har jeg desværre set alt for ofte.
Når det sker, bliver mange forvirret, for de har jo ikke ændret noget lige for nyligt. Så hvorfor bliver de ”straffet” nu?
Forklaringen er som sagt, at DC-filtreringen ikke kører synkront med crawling og indeksering. Så der kan gå mange måneder, eller endda år fra problemet opstår på dit website til Google ser det, og du oplever konsekvenserne af det.
I dette afsnit skal vi se nærmere på, hvordan Duplicate Content kan opstå, hvordan du kan begrænse det, og hvordan du undgå DC-filtrering i Google.
Sådan identificerer du Duplicate Content
Hvis dit website allerede er publiceret og indekseret i Google, kan du undersøge, om du har konkrete problemer med Duplicate Content med en Google søgning.
Du kan starte med at søge efter et udsnit af indholdet på en side kombineret med den avancerede søgefunktion ”site:” efterfulgt af dit domæne.
Lad os se på et eksempel. En produktside fra elgiganten.dk
Hvis vi søger på site:www.elgiganten.dk efterfulgt af den første del af produktteksten i citationstegn, ser søgningen således ud:
- site:www.elgiganten.dk “Det fritstående komfur ELI23020HV fra Voss med induktionskogeplade med 4 kogezoner og 4 boostere, en stor ovn med mange funktioner og Katalytisk rengøring, vil hjælpe dig med at tilberede måltider til hele familien.”
Resultatet i Google ser således ud:
Hvad er der galt?
Umiddelbart vises kun et resultat, så man kunne tro, alt var OK. Men det er det ikke helt. Hvis du scroller ned i bunden af søgeresultatet, kan du se denne besked:
Alene dette er en indikation på, at der nok er noget galt. Hvis du klikker på linket, viser Google alle de 7 resultater, de har indekseret – men altså også allerede identificeret som stort set identiske.
Og som du kan se nedenfor, er det ikke helt forkert. Det ser ud til at være nøjagtigt det samme produkt, som man altså kan finde på hele 7 forskellige URL’er på elgiganten.dk
I de næste afsnit skal vi se nærmere på, hvordan det kan ske, og hvad du kan gøre ved det.
Tjek for DC på tværs af sites
Hvis du ikke alene vil se, om der er identiske versioner af teksten på dit eget website, men på tværs af sites, kan du udelade site:www.elgiganten.dk og blot søge på teksten i citationstegn.
I det konkrete eksempel finder Google 10 resultater på forskellige websites, hvoraf i hvert fald de første 3 ser helt identiske ud – Elgigantens almindelige version, en version fra et færøsk website (med dansk tekst) og så en elektronisk tilbudsavis fra Elgiganten.
Find identiske TITLEs
Du kan også indsnævre din søgning til kun at lede efter sider, der har den samme overskrift. I så fald skal du skrive intitle: foran overskriften.
Det kunne f.eks. være en søgning på ovenstående sides titel:
- site:www.elgiganten.dk intitle:”VOSS-Electrolux induktionskomfur ELI23020HV”
I det tilfælde finder Google 5 forskellige URL’er på sitet med præcis den samme titel.
Sådan kan du automatisere tests af Duplicate content
Det kan naturligvis godt være lidt besværligt at lave den slags tests af alle dine sider, men det behøver du heller ikke.
Hvis du finder eksempler som ovenstående på nogle af dine sider, er der en stor sandsynlighed for, at det er et generelt problem på dit site, du skal finde nogle generelle løsninger på.
Der findes også tjenester, som kan gøre arbejdet med at finde identisk indhold på tværs af websites lidt lettere. Den mest brugte tjeneste hedder CopyScape. Den finder du her:
Du kan i begrænset omfang bruge denne service gratis, men ønsker du for alvor at overvåge dit website, skal de betale for brugen.
Uanset om dit website er offentliggjort eller ej, er der også en tredje mulighed og det er Screaming Frog, som jeg efterhånden har nævnt et par gange.
Med Screaming Frog kan du identificere muligt Duplicate Content på dit eget website på flere måder. Både under URL, TITLE og META-description kan du filtrere for duplikerede versioner.
Crawl dit website med jævne mellemrum og tjek de tre rapporter for eventuelle problemer.
Køb bogen – eller download gratis light-version
Har du fået blod på tanden til endnu flere gode SEO-tips? Så køb bogen i dag og kom igang med at styrke din synlighed i Google.
Hvis du er i tvivl om du vil købe bogen er der godt nyt – for jeg har lavet en “light-version”, som en smagsprøve på hvad du får. Ja, faktisk er det lidt mere end en smagsprøve, for light-versionen er på hele 153 sider!
Du kan få den helt gratis ved at udfylde formularen i toppen af forsiden på www.demib.dk
(Og bare rolig, du bliver naturligvis ikke tilføjet nyhedsbrevet to gange, hvis bare du bruger samme e-mail).
Skriv kommentar