Duplicate Content – Identificér duplicate content og undgå at blive straffet af Google

Oplever du, at dine tekster florerer andre steder på nettet? Det er du ikke alene om. Duplicate content er for mange et voksende problem, men ikke alle tager det alvorligt. Mange er faktisk ikke klar over, at de står over for problemet. Det er dog vigtigt at være opmærksom på, hvis du ikke ønsker at blive straffet af søgemaskiner som Google. Duplicate content kan have en skadelig virkning på dit websites placering i søgemaskineresultaterne, da det er søgemaskinernes algoritmer, der afgør, om dit indhold forekommer duplikeret eller ej.

Bliv klogere på, hvordan duplicate content kan påvirke dit website, og hvordan du kan bekæmpe det med effektive værktøjer. Vi kommer bl.a. ind på følgende udfordringer:

  • Hvad er duplicate content
  • Konsekvenserne ved duplicate content
  • Måder at bekæmpe duplicate content på

Duplicate content har, siden internettets begyndelse, været kendt som en udfordring for både brugere og søgemaskiner. Kopieret indhold giver nemlig ikke kun ekstra arbejde til søgemaskinernes web crawlere og servere, men giver også en dårlig brugeroplevelse, hvis brugeren bliver eksponeret for det samme indhold på tværs af flere sider.

Hvis du står over for udfordringen med duplicate content, kan du risikere at blive straffet for det, selv hvis indholdet er dit. Det er nemlig Google, der afgør, om dit indhold er overflødigt i forhold til andre duplikerede tekster på nettet.

Du har kort sagt ingen kontrol over det.

Dublicated content

 

Hvad er duplicate content?

Duplicate content, der både er kendt som duplikeret indhold, kopieret indhold eller identisk indhold, opstår, når identisk eller næsten identisk indhold optræder på flere forskellige sider på nettet.

Duplicate content dækker derfor over det samme tekstindhold, der optræder på mere end én URL, enten på samme domæne eller på forskellige websites.

Konsekvenserne ved duplicate content

Der er mange måder, du kan blive straffet på af søgemaskinerne, hvis du har duplicate content, og konsekvenserne kan vise sig at være store, hvis du ikke får styr på det i god tid.

Tab af placeringer i søgeresultaterne

Hvis du har duplicate content på dit site, vil Google filtrere det dobbeltkopierede indhold fra søgeresultaterne, så den tekstversion (og dermed hjemmeside), der fremstår mest hensigtsmæssig for brugeren, vil stå alene tilbage med en position i søgeresultaterne.
Google kan i ekstreme tilfælde vælge at straffe sider med duplicate content, hvis det ser ud til, at hensigten med det duplikerede indhold er at vildlede eller manipulere med søgemaskineresultaterne.

Google opfatter på denne måde sider med ens eller næsten ensartet indhold som spam. Det har store konsekvenser for duplikerede sider, fordi de mister kontrollen over, hvilken version af det duplikerede indhold, der vises på Google og derfor hvem, der beholder placeringerne i søgeresultaterne.

Tab af autoritet

Sider med duplicate content vil kunne risikere at miste den autoritet, der strømmer ind fra links til det frasorterede indhold, hvilket igen kan føre til lavere placeringer i søgeresultaterne. Samtidig vil de sider kunne risikere, at GoogleBot ikke vil crawle alt det indhold, der findes på dem, og det kan føre til lavere trafik til dit site.

Tab af værdifuld trafik

Når Google ser indhold, som findes andre steder på nettet, vil Google forsøge at identificere, hvem den oprindelige kilde til teksten er. Google vil derefter fjerne de sider med mest ”tyndt” indhold og belønne de sider, der har mest ”fyldigt” indhold. Det kan påvirke indekseringen af hele dit website, hvis dit indhold forekommer irrelevant, og kan således føre til tab af værdifuld trafik.

Udfordringerne ved duplicate content viser sig således at være mange, og de kan være særdeles skadende for dit website. Der er dog ikke altid nemt at vide, om ens indhold findes andre steder, men der er effektive værktøjer, som kan hjælpe dig på vej til at bekæmpe det.

Har du ducplicate content?

Den bedste forudsætning for helt at undgå duplicate content er at skrive sine egne tekster, da det handler om at have unikke tekster. Det betyder, at teksten skal være din egen og med unik værdi for læseren og altså ikke en kopi af en andens tekst, som eksempelvis en produktbeskrivelse fra en leverandør.

Hvis du dog oplever at stå over for problemet med duplicate content, kan du vælge at identificere det på flere måder med effektive værktøjer, der kan finde frem til sider med ensartet indhold på både interne og eksterne domæner.

Find duplicate content ved en søgning på Google

En nem og hurtig måde at identificere, om du har duplicate content, er ved at søge efter et bestemt tekststykke på Google, som du mistænker for at være blevet kopieret af et andet website. Du kan gøre det ved at markere den tekst, du mistænker for at være duplikeret, på siden, højreklikke på teksten og derefter vælge den mulighed, der hedder ”Søg på Google”.

Du kan også vælge at kopiere teksten, som du mener er duplikeret, og indsætte den i en søgning på Google med anførelsestegn både foran og bagved teksten. Herefter viser Google de sider, som har indhold, der er identisk i forhold til det, du har søgt på i Google ved begge metoder.

Måderne at søge efter duplicate content på forudsætter dog, at Google kender til de sider, der har duplicate content. Du kan derfor ikke være garanteret at finde sider med duplicate content på denne måde, hvis den kopierede tekst fx stammer fra en side, der enten er nyoprettet eller er blevet tilpasset for nyligt.

Siteliner – Identificér duplicate content på eget site

Siteliner er et effektivt og gratis analyseværktøj, der kan bruges til at scanne hele dit website for duplicate content mellem to eller flere URL’er på dit eget domæne. Siteliner er derfor god at bruge, hvis du har flere sider med identisk indhold på tværs af flere sider på dit website.

Gå til Siteliner: http://www.siteliner.com/

Siteliner

 

Når du indsætter URL’en til dit website her og trykker ”Go”, vil Siteliner scanne hele dit website for at se, om der forekommer duplicate content på dine sider.

De resultater, du efterfølgende får vist, indikerer, hvor mange sider du har med duplicate content, lignende content og unikt content. Det har vi illustreret med et eksempel med www.falck.dk herunder, hvor der er blevet identificeret 32,5% duplicate content internt på Falcks’ website på tværs af 250 sider ved brug af Siteliner

 

Siteliner

 

Man kan herefter vælge at se, hvilke URL’er ens duplicate content optræder på samt, hvor stort et match der er imellem disse, både vist i antal ord og ved en procentvis duplikationsgrad.

Siteliner er dog begrænset, da den kun kan scanne de 500 mest vigtige sider. Dog giver det en god indikation af, hvor på dit site du har duplicate content, så du nemt kan komme det til livs.

 

CopyScape – Bekæmp duplicate content via flere metoder

CopyScape er et analyseværktøj, der kan bruges til at finde frem til, om indholdet på ens side er unikt, eller om der er duplicate content andre steder på nettet.

Dette analyseværktøj kan anvendes på flere måder:

  • Baseret på en specifik URL kan CopyScape crawle nettet, hvortil det identificerer andre sider med indhold, der fremstår duplikeret til dit (metode 1)
  • Hold to URL’er op imod hinanden og se om de er helt eller delvist kopier af hinanden (metode 2)
  • Indsæt tekststykker, som du ønsker at sammenligne duplikationsgraden af (metode 3)

Med CopyScape kan du således bearbejde dit indhold, så du opnår en tekst, hvor den procentvise andel af duplikerede ord og sætninger formindskes mest muligt og dermed får dit indhold til at fremstå unikt for Google.

Du kan både bruge CopyScape i dens gratisversion og i en betalt udgave. Gratisversionen af CopyScape kan kun analysere sider enkeltvist og er derfor begrænset, hvor betalingsversionen kan analysere helt op til 10.000 sider på én gang.

Lokalisér det kopierede indhold

Ved den første fremgangsmåde kan du få vist de sider på nettet, der har tekst, der er identiske med dine egne. Du får hertil vist en liste med top 10 sider, der helt eller delvist matcher indholdet på din URL.

Gå til CopyScape: https://www.copyscape.com/

Hvis du får resultater med duplicate content, vil du få vist de eksakte ord og sætninger, som matcher 100 % i forhold til tekstindholdet på din side. Det resultat, der står først på listen, vil fremstå som den side, der har den største grad af duplicate content magen til dit. På den måde kan du identificere, om andre sider har kopieret dit oprindelige indhold. Vi anbefaler, at laver din egen validering også ved at besøge de viste URLs.

Copyscape

Sammenlign indhold på to URLs

Ved denne fremgangsmåde kan du sammenligne to foruddefinerede URL’er. Du indtaster blot de to URL’er, som du på forhånd ved, du vil sammenligne, hvis du har en mistanke om duplicate content. Du kan også vælge at indtaste URL’erne fra fremgangsmåde 1 for at verificere resultatet yderligere.

Gå til https://www.copyscape.com/compare.php (sti i menu: Products – Free Comparison Tool)

Denne metode viser dig en side-by-side sammenligning i modsætning til metode 1. Du får samtidig også givet en oversigt over, hvilken URL der ligner den anden mest målt i procentvis lighedsgrad.

Herefter kan du identificere de afsnit, som er mest kritiske at optimere, hvis de indeholder duplicate content.

 

Copyscape

Sammenlign udvalgte tekststykker

Denne metode minder på mange måder om metode 2. Dog adskiller denne metode sig ved, at du her sammenligner foruddefinerede tekststykker fremfor specifikke URL’er. Du kan bruge denne metode til at arbejde med enkeltafsnit, eller også kan du vælge at bearbejde en hel side på én gang.

På den måde får du mulighed for at validere, om dit indhold er unikt, sammenlignet med et andet tekststykke, før du sætter det op i dit CMS.

Gå til https://www.copyscape.com/compare.php (sti i menu: Products – Free Comparison Tool)

Når du har indsat dine tekster og valgt ‘Compare Items’, får du vist lighedsgraden mellem de to. Du kan nu omskrive din tekst efter behov og efterfølgende sammenligne din tekst med kopien igen for at sikre, at du er kommet udenom det identiske indhold.

 

Dublicated content - Copyscape

Løsninger på duplicate content

Du kan også undgå at blive straffet for kopieret indhold, der går igen på flere sider både internt og eksternt, ved at anvende canonical tags eller noindex tags som mulige løsninger på duplicate content. Men hvordan fungerer de i praksis?

Canonical tags

Canonical tags kan være en løsning til at undgå duplicate content på de sider, hvor du genbruger det samme indhold eller har flere undersider, hvor du anvender den samme tekst. Når det er tilfældet, er det vigtigt at fortælle søgemaskinerne, hvilken side der er primærkilden til indholdet og derfor, hvilken side du ønsker at få vist i søgeresultaterne. Og det er det, et canonical tag gør.

Når du opretter et canonical tag, fortæller du søgemaskinerne, hvilken side på dit site, der ’ejer’ indholdet. Dvs. at du både kan oprette et canonical tag, som peger på siden selv og også at du kan oprette et canonical tag, der peger over på en anden side. Det er fx en god idé at anvende et canonical tag på produkter i din webshop, som du har liggende i mere end én produktkategori, eller hvis du har forskellige versioner af dit website med identisk indhold.

Bruger du et canonical tag til at pege over på en anden side, skal du være opmærksom på, at du samtidig fortæller Google, at denne side ikke er en primær kilde og derfor heller ikke bør findes på Google. Det kan sammenlignes med at lave et redirect. Derfor vil den linkværdi, der strømmer ind til siden, også gå tabt.

Det er vigtigt at være opmærksom på, at et canonical kun er en vejledning til Google, og Google kan i visse tilfælde vælge at tilsidesætte den.

Noindex tags

En anden løsning til at undgå at blive straffet for duplicate content er ved brug af noindex tags, som er et kodestykke, der fortæller Google, at du ikke ønsker at indeksere en specifik side på dit website. Når du bruger et noindex tag på en specifik side, vil den dog stadig blive set af søgemaskinerne, men siden vil ikke blive vist i søgeresultaterne.

Ved brug af noindex tags kan du således undgå at blive straffet med lavere rankplaceringer i søgeresultaterne, men du vil dog ikke få organisk trafik til de sider, du angiver med et noindex tag.

Med effektive værktøjer kan du altså bekæmpe duplicate content, så du undgår at blive straffet for det af bl.a. Google.

 

Vil du høre mere om, hvordan vi kan hjælpe din virksomhed/organisation med at identificere duplicate content og forbedre jeres synlighed i de lokale søgninger? Så er du mere en velkommen til at kontakte Resolution.