Duplicate content

Duplicate content et stort problem på mange websites

Duplicate content er et problem på rigtigt mange websites, her er der tale om sites der bruger flere indgange til det samme website, og det indhold der findes på dette, der kan være tale om tilgang fra både domænenavn.dk og www.domænenavn.dk og fra to til rigtigt mange forskellige domænenavne der peger via den opsatte DNS direkte ind på samme website, og det samme tekstmæssige indhold.

Flere CMS huse er sløsede eller totalt uvidende om, hvad duplicate content egentligt er, og dette taget i betragtning af mange sideløbende med deres CMS salg udbyder SEO services til de samme kunder. Det er svært at forstå som SEO ekspert, hvordan rådgivning omkring SEO kan finde sted, når så basal viden om duplicate content mangler!

Hvis man foretager søgning på flere CMS udviklingshuse, både store og små opstår der i mange tilfælde det fænomen, hvor CMS udbyderen har fra flere tusinde sider spændende op til over langt 100.000 sider indekseret på f.eks. Google på sit eget domænenavn + subdomænerne.

100.000 sider er nok ikke lige det antal sider der skal til for at fortælle om CMS systemernes fortræffeligheder! Vel?

Her er der tale om kunders websites som bliver til indhold på CMS firmaet platform, og på deres webadresse, og de tages herved som gidsler overfor søgemaskinerne. Nogle af CMS husene henter så lidt linkjuice ud fra de underliggende domæner, da der typisk er link til hovedsitet hos udvikleren med lidt ankertekster etc.

Testdomæner oprettes hos CMS udbyderen som subdomæne

Der oprettes et subdomæne når en kunde skal have en ny hjemmeside på leverandørens website f.eks. oles-nye-webshop.cmsudbyderen.dk – her ligger der så et domæne med det samme tekstmæssige indhold som på hoveddomænet, dette er ok når sitet opbygges, hvis det er skærmet korrekt af for søgemaskiner, men når det er færdigprogrammeret skal subdomænet suspenderes, og hoveddomænet sættes i drift, uden dublicate content.

Det kan være svært for en lægmand selv at finde ud af om der er dobbeltdomæner, men man kan altid prøve at tjekke serverkoderne selv på det testdomæne der var oprettet til formålet i forbindelse med det nye website blev programmeret, hvis man får en serverkode 200 på oles-nye-webshop.cmsudbyderen.dk er det ikke så smart!

Der skal være en serverkode 301, og det der skal stå i adresselinjen på webbrowseren skal være navnet på den pågældende shop f.eks. www.oles-nye-webshop.dk, hvis du får en serverkode 200 på testdomænet skal du kontakte din udbyder og bede ham om at nedlægge DNS én på testdomænet aldeles straks.

Hvis en ondsindet sjæl, som tilfældigvis måske er konkurrent til dit site, finder sådanne duplikerede websteder kan der skabes meget ravage for dit website, hvis testdomænet lige pludselig få en stor omgang linkjuice, så risikerer du det er testdomænet der findes på søgemaskinerne og ikke dit eget domæne.

Sammen med relative urlér, som de fleste sites er udstyret med vil sitet kunne køres på alle mulige og umulige navne, der peger ind på serveren med DNS pegninger, hvilket vil give problemer for dit website, da domænenavnet vil være den eneste forskel på url adressen og det tekstmæssigt indhold på dit website.

Det er heldigvis ikke alle CMS udviklingshuse der glemmer at lukke af for testsites, men desværre er der mange der ikke helt forstår problematikken, ingen nævnt, ingen glemt, men man kan selv teste sit CMS bureau ved almindelig søgning på Google, og se om ens websites tilfældigvis lige skulle ligge her på et underligt domæne.

Her er også et stort problem med Duplicate content.

Vi ser tit nye kunder der har hamstret domæner ad libitum, og ved test af deres website finder vi mange domæner der peger ind på sitet, nogle har 15 – 20 domæner de har købt op, hvor pegningen har været forkert sat op fra det webhotel der solgte dem domænerne, derved var deres placeringer fordelt mellem de enkelte domæner, og det er yderst kritisk, når nogle er med, og andre ikke er med – og linkjuice er fordelt på mange domæner.

Normalt kan det hurtigt rettes op igen, da Google ikke umiddelbart betragter det som snyd, men når man ikke selv bestemmer, hvilket domæne man gerne vil have indekseret, bestemmer søgemaskinen det for en – ud fra de kriterier den vælger, og den måde dens algoritme er sammensat.

Her er et overblik over serverkoder som serveren sender med headeren.

  • HTTP Status Code – 200 OK
  • HTTP Status Code – 301 Flyttet permanent
  • HTTP Status Code – 302 Found
    Siden er midlertidig flyttet
    Vær varsom med at anvende 302 som redirectkode! ( den tager vi på et andet tidspunkt )
  • HTTP Status Code – 304 Ikke ændret
  • HTTP Status Code – 307 Midlertidig Redirect
  • HTTP Status Code – 400 Bad Request
  • HTTP Status Code – 401 Uautoriserede
    Anmodningen kræver brugergodkendelse.
  • HTTP Status Code – 403 Forbidden
    Serveren forstod anmodningen, men nægter at opfylde den.
  • HTTP Status Code – 404 Ikke fundet
    Serveren har ikke fundet noget der matcher den Requestede-URI
  • HTTP Status Code – 410 Gone
  • HTTP Status Code – 500 Intern serverfejl
    Serveren stødte på en uventet tilstand, der forhindrede den i at opfylde anmodningen.
    Typisk forkerte permissions på unix maskiner på cgi scripts, eller mellemrum eller specieltegn sat forkert etc. i htaccess filen.
  • HTTP Status Code – 501 Ikke implementeret

Læs mere om.: ServerkoderDuplicate contentGoogle kopieret indhold

Del nyheden!

2 kommentarer til Duplicate content

  • Hvordan kan man sikre sig der ikke er kopieret indhold når man skifter til ny leverandør af CMS.
    Det ville være rart med nogle konkrete forslag og metoder så man ikke får problemer med google.

    Jan

  • I forbindelse med opsætning af et nyt CMS system, er det muligt at tilgå dette site uden der er DNS på det pågældende domæne, dette er praktisk, hvis man eksempelvis ønsker at skifte til en anden udbyder med det nye website.

    Når DNS serveren ( navneserveren ) ikke peger på den nye server kan man i stedet indsætte informationerne i hostfilen på den maskine man arbejder på –filen er en lokal fil der kan åbnes med Notepad og redigeres efter behov.

    Skriv den IP adresse websitet ligger på (udleveres af CMS leverandøren) samtidig med domænenavnet og gem filen.

    Nu vil du have mulighed for at tilgå dit nye website og sætte det korrekt op etc. inden det sættes online.

    Det der reelt sker foregår lokalt på den pc du arbejder med er følgende.:

    Windows omskriver IP adressen i hostfilen til et hostnavn, og dette bevirker når du taster domænenavnet ind i browseren får du adgang til det nye site da adressen vil blive routet til den IP adresse der er i hostfilen og ikke via den almindelige DNS.

    På f.eks. Windows Vista ligger hostfilen i C:\Windows\system32\drivers\etc

    Filen du skal bruge hedder hosts

    På andre Windows udgaver kan den ligge i forskellige biblioteker, Brug søgefunktionen til at finde den.

    Hostsfil

    En anden metode der også kan anvendes, hvis der ligger test domæne på f.eks. oles-nye-webshop.cmsubyderen.dk – er brug af en robots.txt fil som kan udelukke al indeksering af det pågældende website.

    Du kan læse om brug af robots.txt her.

    Der er også mulighed for at sætte en adgangskontrol op med password op og derved forhindre andre end ejeren og udvikleren af websitet at tilgå det i programmeringsfasen.

    Endvidere er der muligheder for at udføre noget rewrite kodning i htaccess filen, her kan der styres forskellige funktioner på domænerne, denne løsning skal dog ligge på en Apache server for at kunne fungere, der skal endvidere være tilladelse til at kunne bruge htaccess på det pågældende webhotel, for at det kan fungere med en sådan løsning.

    Men det vigtigste er når det nye website bliver taget i brug, tjek for dobbelt domæner og kontroller selv, at de er væk, ellers opstår der problemer som reelt kunne undgås, hvis der var handlet i tide.

Tilmelding nyheder