Gepubliceerd op

Voor veel bedrijven is de keuze voor hun web statistiekprogramma simpel. Als je 10 online marketeers vraagt welk web statistiekprogramma zij voor het MKB aanraden, dan durf ik te wedden dat er ten minste 9 Google Analytics noemen. Voor veel mensen (waaronder ikzelf) is Google Analytics dan ook als benchmark gaan gelden. Er worden echter ook weleens andere statistiekprogramma’s als referentiekader gebruikt. Dit kan soms voor venijnige miscommunicaties zorgen.

Verschillen in bezoekersaantallen in de praktijk

Bijna twee jaar geleden namen mijn vennoot en ik een website over ter ondersteuning van onze huidige online activiteiten. In een markt met vrij weinig “online hangplekken” leek het een goede zet om deze website met, zoals de vorige eigenaar had aangegeven, 40.000 maandelijkse bezoekers toe te voegen aan ons portfolio. Nadat wij een kijkje in de backend van de website mochten nemen, bleek dat de bezoekersaantallen uit een voor ons onbekend statistiekprogramma kwamen.

Onze online zoektocht naar de verschillen tussen Google Analytics en dit onbekende statistiekprogramma leverde weinig resultaat op en de aankoop werd een sprong in het diepe. En wat voor één… Na het implementeren van Google Analytics bleek dat de website slechts 5.000 maandelijkse bezoekers had! Tot overmaat van ramp moest dit verschil (35.000 maandelijkse bezoekers) ook nog eens worden uitgelegd aan de huidige adverteerders.

Aangezien dit toch al even geleden was, had ik niet verwacht nog een soortgelijke situatie tegen te komen. Recentelijk heb ik echter een oriënterend gesprek met een (inmiddels) nieuwe klant gehad, waarbij deze mij vertelde dat hij ongeveer 7.000 bezoekers per maand had. Gezien de staat van zijn website en bedrijfsomvang, leek me dit aan de hoge kant. Op de vraag welk web statistiekprogramma hij gebruikte, liet hij de backend van zijn hostingprovider One.com zien.

In onderstaande afbeelding zijn de bezoekersaantallen per dag te zien van november 2014.

Bezoekersaantallen per dag

Gelukkig bleek zijn eerdere webdeveloper ook Google Analytics ingebouwd te hebben en had hij zonder het te weten al een hele berg data verzameld. Ook hier bleek een enorm verschil in bezoekersaantallen en paginaweergaven te zitten.

In onderstaande afbeelding zijn de bezoekersaantallen in Google Analytics van de hele maand november 2014 te zien.

Bezoekersaantallen Google Analytics

In deze situatie bleek er dus een verschil van 1158% (paginaweergaven) en 655% (bezoekers) te zijn.

De oorzaken achter deze verschillen

Ieder statistiekprogramma registreert de activiteiten op jouw website anders. Wanneer je duiding wilt geven aan deze data, is het belangrijk dat je begrijpt hoe deze data is opgebouwd.

Naamstellingen en maatstaven binnen statistiekprogramma’s

Niet alle web statistiekprogramma’s gebruiken dezelfde termen. Vaak ontstaat hier al een hoop verwarring over. Als we de situatie hiervoor als voorbeeld gebruiken, dan zie je “hits” prominent naar voren komt. One.com maakt gebruik van het statistiekprogramma “ModLogan” en hierin worden “hits” als volgt beschreven:

“Een hit is een verzoek van een browser of zoekmachine voor een bestand op uw website. Alle visits aan een website leveren bestandsaanvragen op en alle verzoeken aan een webruimte worden geregistreerd als “hits”. Zodoende kan een hit een verzoek om HTML-pagina’s, foto’s en allerlei andere bestanden zijn. Een HTML-pagina die bestaat uit tekst en twee afbeeldingen zal bijvoorbeeld drie hits genereren; één voor de pagina zelf en twee voor de afbeeldingen.”

Wanneer we deze beschrijving lezen wordt het duidelijk dat “hits” erg breed zijn en voor de gemiddelde ondernemer een vrij onzinnige maatstaf is. Maar ook in het aantal “visits” zat tussen beide programma’s een groot verschil (655%). Als we kijken naar hoe ModLogan een “visit” beschrijft, dan vinden we het volgende:

“Visits” geeft het aantal bezoekers weer die uw site heeft gehad. Telkens wanneer er een verzoek wordt verzonden naar uw webruimte, berekent het statistiekprogramma de tijd die verstreken is sinds de vorige verzoek van het IP-adres van de bezoeker. Als dit langer geleden is dan 30 minuten, wordt het verzoek geregistreerd als een nieuwe “visit”. – Bron

Google Analytics beschrijft een visit / sessie / bezoek als volgt:

“Een bezoek kan enkele seconden duren maar ook meerdere uren. Stel dat bezoeker Jaap op uw site komt, dan stelt Google Analytics een aantal cookies in, waaronder de __utmb cookie die is ingesteld om 30 minuten na het laatste verzoek van Jaap te verlopen. Als deze cookie verloopt wordt deze van Jaaps computer verwijderd. Elke keer dat hij een verzoek doet (zoals een paginaweergave, gebeurtenis, sociale interactie of een transactie), dan wordt de tijd waarop de __utmb cookie verloopt opnieuw ingesteld op 30 minuten. Als __utmb niet bestaat op de computer van Jaap, dan stelt Google Analytics een nieuwe cookie in en begint een nieuw bezoek.”

Hoewel het principe “na 30 minuten geen activiteit, dan wordt de volgende activiteit als een nieuwe visit geteld” hetzelfde is, blijkt de methodiek te verschillen. Google Analytics maakt namelijk gebruik van een cookie en ModLogan van het IP-adres.

IP-adres

Door gebruik te maken van het IP-adres kan het statistiekprogramma ook na het verwijderen van eventuele cookies de gebruiker blijven volgen. Daarentegen kan het gebruiken van het IP-adres ervoor zorgen dat gebruikers dubbel worden geteld. Veel apparaten met een mobiele internetverbinding (zoals tablets en smartphones) gebruiken immers dynamische IP-adressen. Zo zorgt bijvoorbeeld het overstappen van Wi-Fi naar mobiel internet ervoor dat er een nieuwe “visit” wordt gestart.

Cookies

Cookies daarentegen zijn niet gevoelig voor het wisselen van IP-adressen en zullen deze visits als één tellen. Een cookie staat immers op het apparaat zelf. Cookies kunnen echter wel handmatig worden verwijderd, waardoor een nieuwe visit kan worden geregistreerd. Naar mijn inzicht gebeurt dit tijdens het surfen echter veel minder dan het automatisch wisselen van IP adressen.

Credits voor deze uitleg: Ronald Edelschaap

Spider, crawlers en robots

Iedere programmeur die zijn server logs wel eens heeft bekeken, weet dat er een enorm aantal spiders, crawlers en robots zijn die websites bezoekt. Vaak zijn dit zoekmachines die jouw content op hun website willen tonen, maar het kunnen ook andere programma’s zijn die jouw website controleren. Denk bijvoorbeeld aan een check om te zien of je nieuwe content hebt, je server nog “up” is of dat de websitesnelheid op orde is. Hieronder zie je een overzicht waarin het duidelijk wordt hoeveel crawlers en spiders bijdragen aan dit verschil in website statistieken.

spiders crawlers bots

In het rode kader staan de spiders, crawlers en robots aangegeven. Samen zijn zij verantwoordelijk voor 3.228 visits; dit in tegenstelling tot de 546 visits (verschil van 591%) van normale bezoekers. Statistiekprogramma’s die gebruikmaken van server logs en daarbij spiders, crawlers en robots niet uitsluiten, lopen hierdoor het gevaar vertekende bezoekersaantallen te presenteren.

Voorbeelden van dit soort statistiekprogramma’s (zogeheten log file analyzers) zijn:

  • AWStats
  • Analog
  • W3Perl
  • Retrospective
  • Splunk
  • XpoLog
  • Deep Log Analyzer
  • Webalizer

Google Analytics maakt gebruik van javascript om data te verzamelen. Aangezien veel bots javascript niet activeren, voorkomt dit dat er een hoop van deze visits als bezoekers wordt geregistreerd. Helaas werkt ook Google Analytics niet vlekkeloos op dit gebied. Pas sinds 30 juli 2014  is het mogelijk om bots en spiders die toch worden geregistreerd grotendeels uit je web statistieken uit te sluiten. Deze instelling staat echter niet standaard aan. Om deze bots en spiders uit te sluiten in Google Analytics kun je de volgende stappen doorlopen:

  1. Ga naar het “beheerder” gedeelte van Google Analytics;
  2. Selecter “instellingen weergeven” in de derde kolom (weergave);
  3. Vink “Alle treffers van bekende bots en spiders uitsluiten” aan (zie afbeelding).

Voor deze service maakt Google Analytics gebruik van de IAB/ABC internationale spiders & bots lijst. Deze (sinds 2006 bijgehouden) lijst bevat alle bekende spiders en bots. Nieuwe bots of onbekende bots kunnen dus nog altijd tussen je websitestatistieken terechtkomen en zelfs voor een “bot spike” in je websitestatistieken zorgen. Wil je aan de slag met het uitsluiten van spiders en bots, dan raad ik je aan dit artikel (Engelstalig) eens te lezen.

Ervaren jullie ook wel eens enorme verschillen in web statistiekprogramma’s? Ik ben benieuwd!

Dit artikel is oorspronkelijk door ons geschreven op 24 december 2014 voor MarketingMed

Geschreven door