Loading...
 

Bezoekgewicht

Waarom wegen?

Volgens de nieuwe richtlijnen Economische Impact (2.3) dient er een weging plaats te vinden van een aantal variabelen. Het gewicht is afgeleid van het aantal bezoeken dat een respondent aflegt aan het evenement. Zonder weging zijn de resultaten niet correct, omdat er een bias zit in de steekproef. Dit wordt geïllustreerd met een voorbeeld.
Stel we onderzoeken een evenement van 2 dagen. Er is een groep bezoekers die één dag komt en er is een groep die twee dagen (dus beide dagen) komt. De groep die één dag komt, bestaat uit 15.000 bezoekers. Deze is precies verdeeld over twee dagen, dus 7.500 bezoekers per dag.
De groep die twee dagen komt bestaat uit 2.500 bezoekers (personen). Deze groep legt dus 5.000 bezoeken af. De verhouding van deze twee groepen is elke dag 1:3 (zie tabel).
In totaal zijn er dus 15.000+2.500 = 17.500 unieke bezoekers, die 20.000 bezoeken afleggen.

dag 1 dag 2 totaal bezoeken bezoekers
werkelijk aantal bezoeken per dag 10000 10000 20000
2500 bezoekers 2 dagen 2500 2500 5000 2500
7500 bezoekers 1 dag 7500 7500 15000 15000
totaal bezoekers 17500


We gaan nu enquêtes afnemen. Er wordt een steekproef van 400 respondenten genomen, waarbij de aantallen bezoekers, uitgesplitst naar 1 en 2 dagen, een perfecte afspiegeling zijn van de werkelijke (aanwezige) populatie.
De steekproef ziet er dan als volgt uit:

steekproef n = 400 Dag 1 Dag 2  totaal
aantal bezoekers 2 dagen 50 50 100
aantal bezoekers 1 dag 150 150 300
Totaal steekproef 200 200 400


De verhouding tussen 2-dags en 1-dagsbezoekers is in de steekproef 1:3, net als in de populatie.
Willen we nu het aantal unieke bezoekers uitrekenen, dan delen we het aantal bezoeken van de populatie door de gemiddelde bezoekduur uit de steekproef.
De gemiddelde bezoekduur uit de steekproef is 1,25 ((100*2+300*1)/400). Dit zou betekenen dat het aantal bezoekers 20.000/1,25 = 16.000 uitkomt. Dit is niet correct: het juiste aantal is 17.500.

Hoe komt dit?

Dit wordt veroorzaakt door het feit dat de groep die twee dagen bezoekt, in feite oververtegenwoordigd is in de steekproef. Immers, zij lopen kans op beide dagen geïnterviewd te worden. Het steekproef gemiddelde ligt in dit voorbeeld daarom te hoog en daarom wordt het aantal bezoekers te laag ingeschat.
De achterliggende oorzaak heeft uiteindelijk met het trekken met of zonder teruglegging te maken. Bij een enquête wordt een respondent in principe maar één keer geïnterviewd. Het is een steekproef zonder teruglegging.
Als we de totale populatie zouden interviewen, zonder teruglegging, dan is het steekproef gemiddelde 7500*2+15.000*1 = 1,14. Het aantal bezoekers is dan 20.000/1,14 = 17.500. Dit is wel correct.
Omdat we meestal een steekproef nemen die veel kleiner is dan de populatie, lijkt onze steekproef echter meer op een steekproef met teruglegging. We maken dus een fout als we doen alsof het een steekproef is zonder teruglegging. De grootte van de fout die we maken is afhankelijk van de omvang van de steekproef ten opzichte van de populatie en is weergegeven in onderstaande grafiek. De fout is het verschil tussen de blauwe lijn en de groene lijn.

Op de x-as staat de steekproef als percentage van de populatie. Uit de grafiek blijkt dat in dit voorbeeld bij een steekproef omvang van 100% de oude manier correct is (zoals in het rekenvoorbeeld hierboven), maar de fout wordt groter naarmate de steekproef een kleiner deel van de populatie betreft: de afstand tussen de groene en blauwe lijn wordt steeds groter. Normaliter is een steekproef kleiner dan 10%.

Hoe corrigeren we dit?

In de grafiek is ook een alternatieve berekening weergegeven (nieuwe methode, rode lijn). Deze methode benadert het juiste gemiddelde, naarmate de populatie groter is t.o.v. de steekproef.
De formule luidt:
x ̅=n/(∑_(x=1)^z▒dx⁄x)
Vullen we de waarden in van ons voorbeeld dan luidt de uitkomst:
Gewogen gemiddelde = 400/ (100/2 + 300/1) = 400/350 = 1,14.

Zie ook Weging volgens de nieuwe richtlijnen economische impact: wat is het effect?

Created by admin. Last Modification: maandag september 4, 2017 22:44:17 CEST by admin.