Loading...
 

gewichten

Omschrijving

Als er een enquête afgenomen wordt tijdens een evenement, worden de antwoorden normaliter op geslagen in een dataset. Elke regel in een dataset is één respondent die de vragenlijst heeft ingevuld. Dit noemen we één observatie. Een observatie is dit voorbeeld hetzelfde als een respondent. De dataset met respondenten is de steekproef, alle bezoekers van het evenement vormen samen de populatie.

Een gewicht is een factor die aan een observatie (respondent) in een steekproef wordt toegekend. Elke observatie heeft een eigen gewicht. Het gewicht hoeft overigens niet uniek te zijn, vaak is het zo dat bepaalde observaties hetzelfde gewicht krijgen.

Het doel van een gewicht is om te corrigeren voor verschillen in samenstelling tussen een steekproef en een populatie. Het gewicht dat een observatie krijgt, zorgt er voor dat de verhoudingen van de steekproef ten aanzien van een bepaald kenmerk, gelijk zijn aan de verhoudingen van dat zelfde kenmerk in de populatie waaruit de steekproef getrokken is.

Met een gewicht kan een andere variabele gewogen worden. Een weging zorgt er voor dat het gemiddelde van deze andere variabele (beter) overeenkomt met het gemiddelde van de steekproef. Deze weging houdt in dat de andere variabele vermenigvuldigd wordt met het gewicht en dat de som van deze producten gedeeld wordt door de som van de gewichten. Zie het voorbeeld hieronder.

Normaliter wordt het gewicht zo gekozen dat de som van alle gewichten gelijk is aan het aantal observaties.

Voorbeeld bepaling van een gewicht

Stel dat in een steekproef het aandeel mannen lager is dan in de populatie waaruit de steekproef getrokken is. Mannen zijn dus ondervertegenwoordigd. Als we de steekproef hiervoor willen corrigeren, dan krijgen mannen een gewicht groter dan 1 en vrouwen een gewicht kleiner dan 1.

Een cijfervoorbeeld:
Bij een evenement ziet de populatie van bezoekende mannen en vrouwen er als volgt uit:

Populatie  Aantal percentage
mannen 600 67%
vrouwen 300 33%
  900 100%

De steekproef ziet er als volgt uit

steekproef  Aantal Percentage
mannen 50 56%
vrouwen 40 44%
  90 100%


Het aantal mannen is ondervertegenwoordigd in de steekproef. Met welke factor moeten we nu het aantal mannen ophogen om tot een juiste afspiegeling te komen? In feite wil je dat de steekproef er als volgt uit zou zien:

verwachte waarde steekproef    
mannen 60 67%
vrouwen 30 33%
  90 100%

Het totaal van de steekproef (n) blijft gelijk, maar de verhouding mannen en vrouwen is gewijzigd.

De ‘verwachte’ waarde van het aantal mannen in de steekproef is 60. Dat is de waarde waarbij het aandeel mannen in de steekproef gelijk is aan dat in de populatie (67%). De factor W waarmee we het aantal mannen moeten vermenigvuldigen om op 60 te komen is dan: 50 * W = 60.

Oftewel:  W = 60/50, dat is 1,2. De factor waarmee we het aantal vrouwen moeten vermenigvuldigen is dan 30/40, dat is 0,75.

De weegfactor W is dan

W weegfactor
X (hoofdletter) Aantal mannen in de populatie
N (hoofdletter) Omvang populatie
x (kleine letter) Aantal mannen in steekproef
n (kleine letter) Omvang steekproef
 

Het rechterlid kunnen we ook schrijven als:

 

Met andere woorden: de weegfactor W is gelijk aan het percentage van mannen in de populatie gedeeld door het percentage mannen in de steekproef, 66%/56% = 1,2.

Kort gezegd: het gewicht van een observatie j met kenmerk g (gender=man) is gelijk aan het percentage van kenmerk g (gender=man) in de populatie, gedeeld door het percentage van kenmerk g in de steekproef.

Gebruik van een gewicht

Stel dat mannen gemiddeld 30 euro per persoon uitgeven en vrouwen 20 euro. Wat zijn dan de gemiddelde uitgaven (y)?

De ongewogen gemiddelde uitgaven zijn:

(30 * 50 + 20 * 40)/90 = 25,56

De gewogen gemiddelde uitgaven zijn:

(30 * 50 * 1,2 + 20 * 40 * 0,75)/(50*1,2+40*0,75) = 26,67

Door het gewicht dat mannen hebben gekregen, liggen de gewogen gemiddelde uitgaven hoger dan de ongewogen. Immers, mannen geven per persoon gemiddeld meer uit (in dit voorbeeld).

De formule voor het gewogen gemiddelde van variabele y (voor groep q) is:

In dit voorbeeld is de groep q waarvoor het gemiddelde is berekend gelijk aan de totale steekproef. In dat geval is de noemer gelijk aan n, immers:

Of te wel, de som van alle gewichten is gelijk aan n.

Maar groep q hoeft niet de hele steekproef te zijn. Stel dat de buitenlanders als volgt verdeeld over de steekproef zijn (en dat dit een goede afspiegeling is van de populatie):

buitenlanders nederlanders totaal
mannen 12 38 50
vrouwen 20 20 40
32 58 90

We willen nu gemiddelden willen berekenen voor buitenlanders. Wat is nu het ongewogen en gewogen gemiddelde?

Het ongewogen gemiddelde is:

(12 * 30 + 20 * 20)/(32) = 23,75

Het gewogen gemiddelde is:

(12 * 30 * 1,2 + 20 * 25 * 0,75)/(12* 1,2 + 20 * 0,75) = 24,90

Bij het gewogen gemiddelde is de noemer gelijk aan 29,4, dat wil zeggen: dus niet meer gelijk aan het aantal observaties (32).

Het voordeel van een weegfactor wordt hiermee duidelijk: we hoeven slechts éénmaal deze weegfactor te bepalen om op consistente wijze de gewogen gemiddelden voor allerlei groepen uit te rekenen.

Zie ook bezoekgewicht

Created by admin. Last Modification: donderdag Oktober 26, 2017 10:19:24 CEST by admin.