Good Survey Research Design probeert de bemonsteringsfout te verminderen
Wat is een betrouwbaarheidsinterval?
Een betrouwbaarheidsinterval is de foutmarge die een onderzoeker zou ondervinden als hij of zij een bepaalde onderzoeksvraag zou kunnen stellen van bijvoorbeeld elk lid van de doelpopulatie en hetzelfde antwoord kan terugkrijgen dat de leden van de steekproef in de enquête hebben gegeven.
Als de onderzoeker bijvoorbeeld een betrouwbaarheidsinterval van 4 en 60% van de deelnemers aan de enquête heeft gebruikt, die is beantwoord als 'Zou aanbevelen aan vrienden', zou hij er zeker van kunnen zijn dat tussen 54% en 64% van de leden van de gehele doelpopulatie zeg ook "Zou aanbevelen aan vrienden" wanneer dezelfde vraag gesteld. Het betrouwbaarheidsinterval is in dit geval +/- 4.
Wat is een betrouwbaarheidsniveau?
Een betrouwbaarheidsniveau is een uitdrukking van hoe zeker een onderzoeker kan zijn van de gegevens die uit een steekproef zijn verkregen. Betrouwbaarheidsniveaus worden uitgedrukt als een percentage en geven aan hoe vaak dat percentage van de doelpopulatie een antwoord zou geven dat binnen het betrouwbaarheidsinterval ligt. Het meest gebruikte betrouwbaarheidsniveau is 95%. Een gerelateerd concept wordt statistische significantie genoemd.
Het vertrouwen van een onderzoeker in de waarschijnlijkheid dat zijn steekproef echt representatief is voor de doelpopulatie, wordt beïnvloed door een aantal factoren.
Het vertrouwen van een onderzoeker in het ontwerpen en implementeren van zijn onderzoek - en een bewustzijn van de beperkingen ervan - is grotendeels gebaseerd op drie belangrijke variabelen: steekproefomvang, responsfrequentie en populatiegrootte. Onderzoekers zijn het er al lang over eens dat deze variabelen zorgvuldig moeten worden overwogen tijdens de onderzoeksplanningsfase.
- Steekproefgrootte Over het algemeen leveren grotere steekproeven gegevens op die de doelpopulatie echt weerspiegelen. Een breed betrouwbaarheidsinterval is indicatief voor minder vertrouwen in de gegevens omdat er een grotere foutenmarge is . Een breed betrouwbaarheidsinterval is vergelijkbaar met het afdekken van uw weddenschappen. Hoewel er een verband is tussen het betrouwbaarheidsinterval en de steekproefomvang, maar het is geen lineair verband . Een onderzoeker kan het betrouwbaarheidsniveau niet halveren door de steekproefomvang te verdubbelen.
- Frequentie van respons De nauwkeurigheid waarmee de steekproefgegevens de doelpopulatie weerspiegelen, hangt ook af van het percentage respondenten dat een bepaald antwoord gaf of op een specifieke manier reageerde . Hoe groter het aantal respondenten dat een bepaald antwoord gaf, met de woorden 'Erg blij', hoe onzekerder de onderzoeker van dat antwoord kan zijn. Er zal enige variabiliteit zijn in het percentage in de middelste gebieden van de normale curve. Dat wil zeggen, als een onderzoeker 50% zeker weet dat leden van de doelgroepen zullen reageren (binnen een betrouwbaarheidsinterval) zoals leden van de steekproefpopulatie, is er waarschijnlijk enige variatie van dat 50% -niveau.
Het is goed om te onthouden dat uitbijters (gegevens die zich aan het verre uiteinde of in de staarten van de normale curve bevinden) eerder in dezelfde mate in de populatie voorkomen als in een steekproef - er is hier minder variatie , omdat er een lagere frequentie is . (Bedenk hoe de ballen in een Galton Box de neiging hebben om in het midden te stapelen in de tentoonstelling van het Pacific Science Center? Slechts een paar ballen stuiteren in de staarten.) Daarom is het gemakkelijker om zeker te zijn van de frequentie van extreme antwoorden .
- Populatiegrootte is geen belangrijke factor in de steekproefomvang, tenzij een onderzoeker werkt met een populatie die erg klein is en die hem of haar kent (bijvoorbeeld klein genoeg zodat alle leden van de populatie door de onderzoeker kunnen worden geïdentificeerd).
Creative Research Systems wijst erop dat:
De wiskunde van waarschijnlijkheid bewijst dat de grootte van de populatie irrelevant is, tenzij de steekproef een paar procent overschrijdt van de totale populatie die u onderzoekt. Dit betekent dat een steekproef van 500 mensen even nuttig is om de mening van een staat van 15.000.000 te onderzoeken als het een stad van 100.000 zou zijn.
Het genereren van een representatief monster kan een kostbaar en tijdrovend proces zijn. Onderzoekers worden altijd geconfronteerd met een wisselwerking tussen het vertrouwensniveau dat ze willen verkrijgen - of de mate van nauwkeurigheid die ze moeten bereiken - en het zelfvertrouwen dat ze zich kunnen veroorloven.
Steekproefgrootte in Qualitative Surveys Research
Kwalitatief onderzoek is verkennend of beschrijvend van aard en niet gericht op cijfers of metingen. Maar zorgen over steekproeffouten in kwalitatief onderzoek zijn nog steeds geldig. Als algemene regel geldt dat als een voorbeeld representatief is voor het doeluniversum, de thema's of patronen die uit het onderzoek naar voren komen, de grotere populatie weerspiegelen die van belang is voor de onderzoeker. Als het monster zowel representatief is als uit een groot percentage van de doelpopulatie bestaat, zal het vertrouwen in de nauwkeurigheid van gegevens die uit die steekproef zijn verkregen, doorgaans hoog zijn.
Bepaling van de steekproefomvang in enquêtesonderzoek
Verschillende regels zijn van toepassing op kwantitatief onderzoek en kwalitatief onderzoek als het gaat om het bepalen van de steekproefomvang. Over het algemeen moet een onderzoeker, om zeker te zijn van de gegevens die worden gegenereerd door kwalitatief onderzoek, een duidelijk beeld hebben van hoe de gegevens zullen worden gebruikt. De gegevens kunnen de basis vormen voor een beschrijvend verhaal (zoals in een case study of etnografisch onderzoek) of het kan op een verkennende manier dienen om relevante variabelen te identificeren die later in een kwantitatief onderzoek op correlaties kunnen worden getest.
Steekproefgrootte in kwantitatief onderzoek
Kwantitatief onderzoek omvat vaak vergelijkingen tussen marktsegmenten of subgroepen van een doelmarkt. Omdat kwantitatief onderzoek getalsgestuurd is, kan het bepalen van een comfortabele steekproefomvang vrij eenvoudig zijn - voor elke belangrijke groep of een bepaald segment in een studie zou een onderzoeker 100 deelnemers willen onderzoeken. Dit nummer is een aanbeveling en geen absolute. Een marktonderzoeker zal een aantal relevante variabelen in overweging nemen om de omvang van een steekproef in enquêtesonderzoek te bepalen.
Bij het uitvoeren van survey-marktonderzoek is het de bedoeling om uit de steekproef af te leiden wat waarschijnlijk het geval is voor het doeluniversum. Een monster geeft gegevens die kunnen worden waargenomen of bekend zijn. Uit deze waargenomen of bekende gegevens kan een onderzoeker schatten in welke mate een onbekende waarde of parameter kan worden gevonden in een doelpopulatie.
Kwantitatief onderzoek is gebaseerd op het idee van een normale , symmetrische curve die, in de geest van de onderzoeker, het doeluniversum representeert - de populatie waarover de onderzoeker eerder dan in feite parameters moet schatten. Een representatief voorbeeld stelt een onderzoeker in staat om - uit de voorbeeldgegevens - een geschat bereik te berekenen dat waarschijnlijk de onbekende waarde of parameter bevat die van belang is. Dit geschatte waardenbereik vertegenwoordigt een gebied op de normale curve en wordt meestal uitgedrukt in een decimaal of een percentage.
De normale curve en waarschijnlijkheid
Een normale, symmetrische curve is een visuele uitdrukking van de waarschijnlijkheid. Laten we eens kijken naar een eenvoudige heuristiek: een activiteit in een science center laat een groot aantal ballen vallen tussen twee acrylplaten, één voor één. Elke bal valt door dezelfde opening aan de bovenkant van het scherm en daalt vervolgens tussen een van de verticale, parallelle verdelers die de stapels ballen van elkaar scheiden zodra ze tot rust komen. Na enkele uren hebben de ballen de vorm van een normale curve gevormd. De curve verandert een klein beetje naarmate elke nieuw geïntroduceerde bal de ballen bereikt die het eerst aankwamen. Maar over het algemeen is de symmetrische curve duidelijk en het gebeurde natuurlijk, onafhankelijk van enige actie door de waarnemers of het personeel van het Wetenschapscentrum. De gebogen vorm die de ballen vormen weerspiegelt de waarschijnlijkheid dat de meeste ballen in het midden vallen en daar blijven. Minder ballen zullen het in de uiteinden van de curve maken - sommige onvermijdelijk zullen dit zijn, maar ze zijn klein in aantal.
Deze normale curve is vergelijkbaar met het concept van een monster. Telkens wanneer het display wordt leeggemaakt en de ballen opnieuw in de Galton-doos vallen, zal de configuratie van de stapels ballen slechts een klein beetje anders zijn. Maar na verloop van tijd zal de vorm van de curve niet veel veranderen en zal het patroon waar blijven.