Een uitbijter (outlier in het Engels) is een waarde/waarneming die niet bij de andere waarnemingen past. Of beter:
lijkt te passen!
Neem bijvoorbeeld de kijkers naar Sesamstraat. De meesten zullen tussen de, wat is het, 4 en 10 jaar oud zijn. Echter, bij een onderzoek vind je een kijker van 67 en een van 88 jaar. Uitbijters toch? Moet haast wel fout zijn, komma vergeten ofzo

Maar bekijk het eens zo: opa en oma kijken mee met de kleinkinderen. Dan is je waarde wel degelijk correct en komt niet voort uit een meetfout. Anderzijds kun je argumenteren dat opa en oma uit een andere populatie (nl. niet kinderen die Sesamstraat kijken) komen dan je interessant vind. Voorzichtigheid is dus geboden als het gaat om het bestempelen van een waarde als uitbijter.
Het probleem zit 'm wat mij betreft in het feit dat uitbijter/outlier een statistische term is. Een term die daarom op zijn minst getest moet worden om gebruikt te mogen worden. Binnen de statistiek bestaan meerdere manieren om daadwerkelijk te testen of een waarde mogelijk een uitbijter is (meerdere methodes, vanwege meerdere types verdelingen en ook meningsverschillen over wanneer een waarde een uitbijter is). Eigenlijk ligt het nog iets subtieler: er is niet één exacte methode om te bepalen of een waarde een uitbijter is. Er zijn wel methodes om datapunten te onderscheiden die er mogelijk een uitbijter zijn. Uiteindelijk is het een subjectieve beslissing (meetfout? verkeerde populatie?) om te beslissen of een waarde wel of niet als uitbijter beschouwd moet worden.
Omdat het hele verhaal zo lastig is, en de term uitbijter voor mij betekent dat een waarde "foutief" is (
en daar hebben wij niet echt/geen kijk op in het geval van het ENS) heb ik er moeite mee dat die term zo vaak gebruikt wordt. Het is veiliger om te zeggen: de oper is een van de warmste/koudste oplossingen. Of: de oper lijkt niet te worden ondersteund door het ENS.
Hopelijk begrijp je nu mijn standpunt, Frank
Quote selectie