Een variabele is een een eigenschap of kenmerk van een object die verschillende waarden kan aannemen. Variabelen kunnen kwantitatief zijn, dat wil zeggen in getallen uit te drukken, zoals lengte en leeftijd. Bij kwalitatieve variabelen laten de kenmerken zich alleen in woorden omschrijven: geslacht, haarkleur, beroep.
Meten is het - volgens bepaalde regels - toekennen van getallen aan eigenschappen. Bij veel soorten onderzoek worden waarnemingen ingedeeld in klassen. Dergelijke gegevens duiden een niet-getalsmatige eigenschap (kwaliteit) aan; men noemt dit kwalitatieve gegevens. De wijze waarop gegevens zijn gemeten, wordt het meetniveau of meetschaal van de variabele genoemd. Het meetniveau is bepalend voor de berekeningen en statistische toetsen die mogen worden uitgevoerd.
Bij metingen kan gebruik worden gemaakt van vier verschillende meetniveaus:
-
Nominaal meetniveau: bij meten op een nominaal meetniveau worden personen of objecten ingedeeld in kwalitatief verschillende klassen of categorieën waaraan een getalsmatige code kan worden toegekend. Het toekennen van getallen is willekeurig, dus bijvoorbeeld man = 0, vrouw = 1. De gebruikte codes voor de categorieën zijn willekeurig, ze geven alleen aan dat de categorieën van elkaar verschillen. Het toegekende getal zegt niets over de betreffende eigenschap en is eigenlijk dus niets anders dan een naam (latijn: nomen). Een bijzondere vorm van een 'nominale variabele' is de dichotome variabele. Een dichotome variabele is een kenmerk dat slechts twee mogelijke waarden kan aannemen, bijvoorbeeld man/vrouw, geslaagd/gezakt of goed/fout. Sommige variabelen zijn van nature dichotoom andere variabelen worden dichotoom gemaakt (gedichotomeerd), dat wil zeggen dat scores worden samengevoegd in twee categorieën.
-
Ordinaal meetniveau: bij meten op ordinaal meetniveau worden personen of objecten ook ingedeeld in kwalitatief verschillende klassen of categorieën, maar is sprake van een ordening in de toegekende getallen ('ranggetallen'). Bij een ordinale meetschalen kan er niet willekeurig gecodeerd worden omdat er nu wel sprake is van een ordening of rangorde. Bijv. opleidingsniveau of geclassificeerde inkomensklassen. De verschillen tussen de opeenvolgende code mogen wel willekeurig zijn. Een hoger (of lager) getal betekent méér dan een eigenschap. Hoeveel meer is echter niet eenduidig bepaald, de keuze van de toe te kennen getallen is namelijk betrekkelijk willekeurig, er is eigenlijk alleen sprake van een 'natuurlijke volgorde' of rangordeschaal.
-
Ratioschaal: het hoogste meetniveau is sprake van een ratioschaal waarbij verhoudingen tussen getallen direct geïnterpreteerd kunnen worden als verhoudingen tussen hoeveelheden van de eigenschap. 32 minuten is écht twee keer zo veel als 16 minuten. Bij een ratioschaal is er een duidelijk gedefinieerd, vast nulpunt dat de afwezigheid van iets weergeeft: een lengte van 0 betekent géén lengte.
-
Interval meetniveau: tussen het ordinale meetniveau en de ratioschaal ligt het intervalniveau. Een intervalschaal heeft een arbitrair nulpunt. Een bekend voorbeeld is temperatuur in graden Celcius. Zweedse astronoom Anders Celsius heeft tamelijk willekeurig de temperatuur waarbij water van vaste vorm (ijs) overgaat in vloeistof, 0 graden genoemd. Als hij in plaats van water stikstof had genomen, was nul graden veel kouder geweest. Bij metingen op intervalniveau kunnen verschillen tussen twee waarden direct vergeleken worden.
Het meetniveau heeft - zoals gezegd - gevolgen voor de toegestane statistische bewerkingen. Hoe hoger het meetniveau, des te meer bewerkingen zijn toegestaan.
Discrete data (variabelen)
Variabelen die 'gemeten' worden op nominaal of ordinaal meetniveau worden discrete data genoemd. Bij zowel het nominale variabelen als ordinale variabelen, geldt dat je eigenlijk meer bezig bent met het indelen in categorieën, dan wat je in het dagelijks leven vaak onder de term 'meten' verstaat. De verkregen data worden daarom ook wel categorische data genoemd. Een naam die ook gebruikt wordt is attributieve data of attributiedata. 'Attributie' in de zin van toekennen; je kent letterlijk een categorie toe aan dingen.
Bij een discrete variabele bestaan de waarden alleen uit gehele getallen. De variabele heeft een waarde die de uitkomst is van een telling of classificatie. Discrete variabelen staan 'los van elkaar'; het gaat om losse waarden die sprongsgewijs veranderen. Een frequentieverdeling van een discrete variabele wordt meestal weergegeven als een staafdiagram.
Continue data (variabelen)
Variabelen die gemeten worden op ratio- of intervalniveau worden continue data genoemd. De toegekende getalsmatige eigenschap kan in theorie alle mogelijke waarden krijgen. Bij continue variabelen kan wél elke waarde tussen twee meetpunten voorkomen. Continu variabelen nemen waarden aan uit een aaneengesloten interval (continuüm).
De variabele heeft een waarde die de uitkomst is van een échte meting, waarbij er een getal wordt toegekend aan de variabele. Een voorbeeld van een continue variabele is 'lichaamslengte'. De frequentieverdeling van een continue variabele wordt meestal weergegeven als een vloeiende curve.
Veel gebruikte grafieken:
Discrete data
- Pareto chart
- Histogram
- Pie chart
Continue/numerieke variabele
- Probability plot
- Time Series plot
Zie ook: Statistische concepten en hulpmiddelen: meetniveaus variabelen