Pieter Bots en Ivo Bouwmans definiëren een diagram, of grafiek, als een grafisch model. Bots en Bouwmans maken onderscheid drie categorieën diagrammen. Allereerst onderkennen zij grafieken en netwerkdiagrammen. Grafieken zijn diagrammen die een grafische weergave zijn van een gegevensverzameling, een netwerkdiagram is een diagram die de relatie visualiseert tussen de mensen en/of dingen die onderling verbonden zijn in een netwerk. Naast de grafieken en netwerkdiagrammen zijn er nog een aantal andersoortige diagrammen die Bots en Bouwmans indelen in de categorie 'overig'.
Bots en Bouwmans onderscheiden zes verschillende grafieken:
-
Boxplot.
-
Cirkeldiagram.
-
Lijndiagram.
-
Sankey-diagram.
-
Spreidingsdiagram.
-
Staafdiagram.
(1) Boxplot
Een boxplot is een grafische weergave van vijf beschrijvende statistieken van een gegevensverzameling: het minimum, het eerste kwartiel, de mediaan (= het tweede kwartiel), het derde kwartiel, en het maximum van de waarden.
(2) Cirkeldiagram
Een cirkeldiagram (pie chart) gebruik je wanneer je gegevens als relatieve bijdrage aan een totaal wilt weergeven. De cirkel komt dan overeen met het totaal, de afzonderlijke cirkelsegmenten met de relatieve aandelen van de onderscheiden componenten. Je kunt daarbij nog kiezen tussen procentuele en/of absolute bijdrage.
(3) Lijndiagram
Een lijndiagram wordt meestal gebruikt om een tijdreeks te visualiseren zodat de volgende eigenschappen van die tijdreeks zichtbaar worden:
- Variabiliteit: de mate waarin de waarde van de weergegeven variabele in de tijd varieert.
- Trend: of de waarde gemiddeld genomen in de tijd toeneemt of juist afneemt.
- Periodiciteit: of de variatie in waarde zich volgens een patroon herhaalt.
Een lijndiagram geeft dus typisch antwoord op de vraag "Hoe verandert de waarde van een variabele in de tijd?".
(4) Sankey-diagram
In een Sankey-diagram worden stromen (van bijvoorbeeld goederen, geld of energie) weergegeven door banen waarvan de breedte evenredig is met de omvang van de stroom.
(5) Spreidingsdiagram
Een spreidingsdiagram (scatter plot) geeft een indruk van de mate waarin twee verschillende factoren aan elkaar gerelateerd zijn. Naarmate de punten meer homogeen binnen het x,y-vlak verspreid liggen is het onwaarschijnlijker dat er een verband bestaat tussen de factoren. Voor min of meer lineaire relaties is de correlatiecoëfficiënt een wiskundige maat voor een mogelijk verband.
(6) Staafdiagram
Een staafdiagram (bar chart) visualiseert tegelijk de waarden van factoren en de onderlinge verhouding tussen die factorwaarden. De factoren waarvan de waarde als staaf wordt weergegeven moeten dezelfde eenheid hebben.
Enkelvoudig staafdiagram
Een staafdiagram gebruik je doorgaans om dezelfde factor voor verschillende (sub)systemen weer te geven. Een staafdiagram kun je ook gebruiken om de waarde van een factor op verschillende tijdstippen te visualiseren. Een staafdiagram gebruik je om de verschillen tussen specifieke periodes in een tijdreeks te benadrukken. Wil je juist benadrukken dat het om een geleidelijke ontwikkeling in de tijd gaat, dan moet je een lijndiagram gebruiken .
Meervoudig staafdiagram
Een meervoudig staafdiagram gebruik je om de waarde van meer dan één factor tegelijk weer te geven. Dat doe je bijvoorbeeld om de verschillen in waarde tussen de factoren te benadrukken. Het onderstaande staafdiagram geeft behalve antwoord op de vraag "Hoe ontwikkelde zich het personenvervoer via Schiphol in het afgelopen decennium?" ook antwoord op de vraag "Is het gemiddelde aantal passagiers per vlucht de afgelopen jaren toegenomen?"
De factoren in een meervoudig staafdiagram mogen verschillende eenheden hebben, zolang je dat maar duidelijk in de legenda aangeeft.
Een gespiegeld staafdiagram kan nuttig zijn om balansgrootheden te visualiseren:
Gestapeld staafdiagram
Een gestapeld staafdiagram gebruik je wanneer je de ontwikkeling in het relatieve aandeel van de verschillende factoren in het totaal wilt laten zien. Deze factoren moeten dan wel allemaal dezelfde eenheid hebben. Aan een gestapeld staafdiagram lezen mensen een verhouding zoals 1:2, 3:4 en 1:5 beter af dan aan de grootte van de cirkelsegmenten in een cirkeldiagram.
Histogram
Een histogram visualiseert de verdeling van de waarden die een factor kan aannemen. Dit effect bereik je door het waardebereik van de factor op te delen in een aantal intervallen (bins) van gelijke grootte, en daarna voor een serie waarnemingen het aantal waarnemingen per interval te tellen.
Om een goed beeld te geven van de relatieve frequenties moet het aantal intervallen niet te groot zijn (want dan worden de staven te kort om duidelijk een patroon te zien) en ook niet te klein zijn (want dan heb je te weinig staven om een goed beeld te krijgen van de vorm van de verdeling). Bij 100 waarnemingen zijn 5 à 10 intervallen doorgaans geschikt. Bij grotere gegevensverzamelingen kun je meer intervallen nemen. Het aantal intervallen wordt ook wel de resolutie van het model genoemd.
Een histogram wordt vaak gebruikt bij het bepalen van de kansverdeling van een stochastische variabele.
Eisen aan een diagram
[Bots & Bouwmans stellen in het algemeen dat er vijf eisen zijn waaraan een diagram moet voldoen:]
- Informatieve titel (Wat zien we hier?).
-
Legenda die de betekenis van de elementen van het diagram uitlegt (vaak volstaat de naam van de factor).
-
Bij assenstelsels: elke as gelabeld met de naam en eenheid van de variabele, en voorzien van een schaalverdeling.
-
Volledige bronvermelding (Waar komen de gegevens vandaan?).
-
Een nummer (bv.: Figuur 1.2)* waarmee in de rapporttekst naar het diagram verwezen wordt (bv.: zie figuur 1.2; dus niet: 'zie de figuur hieronder').
De validiteit van een grafiek hangt af van de juiste keuze van grafiektype en de betrouwbaarheid van de gebruikte gegevens.
Bron: Diagram, Pieter Bots & Ivo Bouwmans