1A. Sportdag. Uitleg en samenvatting.
Een basisschool had eens 73 leerlingen in groep 8.

De Juf heeft op de sportdag van elk kind de best prestatie genoteerd. Er waren drie onderdelen:

- Sprint over 50 meter; hoeveel seconden had je nodig?
- Verspringen; hoeveel cm ver kwam je?
- Vergooien; hoeveel meter?

Al die gegevens staan nu in een gegevensbestand, met de naam "sport".
De namen van de kinderen zijn weggelaten (privacy), maar hun leeftijd staat er wel in, en ook of het meisje of jongen was.

We gaan dat gegevensbestand met het computerprogramma VUstat bekijken.
Alles wat hier onder staat moet je nu zelf ook gaan meedoen op je computer.



Je ziet het staan, links boven in het keuzemenu van deze webpagina.
Klik het programma aan, en kies het eerste onderdeel: Data analyse.

Je ziet dan een gegevensbestand over een groep kinderen:


Maar dat bestand gaan we niet gebruiken. We willen de sportprestaties zien.


We gaan het bestand "sport" inladen. Dat gaat zo:

Zet de cursor eerst op "Bestand", dan op "Datasets" en
kies daarna met een klik "Datasets voor Toeval in de greep".
Je ziet dan een lijstje mogelijke bestanden.
Zoek "Sport" en klik dat aan.
Je hebt nu het gewenste gegevensbestand ingeladen in je computer:



Hieronder staat een samenvatting van de belangrijkste dingen die je gaat ontdekken in de opgaven.
Dit moet je dus eigenlijk pas gaan bestuderen als je de opgaven uit hoofdstuk 1B af hebt.
Je kunt met die samenvatting misschien ook nog je verslag van je werk aan die opgaven mooier of completer maken.


Variabelen.
Je ziet dat er voor elk kind vijf gegevens zijn opgeschreven:
geslacht, leeftijd, sprint, vérspringen, vérgooien.
Dat zijn de variabelen van het gegevensbestand. Als je langs de kinderen loopt, dan variëren die gegevens. De sprint was over 50 meter, de tijd staat in seconden; vérspringen werd in cm geneten en vérgooien in meters. Er werd met een schijf van 200 gram gegooid.

Als je bovenaan zo'n kolom op de naam van de variabele klikt, dan wordt het bestand gesorteerd op de volgorde van die kolom. Nog een keer klikken: de volgorde wordt omgekeerd.
In de opgaven van hoofdstuk 1B gaan we dat sorteren gebruiken om een paar vragen te beantwoorden die je aan het gegevensbestand kunt stellen.

Grafieken.
Een grafiek geeft een overzicht van een variabele in een plaatje.
In de opgaven van hoofdstuk 1B gaan we bijna al dit soort plaatjes laten maken door de app.

Als je dat een beetje door hebt dan kun je daarmee allerlei vragen beantwoorden die je aan het gegevensbestand kunt stellen.
  


Tabellen.
Een tabel geeft een overzicht van een variabele in een lijstje met getallen.


Die getallen geven aan hoe vaak de verschillende waarden van de variabele in het gegevensbestand vóórkomen.
Als je het zelf op papier zou moeten doen dan zou je "turven" met .
Dat kan met de getallen zélf (frequentie), maar ook met de percentages (relatieve frequentie).
Het woord "frequentie van een waarde" betekent gewoon: "hoe vaak" komt zo'n waarde voor in het bestand.

Ken(ge)tallen.
Dit zijn getallen waarmee een gegevensbestand kort wordt samengevat.
Je "kent" het bestand daarmee (een beetje).
De belangrijkste zijn de Centrummaten (gemiddelde, mediaan, modus) en
de Spreidingsmaten (kwartielen, standaardafwijking SD).

In het plaatje hieronder zie je het verband van de kwartielen met de grafiek van de boxplot.
In de vierde klas kom je het kengetal "SD" pas tegen. Daar hebben we het nu niet over.


Ook deze twee mogelijkheden van de app zullen we in de opgaven gaan gebruiken om antwoorden te vinden op vragen die we aan het gegevensbestand stellen.
En je kunt de app ook gebruiken om mooie presentaties te maken over de ins en outs van het gegevensbestand.