Het analyseren van Amerikaanse babynamen
Op deze pagina leer je meer over de visualisatie van grote datasets.
Hoe werkt het als je gegevens gaat analyseren die uit miljoenen stukjes informatie bestaan, in plaats van
een paar honderd? Grote datasets bieden uitdagingen en kansen voor het ontdekken van nieuwe informatie.
- Open deze webarchive-link: Baby Name Voyager. Het is een visualisatie van de duizend meest populaire
jongens- en meisjesnamen van kinderen geboren in de Verenigde Staten tussen 1880 en 2014.
- Wat was de populairste meisjesnaam in de jaren 1900? En in de jaren 1960?
- Welke jongensnamen zijn tegenwoordig veel minder populair dan in 1880?
- Zoek op welke namen in Nederland tegenwoordig populair zijn via svb.nl 2023. Zijn hier Amerikaanse namen bij? Uit welke tijd?
- Wat kun je nog meer vinden? Zoek wat interessante details in de data en bereid je voor om het aan je klas te laten zien.
- Had je moeite bij het beantwoorden van een van bovenstaande vragen? Wat is er eventueel niet zo duidelijk
aan deze visualisatie? Hoe zou je dat kunnen verbeteren?
De Baby Name Voyager is een indrukwekkende visualisatie van een grote dataset. Deze gegevens zijn afkomstig
van de Social Security
Administration, via een tekstbestand voor elk jaar van 1880 tot 2014. Maar het bekijken van de gegevens in
zo'n plat tekstbestand zou je niet bepaald veel inzicht geven...
Grote datasets bieden unieke uitdagingen en kansen:
- Met data van ons eigen CBS kun je zelf een data-analyse maken van de geboortes in ons land per jaar. Je kunt de data
hier
downloaden.
- Denk eens aan een grote dataset die je zelf hebt gemaakt en probeer deze visueel te maken met
Snap!
Let op, grote datasets kunnen teksten, geluiden, plaatjes en video’s bevatten.