AI-vroegsignalering
Drie toepassingen met simpele machine learning: decision tree, clustering en anomalieën.
AI-gedreven vroegsignalering
Steeds vaker komt de vraag op: kunnen we energiearmoede eerder zien aankomen, zodat hulp sneller en gerichter kan? In dit hoofdstuk beschrijf ik drie realistische toepassingen met simpele machine learning.
1. Risicovoorspelling met decision tree of random forest.
Idee: je gebruikt historische data om te leren welke combinaties van kenmerken vaak samenhangen met energiearmoede. Een decision tree is handig omdat je de beslisregels kunt uitleggen.
Voorbeeld van kenmerken: inkomenscategorie, type woning (huur/koop), bouwjaar, energielabel, huishoudgrootte, (geanonimiseerd) verbruikspatroon, wijkkenmerken.
Risico’s: privacy (AVG), bias (onbedoeld bepaalde groepen vaker labelen), en verkeerd gebruik (stigmatiseren). Daarom: zo min mogelijk persoonsgegevens, werken met encryptie en duidelijke regels.
Succesmaat: minder gemiste huishoudens die later alsnog in de problemen komen, én gerichtere inzet van hulp (minder fout aangeschreven huishoudens / huishoudens die het niet nodig hebben).
2. Wijkclusters voor hotspot-aanpak
Idee: je clustert wijken op basis van kenmerken (woningkwaliteit, inkomensniveau, energielasten, type woningen). Daarmee kun je een wijkgerichte aanpak beter plannen.
Benodigde data: vooral data op wijk/buurtniveau (CBS, gemeentelijke data, woningdata). Dit kan privacyvriendelijker zijn dan huishouden-niveau.
Risico’s: je mist individuele situaties, en clusters kunnen “te grof” zijn. Ook kunnen wijken veranderen door renovaties of verhuisstromen.
Succesmaat: in hotspot-wijken sneller effect zien (meer isolatiemaatregelen, minder hulpvragen rond energierekeningen).
3. Anomalie-detectie: extreem laag stoken als signaal
Idee: sommige huishoudens lijken “niet energiearm” omdat ze heel weinig verbruiken. Maar dat kan verborgen energiearmoede zijn: mensen zetten de verwarming nauwelijks aan.
Data: tijdreeksverbruik (slimme meters) + context (woningtype, huishouden, wijk). Dit moet heel zorgvuldig, want verbruiksdata is gevoelig.
Risico’s: privacy, verkeerde interpretatie (bijv. mensen die weinig thuis zijn), en twijfel over toestemming.
Succesmaat: hoeveel verborgen gevallen je eerder in beeld krijgt, zonder dat je mensen onterecht labelt.
Randvoorwaarden: AVG, bias, uitlegbaarheid
- AVG: werk met zo min mogelijk persoonsgegevens; kies voor aggregatie waar het kan; leg vast wie toegang heeft.
- Bias: check of het model bepaalde groepen structureel over- of onderselecteert. Test op fairness.
- Uitlegbaarheid: bij beleid is uitleg belangrijk. Decision trees scoren hier beter dan black boxes.
- Menselijke controle: AI ondersteunt. Een mens beslist, en er moet bezwaar mogelijk zijn.