Artificial Intelligence helpt bloeiende planten tellen
Naturalis Biodiversity CenterSlimme algoritmes kunnen objecten in beelden herkennen. Dit principe wordt al toegepast in bijvoorbeeld de rijbaanherkenning van auto’s, of bij de nieuwste CT- of MRI-scanners die tumoren helpen opsporen. Onderzoekers en studenten van Fontys Hogeschool ICT, HAS en Naturalis ontwikkelden samen een Artificial Intelligence (AI)-model dat wilde planten kan herkennen en tellen.
Hoe werkt het?
De input van het AI-model bestaat uit een verticaal naar beneden gemaakte foto van vegetatie van ongeveer één vierkante meter. Zo’n foto kan met een smartphone of drone gemaakt worden. Als resultaat geeft het model een lijstje van de bloeiende plantensoorten in die foto en de bijbehorende aantallen.
Datakwaliteit
Om het model te trainen gebruikten de makers de zogeten Eindhoven Wildflower Dataset. Deze dataset bestaat uit ruim 2.000 foto’s, waarop in totaal 65.000 bloemen te zien zijn, van 160 verschillende plantensoorten. De foto’s zijn gemaakt in bermen, stadsparken, weilanden en natuurgebieden in de omgeving van Eindhoven. Het bijzondere van dit AI-model is dat het een standaard algoritme gebruikt, en dat er vooral veel aandacht is besteed aan de kwaliteit van de data waarmee het model getraind is. Zo is voor elke plantensoort nauwkeurig vastgelegd wat precies de ‘tel-eenheid’ is. Vaak is dat de bloeiwijze van de plant.
Daarnaast zijn er richtlijnen opgesteld om ervoor te zorgen dat de beelden van de Eindhovense trainingsset op een eenduidige en consistente manier zijn geannoteerd. Er is ook hard gewerkt om het model te trainen met een gebalanceerde dataset om ‘bias’ te voorkomen. Er zijn precies evenveel annotaties per plantensoort gebruikt.
Bloementeelt
Deze methode kan eenvoudig opgeschaald worden, bijvoorbeeld voor wilde planten die op dijken, in bermen, of op akkers groeien. Telers van bolgewassen en snijbloemen kunnen de methode ook gebruiken om bijvoorbeeld hun oogst mee in te schatten. Hiervoor dient de trainingsset eerst uitgebreid te worden met foto’s van nog ontbrekende plantensoorten, zodat het plantentel-algoritme getraind kan worden met nieuwe beelden.
Oftewel: wie planten wil tellen, kan nu nog niet meteen aan de slag, legt Gerard Schouten van Fontys Hogeschool uit. "Je moet dit zien als een proof of concept, we laten zien dat je meerdere plantensoorten betrouwbaar kunt tellen met een AI-model. Als je het model echt in de praktijk wilt gaan inzetten, zullen er nog een paar stappen gezet moeten worden. Er moeten meer soorten in, en er is ook nog een IT-slag nodig om echt een ‘end-to-end’ systeem te maken. Denk dan bijvoorbeeld aan integratie met een beeldsensor in een drone of smartphone, die de beelden automatisch naar de Cloud stuurt, waar ook het AI-model draait. Of een gebruikersvriendelijke user interface, bijvoorbeeld een app, om de resultaten van het model te bekijken."
De eerste mijlpaal is er al: Schouten en zijn collega's van de HAS en van Naturalis publiceerden over het model en de dataset in wetenschapsvakblad PLOS ONE.
Meer informatie
- Lees het volledige onderzoek: Data-centric AI approach for automated wildflower monitoring.
- Het plantentel-algoritme komt beschikbaar voor onderzoekers via de soortherkennings-infrastructuur ARISE. Dat heeft een zogeheten plug and play software-architectuur zodat allerlei vormen van data of data-herkenning er eenvoudig aan toegevoegd kunnen worden. Lees hier meer over dat project.
- Eindhoven Wildflower Dataset is nu al beschikbaar voor wie ermee aan de slag wil.
Tekst: Gerard Schouten (Fontys Hogeschool ICT) en Barbara Gravendeel (Naturalis Biodiversity Center)
Beeld: Fontys Hogeschool, Eindhoven Wildflower Dataset; Esmee Winkel, Naturalis Biodiversity Center