ML-gebaseerde survival analyse met intervalgecensureerde gegevens voor leeftijdsvoorspelling bij honden
Puppy's worden vaak op te jonge leeftijd verhandeld. Dit kan gezondheidsimplicaties voor niet alleen de hond, maar ook voor de menselijke bevolking met zich meebrengen. Hierbij spelen de minimumleeftijden van acht en vijftien weken een cruciale rol. Deze zijn respectievelijk ingevoerd om te voorkomen dat pups te vroeg van hun moeder gescheiden worden en ongevaccineerd verhandeld worden. Daarom wordt gezocht naar een techniek
die de leeftijd van een pup accuraat kan inschatten om de illegale puppyhandel te bestrijden.
Eerder diergeneeskundig onderzoek concludeert dat een tandheelkundige controle de minst invasieve manier is om een leeftijdsbepaling te maken. Hieruit resulteerde data van 1001 pups over de ontwikkeling van het melkgebit en gegevens van 440 honden over het doorkomen van het volwassen gebit. Daarnaast zijn kenmerken zoals grootte, schedeltype, geslacht en ras ook genoteerd.
De machinaal leren modellen opgesteld in deze masterproef leren uit die data om zo de leeftijd van nieuwe pups te kunnen bepalen. De data bevat echter één grote uitdaging. De leeftijd van de pups is namelijk in intervallen genoteerd, dit wil zeggen dat de exacte ouderdom wanneer een bepaalde tand uitkwam niet gekend is. Dit fenomeen heet interval censurering en wordt in de statistische tak survival analyse bestudeerd.
De ontwikkelde modellen bestaan daarom uit een combinatie van machinaal leren en survival analyse. Door deze samen te brengen kan de interval gecensureerde data correct verwerkt worden met machinaal leren algoritmes.
Voor zowel het melk- als het volwassen gebit zijn verschillende modellen opgesteld en geëvalueerd. Hieruit blijkt dat de hybride machinaal leren en survival analyse modellen beter scoren dan de klassieke statistische modellen. De verkregen resultaten tonen aan dat de modellen in dit onderzoek waardevolle ondersteuning kunnen bieden bij de leeftijdsbepaling van honden.