Wat is de impact van de waargenomen datakwaliteit? Hoe kunnen we het model verbeteren door betere data? Hoe gaan we de prestaties van het model en de drift van gegevens controleren?
Datakwaliteit is cruciaal voor de betrouwbaarheid en nauwkeurigheid van je AI-model. Bespreek de verschillende aspecten van datakwaliteit, zoals nauwkeurigheid, volledigheid, consistentie en tijdigheid van de gegevens. Leg uit welke stappen en technieken je gebruikt om datakwaliteit te garanderen, waaronder dataschoning, detectie van uitschieters en validatieprocessen.
Model monitoring: hoe ga je de kwaliteit van het model, als het eenmaal in productie is, controleren en monitoren? Wat is de verwachte houdbaarheid van het model? Wie bepaalt wanneer het model moet worden herzien? Wie of welk team is verantwoordelijk voor model monitoring?
Benadruk het belang van data van hoge kwaliteit voor betrouwbare AI-resultaten.
Welke machine learning techniek zal worden gebruikt? Hoe beoordeel je de kwaliteit van het model?
Welke statistische metriek ga je gebruiken (bijv. precisie, recall, f1)? Wordt het voorspellend, beschrijvend of prescriptief?
Welke validatie techniek wordt toegepast?
Ondersteunt het model je bedrijfsdoelstelling?
Geef een uitgebreid overzicht van het algoritme dat je oplossing aandrijft. Leg in grote lijnen de technische details uit, de architectuur en hoe het model gegevens verwerkt. Bespreek, indien van toepassing, de keuze van machine learning- of deep learning-technieken en hun geschiktheid voor het probleem dat je oplost. Vermeld eventuele bedrijfseigen of unieke aspecten van je model.
Zie Cassie Kozyrkov Statistical Thinking op YouTube, aflevering 10. over toegepaste statistiek: als er geen standaardactie is, als we niet van gedachten willen veranderen, is het niet nodig om statistiek te gebruiken.
De standaardactie verwijst naar de actie die gebruikers momenteel uitvoeren. Je standaardactie is bijvoorbeeld dat je een standaard antwoordmail stuurt naar een klant na een klacht. Dezelfde inhoud voor elke gebruiker. Je wilt dat een AI-systeem gepersonaliseerde e-mailinhoud genereert op basis van eerdere interacties over klachten, toon van de stem, enzovoort.
Hoe controleer je op ongewenste vooroordelen (bias)?
Mag je de verzamelde gegevens voor dit doel gebruiken?
Kun je het gedrag van het model verklaren?
Ga in de context van privacy en ethiek in op hoe je AI-model omgaat met gevoelige gegevens, eerlijkheid garandeert en transparantie handhaaft. Beschrijf alle privacy beschermingsmaatregelen, strategieën om vooroordelen te beperken en functies die nodig zijn om het model te kunnen verklaren (bijvoorbeeld shap) . Houd rekening met ethische overwegingen bij het verzamelen en gebruiken van gegevens en het gedrag van het model.