Big data en kunstmatige intelligentie

Verborgen evidence in medische data

© everythingpossible / Fotolia

Wat betekent machine learning voor de zorg en hoe werken artsen en data scientists samen aan de ontwikkeling van algoritmen? In een serie blogs geven data scientist Janine Khuc en arts Caroline Yntema antwoord op deze vragen. In deel 1 de potentie van het leren van data.

Wanneer men een arts bezoekt gaat het meestal als volgt: de arts verzamelt informatie, analyseert deze, stelt een diagnose, past de beschikbare richtlijnen toe en maakt een behandelplan. Sommige patiënten zullen het goed doen. Anderen zal het minder goed afgaan of zullen zelfs ernstige bijwerkingen krijgen. Dan wordt overgegaan op de volgende behandeling, in de hoop dat deze wel aanslaat. En de cyclus gaat verder. Van veel medicatie weten we niet waarom deze bij de ene patiënt goed werkt en bij de andere patiënt weinig effect heeft. Ook zijn we afhankelijk van de ervaring van de arts, die mogelijk op specifieke gebieden relatief onervaren is. Hoe kan het dat deze methode van trial and error ​​het beste is dat we kunnen doen?

__________________________________________________________________________________________

Abonneer u nu op de nieuwsbrief van QruxxTech en krijg daarmee iedere maandag een update van alle artikelen, blogs en nieuwsberichten.

___________________________________________________________________________________________

De huidige medische evidence

Al lang worden behandelingen ontwikkeld en getest met behulp van de gouden standaard van wetenschappelijk onderzoek: gerandomiseerde gecontroleerde trials (RCT’s). Dit is een vorm van onderzoek waarin een behandeling en placebo willekeurig worden toegewezen aan patiënten in de onderzoeksgroep. Als een behandeling voor een voldoende aantal gevallen effectief en veilig lijkt te zijn, wordt deze goedgekeurd en gebruikt voor de behandeling van patiënten met de specifieke aandoening waarvoor de RCT is uitgevoerd. Oók voor patiënten met deze aandoening die mogelijk minder goed te vergelijken zijn met deelnemers uit het onderzoek.

Het probleem is dat de ‘evidence’ die artsen gebruiken vaak gebaseerd is op een deelpopulatie die jong, mannelijk en gezond is. Kinderen, vrouwen, ouderen en patiënten met verschillende chronische aandoeningen (comorbiditeiten) en medicijnen worden vaak uitgesloten van deze onderzoeken. In Nederland heeft ongeveer 35% van de bevolking van 50 jaar en ouder meer dan één chronische ziekte en ongeveer 20% van de patiënten ouder dan 65 gebruikt meer dan 5 geneesmiddelen. Hoe kunnen we, gegeven de ‘evidence’, verwachten dat bewijsmateriaal dat is afgeleid van één groep kan worden gebruikt om de behandeling te bepalen voor individuen van een andere groep?

Om deze reden krijgen artsen vaak te maken met klinische vragen waarover onvoldoende bewijs beschikbaar is om hen te begeleiden, wat het voor hen moeilijk maakt om met een behandelplan te komen waarvan ze zeker weten dat het effect zal hebben. Voor de behandeling van een urineweginfectie moet een patiënt soms meerdere soorten antibiotica proberen (met verschillende bezoeken aan de huisarts) voordat de behandeling aanslaat. In de psychiatrie komt het niet zelden voor dat pas de derde keuze antidepressieve behandeling aanslaat, een proces wat maanden (of zelfs jaren) kan duren. Ook kunnen we niet voorspellen bij welke patiënt, ongeacht het effect van de medicatie, ernstige bijwerkingen op zullen optreden.

Leren van data

In de zorg genereren medische professionals steeds meer gegevens over de patiënt. De diagnose, voorgeschreven medicatie, laboratoriumwaarden en metingen die zijn uitgevoerd tijdens het bezoek van de patiënt worden allemaal geregistreerd. Er zijn dus veel data beschikbaar in medische dossiers die de door patiënten ervaren trial and error weerspiegelen. Data die zelden worden bekeken. Er zit veel potentie in het leren van grote aantallen patiënten met verschillende kenmerken, klachten en medicijnen waarvan de behandelingen eerder wel of niet hebben gewerkt; het biedt mogelijkheden om van gemiddelde behandeleffecten naar individuele behandeleffecten te gaan.

Menselijke intelligentie en machine learning

Het aantal variabelen dat wordt opgenomen in medische dossiers loopt in de honderden. Gezien de enorme hoeveelheid mogelijke combinaties van variabelen die kunnen worden bekeken, is het voor het menselijk brein onmogelijk om deze informatie systematisch te verwerken. Meestal kiezen we 5 tot 6 factoren die naar onze mening de belangrijkste zijn en nemen op basis daarvan een besluit.

Veel waardevolle informatie gaat hiermee verloren. Dat is precies waar de potentie van machine learning om de hoek komt kijken. Dit een tak van Artificiële Intelligentie die de capaciteit heeft om gegevens veel sneller te verwerken dan elk menselijk brein ooit zou kunnen.

Een bijzonder aspect van machine learning is dat je niet expliciet hoeft te beschrijven hoe het moet leren. Je moet het goede voorbeelden geven waarna het de identificerende kenmerken van deze voorbeelden zelf zal ontdekken. Machine learning stelt ons in staat om regels, structuren en patronen te identificeren in de grote brij aan informatie, waardoor we kleine signalen samenstellen die we waarschijnlijk als ruis zouden beschouwen maar samen toch significant kunnen zijn. Machine Learning heeft de capaciteit om informatie veel sneller te verwerken dan wij als mensen ooit zouden kunnen en heeft grote potentie in een breed scala aan toepassingen.

We gebruiken het al veel in ons dagelijks leven; Spotify biedt ons elke dag nieuwe muziek aan en Netflix suggereert nieuwe series. Dat is beide machine learning. En het is inderdaad veelbelovend. Als je de media gelooft, lijkt het de oplossing voor al onze problemen. Maar het is geen magie. En net als een kind dat ervaring nodig heeft om zich te ontwikkelen tot een volwassene, heeft machine learning iets nodig om van te leren – en dat is data, goede data.

Janine Khuc en Caroline Yntema zijn als data scientist en arts verbonden aan Pacmed. Pacmed ontwikkelt beslissingsondersteunende tools, gebaseerd op de analyse van zorgdata. In deel twee van deze reeks zullen zij ingaan op de randvoorwaarden, uitdagingen en valkuilen die de interpretatie en het gebruik van medische data voor de ontwikkeling van algoritmen met zich mee brengen.

Reacties