Big data en kunstmatige intelligentie

Algoritmen: het signaal vinden in de ruis

ipopba / Getty Images / iStock

Wat betekent machine learning voor de zorg en hoe werken artsen en data scientists samen aan de ontwikkeling van algoritmen? In een serie blogs geven data scientist Janine Khuc en arts Caroline Yntema antwoord op deze vragen. In deel 3 de betrokkenheid van zorgverleners bij het ontwikkelen van algoritmen

In deel 2 van deze serie gingen we in op de uitdagingen en valkuilen van de vertaling van data naar een verhaal. In deze laatste aflevering gaan we dieper in op het belang van de betrokkenheid van de medische professional om signalen en ruis in de data te onderscheiden.

Zie je hier een hond?

 

Op het eerste gezicht lijkt het misschien ruis. Maar in die ruis zie je het signaal waarnaar we op zoek zijn; een hond. Zonder een indicatie van waar je naar op zoek bent, duurt het misschien veel langer voordat je de hond ziet. Misschien had je hem zelfs nooit ontdekt of zag je allerlei andere dingen.

_________________________________________________________________________________________

Abonneer u nu op de nieuwsbrief van QruxxTech en krijg daarmee iedere maandag een update van alle artikelen, blogs en nieuwsberichten.

___________________________________________________________________________________________

Wanneer er veel data is, worden ruis en signalen snel met elkaar verward. De uitdaging ligt in het onderscheiden van wat het relevante signaal en de ruis is. En dat is precies waar de samenwerking tussen data-scientists en medische professionals begint. Het begint met medische professionals die de relevante resultaten definiëren om ervoor te zorgen dat alles wat we hebben opgeslagen in de praktijk relevant is, ons vertelt waar we op moeten letten in de data en ons helpt om de signalen in de ruis te vinden en begrijpen.

De behoefte aan medische expertise

Het is belangrijk om in het achterhoofd te houden dat machine learning ons alleen kan helpen om associaties en patronen te vinden – niet om ze te begrijpen.

De sterkste associaties die gevonden worden met machine learning – zonder menselijke intuïtie – kunnen pure ruis en relatief irrelevant zijn voor de onderzochte medische kwestie. Een algemener voorbeeld hiervan is het intuïtief verband dat wij zien tussen gesmolten kaas en oventemperatuur; wij weten dat de oven de kaas smelt, en dat de gesmolten kaas de oven niet opwarmt. Dit intuïtieve inzicht laat zien dat we expert zijn in het identificeren van causale patronen in ons dagelijks leven.

 Als we deze waarneming (gesmolten kaas en een warme oven) in een algoritme voor machine learning zouden stoppen, zou het ons alleen kunnen vertellen dat er een complex verband is tussen gesmolten kaas en oventemperatuur. Medische professionals hebben dit intuïtieve inzicht in de (patho)fysiologie van het menselijk lichaam. Door dit intuïtieve inzicht kunnen ze de aannemelijkheid van gevonden patronen en associaties beoordelen. Als zodanig is het essentieel om deze op te nemen om niet alleen de ruis van het relevante signaal te onderscheiden, maar ook om de accuraatheid van modellen die we bouwen te beoordelen.

Interpreteerbare modellen

Het causale begrip van medische professionals is ook essentieel voor de ontwikkeling van technologieën die nuttig voor hen zullen zijn. Ze nemen beslissingen op basis van het causale begrip van een probleem dat zich voordoet. Om deze reden moeten artsen ook inzicht kunnen hebben in de resultaten en output van een machine learning-algoritme. Wat als dat een arts zegt dat je ziek bent maar niet uit kan leggen waarom?

Om AI in de praktijk uitvoerbaar te maken moeten medische professionals begrip hebben van de manier waarop het machine learning model bewijs genereert voordat ze het mee kunnen nemen in hun redenering en besluitvorming. Net zoals artsen in de loop der jaren kennis en inzicht hebben vergaard over cholesterolniveaus, roken en hypertensie als factoren die een rol spelen bij het ontwikkelen van cardiovasculaire ziekten, zal de toekomstige arts inzicht en kennis moeten vergaren over de manier waarop een machine learning algoritme resultaten en output genereert.

Samenvattend

In de medische praktijk worden dagelijks grote hoeveelheden data gegenereerd waarin trial and error behandelingen van vele patiënten zijn weerspiegeld. Dit zijn waardevolle data die bij kunnen dragen aan de behandeling van vergelijkbare patiënten. Deze vergelijkbare patiënten worden op dit moment behandeld volgens richtlijnen die ontwikkeld zijn aan de hand van RCT’s, wat betekent dat elke patiënt de beste behandeling voor de statistisch gemiddelde persoon krijgt.

Vanwege de enorme brij aan data waarin de ‘verhalen’ van deze patiënten verborgen liggen, is het voor het menselijk brein onmogelijk om alle patiënten te analyseren en alle mogelijke verbanden te zien. Machine learning heeft de potentie om deze verbanden te onthullen en informatie te genereren die het menselijk brein niet uit de data kan halen.

Maar de accuratesse van zo’n machine learning algoritme valt of staat bij validiteit van de methoden waarmee de patiëntdata zijn geanalyseerd. Context, prescriptie-bias, correlatie versus causaliteit en intuïtie zijn relevante begrippen als het gaat over het ‘opvoeden’ van een algoritme; het zijn de menselijke factoren die een algoritme zichzelf moeilijk aan kan leren (en misschien wel nooit zal leren). Voor de juiste interpretatie en valide gebruik van de data is een nauwe samenwerking nodig tussen de data-scientist die het algoritme bouwt en de arts die data genereert én het algoritme uiteindelijk zal gebruiken voor beslissingsondersteuning, met als doel de zorg voor iedere patiënt te optimaliseren.

Het team van de data-scientist en arts is momenteel ‘the new kid on the block’, maar heeft grote potentie om de zorg drastisch te verbeteren. Zij kunnen samen Machine Learning algoritmen ontwikkelen die (in combinatie met RCT’s) de zorg maximaal aan laten sluiten bij de behoeften van iedere individuele patiënt, zodat het – juíst als het gaat om het behandelen van ziekte – een waardevolle gedachte is dat iedere patiënt uniek is. Doordat deze algoritmen ook weer leren van alle beslissingen en ervaringen van de artsen die ze gebruiken, kunnen andere artsen ook leren van de gemaakte keuzes en opgeslagen data. Hoe meer data, hoe meer variabelen, hoe meer kennis, hoe meer algoritmen, des te nauwkeuriger we in de toekomst de beste behandeling voor elk individu kunnen kiezen. Dus waar wachten we nog op?

 

Reacties