Ingen enda teknik finns i ett vakuum. Microsofts Kinect kan ha lidit en otrolig bild i dunkel efter den oroliga kopplingen med Xbox One. Men dess underliggande principer, teknik och den forskning som gick in på att utveckla den nu har en mycket viktigare roll än att mäta din berusade “Bara dansa” prestanda.

Det sparar liv.

När han talade vid AI-toppmötet i London diskuterade Microsofts professor Christopher Bishop (laboratoriedirektör för Microsoft Research) och Antonio Criminisi, huvudforskare för InnerEye Assistive AI for Cancer, hur huvudrollspeltekniken i kombination med principerna för maskininlärning nu är används för att diagnostisera cancer.

Sätter timmar i sekunder

InnerEye Assistive AI for Cancer är ett Microsoft-aktiverat forskningsprojekt som använder bildanalys och verktyg för att dramatiskt sänka den tid det tar att identifiera och diagnostisera cancerceller hos en patient.

En av de viktigaste tillämpningarna av tekniken är att undersöka data som produceras från en datortomografi (CT) -sökning. CT-skanningar ser rätt vägen genom kroppsvävnad och benämne, vilket resulterar i bilder som erbjuder många olika lager eller skivor i hela patientens kropp. Tillsammans bygger de en hel bild av patientens interna arbete - men identifierar varje organ genom varje minutiellt olika skikt och att kunna identifiera avvikelser inom den dataen kan ta till och med den mest skickliga onkologen många timmar. De använder 3D-modelleringsteknik för att markera och identifiera friska organ, skilja dem från eventuella avvikelser, men måste bygga den bilden pixel med pixel eller voxel av voxel innan de fattar beslut om en behandlingsplan.

Men vad tar en onkologtid att göra för hand kan InnerEye uppnå (med lite mänsklig hjälp) på ungefär 30 sekunder. Som sådan kan mycket mer tid ges till behandlingsplanen för varje enskild patient, med fasta data (vid strålbehandling) om vilka friska områden av kroppen för att undvika att träffa.

“Att träna programvaran har vi hundratals bilder av CT-skanningar från patienter, alla anonymiserade och samtyckta”, förklarar Criminisi.

“De kommer från olika regioner i världen, inte bara Storbritannien, vilket är viktigt för att fånga variationen i etnicitet, kroppsform och sjukdomstillstånd. Varje bild bekräftas av en onkolog att ha, till exempel tecken på prostatacancer, och vi förfinar den genom segmentering.”

InnerEye prestanda saknar emellertid insats från en läkare. Faktum är att det förbättras av det. Medan InnerEye är otroligt kapabel att identifiera olika kroppszoner är felmarginalen inte perfekt. En onkolog kan finjustera den resulterande rapporten och data som matas tillbaka till molnet kan användas för att förfina InnerEys algoritmer varhelst de används, i vilken övning som helst över hela världen.

“Det är inte "förstärkning lärande", det är en annan typ av maskininlärning kallad "övervakad lärande",” sade Criminisi. Det är en mer traditionell typ av lärande, eftersom det är raffinerat genom professionell inmatning, i detta fall från en läkare.

“Vi kommer aldrig att ersätta läkare,” säger Criminisi. “Men det här är ett verktyg för att hjälpa dem att göra sina jobb mer effektivt och effektivt.”

Från spel till medicin

För alla patienter med intresse för spel kan de bli förvånad över att höra rötterna till den programvara som nu används på resan till återhämtning.

“Det använder samma teknik som först utvecklades för att spela spel med Xbox,” förklarar Criminisi.

“Vad vi gör använder Random Forest, en mycket speciell typ av maskininlärningsalgoritm, som intressant kom ut från Microsofts laboratorium för många år sedan och ledde till uppfinningen av Kinect.

“Den tekniken tittade på en användare, inte en patient, från utsidan i, och kunde känna igen rörelser. Så vi trodde, låt oss vända på huvudet och använda det på bilder där du tittar på en patient från insidan ut. Det är samma teknik som utvecklas över tiden.”

Det är inte bara skanningsteknologins historia i Kinect som länkar Microsofts AI-ambitioner till spel, men också den underliggande chiphårdvaran som utför beräkningsuppgifterna. Dess fältprogrammerbara Gate Array (FPGA) -kiselarkitektur är grundad i arbetet på spel-GPU-enheter.

“En CPU är en ganska generisk processor,” förklarar biskop.

“Det har fördelen av att vara mycket flexibel och programmerbar i programvara, men den faktiska arkitekturen är fast. Då finns det mer specialiserad arkitektur, till exempel grafiska bearbetningsenheter eller GPU. De är utformade för snabb grafik, främst för spelbranschen. Men det visar sig att de är mycket väl lämpade för en mycket specifik typ av maskininlärning kallat ett "djupt neuralt nätverk", vilket verkligen är den sak som understödjer hela spänningen runt AI.

“GPUer är en mycket specifik fast arkitektur, verkligen väldigt bra på att göra mycket av samma sak parallellt. Men de saknar flexibilitet. En FPGA är lite annorlunda - du kan tänka på den som en LEGO-uppsättning portar som kan konfigureras i programvara för att vara mycket specifik arkitektur. Det kommer inte vara lika effektivt som ett ändamålsenligt chip på en specifik algoritm, men du kan snabbt konfigurera det för att fungera på något av ett antal olika algoritmer, eller om en ny algoritm kommer med.

“Det här bränser AI-revolutionen, tillsammans med en enorm mängd forskning kring nya maskininlärningstekniker. Flexibiliteten innebär att när en ny och förbättrad algoritm kommer med, kan vi bara omkonfigurera den FPGA-superdatorn för att hantera den. Vi behöver inte längre utveckla ett nytt skräddarsydd chip. ”

Framstegen mot integritet

Som ett exempel hävdar biskop att FPGA-chips kan användas för att översätta helheten av den episka romanen "Krig och fred" från ryska till engelska på den tid det skulle ta dig att hämta det från din bokhylla.

“Föreställ dig en framtid där vi distribuerar detta verktyg på sjukhus, som vi redan gör,” säger Criminisi.

“Som onkolog fixar några misstag eller gör stilistiska val, går data tillbaka till Microsoft Cloud, Azure, och vi använder den för att omskolera algoritmen. Det finns fortlöpande lärande. Nästa dag, när läkaren går tillbaka till operationen, har prestationen förbättrats. Det är där vi vill gå nästa.”

Men att nå denna spännande nästa etapp i det dagliga diagnoset kommer att presentera utmaningar borttagna från kisel, medger Criminisi.

“En sak är att prata om tekniken, den andra är att prata om de juridiska hindren och skyddet för privatlivet. Att möjliggöra en mekanism där du kan göra fortlöpande lärande kommer att vara från en styrningsperspektiv mycket mer komplicerad än vad vi gör just nu.”

Det kanske inte är en uppståndelse för Kinect, men för att förebygga en potentiellt otrolig död hos patienter, kanske har tekniken genom denna utveckling äntligen hittat sin sanna anrop.

  • Kunde Microsofts Kinect återfödas som en virtuell verklighetskontroller?