Maskininlärning förbättrar allt från bild- och taligenkänning för att förutsäga när maskiner kommer att misslyckas. Det är det som gör Cortana smart för att spricka skämt och förutse sportkampanjer, samt berätta när du ska gå tidigt för mötet eftersom trafiken är dålig. Men det finns fortfarande en lång väg för digitala assistenter att gå innan vi verkligen kan lita på dem.

Vi testar fortfarande datorsystem som försöker hjälpa oss, inte på fakta, men hur väl de kommunicerar, hävdar Bings sökregissör Stefan Weiz i sin senaste bok, "Sök".

"I system som Siri eller Cortana är 30 till 40% av alla interaktioner som människor initierar sociala eller dumma frågor som sondar på assistenten snarare än förfrågningar som systemet skulle svara på. Vi vill (och behöver) att tro på att vi "engagerar sig med någon som förstår inte bara matte men vår mänsklighet."

Chit chatt med Cortana

Därför byggde Microsoft chit chat-systemet i Cortana som låter henne sjunga sånger och göra imitationer. "Humor har varit ett stort fokus för MSR i vårt samarbete med Cortana-laget, säger chefen för Microsoft Research Peter Lee. "Chit chat är ett lättviktigt maskininlärningssystem och vi kan fortsätta öka antalet domäner som Cortana kan chatta med dig om."

Problemet är hur snabbt Cortana kan följa med vad som händer när det gäller att bryta nyheter snarare än den säsongsbetonade humor som Bing-laget lägger till, som att spåra Santa eller skoja om Seattle Seahawks.

"I Cortana eller någon digital assistent finns det färskhet vad Cortana vet om," förklarade Lee för oss. "Cortana lär dig fortlöpande. Du kan ha en chatt-pratkonversation fråga om vem som ska vinna Seahawks-spelet som kommer upp nästa söndag. Men på kvällen där saker är utbrott i Ferguson Missouri är det inte alltid uppenbart att Cortana kommer att ha friskhet av kunskap för att interagera. "

Det är därför, även om Microsoft har stor framgång med de för närvarande populära djupa inlärningssystemen för tjänster som Skype Translator och det nya bildigenkännet i OneDrive (där dina bilder nu automatiskt får taggar som "blomma" och "strand") är det inte sätter alla sina ägg i den korgen. "Vi blir mycket smartare när vi kommer till realisationer om när vi ska använda djupa neurala nätverk eller probabilistiska modeller jämfört med andra inlärningstekniker", förklarar Lee, och nästa steg är mer dynamiska maskininlärningssystem som är fria.

"Med traditionella modeller av maskininlärning spenderar du denna enorma insats för att få ett enormt datakorpus och träna systemet offline och distribuera det. Men vi finner i allt fler situationer att modellen inte är tillräckligt bra. Eftersom maskininlärning blir en mer och mer integrerad del av allt vi berör och interagerar med, tror jag att frågorna om underhåll av den intelligensen och fräschheten hos den intelligensen kommer att bli allt viktigare, varnar Lee. Problemet är något han kallar "ML rot".

"Just nu är det vanligtvis maskinlärningssystem som är statiska och deras effektivitet försämras ibland över tiden. Även om arbetet med maskininlärning alltid går framåt, är det inte ett specifikt maskininlärningssystem. Vid något tillfälle måste du samla en massa experter och gå igenom stora ansträngningar att träna och börja på nytt. Det är inte skalbar. Du behöver en process där icke-experter kan behålla och avancera maskininlärningssystem och där maskininlärningssystem är mer mottagliga för kontinuerlig inlärning. "

Bing Predicts-systemet ligger bakom Cortanas sportkunnande och förutsägbara förmågor

Halo rankningar

Cortana är inte det enda Microsoft-systemet som gör mer av denna kontinuerliga dynamiska inlärning. "I Halo använder TrueSkills rankningssystem en probabilistisk modell som är mycket mer dynamisk", berättade han för oss. Din ranking är hur Halo föreslår andra spelare att spela mot. TrueSkill spårar hur bra systemet tycker att varje spelare är, och hur säker det är att kompetensbetyget är rätt. Ju mer du spelar desto säkrare blir systemet om hur exakt det är att rangordna dig, och det måste det göra i bara några spel trots att det finns miljoner människor som spelar.

Samma verktyg kan också vara användbara på jobbet. TrueSkill är byggt med Infer.NET, det samma systemet som Clutter använder för att se vilka e-postmeddelanden du vill se, med beskrivningar som är enkla att skriva - och uppdateras när du vill förbättra systemet.

Clutter lär dig av ditt beteende, och det tar i dag upp till en dag för att ändra hur det behandlar meddelanden som du har dragit tillbaka i din inkorg när det felaktigt trodde att de inte var intressanta. Delve, en Office 365-tjänst som försöker prioritera de dokument och bilagor som personer har delat med dig, kan ta ett par dagar för att hitta nya dokument som du behöver veta om.

Om vi ​​ska lita på dessa system måste de bli snabbare. När allt kommer omkring förväntar vi oss sökmotorerna om nyheter så fort det händer. "Företagen kommer alltmer att komma till den punkt där de vill att intelligenta agenter ska vara medvetna om de allra senaste tankarna, uttalandena, e-postmeddelanden och dokument från alla sina kollegor, hela tiden" förutspår Peter Lee. "Även ett maskininlärningssystem som omskolar en gång om dagen kommer att vara för långsamt och ointelligent."

  • Maskininlärning i molnet: bortom Kinect och Cortana