Ubisofts AI lip-sync tech kan ha applikationer bortom spel
NyheterVi är säkra på att vi inte är ensamma när vi säger att när någon nämner AI i spel, hoppas våra sinnen omedelbart till NPC och fiender. deras rörelser, deras reaktioner, deras, väl intelligens. Allt är en del av ett spelets AI.
Men som det visar sig är AI så mycket mer än i spel. Efter en konversation med Yves Jacques, chefen för Ubisofts La Forge-teknikforskningsprojekt, fick vi en mycket bättre uppfattning om hur AI används för att göra spelutvecklingen snabbare och billigare, liksom att förbättra den underjordiska kvaliteten på spelen vi spelar.
Vi bad Jacquier att berätta om några av prototyperna som utvecklas och används av Ubisoft och La Forge för tillfället. Ett AI-driven projekt han var särskilt glada att diskutera var Sound Matching. Detta berättar han, ”tar wav-filen direkt från de inspelade skådespelarna och driver ansiktsanimationen” av in-game-tecken.
Förbättrad ansiktsanimering
Utan AI finns det några sätt att göra ansiktsanimation, förklarar Jacquier. Ett sätt är manuellt, vars process kan också accelereras med hjälp av rörelseinspelning, och en annan är att bryta ner text i fonem eller tydliga ljudenheter. Med hjälp av dessa kan du skapa olika läpprörelser, spela in röstspelare som talar och kartlägga sedan rösten med fonemet och animationens olika former.
Bortsett från att det låter helt ansträngande, säger Jacquier oss ett stort problem med att använda den senare metoden är att den huvudsakligen endast är användbar för engelska som “du måste ha stora databaser för att omvandla text till fonem och inte alla är tillförlitliga”. Ännu mer än så, ”du kan inte förvandla saker som skäll och hosta, saker som så”.
“Vi får en ökad kvalitet, en ökad känsla av nedsänkning för spelaren och det har minskat de förväntade lokaliserade animeringskostnaderna med cirka 30%“
Yves Jacquier
Denna begränsning skapar några problem när du försöker lokalisera spel till andra språk än engelska: “vi hade mycket arbete att göra när vi ville lokalisera våra spel eftersom vi spelar in vår baslinje på engelska, då spelar vi in alla andra språk och då måste vi läsa synkronisera för att synkronisera varje mening genom den engelska animationen”.
Detta gör inte bara det här “skapa en lägre kvalitetserfarenhet, en lägre känsla av nedsänkning om du spelar på ett annat språk än engelska”, det kostar också mycket sedan du är “frågar folk att spendera mycket tid manuellt anpassa och synkronisera främmande meningar med engelsk animering”.
När vi hör om hur mycket arbete som måste gå in i något som uppenbart enkelt som rörelsen av en avatarens läppar, är vi inte förvånad över att Jacquier är så upphetsad av förmågan hos hans Sound Matching AI.
Lägre kostnad, högre kvalitet
“Det fungerar med ljudvågor,” Han säger, vilket betyder det “fungerar på vilket språk som helst och det skapar läppanimationen direkt”. Vad detta resulterar i är “en ökad kvalitet, en ökad känsla av nedsänkning för spelaren och det har minskat de förväntade lokaliserade animeringskostnaderna med cirka 30%”.
När AI tillåter dig att göra så betydande besparingar i både tid och pengar under utvecklingsprocessen betyder det, säger Jacquier, “vi kan sätta [dessa ansträngningar] någon annanstans för att förbättra spelets kvalitet”.
Vad vi får är då mycket mer exakta ansiktsrörelser när speltecken talar. Vi har alla märkt när du spelar spel där det finns ögonblick när det som en karaktär säger inte matchar deras läpprörelser alls. Det är inte spelförstöring på något sätt, och det är bara irriterande på det sättet att en lite off-center målning kan vara. Men det har en inverkan på nedsänkning som Ubisoft skulle vilja förhindra.
Förgrena sig till andra fält
Det som är väldigt intressant är att arbetet Ubisoft gör med denna prototyp används också av andra forskare inom andra områden, nämligen medicin, för att de har funnit att de delar samma utmaningar.
“jag visste inte,” Jacquier fortsätter, “men i medicin använder de avatarer för att behandla patienter med schizofreni eller ångest”. Jacquier var snabb att berätta för oss att han inte alls är en specialist i området, men det är hans förståelse att videospelliknande avatarer används för att “hjälpa patienter att konfrontera sina egna röster i schizofreni eller rädsla för ångest”.
Där fältet medicin och spel korsar här är det i deras behov av avatarer att ha trovärdig ansiktsanimation. “Om du börjar inte tro på en situation börjar inte tro på att du faktiskt pratar med avataren som något verkligt, kommer behandlingen att misslyckas,” Jacquier tillägger.
”Om du börjar inte tro på en situation börjar inte tro på att du faktiskt pratar med avataren som något verkligt, kommer behandlingen att misslyckas”
Yves Jacquier
En stor del av behandlingen handlar om att konversera med en avatar, vilket innebär att patienterna kommer att fokusera på läpprörelsen, så medicinska forskare letar efter den här delen av ansiktet i synnerhet för att vara exakt.
“När vi pratar med någon, går mycket vår uppmärksamhet till munnen, speciellt när det finns buller eller du försöker koncentrera dig,” säger Jacquier. ”Så om läpprörelsen berättar dig något annorlunda än vad du hörs så förlorar du personen.”
Han berättar för oss att de som arbetar med behandlingsplaner så här har uttryckt mycket intresse för AI Ubisoft jobbar på, “speciellt Stephane Guay, som är ledande forskning inom mentalvårdsinstitutet som försöker inkludera mer teknik för att hjälpa patienter, inte bara medicin och regelbunden behandling som existerar“.
För närvarande försöker Jacquier och hans team att träna exakt hur de kommer att samarbeta, men det finns ett hopp om att vilken väg de följer kommer att “förbättra våra spel och deras behandling”.
- E3 är världens största utställning för spelindustrin, fylld med de senaste och bästa spel, konsoler och spelhårdvara. TechRadar rapporterar live från Los Angeles hela veckan för att få dig det allra senaste från showgolvet. Gå till vårt dedikerade E3 2018-nav för att se alla nya utgåvor, tillsammans med TechRadars världsklassanalys och köpa råd om nästa år i spel.