Den tysta revolutionen som gör telefonen smartare än du på fotografering
NyheterKonstgjord intelligens (AI) gör sin väg till nästan alla aspekter av våra liv. Det är våra telefoner, medan många av oss har låtit det komma in i våra hem i form av röstassistenter i smarta högtalare.
Det är bara de mest synliga implementeringarna av AI, och under de kommande åren kommer det att användas alltmer bakom kulisserna, i kuggarna som kommer att hålla våra allt smartare städer springande.
Det är dock i bild och fotografi att du får se AI som jobbar med sin magi tydligt. Låt oss titta på några av de bästa exemplen på denna nya teknik som aktivt förbättrar fotograferingen.
Tunn AI-kamera
Den vanligaste versionen av fotografisk AI idag finns i smartphones. Många nya och senaste modeller har AI-assisterade funktioner som använder olika typer av scen och objektigenkänning för att förbättra dina foton.
Olika telefonsvarare har olika tillvägagångssätt och olika egenskaper, dock med några intressanta avvikelser i förhållningssätten.
Huawei AI
Få företag skriker så högt om AI i telefoner som Huawei - det är en högsta fakturering punkt om du vill köpa en handenhet som Huawei P20 Pro.
Det finns ett separat AI-fotograferingsläge i kamerapappen som i Mate 20 Pro kan känna igen 1 500 olika scener och situationer. Bearbetningen applicerar sedan en färg- och kontrastprofil som passar, för att göra dina bilder verkligen pop.
Ett ultra-naturligt utseende är inte syftet här. Huawei AI fotografering maxes-out färgmättnad för större påverkan, inte maximal trovärdighet. Resultatet går dock bra på sociala medier.
Apple Portrait Lighting
Porträttbelysning är en av Apples AI-assisterade fotofunktioner och emulerar effekten av olika typer av studiobelysning. Några andra telefoner, som Huawei P20 Pro, har också haft en spricka på detta koncept, men Apple har levererat den bästa implementeringen hittills.
Så varför är det AI? Porträttbelysning innebär att du skapar en 3D-djupskarta över motivets ansikte och sedan applicerar ett 3D-filter för att lägga till ljuseffekter som följer konturerna av deras funktioner, som om de tänds av en studiobelysning.
Apple kallar det en “studio i fickan”. Det kommer förstås inte att ersätta en studio, men resultaten kan vara överraskande effektiva.
Google Lens
Google är den mest produktiva utvecklaren av AI-teknik, och flera av kamerans lägen på sina telefoner flirta med AI-liknande behandling.
Pixel 3: s Top Shot, till exempel, är ett brastläge som tar en serie bilder och väljer sedan de som den tycker är bäst. Photobooth gör samma sak, men för bilder av dig och dina vänner som drar ansikten. Eller ler.
Google Lens är dock en mer dynamisk demo av AI. Det är ett kameramodus som klickar på Googles bild- och textigenkänning och sätter dem i ett verkligt sammanhang. Du kan peka din telefon på produkter, landmärken och till och med tapeter, och Lens kommer att försöka hitta dem online och ge relevant information.
Google Foton
Det finns en mer praktisk och nästan dold användning för det neurala nätverket som går in i Googles bildigenkänning - Google Foton, och i synnerhet sökfunktionen.
Överst i appen Google Foton ser du nu en sökfält. Du kan skriva in objekt eller teman i det och Googles AI-algoritmer sparar in för att hitta relevanta bilder. Testa. "Hundar", "jul" och till och med "ost" kommer att returnera relevanta bilder, om de är i ditt fotobibliotek.
Foton spelar också curator, väljer bilder för att bli animerade GIF, för att förbättra med filter och sy i panorama. Allt detta bygger på en avancerad typ av bildigenkänning som i vissa kretsar anses vara AI.
Nvidia image restaurering
Vissa implementeringar av AI kan känna sig vanliga nästan direkt, men det finns vissa tillämpningar i verken som känner sig riktigt futuristiska.
Nvidias bildförbättringstekniker är några av de mest imponerande verkliga visuella demonstrationerna av kontextualiserad AI, och det finns tre sätt att implementera tekniken som lovar stora saker.
Den första är "de-noising" av bilder. Den använder en djupt lärande-baserad metod för att återställa bilddata som är förmörkad av ljud, eller till och med text. Det här är faktiskt en ren och mycket avancerad version av vilka kamerakameror som gör när du tar bort bildstörning från ett foto.
Det informeras dock av ett neuralt nätverk utbildat genom exponering för massor av andra bilder, vilket hjälper det att känna igen mönster och interpolera data som saknas från källbilden.
Det finns en mer dramatisk demonstration av kraften hos Nvidias neurala nätverk, i form av AI i målning. I demo tas delar av en källbild bort och återtecknas, den saknade informationen interpoleras genom, återigen det bildtrevade neurala nätverket.
Slutligen kan Nvidia konvertera 30fps eller 60fps video till slow-mo 480fps, 16 gånger långsammare än standard. Som med in-painting tekniken används AI för att skapa bilddata som helt enkelt inte finns i källmaterialet.
TV-apparater har faktiskt jämförbara interpolerade ramlägen. Nvidias AI kan emellertid hantera tygflödet mycket bättre, för mer naturliga resultat.
Iconem
Nuvarande AI är i stor utsträckning mycket liten, inte enormt "intelligent", beräkningar som, när de appliceras i stor skala, ger fantastiska resultat
Den här beskrivningen är verkligen sant för Iconem, ett arvstart som använder Microsoft-utvecklat AI.
Iconems mål är att spela in bilder av viktiga historiska platser som hotas av krig, erosion eller andra slags skador, vilket skapar en livliknande rekord av deras nuvarande tillstånd.
AI: s jobb här är att kartlägga tiotusentals bilder på en skannad 3D-modell av ett arv, med hjälp av droner för att fånga de önskade bilderna. Iconem besöker platser som är svåra att komma åt eller farliga, till exempel den stora Umayyadmoskén i Aleppo i krigshärna Syrien.
Du kan se några av Iconems skanningar på YouTube, och dess skanningar av Aleppo har gjorts till en app, tillgänglig från Google Play..
Google BigGAN
Du kanske känner till Google för sin sökmotor och Android mobila operativsystem, men det utvecklar också berg av innovativ ny teknik genom sina Labs-program och offshoots.
DeepMind är Google moderbolag Alfabetets AI-division, och BigGAN är ett av de senaste projekten - utformad av en praktikant, inte mindre. Detta är en del av AI-programvara som genererar bilder med hjälp av algoritmer.
Först genereras en bild algoritmiskt från ett slumptal. Bilden jämförs sedan med en "riktig" bild för att analysera hur nära den är. En ny version av bilden skapas sedan, i ett försök att göra sina egenskaper närmare den riktiga referensen.
Du kan kolla in några av BigGANs resultat online. Det kan skapa några otroligt realistiska naturliga strukturer, som gräs och trädlinjer. Men BigGAN-genererade mänskliga ansikten ser fortfarande ut som saker av Francis Bacon's mardrömmar.
- Brakt till dig i samarbete med Nokia och Android One, vilket hjälper dig att göra mer av din smartphone. Du kan lära dig mer om ny Nokia 7.1 här, och du hittar mer bra råd om att få ut det mesta av din telefon här.