Förhöjda verkligheten hyses nästa stora sak på mobila enheter, allt från spel till att kontrollera huspriserna. peka på en smartphone som kör Yelp på en stadsgata och Monocle-funktionen ger dig recensioner och betyg för företagen där.

Google Goggles kan göra detsamma, men Goggles produktchef Shailesh Nalawadi är inte det som är intresserad av AR: "Vi ser inte riktigt oss själva som jobbar med ökad verklighet, vi jobbar med visuell sökning."

Det är så som människor arbetar, pekar han på, så det är bara meningsfullt att söka på jobbet visuellt. "80% av informationen förbrukas visuellt och inte genom någon av de andra sinnena. Varför är det att du översätter och transkriberar det du ser på ord?"

Även om Nalawadi är realistiskt vad du kan göra med en telefonkamera idag ("Bildigenkänning är riktigt svårt men det finns ingen brist på Hollywood-filmer som visar detta som redan uppnåtts!), Tror han inte att vi behöver platsmedvetna glasögon eller De digitala kontaktlinserna beräknas vara till försäljning senast 2020; som namnet Goggle föreslår, är telefonen tittaren.

"Du har dessa väldigt snabba datorer som vi alla bär runt i våra fickor, som har möjligheter som du inte skulle ha haft på stationära datorer för bara fem eller tio år sedan", säger han.

"Naturligtvis, oavsett hur kraftfull dessa enheter är, har datorvision ett sätt att ta upp alla CPU-cykler du har så Goggles tar hand om det tunga lyfter över i molnet."

Det fungerar bara på grund av mobila bredbandsanslutningar och medan Nalawadi kallar den tre till åtta sekunderigenkänningstiden som skyddsglasögon brukar ta "ganska fenomenal" erkänner han "vi inser också att det inte räcker för att människors uppmärksamhetstider är riktigt korta."

Långt från färdigt

Skyddsglasögon är frukten av tre till fem års forskning och det är långt ifrån färdigt, säger han.

"Vi kämpade och vi byggde den här saken där du kan flytta din kamera, peka på det på ett objekt och få det att komma tillbaka och berätta vad det är som det ser på. Verkligheten är att vi är väldigt långt ifrån den staten".

Vad Nalawadi vill göra är mycket mer ambitiöst än att bara lägga information om var du är på skärmen. han vill ha visuell sökning som kan hantera hela världen.

"För det första, förklarar han," det handlar om att utöka erkännandekapaciteten hos våra datorer. Just nu har vi en mycket smal uppsättning tiotals miljoner objekt som vi känner igen men världen är mycket större än tiotals miljoner objekt och det är en fenomenal försök att försöka få den här informationen i vår databas och känna igen den. "

SE OCH SÖK: Glasögon behandlar landmärken som logotyper och streckkoder; det berättar vad du tittar på och ger resultat

Med tiden kommer Goggles att känna igen växter och schackspel, och snart kommer det att översätta text på saker du ser.

Göra databas med bilder Goggles kan matcha större är bara början. Det finns det grundläggande sökproblemet: "Vi spenderar mycket tid på sökkvalitet, när det är en lyckad match, vilka är de relevanta resultaten som behöver komma tillbaka?"

Ett bredare problem

Men Nalawadi vill också ta itu med det mycket bredare problemet. "För närvarande finns det en uppfattning om att förstärkt verklighet handlar om att visa kuratiserade geodata. Jag tror att det finns vägar mer information i den scenen och du behöver verkligen bildigenkänning överlagd ovanför detta för att ge mer information om vad som händer runt omkring dig. "

Han tycker också att bildigenkänning kommer att göra förstärkt verklighetserfarenhet bättre än den ungefärliga positionen dagens smarttelefoner kan beräkna.