GOOGLE CLOUD VISION: SE VÄRLDEN MED GOOGLEÖGON

En liten robot, tillverkad av inte mycket mer än ett par hjul och fyra sladdar, kör fram och tillbaka på ett bord. Den kör förbi personerna som sitter runt den, och stannar upp vid en person som sitter och ler och säger med sin metalliska röst: 'Du verkar nöjd: berätta varför!'. Om personen däremot ser sur ut, frågar den: 'Du verkar ledsen: vad beror det på?'.

EMPATHYBOT: ROBOTEN SOM TOLKAR DINA KÄNSLOUTTRYCK

Hur kan en så rudimentär anordning känna av en mänsklig känsla? Var döljer sig den kraftfulla processorn och de enorma databaser som krävs för denna uppgift?

Molnets kraft

I själva verket finns denna ofantliga datorkraft inte i maskinen. Den befinner sig i ett moln i Google, en uppsättning fjärrdatorer som företaget gör tillgängliga för användare och utvecklare.

Den empatiska roboten använder molnkraften för att känna av ansiktsuttryck. Detta är möjligt tack vare en av de mest innovativa applikationerna från teknikjätten i Mountain View: Google Cloud Vision.

Denna produkt ger programmerare och hackers möjligheten att för sina projekt utnyttja potentialen hos Google Images algoritmer. Möjligheterna genom Googles ögon är oändliga: från förmågan att lista ut en hundras till att räkna ut hur många personer det finns på ett klassfoto; från att skilja en pumpa från en boll och peka ut sjön på ett gammalt foto.

Bilder i rörelse

Google Cloud Vision har bara funnits i ett år, men redan i mars kunde Google presentera en ytterligare utveckling: Google Cloud Video Intelligence. Systemet applicerar vissa av Visions funktioner till rörliga bilder. På detta sätt växer möjligheterna att söka efter audiovisuellt innehåll enormt.

Det är inte en tillfällighet att ett av de första företagen att intressera sig för Google Cloud Vision var AeroSense. Detta drönarbolag registrerar tusentals bilder under varje enskild flygning. Att manuellt gå igenom alla dessa bilder för att identifiera de fotograferade objekten är oöverkomligt. Det är i situationer som denna som Googles automatiserade identifiering blir oumbärlig.

Algoritmer som lär sig av data

Hemligheten bakom Google Cloud Vision ligger i algoritmerna i “machine learning” som gjort sökmotorn så framgångsrik. Google använder den enorma mängden data som de har till sitt förfogande för att utveckla sina algoritmer.

När vi söker på ordet 'hund', visar Google Images miljontals bilder på hundar. Detta inträffar inte för att algoritmen känner till den platonska idén av en hund, utan för att den har lärt sig att känna igen detta djur genom att jämföra en enorm mängd bilder.

Företaget har gett användarna tillgång till en simulator, som gör det möjligt att upptäcka den enorma bildbanken och förstå funktionen hos Google Cloud Vision. Företaget i Mountain View är inte det enda som hoppat på detta tåg... Amazon, har t.ex. lanserat en produkt som konkurrerar om samma marknad: Amazon Rekognition.

Text och bilder

De datorseende applikationerna har häpnadsväckande förmågor. I följande video använder en robot som tagits fram med Rasperry Pi Google Cloud Vision för att klassificera Halloweengodis som mer eller mindre goda. Programmet kan känna igen märket på godisbitarna tack vare sin algoritms förmåga att extrahera text från bilder.

GODISKLASSIFICERANDE ROBOT

Google Cloud Vision kan tolka bilder på många olika sätt:

För hackers och forskare

Google Cloud Vision öppnar upp för häpnadsväckande hackingmöjligheter. I kombination med Google Translate kan man t.ex. lära sig hur man säger glas på kinesiska, endast genom att zooma in ett glas med mobilen.

SAKERS NAMN

Om programvaran istället kombineras i samarbete med olika modeexperter, kan du få ett system som automatiskt klassificerar vilken urbana tillhörighet en förbipasserande med en excentrisk look har.

STILIDENTIFIERING

Disney har använt programmet i en augmented reality-app som gör att draken från deras senaste film plötsligt sitter på din soffa. Forskaren Kalev Leetaru, har istället använt det för att analysera de vanligaste situationerna i ett dussintals valkampanjsreklamer eller de platser som blivit mest fotograferade av internationell press.

Kanske är det du som gör nästa app, eftersom Googles öga kommer att ändra även din världsbild.

License: Creative Commons Attribution No Derivatives 4.0

You might also be interested in...