Android

Google: we hebben een doorbraak bereikt in zoeken op afbeeldingen

Zoekhulpmiddelen bij Google Afbeeldingen

Zoekhulpmiddelen bij Google Afbeeldingen
Anonim

Mensen kunnen uitblinken in patroonherkenning, maar computers zijn niet erg slim in het identificeren van afbeeldingen. Onze hersenen kunnen onmiddellijk foto's van beroemde bezienswaardigheden identificeren, zoals het Vrijheidsbeeld of de Grote Muur van China, maar computers hebben meestal geen flauw idee zonder tekst-tags als een spiekbrief.

Dit kan echter een verandering zijn als een Google-onderzoeksproject in "computer vision" pans out. De zoekgigant maandag presenteerde een paper over herkenningspunten op de Computer Vision en Pattern Recognition (CVPR) conferentie in Miami. Met de nieuwe technologie kunnen computers snel een ID.D. afbeeldingen van meer dan 50.000 wereldoriëntatiepunten met een nauwkeurigheid van 80 procent, zegt Google.

Google wijst er snel op dat de patroonherkenningstechnologie nog steeds een onderzoeksproject is en geen nieuwe service. Dat is logisch, want een zoekinstrument dat klopt, slechts 8 van de 10 pogingen is nog niet klaar voor prime time. Toch is het concept best gaaf en zou het een zegen kunnen zijn voor reizigers als Google op een dag de nauwkeurigheidsgraad kan verhogen. De mogelijkheid om een ​​foto van een ongeïdentificeerd oriëntatiepunt te maken en je smartphone of Net-ingeschakelde camera te laten identificeren, zou volgens mij populair zijn. Natuurlijk is er ook het potentieel voor wetenschappelijke en consumentenapplicaties waar nog niemand aan heeft gedacht.

Dus hoe werkt het? Jay Yagnik, hoofd van computer vision-onderzoek van Google, legt uit in een blogpost. De eerste stap is om 40 miljoen GPS-getagde foto's te gebruiken van twee Google-services, Picasa en Panoramio, en online reisgidswebpagina's om een ​​lijst met herkenningspunten samen te stellen. "Vervolgens vonden we kandidaat-afbeeldingen voor elk oriëntatiepunt met behulp van deze bronnen en Google Image Search, die we vervolgens" sneden "met behulp van efficiënte beeldvergelijkende en onbewaakte clusteringstechnieken," schrijft hij.

De laatste stap was het ontwikkelen van een indexeringssysteem voor snelle beeldherkenning. Maar ondanks de slimheid van het project blijft accuraat zoeken naar afbeeldingen lastig. Zoals de onderstaande foto laat zien, kunnen niet-gerelateerde oriëntatiepunten dezelfde architecturale kenmerken delen; ook kan de opname van een enorme banner of vlag leiden tot een valse match.

Hopelijk zal het onderzoeksproject van Google het zoeken naar afbeeldingen verbeteren, wat vandaag te veel afhankelijk is van taggen. De volgende stap zou zijn om een ​​manier te vinden om het ontelbare aantal niet-landmark-afbeeldingen te identificeren, maar die taak lijkt oneindig uitdagender.