Components

Microsoft Research ontwikkelt kaartzoekopdracht voor ongestructureerde gegevens

Enrich Search Results with JSON-LD Markup through Google Tag Manager

Enrich Search Results with JSON-LD Markup through Google Tag Manager
Anonim

Microsoft Research India heeft technologie ontwikkeld die gebruikers in staat stelt om kaarten te doorzoeken, zelfs in landen als India, waar de adressen vaak niet gestructureerd zijn.

Het onderzoeksproject heet Robust Location Search en een prototype van de technologie is al klaar, zei B. Ashok, directeur van geavanceerde ontwikkeling en prototyping bij Microsoft Research India, op woensdag. Hoewel de technologie in India is ontwikkeld, is deze generiek en ontworpen om te worden gebruikt in elk land met ongestructureerde adressen.

In plaats van naar regels in het adres te zoeken, gebruikt het algoritme onderliggende geospatiale gegevens om te achterhalen welke locatie de termen in de adresstring komen overeen met, zei Ashok.

[Nader lezen: uw nieuwe pc heeft deze 15 gratis, uitstekende programma's nodig]

In landen als India wordt een locatie vaak in een adres beschreven door zijn ruimtelijke relatie zoals in de buurt van of tegenover een oriëntatiepunt, in plaats van een formele, hiërarchische adresstructuur bestaande uit een straatnummer, straatnaam, stad, staat en postcode.

Heel vaak kan dezelfde locatie een ander adres hebben of een verwijzing naar een ander oriëntatiepunt, zei Ashok. De lokale postbode weet brieven af ​​te leveren op basis van deze ongestructureerde adressen, maar dergelijke ongestructureerde gegevens vormen een uitdaging voor software die wordt gebruikt voor kaartonderzoeken.

Commerciële kaartdiensten, waaronder die van Google, Yahoo en Microsoft, waren oorspronkelijk ontworpen voor landen zoals de VS, die gestructureerde adressen heeft, maar die misschien niet zo goed zijn bij het werken aan ongestructureerde adressen, zei Ashok.

Het onderzoekslaboratorium in Bangalore is in besprekingen om het nieuwe algoritme op te nemen in Windows Live Local van Microsoft.

Microsoft Research India gebruikt een technologie, de zogenaamde spatial intersection, om verschillende termen in de adresreeks te analyseren om de locatie voor een ongestructureerd adres te achterhalen, zoals '2nd Cross, 10th Main, Sadashivnagar, Bangalore'.

De software begint met termen als "2nd Cross" en "10th Main" gebruiken vervolgens de straatkruisinginformatie die 2nd Cross kruist met 10th Main om alle instanties op de kaart te identificeren waar het 2nd Cross int ersecten met 10e Main, Ashok gezegd. De volgende termijn, Sadashivnagar, kruist met de verzamelde informatie over kruispunten van 2nd Cross en 10th Main om te komen op de locatie waarnaar het adres verwijst, voegde hij eraan toe.

De software zal op de locatie aankomen, ongeacht de volgorde waarin de termen worden gepresenteerd in het adres en ook wanneer dezelfde locatie een aantal alias-adressen heeft, zei Ashok. Het kan ook door gebruikers in meerdere talen worden gebruikt. Een zoekopdracht in het Hindi, een Indiase taal, zou bijvoorbeeld vertaald kunnen worden naar de taal van de kaart en de zoekopdracht kan op basis van deze voorwaarden worden uitgevoerd, volgens Ashok.

Termen zoals 'in de buurt' die niet in overeenstemming met de gegevens op de kaart worden ook weggegooid, Ashok zei.