Components

Welkom bij Web 3.0: semantische zoekopdrachten

Web 3.0 Explained

Web 3.0 Explained
Anonim

De alomtegenwoordige zoekwoordmodus van de internetzoektechniek staat op het punt om te worden overgenomen door een nieuw soort semantische zoektechnologie, volgens analisten van het onderzoeksbureau Ovum.

Hoewel keyword search de populairste methode blijft, is deze meestal niet correct, waarbij gebruikers soms tot 30.000 hits op een zoekopdracht krijgen en vervolgens een lijst met losjes verwante zoekwoordresultaten doorzoeken om relevante documenten te vinden.

"Dit is waar een nieuw soort zogenaamde semantische technologieën in het frame komt. rangschikkingsalgoritmen zoals Google's PageRank voor het voorspellen van relevantie, semantisch zoeken dipt in de betekenis in taal om uiterst relevante zoekresultaten te produceren, "volgens een rapport gepubliceerd door Ovum-analisten Mike Davis en Madan Sheina.

Opmerkelijke semanti c webaanbieders die door de analisten worden genoemd, omvatten Expert System, Powerset, Yedda, Trovix en Hakia. Volgens de auteurs nam de bekendheid met semantisch zoeken toe toen Microsoft twee semantische zoekbedrijven Powerset en Zoomix ophaalde.

In het geval van Expert System is de toepassing, Cogito genaamd, ontworpen rond de principes van menselijk begrip om inhoud toe te staan begrepen worden op de manier zoals de auteur het bedoeld heeft. Dit is iets dat zoeken op trefwoord negeert.

"Een Google-zoekopdracht naar het woord 'jaguar' zou inhoud rond het dier en de auto oproepen. Semantisch zoeken zou niet alleen naar het trefwoord kijken, maar ook naar andere woorden eromheen als 'jungle' 'of' saloon 'om de twee betekenissen te scheiden, "zeiden de auteurs.

Diepere analyse

Naast semantisch zoeken, zijn er andere vormen, inclusief heuristieken en ontologie, taalkunde en text mining, en statistisch. Expert System beweert echter dat deze benaderingen tekortschieten, waarbij alleen de morfologische en grammaticale aspecten van de analyse worden aangepakt.

Andere zoekmachines raken vaak een bakstenen muur als het gaat om diepgaande analyse. Als een heuristisch gestuurde zoekmachine bijvoorbeeld twee adjectieven in een zin ziet, wast deze deze meestal weg en scoort de zin als neutraal omdat hij geen idee heeft waar de twee afzonderlijke bijvoeglijke naamwoorden naar verwijzen.

Ter vergelijking, semantische zoekacties zien eruit bij beide zinslogica - hoe woorden in een zin op elkaar betrekking hebben - en semantische analyse - de context van sleutelwoorden begrijpen.

Wanneer een term dubbelzinnig is, wat betekent dat het meerdere betekenissen kan hebben, bijvoorbeeld schors, is semantische analyse nodig aan de andere woorden die zich eromheen wikkelen om het zijn ware betekenis en context te geven.

Een lexicale database

De ingenieurs van Expert Systems zeggen dat Cogito een extra stap kan zetten omdat het een semantisch netwerk heeft - een lexicale database dat zorgt voor een kennisrepresentatie van woorddefinities en hun relaties. Het vertaalde het woordenboek van Webster in een in-memory database - bestaande uit 350.000 woorden en 2,8 miljoen relaties.

"Het semantische netwerk van het expertsysteem concentreert zich ook op algemene woorden.Dit is anders dan de meeste ontologische benaderingen die zich bezighouden met het omdraaien van betekenis en context rond gespecialiseerd inhoud, zoals wetenschappelijke termen, en algemene woorden overslaan die 90 procent van alle inhoud bevatten, "aldus de Ovum-auteurs.

Semantisch zoeken is echter nog steeds doorzeefd met" veel theoretische hype maar weinig echte substantie of bewijs dat het werkt beter dan de huidige zoektechnologie.

"Semantische netwerken zijn lastig te bouwen en niet allemaal gelijk. Het is onwaarschijnlijk dat semantische technologieën in staat zullen zijn 100 procent precisie te bieden in hun analyse en resultaten. Bovendien zijn er nog steeds vraagtekens over mogelijk vastzittende prestatieproblemen met semantische zoekopdrachten die meer verwerkingscycli opeten. "