AbstractsComputer Science

Dynamic Query Completion Through Search Result Clustering; Dynamiska sökordsförslag genom klustring av sökresultat

by Amelia Andersson




Institution: KTH Royal Institute of Technology
Department:
Year: 2015
Keywords: Natural Sciences; Computer and Information Science; Computer Science; Naturvetenskap; Data- och informationsvetenskap; Datavetenskap (datalogi); Master of Science in Engineering - Computer Science and Technology; Civilingenjörsexamen - Datateknik; Datalogi; Computer Science
Record ID: 1343963
Full text PDF: http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-166382


Abstract

Query completion is a feature employed by most modernsearch engines. These completions can be derived by different means. The most popular algorithm ranks completions by the frequency with which it appears in a database of old query logs. This project aims to investigate a new method for finding completions: namely through clustering search results and extracting terms from the clusters. To test the capabilities of this method, the project implemented the back-end to a search system, which includes the search result clustering algorithm Lingo. The system uses the output cluster labels as query completions. Two experiments were conducted, one for Informational queries and one for Navigational queries, each comparing the system to Apache Solr’s Suggester component. For Informational queries, a new way of scoring query completions was invented. The experiments showed that clustering performedbetter than the Suggester component for Informational queries, the results were inconclusive for Navigational queries. ; Sökordsförslag är en funktion som erbjuds av de flesta moderna sökmotorer. Dessa sökordförslag kan framkallas på olika sätt. Den metod som används mest ordnar sina sökordsförslag efter antalet gånger förslagen förekommer i en databas av gamla sökordsloggar. Målet med detta projekt är att undersöka en ny metod för att hitta sökordsförslag, nämligen genom att klustra sökresultat och extrahera termer från klustren. För att testa möjlighetetrna med denna metod implementerade vi ett bakomliggande system, vilket inkluderade sökresultatsklustringsalgoritmen Lingo. De resulterande klusterrubrikerna från Lingo användes som sökordsförslag. Två experiment utfördes, en för Informativa sökningar och en för Navigerande sökningar. I båda experimenten jämfördes systemet med Apache Solr’s Suggester komponent. Inför experimentet för Informativa sökningar kom vi fram till ett helt nytt sätt att poängsätta sökordsförslag. Resultaten från experimenten visade att klustringsmetoden presterade bättre än Suggester komponenten för Informativa sökningar. Det gick inte att dra några slutsatser från resultaten av experimentet för Navigerande sökningar.