Proof of Concept einer Suchlösung

Um die sehr heterogene Web-Landschaft der Universität Magdeburg durchsuchbar zu machen, hat die Otto-von-Guericke-Univesität Magdeburg [1] in einer Public-Private Partnership mit initOS [2] einen Prototypen [3] basierend auf Open Source Technologie wie folgt aufgebaut.

Herzstück der Suche ist ein Apache Solr-Server [4], der den Suchindex verwaltet und Suchanfragen beantwortet. Um den Suchindex zu befüllen verwenden wir einen Crawler, der auf Apache Nutch [5] aufbaut. Auf Grund der Heterogenität der zu indizierenden Seiten erscheint uns ein Crawl-Ansatz geeigneter als Lösungen, die Daten direkt aus der Datenbank des CMS lesen (sofern überhaupt vorhanden).

Auf der Stufe des Crawlers haben wir einige grobe Anpassungen vorgenommen, um den Index nicht durch redundante Suchinhalte zu verwässern. Dies betrifft zum Beispiel News-Inhalte, die auf allen Unterseiten anzeigt werden. Für das Nutzerinterface und die Darstellung der Suchergebnisse verwenden wir die JavaScript-Library AJAX Solr [6]. Unser Prototyp bietet beispielhaft einige Facettierungsmöglichkeiten nach Metadaten wie dem Erstellungsdatum, sowohl nach Monat als auch nach Semester gruppierbar.

[1] http://www.ovgu.de
[2] http://blog.initos.com
[3] http://178.63.162.132/ajax-solr/examples/otto/index.html
[4] http://lucene.apache.org/solr/
[5] http://nutch.apache.org/
[6] https://github.com/evolvingweb/ajax-solr

Letzte Änderung: 11.09.2013 - Ansprechpartner: Werner Liebscher