Hochschule für Technik Rapperswil HSR (FH Ostschweiz), Abteilung Informatik

Studienarbeit Sommersemester 2004

Intelligenter fachspezifischer Spider

Betreuer:

Prof. S.F. Keller, HSR

Partner (Firma oder Verwaltung), externer Betreuter:

Es bestehen Kontakte mit Hochschulinstituten und
Firmen, die noch konkretisiert werden müssen

Einführung

Fachspezifische Suchmaschinen und Suchverfahren sind hochaktuelle Forschungsthemen aus dem Fachbereich Informationssysteme. Diese Suchverfahren sollen zunächst evaluiert werden. Anschliessend sollen verbesserte Verfahren, insbesondere mit maschinellem Lernen, vorgeschlagen und prototypisch implementiert werden. Als Basis dazu dient der im Aufbau befindliche Prototyp, Geometa.info, der mit der Suchmaschine Lucene implementiert ist.

Das Ziel der Spider-Komponente ist es, möglichst viele Seiten zu finden, die mit einem fachspezifischen Thema übereinstimmen. Zu diesem Thema ist ein bestimmtes Wissen in Form von Thesauren und Sprachübersetzungen vorgegeben. Für die Übereinstimmung spielt das Relevanzmass eine zentrale Rolle. Dessen Erkennung geschieht in verschiedenen Stufen: Sprache erkennen, mittels Thesauren Ähnlichkeiten messen, etc.; dass dies auch mit interaktiven Mitteln unterstützt werden kann, ist eine zusätzliche Option als Erweiterung der Abfrage-Komponente.

Weitere Fragestellungen ergeben sich bei der Vorbesprechung der Arbeit. Die Aufgabe könnte voraussichtlich auch noch aufgrund der externen Partner angepasst werden.

Aufgabenstellung und erwartete Resultate

Erwartete Resultate:

Die Dokumentation und die Projektrealisierung erfolgt gemäss den Richtlinien und Informationen über Studienarbeiten (vgl. "Organisatorisches und Administratives zu Studien-/Diplomarbeiten" auf www.i.hsr.ch/waco2 und ita.hsr.ch) sowie den Angaben des betreuenden Dozenten (www.integis.ch).

Randbedingungen und Infrastruktur

Quellenangaben

Letzte Änderung: 06. Februar 2004