Thematische Suche

Als thematische Suche (engl. „Topic Search“ oder „Thematic Search“) wird im Bereich der Informationstechnologie eine spezielle Form der semantischen Suche bezeichnet, bei der die Nutzer im Web, in einer digitalen Bibliothek oder in einem lokalen Archiv nach Dokumenten suchen, die sich mit einem bestimmten Thema beschäftigen. (Siehe auch Wikipedia “Thematische Suche“)

Beispielsweise können Benutzer daran interessiert sein, alle Dokumente zum Themenbereich „Herzkrankheiten” (oder „Kriminalität“, „Astronomie“, „Nachkriegszeit“ etc.) zu finden. Suchmaschinen, die rein „stichwortbasiert“ arbeiten, können solche Dokumente nur dann finden, wenn das erwünschte Thema selbst wörtlich als Begriff im Text auftritt. Dies ist jedoch oft nicht der Fall: viele interessante Texte behandeln einen speziellen Bereich oder Teilaspekt des betrachteten Themas, ohne dieses explizit zu nennen. So liefert ein Fachartikel über Vorhofflimmern interessante Informationen zu den Themen „Gesundheit“ oder „Herzkrankheiten“, auch wenn diese Wörter selbst im Text nicht auftreten. Ähnlich gehört ein Bericht über Galaxien zum Themenbereich „Astronomie”, auch wenn dieser Begriff nicht erwähnt ist. Übliche Volltext-Suchmaschinen sind nicht in der Lage, automatisiert Stichwörter dazugehörigen Themen zuzuordnen. Viele themenrelevante Dokumente werden darum schlicht nicht gefunden. Bessere Möglichkeiten bieten spezielle Suchtechniken und -Umgebungen, die thematische Zusammenhänge zwischen unterschiedlichen Begriffen systematisch erfassen und bei der Beschreibung von Dokumentinhalten im Suchindex und bei der Beantwortung von Nutzeranfragen mit berücksichtigen.


Die thematische Suche überträgt die durch Systematiken und Kataloge geprägte traditionelle Bibliothekssuche auf die computergesteuerte Welt digitaler Archive, Bibliotheken, Foren und Plattformen und erweitert und bereichert diese mit neuen Interaktionsformen. Fast alle Formen der Recherche in elektronischen Textbeständen, die über eine reine Stichwortsuche hinausgehen, stellen eine Form der thematischen Suche dar, wobei eine Kombination mit stichwortbasierter Suche durchaus sinnvoll sein kann. Beispielsweise mag es für einen Konzern interessant sein, alle Meldungen zum Themenbereich „Umwelt“ zu finden, in denen er erwähnt ist. Eine politische Partei könnte sich dafür interessieren, in welchen Presseartikeln zum Thema „Internet“, „Wirtschaft“ oder „Sozialbereich“ sie genannt wurde, und welche Artikel zum selben Themenbereich andere Parteien erwähnen. Ist der Zusammenhang zwischen Dokumenten und den dort auftretenden Themen in einer Suchmaschine elektronisch erfasst, so kann den Nutzern ein Überblick angeboten werden, welche Themen mit welcher Relevanz im erfassten Dokumentenbestand auftreten, interessante Dokumente können dann durch Navigation in Themenhierarchien gefunden werden. Eine Spezialform dieses visuellen thematischen Zugriffs stellen thematische „Tag Clouds“ (s.u.) dar. Sind die Meldungen oder Dokumente – wie bei Nachrichtenkollektionen – überdies mit Zeitstempeln versehen, so kann auch der zeitliche Verlauf der Wichtigkeit der Themen dargestellt werden. Je mehr im Hinblick auf die Nutzerinteressen die Gewinnung eines Überblicks, die Analyse vorhandener Themen unter verschiedenen Blickwinkeln und das Erkennen von Beziehungen zwischen Themen, unterschiedlichen Dokumenten und Quellen in den Vordergrund rücken, desto weniger stellt die Interaktion eine „Suche“ im eigentlichen Sinn dar, allgemeiner kann man daher von einem „thematischen Zugriff“ auf Inhalte sprechen.

Thematische Verschlagwortung, Tagging und Begriffswolken

Um eine thematische Suche zu ermöglichen, werden Beiträge und Artikel in vielen Internetforen manuell nach Themen verschlagwortet und mit Tags versehen. Beim „Social Tagging” vergeben die Benutzer selbst die Tags. Oft werden den Nutzern zur visuellen Navigation im Dokumentenbestand dann „Tag Clouds” präsentiert, die häufig vergebene Themen anzeigen. Das Anklicken eines Themas führt dann auf relevante Dokumente. Sofern alle Dokumente mit einer ausreichenden Anzahl qualitativ guter Tags versehen sind, ergibt sich dadurch eine interessante und intuitiv leicht verständliche Form der thematischen Suche. In der Praxis erweist sich die manuelle Verschlagwortung aber auch oft als unzureichend, da viele Dokumente ungetaggt bleiben. Werden dennoch Tag Clouds eingesetzt, bleibt das Ergebnis meist hinter den Erwartungen zurück.

Um von manuell vergebenen Labels unabhängig zu sein und alle Texte mitzuberücksichtigen, stellen primitivere Arten von Begriffswolke lediglich die häufigsten oder auffallendsten Begriffe der zugrundeliegenden Textsammlung dar. Hierbei werden dann allerdings nur Begriffe erfasst, die wörtlich im Text auftreten. Unterschiedliche Begriffe, die häufig gemeinsam auftreten, werden in den Wolken näher zueinander platziert. Das hierdurch vorgespielte „Weltwissen”, das den Zufälligkeiten der Dokumentkollektion entspringt, entpuppt sich bei näherer Betrachtungsweise jedoch oft als fragwürdig.

Der thematische Zugang zu Archiven und Dokumentbeständen – Grundprinzip und erweiterte Recherchemöglichkeiten

Großarchive unterschiedlicher Einrichtungen ebenso wie Presse, Bibliotheken und Verlage stehen derzeit vor der Aufgabe, umfassende Dokumentbestände dem internen oder externen Publikum im Internet zugänglich zu machen. Gerade im Anblick einer ständig wachsenden Menge von Dokumenten, die in elektronischer textueller Form vorliegen, wird immer deutlicher, dass die traditionelle Volltextsuche keinen zufriedenstellenden Zugriff auf Dokumente ermöglicht, da sie kein Bild des Archivs und der auftretenden Themenbereich vermittelt und den Benutzer bei der Auswahl von Suchbegriffen alleine lässt. Als Gegenentwurf stellen wir den thematischen Zugriff auf Archive vor. Bei diesem Ansatz wird unter Einsatz einer Themenhierarchie nach einer speziellen Form der automatischen Indexierung dem Benutzer ein echter  Überblick über das Archiv gegeben, in welchem allgemeine und spezielle Themen des Archivs mit ihrem Gewicht verzeichnet sind. Der Benutzer kann damit im Themenverzeichnis navigieren, um zu interessanten Dokumenten zu gelangen. Die Stärke des Ansatzes beruht auch auf einer ganzen Reihe weiterer interessanter Interaktionsformen, die dem Benutzer zur Verfügung stehen. In dieser Arbeit stellen wir die Grundprinzipien des thematischen Zugangs sowie nützliche erweiterte Recherchemöglichkeiten vor.

Download: White Paper

Ziel des White Paper ist es, die Grundzüge des thematischen Zugangs sowie die sich ergebenden erweiterten Recherchemöglichkeiten allgemeinverständlich und ohne vertieften wissenschaftlichen Hintergrund darzustellen.

Print Friendly, PDF & Email