Aktuelle wissenschaftliche Experimente an der Ludwig-Maximilians-Universität München haben bestätigt, dass mit der TopicZoom-Technologie bei der Suche nach ähnlichen Dokumenten und beim thematischen Clustern von Dokumentenkollektionen bessere Ergebnisse erzielt werden als mit den üblichen Standardverfahren. In einer Bachelorarbeit wurden hierzu Dokumentenclusterverfahren verglichen, die einerseits auf einer im Information Retrieval üblichen “Bag-of-Word”-Repräsentation der Dokumente beruhen, andererseits auf einer Vektorrepräsentation, wie sie sich aus der TopicZoom-Verschlagwortung der Dokumente ergibt. Das Ergebnis der Untersuchungen zeigt, dass die TopicZoom-Repräsentation bei ansonsten identischen Verfahren zu besseren Clusterergebnissen führt.

Interessierte können die Bachelorarbeit hier downloaden.


Thanks to: unsplash-logo Brannon Naito

Print Friendly, PDF & Email