Die Antwort auf einen Request gegen die TopicZoom WebTags API erfolgt in XML in UTF-8.

Das Root-Tag des XML Tokens ist ein TZTopicSet.

Das TZTopicSet enthält mehrere Attribute:

  1. den TopicZoom XML Namespace (default)
  2. date: Das aktuelle Systemdatum
  3. SentiPosAbs: Die absolute Anzahl der positiv konnotierten Marker im Text
  4. SentiPosRel: Die Relative (prozentualle) Gewichtung der positiven Marker im Verhältnis zum Gesamtsentiment
  5. SentiNegAbs: Die absolute Anzahl der negativ konnotierten Marker im Text
  6. SentiPosRel: Die Relative (prozentualle) Gewichtung der negativ Marker im Verhältnis zum Gesamtsentiment

Beispiel TZTopicSet:

<TZTopicSet xmlns:tzns="http://www.topiczoom.de:2208/TZNS" date="Tue Nov 26 11:28:29 2019" SentiPosAbs="2" SentiPosRel="6.666667E-01" SentiNegAbs="1" SentiNegRel="3.333333E-01" WordCount="145" >

Das Root- TZTopicSet beinhaltet für jedes erkannte Thema bzw. jede Entität ein TZTopic-Tag. Jedes TZTopic-Tag kann folgende Attribute haben:

  1. txt-Attribut: in diesem Attribut steht der Name bzw. die Bezeichnung des jeweiligen Tags, Themas oder der Entität.
  2. weight-Attribut: In diesem Attribut ist das absolute Gewicht des Themas angegeben. Je höher diese Zahl umso sicherer kann dem Text dieses Thema zugeordnet werden.
  3. DoG-Attribut: DoG steht für „Degree of Generality“. Umso niedriger die der DoG-Wert ist, umso allgemei-ner ist das Thema, umso höher umso spezifischer. DoG Werte von 99 stehen für “ohne ontologischen Hintergrund” erkannte Entitäten oder Indikatoren, die nicht zwingend einen thematischen Kontext induzieren (z.B. “Max Huber” ist eine Person, aber kein Thematischer Indikator)
  4. Sig-Attribut: Sig steht für Significance. Hierbei wird bewertet, wie ungewöhnlich ein Thema im Vergleich zu einem großen Nachrichten- und Artikelarchiv ist.
  5. direct-Attribut: Gibt an ob und wie oft das Schlagwort direkt im Text erwähnt wird. 0 bedeutet, dass nur spezifischere Themen erwähnt werden, aus denen eine Indikation des gegebenen Themas abgeleitet wurde.
  6. RDFID-Attribut: Ein eindeutiger Identifikator des Themas.
  7. Diversity-Attribut: Ein Wert, der angibt in wieweit spezifischere verwandte Themen im Text gefunden wur-den. Ein hoher Wert deutet eine hohe Relevanz des Themas im Text und gleichzeitig eine gute Zusammen-fassende Wirkung des Schlagworts an. 0,5 bedeutet, dass das Schlagwort nur über mehrere Abstaktionsebe-nen den Text beschreibt. Werte größer als 1 stellen sehr hohe Relevanzen da.
  8. TSCCS-Attribut: Dieses Attribut stellt ein Mapping zum „Thema Subject Classification Code System“ von EDITEUR.org bereit
  9. TZTYPE-Attribut: Eine Einsortierung von Einträgen in verschiedene Entitätsklaaen wie z.B. „geo“, „Person“ oder „time“;

Hier folgend Beispiele für TZTopics:

<TZTopic txt="Fußballspieler" weight="3" DoG="8" Sig="1.89582440077276" direct="0" RDFID="21923313" Diversity="0.5" TSCCS="0" TZTYPE="persbez" />
<TZTopic txt="Deutschland" weight="8" DoG="8" Sig="2.03156206941846" direct="0" RDFID="21996974" Diversity="4" TSCCS="1DFG" TZTYPE="Geo" />
<TZTopic txt="Persönlichkeiten des Bereichs Fußball" weight="3" DoG="6" Sig="1.83464639785147" direct="0" RDFID="21988831" Diversity="0.5" TSCCS="0" TZTYPE="persbez" />
<TZTopic txt="Borussia Dortmund" weight="2" DoG="14" Sig="1.96382664948449" direct="2" RDFID="21468291" Diversity="1" TSCCS="0" TZTYPE="org" />
<TZTopic txt="Tobias Escher" weight="1" DoG="99" Sig="1.01" direct="1" RDFID="none" Diversity="1" TSCCS="0" TZTYPE="person" />
<TZTopic txt="Leipzig" weight="2" DoG="13" Sig="1.81318907818257" direct="2" RDFID="21731145" Diversity="1" TSCCS="1DFG-DE-FSA" TZTYPE="Geo" />
<TZTopic txt="Sachsen" weight="2" DoG="10" Sig="1.51588678217748" direct="0" RDFID="21996702" Diversity="0.5" TSCCS="1DFG-DE-FS" TZTYPE="Geo" />
<TZTopic txt="Männer" weight="3" DoG="4" Sig="1.40165358189978" direct="0" RDFID="20929102" Diversity="0.5" TSCCS="0" TZTYPE="persbez" />
<TZTopic txt="25. 11. 2019" weight="1" DoG="99" Sig="1.01" direct="1" RDFID="none" Diversity="1" TSCCS="0" TZTYPE="Datum" />
<TZTopic txt="Fußball" weight="5" DoG="5" Sig="2.30742604937001" direct="0" RDFID="21991228" Diversity="1.5" TSCCS="SFBC" TZTYPE="0" />
<TZTopic txt="Bundeskanzlerin Angela Merkel" weight="1" DoG="14" Sig="6.38232899764929" direct="1" RDFID="21865853" Diversity="1" TSCCS="0" TZTYPE="person" />









Photo by Dawid Małecki on Unsplash

Categories: Coding