Der medizinische Bereich stellt einen wesentlichen Teil der TopicZoom-Ontologie dar. In diesem sind ca. 10.000 Konzepte des Bereichs Gesundheit – von Krankheitsbezeichnungen über Therapien und Medikamente bis hin zu
Kliniknamen – in einem semantischen Netz geordnet. Für jedes Konzept sind Synonyme, Bezeichnungs- und Flexionsvarianten hinterlegt. Die Anordnung im semantischen Netz erlaubt es, jedes Konzept als Thema aufzufassen, welchem dann auch die untergeordneten Konzepte zugeordnet sind. So gehört z.B. “Magenprobleme” zum übergeordneten Thema “Gastroenterologie”, welches seinerseits ein Teil des Konzepts/Themas “Innere Medizin” ist.

Die nachfolgenden Abbildungen illustrieren die automatische Zuordnung von Themen und Konzepten zu vorgegebenen Texten mittels der
automatischen Themenerfassung bei TopicZoom. Als Grundlage dienen die Wikipediabeschreibungen zu dreizehn großen Pharmaunternehmen (abgerufen Mai 2020). Es wurden drei Listen von Themen/Konzepten aus der TopicZoom-Ontologie zur Analyse dieser Beschreibungen gewählt. Die erste Liste umfasst medizinische Fachgebiete unterschiedlicher Allgemeinheit. Die zweite Liste umfasst Bezeichnungen für Krankheiten (“Diabetes”) beziehungsweise Krankheitstypen (“Infektionskrankheiten”).
Die dritte Liste schaut auf Medikamente und Medikamentengruppen. Alle Einträge der drei Listen werden als Themen betrachtet. Die Trefferzahlen zum jeweiligen Thema in den dreizehn Beschreibungen werden in einer Heatmap dargestellt.

Wie bei vergleichbaren Diagrammen ist auch hierbei zu bemerken, dass die so ermittelten Trefferzahlen keine objektive Analyse der jeweiligen Firma selbst darstellen, sondern lediglich die Verhältnisse in den beschreibenden Wikipediatexten widerspiegeln.

Vergleich der Unternehmen mit Blick auf medizinische Fachgebiete

Beim Blick auf die Trefferzahlen zu medizinischen Fachgebieten ist zu beachten, dass diese unterschiedlich spezifisch sind. Dies erklärt, dass der sehr breite Bereich “Innere Medizin” sehr viele Treffer hat, ein Untergebiet wie “Kardiologie” hingegen weniger. (Andere Scores, die von TopicZoom zur Verfügung gestellt werden, heben speziellere Gebiete in besonderer Weise hervor.) Eine Reihe von medizinischen Gebieten ist in den Beschreibungen vieler Firmen zu beobachten. Hierzu zählen neben “Innere Medizin” auch “Medizinische Mikrobiologie” und “Biomedizin”. Andere Gebiete wie “Diabetologie”, “Angiologie”, “Venerologie” und insbesondere “Zahnmedizin” sind mit weniger Firmen verbunden.

Trefferzahlen in den Wikipedia-Firmenbeschreibungen zu medizinischen Fachgebieten

Vergleich der Unternehmen mit Blick auf Arten von Arzneimitteln

Beim Blick auf Arzneimittel ergibt sich eine höhere Diversivität zwischen den Firmenbeschreibungen. Gut zu sehen ist, dass alle betrachteten Firmen ein unterschiedliches Spektrum an Arzneimitteln abdecken. Während beispielsweise GlaxoSmithKline relativ breit aufgestellt ist, ist bei vielen Firmen eine deutliche Konzentration auf bestimmte Medikamentengruppen zu beobachten.

Trefferzahlen in den Wikipedia-Firmenbeschreibungen zu Medikamentenarten

Vergleich der Unternehmen mit Blick auf Krankheiten

Mit Blick auf die Trefferzahlen zu Krankheiten in den Firmenbeschreibungen ist nochmals zu betonen, dass die Schaubilder nur die Verhältnisse in den Texten wiedergeben. Bei einigen Firmen sind in den Texten kaum Erwähnungen von Krankheiten zu finden. Andere Texte gehen ausführlich auf die Krankheiten im Fokus der Firmen ein. Die Bekämpfung von Infektionskrankheiten spielt eine erkennbar große Rolle. (Die obige Abbildung zu Medikamentengruppen zeigte bereits, dass viele Firmen Antibiotika anbieten.) Bei Gruenental legt der Schwerpunkt im Bereich Infektionskrankheiten auf bakteriellen Infektionen. Bei Boehringer und Hoffmann-La Roche gehen die Texte eher auf Viruserkrankungen ein.

Trefferzahlen in den Wikipedia-Firmenbeschreibungen für Krankheiten

Vom Überblick zum Detail

Alle Angaben, die in den Diagrammen zu finden sind, basieren auf konkreten Textbausteinen der Texte, die in der TopicZoom Ontologie dem jeweiligen Konzept oder Thema zugeordnet sind. Dadurch ist es auch möglich, die jeweiligen Textpassagen anzuzeigen, um detailliertere Informationen zu erhalten. Hierfür hat TopicZoom eine spezielle Technik des “Dokumenten-Screenings” entwickelt. Dies sei hier am Beispiel “Neurologische Erkrankungen” gezeigt.

Durch Anklicken des folgenden Links kommt man zu einer Darstellung jedes Firmentexts als farbliches Band, wobei gelb jene Passagen hervorgehoben sind, die Textbausteine zum Bereich “Neurologische Erkrankungen” enthalten. Geht man mit der Maus auf den gelben Streifen, so werden diese Textbausteine – markiert mit !!! – sichtbar. Bei Hoffman-La Roche führt dies u.a. auf Multiple Sklerose und Parkinson, bei Novartis u.a. auf Antiepileptika, MS und Alzheimer etc.

Detailansicht zu “Neurologische Erkrankungen” via Dokumenten-Screening

Das breitere Bild: Verwandte Formen der thematischen Suche

Die hier vorgestellte Form einer thematischen Suche, vom vergleichenden Überblick bis zum Detail per thematischem Dokumentenscreening, stellt nur eine von vielen Möglichkeiten dar, die sich durch die TopicZoom Techniken zur Themenerfassung ergeben. In der TopicZoom-Themengalerie “Suchmaschinentechnologie zur thematischen Suche in Studiengangsbeschreibungen” stellen wir an einem Beispiel vor, wie man in einer umfangreichen Kollektion von Texten nach Texten suchen kann, die zu einer Eingabeanfrage oder einem Eingabetext eine besonders gute thematische Übereinstimmung aufweisen.
In anderen Anwendungen kann man zwei Texte oder Korpora A und B im Detail vergleichen, wobei einerseits übereinstimmende Konzepte oder Themen, andererseits die spezifischen Themen für A bzw. B aufgelistet sind.

Quellennachweis

Die in diesem Post als Datengrundlage verwendeten Texte stammen aus der Wikipedia und unterliegen den Lizenzbestimmungen Creative Commons Attribution-ShareAlike 3.0 Unported.

Foto, danke an: Photo by Stephen Foster on Unsplash

Print Friendly, PDF & Email