Informationsvorsprung durch Soziale Medien Analyse

Moderne, digitale Kommunikationswerkzeuge erlauben es jedermann persönliche Meinungen und Gedanken einem weltweiten Publikum kund zu tun. Immer mehr Menschen beteiligen sich an Online-Communities, verfassen Blogs und tauchen in die Welt sozialer Netzwerke ein.

Die stetig steigende Nutzung sozialer Netzwerke wie Facebook und Twitter oder von Online-Diskussionsforen und Blogging-Sites macht es immer wichtiger auf die Stimme des Kunden (des Marktes, Mitarbeiters oder Patienten) zu hören, einzugehen … und sich natürlich auch Gehör zu verschaffen. Es zeigt sich immer öfter, dass Themen die in diesen Medien angesprochen werden auf den Titelseiten großer, renommierter Zeitungen landen. Das Monitoring und die Analyse dieser Online Kommunikation sind für all jene unabdingbar, die sich nicht von der Informationsflut überrollen lassen, sondern dieser vorauseilen wollen. Die Einsatzgebiete Sozialer Medien Analyse sind breit gefächert: Marketing und PR, Customer Service, Competitive Intelligence, Investor Relations und andere Relations Bereiche.

Die eingehende Analyse des Kommunikationsverhaltens und Informationsaufkommens in Sozialen Medien unterstützt die Beobachtung, Messung und das Verstehen des Informationsflusses in diesen Informationskanälen. Im Kern wird mit diesen Methoden folgende Frage adressiert: Wer spricht wo, wie worüber?

1.       WO wird online über ein bestimmtes Thema (Marke, Produkt etc.) gesprochen? In welchen relevanten Informationsquellen findet Kommunikation über ein bestimmtes Thema statt. Welche Wichtigkeit und Glaubwürdigkeit wird diesen Quellen attestiert.

2.       WIE und WORÜBER diskutiert man online über diese Themen? Im Vordergrund steht die Ermittlung der Tonalität (Sentiment) in der bestimmte Themen in Zusammenhang mit, bspw. einem Unternehmen, Produkt oder dem Mitbewerb diskutiert werden. Mit welcher Häufigkeit finden Diskussionen statt und welche Themen werden diskutiert.

3.       WER steht hinter diesen Diskussionen? Primäres Ziel ist die Identifikation der Meinungsträger und Opinion Leader die zu bestimmten Themen Stimmung machen.

Aus technologischer Sicht wird zur Analyse Sozialer Medien, und damit zur Unterstützung der Beantwortung obiger Fragen, auf eine Vielzahl unterschiedlicher Technologien und Ansätze zurückgegriffen die sich unter dem Terminus Text Analytics zusammenfassen lassen. Dabei werden primär unstrukturierte (Text)Daten aggregiert, korreliert und auf spezifische Trends, Ausreißer und Muster untersucht. Zusätzlich stellt man jene explorative Funktionalität für unstrukturierte Inhalte zur Verfügung, die man in der traditionellen Business Intelligence kennen und schätzen gelernt hat.

Die Identifikation potentiell relevanter Informationsquellen und die Datenakquise durch groß angelegtes Web Crawling stehen am Anfang einer Kette von Schritten die im Rahmen des Analyseprozesses abgearbeitet werden. Nach der Akquise der oftmals sehr umfangreichen Datenmengen von mehreren Millionen Beiträgen, folgt die thematische Aufbereitung der Anwendungsdomäne um den Themenraum abzustecken und die Erfassung des meist mehrsprachigen Domänenvokabulars wie spezifische Produktnamen, Stichworte, Synonyme, Abkürzungen oder Slang. Durch den Einsatz linguistischer Methoden und Verfahren des Maschinellen Lernens wird eine tiefgehende Analyse des Datenmaterials erreicht. Dies inkludiert unter anderem:

Korpusanalyse – Durch die frequentistische Analyse der Beiträge (=Postings) in diesen Quellen werden Wortverteilungen ermittelt, die in weiterer Folge zur Identifikation von Worthäufungen in der Gesamtheit aller Postings herangezogen werden. Diese Häufungen stellen Schlagworte dar, die diese Beiträge näher beschreiben.

Clustering –  Durch Verwendung moderner Clustering Verfahren wird die automatische thematische Gruppierung von Postings erreicht. Diese automatisch erzeugten Gruppen entsprechen Themengebieten, die der Zusammenfassung und Bezeichnung von Beiträgen mit ähnlichem Inhalt dienen.

Semantische Annotation & Sentiment Analyse – Die automatische Anreicherung der Postings  um semantische Konzepte (wie etwa Regionen, Personen, …) ermöglicht eine präzisere Analyse. Die semantische Anreicherung erfolgt unter Verwendung spezieller Ontologien, Methoden der Informationsextraktion und Textanalyse. Der Einsatz von linguistischen Verfahren erlaubt die Bewertung der Tonalität (Sentiment) von Postings und dadurch die Kategorisierung nach bestimmten Typologien wie bspw. in positive, neutrale und negative Beiträge. Zusätzlich wird der Sentimentkontext analysiert, um den Meinungsträger und das Ziel dieser Meinung (bspw. ein Produkt) zu identifizieren.

Durch die Analyse Sozialer Medien eröffnet sich eine völlig neue Perspektive darauf, wie bspw. Unternehmen oder Marken von der Welt gesehen werden und ermöglicht zum passenden Zeitpunkt richtig zu reagieren. In letzter Konsequenz wird jedoch erst durch die Kombination computergestützter, automatisierter Analyseverfahren und dem Erkenntnisvermögen des Menschen aus rohem Datenmaterial nützliche Information.