Natural Language Processing – Versteckte Potenziale und Insights ans Tageslicht bringen

„Alexa, spiele meinen Lieblingssong!“ …, denn hier spielt die Musik. Intelligente Assistenten wie Alexa, Siri und Co. sind mittlerweile fester Bestandteil unseres Alltags geworden und wirken beinahe schon menschlich. Aber was passiert eigentlich im Hintergrund? Wie ist es möglich, dass eine Maschine durch meine Sprache gesteuert werden kann und Musik abspielt, meine Lieblingsserie abspielt oder meinen Einkauf erledigt?

Eine der zugrundeliegenden Technologien ist das sogenannte Natural Language Processing, kurz NLP. Dieses definiert sich als eine Unterdisziplin der Künstlichen Intelligenz (KI) und beschäftigt sich mit der maschinellen Verarbeitung der natürlichen Sprache. Natürliche Sprache versteht sich als die von Menschen im Alltag genutzte Sprache und grenzt sich folglich von z. B. Programmiersprachen ab. Dabei taucht Sprache in unterschiedlichsten unstrukturierten Datenformen auf und kann entsprechend unterschiedlich verarbeitet werden. Dazu zählen Sprache in Audio Format oder auch Text Format.

Wie funktioniert NLP?

Natürlich sind Alexa und Co. keine echten Menschen, sie haben aber von uns gelernt. Dabei werden Methoden des Machine Learnings (ML) bzw. Deep Learnings angewendet, um der Maschine natürliche Sprache beizubringen.

Stellen Sie sich ein Kleinkind vor, das gerade zu sprechen lernt. Sie zeigen auf einen Baum und geben gleichzeitig die Laute von sich, die das gesprochene Wort „Baum“ erzeugen. Das Kind nimmt visuell die Eigenschaften des Baums und gleichzeitig die gesprochenen Laute wahr. Wiederholen Sie dies einige Male, wird das Kind lernen, dass zwischen den visuellen Eigenschaften des Baumes und dem gesprochenen Wort ein Zusammenhang besteht. In der einfachsten Form des ML läuft es ganz ähnlich ab. Man gibt der Maschine eine Audiospur und ein dazugehöriges Transkript. Durch riesige Datensätze lernt die Maschine, welche Audioeigenschaften mit welchen geschriebenen Worten zusammenhängen und wird so dazu befähigt, gesprochene Sprache zu transkribieren.

Natürlich handelt es sich hier um vereinfachte Beispiele; das Spektrum der natürlichen Sprache ist um ein Vielfaches komplexer, aber das Grundprinzip des maschinellen Lernens bleibt gleich.

Was alles mit NLP möglich ist

So vielfältig und komplex Sprachen sind, so sind es auch die Anwendungsgebiete von NLP. Im Folgenden geben wir einen Überblick über die gängigsten Technologien und wie sie Mehrwert schaffen können.

Speech-to-Text

Speech-to-Text Algorithmen dienen der klassischen Transkription von gesprochener Sprache in Textformat. Häufig ist Speech-to-Text nur der erste Baustein in einer Kette von NLP Algorithmen, da sich Textformate für weitere Analysen wesentlich besser eignen.

Speech-to-Text macht also überall dort Sinn, wo Sie große Mengen an gesprochener Sprache in Form von Audiodaten haben, wie zum Beispiel im Call-Center, Kundengesprächen oder Videointerviews. Durch die Transkription eröffnen sich viele weitere Möglichkeiten der Textanalyse, als auch Dokumentations- und Archivierungsmöglichkeiten.

Sentiment Analysis:

Sie möchten wissen, wie sich Ihre Kunden in sozialen Medien gegenüber Ihrer Marke äußern und ob die Online Bewertungen gegenüber Ihrer Marke positiv oder negativ sind? Möchten Sie die Call-Center Interaktionen mit Ihren Kunden besser verstehen und besser auf Kundenanfragen reagieren können? Dann ist die Sentiment Analaysis Technologie die richtige für Sie. Bei der Sentiment Analysis werden Emotionen und Stimmungen in der Kommunikation analysiert. Die Technologie analysiert die Sprache hingehend auf Emotionen und Stimmungen, die mitschwingen. Dadurch können Sie z. B. erfahren, welche Einstellungen Kunden zu Ihrer Marke haben und entsprechende Maßnahmen treffen, um diese zu beeinflussen.

Text Klassifizierung

Bei der Klassifizierung geht es darum, Texte bestimmten Kategorien zuzuordnen. Auch hier gibt es unzählige Anwendungsmöglichkeiten; viele davon begegnen Ihnen auch im Alltag. Wenn ihr E-Mail Provider E-Mails automatisch in den Spam-Ordner schiebt, dann ist dies auf Grundlage einer automatisierten Analyse des Inhalts und entsprechender Klassifizierung geschehen.

Klassifizierungs-Algorithmen können auf alle möglichen Kategorien trainiert werden. Sie helfen einen Überblick über die Flut an Textinformationen zu bewahren, mit der wir täglich konfrontiert sind. Ein paar Beispiele hierfür:

automatisierte Zuordnung von Posteingang oder Support-Anfragen zu den entsprechenden Themenfeldern (z. B. Werbung, Anfrage, Rechnungen, Aufträge) oder Sachbearbeitern
klarer Überblick sowie detaillierte Analysen über Dokumente in Ihrem Archiv oder Dokumenten-Management-System (z. B. Einordnung in Verträge, Kündigungen, etc.)
tief gehende Analysen von (Kunden-)Kommunikation (z. B. welche Beschwerden kommen häufiger vor, was gefällt den Kunden gut, etc.)

Chatbots

Chatbots sind Dialogsysteme und kommen intelligenten Assistenten wie Alexa wohl am nächsten. Die Komplexität und „Intelligenz“ dieser Maschinen kann dabei stark variieren. Sie greifen häufig auf eine Vielzahl anderer NLP-Technologien zurück und suggerieren dem Nutzer eine Konversation. Chatbots werden häufig als erste Anlaufstelle für Support- und Kundenanfragen genutzt. Je nach Medium greifen sie auch auf Speech-to-Text und Text-to-Speech Algorithmen zurück. Mithilfe von Klassifizierung wird die Fragestellung bzw. das Anliegen des Kunden identifiziert und regelbasiert beantwortet.

Text-to-Speech

Text-to-Speech Technologie stellt das Pendant zu Speech-to-Text dar: Sprache in Form von Text wird in eine maschinelle Audiospur umgewandelt. Diese Technologie findet besonders in Dialogsystemen, wie zum Beispiel Chatbots über Telefon oder smarten Assistenten Anwendung.

Was passiert also sprachlich, wenn ich Alexa bitte, meine Lieblingsmusik zu spielen? Wie in vielerlei Anwendungsfällen werden hier mehrere Technologien verknüpft, um dem Wunsch des Kunden zu entsprechen. Die Sprache des Kunden wird transkribiert, analysiert (klassifiziert), mit der Datenbank abgeglichen und ausgeführt mit einem zusätzlichen Text-to-Speech Kommentar „OK, ich spiele dein Lieblingslied xyz“.

Watch-outs: Worauf sollte man achten?

Maschinen sind nur so intelligent wie die Daten, von denen sie lernen. Wenn z. B. ein Speech-to-Text Algorithmus lediglich mit Audio-Daten trainiert wird, die auf Hochdeutsch gesprochen sind, wird er Probleme haben, starke Akzente richtig zu verstehen. Wenn also die Trainingsdatensätze fehlerhaft oder unvollständig sind, wird sich dies auch im Ergebnis zeigen.
Verstehen, was ein Algorithmus kann und was nicht: Viele denken bei KI an Maschinen, die, wie in Filmen, beinahe schon menschlich handeln und denken können. Die Realität sieht anders aus. Für gewöhnlich sind Algorithmen auf eine ganz bestimmte Aufgabe ausgelegt. Smarte Assistenten können unsere Lieblingsmusik abspielen, aber nicht das Auto selbständig fahren. Dessen sollte man sich bewusst sein, damit man NLP zielgerichtet einsetzen kann.
Sprache ist vielschichtig und komplex. In manchen Anwendungsfällen lohnt es sich auch weitere Datenquellen, wie z. B. Mimik und Körpersprache aus Videodaten hinzuziehen, um ein noch tieferes Verständnis über Kommunikation zu erhalten.

Die Anwendungsgebiete von NLP sind genauso vielschichtig wie Sprache selbst. Mit dem richtigen Ansatz und den richtigen Daten lassen sich große Potenziale in Kommunikation, Datenanalysen, Prozessen und Innovation fördern.

Wenn Sie Fragen zu diesem Thema haben oder gerne unverbindlich über Anwendungsfälle fachsimpeln möchten, zögern Sie nicht, uns anzuschreiben.

P.S.: NLP hat nichts mit dem ebenfalls so abgekürzten Neuro-Linguistic Programming zu tun.