Während die Datenbestände in Unternehmen stetig wachsen, steht die digitale Welt vor der Herausforderung, den Anwendern eine möglichst unkomplizierte Navigation durch die Datenberge zu ermöglichen. Helfen soll dabei natürliche Sprachverarbeitung im Zusammenspiel mit KI und Analytics.
Business Intelligence ist in vielen Unternehmen angekommen und das Sammeln, das Analysieren und das Visualisieren von Daten sind mittlerweile wichtige Werkzeuge für viele Manager. Entsprechende Lösungen und Software gibt es daher mittlerweile wie Sand am Meer. Natürliche Sprachverarbeitung im Zusammenspiel mit KI- und Analytics-Tools (Natural Language Processing, kurz NLP) kann bei der Auswahl helfen.
Bisher beherrschen nur wenige Data Scientists und sogenannte „Power-User“ die intelligente Auswertung von größeren Datenzusammenhängen. Will aber ein Manager beispielsweise ein Reporting oder eine genaue Analyse über die Verkaufszahlen einer bestimmten Produktgruppe sehen, muss er bei den Profis nachfragen. Das bedeutet zusätzlichen Aufwand und kostet Zeit. Darum ist das erklärte Ziel von BI-Entwicklern, die neuen Lösungen der breiten Masse zugänglich zu machen, denn so können Entscheidungen auf Basis fundierter Informationen und Analysen schneller getroffen werden und dem Unternehmen im Idealfall Zeit und Geld sparen. Die benötigte technische Basis hierfür – also Analytics-Lösungen auf der einen und Sprach- beziehungweise Textverarbeitung auf der anderen Seite – ist im Einzelnen bereits oftmals vorhanden. Der nächste logische Schritt ist nun, diese Werkzeuge miteinander zu verknüpfen. Die Idee ist es, eine Eingabezeile, in die der Anwender seine Frage eintippen kann, oder eine Spracheingabe zur Verfügung zu stellen, um die angefragten Daten auszuwerten.
Datenanalyse mit Sprachsteuerung
Um das Zusammenspiel der beiden Komponenten Natural Language Processing und Analytics besser zu verstehen, lohnt sich ein Blick auf die jeweiligen Bausteine. Wie kann Sprache dabei helfen, Daten zu analysieren? Ein entscheidender Faktor ist die Fähigkeit von intelligenter Analysesoftware, natürliche Sprache zu verstehen. Die größte Herausforderung im NLP-Kontext ist es, aus dem gesprochenen oder eingetippten Text die korrekten Datenobjekte und Aggregatsfunktionen herauszufiltern. Lautet die Anfrage beispielsweise “Wie ist der jährliche Umsatz in der DACH-Region?”, muss die Sprach-Engine die Schlagworte “Umsatz” und “Jahr” sowie die Länder “Deutschland, Österreich und Schweiz” herauslesen können. Das funktioniert bei vielen Anbietern, die mit NLP beziehungsweise Sprachschnittstellen arbeiten, schon recht gut – allerdings nicht für alle Sprachen. Sobald beispielsweise ein deutschsprachiger Anwender zu Englisch wechseln muss, ist der Vorteil der natürlichen Sprache nicht mehr gegeben. Schon die verschiedenen Begriffe für “Kunden”, also “Client”, ”Customer” oder auch “Account”, können den Erfolg der Suche maßgeblich beeinflussen. So müssen entweder die Anwender oder die Tools noch einiges lernen. Immerhin kann eine gute Autovervollständigung Anwender dabei unterstützen, eine Anfrage korrekt zu übermitteln.
Kurz gefasst: Data Science |
---|
Der Begriff setzt sich aus den englischen Wörtern “data” (Daten) und “science”(Wissenschaft) zusammen und bezeichnet generell die Extraktion von Wissen aus Daten. Bei Data Science beziehungsweise der Datenwissenschaft handelt es sich um ein interdisziplinäres Wissenschaftsfeld, welches wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturierten als auch unstrukturierten Daten ermöglicht. Der Studiengang Data Science verwendet beispielsweise Techniken und Theorien aus den Fächern Mathematik, Statistik und Informationstechnologie, einschließlich der Signalverarbeitung, bezieht Wahrscheinlichkeitsmodelle des maschinellen und des statistischen Lernens, der Programmierung, der Datentechnik, der Mustererkennung, der Prognostik, der Modellierung von Unsicherheiten und der Datenlagerung ein. Personen, die im Bereich Data Science arbeiten, werden oft auch als Data Scientist beziehungsweise Datenwissenschaftler bezeichnet, wobei oft speziellere oder Spezialisierungen anderer, übergeordneter Berufsbezeichnungen üblich sind – wie Statistiker oder Informatiker. |