Enterprise Search

Unstrukturierten Daten auf der Spur

2. November 2023, 15:40 Uhr | Autor: Franz Kögl / Redaktion: Sabine Narloch

Fortsetzung des Artikels von Teil 1

Generative KI beschleunigt Rezeption von Inhalten

Zudem statten Anbieter ihre Enterprise-Search-Lösungen gegenwärtig mit generativer KI aus, wie sie vor allem durch ChatGPT bekannt wurde. Die Anbieter integrieren große KI-Sprachmodelle (Large Language Models, LLMs) in ihre Systeme, die auf neuronalen Netzen basieren und mit riesigen Datenmengen trainiert werden. Diese Modelle sind in der Lage, menschliche Sprache besser zu verstehen und zu verarbeiten als jemals zuvor und sogar komplette Texte selbstständig zu generieren. Enterprise Search bildet für den Einsatz von LLMs einen guten Rahmen, denn sie kann ein entscheidendes Risiko dieser Technologie beherrschen: ihre Neigung zu Halluzinationen.

Immer wieder werden Fälle bekannt, in denen Systeme wie ChatGPT vermeintliche Fakten oder Quellenangaben schlichtweg erfinden. Der Grund für solche Halluzinationen ist, dass große KI-Sprachmodelle mit Wahrscheinlichkeiten arbeiten. Wenn sie einen Text generieren, tun sie das Wort für Wort und fügen dabei als nächstes immer das am wahrscheinlichsten sinnvolle Wort hinzu. Ob die Wörter der Wahrheit entsprechen, ist nicht sicher, sondern nur mehr oder weniger wahrscheinlich. So kommt es zu Texten, die falsche Informationen enthalten, was aber für die Nutzerinnen und Nutzer wegen der formalen Perfektion der Antworten meist nicht erkennbar ist.

Im Rahmen von unternehmensweiter Suche agieren die Sprachmodelle aber nicht losgelöst. Sie verarbeiten stattdessen die rechtegeprüften Treffer – also die eigenen Daten – weiter, die von der Unternehmenssuche auf herkömmliche Weise ermittelt werden – und zwar in Form von Zusammenfassungen oder Antworten auf Fragen zu diesen Treffern. Nutzerinnen und Nutzer können dadurch gefundene Texte und Informationen schneller rezipieren. Die generative KI verwendet dabei nur Informationen aus organisationseigenen Daten, die faktisch korrekt sind, wodurch das Risiko für Halluzinationen sinkt. Zudem gibt die Enterprise-Search-Software die kompletten Quellen der Zusammenfassungen und Antworten an und schafft damit eine zusätzliche Sicherheitsschicht gegen Falschinformationen.

Flexibler Zugang zu relevanten Informationen

Enterprise Search ist zudem ein Analysetool für unstrukturierte Daten, das Unternehmen einen flexiblen Zugang zu den relevanten Informationen eröffnet. Sie müssen nicht vorab definieren, was ausgewertet werden soll, sondern können benötigte Auswertungen ad hoc zusammenstellen und durch intelligente Drill-Downs analysieren. Ausgehend von einer 360-Grad-Sicht auf den gesamten Datenbestand können sie diesen über Filter und Aggregationen dynamisch eingrenzen. Die generative KI vermag es mitunter die Analysen zu beschleunigen, indem sie Suchergebnisse wie umfangreiche Berichte oder Präsentationen inklusive der kompletten Quellenangabe zusammenfasst. Zudem gibt sie mitunter den Nutzerinnen und Nutzern die Möglichkeit, in einen Frage-Antwort-Dialog mit gefundenen Dokumenten zu treten und sich so die dort gespeicherten Informationen schnell und gezielt zu erschließen. Die Ergebnisse der Analyse sind nicht zwingend Trefferlisten, sondern können auch Darstellungen in flexibel konfigurierbaren Dashboards und Visualisierungs-Frontends sein. Über eine API lassen sich die aggregierten Ergebnisse auch an führende Systeme weitergeben – beispielsweise eine Business-Intelligence-Software.

Wenn Unternehmen auf diese Weise unstrukturierte Daten in ihre Business Intelligence integrieren, erhalten sie die Möglichkeit, Berichte und Analysen auf Basis ihres kompletten Datenbestands zu erstellen. Sie können das Potenzial ihrer Unternehmensdaten besser ausschöpfen und eine fundierte Entscheidungsfindung unterstützen. Die Kombination von strukturierten und unstrukturierten Daten ermöglicht es Unternehmen zudem, Datenqualitätsprobleme zu reduzieren und die Genauigkeit von Berichten und Analysen zu erhöhen. So können sie beispielsweise automatisierte Prozesse zur Identifizierung von Dubletten oder Inkonsistenzen in den Daten aufsetzen.

Franz Kögl ist Vorstand bei IntraFind in München.

Anbieter zum Thema

zu Matchmaker+

  1. Unstrukturierten Daten auf der Spur
  2. Generative KI beschleunigt Rezeption von Inhalten

Lesen Sie mehr zum Thema


Das könnte Sie auch interessieren

Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu IntraFind Software AG

Weitere Artikel zu Daten-Management

Weitere Artikel zu Datenschutz

Weitere Artikel zu Datensicherheit

Weitere Artikel zu Big Data

Matchmaker+