Linguistische Datenverarbeitung
- Ordnung ins Namens-Chaos
- Die Crux mit den Namen
- Linguistische Datenverarbeitung
IBM hat eine lange Tradition nicht nur in der Informationstechnik allgemein, sondern ganz speziell in linguistischer Datenverarbeitung. Mit seinen Speziallösungen »Entity Analytics Solution« (EAS) und »Global Name Recognition« (GNR) wird im Bereich der Melde-, Sozial- und Fahndungsregister sozusagen Identitätsmanagement erst möglich gemacht.
ENS ist ein selbst lernendes und sich selbst korrigierendes System und baut auf einer internationalen Namensbasis von über 900 Millionen Einträgen auf. Es ist besonders auf die Zusammenführung von Attributen, die zu ein- und derselben Person gehören, beziehungsweise auf die Verknüpfung von Personen, die bestimmte Attribute, beispielsweise ein Bankkonto oder die Telefonnummer, gemeinsam haben, spezialisiert. Als besonderen Clou der Lösung preisen die IBM-Leute die anonymisierte Verarbeitung von Bildern und Text, sodass der Datenschutz auch beim Datenaustausch über verschiedene Ebenen (Bund, Länder, international) gewahrt bleibe. Klardaten müssten, so die IBM-Aussage, nur bei einem konkreten Verdachtsfall ausgetauscht werden.
Die »Entity Analytics Solution« wird ergänzt durch die »Global Name Recognition«. Damit lassen sich sprachliche Ähnlichkeiten, unterschiedliche Schreibweisen, klangliche Ähnlichkeiten (das Programm hat auch eine phonetische Analysekomponente) oder kulturelle Besonderheiten analysieren und auswerten. Dabei sind Namen aus über 200 Ländern und 15 Kulturkreisen berücksichtigt.
GNR kann EAS entweder ergänzen oder auch unabhängig davon in andere Systeme wie etwa Telefonvermittlungszentralen oder Stellen- und Bewerberbörsen eingebunden werden. Die Informationstechnik für ein umfassendes Identitätsmanagement im staatlichen Bereich ist also vorhanden. Es muss sowohl technisch kompetent als auch im Blick auf die »Informationelle Selbstbestimmung«, wie sie das deutsche Bundesverfassungsgericht vor nunmehr fast 25 Jahren definiert hat, eingesetzt werden.