Multimodale Callcenter-Anwendungen

11. April 2008, 0:00 Uhr | funkschau sammeluser

Fortsetzung des Artikels von Teil 2

ARCHITEKTUR DER LÖSUNG

Eine multimodale Callcenter-Applikation wie in diesem Beispiel (siehe Aufmacherbild) setzt sich aus verschiedenen Komponenten zusammen: einer Sprachplattform, dem Webportal, einer Dialog-Anwendung (zur Bereitstellung des Sprach- und Web-Dialoges) und zwei Adaptern, um ein CRM-System (Customer Relationship Management) sowie die Callcenter-Agent-Applikation anzubinden. Die Sprachplattform hat Schnittstellen zum TK-Netzwerk (klassisch oder über IP) und nimmt die Anrufe entgegen. Außerdem ist sie die Ablaufumgebung des Sprachdialogs. Dazu besitzt sie noch einen Voice-XML-Interpreter sowie ein TTS- (Text To Speech) und ein ASR-System (Automatic Speech Recognition).

Die Sprachplattform nimmt einen eingehenden Anruf an und arbeitet ihn anhand einer dynamisch erstellten Voice-XML-Datei ab. Dabei werden Sprach-Prompts abgespielt beziehungsweise Texte mit synthetischer Stimme vorgelesen. Außerdem lassen sich Sprach- oder DTMF-Eingaben auslesen und interpretieren. Das Webportal läuft auf einem Webserver mit dynamischer Erweiterung und bindet die von der Dialog-Applikation bezogene Webseite mit ein.

Die Dialog-Applikation ist das Herzstück der Lösung. Sie stellt den Dialog im Voice-XML-Format und die Ausgabe für die Webseite bereit. Technisch gesehen besteht diese Applikation aus drei Bausteinen: jeweils einer Frontend- Komponente für die Nutzerschnittstellen zur Sprachplattform und zum Webportal, sowie einer Backend- Komponente. Das Backend hat zusätzlich noch eine Datenbankschnittstelle sowie zwei über Adapter betriebene Schnittstellen zur CRM- und Callcenter-Agent-Applikation.
Im Backend werden die beiden Sessions (Sprache und Web) zusammengeführt. Es stellt den generischen Zwischendialog, der in der Datenbank hinterlegt ist, für die beiden Frontends bereit und speichert die Position eines Nutzers im Dialog. Außerdem übernimmt das Backend die Aufgaben der Nutzerauthentifizierung und stellt die Applikationslogik samt CRM-Anbindung bereit.

Das Sprach-Frontend wandelt den vom Backend erhaltenen Zwischendialog anhand vorgegebener Regeln in Voice-XML um und stellt diesen der Sprachplattform bereit. Eingaben des Nutzers leitet das Sprach-Frontend an das Backend zur Verarbeitung weiter. Das Sprach-Frontend läuft auf einem Standard-Webserver mit dynamischer Erweiterung (zum Beispiel Apache inklusive Tomcat) und besteht aus zwei Schichten:

  1. Einer Logikschicht für die Verbindung zum Backend und zur Datenaufbereitung.
  2. Die zweite Schicht ist zuständig für die Darstellung des Dialogs im Voice-XML-Format.

Analog zum Sprach-Frontend wandelt das Web-Frontend den Zwischendialog, den es vom Backend erhalten hat, ins HTML-Format zur Verwendung in der Portalseite als Ausgabeseite um. Das Web-Frontend läuft wie das Sprach-Frontend auf einem Webserver mit dynamischer Erweiterung. Wie das Sprach-Frontend besteht das Web- Frontend aus einer Logik- und einer Präsentationsschicht.

Autoren

Wolfgang Hummel ist Solution Architect für Telco-Lösungen. Maximilian Kerk ist BA-Student im Bereich Informatik. Beide sind bei der Hewlett-Packard Deutschland beschäftigt.

 


  1. Multimodale Callcenter-Anwendungen
  2. Szenario Telefonrechnung
  3. ARCHITEKTUR DER LÖSUNG

Jetzt kostenfreie Newsletter bestellen!

Matchmaker+