decaNLP: Mit decaNLP lassen sich zehn Aufgaben der natürlichen Sprachverarbeitung auf einmal erledigen: Fragen beantworten, maschinelle Übersetzung, Zusammenfassung, natursprachliche Schlussfolgerungen, Sentiment-Analyse, semantische Rollenzuweisung, Beziehungen, zielorientierter Dialog, Datenbankabfragen und Pronomenauflösung. Früher musste für jede dieser Aufgaben ein eigenes Modell erstellt und trainiert werden. Data Scientists benötigen nun nur noch decaNLP für zehn Aufgaben – und erhalten somit eine Art “Schweizer Taschenmesser für NLP” an die Hand.
Multitask Question Answering Network (MQAN): Das MQAN-Modell in decaNLP ermöglicht Zero-Shot-Learning. Also die Fähigkeit, Aufgaben zu bearbeiten, die es zuvor nicht kannte, und für die es auch nicht speziell trainiert wurde. Das Modell kann folglich völlig neue Aufgaben anhand verschiedener, aber verwandter Aufgabenbeschreibungen generalisieren. MQAN zeigt Verbesserungen beim Transferlernen für maschinelle Übersetzungen und Eigennamenerkennung, der Domänenanpassung für die Sentiment-Analyse und natursprachliche Schlussfolgerungen. MQAN kann so zu einer neuen Generation von Chatbots führen, die eine natürlichere und zielführende Mensch-Maschine-Interaktion ermöglichen.
Open Source Code: Der Code für die Beschaffung und Vorverarbeitung von Datensätzen, das Training und die Evaluierung der Modelle und ein kontinuierlich aktualisiertes Leaderboard basierend auf den Joint Model Decathlon Scores (decaScore) wird von Salesforce als Open Source zur Verfügung gestellt.