Github: Open Source RASA-Custom-Entity-Extraction

rasa_logo_npn-300x168.png

RASA ist eine Technologiefirma, die intelligente, AI-basierte Bots und Assistenten entwickelt. Einsatzmöglichkeiten bestehen bspw. im Kundenservice von Versicherungen. Die Technologie ist skalierbar, da sie auf neusten Erkenntnissen aus dem Bereich Machine Learning basiert.

Ein wichtiges Mittel zur präziseren Bearbeitung von Anfragen stellt dabei die Extraktion sogenannter Entitäten dar. Sie können dazu verwendet werden, um wichtige Informationen wie beispielsweise Namen oder Anfragetypen aus Eingaben herauszufiltern. RASA stellt verschiedene vordefinierte Extraktoren zur Verfügung, mit deren Hilfe Entitäten aus Eingaben extrahiert werden können. Diese arbeiten auf den unterschiedlichsten Mechanismen. Beispielsweise nutzt der „CRFEntityExtractor“ Conditional Random Fields (CRF), um Entitäten zu erkennen.

Falls ein Entitätentyp jedoch sehr vielseitige und einzigartige Wörter enthält, stoßen sie schnell an ihre Grenzen, da keine präzisen Modelle der Strukturen aufgebaut werden können. Aus diesem Grund möchten wir Ihnen in den folgenden Abschnitten eine Methode vorstellen, mit der Sie Ihre eigenen, individuellen Extraktoren für RASA schreiben und in Ihr bestehendes Projekt integrieren können. Dafür stellen wir das RASA-Custom-Entity-Extraction mit einigen Templates unter MIT-Lizenz auf GitHub zur freien Verfügung. Diese verwenden einen einfachen Fuzzy Matching-Ansatz, um Entitäten in Texten zu erkennen. Die zu filternden Entitäten können beispielsweise in einer Datenbank oder einer .json-Datei hinterlegt werden. Unser Ansatz kann leicht durch komplexere Algorithmen erweitert werden.