<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=2171572209666742&amp;ev=PageView&amp;noscript=1">
Mann hält Telefon und liest eine Chat-Nachricht

Die maschinelle Verarbeitung von Texten

Natural Language Processing

In einer Welt mit ständig zunehmenden Informationsfluten kann uns die automatisierte Verarbeitung natürlicher Sprache dabei helfen, uns auf das Wesentliche zu konzentrieren.

Motivation

Natural Language Processing (NLP) ist die maschinelle Verarbeitung von Texten. Seit den Anfängen dieser Disziplin im Jahr 1970 hat sie schon einige Fortschritte erzielt, aber erst Ende 2022 konnte ChatGPT von OpenAI mit seinen erstaunlichen Fähigkeiten weltweite Aufmerksamkeit auf sich ziehen. Es gibt allerdings auch Alternativen und gelegentlich auch spezialisierte Modelle, die bestimmte NLP-Aufgaben bewältigen können. Von diesen sind manche Open Source, was im Hinblick auf Sicherheit und Vertraulichkeit von besonderer Bedeutung ist.

Mann zeigt auf Monitor

Ansatz

Unser Fokus liegt auf Anwendungen, die sich bei Unternehmen besonderer Nachfrage erfreuen, insbesondere auf der semantischen Zusammenfassung von Suchanfragen, Frage-Antwort-Systemen und der Dokumentenanalyse (Klassifizierung). Wir haben verschiedene NLP-Modelle in bestimmten Anwendungsfällen auf ihre Leistung und nicht-funktionelle Kriterien hin evaluiert, z.B. wie gut sie sich in vorhandene Lösungen und Produkte integrieren lassen. Die Frage, ob On-Premise- oder Remote-API-Lösung, ist wegen der Auswirkungen auf Modellwartung und Datensicherheit ebenfalls ein wichtiger Faktor.

Die Optimierung der internen Suchfunktion von Adnovum ist ein gutes Beispiel eines solchen Anwendungsfalls. Nachdem sich herausstellte, dass die semantische Suchfunktion eines BERT-ähnlichen Modells der Confluence-Suche überlegen ist, entwickelten wir eine Applikation, die den internen Confluence nur teilweise indiziert. Dann integrierten wir dieses NLP-Modell in Elasticsearch, um neben Confluence auch andere Datenspeicher in die Indizierung und semantische Suchfunktion miteinzubeziehen. Mit weiteren, auf Frage-Antwort-Systemen zugeschnittenen NLP-Modellen ausgestattet kann die Applikation nicht nur passende Dokumente auflisten, sondern auch ausformulierte Antworten liefern. Dadurch wird eine schnelle und praktische Informationsabfrage gewährleistet, wie sie moderne Nutzer erwarten. Wegen der Datenschutzanforderungen sollte jedoch solch eine Lösung lokal, d.h. on-premise sein.

Erwartetes Ergebnis

Öffentliche verfügbare NLP-Modelle, sowohl On-Premise- als auch Remote-API-Varianten, sind uneingeschränkt für die implementierten und validierten Anwendungsfälle geeignet. Unsere Kunden können diese Modelle mit ihren eigenen Daten ausprobieren, z.B. in den Bereichen semantische Suchfunktion, Zusammenfassung und Frage-Antwort-Systemen, und mit weiterer Feinabstimmung die Modelle auf ihre domänenspezifischen Vokabulare und Aufgaben anpassen. Die wichtigsten europäischen Sprachen werden unterstützt (Englisch, Deutsch, Französisch und Italienisch). Kommerzielle Cloud-basierte Modelle garantieren Datensicherheit.

Status

Die Expertise, die wir mit unseren technischen Analysen und PoC-Implementierungen erlangt haben, teilen wir in Workshops mit unseren Kunden aus verschiedenen Branchen. Unsere Kunden können direkt vor Ort ihre eigenen Daten in unsere Demo-Applikation einspeisen, um sofort einen Eindruck zu bekommen, welch einen Mehrwert NLP-Technologien für ihre internen Prozesse und Systeme bietet.

Conversational AI

ChatGPT hat viele Fragen bezüglich Conversational AI aufgeworfen, und letztere kann in der Tat auf zweierlei Weise von NLP-Technologien profitieren. Zum einen lassen sich damit solche Kernfunktionen wie die Sprache-zu-Text-Transkription und die Absichtserkennung verbessern. Die Open-Source-Lösung Whisper von OpenAI ist ein eindrückliches Beispiel dafür, wie ein leistungsfähiges Sprachmodel die Transkription aufwerten kann. Zum anderen gibt es zusätzliche Funktionalitäten, wie die automatisierte Zusammenfassung von Gesprächen. Zusammen mit unserem Conversation-AI-Team sind wir dabei, Verbesserungen in diesen beiden Gebieten zu erforschen.

Zusammengefasst kann man sagen, dass ChatGPT allein eine professionelle Conversational-AI-Lösung nicht ersetzen kann. Es kann aber ein wichtiger Bestandteil eines stark verbesserten Produkts sein. Wir erforschen gerade, wie ChatGPT am besten zu einer professionellen Conversational AI beitragen kann.