09.09.2025
Blog
Think ahead

Hybride Chatbots: Architektur und technische Umsetzung

Im ersten Teil unserer Reihe haben wir gezeigt, warum hybride Chatbots ein perfektes Zusammenspiel aus traditionellen, regelbasierten Ansätzen und moderner generativer KI-Technologie darstellen. In diesem zweiten Teil tauchen wir tiefer ein in die Architektur und die Funktionsweise dieser Hybridmodelle, um einmal zu veranschaulichen, wie sich das Konzept verwirklichen lässt.

Potrait von Ansprechpartner Carsten Dahlmann
Carsten Dahlmann
Conversational AI Consultant

Architekturprinzipien hybrider Chatbots 

Ein hybrider Chatbot verbindet zwei Antwortstrategien. Eine legt Wert auf Kontrolle und Konsistenz durch vorgefertigte Inhalte – typischerweise über statische Dialogstrukturen oder über Wissensdatenbanken, die sicherstellen, dass Antworten passgenau vorbereitet sind. Die andere nutzt generative KI, um Konversationen flexibel, natürlich und kontextbezogen zu gestalten. Eine Orchestrierungsschicht entscheidet je nach Nutzereingabe zwischen diesen beiden Modi, idealerweise gesteuert über Confidence Scores, die anzeigen, ob eine Anfrage regelbasiert beantwortet werden kann oder generative KI-Unterstützung benötigt. 

Statische Dialogbäume und Vektor-RAG im Vergleich 

Je nach Compliance-, Qualitäts- und Steuerungsanforderungen kann der regelbasierte Zweig gezielt über statische Dialogbäume realisiert werden. In diesem Fall haben Redakteur:innen die Antworten also bereits vorformuliert. Diese werden kontrolliert ausgespielt, sobald die Intention durch das LLM (Large Language Model) erkannt werden konnte. Somit wird bei dieser Vorgehensweise die klassische Intent- und Entitäten-Erkennung mittels NLU (Natural Language Understanding) durch eine LLM-basierte Klassifizierung ersetzt: Das KI-Modell identifiziert die Absicht des Nutzenden anhand seiner Eingabe, woraufhin die passende, manuell erstellte Antwort aus dem Dialogbaum ausgespielt wird. Diese Variante minimiert Halluzinationsrisiken und sorgt für inhaltliche Genauigkeit, da die KI nicht selbstständig möglicherweise fehlerhafte oder ungewünschte Inhalte generiert. 

Vorteile und Grenzen von Vektor-Retrieval (RAG) 

RAG bzw. Vektor-Retrieval ist besonders dann sinnvoll, wenn Wissensdatenbanken groß und dynamisch sind. Typischerweise werden dabei die relevantesten Dokumentpassagen per Top-k-Ähnlichkeitssuche ausgewählt. Das kann jedoch dazu führen, dass einzelne wichtige Informationen nicht in den Kontext des Chatbots einbezogen werden. Dieses Problem lässt sich abmildern, indem man Vektorsuche mit weiteren Verfahren kombiniert – etwa klassischer Stichwortsuche (Keyword Search) oder NLU/NLP-basierten Methoden wie Synonymerkennung oder Intent-Matching. Ergänzend können Optimierungen wie erweiterte Suchanfragen (Query Expansion) oder strukturierte Indexierung eingesetzt werden, um die Trefferqualität zu verbessern. Diese Ansätze bringen allerdings jeweils eigene Vor- und Nachteile mit sich, die sich von der bewusst begrenzten, vollständig geprüften Antwortmenge statischer Dialogbäume unterscheiden. 

Kombination beider Ansätze in der Praxis 

In der Praxis können diese Ansätze leicht kombiniert werden: intentgesteuerte Pfade aus einer bestehenden NLU-/Dialogplattform (z. B. Watson Assistant, Dialogflow CX oder Rasa) liefern verlässliche Antworten, während ein LLM die Sprache glättet, Varianten erzeugt und Edge-Cases abdeckt – ohne dass dabei die Kontrolle über den Inhalt aufgegeben werden muss. 

Modellwahl: On-Premise oder Cloud? 

Für die erfolgreiche Implementierung eines Hybrid-Chatbots ist die Wahl der Modellplattform ebenfalls entscheidend – On-Premise-LLMs wie LLaMA, Mistral oder Falcon bieten volle Datenhoheit und sind ideal für behördliche Anforderungen. 

Im Gegensatz dazu ermöglichen Cloud-Plattformen wie Azure OpenAI, Google Vertex AI oder AWS Bedrock hochskalierbare, ständig aktualisierte Modelle mit umfassenden Services rund um Sicherheit, Monitoring und Deployment. 

Hybride Szenarien mit kombinierter Modellnutzung 

In einigen Architekturen wird beides kombiniert: Sicherheitskritische oder datenschutzrelevante Anfragen laufen lokal auf On-Premise-Modellen, während komplexere oder rechenintensive Vorgänge über die Cloud abgewickelt werden – jeweils orchestriert, um Effizienz und Compliance zu vereinen. 

Sicherheits- und Qualitätsaspekte 

Zuverlässigkeit bedeutet mehr als nur „funktionieren“. Neben stabiler Performance gehören dazu umfassende Schutzmechanismen wie strikte Datenzugriffskontrollen (z. B. SSO, rollenbasierte Berechtigungen), Verschlüsselung in Transit und at Rest, PII-Filterung sowie Output-Parsing. 

Monitoring und Qualitätskontrolle 

Ergänzend sind kontinuierliches Monitoring, Feedback-Loops und automatisierte Regressionstests entscheidend, um Halluzinationen zu verhindern, die Tonalität zu kontrollieren und Abweichungen früh zu erkennen. 

Auditierbarkeit in regulierten Branchen 

Gerade in regulierten Branchen ist auch die Auditierbarkeit zentral: Protokollierung von Modellentscheidungen, Nachvollziehbarkeit der genutzten Datenquellen und definierte Eskalationswege bei kritischen Vorfällen sichern Compliance-Anforderungen ab. Durch regelmäßige Qualitätssicherung, inklusive Benchmarking gegen definierte KPIs, kann der Chatbot nicht nur auf hohem Niveau betrieben, sondern auch fortlaufend optimiert werden. 

Fazit: Intelligente Architektur als Erfolgsfaktor 

Die größte Stärke hybrider Chatbots liegt nicht allein in Generativität, sondern in der intelligenten Architektur: statische Strukturen für sichere, vollständige Antworten, ergänzt durch generative Komponenten für Flexibilität und Nutzerfreundlichkeit. Ideal gekoppelt mit On-Premise-Modellen und Cloud-Service-Angeboten — je nach Anforderung. 

Lesen Sie auch: Hybride Chatbots: Die Zukunft der Kundeninteraktion – Materna Blog

Potrait von Ansprechpartner Carsten Dahlmann

Carsten Dahlmann
Conversational AI Consultant

Carsten Dahlmann ist als Conversational AI Consultant bei Materna an der Schnittstelle zwischen Sprache und Technik tätig. Er begleitet Kunden bei der Konzeption, Redaktion und Optimierung von digitalen Assistenten – vom Dialogdesign bis hin zur Integration generativer KI. Derzeit beschäftigt er sich intensiv mit der Frage, wie generative KI sinnvoll und verständlich in Unternehmenskontexte eingebettet werden kann – und gibt dieses Wissen in Schulungen weiter.

Verwandte Artikel

Event
Dortmund
05.11.2026
XCS Day (Xchange in Cyber Security)

Beim XCS Day treffen sich erneut Expert:innen aus Wirtschaft und Verwaltung, um aktuelle Herausforderungen und Strategien rund um Cyber Security und Regulierung zu diskutieren. Erfahren Sie, wie Organisationen ihre Widerstandsfähigkeit gegenüber…

Weiterlesen
Event
Bochum
03.11.2026
IT.Connect
Weiterlesen
Event
Berlin
13.10.2026 - 15.10.2026
Smart Country Convention (SCCON)

Treffen Sie uns erneut in Halle 27 am Stand 206 auf der führenden Veranstaltung für den digitalen Staat und öffentliche Dienste. Die SCCON ist ein Muss für alle Akteurinnen und Akteure, die den digitalen Wandel aktiv vorantreiben und gestalten.

Weiterlesen
Event
Düsseldorf
30.09.2026
27. ÖV-Symposium NRW

Künstliche Intelligenz, Digitale Souveränität, Cloud, Datenökonomie und Cyber Security bilden den Rahmen für die digitale Transformation der Verwaltung in NRW. Die beliebte Informations- und Dialogplattform für Verwaltungsmodernisierung bietet einen…

Weiterlesen
Event
Dortmund
10.09.2026
Resilience Readiness Day

Erleben Sie einen Tag voller Impulse, Best Practices und wegweisender Ideen rund um nationale Resilienz. Wir laden zum Resilience Readiness Day ein. Materna bringt Entscheider:innen aus Verwaltung, Sicherheitsbehörden, Bundeswehr, KRITIS-Unternehmen…

Weiterlesen
Event
Online
30.07.2026
Webcast „Mitarbeitende im Fokus: HR-Services im öffentlichen Sektor digital gestalten“

Wie können Personalprozesse im öffentlichen Sektor einfacher, transparenter und serviceorientierter gestaltet werden? In diesem Webcast zeigt agineo anhand eines durchgängigen Employee Lifecycles, wie Behörden und öffentliche Einrichtungen…

Weiterlesen
Event
Online
09.07.2026
Webcast „Und wie geht das jetzt mit diesen Agenten?“

Wie unterstützen KI-Agenten den Service-Alltag heute schon konkret? In unserem Webcast geben wir Ihnen einen strukturierten Überblick über BMC HelixGPT und zeigen, welche Agenten aktuell verfügbar sind und wie sie in der Praxis arbeiten. Anhand eines…

Weiterlesen
Event
Berlin
07.07.2026
Digital Mobility Conference

Wie sieht digitale Mobilität im Jahr 2026 aus? Welche Rolle spielen KI und Daten für effizientere, vernetzte und nachhaltige Verkehre auf der Straße, der Schiene und in der Luft? Wie gelingt der Hochlauf beim autonomen Fahren und wie sieht das…

Weiterlesen
Event
Online
07.07.2026
Webcast "Weniger Risiko, mehr Sicherheit – Zero Trust mit Microsoft"

Moderne IT-Infrastrukturen erfordern ein neues Verständnis von Vertrauen. Wachsende Ökosysteme mit hybriden Infrastrukturen, dutzenden Cloud-Diensten und verteilten Arbeitsplätzen erzeugen eine Komplexität, die klassische Perimeter-Ansätze nicht mehr…

Weiterlesen
Event
München
07.07.2026
Materna auf dem IDC FutureTech Summit 2026

Treffen Sie Materna und BMC auf dem IDC FutureTech Summit 2026 und besuchen Sie um 11:15 Uhr den Vortrag „Belastbare Datenpipelines als KI-Erfolgsfaktor – Warum die Orchestrierung von KI wichtiger geworden ist als die KI selbst“. Die Referenten

Weiterlesen