Kurz erklärt
RAG (Retrieval Augmented Generation, deutsch: Abruf-erweiterte Generierung) ist eine Technik, bei der ein KI-Modell vor der Antwortgenerierung relevante Informationen aus externen Quellen abruft.
Die Analogie: Die KI bekommt einen ‘Spickzettel’ mit firmenspezifischem Wissen, bevor sie antwortet.
Wie RAG funktioniert
- Nutzer stellt Frage: ‘Wie viel Urlaub habe ich?’
- System durchsucht Firmendokumente: Urlaubsrichtlinien + Mitarbeiterdaten werden abgerufen
- Relevante Passagen werden dem Prompt hinzugefügt: Die KI erhält Kontext
- KI generiert Antwort: Basierend auf den echten Firmendaten
Business-Beispiele
HR-Chatbot: Mitarbeiter fragt nach Urlaubsanspruch → System ruft Urlaubsrichtlinien + individuelle Mitarbeiterdaten ab → personalisierte Antwort.
Kundenservice: System ruft Kundenhistorie und Produktdaten für individuelle Empfehlungen ab.
Legal/Finance: Suche in internen Dokumenten für Compliance-Fragen – die KI zitiert echte Richtlinien statt zu halluzinieren.
Technical Support: Die KI greift auf Produktdokumentation und Ticket-Historie zu.
Vorteile von RAG
Reduziert Halluzinationen: Die KI hat echte Daten statt erfundener Informationen – Faktentreue steigt erheblich.
Aktuelles Wissen: Nicht nur Trainingsdaten – die KI kann auf heute aktualisierte Dokumente zugreifen.
Datenschutz: Sensible Daten bleiben intern und werden nicht ins Modell trainiert.
Keine teure Feinabstimmung: Das Basismodell bleibt unverändert – spart Kosten und Zeit.
Technische Umsetzung
Vektordatenbanken: Dokumente werden in numerische Repräsentationen (Embeddings) umgewandelt und durchsuchbar gemacht.
Semantic Search: Das System findet semantisch relevante Passagen, nicht nur Keyword-Matches.
Chunk-Strategie: Lange Dokumente werden in überschaubare Abschnitte aufgeteilt.
RAG ist die praktikabelste Lösung
Um KI mit Unternehmenswissen zu verbinden, ohne das Modell selbst zu verändern. Für die meisten Business-Anwendungen ist RAG die optimale Balance zwischen Aufwand und Nutzen.
Zusammenspiel mit MCP
MCP stellt die Verbindung zu Datenquellen her (Protokoll), RAG nutzt diese Verbindung intelligent (Methode). Beide Technologien ergänzen sich perfekt.