Zum Hauptinhalt springen
Drucken

RAG (Retrieval-Augmented Generation)

RAG steht für „Retrieval-Augmented Generation“ und bezeichnet eine Methode, mit der eine KI ihre Antworten auf ein bestimmtes, ausgewähltes Wissen stützt, statt nur aus dem Gedächtnis zu antworten. Vereinfacht: Die KI schlägt erst nach und formuliert dann.

Wie es funktioniert

Normale Sprachmodelle antworten aus dem, was sie beim Training gelernt haben. Das führt zu zwei Problemen – sie kennen keine aktuellen oder firmeninternen Informationen, und sie erfinden manchmal Dinge, die plausibel klingen, aber falsch sind. RAG entschärft beides, indem der KI vor dem Antworten die passenden Dokumente vorgelegt werden.

Der Ablauf hat zwei Schritte. Zuerst durchsucht das System eine Wissensbasis – etwa Handbücher, Produktdaten oder eine Sammlung von Fragen und Antworten – und holt die relevantesten Textstellen heraus (das „Retrieval“). Dann bekommt das Sprachmodell diese Textstellen mitgeliefert und formuliert daraus eine Antwort (die „Generation“).

In der Praxis

Ein Beispiel: Ein Unternehmen baut einen Chatbot für den Kundenservice. Ohne RAG würde der Bot allgemein herumraten. Mit RAG greift er auf die echten Handbücher und Produktinfos der Firma zu und antwortet mit genau diesen Angaben – und kann sogar die Quelle nennen.

Der große Vorteil: Man muss die KI nicht teuer neu trainieren, wenn sich etwas ändert. Es reicht, die hinterlegten Dokumente zu aktualisieren. Deshalb steckt RAG heute hinter vielen Firmen-Chatbots, Wissensdatenbanken und KI-Assistenten, die verlässliche, überprüfbare Auskünfte geben sollen.

Inhaltsverzeichnis
Nach oben scrollen