Optimale RAG-Dokumente erstellen
Best Practices für Wissensdokumente, die perfekt mit RAG-Chatbots funktionieren
Warum ist die Dokumentenstruktur wichtig?
RAG-Chatbots (Retrieval Augmented Generation) nutzen Ihre Dokumente als Wissensbasis. Je besser strukturiert Ihre Dokumente sind, desto präziser und hilfreicher sind die Antworten des Chatbots. Schlecht strukturierte Dokumente führen zu ungenauen oder irrelevanten Antworten.
Das sollten Sie TUN
Strukturierte Absätze mit klaren Überschriften verwenden
Jeder Absatz sollte ein spezifisches Thema behandeln und eine aussagekräftige Überschrift haben
Semantische Zusammenhänge explizit machen
Verbinden Sie verwandte Konzepte mit klaren Erklärungen: 'Dies bezieht sich auf...', 'Im Gegensatz zu...'
Konkrete Beispiele und Use Cases einbauen
Beispiele helfen dem Chatbot, praktische Antworten auf ähnliche Fragen zu geben
Synonyme und alternative Formulierungen nennen
'Rückgabe (auch: Rücksendung, Umtausch, Retoure)' hilft bei verschiedenen Formulierungen
Fragen direkt beantworten
Formulieren Sie Abschnitte wie FAQs: 'Kann ich Produkte zurückschicken? Ja, innerhalb von 14 Tagen...'
Das sollten Sie VERMEIDEN
Reine Tabellen ohne Kontext
Tabellen sollten immer mit erklärenden Texten versehen sein, die den Kontext liefern
Keyword-Stuffing
Natürliche Sprache funktioniert besser als künstlich viele Keywords einzubauen
Sehr lange, unstrukturierte Textblöcke
Teilen Sie lange Texte in thematische Absätze mit Überschriften auf
Wichtige Informationen nur in Bildern
Text in Bildern kann nicht durchsucht werden - immer auch als Text bereitstellen
Inkonsistente Terminologie
Verwenden Sie einheitliche Begriffe für die gleichen Konzepte im gesamten Dokument
Vorher / Nachher Beispiel
Rückgaberegelung
Rückgabe 14 Tage. Original Verpackung. Rechnung mitschicken. Porto zahlt Kunde. Geld zurück nach Prüfung. Ausnahmen: Hygieneartikel, reduzierte Ware, Sonderanfertigungen.
Problem: Keine Struktur, unvollständige Sätze, unklar für verschiedene Fragestellungen
Kann ich Produkte zurückschicken?
Ja, Sie haben ein 14-tägiges Rückgaberecht (auch: Widerrufsrecht, Rücksendung).
Voraussetzungen für die Rückgabe:
- Produkt in Originalverpackung
- Rechnung/Kaufbeleg beilegen
- Innerhalb von 14 Tagen nach Erhalt
Kosten der Rücksendung:
Die Rücksendekosten trägt der Kunde.
Ausnahmen vom Rückgaberecht:
- Hygieneartikel
- Reduzierte/Sale-Ware
- Individuell angefertigte Produkte
Vorteil: Klare Struktur, vollständige Sätze, beantwortet verschiedene Fragestellungen
Praktische Tipps
Format der Dokumente
- • PDF, DOCX, TXT oder Markdown sind ideal
- • Strukturierte Formate bevorzugen (Markdown, DOCX mit Styles)
- • Vermeiden Sie gescannte PDFs ohne OCR
Länge der Dokumente
- • Optimal: 500-2000 Wörter pro Dokument
- • Zu kurz (<200 Wörter): Wenig Kontext
- • Zu lang (>5000 Wörter): In mehrere Dokumente aufteilen
Aktualität pflegen
- • Dokumente regelmäßig aktualisieren
- • Veraltete Informationen entfernen
- • Datum der letzten Aktualisierung angeben
Testen und optimieren
- • Chatbot mit typischen Fragen testen
- • Bereiche mit schwachen Antworten identifizieren
- • Dokumente entsprechend anpassen
Wie funktioniert die intelligente Suche?
RAG-Chatbots nutzen Vektorsuche, um die Bedeutung von Fragen zu verstehen – nicht nur einzelne Wörter
Normale Keyword-Suche
Wie es funktioniert:
Sucht nur nach exakten Wortübereinstimmungen in Dokumenten
Beispiel-Suche:
"Rückgaberecht"
Findet nur Dokumente mit genau diesem Wort
Wird NICHT gefunden:
- "Kann ich Produkte zurückschicken?"
- "Was ist eure Rückgabepolitik?"
- "Umtausch möglich?"
RAG-Chatbot mit Vektorsuche
Wie es funktioniert:
Versteht die Bedeutung und findet semantisch ähnliche Inhalte
Beispiel-Suchen:
"Kann ich Produkte zurückschicken?"
"Was ist eure Rückgabepolitik?"
"Umtausch möglich?"
Findet ALLE relevanten Infos:
- Erkennt Synonyme automatisch
- Versteht verschiedene Formulierungen
- Findet inhaltlich passende Antworten
Technologie dahinter: Vektorsuche
Vektorsuche wandelt Text in mathematische "Fingerabdrücke" (Vektoren) um. Texte mit ähnlicher Bedeutung haben ähnliche Vektoren (die "Fingerabdrücke sind ähnlich, der Abstand der beiden ist gering) – so erkennt der Chatbot, dass "Rückgabe", "Umtausch" und "zurückschicken" im gleichen Kontext relevant sind, auch wenn die Wörter unterschiedlich sind.
Bereit, Ihren Chatbot zu optimieren?
Mit diesen Best Practices erstellen Sie eine optimale Wissensbasis für Ihren RAG-Chatbot
