Enterprise-KI-Glossar: RAG-Systeme, AI-Evaluations & Datenbereinigung
Warum dieses Glossar? In fast jedem Discovery-Gespräch passiert dasselbe: Der Entscheider nickt bei ‚RAG‘, aber meint etwas anderes als der Entwickler im selben Raum. Dieses Glossar soll hier Abhilfe schaffen.
1. Kernarchitektur: RAG-Architektur & Retrieval-Systeme
Definition: Ein Architektur-Muster, das ein Large Language Model (LLM) mit einem externen Information-Retrieval-System kombiniert. Vor der Antwortgenerierung wird eine Abfrage an eine Datenquelle durchgeführt, um relevante Kontexte zu extrahieren, die dem Modell als zusätzliche Eingabe (Prompt-Erweiterung) bereitgestellt werden.
Wirtschaftlicher Nutzen: RAG-Systeme verhindern, dass die KI auf veraltetes Wissen zurückgreift. Sie liefert Antworten basierend auf Ihren aktuellen Dokumenten, nicht auf Trainingsdaten von vor zwei Jahren. Interne Daten werden zur Grundlage, während Datenhoheit bestehen bleibt.
Beispiel-Case: Ein mittelständischer Maschinenbauer hat 5.000 PDF-Wartungshandbücher. Techniker benötigen im Feld oft 15 Minuten, um die korrekte Drehmoment-Einstellung zu finden.
- Lösung: Implementierung eines RAG-Systems. Der Techniker stellt eine Frage per Spracheingabe. Das System extrahiert die exakte Passage aus dem Handbuch Modell-Revision 2023 und liefert die Antwort in 2 Sekunden inkl. Quellenangabe.
Definition: Die Transformation von unstrukturierten Daten (Text, Bild, Audio) in hochdimensionale numerische Vektoren. Dieser Prozess bildet semantische Relationen in einem mathematischen Vektorraum ab, wobei inhaltlich verwandte Konzepte eine geringere Distanz (z. B. Kosinus-Ähnlichkeit) zueinander aufweisen.
Wirtschaftlicher Nutzen: Embeddings ermöglichen es der KI, die Bedeutung hinter Wörtern zu verstehen. So findet das System Informationen über „Kosteneffizienz“, auch wenn im Dokument nur von „Sparen“ die Rede ist.
Beispiel-Case: Ein Kunde sucht in einem Onlineshop für Ersatzteile nach „Vorrichtung zum Feststellen von Bolzen“, im System ist jedoch nur „Arretierungsstift“ hinterlegt.
- Lösung: Durch Embeddings erkennt die KI die semantische Ähnlichkeit. Der Kunde findet das Produkt sofort, was die Conversion-Rate um 12 % steigert.
Definition: Eine Vektordatenbank bildet die Grundlage für RAG Systeme. Sie ist eine spezialisierte Datenbank-Infrastruktur zur Speicherung und Indizierung von Embeddings. Sie ermöglicht die effiziente Durchführung von Ähnlichkeitssuchen (Approximate Nearest Neighbor Search) in multidimensionalen Räumen.
Wirtschaftlicher Nutzen: Skalierbarkeit der AI-Infrastruktur. Sie erlaubt den performanten Zugriff auf Millionen von Datensätzen in Millisekunden, was die Betriebskosten bei wachsendem Datenvolumen stabilisiert. Vektordatenbanken ermöglichen den Einbau von Metadaten, um z.b. Zeiträume zu filtern, um die Wissensbasis vorzufiltern und genau einen Ausschnitt der Daten zu nutzen.
Beispiel-Case: Ein Rechtsportal möchte 2 Millionen Gerichtsurteile durchsuchbar machen. Eine herkömmliche SQL-Datenbank wird bei komplexen semantischen Abfragen zu langsam.
- Lösung: Einsatz einer Vektordatenbank (z. B. Pinecone oder Weaviate). Die Abfragegeschwindigkeit wird um den Faktor 50 beschleunigt, was die Serverkosten pro User-Session um 18 % senkt.
Definition: Der Prozess der Segmentierung von Langtexten in kleinere, eigenständige Einheiten (Chunks). Beim Semantic Chunking erfolgt die Segmentierung nicht nach Zeichenbegrenzung, sondern basierend auf inhaltlichen Kohärenz-Schnittstellen, um die semantische Integrität der Informationseinheit zu wahren.
Wirtschaftlicher Nutzen: Nur wer „smart“ chunked (z.B. nach Absätzen statt nach Zeichenanzahl), stellt sicher, dass die KI den Kontext behält und präzise Quellen zitiert.
Beispiel-Case: Ein 50-seitiger Projektvertrag soll auf Compliance-Risiken geprüft werden. Einfaches Chunking zerschneidet einen wichtigen Haftungsparagraphen in der Mitte.
Lösung: Semantic Chunking erkennt das Ende des Paragraphen. Die KI erhält den vollständigen Kontext der Klausel, was die Genauigkeit der Risikoanalyse von 75 % auf 98 % hebt.
Definition: Der Prozess der Bereinigung von Rohdaten vor der Analyse, d.h. Entfernung von Duplikaten, Ausreißern, fehlenden Werten. Liegt vor der semantischen Analyse.
Data Cleaning vs. Semantic Chunking:
- Datenbereinigung braucht es immer zuerst (Datenqualität)
- Chunking kommt danach (für Retrieval-Systeme relevant)
2. KI-Qualitätskontrolle: AI-Evaluations & Grounding
Definition: Frameworks zur quantitativen und qualitativen Bewertung von LLM-Outputs. Dabei werden vordefinierte Test-Sets genutzt, z.b. um die Performance gegen Benchmarks oder mittels LLM-as-a-judge (automatisierte Bewertung durch ein übergeordnetes Modell) zu validieren. Darüber hinaus existieren zahlreiche Methoden, AI-Evals anzuwenden.
Wirtschaftlicher Nutzen: Evals sind die Qualitätskontrolle der KI. Ohne Evals wissen Sie nicht, ob Ihr System zu 60% oder 95% korrekt antwortet.
Definition: Der Prozess, die Antworten eines LLMs strikt auf verifizierte Datenquellen zu limitieren. Hierbei wird das Modell angewiesen, Behauptungen ausschließlich auf die im Prompt bereitgestellten Kontexte zu stützen.
Wirtschaftlicher Nutzen: Grounding ist das effektivste Mittel gegen Halluzinationen in Fachanwendungen.
Definition: Ein Phänomen, bei dem ein generatives Modell syntaktisch korrekte, aber faktisch falsche oder nicht durch die Quelldaten gedeckte Informationen erzeugt. Dies resultiert meist aus der probabilistischen Natur der Token-Vorhersage.
Wirtschaftlicher Nutzen: Ein hohes Risiko für die Reputation. Durch RAG und Grounding wird dieses Risiko im Enterprise-Umfeld minimiert.
Definition: Eine spezifische Evaluierungsmetrik, die misst, inwieweit die generierte Antwort konsistent mit den bereitgestellten Quelldokumenten ist. Sie prüft, ob alle in der Antwort enthaltenen Fakten direkt aus dem Kontext abgeleitet werden können.
Wirtschaftlicher Nutzen: Hohe Faithfulness garantiert, dass die KI keine eigenen (potenziell falschen) Fakten hinzuerfindet. Grounding ist das Prinzip, Faithfulness ist der Score, mit dem man misst, ob das Prinzip eingehalten wird.
3. Strategisches Prompting & Engineering
Definition: Die methodische Strukturierung komplexer Eingabebefehle. Dies umfasst die Integration von System-Instruktionen, dynamischen Kontexten, Few-Shot-Beispielen und Output-Formatvorgaben in eine logische Abfolge.
Wirtschaftlicher Nutzen: Ermöglicht hochgradig personalisierte und konsistente KI-Antworten in automatisierten Workflows.
Definition: Die maximale Anzahl an Token (Wörtern/Zeichenteilen), die ein LLM in einem einzelnen Inferenzschritt verarbeiten kann. Dies umfasst sowohl die Eingabe (Prompt + Kontext) als auch die generierte Ausgabe.
Wirtschaftlicher Nutzen: Ein größeres Kontextfenster erlaubt es, ganze Bücher oder hunderte E-Mails in einer Anfrage zu analysieren.
Definition: Eine Technik, bei der dem Modell innerhalb des Prompts eine geringe Anzahl von Beispielen (Input-Output-Paare) bereitgestellt wird, um die gewünschte Aufgabe und das Zielformat ohne Parameter-Anpassung (Fine-Tuning) zu spezifizieren.
Wirtschaftlicher Nutzen: Erhöht die Trefferquote bei komplexen Aufgaben (z.B. Datenextraktion in ein bestimmtes JSON-Format) drastisch.
Warum technisches Vokabular für Entscheider zählt
Wenn Sie in einem laufenden KI-Projekt über einen dieser Begriffe stolpern, wir prüfen gern, ob die Architektur dahinter stimmt. Das gemeinsame Verständins dieser Begriffe schafft eine Basis ohne Missverständnisee den Erfolg Ihres KI-Projekts voran zu treiben .
Bei SMADEV übersetzen wir diese Konzepte in funktionale Business-Lösungen. Wir bauen nicht nur KI, wir bauen validierte, skalierbare Systeme, die den Unternehmenserfolg messbar machen.
Wer die Architektur versteht, sieht schnell, wo im eigenen System etwas fehlt. Wenn Sie beim Lesen an ein konkretes Projekt gedacht haben — das ist der richtige Moment für ein Gespräch.