Technik
Embedding
Mathematische Darstellung von Text als Zahlenvektor der semantische Bedeutung kodiert
Ein Embedding ist die Umwandlung von Text in einen Vektor aus Zahlen. Texte mit ähnlicher Bedeutung erhalten ähnliche Vektoren — dadurch kann ein System semantische Ähnlichkeit berechnen.
Praktische Bedeutung
Embeddings sind die Grundlage für Vektordatenbanken und RAG-Systeme. Wenn ein Agent relevante Dokumente zu einer Frage sucht, vergleicht er den Embedding-Vektor der Frage mit den Vektoren aller gespeicherten Dokumente.
Beispiel
- “Wie spare ich Steuern?” und “Welche Steuerabzüge gibt es?” haben ähnliche Embeddings
- Ein RAG-System findet deshalb beide Dokumente wenn nach einem gefragt wird