Vector Database
–-> zum BOTwiki
Eine Vector Database ist eine spezialisierte Datenbank zur Speicherung und Suche von Embedding-Vektoren. Sie ist das technische Rückgrat jeder semantischen Suche und damit ein zentraler Baustein moderner Knowledge AI in Voice- und Chat-Anwendungen. Für einen Chatbot oder Voicebot mit substantieller Wissensbasis ist die Wahl und Konfiguration der Vector Database eine direkte Stellschraube für Antwortqualität, Latency und Betriebskosten.
Was Vector Databases von klassischen Datenbanken unterscheidet
Relationale Datenbanken arbeiten mit präzisen Werten und exakten Joins. Eine Vector Database hingegen speichert hochdimensionale Vektoren und unterstützt Nearest-Neighbor-Suchen. Dafür verwenden Vector Databases approximative Algorithmen wie HNSW, IVF oder PQ, die enorme Geschwindigkeiten ermöglichen, gleichzeitig aber einen leichten, kontrollierten Qualitätsverlust einführen.
Gängige Optionen am Markt
- Spezialisierte Vector Databases: Pinecone, Weaviate, Qdrant, Milvus.
- Erweiterungen klassischer Datenbanken: pgvector für PostgreSQL, Elasticsearch mit Vektor-Suche.
- Cloud-native Services: Vertex AI Matching Engine, Azure AI Search, Amazon OpenSearch.
BOTfriends wählt die Vector Database modellagnostisch pro Use Case – entscheidend sind Skalierbarkeit, EU-Hosting, Filter-Fähigkeiten und Integration in die bestehende Plattform.
Vector Database in der RAG-Pipeline
In einer typischen RAG-Pipeline stehen drei Schritte: Chunking der Dokumente, Erzeugen der Embeddings und Speicherung in der Vector Database. Bei einer Anfrage wird die Frage selbst eingebettet, die Vector Database liefert die nächsten Treffer, und ein Reranker entscheidet über die finale Reihenfolge. Erst dieser kombinierte Stack ermöglicht Semantic Search auf Produktionsniveau.
Skalierung, Filterung und Governance
Produktive Vector Databases müssen mehr leisten als reine Nächste-Nachbar-Suche. Wichtig sind Metadaten-Filter (etwa Sprache, Mandant, Datum), Multi-Tenancy für verschiedene Kundenkontexte und ein klares Berechtigungskonzept. Für BOTfriends ist EU-Hosting Pflicht, ebenso wie auditierbare Logs und ein klar definierter Löschprozess. So bleibt die Plattform DSGVO-konform und gleichzeitig leistungsfähig.
Häufig gestellte Fragen (FAQ)
Nicht zwingend. Erst ab gewissen Volumina lohnen sich spezialisierte Systeme.
Sehr wichtig. Mandantenfilter, Sprachfilter oder Dokumentdatum machen aus einer generischen Suche ein produktiv einsetzbares Knowledge-AI-System.
Das hängt von Anzahl und Dimensionalität der Vektoren ab. Über Embeddings-Quantisierung lässt sich der Speicherbedarf deutlich reduzieren.
Ja. Verschiedene Vektor-Spaces lassen sich in derselben Plattform halten, etwa für unterschiedliche Sprachen oder Use Cases. Wichtig ist eine saubere Trennung und Versionierung.
–> Zurück zum BOTwiki

AI Agent ROI Rechner
Kostenloses Training: Chatbot Crashkurs
Whitepaper: Die Akzeptanz von Chatbots