Vollständige Verarbeitung, ohne Kompromisse.
Von der Dokumenteningestion bis zu KI-gestützten Antworten ist jeder Schritt auf Sicherheit, Compliance und Transparenz ausgelegt.
1.254 automatisierte Tests. 27 unabhängige Module. 25 Abstraktionsschnittstellen. 0 proprietäre Abhängigkeiten im zertifizierten Kern.
- 1
Dokumenteningestion
Stapel- oder Einzeldateiverarbeitung. PDF, Excel, PPTX, HTML, Markdown mit automatischer Metadatenextraktion.
- 2
Schutz personenbezogener Daten
Automatische Erkennung und Maskierung sensibler Daten — Namen, Telefonnummern, Bankkonten, E-Mails — vor jeder KI-Verarbeitung.
- 3
Daten-Chunking
Rekursives, hierarchisches Chunking mit Eltern-Kind-Beziehungen für präzises, kontextbewusstes Retrieval.
- 4
Semantische Anreicherung
Vektorindizierung und Datenkontextualisierung für Suche, die Bedeutung versteht, nicht nur Schlüsselwörter.
- 5
Knowledge-Graph-Extraktion
Automatische Entitäts- und Beziehungsextraktion für komplexe Abfragen über Ihren gesamten Dokumentencorpus.
- 6
Kryptografischer SHA-256-Pfad
Jede Pipeline-Operation wird kryptografisch signiert. Vollständig exportierbar für Compliance-Reviews.
- 7
Vollständige Auditierbarkeit
Jede Ingestion, Anfrage und KI-Antwort wird protokolliert und nachverfolgt. Bereit für interne und regulatorische Audits.
- 8
Ferrocene-Compiler-Zertifizierung
Kern kompatibel mit dem zertifizierten Ferrocene-Rust-Compiler, qualifiziert für sicherheitskritische Umgebungen gemäß IEC 62304- und ISO 26262-Standards.
- 9
Hexagonale Architektur
25 abstrakte Port-Traits entkoppeln die Business-Domäne von allen externen Abhängigkeiten. Adapter zeigen zum Kern — nie umgekehrt.
- 10
Natives Rust, Null Drittanbieter-Runtime
Pipeline als einzelne Binärdatei kompiliert, ohne Python, ohne JVM. MSRV 1.75, stabile Toolchain.
- 11
Typisierte Blackboard-Pipeline
Stark typisierter PipelineContext — kein HashMap. Abhängigkeiten zwischen Stages werden beim Aufbau validiert, nicht zur Laufzeit.
- 12
Hybrid-Modus: Linear / Graph / Multi-Query
Drei Retrieval-Modi auf derselben Engine: lineares RAG, GraphRAG (Oxigraph RDF-Triplestore) und Multi-Query-Fusion via Reciprocal Rank Fusion.
- 13
Integriertes GraphRAG
Entitätsextraktion, persistenter RDF-Speicher und Multi-Hop-Traversierung direkt im Ingestion-Pipeline.
- 14
SHA-256 Audit-Kette
Jede Stage emittiert StageStarted / StageCompleted / StageFailed Ereignisse und bildet eine kryptografisch verifizierbare Kette.
- 15
PII-Filter
PiiStage in jede Pipeline einfügbar. Regex-basierte Erkennung und Maskierung personenbezogener Daten vor Indexierung oder Generierung.
- 16
Nativer Parser — Kein Python
HTML, Markdown, Excel, PPTX und PDF in purem Rust geparst via vectrant-adapter-parser-native. Kein externer Parsing-Service.
- 17
Dekorativer LRU-Cache
CachedEmbeddingModel und CachedLLMEngine wrappen jeden Adapter transparent ohne den Kern zu modifizieren.
- 18
Vendor-Agnostische Cloud-Adapter
OpenAI, Anthropic, Ollama, Cohere und pgvector via Feature Flags registriert. API-Schlüssel werden nie gespeichert — nur der Name der Umgebungsvariable.
- 19
Eingabe / Ausgabe Guardrails
InputGuardrail- und OutputGuardrail-Ports zur Erkennung von Prompt-Injection, Toxizitätsfilterung und Durchsetzung von Richtlinienverstößen.
- 20
Dokumenten-Zugriffskontrolle
AccessControl-Port mit RBAC/ABAC zum Filtern von Retrieval-Ergebnissen nach Benutzer oder Rolle ohne Offenlegung eingeschränkter Inhalte.
- 21
RAGAS-Ähnliche Qualitätsbewertung
QualityEvaluator-Port misst Faithfulness, Answer Relevance, Context Precision und Context Recall in der Post-Pipeline-Phase.
- 22
Lifecycle-Metriken und Hooks
PipelineHooks (Stage-Callbacks) und PipelineMetrics (aggregiertes Timing) ohne Eingriff in die Business-Logik.
- 23
27 Crates Workspace, 1.147+ Tests
Unit-, Integrations- und End-to-End-Abdeckung. Null unwrap() / panic!() / unsafe im Produktionscode, durch automatisierte Tests durchgesetzt.