Un'elaborazione end-to-end, senza compromessi.
Dall'ingestion dei documenti alle risposte generate dall'IA, ogni passaggio è progettato per sicurezza, conformità e trasparenza.
1.254 test automatizzati. 27 moduli indipendenti. 25 interfacce di astrazione. 0 dipendenze proprietarie nel core certificato.
- 1
Ingestion di documenti
Elaborazione in batch o singolo file. PDF, Excel, PPTX, HTML, Markdown con estrazione automatica dei metadati.
- 2
Protezione dei dati personali
Rilevamento e mascheramento automatici dei dati sensibili — nomi, telefoni, conti bancari, email — prima di qualsiasi elaborazione IA.
- 3
Chunking dei dati
Chunking ricorsivo e gerarchico con relazioni padre-figlio per un retrieval preciso e contestuale.
- 4
Arricchimento semantico
Indicizzazione vettoriale e contestualizzazione dei dati per una ricerca che comprende il significato, non solo le parole chiave.
- 5
Estrazione di knowledge graph
Estrazione automatica di entità e relazioni per query complesse sull'intero corpus documentale.
- 6
Traccia crittografica SHA-256
Ogni operazione della pipeline è firmata crittograficamente. Completamente esportabile per le revisioni di conformità.
- 7
Auditabilità completa
Ogni ingestion, query e risposta IA è registrata e tracciabile. Pronto per audit interni e regolatori.
- 8
Certificazione compilatore Ferrocene
Core compatibile con il compilatore Rust certificato Ferrocene, qualificato per ambienti critici secondo le norme IEC 62304 e ISO 26262.
- 9
Architettura Esagonale
25 port trait astratti disaccoppiano il dominio di business da tutte le dipendenze esterne. Gli adattatori puntano verso il core — mai il contrario.
- 10
Rust Nativo, Zero Runtime di Terze Parti
Pipeline compilata in un singolo binario, senza Python, senza JVM. MSRV 1.75, toolchain stabile.
- 11
Pipeline Tipizzata a Blackboard
PipelineContext fortemente tipizzato — nessuna HashMap. Le dipendenze tra stage sono validate al momento dell'assemblaggio, non a runtime.
- 12
Modalità Ibrida: Lineare / Grafo / Multi-Query
Tre modalità di retrieval sullo stesso motore: RAG lineare, GraphRAG (RDF triplestore Oxigraph) e fusione multi-query via Reciprocal Rank Fusion.
- 13
GraphRAG Integrato
Estrazione di entità, archiviazione RDF persistente e attraversamento multi-hop direttamente nella pipeline di ingestion.
- 14
Catena di Audit SHA-256
Ogni stage emette eventi StageStarted / StageCompleted / StageFailed formando una catena crittograficamente verificabile.
- 15
Filtro PII
PiiStage inseribile in qualsiasi pipeline. Rilevamento e mascheramento basati su regex prima dell'indicizzazione o generazione.
- 16
Parser Nativo — Senza Python
HTML, Markdown, Excel, PPTX e PDF analizzati in puro Rust tramite vectrant-adapter-parser-native. Nessun servizio di parsing esterno.
- 17
Cache LRU Decorativa
CachedEmbeddingModel e CachedLLMEngine avvolgono qualsiasi adattatore in modo trasparente senza modificare il core.
- 18
Adattatori Cloud Vendor-Agnostic
OpenAI, Anthropic, Ollama, Cohere e pgvector registrati tramite feature flag. Le chiavi API non vengono mai archiviate — solo il nome della variabile d'ambiente.
- 19
Guardrail di Ingresso / Uscita
Porte InputGuardrail e OutputGuardrail per rilevare prompt injection, filtrare tossicità e applicare le politiche.
- 20
Controllo Accesso Documentale
Porta AccessControl con RBAC/ABAC per filtrare i risultati di retrieval per utente o ruolo senza esporre contenuti riservati.
- 21
Valutazione Qualità RAGAS-like
Porta QualityEvaluator che misura faithfulness, answer relevance, context precision e context recall nella fase post-pipeline.
- 22
Metriche e Hook del Ciclo di Vita
PipelineHooks (callback per stage) e PipelineMetrics (timing aggregato) senza intrusione nella logica di business.
- 23
27 Crates Workspace, 1.147+ Test
Copertura unit, integrazione ed end-to-end. Zero unwrap() / panic!() / unsafe nel codice di produzione, garantito da test automatizzati.