Architecture

Comment ça marche

Vault est un boîtier physique installé dans vos locaux. Il indexe vos documents, expose une API souveraine, et reste invisible à votre stack IA cloud actuelle — vous n'avez rien à changer côté Copilot, Cursor ou ChatGPT.

Le flux en un schéma

┌──────────────────────────┐ │ Vos collaborateurs │ │ utilisent Copilot M365 │ inchangé │ ChatGPT · Cursor · Claude │ │ comme aujourd'hui │ └────────────┬─────────────┘ │ "Rédige-moi un mémo sur le dossier X" ▼ ┌────────────────────────────────────────────────────────┐ │ Copilot / ChatGPT Enterprise / Cursor │ │ (votre IA cloud actuelle, inchangée) │ └────────────┬───────────────────────────────────────────┘ │ MCP / API : "retrieve context about dossier X" ▼ ┌────────────────────────────────────────────────────────┐ │ LMbox VAULT (dans vos locaux) │ │ ┌──────────────────────────────────────────────────┐ │ │ │ RAG vectoriel + ACL + audit chain SHA-256 │ │ │ │ │ │ │ │ Documents : restent on-prem. │ │ │ │ Chunks retournés : anonymisés selon vos règles. │ │ │ │ Audit : chaque requête tracée + signée. │ │ │ └──────────────────────────────────────────────────┘ │ └────────────┬───────────────────────────────────────────┘ │ Top-5 chunks pertinents (sans données sensibles) ▼ Copilot écrit le mémo en utilisant le contexte.

Le workflow utilisateur en 3 étapes

1Vous indexez vos documents
SharePoint, Drive, NAS, Salesforce, Jira, Slack, Confluence, ServiceNow… 8 connecteurs natifs. Sync delta automatique, vous n'avez rien à pousser manuellement.
2Vos équipes utilisent leur IA habituelle
Copilot M365 dans Word/Outlook/Teams. Cursor dans VS Code. ChatGPT Enterprise dans le navigateur. Claude Code en CLI. Aucun changement d'outil.
3Vault répond aux requêtes de contexte
Vault répond aux requêtes de contexte depuis vos locaux. Votre IA cloud reçoit les passages pertinents (anonymisés selon vos règles) mais ne voit jamais vos documents bruts.

Ce qui ne sort jamais de votre bâtiment

✓ Reste on-prem
• Vos documents bruts (PDF, Word, Excel, etc.)
• Vos métadonnées (titres, dates, auteurs)
• Votre liste de clients, dossiers, projets
• Vos embeddings vectoriels
• Vos audit logs (chaîne SHA-256)
• Vos credentials connecteurs (chiffrés Fernet)
→ Sort (avec votre contrôle)
• Les chunks anonymisés (passages de 200-500 mots)
• Les chunks sont filtrés ACL avant tout retour
• Les chunks sont passés par RGPD redact (NIR, IBAN, emails internes masqués)
• Chaque appel à votre IA cloud est audité côté Vault

Stack technique (pour votre RSSI)

CoucheTechnologie
OS applianceLinux LTS (Debian 12 / Ubuntu 24.04 LTS) + boot signé
Base donnéesPostgreSQL 16 + pgvector (HNSW index, vector_l2_ops)
Embeddingsnomic-embed-text v1.5 (768d, défaut) ou bge-m3 (1024d, multilingue)
ChunkingRécursif semantic-aware (512 tokens, overlap 64)
API HTTPREST OpenAI-compatible (/v1/retrieve, /v1/embeddings) + endpoints natifs
MCP server4 outils (search, read_doc, list_sources, find_similar) — spec MCP 2025-11-25
AuthHMAC-SHA256 master key + per-tenant API key · OIDC en option
AuditChain SHA-256 chaînée (même primitive blockchain compliance)
Chiffrement at-restFernet (AES-128-CBC + HMAC-SHA256)
ObservabilitéPrometheus exporter + Grafana embedded
Et si je veux remplacer mon IA cloud par du on-prem plus tard ?
Vault est upgrade-ready vers LMbox complet sans changement de matériel (sauf depuis la taille S vers M+). Vous activez simplement une nouvelle license et notre support déploie en moins de 5 minutes l'inférence LLM locale (Mistral Small 4 par défaut). Tarif d'upgrade pré-négocié dans votre contrat Vault.
Voir les intégrations → Voir les tarifs