Architecture

Comment ça marche

Vault est un boîtier physique installé dans vos locaux. Il indexe vos documents, expose une API souveraine, et reste invisible à votre stack IA cloud actuelle — vous n'avez rien à changer côté Copilot, Cursor ou ChatGPT.

Le flux en un schéma

┌──────────────────────────┐ │ Vos collaborateurs │ │ utilisent Copilot M365 │ inchangé │ ChatGPT · Cursor · Claude │ │ comme aujourd'hui │ └────────────┬─────────────┘ │ "Rédige-moi un mémo sur le dossier X" ▼ ┌────────────────────────────────────────────────────────┐ │ Copilot / ChatGPT Enterprise / Cursor │ │ (votre IA cloud actuelle, inchangée) │ └────────────┬───────────────────────────────────────────┘ │ MCP / API : "retrieve context about dossier X" ▼ ┌────────────────────────────────────────────────────────┐ │ LMbox VAULT (dans vos locaux) │ │ ┌──────────────────────────────────────────────────┐ │ │ │ RAG vectoriel + ACL + audit chain SHA-256 │ │ │ │ │ │ │ │ Documents : restent on-prem. │ │ │ │ Chunks retournés : anonymisés selon vos règles. │ │ │ │ Audit : chaque requête tracée + signée. │ │ │ └──────────────────────────────────────────────────┘ │ └────────────┬───────────────────────────────────────────┘ │ Top-5 chunks pertinents (sans données sensibles) ▼ Copilot écrit le mémo en utilisant le contexte.

Le workflow utilisateur en 3 étapes

1Vous indexez vos documents

SharePoint, Drive, NAS, Salesforce, Jira, Slack, Confluence, ServiceNow… 8 connecteurs natifs. Sync delta automatique, vous n'avez rien à pousser manuellement.

2Vos équipes utilisent leur IA habituelle

Copilot M365 dans Word/Outlook/Teams. Cursor dans VS Code. ChatGPT Enterprise dans le navigateur. Claude Code en CLI. Aucun changement d'outil.

3Vault répond aux requêtes de contexte

Vault répond aux requêtes de contexte depuis vos locaux. Votre IA cloud reçoit les passages pertinents (anonymisés selon vos règles) mais ne voit jamais vos documents bruts.

Ce qui ne sort jamais de votre bâtiment

✓ Reste on-prem

• Vos documents bruts (PDF, Word, Excel, etc.)
• Vos métadonnées (titres, dates, auteurs)
• Votre liste de clients, dossiers, projets
• Vos embeddings vectoriels
• Vos audit logs (chaîne SHA-256)
• Vos credentials connecteurs (chiffrés Fernet)

→ Sort (avec votre contrôle)

• Les chunks anonymisés (passages de 200-500 mots)
• Les chunks sont filtrés ACL avant tout retour
• Les chunks sont passés par RGPD redact (NIR, IBAN, emails internes masqués)
• Chaque appel à votre IA cloud est audité côté Vault

Stack technique (pour votre RSSI)

Couche	Technologie
OS appliance	Linux LTS (Debian 12 / Ubuntu 24.04 LTS) + boot signé
Base données	PostgreSQL 16 + pgvector (HNSW index, vector_l2_ops)
Embeddings	nomic-embed-text v1.5 (768d, défaut) ou bge-m3 (1024d, multilingue)
Chunking	Récursif semantic-aware (512 tokens, overlap 64)
API HTTP	REST OpenAI-compatible (`/v1/retrieve`, `/v1/embeddings`) + endpoints natifs
MCP server	4 outils (search, read_doc, list_sources, find_similar) — spec MCP 2025-11-25
Auth	HMAC-SHA256 master key + per-tenant API key · OIDC en option
Audit	Chain SHA-256 chaînée (même primitive blockchain compliance)
Chiffrement at-rest	Fernet (AES-128-CBC + HMAC-SHA256)
Observabilité	Prometheus exporter + Grafana embedded

Et si je veux remplacer mon IA cloud par du on-prem plus tard ?

Vault est upgrade-ready vers LMbox complet sans changement de matériel (sauf depuis la taille S vers M+). Vous activez simplement une nouvelle license et notre support déploie en moins de 5 minutes l'inférence LLM locale (Mistral Small 4 par défaut). Tarif d'upgrade pré-négocié dans votre contrat Vault.

Voir les intégrations → Voir les tarifs