Centre de confiance

Comment Mnemom gagne la confiance que nous vous demandons d'accorder.

Chaque affirmation du site marketing renvoie à un chemin de code, à une page de documentation et à un test. Cette page est le point d'entrée de la surface de niveau audit : architecture, divulgation, attestations et SBOM. Tout est en ligne, daté et remplaçable.

security.txt Signaler une vulnérabilité

Architecture

Les quatre points de contrôle, en un seul schéma.

Mnemom est un plan de confiance autour de votre flotte d'agents. Chaque requête traverse quatre points de contrôle — porte d'entrée, intérieur·autonomie (AIP), intérieur·intégrité (AAP), porte de sortie — et chaque verdict est signé.

Porte d'entrée

Filtrage des messages entrants — chaque prompt et résultat d'outil parvenant à votre agent est évalué pour détecter prompt injection, ingénierie sociale, injection indirecte et coercition d'appel d'outil. Verdict signé Ed25519.

Inside · autonomy · AIP

L'Agent Integrity Protocol évalue la pensée de l'agent par rapport à sa Alignment Card à chaque tour. Les dérives, désalignements de valeurs et violations de bornes apparaissent dans la trace de décision signée.

Inside · integrity · AAP

L'Agent Alignment Protocol enregistre les AP-Traces a posteriori et vérifie la cohérence comportementale par rapport à la card. La chaîne d'audit relie les points de contrôle AIP aux traces AAP via `linked_trace_id`.

Porte de sortie

Filtrage des réponses sortantes — chaque réponse de l'agent est évaluée contre PII, secrets, violations d'alignment card et schémas de conseils réglementés avant qu'elle ne quitte votre périmètre. Une fuite non rédigée ne peut pas produire un certificat signé valide.

Conscience Architecture Card (CAC)

Chaque déploiement Mnemom est lié à une CAC signée déclarant quels points de contrôle sont actifs et dans quel mode (off / observe / nudge / enforce / enforce_sync). La CAC est publiée par tenant et fait partie de la posture de confiance vérifiable.

Politique de versions

Politique de versions AAP + AIP et processus RFC du protocole.

Les deux protocoles suivent un versionnement semver. Les changements rupturants passent par un processus RFC public avant d'arriver dans une release. Les versions mineures ajoutent des champs avec valeurs par défaut ; les versions majeures peuvent changer le format wire avec une période de dépréciation.

Version mineure (1.X.0) : additive — nouveaux champs, nouvelles valeurs d'enum, nouvelles catégories de concern optionnelles. Rétrocompatible.
Version patch (1.0.X) : corrections de bugs, mises à jour de doc. Aucun changement de schéma.
Version majeure (X.0.0) : changement de format wire. Passe par une RFC publique sur github.com/mnemom/aap/discussions ou aip/discussions. Fenêtre minimale de commentaires de 90 jours avant une RC v2.
Dépréciations : minimum 180 jours entre l'annonce et le retrait. Les verdicts émis sous une version dépréciée restent vérifiables indéfiniment.

Versions actuellement publiées

npm: @mnemom/agent-alignment-protocol
npm: @mnemom/agent-integrity-protocol
npm: @mnemom/aip-verifier
PyPI: agent-alignment-protocol
PyPI: agent-integrity-proto

Ouvrir une RFC

Modèle de menaces

Ce que Mnemom est conçu pour empêcher — et ce qu'il ne couvre pas.

Résumé public du modèle de menaces. Le document complet vit dans le repo safe-house-hardening et est revu trimestriellement. T8 publiera ici la version longue.

Dans le périmètre (empêché par conception)

Violations de bornes — actions hors de l'Alignment Card déclarée de l'agent.
Injection de prompt + injection indirecte — contenu entrant adversarial.
Fuite de données sortantes — PII, secrets, violations d'alignment card.
Dérive comportementale — déviation graduelle par rapport à la baseline de l'agent.
Fabrication de verdicts — la couche de preuve détecte les verdicts trafiqués ou fabriqués.
Fuite de données inter-tenants — frontières strictes entre tenants sur les prompts, traces et alignment cards.

Hors périmètre (divulgation honnête)

·Correction d'inférence LLM — nous prouvons le jugement de l'auditeur, pas la sortie du modèle.
·Raisonnement stéganographique sophistiqué — les agents qui raisonnent de manière invisible échappent à l'analyse des thinking blocks.
·Compromission de l'infrastructure du fournisseur LLM sous-jacent.
·Attaques physiques / chaîne d'approvisionnement contre le déploiement du client.
·Déni de service contre l'infrastructure Mnemom (mitigé, pas éliminé).

Divulgation responsable

Signaler une vulnérabilité — SLA de 90 jours.

La divulgation coordonnée protège tout le monde. Nous accusons réception rapidement, corrigeons en public et créditons le rapporteur.

1
Accusé de réception sous 3 jours ouvrés.
2
Confirmation de la reproduction sous 14 jours.
3
Correction ou mitigation sous 90 jours après l'accusé de réception.
4
Divulgation publique : 90 jours après l'accusé de réception, ou plus tôt si le correctif est livré et les clients sont protégés.

[email protected]Lire security.txt

Clé PGP disponible sur mnemom.ai/.well-known/pgp-key.txt (lors de la publication)

Bug bounty

Programme de divulgation de bonne foi (bounty formel en cours de cadrage).

Un programme de bug bounty formel est en cours de cadrage. En attendant son lancement, nous opérons un processus privé de divulgation de bonne foi. Les rapports éligibles obtiennent une mention au hall of fame et peuvent recevoir une reconnaissance financière à notre discrétion.

Dans le périmètre

Gateway (gateway.mnemom.ai) — signature des requêtes, filtrage entrant de la porte d'entrée, pipeline d'attestation.
Observer + analyse a posteriori (api.mnemom.ai/v1/analyze) — dérivation des verdicts, filtrage sortant de la porte de sortie.
Control plane (api.mnemom.ai) — auth, facturation, containment, logs d'audit.
SDK (@mnemom/agent-alignment-protocol, @mnemom/agent-integrity-protocol) — logique de vérification, vérification des preuves ZK.
Contrats on-chain (MnemoReputationRegistry, MnemoMerkleAnchor sur Base L2).
Surfaces marketing (mnemom.ai, app.mnemom.ai) — authentification, gestion de session, RBAC.

Hors périmètre

·Rate limiting et déni de service (mitigé par Cloudflare ; pas une cible de bounty).
·Ingénierie sociale contre les employés.
·Attaques physiques contre l'infrastructure.
·Services tiers dont nous dépendons (Cloudflare, Supabase, Stripe, Resend, Anthropic, OpenAI). À signaler directement au fournisseur.
·Rapports nécessitant l'accès à l'email, l'appareil ou au compte social d'une victime.

Hall of fame — vide pour l'instant ; les rapporteurs y seront listés avec leur consentement.

Conformité

Attestations et posture.

Posture de conformité actuelle. Nous publions les changements de posture au fil de l'eau — readiness n'est pas attestation.

SOC 2 Type II

Readiness en cours

Audit en cours de cadrage. Nous publierons l'URL du rapport à l'achèvement.

EU AI Act

Article 50 prêt · Article 15 prêt

Article 50 (transparence, août 2026) et Article 15 (exactitude / robustesse / cybersécurité, août 2027). Les presets SDK sont livrés aujourd'hui ; les docs de mapping sur /research/eu-ai-act.

HIPAA

Flux compatibles HIPAA

Détecteurs DLP pour les patterns PHI. BAA disponible en Enterprise. Nous ne sommes pas nous-mêmes covered entity.

ISO 42001 / 27001

Cadrage en cours

Non certifié et hors audit actif. Cadrage en cours ; le parcours sera publié dès qu'il se précisera.

NIST AI RMF 1.0

Mappé (non certifié)

GOVERN/MAP/MEASURE/MANAGE mappées aux contrôles livrés dans /guides/eu-compliance. Cadre volontaire — un mapping technique, pas une certification NIST.

OWASP Agentic Top 10

Mappé (ASI01–10)

Les dix catégories ASI mappées aux contrôles livrés de Safe House / AEGIS (lacunes indiquées honnêtement) — voir /guides/owasp-agentic-top-10 et le tableau des menaces de /security.

État du réseau AEGIS

Sept SLO pour le réseau défensif inter-tenants.

AEGIS — le réseau de sécurité inter-tenants qui enveloppe la Safe House — porte ses propres SLO publiés. Les cibles sont définies ; les premières mesures seront publiées 30 jours après la GA. Le tableau complet, le code source et les données historiques se trouvent sur /trust/slos.

Propagation des Managed Rules

P95 ≤ 30s

Promotion signée jusqu'au chargement par le gateway, via deux chemins de livraison signés et indépendants.

Mesure en attente

Fraîcheur du jeu de règles

P99 ≤ 5 min

En fonctionnement normal, à travers la flotte de gateways.

Mesure en attente

Alerte de péremption

P0 à 24 h

Astreinte alertée dès qu'un jeu de recettes sur un gateway est périmé depuis 24 heures.

Mesure en attente

Disponibilité du failover

99,99 %

Le gateway charge avec succès un jeu de règles vérifié à travers plusieurs niveaux de lecture indépendants.

Mesure en attente

Vérification de signature

≥ 99,99 %

Un échec de signature déclenche un P0 et un fallback R2 avec une chaîne de signature indépendante.

Mesure en attente

Taux de faux positifs par recette

FP glissant 7 jours par recette

Auto-rollback lorsque le ratio FP d'une recette dépasse le seuil par palier (CLPI Phase 2).

Mesure en attente

Gate de phase de mutation

Seuil de détection soutenue

Taux de détection arena d'entrée/sortie par seau. Par (substrat × vertical × pattern × source).

Mesure en attente

La première fenêtre de mesure de 30 jours sera publiée 30 jours après la GA. Nous n'annonçons pas à l'avance des chiffres que nous ne pouvons pas défendre.

Tableau complet des SLO Avis de sécurité Flux d'IoC (STIX 2.1)

EU AI Act

Articles 10, 12 et Annexe IV — ce que fournit AEGIS.

L'application de l'EU AI Act aux systèmes d'IA à haut risque commence le 2026-08-02. Trois dispositions sont structurantes pour toute infrastructure d'agents : gouvernance des données (Article 10), tenue des registres (Article 12) et documentation technique (Annexe IV). AEGIS produit les preuves vérifiables exigées par chacune. La conformité est une responsabilité conjointe ; le tableau ci-dessous nomme ce que nous fournissons.

Article 10

Gouvernance des données pour l'IA à haut risque

Chaîne d'événements de gouvernance append-only — chaque promotion de recette, retrait, changement de mode et action de relecteur est signé Ed25519 et chaîné. Le marquage d'identité de l'écrivain isole les sources de signal arena, client et opérateur au niveau du schéma.

Article 12

Tenue des registres et traçabilité

Chaîne d'audit signée tout au long du cycle de vie — signature de promotion, signature d'enveloppe KV, signature d'enveloppe R2 sur des clés indépendantes, lignes d'évaluation par gateway estampillées avec la substrate fingerprint et l'identité de l'écrivain. Les enregistrements sont interrogeables, rejouables et inviolables.

Annexe IV

Documentation technique

CMS public d'avis sur /trust/advisories avec comptes rendus post-incident signés, flux d'IoC lisible par machine sur /v1/trust/iocs (STIX 2.1), et SLO publiés sur /trust/slos. La documentation technique que cherchent les auditeurs est la même que celle que lisent les clients et les agents.

Pas un conseil juridique. Cette page nomme les preuves produites par AEGIS ; les obligations au titre du règlement restent celles du déployeur. Références EU AI Act : Articles 10, 12 et Annexe IV. L'application des obligations à haut risque commence le 2026-08-02.

Fiabilité

Objectifs de niveau de service.

Les cibles que Mnemom s'engage publiquement à tenir sont les mêmes que celles que le harnais de validation vérifie en CI. L'état courant en direct est sur status.mnemom.ai ; les engagements et le raisonnement sont documentés ici.

Lire les engagements SLO Statut en direct

Chaîne d'approvisionnement

Publication du SBOM à chaque release.

Chaque release du gateway worker et chaque version de SDK est livrée avec un SBOM CycloneDX. Les SBOM par release sont liés depuis la page de release sur GitHub.

SBOM AAP · github.com/mnemom/aap/releases
SBOM AIP · github.com/mnemom/aip/releases

Les SBOM sont au format CycloneDX 1.5 JSON. Nous nous engageons à publier à chaque release ; nous ne nous engageons pas à embarquer le SBOM dans une attestation TUF ou in-toto aujourd'hui (à l'étude).

Dernière mise à jour le 2026-05-16. Cette page évolue en parallèle de la track safe-house-hardening.

Audité trimestriellement · prochain rafraîchissement juillet 2026

Inventaire des affirmations marketing →