Centro de Confianza

Cómo Mnemom se gana la confianza que le pedimos.

Cada afirmación del sitio de marketing se corresponde con una ruta de código, una página de documentación y un test. Esta página es el punto de entrada de la superficie de nivel auditoría: arquitectura, divulgación, atestaciones y SBOM. Todo en vivo, fechado y reemplazable.

security.txt Reportar una vulnerabilidad

Arquitectura

Los cuatro puntos de control, en un solo diagrama.

Mnemom es un plano de confianza alrededor de su flota de agentes. Cada solicitud atraviesa cuatro puntos de control — puerta de entrada, interior·autonomía (AIP), interior·integridad (AAP), puerta de salida — y cada veredicto está firmado.

Puerta de entrada

Filtrado de mensajes entrantes — cada prompt y resultado de herramienta que llega a su agente se evalúa contra prompt injection, ingeniería social, inyección indirecta y coerción de llamadas a herramientas. Veredicto firmado con Ed25519.

Interior · autonomía · AIP

El Agent Integrity Protocol evalúa el pensamiento del agente respecto a su Alignment Card en cada turno. La deriva, la desalineación de valores y las violaciones de límites aparecen en la traza de decisión firmada.

Interior · integridad · AAP

El Agent Alignment Protocol registra AP-Traces a posteriori y verifica la consistencia conductual respecto a la card. La cadena de auditoría enlaza los puntos de control AIP con las trazas AAP mediante `linked_trace_id`.

Puerta de salida

Filtrado de respuestas salientes — cada respuesta del agente se evalúa contra PII, secretos, violaciones de alignment card y patrones de asesoramiento regulado antes de que salga de su perímetro. Una fuga no redactada no puede producir un certificado firmado válido.

Conscience Architecture Card (CAC)

Cada despliegue de Mnemom se vincula a una CAC firmada que declara qué puntos de control están activos y en qué modo (off / observe / nudge / enforce / enforce_sync). La CAC se publica por tenant y forma parte de la postura de confianza verificable.

Política de versiones

Política de versiones AAP + AIP y proceso RFC del protocolo.

Ambos protocolos siguen versionado semver. Los cambios rompedores pasan por un proceso público de RFC antes de llegar a una release. Las versiones menores añaden campos con valores por defecto; las versiones mayores pueden cambiar el formato wire con un periodo de deprecación.

Versión menor (1.X.0): aditiva — nuevos campos, nuevos valores de enum, nuevas categorías de concern opcionales. Retrocompatible.
Versión patch (1.0.X): correcciones de bugs, actualizaciones de docs. Sin cambios de esquema.
Versión mayor (X.0.0): cambio de formato wire. Pasa por una RFC pública en github.com/mnemom/aap/discussions o aip/discussions. Ventana mínima de comentarios de 90 días antes de un RC v2.
Deprecaciones: mínimo 180 días desde el anuncio hasta la eliminación. Los veredictos emitidos bajo una versión deprecada siguen siendo verificables indefinidamente.

Versiones publicadas actualmente

npm: @mnemom/agent-alignment-protocol
npm: @mnemom/agent-integrity-protocol
npm: @mnemom/aip-verifier
PyPI: agent-alignment-protocol
PyPI: agent-integrity-proto

Abrir un RFC

Modelo de amenazas

Qué está diseñado Mnemom para prevenir — y qué no.

Resumen público del modelo de amenazas. El documento completo vive en el repo safe-house-hardening y se revisa trimestralmente. T8 publicará aquí la versión extendida.

En el alcance (prevenido por diseño)

Violaciones de límites — acciones fuera de la Alignment Card declarada del agente.
Inyección de prompts + inyección indirecta — contenido entrante adversario.
Fuga de datos salientes — PII, secretos, violaciones de alignment card.
Deriva conductual — desviación gradual respecto a la línea base del agente.
Fabricación de veredictos — la capa de prueba detecta veredictos manipulados o fabricados.
Fuga de datos entre tenants — fronteras estrictas entre tenants en prompts, trazas y alignment cards.

Fuera del alcance (divulgación honesta)

·Corrección de la inferencia del LLM — probamos el juicio del auditor, no la salida del modelo.
·Razonamiento esteganográfico sofisticado — los agentes que razonan de forma invisible eluden el análisis del thinking block.
·Compromiso de la infraestructura del proveedor LLM subyacente.
·Ataques físicos / de cadena de suministro contra el despliegue del cliente.
·Denegación de servicio contra la infraestructura de Mnemom (mitigada, no eliminada).

Divulgación responsable

Reportar una vulnerabilidad — SLA de 90 días.

La divulgación coordinada protege a todos. Acusamos recibo rápido, arreglamos en público y damos crédito al reportante.

1
Acuse de recibo en 3 días hábiles.
2
Reproducción confirmada en 14 días.
3
Fix o mitigación en 90 días desde el acuse de recibo.
4
Divulgación pública: 90 días desde el acuse de recibo, o antes si el fix se entrega y los clientes están protegidos.

[email protected]Leer security.txt

Clave PGP disponible en mnemom.ai/.well-known/pgp-key.txt (cuando se publique)

Bug bounty

Programa de divulgación de buena fe (bounty formal en scoping).

Un programa formal de bug bounty está en scoping. Hasta su lanzamiento, operamos un proceso privado de divulgación de buena fe. Los reportes elegibles obtienen reconocimiento en el hall of fame y pueden recibir reconocimiento monetario a nuestra discreción.

En el alcance

Gateway (gateway.mnemom.ai) — firma de solicitudes, filtrado entrante de la puerta de entrada, pipeline de atestación.
Observer + análisis a posteriori (api.mnemom.ai/v1/analyze) — derivación de veredictos, filtrado saliente de la puerta de salida.
Control plane (api.mnemom.ai) — auth, facturación, containment, audit logs.
SDKs (@mnemom/agent-alignment-protocol, @mnemom/agent-integrity-protocol) — lógica de verificación, verificación de pruebas ZK.
Contratos on-chain (MnemoReputationRegistry, MnemoMerkleAnchor en Base L2).
Superficies de marketing (mnemom.ai, app.mnemom.ai) — autenticación, gestión de sesión, RBAC.

Fuera del alcance

·Rate limiting y denegación de servicio (mitigado por Cloudflare; no es objetivo de bounty).
·Ingeniería social contra empleados.
·Ataques físicos contra la infraestructura.
·Servicios de terceros de los que dependemos (Cloudflare, Supabase, Stripe, Resend, Anthropic, OpenAI). Reportar directamente al proveedor.
·Reportes que requieren acceso al email, dispositivo o cuenta social de una víctima.

Hall of fame — vacío por ahora; los informantes se listarán aquí con su consentimiento.

Cumplimiento

Atestaciones y postura.

Postura de cumplimiento actual. Publicamos los cambios de postura conforme ocurren — readiness no es atestación.

SOC 2 Type II

Readiness en curso

Auditoría en scoping. Publicaremos la URL del informe al completar.

EU AI Act

Artículo 50 listo · Artículo 15 listo

Artículo 50 (transparencia, agosto 2026) y Artículo 15 (precisión / robustez / ciberseguridad, agosto 2027). Los presets de SDK se entregan hoy; docs de mapeo en /research/eu-ai-act.

HIPAA

Flujos compatibles con HIPAA

Detectores DLP para patrones de PHI. BAA disponible en Enterprise. Nosotros mismos no somos covered entity.

ISO 42001 / 27001

Definición de alcance en curso

Sin certificación y sin auditoría activa. Definición de alcance en curso; publicaremos la ruta cuando se concrete.

NIST AI RMF 1.0

Mapeado (no certificado)

GOVERN/MAP/MEASURE/MANAGE mapeadas a controles ya entregados en /guides/eu-compliance. Marco voluntario — un mapeo técnico, no una certificación del NIST.

OWASP Agentic Top 10

Mapeado (ASI01–10)

Las diez categorías ASI mapeadas a controles ya entregados de Safe House / AEGIS (brechas indicadas con honestidad) — ver /guides/owasp-agentic-top-10 y la tabla de amenazas de /security.

Estado de la red AEGIS

Siete SLO para la red defensiva entre tenants.

AEGIS — la red de seguridad entre tenants que envuelve la Safe House — lleva sus propios SLO publicados. Las metas están definidas; las primeras mediciones se publican 30 días después de la GA. La tabla completa, el código fuente y los datos históricos viven en /trust/slos.

Propagación de Managed Rules

P95 ≤ 30s

Promoción firmada hasta la carga en el gateway, a través de dos rutas de entrega firmadas e independientes.

Medición pendiente

Frescura del conjunto de reglas

P99 ≤ 5 min

En operación normal, a lo largo de toda la flota de gateways.

Medición pendiente

Alerta de obsolescencia

P0 a 24h

Guardia avisada cuando el conjunto de recetas de algún gateway lleva 24 horas obsoleto.

Medición pendiente

Disponibilidad de failover

99,99%

El gateway carga con éxito un conjunto de reglas verificado a través de múltiples niveles de lectura independientes.

Medición pendiente

Verificación de firma

≥ 99,99%

Un fallo de firma dispara un P0 y un fallback de R2 con una cadena de firma independiente.

Medición pendiente

Tasa de falsos positivos por receta

FP móvil a 7 días por receta

Auto-rollback cuando la ratio FP de una receta cruza el umbral por nivel (CLPI Fase 2).

Medición pendiente

Puerta de mutation-phase

Umbral de detección sostenida

Tasa de detección arena de entrada/salida por bucket. Por (sustrato × vertical × patrón × fuente).

Medición pendiente

La primera ventana de medición de 30 días se publica 30 días después de la GA. No anunciamos por adelantado cifras que no podemos defender.

Tabla completa de SLO Avisos Feed de IoC (STIX 2.1)

EU AI Act

Artículos 10, 12 y Anexo IV — qué aporta AEGIS.

La aplicación del EU AI Act a los sistemas de IA de alto riesgo comienza el 2026-08-02. Tres disposiciones son estructurales para cualquier infraestructura de agentes: gobernanza de datos (Artículo 10), llevanza de registros (Artículo 12) y documentación técnica (Anexo IV). AEGIS produce las pruebas verificables que cada una exige. El cumplimiento es una responsabilidad compartida; la tabla siguiente nombra lo que aportamos nosotros.

Artículo 10

Gobernanza de datos para IA de alto riesgo

Cadena de eventos de gobernanza append-only — cada promoción de receta, retirada, cambio de modo y acción del revisor está firmada con Ed25519 y encadenada. El estampado de identidad del writer aísla a nivel de esquema las fuentes de señal de arena, cliente y operador.

Artículo 12

Llevanza de registros y trazabilidad

Cadena de auditoría firmada a lo largo del ciclo de vida — firma de promoción, firma de envelope KV, firma de envelope R2 sobre claves independientes, filas de evaluación por gateway estampadas con substrate fingerprint e identidad del writer. Los registros son consultables, reproducibles y a prueba de manipulación.

Anexo IV

Documentación técnica

CMS público de avisos en /trust/advisories con informes post-incidente firmados, feed de IoC legible por máquina en /v1/trust/iocs (STIX 2.1) y SLO publicados en /trust/slos. La documentación técnica que buscan los auditores es la misma que leen clientes y agentes.

No constituye asesoramiento legal. Esta página nombra las pruebas que AEGIS produce; las obligaciones bajo el reglamento siguen siendo del desplegador. Referencias del EU AI Act: Artículos 10, 12 y Anexo IV. La aplicación de las obligaciones de alto riesgo comienza el 2026-08-02.

Fiabilidad

Objetivos de nivel de servicio.

Las metas a las que Mnemom se compromete públicamente son las mismas metas que el harness de validación verifica en CI. El estado actual en vivo está en status.mnemom.ai; los compromisos y el razonamiento están documentados aquí.

Leer los compromisos SLO Estado en vivo

Cadena de suministro

Publicación de SBOM por release.

Cada release del gateway worker y cada versión del SDK se entrega con un SBOM CycloneDX. Los SBOM por release están enlazados desde la página de release en GitHub.

SBOM de AAP · github.com/mnemom/aap/releases
SBOM de AIP · github.com/mnemom/aip/releases

Los SBOM son CycloneDX 1.5 JSON. Nos comprometemos a publicar por release; no nos comprometemos hoy a embeber el SBOM en una atestación TUF o in-toto (en consideración).

Última actualización 2026-05-16. Esta página evoluciona junto con la track safe-house-hardening.

Auditado trimestralmente · próxima actualización julio 2026

Inventario de afirmaciones de marketing →