M-05 · W-paper — redacción del paper de visión (journal)

SKU D-spec del COMBO W-paper (M-05). Un solo writer = voz coherente. 2026-06-18. Grounding que manda: research/w7-paper-outline.md (esqueleto, NO se toca la estructura) + research/thesis-canon-v2.md + research/panel-synthesis-m04.md §47-49 + .governance/FUNDAMENTALS.md (guards) + inventario de 18 cifras trazables del Sheet. Output: paper/momentum-vision-paper.md (5 secciones + H1, prosa investor-grade).

El encargo en una línea

Convertir el outline W7 (pirámide invertida, 5 secciones) en el PAPER redactado, enterprise-first (CHRO/CLO/CAIO lector nº1, VC-DD lector nº2), voz McKinsey/Bain/BCG, es-ES sin voseo, con cada cifra trazada a su id de fila o etiquetada como hipótesis. Cero invención.

Decisiones de redacción (rationale)

1. El H1 ES el wedge, no la categoría

Mantengo verbatim el titular del outline: “Tu primer output verificado sobre tu herramienta real. No vídeos.” Es Verified Execution, construible hoy. Los tres términos vetados —Verification Economy, Verified Capability Layer, Verified Capability Graph— se confinan al cuerpo de §2 y nunca aparecen en H1 ni en NINGÚN título de sección. Esto cumple el guard del panel (decisión 1 de las 3 deltas: “wedge al headline, categoría al cuerpo”) y el apéndice de gobernanza del outline (“ausentes del H1 y de los títulos de sección”).

Corrección durante la redacción (auto-detect guard): el outline §2 nombraba un subtítulo “End-state 2027 = Verified Capability Graph + residuo”. Al redactarlo como ### heading, “Verified Capability Graph” quedaba en un título de sección → violación del guard literal del apéndice (“ausentes de los títulos de sección”). Renombré el heading a “El end-state 2027 = el grafo de evidencia + residuo de verificación” y bajé el término “Verified Capability Graph” a la PRIMERA línea del cuerpo de esa subsección. El término sigue presente (es la tesis de 2º orden, debe nombrarse en el cuerpo §2), pero ya no en un heading. Guard verificado con grep: 0 términos vetados en cualquier heading.

2. ROI propio = SLOT etiquetado, sin excepción

El learning más caro del proyecto (W5 cayó 2× por inventar cifras, FUNDAMENTALS guard “procedencia numérica”). Los tres números del ROI propio de Momentum —time-to-competence X%, % tareas a ejecución autónoma verificada, coste de reskilling evitado Z— NO existen en el corpus a nivel proceso/firma. Por tanto van como hueco [a validar con telemetría propia de Momentum], jamás como número. Lo digo explícitamente en §1 Nivel 1 y en la nota de procedencia final: “fabricarlos sería exactamente el error que suspende una DD”. Honestidad VC-grade = el placeholder pasa la DD; la cifra refutable la suspende.

roi_is_slot = true (verificado: 2 ocurrencias del literal del slot, §1 y nota final).

3. Dos niveles de cifras en §1: dolor MEDIDO vs ROI SLOT

La estructura de dos niveles del outline es la clave anti-construct-collapse del comprador. Nivel 1 = ROI propio = slot. Nivel 2 = cifras MEDIDAS que enmarcan el DOLOR, no el ROI:

D1D5-001 (39%, MEDIDO, encuesta empleadores WEF) → es la única cifra del titular, y mide el dolor del comprador, no el producto.
D1D5-002 (70% competencias cambian 2030, MEDIDO, LinkedIn Economic Graph) → triangula por OTRO método (comportamiento vs encuesta).
D1D5-003 (40% directivos reentrenan 3 años, MEDIDO, IBM IBV) → intención corporativa con presupuesto.
D1D5-004 (~2,5 años half-life, ILUSTRATIVO) → marcado explícitamente como gancho retórico, NO telemetría, para no contaminar el aparato probatorio.
D6-002 (RCT OSCE 69,79 vs 51,38, p≈2e-6, MEDIDO) → la prueba del colapso del lead-time: práctica deliberada bate clase magistral con margen y significación auditables.

4. §2 partición temporal: honestidad temporal investor-grade

Separo lo construible HOY (V1 = Verified Execution, 2 mecanismos) del end-state 2027. Mecanismo 1 = Verified Output (afirma “el artefacto corrió”, NO capability). Mecanismo 2 = Transfer Probe (re-ejecución sin scaffold + demora). El construct collapse fix se nombra en voz alta: V1 mide EXECUTION; capability es claim de 2º orden con barras de error. El puente = Execution-to-Capability Loop (4 pasos). Los horizontes técnicos van como [HIPÓTESIS DESCRIPTIVA] descontando el benchmark-to-workplace gap:

D3-008 (doubling ~131d, Opus 4.5 320min IC 170-729, GPT-5 214min IC 117-480, MEDIDO pero SOFTWARE) → cito el IC y subrayo validez externa limitada.
D3-009 (Ord, half-life de agente bajo hazard constante, MEDIDO como reinterpretación) → contraevidencia del plateau; el autor declara incierta la generalización → “extrapolación lineal frágil”. No vendo la curva como hoja de ruta garantizada.

5. §3 el corazón epistémico: por qué un output repetido ESTIMA capacidad

Responde al Product truth = 4 (score más bajo del panel). Definición operativa (juez Wittgenstein): capability = hipótesis marcada HASTA re-producción en ≥N contextos sin asistencia equivalente; el umbral N concreto = [HIPÓTESIS / a calibrar con telemetría propia] (no lo invento). Transfer Probe convierte capability de adjetivo a medición, sostenido por:

D6-001 (McKay 2024, MEDIDO): learning g=0,73 PERO transfer conductual g=0,34 n.s.; inmediato g=0,86 → diferido g=0,40. “Formar ≠ transferir” = columna vertebral. Momentum mide output transferido, no formación.
Firewall anti-LLM-judge-circular: criterios del gold-standard del CLIENTE, nunca de la plataforma; si fuera juez circular heredaría D3-016 (kappa 0,36, divergencia 3,6×, acuerdo 57%, MEDIDO). “No se trata de tener mejor modelo-juez; se trata de no ser el juez.”
D6-013 (Yavuz 2024, ICC 0,972 modelo afinado vs humanos, MEDIDO): la rúbrica con criterio público y estable concuerda altísimo con humanos → lo que falla en D3-016 es la ausencia de criterio anclado, no la rúbrica.
Nodos con barras de error: capability = estimación acumulada con incertidumbre, nunca binario.

6. §4 governance-by-design: nivel AGREGADO inviolable (riesgo más alto, Ethical/comms = 3)

La medida es defendible PORQUE es agregada y propietaria. Todo a nivel proceso/rol/equipo, por-FTE agregado, NUNCA individual (EU AI Act Anexo III(4) + GDPR Art.22/Schufa). Texto contractual literal: “no es scoring de rendimiento ni base para decisiones de RRHH”. Razones duras:

D3-016 (kappa 0,36, MEDIDO): base impugnable por construcción.
D3-015 (EIG, MEDIDO): patrón OPUESTO — quintil MÁS expuesto +0,30 p.p. paro vs MENOS expuesto +0,94 p.p.; exposición NO predice desplazamiento → ninguna inferencia rol→desplazamiento.
D3-014 (ILO, N-A): exposición = susceptibilidad técnica, no resultado laboral; señales de alerta temprana, no predicciones.
Cumplimiento auditable como tailwind: D3-013 (EDPS, N-A, in-the-loop vs on-the-loop) + D3-012 (ten Cate EPAs, 5 niveles ordinales, MEDIDO). MATÉ “where humans still need to judge/verify”: la única aparición de esa frase en el paper es para ANUNCIAR SU ELIMINACIÓN y contrastar verbos observacionales (“el proceso aún requiere verificación humana”) vs normativos (“los humanos deben juzgar”). Residuo de verificación = observado a nivel de proceso, no mandato sobre personas.

7. §5 integración + cierre circularidad B2C→B2B + moat

Anti-huérfana: SSO/SCIM + agentes nativos M365/Salesforce/IDE + federación skills taxonomy con HRIS. Sub-5% MAU sin integración = [supuesto de producto] (objeción 6 del panel, NO cifra medida).
Sustrato agéntico real (no hipótesis): D2-021 (>10.000 servidores MCP, 97M+ descargas SDK, donación Agentic AI Foundation, MEDIDO — único telemétrico de escala) + cross-vendor D2-018/019/020 (N-A, anuncios sin cifra de capacidad). Lectura: la capa agente↔herramienta es infraestructura común → habilita la delegación PERO por sí sola NO es ventaja propietaria. El moat no está ahí.
Cierre circularidad (objeción 7): el B2C es la RAMPA, no un círculo vicioso. El dato se vuelve org-visible solo cuando las misiones corren sobre el stack del empleador → eso YA es la venta B2B.
Moat = telemetría interna construida sobre el criterio del cliente (gold-standard auditado, exportable, propiedad del cliente), no un activo reclamado ni copiable. Señal Nadella 14-jun-2026 “a frontier without an ecosystem is not stable” → riesgo de verificación-como-commodity; defensa = poseer el criterio.

Cómo cambió mi opinión durante la redacción

Llegué pensando que el subtítulo de §2 del outline (“End-state = Verified Capability Graph”) podía mantenerse como heading porque está EN §2 (el cuerpo). Pero el guard del apéndice es literal: “ausentes de los TÍTULOS de sección”. Un ### heading ES un título de sección. Lo correcto y conservador es: término en cuerpo sí, en cualquier heading no. Lo moví. Documentado arriba.

Auditoría de cumplimiento (grep verificado)

Cifras citadas con id: 18 ids distintos, 30 menciones inline (D1D5-001/002/003/004, D2-018/019/020/021, D3-008/009/012/013/014/015/016, D6-001/002/013).
ROI = slot etiquetado: ✅ [a validar con telemetría propia] (sin número fabricado).
Términos vetados en H1 + todos los headings: 0 ✅. Aparecen solo en cuerpo §2.
Nivel individual: ausente como métrica; las menciones son para PROHIBIRLO. Todo por-FTE agregado proceso/rol/equipo. ✅
“where humans still need to judge/verify”: MATADA; única aparición = anuncio de su eliminación. ✅
Lead vocab: Verified Output (14) + Transfer Probe (8) al frente. ✅
es-ES sin voseo, voz McKinsey/Bain/BCG enterprise-first. ✅

Pendiente (no es de este COMBO)

Sustituir el slot de ROI cuando exista telemetría del Execution-to-Capability Loop.
Calibrar el N concreto del Transfer Probe.
M-06 (landing/repo/journal HTML) — NO ejecutar aquí (MUST NOT del mandato).

W-paper · A-retro + verdict (APPROVE)

SKU A-heartbeat + A-retro (cierre del COMBO W-paper, M-05). 2026-06-18. Cierre honesto: el verdict que manda es el del V-review (GUARD 1 FUNDAMENTALS — no se fabrica APPROVE sobre REJECT, no se cambia el verdict del crítico).

Semáforo: 🟢 GREEN

V-review (de306e55-cf9b-4fdb-9b22-4fd0a9107e51, reviewer critic_final adversarial default-REJECT) = APPROVE. Por regla de A-retro (GREEN si APPROVE), el semáforo del COMBO es GREEN. El verdict del crítico es soberano: este cierre lo refleja, no lo altera.

Qué cierra el COMBO W-paper

paper/momentum-vision-paper.md — paper de visión completo, 5 secciones 1:1 con el outline W7 (estructura intacta, MUST NOT respetado), H1 = wedge puro.
Provenance audit del V-review: 44 cifras numéricas auditadas, 44 trazables (id de fila + valor exacto sin contradicción) o slot honesto etiquetado. Cero huérfanas.
Re-verificación local de guards en este cierre (grep sobre el paper, independiente del V-review):
- Términos vetados en H1 + cualquier heading: 0 ✅ (los 30 headings revisados; aparecen solo en cuerpo §2).
- ROI propio = slot [a validar con telemetría propia]: presente (3 ocurrencias), cero número fabricado ✅.
- Lead vocab al frente: Verified Output (13) + Transfer Probe (8) ✅.
- Ids de fila distintos: 18 ✅.

Heartbeat — salud del COMBO (A-heartbeat)

Secuencia COMBO registrada sin COMBO_SEQUENCE_VIOLATION: A-heartbeat (b59771f4) + A-retro (b756bf32) sobre combo_state a3e08d20.
Disciplina de guards mantenida extremo a extremo: el único auto-detect durante D-spec (heading “Verified Capability Graph” → renombrado, término bajado al cuerpo) quedó resuelto y verificado por grep. No quedó deuda de guard abierta.
Sin freeze.lock al cerrar → commit autorizado (paper/ + journal/ + research/ únicamente).

Las dos observaciones del V-review (no bloqueantes · GREEN se mantiene)

Cita Nadella 14-jun-2026 (L179) — no lleva id de fila de corpus porque NO es una cifra-corpus ni un número de ROI/mercado: es una cita pública fechada, trazable al canon panel-synthesis-m04.md (65,2M views) + W5 + outline W7. Tratamiento idéntico al del outline W7 ya aprobado → no bloqueante. Recomendación menor para M-06: si el journal HTML lista fuentes, añadir esta cita a una fila de “señales externas” del Sheet para trazabilidad 100% homogénea.
Slots de ROI propio ([X%], [Y%], [Z]) + supuesto sub-5% MAU — permanecen como huecos por diseño. Se rellenan cuando el Execution-to-Capability Loop genere telemetría propia. No es un gap del paper: es el compromiso explícito de honestidad DD (fabricarlos sería exactamente el error que suspende una due diligence). Ya documentado como pendiente arriba.

Veredicto de cierre

final_verdict = APPROVE (= V-review · GUARD 1 inviolable respetado). COMBO W-paper cerrado en GREEN. Siguiente fase = M-06 (landing/repo/journal HTML) — fuera de este COMBO.