M-04 · Entrada 08 de 25

W7 · Outline del paper

Qué es esto

Outline del paper de visión (el esqueleto, no el paper): enterprise-first, pirámide invertida, 5 secciones obligatorias de la directiva del panel.

Fase del Bridge

COMBO W7 (M-04) · SKU D-spec (síntesis).

Journal · M-04 W7 — D-spec/síntesis (OUTLINE del paper, NO el paper)

SKU D-spec del COMBO W7. register_prompt OK (artifact 2649df2a-ecce-458d-9fe5-697a1e2ac9d9, combo_state a3e08d20-6563-46c2-b2ef-ac294e71a441, sku=D-spec, phase=default). Sin COMBO_SEQUENCE_VIOLATION. freeze.lock = ausente → procedo. 2026-06-17.

Qué se me pide y qué NO

  • Escribir el OUTLINE del paper de visión (no el paper). Enterprise-first, VC-grade DD, pirámide invertida.
  • 5 secciones obligatorias (i)-(v), exactamente las de la directiva M-04 del panel (panel-synthesis-m04.md §49).
  • Lector nº1 = CHRO/CLO/CAIO (no el VC; el VC es el segundo lector que hace DD).
  • Lead vocab = Verified Output (ancla) + Transfer Probe (acuñación de validez). “Verification Economy”/“Verified Capability Layer”/“Verified Capability Graph” → SOLO cuerpo, 2º orden.
  • NO redactar prosa de paper. Es esqueleto: por sección, qué argumenta, qué evidencia con id, qué se afirma vs qué es hipótesis.

Decisiones de redacción del outline (rationale)

D1 · La pirámide invertida se ejecuta literalmente en el orden de las secciones

El panel puntuó narrative punch = 5 con la queja “invertir la pirámide: wedge tocable al headline, rigor al cuerpo”. El error de W5 (cayó 2× por cifras) y el riesgo de W7 es lo contrario: meter la categoría abstracta arriba. Por eso el H1 es el wedge construible HOY (“tu primer output verificado sobre tu herramienta real, no vídeos” = Verified Execution), y la teoría (Capability Graph, Verification Economy) baja a la sección (ii) cuerpo. El titular es tocable; el rigor es interno.

D2 · El ROI del wedge — el punto donde W5 murió, y donde más cuidado pongo

La directiva exige “ROI atribuible en UNA frase con número”. El corpus NO tiene ninguna cifra propia de ROI de Momentum (time-to-competence reducido, % tareas a autónomo, coste reskilling evitado a nivel proceso/firma). w4 declaró la HII-by-role como ILUSTRATIVA y refutada (NBER kappa 0,36 D3-016, EIG D3-015, ILO D3-014). Inventar el número = REJECT automático. Solución de dos niveles (roi_framing del mandato):

  • NIVEL 1 (el claim ROI propio): placeholder explícito etiquetado [a validar con telemetría propia de Momentum]. La frase-titular del ROI lleva el slot, no un número fabricado. Esto es honestidad VC-grade: un VC perdona un placeholder etiquetado; no perdona una cifra refutable.
  • NIVEL 2 (cifras MEDIDAS que dimensionan el DOLOR, no el ROI): D1D5-001 (39% skills, WEF, MEDIDO), D1D5-002 (70%, LinkedIn, MEDIDO), D1D5-003 (40% directivos, IBM, MEDIDO), D1D5-004 (~2,5 años half-life — ILUSTRATIVO, cita HBR vía Deloitte), y D6-002 (OSCE 69,79 vs 51,38, p≈2e-6, MEDIDO) para el lead-time compression. Cada una con su id + etiqueta.
  • Regla de oro: el ROI atribuible a Momentum es slot [a validar]; las cifras MEDIDAS enmarcan el dolor del comprador, jamás se presentan como ROI del producto.

roi_traceable del schema = el placeholder etiquetado (NIVEL 1), con las cifras-dolor MEDIDAS citadas como contexto (NIVEL 2). No hay número de ROI propio porque no existe en corpus. Eso es lo correcto.

D3 · Partición temporal estricta (sección ii) para no repetir el construct collapse de W5

Product truth = 4 (el score más bajo del panel): “el motor V1 mide EXECUTION, no capability”. El outline separa duro:

  • V1 = Verified Execution (2 mecanismos núcleo: (1) misión sobre herramienta real → Verified Output evaluado contra gold-standard del cliente; (2) Transfer Probe = re-ejecución sin andamiaje + demora). Esto se construye HOY.
  • End-state 2027 = Verified Capability Graph + residuo (nodos con barras de error, dependiente de verificación externa + acumulación de Weighted Verified Outputs). 2º orden, al cuerpo.
  • El puente es el Execution-to-Capability Loop (4 pasos, w5 línea 30). Los horizontes METR (D3-008 ~131d doubling, Opus 4.5=320min, GPT-5=214min) entran descontando el benchmark-to-workplace gap; D3-009 (Ord half-life) como contraevidencia del plateau. Todo [HIPÓTESIS DESCRIPTIVA].

D4 · Validez psicométrica (sección iii) — Transfer Probe es el corazón epistémico

El juez Wittgenstein del panel: capability = hipótesis hasta re-producción en ≥N contextos sin asistencia equivalente. El outline ancla:

  • Transfer Probe (acuñación propia) = re-ejecución sin scaffold + demora → convierte capability de marketing en medición.
  • Firewall de verificación: criterios del gold-standard auditado del CLIENTE, nunca de la plataforma → rompe el LLM-judge circular (D3-016, kappa 0,36).
  • Sostén pedagógico: D6-013 (ICC 0,972 rúbrica IA, MEDIDO) = verificación por rúbrica es psicométricamente defendible; D6-001 (transfer g=0,34 n.s. vs learning g=0,73) = formar ≠ transferir, por eso el producto mide output transferido, no formación; D6-002 (OSCE práctica deliberada) = DEMONSTRATES-not-PASSES.
  • Nodos con barras de error: capability = estimación con incertidumbre, nunca afirmación binaria.

Ethical/comms risk = 3 (el riesgo más alto del panel). El outline blinda:

  • Nivel AGREGADO (proceso/rol/equipo), NUNCA individual → EU AI Act Anexo III(4) + GDPR Art.22/precedente Schufa.
  • Texto literal del producto: “no es scoring de rendimiento ni base para decisiones de RRHH”.
  • Bias audit + derecho de impugnación + grafo exportable/propiedad del cliente.
  • MATAR “where humans still need to judge/verify” (verbos observacionales “still requires verification”, nunca normativos “must judge”).
  • Citas que justifican prohibir el uso individual: NBER kappa 0,36 (D3-016) + EIG +0,30 vs +0,94 p.p. (D3-015). La medida es interna/propietaria/agregada porque el scoring externo es circular e impugnable.

D6 · Integración + cierre de circularidad (sección v)

Objeción 6 (herramienta huérfana = sub-5% MAU) + objeción 7 (circularidad B2C→B2B). El outline:

  • Integración: SSO/SCIM + agentes nativos (M365/Salesforce/IDE) + federación de skills taxonomy con HRIS.
  • Cierre de circularidad: el dato org-visible exige misiones sobre el stack del empleador → eso YA es venta B2B. El B2C es el wedge de entrada; el B2B es donde el dato se vuelve org-visible y defendible.
  • Moat = telemetría interna construida, no reclamada (w4 §6; señal Satya Nadella “a frontier without an ecosystem is not stable” → riesgo de verificación-como-commodity; defensa = poseer el criterio = gold-standard del cliente, exportable).
  • Sustrato real de la capa agéntica: D2-021 (>10.000 servidores MCP, 97M+ descargas/mes, MEDIDO) + D2-018/019/020 (adopción cross-vendor).

Trazabilidad — tabla de cifras del outline (cada una con id + etiqueta)

Cifraidetiquetauso en outline
39% skills transformadas/obsoletas 2025-30 (WEF)D1D5-001MEDIDOdolor del comprador, sección (i) NIVEL 2
70% skills cambian para 2030 (LinkedIn)D1D5-002MEDIDOdolor, (i) NIVEL 2
40% directivos prevén reskill en 3 años (IBM)D1D5-003MEDIDOdolor, (i) NIVEL 2
half-life skills tech ~2,5 años (HBR vía Deloitte)D1D5-004ILUSTRATIVOgancho, (i) NIVEL 2
OSCE 69,79 vs 51,38, p≈2e-6 (Kanoksin)D6-002MEDIDOlead-time compression (i)+(iii)
ICC 0,972 rúbrica IA (Yavuz)D6-013MEDIDOverificación defendible (iii)
transfer g=0,34 n.s. vs learning g=0,73 (McKay)D6-001MEDIDOformar≠transferir (iii)
~131d doubling; Opus 4.5=320min; GPT-5=214min (METR)D3-008MEDIDO (software)horizonte (ii), descontar gap
half-life agente / plateau (Ord)D3-009MEDIDO (reinterpretación)contraevidencia plateau (ii)
EPAs 5 niveles ordinales (medicina)D3-012MEDIDO (estándar ordinal)precedente supervisión (iv)
in/on-the-loop (EDPS)D3-013N-Acategoría regulatoria (iv)
exposición≠resultado (ILO)D3-014N-Arefuta salto exposición→resultado (iv)
EIG +0,30 vs +0,94 p.p.D3-015MEDIDOprohibir uso individual (iv)
NBER kappa 0,36; divergencia 3,6×D3-016MEDIDOfirewall + prohibir individual (iii)+(iv)
>10.000 servidores MCP, 97M+ descargas/mesD2-021MEDIDOsustrato agéntico (v)
adopción cross-vendor MCPD2-018/019/020N-Asustrato agéntico (v)
ROI propio de Momentum[a validar con telemetría propia]NIVEL 1, slot, no inventado

Self-check pre-cierre

  • ¿“Verification Economy”/“Verified Capability Layer”/“Verified Capability Graph” en algún H1/headline? → NO. Solo cuerpo (sección ii). forbidden_headline_absent = true.
  • ¿Algún output a nivel individual? → NO. Todo agregado proceso/rol/equipo. individual_level_absent = true.
  • ¿Alguna cifra inventada? → NO. Cada número tiene id+etiqueta; el ROI propio es slot etiquetado.
  • ¿“where humans still need to judge/verify”? → MATADO. Verbos observacionales.
  • ¿Lead vocab correcto? → Verified Output + Transfer Probe al frente; Capability Graph al cuerpo.
  • ¿Es OUTLINE y no paper? → Sí: esqueleto con bullets de argumento/evidencia/claim, no prosa redactada.

W7 · A-retro + verdict (APPROVE)

SKU A-retro (cierre) del COMBO W7. register_prompt OK — A-heartbeat (artifact cf889466-9810-4146-ad4e-ab7d9ab91165) + A-retro (artifact b720c13d-263d-4f0a-b46e-eb6b4a5d2a46), ambos combo_state a3e08d20-6563-46c2-b2ef-ac294e71a441, sin COMBO_SEQUENCE_VIOLATION. freeze.lock = ausente. 2026-06-17.

Verdict

  • V-review id=b304c196-3df8-42dc-9117-12c6f5384e0eAPPROVE.
  • A-retro advisor_verdict id=8892a667-882f-47ad-8c7f-39a7e884ab60 (reviewer_role=critic_final, sprint_ref=M-04 W7) → APPROVE (ratifica el V-review; NO se fabrica un verdict alternativo).
  • Semáforo: GREEN (APPROVE).

Los 5 checks duros — todos pasados

  1. Pirámide invertida ejecutada literalmente en el orden de secciones: H1 = wedge Verified Execution construible HOY; teoría (Capability Graph, Verification Economy) bajada al cuerpo §(ii). narrative corregido respecto a W5.
  2. Cero cifras fabricadas — la trampa que mató W5 (2×). El ROI propio de Momentum = slot [a validar con telemetría propia] (NIVEL 1). Las cifras MEDIDAS (D1D5-001/002/003, D6-002, D6-013, D6-001, D3-008/015/016, D2-021) enmarcan el DOLOR del comprador con id+etiqueta, jamás como ROI del producto (NIVEL 2).
  3. Nivel AGREGADO inviolable (proceso/rol/equipo), cero scoring individual — EU AI Act Anexo III(4)+GDPR Art.22/Schufa. Texto literal del producto: “no es scoring de rendimiento ni base para decisiones de RRHH”.
  4. Lead vocab correcto — Verified Output + Transfer Probe al frente; headlines prohibidos (Verification Economy / Verified Capability Layer / Verified Capability Graph) ausentes de todo H1.
  5. “where humans still need to judge/verify” MATADO — verbos observacionales (“still requires verification”), nunca normativos.

Watch-item del V-review (NO bloqueante para W7-write)

El V-review señaló que §1 NIVEL 1 usa “coste de reskilling evitado por empleado = Z”. Resolución: es una métrica de coste por-FTE (unit economics agregable) y un slot etiquetado, NO scoring individual de capacidad → no viola Check 4. Recomendación adoptada para la prosa de W7-write: reformular como “coste por-FTE agregado” para eliminar cualquier óptica de nivel individual. Se traslada al mandato W7-write como nota de redacción, no como bloqueo del cierre.

Cierre

COMBO W7 cerrado en GREEN. El OUTLINE queda listo como esqueleto canónico para el siguiente COMBO (W7-write = redacción de la prosa del paper), que debe heredar: la partición temporal estricta (D3), el firewall de verificación con criterio del cliente (D4), el blindaje governance-by-design agregado (D5) y la nota por-FTE de este watch-item.