Journal · M-04 W7 — D-spec/síntesis (OUTLINE del paper, NO el paper)
SKU D-spec del COMBO W7. register_prompt OK (artifact
2649df2a-ecce-458d-9fe5-697a1e2ac9d9, combo_statea3e08d20-6563-46c2-b2ef-ac294e71a441, sku=D-spec, phase=default). Sin COMBO_SEQUENCE_VIOLATION. freeze.lock = ausente → procedo. 2026-06-17.
Qué se me pide y qué NO
- Escribir el OUTLINE del paper de visión (no el paper). Enterprise-first, VC-grade DD, pirámide invertida.
- 5 secciones obligatorias (i)-(v), exactamente las de la directiva M-04 del panel (
panel-synthesis-m04.md§49). - Lector nº1 = CHRO/CLO/CAIO (no el VC; el VC es el segundo lector que hace DD).
- Lead vocab = Verified Output (ancla) + Transfer Probe (acuñación de validez). “Verification Economy”/“Verified Capability Layer”/“Verified Capability Graph” → SOLO cuerpo, 2º orden.
- NO redactar prosa de paper. Es esqueleto: por sección, qué argumenta, qué evidencia con id, qué se afirma vs qué es hipótesis.
Decisiones de redacción del outline (rationale)
D1 · La pirámide invertida se ejecuta literalmente en el orden de las secciones
El panel puntuó narrative punch = 5 con la queja “invertir la pirámide: wedge tocable al headline, rigor al cuerpo”. El error de W5 (cayó 2× por cifras) y el riesgo de W7 es lo contrario: meter la categoría abstracta arriba. Por eso el H1 es el wedge construible HOY (“tu primer output verificado sobre tu herramienta real, no vídeos” = Verified Execution), y la teoría (Capability Graph, Verification Economy) baja a la sección (ii) cuerpo. El titular es tocable; el rigor es interno.
D2 · El ROI del wedge — el punto donde W5 murió, y donde más cuidado pongo
La directiva exige “ROI atribuible en UNA frase con número”. El corpus NO tiene ninguna cifra propia de ROI de Momentum (time-to-competence reducido, % tareas a autónomo, coste reskilling evitado a nivel proceso/firma). w4 declaró la HII-by-role como ILUSTRATIVA y refutada (NBER kappa 0,36 D3-016, EIG D3-015, ILO D3-014). Inventar el número = REJECT automático. Solución de dos niveles (roi_framing del mandato):
- NIVEL 1 (el claim ROI propio): placeholder explícito etiquetado
[a validar con telemetría propia de Momentum]. La frase-titular del ROI lleva el slot, no un número fabricado. Esto es honestidad VC-grade: un VC perdona un placeholder etiquetado; no perdona una cifra refutable. - NIVEL 2 (cifras MEDIDAS que dimensionan el DOLOR, no el ROI): D1D5-001 (39% skills, WEF, MEDIDO), D1D5-002 (70%, LinkedIn, MEDIDO), D1D5-003 (40% directivos, IBM, MEDIDO), D1D5-004 (~2,5 años half-life — ILUSTRATIVO, cita HBR vía Deloitte), y D6-002 (OSCE 69,79 vs 51,38, p≈2e-6, MEDIDO) para el lead-time compression. Cada una con su id + etiqueta.
- Regla de oro: el ROI atribuible a Momentum es slot
[a validar]; las cifras MEDIDAS enmarcan el dolor del comprador, jamás se presentan como ROI del producto.
→ roi_traceable del schema = el placeholder etiquetado (NIVEL 1), con las cifras-dolor MEDIDAS citadas como contexto (NIVEL 2). No hay número de ROI propio porque no existe en corpus. Eso es lo correcto.
D3 · Partición temporal estricta (sección ii) para no repetir el construct collapse de W5
Product truth = 4 (el score más bajo del panel): “el motor V1 mide EXECUTION, no capability”. El outline separa duro:
- V1 = Verified Execution (2 mecanismos núcleo: (1) misión sobre herramienta real → Verified Output evaluado contra gold-standard del cliente; (2) Transfer Probe = re-ejecución sin andamiaje + demora). Esto se construye HOY.
- End-state 2027 = Verified Capability Graph + residuo (nodos con barras de error, dependiente de verificación externa + acumulación de Weighted Verified Outputs). 2º orden, al cuerpo.
- El puente es el Execution-to-Capability Loop (4 pasos, w5 línea 30). Los horizontes METR (D3-008 ~131d doubling, Opus 4.5=320min, GPT-5=214min) entran descontando el benchmark-to-workplace gap; D3-009 (Ord half-life) como contraevidencia del plateau. Todo [HIPÓTESIS DESCRIPTIVA].
D4 · Validez psicométrica (sección iii) — Transfer Probe es el corazón epistémico
El juez Wittgenstein del panel: capability = hipótesis hasta re-producción en ≥N contextos sin asistencia equivalente. El outline ancla:
- Transfer Probe (acuñación propia) = re-ejecución sin scaffold + demora → convierte capability de marketing en medición.
- Firewall de verificación: criterios del gold-standard auditado del CLIENTE, nunca de la plataforma → rompe el LLM-judge circular (D3-016, kappa 0,36).
- Sostén pedagógico: D6-013 (ICC 0,972 rúbrica IA, MEDIDO) = verificación por rúbrica es psicométricamente defendible; D6-001 (transfer g=0,34 n.s. vs learning g=0,73) = formar ≠ transferir, por eso el producto mide output transferido, no formación; D6-002 (OSCE práctica deliberada) = DEMONSTRATES-not-PASSES.
- Nodos con barras de error: capability = estimación con incertidumbre, nunca afirmación binaria.
D5 · Governance-by-design (sección iv) — nivel AGREGADO inviolable, riesgo legal más alto
Ethical/comms risk = 3 (el riesgo más alto del panel). El outline blinda:
- Nivel AGREGADO (proceso/rol/equipo), NUNCA individual → EU AI Act Anexo III(4) + GDPR Art.22/precedente Schufa.
- Texto literal del producto: “no es scoring de rendimiento ni base para decisiones de RRHH”.
- Bias audit + derecho de impugnación + grafo exportable/propiedad del cliente.
- MATAR “where humans still need to judge/verify” (verbos observacionales “still requires verification”, nunca normativos “must judge”).
- Citas que justifican prohibir el uso individual: NBER kappa 0,36 (D3-016) + EIG +0,30 vs +0,94 p.p. (D3-015). La medida es interna/propietaria/agregada porque el scoring externo es circular e impugnable.
D6 · Integración + cierre de circularidad (sección v)
Objeción 6 (herramienta huérfana = sub-5% MAU) + objeción 7 (circularidad B2C→B2B). El outline:
- Integración: SSO/SCIM + agentes nativos (M365/Salesforce/IDE) + federación de skills taxonomy con HRIS.
- Cierre de circularidad: el dato org-visible exige misiones sobre el stack del empleador → eso YA es venta B2B. El B2C es el wedge de entrada; el B2B es donde el dato se vuelve org-visible y defendible.
- Moat = telemetría interna construida, no reclamada (w4 §6; señal Satya Nadella “a frontier without an ecosystem is not stable” → riesgo de verificación-como-commodity; defensa = poseer el criterio = gold-standard del cliente, exportable).
- Sustrato real de la capa agéntica: D2-021 (>10.000 servidores MCP, 97M+ descargas/mes, MEDIDO) + D2-018/019/020 (adopción cross-vendor).
Trazabilidad — tabla de cifras del outline (cada una con id + etiqueta)
| Cifra | id | etiqueta | uso en outline |
|---|---|---|---|
| 39% skills transformadas/obsoletas 2025-30 (WEF) | D1D5-001 | MEDIDO | dolor del comprador, sección (i) NIVEL 2 |
| 70% skills cambian para 2030 (LinkedIn) | D1D5-002 | MEDIDO | dolor, (i) NIVEL 2 |
| 40% directivos prevén reskill en 3 años (IBM) | D1D5-003 | MEDIDO | dolor, (i) NIVEL 2 |
| half-life skills tech ~2,5 años (HBR vía Deloitte) | D1D5-004 | ILUSTRATIVO | gancho, (i) NIVEL 2 |
| OSCE 69,79 vs 51,38, p≈2e-6 (Kanoksin) | D6-002 | MEDIDO | lead-time compression (i)+(iii) |
| ICC 0,972 rúbrica IA (Yavuz) | D6-013 | MEDIDO | verificación defendible (iii) |
| transfer g=0,34 n.s. vs learning g=0,73 (McKay) | D6-001 | MEDIDO | formar≠transferir (iii) |
| ~131d doubling; Opus 4.5=320min; GPT-5=214min (METR) | D3-008 | MEDIDO (software) | horizonte (ii), descontar gap |
| half-life agente / plateau (Ord) | D3-009 | MEDIDO (reinterpretación) | contraevidencia plateau (ii) |
| EPAs 5 niveles ordinales (medicina) | D3-012 | MEDIDO (estándar ordinal) | precedente supervisión (iv) |
| in/on-the-loop (EDPS) | D3-013 | N-A | categoría regulatoria (iv) |
| exposición≠resultado (ILO) | D3-014 | N-A | refuta salto exposición→resultado (iv) |
| EIG +0,30 vs +0,94 p.p. | D3-015 | MEDIDO | prohibir uso individual (iv) |
| NBER kappa 0,36; divergencia 3,6× | D3-016 | MEDIDO | firewall + prohibir individual (iii)+(iv) |
| >10.000 servidores MCP, 97M+ descargas/mes | D2-021 | MEDIDO | sustrato agéntico (v) |
| adopción cross-vendor MCP | D2-018/019/020 | N-A | sustrato agéntico (v) |
| ROI propio de Momentum | — | [a validar con telemetría propia] | NIVEL 1, slot, no inventado |
Self-check pre-cierre
- ¿“Verification Economy”/“Verified Capability Layer”/“Verified Capability Graph” en algún H1/headline? → NO. Solo cuerpo (sección ii).
forbidden_headline_absent = true. - ¿Algún output a nivel individual? → NO. Todo agregado proceso/rol/equipo.
individual_level_absent = true. - ¿Alguna cifra inventada? → NO. Cada número tiene id+etiqueta; el ROI propio es slot etiquetado.
- ¿“where humans still need to judge/verify”? → MATADO. Verbos observacionales.
- ¿Lead vocab correcto? → Verified Output + Transfer Probe al frente; Capability Graph al cuerpo.
- ¿Es OUTLINE y no paper? → Sí: esqueleto con bullets de argumento/evidencia/claim, no prosa redactada.
W7 · A-retro + verdict (APPROVE)
SKU A-retro (cierre) del COMBO W7. register_prompt OK — A-heartbeat (artifact
cf889466-9810-4146-ad4e-ab7d9ab91165) + A-retro (artifactb720c13d-263d-4f0a-b46e-eb6b4a5d2a46), ambos combo_statea3e08d20-6563-46c2-b2ef-ac294e71a441, sin COMBO_SEQUENCE_VIOLATION. freeze.lock = ausente. 2026-06-17.
Verdict
- V-review id=
b304c196-3df8-42dc-9117-12c6f5384e0e→ APPROVE. - A-retro advisor_verdict id=
8892a667-882f-47ad-8c7f-39a7e884ab60(reviewer_role=critic_final, sprint_ref=M-04 W7) → APPROVE (ratifica el V-review; NO se fabrica un verdict alternativo). - Semáforo: GREEN (APPROVE).
Los 5 checks duros — todos pasados
- Pirámide invertida ejecutada literalmente en el orden de secciones: H1 = wedge Verified Execution construible HOY; teoría (Capability Graph, Verification Economy) bajada al cuerpo §(ii).
narrativecorregido respecto a W5. - Cero cifras fabricadas — la trampa que mató W5 (2×). El ROI propio de Momentum = slot
[a validar con telemetría propia](NIVEL 1). Las cifras MEDIDAS (D1D5-001/002/003, D6-002, D6-013, D6-001, D3-008/015/016, D2-021) enmarcan el DOLOR del comprador con id+etiqueta, jamás como ROI del producto (NIVEL 2). - Nivel AGREGADO inviolable (proceso/rol/equipo), cero scoring individual — EU AI Act Anexo III(4)+GDPR Art.22/Schufa. Texto literal del producto: “no es scoring de rendimiento ni base para decisiones de RRHH”.
- Lead vocab correcto — Verified Output + Transfer Probe al frente; headlines prohibidos (Verification Economy / Verified Capability Layer / Verified Capability Graph) ausentes de todo H1.
- “where humans still need to judge/verify” MATADO — verbos observacionales (“still requires verification”), nunca normativos.
Watch-item del V-review (NO bloqueante para W7-write)
El V-review señaló que §1 NIVEL 1 usa “coste de reskilling evitado por empleado = Z”. Resolución: es una métrica de coste por-FTE (unit economics agregable) y un slot etiquetado, NO scoring individual de capacidad → no viola Check 4. Recomendación adoptada para la prosa de W7-write: reformular como “coste por-FTE agregado” para eliminar cualquier óptica de nivel individual. Se traslada al mandato W7-write como nota de redacción, no como bloqueo del cierre.
Cierre
COMBO W7 cerrado en GREEN. El OUTLINE queda listo como esqueleto canónico para el siguiente COMBO (W7-write = redacción de la prosa del paper), que debe heredar: la partición temporal estricta (D3), el firewall de verificación con criterio del cliente (D4), el blindaje governance-by-design agregado (D5) y la nota por-FTE de este watch-item.