← Volver al research

Protocolo de trazabilidad del corpus — Momentum Skills Research

Contrato operativo del corpus. Lo siguen W2, W3 y W6 sin reinterpretación. Materializa las reglas duras del brief (cero invención, recencia, separación medido/ilustrativo) en convenciones verificables sobre el Google Sheet canónico y el NotebookLM corpus.

Estado: fijado en W1 (setup). La carga real de fuentes es M-02 (W2/W3/W6). En W1 no se puebla ninguna fila.


0. Principio rector — la columna vertebral

Toda fuente se evalúa por una sola pregunta: ¿sostiene o refuta la columna vertebral del paper?

categoría  →  colapso (lead-time)  →  HII  →  bifurcación (AI / Human Workforce)  →  mapa empírico de reemplazabilidad
  • Una fuente que sostiene un eslabón (lo prueba, lo cuantifica, lo fundamenta teóricamente) entra como fila.
  • Una fuente que refuta un eslabón también entra: el contraargumento es señal, no ruido.
  • Una fuente que no toca ningún eslabón no es research de Momentum: es curiosidad. No entra (regla dura 3).

Cada fila declara en notas qué eslabón toca. Sin esa declaración, la fila no está calificada para citarse.

Fuente única de verdad de la trazabilidad de citas: el Google Sheet. No hay bibliografía en markdown disperso (regla dura 8). Decisiones técnicas/feature → mcpstartupos Dev OS. Thinking/rationale → journal/ (regla dura 10).


1. Taxonomía de columnas — tab Corpus

#ColumnaTipoDefinición operativa
AidtextoIdentificador secuencial estable de la fila (p. ej. D3-001). Es el ancla de cita: el paper cita la fila por su id, no por la URL. Inmutable una vez asignado. Formato: <dominio>-<NNN>.
BtítulotextoTítulo literal de la fuente. Sin parafrasear.
CautortextoAutor(es) o institución emisora.
DtipodropdownClase de fuente: paper | libro | POV | report.
EañonúmeroAño de publicación. Gobierna el filtro de recencia 2024-2026 (regla dura 2).
FdominiodropdownDominio MECE al que sirve (ver §4).
GstatusdropdownEstado de procesamiento: pendiente | leído | citado | descartado.
Hsubido_a_notebooklmdropdownLedger de sincronía Sheet↔NotebookLM: pendiente | | no (ver §6).
Iurl_fuentetexto/URLURL real y resoluble a la fuente primaria. Sin url_fuente verificable la fila no califica (regla dura 1).
JnotastextoAnotación del curador: hallazgo clave, eslabón de la columna vertebral que toca, advertencia de método, cruce cross-dominio si aplica.
Kevidenciadropdown (NUEVA)Naturaleza del dato (ver §5): MEDIDO | ILUSTRATIVO | N-A.

Posición de la columna evidencia: columna K, inmediatamente después de notas (J). Se sitúa al final para no desplazar el orden histórico de columnas ya conocido por el equipo; queda documentada en el tab README del Sheet.

Tab Vocabulario

ColumnaDefinición
término/fraseTérmino o frase candidata del léxico Momentum (en inglés técnico o es-ES según destino).
definiciónDefinición operativa breve.
dominioDominio MECE al que pertenece el término (mismos valores que Corpus).
candidato_acuñaciónMarca si el término es candidato a acuñación propia (vocabulario de marca).
notas marketingUso previsto en paper/landing, connotación, riesgo de sobre-promesa.

2. QUALIFY — qué hace que una fuente entre como fila

Una fuente califica solo si cumple las tres condiciones:

  1. Toca la columna vertebral — sostiene o refuta categoría → colapso → HII → bifurcación → mapa (regla dura 3). Si no, es ruido y no entra.
  2. Tiene url_fuente real y resoluble a fuente primaria, siempre que la fuente exista en la web. Cero invención de fuentes o datos (regla dura 1).
  3. Cumple recencia (§3) o queda justificada como contexto fundacional en notas.

Sin fila no hay cita; sin cita no hay claim en el paper (regla dura 1).


3. RECENCIA 2024-2026

  • Prioridad estricta a fuentes 2024-2026. El campo año es el control.
  • Pre-2024 entra SOLO como base teórica: teoría de HII, ciencia del aprendizaje (D6). Nunca como evidencia de la trayectoria actual de agentes (D2) ni del estado del mercado (D1/D5).
  • D2 (agéntica/MCP) revalida al cierre de W3 por obsolescencia rápida (riesgo R5): toda fuente D2 se re-verifica para descartar afirmaciones superadas.

Toda fila pre-2024 lleva en notas la justificación explícita de contexto fundacional; sin ella, el guardián la veta.


4. Mapeo dominio → dropdown (MECE)

CódigoEtiqueta dropdownAlcance
D1EdTech adultosEdTech, educación online de adultos, formación con IA/agentes.
D2IA agentes/MCPTrayectoria de agentes, capacidades, MCP, tooling. (Revalida cierre W3.)
D3Futuro del trabajo/HIIHuman Inflation Index, reemplazabilidad, lead-time del colapso.
D4Escenarios IA 2027-2030Proyecciones, escenarios, bifurcación AI/Human Workforce.
D5Mercado/CompetenciaTamaño de mercado, competidores, pricing, landing de rivales.
D6PedagogíaCiencia del aprendizaje, diseño instruccional, andragogía.

El valor del dropdown dominio usa la etiqueta (p. ej. D3 Futuro del trabajo/HII); el id usa el código (p. ej. D3-001).


5. Etiqueta evidencia — MEDIDO vs ILUSTRATIVO (regla dura 4)

Toda fila con cifra o claim cuantitativo lleva la columna evidencia rellena. Materializa la separación medido ≠ ilustrativo en el propio Sheet; sin esta etiqueta la fila no cierra el gate W4.

ValorCuándo aplica
MEDIDOEstudio con datos y metodología declarada. La cifra proviene de telemetría, benchmark o muestra observada.
ILUSTRATIVOHipótesis o cifra no telemétrica. La HII por rol es ILUSTRATIVA hasta haber telemetría real y se propaga como tal a paper y landing.
N-ALa fila no aporta cifra/claim cuantitativo; solo contexto cualitativo.

Confundir medido con ilustrativo tumba la credibilidad ante un VC. La etiqueta ILUSTRATIVO debe propagarse explícitamente a toda cita derivada en paper y landing.


6. DEDUP — una fuente = una fila

  • Cada fuente tiene un id único. Antes de añadir, el curador busca por título + autor + url_fuente.
  • Si una misma fuente sirve a dos dominios, se elige el dominio de mayor proximidad a la columna vertebral y se referencia el cruce en notas. No se duplica la fila.

7. Convención de carga NotebookLM

  • Qué se sube: solo fuentes que ya califican como fila en Corpus (han pasado QUALIFY + URL real + etiqueta evidencia). Garantiza que cada source de NotebookLM tenga su fila trazable (sincronía Sheet↔NotebookLM). No se sube nada que no esté primero en el Sheet.
  • Naming de sources: <código-dominio>-<id> · [autor año] título-corto — p. ej. D3-001 · [autor 2025] título-corto. Hace el source rastreable a su fila del Sheet y a su eslabón de la columna vertebral de un vistazo.
  • Ledger subido_a_notebooklm:
    • pendiente al crear la fila.
    • una vez la fuente está añadida como source (source_add).
    • no si se decide deliberadamente no subirla (p. ej. fuente solo de pricing/landing de competidor D5 que se cita pero no se ingiere).
  • Auditoría del guardián: toda fila con status = citado debe tener subido_a_notebooklm = sí o justificación en notas.
  • Cross-corpus: un único notebook para los 6 dominios en esta fase (consultas cross-dominio para la síntesis W7). Si el volumen (~57-95 fuentes, núcleo ≈70) lo exigiera, se evaluaría partición por dominio en M-02 — decisión a registrar en Dev OS, no aquí.
  • Anna’s Archive: solo lectura propia para ingestión personal en el corpus; nunca como input comercial (constraint del brief).

NotebookLM canónico: notebook 238984eb-8edf-4302-8a9f-4d16d981281d (grounding documental que reduce alucinación vía respuestas con cita).


8. VETO del guardián de trazabilidad

El curador de corpus / guardián de trazabilidad puede vetar cualquier fila que:

  • no tenga fuente,
  • no tenga url_fuente resoluble,
  • lleve cifra ilustrativa no etiquetada como ILUSTRATIVO,
  • caiga fuera de la columna vertebral,
  • caiga fuera de recencia sin justificación de contexto fundacional.

El veto es el mecanismo que convierte el «cero invención» de deseo en regla operativa. Tiene derecho de veto sobre cualquier fila sin URL resoluble o con cifra no respaldada.


9. Separación de registro (reglas duras 8 y 10)

QuéDónde
Bibliografía canónica / trazabilidad de citasGoogle Sheet (única fuente de verdad)
Decisiones técnicas / feature de productomcpstartupos Dev OS
Thinking / rationale / cambios de opiniónjournal/

El Sheet no se duplica en markdown. Este protocolo describe el contrato; no almacena fuentes.