Protocolo de trazabilidad del corpus — Momentum Skills Research
Contrato operativo del corpus. Lo siguen W2, W3 y W6 sin reinterpretación. Materializa las reglas duras del brief (cero invención, recencia, separación medido/ilustrativo) en convenciones verificables sobre el Google Sheet canónico y el NotebookLM corpus.
Estado: fijado en W1 (setup). La carga real de fuentes es M-02 (W2/W3/W6). En W1 no se puebla ninguna fila.
0. Principio rector — la columna vertebral
Toda fuente se evalúa por una sola pregunta: ¿sostiene o refuta la columna vertebral del paper?
categoría → colapso (lead-time) → HII → bifurcación (AI / Human Workforce) → mapa empírico de reemplazabilidad
- Una fuente que sostiene un eslabón (lo prueba, lo cuantifica, lo fundamenta teóricamente) entra como fila.
- Una fuente que refuta un eslabón también entra: el contraargumento es señal, no ruido.
- Una fuente que no toca ningún eslabón no es research de Momentum: es curiosidad. No entra (regla dura 3).
Cada fila declara en notas qué eslabón toca. Sin esa declaración, la fila no está calificada para citarse.
Fuente única de verdad de la trazabilidad de citas: el Google Sheet. No hay bibliografía en markdown disperso (regla dura 8). Decisiones técnicas/feature → mcpstartupos Dev OS. Thinking/rationale → journal/ (regla dura 10).
1. Taxonomía de columnas — tab Corpus
| # | Columna | Tipo | Definición operativa |
|---|---|---|---|
| A | id | texto | Identificador secuencial estable de la fila (p. ej. D3-001). Es el ancla de cita: el paper cita la fila por su id, no por la URL. Inmutable una vez asignado. Formato: <dominio>-<NNN>. |
| B | título | texto | Título literal de la fuente. Sin parafrasear. |
| C | autor | texto | Autor(es) o institución emisora. |
| D | tipo | dropdown | Clase de fuente: paper | libro | POV | report. |
| E | año | número | Año de publicación. Gobierna el filtro de recencia 2024-2026 (regla dura 2). |
| F | dominio | dropdown | Dominio MECE al que sirve (ver §4). |
| G | status | dropdown | Estado de procesamiento: pendiente | leído | citado | descartado. |
| H | subido_a_notebooklm | dropdown | Ledger de sincronía Sheet↔NotebookLM: pendiente | sí | no (ver §6). |
| I | url_fuente | texto/URL | URL real y resoluble a la fuente primaria. Sin url_fuente verificable la fila no califica (regla dura 1). |
| J | notas | texto | Anotación del curador: hallazgo clave, eslabón de la columna vertebral que toca, advertencia de método, cruce cross-dominio si aplica. |
| K | evidencia | dropdown (NUEVA) | Naturaleza del dato (ver §5): MEDIDO | ILUSTRATIVO | N-A. |
Posición de la columna evidencia: columna K, inmediatamente después de notas (J). Se sitúa al final para no desplazar el orden histórico de columnas ya conocido por el equipo; queda documentada en el tab README del Sheet.
Tab Vocabulario
| Columna | Definición |
|---|---|
término/frase | Término o frase candidata del léxico Momentum (en inglés técnico o es-ES según destino). |
definición | Definición operativa breve. |
dominio | Dominio MECE al que pertenece el término (mismos valores que Corpus). |
candidato_acuñación | Marca si el término es candidato a acuñación propia (vocabulario de marca). |
notas marketing | Uso previsto en paper/landing, connotación, riesgo de sobre-promesa. |
2. QUALIFY — qué hace que una fuente entre como fila
Una fuente califica solo si cumple las tres condiciones:
- Toca la columna vertebral — sostiene o refuta
categoría → colapso → HII → bifurcación → mapa(regla dura 3). Si no, es ruido y no entra. - Tiene
url_fuentereal y resoluble a fuente primaria, siempre que la fuente exista en la web. Cero invención de fuentes o datos (regla dura 1). - Cumple recencia (§3) o queda justificada como contexto fundacional en
notas.
Sin fila no hay cita; sin cita no hay claim en el paper (regla dura 1).
3. RECENCIA 2024-2026
- Prioridad estricta a fuentes 2024-2026. El campo
añoes el control. - Pre-2024 entra SOLO como base teórica: teoría de HII, ciencia del aprendizaje (D6). Nunca como evidencia de la trayectoria actual de agentes (D2) ni del estado del mercado (D1/D5).
- D2 (agéntica/MCP) revalida al cierre de W3 por obsolescencia rápida (riesgo R5): toda fuente D2 se re-verifica para descartar afirmaciones superadas.
Toda fila pre-2024 lleva en notas la justificación explícita de contexto fundacional; sin ella, el guardián la veta.
4. Mapeo dominio → dropdown (MECE)
| Código | Etiqueta dropdown | Alcance |
|---|---|---|
D1 | EdTech adultos | EdTech, educación online de adultos, formación con IA/agentes. |
D2 | IA agentes/MCP | Trayectoria de agentes, capacidades, MCP, tooling. (Revalida cierre W3.) |
D3 | Futuro del trabajo/HII | Human Inflation Index, reemplazabilidad, lead-time del colapso. |
D4 | Escenarios IA 2027-2030 | Proyecciones, escenarios, bifurcación AI/Human Workforce. |
D5 | Mercado/Competencia | Tamaño de mercado, competidores, pricing, landing de rivales. |
D6 | Pedagogía | Ciencia del aprendizaje, diseño instruccional, andragogía. |
El valor del dropdown dominio usa la etiqueta (p. ej. D3 Futuro del trabajo/HII); el id usa el código (p. ej. D3-001).
5. Etiqueta evidencia — MEDIDO vs ILUSTRATIVO (regla dura 4)
Toda fila con cifra o claim cuantitativo lleva la columna evidencia rellena. Materializa la separación medido ≠ ilustrativo en el propio Sheet; sin esta etiqueta la fila no cierra el gate W4.
| Valor | Cuándo aplica |
|---|---|
MEDIDO | Estudio con datos y metodología declarada. La cifra proviene de telemetría, benchmark o muestra observada. |
ILUSTRATIVO | Hipótesis o cifra no telemétrica. La HII por rol es ILUSTRATIVA hasta haber telemetría real y se propaga como tal a paper y landing. |
N-A | La fila no aporta cifra/claim cuantitativo; solo contexto cualitativo. |
Confundir medido con ilustrativo tumba la credibilidad ante un VC. La etiqueta ILUSTRATIVO debe propagarse explícitamente a toda cita derivada en paper y landing.
6. DEDUP — una fuente = una fila
- Cada fuente tiene un
idúnico. Antes de añadir, el curador busca portítulo+autor+url_fuente. - Si una misma fuente sirve a dos dominios, se elige el dominio de mayor proximidad a la columna vertebral y se referencia el cruce en
notas. No se duplica la fila.
7. Convención de carga NotebookLM
- Qué se sube: solo fuentes que ya califican como fila en
Corpus(han pasado QUALIFY + URL real + etiquetaevidencia). Garantiza que cada source de NotebookLM tenga su fila trazable (sincronía Sheet↔NotebookLM). No se sube nada que no esté primero en el Sheet. - Naming de sources:
<código-dominio>-<id> · [autor año] título-corto— p. ej.D3-001 · [autor 2025] título-corto. Hace el source rastreable a su fila del Sheet y a su eslabón de la columna vertebral de un vistazo. - Ledger
subido_a_notebooklm:pendienteal crear la fila.síuna vez la fuente está añadida como source (source_add).nosi se decide deliberadamente no subirla (p. ej. fuente solo de pricing/landing de competidor D5 que se cita pero no se ingiere).
- Auditoría del guardián: toda fila con
status = citadodebe tenersubido_a_notebooklm = sío justificación ennotas. - Cross-corpus: un único notebook para los 6 dominios en esta fase (consultas cross-dominio para la síntesis W7). Si el volumen (~57-95 fuentes, núcleo ≈70) lo exigiera, se evaluaría partición por dominio en M-02 — decisión a registrar en Dev OS, no aquí.
- Anna’s Archive: solo lectura propia para ingestión personal en el corpus; nunca como input comercial (constraint del brief).
NotebookLM canónico: notebook 238984eb-8edf-4302-8a9f-4d16d981281d (grounding documental que reduce alucinación vía respuestas con cita).
8. VETO del guardián de trazabilidad
El curador de corpus / guardián de trazabilidad puede vetar cualquier fila que:
- no tenga fuente,
- no tenga
url_fuenteresoluble, - lleve cifra ilustrativa no etiquetada como
ILUSTRATIVO, - caiga fuera de la columna vertebral,
- caiga fuera de recencia sin justificación de contexto fundacional.
El veto es el mecanismo que convierte el «cero invención» de deseo en regla operativa. Tiene derecho de veto sobre cualquier fila sin URL resoluble o con cifra no respaldada.
9. Separación de registro (reglas duras 8 y 10)
| Qué | Dónde |
|---|---|
| Bibliografía canónica / trazabilidad de citas | Google Sheet (única fuente de verdad) |
| Decisiones técnicas / feature de producto | mcpstartupos Dev OS |
| Thinking / rationale / cambios de opinión | journal/ |
El Sheet no se duplica en markdown. Este protocolo describe el contrato; no almacena fuentes.