Documentar modelo cats 1645-1652 (derivado de cartas) y formalizar regeneración del CSV #59

New Issue

2026-06-28T19:13:52Z

rafa commented

2026-06-28 19:13:52 +00:00

Origen

Tras descartar el #41 (mi diagnóstico erróneo), queda como trabajo útil documentar y formalizar el modelo real de clasificación de feadulta.

Modelo (recordatorio)

Las cats WP 1645-1652 (lecturas-biblicas, comentario-editorial, comentarios-al-evangelio, eucaristia, multimedia, articulos, noticias, otros) derivan del encabezado bajo el cual cada post aparece en cartas semanales históricas:

Sección en la carta	→ cat WP
Artículos seleccionados para la semana	1650
Evangelio y comentarios al Evangelio	1647
Material multimedia	1649
Para unas eucaristías más participativas y actuales	1648
Lecturas / Comentario editorial / Noticias / Otros	1645 / 1646 / 1651 / 1652

Materializado en clasificacion_articulos.csv (16.921 filas, raíz del repo, generado 2026-03-05).

Trabajo

1. Documentar en wiki

Página Categorías y términos: añadir sección "Cómo se derivan las cats 1645-1652" con el mapping, explicación del CSV y nota de que es derivado (no manual).
Página Carta de la semana: cross-link al modelo de clasificación.
Página nueva o sección en Scripts de migración: describir el CSV y el proceso de derivación.

2. Formalizar regeneración del CSV

Hoy el CSV existe estático desde marzo 2026. Cada delta posterior asigna cats puntualmente a posts nuevos, pero el CSV no se regenera → no es fuente de verdad auditable a fecha actual.

Propuesta: script scripts/regenerar_clasificacion_csv.py que:

Recorre todas las cartas (cats 6, 21, 22) ordenadas por fecha
Para cada carta, llama a una versión Python de fea_extract_sections_from_html (paridad con el mu-plugin del #38)
Resuelve links a WP post_id
Genera clasificacion_articulos.csv actualizado
Opcional: detecta divergencias contra cats actuales del WP y reporta

3. Re-clasificación opcional

Tras regenerar el CSV, opcionalmente aplicar SQL para reasignar cats 1645-1652. Esto corregiría posibles desviaciones acumuladas. No es obligatorio — solo si se detectan inconsistencias relevantes.

No bloqueante

Ni para cutover ni para #38. Es documentación + tooling de mantenimiento.

Criterios de aceptación

Wiki actualizada con el modelo
Script regenerar_clasificacion_csv.py funcional, reproducible
Diff entre CSV regenerado y el de marzo 2026 documentado en el issue

## Origen Tras descartar el #41 (mi diagnóstico erróneo), queda como trabajo útil documentar y formalizar el modelo real de clasificación de feadulta. ## Modelo (recordatorio) Las cats WP `1645-1652` (lecturas-biblicas, comentario-editorial, comentarios-al-evangelio, eucaristia, multimedia, articulos, noticias, otros) **derivan del encabezado bajo el cual cada post aparece en cartas semanales históricas**: | Sección en la carta | → cat WP | |---|---:| | Artículos seleccionados para la semana | 1650 | | Evangelio y comentarios al Evangelio | 1647 | | Material multimedia | 1649 | | Para unas eucaristías más participativas y actuales | 1648 | | Lecturas / Comentario editorial / Noticias / Otros | 1645 / 1646 / 1651 / 1652 | Materializado en `clasificacion_articulos.csv` (16.921 filas, raíz del repo, generado 2026-03-05). ## Trabajo ### 1. Documentar en wiki - Página [Categorías y términos](../wiki/Categorias-y-terminos): añadir sección "Cómo se derivan las cats 1645-1652" con el mapping, explicación del CSV y nota de que es derivado (no manual). - Página [Carta de la semana](../wiki/Carta-de-la-semana): cross-link al modelo de clasificación. - Página nueva o sección en [Scripts de migración](../wiki/Scripts-de-migracion): describir el CSV y el proceso de derivación. ### 2. Formalizar regeneración del CSV Hoy el CSV existe estático desde marzo 2026. Cada delta posterior asigna cats puntualmente a posts nuevos, pero **el CSV no se regenera** → no es fuente de verdad auditable a fecha actual. Propuesta: script `scripts/regenerar_clasificacion_csv.py` que: - Recorre todas las cartas (cats 6, 21, 22) ordenadas por fecha - Para cada carta, llama a una versión Python de `fea_extract_sections_from_html` (paridad con el mu-plugin del #38) - Resuelve links a WP post_id - Genera `clasificacion_articulos.csv` actualizado - Opcional: detecta divergencias contra cats actuales del WP y reporta ### 3. Re-clasificación opcional Tras regenerar el CSV, opcionalmente aplicar SQL para reasignar cats 1645-1652. Esto corregiría posibles desviaciones acumuladas. **No es obligatorio** — solo si se detectan inconsistencias relevantes. ## No bloqueante Ni para cutover ni para #38. Es documentación + tooling de mantenimiento. ## Criterios de aceptación - Wiki actualizada con el modelo - Script `regenerar_clasificacion_csv.py` funcional, reproducible - Diff entre CSV regenerado y el de marzo 2026 documentado en el issue

rafa closed this issue

2026-06-28 19:13:52 +00:00

Sign in to join this conversation.

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: rafa/feadulta#59