Documentar modelo cats 1645-1652 (derivado de cartas) y formalizar regeneración del CSV #59

Closed
opened 2026-06-28 19:13:52 +00:00 by rafa · 0 comments
Owner

Origen

Tras descartar el #41 (mi diagnóstico erróneo), queda como trabajo útil documentar y formalizar el modelo real de clasificación de feadulta.

Modelo (recordatorio)

Las cats WP 1645-1652 (lecturas-biblicas, comentario-editorial, comentarios-al-evangelio, eucaristia, multimedia, articulos, noticias, otros) derivan del encabezado bajo el cual cada post aparece en cartas semanales históricas:

Sección en la carta → cat WP
Artículos seleccionados para la semana 1650
Evangelio y comentarios al Evangelio 1647
Material multimedia 1649
Para unas eucaristías más participativas y actuales 1648
Lecturas / Comentario editorial / Noticias / Otros 1645 / 1646 / 1651 / 1652

Materializado en clasificacion_articulos.csv (16.921 filas, raíz del repo, generado 2026-03-05).

Trabajo

1. Documentar en wiki

  • Página Categorías y términos: añadir sección "Cómo se derivan las cats 1645-1652" con el mapping, explicación del CSV y nota de que es derivado (no manual).
  • Página Carta de la semana: cross-link al modelo de clasificación.
  • Página nueva o sección en Scripts de migración: describir el CSV y el proceso de derivación.

2. Formalizar regeneración del CSV

Hoy el CSV existe estático desde marzo 2026. Cada delta posterior asigna cats puntualmente a posts nuevos, pero el CSV no se regenera → no es fuente de verdad auditable a fecha actual.

Propuesta: script scripts/regenerar_clasificacion_csv.py que:

  • Recorre todas las cartas (cats 6, 21, 22) ordenadas por fecha
  • Para cada carta, llama a una versión Python de fea_extract_sections_from_html (paridad con el mu-plugin del #38)
  • Resuelve links a WP post_id
  • Genera clasificacion_articulos.csv actualizado
  • Opcional: detecta divergencias contra cats actuales del WP y reporta

3. Re-clasificación opcional

Tras regenerar el CSV, opcionalmente aplicar SQL para reasignar cats 1645-1652. Esto corregiría posibles desviaciones acumuladas. No es obligatorio — solo si se detectan inconsistencias relevantes.

No bloqueante

Ni para cutover ni para #38. Es documentación + tooling de mantenimiento.

Criterios de aceptación

  • Wiki actualizada con el modelo
  • Script regenerar_clasificacion_csv.py funcional, reproducible
  • Diff entre CSV regenerado y el de marzo 2026 documentado en el issue
## Origen Tras descartar el #41 (mi diagnóstico erróneo), queda como trabajo útil documentar y formalizar el modelo real de clasificación de feadulta. ## Modelo (recordatorio) Las cats WP `1645-1652` (lecturas-biblicas, comentario-editorial, comentarios-al-evangelio, eucaristia, multimedia, articulos, noticias, otros) **derivan del encabezado bajo el cual cada post aparece en cartas semanales históricas**: | Sección en la carta | → cat WP | |---|---:| | Artículos seleccionados para la semana | 1650 | | Evangelio y comentarios al Evangelio | 1647 | | Material multimedia | 1649 | | Para unas eucaristías más participativas y actuales | 1648 | | Lecturas / Comentario editorial / Noticias / Otros | 1645 / 1646 / 1651 / 1652 | Materializado en `clasificacion_articulos.csv` (16.921 filas, raíz del repo, generado 2026-03-05). ## Trabajo ### 1. Documentar en wiki - Página [Categorías y términos](../wiki/Categorias-y-terminos): añadir sección "Cómo se derivan las cats 1645-1652" con el mapping, explicación del CSV y nota de que es derivado (no manual). - Página [Carta de la semana](../wiki/Carta-de-la-semana): cross-link al modelo de clasificación. - Página nueva o sección en [Scripts de migración](../wiki/Scripts-de-migracion): describir el CSV y el proceso de derivación. ### 2. Formalizar regeneración del CSV Hoy el CSV existe estático desde marzo 2026. Cada delta posterior asigna cats puntualmente a posts nuevos, pero **el CSV no se regenera** → no es fuente de verdad auditable a fecha actual. Propuesta: script `scripts/regenerar_clasificacion_csv.py` que: - Recorre todas las cartas (cats 6, 21, 22) ordenadas por fecha - Para cada carta, llama a una versión Python de `fea_extract_sections_from_html` (paridad con el mu-plugin del #38) - Resuelve links a WP post_id - Genera `clasificacion_articulos.csv` actualizado - Opcional: detecta divergencias contra cats actuales del WP y reporta ### 3. Re-clasificación opcional Tras regenerar el CSV, opcionalmente aplicar SQL para reasignar cats 1645-1652. Esto corregiría posibles desviaciones acumuladas. **No es obligatorio** — solo si se detectan inconsistencias relevantes. ## No bloqueante Ni para cutover ni para #38. Es documentación + tooling de mantenimiento. ## Criterios de aceptación - Wiki actualizada con el modelo - Script `regenerar_clasificacion_csv.py` funcional, reproducible - Diff entre CSV regenerado y el de marzo 2026 documentado en el issue
rafa closed this issue 2026-06-28 19:13:52 +00:00
Sign in to join this conversation.
No Label
1 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: rafa/feadulta#59