Estos scripts de la Fase 3 para llevar a cabo el análisis estadístico de todos los datos obtenidos.
44 lines
1.4 KiB
Markdown
44 lines
1.4 KiB
Markdown
# Fase 3 — Análisis Estadístico (Adicciones ↔ Violencia)
|
|
|
|
Este módulo ejecuta un análisis estadístico integral que estudia la relación entre **actividad de juego**, **prohibiciones**, **consumo** y **condenas** en el contexto social y económico de las adicciones y la violencia.
|
|
|
|
## Ejecución
|
|
|
|
Ejecutar el script principal:
|
|
|
|
```bash
|
|
python3 analisis.py
|
|
```
|
|
|
|
## Requisitos
|
|
|
|
- Python 3.10 o superior
|
|
- PostgreSQL (base de datos: `adicciones`)
|
|
- Librerías principales:
|
|
- pandas
|
|
- numpy
|
|
- matplotlib
|
|
- sqlalchemy
|
|
- scikit-learn
|
|
- statsmodels
|
|
- openai (para conclusiones automáticas GPT-4o)
|
|
|
|
Instalación rápida:
|
|
|
|
```bash
|
|
pip install -r requirements.txt
|
|
```
|
|
|
|
## Descripción General
|
|
|
|
El proceso realiza:
|
|
|
|
1. **Carga y limpieza** de datos desde PostgreSQL.
|
|
2. **Normalización y agregación anual** de métricas clave.
|
|
3. **Análisis descriptivo ampliado**, incluyendo asimetría, curtosis, variaciones YoY, CAGR y medias móviles.
|
|
4. **Modelado estadístico avanzado** mediante OLS, WLS, RLM, PCA y análisis de multicolinealidad (VIF).
|
|
5. **Evaluación de correlaciones** (Pearson, Spearman, Kendall y parciales).
|
|
6. **Generación automática de gráficos y reportes HTML** con análisis interpretativo y **conclusión redactada por GPT-4o**.
|
|
|
|
Salida final: `/salidas/reporte_estadistico.html` — Reporte interactivo con tablas, gráficos y conclusiones.
|