Code-Sprint/Estadistica-3/README.md
diqueran f2799cde60 Scripts Estadísticos
Estos scripts de la Fase 3 para llevar a cabo el análisis estadístico de todos los datos obtenidos.
2025-10-28 15:48:51 +01:00

44 lines
1.4 KiB
Markdown

# Fase 3 — Análisis Estadístico (Adicciones ↔ Violencia)
Este módulo ejecuta un análisis estadístico integral que estudia la relación entre **actividad de juego**, **prohibiciones**, **consumo** y **condenas** en el contexto social y económico de las adicciones y la violencia.
## Ejecución
Ejecutar el script principal:
```bash
python3 analisis.py
```
## Requisitos
- Python 3.10 o superior
- PostgreSQL (base de datos: `adicciones`)
- Librerías principales:
- pandas
- numpy
- matplotlib
- sqlalchemy
- scikit-learn
- statsmodels
- openai (para conclusiones automáticas GPT-4o)
Instalación rápida:
```bash
pip install -r requirements.txt
```
## Descripción General
El proceso realiza:
1. **Carga y limpieza** de datos desde PostgreSQL.
2. **Normalización y agregación anual** de métricas clave.
3. **Análisis descriptivo ampliado**, incluyendo asimetría, curtosis, variaciones YoY, CAGR y medias móviles.
4. **Modelado estadístico avanzado** mediante OLS, WLS, RLM, PCA y análisis de multicolinealidad (VIF).
5. **Evaluación de correlaciones** (Pearson, Spearman, Kendall y parciales).
6. **Generación automática de gráficos y reportes HTML** con análisis interpretativo y **conclusión redactada por GPT-4o**.
Salida final: `/salidas/reporte_estadistico.html` — Reporte interactivo con tablas, gráficos y conclusiones.