Estos scripts de la Fase 3 para llevar a cabo el análisis estadístico de todos los datos obtenidos.
1.4 KiB
1.4 KiB
Fase 3 — Análisis Estadístico (Adicciones ↔ Violencia)
Este módulo ejecuta un análisis estadístico integral que estudia la relación entre actividad de juego, prohibiciones, consumo y condenas en el contexto social y económico de las adicciones y la violencia.
Ejecución
Ejecutar el script principal:
python3 analisis.py
Requisitos
- Python 3.10 o superior
- PostgreSQL (base de datos:
adicciones) - Librerías principales:
- pandas
- numpy
- matplotlib
- sqlalchemy
- scikit-learn
- statsmodels
- openai (para conclusiones automáticas GPT-4o)
Instalación rápida:
pip install -r requirements.txt
Descripción General
El proceso realiza:
- Carga y limpieza de datos desde PostgreSQL.
- Normalización y agregación anual de métricas clave.
- Análisis descriptivo ampliado, incluyendo asimetría, curtosis, variaciones YoY, CAGR y medias móviles.
- Modelado estadístico avanzado mediante OLS, WLS, RLM, PCA y análisis de multicolinealidad (VIF).
- Evaluación de correlaciones (Pearson, Spearman, Kendall y parciales).
- Generación automática de gráficos y reportes HTML con análisis interpretativo y conclusión redactada por GPT-4o.
Salida final: /salidas/reporte_estadistico.html — Reporte interactivo con tablas, gráficos y conclusiones.