
Estadistica para ciencia de datos
Temario de Estadística para Ciencia de Datos
bajo revisión
Nivel Básico
Introducción a la estadística descriptiva
- Medidas de tendencia central (media, mediana, moda)
- Medidas de dispersión (varianza, desviación estándar)
- Herramientas Python: NumPy, Pandas
- Práctica: Análisis básico en hojas de cálculo de Google
Visualización de datos
- Tipos de gráficos (barras, histogramas, dispersión)
- Herramientas Python: Matplotlib, Seaborn, Altair
- Práctica: Creación de gráficos en Google Colab
Probabilidad básica
- Conceptos fundamentales
- Distribuciones de probabilidad comunes
- Herramientas Python: SciPy
- Práctica: Simulaciones simples en Google Colab
Introducción a la inferencia estadística
- Muestreo y estimación
- Intervalos de confianza
- Herramientas Python: StatsModels, Scikitlearn
- Práctica: Análisis de datos de ejemplo en bases de datos abiertas
Nivel Intermedio
Pruebas de hipótesis
- Pruebas paramétricas y no paramétricas
- Errores Tipo I y Tipo II
- Herramientas Python: SciPy, StatsModels
- Práctica: Aplicación en datos reales de bases abiertas
Análisis de regresión
- Regresión lineal simple y múltiple
- Evaluación de modelos
- Herramientas Python: Scikit-learn, StatsModels
- Práctica: Modelado en Google Colab con datos de bases abiertas
Análisis de varianza (ANOVA)
- ANOVA de una vía y factorial
- Herramientas Python: SciPy, StatsModels
- Práctica: Análisis en Google Colab
Series temporales básicas
- Componentes de una serie temporal
- Modelos de suavizado
- Herramientas Python: Pandas, StatsModels
- Práctica: Análisis de series temporales en hojas de cálculo de Google y Google Colab
Nivel Avanzado
Métodos de remuestreo
- Bootstrap
- Validación cruzada
- Herramientas Python: Scikit-learn
- Práctica: Implementación en Google Colab
Modelos lineales generalizados
- Regresión logística, Poisson
- Herramientas Python: StatsModels, Scikit-learn
- Práctica: Modelado avanzado con datos de bases abiertas
Análisis multivariado
- Análisis de componentes principales (PCA)
- Análisis factorial
- Herramientas Python: Scikit-learn
- Práctica: Reducción de dimensionalidad en Google Colab
Métodos Bayesianos
- Teorema de Bayes
- Inferencia Bayesiana
- Herramientas Python: PyMC3
- Práctica: Modelado Bayesiano en Google Colab
Aprendizaje automático estadístico
- Árboles de decisión y bosques aleatorios
- Máquinas de vectores de soporte (SVM)
- Herramientas Python: Scikit-learn
- Práctica: Implementación de modelos en Google Colab con datos de bases abiertas
Series temporales avanzadas
- Modelos ARIMA, SARIMA
- Pronóstico
- Herramientas Python: StatsModels, Prophet
- Práctica: Análisis y predicción de series temporales complejas
Bibliotecas Python adicionales a considerar:
- Plotly (para visualizaciones interactivas)
- Scipy.stats (para funciones estadísticas adicionales)
- Statsmodels.api (para modelado estadístico avanzado)
- XGBoost (para modelos de gradiente boosting)
- Tensorflow y Keras (para aprendizaje profundo, si es necesario)