Modelación y programación con R para el análisis estadístico

ÁREA: APOYO A LA ACTIVIDAD MATEMÁTICA

PRESENTACIÓN

La mayoría de los fenómenos naturales y sociales presentan una variabilidad lógica e inherente, por lo que para su estudio y análisis se requiere el uso de técnicas cuantitativas y herramientas estadísticas. En particular, la inferencia estadística ha jugado un papel muy importante en la modelación lineal y no lineal, como herramientas para la toma de decisiones. Debido a la complejidad de los fenómenos y la cantidad significativa de datos que se recopilan en la actualidad, es necesario usar computadoras y software estadístico para facilitar las tareas de investigación.
A pesar de que existe una cantidad importante de software estadístico, R se ha posicionado como uno de los paquetes estadísticos preferidos en la investigación, debido a que es un lenguaje para el cómputo estadístico y las gráficas, de acceso abierto y gratuito, que provee una gran variedad de técnicas estadísticas y un gran poder de graficación, se compila y corre en una variedad de sistemas operativos, además que puede expandir sus capacidades con paquetes independientes.
Para aquellos fenómenos complejos, que requieren un enfoque cuantitativo en su análisis, el paquete estadístico R es la herramienta de investigación ideal.
En este curso se estudiará la aplicación de subrutinas para la graficación avanzada, el análisis de regresión simple, la regresión múltiple, modelos de análisis de covarianza, modelos lineales generalizados, regresión no lineal y métodos multivariados. Se utilizarán bases de datos que contengan datos reales de proyectos de investigación.

OBJETIVO

El participante aplicará la programación del paquete estadístico R y sus herramientas, para el análisis estadístico en el ámbito de la enseñanza y la investigación.

BENEFICIOS

Contar con conocimientos y habilidades que permiten desarrollar modelos para su uso en la predicción y el análisis de fenómenos. Asimismo, de técnicas de programación que facilitan su aplicación, así como el desarrollo académico y profesional de manera eficiente. Aprovechar la portabilidad de R y aplicarlos con su instalación en diferentes sistemas operativos.

DIRIGIDO A:

Este curso está dirigido a profesionales de áreas como Biología, Oceanografía, Oceanología, Química, Economía, Física y Matemáticas, así como estudiantes de postgrado, investigadores y profesionales en áreas multidisciplinarias. Se requieren conocimientos de estadística descriptiva y estadística inferencial.

CONTENIDO

1. GRAFICACIÓN INTERMEDIA EN R
1.1 Mapas
1.2 Gráficas de dispersión condicionadas
1.3 Gráficas 3D
2. PRINCIPIOS BÁSICOS DE MODELACIÓN
2.1 Variables de respuesta, variables predictivas, continuas y factores
2.2 Elementos de un modelo
2.3 Principio de parsimonia
2.4 Tipos de modelos estadísticos
3. REGRESIÓN LINEAL SIMPLE
3.1 Correlación
3.2 Definición y supuestos de la regresión lineal simple
3.3 Estimación de los parámetros de regresión
3.4 Graficación de la regresión
3.5 Prueba de los supuestos de regresión
3.6 Análisis de varianza y regresión
3.7 Cambios de variable
3.8 Notación matricial
3.9 Cálculo de parámetros de la regresión con matrices
4. REGRESIÓN MÚLTIPLE
4.1 Definición y supuestos de la regresión múltiple
4.2 Notación Matricial
4.3 Simplificación para obtener el modelo adecuado mínimo
4.4 Ejemplos complejos
4.5 Problemas comunes de la regresión múltiple
5. ANÁLISIS DE COVARIANZA (ANCOVA)
5.1 Definición y supuestos del análisis de covarianza
5.2 Implificación para obtener el modelo adecuado mínimo
6. MODELOS LINEALES GENERALIZADOS (GLM)
6.1 Definición y supuestos de los modelos lineales generalizados
6.2 Problemas con GLM
6.3 Sobredispersión
6.4 Tipos de errores en GLM
6.5 Funciones de enlace
6.6 Desviación (Deviance)
7. MODELOS NO LINEALES
7.1 Criterios de ajuste: mínimos cuadrados y verosimilitud
7.2 Ajuste de modelos no lineales en Excel usando Solver
7.3 Ajuste de modelos no lineales con R usando nls y optim
8. MÉTODOS MULTIVARIADOS
8.1 Covarianza, correlación y distancia
8.2 Análisis de componentes principales
8.3 Análisis factorial
8.4 Análisis de conglomerados o clústeres
8.5 Análisis de componentes principales

DURACIÓN

40 hrs.

Diciembre 2022

101615/B