Introducción a la ciencia de datos utilizando PYTHON

ÁREA: DESARROLLO DE SOFTWARE

PRESENTACIÓN

Diariamente en Internet se genera y almacena información equivalente a 2 Exabytes, con una tendencia al alza cada año. Cada minuto se suben 72 horas de video en YouTube®, más de 500,000 mensajes en Twitter®, alrededor de 100,000 nuevos artículos en sitios como WordPress® y más de 10,000 fotografías en Instagram® y Flickr®. La Ciencia de Datos se emplea en este entorno para establecer predicciones y tomar decisiones en prácticamente cualquier ámbito donde haya grandes volúmenes de datos.

PERFIL DE INGRESO

Este curso está dirigido a las personas interesadas en el uso de las herramientas de la Ciencia de Datos, para establecer análisis predictivos y retrospectivos. Se requiere haber acreditado o demostrar conocimientos equivalentes al curso Introducción a la programación.

OBJETIVO

El participante reconocerá las características básicas del flujo de trabajo para el análisis de datos, empleando las herramientas estadísticas y computacionales para su uso elemental en la Ciencia de Datos.

TEMARIO

1. INTRODUCCIÓN
1.1 Conceptos de Machine Learning
1.2 La ciencia de datos
1.3 Flujo de trabajo del análisis de datos
1.4 Aplicaciones de la Ciencia de Datos
2. CONFIGURACIÓN DEL ENTORNO DE TRABAJO PARA EL ANÁLISIS DE DATOS
2.1 Instalación de las herramientas de programación Python
2.2 Instalación de paquetes de análisis de datos (pip, PyCharm, Anaconda y Jupyter)
2.3 Instalación del IDE de programación
3. INTRODUCCIÓN AL LENGUAJE DE PROGRAMACIÓN PYTHON
3.1 Estructura y elementos del lenguaje
3.2 Módulos, paquetes y espacios de nombre
3.3 Programación orientada a objetos
3.4 Uso de bibliotecas
4. INTRODUCCIÓN A LOS ELEMENTOS DE ANÁLISIS ESTADÍSTICO PARA EL ANÁLISIS PREDICTIVO Y EL ANÁLISIS RETROSPECTIVO
4.1 Conceptos básicos de Estadística
4.2 Regresión Lineal con Python
4.3 Regresión Logística con Python
4.4 Segmentación o Clustering
4.5 Árboles de decisión
4.6 Series temporales
4.7 Técnicas de clasificación y predicción supervisada Naïve Bayes
4.8 Procesamiento de Lenguaje Natural
5. OPERACIONES DE PROCESAMIENTOS DE DATOS
5.1 Proceso de preparación de datos o Data Cleaning
5.2 Proceso de limpieza, estructuración y enriquecimiento de datos o Data Wrangling
5.3 Clustering y Clasificación
5.3.1 Árboles y bosques aleatorios
5.3.2 Algoritmo estadístico de clasificación supervisado: K nearest neighbor
5.3.3 Elementos básicos de redes neuronales
6. Perspectivas de la Ciencia de Datos
6.1 El futuro de la Ciencia de Datos

PERFIL DE EGRESO

Los conocimientos adquiridos permitirán al participante conocer algunas de las herramientas empleadas para el tratamiento de análisis estadístico, así como las operaciones de procesamiento de datos involucradas en la Ciencia de Datos.

REQUISITOS ACADÉMICOS

Estudios mínimos de preparatoria o equivalente.

DURACIÓN

30 horas

RECURSOS INFORMÁTICOS

BIBLIOGRAFÍA


Diciembre 2023