Introducción al Big Data

ÁREA: GESTIÓN DE DATOS

PRESENTACIÓN

El volumen de datos que se genera en las organizaciones crece de manera significativa, que es difícil su explotación con las herramientas de gestión de bases de datos tradicionales. Entre las dificultades se encuentran la captura, el almacenamiento, la búsqueda, el intercambio, el análisis y la visualización. En la gestión de grandes volúmenes de datos, el Big Data es un elemento clave, porque utiliza tecnologías heterogéneas, aunque complementarias, para salvar estos inconvenientes: Hadoop, NoSQL, Column oriented DB, MPP DB y SQL Databases, con poderosas herramientas de visualización.

PERFIL DE INGRESO

EL curso está dirigido a las personas interesadas en adquirir los fundamentos del Big Data. Se requiere haber acreditado o demostrar los conocimientos equivalentes al curso Introducción al diseño de bases de datos relacionales y experiencia en el manejo de un sistema de gestión de bases de datos relacional.

OBJETIVO

El participante comprenderá los principales conceptos, metodologías, arquitecturas, tecnologías y plataformas del campo Big Data.

TEMARIO

1. BIG DATA
1.1 ¿Qué es?
1.2 Áreas de uso
1.3 Plataformas
1.4 Entorno Operativo
1.5 Fuentes de Big Data
1.6 Las 5 V de Big Data
1.7 Gobernanza de Big Data
1.8 Aplicaciones analíticas de Big Data
1.9 Problemática que plantea Big Data
2. APACHE HADOOP
2.1 El paradigma Map Reduce
2.2 Sistema de Archivos Distribuidos de Hadoop (HDFS)
2.3 Soporte de SQL en Hive
2.4 Uso del módulo Kite SDK
2.5 Importación de datos con Sqoop
2.6 Ingesta de datos con Apache Flume
2.7 Procesamiento de datos con Apache Pig
2.8 Otras arquitecturas y herramientas
3. BASES DE DATOS NOSQL
3.1 Diferencia entre Bases de datos relacionales y No relacionales
3.2 Datos estructurados y no estructurados
3.3 Arquitectura y tipos de bases de datos NoSQL
3.4 JSON/BSON: Estructura de un objeto
3.5 Bases de datos No SQL
3.5.1 Bases de datos clave – valor
3.5.2 Bases de datos documentales
3.5.3 Bases de datos en grafo
3.5.4 Bases de datos columnares
3.6 Ejemplos de Bases de Datos NoSQL
3.6.1 MongoDB
3.6.2 Apache Cassandra
3.6.3 Hbase
3.6.4 Amazon DynamoDB
4. BIG DATA EN LA NUBE
4.1 Beneficios
4.2 Implementación
4.3 Cloud-Based Hadoop Cluster
4.4 AWS Versus GCP
4.5 Análisis de series de tiempo en métricas de infraestructura en la nube

PERFIL DE EGRESO

El participante conocerá metodologías, arquitecturas, tecnologías y plataformas para el diseño de proyectos de Big Data, enfocados en el manejo de grandes volúmenes de datos.

REQUISITOS ACADÉMICOS

Estudios mínimos, terminados o en curso, de una licenciatura afín al cómputo o la administración.

DURACIÓN

30 horas.

RECURSOS INFORMÁTICOS

BIBLIOGRAFÍA

Diciembre 2023

101293/E