PRESENTACIÓN
El volumen de datos que se genera en las organizaciones crece de manera significativa, que es difícil su explotación con las herramientas de gestión de bases de datos tradicionales. Entre las dificultades se
encuentran la captura, el almacenamiento, la búsqueda, el intercambio, el análisis y la visualización. En la gestión de grandes volúmenes de datos, el Big Data es un elemento clave, porque utiliza tecnologías
heterogéneas, aunque complementarias, para salvar estos inconvenientes: Hadoop, NoSQL, Column oriented DB, MPP DB y SQL Databases, con poderosas herramientas de visualización.
PERFIL DE INGRESO
EL curso está dirigido a las personas interesadas en adquirir los fundamentos del Big Data. Se requiere haber acreditado o demostrar los conocimientos equivalentes al curso Introducción al diseño de bases de
datos relacionales y experiencia en el manejo de un sistema de gestión de bases de datos relacional.
OBJETIVO
El participante comprenderá los principales conceptos, metodologías, arquitecturas, tecnologías y plataformas del campo Big Data.
TEMARIO
1. |
BIG DATA
1.1 |
¿Qué es? |
1.2 |
Áreas de uso |
1.3 |
Plataformas |
1.4 |
Entorno Operativo |
1.5 |
Fuentes de Big Data |
1.6 |
Las 5 V de Big Data |
1.7 |
Gobernanza de Big Data |
1.8 |
Aplicaciones analíticas de Big Data |
1.9 |
Problemática que plantea Big Data |
|
2. |
APACHE HADOOP
2.1 |
El paradigma Map Reduce |
2.2 |
Sistema de Archivos Distribuidos de Hadoop (HDFS) |
2.3 |
Soporte de SQL en Hive |
2.4 |
Uso del módulo Kite SDK |
2.5 |
Importación de datos con Sqoop |
2.6 |
Ingesta de datos con Apache Flume |
2.7 |
Procesamiento de datos con Apache Pig |
2.8 |
Otras arquitecturas y herramientas |
|
3. |
BASES DE DATOS NOSQL
3.1 |
Diferencia entre Bases de datos relacionales y No relacionales |
3.2 |
Datos estructurados y no estructurados |
3.3 |
Arquitectura y tipos de bases de datos NoSQL |
3.4 |
JSON/BSON: Estructura de un objeto |
3.5 |
Bases de datos No SQL
3.5.1 |
Bases de datos clave – valor |
3.5.2 |
Bases de datos documentales |
3.5.3 |
Bases de datos en grafo |
3.5.4 |
Bases de datos columnares |
|
3.6 |
Ejemplos de Bases de Datos NoSQL
3.6.1 |
MongoDB |
3.6.2 |
Apache Cassandra |
3.6.3 |
Hbase |
3.6.4 |
Amazon DynamoDB |
|
|
4. |
BIG DATA EN LA NUBE
4.1 |
Beneficios |
4.2 |
Implementación |
4.3 |
Cloud-Based Hadoop Cluster |
4.4 |
AWS Versus GCP |
4.5 |
Análisis de series de tiempo en métricas de infraestructura en la nube |
|
PERFIL DE EGRESO
El participante conocerá metodologías, arquitecturas, tecnologías y plataformas para el diseño de proyectos de Big Data, enfocados en el manejo de grandes volúmenes de datos.
REQUISITOS ACADÉMICOS
Estudios mínimos, terminados o en curso, de una licenciatura afín al cómputo o la administración.
DURACIÓN
30 horas.
RECURSOS INFORMÁTICOS
- Apache Hadoop.
- MongoDB.
BIBLIOGRAFÍA
- Aldana, José Francisco, Baldominos Gómez, Alejandro, Mochón Morcillo, Francisco, et al. Introducción al Big Data. García Maroto Editores, 2016, 380 pp.
- Adams, Tache. Big Data Now. O’Reilly Media, Inc, 2017.
- Needham, Jeffrey. Disruptive Possibilities: How Big Data Changes Everything. Kindle Edition, 2013, 80 pp.
Diciembre 2023
101293/E