Presencial en Todas las provincias de España
También en Modalidad: Online
400 Horas / 60-300 Horas prácticas
30 ECTS
Modalidad Abierta
El término "big data" se refiere a conjuntos de datos extremadamente grandes y complejos que son difíciles de gestionar, procesar y analizar utilizando herramientas tradicionales de procesamiento de datos.
El objetivo del análisis de big data es descubrir patrones, tendencias y relaciones ocultas en los datos, con el fin de obtener información significativa y valiosa que pueda ser utilizada para tomar decisiones informadas, mejorar la eficiencia, identificar oportunidades comerciales, predecir comportamientos futuros, entre otros.
Para manejar y analizar el big data, se utilizan herramientas y tecnologías como sistemas de almacenamiento distribuido, bases de datos NoSQL, frameworks de procesamiento de datos como Hadoop y Spark, técnicas de minería de datos, aprendizaje automático (machine learning), inteligencia artificial y visualización de datos, entre otros.
Es importante destacar que el big data plantea desafíos en términos de privacidad, seguridad y ética, ya que implica el manejo de grandes cantidades de información personal y confidencial. Por lo tanto, es necesario adoptar medidas adecuadas para proteger los datos y garantizar su uso responsable.
Mejora en la toma de decisiones: El análisis de grandes volúmenes de datos (big data) puede proporcionar información valiosa para la toma de decisiones estratégicas.
¿Quieres ser un hacha del análisis de datos? Con nuestra formación online de Big Data te prepararás para trabajar como arquitecto de datos, data scientist, data consultant o big data developer (entre otras profesiones). Podrás especializarte en Apache Hadoop y Business Intelligence y fliparlo con las oportunidades que crecen cada día para quien está dispuesto a formarse en este sector. Estás ready?
¿Qué aprenderás?
En esta formación de Big Data te adentrarás en el mundo de la programación, conocerás su ecosistema y cómo utilizarlo para la resolución de problemas, aprenderás a visualizar los datos de una manera correcta para conseguir una clara interpretación de los mismos, conocerás y pondrás en práctica las diferentes técnicas para la explotación de datos y prepararás proyectos orientados al Big Data incluyendo elementos fundamentales… Para todo ello utilizarás Databricks y trabajarás con Python, Spark, SQL, Hadoop… También te enseñaremos algunos algoritmos del Machine Learning.
Sukiru: habilidades para samuráis digitales
¡Curso complementario!
Sukiru significa habilidad en japonés y eso es lo que queremos fomentar en nuestra escuela: que nuestros alumnos se hagan con todas las habilidades necesarias para triunfar "ahí fuera".
Por eso, con esta formación podrás disfrutar de nuestro curso en metodologías de trabajo Scrum Manager.
Te preparamos para que puedas conseguir la certificación Data Science de IBM. La ciencia de datos es la práctica de extraer conocimiento de cantidades masivas de datos, utilizando métodos como estadísticas, aprendizaje automático, minería de datos y análisis predictivo. Esta disciplina está revolucionando la forma en que las organizaciones resuelven problemas y obtienen ventajas competitivas.
Además, tendrás acceso a IBM Skills Academy pudiendo realizar un curso a mayores de data science (75 horas con clases, laboratorios y estudios de caso).
- Arquitecto de datos
- Data Scientist
- Data Consultant
- Big Data Developer
Bloque 1: Introducción al Big Data
Ecosistema Big Data
Aprenderás a conocer el mundo que rodea el Big Data y cómo se utilizan sus distintos ecosistemas en la resolución de problemas.
Estrategias basadas en datos
Cuadros de mando (dashboards) y la gran “pelea”: Business Intelligence vs. Big Data.
Entornos de procesamiento
Cloud Computing e Internet de las Cosas (IoT).
Ejemplos en la industria
Conocerás de forma práctica y teórica casos reales de la aplicación del Big Data dentro del sector industrial.
Bloque 2: El dato, su ciclo de vida y almacenamiento
Datos
El dato, su contexto y cómo se gestiona desde que se genera hasta que se implica una toma de decisiones por parte de una persona o máquina.
Derechos, calidad, fuentes
¿Quién genera qué? Cómo lo hace? ¿Con qué fuentes nos encontramos? ¿Existen derechos sobre los datos? Controlarás sobre esto y ¡mucho más!
Tratamiento, carga, procesamiento
Se pueden tener muchos datos y que no sirvan para nada. ¿Cómo se tratarán estos datos? ¿Cuál es el procesamiento de los mismos?
Almacenamiento escalable de datos
Conocerás los sistemas distribuidos (Hadoop), las bases de datos no estructuradas (MongoDB) y las bases de datos de grafos (Neo4j o Spark GraphX).
Bloque 3: Análisis para la Explotación de datos: (Python, R y/o PySpark)
Perfiles, análisis y técnicas
Los datos se crean y almacenan para algo: la toma de decisiones.
Técnicas de muestreo de datos
¿Qué información llevan los datos “a simple vista” (análisis exploratorio)? ¿Cómo puedo extraer información “oculta” en los datos?
Contraste, regresión y predicción
Pondrás en práctica diferentes técnicas para la explotación de datos. Conocerás en qué se basan y cómo funcionan los distintos algoritmos de machine learning.
Introducción al Deep Learning
Entrarás de lleno en este tipo de machine learning que entrena a una computadora para que realice tareas como las que podrías hacer tú.
Bloque 4: Presentación de proyectos Big Data y storytelling
Preparación de proyecto
¿Qué cosas no se pueden olvidar a la hora de hablar de un proyecto Big Data?
Storytelling
¿Qué es el storytelling y cómo nos puede ayudar a llegar a nuestra audiencia?
Elementos fundamentales
Aprenderás a preparar una presentación orientada a proyectos de Big Data en la cual se definen qué elementos son fundamentales y sobre los que se debe reflexionar si son necesarios o no así como al hecho de llevar a cabo una preparación de la misma más allá del documento a presentar.
La presentación
Sabrás hacerla. Querrás enseñarla.
Especialidades
¿Qué aprenderás con Apache Hadoop?
Hadoop es una de las herramientas de Apache que trabaja con Big Data y permite el desarrollo de aplicaciones de procesamiento paralelo, lo que hace que podamos trabajar con miles de nodos y petabytes de datos. En su núcleo, Hadoop tiene dos funciones principales: almacenar datos (HDFS) y procesar datos (MapReduce). Con esta especialización dominarás todos los procesos de implementación y administración de recursos que usan los softwares, webs o aplicaciones alojadas, así como aprenderás a monitorizar su rendimiento y el cumplimiento de las normas y la seguridad.
Temario
Módulo 1
Introducción al Big Data
Módulo 2
Apache Hadoop (HDFS)
Módulo 3
Map Reduce & Yarn
Módulo 4
Ecosistema Hadoop
*Se pueden cursar varias especialidades de forma simultánea.
¿Qué aprenderás con Business Intelligence?
Tokier: esta especialización en Business Intelligence te está esperando. Con este plus, las herramientas más recientes y las técnicas de análisis de datos, podrás entender el contexto y la importancia de los datos de negocio para transformar las organizaciones. Podrás trabajar como gerente de datos y análisis, responsable de visualización de datos de negocio, director de datos, consultor de inteligencia de negocio o analista de datos, ¡por ejemplo!
Temario
Módulo 1
Introducción al Business Intelligence
Módulo 2
ETL e introducción a la visualización
Módulo 3
Introducción al Power BI
Módulo 4
Introducción a Tableau y Tableau avanzado
*Se pueden cursar varias especialidades de forma simultánea.