¿Qué es Big Data?
El Big Data es la gestión y el análisis de grandes volúmenes de datos que no pueden ser tratados de manera convencional o con los métodos tradicionales o empleados hasta los últimos años, ya que superan las capacidades de procesamiento y gestión del software tradicional. El concepto de Big Data se refiere a todas las tecnologías, infraestructuras, servicios y nuevos conocimientos creados para dar solución al procesamiento de los enormes volúmenes de datos que generamos, ya sea por nuestra huella en internet, nuestras localizaciones, compras, sensores, micrófonos, cámaras que nos rodean y registran.
 

¿Qué es Machine Learning?
El Aprendizaje Automático (Machine Learning) como campo ahora está increíblemente generalizado, con aplicaciones que van de la web (búsqueda, publicidad y sugerencias) a la seguridad nacional, desde el análisis de interacciones bioquímicas hasta el tráfico y las emisiones hasta la astrofísica.
Este curso lo familiarizará con una amplia muestra representativa de modelos y algoritmos para el aprendizaje automático.
 

  • El curso de Big Data está orientado a introducir y explicar los principales conceptos y tecnologías del campo Big Data. El objetivo es ofrecer una visión holística de Big Data, apoyándonos en su capacidad para generar oportunidades de negocio, así como optimizar los ya existentes. Se verán ejemplos de arquitecturas ya implantadas en el mercado y se analizarán los casos en los que Big Data es y ha sido decisivo. Se utilizará el framework Apache Hadoop para el manejo de grandes volúmenes de información.
  • El curso de Machine Learning con Python tiene como objetivo primordial aprender cómo usar el lenguaje Python para implementar y aplicar algoritmos de aprendizaje automático y Estadística. Esta es una habilidad muy importante para todos los analistas de datos y científicos de datos, que deseen crear modelos predictivos. 
     

BIG DATA CON HADOOP

  •  Introducción al Big Data 
    • Qué es el Big Data. 
    • Conceptos y Terminología. 
    • Aspectos Generales de Big Data (Ejemplos, Fuentes, Adopción, Las V de Big Data).
  • Big Data y Data Science
    • Plataforma Big Data.
    • Big Data y Data Science.
    • Habilidades para los Data Scientists.
    • El proceso de Data Science.
  • Planificación del Big Data
    • Recursos Humanos. 
    • Recursos Organizacionales.
    • Recursos Tecnológicos.
    • Ciclo de Vida del Big Data.
  • Procesamiento de Big Data
    • Procesando Big Data.
    • HADOOP
      • Instalación: Shell, Common Utilities, Configuration.
      • HDFS (Hadoop Distributed File System): Data Operations, File Formats, HDFS Management.
      • MAPREDUCE.
      • YARN.
      • SECURITY: Authentication, authorization, data classification.
      • Laboratorio Cloud.
      • Laboratorio VM.​​​​​​​​​​​​​​

MACHINE LEARNING CON PYTHON

Machine Learning

  • Machine Learning Lenguajes, tipos y ejemplos
  • Machine Learning vs Modelado estadístico
  • Aprendizaje Supervisado (El método de los k vecinos más cercanos, Árboles de decisión, Bosques Aleatorios)
  • Aprendizaje No Supervisado (K-Means, Clustering, Medición de las distancias entre los clústeres, Agrupación basada en densidad)
  • Reducción de dimensionalidad y filtrado colaborativo 

Python

  • Introducción a Python.
    • Herramientas para control de flujo.
    • Estructuras de datos.
    • Módulos
    • Entradas y salidas.
    • Errores y excepciones.
    • Clases
    • Taller práctico.
    • Proyecto Final.    
  • Docentes con amplia experiencia académica y empresarial.
  • Otorga 24 PDU's.
Suscríbete

Entérate de nuestras novedades