Curso - Abierto al público - Presencial - Sede Bucaramanga

El curso buscar desarrollar las habilidades en el manejo de una plataforma de manejo de grandes datos Big data, como lo es Spark, específicamente su framework PySpark ;el cual permite desarrollas análisis de datos básicos, desarrollar e implementar modelos de aprendizaje automático (Supervisado y No Supervisado).

Este curso es homologable en el Diplomado Ciencia de Datos, como el 6to módulo del programa. 

  • Dirigido a

    Profesionales, técnicos o tecnólogos que deseen participar en proyectos de análisis de datos en los sectores industriales, empresariales, productivo, comerciales, salud y otros.

  • Objetivos

    General

    Conocer los elementos del marco de trabajo Spark y desarrolle soluciones de Big data a partir de este.


    Específicos

    • Distinguir los beneficios de utilizar Spark para operaciones de Big data en comparación a un enfoque netamente de map-reduce.
    • Desarrollar soluciones de Big data utilizando los elementos dados en PySpark (SparkSQL, SparkML, SparkStreaming.
  • Competencias de formación

    Comprende

    El participante comprende la estructura general de Spark y como esta es trasladada al marco de trabajo PySpark.


    Analiza

    El participante analiza modelos de aprendizaje automático y métricas u operaciones de análisis de datos en un entorno de Big data como lo es PySpark.


    Aplica

    El participante al diplomado aplica soluciones de Big data a problemas de análisis de grandes volúmenes de datos.

  • Metodología

    El curso se desarrollará a través de sesiones teórico-prácticas con computadora utilizando PySpark.

  • Plan de Estudios

    Unidad 1: Elemento RDD y evaluación lazy

    Unidad 2: Introducción marco de trabajo Py-Spark y elementos

    Unidad 3: SparkSQL

    Unidad 4: Spark ML

    Unidad 5: SparkStreaming

  • Docente

    Daniel Orlando Martínez Quezada. MSc. en Ingeniería Industrial en 2017 e Ingeniero Industrial en 2014, ambos de la Universidad Industrial de Santander, Colombia. Docente tiempo completo de la Universidad Autónoma de Bucaramanga afiliado al Grupo de investigación de Preservación e Intercambio digital de información y conocimiento PRISMA, coordinador de la Especialización en Gestión Logística Integral Docente afiliado al Grupo de Investigación en Optimización y Organización de Sistemas Productivos y Logísticos OPALO, adscrito a la Escuela de Estudios Industriales y Empresariales de la Universidad Industrial de Santander, Colombia.

    **La UNAB se reserva el derecho a modificar el cuerpo docente

Institución de Educación Superior sujeta a la inspección y vigilancia del Ministerio de Educación Nacional