Data Science Bootcamp
Data Science Bootcamp es un programa con el que aprenderás de forma práctica todo lo que necesitas para desarrollarte como Data Scientist. A través del programa, serás capaz de resolver los principales retos de la profesión. Junto a nuestros formadores, mentores y empresas del sector tecnológico, te guiaremos en un aprendizaje práctico y orientado a las necesidades del mercado laboral.
Aprenderás Python, sus librerías de análisis de datos y de Machine Learning y Deep Learning para construir y desplegar modelos de Inteligencia artificial para crear modelos predictivos y por tanto servir de apoyo en la toma de decisiones de la empresa.
¡Tú eres el próximo Data Scientist!
Dirigido a…
- Directivos y Responsables de área
- Graduados/as en Ingeniería e Ingenieros/as técnicos/as Universitarios con carreras relacionadas con Empresa, economía, datos y tecnología.
Salidas profesionales
- Data Scientist y/o Data Manager
- Técnico/a en Big Data
- Analista de datos
- Técnico/a en Business Intelligence
- Facilitador/a de proyectos 4.0
- Gestor/a de proyectos 4.0
Formación modular
Módulo 1: Fundamentos básicos de Programación Python
- Introducción y operaciones básicas
- Mutaciones, alias y clonación de listas
- Control de flujo y condicionales
- Iteraciones
- Funciones
- Módulos y archivos
- Introducción a Numpy
- Introducción a Pandas
- Visualización de datos con Matplotlib y Seaborn
- Ejercicios Prácticos.
Módulo 2: El dato: captura, procesamiento, calidad y visualización de datos
- Procesamiento de datos con Python:
- Modificaciones básicas de datos
- Análisis preliminar de variables
- Tratamiento de fechas
- Correcciones masivas de errores tipográficos
- Unión de tablas
- Filtrado
- Modificaciones avanzadas
- Web scraping
- Introducción a la adquisición de datos desde diversas fuentes y técnicas de web scraping
- Técnicas y herramientas de web scraping: Scrapy, Beautiful soup, Selenium…
- Ejemplos reales de recogida de datos
- Primeros pasos con Power BI
- Introducción a DAX
- Creación de informes y Dashboards
- Conexión con fuentes de datos
- Plataformas, bases de datos y procesamientos en la nube
- Bases de datos relacionales y no relacionales.
- SQL
- MongoDB
- Neo4j
- Procesos ETL
- Procesamiento en Azure, AWS y Google
- Bases de datos relacionales y no relacionales.
Módulo 3: Estadística
- Estadística y Econometría:
- Probabilidad.
- Modelos de Distribución Discreta.
- Modelos de Distribución Continua.
- Distribución Normal.
- Estimación.
- Contraste de Hipótesis.
- Tabla ANOVA.
- Estadísticos Básicos y Regresión Lineal.
Módulo 1: Matemáticas
- Álgebra Lineal:
- Vectores.
- Espacios Vectoriales.
- Matrices.
- Cuerpos.
- Sistemas.
- Función de Coste y Mínimos Cuadrados Ordinarios.
- Optimización.
Módulo 2: Calidad del dato
- Detección y tratamiento de Outliers.
- Tratamiento de Valores Perdidos.
Módulo 3: Machine learning
- Definición.
- Mapa conceptual y clasificación de modelos.
- Validación de Modelos.
- Normalización de Variables.
- Modelos Supervisados: Clasificación y Regresión.
- Modelos no Supervisados
Módulo 4: Deep learning
- Definición.
- Redes Neuronales densas.
- Funciones de Activación.
- Procesamiento del Lenguaje Natural.
- Visión Artificial.
- Casos Prácticos.
Módulo 1: Programas de Innovación abierta y plataformas colaborativas
- Características
- Requisitos
- Programas existentes
- Kopuru
Módulo 2: Metodología CRISP-DM
- Conocimientos del negocio
- Conocimiento de los datos
- Limpieza de los datos
- Modelado
- Validación
- Puesta en Producción
Módulo 3: Cuantificación de proyectos de IA
- Creación de Valor en un Proyecto de IA
- Cuantificación del proyecto
- Establecimiento de las medidas a tomar
- Estimación de los costes asociados
- Determinación del beneficio esperado
- Decisión final
Módulo 4: Data Governance
- Introducción al Data Governance
- Órganos Roles y Responsabilidades
- Funciones y Actividades
- Herramientas
- Buenas prácticas
Módulo 5: Open Data
- Principios del Open Data
- Marco de los Datos Abiertos
- Análisis de la normativa vigente
- Licencias y Condiciones de Uso
- Normalización de datos y fomento de la reutilización.
Módulo 6: Casos prácticos y planificación
La duración del programa se estima en 340 horas más el proyecto y reto final.
Clases híbridas (presenciales y telepresenciales) en viernes y sábado que combinan enseñanzas teóricas con aplicación práctica en casos reales.
Durante todo el programa se realizarán trabajos prácticos que se evaluarán para constatar el nivel de progreso
Metodología
- Project based learning: Democratizar la AI mediante retos prácticos durante la capacitación para un aprendizaje eficiente.
- Empresas reales implicadas: Se realizan 6-8 retos de empresas reales en las tres últimas semanas con el asesoramiento de las empresas colaboradoras.
- Mentores especializados: Un enfoque práctico de Learn-by-doing mediante un profesor magistral y un instructor práctico.
- Acceso a talento con valor: Metodología específicamente orientada a crear capacidades en AI con aplicación inmediata en el entorno laboral.
- Vigilancia tecnológica: Revisando tendencias y oportunidades de mercado a nivel nacional y global.
Objetivos
Los retos del Data Scientist están en poder interpretar un problema y explicarlo de forma objetiva y rigurosa, saber cómo obtener valor de la información que maneja y transformar todo ello en decisiones efectivas en función de los objetivos.
Aprenderás Python, sus librerías de análisis de datos y de Machine y Deep Learning para construir y desplegar modelos de Inteligencia artificial para crear modelos predictivos y por tanto servir de apoyo en la toma de decisiones de la empresa.
¿Por qué el Data Science Bootcamp?
Carrera Profesional de futuro, una de las más demandadas y con potencial de crecimiento en el contexto laboral.
Conocer los datos, analizarlos y explotarlos generando información de valor, se ha convertido en la prioridad de la práctica totalidad de las empresas que desean ser competitivas.
Dar solución a problemas de Inteligencia Artificial se debe a los avances que están permitiendo la aplicación de técnicas Machine Learning sobre datos no estructurados (imágenes, sonidos, texto…).
El análisis de datos se está convirtiendo en una competencia transversal del empleado del siglo XXI. Cuantos más conocimientos se tienen, más valor se adquiere como profesional.
La ciencia de datos permite trabajar en distintos sectores y áreas de negocio: desde la agricultura hasta la industria pasando por la logística o turismo.
Contribuir a los procesos de transformación digital de las empresas.
Los Alumni del Data Science Bootcamp
trabajan en…