Descarga PDF con más información

SAS Data
Scientist
Plan de Formación
www.sas.com/spain/formacion
Juan Lorenzo, Director del Plan de Formación – [email protected][email protected]
• Tel: +34 91 200 73 00
•
•
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® DATA SCIENTIST
BIG DATA
BIG DATA
EL NUEVO RETO EN LAS EMPRESAS
Los datos son considerados hoy en día uno de
los activos mas importantes de las empresas. Su
volumen es enorme y crece día a día. Son tanto
datos estructurados, como no estructurados y
de muy diversas fuentes.
El análisis de estos grandes volúmenes datos
puede proporcionar información muy valiosa
para la empresa y sus procesos, permitiendo
nuevos modelos y la mejora de los existentes;
las conclusiones de este análisis puede aportar
gran valor a la toma de decisiones.
Una nueva figura nace ante este
escenario, el Data Scientist, que es
capaz de abordar los datos, analizarlos,
desarrollar modelos analíticos y
entender los resultados para
trasladarlos al contexto de negocio.
Deberá disponer de conocimientos de
las estructuras de datos, amplios
conocimientos en estadística y
habilidades de negocio
En definitiva, el Data Scientist
combinará hábilmente sus competencias
técnicas con el conocimiento del
negocio.
2
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® DATA SCIENTIST
COMPETENCIAS
UN PERFIL MULTIDISCIPLINAR
La tarea primordial del Data Scientist es la detección eficiente de nuevas
oportunidades de negocio mediante el uso creativo de técnicas de análisis
aplicado a grandes volúmenes de datos. Para ello utiliza dos fuentes de trabajo;
en una vertiente mantiene contacto cercano con las áreas de negocio y, en la otra,
utiliza los datos y métodos creativos de análisis para desarrollar modelos de
información y soporte a la toma de decisiones
Fundamentos
SAS®
Uso Creativo de la
estadística
Minería de
Datos y
Textos
Gestión de Datos en
Big Data
Interpretación de
Resultados
Estadística
Innovación y nuevas
Oportunidades
Tratamiento
y
Visualización
de Datos
Su objetivo es conseguir resultados rápidos basados en el análisis de los datos y
para ello debe ser capaz de crear con agilidad estructuras de datos sobre las que
aplicar técnicas de análisis apropiadas para seleccionar y obtener resultados que
derivar en consecuencias para el negocio.
3
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® DATA SCIENTIST
PLAN DE FORMACIÓN
Pero la pregunta sigue siendo: ¿Cómo ser un Data Scientist?
Para dar respuesta a esta cuestión, SAS® Formación dispone de un programa de
capacitación integral que le permite adquirir las competencias de un perfil SAS®
Data Scientist.
Este plan de formación se estructura por áreas de conocimiento que se
corresponden con las competencias necesarias de un perfil Data Scientist.
De este modo en cada una de estas áreas se adquiere el conocimiento, a través de
los cursos de formación SAS® incluidos en el plan de formación.
Fundamentos SAS®. Requisitos previos
• Se definen como requisito para acceder al plan de formación
SAS® Data Scientist
Estadística
• Estrategias y Conceptos para el Data Scientist
• Estadística In-Memory para Hadoop
Tratamiento y Visualización de Datos
• Introducción a Hadoop
• Integración de SAS con Hadoop
• SAS Visual Analytics: Exploring and Reporting
Minería de Datos y Textos
• Modelización Predictiva usando la Regresión Logística
• Modelización Predictiva usando SAS High-Performance Analytics
• Text Analytics con SAS
• SAS Sentiment Analysis: Construcción de Modelos
4
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® DATA SCIENTIST
ITINERARIOS POR COMPETENCIA
Fundamentos SAS®. Requisitos previos
Dada la amplitud de conocimientos del perfil SAS® Data Scientist, el plan de
formación integral definido, parte de la premisa de disponer de conocimientos
básicos de programación SAS® y estadística, por tanto, la adquisición de éstos no
se encuentra incluida en el plan de formación SAS® Data Scientist.
La base de conocimientos requerida puede ser adquirida con la siguiente relación
de los cursos SAS®.
En caso de ser necesaria la realización de alguno de los cursos para completar la
base de requisitos, estos pueden realizarse en formato eLearning o bien contacte
con SAS® Formación para otras modalidades de realización.
Fundamentos
SAS®
Fundamentos de Programación SAS
Técnicas de manipulación de datos con SAS
Fundamentos Macro Lenguaje SAS
Fundamentos de SAS SQL
Estadística SAS: Introducción a ANOVA, Regresión y Regresión
Logística
Análisis Aplicado con SAS Enterprise Miner
5
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® DATA SCIENTIST
ITINERARIOS POR COMPETENCIA
Estadística
En este ámbito, la tarea del SAS® Data Scientist es analizar grandes cantidades
de datos para descubrir características relevantes para el negocio e investigar las
relaciones entre ellos, primero por medio del análisis Descriptivo para
posteriormente iniciar el proceso del análisis Predictivo.
Estrategias
y Conceptos
para el Data
Scientist
Este curso repasa los principales Skills del Data Scientist
modelización Predictiva, el valor de los Datos
Desestructurados, la importancia de la Visualización
trabajando con Big Data
Estadística
In-Memory
para
Hadoop
Este curso se centra en el acceso y manipulación de datos en
el servidor LASR para la ejecución de Análisis Exploratorios
6
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® DATA SCIENTIST
ITINERARIOS POR COMPETENCIA
Tratamiento y Visualización de Datos
El acceso y preparación de datos para que sean completamente utilizables es una
tarea esencial del Data Scientist. Los procesos de tratamiento de grandes
volúmenes de datos, pueden ser muy lentos y complejos, por ello el Data
Scientist debe ser capaz de crear las estructuras de datos apropiadas para poder
trabajar con ellas rápida y eficientemente.
Por otro lado el Data Scientist debe ser capaz de presentar los resultados de sus
análisis de una forma clara y rápida a los usuarios de negocio.
Introducción
a Hadoop
Este curso dotará a los asistentes de los conocimientos
básicos sobre Hadoop necesarios para su posterior
integración con SAS.
Integración
de SAS con
Hadoop
Este curso enseña como usar los métodos de
programación de SAS para acceder, escribir y transformar
datos en Hadoop; y a ejecutar código Map-Reduce y Pig
a través de los procedimientos de Hadoop.
SAS Visual
Analytics:
Exploring and
Reporting
Este curso enseña como Explorar y generar Informes
utilizando SAS Visual Analytics
7
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® DATA SCIENTIST
ITINERARIOS POR COMPETENCIA
Minería de Datos y Textos
La modelización predictiva es una de las principales actividades del Data
Scientist, pero el gran volumen de datos y variables así como la diversa
naturaleza de estos, obliga a que sea capaz de aplicar técnicas de selección
de variables, valoración de modelos, tratamiento de valores missing, que
deben ser eficientes para dichos conjuntos de datos masivos. En este sentido,
el uso de las capacidades High Performance es clave para la consecución
óptima de resultados.
Así mismo, deberá dominar métodos estadísticos y lingüísticos para
determinar palabras clave deterministas y temas, categorizar contenidos y
descubrir el sentimiento de texto electrónico.
Modelización
Predictiva usando
la Regresión
Logística
Este curso cubre la Modelización Predictiva por medio de la regresión
Logística, la Selección de Variables, tratamiento de Valores Faltantes y el
uso de técnicas para el Tratamiento Masivo de datos.
Modelización
Predictiva usando
SAS HighPerformance
Analytics
Este curso se centra en la funcionalidad de SAS High-Performance
Statistics y los procedimientos de Data Mining para la modelización
Predictiva.
Text Analytics con
SAS
Este curso enseña como procesar datos de Texto para para agruparlos en
subgrupos homogéneos y a su uso para mejorar los modelos Predictivos.
SAS Sentiment
Analysis:
Construcción de
Modelos
Este curso muestra como escribir reglas para construir Modelos Basados
en Reglas para evaluar sentimientos y a combinarlos con modelos
estadísticos.
8
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® DATA SCIENTIST
CARACTERÍSTICAS DEL PLAN DE FORMACIÓN
Número de horas lectivas
• 140 horas
Idioma
• Los cursos incluidos en el plan de formación serán impartidos en su
mayoría en Castellano excepto alguno de los cursos que será impartido
en inglés por especialistas internacionales
Material
• Para todos los cursos, SAS entrega toda la documentación necesaria
para el desarrollo de los mismos en forma de manuales de cursos,
material,… así como hojas de asistencia y encuestas para la valoración
de los diferentes aspectos del curso a su término
Ubicación
• Los cursos se realizaran en las aulas de SAS en Madrid sitas en C. Arroyo
de Valdebebas, 4, P3, 28050 Madrid
Certificación
• Certificado de Asistencia al plan de formación SAS Data Scientist con la
asistencia a un mínimo del 80% de las horas lectivas del plan de
formación.
• Título Propio de SAS Data Scientist con la superación con éxito de la
prueba de evaluación final
Director del Plan de Formación
• Juan Lorenzo
• [email protected]
9
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .
SAS® FORMACIÓN
CONTÁCTANOS
www.sas.com/spain/formacion
• support.sas.com/training
• [email protected]
•
Tel: +34 91 200 73 00
Tel: +34 91 200 73 08
10
C o p yr i g h t © 2 0 1 4 , S A S In s t i t u t e In c . A l l r i g h t s r e s e r ve d .