Herramientas BIg Data y análisis de datos

Herramientas BIg Data y análisis de datos

Presencial

260 horas

Compartir en Facebook


Objetivos

Aprenderá a trabajar con Mongo que es  una base de datos de documentos de código abierto que proporciona alto rendimiento, alta disponibilidad y escalado automático. Es un sistema de base de datos NoSQL..

Se introducirá al alumno en un lenguaje de programación multiparadigma que soporta orientación a objetos, programación imperativa y programación funcional

Por último aprenderá a programar en R que se trata de un lenguaje de programación orientado al análisis estadístico y a la representación gráfica de los resultados obtenidos.

 

Módulo 1

MONGO DB (60 horas)

- Primeros Pasos. Bases de Datos NO-SQL
Instalación y Parametrización MongoDB
Conceptos sobre Documentos y Colecciones
BSON Types
MongoDB Extended JSON

- El Shell de MongoDB
Configración del Shell
Scripts en MongoShell
Tipos de Datos en MongoShells

- Operaciones CRUD en MongoDB
Inserción, consultas, actualización y eliminación de documentos
Operaciones de escritura por Lotes
SQL a MongoDB gráficos de mapeo
Lecturas aisladas
Agregaciones Pipeline
Consultas Geoespaciales

 - Indexaciones, Escaneado y Busquedas de Cadenas de Texto.

Indexación de textos, campos simples y Multiclaves
Propiedades de las Indexaciones
Operadores de búsqueda de textos

- Motor de Almacenamiento MongoDB
Wiredtiger
MMAPV
IN-Memory
Journaling

- Seguridad en MongoDB
Parametros de autentificación
Gestión de Roles de Seguridad
Encriptaciones y Auditorías.

- Copias de Seguridad y Replicas
Copias y Restauraciones
Replicas por conjunto de miembros y por conjunto de sincronización de Datos
Replicas de Alta Disponibilidad.


Módulo 2

PROGRAMACION Y DESARROLLO PYTHON  (120 horas)

- Introducción y Preparación del entorno de desarrollo
Instalando Python.
Instalación de un Shell interactivo mejorado
Ninea-IDE & Visual Studio Community
Instalación de Bazaar

- Estructura y elementos del lenguaje
Elementos del Lennuaje
Variables, tipos de datos, operadores aritméticos, tipos de datos complejos, listas y Diccionarios
Estructuras de Control de Flujo
Identación, encoding, asignación múltiple
Estructuras de control de flujo condicionales
Estructuras de control iterativas
Bucle while y For

- Módulos, paquetes y namespaces
Creando módulos empaquetados
Importando módulos enteros
Namespaces, alias, módulos sin namespaces

- Funciones definidas por el usuario
Defniendo funciones
Sobre los parámetros
Parámetros por omisión y Keywords
Parámetros arbitrarios y desempaquetado
Llamadas de retorno y recursivas

- Introducción a la Orientación a Objetos
Pensar en obejtos
Programación Orientada a Objetos
Elementos y Característcas de la POO
Clases, propiedades, métodos y objetos
Herencia: característca principal de la POO

- Métodos principales del Objeto String
Métodos de formato, busqueda de validación y sustitución
Dar formato a una cadena, sustituyendo texto dinámicamente
Reemplazar texto en una cadena.
Métodos de unión y división
Unir una cadena de forma iterativa
Partir una cadena en partes, utlizando un separador
Partir una cadena en en líneas

- Métodos principales del objeto list
Métodos de agregado, eliminación orden y búsqueda
Conversión de tipos
Concatenación simple de colecciones
Valor máximo y mínimo
Contar elementos

- Métodos principales del objeto dict
Métodos de eliminación
Vaciar un diccionario
Métodos de anrenado y creación
Copiar y crear y concatenar diccionarios
Concatenar diccionarios
Establecer una clave y valor por defecto
Métodos de retorno
Obtener el valor de una clave
Obtener las claves y valores de un diccionario

- El objeto File: trabajando con archivos
Sobre el objeto File
Modos de Apertura
Métodos y Propiedades del Objeto File

- Gestión Módulos de la librería estándar
Módulos de sistema
Archivos y directorios
El módulo os y las variables de entorno, os.path
Módulo sys, variables y métodos
Entradas y salidas que pueden ser capturadas con PopeN
stdout, stdin, stderr
Utlizando tuberías para capturar la salida.
Módulos para el programador
Debuguear códing con Pdb
Documentar tu app con pydoc
Módulos de Internet y acceso al navegador Web
Conexión FTP

- Funciones definidas por el usuario
Introducción a bases de datos con Python
Conectarse a la base de datos y ejecutar consultas
Una forma simple de acceder a bases de datos
Insertar datos
Seleccionar todos los registros
Seleccionar solo registros coincidentes
Eliminar registros

 

 


Módulo 3

PROGRAMACION Y DESARROLLO DE APLICACIONES EN LENGUAJE ESTADISTICO R (80 HORAS)

- Introducción al Lenguaje R
El entorno R
Estadística con R
R en un sistema de ventanas
Utlización interactiva de R
Funciones y capacidades
Ordenes de R.
Ejecución de ordenes desde un archivo
Almacenamiento y eliminación de objetos

- Cálculos con R. Números y Vectores
Aritmética Vectorial
Clases de objetos
Objetos: Modos y atributos
Atributos intrínsecos: modo y longitud
Modifcación de la longitud de un objeto
Obtención y modifcación de atributos
Clases de objetos.

- Variables indexadas. Matrices
Variables indexadas (Arrays)
Elementos de una variable indexada
Uso de variables indexadas como índices
La función Array
Variables indexadas y vectores. Operaciones
Operaciones con matrices
Producto matricial. Inversa de una matriz

- Listas y hojas de datos
Conceptos sobre Listas
Construcción y modifcación de listas
Concatenación de listas
Hojas de datos (Data frames)
Funciones attach() y detach()
Trabajo con hojas de datos
Conexión de listas arbitrarias

- Lectura de datos de un archivo
La función read.table()
La función scan()
Acceso a datos internos. Acceso a datos de una biblioteca
Edición de datos
Importar datos

 - Distribuciones probabilísticas

Tablas estadístcas
Estudio de la distribución de datos
Contrastes de una y de dos muestras

- Métodos principales del objeto list
Métodos de agregado, eliminación orden y búsqueda
Conversión de tipos
Concatenación simple de colecciones
Valor máximo y mínimo
Contar elementos

- Programación R Ciclos. Ejecución condicional
Expresiones agrupadas. Ordenes de control
Ejecución condicional: la orden if
Ciclos: Ordenes for, repeat y while
Escritura de nuevas funciones
Asignaciones dentro de una función
Factores de efciencia en diseño en bloques
Clases. Funciones genéricas. Orientación a objetos
Modelos estadístcos en R. Definición de modelos estadísticos. Fórmulas.

- Procedimientos con Gráficos
Funciones gráficas
La función plot
Representación de datos multivariantes
Otras representaciones gráficas
Argumentos de las funciones gráficas
Anotaciones matemáticas
Fuentes vectoriales Hershey. Funciones gráficas interactivas
Uso de parámetros gráficos
Elementos gráficos
Ejes y marcas de división. Márgenes de las figuras
Figuras múltples
Dispositvos gráficos
Inclusión de gráficos PostScript en documentos
Dispositvos gráficos múltiples
Gráficos dinámicos


Módulo 6

-


Herramientas BIg Data y análisis de datos
¿Te interesa este curso?

Envíanos este formulario para que podamos contactar contigo y ampliarte la información del curso.
Nota: los campos con asterisco son obligatorios.

Indica, por favor, qué horarios tienes disponibles y cuál sería el ideal.

De lunes a jueves:

Martes, miércoles y jueves:

Los viernes:

Los sábados:

Confirma que eres un ser humano, por favor ;-)

Otros cursos que te pueden interesar