Ticker

6/recent/ticker-posts

Data Science With Python

En la actualidad los dos lenguajes de programación más utilizados en data science son R y Python. En este tutorial les comparto el los temas por modulo y el repositorio de Data Science para iniciar en este ámbito de los datos y comprender el lenguaje Python.

Data Science

Data Science, también conocida como la Ciencia de Datos, es un campo interdisciplinario que incluye sistemas, procesos y métodos científicos para poder extraer y estudiar el conocimiento de datos en sus diversas formas. Se puede entender como una continuación de campos que analizan datos como serían la minería de datos, la analítica predictiva, la estadística y el aprendizaje automático.

La Ciencia de Datos utiliza técnicas extraídas de distintos campos que se ubican dentro de las matemáticas, la informática, la estadística y la ciencia de la información; y a su vez, maneja procesos y sistemas como algoritmos, ecuaciones, interpretación de resultados y evaluaciones de datos. 

Les comparto los recursos que se encuentra en mi repositorio en GitHub acerca del aprendizaje de Data Science With Python Offered By IBM ofrecido en la Platforma cognitiveclass.ai

Course: Data Analysis with Python

Módulo 1: Importación de conjuntos de datos

  • Objetivos de aprendizaje
  • Entendiendo el dominio
  • Comprender el conjunto de datos
  • Paquete Python para ciencia de datos
  • Importar y exportar datos en Python
  • Información básica de conjuntos de datos

Módulo 2: Limpieza y preparación de los datos

  • Identificar y manejar valores faltantes
  • Formato de datos
  • Conjuntos de normalización de datos
  • Binning
  • Variables indicadoras

Módulo 3: Resumen del marco de datos

  • Estadísticas descriptivas
  • Básico de agrupación
  • ANOVA
  • Correlación
  • Más sobre correlación

Módulo 4 - Desarrollo de modelos

  • Regresión lineal simple y múltiple
  • Evaluación de modelos mediante visualización
  • Regresión polinómica y canalizaciones
  • R cuadrado y MSE para evaluación en muestra
  • Predicción y toma de decisiones

Módulo 5 - Evaluación del modelo

  • Evaluación del modelo
  • Sobreajuste, subajuste y selección de modelo
  • Regresión de cresta
  • Búsqueda de cuadrícula
  • Refinamiento del modelo

Course Certificate: Data Analysis with Python

Validated Certificate of Data Analysis with Python on Credly
Validated Certificate of Data Analysis with Python on Credly

Publicar un comentario

0 Comentarios