Para emprender este tutorial práctico con relacion a la elaboración o desarrolla de un modelo Machine Learning de Regresión Lineal con Python, mencionar que no se pretenden profundizar conceptos en relacion a Machine Learning (ML), aprendizaje supervisado, regresión lineal u otros.
Requisitos:
- Python 3.10.
- Librerías: NumPy, Matplotlib.
- IDE - Visual Studio Code.
- GUI - Anaconda Navigator.
- Jupyter Notebooks.
Lo que se vera en este tutorial:
- Consideraciones y conceptos básicos.
- Notaciones relavantes para el desarrollo del modelo.
- Desarrollo del modelo ML de Regresión Lineal.
- Conclusiones y Referencias.
① Consideraciones y conceptos básicos:
1.1. Aprendizaje supervisado y no supervisado:
Los métodos que implican el aprendizaje a partir de datos se pueden dividir en dos categorías principales: aprendizaje supervisado (a donde pertenece regresión lineal) y aprendizaje no supervisado. En el aprendizaje supervisado, se puede entrenar un modelo utilizando datos que están etiquetados, lo que significa que los datos tienen variables objetivo (precio del inmueble en este tutorial).
1.2. Variable:
La variable objetivo juega un papel clave al permitir que el algoritmo de aprendizaje supervisado predice los objetivos correctos para los datos procesados. Los algoritmos típicos para el aprendizaje supervisado incluyen modelos lineales teniendo en cuenta como el análisis de regresión lineal basado en máquinas de vectores de soporte (SVM - Support vector machine) o inclusive procesamiento en redes neuronales convulsionales (CN - Convolutional Neural Networks).
1.3. ¿Qué es regresión lineal?
La regresión lineal es la técnica de análisis de datos, la regresión lineal realiza la tarea de predecir una variable dependiente (objetivo) en función de las variables independientes dadas. Entonces, esta técnica de regresión encuentra una relación lineal entre una variable dependiente y las otras variables independientes dadas. Por lo tanto, el nombre de este algoritmo es Regresión lineal.
1.4. Representación Grafica de regresión Lienal.
En el eje “X” está la variable independiente y en el eje “Y” está la salida. La línea de regresión es la línea que mejor se ajusta a un modelo. “Y” nuestro principal objetivo en este algoritmo es encontrar la línea que mejor se ajuste.
1.5. ¿Qué es Dataset?
1.6. ¿Qué son los Jupyter Notebooks?
Pueder aprender a usar Jupyter Notebooks desde cero en el tutorial acerca de Jupyter Notebooks con Anaconda Navigator y Visual Studio Code.
② Notaciones relavantes para el desarrollo del modelo:
③ Desarrollo del modelo ML de Regresión Lineal:
El desarrollo del modelo de Machine Learning es aplicar conceptos con relación al algortimo supervisado de regresión lineal, se pretende predecir los precios de los inmuebles según su tamaño; teniendo en consideración las siguientes etiquetas “X” = tamaño en m^2 y “Y” = precio en $ 1000's.
3.1. Importar librerias:
NumPy: Librería de Python orientado al cálculo numérico y el análisis de datos, especialmente para trabajar con gran volumen de datos; contiene clases para manipulación de objetos como arrays que permite representar colecciones de datos de un mismo tipo en varias dimensiones, y funciones muy eficientes para su manipulación.
Matplotlib: Librería de Python especializada en la creación de gráficos en dos dimensiones, los tipos de gráficos soportados y más comunes como: Diagramas de barras, Histograma, Diagramas de sectores, Diagramas de caja y bigotes, Diagramas de violín, Diagramas de dispersión o puntos, Diagramas de lineas, Diagramas de areas, Diagramas de contorno y Mapas de color
El import de utils (from utils import *) es con relación al archivo Python utils.py que cuenta con la función para carga los datos de entreamiento (load_data()):
3.2. Variables de entrenamiento y dataset inicial:
Captura el número de datos iniciales para el entrenamiento:
Nuestro dataset inicial es de 100 registros en base a las equitetas “X” = tamaño en m^2 y “Y” = precio en $ 1000's
3.3. Aplicar entrenamiento (aun no es un entrenamiento final):
3.4. Trazar los datos:
3.5. Asignar valor al párametro (w) de predicción y asignar filtro incial al parametro (b) de predicción:
3.6. Implementar la función para calcular la salida de los datos procesados:
3.7. Trazar la salida de predicción:
Puntos dispersos segun la traza de datos + la aproximación inicial de nuestra predicción |
3.8. Aplicar una predicción:
Predicción con un tamaño de 90 m^2 |
④ Conclusiones y Referencias:
Conclusiones:
- En este tutorial especificamos los requisitos, consideraciones y conceptos básicos básicos en relación al Modelo de Regresión Lineal.
- Se desarrolla el Modelo de Regresión Lineal aplicando los conceptos con relación a la implementación de Machine Learning en base a la categoría del aprendizaje supervisado y algoritmo de regresión lineal según la variable objetivo y establecido de tipo numérico.
0 Comentarios