El modelo de regresión lineal se utiliza en proyectos de aprendizaje automatico, en este caso los datos se dividen en dos grupos, un conjunto de entrenamiento y otro de prueba. Los resultados del modelo dependen del conjunto de entrenamiento, por lo tanto es importante identificar los coeficientes con los que el modelo consigue el máximo rendimiento. Los problemas de regresión lineal por lo general tienen una variable dependiente continua, sin embargo, las entradas pueden ser datos continuos, discretos o incluso categoricos.
En la práctica la variable dependiente (o respuesta) se denota con y
, mientras que las variables independientes o predictoras con x
. Cuando se tienen dos o más variables independientes, se pueden representar con el vector
Donde n
son el número de entradas. La ecuación de la regresion lineal se representa
Donde m
es la pendiente y b
es el punto de corte de la recta, a continuación se ilustran los parámetros de un modelo de regresión lineal
El aprendizaje consiste en encontrar los mejores coeficientes para los datos que tenemos, en la siguiente figura se simulan las interacciones que el modelo tiene internamente para llegar a obtener los coeficiente con un optimo rendimiento
La regresión lineal se utiliza para predecir en diferentes campos como economia, ciencias de la computación, ciencias sociales, entre otras. Algunos aplicaciones de este modelo son:
- Predecir el precio de un inmueble
- Predecir el salario de los empleados de una empresa
- Predecir el monto de las ventas en una tienda de retail