Regresión lineal numpy

Regresión lineal numpy

“Estamos viviendo en una era en la que estamos rodeados de ciencia de datos, conjuntos de datos más grandes, computadoras de alta potencia computacional e inteligencia artificial. La ciencia de datos y la inteligencia artificial han llegado a la navegación autónoma de vehículos; Las imágenes son reconocidas por ellas, decidir los sectores energéticos y financieros, los sectores del mercado de valores, y nuestros círculos sociales también han sido revolucionados por el aprendizaje automático y luego el avance en las ciencias biomédicas. La regresión lineal es una de las técnicas de aprendizaje automático más importantes que nos permite realizar un análisis de datos estadísticos o cálculos científicos, y cualquier campo que elijamos donde queremos ir artificialmente inteligentes, encontraremos una regresión lineal.

La regresión lineal es un método en el aprendizaje automático que se utiliza para aprender la relación entre una variable dependiente, digamos "y" y las diversas variables independientes "x". Basado en esta relación entre las variables, la regresión lineal predice los eventos futuros para la "Y". Las variables en la regresión lineal son las características que representan los atributos de observación, y la observación es el único punto de datos en el conjunto de datos. La salida predicha depende de estas observaciones y las características. Las aplicaciones de la regresión lineal incluyen la predicción de los precios de la vivienda dependiendo de las características (como el área de la casa, las habitaciones que tiene, el interior de la casa), el pronóstico del tiempo, la predicción del mercado de valores, etc."

Procedimiento

El artículo mostrará el método de implementación para los modelos de regresión lineal. Aplicaremos este modelo a un conjunto de datos e implementaremos este modelo, seguiremos algunos pasos para entrenar primero el modelo para aprender a predecir y luego probaremos el modelo para verificar qué tan cerca está la predicción del modelo. la salida real.

Sintaxis

La sintaxis para el modelo de regresión es la siguiente:

$ modelo = regresión lineal ()


Utilizaremos la función mencionada anteriormente para implementar el modelo de regresión ajustando el conjunto de datos a este modelo. Entrenaremos los datos sobre el modelo de regresión lineal para estimar el valor de la salida utilizando la hipótesis y la función de pérdida como:

Y_predicte (h (x) = b0 + b1*x), que es el valor predicho para la respuesta de salida "y" del modelo.

función de pérdida = real_y - y_predicto

Valor de retorno

El valor de retorno para el modelo de regresión es continuo ya que la regresión tiene una variable dependiente continua como salida, "y" y múltiples variables, "x", que pueden ser discretas o continuas.

Ejemplo # 01

Comencemos a implementar el modelo de regresión lineal. Para la implementación de esta función, utilizaremos el intérprete "Spyder" de Python. Para comenzar a implementar el modelo, tendríamos que aplicar ciertas funciones y clases de los diferentes paquetes de biblioteca. La primera y principal biblioteca para esta implementación sería la "Numpy". Todos estamos familiarizados con esta biblioteca numpy, ya que esto permite las operaciones y la implementación de las matrices multidimensionales y las matrices, y es un paquete de código abierto. Esto se utilizará en el programa para implementar la matriz con diferentes dimensiones.

Otro paquete importante es el "Scikit-Learn" Este paquete se basa en el Numpy, y permite que el preprocesamiento de los datos y la dimensionalidad reduzcan los modelos de regresión, las clasificaciones y la agrupación. Usaremos este paquete para la implementación del modelo de regresión lineal en Python. Para importar este paquete, utilizaremos el comando "Importar" Numpy con el prefijo llamado "NP", y luego desde el paquete de Scikit Learn, importaremos el modelo de regresión lineal como "De Sklearn.lineal_model importarregresión lineal ".

Después de importar estos paquetes, ahora es el momento de crear los datos con los que queremos trabajar y para hacerlo, definiremos la variable dependiente (salida) como "y" y la variable independiente (regresor) como "x". Para este ejemplo, mantendremos estas variables simples como un objeto de matriz 1-D, y esto marca los datos más simples para la regresión. Declararemos la "X" como la "NP". Array ([2, 12, 22, 32, 42, 52]). remodelar (-1, 1) "y la" y "como" np. Array ([2, 10, 14, 20, 32, 36]) ". El Y es un solo dimensional, y hemos remodelado la X para ser (-1, 1) ya que queremos que la X solo tenga una columna y varias filas, por lo que tiene dos dimensiones como la forma de la X (6, 1).

Ahora se ajustaremos a estas variables al modelo de regresión lineal, y para hacerlo, llamaremos el método "regresión lineal (). Fit (x, y) "y asignarlo a la variable" modelo ". Una vez que hayamos instalado el modelo ahora, verifiquemos si el modelo funciona o no llamando y aplicando el ".puntaje "en el modelo como" modelo. Puntaje (x, y) ". El .La puntuación también toma el predictor como "x" y la respuesta como "y", y da el r^2, que es el coeficiente de la determinación, lo que significa que dice qué tan bien el modelo puede hacer predicciones.

Ahora para verificar los valores de los atributos de la "Hipótesis = B0 +B1*X", usaremos el "Modelo. Intercept ", que dará" B0 "y" modelo. COEF_ "que devolverá el valor para" B1 ", que son los valores estimados del modelo para la" y ". Ahora, después de obtener estos valores, predeciremos usar el modelo llamando al "modelo. predecir (x) ”y guárdelo en el y_pedicted. La respuesta será predicha por el modelo y, por lo tanto, hemos entrenado nuestro modelo; Ahora, para probar cómo funciona el modelo en el conjunto de datos de prueba, pasaremos los nuevos valores de x a los parámetros del "modelo. predecir (x_new) ". El modelo dará los valores predichos como respuesta a la salida para la "X" recientemente definida. El código para el entrenamiento y luego la prueba del modelo de regresión lineal se proporciona a continuación en la figura.


Conclusión

Hemos entrenado un modelo, que es "regresión lineal", de los aprendices numpy y scikit en un conjunto de datos para predecir la respuesta para el conjunto de datos, y luego probamos este modelo para predecir la respuesta para el nuevo conjunto de datos.