Regresión logística escolar

Regresión logística escolar
La popularidad del aprendizaje automático y las ciencias de los datos ha aumentado todos los días desde la cantidad de datos producidos, algoritmos eficientes para administrar y trabajar con esos datos, y la fuerza de la potencia informática continúa aumentando. La clasificación de datos con el método de regresión logística es una de las áreas esenciales y básicas del aprendizaje automático. En este artículo, explicaremos qué es la clasificación de datos, qué es la regresión logística y cómo se implementan en un programa de Python. Demostraremos algunos ejemplos y explicaremos cada parte individualmente para ayudarlo a comprender cómo puede implementar la regresión logística en Python.

¿Qué es la clasificación??

Primero, para implementar cualquier cosa en Python o en cualquier otro lenguaje de programación, debe comprender su funcionalidad básica para que pueda escribir el código de manera eficiente para ello. Entonces, explicemos primero el concepto de clasificación y luego pasemos a implementar la regresión logística utilizando las funciones de la biblioteca Scipy.

En la ciencia de datos y el aprendizaje automático, la clasificación es un subcampo de aprendizaje automático supervisado que hace predicciones sobre la categoría o clase a la que pertenecerá una entidad en función de sus atributos. Analiza la recopilación de observaciones describiendo matemáticamente la dependencia entre los datos de entrada y salida. Crea una conexión o enlace entre variables dependientes e independientes y lo hace trabajando con ambos. Se puede utilizar en varios campos de tecnología y ciencia para diversos fines, como el reconocimiento de imágenes, la clasificación de texto, etc.

¿Qué es la regresión logística??

La regresión logística es una técnica de aprendizaje automático supervisado para la clasificación que es comparable a la regresión lineal y es miembro de la clase de clasificadores lineales. Es un método muy conveniente, sin complicaciones y rápido para interpretar los resultados. No solo se puede utilizar para la clasificación binaria sino también problemas multiclase. En matemáticas, la regresión logística funciona con el logaritmo natural y las funciones sigmoides. La función sigmoidea es la curva en forma de S de una variable que tiene 0 o 1 en casi todos los dominios. Mientras que el logaritmo natural es el logaritmo de un número a su base.

¿Qué es la regresión logística en Scipy Python??

La idea detrás de la regresión logística es la misma en Scipy Python como discutimos anteriormente. La biblioteca Scipy proporciona la función logística () para calcular la regresión logística en el programa Python. Explicaremos algunos casos comunes de regresión logística con la ayuda de ejemplos. Pero antes de eso, aprendamos y comprendamos la sintaxis de la función logística proporcionada por la biblioteca Scipy.

Sintaxis de la función Scipy Logistic () en Python

La función logística () de la biblioteca Scipy se utiliza para generar las variables aleatorias continuas y funciona con los métodos de la clase RV_Continua. Hereda todos los métodos, características y funcionalidades de la clase RV_Continua para completar los detalles específicos de la regresión logística. La función logística () utiliza la siguiente función de densidad de probabilidad:

Que es un caso especial de genlogístico con c = 1. Consulte la sintaxis de la función logística con los métodos de la clase RV_Continua a continuación:

Aquí, el objeto 'Logistic_Gen' se refiere a uno de los métodos de la clase RV_Continua. Algunos de los métodos de la clase RV_Continua son PPF, PDF, CDF, LOGPDF, RVS, SF, ISF, etc. Ahora, pasemos a la sección Ejemplos para aprender a implementar la función logística () en un programa de Python.

Ejemplo 1:

Considere el código de muestra que se proporciona a continuación para comprender el funcionamiento de la función logística () de la biblioteca Scipy. Aquí, estamos implementando la función logística () con los métodos PPF y PDF. El PPF significa la función de porcentaje de puntos que se utiliza para obtener el percentil de los datos y PDF significa la función de densidad de probabilidad y se utiliza para obtener la densidad de probabilidad de los datos. Consulte el código de muestra que se proporciona a continuación y luego explicaremos cada parte paso a paso:

importar numpy como np
De Scipy.Estadísticas de importación logística
Importar matplotlib.Pyplot como PLT
Fig, Ax = PLT.subtramas (1, 1)
x = NP.Linspace (logística.PPF (0.02),
logístico.PPF (0.98), 100)
hacha.trama (x, logística.PDF (x),
'r', lw = 8, alfa = 0.4, etiqueta = 'PDF logístico')
rv = logistic ()
hacha.Parcela (x, RV.pdf (x), 'k', lw = 3, etiqueta = 'pdf congelado')
hacha.leyenda (loc = 'mejor')
PLT.espectáculo()

Hablemos primero sobre las bibliotecas y luego del resto del programa. Necesitamos la biblioteca Numpy para generar y almacenar los datos en un objeto Numpy. Necesitamos la biblioteca Scipy para usar la función de su paquete de estadísticas. Necesitamos la biblioteca matplotlib para trazar los datos en un gráfico. Por lo tanto, importamos las tres bibliotecas junto con sus paquetes y funciones asociadas que requeriremos más. Después de eso, el tamaño 1 x1 para trazar el gráfico se define mediante la trama secundaria (1, 1). La variable x contiene los datos para la función de densidad de probabilidad que proporcionará el pdf logístico. El PDF logístico se ha congelado en la variable RV y ambos resultados se han pasado a la función Plot () para mostrarlos en el gráfico. Ahora, veamos el gráfico generado a continuación:

Ejemplo 2:

Anteriormente, implementamos la función PDF para generar regresión logística y luego congelándola. Ahora comparemos el resultado del método CDF con el método PDF en este ejemplo. Considere el código de muestra dado en el fragmento de código a continuación:

importar numpy como np
De Scipy.Estadísticas de importación logística
Importar matplotlib.Pyplot como PLT
Fig, Ax = PLT.subtramas (1, 1)
x = NP.Linspace (logística.PPF (0.02),
logístico.PPF (0.98), 100)
hacha.trama (x, logística.PDF (x),
'r', lw = 8, alfa = 0.4, etiqueta = 'PDF logístico')
rv = logistic ()
hacha.Parcela (x, RV.pdf (x), 'k', lw = 3, etiqueta = 'pdf congelado')
vals = logística.PPF ([0.001, 1, 0.999])
notario público.allClose ([0.001, 1, 0.999], logística.CDF (vals))
r = logística.RVS (tamaño = 1000)
hacha.Hist (r, densidad = true, histtype = 'stephilled', alfa = 0.5)
hacha.Legend (loc = 'mejor', marco = false)
PLT.espectáculo()

La primera sección del programa es la misma que definimos en el ejemplo anterior. La implementación del método CDF se ha agregado a este programa. Para comparar la línea del PDF logístico, generamos el histograma del método CDF. Veamos el gráfico dado en la captura de pantalla a continuación:

Ejemplo 3:

Implementemos otro método de la clase rv_continua para comprender el funcionamiento de la función logística (). Considere el código de muestra dado en el fragmento de código a continuación:

importar numpy como np
De Scipy.Estadísticas de importación logística
Importar matplotlib.Pyplot como PLT
Fig, Ax = PLT.subtramas (1, 1)
x = NP.Linspace (logística.PPF (0.02),
logístico.PPF (0.98), 100)
hacha.trama (x, logística.PDF (x),
'r', lw = 8, alfa = 0.4, etiqueta = 'PDF logístico')
rv = logistic ()
hacha.Parcela (x, RV.pdf (x), 'k', lw = 3, etiqueta = 'pdf congelado')
vals = logística.PPF ([0.001, 1, 0.999])
notario público.allClose ([0.001, 1, 0.999], logística.logcdf (vals))
r = logística.RVS (tamaño = 1000)
hacha.Hist (r, densidad = true, histtype = 'stephilled', alfa = 0.5)
hacha.Legend (loc = 'mejor', marco = false)
PLT.espectáculo()

Utilizamos el mismo programa que en los ejemplos anteriores, acabamos de reemplazar el método CDF con el método LogCDF. Ahora, comparemos los resultados del método CDF y el método LOGCDF ​​comparando las salidas de ambos programas. Vea el resultado que se da a continuación:

Conclusión

Esta guía dio una descripción general rápida de la función de regresión logística proporcionada por la biblioteca Scipy. Un enfoque de aprendizaje automático supervisado ofrecido en el grupo de clasificación es la regresión logística. La regresión logística es una de sus técnicas importantes, y la clasificación también es una aplicación importante del aprendizaje automático. Demostramos algunos ejemplos para mostrar cómo implementar la función logística () de la biblioteca Scipy.