Estadísticas escondidas sesgadas

Estadísticas escondidas sesgadas
En la era actual de tecnologías de vanguardia, la demanda del lenguaje de programación de alto rendimiento ha aumentado. Python demuestra que es el mejor de todos los lenguajes de programación, ya que tiene mucho que dar para las funciones fáciles y amigables para principiantes de la lista de sus paquetes de biblioteca para la implementación y la ejecución de los programas de software. Python es la mejor herramienta de programación para el análisis de conjuntos de datos grandes y grandes, para fines computacionales y estructuras orientadas a objetos. Python tiene una biblioteca llamada "Scipy" para lidiar con la implementación de los modelos de aprendizaje profundo, la capacitación del modelo para las aplicaciones de aprendizaje automático, las operaciones matemáticas y los optimizadores.

Las estadísticas de SciPy "sesgo" es el método que se utiliza para buscar la asimetría en la distribución de las variables en el conjunto de datos. La asimetría define cómo la variable se distribuye en el pico y si la cola de distribución es más gruesa en el lado derecho, lo que significa que se sesgó positivamente o la cola está ascilada negativamente, la cola es más gruesa en el lado izquierdo y cero sesgado cuando la distribución es normal normal.

Procedimiento

El procedimiento del artículo consistirá en pasos secuenciales. Entonces, primero, la sintaxis se explicará para la función de sesgo de estadística Scipy. Luego, el proceso de ejecución para esta función en el código de Python se mostrará en el artículo. Finalmente, concluiremos el artículo discutiendo los resultados de la implementación de la función. Todos los programas se escribirán en la plataforma en línea para Python I.mi. "Collab de Google". Para comenzar con esta plataforma, necesitamos navegar a la dirección web https: // colab.investigación.Google.com/.

Sintaxis

La función "$ Scipy.estadísticas.sesgo (matriz, axis = 0, sesgo = verdadero)"Se usa para calcular la asimetría para la variable aleatoria en un conjunto de datos

La "matriz" del parámetro en la lista de argumentos de la función de sesgo de estadísticas se reemplaza con cualquier matriz de entrada o el conjunto de datos cuya asimetría queremos determinar. El "eje" es ese eje donde o a lo largo del cual se debe calcular la asimetría y su valor predeterminado es "0". El sesgo siempre se establece en el tipo booleano "verdadero" como su valor estadístico.

Valor de retorno

La función devolverá un valor que nos hará saber si la distribución es positiva, negativa o cero sesgada según la distribución normal.

Ejemplo # 01

La asimetría es la medida para analizar la asimetría en la distribución de los datos. Exploremos esta función y realicemos un ejemplo práctico de esta función asumiendo y luego definiendo algunos datos hipotéticos y luego la distribuye para verificar su asimetría. Para inicializar el ejemplo, redirige a la colaboración de Google y haga un nuevo cuaderno allí para escribir un programa de Python para el ejemplo. Para importar las bibliotecas que se utilizarán para usar el atributo o el módulo "stats skew ()", escribiremos la primera línea en el script de Python como "de scipy. Las estadísticas importan el sesgo "y para crear la biblioteca" numpy "de importación de matriz ya que esta biblioteca funciona con la matriz multidimensional y sus operaciones.

Entonces, importe el "Numpy como el prefijo NP". La última biblioteca para importar será "Pylab" y luego accederemos al Pylab como el "PLT" para trazar la distribución a lo largo de algún eje para identificar visualmente la asimetría en esa distribución. Ahora, crearemos una matriz bidimensional y luego calcularemos la asimetría para la matriz basada en el eje ya que la matriz 2D tiene dos ejes en total. Uno se establece en predeterminado como "cero" y el valor del otro que tenemos que definir como "1",. Por lo tanto, primero calcularemos el sesgo para la matriz 2D con el eje establecido en cero y posteriormente a eso estableceremos el valor del eje en "1" para calcular la asimetría para ese eje. Definir una matriz en 2D con el "NP de Numpy. Método de matriz ([]) "y pase los elementos como" ([3, 4, 6, 8, 9], [1, 2, 5, 7,4], [9, 10, 4, 5, 6]) ", Almacene el valor de esta matriz en la variable como" array_skew ". Luego, desde el módulo de estadísticas, llame a la función skew () y due el nombre de la matriz como "array_skew" en los argumentos de la función de sesgo. El valor del eje en dicha llamada es predeterminado establecido en el valor "cero" y verifique los resultados.

Podemos volver a usar la misma matriz y pasarla a la función skew (), pero esta vez con el parámetro del eje establecido en el valor "1" y separado por la coma en la lista de argumentos de la función skew (). El código y la salida de este programa se dan a continuación.

La función calculará para la primera llamada de la función de sesgo, algunos valores del shkewness a lo largo del eje "0" y la segunda llamada de función del método de sesgo devolverá el valor de la asimetría para toda la matriz a lo largo del eje "1".

Ejemplo # 02

Los exadatos anteriores solo devolvieron los valores sesgados para la matriz, pero con la ayuda de este ejemplo, trazaremos la distribución y luego identificaremos visualmente la asimetría en la distribución de los datos. Importar el "De Scipy. Estadísticas El módulo de sesgo ", el" np "forman el numpy para definir la matriz, y el" pylab como plt "para trazar la distribución en los dos ejes.

Después de la importación de estas bibliotecas, definiremos el eje "0" como la matriz con el valor "np. Linspace (-4, 8.5, 1000) ". Luego, definiremos otro eje como "eje1" y pasaremos el valor del eje0 al eje 1 como "1./(notario público. sqrt (2.*notario público.pi)) * np. Exp( -.4*(axis0) ** 2) ". Ahora, usaremos ambos ejes y con la ayuda del módulo PLT del pylab, trazaremos los resultados de la asimetría pasando el eje1 y el eje0 a la lista de argumentos de la función de la trama como "PLT. traza (axis0, axis1,*) "y luego mostrando los resultados como una" imprime ("skew_value:", skew (axis1)) ". El valor para la función de sesgo se devuelve como un número positivo, lo que significa que la distribución está sesgada positivamente.

Conclusión

La implementación del "SciPy .STATS SKEW () "se muestra en el artículo. El artículo explica el concepto de asimetría al dar una introducción sobre el papel de la asimetría en la distribución de los datos. Luego, explica la sintaxis en el script de Python y demuestra dos ejemplos para permitir que los lectores comprendan a fondo el concepto del tema.