Funciones de estadísticas de scipy

Funciones de estadísticas de scipy

En Python, hay un paquete para funciones estadísticas en la biblioteca Scipy. El subpackaje Scipy se llama Scipy.estadísticas. Se emplea principalmente para procedimientos estadísticos y distribuciones probabilísticas. Los tipos de funciones de probabilidad son numerosas. La naturaleza de código abierto de la biblioteca permite la expansión de su capacidad estadística. Podemos trabajar con una variedad de distribuciones, incluidas distribuciones binomiales, uniformes y continuas. Tenemos funciones para variables continuas y discretas. Además, podemos ejecutar la prueba t y calcular la puntuación t. Con numerosos ejemplos, aprendamos más sobre las funciones de estadísticas escasas.

Explicación de estadísticas de scipy

Numerosas distribuciones de probabilidad, estadísticas de frecuencia y resumen, funciones de correlación y pruebas estadísticas, estimación de densidad del núcleo, estadísticas enmascaradas, funcionalidad cuasi-Monte Carlo y otras características se incluyen en este módulo.

Hay muchas áreas en el vasto campo de estadísticas que salen del alcance de Scipy y son manejadas por otros paquetes. Entre los más significativos están:

  • estadelo
  • Pandas
  • Pymc
  • lear

El scipy.El subackage de estadísticas contiene todas las rutinas estadísticas, y la función de información (estadísticas) devuelve una lista bastante completa de estas funciones. Los paquetes de sub-docstrucción de estadísticas contienen además una lista de las variables aleatorias disponibles. Este módulo incluye una colección considerable de distribuciones de probabilidad además de una colección en expansión de funciones estadísticas.

¿Qué es la distribución aleatoria continua normal en SciPy??

Para abarcar variables aleatorias discretas y continuas, se desarrollan dos clases de distribución generales. La distribución aleatoria continua normal es uno de los tipos que vamos a discutir aquí.

La variable puede tener cualquier valor en este tipo de distribución de probabilidad. Por eso se conoce como una variable aleatoria continua.

Ejemplo 1:

El primer ejemplo aquí muestra cómo los conceptos discutidos en la función de secciones anteriores. Importamos la función de norma, que deriva de la clase rv_continua, en este código de ejemplo. Las funciones contienen enfoques e información para abordar una distribución continua particular.

Para calcular el CDF en una matriz, utilizamos la función de norma. Hagamos un esfuerzo para comprender el código línea por línea.

En la primera línea del código, importamos la norma del scipy.biblioteca. Después de eso, la biblioteca Numpy se importa para la ejecución del programa. Posteriormente se crea una variable llamada "Comprobación" en la que se almacena la matriz Numpy creada. Por último, la declaración de impresión se utiliza en la que la norma.La función cdf () se ejecuta en la matriz especificada. Ejecutemos el código y veamos qué resultado produce.

De Scipy.Norma de importación de estadísticas
importar numpy
Check = Numpy.Array ([4, -2,3,2,5,0])
Imprimir (Norma.CDF (cheque))

Aquí, puede ver el resultado que se genera a partir del código escrito anteriormente.

Una cosa más que podemos hacer es usar la función de porcentaje de puntos para determinar la mediana de la distribución. El inverso del CDF es PPF, que se abrevia como PPF.

Aquí, puede ver la mediana de los valores de CDF que se generan en el código anterior.

Cómo generar una distribución uniforme en Scipy

En pocas palabras, una distribución uniforme denota una probabilidad plana y constante de que un valor caiga dentro de un cierto rango. Es posible crear una distribución uniforme. Después de importar la función uniforme, debemos crear el CDF de la matriz.

Las palabras clave de escala y LOC nos permiten expandir la funcionalidad. La palabra clave LOC define el valor medio, mientras que la palabra clave de escala define la desviación estándar. Aquí está el código:

Primero, importamos el módulo numpy y uniforme. Después de eso, creamos la variable en la que almacenamos la matriz Numpy creada. Finalmente, se puede ver la declaración de impresión en la que el uniforme.Se utiliza la función CDF.

importar numpy
De Scipy.Uniforme de importación de estadísticas
check_res = numpy.matriz ([7,4,9,5,4])
Imprimir (uniforme.CDF (check_res, loc = 5, escala = 3))

Adjunto está la salida de su ayuda.

Cómo generar una distribución binomial en Scipy

Además, al importar binom, la instancia de la clase discreta de RV, podemos producir una distribución binomial. Está compuesto por información y métodos de clase. El código es bastante el mismo que en el código anterior, excepto que usamos el Bunom.Función CDF () aquí que incluye tres parámetros que puede ver en la última línea del código.

importar numpy
De Scipy.Binom de importación de estadísticas
salida = numpy.matriz ([7,4,5,5,4])
Impresión (binom.CDF (salida, n = 1, p = 3))

Aquí está el resultado:

¿Qué son las estadísticas descriptivas??

Los resultados de estadísticas fundamentales como Min, Max, media y varianza se devuelven utilizando la matriz Numpy como entrada. La siguiente tabla enumera un puñado de las operaciones estadísticas fundamentales incluidas en el scipy.paquete de estadísticas.

Nombre de la función Descripción
describir() Las estadísticas descriptivas de la matriz dada se calculan a través de esta opción.
Gmean () La media geométrica del eje especificada se calcula con esta opción.
Hmean () A lo largo del eje elegido, la media armónica se calcula mediante la función hmean ().
curtosis () Esta función calcula la curtosis.
modo() Este método devuelve el valor modal.
sesgar() El método skew () prueba la asimetría de los datos especificados.
f_oneway () Este método realiza un ANOVA de 1 vía.
IQR () Determina el rango intercuartil de los datos a lo largo del eje elegido.
ZSCORE () Calcula la puntuación z de cada valor de la muestra. Es relativo a la media de la muestra, así como a la desviación estándar.
sem () Determina los números en el error estándar de la matriz de entrada de la media.

¿Qué es una prueba t??

La prueba t es una de las mejores formas de evaluar si dos promedios son diferentes entre sí o no. La prueba t también es un tema importante de discusión en términos de diferencias grupales.

Puntaje t

La puntuación T mide la relación de dos grupos, así como la varianza dentro de las agrupaciones. La puntuación T refleja cuán similares o diferentes son los grupos; Cuanto más pequeño es la puntuación T, más significativa es la puntuación t y mayor es la diferencia entre los grupos.

Aquí, se nos dan dos muestras que pueden provenir de la misma distribución o dos distribuciones diferentes. Y queremos determinar si comparten las mismas características estadísticas. Vea el siguiente código que se adjunta aquí:

De las estadísticas de importación escasas
rvs_res = estadísticas.norma.RVS (loc = 4, escala = 8, tamaño = (30,4))
Imprimir ("Aquí está el resultado de la comparación de las dos muestras:")
Imprimir (estadísticas.ttest_1samp (rvs_res, 4.0))

Adjunto está la salida:

Un valor p en la salida anterior representa la probabilidad de que los resultados de sus datos de muestra ocurrieran por accidente. El rango de valores p es de 0% a 100%.

Conclusión

Las funciones de stats scipy fueron el tema de este artículo. El módulo de estadísticas de Scipy es un componente crucial. Es útil obtener las distribuciones probabilísticas. Uso de estadísticas escasas, se pueden producir números aleatorios discretos o continuos. También incluye otras funciones adicionales que proporcionan valores estadísticos descriptivos. Discutimos variables aleatorias, continuas y aleatorias en esta publicación. Se discuten las funciones para interactuar con varios tipos de distribución. Además, describimos cómo puede analizar los datos utilizando la prueba t para determinar el valor medio.