Módulo de estadística en Python

Módulo de estadística en Python
Si estás en el mundo de la investigación, las estadísticas son de suma importancia! Y Python ofrece muchos módulos para estadísticas, pero del que hablaremos hoy se llama módulo de estadística. Es un módulo simple, no para estadísticas avanzadas, sino para aquellos que solo necesitan un cálculo simple y rápido. En este tutorial, revisaremos el módulo de estadística en Python.

Módulo de estadística

El módulo de estadísticas proporciona funciones simples para calcular las estadísticas de un conjunto de datos. Afirman que no están compitiendo con Numpy, Scipy u otro software como SPSS, SAS y MATLAB. Y de hecho, es un módulo muy simple. No proporciona pruebas paramétricas o incluso no paramétricas. En cambio, se puede usar para hacer algunos cálculos simples (aunque creo que incluso Excel puede hacer lo mismo). Afirman además que apoyan int, flotación, decimales y fracciones.

El módulo de estadísticas puede medir (1) promedios y medidas de ubicación central, (2) medidas de dispersión y (3) estadísticas para las relaciones entre dos entradas.

Estadísticas.significar()

El módulo de estadística contiene una gran cantidad de funciones. No cubriremos cada uno, sino algunos de ellos. En este caso, el conjunto de datos se coloca en una lista. La lista se pasa a la función.

Para enteros:

principal.estadísticas de importación de PY
x = [1, 2, 3, 4, 5, 6]
media = estadística.media (x)
Imprimir (media)

Cuando corres este último, obtienes:

principal.Py 3.5

Para fracciones, la terminología es ligeramente diferente. Tendrás que importar el módulo llamado fracciones. Además, debe colocar la fracción entre paréntesis y escribir una F de capital en frente. Así 0.5 sería igual a F (1,2). Esto no es factible para grandes conjuntos de datos!

principal.estadísticas de importación de PY
de fracciones, importar fracción como F
x = [F (1,2), F (2,3), F (3,4), F (4,5), F (5,6), F (6,7)]
media = estadística.media (x)
Imprimir (media)

Cuando corres este último, obtienes:

principal.PY 617/840

En la mayoría de los trabajos de investigación, el tipo de número más común que se encuentra es el valor decimal, y eso es mucho más difícil de lograr con el módulo de estadística. Primero debe importar el módulo decimal y luego colocar cada valor decimal en la cotización (que es absurdo y poco práctico si tiene grandes conjuntos de datos).

principal.estadísticas de importación de PY
de decimal importar decimal como D
x = [d ("0.5 "), D (" 0.75 "), D (" 1.75 "), D (" 2.67 "), D (" 7.77 "), D (" 3.44 ")]
media = estadística.media (x)
Imprimir (media)

Cuando corres este último, obtienes:

principal.Py 2.81333333333333333333333333333

El módulo de estadística también ofrece la media fmean, geométrica y armónica. Estadísticas.mediana () y estadísticas.modo () son similares a las estadísticas.significar().

Estadísticas.varianza () y estadísticas.stdev ()

En la investigación, muy, muy raramente es el tamaño de su muestra tan grande que equivale o aproximadamente equivale al tamaño de la población. Entonces, analizaremos la varianza de la muestra y la desviación estándar de la muestra. Sin embargo, también ofrecen una varianza de población y una desviación estándar de población.

Una vez más, si desea usar decimales, debe importar el módulo decimals, y si desea usar fracciones, debe importar el módulo de fracciones. Esto, en términos de análisis estadístico, es bastante absurdo y muy poco práctico.

principal.estadísticas de importación de PY
de decimal importar decimal como D
x = [d ("0.5 "), D (" 0.75 "), D (" 1.75 "), D (" 2.67 "), D (" 7.77 "), D (" 3.44 ")]
var = estadísticas.Varianza (x)
Imprimir (var)

Cuando corres este último, obtienes:

principal.Py 7.1442666666666666666666666667

Alternativamente, la desviación estándar se puede calcular haciendo:

principal.estadísticas de importación de PY
de decimal importar decimal como D
x = [d ("0.5 "), D (" 0.75 "), D (" 1.75 "), D (" 2.67 "), D (" 7.77 "), D (" 3.44 ")]
ETS = estadísticas.stdev (x)
Imprimir (STD)

Cuando corres este último, obtienes:

principal.Py 2.672876103875124748889421932

correlación de Pearson

Por alguna razón, aunque los autores del módulo de estadística ignoraron las pruebas ANOVA, las pruebas t, etc. incluyeron correlación y regresión lineal simple. Eso sí, la correlación de Pearson es un tipo específico de correlación utilizado solo si los datos son normales; es, por lo tanto, una prueba paramétrica. Hay otra prueba llamada correlación de Spearman que también se puede usar si los datos no son normales (lo que tiende a ser el caso).

principal.estadísticas de importación de PY
x = [1.11, 2.45, 3.43, 4.56, 5.78, 6.99]
y = [1.45, 2.56, 3.78, 4.52, 5.97, 6.sesenta y cinco]
corr = estadísticas.correlación (x, y)
Imprimir (Corr)

Cuando corres este último, obtienes:

principal.Py 0.9960181677345038

Regresión lineal

Cuando se lleva a cabo una regresión lineal simple, arroja una fórmula:

y = pendiente * x + intercepción

Excel también hace esto. Pero lo máximo que este módulo puede hacer es imprimir el valor de la pendiente y la intersección de la que puede recrear la línea. Excel y SPSS ofrecen gráficos para acompañar la ecuación, pero nada de eso con el módulo de estadística.

principal.estadísticas de importación de PY
x = [1.11, 2.45, 3.43, 4.56, 5.78, 6.99]
y = [1.45, 2.56, 3.78, 4.52, 5.97, 6.sesenta y cinco]
pendiente, intercepción = estadísticas.lineal_regression (x, y)
Imprimir ("La pendiente es % s" % pendiente)
Imprimir ("La intercepción es % s" % intercepta)
Imprimir (" %s x + %s = y" %(pendiente, intercepción))

Cuando corres este último, obtienes:

principal.py la pendiente es 0.9111784209749394
La intersección es 0.46169013364824574
0.9111784209749394 x + 0.46169013364824574 = y

Covarianza

Además, el módulo de estadística puede medir covarianza.

principal.estadísticas de importación de PY
x = [1.11, 2.45, 3.43, 4.56, 5.78, 6.99]
y = [1.45, 2.56, 3.78, 4.52, 5.97, 6.sesenta y cinco]
cov = estadísticas.covarianza (x, y)
Imprimir (CoV)

Cuando corres este último, obtienes:

principal.Py 4.2797199999999999

Aunque Python ofrece un módulo llamado módulo de estadística, no es para estadísticas avanzadas! Eso sí, si realmente desea analizar su conjunto de datos, vaya con cualquier módulo que no sea el módulo de estadística! No solo es demasiado simple, sino que también todas las características que ofrece también se pueden encontrar fácilmente en Excel. Además, solo hay dos pruebas, la correlación de Pearson y la regresión lineal simple, que este módulo ofrece en términos de pruebas. No hay ANOVA, ni prueba t, ni chi-cuadrado ni ninguno de los similares! Y lo que es más, si necesita usar decimales, debe invocar el módulo decimal, lo que puede ser frustrante para conjuntos de datos grandes y muy grandes. No atrapará a nadie que necesite un trabajo estadístico real realizado usando este módulo (vaya con SPSS si necesita cosas avanzadas), pero si es simple, divertido, entonces este módulo es para usted.

Codificación feliz!