Tramamente.expresar.histograma

Tramamente.expresar.histograma
Una de las gráficas más comunes en el análisis estadístico es un histograma. Es una de las formas más eficientes y fácil de implementar el tipo de gráfico que muestra la distribución de frecuencia. Es muy similar a una trama de bar con algunas diferencias importantes. Piense en ello como una trama de barra agregada.

En este tutorial, aprenderemos cómo podemos crear una gráfica de histograma utilizando el módulo Express Plotly.

Tramamente.expresar.histograma ()

En Plotly Express, usamos la función histograma () para crear gráficos de histograma. La función proporciona una sintaxis como se muestra:

tramamente.expresar.HISTOGRAM (data_frame = none, x = none, y = none, color = none, pattern_shape = none, facet_row = none, facet_col = none, facet_col_wrap = 0, facet_row_spacing = none, facet_col_spacing = none, hover_name = none, hover_data = none, animation_frame=None, animation_group=None, category_orders=None, labels=None, color_discrete_sequence=None, color_discrete_map=None, pattern_shape_sequence=None, pattern_shape_map=None, marginal=None, opacity=None, orientation=None, barmode='relative', Barnorm = None, HistNorm = None, Log_x = False, Log_y = False, Range_x = None, Range_y = None, HistFunc = None, Cumulative = None, NBins = None, Text_auto = False, Title = None, Template = None, Width = Ninguno, altura = ninguno)

Los siguientes son los parámetros de función más útiles que necesitará saber:

  1. Data_frame: especifica el marco de datos que contiene los nombres de la columna. Puede aprobar este valor como un marcador de datos, un diccionario o un objeto Like_like.
  2. x - Especifica los valores utilizados para colocar las marcas a lo largo del eje x a lo largo de la coordenada cartesiana. Este puede ser un nombre de columna dentro de un marco de datos o una serie Pandas.
  3. Y - Similar a x pero los valores especificados en este parámetro se utilizan para colocar las marcas a lo largo del eje Y.
  4. Color: define los valores utilizados para asignar un color único a las marcas.
  5. Acumulativo: especifica si los valores del histograma son acumulativos.
  6. NBINS: especifica el número de contenedores.
  7. Histnrom: especifica el modo en que se crean los contenedores. Los valores aceptados incluyen:
    1. 'por ciento'
    2. 'probabilidad'
    3. 'densidad'
    4. 'densidad de probabilidad'

La función luego devolverá una gráfica de histograma de tipo Graph_Objects.Cifra.

Ejemplo: usando los datos de Gapminder ()

Podemos crear un histograma utilizando los datos de Gapminder en Plotly. Tome el código de ejemplo que se muestra a continuación:

Importar trama.expresar como PX
DF = PX.datos.GABMINDER ().consulta ("continente == 'Europa'")
Fig = PX.histograma (df, x = 'gdppercap')
higo.espectáculo()

En el ejemplo anterior, estamos utilizando los datos de Gapminder () de Plotly Express. Luego trazamos un histograma que muestra la distribución del PIB per cápita de los países del continente de Europa.

Una vez que ejecutamos el código anterior, deberíamos ver un histograma como se muestra:

Ejemplo 2 - Uso de datos categóricos

También podemos crear un histograma de datos categóricos especificando los parámetros X e Y.

Tome el código de ejemplo que se muestra a continuación:

Importar trama.expresar como PX
DF = PX.datos.GABMINDER ().consulta ("continente == 'Europa'")
Fig = PX.Histograma (df, x = 'país', y = 'GDPPERCAP')
higo.espectáculo()

En este caso, el histograma mostrará cada país y la suma del valor per cápita del PIB como se muestra en la figura a continuación:

Ejemplo 3: especificar tipo de normalización

Por defecto, Plotly creará un histograma con cada muestra en cada contenedor. Sin embargo, podemos especificar el modo en el que deseamos presentar los contenedores utilizando el parámetro Histnorm.

Veamos varios ejemplos:

Densidad de probabilidad

Fig = PX.histograma (df, x = 'gdppercap', histnorm = 'densidad de probabilidad')
higo.espectáculo()

En este ejemplo, creamos un histograma de densidad de probabilidad que es una suma de las áreas de barras iguales a 1.

La figura resultante es como se muestra:

Verifique la lista de parámetros para conocer los diversos tipos que puede especificar.

Ejemplo 4 - Especifique el número de contenedores

Por defecto, Plotly elegirá el número de contenedores para que sea comparable al número de muestras en un contenedor. Sin embargo, podemos especificar el número de contenedores utilizando el parámetro NBINS.

Un ejemplo es como se muestra:

Fig = PX.histograma (df, x = 'gdppercap', nbins = 50)
higo.espectáculo()

En el ejemplo anterior, especificamos el número de contenedores a 50. Esto debería devolver una figura como se muestra:

Ejemplo 5 - Especifique el parámetro de color

También podemos especificar el parámetro de color. Esto asignará un color único basado en el nombre de las columnas especificadas.

El código de ejemplo es como se muestra:

Fig = PX.HISTOGRAM (DF, X = 'GDPPERCAP', COLOR = 'PAÍS')
higo.espectáculo()

La figura resultante:

En este caso, Plotly asignará un color único a cada país en la trama según lo especificado por el parámetro de color.

Ejemplo 6 - Histograma horizontal

Plotly también nos permite crear histogramas horizontales. Eche un vistazo al siguiente código:

Fig = PX.HISTOGRAM (DF, X = 'GDPPERCAP', Y = 'país', color = 'país')
higo.espectáculo()

En este caso, estamos trazando un histograma de la suma del PIB per cápita de cada país. El código anterior debe devolver una figura como se muestra:

Ejemplo 7 - Orden de clasificación por categoría

En algunos casos, es posible que deseemos ordenar el gráfico resultante basado en un valor específico. Por ejemplo, en el histograma anterior, podemos ordenar el histograma en función del total de GDPPERCAP en orden ascendente.

Usando la función update_xaxes o update_yaxes, especificamos cómo deseamos ordenar los datos.

En nuestro ejemplo, deseamos clasificar el eje y. Por lo tanto, usaremos la función update_yaxes (). En la función, podemos especificar el parámetro y el método CategoryOrder en el que deseamos ordenar los datos. En este caso, 'descendente total'.

Podemos ejecutar el código como se muestra:

Fig = PX.HISTOGRAM (DF, X = 'GDPPERCAP', Y = 'país', color = 'país').update_yaxes (categoryOrder = 'total descendente')
higo.espectáculo()

El código anterior debe dar como resultado una figura como se muestra:

Conclusión

En este artículo, exploramos cómo usar la función histograma () del módulo Express Plotly. La función nos permite crear histogramas de varios datos.