Parcela de bar apilada

Parcela de bar apilada
La exploración de datos es algo que a todos nos gusta hacer. El análisis de datos exploratorios es el proceso de mostrar datos y comprender o extraer información importante. Los datos se pueden mostrar de muchas maneras diferentes. Una parcela de barra apilada es un gráfico útil que se utiliza en una variedad de aplicaciones y presentaciones. Aprenderemos cómo comprender y construir parcelas de barras apiladas usando Python en este artículo.

¿Qué es una trama de bar apilada en Seaborn?

Una gráfica de barra apilada es una representación visual de un conjunto de datos en el que la categoría se resalta con ciertas formas como rectángulos. Los datos proporcionados en el conjunto de datos están representados por la longitud y las alturas de la tabla de barras. En una gráfica de barra apilada, un eje incluye la proporción de recuentos asociados con una clasificación específica de una columna en el conjunto de datos, mientras que el otro eje representa los valores o recuentos conectados con él. Las parcelas de barra apiladas podrían representarse horizontal o verticalmente. El gráfico de barras verticales se conoce como un gráfico de columna.

Una gráfica de barra apilada es un tipo de gráfico donde cada barra se divide gráficamente en las barras subcons. Para mostrar numerosas columnas de datos al mismo tiempo.

También vale la pena recordar que una gráfica de barra solo muestra el valor media (u otro estimador), mientras que mostrar el rango de valores posibles a través de cada escala de los datos categóricos puede ser más útil en muchas circunstancias. Otras parcelas, como una caja o una parcela de violín, serían más apropiadas en este escenario.

Sintaxis de la parcela de bar apilada

La sintaxis de la función de trazado de barra apilada de Seaborn es extremadamente simple.

DataFramename.plot (kind = 'bar', apilado = true, color = [color1, color2,… colorn])

Aquí está DataFramename en el conjunto de datos de trazado. Esto se considera una forma amplia si X e Y no están presentes. Aparte de eso, será una forma larga dentro de este DataFramename. El método de la parcela debe establecerse en apilado = verdadero para trazar el diseño de la barra apilada. También podemos pasar una lista de colores, que usamos para colorear por separado cada barra en una barra. Algunos otros parámetros opcionales también juegan un papel importante en la consignación de las tramas de barra apiladas.

Orden, Hue_order: Los niveles categóricos deben trazarse en orden; de lo contrario, los niveles se suponen de los elementos de datos.

estimador: Dentro de cada contenedor categórico, use esta función estadística para estimar.

CI (Float, SD, Ninguno): El ancho de los intervalos de confianza debe dibujarse en torno a los valores estimados si "SD", omita la escala y muestre la desviación estándar de las observaciones en su lugar. No habrá botas de arranque ni barras de error si no se especifica ninguna.

n_boot (int): Se define la frecuencia de los ciclos de arranque para usar al calcular modelos estadísticos.

orientar: La trama está orientada de cierta manera (vertical u horizontal). Esto normalmente se infiere de los tipos de variables de entrada, pero se puede utilizar para aclarar la incertidumbre en la que las variables X e Y son enteros o al visualizar datos de forma ancha.

paleta: Colores para utilizar para varios niveles de tono. Debe ser un diccionario que traduce rangos de tono a los colores matplotlib, o cualquier cosa que la paleta de colores () pueda entender.

saturación: Los colores deben dibujarse en una proporción de las áreas grandes de saturación reales de ganancias de colores moderadamente dessaturados, pero a menos que queramos que los colores de la trama cumplan exactamente las especificaciones de color de entrada, configure esto en 1.

Errcolor: Las líneas que representan el modelo estadístico están coloreados de manera diferente.

Errwidth (flotante): Grosor de la línea de las barras de error (y tapas).

Dodge (Bool): Si los elementos deben moverse o no a lo largo del eje categorizado cuando se emplea la anidación del tono.

Ejemplo 1:

Tenemos una parcela de bar apilada simple que muestra las ventas del automóvil en diferentes meses. Incluimos algunas bibliotecas que son necesarias para este código de ejemplo. Luego, creamos un marco de datos en la variable "DF". Tenemos tres campos con el nombre del automóvil que tienen diferentes porcentajes de ventas por año y en el campo de índice, incluimos los nombres de los meses. Luego, creamos la trama de bares apilados llamando al DF.trazar y pasar el parámetro como una barra, y apiló el valor a verdadero dentro de él. Después de eso, asignamos la etiqueta al eje x e y y también establecimos el título para la trama de barra apilada.

Importar matplotlib.Pyplot como PLT
Importar Sevorn como SNS
df.Explotar ('z')
importar pandas como PD
DF = PD.DataFrame ('BMW': [14, 33, 43, 81, 52, 24, 18, 85, 12, 68, 75, 21],
'CVICS': [22, 23, 10, 72, 31, 48, 52, 42, 32, 21, 55, 35],
'Ferrari': [35, 48, 12, 35, 63, 20, 32, 53, 20, 35, 27, 58],
index = ['Jan', 'feb', 'mar', 'abr', 'may', 'jun', 'jul', 'agu', 'sep', 'oct', 'nov', 'dec' ])
df.plot (kind = 'bar', apilado = true, color = ['azul', 'rojo', 'naranja'])
PLT.XLABEL ('Meses de ventas')
PLT.Ylabel ('rangos de ventas')
PLT.Título ('Ventas de autos en un año')
PLT.espectáculo()

La representación visual de la trama de barra apilada es la siguiente:

Ejemplo 2:

El siguiente código demuestra cómo agregar títulos del eje y un título de descripción general, y sobre cómo rotar las etiquetas del eje X y el eje Y para una mejor legibilidad. Creamos el marco de datos de los trabajadores con los turnos de la mañana y la noche durante los días dentro de una variable "DF". Luego, creamos una trama de barra apilada con el DF.función de trazado. Después de eso, establecemos el título de la trama como 'trabajos de la empresa' con el tamaño de la fuente. También se dan las etiquetas para el eje x y la identificación del eje Y. Al final, dimos un ángulo a las variables X e Y que gira de acuerdo con ese ángulo.

importar pandas como PD
Importar matplotlib.Pyplot como PLT
Importar Sevorn como SNS
DF = PD.DataFrame ('Days': ['Mon', 'martes', 'Wed', 'Thur', 'Fri'],
'Morning Shift': [32, 36, 45, 50, 59],
'Evening Shift': [44, 47, 56, 58, 65])
df.plot (kind = 'bar', stacked = true, color = ['rojo', 'naranja'])
PLT.Título ('Labores de la empresa', FontSize = 15)
PLT.xlabel ('días')
PLT.Ylabel ('Número de trabajos')
PLT.Xticks (rotación = 35)
PLT.Yticks (rotación = 35)
PLT.espectáculo()

La gráfica de barra apilada con las etiquetas rotacionales x e y se muestra en la figura de la siguiente manera:

Ejemplo 3:

Podemos usar el mismo gráfico de barras para mostrar un conjunto de valores categóricos. El resultado final no tendrá una apariencia apilada, sino que representará las observaciones en un solo gráfico con varias barras. En el código de ejemplo, establecemos el marco de datos que tiene los datos del móvil que tienen diferentes tasas en diferentes días. Esta gráfica muestra las tasas de dos móviles simultáneamente a medida que establecemos el parámetro variable X e Y en la función de trazado de barras marinas con el conjunto de tono como móvil.

importar pandas como PD
Importar matplotlib.Pyplot como PLT
Importar Sevorn como SNS
DF = PD.DataFrame ("Tarifas": [40, 80, 50, 60, 70, 50, 80, 40, 30, 40, 20, 30, 50, 70],
"Móvil": ['Oppo', 'Samsung', 'Oppo', 'Samsung', 'Oppo', 'Samsung', 'Oppo', 'Samsung', 'Oppo', 'Samsung', 'Oppo', ', " Samsung ',' Oppo ',' Samsung '],
"Días": [1, 1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7])
S = SNS.Barplot (x = "días", y = 'tasas', data = df, hue = "móvil")
PLT.espectáculo()

La gráfica se visualiza con las dos barras en la siguiente figura de gráfico:

Conclusión

Aquí, explicamos brevemente la trama de bar apilada con la biblioteca marítima. Mostramos el diagrama de barras apilada con diferentes visualización de los marcos de datos y también con diferentes estilos de etiquetas X e Y. Los scripts son fáciles de comprender y aprender usando el Ubuntu 20.04 terminal. Los tres ejemplos se pueden cambiar según las necesidades de trabajo de los usuarios.