Requisito previo
Si es un nuevo usuario de Python, primero tendrá que configurar el entorno para mostrar la salida de la trama de la caja. Puede usar cualquier intérprete de Python para ejecutar el código. En este tutorial, usaré spyder3 para ejecutar el código. Si no ha instalado el pandas y marino Bibliotecas antes, luego debe ejecutar el siguiente comando desde el terminal para instalar estas bibliotecas:
$ PIP3 Instalar Pandas SeabornParcelas de caja con pandas
El Boxplot () método de pandas se utiliza para generar cifras de trazado de cuadros basados en el marco de datos. Este método contiene muchos argumentos; Algunos de estos argumentos se utilizan en los ejemplos a continuación. Esta parte del tutorial incluirá dos ejemplos que le mostrarán cómo crear gráficos de caja en pandas. Puede usar datos generados aleatoriamente en la biblioteca Numpy, o los datos de un archivo CSV, para generar un diagrama de cuadro en pandas.
Ejemplo 1: gráficos de caja basados en valores aleatorios
Las gráficas de la caja en el siguiente ejemplo se generaron usando Numpy y pandas. La biblioteca Numpy se usa en el script para crear un objeto de cuadro de datos mediante la generación de una matriz bidimensional de valores aleatorios que contienen 5 filas y 5 columnas. El contenido del marco de datos se imprimirá utilizando la cabeza() método. A continuación, el Boxplot () El método se utiliza para generar gráficos de caja con color azul, tamaño de fuente 10 y un ángulo de rotación de 30 grados para mostrar los valores de la columna.
#!/usr/bin/env python3Producción
La siguiente salida aparecerá después de ejecutar el código.
Ejemplo 2: gráficos de cuadros basados en datos de CSV
Las gráficas de la caja en el siguiente ejemplo se generaron a partir de datos de CSV. Crear un archivo CSV llamado banco.CSV Usando los siguientes datos.
banco.CSV
SL, Client_Name, Account_Type, Género, SaldoEn el siguiente script, el mate La biblioteca se utilizó para configurar el tamaño de la figura del gráfico de cuadros y para mostrar la salida en línea. Todos los registros de el Banco.CSV el archivo se cargaron utilizando el read_csv () método de pandas. Los primeros 8 registros del marco de datos se imprimieron luego utilizando el cabeza() método. El Boxplot () El método se usó en la siguiente declaración para dibujar la figura de la gráfica de cuadros usando color rojo basado en 'Tipo de cuenta' con la columna llamada 'Balance.'
#!/usr/bin/env python3Producción
La siguiente salida aparecerá después de ejecutar el código.
Parcelas de caja con marítimo
Otra biblioteca de Python comúnmente utilizada para dibujar gráficas de caja es la biblioteca marino. Una de las características importantes de esta biblioteca es que tiene muchos conjuntos de datos de muestra incorporados para probar diferentes tareas. Los siguientes dos ejemplos cubrirán el uso de dos conjuntos de datos de muestra diferentes para dibujar gráficos de cuadros utilizando el marino biblioteca.
Ejemplo 3: gráficos de caja basados en el parámetro X
El siguiente ejemplo usa un conjunto de datos de muestra, llamado 'diamantes ' de el mar biblioteca para generar la trama de la caja. Aquí, el estilo de la cuadrícula se define usando el set_style () método. El load_dataSet () El método se utiliza para cargar los datos del 'diamantes conjunto de datos. Los primeros cinco registros se imprimen desde el conjunto de datos y el Boxplot () Luego se usa el método para dibujar el gráfico de cuadro en función de la columna, nombrada 'profundidad,'Con color azul.
# Importar Biblioteca Seaborn para generar la trama de cajaProducción
La siguiente salida aparecerá después de ejecutar el código.
Ejemplo 4: gráficos de caja basados en parámetros X e Y
El siguiente ejemplo usa el conjunto de datos de muestra llamado 'vuelos'Para dibujar la trama de la caja. Aquí, tanto los parámetros X como de Y de el boxplot () El método se utilizan para dibujar la figura. Las otras declaraciones son similares al ejemplo anterior.
# Importar Biblioteca Seaborn para generar la trama de cajaProducción
La siguiente salida aparecerá después de ejecutar el código.
Conclusión
Al trabajar con una gran cantidad de datos, es posible que desee resumir los datos utilizando un diagrama, como un diagrama de caja. Este tutorial utilizó varios ejemplos para mostrarle cómo generar tramas de caja con dos bibliotecas de Python.