Histograma de marco de pandas

Histograma de marco de pandas
Podemos hacer que DataFrame contenga diferentes campos y filas en Pandas. Los datos se insertan en esas filas y columnas. Podemos dibujar el "histograma" del marco de datos en pandas. Un "histograma" se usa con frecuencia para mostrar cómo se distribuyen los datos numéricos. Con frecuencia desee comprender rápidamente cómo se distribuyen las variables numéricas específicas en un conjunto de datos al investigarlo. Se usa un histograma para hacer esto. Pandas proporciona el método "Hist ()" para dibujar el histograma.

Los pandas.Marco de datos.La técnica hist () se utiliza para determinar cómo se distribuyen las variables numéricas. Los valores se dividen en variables numéricas por esta función. Su propósito principal es crear un histograma a partir de un marco de datos especificado. Cuando el marco de datos de Pandas.Se utiliza el método Hist (), cada serie en el marco de datos especificado se pasa automáticamente a Matplotlib. pyplot.Método Hist (). A cambio, obtenemos un histograma para cada columna. Trazaremos el histograma del marco de datos en esta guía utilizando el método "Hist ()" de Pandas.

Sintaxis:

Marco de datos.Hist (datos, columna = ninguno, por = none, grid = true, xlabelsize = none, xrot = none, ylabelsize = none, yrot = none, ax = none, sharex = false, sharey = false, figSize = none, Layout = Ninguno, contenedores = 10, backend = none, Legend = false, ** kwargs)

Ejemplo 1:

Los códigos de pandas en esta guía se realizan en la herramienta "Spyder". En la primera línea, importamos los "Pandas como PD". Luego, creamos un marco de datos de "valores" utilizando el "PD.Método DataFrame () ". Desarrollamos dos columnas del marco de datos "valores" que son "longitud L" y "amplitud b". Y ponemos los valores numéricos en cada uno de ellos. En "Longitud L", insertamos "2.7, 8.7, 3.4, 2.4 y 1.Valor numérico de 9 ". Mientras que en "Apreth B", insertamos "4.24, 2.67, 7.6, 7.1 y 4.Vlaues numéricos de 9 ". Ahora, dibujamos el histograma de estos datos del marco de datos. Inicializamos la variable "HIST" con el "DataFrame.Método Hist () "e inserte el" contenedores = 6 ".

Un histograma evalúa el número de mediciones que ocurren a través de cada contenedor después de dividir los valores contenidos dentro de una variable numérica en "contenedores."Podemos obtener una comprensión instintiva rápida y fácil de la distribución de valores dentro de una variable representando visualmente esos recuentos agrupados de una manera columna.


Esta salida aparece en la consola Spyder cuando presionamos las teclas "Shift + Enter" en el teclado. Aquí tenemos dos histogramas. Estos son los histogramas de los datos que insertamos en el código Pandas.

Ejemplo 2:

Generamos el marco de datos "Valores" aquí que contiene tres columnas que son "B_1, H_1 y L_1" que muestra la amplitud, la altura y la longitud, respectivamente. Añademos "4.24, 2.67, 7.6, 7.1 y 4.9 "en" B_1 ". Agregamos también agregar "6.8, 5.5, 4.8, 11.88 y 1.1 "en" H_1 ". Entonces, insertamos "3.7, 9.7, 3.4, 4.4 y 2.9 "en" L_1 ". Después de esto, utilizamos el método "Hist ()" que convierte estos valores numéricos en un histograma. Dibuja tres histogramas separados. El valor de "contenedores" que establecemos aquí es "12".


Aparecen tres gráficos de histograma diferentes en la salida. El primer histograma es de los datos "B_1", el segundo cuadro de histograma es de los datos "H_1", y el último es de los datos "L_1".

Ejemplo 3:

Ahora, dibujamos cuatro histogramas distintos en este ejemplo. Para esto, creamos cuatro columnas del DataFrame como "Datos 1, Datos 2, Datos 3 y Datos 4". En "Datos 1", agregamos algunos valores que son "2.7, 0.0, 1.4, 2.4 y 1.9 ". Colocamos "4.24, 2.67, 7.6, 7.1 y 4.9 "en" Datos 2 ". Agregar "5.8, 5.5, 7.8, 10.88 y 0.1 "a" Datos 3 ". Y agregue los valores "20, 40.8, 55.8, 7.2 y 48 "en" Datos 4 ". Después de esto, dibujamos el histograma de todas esas columnas por separado. Utilizamos la técnica "Hist ()" con el nombre del DataFrame y establecemos sus "Bins" como "8". Genera cuatro histogramas distintos en la pantalla de salida.


Creamos estos histogramas dados con la ayuda de la función "Hist ()" en Pandas. Todas las columnas contienen datos diferentes, por lo que los cuatro histogramas aquí son diferentes entre sí.

Ejemplo 4:

También podemos dibujar el histograma de los datos que están presentes en el archivo CSV. Ahora, en este ejemplo, trazamos los histogramas de los datos del archivo CSV. Para esto, importamos el "matplotlib.Biblioteca de Pyplot "como" PLT ". Obtenemos las funciones de esta biblioteca colocando el objeto "PLT" en lugar del "matplotlib.pyplot ". Ahora, leemos el archivo CSV utilizando el método "Read_csv". Especificamos el nombre del archivo que contiene los datos que queremos importar a un marco de datos en el "Read_csv ()".

Aquí, el archivo se llama "archivo.CSV ". Los datos del "archivo.CSV "se almacena en el" DF "en forma de DataFrame. Renderizamos los datos del archivo en forma de DataFrame en la consola. Luego, aplicamos el método "Hist ()" en el que colocamos el nombre de la columna presente en el archivo CSV. Este nombre de columna es "S_NAME". Cuando se crean los histogramas, este nombre aparece allí. La "Figsize" que utilizamos aquí se usa para ajustar el tamaño de la imagen de histograma que establecemos como "12" para el "ancho" y "8" para la "altura" del tamaño del gráfico del histograma.

Además, los "contenedores" se establecen en "15". Al final, colocamos el "PLT.método show () ". El "PLT. El método show () ”inicia un bucle de eventos, busca todas las entidades de figuras existentes y inicia múltiples ventanas interactivas que demuestran su gráfico o gráficos.


Aquí, primero muestra los datos que están presentes en el archivo CSV en forma de DataFrame. Luego, traza los gráficos de los datos numéricos por separado para cada.


Verás que tenemos seis gráficos distintos aquí. Los nombres de los estudiantes se mencionan en cada gráfico ya que ajustamos este "S_NAME" en el código. Entonces, este "s_name" se representa aquí en la parte superior de cada gráfico.

Ejemplo 5:

Nuevamente importamos ambas bibliotecas que son "Pandas" y "matplotlib.pyplot "en este código como" PD "y" PLT ", respectivamente. Luego, dibujamos el histograma de la "oficina.Archivo CSV "colocando el método" Read_csv () "primero y luego usando la función simple" Hist () ". Además, mostramos los datos del archivo de oficina como un marco de datos en el terminal antes de usar el método "Hist ()". Agregamos el "PLT. Función show () "que explicamos en el ejemplo anterior.


El marco de datos de la "oficina.El archivo CSV "se representa. Sus histogramas se muestran en la siguiente ilustración. Aquí, los datos del archivo CSV se muestran primero en forma de DataFrame.


Se muestran dos gráficos de histograma en la salida ya que este marco de datos contiene solo dos columnas que tienen datos numéricos,.

Ejemplo 6:

Este es nuestro último ejemplo para esta guía. Creamos el DataFrame de datos "Cars_DF" e insertamos dos columnas en él. El "nombre del automóvil" contiene los nombres de los autos y el "precio challan" contiene el precio de Challan. Después de esto, accedemos a la función "Hist ()" desde el "PLT", que es la biblioteca que importamos al comienzo del código. Pasamos el nombre de la columna "challan_price" en el "PLT. Hist () "Función y utiliza el" PLT. método show () ".


Este es el gráfico de histograma de este código que se dibuja en función de los valores numéricos presentes en la columna "challan_price".

Conclusión

El método "Hist ()" en Pandas se demuestra en esta guía. Nuestro objetivo principal es transmitir la idea del método "Hist ()" en Pandas de manera simple y sucinta. Explicamos cómo usar la función Pandas "Hist ()" para dibujar el histograma de los datos numéricos del marco de datos. Explicamos que el "histograma" es una representación visual de cómo se distribuyen los datos. Podrá continuar con una etapa más complicada de la programación de pandas después de leer esta guía. Esperamos que se beneficie enormemente en el futuro de esta guía.