Cómo trazar datos en Pandas Python

Cómo trazar datos en Pandas Python
La visualización de datos juega un papel importante en el análisis de datos. Pandas es una fuerte biblioteca de análisis de datos en Python para la ciencia de datos. Proporciona varias opciones para la visualización de datos con .Método Plot (). Incluso si es un principiante, puede trazar fácilmente sus datos utilizando la biblioteca Pandas. Necesita importar los pandas y matplotlib.Paquete Pyplot para la visualización de datos.

En este artículo, exploraremos varios métodos de trazado de datos utilizando Pandas Python. Hemos ejecutado todos los ejemplos en el editor de código fuente de PyCharm utilizando Matplotlib.paquete de pyplot.

Trazado en Pandas Python

En pandas, el .plot () tiene varios parámetros que puede usar en función de sus necesidades. Principalmente, utilizando el parámetro 'Kind', puede definir qué tipo de gráfico creará.

La sintaxis para trazar datos usando Pandas Python

La siguiente sintaxis se usa para trazar un marco de datos en Pandas Python:

# Importar pandas y matplotlib.paquetes de pyplot
importar pandas como PD
Importar matplotlib.Pyplot como PLT
# Preparar datos para crear datos de datos
data_frame =
'Columna1': ['campo1', 'campo2', 'campo3', 'campo4', ...],
'Columna2': ['campo1', 'campo2', 'campo3', 'campo4', ...]

var_df = PD.DataFrame (data_frame, columns = ['columna1', 'columna2])
Imprimir (variable)
# trazar gráfico de barras
var_df.trama.barra (x = 'columna1', y = 'columna2')
PLT.espectáculo()

También puede definir el tipo de gráfico utilizando el parámetro de tipo de la siguiente manera:

var_df.plot (x = 'columna1', y = 'columna2', kind = 'bar')

Los objetos Pandas Dataframes tienen los siguientes métodos de trazado para trazar:

  • Trama de dispersión: trama.dispersión()
  • Trazado de la barra: trama.bar (), trama.barh () donde h representa la trama de barras horizontales.
  • Trazado de línea: trama.línea()
  • Trazado de pastel: trama.tarta()

Si un usuario solo usa el método Plot () sin usar ningún parámetro, entonces crea el gráfico de línea predeterminado.

Ahora explicaremos algunos tipos principales de trazado en detalle con la ayuda de algunos ejemplos.

Dispersión tramando en pandas

En este tipo de trazado, hemos representado la relación entre dos variables. Tomemos un ejemplo.

Ejemplo

Por ejemplo, tenemos datos de correlación entre dos variables GDP_Growth y Oil_price. Para trazar la relación entre dos variables, hemos ejecutado la siguiente pieza de código en nuestro editor de código fuente:

Importar matplotlib.Pyplot como PLT
importar pandas como PD
GDP_CAL = PD.Marco de datos(
'GDP_GROWTH': [6.15.8, 5.7, 5.7, 5.8, 5.sesenta y cinco.5, 5.3, 5.2, 5.2],
'Oil_price': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
DF = PD.DataFrame (GDP_CAL, Columns = ['Oil_price', 'GDP_Growth'])
Imprimir (DF)
df.plot (x = 'Oil_price', y = 'GDP_Growth', kind = 'scatter', color = 'rojo')
PLT.espectáculo()

Gráficos de línea trazado en pandas

El diagrama de gráfico de línea es un tipo básico de trazado en el que se muestra información dada en una serie de puntos de datos que están conectados aún más por segmentos de líneas rectas. Usando los gráficos de línea, también puede mostrar las tendencias de la información en tiempo extra.

Ejemplo

En el ejemplo a continuación, hemos tomado los datos sobre la tasa de inflación del año pasado. Primero, prepare los datos y luego cree DataFrame. El siguiente código fuente traza el gráfico de línea de los datos disponibles:

importar pandas como PD
Importar matplotlib.Pyplot como PLT
infl_cal = 'año': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = PD.DataFrame (infl_cal, columnas = ['año', 'infl_rate'])
marco de datos.plot (x = 'año', y = 'infl_rate', kind = 'line')
PLT.espectáculo()

En el ejemplo anterior, debe establecer el tipo = 'Línea' para la trazado de la tabla de línea.

Método 2# Uso de la trama.Método Line ()

El ejemplo anterior, también puede implementar utilizando el siguiente método:

importar pandas como PD
Importar matplotlib.Pyplot como PLT
inf_cal = 'año': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = PD.DataFrame (inf_cal, columnas = ['inflation_rate'], index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
marco de datos.trama.línea()
PLT.Título ('Resumen de la tasa de inflación de los últimos 11 años')
PLT.Ylabel ('inflation_rate')
PLT.Xlabel ('año')
PLT.espectáculo()

Se mostrará el siguiente gráfico de línea después de ejecutar el código anterior:

Gráfico de barras en pandas

El trazado del gráfico de barras se utiliza para representar los datos categóricos. En este tipo de gráfico, las barras rectangulares con diferentes alturas se trazan en función de la información dada. El gráfico de barras se puede trazar en dos direcciones horizontales o verticales diferentes.

Ejemplo

Hemos tomado la tasa de alfabetización de varios países en el siguiente ejemplo. Se crean marcos de datos en los que 'country_names' y 'literacy_rate' son las dos columnas de un marcado de datos. Usando pandas, puede trazar la información en la forma del gráfico de barras de la siguiente manera:

importar pandas como PD
Importar matplotlib.Pyplot como PLT
lit_cal =
'Country_Names': ['Pakistán', 'EE. UU.', 'China', 'India', 'Reino Unido', 'Austria', 'Egipto', 'Ucrania', 'Saudia', 'Australia',
'Malasia'],
'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = PD.DataFrame (lit_cal, columns = ['country_names', 'litr_rate'])
imprimir (data_frame)
marco de datos.trama.bar (x = 'country_names', y = 'litr_rate')
PLT.espectáculo()

También puede implementar el ejemplo anterior utilizando el siguiente método. Establezca el tipo = "Bar" para la traza del gráfico de barras en esta línea:

marco de datos.plot (x = 'country_names', y = 'litr_rate', kind = 'bar')
PLT.espectáculo()

Trazado de gráfico de barra horizontal

También puede trazar los datos en barras horizontales ejecutando el siguiente código:

Importar matplotlib.Pyplot como PLT
importar pandas como PD
data_chart = 'litr_rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
DF = PD.DataFrame (data_chart, columns = ['litr_rate'], index = ['Pakistan', 'USA', 'China', 'India', 'Reino Unido', 'Austria', 'Egipto', 'Ucrania', 'Saudia' , 'Australia',
'Malasia'])
df.trama.Barh ()
PLT.Título ('Tasa de alfabetización en varios países')
PLT.Ylabel ('country_names')
PLT.xlabel ('litr_rate')
PLT.espectáculo()

En DF.trama.Barh (), el Barh se usa para trazar horizontal. Después de ejecutar el código anterior, se muestra el siguiente gráfico de barras en la ventana:

Trazado de gráfico circular en pandas

Un gráfico circular representa los datos en una forma gráfica circular en la que los datos se muestran en cortes en función de la cantidad dada.

Ejemplo

En el siguiente ejemplo, hemos mostrado la información sobre 'Earth_Material' en diferentes rodajas en el gráfico de pasteles. Primero, cree DataFrame, luego, utilizando los pandas, muestre todos los detalles en el gráfico.

importar pandas como PD
Importar matplotlib.Pyplot como PLT
material_per = 'Earth_part': [71,18,7,4]
DataFrame = PD.DataFrame (material_per, columnas = ['Earth_part'], index = ['Water', 'Mineral', 'Sand', 'Metals'])
marco de datos.trama.Pie (y = 'Earth_part', figSize = (7, 7), autopct = '%1.1f %% ', startangle = 90)
PLT.espectáculo()

El código fuente anterior traza el gráfico PIE de los datos disponibles:

Conclusión

En este artículo, ha visto cómo trazar los marcos de datos en Pandas Python. Se realizan diferentes tipos de trazado en el artículo anterior. Para trazar más tipos como Box, Hexbin, Hist, KDE, Densidad, área, etc., Puede usar el mismo código fuente simplemente cambiando el tipo de trazado.