Tutorial de Python Matplotlib

Tutorial de Python Matplotlib
En esta lección sobre la biblioteca de Python Matplotlib, analizaremos varios aspectos de esta biblioteca de visualización de datos que podemos usar con Python para generar gráficos hermosos e intuitivos que pueden visualizar los datos en una forma que el negocio quiere de una plataforma. Para completar esta lección, cubriremos las siguientes secciones:
  • ¿Qué es Python matplotlib??
  • Tipos de parcelas que podemos construir, como gráfico de barras, histograma, parcela de dispersión, diagrama de área y gráfico de educación física
  • Trabajando con múltiples tramas
  • Algunas alternativas para Python Matplotlib

¿Qué es Python matplotlib??

El matplotlib.Pyplot es un paquete de trazado de gráficos que se puede usar para construir gráficos bidimensionales utilizando el lenguaje de programación de Python. Debido a su naturaleza conectable, este paquete se puede utilizar en cualquier aplicación de GUI, servidores de aplicaciones web o scripts simples de Python. Algunos kits de herramientas que extienden la funcionalidad de Python Matplotlib son:

  • Mapa base es una biblioteca de trazado de mapas que proporciona características para crear proyectos de mapas, costas y límites políticos
  • Natgrid se puede utilizar para la reducción de datos irregulares en datos espaciados
  • Herramientas de Excel se puede usar para intercambiar datos entre MS Excel y Matplotlib
  • Cardapía es una biblioteca de mapeo muy compleja que incluso proporciona características de transformación de imágenes aparte de las proyecciones de puntos, línea y polígono

Solo una nota antes de comenzar es que usamos un entorno virtual para esta lección que hicimos con el siguiente comando:

python -m virtualenv matplotlib
fuente matplotlib/bin/activar

Una vez que el entorno virtual está activo, podemos instalar la biblioteca Matplotlib dentro de la ENV virtual para que los ejemplos que creamos a continuación puedan ejecutarse:

PIP Instalar matplotlib

Vemos algo como esto cuando ejecutamos el comando anterior:

Puede usar Anaconda también para ejecutar estos ejemplos que son más fáciles. Si desea instalarlo en su máquina, mire la lección que describe "Cómo instalar Anaconda Python en Ubuntu 18.04 LTS ”y comparta sus comentarios. Ahora, avancemos a varios tipos de parcelas que se pueden construir con Python Matplotlib.

Tipos de tramas

Aquí, demostramos los tipos de gráficos que se pueden dibujar con Python Matplotlib.

Gráfico simple

El primer ejemplo que veremos será de un gráfico simple. Este ejemplo se utiliza como una demostración de cuán simple es construir un gráfico de gráficos junto con personalizaciones simples que vienen con él. Comenzamos importando matplotlib y definiendo las coordenadas X e Y queremos trazar:

de matplotlib import pyplot como plt
x = [3, 6, 9]
y = [2, 4, 6]

Después de esto, podemos trazar estas coordenadas en el gráfico y mostrarlo:

PLT.Parcela (x, y)
PLT.espectáculo()

Cuando ejecutemos esto, veremos el siguiente gráfico:


Con solo unas pocas líneas de código, pudimos trazar un gráfico. Agregamos algunas personalizaciones para que este gráfico sea un poco más expresivo:

PLT.Título ('LH Plot')
PLT.Ylabel ('y eje')
PLT.xlabel ('x eje')

Agregue las líneas de código anteriores justo antes de mostrar la trama y el gráfico ahora tendrá etiquetas:

Daremos un intento más de personalizar este gráfico para que sea intuitivo con las siguientes líneas de código antes de mostrar la trama:

x1 = [3, 6, 9]
y1 = [2, 4, 6]
x2 = [2, 7, 9]
y2 = [4, 5, 8]
PLT.Título ('Info')
PLT.Ylabel ('y eje')
PLT.xlabel ('x eje')
PLT.Plot (X1, Y1, 'G', Label = 'Quarter 1', LineWidth = 5)
PLT.Plot (X2, Y2, 'R', Label = 'Quarter 2', LineWidth = 5)
PLT.leyenda()
PLT.cuadrícula (verdadero, color = 'k')
PLT.espectáculo()

Veremos la siguiente trama cuando ejecutemos el fragmento de código anterior:

Observe con qué comenzamos y con qué terminamos, un gráfico muy intuitivo y atractivo que puede usar en sus presentaciones y está hecho con un código de pitón puro, definitivamente algo de lo que estar orgulloso !

Hacer un gráfico de barras

Un gráfico de barras es específicamente útil cuando queremos plataforma una comparación con medidas específicas y limitadas. Por ejemplo, comparar las marcas promedio de los estudiantes con una sola materia es un buen caso de uso. Construyamos un gráfico de barras para el mismo caso de uso aquí, el fragmento de código para esto será:

AVG_Marks = [81, 92, 55, 79]
Física = [68, 77, 62, 74]
PLT.bar ([0.25, 1.25, 2.25, 3.25], avg_marks, etiqueta = "promedio", width =.5)
PLT.bar([.75, 1.75, 2.75, 3.75], física, etiqueta = "física", color = 'r', width =.5)
PLT.leyenda()
PLT.xlabel ('rango')
PLT.Ylabel ('Marcas')
PLT.Título ('Comparación')
PLT.espectáculo()

El gráfico de barras creado con los datos de muestra anteriores se verá como el siguiente:

Hay múltiples barras presentes aquí para establecer una comparación. Tenga en cuenta que hemos proporcionado el ancho de cada barra como primer parámetros y la barra se desplaza 0.5 valores del anterior.

Podemos combinar esta construcción de gráficos de barras con la biblioteca de pandas para personalizar esto más, pero lo cubriremos en una lección diferente sobre pandas.

Distribuciones con histogramas

Los histogramas a menudo se confunden con gráficos de barras. La diferencia más básica radica en su caso de uso. Los gráficos de barras se utilizan para establecer comparaciones entre los datos, mientras que los histogramas se utilizan para describir la distribución de datos.

Por ejemplo, apliquemos el ejemplo de las marcas de los estudiantes nuevamente, pero esta vez, solo veremos las marcas promedio de los estudiantes y veremos cómo se distribuyen. Aquí está el fragmento de código, muy similar al ejemplo anterior:

contenedores = [0,10,20,30,40,50,60,70,80,90,100]
AVG_Marks = [81, 77, 55, 88, 81, 66, 51, 66, 81, 92, 55, 51]
PLT.Hist (AVG_Marks, Bins, Histtype = 'Bar', rwidth = 0.8)
PLT.xlabel ('rango')
PLT.Ylabel ('Marcas')
PLT.Título ('Comparación')
PLT.espectáculo()

El histograma creado con datos de muestra anteriores se verá como lo siguiente:

El eje Y muestra aquí que cuántos estudiantes tienen las mismas marcas que se proporcionaron como datos para la construcción.

Haciendo una trama de dispersión

Cuando se trata de comparar múltiples variables y establecer su efecto entre sí, la trama de dispersión es una buena manera de presentar lo mismo. En esto, los datos se representan como puntos con valor de una variable reflejada por el eje horizontal y el valor de la segunda variable determina la posición del punto en el eje vertical.

Veamos un fragmento de código simple para describir lo mismo:

x = [1,1.5,2,2.5,3,3.5,3.6]
y = [75,8,85,9,95,10,75]
x1 = [8,8.5,9,9.5,10,10.5,11]
y1 = [3,35,3.7,4,45,5,52]
PLT.dispersión (x, y, etiqueta = '10 estudiantes de alta puntuación ', color =' r ')
PLT.dispersión (x1, y1, etiqueta = '10 estudiantes de bajo puntaje ', color =' b ')
PLT.xlabel ('Marcas')
PLT.Ylabel ('Conde de estudiantes')
PLT.Título ('Plot de dispersión')
PLT.leyenda()
PLT.espectáculo()

El diagrama de dispersión creado con datos de muestra anteriores se verá como lo siguiente:

Tramas de área

Las gráficas de área se utilizan principalmente para rastrear los cambios en los datos a lo largo del tiempo. También se denominan gráficos de pila en varios textos. Por ejemplo, si queremos establecer una representación del tiempo invertido por un estudiante para cada asignatura en un solo día, aquí está el código con el que podemos hacer lo mismo:

días = [1,2,3,4,5]
Física = [2,8,6,5,7]
Python = [5,4,6,4,1]
r = [7,9,4,3,1]
Matemáticas = [8,5,7,8,13]
PLT.plot ([], [], color = 'm', etiqueta = 'física', linewidth = 5)
PLT.plot ([], [], color = 'c', etiqueta = 'python', lineWidth = 5)
PLT.plot ([], [], color = 'r', etiqueta = 'r', lineWidth = 5)
PLT.plot ([], [], color = 'k', etiqueta = 'math', linewidth = 5)
PLT.StackPlot (Days, Physics, Python, R, Math, Colors = ['G', 'K', 'R', 'B'])
PLT.xlabel ('x')
PLT.Ylabel ('Y')
PLT.Título ('Placa de pila')
PLT.leyenda()
PLT.espectáculo()

La gráfica de área creada con datos de muestra anteriores se verá como lo siguiente:

El resultado anterior establece claramente una diferencia en el tiempo que un estudiante en cada sujeto con una forma clara de proporcionar la diferencia y la distribución.

Gráficos circulares

Cuando queremos dividir toda la parte en múltiples partes y describir la cantidad que ocupa cada parte, un gráfico circular es una buena manera de hacer esta presentación. Se utiliza para mostrar el porcentaje de datos en un conjunto de datos completo. Aquí hay un fragmento de código básico para hacer un cuadro simple:

etiquetas = 'python', 'c ++', 'ruby', 'java'
Tamaños = [225, 130, 245, 210]
colores = ['r', 'b', 'g', 'c']
explotar = (0.1, 0, 0, 0) # Explota la primera porción
# Trama
PLT.Pie (tamaños, explotar = explotar, etiquetas = etiquetas, colores = colores,
autopct = '%1.1f %% ', shadow = true, startangle = 140)
PLT.eje ('igual')
PLT.espectáculo()

El gráfico circular creado con datos de muestra anteriores se verá como lo siguiente:

En las secciones anteriores, analizamos varios componentes gráficos que podemos construir con la biblioteca Matplotlib para representar nuestros datos en varias formas y establecer diferencias de manera intuitiva al tiempo que somos estadísticos.

Características y alternativas para matplotlib

Una de las mejores características para matplotlib es que puede funcionar en muchos sistemas operativos y backends gráficos. Admite docenas de sistemas operativos y salida gráfica que vimos en esta lección. Esto significa que podemos contar con él cuando se trata de proporcionar una salida de una manera que necesitamos.

Hay varias otras bibliotecas presentes que pueden competir con matplotlib como:

  1. Seahorn
  2. Tramamente
  3. GGPLOT2

Aunque las bibliotecas mencionadas anteriormente pueden presentar algunas formas avanzadas de describir y presentar datos de manera gráfica, pero no hay negación en la simplicidad y la naturaleza efectiva de la Biblioteca Matplotlib.

Conclusión

En esta lección, observamos varios aspectos de esta biblioteca de visualización de datos que podemos usar con Python para generar gráficos hermosos e intuitivos que pueden visualizar los datos en una forma que la empresa quiere de una plataforma. Matplotlib es una de las bibliotecas de visualización más importantes cuando se trata de ingeniería de datos y datos de presentación en la mayoría de las formas visuales, definitivamente una habilidad que necesitamos tener en nuestro cinturón.

Comparta sus comentarios sobre la lección en Twitter con @Sbmaggarwal y @Linuxhint.