Tutorial de Python Seaborn

Tutorial de Python Seaborn
En esta lección sobre la biblioteca de Python Seborn, analizaremos varios aspectos de esta biblioteca de visualización de datos que podemos usar con Python para generar gráficos hermosos e intuitivos que pueden visualizar los datos en una forma que el negocio quiere de una plataforma. Para completar esta lección, cubriremos las siguientes secciones:
  • ¿Qué es Python Seaborn??
  • Tipos de parcelas que podemos construir con Seaborn
  • Trabajando con múltiples tramas
  • Algunas alternativas para Python Seaborn

Esto parece mucho para cubrir. Empecemos ahora.

¿Qué es la biblioteca de Python Seborn??

Seaborn Library es un paquete de Python que nos permite hacer infografías basadas en datos estadísticos. Como se hace en la parte superior de Matplotlib, por lo que es inherentemente compatible con él. Además, admite la estructura de datos Numpy y Pandas para que el trazado se pueda hacer directamente a partir de esas colecciones.

Visualizar datos complejos es una de las cosas más importantes que Seed se encarga. Si tuviéramos que comparar matplotlib con marítimo, Seborn puede facilitar las cosas que son difíciles de lograr con matplotlib. Sin embargo, es importante tener en cuenta que Seborn no es una alternativa a Matplotlib, sino un complemento de la misma. A lo largo de esta lección, también utilizaremos las funciones de matplotlib en los fragmentos de código. Seleccionará trabajar con Seaborn en los siguientes casos de uso:

  • Tiene datos estadísticos de series de tiempo para ser trazados con la representación de la incertidumbre en torno a las estimaciones
  • Establecer visualmente la diferencia entre dos subconjuntos de datos
  • Para visualizar las distribuciones univariadas y bivariadas
  • Agregar mucho más afecto visual a los gráficos de matplotlib con muchos temas incorporados
  • Para ajustar y visualizar modelos de aprendizaje automático a través de regresión lineal con variables independientes y dependientes

Solo una nota antes de comenzar es que usamos un entorno virtual para esta lección que hicimos con el siguiente comando:

python -m virtualenv mar
Fuente Seaborn/Bin/Activar

Una vez que el entorno virtual está activo, podemos instalar la biblioteca marítima dentro de la Env Virtual para que se puedan ejecutar ejemplos a continuación:

PIP Instalar Seborn

Puede usar Anaconda también para ejecutar estos ejemplos que son más fáciles. Si desea instalarlo en su máquina, mire la lección que describe "Cómo instalar Anaconda Python en Ubuntu 18.04 LTS ”y comparta sus comentarios. Ahora, avancemos a varios tipos de parcelas que se pueden construir con Python Seborn.

Usando el conjunto de datos de Pokemon

Para mantener esta lección práctica, utilizaremos el conjunto de datos de Pokémon que se puede descargar desde Kaggle. Para importar este conjunto de datos a nuestro programa, utilizaremos la biblioteca Pandas. Aquí están todas las importaciones que realizamos en nuestro programa:

importar pandas como PD
de matplotlib import pyplot como plt
Importar Sevorn como SNS

Ahora, podemos importar el conjunto de datos a nuestro programa y mostrar algunos de los datos de muestra con pandas como:

DF = PD.read_csv ('Pokemon.CSV ', index_col = 0)
df.cabeza()

Tenga en cuenta que para ejecutar el fragmento de código anterior, el conjunto de datos CSV debe estar presente en el mismo directorio que el programa en sí mismo. Una vez que ejecutemos el fragmento de código anterior, veremos la siguiente salida (en el cuaderno de Anaconda Jupyter):

Trazar la curva de regresión lineal

Una de las mejores cosas de Seaborn son las funciones inteligentes de trazado que proporciona que no solo visualiza el conjunto de datos que le proporcionamos, sino que también construyen modelos de regresión a su alrededor. Por ejemplo, es posible construir un gráfico de regresión lineal con una sola línea de código. Aquí está cómo hacer esto:

SNS.LMPLOT (x = 'Attack', y = 'Defense', Data = DF)

Una vez que ejecutemos el fragmento de código anterior, veremos la siguiente salida:

Notamos algunas cosas importantes en el fragmento de código anterior:

  • Hay una función de trazado dedicada disponible en Seaborn
  • Utilizamos la función de ajuste y trazado de Seaborn que nos proporcionó una línea de regresión lineal que se modeló

No tengas miedo si pensabas que no podemos tener una trama sin esa línea de regresión. Podemos ! Probemos un nuevo fragmento de código ahora, similar al último:

SNS.LMPLOT (x = 'Attack', y = 'Defense', Data = DF, FIT_REG = FALSE)

Esta vez, no veremos la línea de regresión en nuestra trama:

Ahora esto es mucho más claro (si no necesitamos la línea de regresión lineal). Pero esto no ha terminado todavía. SeaBorn nos permite hacer diferentes esta trama y eso es lo que haremos.

Construcción de gráficos de caja

Una de las características más grandes en Seaborn es cómo acepta fácilmente la estructura de los marcos de datos de Pandas para trazar los datos. Simplemente podemos pasar un marco de datos a la biblioteca Seaborn para que pueda construir un diagrama de caja:

SNS.Boxplot (datos = DF)

Una vez que ejecutemos el fragmento de código anterior, veremos la siguiente salida:

Podemos eliminar la primera lectura del total, ya que se ve un poco incómodo cuando en realidad estamos tramando columnas individuales aquí:

stats_df = df.Drop (['total'], eje = 1)
# Nuevo Plotón de caja usando STATS_DF
SNS.Boxplot (data = stats_df)

Una vez que ejecutemos el fragmento de código anterior, veremos la siguiente salida:

Parcela de enjambre con marítimo

Podemos construir una trama de enjambre de diseño intuitivo con marítimo. Volveremos a usar el marco de datos de los pandas que cargamos anteriormente, pero esta vez, llamaremos a la función de show de matplotlib para mostrar la trama que hicimos. Aquí está el fragmento de código:

SNS.set_context ("papel")
SNS.swarmplot (x = "ataque", y = "defensa", data = df)
PLT.espectáculo()

Una vez que ejecutemos el fragmento de código anterior, veremos la siguiente salida:

Mediante el uso de un contexto marino, permitimos que Seorn agregue un toque personal y un diseño de fluido para la trama. Es posible personalizar esta trama aún más con el tamaño de fuente personalizado utilizado para las etiquetas en la trama para facilitar la lectura. Para hacer esto, pasaremos más parámetros a la función set_context que funciona como lo que suenan. Por ejemplo, para modificar el tamaño de fuente de las etiquetas, haremos uso de fuentes.parámetro de tamaño. Aquí está el fragmento de código para hacer la modificación:

SNS.set_context ("papel", font_scale = 3, rc = "fuente.tamaño ": 8," Axes.etiqueta ": 5)
SNS.swarmplot (x = "ataque", y = "defensa", data = df)
PLT.espectáculo()

Una vez que ejecutemos el fragmento de código anterior, veremos la siguiente salida:

El tamaño de fuente para la etiqueta se cambió en función de los parámetros que proporcionamos y el valor asociado a la fuente.parámetro de tamaño. Una cosa en la que Seaborn es experto en hacer que la trama sea muy intuitiva para el uso práctico y esto significa que Seaborn no es solo un paquete de práctica de Python, sino algo que podemos usar en nuestras implementaciones de producción.

Agregar un título a las tramas

Es fácil agregar títulos a nuestras tramas. Solo necesitamos seguir un procedimiento simple de usar las funciones de nivel de ejes donde llamaremos al set_title () Funcionar como mostramos en el fragmento de código aquí:

SNS.set_context ("papel", font_scale = 3, rc = "fuente.tamaño ": 8," Axes.etiqueta ": 5)
my_plot = sns.swarmplot (x = "ataque", y = "defensa", data = df)
my_plot.set_title ("gráfico de enjambres de LH")
PLT.espectáculo()

Una vez que ejecutemos el fragmento de código anterior, veremos la siguiente salida:

De esta manera, podemos agregar mucha más información a nuestras tramas.

Seaborn vs matplotlib

Mientras observamos los ejemplos en esta lección, podemos identificar que Matplotlib y Seaborn no se pueden comparar directamente, pero pueden verse como complementados entre sí. Una de las características que lleva a Seaborn 1 paso adelante es la forma en que Seaborn puede visualizar los datos estadísticamente.

Para hacer lo mejor de los parámetros marinos, recomendamos ver la documentación marina y descubrir qué parámetros usar para hacer que su trama sea lo más cerca posible de las necesidades comerciales.

Conclusión

En esta lección, observamos varios aspectos de esta biblioteca de visualización de datos que podemos usar con Python para generar gráficos hermosos e intuitivos que pueden visualizar los datos en una forma que la empresa quiere de una plataforma. El Seaborm es una de las bibliotecas de visualización más importantes cuando se trata de ingeniería de datos y datos de presentación en la mayoría de las formas visuales, definitivamente una habilidad que necesitamos tener en nuestro cinturón, ya que nos permite construir modelos de regresión lineal.

Comparta sus comentarios sobre la lección en Twitter con @Sbmaggarwal y @Linuxhint.