Tutorial de Python Plotly

Tutorial de Python Plotly
Plotly es una compañía de análisis conocida por desarrollar análisis de análisis, estadísticas y gráficos en tiempo real para aplicaciones basadas en la web y scripts independientes de Python. En esta lección, analizaremos ejemplos básicos con trama y construyen gráficos de datos simples e intuitivos de la serie temporal que serán de naturaleza 100% interactiva y, sin embargo, fácil de diseñar. Estos gráficos se pueden usar en presentaciones, ya que son completamente interactivos y listos para jugar con.

También hay una opción para guardar un diseño de gráfico fuera de línea para que puedan exportarse fácilmente. Hay muchas otras características que hacen que el uso de la biblioteca sea muy fácil:

  • Guardar gráficos para el uso fuera de línea como gráficos vectoriales que están altamente optimizados para fines de impresión y publicación
  • Los gráficos exportados están en formato JSON y no en el formato de imagen. Este JSON se puede cargar en otras herramientas de visualización como Tableau fácilmente o manipularse con Python o R
  • Como los gráficos exportados son de naturaleza JSON, es prácticamente muy fácil incrustar estos gráficos en una aplicación web
  • Plotly es una buena alternativa para matplotlib para la visualización

Para comenzar a usar el paquete tramly, necesitamos registrarnos para una cuenta en el sitio web mencionado anteriormente para obtener un nombre de usuario y una clave de API válidos con la que podemos comenzar a usar sus funcionalidades. Afortunadamente, un plan de precios gratuitos está disponible para Plotly con el que obtenemos suficientes características para hacer gráficos de grado de producción.

Instalación de trama

Solo una nota antes de comenzar, puede usar un entorno virtual para esta lección que podemos hacer con el siguiente comando:

python -m virtualenv tramly
fuente numpy/bin/activar

Una vez que el entorno virtual está activo, puede instalar la biblioteca complementaria dentro de la Env Virtual para que se puedan ejecutar ejemplos a continuación:

PIP Instalar complement

Haremos uso de Anaconda y Jupyter en esta lección. Si desea instalarlo en su máquina, mire la lección que describe "Cómo instalar Anaconda Python en Ubuntu 18.04 LTS ”y comparta sus comentarios si enfrenta algún problema. Para instalar Plotly con Anaconda, use el siguiente comando en el terminal desde Anaconda:

conda instalación -c tramly tramly

Vemos algo como esto cuando ejecutamos el comando anterior:

Una vez que todos los paquetes necesarios se instalen y se realicen, podemos comenzar a usar la biblioteca de trazado con la siguiente declaración de importación:

Importar trama

Una vez que haya hecho una cuenta en Plotly, necesitará dos cosas: el nombre de usuario de la cuenta y una clave API. Solo puede haber una clave API que pertenece a cada cuenta. Así que manténgalo en algún lugar seguro como si lo pierda, tendrá que regenerar la clave y todas las aplicaciones antiguas que usan la llave anterior dejarán de funcionar.

En todos los programas de Python que escribe, mencione las credenciales de la siguiente manera para comenzar a trabajar con Plotly:

tramamente.herramientas.set_credentials_file (username = 'username', api_key = 'your-api-key')

Comencemos con esta biblioteca ahora.

Empezando con Plotly

Haremos uso de las siguientes importaciones en nuestro programa:

importar pandas como PD
importar numpy como np
importar scipy como sp
Importar trama.Traz como Py

Hacemos uso de:

  • Pandas para leer archivos CSV de manera efectiva
  • Numpy para operaciones tabulares simples
  • SciPy para cálculos científicos
  • Capla para la visualización

Para algunos de los ejemplos, utilizaremos los propios conjuntos de datos de Plotly disponibles en GitHub. Finalmente, tenga en cuenta que también puede habilitar el modo fuera de línea para Plotly cuando necesita ejecutar scripts de trazado sin una conexión de red:

importar pandas como PD
importar numpy como np
importar scipy como sp
Importar trama
tramamente.desconectado.init_notebook_mode (conectado = true)
Importar trama.fuera de línea como py

Puede ejecutar la siguiente declaración para probar la instalación de trazado:

Imprimir (complementamente.__versión__)

Vemos algo como esto cuando ejecutamos el comando anterior:

Finalmente descargaremos el conjunto de datos con pandas y lo visualizaremos como una tabla:

Importar trama.figura_factory como FF
DF = PD.read_csv ("https: // raw.githubusercontent.com/tramly/dataSets/Master/School_
ganancias.CSV ")
tabla = ff.create_table (df)
py.iPlot (table, filename = 'table')

Vemos algo como esto cuando ejecutamos el comando anterior:

Ahora, construamos un Gráfico de barras Para visualizar los datos:

Importar trama.Graph_objs como Go
datos = [GO.Barra (x = df.Escuela, y = df.Mujer)]
py.iPlot (Data, FileName = 'Women-Bar')

Vemos algo como esto cuando ejecutamos el fragmento de código anterior:

Cuando vea el cuadro anterior con el cuaderno de Jupyter, se le presentará varias opciones de acercarse/salir a través de una sección particular de la tabla, Box & Lasso Select y mucho más.

Gráficos de barra agrupados

Múltiples gráficos de barras se pueden agrupar para fines de comparación muy fácilmente con Plotly. Hagamos uso del mismo conjunto de datos para esto y mostremos la variación de la presencia de hombres y mujeres en universidades:

Mujeres = ir.Barra (x = df.Escuela, y = df.Mujer)
Hombres = ir.Barra (x = df.Escuela, y = df.Hombres)
datos = [hombres, mujeres]
diseño = ir.Diseño (barmode = "grupo")
Fig = GO.Figura (datos = datos, diseño = diseño)
py.Iplot (fig)

Vemos algo como esto cuando ejecutamos el fragmento de código anterior:

Aunque esto se ve bien, las etiquetas en la esquina superior derecha no lo están, correctamente! Vamos a corregirlos:

Mujeres = ir.Barra (x = df.Escuela, y = df.Mujeres, nombre = "Mujeres")
Hombres = ir.Barra (x = df.Escuela, y = df.Hombres, nombre = "Hombres")

El gráfico se ve mucho más descriptivo ahora:

Intentemos cambiar el Barmode:

diseño = ir.Diseño (barMode = "relativo")
Fig = GO.Figura (datos = datos, diseño = diseño)
py.Iplot (fig)

Vemos algo como esto cuando ejecutamos el fragmento de código anterior:

Gráficos circulares con Plotly

Ahora, trataremos de construir un gráfico circular con trama que establezca una diferencia básica entre el porcentaje de mujeres en todas las universidades. El nombre de las universidades será las etiquetas y los números reales se utilizarán para calcular el porcentaje de todo. Aquí está el fragmento de código para el mismo:

traza = ir.Pie (etiquetas = DF.Escuela, valores = df.Mujer)
py.iPlot ([traza], filename = 'pastel')

Vemos algo como esto cuando ejecutamos el fragmento de código anterior:

Lo bueno es que Plotly viene con muchas características del zoom entrando y saliendo y muchas otras herramientas para interactuar con el gráfico construido.

Visualización de datos de series de tiempo con Plotly

Visualizar los datos de la serie temporal es una de las tareas más importantes que se encuentra cuando es analista de datos o ingeniero de datos.

En este ejemplo, utilizaremos un conjunto de datos separado en el mismo repositorio de GitHub que los datos anteriores no involucraban ningún datos estampados de tiempo específicamente. Como aquí, trazaremos la variación del stock de mercado de Apple con el tiempo:

Financiero = PD.read_csv ("https: // raw.githubusercontent.com/tramly/dataSets/Master/
Apple de cuadros de finanzas.CSV ")
datos = [GO.Dispersión (x = financiero.Fecha, y = financiera ['aapl.Cerca'])]
py.iPlot (datos)

Vemos algo como esto cuando ejecutamos el fragmento de código anterior:

Una vez que pase el mouse sobre la línea de variación de gráficos, puede hacer detalles específicos:

Podemos usar los botones de Zoom In -Out para ver datos específicos de cada semana también.

Gráfico OHLC

Se utiliza un gráfico OHLC (abierto bajo bajo) para mostrar la variación de una entidad en un lapso de tiempo. Esto es fácil de construir con pyplot:

desde la importación de fecha y hora de fecha y hora
Open_data = [33.0, 35.3, 33.5, 33.0, 34.1]
high_data = [33.1, 36.3, 33.6, 33.2, 34.8]
Low_data = [32.7, 32.7, 32.8, 32.6, 32.8]
Close_data = [33.0, 32.9, 33.3, 33.1, 33.1]
fechas = [DateTime (año = 2013, mes = 10, día = 10),
DateTime (año = 2013, mes = 11, día = 10),
DateTime (año = 2013, mes = 12, día = 10),
DateTime (año = 2014, mes = 1, día = 10),
DateTime (año = 2014, mes = 2, día = 10)]
traza = ir.OHLC (x = fechas,
Open = Open_data,
High = high_data,
Low = Low_Data,
Close = Close_Data)
data = [traza]
py.iPlot (datos)

Aquí, hemos proporcionado algunos puntos de datos de muestra que se pueden inferir de la siguiente manera:

  • Los datos abiertos describen la tasa de acciones cuando se abría el mercado
  • Los datos altos describen la tasa de stock más alta alcanzada durante un período de tiempo determinado
  • Los bajos datos describen la tasa de stock más baja alcanzada durante un período de tiempo determinado
  • Los datos cercanos describen la tasa de stock de cierre cuando terminó un intervalo de tiempo determinado

Ahora, ejecutemos el fragmento de código que proporcionamos anteriormente. Vemos algo como esto cuando ejecutamos el fragmento de código anterior:

Esta es una excelente comparación de cómo establecer comparaciones de tiempo de una entidad con la suya y compararla con sus logros altos y bajos.

Conclusión

En esta lección, observamos otra biblioteca de visualización, Plotly, que es una excelente alternativa a Matplotlib en aplicaciones de grado de producción que se exponen como aplicaciones web, Plotly es una biblioteca muy dinámica y rica para usar para fines de producción, por lo que definitivamente esto es una habilidad que necesitamos tener bajo nuestro cinturón.

Encuentre todo el código fuente utilizado en esta lección en GitHub. Comparta sus comentarios sobre la lección en Twitter con @Sbmaggarwal y @Linuxhint.