Por defecto, Pandas DataFrame se usa para cargar el conjunto de datos. Este marco de datos es utilizado por cualquier función Pandas DataFrame. Los marcos de datos son cuadrículas rectangulares que contienen datos y permiten una fácil visualización de los datos. Cada columna del patrón de cuadrícula es un vector que mantiene datos para una sola variable, y cada fila de la cuadrícula tiene valores de una instancia. Esto significa que los valores en las filas de un marco de datos no tienen que ser del mismo tipo de datos; Pueden ser aritméticos, texto, lógicos o cualquier otra cosa. Los marcos de datos son contenedores de datos anotados bidimensionales con diversos tipos de columnas que vienen empaquetadas con el módulo Pandas para Python.
La biblioteca en Seaborn incluye algunos conjuntos de datos clave. Los conjuntos de datos se cargan automáticamente después de que se instala Seborn. El conjunto de datos necesario se puede cargar con la ayuda de la función posterior.
load_dataSet ()Esta función le brinda acceso rápido a un número limitado de conjuntos de datos de muestras que puede usar para documentar SeaBorn o crear ejemplos repetibles para informes de errores. El uso normal no lo requiere."
Ejemplo 1
En nuestro primer ejemplo, estamos utilizando la trama de caja para imaginar los registros. Tenemos módulos marinos y matplotlib para trazar la gráfica de línea. Luego, una variable se declara como datos, y dentro de esa variable, se llama a la carga marítima_dataSet. El load_dataSet toma el marco de datos de las puntas, que está presente de forma predeterminada en Python. Ahora, podemos llamar a cualquiera de las columnas desde el conjunto de datos Titanic para la representación de la trama. El diagrama de cuadros toma X como argumento al que hemos establecido la columna Total_bill del conjunto de datos de muestra Titanic.
Importar Sevorn como SNSEl plan de cuadro de cuadro de datos Titanic se visualiza en la siguiente figura.
Ejemplo 2
Podemos trazar el marco de datos con cualquiera de las parcelas marinas. En este ejemplo, tenemos una parcela de violín para hacer la trama de marco de datos marinos. Una trama de caja y una parcela de violín son comparables. Compara las distribuciones de numerosos puntos de datos cuantitativos entre uno o más factores de categoría.
Como estamos utilizando la función SeaBorn Load_dataset, por lo que necesitamos importar el módulo de Python Seborn, y para la gráfica, tenemos un módulo matplotlib. Allí diseñamos el fondo de la trama a una cuadrícula oscura. Luego, la función load_dataSet se llama, donde nuevamente, hemos utilizado los consejos de conjunto de datos de muestra.
De los consejos de conjunto de datos de muestra, estamos tomando dos columnas, Total_bill y Time, para los ejes x e y de la gráfica. Para usar estas columnas para la parcela, tenemos una parcela de violín marginal aquí que toma la X como Total_bill para el eje e y como tiempo para el eje Y. Estas columnas especificadas se comparan entre sí en la gráfica.
Importar Sevorn como SNSEl marco de datos se visualiza en la siguiente figura.
Ejemplo 3
Aquí, hemos mostrado el diagrama de marco de datos con el gráfico de puntos. Una gráfica de puntos puede indicar la estimación con intervalos de confianza mediante el uso de gráficos de gráficos de dispersión. El punto determina una importancia estadística estimada para un punto de datos basado en la ubicación del punto de la gráfica de dispersión e incluye barras de error para indicar el nivel de incertidumbre.
En el siguiente script, hemos establecido el estilo de la cuadrícula oscura para el fondo de la trama. Luego, tenemos una función load_dataset, esta vez tenemos un conjunto de datos de iris para generar el gráfico. Hemos pasado las columnas sepal_length y sepal_width al parámetro x e y para el gráfico de puntos.
gimport marLa gráfica de puntos del Iris del conjunto de datos se muestra de la siguiente manera:
Ejemplo 4
El marco de datos de pandas bidimensional es apropiado para la estructura estadística con ejes etiquetados que pueden variar y es de tamaño-mutable (filas y columnas). Para crear el marco de datos del panda, las longitudes de todas las matrices deben ser iguales. Si se define un índice, debe tener la misma longitud que las matrices. Si no se establece un índice en el rango (n), entonces, por defecto, se usa la n, que es la longitud de la matriz.
En el fragmento de código determinado, hemos importado el módulo de panda, y luego hemos llamado al constructor de marcos de datos de Pandas, donde las dos matrices se especifican como List1 y List2. Tenemos una colección de números aleatorios en una matriz de igual longitud. Para hacer el gráfico de los datos anteriores, tenemos una trama KDE. Muestra la densidad de probabilidad de una variable continua en varios niveles. También podemos crear un gráfico separado para varias muestras, lo que facilita la visualización de datos. Se llama a la propiedad de datos con los campos que tiene dentro de DataFrame.
Importar matplotlib.Pyplot como PLTLa gráfica KDE muestra la comparación del marco de datos de Pandas dentro de la figura.
Conclusión
Ahora, tiene un breve artículo de marco de datos de la trama marginal aquí. Podemos crear el marco de datos por nosotros mismos con el marco de datos del panda. Los marcos de datos en los pandas son conjuntos de datos de lectores fuertes que debe usar para obtener una comprensión más profunda de su información. También podemos utilizar los marcos de datos de muestras marinos incorporadas utilizando la función load_dataset. Este marco de datos se puede trazar con cada gráfica de martes, como hemos demostrado los numerosos ejemplos que trazan los marcos de datos.