Marco marítimo de datos de datos

Marco marítimo de datos de datos
“Searborn ayuda en la exploración y comprensión de los datos. Sus funciones de gráfico funcionan con marcos de datos y matrices que contienen conjuntos de datos completos, realizando la agregación estadística requerida y el mapeo semántico internamente para crear gráficos útiles. Las asociaciones estadísticas se pueden ver con la ayuda de Seaborn. El análisis estadístico se utiliza para descubrir cómo los parámetros en un conjunto de datos se relacionan entre sí y cómo esa conexión está influenciada por otras variables. Este análisis estadístico ayuda a la visualización de las tendencias, así como la identificación de varias características en el conjunto de datos.

Por defecto, Pandas DataFrame se usa para cargar el conjunto de datos. Este marco de datos es utilizado por cualquier función Pandas DataFrame. Los marcos de datos son cuadrículas rectangulares que contienen datos y permiten una fácil visualización de los datos. Cada columna del patrón de cuadrícula es un vector que mantiene datos para una sola variable, y cada fila de la cuadrícula tiene valores de una instancia. Esto significa que los valores en las filas de un marco de datos no tienen que ser del mismo tipo de datos; Pueden ser aritméticos, texto, lógicos o cualquier otra cosa. Los marcos de datos son contenedores de datos anotados bidimensionales con diversos tipos de columnas que vienen empaquetadas con el módulo Pandas para Python.

La biblioteca en Seaborn incluye algunos conjuntos de datos clave. Los conjuntos de datos se cargan automáticamente después de que se instala Seborn. El conjunto de datos necesario se puede cargar con la ayuda de la función posterior.

load_dataSet ()

Esta función le brinda acceso rápido a un número limitado de conjuntos de datos de muestras que puede usar para documentar SeaBorn o crear ejemplos repetibles para informes de errores. El uso normal no lo requiere."

Ejemplo 1

En nuestro primer ejemplo, estamos utilizando la trama de caja para imaginar los registros. Tenemos módulos marinos y matplotlib para trazar la gráfica de línea. Luego, una variable se declara como datos, y dentro de esa variable, se llama a la carga marítima_dataSet. El load_dataSet toma el marco de datos de las puntas, que está presente de forma predeterminada en Python. Ahora, podemos llamar a cualquiera de las columnas desde el conjunto de datos Titanic para la representación de la trama. El diagrama de cuadros toma X como argumento al que hemos establecido la columna Total_bill del conjunto de datos de muestra Titanic.

Importar Sevorn como SNS
Importar matplotlib.Pyplot como PLT
datos = SNS.load_dataSet ("consejos")
SNS.Boxplot (datos ['Total_bill'])
PLT.espectáculo()

El plan de cuadro de cuadro de datos Titanic se visualiza en la siguiente figura.

Ejemplo 2

Podemos trazar el marco de datos con cualquiera de las parcelas marinas. En este ejemplo, tenemos una parcela de violín para hacer la trama de marco de datos marinos. Una trama de caja y una parcela de violín son comparables. Compara las distribuciones de numerosos puntos de datos cuantitativos entre uno o más factores de categoría.

Como estamos utilizando la función SeaBorn Load_dataset, por lo que necesitamos importar el módulo de Python Seborn, y para la gráfica, tenemos un módulo matplotlib. Allí diseñamos el fondo de la trama a una cuadrícula oscura. Luego, la función load_dataSet se llama, donde nuevamente, hemos utilizado los consejos de conjunto de datos de muestra.

De los consejos de conjunto de datos de muestra, estamos tomando dos columnas, Total_bill y Time, para los ejes x e y de la gráfica. Para usar estas columnas para la parcela, tenemos una parcela de violín marginal aquí que toma la X como Total_bill para el eje e y como tiempo para el eje Y. Estas columnas especificadas se comparan entre sí en la gráfica.

Importar Sevorn como SNS
Importar matplotlib.Pyplot como PLT
SNS.set (style = 'Darkgrid')
DF = SNS.load_dataSet ("consejos")
SNS.ViolInplot (x = "total_bill", y = "tiempo", data = df)
PLT.espectáculo()

El marco de datos se visualiza en la siguiente figura.

Ejemplo 3

Aquí, hemos mostrado el diagrama de marco de datos con el gráfico de puntos. Una gráfica de puntos puede indicar la estimación con intervalos de confianza mediante el uso de gráficos de gráficos de dispersión. El punto determina una importancia estadística estimada para un punto de datos basado en la ubicación del punto de la gráfica de dispersión e incluye barras de error para indicar el nivel de incertidumbre.

En el siguiente script, hemos establecido el estilo de la cuadrícula oscura para el fondo de la trama. Luego, tenemos una función load_dataset, esta vez tenemos un conjunto de datos de iris para generar el gráfico. Hemos pasado las columnas sepal_length y sepal_width al parámetro x e y para el gráfico de puntos.

gimport mar
Importar matplotlib.Pyplot como PLT
marino.set (style = 'Whitegrid')
Datos = marina.load_dataset ("iris")
marino.PointPlot (x = "sepal_length", y = "sepal_width", data = data)
PLT.espectáculo()

La gráfica de puntos del Iris del conjunto de datos se muestra de la siguiente manera:

Ejemplo 4

El marco de datos de pandas bidimensional es apropiado para la estructura estadística con ejes etiquetados que pueden variar y es de tamaño-mutable (filas y columnas). Para crear el marco de datos del panda, las longitudes de todas las matrices deben ser iguales. Si se define un índice, debe tener la misma longitud que las matrices. Si no se establece un índice en el rango (n), entonces, por defecto, se usa la n, que es la longitud de la matriz.

En el fragmento de código determinado, hemos importado el módulo de panda, y luego hemos llamado al constructor de marcos de datos de Pandas, donde las dos matrices se especifican como List1 y List2. Tenemos una colección de números aleatorios en una matriz de igual longitud. Para hacer el gráfico de los datos anteriores, tenemos una trama KDE. Muestra la densidad de probabilidad de una variable continua en varios niveles. También podemos crear un gráfico separado para varias muestras, lo que facilita la visualización de datos. Se llama a la propiedad de datos con los campos que tiene dentro de DataFrame.

Importar matplotlib.Pyplot como PLT
Importar Sevorn como SNS
importación de pandas
datos = pandas.DataFrame ("List1": [23, 30, 14, 15, 20],
"List2": [19, 20, 16, 26, 11])
SNS.KDePlot (Data ['list1'], data ['list2'])
PLT.espectáculo()

La gráfica KDE muestra la comparación del marco de datos de Pandas dentro de la figura.

Conclusión

Ahora, tiene un breve artículo de marco de datos de la trama marginal aquí. Podemos crear el marco de datos por nosotros mismos con el marco de datos del panda. Los marcos de datos en los pandas son conjuntos de datos de lectores fuertes que debe usar para obtener una comprensión más profunda de su información. También podemos utilizar los marcos de datos de muestras marinos incorporadas utilizando la función load_dataset. Este marco de datos se puede trazar con cada gráfica de martes, como hemos demostrado los numerosos ejemplos que trazan los marcos de datos.