Método de información de pandas

Método de información de pandas
"El módulo Pandas de Python se utiliza para modificar los conjuntos de datos. Ofrece herramientas para la investigación de datos, el filtrado, el procesamiento y la manipulación. La excelente comunidad de información de Python Python Packages lo convierte en un lenguaje efectivo para realizar análisis de datos. Una de esas herramientas, Pandas, simplifica enormemente el proceso de importación y análisis de datos. Usando la función info (), puede resumir rápidamente un marco de datos. Este método muestra detalles sobre un marco de datos, como sus valores no nulos, la utilización de la memoria y los tipos de datos de índice y columna para imprimir el resumen completo. Solo imprime los datos contenidos en el marco de datos proporcionado y no devuelve el valor. Al realizar un estudio exploratorio de la información es útil. Utilizamos el marco de datos.Función info () para adquirir rápidamente un resumen del conjunto de datos."

Sintaxis para el método Pandas Info ()

Vamos a discutir brevemente los parámetros utilizados aquí:

Verboso: La aplicación de esta propiedad permite al usuario elegir si explica todo el informe

BUF: Tampoco es obligatorio. Determina dónde se debe enviar otra salida. Pase el búfer reritable si desea modificar la salida más.

Uso de memoria: Indica si se debe mostrar el uso general de la memoria de los elementos del marco de datos, incluido el índice. Por defecto, esto se adhiere al valor para los pandas. opción.Display_memory El uso siempre muestra el uso de la memoria como "verdadero". Nunca mostrar el uso de memoria es "falso".

Max_col: Cuándo usar la salida acortada en lugar de la salida detallada. La salida truncada se utiliza si el cuadro de datos contiene más columnas que el límite de COLS MAX. Visualización de opciones del panda.El valor de columnas max _info_ se utiliza de forma predeterminada.

NULL_COUNTS: Sirve para indicar si mostrar o no recuentos nulos.

Ejemplo # 1: Muestre el resumen del marco de datos utilizando el método de información con el valor detallado

Hablaremos sobre Python Pandas DataFrame.método info () en esta demostración. Para adquirir un informe de DataFrame, utilizamos este método. Esta función muestra información sobre un conjunto de datos, como el tipo de índice y las columnas, los valores no nulos y el consumo de memoria, cuando se invoca a un marcado de datos. Ahora hablemos del ejemplo. Hemos usado tres columnas en este ejemplo; "Integers", "personajes" y "Valores de flotación". Hay cuatro números enteros en columnas "Integer", "7", "8", "9" y "10". Hemos seleccionado cuatro valores para el personaje "adición", "resta", "multiplicación" y "división". En la columna, tenemos "valor flotante" tiene estos valores "1.1 "," 1.2 "," 1.3 "y" 1.4 ".

Después de eso, pasamos esta lista de valores para generar un marco de datos empleando el "PD.Método de marco de datos "proporcionado por el módulo de Panda para construir el marco de datos. Hemos asignado nuevas etiquetas a esta lista "entero" como "int", "personaje" como "char" y "float_values" como "float"; Estas etiquetas serán títulos de columna de nuestro marco de datos de salida. Se muestra una declaración "Descripción del marco de datos" utilizando la función "print ()".

Luego llegamos a la función principal del programa, que es el método de marco de datos "info ()". El marco de datos.La función de información se utiliza para obtener una descripción general simple de la trama de datos. "DF.info () ”se está utilizando aquí para proporcionar una descripción general del código. En este caso, el parámetro que hemos pasado a esta función es "textual". Este parámetro tiene dos valores posibles; "verdadero o falso". "Verbose = true" utilizado aquí significa mostrar la información completa del marco de datos. Uso de memoria de visualización "verdadero". Por lo tanto, estamos usando el "DF.función de información (verbose = true) ”, que imprime toda la información del marco de datos.

Como se muestra en el resultado, muestra un resumen de código; Primero, nos informa de la clase, que es "Pandas.centro.marco.DataFrame "", luego muestra que el rango de índice que tenemos en este ejemplo es "4", lo que significa que la información que ingresamos en este código se indexa de 0 a 3; por lo tanto, hay entradas de 0 a 3 en total. Las "columnas de datos" a continuación indican que hay tres columnas. La primera columna enumera los nombres de la columna, la segunda columna enumera el recuento no nulo y la tercera columna enumera los tipos de datos para los datos que hemos ingresado. Al final, menciona que los tipos de datos que tenemos son "Float64 (1)", "int64 (1)" y "objeto (1)", y esto usa 224.0+ bytes de memoria.

Ejemplo # 2: Mostrando el resumen aplicando el método info () con valor detallado falso

Declarando nuestro segundo ejemplo importando el módulo de panda. En este procedimiento, se crea un marco de datos con tres columnas. Su primera columna se refiere al "entero", el segundo como el "carácter" y el tercero como los "valores de flotación". Tenemos tres valores en la columna "entero", que son "4", "5" y "6" y en la columna "personajes", tenemos tres variables "A", "B" y "C" y para la columna "Valores flotantes", tenemos "2.2 "," 1.2 "y" 3.3 ". Dado que el tamaño del índice es "3", significa que tenemos entradas de "0" a "2."

En este ejemplo, el método "info ()" se utiliza para obtener un informe rápido de Dataframes sin mostrar el uso de la memoria. El uso de verdadero o falso en verbose es indicar si la información completa es o no es opcional. El marco de datos ahora se mostrará usando "PD. marco de datos".

Entonces, usando la función "print ()", estamos mostrando la declaración "detalle" en el siguiente paso. Luego imprimemos la función "DF.info (verbose = false) ". El uso de esta función nos proporcionará una descripción general concisa del código. En lugar de imprimir todo el marco de datos y describir su contenido, este método se utilizó para explicar el código de manera concisa. Ahora usando DF.info (verbose = false) "Simplemente mostrará el" detalle "y lo describirá.

La salida muestra que el "detalle" es bastante conciso y claro. Dado que usamos "verbose = true" en el ejemplo anterior, se mostraron todo el resumen y el marco de datos del código; Sin embargo, usamos verbose = falso en esto, por lo que mostró un resumen muy corto. En "Detalle" primero, muestra la "clase", que es "Pandas.centro.marco.marco de datos".

El "rango de índice" se muestra en la siguiente línea, que es "3" que indica que el rango de entradas es de "0 a 2", luego indica el número de la columna en la que hay tres columnas entonces; Quizás se presentan los tipos de datos de los datos que tenemos en el marco de datos. "Float64 (1)", "int64 (1)", "int64 (1)" y el objeto (1) son los tipos de datos.

Un objeto no es un tipo de datos, pero aquí se usa para el carácter. La siguiente línea muestra el uso de la memoria, que muestra la cantidad de almacenamiento que es gratuita en su sistema, además de la cantidad de memoria, todos los programas abiertos, incluidos Windows. El tamaño para el uso de la memoria es "200.0+ bytes) ".

Conclusión

Hablamos sobre la función Info () en este artículo. La función de información de Pandas describe el marco de datos. Si resumamos brevemente el artículo en el primer ejemplo, crearíamos un marco de datos en el que tomamos tres columnas "Integers", "Carácter" y "Float_Values". Tenemos algunos valores en estas columnas. Tenemos un índice con cuatro entradas, que van desde "0 a 3". Usando el "DF.información.(verbose = true) ”La función mostrará a fondo el resumen completo del marco de datos. Un marco de datos con algunas columnas es lo que tenemos en el segundo ejemplo. Tiene tres entradas en nuestro índice, numeradas "0 a 2". La función "DF.información.(verbose = false) "mostrará una breve descripción del código. Este artículo puede hacer que sea más simple para que comprenda el método de información de panda ().