Pandas derretido

Pandas derretido
Un panda es un marco estadístico apropiado para Python. Antes de la invención de los pandas, la mayor parte de los investigadores usó Python para asaltar información y preparación antes de cambiar a un dialecto más especial, como "R", para el equilibrio de su proceso. Las series ofrecidas de Pandas, que proporcionan un diseño de clasificación, y Dataframes, que tiene un diseño tabulado. Estos dos nuevos tipos de objetos son para almacenar información que facilita las operaciones analíticas y elimina la necesidad de transferir herramientas. La función Pandas "Melt ()" se usa para describir un objeto DataFrame que se produce de manera específica con una o más columnas que actúan como cambio de identificadores en el formato del conjunto de datos de extenso a largo. Simplemente dos columnas son configurables y valores, mientras que las otras columnas se consideran valores y no se invivan al eje de fila. Cuando Python admite datos explicativos, utiliza esta función.

Las columnas de DataFrame, cada una de las cuales puede contener un entero, un número de punto flotante o una cadena, se representan a nivel de columna porque contiene numerosos índices, por lo tanto, es predeterminado a considerar el no valor. En consecuencia, derretimos la información utilizando este nivel de columna. El nombre de la variable es una representación del nombre de variable específico que se utiliza para derretir columnas. Este adaptable típicamente comprende un valor escalar y tiene el valor predeterminado de Non porque usa la variable utilizada en esa columna específica para derretir el marcado de datos.

La sintaxis para la función fle ()

"Value_vars" son representaciones de las columnas no pavimentadas existentes. La mayoría de las columnas se devuelven y no se establecen como "id_var" si los nombres de la columna no están indicados. Se puede usar una lista de tuple o ndarray como parámetros de valor. Todas las secciones que se utilizan como variables de identificación están representadas por la variable "ID_VARS". El marco de datos que debe asignarse en pandas se debe indicar con el marco.

Ejemplo # 1: Usando la función de fusión, puede pasar varias columnas como parámetro Value_Vars

Usando pandas en Python, podemos reestructurar los datos en una forma más amigable para la computadora para simplificar el procesamiento de datos de la tabla. La función imperativa "fundir ()" requiere ser ejecutada. Un marco de datos no se da viva desde la versión grande al formato habitual utilizando "Pandas.derretir()". Inicialmente, creamos nuestro marco de datos. DataFrame se utiliza para almacenar información en un formato bidimensional. Es idéntico a una tabla en que los datos se almacenan en filas y columnas. Los registros están representados por filas y las características están representadas por columnas.

En este caso, el nombre de nuestro marco de datos es "D1" que tiene tres columnas. "Nombre" es la primera columna en nuestro marco de datos y además se incluye una lista de algunos nombres: "Thomas", "Lily" y "Henry". La segunda columna que tenemos es "edad" que contiene "25", "29" y "31". Y en la tercera columna, "profesión", tenemos "ingeniero", "médico" y "contador". Usando "PD.DataFrame ”. Mostraremos DataFrame en la pantalla.

Ahora, agregemos la función "Melt ()" a nuestra aplicación. Se utilizaron los parámetros de "Melt ()" de la función "ID VAR" y "Valor VAR". Para usar una columna o columnas como variables de identificador, use "ID _VAR" y el "Value_var", que es el segundo parámetro utilizado en este ejemplo para definir dónde se derritiría y almacenará el contenido en las líneas adicionales. Aquí, usamos un "int_var" en una sola columna y un "value_var" en numerosas columnas. Usamos "value_var" en las columnas "edad" y "profesión" y "id_var" en la columna "nombre". "PD.Melt "se utiliza para generar DataFrame y" Imprimir (DF_MELTET) "mostrará el DataFrame en la pantalla.

Se ven dos marcos de datos en la imagen de salida del programa. Usando el "PD.DataFrame "Función, generamos el primer cuadro de datos en el que tenemos tres columnas" Nombre "," Age "y" Profesión ". Aplicando los parámetros "id_var" y "valor _var" al "PD.Método Melt () ", se genera el segundo marco de datos. "ID_VAR" se aplica en una sola columna que es "Nombre". Significa que la columna se mostrará exactamente como está con sus valores y el "value_var" se usa en dos columnas "edad" y "profesión". Crea dos columnas en DataFrame, una es "variable" y la otra es "valor" en la columna de valor, el nombre de la columna se muestra.

Una herramienta crucial que elige filas y columnas de datos específicas de un marco de datos se denomina índice de pandas. Su trabajo es configurar los datos para el acceso rápido y la organización. También se describe como un subgrupo. El valor individual del índice se conoce como etiqueta y los valores se escriben en negrita en el índice. El tamaño del índice de DataFrame inicial es "3", que varía de "0 a 1", y cuando se aplican los parámetros, el tamaño del índice es "6" que varía de "0 a 5".

Ejemplo 2: Usando la función de fusión, puede pasar varias columnas como parámetro int_vars

Vea lo que sucede cuando especifica más de una columna para la opción ID_VARS. Similar al último ejemplo, este se aplica "ID_VAR" a varias columnas, mientras que "value_var" se aplica a una sola columna. En el programa anterior, "value_var" se aplicó a varias columnas, mientras que "id_var" se aplicó a una sola columna.

Lo primero que hacemos es construir un marco de datos de tres columnas. El nombre de la columna es "nombre", "marcas" y "sujeto". Los nombres que están en la primera columna son "Ava", "Isla" y "Leo". En la segunda columna, tenemos la lista de marcas "45", "22" y "31". Para la tercera columna, tenemos el nombre del sujeto que incluye "Gestión", "OOP" y "Java". Ahora, "PD.DataFrame "generará DataFrame y" Imprimir (DF) "mostrará el DataFrame en la pantalla.

Incorporemos ahora el método "Melt ()" en nuestro código. Se utilizaron los argumentos "id_var" y "valor _var" de la función "fundir ()". El "id_var" se usa en dos columnas. "Nombre" y "Marcas" y "Value_var se usa en una columna" Asunto ". Para crear el nuevo marco de datos utilizando la información del antiguo marcado de datos, use "PD.derretir". Ahora, DataFrame se mostrará en la pantalla por "Imprimir (DF derretido)".

El resultado de la función "fusel ()" con sus dos argumentos que son "id_var" y "value_var" se muestra en la salida. Al aplicar "id_var" en las dos columnas "nombre" y "marcas", mostrará sus valores tal como es y como aplicamos "value_var" a la columna "sujeto". Luego, se divide en estas dos columnas "variable" y "valor". En la columna "variable", muestra el nombre de la columna "sujeto" y en la columna "valor" muestra los valores de la columna "sujeto". El índice es "3" en magnitud, que varía de "0 a 2".

Conclusión

El método "fle ()" en pandas es una forma versátil de modificar el marco de datos de pandas. Aprendimos a utilizar la función de Pandas 'Melt () para convertir un gran marco de datos en un marco de datos largo y sencillo utilizando un caso de uso directo. Debe reestructurar constantemente una sección de las piezas en nuestro material mientras mantiene al menos un segmento en su lugar como indicadores. La función "Melt ()" en Pandas es una herramienta fantástica para modificar los datos. Si administra una gran cantidad de información económica y relacionada con el dinero y la requiere en una forma más larga de bases de datos, es especialmente útil.