Transformación de pandas

Transformación de pandas
“Python Pandas nos proporciona una técnica relativamente simple si necesitamos transformar nuestro marco o serie de datos. El método "transform ()" de pandas es un método integral que utiliza una función para generar un nuevo marco de datos por sí solo, cambiando cada elemento presente en el marco de datos original mientras mantiene la longitud y el índice de la misma manera. "FUNC" es el parámetro de designación de funciones del método "transform ()". Utilizamos "func" con condiciones lambda para transformar el marco de datos. El método "lambda ()" se aplica para incluir otras funciones."

La sintaxis para el método Python Pandas Transform ()

Ejemplo 1: Uso del método Pandas Transform () agregando 1 a cada Elemento de DataFrame

En esta demostración, utilizaremos el método "transform ()" y el parámetro "función" para agregar "1" a cada elemento de DataFrame. El método "Transform ()" se utiliza principalmente para cambiar el marco de datos mediante la autoproducción de cambios en los elementos de DataFrame. Cuando un método se ejecuta en sí mismo utilizando la función "transform ()", un marco de datos con valores transformados y la misma longitud del eje que se produce el yo.

Comenzando con la primera ilustración del artículo. Utilizamos la herramienta "Spyder" para implementar el código. Debemos importar primero la biblioteca de pandas. Para crear DataFrame, actualmente estamos usando "PD.marco de datos". El DataFrame de "DF" contiene cuatro columnas. Las letras "M", "N", "O" y "P" son los nombres de la columna. Algunos valores han sido enumerados para estas columnas. Tenemos los valores "1", "2", "3", "4" y "5" en la columna "M". Los números "6", "7", "8", "9" y "10" están en la columna "n", mientras que los números "11", "12", "13", "14" y "15" están en la tercera columna "O" Además, tenemos "16", "17", "18", "19" y "20" para la columna final, "P". El cuadro de datos ahora se está imprimiendo utilizando la función "print ()".

Lo siguiente que vamos a hacer es usar el parámetro "func" con la función "transform ()". DataFrame se transforma esencialmente por el parámetro "FUNC". Como puede ver, "lambda" también se usa en el método transform () utilizando el parámetro "func". Pequeñas funciones sin nombre se conocen como Lambdas. Solo puede tener una expresión pero puede tener un número ilimitado de entradas. Aquí, usamos Lambda para expresar la condición, que es "A+1", agregando "1" a cada valor en las columnas del DataFrame. Supongamos que "A" representa cada elemento en el marco de datos y que la condición es "A+1", que se aplicará uno por uno a cada elemento que presente las columnas de DataFrames. Después de esto, estamos mostrando la declaración "Transformado DataFrame" y el DataFrame en la pantalla utilizando la función "Impresa ()".

Hay dos marcos de datos visibles en esta pantalla de salida de salida, como se puede ver. Se realiza la transformación del marco de datos. La transformación de datos de datos muestra que cada elemento en el marco de datos ha recibido "1", como se puede ver mirando todos los elementos. La primera columna en el primer marco de datos tiene el primer valor "1", y cuando agrega "1" más, el resultado es "2", como puede observar. El valor de la primera columna en la transformación de datos de datos es "2", y en consecuencia, todos estos fueron agregados. DataFrame tiene un tamaño de índice de "5", que varía de "0 a 4".

Ejemplo 2: restando cada elemento del DataFrame utilizando el método Transform ()

Este ejemplo es idéntico al primero, pero en este caso, se cambia la condición de la función Lambda. En este caso, vamos a restar "1" de cada elemento presente en un marco de datos individualmente utilizando el método "transform ()".

Primero debemos importar la biblioteca de panda como "PD" antes de que se ejecute este código. La creación de un marco de datos "DF" es la siguiente etapa. Hay cuatro columnas en este marco de datos "primero", "segundo", "tercero" y "cuarto". Hemos dado a estas columnas algunos valores. Tenemos los números "3", "4", "5" y "9" para la columna "Primera". La columna "Segunda" tiene los números "2", "7", "8", "15 y" 10 "en ella. La columna "Tercera" contiene los números "19", "11", "13", "12" y "18" y la columna "Cuarta" contiene los números "22", "29", "34", "24 "y" 22 ". Ahora, creamos este marco de datos usando "PD.DataFrame ", y también usamos la función" print () "para mostrarla en la pantalla.

En este momento, estamos utilizando el método "transform ()" con su parámetro "func", y dentro de él, estamos aplicando una condición utilizando la función "lambda ()". La condición es "A-1", lo que significa que restará "1" de cada valor de los datos en las columnas y luego mostrará los valores como otro marco de datos, a los que nos referimos como un marco de datos transformado. Por lo tanto, utilizando el método "print ()", mostraremos este marco de datos transformado.

Ahora echemos un vistazo a nuestra pantalla de salida, donde se ven dos marcos de datos. El valor inicial en la columna "Primera" de nuestro primer cuadro de datos es "3", y el último en la cuarta columna es "22", sin embargo, si usamos la función de transformación con la condición lambda, que es la resta de 1, nosotros, nosotros Observará que todos los valores en el marco de datos transformado, que es el segundo marco de datos, se restan con éxito. Dado que el primer y el último valores han cambiado a "2" y "21", respectivamente, todos los demás valores entre ellos también se han restado y cambiado.

Ejemplo 3: Dividir cada miembro de marco de datos por dos utilizando una condición lambda y el método transform ()

En este ejemplo, usaremos "transform ()" para dividir cada número en todas las columnas. Estamos utilizando el parámetro "func" del método transform () con una condición lambda. Usando la función "lambda ()" en pandas, se nos permite "agregar", "restar", "dividir", "multiplicar" y realizar otras operaciones matemáticas.

Ahora estamos creando nuestro DataFrame "DF" después de importar Pandas como "PD". Aquí, tenemos cuatro columnas como en el ejemplo anterior "W", "X", "Y" y "Z". Además, estas columnas se presentan con algunos valores. La primera columna representa los valores "4", "8", "16", "20" y "6", mientras que la segunda columna contiene los valores "2", "12", "8", "14", y "10", mientras que la tercera columna contiene los valores "8", "2", "19", "20" y "22" y en la columna final, tenemos los valores "26", "28", "34", "24" y "22". Inicialmente, estamos creando este marco de datos con "PD.DataFrame "y mostrarlo en la pantalla con la función" print () ".

Actualmente estamos utilizando el método principal de nuestro programa, "Transform ()" para dividir cada uno de los números en columnas. Por lo tanto, aplicamos la condición de lambda "A/2" al parámetro "func" que es igual a lambda. Por lo tanto, "A" describe cada valor presente en el marco de datos. Dividirá cada uno de los números presentes en columnas una por una. El marco de datos transformado se mostró en la pantalla.

Actualmente, el primer marco de datos que produjimos, indicando sus valores, se puede ver en la parte superior de la pantalla de salida, y si observamos el segundo marco de datos, todos sus valores se han transformado. La operación de división se implementa de manera efectiva, como lo demuestra el hecho de que el primer valor en el marco de datos transformado ahora es "2" en lugar del valor inicial de DataFrame de "4", lo que daría como resultado una respuesta de "2" si dividimos " 4 por 2 ". Como se puede ver, otros valores también están divididos y transformados.

Conclusión

En este artículo, aplicamos el método "transform ()" con su parámetro "func" para transformar el marco de datos utilizando condiciones "lambda". Podemos ver que cambiar cada elemento de DataFrame ahora es bastante fácil. En este artículo, utilizamos las tres operaciones matemáticas, suma, resta y división con los parámetros "func" y lambda para actualizar los valores del marco de datos. Anticipamos que este artículo nos ayudará a completar la tarea transformada de nuestro panda.