Pandas aplicar lambda

Pandas aplicar lambda
"Pandas" es una biblioteca de programación bien conocida para el análisis y la manipulación de datos. Es una biblioteca de código abierto. "Pandas" nos da la flexibilidad para agregar nuevas funciones según sea necesario, incluidas las funciones de clasificación y lambda. Podemos agregar fácilmente la función "lambda" a la columna y la fila en el marco de datos de "pandas". Pequeñas funciones con una sola expresión se conocen como lambdas. Las funciones de Lambda también pueden funcionar de manera sin nombre como funciones anónimas. Estos son útiles cuando necesitamos escribir menos código para operaciones rápidas y simples. Podemos insertar esta función colocando la palabra clave "lambda" en nuestro código "pandas". Presentamos esta guía para ayudarlo a aprender el concepto de la función "lambda" en "pandas".

Sintaxis

Argumentos de Lambda: expresión

Ejemplo # 01

Estamos utilizando la aplicación "Spyder" para crear los códigos, que se dan en esta guía. Dado que estamos haciendo código "pandas", debemos importar la biblioteca "pandas" y la importamos "como PD". Esto nos ayudará a proporcionar las funciones de "pandas" en nuestro código cuando utilizamos la palabra clave "PD". Aquí, generamos un diccionario "marcas" y agregamos datos como "Rao, James, 455" en la primera fila. A continuación, "William, Elvish, 250" se agrega en la segunda fila. El "Samuel, John, 495" está en la tercera fila, luego "Smith, Micheal, 400", "Robert, Alvis, 350", y también "Rick, Leo, 450" están allí en el cuarto, quinto y sexto hilera.

Ahora, estamos convirtiendo el diccionario "Marcas" en el marco de datos "Resultado" y también ajustando el nombre del encabezado aquí utilizando el método "columnas". Los nombres de los encabezados que establecemos aquí son "Nombre, Padre_Name y Total_Marks". Estos nombres se establecen aquí como los nombres de encabezado del marco de datos "Resultado". Ahora, representamos el marco de datos "resultado". No aplicamos el método "lambda" todavía. Debajo de esto, nos estamos moviendo para aplicar este método "lambda" para usar la función "lambda".

Aquí, aplicamos esta función a solo la columna "Total_Marks" colocando esta función "lambda" en el método "asignar ()". Utilizamos esta función para encontrar el "porcentaje" de los estudiantes, que agregamos a DataFrame. Utilizamos la función "lambda" y colocamos la fórmula para obtener el "porcentaje". La función "lambda" está aquí dentro del método "asigne ()", y establecemos la columna Total_Marks dividida por "500" y multiplicada por "100". Se creará la columna de "porcentaje", y todos los porcentajes de los estudiantes aparecerán en esa columna. Mostramos la marca de datos "Final_Result" utilizando la siguiente función "print ()":

Estamos presionando "Shift + Enter" para obtener la salida. En el primer cuadro de datos, no hay columna para el porcentaje de los estudiantes. Aplicamos el "lambda" y calculamos el porcentaje de los estudiantes y los mostramos en la columna "porcentaje".

Ejemplo # 02

Este es también el código "pandas". Así que nuevamente importamos los "Pandas como PD" aquí. Luego cree una lista aquí con el nombre "Nested_List" y agregue datos numéricos. Insertamos "15, 2.5, 100, 12 "en la primera lista y" 20, 4.5, 50, 15 "en el siguiente. Luego, en la tercera lista, insertamos "25, 5.2, 80, 19 "," 45, 5.8, 48, 37 "en la cuarta lista. La quinta lista contiene "40, 6.3, 70, 24 ", y la sexta lista contiene" 41, 6.4, 90, 55 ". En la última lista, agregamos "51, 2.3, 111, 19 ". Cambiamos esta lista anidada en DataFrame ajustando sus nombres de encabezado de columna como "column_1, column_2, column_3 y column_4" y lo representan. Ahora, estamos aplicando el método "lambda" y calculando la suma de todos los valores. Este valor de suma se almacenará en la columna "suma", que se crea aquí y se agrega al marco de datos anterior. Presentamos la función de datos "New_Data" utilizando la función "print ()" a continuación:

No hay una columna para la suma de valores en el primer marco de datos. Agrega "15, 2.5, 100, 12 ", y la suma se muestra al final de la fila en la nueva columna" suma ". La suma del valor de cada fila se determina utilizando el "lambda" y se muestra en la columna "suma" por separado para cada fila.

Ejemplo # 03

Necesitamos importar dos bibliotecas en este código. Una de ellas es la biblioteca "Pandas", y la segunda es la biblioteca "Numpy". Luego creamos e inicializamos la lista anidada aquí. Insertamos datos en el formulario numérico aquí y luego alteramos esta lista anidada en el marco de datos y los almacenamos en una nueva variable, "my_dataframe". El nombre del encabezado para este marco de datos es "data1, data2 y data3" y agrega los valores del índice como "A1, A2, A3, A4, A5 y A6".

Presentamos este marco de datos y luego aplicamos el método Lambda aquí en el que insertamos el "NP. Función Square ”. Esta función está presente en la biblioteca "Numpy", y la tenemos aquí colocando el "NP". Calculamos el cuadrado de "A2" colocando "A2" en este método. Y también, establezca su "eje = 1". Luego imprimimos el DataFrame nuevamente utilizando "print ()".

Aquí, todos los valores de ambos marcos de datos son los mismos, pero los valores de la fila "A2" son diferentes, porque en el segundo marco de datos, encuentra el cuadrado de la fila "A2" y el cuadrado de números se representan aquí:

Ejemplo # 04

Aquí, el código del ejemplo 3 se usa una vez más, y lo cambiamos un poco. En este código, estamos aplicando la misma función cuadrada a varias filas. Utilizamos el método "lambda" y colocamos el "np. Función Square ”. En esta función, insertamos cuatro valores de índice, que son "A1, A3, A5, A7". Esta función cuadrada se aplicará a valores de cuatro filas y luego imprimirá este marco de datos actualizado.

En el segundo marco de datos, los valores de las filas "A1, A3, A5, A7" son los valores actualizados del primer cuadro de datos, y es el cuadrado de esos valores que están presentes en el primer marco de datos en "A1, A3, A5, Las filas A7 ”se representan en el segundo marco de datos.

Ejemplo # 05

Ahora, pase al último ejemplo de esta guía. Inicie este ejemplo importando bibliotecas "Pandas" y "Numpy". Después de importar ambas bibliotecas, generamos una lista anidada a continuación con el nombre "raw_list" y agregamos los datos numéricos a esta lista anidada. Cambiamos esta lista en DataFrame y agregamos los nombres de los encabezados de la columna, que son "A_01, A_02, A_03 y A_04", y los valores de índice, que son "11, 12, 13, 14, 15 y 16" ".

Ahora, aplicamos "lambda" y agregamos la función cuadrada de "numpy" a las filas "12, 14". Después de esto, nuevamente utilizamos "Lambda" para calcular el "producto" de todas las filas, y también en la próxima "lambda", calculamos la "suma" de todas las filas y también almacenamos el producto y suma en el "producto", y columna "suma", que hemos creado aquí. Ahora, representamos el nuevo marco de datos en el que están presentes el cuadrado de dos filas y la suma y el producto. Este nuevo marco de datos, incluido todo esto, se representa utilizando la "impresión ()".

Aquí, puede ver que en DataFrame de datos actualizado, que está presente debajo del primer marcado de datos, la fila "12 y 14" muestra el cuadrado de los valores presentes en el primer DataFrame, y también hay dos nuevas columnas en las que están presentes la "suma de la" suma "Y el" producto "de las filas se muestran por separado.

Conclusión

Puede usar esta guía para aprender cómo usar el "Aplicar Lambda" en "Pandas" porque explica cómo hacerlo. Nuestro objetivo principal es explicar a fondo la noción del método de "lambda" que es clara, simple y profunda. Con la ayuda de la función "lambda", hemos demostrado cómo aplicar la función "lambda" en "pandas" en cinco escenarios diferentes. Estará en un nivel moderado de experiencia después de completar la lectura de esta guía, desde la cual puede ir a niveles más altos.