asignación de pandas

asignación de pandas
Usando la función asignar () en pandas, puede agregar nuevos segmentos a un marco de datos mientras restaura un duplicado del elemento original. Las secciones recién asignadas reemplazarán las existentes. Uno de los paquetes que hacen que la recopilación e investigación de la información sea más accesible es Pandas. Seleccionamos un trabajo cambiante, determinamos los criterios bajo los cuales se deben aplicar cada una de estas modificaciones y luego lo pasamos a las diversas funciones asignadas. Cuando hay dos argumentos, el tipo objetivo es el que nos dice qué tipo debemos intentar. Con una excepción, discutiremos en un segundo, esto naturalmente será lo mismo que el tipo inicial.

Cómo usar la función asignar () en pandas

Para usar la función asignar () en pandas, primero tenemos que entender su sintaxis.

Sintaxis: Marco de datos.asignar (** argumentos de palabras clave, self)

Dónde,

Argumentos de palabras clave: Los nombres de la columna y las frases de captura sirven como argumentos de palabras clave. Si se pueden llamar a las cualidades, DataFrame las procesa y las asigna a las nuevas columnas de DataFrame. A pesar de que los pandas no lo verifican, el llamable no puede cambiar el marcado de datos de entrada. Si las propiedades, como la serie o los clústeres, no son llamables. En cierto sentido, están asignados. Se puede utilizar un diccionario de cadenas o listas como argumentos de palabras clave.

ser: Devuelve un marco de datos completamente nuevo con columnas que se han agregado a las existentes como una salida.

Ahora podemos entender cómo funciona la función de asignación de pandas (). En cualquier caso, no podemos reducir significativamente el tamaño de nuestro marco de datos porque el número completo de 64 bytes ocupa la misma cantidad de espacio que 64 bytes de cuerdas o valores de puntos flotantes, al igual que cómo 100 libras de ladrillos pesan igual como 100 libras de bloques. Simplificamos el proceso de desanimar a esos segmentos. Tenemos increíblemente pocas características aquí, por lo que si creamos una capacidad que toma un subconjunto de un subconjunto de columna e intenta determinarlo a la forma más pequeña que puede tomar, debería ser capaz de operar. Los siguientes ejemplos lo ayudarán mejor a comprenderlo.

Ejemplo 1: Uso de la función asignar () en pandas

La temperatura se calculará en este ejemplo utilizando el método asignar (). Mientras que el módulo Numpy funciona principalmente con datos numéricos, el módulo pandas funciona principalmente con datos tabulares. Después de importar los módulos, crearemos un marco de datos en el que podemos aplicar la función asignar ().

La función Lambda tiene el mismo potencial para comportarse como una función estándar que se especifica utilizando la palabra clave DEF de Python. Podemos ver nuestro marco de datos utilizando la función print () y pasar el nombre de nuestro marco de datos después de aplicar la función asignar (), I, i.mi., "DF_Assign" como argumento en la función print (). También puede ilustrarlo simplemente escribiendo el nombre del marco de datos.

Numpy se importa después de los pandas en el script mencionado anteriormente. Luego se registran las temperaturas de los dos países a medida que generamos el Índice de DataFrame y DataFrame para ellos. Finalmente, utilizamos el método asignar () para calcular las temperaturas utilizando la ecuación proporcionada por el programa. Cuando asignamos la función de impresión, la variable DF, que representa el marco de datos, calcula la ecuación matemática e imprime la salida previamente vista. La función asignar () calibra la ecuación, que considera variables. Para convertir de grados Fahrenheit a grados Celsius, se agrega 32 a los valores de esta variable "A" junto con Lambda. Luego, el comando completa esta ecuación y genera los resultados.

Ejemplo 2: nueva creación de variables y una asignación constante

Antes de ejecutar cualquiera de estos ejemplos, debe importar pandas y hacer el marco de datos necesario.

Llamamos a nuestro DataFrame "S-Data". Este marco de datos incluye variables para ventas y gastos y datos simulados para ventas para cada individuo. Podemos agregar algunas variables adicionales desde aquí usando el método asignar ().

Si todas las personas en este conjunto de datos son empleadas por el mismo negocio o empresa, supongamos que está trabajando con esa información. A diferencia de "s_data", que solo contiene datos de empleados que trabajan para la misma compañía, otros marcos de datos pueden tener registros para vendedores que trabajan para varias empresas. ¿Qué pasaría si quisiéramos hacer una variable para las personas en este marco de datos que contenía el nombre de su empresa?? Con la función asignar (), podemos lograr lo siguiente:

Agregamos una nueva variable llamada "negocio" en este caso. El valor de la variable comercial es el mismo para cada fila de datos. Dice "hardware" como el valor. Técnicamente hablando, el valor es el mismo para cada fila. Es un valor de cadena, para ser más preciso. Habiendo declarado que, al crear variables con valores constantes, con datos o valor numéricos continuos, podemos asignar una nueva variable además de agregar valores textuales como en este ejemplo.

Ejemplo 3: Agregue una variable de valor calculado con el método asigne ()

Usaremos el mismo marco de datos "s_data" en este ejemplo. Para ser más precisos, agregaremos "ganancias" como una nueva variable, las ventas iguales menos costos (los expertos en finanzas y contabilidad sabrán que este no es un método exacto para calcular el beneficio; sin embargo, usaremos este cálculo sesgado como ejemplo.).

Usando este código, obtendremos la siguiente salida:

En este caso, agregamos una nueva columna calculada llamada "Beneficio". Las ganancias, como se puede ver, es solo las ventas restando los gastos. Sin embargo, recuerde que debemos usar los nombres "S_data.ventas "y" s_data.gastos ”para referirse a las variables de ventas y gastos dentro de asignación (). También podríamos referirnos a ellos como "s_data ['gastos']" y "s_data ['ventas']". Puede elegir cualquiera, pero para este ejemplo, se utilizará el previamente que se muestra.

Ejemplo 4: Agregar múltiples columnas usando la función asignar ()

Agregaremos dos variables simultáneamente en este ejemplo. Se agregarán las variables de "negocio" y "ganancias". Usaremos el mismo marco de datos de los ejemplos anteriores 2 y 3, i.mi., s_data.

Las variables "ganancias" y "negocios" se agregan simultáneamente en este ejemplo. Verá que comenzamos una nueva línea de código para la segunda variable en términos de sintaxis. Puede mantener todo su código en una sola línea si lo desea, aunque no lo sugiero particularmente. La sobrescritura directa de sus datos originales es otra opción.

Simplemente ejecute el método de asignación y envíe los resultados al marco de datos "S_DATA" especificado en el nombre original de DataFrame. En ciertas situaciones, hacer esto es completamente apropiado. De vez en cuando puede reemplazar sus datos por completo.

Conclusión

Resumiremos diciendo que la función asigna () en pandas nos permite realizar varias tareas a medida que creamos una referencia de palabras de los nombres de la sección. En este tutorial, implementamos diferentes ejemplos para enseñarle cómo usar la función asignar (), cómo agregar una nueva columna con valor o datos constantes, cómo agregar una columna con valores calculados y cómo agregar múltiples columnas en un marco de datos de datos Usando la función asignar ().