Pandas nueva columna basada en otra columna

Pandas nueva columna basada en otra columna
Este artículo ilustrará dos métodos que puede usar para crear una nueva columna basada en el valor de otra columna dentro de un Pandas DataFrame.

Muestra de datos de datos.

En este tutorial, usaremos un ejemplo de DataFrame de ejemplo como se muestra a continuación:

Uso de la función de aplicar pandas

La primera y más práctica forma de agregar una nueva columna basada en otra es usar la función Pandas Aplic.

Supongamos que queremos devolver la calificación de una película como porcentaje, podemos hacer:

porcentaje de DEF (x):
retorno (x / 10) * 100
df ['%_ calificación'] = DF.imdb_rating.Aplicar (porcentaje)
df

En el ejemplo anterior, definimos una función que toma la calificación actual, dividida por 10 y la multiplica por 100.

Luego creamos una nueva columna llamada '%_rating' y pasamos la función definida por el usuario como un parámetro al Aplicar () función.

Esto debería devolver el nuevo DataFrame como se muestra:

Uso de la operación en términos de elementos

También podemos crear una nueva columna utilizando una operación de elemento en lugar de la función Aplicar.

Un ejemplo se ilustra a continuación:

df ['%_ calificación'] = (df ['imdb_rating'] / 10) * 100
df

El código anterior debería devolver:

Conclusión

Este artículo ilustra dos métodos principales para crear una nueva columna basada en un valor de otra columna en Pandas.