Caso de pandas cuando

Caso de pandas cuando

En este tutorial, realizaremos diferentes operaciones utilizando declaraciones de casos y declaraciones IF-Else. Una declaración de caso permite comparar el valor de una variable con un rango de valores potenciales. Cuando el conjunto de valores se menciona o se pasa en la declaración de caso, cada valor dentro del conjunto se verifica por los casos o condiciones dentro de la declaración.

La instrucción de caso en Pandas DataFrame proporciona una salida o devuelve un valor si se cumple la condición.

Escenario 1: Use Numpy.donde () como caso cuando

En este escenario, verificaremos cada condición el valor y, si se cumple la condición, generará la salida o devolveremos el valor en la condición. Necesitamos importar el módulo Numpy. De lo contrario, se lanza una excepción del módulo.

Aquí, Numpy.donde () acepta la condición como el primer parámetro. Si la condición es verdadera, entonces el valor especificado en el segundo parámetro se asigna a la fila. Si la condición falla, entonces se asigna el valor/condición especificado como el tercer parámetro. De esta manera, podemos implementar la instrucción de caso en Pandas DataFrame.

Sintaxis

DataFrame_Object ['columna'] = numpy.donde (condición 1, 'valor',
numpy.donde (condición 2, 'valor',

numpy.donde (condición n, 'valor', 'valor')))

Ejemplo 1

Creemos el marcado de datos de Pandas con nombre puntaje que contiene una columna llamada "Calificación" con 5 valores numéricos. Luego, cree una nueva columna llamada "Grado" y especifique los valores para cada fila en función de la condición especificada dentro de Numpy.dónde cláusula.

Si la calificación es menor o igual a 50, asigne la calificación como "D". De lo contrario, asigne la calificación como "A".

# Importar el DataFrame desde el módulo pandas
Desde Pandas Import DataFrame
# Importar el módulo Numpy
importar numpy
# Considere el marco de datos que contiene 5 filas en la columna - "Calificación"
Score = DataFrame ('Calificación': [25,50,100,56,89])
#Frame de datos real
Impresión (puntaje)
# Especifique las condiciones y almacene el valor en la nueva columna - "Grado".
puntaje ['grado'] = numpy.donde (puntaje ['calificación']<=50,"D","A")
Impresión (puntaje)

Producción

Clasificación
0 25
1 50
2 100
3 56
4 89
Calificación
0 25 D
1 50 D
2 100 A
3 56 A
4 89 A

Explicación

Según la salida, dos clasificaciones son inferiores o iguales a 50. Entonces "D" se asigna como grado para estas dos filas. Para las filas restantes, se asigna "A".

Ejemplo 2

Creemos el marcado de datos de Pandas con nombre puntaje que contiene una columna llamada "Calificación" con 5 valores numéricos. Luego, cree una nueva columna llamada "Grado" y especifique los valores para cada fila en función de las condiciones especificadas dentro de Numpy.dónde cláusula.

  1. Si la calificación es menor o igual a 25, asigne la calificación como "D".
  2. Si la calificación es menor o igual a 50, asigne la calificación como "C".
  3. Si la calificación es menor o igual a 75, asigne la calificación como "B".
  4. De lo contrario, se asigna la calificación "A".
# Importar el DataFrame desde el módulo pandas
Desde Pandas Import DataFrame
# Importar el módulo Numpy
importar numpy
# Considere el marco de datos que contiene 5 filas en la columna - "Calificación"
Score = DataFrame ('Calificación': [25,50,100,75,90])
#Frame de datos real
Impresión (puntaje)
# Especifique las condiciones y almacene el valor en la nueva columna - "Grado".
puntaje ['grado'] = numpy.donde (puntaje ['calificación']<=25,"D",
numpy.donde (puntaje ['calificación']<=50,"C",
numpy.donde (puntaje ['calificación']<=75,"B","A")))
Impresión (puntaje)

Producción

Clasificación
0 25
1 50
2 100
3 75
4 90
Calificación
0 25 D
1 50 C
2 100 A
3 75 B
4 90 A

Explicación

Según la salida,

  1. Hay una calificación que es menor o igual a 25. Entonces se asigna la calificación "D".
  2. Hay una calificación que es menor o igual a 50. Entonces se asigna la calificación "C".
  3. Hay una calificación que es menor o igual a 75. Entonces se asigna la calificación "B".
  4. Las dos filas restantes fueron asignadas de grado "A".

Escenario 2: use aplicar () como caso cuando

Como sabemos, Lambda toma una expresión condicional de tal manera que podamos incluir una declaración if-else como expresión condicional. Si la condición resulta como verdadera, entonces Value1 se coloca en las filas que coinciden con la condición. Si la condición falla, entonces Value2 se coloca en las filas que fallan en la condición. Es importante comprender que la expresión de lambda se pasa como un parámetro a la función Aplicar (). Por lo tanto, es necesario usar la función Apply (), que sigue el nombre de la columna del objeto DataFrame.

Sintaxis

DataFrame_Object ['nueva columna'] = dataFrame_Object ['peso'].Aplicar (Lambda X: Value1 si la condición más value2)

Aquí:

  1. Podemos especificar la condición utilizando el operador de relación.
  2. La nueva columna es el nombre de la columna.
  3. Necesitamos pasar una expresión de lambda dentro de la función Apply () que tomará la condición como parámetro. Según la condición, Value1 se coloca en la fila que coincide con la condición. De lo contrario, se coloca value2.

Ejemplo 1

Creemos el marcado de datos de Pandas con nombre animales_ número que sostienen una columna llamada "peso" con 6 valores numéricos y crean una nueva columna y establece el valor en 'sí' donde el peso es mayor que 75 y establece valor - 'no' donde el peso es inferior a 75.

# Importar el DataFrame desde el módulo pandas
Desde Pandas Import DataFrame
# Considere el marco de datos que contiene 6 filas en la columna - "peso"
animales_number = dataFrame ('peso': [10,23,90,45,78,104])
#Frame de datos real
Imprimir (Animals_number)
# Crear una nueva columna y establecer el valor en 'sí' donde el peso es mayor que 75.
# y establezca el valor - 'no' donde el peso es inferior a 75.
Animals_number ['peso animal mayor que 75'] = animales_number ['peso'].Aplicar (lambda x: 'sí' si x> 75 else 'no')
Imprimir (Animals_number)

Producción:

peso
0 10
1 23
2 90
3 45
4 78
5 104
peso de peso animal mayor que 75
0 10 No
1 23 No
2 90 Sí
3 45 No
4 78 Sí
5 104 Sí

Explicación

Según la salida, hay tres valores en la columna de peso que son inferiores a 75. En la columna "Peso animal mayor de 75", se coloca 'No', y para los valores restantes 'sí' se coloca.

Ejemplo 2

Creemos el marcado de datos de Pandas con nombre animales que sostiene una columna llamada "Nombre" con 6 valores y crea una nueva columna llamada "Tipo" y establece el valor en 'Wild' donde el nombre es igual a 'Tiger' y el resto de las filas a 'Doméstico'.

# Importar el DataFrame desde el módulo pandas
Desde Pandas Import DataFrame
# Considere el marco de datos que contiene 6 filas en la columna - "Nombre"
animales = dataFrame ('name': ['tiger', 'burro', 'vaca', 'ciervo', 'camello', 'caballo'])
#Frame de datos real
Impresión (animales)
# Crear una nueva columna con nombre de tipo y establecer el valor en 'Wild' donde el nombre es 'Tiger' y
# Establezca el valor en 'doméstico' donde el valor no es igual al 'tigre'.
Animales ['tipo'] = animales ['nombre'].Aplicar (lambda x: 'salvaje' si x == 'tigre' más 'doméstico')
Impresión (animales)

Producción:

nombre
0 tigre
1 burro
2 vaca
3 ciervos
4 camello
5 caballos
tipo de nombre
0 tigre salvaje
1 burro doméstico
2 vacas domésticas
3 ciervos domésticos
4 Camel Doméstico
5 caballos domésticos

Explicación

Según la salida, solo hay un valor en la columna de nombre, que es igual a 'tigre'. Entonces, en la columna de "tipo", se coloca 'salvaje', y para los valores restantes, 'doméstico' se coloca ya que no son iguales al 'tigre'.

Conclusión:

En este artículo, cuando se cumple la condición, una declaración de este tipo, llamada declaración de caso, devuelve un valor. Hemos visto cómo puede crear una declaración de caso para realizar una operación o tarea requerida. En este tutorial, hemos usado el NP.donde () función y la función aplicar () para crear declaraciones de casos. Implementamos algunos ejemplos para enseñarle cómo usar las declaraciones de casos PANDAS utilizando la función Where () y cómo usar la función Aplicar () para crear declaraciones de casos.