Pandas para verificar el valor de la celda es nan

Pandas para verificar el valor de la celda es nan
La documentación principal de los pandas es decir que los valores nulos son los valores faltantes. Podemos denotar los valores faltantes o nulos como nan en los pandas como lo hacen la mayoría de los desarrolladores. Los desarrolladores usan las palabras clave NAN y NINGNO para mostrar los valores faltantes en DataFrame. Lo mejor en los pandas es que trata tanto a Nan como a ninguno de manera similar. Para verificar el valor faltante de una celda, Pandas.Notnull devolverá falso en ambos casos de Nan y ninguno si la celda tiene Nan o ninguno.

Entonces, en este artículo, exploraremos diferentes métodos para verificar si un valor de celda en particular es nulo o no (nan o ninguno).

Los diferentes métodos que vamos a discutir son:

  1. es nulo
  2. Isnan
  3. isna
  4. no nulo

Discutamos cada método en detalle.

Método 1: Usando la función isnull

En este método, utilizaremos un método muy fácil llamado isnull () para averiguar si la celda en particular tiene un valor nan.

# Python Isnull.py
importar pandas como PD
importar numpy como np
data = 'x': [1, 2, 3, 4, 5, np.nan, 6, 7, np.nan, 8, 9, 10, np.yaya],
'Y': [11, 12, NP.nan, 13, 14, np.nan, 15, 16, np.nan, np.nan, 17, np.nan, 19]
DF = PD.DataFrame (datos)
Imprimir (DF)
nan_in_df = df.isnull (df.Iloc [5, 0])
Imprimir (nan_in_df)

Producción: Python isnull.py

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 nan nan
6 6.0 15.0
7 7.0 16.0
8 nan nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 nan 19.0
Verdadero

Línea 3 a 4: importamos los pandas de la biblioteca y numpy.

Línea 6: Creamos un diccionario con teclas X e Y y sus valores con algunos NP.yaya.

Línea 8 a 10: Convertimos el diccionario en DataFrame y luego imprimimos ese marcador de datos que podemos ver en la salida anterior.

Línea 12 a 13: Llamamos al método DataFrame IsNull y verificamos el valor de DataFrame de células particulares [5, 0] es nulo o no. En este caso, no estamos verificando todo el marco de datos y el valor de marco de datos de una sola célula. Entonces le da a la salida verdadera, que se muestra en la salida anterior. El primer valor 5 [5, 0] que representa la posición del índice, y el otro valor, 0, representa el nombre del índice de la columna.

Método 2: Uso del método ISNAN ()

En el ejemplo anterior, verificamos el valor de NAN utilizando el método ISNULL del DataFrame. Ahora vamos a usar otro método llamado isnan. Este método pertenece al Numpy y no al marco de datos. El siguiente programa es para lo que verifica solo la celda en particular.

# También podemos verificar el valor de nan de celda en DataFrame
data = 'x': [1, 2, 3, 4, 5, np.nan, 6, 7, np.nan, 8, 9, 10, np.yaya],
'Y': [11, 12, NP.nan, 13, 14, np.nan, 15, 16, np.nan, np.nan, 17, np.nan, 19]
DF = PD.DataFrame (datos)
Imprimir (DF)
valor = df.en [5, 'x'] # nan
isnan = np.isnan (valor)
Imprimir ("===============")
imprimir ("es valor en df [5, 'x'] nan:", isnan)

Producción:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 nan nan
6 6.0 15.0
7 7.0 16.0
8 nan nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 nan 19.0
===============
Es valor en df [5, 'x'] nan: verdadero

Línea 2: Creamos un diccionario con teclas X e Y y sus valores con algunos NP.yaya.

Línea 4 y 5: Convertimos el diccionario en DataFrame y luego imprimimos ese marcador de datos que podemos ver en la salida anterior.

Línea 6: Filtramos el valor de celda particular usando el índice y el nombre de la columna [5, 'x'] y asignamos ese valor al valor variable. El primer valor 5 que representa la posición del índice, y 'x' representa el nombre de la columna.

Línea 7: Estamos comprobando si el valor es nan o no.

Línea 9: Finalmente imprimimos nuestra salida, lo que muestra que el valor tiene nan es verdadero.

Método 3: Valor de nan celular en una serie usando isnan

Verificamos el ejemplo anterior el valor de NAN en un marco de datos de celda. También podemos verificar el interior de la serie Pandas si algún valor de celda es nan o no. Así que veamos cómo podemos implementar eso.

# También podemos verificar el valor de nan de celda en la serie DataFrame
serie_df = PD.Serie ([2, 3, NP.nan, 7, 25])
Imprimir (Series_DF)
valor = serie_df [2] # nan
isnan = np.isnan (valor)
Imprimir ("===============")
imprimir ("es valor en df [2] nan:", isnan)

Producción:

0 2.0
1 3.0
2 nan
3 7.0
4 25.0
dtype: float64
===============
Es valor en df [2] nan: verdadero

Línea 3: Creamos la serie Pandas.

Línea 6: Asignamos el valor de la celda que queremos verificar a otra variable.

Línea 7: Estamos revisando el valor en esa variable es nan o no.

Método 4: Usando pandas.isna

Otro método que podemos usar es verificar si un valor de celda de marcado de datos particular es nulo o no usa los pandas.Método ISNA.

data = 'x': [1,2,3,4,5, NP.nan, 6,7, np.nan, 8,9,10, np.yaya],
'Y': [11,12, NP.nan, 13,14, np.nan, 15,16, np.nan, np.nan, 17, np.nan, 19]
DF = PD.DataFrame (datos)
Imprimir (DF)
Imprima ("Valor NAN en la celda [5, 0]")
pd.isna (df.Iloc [5,0])

Producción:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 nan nan
6 6.0 15.0
7 7.0 16.0
8 nan nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 nan 19.0
Comprobación del valor de NAN en la celda [5, 0]
Verdadero

Línea 1: Creamos un diccionario con teclas X e Y y sus valores con algunos NP.yaya.

Línea 3 a 5: Convertimos el diccionario en DataFrame y luego imprimimos ese marcador de datos que podemos ver en la salida anterior.

Línea 8: Verificamos si el valor del celular [5, 0] es Nan o no. El primer valor 5, que representa la posición del índice, y 0 representa el nombre de la columna. Finalmente imprimimos nuestra salida que muestra que el valor tiene NAN es cierto.

Método 5: Usando pandas.Método NotNull

Otro método a través del cual podemos verificar el valor de celda particular es NAN o no usar el método NotNull. En este método, si el valor de la celda es nan o falta, devolverá un falso booleano, como se muestra en el programa a continuación.

data = 'x': [1,2,3,4,5, NP.nan, 6,7, np.nan, 8,9,10, np.yaya],
'Y': [11,12, NP.nan, 13,14, np.nan, 15,16, np.nan, np.nan, 17, np.nan, 19]
DF = PD.DataFrame (datos)
Imprimir (DF)
Imprima ("Valor NAN en la celda [5, 0]")
pd.nonull (df.Iloc [5,0])

Producción:

x y
0 1.0 11.0
1 2.0 12.0
2 3.0 nan
3 4.0 13.0
4 5.0 14.0
5 nan nan
6 6.0 15.0
7 7.0 16.0
8 nan nan
9 8.0 nan
10 9.0 17.0
11 10.0 nan
12 nan 19.0
Comprobación del valor de NAN en la celda [5, 0]
FALSO

Línea 1: Creamos un diccionario con teclas X e Y y sus valores con algunos NP.yaya.

Línea 3 a 5: Convertimos el diccionario en DataFrame y luego imprimimos ese marcador de datos que podemos ver en la salida anterior.

Línea 8: Estamos comprobando si el valor de la celda [5, 0] no es nan. El primer valor 5, que representa la posición del índice, y 0 representa el nombre de la columna. Finalmente imprimimos nuestra salida, lo que muestra que el valor tiene nan y devuelve como falsos porque estamos verificando si la celda no es nula, pero la celda en realidad es nula.

Conclusión

En este blog, hemos visto diferentes métodos para determinar que un valor de celda particular es nan o ninguno porque a veces necesitamos averiguar el valor de la celda y no todo el marco de datos. Es por eso que este blog es particular para el enfoque del valor celular. Hemos visto pandas y numpy, ambos métodos para verificar los valores faltantes. Nos centramos en el concepto solo para mostrar tutoriales simples y no usar ningún bucle de iteración. Todos los métodos anteriores que discutimos son rápidos en la ejecución, incluso si desea verificar todo el marco de datos.

El código de este blog está disponible en el enlace GitHub.