Filtro Nan Pandas

Filtro Nan Pandas

Mientras trabajan con una gran cantidad de conjuntos de datos, los usuarios a menudo encuentran múltiples valores nulos o nan. Los valores nulos representan los valores nulos en un conjunto de datos. En Python, los desarrolladores también se encuentran con valores NAN cuando trabajan con Pandas en Python. Para filtrar estos valores nulos, Python incluye diferentes funciones.

Los resultados de este blog son:

  • ¿Qué es "Pandas" en Python??
  • ¿Qué son los valores NAN??
  • Cómo filtrar la fila específica desde el conjunto de datos que contiene valor NAN usando Pandas DataFrame en Python?
  • Cómo filtrar múltiples filas desde el conjunto de datos que contiene valor NAN usando Pandas DataFrame en Python?
  • Cómo filtrar todas las filas del conjunto de datos que contiene valor NAN usando Pandas DataFrame en Python?

¿Qué es "Pandas" en Python??

En Python, "pandas"Es la biblioteca más utilizada para trabajar con flotante, fecha y hora, cadena, etc., Tipos de conjuntos de datos. Tiene múltiples funciones para explorar, analizar, limpiar y manipular los datos deseados. En otras palabras, permite a los usuarios filtrar las filas que tienen los valores NAN utilizando el "marco de datos"Funciones, como"marco de datos.dropna ()", y "marco de datos.no nulo()"Funciones.

¿Qué son los valores NAN??

Casi todos los conjuntos de datos tienen valores nulos, el NULL es un valor de punto flotante particular que representa "No un número". Los datos vienen en múltiples formas y formas, incluidos valores en blanco/faltantes que se representan como NAN. Al igual que otros lenguajes de desarrollo, Python también tiene múltiples formas de representar los valores faltantes en los conjuntos de datos.

Cómo filtrar filas de datos particulares desde el conjunto de datos que contiene valor NAN utilizando el marco de datos PANDAS en Python?

Para filtrar filas específicas del conjunto de datos que contiene valores NAN, primero crearemos un conjunto de datos que contenga valores NAN. Para hacerlo, importe el "numpy", y "pandas"Módulos de biblioteca y crear un nuevo conjunto de datos. Luego, verifique el conjunto de datos recién creado:

importar pandas como PD
importar numpy como np
DataFrame = PD.DataFrame ('Autores': ['Maria', 'Henry', 'Marry', NP.Nan, 'Alex'],
'Nombre de usuario': ['FMN018', NP.nan, 'fm012', 'mg002', 'ma025'],
'Experiencia': ['1 año', '2 años', NP.nan, '6 meses', '9 meses']
)
marco de datos

Como puede ver, el conjunto de datos creado incluye múltiples valores de NAN:

Ahora, usa el "no nulo()Función para filtrar la fila específica de la columna particular que contiene valores NAN:

DataFrame [DataFrame ['Experience'].no nulo()]

Producción

Cómo filtrar múltiples filas de datos desde el conjunto de datos que contiene valor NAN utilizando Pandas DataFrame en Python?

A veces, los usuarios deben filtrar las múltiples filas del conjunto de datos proporcionado desde más de una columna. Para hacerlo, especifique los nombres de la columna deseados y luego, use el "todo()"Función con el"no nulo()" función:

columnas = ['experiencia', 'nombre de usuario']
DataFrame [DataFrame [columnas].no nulo().Todos (1)]

Se puede observar que varias filas se filtran desde el conjunto de datos que contiene valores NAN de las columnas especificadas:

Cómo filtrar todas las filas del conjunto de datos que contiene valor NAN usando Pandas DataFrame en Python?

Si los usuarios desean filtrar todas las filas desde el conjunto de datos que contienen valores NAN utilizando Pandas DataFrame en Python, el "dropna ()La función se puede usar:

marco de datos.dropna ()

Producción

Hemos compilado las formas más fáciles de filtrar los valores NAN en Python.

Conclusión

Para filtrar las filas que tienen los valores NAN en Python, el "marco de datos"Funciones, como"marco de datos.no nulo()", y "marco de datos.dropna ()Se utilizan funciones. Este blog proporcionó las diferentes formas de filtrar los valores NAN en Python.