Pandas retira filas con condición

Pandas retira filas con condición
Este artículo discutirá cómo usar la función pandas drop () para eliminar filas que coincidan con una condición específica.

Muestra de datos de datos

En este tutorial, utilizaremos una muestra de datos de datos con los datos a continuación almacenados en películas.Archivo CSV:

,Título, Release_Year, IMDB_Rating
0, Iron Man, 2008,7.9
1, The Incredible Hulk, 2008,6.6
2, Iron Man 2,2010,6.9
3, Thor, 2011,7.0
4, Captain America: The First Avenger, 2011,6.9
5, The Avengers, 2012,8.0
6, Iron Man 3.2013,7.1
7, Thor: The Dark World, 2013,6.8
8, Captain America: The Winter Soldier, 2014,7.8
9, Guardianes de la Galaxia, 2014,8.0
10, Avengers: Age of Ultron, 2015,7.3
11, Ant-Man, 2015,7.3
12, Capitán América: Guerra Civil, 2016,7.8
13, Doctor Strange, 2016,7.5
14, Guardianes de la Galaxia: Volumen 2,2017,7.6
15, Spiderman: Homecoming, 2017,7.4
16, Thor: Ragnarok, 2017,7.9
17, Black Panther, 2018,7.3
18, Avengers: Infinity War, 2018,8.4
19, Ant-Man and the Wasp, 2018,7.0
20, Capitán Marvel, 2019,6.8
21, Avengers: Endgame, 2019,8.4
22, Spider-Man: lejos de casa, 2019,7.4
23, viuda negra, 2021,6.7
24, Shang-chi, 2021,7.4
25, Spiderman: No hay camino a casa, 2021,8.4
26, Doctor Strange: En el multiverso de la locura, 2022,7.5
Una vez descargado, cargue el archivo CSV como se muestra a continuación:
importar pandas como PD
DF = PD.read_csv ('películas.CSV ', index_col = [0])
df

Eliminar filas basadas en la condición de la columna

Para eliminar filas basadas en una sola condición en una columna especificada, podemos usar la función Drop (). Por ejemplo, si queremos eliminar cualquier fila donde el lanzamiento_year esté por debajo de 2012, podemos hacer:

DF = DF.Drop (DF [DF ['Release_Year'] < 2012].index, inplace=False)
df

En este ejemplo, comandamos la función de caída para eliminar todas las filas donde el valor en la columna 'Release_year' es menor que 2012. El parámetro 'inplace' evita que la función modifique el marco de datos original. Esto debería volver:

Si se dio cuenta, las filas en la salida anterior tienen un valor de lanzamiento_year de 2012 y superior.

Eliminar filas basadas en múltiples condiciones.

También podemos emparejar más de una condición al eliminar las filas. Por ejemplo, para eliminar las filas donde la calificación es mayor que 7.3 Y el año de lanzamiento es mayor que 2018, podemos hacer:

df.Drop (DF [(DF ['Release_Year']> 2018) & (DF ['IMDB_Rating']> = 7.3)].índice, inplace = falso)
df

El código anterior nos permite usar el operador ampersand para combinar múltiples condiciones.

Clausura

El artículo demuestra cómo usar la función pandas drop () para eliminar filas que coinciden.