Filtro de filas en el marco de datos

Filtro de filas en el marco de datos
Si queremos filtrar las filas de DataFrame, podemos usar la función Filtro () y especificar la condición dentro de ella. Basado en la condición, podemos filtrar las filas. Para esto, tenemos que usar la función Filter ().

En este tutorial R, filtraremos las filas utilizando la función Filter ().

Creemos un marco de datos con cuatro filas y cinco columnas.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India ',' Australia '), market_type = c (' supermercado ',' bar ',' supermercado ',' restaurent '), market_squarefeet = c (120,342,220,110)))
#mercado de desplazamiento
Impresión (mercado)

Resultado:

Filtremos las filas en este marco de datos.

Sintaxis:

Filtro (DataFrame_Object, condición)

Parámetros:
Se necesitan dos parámetros:

  1. DataFrame_Object es el DataFrame
  2. La condición se usa para filtrar las filas

Podemos especificar las condiciones utilizando los operadores relacionales y lógicos.

Ejemplo 1:
En este ejemplo, especificaremos la condición en la columna Market_id.

Filtraremos las filas seleccionando los valores en esta columna superiores a 3.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India ',' Australia '), market_type = c (' supermercado ',' bar ',' supermercado ',' restaurent '), market_squarefeet = c (120,342,220,110)))
#Realización de filas solo cuando los valores en la columna Market_id son mayores que 3
Impresión (Filter (Market, Market_id> 3))

Resultado:

Podemos ver que las filas se filtran y usan el operador más grande que (>) en la columna Market_ID.

Ejemplo 2:
En este ejemplo, especificaremos la condición en las columnas Market_id y Market_place.

Filtraremos las filas seleccionando los valores en la columna Market_ID superior a 2 y el valor de mercado "India".

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India ',' Australia '), market_type = c (' supermercado ',' bar ',' supermercado ',' restaurent '), market_squarefeet = c (120,342,220,110)))
#Realización de filas solo cuando los valores en la columna Market_id son mayores de 3 y el lugar es India
Print (Filter (Market, Market_id> 2 & Market_place == 'India')))

Resultado:

Podemos ver que las filas se filtran y usan el operador más grande que (>) en la columna Market_ID y el operador == en la columna Market_place combinada con el operador y (&).

Ejemplo 3:
En este ejemplo, especificaremos la condición en las columnas Market_id y Market_place.

Filtraremos las filas seleccionando los valores en la columna Market_ID superior a 2 o al mercado "India".

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India ',' Australia '), market_type = c (' supermercado ',' bar ',' supermercado ',' restaurent '), market_squarefeet = c (120,342,220,110)))
#Realización de filas solo cuando los valores en la columna Market_id son mayores que 3 o el lugar es India
Print (Filter (Market, Market_id> 2 | Market_place == 'India'))

Resultado:

Podemos ver que las filas se filtran y usan el operador más grande que (>) en la columna Market_ID y el operador == en la columna Market_place combinada con el (|) operator.

Ejemplo 4:
En este ejemplo, especificaremos la condición en la columna Market_place.

Filtraremos las filas seleccionando los valores en la columna Market_place de modo que los valores se encuentren en "India" o "EE. UU." Usando el operador % in %.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'), market_place = c ('India', 'USA', 'India ',' Australia '), market_type = c (' supermercado ',' bar ',' supermercado ',' restaurent '), market_squarefeet = c (120,342,220,110)))
#Realización de las filas solo cuando los valores en Market_place son solo India y EE. UU
Print (Filter (Market, Market_place % in % C ('India', 'USA'))))

Resultado:

Podemos ver que las filas se filtran y usan el operador % in % para verificar los valores que son "India" o "EE. UU.".

Conclusión

En este artículo, discutimos los cuatro ejemplos diferentes para filtrar el marco de datos especificando las diferentes condiciones utilizando los operadores relacionales, los operadores lógicos y el % en % operador.