R - Drop de columnas de cuadro de datos por nombre

R - Drop de columnas de cuadro de datos por nombre
Cuando trabaja con marcos de datos R, es posible que tenga el requisito de soltar las columnas presentes en el marco de datos. En este artículo, veremos cómo dejar o eliminar columnas en un marco de datos especificando el nombre de la columna. Para soltar columnas en un marco de datos, tenemos que crear un marco de datos con algunas filas y columnas.

Podemos definir un marco de datos como una colección de datos en forma de filas y columnas. Simplemente, almacenará datos en filas y columnas. En el lenguaje R, se crea un marco de datos utilizando datos.Función Frame ().

Sintaxis:

datos.marco (valores)

Podemos pasar los valores de los parámetros. Esto puede ser una lista, vector o matriz.

Primero, cree un marco de datos con cuatro filas y cinco columnas relacionadas con el mercado.

Código:

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = c ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#Dispraad el market DataFrame
Impresión (mercado)

Resultado:

Puede ver el marco de datos del mercado aquí:

Existen diferentes enfoques para soltar las columnas en el marco de datos por nombre. Vamos a verlos uno por uno.

Enfoque 1: Uso de nombres ()

El método Names () en la programación R toma los nombres de la columna del marco de datos. Aquí, especificaremos los nombres de la columna en un vector que se eliminarán y verificaremos estos nombres presentes en el marco de datos con nombres (). Finalmente, usaremos '! operador ', para soltar las columnas seleccionando las columnas a través del vector a través de []. De esta manera, podemos soltar las columnas por nombre en el marco de datos seleccionando los nombres de la columna a través de un vector.

Sintaxis:

dataFrame_Object [,!(nombres (dataFrame_Object) % en % column_names)]

Aquí,

  1. DataFrame_Object es el nombre del marco de datos.
  2. Los nombres () es el método que toma el marco de datos de entrada.
  3. El column_names es un vector que almacena los nombres de las columnas que se eliminarán del marco de datos.

Ejemplo 1

En este ejemplo, estamos dejando caer una sola columna: Market_Name. Entonces, tenemos que especificar esta columna en un vector.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = c ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#Consider 1 Columna - Market_Name
column_name = c ('market_name')
#Display las columnas restantes dejando caer la columna seleccionada anteriormente usando nombres () con !
Imprimir (mercado [,!(nombres (mercado) % en % column_name)])

Resultado:

Desde el resultado, podemos ver que la columna Market_Name se elimina y las columnas restantes se devolvieron en un marco de datos.

Ejemplo 2

En este ejemplo, estamos dejando caer múltiples columnas: Market_Name, Market_place y Market_Squarefeet. Entonces, tenemos que especificar estas tres columnas en un vector.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = c ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#considerar las 3 columnas - Market_name, Market_place, Market_squarefeet
column_names = c ('market_name', 'market_place', 'market_squarefeet')
#Display las columnas restantes dejando caer las columnas seleccionadas anteriormente usando nombres () con !
Imprimir (mercado [,!(nombres (mercado) % en % column_names)])

Resultado:

Del resultado, podemos ver que las columnas Market_Name, Market_place y Market_Squarefeet se eliminaron y las columnas restantes se devolvieron en un marco de datos.

Enfoque 2: Uso de Select () de la biblioteca dplyr

El método select () disponible en la biblioteca dplyr se usa para tomar nombres de columnas del marco de datos. Aquí, toma el marco de datos como el primer parámetro, y especificaremos los nombres de la columna en un vector que se eliminará como un segundo parámetro. Utiliza el signo Minus (-) para soltar estos nombres de columnas seleccionadas proporcionadas en un vector. De esta manera, podemos soltar las columnas por nombre en el marco de datos seleccionando los nombres de la columna a través del vector.

Sintaxis:

SELECT (dataFrame_Object,- column_name)

Parámetros:

Se necesitan dos parámetros:

  1. DataFrame_Object es el nombre del marco de datos.
  2. El column_names es un vector que almacena los nombres de las columnas que se eliminarán del marco de datos.

Para usar este método, tenemos que cargar la biblioteca dplyr. Podemos hacer esto utilizando la función biblioteca ().

Biblioteca ("dplyr")

Ejemplo 1

En este ejemplo, estamos dejando caer una sola columna: Market_Name. Entonces, tenemos que especificar esta columna en un vector.

#Load Biblioteca dplyr
Biblioteca ("dplyr")
#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = c ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#Consider 1 Columna - Market_Name
column_name = c ('market_name')
#Display columnas restantes dejando caer la columna seleccionada anterior usando SELECT ()
print (seleccionar (mercado, -column_name))

Resultado:

El resultado mostrará que la columna Market_Name se elimina y las columnas restantes se devolvieron en un marco de datos.

Ejemplo 2

En este ejemplo, estamos dejando caer múltiples columnas: Market_Name, Market_place y Market_Squarefeet. Entonces, tenemos que especificar todas estas tres columnas en un vector.

#Load Biblioteca dplyr
Biblioteca ("dplyr")
#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = c ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#considerar las 3 columnas - Market_name, Market_place, Market_squarefeet
column_names = c ('market_name', 'market_place', 'market_squarefeet')
#Display columnas restantes dejando caer las columnas seleccionadas anteriormente usando SELECT ()
print (seleccionar (mercado, -column_names))

Resultado:

Del resultado, podemos ver que las columnas Market_Name, Market_place y Market_Squarefeet se eliminaron, y las columnas restantes se devolvieron en un marco de datos.

Enfoque 3: Uso de subconjunto ()

El método subset () toma los nombres de la columna del marco de datos. Aquí, toma el marco de datos como el primer parámetro y, en el segundo parámetro, especificaremos los nombres de la columna a través del parámetro Seleccionar que se eliminarán. Utiliza el signo Minus (-) para soltar estos nombres de columnas seleccionadas proporcionadas en un vector. De esta manera, podemos soltar las columnas por nombre en el marco de datos seleccionando los nombres de la columna a través del parámetro Seleccionar.

Sintaxis:

Subset (dataFrame_Object, select = - column_names)

Parámetros:

Se necesitan dos parámetros:

  1. DataFrame_Object es el nombre del marco de datos.
  2. El column_names es un vector que almacena los nombres de la columna que se eliminarán desde el marco de datos, que se pasa a través del parámetro seleccionar.

Ejemplo 1

En este ejemplo, estamos dejando caer una sola columna: Market_Name. Entonces, tenemos que especificar esta columna en un vector y asignarla para seleccionar.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = c ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#Display columnas restantes soltando el mercado de mercado usando subconjunto ()
print (subconjunto (mercado, select = - c (market_name)))

Resultado:

El resultado mostrará que la columna Market_Name se elimina y las columnas restantes se devuelven en un marco de datos.

Ejemplo 2

En este ejemplo, estamos dejando caer múltiples columnas: Market_Name, Market_place y Market_Squarefeet. Entonces, tenemos que especificar todas estas tres columnas en un vector y asignarlo a la selección.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = c ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#Display columnas restantes soltando el mercado de mercado usando subconjunto ()
print (subset (mercado, select = - c (market_name, market_place, market_squarefeet))))

Resultado:

Del resultado, podemos ver que las columnas Market_Name, Market_place y Market_Squarefeet se eliminaron y las columnas restantes se devolvieron en un marco de datos.

Enfoque 4: Usar dentro ()

El método adentro () toma los nombres de la columna del marco de datos. Aquí, toma el marco de datos como el primer parámetro, y en el segundo parámetro, especificaremos los nombres de la columna que se eliminarán a través del método rm (). El método rm () elimina las columnas especificadas dentro de él. De esta manera, podemos soltar las columnas por nombre en el marco de datos.

Sintaxis:

dentro (dataFrame_Object, RM (column_names))

Parámetros:

Se necesitan dos parámetros:

  1. DataFrame_Object es el nombre del marco de datos.
  2. El rm () toma nombres de columna separados por una coma.

Ejemplo 1

En este ejemplo, estamos dejando caer una sola columna: Market_Name. Entonces, tenemos que especificar esta columna en un vector y asignarla para seleccionar.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = c ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar', 'Grocery',
'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#Display columnas restantes soltando la columna de mercado de mercado utilizando dentro ()
Impresión (dentro (mercado, RM (Market_Name)))

Resultado:

El resultado muestra que la columna Market_Name se elimina y las columnas restantes se devolvieron en un marco de datos.

Ejemplo 2

En este ejemplo, estamos dejando caer múltiples columnas: Market_Name, Market_place y Market_Squarefeet. Entonces, tenemos que especificar estas tres columnas en un vector y asignarlo a la selección.

#cree un mercado de marcos de datos que tenga 4 filas y 5 columnas.
mercado = datos.Frame (market_id = c (1,2,3,4), market_name = c ('m1', 'm2', 'm3', 'm4'),
Market_place = C ('India', 'USA', 'India', 'Australia'), Market_Type = C ('Grocery', 'Bar',
'Grocery', 'Restaurent'), Market_Squarefeet = C (120,342,220,110)))
#Display columnas restantes dejando caer el mercado utilizando dentro ()
Print (dentro (Market, RM (Market_Name, Market_place, Market_squarefeet))))

Resultado:

Del resultado, podemos ver que las columnas Market_Name, Market_place y Market_Squarefeet se eliminaron y las columnas restantes se devolvieron en un marco de datos.

Conclusión

Este artículo discutió los cuatro enfoques para soltar o eliminar las columnas de un marco de datos R por nombre de columna. Según el requisito de su aplicación, puede usar cualquiera de los métodos de los siguientes cuatro métodos: nombres (), select (), subset () y dentro ().