Eliminar columnas en r

Eliminar columnas en r
“Un marco de datos con frecuencia contendrá columnas que no son relevantes para su investigación. Para que sea más fácil enfatizar las columnas restantes, tales columnas deben eliminarse del conjunto de datos. Al suministrar nombres de etiquetas y ejes relacionados o definiendo directamente los nombres de índice o columna, se pueden eliminar las columnas. Las etiquetas en múltiples etapas se pueden eliminar utilizando un múltiple andex designando el nivel.

En R, ocasionalmente es posible que necesite eliminar una o múltiples columnas especificadas de un marco de datos. Afortunadamente, hay algún método incorporado del módulo R que lo hace simple. La eliminación de columnas de un conjunto de datos es simplemente un método para eliminar columnas innecesarias del marco de datos. En esta publicación, analizaremos varios métodos distintos para eliminar columnas por título de un conjunto de datos en R."

Cómo eliminar las columnas de los marcos de datos en la R en Ubuntu 20.04?

El mecanismo de caída de columna en R le permite eliminar columnas innecesarias de un marco de datos. En R, puede dejar caer una columna por su nombre de varias maneras. Este artículo muestra cómo eliminar una columna de un marco de datos a través de diferentes casos en muchos métodos diferentes.

Ejemplo # 1: Uso del método de subconjunto para eliminar columnas en R en Ubuntu 20.04

Usar el método subset () con el símbolo "-", que significa variables de caída, es una de las formas más simples de soltar columnas. Esta función en el lenguaje de programación R se utiliza para crear subconjuntos de un marco de datos y eliminar columnas de un marco de datos. La sintaxis del subconjunto en R es así: subconjunto (DF, Expr). Donde DF es el marco de datos, y el EXPR se denota como la expresión del subconjunto.

En el script de ejemplo, hemos creado el marco de datos "data1" que contiene cuatro columnas x1, x2, x3 y x4. El registro se inserta dentro de estas columnas. Al ejecutar el comando data1, se imprime el marco de datos, que muestra los nombres de la columna con las entradas que tienen. Después de esto, hemos creado una variable Data2 y llamado el método de subconjunto dentro de él. El método de subconjunto toma el Data1 como una entrada y la condición de selección para soltar las columnas X1 y X3.

Cuando se ejecuta Data2, genera el nuevo marco de datos, que tiene todas las columnas, excepto el X1 y X3, ya que estas columnas se eliminan con el método de subconjunto.

Ejemplo # 2: Uso del método de nombre para eliminar columnas en R en Ubuntu 20.04

Esta técnica crea un vector de caracteres de caída en el que se almacenan los nombres de columnas. Más tarde, les indicamos que el elija todas las variables, excepto las indicadas en la caída de la columna. La negación se denota por el "!" símbolo. El método de nombres () en R se usa para obtener o modificar el nombre del objeto. Este método acepta el objeto como un parámetro, que puede ser una matriz, vector o marco de datos, así como el valor que se utilizará para nombrar el objeto. La longitud del vector de valor suministrado debe coincidir exactamente con la longitud del objeto a su nombre, y devuelve todos los nombres de la columna.

En el script R anterior, hemos establecido el marco de datos dentro de la variable "DF."El marco de datos se imprime en la pantalla y, como puede ver, este marco de datos tiene cuatro campos con entradas distintas. Luego, hemos incluido el comando de caída y especificado los nombres de la columna dentro del vector. La nueva variable se crea como "new_df", donde se invoca el método de nombre, y al método name (), hemos pasado nuestro marco de datos "DF."Tenga en cuenta que hemos utilizado el operador % in % después del método de nombre y el comando de caída a la derecha del operador % in %.

La ejecución del código anterior genera el siguiente marco de datos donde se han eliminado las columnas Y2 e Y3.

Ejemplo # 3: Uso del método Seleccionar para eliminar columnas en R en Ubuntu 20.04

Usaremos select () en este método importando el paquete dplyr en R y especificando el argumento para omitir las columnas del conjunto de datos. En esencia, esta función simplemente guarda las variables que especifica.

Hemos incluido el paquete dplyr para acceder al método de selección. Además, hemos construido el marco de datos a partir del que podemos eliminar las columnas. El marco de datos se genera en forma tabular al ejecutar el comando myData a medida que el marco de datos se almacena dentro de esta variable. Después de eso, en la siguiente imagen de solicitud, hemos implementado el método Seleccionar donde se especifica el marco de datos como un argumento, y también se proporciona el nombre de la columna A1 con el signo menos.

El indicador R interpreta este comando de método select y emite la marco de datos, que tiene la columna A1 eliminada.

Ejemplo # 4: Uso del método Seleccionar para eliminar las columnas por las posiciones de la columna en R en Ubuntu 20.04

Pasaremos la posición del índice de columna como vector al método de selección con un signo negativo para eliminar la posición columna por columna, como se ve a continuación.

Aquí, primero hemos incluido el módulo dplyr. Y luego, hemos insertado el marco de datos R incorporado "Iris."Se muestra el marco de datos de Iris y tiene varias columnas, como se muestra en el indicador R. Podemos eliminar cualquiera de las columnas dentro del marco de datos del iris especificando el índice de la columna. Para esto, tenemos el método select () al que hemos pasado el marco de datos y el valor de índice al vector. La columna 3,4 y 5 se elimina del Iris del marco de datos, que se muestra a continuación.

Ejemplo # 5: Uso del método Seleccionar para eliminar las columnas por el carácter de inicio y finalización de la columna en R en Ubuntu 20.04

También podemos elegir columnas dependiendo de sus caracteres iniciales y finales aquí. La función inicia_with () devuelve la columna que comienza con el carácter proporcionado. Para usar el método start_with (), tenemos que seguir la sintaxis proporcionada por el lenguaje R, que es seleccionar (DataFrame, -Starts_With ("Subcanding")). Donde DataFrame denota la fuente, DataFrame y la subcadena denotan el carácter o la cadena que lo precede.

Hemos seleccionado el grupo de dientes del marco de datos en este ejemplo, ya que tiene tres columnas que se imprimen en la pantalla. Ahora, en el siguiente paso, tenemos un método start_with () dentro del comando seleccionar. El método start_with () con un signo menos toma el nombre de la columna que comienza con la "dosis" en el marco de datos de la grasa de dientes. Eliminó la columna "dosis" de la trama de datos cuando se ejecutó este comando seleccionar.

El final_with () es una función que devuelve la columna que contiene el carácter dado al final. La sintaxis que utilizamos para el método end_with () es este: select (dataFrame, -ends_with ("subcadena"))). Donde DataFrame se refiere a la entrada DataFrame, y la subcadena se refiere al carácter o una cadena que lo sigue.

Al igual que el método Start_with () anterior, hemos pasado la columna "Supp" desde el Método de dientes del cuadro de datos al método final_with () con el signo menos. Este método también ha eliminado la columna que termina_ con el "Supp."

Conclusión

El lenguaje de programación R se utilizó para demostrar el enfoque de eliminar columnas de un marco de datos. Hemos visto el método de nombre y nombre incorporado de la R, que ha eliminado las columnas. En R, puede soltar una columna utilizando el operador menos antes del método Seleccionar. Además, el método select () en el módulo dplyr en R se utiliza para elegir o eliminar columnas en función de las condiciones como comienza con, termina y columna columnas basadas en la ubicación se presenta con ejemplos.