Combinar columnas en R

Combinar columnas en R
“Hay una diversidad de escenarios en los que los conjuntos de datos se dividen en numerosas tablas y una variedad de razones por las cuales este puede ser el caso. A veces es más simple recopilar información en trozos más pequeños, mientras que en algunas situaciones, es mejor minimizar el tamaño del archivo. Independientemente de por qué los conjuntos de datos se fragmentan en tablas separadas, deben estructurarse de manera que debe haber un mínimo de una columna similar entre ambas tablas, lo que permite combinar si es necesario si es necesario.Hay tres estrategias principales que consideraremos para reducir su carga de trabajo y asegurar que cada columna y parámetro importantes de sus diferentes conjuntos de datos esté integrado adecuadamente.Después de pasar por todas las técnicas y sus códigos de ejemplo prácticos correspondientes, podrá hacer un fuerte control sobre el concepto de combinar columnas en R."

Combinando columnas en R

R nos proporciona varias formas de combinar columnas de un marco de datos. En este artículo, lo familiarizaremos con 3 de ellos; Mediante el uso de la función "Paste ()", utilizando la función "unite ()" y utilizando la función "str_c ()".

Combinar columnas mediante la función "Paste ()"

Uno de los métodos para combinar columnas de un marco de datos en R es usar la función "Paste ()". Esta función funciona combinando columnas a partir de dos datos de datos diferentes, así como dentro del mismo marco de datos.

Antes de centrarnos en su implementación, primero, necesitamos comprender la sintaxis para la función "Paste ()".

# Pegar (datos $ c1, datos $ c2, sep = "")

La sintaxis para la función "Paste ()" tiene 3 parámetros. "Datos" es el nombre del DataFrame que ingresaría, y "C1" es el nombre de la columna de ese marcado de datos. "C2" se refiere al nombre de otra columna en el marco de datos que necesita combinar con el primero. Mientras que "SEP" significa un separador que separa dos columnas y ("") se refiere a cualquier cosa que un separador necesita agregar entre las 2 columnas. Aquí se usa para agregar espacio entre ambas columnas al unirlas.

Hemos creado un marco de datos con 3 columnas; "FirstName", "LastName" y "Age."Al utilizar la función" c () ", asigne valores a todas las columnas. El "primer nombre" y "LastName" tienen valores de tipo de datos de caracteres, mientras que la columna "Age" ha almacenado valores del tipo de datos numéricos. Hemos creado un marco de datos llamado "información" y almacenamos los valores de los "datos.Función Frame () "en él. La instrucción "print ()" mostrará el DataFrame que acabamos de crear.

En la pantalla de salida, puede ver una tabla con 3 columnas.

Ahora utilizaremos la función "Paste ()". Primero, escriba el nombre de DataFrame donde almacenó valores; Como lo llamamos "información", luego agregue un operador "$" al lado, que usamos para elegir una columna o asignar un nuevo valor a una columna. Continuar más al hacer una nueva columna con el nombre "Name Full", al que asignaremos los valores combinados de las 2 columnas diferentes. Dentro de la función "Paste ()", mencione el nombre del DataFrame con un operador "$" y la columna que desea seleccionar. Después de poner una coma, escriba el nombre del DataFrame, el operador "$" y la segunda columna que desea fusionar. "(Sep =" ")" agregará espacio entre ambas columnas mientras las combina.

La imagen a continuación muestra ambas tablas; el primero con el marco de datos inicial y el otro con una columna combinada "Nombre completo."

Puede eliminar el DataFrame anterior eliminando la primera instrucción "print ()".

La salida se puede encontrar en la imagen a continuación.

Combinar columnas por función "unite ()"

Otro método para unir las columnas en la programación R es usar la función "unite ()". Necesitamos cargar el paquete que contiene esta función, que es el paquete "Tidyr".

Para usar la función "unite ()", la sintaxis que seguiremos es:

# Unite (Nombre de DataFrame, nombre de columna combinada, C (columna1, columna2))

Donde el "nombre del marco de datos" es el marco de datos que ingresará. "Nombre combinado de la columna" es el nombre de la columna donde desea almacenar los datos fusionados. Y dentro de la función "C ()" son "columna1" y "columna2", las columnas que necesita combinar.

En el ejemplo en la mano, primero hemos instalado el paquete "Tidyr" de la biblioteca R. Creó un marco de datos de la misma manera que lo creamos en el ejemplo anterior. Queremos combinar 2 columnas; "Nombre y apellido."Dentro de la función" unite () ", escribiremos el nombre de DataFrame, que es" Información."Luego, el nombre de la columna donde los valores combinados de la columna se almacenarán como" nombre completo."Usando la función" C () "para llamar a las 2 columnas que se combinarán. Finalmente, la instrucción "print ()" mostrará la salida.

Una nueva columna con el nombre "FullName" almacenando valores de fusión de columnas "FirstName" y "LastName".

Combinación de columnas por función "str_c ()"

Ahora estamos uniendo varias columnas con el método str_c (). Para esto, inicialmente, necesitamos instalar el paquete "StringR."

La función "str_c ()" funciona con esta sintaxis:
Str_c (DataFrame $ columna1, "", DataFrame $ columna2)

"DataFrame" es el DataFrame que hemos creado. "Columna1" y "column2" son las 2 columnas que queremos concatenar. Si ha notado, hay espacio ("") entre los nombres de la columna. Si no agregamos este espacio adicional, esto fusionará ambas columnas sin espacio.

Aquí hay un ejemplo de lo que hemos hecho.

Al principio, hemos cargado un paquete "StringR" que nos permitirá usar la función "str_c ()". Utilizamos el marco de datos creado en los ejemplos anteriores y, con los mismos pasos que se mencionan anteriormente, almacenamos sus valores en un nuevo cuadro de datos llamado "Información."

Dentro de la función "str_c ()", tomamos los nombres de ambas columnas como "Info $ FirstName" y "Info $ LastName" y agregó espacio entre ellos para que no se mezclaran cuando se concatenen.

Puede ver la columna combinada resultante del ejemplo demostrado anteriormente.

Conclusión

Combinar columnas en la programación R es un concepto súper fácil y útil. Esto se puede hacer por varias técnicas utilizando rstudio en Ubuntu 20.04. Hemos hecho un esfuerzo para presentarle los métodos y técnicas que se pueden utilizar para la concatenación de columnas en R. Al demostrar códigos de ejemplo y elaborar cada pequeño detalle al respecto, nuestro objetivo y propósito intencional es guiarlo de manera más simple y confiable para aprender y disfrutar de la combinación de columnas en la programación R.