Crear un marco de datos en r

Crear un marco de datos en r
En R, los marcos de datos son el objeto utilizado con mayor frecuencia para almacenar datos. Es una colección de vectores de longitudes idénticas. Un marco de datos es una tabla o una estructura que se asemeja a una matriz bidimensional, donde cada columna representa el valor de una sola variable, mientras que los valores de cada columna se representan en una sola fila.

Un marco de datos debe cumplir con algunas características que hemos mencionado en este párrafo. Las columnas en el marco de datos deben ser nombrados y no dejarse vacías. Cada fila en el marco de datos debe nombrarse de manera única.

Creación de datos de datos en R

R La programación proporciona varios métodos para crear un marcado de datos. Podemos construir un marco de datos utilizando los vectores de otro marco de datos e importando un archivo. En este artículo, discutiremos estas técnicas que lo ayudarán a aprender el concepto de crear un marco de datos en R.

Uso de vectores para hacer un marco de datos en r

R La programación le permite construir un marco de datos utilizando vectores que tienen el mismo tamaño. Para este propósito, R le proporciona una función incorporada "Datos.marco()".Esta función puede atrapar tantos vectores como deseamos.

La siguiente es la sintaxis para llamar a esta función:

df <- data.frame(v1, v2, v3, v4)

En cualquier marco de datos, Una columna está representada por cada vector, y el número de filas se determinará por la longitud de cualquier vector.

Hay 2 formas de generar un marco de datos utilizando vectores, uno creando los vectores requeridos y luego pasándolos a los "datos.Función Frame () ". Y el sustituto adicional es proporcionar directamente los vectores a los "datos.Función Frame () "y asignarles valores dentro de los aparatos ortopédicos de la función.

Le ayudaremos a comprender ambos métodos demostrando ejemplos prácticos en Rstudio en Ubuntu 20.04.

Realizaremos un ejemplo para hacer un marco de datos de los vectores. Primero crearemos vectores y luego los pasaremos todos como un parámetro de los "datos.marco()".

En el programa que hemos demostrado en la imagen de arriba, utilizamos cuatro vectores. Todos los vectores se crean utilizando la función "C ()". El primer vector que generamos es "nombre", que almacenará los nombres de 3 personas que tienen valores de tipo de personaje. El segundo vector es "lenguaje" y almacena los nombres de 3 lenguajes de programación. También almacena tipos de datos de caracteres. Nuestro tercer vector es "edad", que almacena tipos de datos numéricos. El último vector, "género", también almacena 3 valores de tipo de datos de caracteres. Los 4 vectores se pasan a los "datos. Frame () "Función como su parámetro. El marco de datos "DF" almacenó la salida de los "datos.Función Frame () "en él. En el último paso del código, utilizamos la instrucción "print ()" para mostrar la salida.

El DataFrame resultante tiene 4 columnas, cada una con el mismo tamaño de vectores.

El otro método alternativo para generar un marco de datos en R utilizando los vectores es que puede proporcionar a los vectores valores dentro de los "datos.Función Frame () ".

Este fragmento de código simplemente creó vectores y los asignó valores dentro del cuerpo de los "datos.función frame () "y almacenó esta función en DataFrame" DF."" PRINT () "mostró la salida.

La tabla resultante produce la misma salida, que se puede ver en la imagen a continuación.

Vale la pena repetir que para generar un marco de datos a partir de una lista de vectores, cada vector en la lista debe tener la misma cantidad de elementos; más, el script informará un error.

Uso de otros marcos de datos para crear un marcado de datos

Crear un marco de datos utilizando dos o más DataFrame es otra técnica aplicada en la programación R. Podemos hacer para la agrupación de columnas de un marco de datos a otro, así como para unirse a las filas.

Ejecutaremos dos programas aquí, uno para la agrupación horizontal y el otro para la agrupación vertical.

Para las columnas, la función que utilizaremos es "cbind ()."Primero creemos 2 marcos de datos y luego los combinemos utilizando la función" cbind () ".

En la primera parte del código, se construirán 2 columnas y los valores se almacenan en DataFrame "DF1".

La tabla resultante produce la misma salida, que se puede ver en la imagen a continuación.

Otro marco de datos, "DF2", se genera que tiene 2 columnas, "edad" y "género."

La tabla resultante produce la misma salida, que se puede ver en la imagen a continuación.

Se construye un marco de datos "DF3 'y utiliza la función" cbind () "para combinar el" DF1 "y" DF2 ".

La salida final muestra una tabla generada al fusionar los 2 marcos de datos.

Del mismo modo, para crear las filas DataFrame, podemos usar la función "rbind ()". Dentro de la función "rbind ()", pasaremos los 2 marcos de datos como parámetros. Esta función concatenará los 2 marcos de datos verticales más pequeños en una tabla completa. Tenga en cuenta que el número de filas debe ser el mismo para todos los marcos de datos que creará.

Leer un archivo en un marcado de datos

Además de generar un marco de datos, hay algunas cosas más que puede hacer. Podemos importar un conjunto de datos tabular y guardarlo como un marco de datos. Es el método más frecuente para construir un marco de datos en la programación R.

Hemos creado un archivo CSV, los valores almacenados en formato tabular y lo llamamos "tabla.CSV."Hemos guardado este archivo en nuestra carpeta" Documentos ". En rstudio, lo leeremos usando la "Leer.CSV () "Función como un nuevo marco de datos llamado" Tabla."

Para leer un archivo CSV en rstudio, lo primero que debe hacer es configurar su directorio de trabajo actual. Al usar la función "getwd ()", puede localizar su directorio de trabajo actual. En el siguiente paso, debe establecer su directorio en el lugar donde ha guardado el ".archivo CSV ". Si no considera estos pasos, recibirá un error mientras lucha por leer el archivo.

Una vez que establezca correctamente la ruta del directorio de trabajo actual en el directorio donde ha almacenado su archivo CSV, ahora usará la "Leer.función csv () ”. Escribe el ".Nombre del archivo de CSV "con una comilla (" ") dentro de la" Leer.csv () ”y use un marco de datos con cualquier nombre que desee almacenar sus valores.

Los datos que hemos almacenado en nuestro archivo CSV se muestran aquí.

Conclusión

En el tema de hoy, exploramos la creación de marcos de datos. Los marcos de datos son estructuras necesarias de la programación R. Hemos discutido diferentes formas de construir sus marcos de datos en Rstudio en Ubuntu 20.04 ambiente elaborando cada uno con un ejemplo útil. Poner práctica práctica a estos códigos de ejemplo no solo le presentará la necesidad de usar Dataframes, sino también las formas alternativas de construirlos.