Los gráficos de caja son un tipo de gráfico que muestra cómo los datos uniformes se dispersan dentro de un conjunto de datos. El conjunto de datos se divide en tres cuartiles como resultado de esto. Este gráfico muestra el mínimo, máximo, promedio, primer, segundo y tercer cuartiles del conjunto de datos.
La caja de una placa de caja comienza en el primer cuartil (25 por ciento) y termina en el tercero (75 por ciento). Como resultado, el cuadro refleja la mitad (50 por ciento) de los datos del centro a través de una línea dentro de esa que indica el promedio. A pesar de incluir los valores atípicos de la placa de caja, una división está formada a ambos lados de la caja a los datos más altos, si existen, estará representado por círculos.
Este tutorial lo educará sobre cómo usar R para hacer diagramas de caja."
Creación de placa de caja en r
Se puede crear un cuadro de caja y bigotes utilizando la función "boxplot ()" de R. Se pueden usar varias entradas para crear este gráfico, incluidos vectores y marcos de datos. En el gráfico equivalente, también puede ingresar una fórmula como entrada al producir diagramas de caja para numerosos grupos.
Creación de placa de caja usando un vector en r
Si desea crear un diagrama de caja en R desde un vector, simplemente pase el vector a la función "Boxplot ()".
Aquí hemos creado un "S" vectorial y lo asignamos una lista de valores numéricos. Usando la función "boxplot ()", pase este vector "s" como parámetro. El diagrama de caja en R está configurado para ser vertical de forma predeterminada, pero si desea cambiarlo a horizontal, puede hacerlo configurando la expresión "horizontal" "verdadero."
A continuación se muestra un diagrama de caja horizontal creado a partir de un vector.
Es esencial tener en cuenta que los diagramas de caja oscurecen la distribución subyacente de los datos. Para solucionar este problema, la función "StripChart ()" en R podría usarse para insertar puntos en un diagrama de caja.
Aquí hemos utilizado el método "Jitter."" PCH "significa personajes de la trama. El "PCH" predeterminado en R es 1, que crea un círculo vacío, mientras que "PCH = 19" significa círculos sólidos. Entonces, lo que usamos son círculos sólidos con un color naranja. Los valores atípicos no se superpondrán si los puntos de datos se vuelven nerviosos.
Creación de placa de caja usando "muesca" en r
También podemos hacer un diagrama de caja con una muesca en r. Nos ayuda a determinar qué tan bien interactúan las medianas de varios grupos de datos entre sí. Al especificar el argumento de muescas a verdadero, puede ilustrar los intervalos de confianza del 95 por ciento para la mediana en el Raplo de caja R. La caja representa los límites superiores e inferiores, mientras que la línea central puede ver la mediana.
Se utiliza una "muesca", o la reducción de la caja, alrededor de la mediana en las parcelas de caja con muescas. Las muescas pueden ayudar a determinar la importancia de una discrepancia en las medianas. Si no hay superposición entre la muesca de 2 cajas, hay una buena posibilidad de que las medianas no sean las mismas.
El diagrama de caja extraído de la "muesca" se representa a continuación.
Creación de placa de caja utilizando un conjunto de datos en r
Para crear una placa de caja en R, también puede usar los marcos de datos en la función "Boxplot ()". En este caso, utilizaremos el conjunto de datos Base R proporcionado "."
Aquí puedes ver el conjunto de datos dentro de la mesa "Peso de pollitos". Contiene 4 columnas de peso, tiempo, pollo y dieta. Todas las columnas tienen valores numéricos almacenados en ellas.
Elegiremos 2 columnas, yo.mi., peso y dieta, del conjunto de datos. Usando la función "BoxPlot ()", dibujaremos los gráficos de caja para la fecha seleccionada.
En la pieza del código anterior, hemos diseñado un diagrama de cajas de "peso" contra la "dieta."Hemos especificado los nombres de las variables con el nombre del conjunto de datos. Dentro de las aparatos ortopédicos de la función "boxplot ()", hemos utilizado el nombre de DataFrame "Pequeño", "$" para especificar la columna, y el nombre de la columna "peso", luego la columna con el nombre del marco de datos "polliza $ dieta $ dieta."
La placa de caja resultante muestra claramente la dispersión del outenador.
Para hacer que este diagrama de caja sea visualmente mejor y más detallado, puede agregar puntos. Puede lograr esto utilizando la función "StripChart ()".
Puede ver los puntos que creamos para mostrar la división de datos esencial en cada diagrama de caja.
Creación de múltiples plazos de caja en R
Crear múltiples gráficos de caja es otra técnica que se puede usar en la programación R. Para implementar este método, estamos utilizando un conjunto de datos incorporado en R Base.
El conjunto de datos que utilizamos aquí es "árboles" proporcionados por R Base. También podemos agregar colores a la placa de caja. En la función "boxplot ()", establecemos el color "col" como "arco iris", que pondrá en diferentes colores en cada placa de caja.
Si desea trazar un diagrama de caja distinto para cada columna de su rata de datos R, puede hacerlo con la utilización de la función "LAPPLY ()".
Dividiremos los gráficos "par" en una fila, así como la cantidad de columnas en el conjunto de datos en este ejemplo. Los gráficos individuales, por otro lado, pueden ser trazados. La función "invisible ()" evita que el texto de salida de la función "lapply" sea visible.
La imagen a continuación muestra el diagrama de caja creado para cada columna de datos individualmente.
Conclusión
La programación R proporciona una variedad de operaciones que se pueden realizar. Crear un diagrama de caja es otro método útil y simple para mostrar datos visualmente en gráficos. En este artículo, discutimos qué son los diagramas de caja y cómo muestran datos. Explicamos cuatro técnicas diferentes que se pueden usar para dibujar diagramas de caja en R, utilizando rstudio en Ubuntu 20.04. Incluido el uso de vectores simples para crear diagramas de caja, utilizar "muescas", usar Dataframes y crear múltiples gráficos de caja también. Demostramos cada método elaborando en diferentes ejemplos de códigos. Esto facilitará el aprendizaje de R para crear gráficos de cajas.