Tráfico de dispersión en R

Tráfico de dispersión en R
“Las representaciones visuales de datos incluyen gráficos y gráficos. Su objetivo como científico de datos es dar un sentido perfecto de grandes cantidades de información. Tres procedimientos están involucrados en el análisis de datos. Obtener datos, limpiar y alterar los datos es una parte importante del proceso. Para evaluar aún más los datos, construya una pantalla visual a partir de él. Las visualizaciones de datos con la trama son herramientas tremendas para hacer que un análisis complicado sea más fácil de entender. Pero primero, pasemos por algunos principios fundamentales de trazado como tramas de dispersión. Un diagrama de dispersión es un diagrama que presenta los niveles de dos variables numéricas en un conjunto de datos como puntos geométricos dentro de un diagrama cartesiano."

¿Cuál es la trama de dispersión en el lenguaje de programación R en Ubuntu 20?.04?

La comparación de variables se realiza utilizando gráficos de dispersión. Cuando necesitamos saber qué más se influye una variable, necesitamos comparar las dos variables. La gráfica de dispersión es un grupo de puntos punteados en los ejes x e y que representan distintos datos de datos. El diseño de los puntos generados demuestra una correlación entre dos variables cuando sus valores se muestran a lo largo del eje x y el eje Y.

Sintaxis de la trama de dispersión en el lenguaje de programación R en Ubuntu 20.04

En R, puedes hacer un diagrama de dispersión en una variedad de métodos. Gráfica (x, y), en la que los parámetros x e y son vectores numéricos que especifican las posiciones (x, y) a la gráfica, es la función más básica.

Parcela (x, y, main, xlab, ylab, xlim, ylim, ejes)

Como se mencionó anteriormente, x cualquier parámetros x es obligatorio para graficar el gráfico de dispersión, pero el gráfico de dispersión también admite algunos parámetros opcionales, que se describen de la siguiente manera:

X: Las coordenadas horizontales se configuran con esta opción.

Y Las coordenadas verticales se configuran con esta opción.

XLAB: La etiqueta para el eje horizontal.

Ylab: La etiqueta del eje vertical.

principal: El tema del gráfico se define por el parámetro principal.

xlim: El parámetro XLIM se usa para representar los valores X.

Ylim: La opción ylim se usa para trazar los valores de y.

hachas: Esta opción determina si la gráfica debe incluir ambos ejes.

Cómo construir la trama de dispersión en el R en Ubuntu 20.04?

Veamos un ejemplo para mostrar cómo podemos usar la función de la trama para crear un diagrama de dispersión. Utilizaremos el conjunto de datos de muestra en nuestros ejemplos, que es un conjunto de datos preconfigurado en el entorno R.

Ejemplo # 1: Uso del método de trazado para construir el gráfico de dispersión R en Ubuntu 20.04

El método Plot () en el lenguaje de programación R se puede usar para hacer una trama de dispersión.

Para construir el gráfico de dispersión, necesitamos el conjunto de datos. Así que aquí, hemos insertado el conjunto de datos UsArRests desde el lenguaje R. Hemos seleccionado las dos columnas de este conjunto de datos para hacer la gráfica de dispersión. Las primeras entradas se muestran del conjunto de datos UsArRests. Luego, tenemos la función de gráfico donde se establecen las dos entradas, x e y,. Para la entrada X, se selecciona la columna "Asesinato", y para la entrada Y tenemos la columna "UrbanPop". Algunas entradas opcionales se pasan dentro de la función, como las etiquetas para X e Y se configuran con XLAB e YLAB. Dentro del rango XLIM e YLIM, se establecen los valores de los parámetros X e Y. Además, el título de la trama de dispersión se establece llamando a la opción "."

La salida del diagrama de dispersión se genera a continuación.

Ejemplo # 2: Uso del método de par para construir las matrices de trazado de dispersión R en Ubuntu 20.04

Utilizamos una matriz de plano de dispersión cuando tenemos múltiples variables y queremos correlacionar una variable con las otras. Las matrices de diagrama de dispersión se crean utilizando el método de pares ().

Aquí, hemos seleccionado el Iris del conjunto de datos de muestra del lenguaje R. Luego, imprima las seis entradas principales del conjunto de datos de Iris. A las columnas del conjunto de datos IRIS, hemos aplicado el método de par. Cada columna se combinará con la columna restante en la función de par.

Las métricas de diagrama de dispersión se visualizan en la siguiente figura.

Ejemplo # 3: Uso de valores ajustados en un diagrama de dispersión en R en Ubuntu 20.04

Puede expandir el gráfico agregando un nuevo nivel de datos. En regresión lineal, puede visualizar el valor ajustado. Para construir un plan de dispersión, utilizamos los métodos GGPLOT () y geom_point () del paquete GGPLOT2.

Comience con este ejemplo; Hemos importado el módulo GGPLOT2 de R. Luego, hemos utilizado el método GGPLOT donde se da el nombre del conjunto de datos "MTCARS". La función "AES" se usa dentro del método GGPlot para crear los registros para los parámetros X e Y. Para la regresión lineal, se utiliza un conjunto adicional de características, "stat_smooth",. El método de suavizado está controlado por la opción stat_ smooth (). El error estándar (SE) se mantiene falso y la línea del tamaño se establece en el valor 1.

Ejemplo # 4: Uso de un nombre dinámico para el título de la trama de dispersión en R en Ubuntu 20.04

Todavía no hemos puesto ningún dato en las tramas. Se requieren gráficos informativos. Sin recurrir a la documentación adicional, el lector debe poder comprender el mensaje detrás del análisis de datos simplemente mirando la trama. Como resultado, se requieren buenas etiquetas cuando se usan gráficas. Las etiquetas se pueden agregar utilizando la función labs ().

Tenemos una variable aquí como scatter_graph al que se asigna el método GGPLOT. El GGPLOT establece su parámetro igual que el ejemplo anterior pero para un conjunto de datos diferente. El conjunto de datos utilizado aquí es el iris. Luego, hemos utilizado nuevamente la variable scatter_garph, y esta vez, hemos establecido los nombres dinámicos en el gráfico de dispersión.

Puede ver la información adicional sobre el diagrama de dispersión dentro de la siguiente figura.

Ejemplo # 5: Uso del método 3dsCatterplot para construir el gráfico de dispersión en R en Ubuntu 20.04

El paquete ScatterPlot3D le permite hacer un diagrama de dispersión tridimensional. ScatterPlot3d es una técnica útil que utiliza (x, y, z) sintaxis.

Hemos incluido el módulo scatterplot3d dentro de nuestro script R arriba. Ahora, podemos usar la función scatterplot3d. A la función scatterPlot3d, hemos pasado tres parámetros que son las columnas seleccionadas del grupo de dientes del conjunto de datos.

El plan de dispersión 3D se representa en el siguiente gráfico.

Conclusión

Este artículo tiene como objetivo informarle sobre la trama de dispersión en R. Los gráficos de dispersión son gráficos de dispersión que se utilizan para mostrar puntos de datos de los parámetros (generalmente dos, pero tres son posibles). El propósito principal de la gráfica de dispersión R es ayudar a visualizar los datos y si las variables numéricas tienen alguna relación. Hemos visto varios enfoques que nos ayudan a crear el diagrama de dispersión de la manera más fácil. Cada método tiene su funcionalidad y es muy fácil de entender.