RStudio proporciona un entorno de desarrollo integrado para manejar el lenguaje de programación gratuito "R" cosas, que está disponible bajo la licencia de GNU. Rstudio es un entorno informático ideal para generar visualizaciones estadísticas detalladas y, como tal, es utilizado por estadísticos de todo el mundo.
RSTUDIO también está disponible como un programa de software y como una aplicación de servidor, utilizada por una variedad de diferentes distribuciones de Linux y para Windows y macOS.
Descargar r Language de programación (Requisitos previos)
La aplicación de escritorio rstudio necesita el lenguaje de programación R para funcionar en Linux Distross. Es necesario descargar una versión R que sea compatible con su sistema operativo Linux. Puede descargarlo usando un repositorio de software.
1- Descargar R con el navegador web
Si no puede obtener R del centro de software, significa que el repositorio debe actualizarse primero. Puede omitir todo eso y descargarlo fuera de la web escribiendo este enlace:
https: // cran.estudio.comunicarse
En el cuadro de búsqueda en su navegador web. Su página de inicio debe parecerse a la captura de pantalla a continuación:
2- Descargar R desde Linux Terminal
Enciende el terminal CLI, escriba el comando a continuación y presione Enter:
Luego ejecute una actualización con los comandos a continuación:
$ sudo apt-get actualización
Este comando obtendrá las actualizaciones de R y adquirirá todos los archivos relevantes del repositorio principal de Ubuntu.
Luego emita el siguiente comando para instalar R:
El comando anterior pasa por la lista de paquetes, revelando cuánto espacio en disco llenará, luego solicita confirmación. Presione la tecla 'Y' en su teclado para continuar con la instalación.
La salida probablemente confirmará la instalación.
Puede buscarlo en el cuadro de búsqueda como se ilustra a continuación:
Instalación de Rstudio en Ubuntu 20.04 con terminal de comando
Con el lenguaje de programación host instalado, ahora podemos proceder a instalar rstudio. Para demostrar la instalación, utilizaremos el terminal de la línea de comandos.
Enciende la terminal y emite lo siguiente
$ sudo apt-get install gdebi-core
Se le pedirá que ingrese la contraseña de root. Una vez que ingrese la contraseña, comenzará la instalación del paquete
$ wget https: // descargar1.rstudio.org/de escritorio/biónico/amd64/rstudio-1.3.1093-amd64.debutante
El paquete en línea rstudio ahora se ha conectado y se está transferiendo a su disco duro.
Se le pedirá que vuelva a ingresar la contraseña de root. Ingrese la contraseña para que la lista de paquetes lea y cargue.
El instalado solicitará permiso para continuar, presione la tecla Y en su teclado.
La salida verificará la instalación, como se muestra a continuación.
Comenzando con Rstudio:
Para lanzar rstudio, diríjase al cuadro de búsqueda y busque rstudio. Lo verá dentro de una de las listas como se muestra a continuación:
Haga clic en el icono rstudio para iniciarlo.
Investigar conjuntos de datos con RStudio
Con rstudio, puede visualizar cualquier dato en forma de gráficos, tablas y gráficos.
Para comprender cómo los datos se representan visualmente en Rstudio, tomemos la muestra de la población del censo de 2010 para cada código postal como ejemplo.
El proceso de análisis de datos puede reducirse vagamente a los siguientes cuatro pasos:
1-Datos sin procesar de importación
Puede importar los datos sin procesar directamente desde la web a rstudio haciéndolo sistemáticamente en la ventana de consola con el siguiente comando:
$ CPD <- read.csv(url("https://data.lacity.org/api/views/nxs9-385f/rows.csv?accessType=DOWNLOAD")
Con el comando ejecutado, rstudio obtendrá los datos como un archivo CSV de la web, y el contenido se asignará a la variable CPD.
Otra forma de importar datos a RSTUDIO es descargando manualmente el conjunto de datos a su disco duro y luego abrir el contenido con la función de datos de importación de RSTUDIO.
Dirígete a la opción Importar conjunto de datos en la pestaña de entorno y seleccione el archivo del conjunto de datos para cargar. Haga clic en Aceptar y se mostrará el cuadro de diálogo sobre el conjunto de datos. Aquí es donde especificará los parámetros, así como los nombres y decimales. Cuando haya terminado, simplemente haga clic en Importar, y el conjunto de datos se agregará al RSTUDIO, y se asignará una variable a su nombre.
Para ver qué conjuntos de datos están en uso, emita el comando a continuación con la variable atribuida a un conjunto de datos:
$ View (CPD)
2 -Manipulando los datos
Ahora que ha importado el conjunto de datos, hay mucho que puede hacer para transformar estos datos. Los datos se manipulan a través de características de transformación. Suponga que desea recorrer una determinada matriz dentro del conjunto de datos. Si tuviéramos que ir a la columna de población total en nuestro conjunto de datos, ingresaríamos el comando a continuación:
$ cpd $ población total
Los datos también se pueden recuperar en forma de vector:
$ CPD [1,3]
La función de subconjunto en rstudio nos permite consultar el conjunto de datos. Digamos que necesitamos resaltar las hileras donde la proporción de hombres a mujer es positiva. Para elegir esas filas, emitirá el siguiente comando:
$ A <- subset(cpd , Total Males > Total de hembras)
En el comando anterior, el primer parámetro que asignamos tenía que ser la variable atribuida al conjunto de datos al que aplicamos la función. La condición booleana se considera como el segundo parámetro. Además, la condición booleana debe evaluarse para cada fila. Sirve como factor decisivo en cuanto a si una fila debe ser parte de la salida.
3 -Uso de las funciones promedio en el conjunto de datos
RStudio tiene funciones específicas para resolver promedios en el conjunto de datos:
$ media (CPD $ MOLES TOTAL): calcula el promedio simple
$ mediana (CPD $ en total hembras) - da la mediana para una columna
$ Quantile (CPD $ Total Población) -piva el cuantil para una columna
$ VAR (CPD $ MALES TOTAL) -OBTENER LA VARIO DE UNA COLUMNA
$ SD (CPD $ Total Womales) -Deviation Standard Desviation
Para obtener el informe resumido en el conjunto de datos, también puede ejecutar cualquiera de estas funciones en todo el conjunto de datos.
$ Resumen (CPD)
4 -Cear un gráfico para el conjunto de datos
Si va a trabajar con rstudio a menudo, encontrará su herramienta de visualización muy ingeniosa. Puede crear un gráfico a partir de cualquier conjunto de datos importado con el gráfico y otras funciones de visualización en rstudio.
Para generar un diagrama de dispersión para el conjunto de datos, emitirá el siguiente comando:
$ plot (x = s $ total maches, y = s $ en total hembras, type = 'p')
Ahora, discutamos los parámetros involucrados aquí. En cada parámetro, S se refiere al subconjunto del conjunto de datos original, y al agregar "P", está indicando que desea que se traza la salida.
También puede representar su conjunto de datos en forma de histograma:
$ Hist (CPD $ Total Hogares)
Del mismo modo, para obtener un gráfico de barras del conjunto de datos importado:
$ Counts <- table(cpd$Total Population)
$ Barplot (Counts, Main = "Distribución total de la población",
$ xlab = "Número de TotalPobulation")
Administrar datos en series de tiempo de forma desigual
Para administrar datos con series de tiempo de forma desigual, debe integrar el paquete de zoológico con rstudio. Para obtener el paquete del zoológico, vaya a la esquina inferior derecha de la pantalla en rstudio y al componente del paquete. El paquete de zoológico convierte los datos de la serie temporal irregular en objetos de zoológico. Los argumentos insertados para crear objetos zoológicos son los datos, que vienen primero, seguidos del valor para ordenar por.
Los objetos del zoológico proporcionan soporte de facilidad de uso. Todo lo que tiene que hacer es escribir "trazar", y se mostrará todos los métodos de trazado que puede usar con ese paquete de zoológico.
Si se encuentra confundido acerca de lo que tiene una cierta función RSTUDIO para ofrecer, ingrese el nombre de esa función y sígalo con "?"Para ver el aviso en el menú de ayuda. Además, presionar el espacio CTRL+después de un nombre de función produce la ventana Autocompleto.
Terminando
Este tutorial ha ilustrado cómo puede configurar rstudio en Ubuntu 20.04 y cubrió los conceptos básicos de la representación estadística y la manipulación con rstudio. Si desea utilizar mejor rstudio, familiarizarse con los conceptos básicos de programación R debería ser un buen primer paso. Rstudio es una herramienta poderosa y tiene aplicaciones en muchas industrias en todo el mundo: inteligencia artificial y minería de datos, por nombrar algunas.
Conocer la esgrafía de la programación R es un poco curva de aprendizaje, pero vale la pena el esfuerzo.