Los análisis estadísticos se realizan utilizando las diferentes funciones incorporadas en R. Estas funciones se incluyen en los paquetes base de R. Para generar los resultados en R junto con los argumentos, los vectores se toman como una entrada. Estas funciones incorporadas son media, mediana y modo, pero solo discutiremos sobre la media en esta publicación. La media juega un papel importante cuando necesitamos encontrar dónde se encuentra el valor central de un conjunto de datos. La media de un conjunto de datos también mantiene la información sobre cada datos dentro del conjunto.
En general, la media se define como la suma de datos/elementos/observaciones divididos por el número total de datos/elementos/observaciones.
¿Cuál es la función R media en Ubuntu 20?.04
La media no puede contener tanto los caracteres numéricos como los datos numéricos, como el modo. Solo puede generar resultados como un valor numérico. El modo calculador es una característica incorporada de R, lo que significa que tiene una funcionalidad definida en el lenguaje de programación R. Estas funciones predefinidas aceptan un vector como entrada y producen un resultado como valor numérico.
La sintaxis de la función media es la siguiente:
1 | Media (x, na.RM) |
Donde x es el vector de entrada y na.RM es un valor booleano para ignorar los valores faltantes del vector de entrada.
¿Cómo funciona el R significa R en Ubuntu 20?.04?
En R, la función de la función incorporada () se usa para calcular la media aritmética de los elementos del vector numérico y muestra el resultado en la forma numérica, por lo que podría pasar como argumento.
Le mostraremos cómo calcular la media en el lenguaje de programación R en Ubuntu 20.04 En este tutorial. Existen numerosos ejemplos de los diferentes escenarios de datos.
Ejemplo #1: media R simple de un vector
Para encontrar la media de un vector, necesitamos tomar un vector que tenga los datos numéricos. Creemos un vector X para enseñarle cómo podemos usar la función media cuando tenemos que encontrar la media de un vector.
Cuando la media se aplica al vector X, sumará todos los valores en el vector X y los dividirá por el número total de valores, que es 9.
Como podemos ver, la media toma el vector X como una entrada y genera un valor numérico que es 12.66667. Esto fue simple ya que no había valores nulos involucrados en los datos. Si se incluyó algún valor nulo, el resultado será diferente.
Ejemplo #2: media del vector numérico que tiene valores de NA en R
Entonces un.RM es una opción que se utiliza para ignorar los valores nulos o na. Es un parámetro lógico que ayuda a la función a decidir si eliminar los valores de NA o no, por lo que puede no afectar el resultado después de los cálculos. En una función media, si na.rm = verdadero, elimina los valores de NA. Entonces un.RM no es una operación ni una función. Es un parámetro utilizado por las diferentes funciones de los datos de marco.
Para encontrar la media de un vector en el que están involucrados los valores de NA, podríamos enfrentar un problema típico.
Después de agregar un valor de NA al Vector X1, lo asignamos al Vector X2 que nos da el siguiente resultado:
El Vector X2 se ve igual que el Vector X1. Pero ahora, el valor de NA se agrega al final. Cuando aplicamos la media al Vector X2, ocurrirá el siguiente problema:
El resultado, la media (x2) devuelve NA, no es lo que esperábamos. Como se mencionó anteriormente, la función media en R solo puede contener datos numéricos. Dado que el valor de NA no son datos numéricos, el NA.RM se usa para ignorar los valores de NA para evitar que ocurra este problema.
Se ilustra claramente que el na.La opción RM ha eliminado el problema del valor de NA y ha generado la media correcta del vector x2 que es 4.625.
Ejemplo #3: media del vector numérico con opción de recorte
Al igual que el NA.RM, TRIM también es un parámetro lógico utilizado por las funciones del marco de datos. En general, la opción de acabado en la media es la media del conjunto de datos después de eliminar un cierto porcentaje de los valores más pequeños y mayores del conjunto de datos. También puede decir que, antes de encontrar la media de un conjunto de datos, se eliminan un porcentaje específico de los valores más pequeños y más grandes.
La sintaxis de la media recortada es la siguiente:
1 | media (x, trim = 0) |
Probemos un recorte del 20 por ciento a nuestro Vector X1 anterior.
Como puede ver en la imagen anterior, la media de V1 sin recorte es 4.625. Pero, ¿qué pasa si aplicamos un ajuste del 20%??
Después de aplicar un ajuste del 20%, el 20% se elimina del valor más grande y pequeño del conjunto de datos, y el valor de la media cambia a 4.83333333.
Ejemplo #4: Media en R del conjunto de datos de muestra
Para ofrecerle un ejemplo más realista, implementaremos la función media en una columna de marco de datos desde un conjunto de datos real. Aquí, hemos elegido un marco de datos "iris". Primero, tenemos que descargar el archivo de datos para que podamos implementar la función media en él.
Los datos (iris) están obteniendo los datos del iris.Archivo CSV a nuestra consola. Llamar a la cabeza () está obteniendo los títulos de la cabeza a nuestros datos de iris. El conjunto de datos se nos muestra como se ve en lo siguiente:
Para encontrar la media de la primera columna de la tabla anterior del conjunto de datos, se puede usar el siguiente script:
Igual que la primera columna, también puede encontrar el valor medio para las otras columnas (i.mi. sépalo.ancho, pétalo.longitud y pétalo.ancho). Como se discutió anteriormente en este tema, la media no puede contener datos de caracteres. Se producirá un problema cada vez que intentemos encontrar la media de la quinta columna, ya que no hay valor numérico en la columna de especies.
Puede ver que el resultado no es un datos numéricos. En cambio, muestra un mensaje de advertencia de que el argumento no es numérico o lógico.
Conclusión
Después de cubrir este tutorial, ahora debería tener una mejor comprensión de la media. También debería poder calcular la media utilizando el lenguaje de secuencia de comandos R en Ubuntu 20.04. La media es una de las métricas vitales en la investigación estadística. Ser consciente de la media puede ser útil para nosotros en la investigación posterior. Sin embargo, la capacidad de evaluar la media no implica que comprenda la investigación estadística y el principio de la media. En R, para encontrar la media de un conjunto de datos, prácticamente implementamos los múltiples ejemplos de la media con vectores, parámetros lógicos y conjuntos de datos.