Antes de construir cualquier algoritmo de aprendizaje automático en un conjunto de datos, el análisis estadístico inferencial es esencial. Obtener inferencias estadísticas de los datos también es parte de este proceso. En estadísticas, algunos conceptos clave describen la variabilidad de una variable numérica. Estos términos son IQR, cuartiles, cuantiles, medios y medios. Ayudan a identificar cualquier anomalía en la columna y la distribución de la columna. Esta publicación es para determinar el cuantil de la columna. La variabilidad de los datos se mide utilizando las funciones de cuantil. Después de clasificar los datos, puede usar cuantiles para dividir los números en una distribución dada en subgrupos iguales. Podemos calcular fácilmente los cuantiles en R utilizando la función cuantil, que devuelve todos los cuantiles de 0%, 25%, 50%, 75%y 100%.
Quantiles en el lenguaje de programación R en Ubuntu 20.04
Quantile es una función genérica que genera cuantiles de muestra para probabilidades especificadas. Una probabilidad de 0 corresponde a la observación más pequeña, mientras que una probabilidad de 1 corresponde al mayor. Allí, tenemos sintaxis para cuantiles utilizados en un lenguaje de programación R.
1 | cuantil (x, probs = seq (0, 1, 1/4), na.rm = false, nombres = true, type = 5, dígitos = 5, ...) |
La siguiente es una descripción del argumento anterior aprobado dentro de la función cuantil:
X: Un elemento de una categoría para la cual se ha especificado una función o un vector numérico donde se requieren cuantiles de muestra. A menos que na.RM es "verdadero", los valores de NA y NAN no se pueden usar en vectores numéricos.
problemas: La probabilidad con valores en un vector numérico; Los valores fuera de ese rango hasta "2E-14" se reconocen y se transfieren al siguiente punto final más cercano.
n / A.RM: Si es cierto, se eliminan los valores de NA y NAN en x antes de evaluar los cuantiles.
Nombres: Cuando es cierto, la función incluye un atributo de nombre. Establecer en "Falso" para reducir el tiempo que lleva resolver un problema con una gran cantidad de variables.
Dígitos: Cuando sea cierto, implementa la precisión para utilizar porcentajes de formato. Internamente, en las versiones R antes de las 4.0.x, esto se estableció en Max (2, getOption ("dígitos")).
Este artículo le enseñará qué son cuantiles y cómo calcularlos en R (cuartiles, octiles, deciles y percentiles). Para obtener cuantiles de muestra para un conjunto de datos, use la utilidad cuantile () en r.
Ejemplo 1: Uso de una función cuantil simple para viajar vectores en R en Ubuntu 20.04
Veamos cómo la función cuantil en R funciona con un ejemplo simple que genera los cuantiles para la entrada de datos. Necesitamos crear datos para aplicar las funciones de cuantil. Aquí, hemos definido los datos variables en el interior, que contienen los datos del vector. Luego, la función cuantil se usa donde hemos pasado los datos especificados previamente junto con la secuencia declarada. Al ejecutar este comando de función de cuantil, obtuvimos los cuantiles de los vectores como se muestra en el siguiente mensaje R:
En el siguiente mensaje R, hemos utilizado nuevamente la función cuantil para calcular los deciles. Para esto, hemos pasado la secuencia 0, 1 y ¼.
Aquí, hemos evaluado el interés de los cuantiles aleatorios. Hemos establecido los datos dentro del argumento de los problemas, mostrando simultáneamente la salida de los percentiles. Tenga en cuenta que la función cuantil dividen los datos en porciones iguales, con la mediana que sirve como centro, la mitad inferior restante sirve como cuartil inferior y la mitad más alta sirve como cuartil superior.
Ejemplo 2: Uso de la función cuantiles para calcular la columna en una trama de datos en R en Ubuntu 20.04
También podemos encontrar el cuantil de la columna dada desde el marco de datos. Hemos definido los datos dentro de la función de cuadro de datos en el siguiente script R. Hemos generado listas con los nombres "list1", "list2" y "list3" con valores numéricos aleatorios.
Después de eso, llame a la función de cuantil e ingrese el nombre de la columna con el símbolo "$" como cómo hemos especificado "$ list3" para cuantil. Como puede ver, la función cuantil coloca los valores de entrada en orden ascendente antes de devolver los percentiles necesarios.
Podemos usar la función Sapply () como se muestra dentro del indicador R si queremos evaluar los cuantiles de numerosas columnas a la vez. Hemos pasado la opción de función (x) dentro de la función de zaply junto con la función cuantil, que tiene los parámetros x y los problemas. La salida de esta función muestra todos los cuantiles de las columnas a la vez.
Ejemplo 3: Uso de la función cuantiles y manejando el error NAN en R en Ubuntu 20.04
NANS se puede encontrar en casi cualquier situación. Estos NANS, también conocidos como valores faltantes, se están volviendo más comunes en el mundo digital basado en datos actual. Si los datos contienen estos números faltantes, la salida puede contener NANS o errores. También tenemos datos vectoriales que incluyen algunos valores de NA llamados datos vectoriales en la función cuantil. La excepción es lanzada por el compilador R que se muestra a continuación:
Podemos eliminar este error utilizando el parámetro cuantil na.RM. Tenemos que configurar el na.Valor de RM a "Verdadero", que nos ayuda a eliminar esta excepción de NANS. Como puede ver en la salida, obtuvimos los valores del percentil y eliminamos con éxito los valores de NA.
Ejemplo 4: Uso de la función cuantiles con el parámetro Probs en R en Ubuntu 20.04
También existe la opción "PROBSS", que le permite especificar los percentiles requeridos. El argumento de los problemas, también conocido como el argumento de "probabilidades", debe ser entre 0 y 1. Dentro del siguiente script R, hemos utilizado la opción PROBS con los valores 33 y 66 dentro de la función cuantil. La salida tiene un mensaje de error de que los problemas están fuera del rango.
Al establecer la opción PROBS dentro del rango de 0 y 1, muestra los valores de los percentiles en lugar de valores falsos.
Conclusión
Hemos tratado de hacer todo lo posible para describir y explorar la función r cuantile () en varias dimensiones utilizando varios ejemplos. El formulario cuantil es la función más valiosa en el análisis de datos, ya que muestra eficientemente datos adicionales sobre información específica. Hemos ilustrado algunos ejemplos que muestran claramente el funcionamiento de la función cuantil. Espero que ahora entiendas mejor la función de r quantile ().