Redshift aproximado percentil_disc que la función realiza su cálculo basado en el algoritmo de resumen de cuantil. Se aproximará al percentil de las expresiones de entrada dadas en ordenar parámetro. Un algoritmo de resumen cuantil se usa ampliamente para tratar con grandes conjuntos de datos. Devuelve el valor de las filas que tienen un pequeño valor distributivo acumulativo que es igual o mayor que el valor percentil proporcionado.
Redshift aproximado percentil_disc La función es una de las funciones de nodo de solo cómputo en el desplazamiento rojo. Por lo tanto, la consulta para el percentil aproximado devuelve el error si la consulta no se refiere a la tabla definida por el usuario o las tablas definidas por el sistema rojo de AWS.
El parámetro distinto no se admite en la función aproximada del percentil_disc y la función siempre se aplica a todos los valores pasados a la función incluso si hay valores de repetición. Además, los valores nulos se ignoran durante el cálculo.
Sintaxis para usar la función de percentil_disc aproximación
La sintaxis para usar la función RedShift ApropediMiate percentil_disc es la siguiente:
Percentil_disc de percentil aproximado (Percentil
El percentil El parámetro en la consulta anterior es el valor del percentil que desea encontrar. Debe ser constante numérica y varía de 0 a 1. Por lo tanto, si desea encontrar el percentil 50, pondrá 0.5.
Orden por expresión
El Orden por expresión se usa para proporcionar el orden en el que desea ordenar los valores y luego calcular el percentil.
Ejemplos para usar la función aproximada de percentil_disc
Ahora en esta sección, tomemos algunos ejemplos para comprender completamente cómo funciona.
En el primer ejemplo, aplicaremos la función aproximada de percentil_disc en una tabla llamada aproximación Como se muestra abajo. La siguiente tabla de desplazamiento rojo contiene la ID de usuario y las marcas obtenidas por el usuario.
IDENTIFICACIÓN | Marcas |
0 | 10 |
1 | 10 |
2 | 90 |
3 | 40 |
4 | 40 |
5 | 10 |
6 | 20 |
7 | 30 |
8 | 20 |
9 | 25 |
Aplicar el percentil 25 en la columna marcas del aproximación tabla que se ordenará por identificación.
Seleccionar marcas, aproximar percentil_disc (0.25)El percentil 25 del marcas columna del aproximación La tabla será la siguiente:
Marcas | Percentil_disc |
10 | 0 |
90 | 2 |
40 | 3 |
20 | 6 |
25 | 9 |
30 | 10 |
Ahora, apliquemos el percentil 50 a la tabla anterior. Para eso, use la siguiente consulta:
Seleccionar marcas, aproximar percentil_disc (0.5)El percentil 50 del marcas columna del aproximación La tabla será la siguiente:
Marcas | Percentil_disc |
10 | 1 |
90 | 2 |
40 | 3 |
20 | 6 |
25 | 9 |
30 | 10 |
Ahora, intentemos solicitar el percentil 90 en el mismo conjunto de datos. Para eso, use la siguiente consulta:
Seleccionar marcas, aproximar percentil_disc (0.9)El percentil 90 del marcas columna del aproximación La tabla será la siguiente:
Marcas | Percentil_disc |
10 | 7 |
90 | 2 |
40 | 4 |
20 | 8 |
25 | 9 |
30 | 10 |
La constante numérica del parámetro del percentil no puede exceder 1. Ahora, intentemos superar su valor y establecerlo en 2 para ver cómo la función de percentil de aproximación se trata de esta constante. Use la siguiente consulta:
seleccionar marcas, aproximar percentil_disc (2)Esta consulta lanzará el siguiente error que muestra que el percentil numérico constante varía de 0 a 1 solo.
Aplicación de la función de percentil_disc aproximación en valores nulos
En este ejemplo, aplicaremos la función aproximada de percentil_disc en una tabla llamada aproximación que incluye los valores nulos como se muestra a continuación:
Alfa | beta |
0 | 0 |
0 | 10 |
1 | 20 |
1 | 90 |
1 | 40 |
2 | 10 |
2 | 20 |
2 | 75 |
2 | 20 |
3 | 25 |
NULO | 40 |
Ahora, solicitemos el percentil 25 en esta tabla. Para eso, use la siguiente consulta:
Seleccione alfa, aproximado percentil_disc (0.25)El percentil 25 del alfa columna del aproximación La tabla será la siguiente:
Alfa | percentil_disc |
0 | 0 |
1 | 20 |
2 | 10 |
3 | 25 |
4 |
Conclusión
En este artículo, hemos estudiado cómo usar la función aproximada de percentil_disc en desplazamiento rojo para calcular cualquier percentil de una columna. Hemos aprendido el uso de la función aproximada de percentil_disc en diferentes conjuntos de datos con diferentes constantes numéricas de percentil. Hemos aprendido cómo usar diferentes parámetros mientras usamos la función de percentil_disc aproximación y cómo esta función trata cuando se pasa un percentil constante de más de 1.