Cambio rojo de percentil aproximado_disc

Cambio rojo de percentil aproximado_disc
Redshift aproximado percentil_disc La función es una de las funciones agregadas proporcionada por RedShift para calcular el percentil de la expresión dada basada en el modelo de distribución discreta. La aproximación es un método mucho más rápido y tiene un error relativo bajo de alrededor de 0.5.

Redshift aproximado percentil_disc que la función realiza su cálculo basado en el algoritmo de resumen de cuantil. Se aproximará al percentil de las expresiones de entrada dadas en ordenar parámetro. Un algoritmo de resumen cuantil se usa ampliamente para tratar con grandes conjuntos de datos. Devuelve el valor de las filas que tienen un pequeño valor distributivo acumulativo que es igual o mayor que el valor percentil proporcionado.

Redshift aproximado percentil_disc La función es una de las funciones de nodo de solo cómputo en el desplazamiento rojo. Por lo tanto, la consulta para el percentil aproximado devuelve el error si la consulta no se refiere a la tabla definida por el usuario o las tablas definidas por el sistema rojo de AWS.

El parámetro distinto no se admite en la función aproximada del percentil_disc y la función siempre se aplica a todos los valores pasados ​​a la función incluso si hay valores de repetición. Además, los valores nulos se ignoran durante el cálculo.

Sintaxis para usar la función de percentil_disc aproximación

La sintaxis para usar la función RedShift ApropediMiate percentil_disc es la siguiente:

Percentil_disc de percentil aproximado ( )
Dentro del grupo ()
De table_name

Percentil

El percentil El parámetro en la consulta anterior es el valor del percentil que desea encontrar. Debe ser constante numérica y varía de 0 a 1. Por lo tanto, si desea encontrar el percentil 50, pondrá 0.5.

Orden por expresión

El Orden por expresión se usa para proporcionar el orden en el que desea ordenar los valores y luego calcular el percentil.

Ejemplos para usar la función aproximada de percentil_disc

Ahora en esta sección, tomemos algunos ejemplos para comprender completamente cómo funciona.

En el primer ejemplo, aplicaremos la función aproximada de percentil_disc en una tabla llamada aproximación Como se muestra abajo. La siguiente tabla de desplazamiento rojo contiene la ID de usuario y las marcas obtenidas por el usuario.

IDENTIFICACIÓN Marcas
0 10
1 10
2 90
3 40
4 40
5 10
6 20
7 30
8 20
9 25

Aplicar el percentil 25 en la columna marcas del aproximación tabla que se ordenará por identificación.

Seleccionar marcas, aproximar percentil_disc (0.25)
Dentro del grupo (orden por identificación)
de aproximación
grupo de marcas

El percentil 25 del marcas columna del aproximación La tabla será la siguiente:

Marcas Percentil_disc
10 0
90 2
40 3
20 6
25 9
30 10

Ahora, apliquemos el percentil 50 a la tabla anterior. Para eso, use la siguiente consulta:

Seleccionar marcas, aproximar percentil_disc (0.5)
Dentro del grupo (orden por identificación)
de aproximación
grupo de marcas

El percentil 50 del marcas columna del aproximación La tabla será la siguiente:

Marcas Percentil_disc
10 1
90 2
40 3
20 6
25 9
30 10

Ahora, intentemos solicitar el percentil 90 en el mismo conjunto de datos. Para eso, use la siguiente consulta:

Seleccionar marcas, aproximar percentil_disc (0.9)
Dentro del grupo (orden por identificación)
de aproximación
grupo de marcas

El percentil 90 del marcas columna del aproximación La tabla será la siguiente:

Marcas Percentil_disc
10 7
90 2
40 4
20 8
25 9
30 10

La constante numérica del parámetro del percentil no puede exceder 1. Ahora, intentemos superar su valor y establecerlo en 2 para ver cómo la función de percentil de aproximación se trata de esta constante. Use la siguiente consulta:

seleccionar marcas, aproximar percentil_disc (2)
Dentro del grupo (orden por identificación)
de aproximación
grupo de marcas

Esta consulta lanzará el siguiente error que muestra que el percentil numérico constante varía de 0 a 1 solo.

Aplicación de la función de percentil_disc aproximación en valores nulos

En este ejemplo, aplicaremos la función aproximada de percentil_disc en una tabla llamada aproximación que incluye los valores nulos como se muestra a continuación:

Alfa beta
0 0
0 10
1 20
1 90
1 40
2 10
2 20
2 75
2 20
3 25
NULO 40

Ahora, solicitemos el percentil 25 en esta tabla. Para eso, use la siguiente consulta:

Seleccione alfa, aproximado percentil_disc (0.25)
Dentro del grupo (orden por beta)
de aproximación
grupo de alfa
orden por alfa;

El percentil 25 del alfa columna del aproximación La tabla será la siguiente:

Alfa percentil_disc
0 0
1 20
2 10
3 25
4

Conclusión

En este artículo, hemos estudiado cómo usar la función aproximada de percentil_disc en desplazamiento rojo para calcular cualquier percentil de una columna. Hemos aprendido el uso de la función aproximada de percentil_disc en diferentes conjuntos de datos con diferentes constantes numéricas de percentil. Hemos aprendido cómo usar diferentes parámetros mientras usamos la función de percentil_disc aproximación y cómo esta función trata cuando se pasa un percentil constante de más de 1.