Función Signum ()
La función signum () es una función matemática utilizada en Pyspark. Está disponible en el Pyspark.sql.módulo de funciones.
Se puede usar con el método SELECT porque SELECT () muestra los valores de Signum en Pyspark DataFrame.
Sintaxis:
dataframe_obj.SELECT (Signum (DataFrame_OBJ.columna))
Parámetro:
Toma el nombre de la columna como un parámetro para devolver los valores de Signum para esa columna.
Ahora, veremos algunos ejemplos para comprender mejor esta función.
Ejemplo 1
Creemos un marco de datos de Pyspark con 3 filas y 4 columnas, más todos los tipos numéricos y valores de devolución de Signum.
Producción:
Entonces, para el valor de la columna1, devolvimos los valores de signum.
3.141592653589793 es mayor que 0. Entonces, el Signum es 1.
1.5707963267948966 es mayor que 0. Entonces, el Signum es 1.
1.0471975511965976 es mayor que 0. Entonces, el Signum es 1.
Ejemplo 2
Ahora, devolveremos los valores de Signum para las columnas Value2 y Value3.
Producción:
Columna - Valor2:
0 es 0. Entonces, el Signum es 0.
1 es mayor que 0. Entonces, el Signum es 1.
-5 es menos de 0. Entonces, el Signum es -1.
Columna - Valor3:
7.8 es mayor que 0. Entonces, el Signum es 1.
0.5 es mayor que 0. Entonces, el Signum es 1.
-12.9 es menos de 0. Entonces, el Signum es -1.
Nota: La función de signum () devolverá nulo si la aplica en valores de cadena. Solo funciona en datos numéricos.
Conclusión
En este tutorial de Pyspark, discutimos la función Signum (). Signum () es una función matemática que se puede usar en Pyspark. Está disponible en el Pyspark.sql.módulo de funciones. En una columna DataFrame, si el valor es inferior a 0, entonces el Signum devuelve -1. Si el valor es igual a 0, el Signum devuelve 0. De lo contrario, devuelve 1.