Función de Pyspark Signum

Función de Pyspark Signum
La principal ventaja de la función Signum es proporcionar un signo a los valores dados. En Pyspark DataFrame con las columnas numéricas, si el valor es inferior a 0, entonces el Signum devuelve -1. Si el valor es igual a 0, entonces el Signum devuelve 0. De lo contrario, devuelve 1.

Función Signum ()

La función signum () es una función matemática utilizada en Pyspark. Está disponible en el Pyspark.sql.módulo de funciones.

Se puede usar con el método SELECT porque SELECT () muestra los valores de Signum en Pyspark DataFrame.

Sintaxis:
dataframe_obj.SELECT (Signum (DataFrame_OBJ.columna))

Parámetro:
Toma el nombre de la columna como un parámetro para devolver los valores de Signum para esa columna.

Ahora, veremos algunos ejemplos para comprender mejor esta función.

Ejemplo 1
Creemos un marco de datos de Pyspark con 3 filas y 4 columnas, más todos los tipos numéricos y valores de devolución de Signum.

importar pyspark
importación matemática
de Pyspark.SQL Import Sparksession
de Pyspark.sql.Funciones de importación Signum
Spark_app = Sparksession.constructor.nombre de la aplicación('_').getorcreate ()
#cree valores matemáticos
valores = [(matemáticas.Pi, 0,7.8,120),
(matemáticas.Pi/2,1,0.5,180),
(matemáticas.Pi/3, -5, -12.9,360)
]
#Assign columnas creando el marco de datos de Pyspark
dataFrame_OBJ = Spark_App.creatataFrame (valores, ['value1', 'value2', 'value3', 'value4'])
dataframe_obj.espectáculo()
#Obtenga los valores de Signum de la columna Value1
dataframe_obj.SELECT (Signum (DataFrame_OBJ.valor1)).espectáculo()

Producción:

Entonces, para el valor de la columna1, devolvimos los valores de signum.
3.141592653589793 es mayor que 0. Entonces, el Signum es 1.
1.5707963267948966 es mayor que 0. Entonces, el Signum es 1.
1.0471975511965976 es mayor que 0. Entonces, el Signum es 1.

Ejemplo 2
Ahora, devolveremos los valores de Signum para las columnas Value2 y Value3.

importar pyspark
importación matemática
de Pyspark.SQL Import Sparksession
de Pyspark.sql.Funciones de importación Signum
Spark_app = Sparksession.constructor.nombre de la aplicación('_').getorcreate ()
#cree valores matemáticos
valores = [(matemáticas.Pi, 0,7.8,120),
(matemáticas.Pi/2,1,0.5,180),
(matemáticas.Pi/3, -5, -12.9,360)
]
#Assign columnas creando el marco de datos de Pyspark
dataFrame_OBJ = Spark_App.creatataFrame (valores, ['value1', 'value2', 'value3', 'value4'])
dataframe_obj.espectáculo()
#Obtenga los valores de Signum de la columna Value2 y Value3
dataframe_obj.SELECT (Signum (DataFrame_OBJ.Value2), Signum (dataFrame_obj.valor3)).espectáculo()

Producción:

Columna - Valor2:

0 es 0. Entonces, el Signum es 0.
1 es mayor que 0. Entonces, el Signum es 1.
-5 es menos de 0. Entonces, el Signum es -1.

Columna - Valor3:

7.8 es mayor que 0. Entonces, el Signum es 1.
0.5 es mayor que 0. Entonces, el Signum es 1.
-12.9 es menos de 0. Entonces, el Signum es -1.

Nota: La función de signum () devolverá nulo si la aplica en valores de cadena. Solo funciona en datos numéricos.

Conclusión

En este tutorial de Pyspark, discutimos la función Signum (). Signum () es una función matemática que se puede usar en Pyspark. Está disponible en el Pyspark.sql.módulo de funciones. En una columna DataFrame, si el valor es inferior a 0, entonces el Signum devuelve -1. Si el valor es igual a 0, el Signum devuelve 0. De lo contrario, devuelve 1.