PYSPARK - La serie Pandas representa la serie Pandas, pero posee la columna Pyspark internamente.
Estructura de datos de la serie de soporte de Pandas, y Pandas se importa del módulo Pyspark.
Antes de eso, debe instalar el módulo Pyspark."
Dominio
PIP install PysparkSintaxis para importar
de Pyspark Import PandasDespués de eso, podemos crear o usar la serie desde el módulo Pandas.
Sintaxis para crear la serie Pandas
pyspark.pandas.Serie()Podemos aprobar una lista o lista de listas con valores.
Creemos una serie Pandas a través de Pyspark que tiene cinco valores numéricos.
#Pandas de Import del módulo PysparkProducción
Ahora, entraremos en nuestro tutorial.
Las funciones agregadas se utilizan para realizar operaciones de agregación como Sum (), Min (), media () y max ().Estas operaciones funcionan solo en datos numéricos como entero, doble, etc
Vamos a verlos uno por uno.
pyspark.pandas.Serie.suma()
Sum () en la serie Pyspark Pandas se usa para devolver la suma total.
Sintaxis
pyspark_series.suma()Donde Pyspark_Series es la serie Pyspark Pandas.
Ejemplo
Suma de retorno de la serie Pyspark Pyspark anterior.
Producción:
278pyspark.pandas.Serie.significar()
media () en la serie Pyspark Pandas se usa para devolver el promedio total.
Sintaxis
pyspark_series.significar()Donde Pyspark_Series es la serie Pyspark Pandas.
Ejemplo
Promedio de retorno de la serie Pyspark Pyspark anterior.
Producción
55.6pyspark.pandas.Serie.min ()
Min () en la serie Pyspark Pandas se usa para devolver el valor mínimo.
Sintaxis
pyspark_series.min ()Donde Pyspark_Series es la serie Pyspark Pandas.
Ejemplo
Devolver valor mínimo de la serie Pyspark Pandas anterior.
Producción
0pyspark.pandas.Serie.max ()
max () en la serie Pyspark Pandas se usa para devolver el valor máximo.
Sintaxis
pyspark_series.max ()Donde Pyspark_Series es la serie Pyspark Pandas.
Ejemplo
Devolver el valor máximo de la serie Pyspark Pandas anterior.
Producción
90Conclusión
En este tutorial de la serie Pyspark Pandas, vimos cuatro funciones de agregación diferentes realizadas en la serie. suma () devolverá la suma total, avg () se usa para devolver el promedio total, Min () se usa para devolver el valor mínimo y Max () devolverá el valor máximo.