Pyspark - Método de espectáculo

Pyspark - Método de espectáculo
En Python, Pyspark es un módulo Spark utilizado para proporcionar un tipo similar de procesamiento como Spark usando DataFrame. Proporciona el método show (), que muestra el marco de datos en un formato tabular.

Sintaxis:

Marco de datos.Show (n, vertical, truncado)

Donde DataFrame es la entrada Pyspark DataFrame

Parámetros:

1. n es el primer parámetro opcional que representa el valor entero para obtener las filas superiores en el marco de datos, y N representa el número de filas superiores que se mostrarán. Por defecto, mostrará todas las filas de DataFrame

2. El parámetro vertical toma valores booleanos, que se utilizan para mostrar el marco de datos en el parámetro vertical cuando está configurado en verdadero. y muestre el marco de datos en formato horizontal cuando se establece en falso. Por defecto, se mostrará en formato horizontal

3. Truncate se usa para obtener el número de caracteres de cada valor en el marco de datos. Tomará un entero como algunos personajes para mostrarse. Por defecto, mostrará todos los caracteres.

Ejemplo 1:

En este ejemplo, crearemos un marco de datos de Pyspark con 5 filas y 6 columnas y mostraremos el marco de datos utilizando el método show () sin ningún parámetros.

Entonces, esto da como resultado un marco de datos tabular al mostrar todos los valores en el marco de datos

#Importa el módulo pyspaprk
importar pyspark
#Import Sparksession para crear una sesión
de Pyspark.SQL Import Sparksession
#cree una aplicación llamada Linuxhint
Spark_app = Sparksession.constructor.AppName ('Linuxhint').getorcreate ()
# Crear datos de estudiante con 5 filas y 6 atributos
estudiantes = ['Rollno': '001', 'Nombre': 'Sravan', 'Age': 23, 'Altura': 5.79, 'Peso': 67, 'Dirección': 'Guntur',
'Rollno': '002', 'Nombre': 'ojaswi', 'edad': 16, 'altura': 3.79, 'Peso': 34, 'Dirección': 'Hyd',
'Rollno': '003', 'Nombre': 'Gnanesh Chowdary', 'Age': 7, 'Altura': 2.79, 'Peso': 17, 'Dirección': 'Patna',
'rollno': '004', 'nombre': 'rohith', 'edad': 9, 'altura': 3.69, 'Peso': 28, 'Dirección': 'Hyd',
'Rollno': '005', 'Nombre': 'Sridevi', 'Age': 37, 'Altura': 5.59, 'Peso': 54, 'Dirección': 'Hyd']
# Crea el DataFrame
DF = Spark_App.Createdataframe (estudiantes)
# marco de datos
df.espectáculo()

Producción:

Ejemplo 2:

En este ejemplo, crearemos un marco de datos de Pyspark con 5 filas y 6 columnas y mostraremos el marco de datos utilizando el método show () con el parámetro n. Establecemos el valor n en 4 para mostrar las 4 filas principales de DataFrame.

Entonces, esto da como resultado un marco de datos tabular al mostrar 4 valores en el marco de datos.

#Importa el módulo pyspaprk
importar pyspark
#Import Sparksession para crear una sesión
de Pyspark.SQL Import Sparksession
#cree una aplicación llamada Linuxhint
Spark_app = Sparksession.constructor.AppName ('Linuxhint').getorcreate ()
# Crear datos de estudiante con 5 filas y 6 atributos
estudiantes = ['Rollno': '001', 'Nombre': 'Sravan', 'Age': 23, 'Altura': 5.79, 'Peso': 67, 'Dirección': 'Guntur',
'Rollno': '002', 'Nombre': 'ojaswi', 'edad': 16, 'altura': 3.79, 'Peso': 34, 'Dirección': 'Hyd',
'Rollno': '003', 'Nombre': 'Gnanesh Chowdary', 'Age': 7, 'Altura': 2.79, 'Peso': 17, 'Dirección': 'Patna',
'rollno': '004', 'nombre': 'rohith', 'edad': 9, 'altura': 3.69, 'Peso': 28, 'Dirección': 'Hyd',
'Rollno': '005', 'Nombre': 'Sridevi', 'Age': 37, 'Altura': 5.59, 'Peso': 54, 'Dirección': 'Hyd']
# Crea el DataFrame
DF = Spark_App.Createdataframe (estudiantes)
# Obtenga las 4 filas principales en el marco de datos
df.show (4)

Producción:

Ejemplo 3:

En este ejemplo, crearemos un marco de datos de Pyspark con 5 filas y 6 columnas y mostraremos el marco de datos utilizando el método show () con un parámetro vertical. Establecemos vertical en falso para mostrar el marco de datos en vista horizontal.

Por lo tanto, esto da como resultado un marco de datos tabular al mostrar todos los valores en la vista horizontal.

#Importa el módulo pyspaprk
importar pyspark
#Import Sparksession para crear una sesión
de Pyspark.SQL Import Sparksession
#cree una aplicación llamada Linuxhint
Spark_app = Sparksession.constructor.AppName ('Linuxhint').getorcreate ()
# Crear datos de estudiante con 5 filas y 6 atributos
estudiantes = ['Rollno': '001', 'Nombre': 'Sravan', 'Age': 23, 'Altura': 5.79, 'Peso': 67, 'Dirección': 'Guntur',
'Rollno': '002', 'Nombre': 'ojaswi', 'edad': 16, 'altura': 3.79, 'Peso': 34, 'Dirección': 'Hyd',
'Rollno': '003', 'Nombre': 'Gnanesh Chowdary', 'Age': 7, 'Altura': 2.79, 'Peso': 17, 'Dirección': 'Patna',
'rollno': '004', 'nombre': 'rohith', 'edad': 9, 'altura': 3.69, 'Peso': 28, 'Dirección': 'Hyd',
'Rollno': '005', 'Nombre': 'Sridevi', 'Age': 37, 'Altura': 5.59, 'Peso': 54, 'Dirección': 'Hyd']
# Crea el DataFrame
DF = Spark_App.Createdataframe (estudiantes)
# Obtenga el marco de datos de manera horizontal
df.show (vertical = falso)

Producción:

Ejemplo 4:

En este ejemplo, crearemos un marco de datos de Pyspark con 5 filas y 6 columnas y mostraremos el marco de datos utilizando el método show () con un parámetro vertical. Establecemos vertical en verdadero para mostrar el marco de datos en vista vertical.

Entonces, esto da como resultado un marco de datos tabular al mostrar todos los valores en la vista vertical.

#Importa el módulo pyspaprk
importar pyspark
#Import Sparksession para crear una sesión
de Pyspark.SQL Import Sparksession
#cree una aplicación llamada Linuxhint
Spark_app = Sparksession.constructor.AppName ('Linuxhint').getorcreate ()
# Crear datos de estudiante con 5 filas y 6 atributos
estudiantes = ['Rollno': '001', 'Nombre': 'Sravan', 'Age': 23, 'Altura': 5.79, 'Peso': 67, 'Dirección': 'Guntur',
'Rollno': '002', 'Nombre': 'ojaswi', 'edad': 16, 'altura': 3.79, 'Peso': 34, 'Dirección': 'Hyd',
'Rollno': '003', 'Nombre': 'Gnanesh Chowdary', 'Age': 7, 'Altura': 2.79, 'Peso': 17, 'Dirección': 'Patna',
'rollno': '004', 'nombre': 'rohith', 'edad': 9, 'altura': 3.69, 'Peso': 28, 'Dirección': 'Hyd',
'Rollno': '005', 'Nombre': 'Sridevi', 'Age': 37, 'Altura': 5.59, 'Peso': 54, 'Dirección': 'Hyd']
# Crea el DataFrame
DF = Spark_App.Createdataframe (estudiantes)
# Obtenga el marco de datos de manera vertical
df.show (vertical = verdadero)

Producción:

Ejemplo 5:

En este ejemplo, crearemos un marco de datos de Pyspark con 5 filas y 6 columnas y mostraremos el marco de datos utilizando el método show () con el parámetro truncado. Establecemos el valor truncado en 1 para mostrar el primer carácter en cada fila del marco de datos.

Por lo tanto, esto da como resultado un marco de datos tabular al mostrar el primer carácter en la vista horizontal.

#Importa el módulo pyspaprk
importar pyspark
#Import Sparksession para crear una sesión
de Pyspark.SQL Import Sparksession
#cree una aplicación llamada Linuxhint
Spark_app = Sparksession.constructor.AppName ('Linuxhint').getorcreate ()
# Crear datos de estudiante con 5 filas y 6 atributos
estudiantes = ['Rollno': '001', 'Nombre': 'Sravan', 'Age': 23, 'Altura': 5.79, 'Peso': 67, 'Dirección': 'Guntur',
'Rollno': '002', 'Nombre': 'ojaswi', 'edad': 16, 'altura': 3.79, 'Peso': 34, 'Dirección': 'Hyd',
'Rollno': '003', 'Nombre': 'Gnanesh Chowdary', 'Age': 7, 'Altura': 2.79, 'Peso': 17, 'Dirección': 'Patna',
'rollno': '004', 'nombre': 'rohith', 'edad': 9, 'altura': 3.69, 'Peso': 28, 'Dirección': 'Hyd',
'Rollno': '005', 'Nombre': 'Sridevi', 'Age': 37, 'Altura': 5.59, 'Peso': 54, 'Dirección': 'Hyd']
# Crea el DataFrame
DF = Spark_App.Createdataframe (estudiantes)
# Obtenga el marco de datos obteniendo solo el primer carácter en cada fila
df.Mostrar (truncar = 1)

Producción:

Conclusión

Este artículo discutió el método show () en Pyspark y su funcionalidad. Consideramos todos los parámetros con valores para el marco de datos para mostrar el marco de datos en formato tabular.