Cómo crear Pandas DataFrame en Python?

Cómo crear Pandas DataFrame en Python?

Pandas DataFrame es una estructura de datos anotada 2D (bifimensional) en la que los datos están alineados en forma tabular con diferentes filas y columnas. Para una comprensión más fácil, el marco de datos se comporta como una hoja de cálculo que contiene tres componentes diferentes: índice, columnas y datos. Pandas Dataframes son la forma más común de utilizar los objetos del panda.

Pandas Dataframes se puede crear utilizando diferentes métodos. Este artículo explicará todos los métodos posibles a través de los cuales puede crear Pandas DataFrame en Python. Hemos ejecutado todos los ejemplos en la herramienta PyCharm. Comencemos la implementación de cada método uno por uno.

Sintaxis básica

Siga la siguiente sintaxis al crear Dataframes en Pandas Python:

pd.DataFrame (df_data)

Ejemplo: Explicemos con un ejemplo. En este caso, hemos almacenado los datos de los nombres y porcentajes de los estudiantes en una variable 'Students_Data'. Además, usando el PD.DataFrame (), hemos creado un Dataframes para mostrar el resultado del estudiante.

importar pandas como PD
Students_Data =
'Nombre': ['Samreena', 'Asif', 'Mahwish', 'Raees'],
'Porcentaje': [90,80,70,85]
resultado = PD.DataFrame (Students_Data)
Imprimir (resultado)

Métodos para crear marcos de datos de pandas

Pandas Dataframes se puede crear utilizando las diferentes formas en que discutiremos en el resto del artículo. Imprimiremos los cursos del estudiante dan como resultado una forma de marcos de datos. Entonces, utilizando uno de los siguientes métodos, puede crear marcos de datos similares que se representan en la siguiente imagen:

Método # 01: Creación de Pandas DataFrame desde el diccionario de listas

En el siguiente ejemplo, los marcos de datos se crean a partir de los diccionarios de las listas relacionadas con los resultados del curso del estudiante. Primero, importe una biblioteca de panda y luego cree un diccionario de listas. Las teclas DICT representan los nombres de la columna como 'Student_Name', 'Course_title' y 'GPA'. Las listas representan los datos o el contenido de la columna. La variable 'Dictionary_Lists' contiene los datos de los estudiantes que se asignan además a la variable 'DF1'. Usando la declaración de impresión, imprima todo el contenido de Dataframes.

Ejemplo:

# Bibliotecas de importación para pandas y numpy
importar pandas como PD
# Importar la biblioteca de Panda
importar pandas como PD
# Crear un diccionario de lista
diccionary_lists =
'Student_name': ['samreena', 'raees', 'sara', 'sana'],
'Course_title': ['sqa', 'sre', 'lo básico', 'inteligencia artificial'],
'GPA': [3.1, 3.3, 2.8, 4.0]
# Crea el DataFrame
dFrame = PD.DataFrame (Dictionary_Lists)
Imprimir (DFRAME)

Después de ejecutar el código anterior, se mostrará la siguiente salida:

Método # 02: Crear Pandas DataFrame desde el Diccionario de Numpy Array

El DataFrame se puede crear a partir del dict de matriz/lista. Para este propósito, la longitud debe ser la misma que la narran. Si se pasa algún índice, entonces la longitud del índice debe ser igual a la longitud de la matriz. Si no se pasa un índice, entonces, en este caso, el índice predeterminado es un rango (n). Aquí, N representa la longitud de la matriz.

Ejemplo:

importar numpy como np
# Crea una matriz numpy
nParray = np.formación(
[['Samreena', 'raees', 'sara', 'sana'],
['Sqa', 'sre', 'lo básico', 'inteligencia artificial'],
[3.1, 3.3, 2.8, 4.0]])
# Crear un diccionario de Nparray
diccionario_of_nparray =
'Student_name': nParray [0],
'Course_title': nParray [1],
'GPA': nParray [2]
# Crea el DataFrame
dFrame = PD.DataFrame (Dictionary_of_nParray)
Imprimir (DFRAME)

Método # 03: Creación de Pandas DataFrame utilizando la lista de listas

En el siguiente código, cada línea representa una sola fila.

Ejemplo:

# Import Library Pandas PD
importar pandas como PD
# Crear una lista de listas
Group_lists = [
['Samreena', 'SQA', 3.1],
['Raees', 'sre', 3.3],
['Sara', 'It Basics', 2.8],
['Sana', 'inteligencia artificial', 4.0]]
# Crea el DataFrame
dFrame = PD.DataFrame (group_lists, columns = ['student_name', 'curso_title', 'gpa'])
Imprimir (DFRAME)

Método # 04: Creación de Pandas DataFrame utilizando la lista de diccionario

En el siguiente código, cada diccionario representa una sola fila y teclas que representan los nombres de la columna.

Ejemplo:

# Pandas de la biblioteca de importación
importar pandas como PD
# Crear una lista de diccionarios
dict_list = [
'Student_name': 'samreena', 'curso_title': 'sqa', 'gpa': 3.1,
'Student_name': 'raees', 'curso_title': 'sre', 'gpa': 3.3,
'Student_name': 'sara', 'curso_title': 'lo básico', 'gpa': 2.8,
'Student_name': 'sana', 'curso_title': 'inteligencia artificial', 'gpa': 4.0]
# Crea el DataFrame
dFrame = PD.DataFrame (dict_list)
Imprimir (DFRAME)

Método # 05: Creación de Pandas DataFrame a partir de la serie Dict of Pandas

Las teclas DICT representan los nombres de las columnas y cada serie representa el contenido de la columna. En las siguientes líneas de código, hemos tomado tres tipos de series: name_series, curso_series y gpa_series.

Ejemplo:

# Pandas de la biblioteca de importación
importar pandas como PD
# Crea la serie de nombres de estudiantes
Name_series = PD.Serie (['Samreena', 'Raees', 'Sara', 'Sana'])
Curso_series = PD.Serie (['sqa', 'sre', 'lo básico', 'inteligencia artificial'])
GPA_Series = PD.Serie ([3.1, 3.3, 2.8, 4.0])
# Crear un diccionario en serie
diccionario_of_nparray
\
'] = ' Nombre ': name_series,' edad ': curso_series,' departamento ': gpa_series
# Creación de marco de datos
dFrame = PD.DataFrame (Dictionary_of_nParray)
Imprimir (DFRAME)

Método # 06: Crear Pandas DataFrame utilizando la función ZIP ().

Se pueden fusionar diferentes listas a través de la función de lista (zip ()). En el siguiente ejemplo, Pandas DataFrame se crea llamando a PD.Función DataFrame (). Se crean tres listas diferentes que se fusionan en forma de tuplas.

Ejemplo:

importar pandas como PD
# List1
Student_name = ['samreena', 'raees', 'sara', 'sana']
# List2
Curso_title = ['sqa', 'sre', 'lo básico', 'inteligencia artificial']]
# List3
GPA = [3.1, 3.3, 2.8, 4.0]
# Tome la lista de tuplas de tres listas, fusionas mediante el uso de zip ().
tuples = list (zip (student_name, curso_title, gpa))
# Asignar valores de datos a tuplas.
tuplas
# Convertir la lista de tuplas en Pandas DataFrame.
dFrame = PD.DataFrame (tuples, columnas = ['student_name', 'curso_title', 'gpa'])
# Imprimir datos.
Imprimir (DFRAME)

Conclusión

Usando los métodos anteriores, puede crear marcos de datos de Pandas en Python. Hemos imprimido el GPA del curso de un estudiante creando Pandas Dataframes. Con suerte, obtendrá resultados útiles después de ejecutar los ejemplos mencionados anteriormente. Todos los programas se comentan bien para una mejor comprensión. Si tiene más formas de crear Pandas Dataframes, no dude en compartirlos con nosotros. Gracias por leer este tutorial.