Este tutorial de Pandas le enseñará cómo convertir una matriz numpy en un objeto Pandas DataFrame. Los valores en múltiples dimensiones se pueden almacenar utilizando matrices multidimensionales. Se puede comparar una matriz 3D con un cubo, mientras que una matriz en dos dimensiones se puede comparar con una matriz.
Los pandas.El constructor DataFrame () se utiliza para convertir una matriz Numpy, similar a la conversión de un diccionario.
Sintaxis:
DataFrame_Object = pandas.DataFrame (numpy_array, index = ['a', 'b'], columns = ['num', 'chr'])
Parámetros:
- El primer parámetro, datos, es el único necesario. La matriz, que se requiere para convertirse en un marco de datos, ahora se coloca aquí.
- Índice: Este es un índice o un índice similar a una matriz. Si no usamos este parámetro, el rangeIndex se usa de forma predeterminada.
- columnas: Estas son etiquetas para las columnas en un índice o marco de datos similares a la matriz. Nuevamente, RangeIndex (0, 1, 2, ..., n) se usa de forma predeterminada si no usamos este argumento.
Ejemplo 1:
Tengamos una matriz numpy llamada "real" que tiene 5 filas y la convierta en DataFrame pasando la matriz Numpy.
importación de pandas
importar numpy
# Considere la matriz numpy
Real = Numpy.Array ([[1, "Cooking", 200], [2, "Música", 3004], [3, "Hand Loom", 1000], [4, "Hand Loom", 2000], [5, "Vestid ", 3000]])
imprimir ("Array Numpy:", real, "\ n")
# Convierta la matriz anterior a Pandas DataFrame
convertido = pandas.DataFrame (real)
# Muestra el marco de datos convertido
Imprimir (convertido)
Producción:
Explicación:
Después de convertirse en Pandas DataFrame, los índices son [0,1,2,3,4] y las columnas son [0,1,2].
Ejemplo 2: con el parámetro de columnas
Ahora, pasamos los nombres de la columna a DataFrame junto con la matriz Numpy.
importación de pandas
importar numpy
# Considere la matriz numpy
Real = Numpy.Array ([[1, "Cooking", 200], [2, "Música", 3004], [3, "Hand Loom", 1000], [4, "Hand Loom", 2000], [5, "Vestid ", 3000]])
# Convierta la matriz anterior a Pandas DataFrame por nombres de columnas de paseos
convertido = pandas.DataFrame (real, columns = ['id', 'trabajo', 'salarios'])
# Muestra el marco de datos convertido
Imprimir (convertido)
Producción:
Explicación:
Ahora, puede ver los nombres de la columna en el cuadro de datos convertido. Son ["id", "trabajo", "salarios"].
Ejemplo 3: con el parámetro de índice
Ahora, pasamos los valores de índice, index = ['Person 1', 'Persona 2', 'Persona 3', 'Persona 4', 'Persona 5'], al marco de datos junto con la matriz Numpy al parámetro de índice.
importación de pandas
importar numpy
# Considere la matriz numpy
Real = Numpy.Array ([[1, "Cooking", 200], [2, "Música", 3004], [3, "Hand Loom", 1000], [4, "Hand Loom", 2000], [5, "Vestid ", 3000]])
# Convierta la matriz anterior a Pandas DataFrame agregando índice
convertido = pandas.DataFrame (real, columnas = ['id', 'trabajo', 'salarios'], index = ['persona 1', 'persona 2', 'persona 3', 'persona 4', 'persona 5'])
# Muestra el marco de datos convertido
Imprimir (convertido)
Producción:
Explicación:
Anteriormente, los índices eran [0,1,2,3,4]. Ahora, puedes ver los índices para cada fila.
Ejemplo 4: Convierta una fila en particular
Tener una matriz numpy con 2 filas y convertir solo la primera fila al marco de datos de Pandas.
importación de pandas
importar numpy
# Considere la matriz numpy
Real = Numpy.Array ([["Health_clinic", "Delhi", 522554], ["Medi View", "Francia", 434456]])
# Convertir solo la primera fila de la matriz Numpy a DataFrame
convertido = pandas.DataFrame ([real [0]], columnas = ['hospital', 'dirección', 'Pincode'], index = ['H1'])
# Muestra el marco de datos convertido
Imprimir (convertido)
Producción:
Explicación:
Aquí, necesitamos pasar el sombrero de índice de fila debe convertirse en la matriz Numpy.
Para convertir solo la primera fila a DataFrame, necesitamos pasar el índice como 0.
Conclusión
Aprendiste a convertir una matriz en un marco de datos en este tutorial de pandas. Primero estudió sobre los objetos Pandas DataFrame y las matrices Numpy. Se discutieron la clase Syntax y DataFrame, que podemos utilizar para generar los objetos de cuadro de datos. Luego, observamos tres instancias en las que transformamos las matrices numpy en pandas dataframes.