Pandas a la matriz

Pandas a la matriz
El método más común y popular para convertir el marco de datos en una matriz es usar la función to_numpy (). En Numpy, las dimensiones se conocen como el eje. La "matriz.La clase de matriz "de la biblioteca Python predeterminada es distinta de la Numpy.formación. También tenemos los métodos de "valores" y to_records ().

Método 1: Uso de to_numpy ()

Cuando aplicamos el método to_numpy () en Pandas DataFrame, un objeto del tipo de datos numpy, nDarray se devuelve como salida. Por lo general, se devuelve un ndarray bidimensional. Echemos un vistazo a la sintaxis de la función antes de ver el funcionamiento de la función en los siguientes ejemplos.

Sintaxis:

DataFrame_Object.to_numpy (dtype = none, copy = false, na_value = nodefault.ningún valor predeterminado)

Parámetros:

  1. dtype: Numpy.dtype, str u opcional. El tipo de datos se pasa a Numpy.asarray ().
  2. Copiar: Bool, falso de forma predeterminada. Si se debe verificar que la salida/datos/valor devuelto no es una vista en las otras matrices. No se garantiza que el to_numpy () no se copie cuando se usa Copy = False. En su lugar, Copy = True hace una copia incluso si no es estrictamente necesario.
  3. Na_Value: Cualquier opción. El valor para reemplazar si hay valores faltantes. El valor, por defecto, depende de los dtypes de las columnas en DataFrame.

Ejemplo 1:
Tengamos un marco de datos que tenga 5 filas y 3 columnas y lo convígurándolo a una matriz Numpy usando el método To_Numpy ().

importación de pandas
importar numpy
# Considere el marco de datos de Pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Música", 3004],
[3, "Lloom de la mano", 1000],
[4, "Hand Loom", 2000],
[5, "Vestir", 3000]],
columnas = ['id', 'trabajo', 'salarios'],
índice = ['persona 1', 'persona 2', 'persona 3', 'persona 4', 'persona 5'])
# Muestra el marco de datos convertido
Imprimir (real, "\ n")
# Convertir a una matriz Numpy
convertido = real.to_numpy ()
# Muestra el tipo de matriz numpy
imprimir (tipo (convertido), "\ n")
Imprimir (convertido)

Producción:

Explicación:
Después de convertir en la matriz Numpy, usamos la función type () para mostrar el tipo de matriz convertida. Puedes ver que 5 filas se almacenan en una matriz numpy.

Ejemplo 2:
Convertir solo dos columnas en el marco de datos a la matriz Numpy utilizando el método to_numpy (). Aquí, tenemos que especificar los nombres de la columna que se convertirán en la matriz Numpy en una lista.

importación de pandas
importar numpy
# Considere el marco de datos de Pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Música", 3004],
[3, "Lloom de la mano", 1000],
[4, "Hand Loom", 2000],
[5, "Vestir", 3000]],
columnas = ['id', 'trabajo', 'salarios'],
índice = ['persona 1', 'persona 2', 'persona 3', 'persona 4', 'persona 5'])
# Convertir solo columnas de 'trabajo' y 'salario' en matriz Numpy
Imprimir (real [['trabajo', 'salarios']].to_numpy ())

Producción:

Explicación:
Podemos ver que solo dos columnas ["trabajar", "salarios"] se convierten en la matriz numpy.

Método 2: Uso del atributo de valores

El "valores" es un atributo que convierte el marco de datos PANDAS en la matriz Numpy directamente.

Sintaxis:

DataFrame_Object.valores

Ejemplo 1: Convierta todo el marco de datos en matriz Numpy
Considere DataFrame anterior y conviértelo en una matriz Numpy utilizando el método To_numpy ().

importación de pandas
importar numpy
# Considere el marco de datos de Pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Música", 3004],
[3, "Lloom de la mano", 1000],
[4, "Hand Loom", 2000],
[5, "Vestir", 3000]],
columnas = ['id', 'trabajo', 'salarios'],
índice = ['persona 1', 'persona 2', 'persona 3', 'persona 4', 'persona 5'])
# Use el atributo de valores para convertir el marcado de datos anterior en matriz Numpy.
Imprimir (real.valores)
imprimir (tipo (real.valores))

Producción:

Explicación:
Puede ver todas las columnas en el marco de datos a la matriz Numpy.

Ejemplo 2: Convierta algunas columnas en una matriz Numpy
Convertir solo dos columnas en el marco de datos a la matriz Numpy utilizando el método to_numpy (). Aquí, tenemos que especificar los nombres de la columna que se convertirán en la matriz Numpy en una lista.

importación de pandas
importar numpy
# Considere el marco de datos de Pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Música", 3004],
[3, "Lloom de la mano", 1000],
[4, "Hand Loom", 2000],
[5, "Vestir", 3000]],
columnas = ['id', 'trabajo', 'salarios'],
índice = ['persona 1', 'persona 2', 'persona 3', 'persona 4', 'persona 5'])
Imprimir (real [['trabajo', 'salarios']].valores)

Producción:

Podemos ver que solo dos columnas ["trabajar", "salarios"] se convierten en la matriz numpy.

Método 3: Uso de To_records ()

El "to_records ()" convierte directamente el marco de datos existente en una matriz Numpy que es de tipo de matriz de registros. La ventaja de usar este método es que para cada fila convertida, el índice también viene en la matriz de registros.

Sintaxis:

DataFrame_Object.to_records ()

Ejemplo 1: Convierta todo el marco de datos en matriz Numpy
Considere DataFrame anterior y conviértelo en una matriz Numpy utilizando el método To_records ().

importación de pandas
importar numpy
# Considere el marco de datos de Pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Música", 3004],
[3, "Lloom de la mano", 1000],
[4, "Hand Loom", 2000],
[5, "Vestir", 3000]],
columnas = ['id', 'trabajo', 'salarios'],
índice = ['persona 1', 'persona 2', 'persona 3', 'persona 4', 'persona 5'])
# Use to_records () para convertir el marco de datos anterior en matriz Numpy.
Imprimir (real.to_records (), "\ n")
# Obtenga el tipo de datos
imprimir (tipo (real.to_records ()))

Producción:

Explicación:
Puede ver todas las columnas en el marcador de datos a la matriz Numpy y la matriz devuelta es una matriz de registros. En cada registro, también puede ver el índice.

Ejemplo 2: Convierta algunas columnas en una matriz Numpy
Use el método To_Records () para convertir las primeras 2 columnas en DataFrame a una matriz Numpy.

importación de pandas
importar numpy
# Considere el marco de datos de Pandas
real = pandas.DataFrame ([[1, "Cooking", 200],
[2, "Música", 3004],
[3, "Lloom de la mano", 1000],
[4, "Hand Loom", 2000],
[5, "Vestir", 3000]],
columnas = ['id', 'trabajo', 'salarios'],
índice = ['persona 1', 'persona 2', 'persona 3', 'persona 4', 'persona 5'])
# Use to_records () para convertir las primeras 2 columnas en el marco de datos en una matriz Numpy.
imprimir (real [[id ',' trabajo ']].to_records (), "\ n")

Producción:

Las dos primeras columnas se convierten en la matriz Numpy.

Conclusión

Discutimos qué matrices son y cómo los marcos de datos en los pandas se pueden convertir en columnas numpy. Utilizamos tres métodos para cambiar las columnas de DataFrame en una matriz. En los ejemplos de este artículo, intentamos enseñarle cómo convertir las columnas específicas o el marco de datos completo en una matriz Numpy usando la función To_numpy (). También utilizamos el método de atributo de valores y to_records () para convertir las columnas de DataFrame en una matriz Numpy.