Pandas to_records

Pandas to_records
Pandas DataFrame es un formato de datos tabulares de tamaño de tamaño bidimensional heterogéneo con ejes con nombre. Para las operaciones matemáticas, las etiquetas de la fila y la columna siempre deben estar alineadas. La estructura de datos fundamental de los pandas es comparable a un dict en que actúa como un contenedor para elementos de serie.

DataFrame se convierte en una matriz de registros Numpy utilizando Pandas DataFrame.a la función registros (). El índice generalmente se administra como el campo inicial del registro. Discutiremos el método pandas to_records () con ejemplos en este artículo.

¿Qué es un marco de datos??

Pandas es un paquete popular de ciencia de datos de Python por una razón: proporciona estructuras de datos potentes, expresivas y flexibles que facilitan la manipulación y el análisis de datos, entre otras cosas. DataFrame es una de esas estructuras.

Un marco de datos es una estructura de datos bidimensional en la que los datos se representan en forma de filas y columnas. Un marcador de datos de Pandas está compuesto por tres componentes principales: datos, filas y columnas.

Debido a que proporcionan una forma flexible y fácil de almacenar y trabajar con datos, los marcos de datos son una de las estructuras de datos más utilizadas en el análisis de datos modernos.

Para crear un marcador de datos Pandas, listas, series, dicts, ndarrays numpy y otro marco de datos se puede utilizar para crear un marco de datos PANDAS.

¿Cuál es la sintaxis de los pandas?.Marco de datos.to_records () funciones?

El método To_Records () es para convertir un marco de datos en una matriz de registros Numpy relevante. La función to_records () en pandas tiene la siguiente sintaxis.

# Marco de datos.to_records (index = true, column_dtypes = none, index_dtypes = none)

Todos los detalles sobre los parámetros están en la siguiente sección.

Índice

Incluya el índice en la matriz de registros resultante, que se puede almacenar en el campo 'Índice' o accedido a través de la etiqueta de índice, si se establece uno.

Column_dtypes

Si el tipo de datos es una cadena o un tipo, se usará para almacenar todas las columnas.

Index_dtypes

Si el tipo de datos es una cadena o tal vez un tipo, se usará para contener todos los niveles de índice. Si se trata de un diccionario, se utilizan la asignación de nombres de niveles de índice, así como índices, para especificar tipos de datos. Solo si index = true es este mapeo utilizado.

Discutamos el tema en profundidad con diferentes ejemplos. Puede implementar estos ejemplos y ver para comprender el concepto general de una mejor manera.

Ejemplo 1:

DataFrame.To_Records () La función de Python es alterar el marco de datos especificado en una matriz de registros Numpy. Considere el código dado a continuación como ejemplo.

Construimos un marco de datos con valores para tres cualidades diferentes: 'salario, nombre del empleado y edad'; 39000, 44000, 25000 y 55000 son los valores para el salario de la propiedad.'Alex, Andrew, Zack y Kim se encuentran entre los valores para el atributo' Nombre del empleado.'

De la misma manera, el atributo de edad comprende los valores 39, 44, 25 y 55. El índice fue construido y establecido. El marco de datos se imprime luego.

importación de pandas
d_frame = pandas.DataFrame ('salario': [39000, 44000, 25000, 55000],
'Nombre del empleado': ['Alex', 'Andrew', 'Zack', 'Kim'],
'Age': [39, 44, 25, 55])
index_ = pandas.date_range ('2020-08-05 07:30', períodos = 4, freq = 'h')
D_FRAME.índice = index_
imprimir (d_frame)

El salario, el nombre del empleado y los valores de edad, así como la fecha y la hora, se muestran en la captura de pantalla a continuación.

En la siguiente captura de pantalla, se muestra el marco de datos especificado a una representación relevante de la matriz de registros numpy.

importación de pandas
d_frame = pandas.DataFrame ('salario': [39000, 44000, 25000, 55000],
'Nombre del empleado': ['Alex', 'Andrew', 'Zack', 'Kim'],
'Age': [39, 44, 25, 55])
index_ = pandas.date_range ('2020-08-05 07:30', períodos = 4, freq = 'h')
D_FRAME.índice = index_
imprimir (d_frame)
Resultado = d_frame.to_records ()
Imprimir (resultado)

La siguiente imagen adjunta explica que DataFrame.La función to_records () se utiliza para alterar el marco de datos a una representación de matriz de registros numpy relevante.

Ejemplo 2:

Veremos cómo usar DataFrame.función to_records () en el segundo ejemplo. El código es similar al mencionado anteriormente. Hemos importado el módulo pandas primero esta vez, luego generamos el marco de datos.

El índice se formó luego como se muestra en el código: index_ = ['primera fila', 'segunda fila', 'tercera fila', 'cuarta fila' y 'quinta fila']]. Finalmente, hemos establecido el índice e imprimimos los resultados de DataFrame. Mira la última línea del código.

importación de pandas
dta_frame = pandas.DataFrame ("1": [9, 3, 4, ninguno, 6],
"2": [8, 1, 22, 35, ninguno],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, ninguno, 1, 9])
index_ = ['first_row', 'Second_row', 'Third_row', 'Fourth_row', 'Fifth_row']
dta_frame.índice = index_
imprimir (dta_frame)

Puede ver el resultado aquí, que incluye el índice y el marco de datos.

Mediante el uso de DataFrame.a la función registros (), convertimos el marcado de datos dado. Puede verlo en la siguiente captura de pantalla adjunta.

importación de pandas
dta_frame = pandas.DataFrame ("1": [9, 3, 4, ninguno, 6],
"2": [8, 1, 22, 35, ninguno],
"3": [19, 9, 17, 6, 9],
"4": [55, 2, ninguno, 1, 9])
index_ = ['first_row', 'Second_row', 'Third_row', 'Fourth_row', 'Fifth_row']
dta_frame.índice = index_
imprimir (dta_frame)
Resultado = dta_frame.to_records ()
Imprimir (resultado)

Después de realizar cambios mínimos en el código de referencia anterior, este es el resultado. DataFrame.La función to_records () altera un marcado de datos específico a una representación de matriz de registros Numpy relevante.

Ejemplo 3:

En nuestro último ejemplo, veremos cómo convertir un marco de datos de pandas utilizando la técnica numpy: los pandas. El método To_Numpy se puede usar para transformar esta estructura de datos en una matriz Numpy.

Puede ver en el código que hemos importado los módulos pandas y numpy, que son esenciales para que el código se ejecute. Construimos el marco de datos después de importar los módulos. Hay 5 filas y 3 columnas de datos en el marco de datos.

Después de eso, DataFrame se transforma en una matriz Numpy. Se muestran el marcador de datos transformado y su tipo.

importación de pandas
importar numpy
data_frame = pandas.Marco de datos(
Data = Numpy.aleatorio.Randint (
0, 10, (5,3)),
columnas = ["A", "B", "C"])
cls_res = data_frame.to_numpy ()
Imprimir (CLS_RES)
Imprimir (tipo (CLS_RES))

La salida está en la siguiente captura de pantalla. Los valores de datos dentro de las 5 filas y 3 columnas de DataFrame construidas se pueden ver aquí. La clase también se muestra en la última línea de la salida. Como se ilustra anteriormente, el método Pandas DataFrame en Numpy () convierte un marco de datos en una matriz Numpy.

Conclusión:

La función To_record () en Python se describe en este artículo. El marco de datos de Pandas también se enseña bien con ejemplos. También se explica los pasos para convertir un marco de datos utilizando el método DataFrame to_records ().