Pandas DataFrame de Dict

Pandas DataFrame de Dict
Se puede generar un marco de datos de pandas utilizando un Python Dict (diccionario) que es un par de valores clave. En tiempo real, generalmente producimos un marco de datos Pandas importando un archivo CSV u otro recurso, pero es posible generarlo utilizando un objeto Dict (Dictionary) también.

Los pandas de Python se implementan con frecuencia tanto en la ciencia de datos/procesamiento de datos como en tareas de aprendizaje automático. Se desarrolla sobre la base de Numpy, otra biblioteca prominente de Python que respalda los cálculos científicos. En Python, los marcos de datos de Pandas son extremadamente útiles para trabajar con datos 2D (bidimensionales). Se puede construir un marco de datos de pandas en una variedad de métodos, uno de estos es extrayendo los datos de un diccionario determinado.

Ejemplo 1: Utilización de la PD de constructor predeterminada.DataFrame () para generar un marco de datos desde un diccionario

Este enfoque comienza generando un diccionario de listas de Python, que luego pasamos al PD.Método DataFrame (). El último pero no menos importante, el PD.El método DataFrame () emite un objeto Pandas DataFrame que contiene el contenido del diccionario de listas.

Ahora, pongámoslo en práctica usando las secuencias de comandos de Python.

En el archivo de Python, primero importamos la biblioteca necesaria que es pandas en esta ilustración, ya que utilizaremos las funciones de Pandas aquí.

Luego creamos un diccionario "datos" e inicializamos con tres listas con los títulos 'nombre', 'edad' e 'instituto', respectivamente. Asignamos cada lista con cuatro valores. Invocamos el método print () para mostrar el diccionario en el terminal.

La salida que obtenemos ejecutando el código anterior se adjunta aquí:


Ahora convertimos este diccionario de pandas en un marco de datos de pandas.

Con el fin de generar el DataFrame a partir de un diccionario, utilizamos el método más simple. Aquí, empleamos el constructor predeterminado PANDAS para generar un marco de datos. Se crea un objeto DataFrame con el nombre "salida" y se le asigna la salida de invocar el PD.Función DataFrame (). Los "datos" dict que creamos anteriormente se pasan como un parámetro para el PD.Función DataFrame (). La instrucción print () con el objeto "salida" como un argumento se ejecuta para mostrar el marco de datos creado a partir del diccionario especificado.

Esto nos produce el siguiente marco de datos PANDAS resultante:

Ejemplo 2: Utilización de los índices definidos por el usuario para generar un marco de datos desde un diccionario

Usando un diccionario con los índices definidos por el usuario, podríamos construir un objeto Pandas DataFrame en Python. Esta técnica comienza generando un diccionario de Python, que luego se pasa simultáneamente con la lista de índices en el PD.Método DataFrame (). El PD.El método DataFrame () finalmente devuelve un objeto Pandas DataFrame que contiene los contenidos del diccionario junto con los índices de la lista de índices proporcionado.

Exploraremos aquí cómo se usa el código Python para ejecutarlo.

Para crear un marco de datos a partir de un dict que utiliza un índices definidos por el usuario, primero debemos tener una lista de diccionario. Dado que generamos un diccionario en el ejemplo anterior, también usaremos el mismo diccionario en este caso.

Ahora, para construir el marco de datos a partir de DICT, empleamos el mismo constructor de marcos de datos de Pandas, pero con una innovación más, ya que queremos que el marco de datos se muestre con índices que le asignamos en lugar de sus índices predefinidos. Utilizamos el parámetro "índice" dentro del paréntesis con el nombre del dict, separado por una coma. Asignamos los valores al parámetro "índice" utilizando el operador de asignación "=" y colocamos los valores dentro de los soportes. Por último, empleamos el método print () para exhibir el resultado del programa.

La siguiente imagen muestra el marco de datos de salida con índices definidos por el usuario "R, X, Y, Z" en lugar del método de indexación 0.

Ejemplo 3: Genere un marco de datos a partir de un diccionario con las columnas necesarias

Para la tercera instancia, ciertas columnas se ignoran cuando generamos un marco de datos desde un diccionario. El parámetro de columnas simplifica esta tarea. Como parámetro, este argumento acepta una lista, los elementos que son las columnas especificadas. Devuelve el marco de datos solo con las columnas seleccionadas.

Veamos la forma de escribir un script de Python para generar un marco de datos utilizando las columnas de diccionario seleccionadas.

En este ejemplo, agregamos un nuevo registro al DICT creado anteriormente "Datos" como "Roll" y lo asignamos con la misma longitud de valores que utilizamos para los otros tres registros. Ahora, colectivamente, tenemos un dict con 4 registros. Cuando ejecutamos el método print (), obtenemos un diccionario con cuatro registros esta vez.

Esta es la salida:

Ahora, exploramos cómo podemos construir un marco de datos a partir de un diccionario con algunas columnas especificadas.

La función Pandas DataFrame nos proporciona un parámetro "columna" para especificar los nombres de las columnas que desea particularmente en su DataFrame. Entre los aparatos ortopédicos del PD.Método DataFrame (), pasamos el argumento "columnas" y asignamos los nombres de las columnas dentro de los soportes. Aquí elegimos dos columnas, "Nombre" e "Instituto". La instrucción print () se presenta en el terminal como el marco de datos que solo contiene las columnas mencionadas anteriormente.

Obtuvimos nuestro marco de datos con dos columnas seleccionadas.

Ejemplo 4: Genere un marco de datos a partir de un diccionario con una orientación cambiada utilizando la función from_dict ()

Similar a la forma anterior, primero generamos un diccionario de listas de Python y luego lo pasamos a DataFrame.from_dict () método. Finalmente, DataFrame devuelve un objeto Pandas DataFrame que contiene la información sobre el diccionario de las listas.from_dict () método. Hay varias alternativas cuando se utilizan específicamente la función de dict () para construir un marco de datos a partir de un diccionario. Las claves de Dict, por defecto, serán sus columnas como es el comportamiento habitual. Las claves del diccionario se muestran como filas cuando la orientación es "índice."

Aquí, primero vemos la configuración predeterminada y luego cambiamos la orientación a "índice".

Utilizamos los "datos" dict. Para generar un marcado de datos desde el diccionario, usamos el método from_dict () en su lugar. Las claves del diccionario se usan como nombres de columna de forma predeterminada cuando se usa el método from_dict (). Las entradas del diccionario se utilizan como valores de marco de datos. Por lo tanto, ejecutamos este método con la configuración predeterminada y lo pasamos el nombre de los "datos" de dict. Vemos la salida a través de la función print ().

El siguiente es el resultado generado por el script de Python anterior:

Ahora, para cambiar la orientación de DataFrame generado a partir de la lista de diccionario proporcionada, alteramos la configuración predeterminada de la función from_dict ().

Cuando suministra el argumento Orient = "índice", se construye un marco de datos utilizando los valores de los valores de dict si prefiere utilizar las teclas DICT como filas. Por lo tanto, agregamos el parámetro "Orient" para cambiar la orientación y asignar el valor "índice". Esto significa que la orientación de valores del índice se alteran de columnas a filas.

Este es el resultado de este programa:

Conclusión

Esta guía explica la generación de un marco de datos desde una lista de diccionario. Elaboramos todas las diferentes formas y aspectos de utilizar este enfoque. Con los ejemplos prácticos, le hicimos comprender cómo emplear la función Pandas DataFrame, así como la función Pandas de_dict. La implementación paso a paso dada lo ayudará a obtener la mejor experiencia de aprendizaje en Python.