Pandas de JSON

Pandas de JSON

La notación del objeto JSON o JS es un formato de datos de texto que almacena datos de texto como valor clave. En Internet, los datos se intercambian con frecuencia a través de archivos JSON. Entre los soportes rizados (), el JSON está representado. JSON usa comas para denotar la separación de cada par de clave/valor. Los datos JSON se asemejan a un diccionario de Python en apariencia. Sin embargo, los diccionarios son estructuras de datos, mientras que JSON es un formato de datos. En Pandas, la función Read_json permite la lectura de archivos JSON a Pandas DataFrame. Puede ver en los ejemplos a continuación cómo convertir los archivos JSON en Pandas DataFrame. Los archivos JSON se pueden leer en el DataFrame de Pandas.

Cómo leer archivos JSON en pandas?

Usamos la función read_json () para extraer los archivos que tienen el .Extensión JSON pasando la ruta del archivo JSON deseado dentro de los paréntesis de la función. Una vez hecho, se devuelve un "marco de datos" (una tabla con filas y columnas para almacenar datos). Podemos especificar el enlace a la ubicación del archivo en lugar de una ruta local si nos gustaría recuperar un archivo JSON que se almacena en un servidor remoto. A veces es posible que necesite transformar un archivo con un .Extensión JSON en Pandas DataFrame. El método pandas read_json (), que emplea la siguiente sintaxis, hace que sea simple lograr esto.

Sintaxis: read_json ('ruta', orient = 'índice')

Dónde,

camino: coloca la ruta del archivo json.

orientar: La orientación del archivo JSON. El valor predeterminado es "índice", pero también puede definir "dividir", "registros", "columnas" o "valores".

Veamos cómo los archivos con extensiones JSON se pueden leer en un marco de datos en los ejemplos a continuación.

Ejemplo 1: Uso de la función Read_json () para leer un archivo JSON

Primero, tenemos que descargar un archivo JSON desde el sitio web de código abierto. Simplemente podemos descargar un archivo con un .Extensión JSON de varios sitios web. En lugar de obtener un archivo JSON de Internet, alternativamente puede crear uno. Hemos descargado un archivo 'iris.JSON 'de un sitio web de código abierto. Para leer este archivo en pandas, usaremos la función read_json ().

Hemos usado el PD.read_json () método para leer el archivo local (.archivo json) en la variable 'df'. Hemos pasado la ruta del archivo JSON como una cadena a la función. Con este método, en los archivos JSON, los datos se convertirán automáticamente en DataFrame. El paquete Pandas se importó inicialmente como PD. En la línea final, exportamos las diez líneas de muestra del marco de datos. El método read_json () ha tomado las 150 filas y 5 columnas de datos del archivo de datos de Iris como entrada.

Usando el DF.función sample (), solo mostramos una muestra de 5 filas de datos en este bloque de salida. Los datos de DataFrame se recuperan aleatoriamente mediante la función Sample (). Un número definido de filas (aleatorias) se devuelve mediante el método sample (). Si no se especifica un valor, la función sample () devuelve 1 fila. Si especificamos el parámetro Orient de la función read_json () con diferentes valores como 'división', 'columnas', 'registros' o 'valores', la salida puede ser ligeramente diferente.

Ejemplo 2: Uso de la función Read_json () para leer un jsonfile desde la ubicación remota

Un archivo que se encuentra en un sistema CICS diferente (sistema de control de información del cliente). Al usar el envío de la función CICS, las solicitudes de control de archivos CICS realizados contra archivos remotos se envían al sistema remoto. Se pueden hacer aplicaciones para acceder a archivos incluso cuando se colocan en una ubicación/servidor desconocido. Al usar la URL remota en lugar de la ruta del archivo, podemos leer los datos de JSON desde una ubicación remota. El método read_json () puede leer desde ubicaciones que no sean solo archivos locales. Los archivos JSON que se mantienen en servidores distantes también se pueden leer. Simplemente podemos proporcionar la llamada de función con la ruta al archivo JSON externo.

Hemos utilizado una API HTTP de acceso público que contiene datos de formato JSON. El método read_json () también se usa para leer los datos JSON de la URL remota. Esta salida contiene una muestra de cinco filas de datos JSON utilizando el método read_json (). Estos datos provienen de una URL pública y tienen 150 filas y cinco columnas.

Ejemplo 3: Uso de PD.DataFrame () Función para leer un archivo JSON en Pandas DataFrame

En los ejemplos anteriores, descargamos el archivo de datos JSON o utilizamos la URL remota para leer los datos. Ahora, crearemos datos JSON y luego los convertiremos en un marco de datos utilizando el PD.Función DataFrame (). Antes de crear los datos JSON o Pandas DataFrame, tenemos que importar los módulos de pandas para usar sus funciones y características.

Nuestros datos json 'j_data' se crean con dos columnas: "nombre" y "edad" con valores ('1': 'brock', '2': 'fin', '3': 'John', '4': 'Moris', '5': 'Jack', '6': 'Anna') y ('1': 38, '2': 26, '3': 41, '4': 35, '5': 28, '6': 27) respectivamente. Ahora, pasaremos nuestros datos JSON dentro del PD.DataFrame () Función para leerlo en DataFrame.

Simplemente pasamos la función 'J_Data' dentro de la función DataFrame () para convertir los datos JSON en Pandas DataFrame.

Ejemplo 4: Uso de PD.DataFrame () Función para leer una estructura JSON anidada en Pandas DataFrame

Crearemos datos JSON mediante el uso de diccionarios anidados, en este ejemplo. En Python, puede usar diccionarios anidados para crear datos JSON. Hay una columna o variable en el archivo JSON para cada elemento en el diccionario exterior. La clave de cada elemento es el encabezado de la columna y sus datos son otro diccionario compuesto por las filas en esa columna específica. Crearemos un diccionario que usaremos para crear un archivo JSON con detalles sobre algunos aleatorios.

Hemos creado nuestros datos JSON anidados. Las claves de los diccionarios se especifican como "nombre", "id", "curso" y "edad". Ahora usaremos el PD.DataFrame () función para convertir el diccionario anidado en pandas dataFrame.

Nuestro diccionario anidado de datos JSON se convierte con éxito en un marcado de datos.

Ejemplo 5: Uso de la función JSON_NUNMALALE () para leer una estructura JSON anidada en Pandas DataFrame

Para leer las cuerdas JSON anidadas y devolver un marco de datos, la función "JSON_NUMALSAY ()" se usa comúnmente. El json.La función de carga () del paquete Python JSON primero debe usarse para leer la cadena JSON antes de usar el método JSON_Normaly (). La función json_normaly () recibirá este objeto JSON y devolverá los datos requeridos en forma de DataFrame.

Junto con los pandas, también hemos importado los módulos JSON y JSON_NUNMALALE para usar las funciones y características proporcionadas por ellos. Usamos el json.Cargas () para leer las cuerdas JSON. Se pasa un objeto de archivo a JSON.load (), que devuelve un objeto JSON. Se utiliza para leer datos que han sido codificados por JSON de un archivo, transformarlo en un diccionario de Python y luego deserializar el archivo original. Los datos requeridos fueron contenidos por la clave 'REC' que luego se pasa en la función JSON_NUNMALSALE () para aplanar los datos en Pandas DataFrame.

Conclusión

En este tutorial, hemos discutido los archivos de datos JSON y cómo podemos leerlos usando la función read_json (). Hemos visto la sintaxis del método read_json () para comprender cómo funciona. Implementamos algunos ejemplos en este artículo para enseñarle cómo leer un archivo JSON desde una ubicación local y remota utilizando la función Read_json () y cómo leer o convertir el archivo JSON y la estructura JSON anidada en Pandas DataFrame usando el PD PD.DataFrame () y json_normalize () función.