Pandas leer tsv

Pandas leer tsv

En "Pandas", podemos leer fácilmente archivos como podemos leer archivos CSV, podemos leer archivos TSV, podemos leer archivos de texto y también podemos leer SQL. Explicamos el archivo TSV aquí. Es un archivo de formato de texto en el que los datos tabulares se almacenan en el formato de texto. Podemos crear o leer fácilmente el archivo "Valor separado" en "Pandas" porque los "Pandas" contienen alguna función incorporada que ayuda a crear y leer los archivos TSV. Discutiremos en este tutorial los métodos que "Pandas" nos proporcionan para leer el archivo TSV. Crearemos y leeremos el archivo TSV y también convertiremos sus datos después de leer el archivo TSV en DataFrame.

Métodos para leer el archivo TSV en "Pandas"

Podemos leer el archivo TSV utilizando dos métodos de "pandas" y utilizaremos estos dos métodos en este tutorial. Los métodos se dan a continuación:

  • método read_table ().
  • método read_csv ().

Ejemplo # 01: Uso del método "Read_table ()"

Utilizamos la herramienta "Spyder" para ayudar a generar los códigos "Pandas". Antes de describir el concepto de leer el archivo TSV, hemos explicado cómo podemos crear el archivo TSV en "Pandas". Importamos la biblioteca "pandas" y luego creamos un marco de datos "new_df" en el que hemos ingresado algunas columnas. Los datos también se ingresan en cada columna. Hemos ingresado "New_Name, New_1, New_2, New_3, New_4 y New_5", que son las columnas del DataFrame "New_DF".

Luego, agregamos el método "to_csv ()" en el que agregamos el nombre del archivo. Insertamos "Newfile.TSV "que convertirá el marcado de datos que hemos creado en este código en el archivo TSV y nombrará este archivo" Newfile.TSV ". También hemos ajustado el parámetro "SEP" donde hemos agregado "\ t" como su valor. Ahora, el "nuevo archivo.se crea TSV ". Mostraremos este archivo TSV también.

Presionamos "Shift+Enter" que ejecuta los códigos y el "Newfile.luego se genera TSV ”. Este archivo TSV se muestra a continuación. Aquí, los datos del marco de datos se almacenan en forma de texto. Ahora, leeremos este archivo TSV también.

Hemos importado los "pandas" nuevamente en el nuevo archivo. Vamos a leer el archivo TSV que hemos creado anteriormente. Colocamos "my_dataframe" que almacena los datos del archivo tsv después de leerlo. Utilizamos el "PD.read_table () "Método y pasar el nombre del archivo que tenemos que leer cuál es" Newfile.TSV ". Este método leerá los datos que están presentes en el archivo TSV y generará el marco de datos de los datos del archivo TSV y luego lo guárdelo en "my_dataframe". Después de esto, el "my_dataframe" se ingresa en la "print ()". Entonces, se imprimirá en el terminal en la ejecución.

Cuando ejecutamos este código "pandas", los datos del archivo TSV se muestran como el marco de datos en el terminal. Los datos del archivo TSV se muestran a continuación que obtenemos después de leer el archivo TSV.

Ejemplo # 02: usando el método "read_csv ()"

También podemos leer el archivo TSV utilizando el método "Read_csv ()". Aquí, estamos utilizando el método "Read_csv ()" para leer el "Newfile.TSV ". Inicializamos la variable "datos" con el método "read_csv ()" y también hemos agregado dos parámetros. Primero, hemos agregado el nombre del archivo y luego establecemos el parámetro "SEP". Su valor se ajusta como "\ t". También imprimemos "datos" usando "print ()" aquí.

También muestra los datos del archivo TSV en formato DataFrame o podemos decir que en forma tabular. Ambos métodos funcionan igual y devuelven el mismo resultado.

Ejemplo # 03:

El nuevo archivo TSV se representa a continuación. Ahora, tenemos que leer los datos de este archivo TSV utilizando el método "pandas".

Hemos agregado el método "Read_table ()" para leer el archivo TSV, pero esta vez hemos agregado un parámetro más. Después de agregar el nombre del archivo TSV, que es "Educación.TSV ", también hemos agregado el parámetro" index_col "que ayuda a ajustar la columna de índice del marco de datos que se crea después de leer el archivo TSV. Ajustamos la columna "RandomName" como el índice del marco de datos. Entonces, cuando se ejecute el código, el archivo se lee, entonces el marco de datos que obtengamos tendrá el "RandomName" como su columna de índice. También mostramos los datos del archivo TSV después de leer aquí usando "print ()".

Aquí, ve que los datos anteriores del archivo TSV se muestran en forma tabular. Obtenemos este marco de datos leyendo el archivo TSV con la ayuda del método "Read_table ()". Además, tenga en cuenta que la columna "RandomName" se establece aquí como la columna de índice.

Ejemplo # 04:

Ahora, tenemos otro archivo TSV que se muestra a continuación. El archivo contiene los datos en formato de texto. También leeremos este archivo.

Hemos creado la variable "New_Columns". Agregamos algunos nombres porque queremos ajustar estos nombres como los nombres de la columna del marco de datos que obtenemos después de leer el archivo TSV que se muestra arriba. Los nombres que agregamos son "class_mammals, class_fish, class_repatiles, class_amphibians y class_birds". Después de esto, utilizamos el método "Read_table" en el que agregamos tres parámetros. Primero, hemos insertado "Animals_data.TSV ", que es el nombre del archivo TSV, y luego ajustó" ninguno "al parámetro" encabezado ". También agregamos los "new_columns" que hemos inicializado en este código al parámetro "Nombres". Entonces, los nombres que hemos agregado anteriormente se ajustan como los nombres de la columna del marco de datos. Luego, renderizamos los datos utilizando la "print ()".

Los datos que se muestran en el formato de texto en el archivo TSV anterior se convierten en DataFrame. Los nuevos nombres de columna que hemos agregado en el código se representan y los nombres de columna anteriores se convierten en la fila o valores de estas columnas.

Ejemplo # 05:

Estamos leyendo el mismo archivo que hemos mostrado en el Ejemplo 4, pero esta vez estamos saltando algunas filas después de leer el "Animals_Data.archivo tsv ". Acabamos de agregar el cuarto parámetro al método "Read_table ()", que es el parámetro "Skiprows". Contáctalo en "4" porque queremos omitir las primeras cuatro filas del marco de datos que se genera después de leer el "Animals_data.TSV ".

El marco de datos se vuelve a reproducirse, pero las primeras cuatro filas no están presentes en este marco de datos porque hemos omitido "4" filas de DataFrame.

Ejemplo # 06:

De nuevo leemos el "Animals_data.TSV "Archivo pero con el método" Read_csv () ". Hemos entrado en el "Animals_Data.TSV "y luego configure el" SEP "en" \ t ". Además, hemos ajustado el valor "ninguno" para el "encabezado" y los nombres que agregamos aquí se establecerán como nombres de la columna. Hemos omitido solo una fila usando el parámetro "Skiprows".

Se muestra el marco de datos que obtenemos y los nombres de la columna se ajustan en consecuencia, como hemos ingresado en el código. Además, la primera fila se elimina de DataFrame aquí.

Ejemplo # 07:

Se muestra un archivo TSV más. Ahora, mostraremos cómo obtener la columna seleccionada después de leer el archivo TSV.

Hemos aplicado el método "read_table ()" y agregamos un nuevo parámetro que son los parámetros "usecols" y agregamos el nombre de la columna que queremos obtener de los "autos.archivo tsv ". Hemos agregado "precio" que es el nombre de la columna. Ahora, solo accederá a los datos de la columna "Precio" y los guardará en "CarsDF". Luego, representamos los datos de la columna "Precio" aquí.

Solo se muestra una columna porque hemos ajustado el parámetro "usecols" en el método "read_table ()". Entonces, no mostró los datos completos del archivo TSV aquí.

Conclusión

Podemos leer diferentes archivos en "Pandas" con la ayuda del método "Pandas". Entonces, hemos escrito este tutorial en el que hemos explicado cómo leer el archivo TSV en "Pandas". Primero hemos explicado la creación del archivo TSV y luego hemos discutido dos métodos en este tutorial que ayuda a leer los datos del archivo TSV. Hemos explicado el método "Read_table ()", así como el método "Read_csv ()" aquí y hemos explicado cómo estos métodos ayudan a leer el archivo TSV en "Pandas". Hemos utilizado estos métodos en este tutorial agregando diferentes parámetros cada vez en cada código para obtener diferentes resultados.