Columnas divididas de pandas por delimitador

Columnas divididas de pandas por delimitador
"Pandas" es un paquete de Python. Es flexible y tiene un diseño expresivo estructurado con datos para trabajar con datos en diferentes modales. Además, los marcos de datos de panda son excelentes para manipular los datos. La mayoría de las veces, trabajamos en datos que tienen una columna que contiene un valor de cadena delimitado, por ejemplo, "X, Y, Z" y queremos que estén en columnas separadas. Esto es posible mediante el uso de una función de pandas que discutiremos en este artículo. Aprenderemos a dividir una columna de texto en columnas separadas individualmente. Para esa función de pandas de la columna dividida por delimitador se debe usar. Su sintaxis es como la función "str ()" de la cadena Python. Pero los pandas divididos por columna, divide los datos de todo el marco de datos. Para la implementación del código, utilizaremos la herramienta "Spyder". Como es un software amigable para el lenguaje de Python.

Sintaxis

Stri.dividir()

La sintaxis anterior se usa para dividir el texto en columnas en un marco de datos. Funciona dividiendo la columna por delimitador en varias columnas. Implementamos la sintaxis de la serie Pandas "STR.Función Split () "en la columna" Dirección "y pasarla con la" coma "para la separación de la columna que queremos dividir.

Parámetros

Hay algunos parámetros que usaremos más adelante en los ejemplos de la columna Panda Split por Delimiter:

Expandir: Expande el valor de la cadena en una columna separada.

Condiciones: si es "verdadero", devuelve el marco de datos; Si "falso", devuelve la serie/índice (cadenas).

"N" limita el número de una división en la salida.

Las siguientes son las formas en que se pueden realizar los pandas divididos por delimitador:

  • columna dividida de pandas por delimitador (agregue una nueva columna al "DF").
  • columna dividida de pandas por delimitador (dentro de una lista).
  • columna dividida de pandas por delimiter especificando el número de divisiones.

Creación de DataFrame para la implementación de ejemplos de la columna dividida de Pandas por delimitador

Después de abrir la herramienta "Spyder", importe la Biblioteca Pandas como "PD". Ahora, comience a crear el "DF". El "DF" es la abreviatura de "DataFrame". El "DF" tiene la dirección completa de algunas áreas de los diferentes países, como: "5632 Main Street, Park, Canadá"; "2525 Downtown, sal mina, Italia"; "7896 Sky View, apartamento, México"; y el "3988" Sunshine Road, Villa, Japón ". Aquí, vemos que los datos están separados por columna. En los próximos ejemplos, aprenderemos cómo dividir esas áreas de "coma" en las columnas por separado utilizando la función Pandas dividida por delimitador.

La salida muestra la creación de datos de datos de los datos proporcionados en el código.

Ejemplo 01: columna dividida de pandas por delimitador en múltiples columnas

En este ejemplo, dividiremos las columnas de datos de texto en múltiples columnas por delimitador de la función dividida de pandas. DataFrame consiste en las direcciones de las calles como: "5623 Main Street, Shopping Mall, Turquía"; "4585 en el centro, área escolar, Francia"; "0032 Sky View, College, Indonesia"; y "1125 Sunshine Next, University, China". Todas estas direcciones son de diferentes áreas que separaremos esas áreas de "coma" de texto en una columna separada. Podemos decir que podemos tomarlo como el operador de reconocimiento de separador para dividir. Aplicaremos la función dividida de pandas en la "dirección". Entonces, la coma en este caso se dividirá. Además, tenemos que asegurarnos de pasar los parámetros como "expandir" para el valor "verdadero".

La salida muestra las columnas separadas de la dirección en la columna "0". En la columna "1", tenemos las áreas particularmente y en la columna "2", tenemos los nombres de los países. Se crea un marco de datos bien presentado y organizado.

Ejemplo 02: columna dividida de pandas por delimitador dentro de una lista

Crearemos un marco de datos para la implementación de ejemplo de la columna Pandas Split por Delimiter esta vez "dentro de una lista". DataFrame es como "7854 Main Street, Tire Shop"; "8009 en el centro, Sweet Shop, Tokio"; "1003 Sky View, heladería, Sri Lanka"; y "7009 Sunshine Next, High School, África". Ahora, no pasaremos el parámetro verdadero en este ejemplo para hacer la división dentro de la columna.

Aquí en la salida, la división se realiza dentro de las columnas. Pero esto no resultó mostrar la creación de columnas separadas porque la división está dentro de una lista. Si queremos dividir en una columna separada, el último ejemplo mostrará.

Ejemplo 03: columna dividida de pandas por delimitador (agregue una nueva columna al "DF")

En este ejemplo, agregaremos otra columna a DataFrame al lado de las columnas separadas que se pueden hacer fácilmente mediante la columna dividida de pandas y por la función delimitadora. DataFrame es el mismo que el último ejemplo. Ahora, hemos seleccionado el "Estado" como una columna adicional. Tenemos todo el marco de datos y otra columna en una columna separada. De esta manera, si queremos cambiar o realizar cualquier análisis de esa cantidad específica de datos, podemos tenerlo por separado sin afectar los datos originales.

La pantalla ha separado columnas y agrega la columna de "estado" en una columna separada de sí misma. Esto es cuatro por cuatro columnas, lo que significa 2 filas y 2 columnas.

Ejemplo 04: columna dividida de pandas por delimitador especificando el número de divisiones

En el ejemplo 01 anterior, hemos hecho la división de las columnas de texto proporcionando la dirección en la ocurrencia de la "coma" delimitador, lo que resultó en la separación de tres columnas. Del mismo modo, podemos especificar el número de divisiones que queremos. En este caso, estaremos aprendiendo a hacerlo. DataFrame consiste en las direcciones como: “4585 12th Calle, supermercado, Nueva York "," 7000 Portlands, aeropuerto, Italia "; "4555 13th Calle, estación de tren, España ”; y el "Comercial 7777 Next, Candy Shop, Australia". El "n = 1" denota que queremos dividir el marco de datos una vez. La división ocurrirá en la primera ocurrencia, las otras columnas izquierdas se verán juntas.

La salida muestra la división de DataFrame utilizando la columna dividida de pandas mediante la función delimitadora y denotando n como "1". Entonces, la división se hace solo una vez. Las ciudades y los estados están en la segunda columna y la primera ocurrencia de las direcciones está en la primera columna.

Conclusión

La columna dividida de la función pandas por el delimitador es útil y eficiente. Como muchas veces, según la necesidad, queremos tener los datos en una columna o convención específica por la necesidad. Entonces, todo esto se puede hacer usando la columna Pandas Split por delimitador. Hemos realizado funciones tales como la división de columnas múltiples, dividiendo dentro de la columna, dividiendo y agregando una nueva columna y, por último, dividiendo especificando el número de divisiones.