Tipo de datos de cadena en pandas
Pandas usa el tipo de datos de objeto de forma predeterminada para almacenar cadenas. Las cadenas y los tipos de datos mixtos son manejados por el tipo de datos del objeto, sin embargo, no es explícito en particular. Ha habido un tipo de datos dedicado de cadena en pandas en la versión 1.0. Aunque este tipo de datos aún no proporciona ningún recurso explícito o mejoras de rendimiento, el equipo de desarrollo de Pandas dijo que esto sucederá en el futuro. Como resultado, este tutorial empleará exclusivamente el tipo de datos de cadena. Use el "STR" en lugar de la cadena siempre que sea posible si está utilizando una versión de Python menos de 1.0.
Cómo cambiar la columna Pandas a la cadena
Se pueden usar diferentes funciones para cambiar la columna en Pandas a String DataType. Usar el método Astype () es la forma más común de hacerlo. Echemos un vistazo a la función Astype () para ver cómo funciona.
Sintaxis: DF.Astype ("column_name": str, errores = "asumir")
df.astype (): Un método para llamar a la función pandas astype.
"Nombre de la columna": STR: Columnas se convertirán en un formato diferente (string dataType). El nombre de la columna es la columna cuyo tipo de datos se va a cambiar. Los valores de la columna deben transformarse en el tipo de datos requerido, que es una cadena. Cualquier tipo de datos incorporado de python o tipo de datos es aceptable.
errores = 'elevar': Para definir cómo se deben manejar las excepciones durante la converción. Solo se convierten los valores posibles de las células; "Raise" mostrará un error, y "ignorar" lo ignorará.
Hemos visto la sintaxis del método Astype (). Ahora, en los siguientes ejemplos, aprenderá cómo usar el Astype (), otras funciones y los atributos para convertir las columnas de DataFrame en cadenas.
Ejemplo 1: Uso del método Astype ()
Un objeto pandas se puede convertir a un tipo de datos específico utilizando el método Astype (). Cualquier columna existente apropiada se puede convertir a un tipo categórico utilizando la función Astype (). Cuando necesitamos convertir el tipo de datos de una columna específica a otro tipo de datos, el método Astype () es muy útil. En este ejemplo, cambiaremos el tipo de datos de columna a la cadena utilizando la función Astype () para que tengamos que crear un marcado de datos. Para crear un marco de datos, primero importaremos la biblioteca Pandas para usar sus características y funcionalidades.
Creamos nuestro marco de datos pasando un diccionario al PD.DataFrame () función como argumento. Las claves del diccionario se convierten en las etiquetas para cada columna después de pasarlas en el PD.La función DataFrame () y los valores de las claves se convierten en los valores de las columnas de DataFrame. Para visualizar DataFrame, usamos la función print ().
En el DataFrame anterior, tenemos cuatro columnas de DataFrame. La primera columna "Estudiante" contiene los nombres de los estudiantes: "Jack", "Tony", "Marty", "Alex", "Rob". En la segunda columna "edad", las edades de cada estudiante se almacenan "16, 15, 18, 17, 17". Mientras que la columna "Tarifa" almacena la tarifa de cada curso "7000.0, 6500.0, 7100.0, 7000.0, 6900.0 ". El tema de la columna consiste en los nombres de las asignaturas: "inglés", "estadísticas", "matemáticas", "inglés", "ciencia" . Podemos verificar el tipo de datos de cada fila utilizando el atributo dtypes de la siguiente manera:
El tipo de datos de las columnas "estudiante" y "asunto" es "objeto".Mientras que el tipo de datos de las columnas "edad" y "tarifa" es int64 y float64, respectivamente. Ahora, cambiemos el tipo de datos de la columna "tarifa" de flotación a cadena.
A medida que aplicamos el método Astype () y pasamos el tipo de datos "cadena" para cambiar el tipo de datos de la columna "Tarifa", veamos si la columna se convierte en una cadena o no.
Puede notar que el tipo de datos de la columna "tarifa" se convierte en cadena desde float64.
Ejemplo 2: usando el método map () y aplicar ()
El método map () se utiliza para convertir los valores de la serie en sus entradas correspondientes. Para cambiar cada valor de datos en una serie con un valor diferente, se utiliza la función map (). Ese valor se puede obtener de una serie, un dict o una función, mientras que los usuarios pueden pasar una función y aplicarla a cada valor de la serie Pandas utilizando la función pandas aplic (). Sin embargo, estas funciones se pueden usar para cambiar el tipo de datos de las columnas. Usemos el mismo marco de datos que creamos en el ejemplo anterior.
Ahora, verificamos los tipos de datos de las columnas utilizando el atributo dtypes.
Ahora, cambiemos los tipos de datos de la columna "edad" utilizando la función MAP () y cambiemos los tipos de datos de la columna "Tarifa" con la función Aplicar ().
Aplicamos tanto la función map () como la función Aplicar () a la columna "tarifa" y "edad", respectivamente. Usemos el atributo dtypes en nuestro marco de datos "DF" para ver los resultados.
Aquí, podemos ver que el tipo de datos de "cadena" no se puede usar al usar el método map () y aplicar (). Ambas columnas "edad" y "tarifa" ahora se convierten en el tipo de datos de objetos como resultado. Sin embargo, los pandas usan el tipo de datos de objeto de forma predeterminada para almacenar las "cadenas", pero queremos el resultado en el tipo de datos "cadena". Debido a esto, no recomendaríamos usar estos métodos en las nuevas versiones de Python para cambiar los tipos de datos de las columnas.
Ejemplo 3: Uso del método Astype ()
Por último, pero no menos importante, usamos el método Astype () para cambiar el tipo de datos del DataFrame en cadenas. Hemos visto cómo cambiar los tipos de datos de columnas específicas del marco de datos en "cadena" en los ejemplos anteriores. Ahora, cambiamos los tipos de datos de todas las columnas a "cadena" en este ejemplo. Nuevamente, utilizamos el marco de datos "DF" para este ejemplo.
Al usar el atributo dtypes, primero verifiquemos los tipos de datos de nuestras columnas de marco de datos "DF".
Ninguna de las columnas en el DataFrame anterior tiene una columna con un tipo de datos de cadena. Ahora, usamos el método Astype () para cambiar el tipo de datos de todas las columnas de DataFrame en el tipo de datos "cadena".
Como se puede ver, simplemente utilizando la propiedad Astype () con DataFrame al pasar la "cadena" dentro de la función, puede cambiar fácilmente todas las columnas de DataFrame a String.
Los tipos de datos de cada columna se cambian a cadena.
También podemos usar la función ApplyMap () o la .valores.astype () para convertir los tipos de datos, pero devolverán el tipo de datos "objeto" en lugar de "cadena".
Conclusión
En este tutorial, discutimos qué es una cadena de tipo de datos en Python y cómo puede cambiar la columna Pandas en la cadena. Aprendimos la sintaxis de la función Astype () para comprender cómo funciona. Después de pasar por este tutorial, es posible que pueda cambiar las columnas en la cadena usted mismo. Implementamos diferentes ejemplos para enseñarle cómo se puede usar el método ASTIPE el map () y aplicar () para cambiar las columnas de pandas a los tipos de datos de cadena.