Pandas a la cuerda

Pandas a la cuerda
"Los enfoques de DataFrame y Series que los Pandas nos ofrecen se pueden usar para cada columna de su DataFrame y están diseñados para funcionar con cadenas. Usando el método "ApplyMap (STR)", podemos cambiar el marco de datos en cadenas, como puede ver en la muestra a continuación. Este método convertirá fácilmente un tipo de datos en un tipo de cadena. En los pandas, utilizamos principalmente "objeto" como tipo de datos para la cadena. Podemos determinar el número total de caracteres incluidos en los valores de la columna utilizando la técnica "longitud ()" en el procesamiento de cadenas."

La sintaxis para convertir DataFrame en cadena

La sintaxis para obtener la longitud de los valores de cadena presentes en una columna

Ejemplo 1: Convierta el marco de datos en cadenas utilizando ApplyMap (STR)

En Python, hay muchos métodos construidos para trabajar con cuerdas. Cada uno de estos métodos devuelve un nuevo valor sin alterar la cadena original. Para los valores de cadena, se utiliza el tipo de datos de "objeto". En Python Pandas, el tipo de datos de texto se conoce como una "cadena" o un "objeto". Una cadena puede incluir una frase de palabras o también puede ser un número. En este caso, utilizaremos "ApplyMap (STR)" para convertir un marco de datos completo en un tipo de cadena. La "Aplicar (STR)" se usa para convertir los enteros en cadenas, y el ApplyAmap (STR) se utiliza para convertir el marco de datos completo en cadenas.

Hablemos ahora sobre ejecutar nuestro código. Para ejecutar nuestro código, utilizamos la herramienta "Spyder". La biblioteca Pandas debe importarse primero como "PD". Luego construiríamos nuestro marco de datos. DataFrame se llama "datos". Tenemos tres columnas en este DataFrame "curso", "Tarifa" y "Hora de crédito". Estas columnas ahora tienen ciertos valores asignados a ellos. Tenemos una lista de cursos "Python", "OOP", "Virtual_ Studio" y "Java" en la columna "curso". Los valores para la columna "Tarifa" tenemos "35000", "30000", "20000" y "15000" y en la última columna "Credit_Hour", tenemos "3", "4", "3" y " 3 ". Por lo tanto, el "PD.DataFrame ”se está utilizando para crear el marco de datos. En esta ilustración, también estamos mostrando los "tipos de datos" de nuestro programa utilizando la función "print ()" con "DF. tipos de datos". En esencia, "DF.Datatypes ”se utiliza para crear un tipo de datos para un marcado de datos.

Ahora nos estamos moviendo al propósito principal de nuestro programa. Para convertir el marco de datos en una cadena, utilizamos "DF.aplicar map (str) ". Usando el método "ApplyMap ()", se puede aplicar una función dos veces a cualquier elemento de DataFrame. En los pandas, el "STR" se usa principalmente para recuperar los valores de los marcos de datos o la serie. Lo que ocurre en este programa es que esta función convierte los tipos de datos de "entero" a "cadena" de tipos de datos. Invocando la función "print ()", ahora estamos mostrando nuestro marco de datos y sus tipos de datos después de usar el "ApplyMap (STR)".

Se mostrarán dos marcos de datos con los tipos de datos en la imagen de salida de nuestro programa. Podemos ver en el segundo marco de datos que convirtió el marco de datos en una cadena alterando el tipo de datos. Los tipos de datos enteros ahora se muestran como tipos de datos de "objeto". Para la cadena, usamos "objeto" como tipo de datos. Este tipo de datos de cadena de "objeto" le permite ser un único valor, número o oración. En el primer cuadro de datos, los tipos de datos para las columnas "Tarifa" y "Credit_Hour" fueron enteros; Sin embargo, después de convertirse en cadenas, los tipos de datos para estas columnas se muestran como "objetos". Por último, muestra "Dtype: Object", lo que indica que se ha convertido en una cadena.

Ejemplo 2: Conversión de valores de columna a tipo de cadena utilizando la función "Astype ()"

En este ejemplo, un tipo de datos de una sola columna se convertirá en un tipo de "cadena". En el ejemplo anterior, todo el marco de datos se convirtió en cadenas, mientras que en este caso, solo una sola columna se convierte en cadenas. Convertimos la columna en el tipo de cadena usando la función "Astype ()". La función "astype ()" en pandas se utiliza principalmente cuando deseamos convertir un tipo de datos en otro tipo de datos; Sin embargo, existen otros métodos alternativos en Python para cambiar simultáneamente uno o más tipos de datos.

Ahora comienza la codificación. La biblioteca Pandas primero debe importarse como un "PD."El siguiente paso implica la creación de DataFrame con el mismo nombre que los" datos "desde la etapa anterior. Este marcado de datos tiene cuatro columnas "curso", "cargos", "duración" y "descuento". Para cada una de estas columnas, hemos enumerado ciertos valores. Los valores en la primera columna son los siguientes "Java", "Graphic_Desiging", "Android_studio" y "OOP". En la segunda columna, "Cargos", tenemos "20000", "21000", "20000" y "24000". Tenemos los valores "1_Month", "2_month" y "3_month" en la tercera columna, "duración" y en la entrada final, tenemos los descuentos "20%" y "30%" para los cursos. El marco de datos se genera utilizando "PD.marco de datos". DataFrame ahora se mostrará en la pantalla utilizando la función "print ()", y sus tipos de datos también se imprimirán utilizando el "DF.comando dtypes ”.

Ahora usaremos la función "Astipes ()" para convertir la columna en particular en una cadena. Con "Astype ()" y el nombre de la columna de parámetros "cargas" y tipo de datos "cadena" dentro de ella, estamos convirtiendo la columna "cargas" en una cadena en este caso. Ahora, aplicaremos la función "print ()" para mostrar los resultados en la pantalla.

Como podemos ver, el tipo de datos para la columna "carga" en el primer caso es "int64", lo que significa que los valores en la columna son enteros, pero cuando la columna se convirtió en una cadena, se mostró una "cadena" en frente de la "carga" como tipo de datos. El tipo de datos para una cadena en Python es un "objeto", y como las tres columnas restantes son cadenas, esto indica que ahora todo el marco de datos se transformará en cadenas.

Ejemplo 3: Determinación de la longitud de la cadena para una determinada columna en un marco de datos

En este ejemplo, determinaremos la longitud de cada valor de cadena para una determinada columna en DataFrame. Usando la función "longitud ()", podemos determinar la longitud de los valores de cadena. Este método se utiliza para determinar los caracteres totales en una cadena de entrada.

Después de importar la biblioteca Pandas para comenzar el tercer ejemplo de nuestro artículo, debemos construir un marco de datos con tres columnas, similar al ejemplo anterior, utilizando "PD.marco de datos". "Student_name", "Roll_number" y "Total_marks" están disponibles como columnas. Estas columnas se enumeran con algunos valores. "Albert", "Jhon", "Ava", "Oliver" y "Amelia" se enumeran en la primera columna, mientras que sus números de rollo se enumeran en la segunda columna como "1", "2", "3", "," 4 "y" 5 ". Y en la columna final, proporcionamos sus marcas finales "498", "470", "444", "390" y "489", respectivamente. Ahora que se ha impreso la declaración "DataFrame".

Después de esto, mostramos una línea de instrucción que dice: "Calcular la longitud de la cadena en una columna", y estamos calculando esto utilizando la función "Longitud ()". Podemos observar en nuestro marco de datos que la columna "student_name" contiene valores de cadena para que podamos determinar la longitud de sus valores. Usamos esta columna. Por lo tanto, estamos utilizando "DF [Nombre del estudiante]" con "Aplicar (len)". Esto agregará los números totales de cada uno de los valores en esta columna, que luego se mostrarán como una nueva columna en el marco de datos con el nombre "student_name_length". Vamos a recurrir a sus resultados actualmente.

Aquí se muestran dos marcos de datos, como puede ver. El segundo marco de datos tiene una columna adicional, "student_name_length", y como podemos ver, calculará el número completo de palabras y la mostrará allí. Por ejemplo, el nombre "Albert" tiene un total de 6 caracteres. Esto indica que esta función funciona con éxito en nuestro programa.

Conclusión

Pandas ofrece varios métodos para convertir un marco de datos en una cadena. Todo el marco de datos se puede convertir en una cadena utilizando "ApplyMap (Str)", que transformará el tipo de datos entero en cadena. Calcular los caracteres de los valores de cadena en una columna utilizando el método "Longitud ()" también es muy útil. Si deseamos calcular múltiples valores individuales, esta técnica de pandas nos simplificará. Será más simple para nosotros trabajar si aplicamos estrategias pequeñas y directas. Anticipamos que si empleamos estas estrategias de manera efectiva, nuestro trabajo será demasiado simple.