Columna de caída de pandas por nombre

Columna de caída de pandas por nombre
"Pandas" es un kit de herramientas de código abierto de Python que simplifica y acelera el análisis de datos. DataFrame, una estructura de datos bidimensional que contiene datos en filas y columnas, como una tabla en una base de datos, es una de las principales características de los pandas.

Cuando se trabaja con Dataframes, con frecuencia se requiere alterar un marco de datos PANDAS para eliminar columnas irrelevantes o para optimizar los datos para la construcción del modelo. A veces, ciertas columnas no serán útiles para su análisis. Debe comprender cómo eliminar esas columnas del marco de datos PANDAS proporcionado. Las columnas se descartan de los modelos de aprendizaje automático cuando son irrelevantes o no mejoran el modelo.

Método pandas drop ()

En los pandas, la manipulación de la columna puede ocurrir de varias maneras. Por ejemplo, utilizando el "DataFrame.Método Drop ”, se pueden eliminar columnas especificadas. Es el método más utilizado para eliminar varias columnas en pandas. Como su nombre lo indica, este método fue diseñado para facilitar la eliminación de columnas o filas simples o múltiples. En este tutorial detallado, explorará cómo soltar columnas simples o múltiples de un marco de datos de pandas utilizando sus nombres.

La sintaxis para esta función se proporciona a continuación:

Aquí, "Column_name" es el nombre de la columna que queremos caer. El "eje" Especifica qué eje debe eliminarse. El eje 1 representa columnas, mientras que el eje 0 representa filas. El "en su lugar" indica que la operación de caída debe ocurrir en el mismo marco de datos en lugar de generar una copia del marco de datos después de la caída.

Aprenderá a utilizar este método para soltar columnas por nombre en este tutorial.

Ejemplo # 1: Utilización de pandas "DataFrame.método drop () "para soltar una sola columna por nombre

En este ejemplo, realizaremos una implementación práctica de este método para eliminar una sola columna por nombre de DataFrame.

Para comenzar a escribir el script de Python para la ejecución de este ejemplo, necesitamos tener un ensamblador relevante en el que podamos ensamblar el código. Tenemos una variedad de opciones, pero la que hemos elegido es la herramienta "Spyder". Necesitas abrir el "spyder-ide.organizar el sitio web y descargar la herramienta "Spyder" según los requisitos de su sistema operativo. Hemos estado utilizando el sistema operativo de Windows, por lo que descargamos la configuración "Spyder" correspondiente. Luego, simplemente lo instalamos, y una vez que se complete el proceso de instalación, encontraremos una interfaz de usuario de la herramienta. Hemos abierto un nuevo archivo haciendo clic en la opción "nuevo archivo", o incluso puede presionar el "Ctrl+N" para abrir el nuevo directorio.

Ahora, tenemos que cargar las bibliotecas de requisitos previos requeridos para el script. La biblioteca necesaria para la ejecución de este método es el "pandas".

Hemos utilizado el "PD.Método DataFrame () ", que proporciona la biblioteca Pandas. Como hemos mencionado, "PD" es un alias para los pandas, mientras que el "marco de datos" es la palabra clave para generar el marco de datos. Entonces, empleamos este método para construir nuestro marco de datos básico. Este marco de datos tiene tres columnas "planta", "precio" y "disponibilidad". La columna "Planta" contiene los nombres de diferentes plantas, que son "Morina", "Oleander", "Acacia", "Olive", "Hopbush" y "Mango". La columna "Precio" almacena los precios de las plantas, que son "500", "700", "1300", "600", "800" y "1150". La última columna, "disponibilidad", dice si la planta está actualmente disponible o no como "y", "n", "y", "y", "n" y "y". Aquí, "y" representa "sí" y "n" representa "no". La longitud de los valores en cada columna de DataFrame debe mantenerse igual, que es seis en este caso. Ahora necesitamos un objeto DataFrame para mantener el contenido en este marco de datos en él. Entonces, creamos un objeto de DataFrame "bosque" y le dimos el resultado generado al llamar al "PD.Método DataFrame () ". Podemos obtener el marco de datos utilizando el objeto "bosque". Ahora, para ver este DataFrame recién creado, tenemos un método de Python para mostrar la salida, que es "print ()". Invocamos el método "print ()" y hemos agregado el nombre del marco de datos entre sus paréntesis.

Para ejecutar este script Pandhon Pandas, necesitamos presionar la opción "Ejecutar archivo". Alternativamente, puede presionar las teclas "Shift+Enter" para ejecutar el programa. Aquí, podemos ver el marco de datos que acabamos de crear con tres columnas y seis filas que se muestran en la consola de la herramienta Spyder.

Nuestro marcado de datos ha sido construido, y ahora podemos ejecutar las operaciones requeridas en él. Se realizará la tarea principal, que es soltar una sola columna por nombre utilizando el "DataFrame de datos PANDAS.método drop () ". Primero, tenemos que escribir el nombre de nuestro DataFrame, que es el "bosque" y luego el ".La función drop () "se invoca con ella. Estamos utilizando el método "drop ()" con tres parámetros aquí "column_name", "eje" y el "innace". El nombre de la columna que hemos proporcionado que queremos caer es la columna "Precio". El "eje" se establece en "1", que indica que la caída está realizada en cuanto a columna.

Y el último parámetro, "inplace", implica que las manipulaciones que hagamos aparecerán en el marco de datos real, y no se generará ninguna copia del marco de datos. La columna que lanzaremos se eliminará directamente del marco de datos original. Por último, utilizamos el método "print ()" para mostrar el marco de datos actualizado original después de eliminar una columna de él.

El fragmento de código anterior, cuando se ejecuta en Python, nos proporciona el marco de datos original con alguna modificación. Podemos observar que este marco de datos tiene solo dos columnas, mientras que la inicial tenía tres columnas. Por esta razón, la columna "Precio" se ha omitido desde DataFrame.

Ejemplo # 2: Utilización de pandas "DataFrame.método drop () ”para soltar múltiples columnas por nombre

Hemos elaborado en la técnica para soltar una sola columna por nombre utilizando el "DataFrame de datos PANDAS.método drop () ". Ahora exploraremos soltar múltiples columnas con la misma técnica.

Para este ejemplo, hemos utilizado el DataFrame construido en la instancia anterior. Como le hemos demostrado, el "bosque" de DataFrame tiene tres columnas "planta", "precio" y "disponibilidad". Después de imprimir el marco de datos, hemos aplicado el "marco de datos.función drop () ”. Hemos mencionado el nombre del "bosque" de DataFrame con el ".método drop () ".

El título de esta ilustración dice que estamos dejando caer más de una columna aquí. Las columnas que hemos elegido de DataFrame to Strens son "precio" y "disponibilidad". Entre las paréntesis del "bosque.Función Drop () ", hemos suministrado la lista de columnas, establecemos" eje "en" 1 "para columnas, y" inplace "se establece" verdadero "para representar los cambios en el marco de datos original. Finalmente, hemos llamado al método "print ()" para mostrar el resultado.

En la imagen de salida, puede ver que el marco de datos ahora se muestra con solo una columna porque el resto de las dos columnas se han eliminado.

Conclusión

Dejar caer una columna usando su nombre es una estrategia muy útil y efectiva en Python Pandas. Hace que el análisis de datos sea mucho más fácil y libre de complicaciones. Este artículo lo ayudará a comprender este concepto y le proporcionará los mejores enfoques para lograr el resultado deseado. En este artículo, hemos explicado e implementado la técnica de eliminar una sola columna por nombre y soltar varias columnas por nombre. Ejecutamos el ejemplo de código Python en la herramienta "Spyder". Aprender a utilizar los pandas "DataFrame.El método Drop () "sería beneficioso y útil para sus proyectos de análisis de datos.