El multiprocesamiento es una técnica de uso de múltiples procesadores o núcleos para realizar tareas en paralelo. En Python, el multiprocesamiento se implementa a través del módulo de multiprocesamiento. Autoriza al usuario a ejecutar múltiples tareas simultáneamente, utilizando así la potencia completa de la CPU de la máquina.
En esta guía de Python, presentaremos una guía en profundidad sobre el "pandas.read_csv ()Función con un módulo de multiprocesamiento. Se cubrirán los siguientes temas:
"Pandas.Read_csv () "Función en Python
El "pandas.read_csv ()"Es una función en el módulo pandas de Python que lee/toma un archivo CSV y recupera un objeto DataFrame que contiene los datos del CSV.
Sintaxis
pd.read_csv (filepath_or_buffer, sep = ',', header = 'infer', index_col = none, useCols = none, motor = none, skiprows = none, nrows = none)
Ejemplo 1: Leer CSV usando "Pandas.función read_csv () "
En el siguiente ejemplo, los "Pandas.La función read_csv () "se usa para leer los datos de CSV:
Código
importación de pandas
df = pandas.read_csv ('ejemplo.CSV ')
Imprimir (DF)
En el fragmento de código anterior:
Producción
Como se observó, se han mostrado el contenido del archivo CSV.
Ejemplo 2: Leer CSV usando "Pandas.read_csv () "con multiprocesamiento
El siguiente código utiliza el "pd.read_csv ()Función para leer múltiples archivos CSV en paralelo usando la biblioteca de multiprocesamiento en Python:
importación de pandas
importar multiprocesamiento
Si __name__ == '__main__':
grupo = multiprocesamiento.Piscina()
archivos = ['Ejemplo.CSV ',' Ejemplo1.CSV ',' Ejemplo2.CSV ']
Dataframes = grupo.mapa (pandas.read_csv, archivos)
Para DF en Dataframes:
Imprimir (DF)
Según el código anterior:
Producción
En este resultado, el "PD.La función read_csv () "se usa con multiprocesamiento para leer archivos CSV.
Conclusión
Para mejorar la velocidad de carga de datos, incluidos sus beneficios y limitaciones los "pd.read_csv ()La función se usa con el módulo de multiprocesamiento. El modelo de multiprocesamiento ofrece una forma de acelerar la carga de datos utilizando múltiples núcleos de CPU para cargar los datos en paralelo. Este tutorial de Python presentó una guía en profundidad sobre el multiprocesamiento de Python Read_CSV.