Instale los cuadernos Anaconda Python y Jupyter para la ciencia de datos

Instale los cuadernos Anaconda Python y Jupyter para la ciencia de datos

Comenzando con Anaconda

Para explicar qué es Anaconda, citaremos su definición del sitio web oficial:

Anaconda es un administrador de paquetes gratuito y fácil de instalar, administrador de entornos y distribución de Python con una colección de más de 1,000 paquetes de código abierto con soporte comunitario gratuito. Anaconda es la plataforma agnóstica, por lo que puede usarlo, ya sea en Windows, MacOS o Linux.

Es fácil asegurar y escalar cualquier proyecto de ciencia de datos con Anaconda, ya que le permite tomar un proyecto de forma de forma nativa desde su computadora portátil hasta el clúster de implementación. Aquí también se puede mostrar un conjunto completo de características con la imagen oficial:

Enterprise de Anaconda

Para mostrar en breve qué es Anaconda, aquí hay algunos puntos rápidos:

  • Contiene Python y cientos de paquetes que son especialmente útiles si está comenzando o experimentado con ciencia de datos y aprendizaje automático
  • Viene con Conda Package Manager y entornos virtuales que el desarrollo es muy fácil
  • Le permite comenzar con el desarrollo muy rápido sin perder su tiempo para configurar las herramientas para la ciencia de datos y el aprendizaje automático

Puedes instalar Anaconda desde aquí. Instalará automáticamente Python en su máquina para que no tenga que instalarlo por separado.

Anaconda vs jupyter cuadernos

Cada vez que trato de discutir Anaconda con personas que son principiantes con Python y Data Science, se confunden entre Anaconda y Jupyter Notebooks. Citaremos la diferencia en una línea:

Anaconda es gerente de empaquetación. Jupyter es un Capa de presentación.

Anaconda intenta resolver el infierno de dependencia En Python, donde diferentes proyectos tienen diferentes versiones de dependencia, por lo que no hacer que diferentes dependencias de proyectos requieran diferentes versiones, que pueden interferir entre sí.

Jupyter intenta resolver el tema de reproducibilidad en el análisis habilitando un enfoque iterativo y práctico para explicar y visualizar el código; mediante el uso de la documentación de texto rica combinada con representaciones visuales, en una sola solución.

Anaconda es similar a Pyenv, Venv y Minconda; Está destinado a lograr un entorno de Python que sea 100% reproducible en otro entorno, independientemente de las otras versiones de las dependencias de un proyecto disponibles. Es un poco similar a Docker, pero restringido al ecosistema de Python.

Jupyter es un Increíble herramienta de presentación para trabajo analítico; Donde puede presentar el código en "bloques", se combina con descripciones de texto ricas entre bloques, y la inclusión de la salida formateada de los bloques, y los gráficos generados en un asunto bien diseñado a través del código de otro bloque.

Jupyter es increíblemente bueno en el trabajo analítico para garantizar reproducibilidad En la investigación de alguien, para que cualquiera pueda regresar muchos meses después y comprender visualmente lo que alguien intentó explicar, y ver exactamente qué código condujo qué visualización y conclusión.

A menudo en el trabajo analítico, terminará con toneladas de cuadernos a medias, explicando ideas de prueba de concepto, de las cuales la mayoría no conducirá a ningún lado inicialmente. Algunas de estas presentaciones podrían meses más tarde, o incluso años más tarde, presente una base para construir para un nuevo problema.

Uso de Anaconda y Jupyter Notebook de Anaconda

Finalmente, echaremos un vistazo a algunos comandos con los que podremos usar Anaconda, Python y Jupyter en nuestra máquina Ubuntu. Primero, descargaremos el script de instalador desde el sitio web de Anaconda con este comando:

curl -o -k https: // repo.anaconda.com/Archive/Anaconda3-5.2.0-Linux-X86_64.mierda

También debemos garantizar la integridad de datos de este script:

Sha256sum anaconda3-5.2.0-Linux-X86_64.mierda

Obtendremos la siguiente salida:

Verifique la integridad de Anaconda

Ahora podemos ejecutar el guión de Anaconda:

Bash Anaconda3-5.2.0-Linux-X86_64.mierda

Una vez que acepte los términos, proporcione una ubicación para la instalación de paquetes o simplemente presione Enter para que tome la ubicación predeterminada. Una vez que se completa la instalación, podemos activar la instalación con este comando:

fuente ~/.bashrc

Finalmente, pruebe la instalación:

lista

Hacer un ambiente de Anaconda

Una vez que tenemos una instalación completa en su lugar, podemos usar el siguiente comando para crear un nuevo entorno:

conda crea --name my_env python = 3

Ahora podemos activar el entorno que hicimos:

fuente activar my_env

Con esto, nuestro símbolo del sistema cambiará, reflejando un entorno de Anaconda activo. Para continuar con la configuración de un entorno Jupyter, continúe con esta lección, que es una excelente lección sobre cómo instalar cuadernos Jupyter en Ubuntu y comenzar a usarlos.

Conclusión: Instale los cuadernos Anaconda Python y Jupyter para la ciencia de datos

En esta lección, estudiamos cómo podemos instalar y comenzar a usar el entorno Anaconda en Ubuntu 18.04, que es un excelente gerente de entorno, especialmente para principiantes para la ciencia de datos y el aprendizaje automático. Esta es solo una introducción muy simple de muchas lecciones por venir para Anaconda, Python, Data Science y Machine Learning. Comparta sus comentarios para la lección conmigo o con el identificador de Twitter de Linuxhint.