Cómo instalar y usar Orange en Linux

Cómo instalar y usar Orange en Linux

Orange es un software de minería de datos que proporciona a sus usuarios soluciones únicas y listas para usar a los problemas de análisis de datos cotidianos. Utiliza una interfaz de programación visual que permite a los usuarios comprender y controlar sus flujos de trabajo de datos de manera visualmente intuitiva. En esencia, utiliza módulos basados ​​en Python que le permiten heredar su funcionalidad central para implementarse en los datos que se cargan en él. Además de las técnicas de minería de datos, también proporciona un excelente soporte para los algoritmos de aprendizaje automático que ayudan a los usuarios a generar información aguda a partir de sus datos.

Orange se usa ampliamente en el dominio de educación e investigación y es considerada una gran herramienta por grupos de investigación no basados ​​en la programación. La interfaz de programación visual llamada Lienzo naranja Hace que sea fácil hacer el trabajo incluso para las personas que no tienen una experiencia integral en programación. El lienzo funciona permitiendo que los usuarios coloquen widgets que representan alguna funcionalidad central de un flujo de trabajo de análisis de datos. Estos widgets se pueden apilar uno tras otro para crear una tubería completa por la que los datos se mueven y genera la salida requerida.

Al final de este artículo, podrá:

    1. Descargue e instale Orange en su máquina Linux
    2. Comprender la importancia que posee para la comunidad de ciencias de datos
    3. Aprenda las diferentes formas en que este conjunto de herramientas puede ser beneficioso para usted

Instalación

Como se discutió anteriormente, Orange usa módulos Python, por lo que se puede descargar fácilmente desde el Python Package Manager llamado pepita. Para usar PIP, primero debemos descargarlo e instalarlo.

Siga los pasos para la instalación completa de Orange en su máquina Linux.

1. Primero, necesitamos actualizar el local apto Repositorios usando el siguiente comando:

$ sudo apt-get actualización

Debe obtener una salida que sea similar a esta:

2. Después de actualizar el apto Repositorios locales, ahora instala algunos paquetes de Python que lo ayudarán a descargar e instalar Naranja. Esto se hace ya que Orange es esencialmente un módulo Python que utiliza alguna funcionalidad central de otros módulos de Python para proporcionarle capacidades de minería y análisis de datos.

Ejecute el siguiente comando para descargar el pepita Manager de paquetes y python virtualenv configuración:

$ sudo apt-get install git python-pip python-virtualenv

Debería obtener una salida similar a esta:

Ahora, ejecute el segundo comando que descarga todos los módulos Python necesarios que Orange requerirá para ejecutar correctamente:

$ sudo apt-get install git python3-dev python3-numpy python3-scipy
python3-pyqt4 python-qt4-dev python3-sip-dev libqt4-devel

Nota: Este comando puede tomar algún tiempo para completar la ejecución dependiendo de su conexión a Internet.

En segundo lugar, se le puede pedir que presione el Y clave para aceptar la instalación de otros paquetes principales.

Debe esperar una salida similar a esta:

3. Ahora creamos un entorno virtual para instalar todo el Naranja módulos y dependencias.

Ejecute los siguientes comandos:

$ Mkdir Orange3env
$ virtualenv -p python3 --system-site-Packages Orange3env


$ Source Orange3env/local/bin/activar



Nota: Si el comando anterior no funciona, ejecute el siguiente comando:

$ Source Orange3env/bin/activar

4. Instalar Naranja llamando pepita que anteriormente descargamos.

Ejecute el siguiente comando:

$ Pip Install Orange3

Debe obtener la siguiente salida:

5. La salida exitosa del paso anterior significa que Naranja se ha descargado e instalado utilizando el Python Package Manager pepita.

Ahora ejecutamos el siguiente comando para ejecutar Orange:

$ python -m naranja.lienzo



Nota: Si el siguiente Naranja Las pantallas GUI se abren, eso significa que todos sus esfuerzos fueron exitosos y la naranja está instalada y abierta en su máquina Linux.

Guía del usuario

Orange es una herramienta práctica de minería y análisis de datos que permite a los usuarios crear flujos de trabajo de análisis de datos de manera visual e interactiva. Esto significa que puede crear modelos complejos utilizando una técnica simple de arrastrar y soltar.

El módulo naranja viene con un lienzo que se puede usar para arrastrar y soltar los widgets que representan las diferentes funcionalidades. Construiremos una tubería simple en esta guía que importe los datos en naranja y luego realizaremos algunas acciones en esos datos y generará los resultados.

Por ejemplo, podemos ver todas las diferentes formas en la siguiente imagen en la que los datos se pueden importar a la herramienta naranja que incluye la importación de tablas SQL, archivos CSV, datos de pintura y más.


Importamos los datos de un archivo CSV a los efectos de este tutorial.

Ahora que especificamos qué formato de datos esperamos ingresar en nuestra tubería, seleccionamos una acción que queremos realizar en estos datos.

Ahora vamos al Transformar pestaña y seleccione el widget de aleatorización que toma todas las entradas de datos en nuestros datos y al azar su orden.


Ahora que sabemos lo que queremos hacer con nuestros datos importados, podemos elegir cómo queremos mostrar los resultados de estos datos.

Para nuestra guía, creemos una gráfica de barra de los datos aleatorios para que podamos ver a qué clases pertenecen los datos y cuánto de los datos están contenidos en esas clases.


Después de que los datos se importan al modelo que creamos, atraviesa automáticamente toda. La salida que recibimos en nuestros datos se puede ver a continuación:


Además, también podemos simplemente mostrar los datos utilizando el widget Tabla de datos En la categoría Visualizar.

Conclusión

Como se puede ver, trabajar en Orange for Data Science es extremadamente fácil e intuitivo. Todo lo que tiene que hacer es arrastrar y soltar las diferentes funcionalidades que desea que sus datos pasen y recopilar las salidas. Esta herramienta es especialmente útil para las personas que no tienen experiencia en programación, pero aún así necesita ejecutar ciertas evaluaciones en sus datos. Las comunidades de investigación y academia usan Naranja Dado que les permite generar la inferencia y las ideas sobre sus datos con relativa facilidad y poco o ningún conocimiento de programación previo.