Cómo instalar y usar Keel en Linux Optimize para optimizar los algoritmos de minería de datos complejos

Cómo instalar y usar Keel en Linux Optimize para optimizar los algoritmos de minería de datos complejos

Quilla (Extracción de conocimiento basada en el aprendizaje evolutivo) es una herramienta de software basada en Java que se especializa en la implementación de algoritmos evolutivos. Dado que es un código abierto, proporciona una amplia variedad de algoritmos de descubrimiento de conocimiento que pueden usarse en experimentos que alimentan la comunidad de minería y análisis de datos. Proporciona una interfaz de usuario gráfica simple y fácil de usar que disminuye significativamente la complejidad general de esta herramienta. La mayoría de las herramientas similares en el mercado requieren que los usuarios interactúen con ellos escribiendo el código, mientras que la quilla elimina este requisito al proporcionar una GUI intuitiva que puede ser utilizada tanto por principiantes como por expertos.

Keel proporciona una amplia variedad de diferentes algoritmos computacionales basados ​​en inteligencia que incluyen clasificación, regresión, extracción de características, análisis de patrones, agrupación y más. Con los modelos convencionales horneados directamente en la aplicación en sí, Keel es una herramienta muy útil cuando se trata de realizar análisis de datos exploratorios en conjuntos de datos sin procesar. Su simple interfaz de arrastre y caída de arrastre con la facilidad de la utilización de la funcionalidad permite una experimentación de minería de datos rápida y eficiente para fines educativos y de investigación. Herramientas como Keel están aumentando en popularidad debido a su enfoque simplista de las prácticas algorítmicas complejas.

Instalación

Hay dos formas principales en las que podemos instalar Quilla En cualquier máquina de Linux. El primero implica ir a la página web de quilla y descargar el software desde allí. El segundo, que seguiremos en esta guía de instalación, requiere que descarguemos KEEL usando el wget Descargar herramienta disponible para usuarios de Linux.

1. Empezamos por conseguir wget En nuestra máquina Linux.

Ejecute el siguiente comando para descargar el wget usando el apto gerente de empaquetación:

$ sudo apt-get install wget

Verá una salida terminal similar:

2. Ahora que tenemos el wget herramienta instalada en nuestra máquina Linux, la usamos para descargar el Quilla herramienta.

Este es el enlace que pasamos a Wget.

Ejecute el siguiente comando en su terminal:

$ wget http: // sci2s.UGR.ES/KEEL/Software/Prototypes/OpenVersion/Software-2018-04-09.cremallera

Debería ver una salida similar en su terminal:

Una vez que KEEL ha terminado de descargar, podemos continuar con el resto de la instalación.

3. Ahora extraemos el archivo comprimido que descargamos en el paso anterior utilizando la herramienta Linux Unzip.

Ejecute el siguiente comando:

$ Unzip Software-2018-04-09.cremallera

Debería ver una salida similar en el terminal:

4. Navegue a la carpeta de quilla ejecutando el siguiente comando:

$ CD Software-2018-04-09/documentos/Experimentos/Keel/Dist/

5. Ejecute el siguiente comando para comenzar con la instalación:

$ java -jar ./Graphinterkeel.frasco

Con esto, la quilla debería estar disponible para que lo use en su máquina Linux.

Guía del usuario

Interactuando con el Quilla La aplicación es realmente fácil y simple. Comencemos por importar el conjunto de datos del iris en nuestro espacio de trabajo.

A medida que importamos los datos, la herramienta nos muestra la agrupación general del punto de datos en el conjunto de datos. También nos muestra las diferentes clases que están presentes en el conjunto de datos junto con la información básica, como los rangos numéricos que abarcan estos puntos de datos y la varianza general y los valores medios que presenta. Esta información permite a los usuarios comprender mejor cómo continuar con la preparación de datos para cualquier tipo de tarea de análisis de datos.


Continuando aún más en la experimentación, nos encontramos con las diferentes técnicas que se pueden utilizar para crear nuestro experimento en cualquier conjunto de datos. Los diferentes algoritmos de aprendizaje que se pueden usar en nuestros datos se pueden ver en la siguiente imagen. Dependiendo de la naturaleza del conjunto de datos y los requisitos del experimento, se pueden experimentar diferentes algoritmos con.

Por ejemplo, si está trabajando con datos no etiquetados y tiene que encontrar similitudes entre los diferentes puntos de datos en su conjunto de datos, utilizando un algoritmo de agrupación de las diferentes opciones disponibles puede ayudarlo a comprender mejor los puntos de datos. Esto eventualmente lo ayuda a etiquetar y clasificar los puntos de datos para que el experimento se pueda construir sobre el uso de algoritmos de aprendizaje supervisados ​​más completos.

Conclusión

El Quilla Platform for Data Analytics es un buen recurso para fines educativos y de investigación. Es una interfaz gráfica de usuario fácil de usar ayuda a los usuarios a comprender mejor los requisitos de los datos, además de proporcionar referencias lógicas a técnicas y algoritmos útiles que ayudan aún más a los usuarios en sus flujos de trabajo. Tener una amplia gama de algoritmos diferentes que se dividen en las diferentes categorías y técnicas algorítmicas permiten a los usuarios experimentar con numerosas direcciones lógicas y comparar estos resultados para que se pueda alcanzar la solución más óptima a cualquier problema.

El enfoque del código gratuito y la caída del código de Keel a la minería de datos ayuda incluso a los principiantes a trabajar sin esfuerzo con modelos integrales de inteligencia computacional. Esto proporciona información sobre conjuntos de datos complejos y obtiene una inferencias útiles que ayudan a resolver los problemas del mundo real.