Cómo instalar y usar sonajeros en Linux para construir algoritmos de minería de datos complejos

Cómo instalar y usar sonajeros en Linux para construir algoritmos de minería de datos complejos

Traqueteo es una herramienta gráfica basada en interfaz de usuario que utiliza Riñonal correr. Se utiliza para la minería y visualización de los datos. Rattle proporciona ciertas funcionalidades a sus usuarios que les permiten construir informes de análisis de datos exploratorios, transmutar datos para que puedan ejecutarse a través de diferentes modelos estadísticos y matemáticos, construir modelos de aprendizaje automático no supervisado y supervisado para los datos y mostrar los resultados en un visual, manera intuitiva. Estos resultados se pueden mostrar en gráficos, gráficos y gráficos dimensionales variables.

Todo esto se hace usando el núcleo Riñonal funcionalidad marco. Ratch convierte todas las acciones que realiza en su interfaz gráfica en un script R que se ejecuta mediante la instalación R subyacente. Así es como Rattle puede lograr toda su poderosa funcionalidad de análisis de datos.

Instalación

Instalar Traqueteo En su máquina Linux, necesitará un envoltorio especial de Administrador de paquetes que pueda descargar e instalar todas las dependencias de sonajeros en su máquina. Este es el wajig herramienta para Linux, que actúa como un envoltorio alrededor del valor predeterminado apto y dpkg gerentes de paquetes. Proporcionó una utilidad fácil para apt y dpkg y agregó funcionalidad más allá de estos dos gerentes de paquetes.

1. Comenzaremos instalando wajig ejecutando el siguiente comando en el terminal:

$ sudo apt-get instalación wajig


Debería ver una salida terminal similar a esta:


2. Ahora agregaremos algunos repositorios de software utilizando Archivos de paquetes personales (PPA) que contienen las dependencias requeridas para ejecutar Ratch.

Los PPA son repositorios de software y aplicaciones diseñados para ejecutarse en máquinas Linux. Estos permiten a los desarrolladores distribuir el software creado utilizando el enlace al repositorio.

Ejecute los siguientes comandos:

$ Wajig Addrepo PPA: Marutter/Rrutter4.0


$ Wajig Addrepo PPA: C2D4U.equipo/C2D4U4.0+



3. Actualizaremos el wajig Lista de fuentes de repositorio local para que los repositorios de software que agregamos anteriormente puedan ser descubiertos por el administrador de paquetes y posteriormente descargar e instalar.

Ejecute el siguiente comando:

$ Wajig Distupgrade


4. Dado que Ratch usa Riñonal y r-cran Para ejecutarse con éxito, instalaremos aquellos que usen el paquete Wajig Manager. También instalaremos algunas otras dependencias junto con los paquetes R antes mencionados.

Ejecute el siguiente comando:

$ wajig install libgtk2.0-DEV R-BASE-DEV RECOMENDADO


Debería ver una salida similar a la siguiente imagen en su terminal:


5. Con Riñonal ahora instalado, lo ejecutaremos e instalaremos Traqueteo desde dentro de r.

Ejecute el siguiente comando para ejecutar Riñonal:

$ R


Debería ver un indicador R similar abierto en su terminal:


6. Ahora instalaremos el Traqueteo Paquete desde dentro de R ejecutando los siguientes comandos:

> Instalar.paquetes ("sonajero")


Debería ver una salida terminal similar:


Si el comando anterior no funciona para usted, intente el siguiente comando:

> Instalar.paquetes ("https: // acceso.togaware.com/rgtk2_2.20.36.2.alquitrán.GZ ", Repos = NULL)
> Instalar.Paquetes ("RGTK2")


7. Después de que ambos comandos se descargan e instalen, podemos cargar el Traqueteo Paquete en la biblioteca R.

Ejecute el siguiente comando en el indicador R:

> Biblioteca (Ratch)



8. Con Traqueteo cargado en el Riñonal Biblioteca, podemos ejecutarlo ejecutando el siguiente comando en el indicador R:

> Ratch ()


Debería ver una instancia de sonajero abierta en su máquina Linux.

Guía del usuario

Nosotros podemos usar Traqueteo Para configurar nuestra rutina de minería de datos de acuerdo con nuestros requisitos. Como puede ver en la imagen de arriba, hay diferentes opciones que puede configurar.

En el Datos pestaña, podemos seleccionar diferentes formatos de archivos de datos, incluidos archivos de valor separados por comas, archivos de texto, bases de datos abiertas e incluso datos contenidos en scripts. Esto permite que el sonajero ingrese los datos de cualquier forma que requiera.


Después de importar los datos, podemos visitar el Transformar pestaña para hacer cambios en nuestros datos. Podemos seleccionar categorías simples o múltiples en nuestros datos y hacer transformaciones de acuerdo con nuestras necesidades. Podemos lograr rápidamente las cosas seleccionando los botones de radio en la parte superior y reordenando los datos en función de alguna prioridad o rango que asignamos. Podemos normalizar los datos escala en función de algún rango que proporcionamos, o podemos aumentar los valores faltantes colocando el valor promedio, mínimo o máximo que se encuentra en una categoría.


Estas son solo algunas cosas que podemos hacer con el Traqueteo Herramienta basada en GUI.

Conclusión

Rattle es una herramienta de minería de datos muy popular que continúa creciendo en popularidad debido a su interfaz gráfica de usuario fácil de usar. No requiere que se escriba ningún tipo de código y simplemente se puede usar interactuando con su interfaz de aplicación. Investigadores, estudiantes y programadores en todo el mundo lo usan para cumplir con sus requisitos de minería de datos. Dado que Rattle proporciona un backend R muy sofisticado, puede lograr requisitos de ciencia de datos estadísticos y analíticos complejos con pocos clics del mouse.

Rattle es una de las mejores herramientas disponibles para las personas que recién comienzan su viaje de ciencia de datos, ya que es extremadamente poderoso y proporciona controles intuitivos que los usuarios pueden aprender de. El sonajero es muy recomendable por los analistas de datos junior y expertos en todo el mundo debido a su capacidad innata para ayudar a crear algunas de las tuberías de minería de datos más potentes utilizadas hoy en día.