Los mejores motores de búsqueda autohostados

Los mejores motores de búsqueda autohostados
¿Sabe tu jefe que estás buscando otro trabajo?? ¿Le ha contado a su pareja sobre la incapacidad de decidir si desea tener hijos o no?? ¿Sus padres saben sobre su orientación sexual?? Bueno, Google y otros motores de búsqueda importantes lo hacen.

"La mayoría de los usuarios buscan en Google mientras se registran, por lo que toda la información sobre su vida en línea está disponible: búsquedas de YouTube, correos electrónicos e historial de búsqueda pasada", dice Adam Tauber, el desarrollador principal del motor de metasearch de la privacidad Searx.

Por supuesto, puede usar Tor para el anonimato y siempre eliminar todos los rastros de su actividad después de cada búsqueda, pero hacerlo después de cada búsqueda probablemente envejezca con bastante rapidez. En su lugar, debe considerar instalar un motor de búsqueda autohospedado capaz de recuperar información para usted sin revelar nada sensible sobre usted.

Hemos seleccionado dos de estos motores de búsqueda, y también presentamos tres motores de búsqueda adicionales para mostrarle excelentes alternativas a los motores de búsqueda propietarios como Google o Bing ya existen y son más fáciles de instalar y usar de lo que podría pensar.

Yacy

Yacy es un motor de búsqueda de pares distribuido gratuito cuyo componente central está escrito en Java. Debido a que todos los usuarios de YACY son iguales y porque el motor de búsqueda no almacena solicitudes de búsqueda de usuarios, la censura simplemente no es posible.

Actualmente, Yacy indexa aproximadamente 1.4 mil millones de documentos en su índice gracias a la actividad de más de 600 operadores de pares que lo contribuyen cada mes. A modo de comparación, el índice de búsqueda de Google contiene cientos de miles de millones de páginas web y tiene más de 100,000,000 de gigabytes en tamaño.

Si bien Yacy todavía tiene un largo camino por recorrer antes de que pueda rivalizar con los motores de búsqueda centralizados más grandes del mundo, ya se puede utilizar como un portal de búsqueda para intranets privados y aplicaciones específicas de proyectos porque Yacy puede operar como un dispositivo de búsqueda único sin redes con otros colegas.

Yacy se puede integrar fácilmente en cualquier página web gracias a sus fragmentos de código simple que se pueden copiar y pegar sin esfuerzo sin ninguna modificación.

Searx

Searx se describe como un motor de metasearch hackable y respetuoso de la privacidad. Está disponible bajo la versión 3 de la Licencia Pública General General de GNU, y su objetivo principal es proteger la privacidad de sus usuarios al no compartir nunca las direcciones IP de los usuarios o el historial de búsqueda con los motores de búsqueda de los cuales reúne los resultados.

"Cuando se usa Searx, la dirección IP de Searx, un agente de usuario aleatorio y una consulta de búsqueda se envían a Google de forma predeterminada", es un alquiler de ASCIIMOO, explica cómo funciona su motor MetaSearch. “Por supuesto, puede personalizar Searx para reenviar otros parámetros adicionales como el lenguaje de búsqueda o el número de página de la página de resultados solicitada."

Searx bloquea automáticamente todas las cookies de seguimiento atendidas por los motores de búsqueda para evitar la modificación de resultados basado en la perfil de usuarios, que puede resultar de un motor de búsqueda que intenta implementar la búsqueda que es individualizada en función de lo que el motor sabe sobre el usuario. Searx es 100 por ciento libre, y cualquiera puede modificarlo según sea necesario. Incluso puede tomar el código Searx y ejecutar el motor MetaSearch en su propio servidor, lo que definitivamente debería abordar cualquier inquietud que pueda tener con respecto a los registros.

Elasticsearch

Elasticsearch es un motor de búsqueda basado en Lucene, una biblioteca de software de recuperación de información gratuita y de código abierto compatible con Apache Software Foundation y se lanza bajo la licencia de software Apache.

Elasticsearch proporciona un motor de búsqueda de texto completo con una interfaz web HTTP. El motor de búsqueda se puede usar para buscar todo tipo de documentos, y se puede distribuir fácilmente en múltiples nodos.

Es posible construir un motor de búsqueda autohospedado utilizando Elasticsearch y Docker, y puede encontrar un tutorial que describa el proceso aquí.

Ambar

Ambar es un motor de búsqueda de documentos de código abierto con muchas características útiles. Admite rastreo automático, etiquetado y búsqueda instantánea de texto completo, solo para dar algunos ejemplos. Una de las características más emocionantes de Ambar es su capacidad para realizar OCR en imágenes y archivos PDF. Los idiomas con apoyo incluyen inglés, alemán, ruso, italiano, francés, español, polaco y holandés.

Ambar se puede implementar fácilmente con un solo archivo Docker-Compose, y puede aprender cómo hacerlo aquí.

Apache solr

Escrito en Java, Apache Solr es una plataforma de búsqueda empresarial que incluye búsqueda de texto completo, resaltado de éxito, búsqueda facetada, indexación en tiempo real, agrupación dinámica y muchas otras características importantes. Fue creado en 2004 para un proyecto interno en CNET Networks. CNET Networks lo donó amablemente a Apache Software Foundation en 2006, donde se graduó del estado de incubación en un proyecto de nivel superior independiente en 2007.

Hoy, Solr es una plataforma de búsqueda empresarial altamente confiable, escalable y tolerante a fallas que alimenta las características de búsqueda y navegación de muchos de los sitios de Internet más grandes del mundo, incluidos Duckduckgo, Eharmony y BestBuye. Puede

Cómo instalar y configurar YACY

La instalación de YACY es muy simple, y lleva solo un par de minutos porque no necesita instalar una base de datos externa o el servidor web-yacy viene con todo lo necesario.

  1. Vaya al sitio web oficial de Yacy y descargue el último paquete para Linux.
  2. Instale el entorno de tiempo de ejecución OpenJDK 8.
    • Si está utilizando una distribución basada en Debian, use el siguiente comando: $ sudo apt-get install openjdk-8-jre
    • Si no, siga las instrucciones específicas para su distribución.
  3. Extraiga el paquete descargado a su ubicación preferida.
  4. Vaya a la nueva carpeta y comience la "Backyacy.shit "en terminal.
  5. Debería ver un mensaje de confirmación informándole que Yacy comenzó como un demonio

Conclusión

Los motores de búsqueda saben más sobre nosotros de lo que a la mayoría de la gente le gustaría admitir. Si desea dejar de alimentar a grandes corporaciones con datos jugosos, puede tomar las cosas en sus propias manos y configurar un motor de búsqueda autohospedado para proteger su privacidad. Aunque los motores de búsqueda autohospedados todavía tienen un largo camino por recorrer para ser completamente utilizables, el potencial para superar a los gustos de Google está allí y capturarlo es solo una cuestión de atraer a más usuarios.