Originalmente a esta saga la iba a llamar “Un venenito muy sutil llamado libertad”, en honor a una infame frase de María Julia Alsogaray, y también por lo que dice la versión en española de prism-break.org en cuanto a los buscadores:
“Startpage es privativo, hospedado en los Estados Unidos y Holanda, y provee resultados anonimizados de Google (incluyendo imágenes). DuckDuckGo es parcialmente privativo, hospedado en los Estados Unidos, y provee resultados anonimizados de Bing.¡Elige tu veneno!”
Como funciona un motor de búsqueda? Bastante fácil.
1) Una araña visita tu página web, entrando por el root, lee TODO el contenido y crea una lista de lo que ha encontrado.
Si tenés configurado un robots.txt podés indicar qué araña puede mirar tal contenido y que araña no.
2) La información es indexada según los algoritmos internos usados por el buscador
3) Esta información es llevada a una central donde se almacena.
4) Cuando alguien realiza una búsqueda, y el sistema muestra todas las webs que contienen la palabra o frase buscada.
Seeks y Yacy son motores de búsqueda también pero, además de ser alternativas libres, hacer búsquedas anónimas (via proxy), no incluir publicidad y ser menos propensos a la censura, son motores de búsqueda descentralizados. Sin embargo ambos muy distintos de enfoque.
Por un lado Yacy es un buscador descentralizado PURO, ya que tiene su propia araña P2P la cual busca entre los nodos activos y recoge el contenido. En cambio Seeks es más bien un meta-buscador (como duckduckgo) que hace búsquedas anónimas en los buscadores centralizados (Google, Bing, Yahoo, etc.) pero tiene un filtro descentralizado, cada nodo muestra los resultados que quiere mostrar.
Hablando de otras cosas y en plan comparativo surgen tres cosas:
1) Muchos achacan los malos resultados de Yacy y es porque devuelve resultados sólo de lo que recolecte el crawler y dependiendo de los nodos activos. Seeks no tiene ese problema ya que busca en los servidores centrales y luego cada nodo filtra los resultados.
2) Yacy es más fácil de instalar y configurar que Seeks (lo digo por experiencia, ya les digo como), además de que es multi plataforma.
3) La búsqueda P2P gasta banda ancha y es lenta. DuckDuckGo sale ganando frente a los dos.
Para instalar Yacy (requiere OpenJDK6): Descargar paquete fuente, descomprimirlo (no hay necesidad de compilarlo), en el directorio ejecutar sh StartYacy.sh, abrir un navegador, entrar en localhost:8090 (se puede cambiar) y ya está. También hay paquetes para Gentoo, Debian, Opensuse y Arch.
Para instalar Seeks: Instalar libevent y elegir entre descargar los paquetes para Debian, Arch, Ubuntu y Gentoo, o descargar el código fuente y compilarlo. Habilitar el plugin httpserv (para que la compu sea un nodo público más), abrir un navegador, entrar en s.s/websearch-hp y ya está.
Para incluir las búsquedas de Yacy en Seeks: Tener Yacy Corriendo, modificar un archivo y reiniciar Seeks (hay que reiniciar seeks cada vez que se toque un archivo de configuración).
También pueden probar usar los nodos públicos, tanto en yacy como en seeks. Y con esto ya está este artículo. Yo por ahora me quedo con el patito y sus poderosos bangs
Continúar leyendo...