...

среда, 12 февраля 2014 г.

Yacy — Распределённый не цензурируемый поисковик: Три годя спустя


Yacy — это децентрализованная поисковая машина, которая позволяет осуществлять поиск информации в интернете без локальной или глобальной цензуры или любых других ограничений.


Первое и единственное упоминание о нем на хабре было 29 ноября 2011.


Но с того времени многое изменилось, давайте посмотрим на него еще раз.



Основные возможности и преимущества Yacy:




— Децентрализованный поиск и хранение индекса — в сети DHT

— Три режима работы 1) Глобальный поисковой индекс 2) Групповой индекс 3) Локальный индекс

— Отсутствие рекламы

— Отсутствие какой-либо цензуры (государственной, копирайтной)

— Огромное количество настроек

Основные недостатки:




— Время поиска (из-за децентрализованной природы, поиск не популярного контента может занимать значительное время)

— Релевантность (алгоритм релевантности был переработан за эти три года, но все равно он отстает от поисковых гигантов)

Что изменилось за три года ?




— Поддержка русскоязычных поисковых запросов

— Появились подсказки в во время ввода поискового запроса

— Опережающий поиск — пока вы печатаете yacy уже ищет пиров с данным контентом

— Улучшились алгоритмы поиска и выдачи — более релевантный результат

и миллионы других мелких изменений под капотом.

Как работает Yacy?




Индексирование



Индексирование может быть инициировано следующими путями:

1) Принудительное указание начала сканирования

2) Удаленный запрос от другого пира

3) Настройка проксирования всех запросов от браузера к Yacy с последующий индексацией того, что вы читаете

После составление базы индекса, она сохраняется локально рассылая в сеть информацию о том, что она у вас есть и распределяется по DHT на соседних пиров


Поиск



Во время процесса поиска, Yacy сначала ищет результаты в локальном индексе, а затем — в глобальном, связываясь по DHT c пирами у которых есть сведения об индексе того или иного запроса/сайта

Результаты поиска от Yacy:








Официальный сайт проекта yacy.net/en/

Windows http://ift.tt/1jxQM9O

Linux http://ift.tt/1lDmMYc

OS X http://ift.tt/1jxQM9S


Тестовая поисковая страницы search.yacy.net (которая может упасть от большого трафика)


PS Последняя статья была три года назад, если хабар пользователям будет интересна тема децентрализованных поисковых систем, я готов сделать обзор всего функционала Yacy и рассмотреть подробно как она работает


This entry passed through the Full-Text RSS service — if this is your content and you're reading it on someone else's site, please read the FAQ at http://ift.tt/jcXqJW.


Комментариев нет:

Отправить комментарий