суббота, 3 ноября 2012 г.

Поиск в интернете (распределенный поисковик 2)

Современный интернет настолько забит хламом, что зачастую найти в нем нужную информацию просто невозможно. Отчасти это связано с несовершенным поисковым алгоритмом, отчасти с засильем всякого рода "оптимизаторов", стремящихся преподнести свои "говносайты" под видом "конфетки".
Наверное если бы я делал "свою" поисковую машину - я бы делал ее по иным принципам - не стремился бы проиндексировать содержимое как можно большего количества сайтов (как это делает гугл), не стремился бы повысить некую мистическую "ревелантность".
Я бы просто сделал поисковик "реального времени".
Идея такая - каталог сайтов с рубрикатором и тегами-метками, владельцы сайтов могут внести свой сайт в одну из рубрик или сделать свою собственную. Еще один момент - пользователи могут сделать свои собственные "рубрик-сеты", куда как в закладках вносить сайты определенных тематик в собственный "сет". Внутренний "рубрикатор-поисковик" позволяет быстро отыскать нужную рубрику, либо список рубрик и "сетов" по ключевому слову.
А теперь ключевой момент - почему же я назвал это "поисковиком реального времени"? А потому, что выбрав нужную рубрику, либо "сет" вы можете запустить "реальный" поиск ключевой фразы по сайтам, представленным в этой рубрике или сете. Никакой индексной информации - поэтому информация всегда самая свежая.
Так же как и в закладках у любого пользователя - количество сайтов в одном "сете" будет скорее всего невелико (К примеру у меня в закладках "украинские новости" представлены всего тремя сайтами), индексируемая информация тоже не хранится на сервере, поэтому громадного количества ресурсов (как тот же гугл) такой поисковик не потребует, а при желании ресурсоемкость можно еще более сократить выработав единый API и используя в качестве поисковой машины поисковики самих сайтов (тем самым создав в итоге тот самый распределенный поисковик, идею которого я как то уже высказывал).

Комментариев нет:

Отправить комментарий