[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Анонс: легковесная система полнотекстового поиска



Hello!

On Friday 05 February 2010 21:34:35 Dmitri V. Ivanov wrote:
> > Хэш - он не для поиска новых файлов, а для проверки необходимости 
> > переиндексировать. Если хэш совпадает, индексатор с чистой совестью может 
> > игнорировать файл.
> 
> Если система у нас - linux или freebsd (есть тонкие моменты в стандарте posix),
> то для того, чтобы знать, что файл не менялся - достаточно ctime и списка каталогов
> с их inode numbers. И можно с чистой совестью игнорировать. А посчитать хэш - это как
> минимум прочесть файл с диска. Тот же gnu tar такое внутри себя умеет. Впрочем - дело
> ваше.

Откуда стремление засунуть эту логику обязательно в индексатор? Пожалуй, и проверку 
хэша нужно выкинуть, оставив только безусловную индексацию. А вот описанный вами
алгоритм очень подходит в качестве обертки к индексатору, как я уже и писал выше.

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Reply to: