Re: Анонс: легковесная система полнотекстового поиска
Hello!
On Friday 05 February 2010 21:34:35 Dmitri V. Ivanov wrote:
> > Хэш - он не для поиска новых файлов, а для проверки необходимости
> > переиндексировать. Если хэш совпадает, индексатор с чистой совестью может
> > игнорировать файл.
>
> Если система у нас - linux или freebsd (есть тонкие моменты в стандарте posix),
> то для того, чтобы знать, что файл не менялся - достаточно ctime и списка каталогов
> с их inode numbers. И можно с чистой совестью игнорировать. А посчитать хэш - это как
> минимум прочесть файл с диска. Тот же gnu tar такое внутри себя умеет. Впрочем - дело
> ваше.
Откуда стремление засунуть эту логику обязательно в индексатор? Пожалуй, и проверку
хэша нужно выкинуть, оставив только безусловную индексацию. А вот описанный вами
алгоритм очень подходит в качестве обертки к индексатору, как я уже и писал выше.
Best regards, Alexey Pechnikov.
http://pechnikov.tel/
Reply to: