Re: Как **надежно** сожранить данные?
Oleksandr Gavenko -> debian-russian@lists.debian.org @ Thu, 24 Mar 2016 17:52:45 +0200:
>> Но общий принцип прост: чексумма должна храниться, и должна быть такой,
>> чтобы при повреждении данных их можно было восстановить. По
>> документации, этим свойством обладает, например, RAID-Z у zfs. Он не
>> только вылет диска переживает, но и битый бит может восстановить. zfs
>> сама по себе проверяет чексуммы (и при чтении тоже), но понятно, что
>> узнать "данные побились" и восстановить данные - не одно и то же.
>>
>> В качестве более простого и надежного решения - база md5sum (если речь
>> не идет о намеренном вторжении, то md5 достаточно), и более одной копии
>> архива (тут уже речь идет скорее об архиве, а не о бэкапе). Каковые
>> копии никогда не втыкаются в один комп (что подразумевает физически
>> разные носители).
>>
>> И, соответственно, если регулярная проверка одной копии показала
>> несовпадение md5, эти данные восстанавливаются из другой копии.
OG> Не сильно улавливаю разницу между бекапом и архивом. Речь о домашних медийных
OG> данных, нужно обеспечить их сохранность пока я жив.
OG> Непрерывность доступа не нужна. Раз в пол года втыкаю внешний накопитель. Т.е.
OG> даже демон не нужен.
Это скорее архив, если ты их не пересматриваешь регулярно.
Бэкап - это резервирование актуального состояния, с недолгой историей
изменений. Защита от сбоя носителя, атаки и т.п. Подразумевает
необходимость быстрого восстановления всего целиком. Плюс защита от
случайного удаления в форме восстановления одного файла, если
несвоевременность удаления своевременно обнаружена :) Важное условие
постановки задачи - потеря небольшого куска работы, чтобы то, что не
попало в бэкап, восстанавливать недолго. Поэтому характерное время
между бэкапами - ну, неделя максимум, если больше, то это не система
резервного копирования, а раздолбайство.
Архив - это длительное хранение, где основная задача - получить доступ к
единичному объекту данных, созданному, вообще говоря, давно. В норме
задача архивирования ставится так, что рабочие материалы туда не
попадают, только завершенная работа, и потому архив
создается/пополняется не по времени, а по событию. Зато хранится чем
дольше, тем лучше. В типичном случае из архива ничего не удаляется, и
данные, попавшие в архив, не меняются. Другой график, другое
обслуживание носителей. Да и сами носители порой другие, даже в
домашних условиях - если носителем бэкапов будет скорее бэкап-сервер, то
носителем архива - внешний винт.
Reply to: