[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Как **надежно** сожранить данные?



Oleksandr Gavenko -> debian-russian@lists.debian.org  @ Thu, 24 Mar 2016 17:52:45 +0200:

 >> Но общий принцип прост: чексумма должна храниться, и должна быть такой,
 >> чтобы при повреждении данных их можно было восстановить.  По
 >> документации, этим свойством обладает, например, RAID-Z у zfs.  Он не
 >> только вылет диска переживает, но и битый бит может восстановить.  zfs
 >> сама по себе проверяет чексуммы (и при чтении тоже), но понятно, что
 >> узнать "данные побились" и восстановить данные - не одно и то же.
 >>
 >> В качестве более простого и надежного решения - база md5sum (если речь
 >> не идет о намеренном вторжении, то md5 достаточно), и более одной копии
 >> архива (тут уже речь идет скорее об архиве, а не о бэкапе).  Каковые
 >> копии никогда не втыкаются в один комп (что подразумевает физически
 >> разные носители).
 >>
 >> И, соответственно, если регулярная проверка одной копии показала
 >> несовпадение md5, эти данные восстанавливаются из другой копии.

 OG> Не сильно улавливаю разницу между бекапом и архивом. Речь о домашних медийных
 OG> данных, нужно обеспечить их сохранность пока я жив.

 OG> Непрерывность доступа не нужна. Раз в пол года втыкаю внешний накопитель. Т.е.
 OG> даже демон не нужен.

Это скорее архив, если ты их не пересматриваешь регулярно.

Бэкап - это резервирование актуального состояния, с недолгой историей
изменений.  Защита от сбоя носителя, атаки и т.п.  Подразумевает
необходимость быстрого восстановления всего целиком.  Плюс защита от
случайного удаления в форме восстановления одного файла, если
несвоевременность удаления своевременно обнаружена :) Важное условие
постановки задачи - потеря небольшого куска работы, чтобы то, что не
попало в бэкап, восстанавливать недолго.  Поэтому характерное время
между бэкапами - ну, неделя максимум, если больше, то это не система
резервного копирования, а раздолбайство.

Архив - это длительное хранение, где основная задача - получить доступ к
единичному объекту данных, созданному, вообще говоря, давно.  В норме
задача архивирования ставится так, что рабочие материалы туда не
попадают, только завершенная работа, и потому архив
создается/пополняется не по времени, а по событию.  Зато хранится чем
дольше, тем лучше.  В типичном случае из архива ничего не удаляется, и
данные, попавшие в архив, не меняются.  Другой график, другое
обслуживание носителей.  Да и сами носители порой другие, даже в
домашних условиях - если носителем бэкапов будет скорее бэкап-сервер, то
носителем архива - внешний винт.


Reply to: