Наверх

Резервная копия vs архив: почему разница так важна

Время чтения: 6 минут
0
Резервная копия vs архив: почему разница так важна

Функции резервного копирования и архивирования весьма различны. Если вы думаете, что можно обойтись без одного из них, то рискуете в итоге получить проблемы не только с доступом, но и с судами.

Представляем вашему вниманию перевод статьи Уильяма Престона, эксперта и аналитика в области резервного копирования, хранения и восстановления данных. Оригинал читайте по ссылке Backup vs. archive: Why it’s important to know the difference.

Функции резервного копирования и архивирования весьма различны. Если вы думаете, что можно обойтись без одного из них, то рискуете в итоге получить проблемы не только с доступом, но и с законом.

https://cdn-images-1.medium.com/max/1600/1*_Wb1y0rcLZQWWJ7klrMfsA.jpeg

Знаете, как довести сторонника резервных копий до инфаркта? Назовите резервную копию архивом. Не стоит говорить, что RAID-массивы могут обойтись и без резервных копий. К счастью, разница между резервной копией и архивом прозрачна, и ее легко уловить.

Что такое резервная копия?

Бэкап (резервная копия) – это копия данных, которая позволяет их восстановить в случае утраты или повреждения. Исходная информация после создания резервной копии не удаляется.

Резервное копирование подразумевает, например, создание копии всех файлов с вашего компьютера по ночам, копирование фотографий в iCloud на случай, если вы вдруг разобьете ваш iPhone. Резервные копии создаются также для файловых серверов (неструктурированные данные) и баз данных (структурированные данные). Резервное копирование может производиться для сохранения данных (дамп базы данных), операционной системы сервера (восстановление исходного состояние системы), или того и другого одновременно (резервное копирование файлов VMware. VMDK).

Определение резервной копии можно дать исходя из ее цели. Цель же всегда неизменна – восстановить данные, если с ними что-то произошло. Представьте, что в массиве RAID 6 отказали все три диска и теперь нужно восстановить данные. Или кто-то случайно (а может и намеренно) удалил одну или несколько виртуальных машин в конфигурации VMware, Hyper-V или AWS EC2, и теперь необходимо их восстановить. Или в один прекрасный день вирус-вымогатель зашифровал все файлы в вашей организации. Без надежной системы резервного копирования, у вас только один выход – заплатить вымогателям. А вот если такая система есть, можно вычислить источник вируса, удалить его, а затем восстановить всю информацию. При этом хакер не получит от вас ни копейки.

Что такое архив?

Архив представляет собой копию данных, созданную для справочных целей. Как правило, исходные данные после архивирования удаляются, хоть это и не обязательно.

Если цель резервной копии состоит в восстановлении данных в состояние, в котором они были вчера, то у архива может быть сразу несколько целей. Чаще всего архивы нужны для поиска информации из далекого прошлого. Например, нужно найти договор, подписанный клиентом несколько лет назад. Или группу связанных данных, например, строительные чертежи недавно рухнувшего здания. А может быть это CAD-чертежи виджета, который когда-то разрабатывала ваша компания, а затем он вышел из моды. А сейчас вдруг снова стал популярным.

Еще одной группой данных могут быть все электронные письма или файлы, призванные доказать вашу правоту в суде. Представьте ситуацию: сотрудник решил, что в компании разрешается подработка, но впоследствии был за это уволен. В ходе судебного разбирательства от обвиняющей стороны может поступить запрос на предоставление всех входящих и исходящих электронных писем с этим сотрудником, в которых есть слова «подработка», «в нерабочее время», или название компании, в которой он собирался «подрабатывать». Или же, кто-то из сотрудников жалуется на нездоровую рабочую атмосферу и просит найти все письма от некоторых руководителей, в которых они нередко прибегают к непечатному словцу.

Во всем этом вам поможет система архивирования. Она позволяет хранить все наряд-заказы, сметы или договоры, когда-либо заключенные вашей компанией. Конечно, вы можете держать все договоры и заказы в облаке, но лучше пусть они будут в архивах, для которых должен быть настроен индекс, позволяющий находить и извлекать заказы и контракты с помощью их содержимого. Таким же образом можно хранить все электронные письма, когда-либо отправленные или полученные вашей компанией.

Некоторые системы архивирования почты удаляют с сервера сообщения в архиве, или сообщения, которые больше заданного размера или не открывались в течение определенного количества дней. Таким образом обеспечивается работоспособность системы, экономия ресурсов и пространства, а также упрощается резервное копирование. Вы вполне можете использовать систему архивирования в этих целях, если вы не обязаны хранить все электронные письма в соответствии с требованиями законодательства.

Восстановление vs Извлечение

Даже если смысл архива в экономии места на основном жестком диске, то чтобы называться архивом, в нем должна прослеживаться четкая разница между извлечением и восстановлением данных. Системы резервного копирования восстанавливают данные, а системы архивирования их извлекают.

Восстанавливается, как правило, один файл, сервер или база данных. Извлекается же обычно группа связанных данных, которые могут храниться в нескольких форматах как на одном, так и на нескольких серверах. Данные восстанавливаются в состояние, в котором они были в определенный момент времени, например, вчера. Извлечение данных производится за определенный период, например, извлекаются все электронные письма за последние три года.

Чтобы восстановить данные или файл необходимо точно знать место хранения на момент создания резервной копии. Иначе вы просто не сможете ничего найти. Вы должны знать имя сервера, базу данных или папку, в которой хранились данные, имя файла или таблицы, которую вы хотите восстановить, а также дату их последнего изменения. В случае с извлечением данных без этой информации вполне можно обойтись. Нужно просто найти все папки или файлы, которые соответствуют определенным параметрам. Например, все файлы и электронные письма за последние 3 года, в которых содержится определенная фраза или созданные определенным человеком.

Почему разница так важна?

Многие пытаются использовать систему резервного копирования в качестве системы архивирования. Они не удаляют резервные копии в течение многих лет или вообще никогда. Но при первом же поисковом запросе вы поймете, насколько трудно найти данные, если они внутри бэкапа. Мало того, что поиск нужной информации может занять месяцы вместо пары минут, так ещё и может обойтись вам гораздо дороже – миллионы, вместо пары долларов.

Представьте, что вы получили запрос на предоставление определенных данных в ходе судебного процесса и не смогли его выполнить. Судья вполне может посоветовать жюри присяжных принять сторону ваших оппонентов. Вы потратили шесть месяцев на выполнение простой, казалось бы, задачи, и ни на шаг не приблизились к ее выполнению. Судья может подумать, что вы хотите что-то утаить и поделится своим мнением с присяжными. Поздравляю, вы только что проиграли дело. Красноречивым примером служит дело против компании Morgan Stanley, которое развивалось по данному сценарию и в итоге обошлось в миллиарды долларов.

Не стоит использовать резервные копии в качестве архивов. Для долговременного хранения данных изучите современные системы архивирования. Да, придется потратиться, но в конечном итоге все окупится.

Перевод: Владимир Головизнин DIRECTUM.

Храните все документы централизовано и в течение срока, установленного законодательством. Какие решения могут реализовать это, читайте на странице Долговременный архив.

Источник: NetworkWorld

Чтобы прочитать эту статью до конца,
или зарегистрируйтесь

Комментарии 0

Чтобы прокомментировать, или зарегистрируйтесь