Журнал о системах электронного документооборота (СЭД)
Электронные архивы

Как хранить электронные документы? Советы эксперта

  0 комментариев Добавить в закладки

Наталья Храмцовская

Как хранить электронные документы?Электронный документооборот в России становится все более распространенным. Е-документы уже активно использует бизнес, на электронную форму работы переходят суды. И это только начало. В ближайшее время архивам придется принять тысячи, миллионы, и, возможно, миллиарды е-документов. Хранить их нужно будет на протяжении многих лет, не нарушая при этом целостности, аутентичности, сохраняя информацию, которая может понадобиться в любое время. А это неизбежно вызовет массу проблем.

Тема "электронного правительства", электронного документооборота, электронных библиотек, счетов-фактур и документов в последнее время стала довольно популярной. Руководство страны, кажется, осознало, что государственное управление, – какие бы технологии при этом не использовались, - осуществляется посредством документов, а не просто информации; и что для того, чтобы "догнать и перегнать" другие капиталистические страны в области "электронного правительства" и "электронной коммерции", нужно срочно решать правовые и технические проблемы, сдерживающие электронный документооборот.

Однако, сказав "А", неизбежно придется сказать и "Б". Использование в государственном управлении и в коммерческой деятельности электронных документов неизбежно приводит к тому, что какие-то из них придется хранить достаточно долго (а в электронном мире "долго" означает более 5-7 лет). Можно, конечно, еще какое-то время "прятать голову в песке", но рано или поздно проблему долговременного и постоянного хранения электронных документов, проблему создания электронных архивов придется решать.

Удивительно, но факт: уже сейчас существуют крупные государственные базы данных, которым установлен постоянный срок хранения, хотя никто не потрудился объяснить государственным органам - владельцам этих баз - что и как они должны сохранить и какими способами будет обеспечиваться юридическая значимость сохраняемой информации и документов. Одновременно наблюдается стойкое нежелание заниматься проблемами электронных архивов на государственном уровне.

Чтобы оценить объемы информации, можно привести два примера из жизни американских архивов. Так, на конец 2007 года в 36 филиалах и подразделениях национальных архивов США на постоянном хранении находилось 3,5 млрд электронных документов. Что касается электронного архива штата Вашингтон, то если в январе 2007 года только в онлайн-доступе было размещено более 10 млн документов, то к январю 2008 эта цифра достигла 27 миллионов.

Отечественный бизнес уже сейчас активно использует электронные документы. Что очень важно, суды, которые сами постепенно переходят на электронные формы работы, уже к ним привыкли и регулярно выносят решения на основе доказательств, представленных в электронном виде.

Если добавить к этому, что в течение года-двух ожидается принятие решения об использовании в России электронных счетов-фактур, то вопрос о том, как все это хранить и каким образом можно обеспечить целостность и аутентичность электронных документов, из теоретической плоскости плавно переходит в область практического применения. От того, насколько быстро и качественно будут разработаны "правила игры" на "электронном поле", в существенной степени зависит дальнейшее экономическое и политическое развитие страны, ее конкурентоспособность на мировой арене.

В организации долговременного и постоянного хранения электронных документов можно выделить две задачи. Первая - сохранить информационное содержание документов (их контент) с тем, чтобы обеспечить возможность их использования в деловой деятельности и в государственном управлении. При всей своей сложности задача понятна. В этом направлении имеется большой практический опыт, в том числе и отечественный – достаточно вспомнить продолжающиеся программы спасения ценно научной информации с магнитных лент, записанных в 80-е и 90-е годы. Задача вторая - сохранить не только содержание, но и юридическую значимость документов, чтобы всегда можно было доказать их целостность и аутентичность. Здесь отечественный опыт пока невелик, поэтому часто приходится использовать зарубежный. Но и там далеко не все проблемы решены. Поэтому эту задачу можно рассматривать как наиболее сложную из двух.

Сохранить целостность и аутентичность

Для того чтобы электронные документы могли быть приняты судом или государственным органом и им была придана максимальная доказательная сила, необходим целый комплекс мер, охватывающий все этапы жизненного цикла документа. Ключевой задачей стратегии долговременной сохранности является обеспечение аутентичности и целостности документов.

Работа с документами должна быть организована так, чтобы в любой момент существовала возможность доказать, что это надежная информация, которая не была искажена, изменена или как-либо иначе испорчена с течением времени.

Сохранность электронных документов, как правило, обеспечивают несколько служб. ИТ-отдел обычно организовывает хранение и оперативный доступ к информации, решает технические проблемы хранения. Департамент ИБ видит свою основную задачу в обеспечении конфиденциальности, т.е. в ограничении доступа к информации. Наконец, архивную службу (и иногда – и юристов) волнует обеспечение сохранности электронной информации в качестве юридически значимых документов.

Стандарты о целостности и аутентичности

Стандарт ISO 15489, п. 7.2.2. Аутентичным считается документ, в отношении которого может быть доказано:

●   то, что он является именно тем, чем он претендует быть;

●   то, что он был создан или послан именно тем лицом, которое указано в качестве его создателя или отправителя;

●   то, что он был создан или послан именно в то время, которое в нем указано.

Стандарт ISO 15489, п. 7.2.4. Целостность документа означает его полноту и неизменность.

Содержать в контексте

С точки зрения архивного дела основной целью является не обеспечение сохранности отдельных документов, а сохранение массивов документов вместе с их взаимосвязями с тем, чтобы была возможность понять роль этих документов в деловой деятельности организации. Значение отдельного документа в большой степени зависит от контекста – от обстоятельств его создания и использования, от его взаимосвязей с другими документами.

Если в бумажном делопроизводстве то или иное дело физически объединяет "бумаги" по определенному признаку или признакам, то в системе электронного документооборота документы, как правило, физически не лежат в соответствующих делах. Очень часто номенклатура и состав самих дел – это всего лишь логическое представление содержимого базы данных, причем могут существовать и альтернативные представления. Документы "раскладываются по делам" виртуально, и эта логика – тот самый контекст - также может быть искажена или утрачена – можно сохранить все индивидуальные документы, но потерять информацию об их логических взаимосвязях.

В бумажном делопроизводстве то или иное дело физически объединяет "бумаги" по определенным признакам

В бумажном делопроизводстве то или иное дело физически

объединяет "бумаги" по определенным признакам

Разрушение контекста может привести к потере юридической значимости документа, поскольку контекст создания и использования включает также и связи с другими документами. Для их фиксации используются различные способы, включая ссылки в "карточке" на другой документ по тому же вопросу или классификационный код, позволяющий связать все документы, относящиеся к одной и той же теме.

В этой связи необходимо обратить серьезное внимание на то, что обеспечение осмысленности электронных данных кардинально отличается от решения той же задачи в отношении бумажной документации. В отличие от бумаг, где физические характеристики обычно передают основную часть контекста создания и использования, в случае с электронными документами на физическом уровне он не зафиксирован, а потому и более хрупок.

На практическом уровне это означает, что, например, электронная структура размещения документов по рубрикам и делам – не простой документ – он имеет огромную важность и равноценен всем описям бумажного архива месте взятым.

Обеспечить читаемость

Одной из основных проблем, которую необходимо решить при организации долговременного хранения электронных документов, является обеспечение их читаемости на протяжении всего жизненного цикла. Задача это многоплановая: необходимо сделать так, чтобы электронный документ можно было прочитать на той компьютерной системе или устройстве, на которой они первоначально были созданы и/или где они в настоящее время хранятся и/или которая в настоящее время используется для доступа к ним и/или которая будет использована для хранения электронной документов в будущем.

Сохраненная на цифровом носителе информация может со временем стать нечитаемой. К этому может привести несколько причин.

Воздействие плохих условий хранения приводит к физическому износу или порче носителей. Все виды носителей, используемые в настоящее время для хранения электронных документов, чувствительны к воздействию неблагоприятной окружающей среды, - например, к перепадам температуры и влажности. Подобные неблагоприятные условия или повреждают носитель, или ускоряют процесс его "старения" и деградации. Для обеспечения максимального срока службы различных типов цифровых носителей требуются различные уровни контроля параметров окружающей среды в местах хранения.

При использовании некоторых технологий записи информации порча данных возможна вследствие воздействия магнитных полей, пыли и загрязняющих окружающую среду веществ (магнитные носители), в то время как другие виды носителей (оптические) менее подвержены влиянию внешних факторов и менее чувствительны к повреждениям, случающимся вне строго контролируемой среды хранения.

Моральное устаревание носителей и оборудования, которое происходит в том случае, когда устройство (например, лента или диск) физически несовместимо с имеющимся компьютерным оборудованием (например, приводом для чтения лент или дисков), и, следовательно, информация не может быть прочитана. Моральное устаревание носителей неизбежно, поскольку технологические достижения постоянно изменяют способы физического хранения электронных документов (происходят, например, изменения в технологии записи, в интерфейсах оборудования и программного обеспечения приводов); изменяются конструктивные параметры устройств. Как следствие, со временем более старые носители информации становятся несовместимыми с появившимися позднее носителями и оборудованием.

Устаревание форматов документов – электронные документы создаются и используются в различных форматах. Многие из них являются "закрытыми" - либо недоступны их подробные описания, либо их использование может быть затруднено вследствие прав интеллектуальной собственности. Это создает угрозу доступности информации при долговременном хранении, поэтому уже сейчас при передаче электронных документов на длительное хранение из широкого набора форматов, используемых создателями и получателями документов, выбирается небольшое число часто используемых стандартов, подходящих для целей архивного хранения.

Именно поэтому сейчас так популярны открытые форматы, которые позволяют работать с электронными документами даже в отсутствие программного обеспечения, использовавшегося для их создания. Специалисты рекомендуют в случае необходимости сохранения электронных документов в "нестандартном" формате постараться оставить максимально подробное его описание и также само ПО.

Среди форматов для длительного и постоянного хранения пока что доминируют (среди текстовых) PDF/A, другие версии открытого формата PDF, SGML, XML и TXT. Для хранения веб-страниц используется HTML. Стоит отметить, что новые открытые форматы ODF и OOXML для длительного и постоянного хранения документов пока не используются.

Устаревание программного обеспечения. При создании и использовании электронных документов организации и отдельные лица используют широкий набор пакетов программ. Для обеспечения сохранности документов чрезвычайно сложно сделать доступ к соответствующему ПО или поддерживать все эти пакеты в работающем состоянии.

Часть электронных документов может оказаться зависимой от программного обеспечения, - и, соответственно, их можно будет использовать лишь в устаревших информационных системах.

Воздействие плохих условий хранения приводит к физическому износу или порче носителей

Воздействие плохих условий хранения приводит

к физическому износу или порче носителей

Операционные системы и прикладное ПО неизбежно будут вытесняться более новыми и производительными, имеющими больше функциональных возможностей. Это означает, что для сохранения документов придется периодически перемещать электронные документы из текущей программной среды в новую.

Выбрать стратегию

Существует несколько основных стратегий обеспечения долговременной сохранности информации, которые могут также использоваться в различных комбинациях.

Копирование. Для кратко- и среднесрочного хранения самым простым и надежным решением является копирование электронных документов на новые носители. Таким образом решается проблема замены поврежденных и устаревших носителей.

Миграция. По оценкам специалистов, трудно ожидать, что старые форматы будут поддерживаться 10 лет и дольше. В этом случае может потребоваться преобразование документов в другие форматы и/или перенос в другие операционные системы. Однако при миграции часто не удается избежать определенных искажений и изменений в документах.

Одним из важных видов миграции является перевод электронных документов на аналоговые носители, – бумагу, микропленку и т.д., - в тех случаях, когда дальнейшее сохранение информации в электронной форме признается неоправданным.

Следует отметить, что если в целях "просто" сохранения информации допустима "ручная" миграция, то для сохранения юридически значимых документов миграция должна проводиться автоматически – только тогда можно будет более-менее уверенно защититься от обвинений в том, что операторы исказили или могли исказить документы.

Эмуляция – пока что популярна в основном у теоретиков. Привлекательна она тем, что если написать для нового компьютера программу, точно эмулирующего работу старого, то для доступа к информации можно использовать оригинальные электронные объекты и ПО. В то же время эмуляция является практически единственным решением, если нужно сохранить, например, исполняемую программу, исходных кодов к которой нет.

Обеспечить организационные меры

Технические меры позволяют сохранить информацию и, в некоторых случаях, доказать ее целостность, однако их, как правило, недостаточно для того, чтобы убедить суд или государственные органы, что она сохранила аутентичность и не была искажена.

Эту часть задачи решают организационные меры. Среди них можно выделить определение методов хранения и путей обеспечения целостности и аутентичности. Здесь определяется позиция организации в отношении выбора одного из двух способов хранения электронных документов: на съемных носителях (предпочтительно – однократной записи: CD, DVD и т.п.) или "онлайн" в системах электронного документооборота или в электронных архивах, использования криптографии и разработки комплекса организационных мер по методологии "менеджмента качества" (СМК). Кроме того, среди организационных мер - опережающая сдача документов на архивное хранение и использование стандартных форматов для длительного хранения.

В конечном итоге, как и в случае бумажных архивов, надежность документов определяется тем, насколько хорошо организована деятельность архива и насколько надежен его персонал.

США: первый опыт «досрочной» передачи в Национальные архивы электронных документов постоянного срока хранения

В январе 2006 года Министерство обороны передало на депозитарное хранение в Национальные архивы 800 тысяч документов в формате PDF – документацию бывшей штаб-квартиры коалиционных сил в Багдаде.

Документы еще 25 лет останутся под контролем военных, но досрочная передача документов позволяет специалистам Американских национальных архивов начать работу по обеспечению их сохранности.

Использовать «однократные» носители?

При хранении электронных документов на носителях однократной записи "мастер-копия" находится на носителях. Те же документы в онлайн-системе рассматриваются как рабочие копии.

У такого способа есть несомненные достоинства. Если электронные документы записываются на носитель однократной записи в момент времени, максимально близкий ко времени их создания, и носитель "закрывается", - то дальнейшее управление электронными документами аналогично управлению привычными бумажными делами. Не требуется переучивать архивных специалистов, и можно использовать апробированные стандарты и методики работы.

Этот метод также имеет и свои недостатки. Так, проблемой является оперативный доступ к документам. Более того, этот метод неудобен при больших объемах документов и при большом размере самих документов. Сложно проводить частичное уничтожение документов, а также обслуживание, конверсию и миграцию - поскольку может потребоваться вставить в привод, прочитать и извлечь из привода тысячи носителей. Кроме всего прочего, носители могут "потеряться" в хранилище, при их перемещении и использовании.

Отечественных рекомендаций по обеспечению долговременной сохранности электронных документов на носителях пока нет.

Существует несколько зарубежных норм, детально регламентирующих хранение электронных документов на съемных носителях однократной записи. Наиболее авторитетными из являются французский стандарт NF Z 42-013 "Требования к разработке и использованию информационных систем по обеспечению целостности содержащихся в них документов" и британский BIP 0008-1:2004 "Практика, обеспечивающая юридическую и доказательную силу информации, сохраняемой электронным образом".

Оба эти стандарта успешно используются в своих странах уже более десяти лет. Оба следуют принципам, предложенным в стандартах менеджмента качества.

Рекомендации Национальных архивов США (NARA) по сохранению электронных документов на носителях однократной записи (разработаны в 2003 году для федеральных государственных учреждений):

использовать носители с ожидаемым сроком службы не менее 20 лет, поддерживаемые многими производителями;

мигрировать документы со старых носителей на новые каждые 10 лет;

контролировать отсутствие изменений в документах;

миграцию документов осуществлять на технологически нейтральные файлы форматов XML, RTF;

хранить электронные носители в стабильной среде: температура 15-18 градусов, влажность 35-45%;

ежегодно проводить выборочную проверку документов, чтобы убедиться в их сохранности, их проверка на читаемость, и при 10 ошибках чтения – заменять носитель и восстанавливать данные; если высокий риск ошибок характерен для определенной партии носителей – переписывать всю партию;

протоколировать все действия с документами.

Хранить ли онлайн?

Этот метод хранения архивных документов появился сравнительно недавно. Внешне его отличие от первого метода не бросается в глаза, поскольку, как и там, документы хранятся и в онлайн-системе (это может быть, в том числе, иерархическая система хранения данных), и на съемных носителях. Однако в данном случае мастер-копией являются данные в системе, а данные на носителях рассматриваются исключительно как резервные копии.

Принципиальное отличие этого метода заключается в том, что если нужно выполнить какие либо операции, охватывающие большие массивы документов, то не нужно тратить время на установку, извлечение и считывание носителей. Кроме того, становится возможной более глубокая автоматизация архивных операций, в том числе такой трудоемкой, как миграция.

Суды регулярно выносят решения на основе доказательств, представленных в электронном виде

Суды регулярно выносят решения на основе доказательств,

представленных в электронном виде

Дополнительным плюсом является то, что информация постоянно доступна для использования, и архив может окупать себя, информационно поддерживая основную деловую деятельность или же оказывая платные услуги. Съемные носители такую оперативность обеспечить не могут, поэтому все чаще и государственные и коммерческие организации используют именно "онлайн"-метод.

Методических материалов по данному методу пока что немного. Можно, в частности, использовать ряд рекомендаций, содержащихся в упомянутом выше британском стандарте BIP 0008-1:2004.

Самой сложной проблемой при организации долговременного хранения электронных документов с ЭЦП является необходимость поддержания возможности в любой момент убедиться в подлинности ЭЦП. Для архивов это означает, что придется сохранять в рабочем состоянии множество версии и поколений инфраструктуры открытых ключей PKI. Большинство российских организаций (а что уж говорить про государственные архивы!), не готовы сейчас к решению таких задач, у них для этого нет ни финансовых, ни технических, ни кадровых ресурсов.

По мнению авторитетных специалистов, подтверждаемому уже имеющимся практическим опытом, решением проблемы является отказ от сохранения ЭЦП "в рабочем состоянии". Главное, по их мнению, чтобы при постоянном хранении электронных подписей (включая ЭЦП) можно было бы удостоверить роль, которую подпись выполнила в прошлом, в отношении интересов создавшей документы организации, интересов третьих сторон, культурных и исторических интересов общества.

При поступлении таких документов на постоянное или длительное архивное хранение, ЭЦП рекомендуется проверять и "снимать", фиксируя всю содержащуюся в ней информацию в метаданных документов. В дальнейшем защита целостности и аутентичности документов должна уже обеспечиваться силами и средствами архива.

Хотя электронные архивисты не горят желанием возиться с ЭЦП, те же самые технологии, на которых базируется ЭЦП, начинают все более активно использоваться в электронном архивном деле – в первую очередь для защиты целостности документов. Поскольку подписывать миллионы документов архивными ЭЦП нереально, то используется система иерархического определения дайджестов (хэшей), когда в итоге вычисляется дайджест всего архива или крупной его части. Тогда одна архивная ЭЦП способна подтвердить целостность всего огромного архива.

В статье перечислен далеко не полный перечень проблем, которые придется преодолевать в самом ближайшем будущем. К сожалению, как показывает российский опыт решения других проблем "электронного правительства", затягивание приводит тому, что все придется определять в авральном порядке, рискуя принять неверные или ошибочные решения. Государство должно в срочном порядке создать электронные архивы на федеральном и региональном уровне, с тем, чтобы успеть подготовиться к тому моменту, когда придется в массовом порядке принимать на хранение электронные документы. Иначе есть вполне ощутимый риск потерять значительную часть документального наследия страны.

 

 

Похожие записи
Комментарии (0)
Сейчас обсуждают
Больше комментариев