Ретроконверсия – важный этап создания электронного архива
Рассмотрим этапы и подводные камни процесса ретроконверсии – оцифровки бумажного архива организации.
А.А. Назаренко, директор по качеству, компания «ИнтерТраст»
Важным этапом создания электронного архива является процесс ввода в него архивной документации. Обычно данный процесс представляет собой прямую передачу надлежащим образом оформленных дел из корпоративной системы электронного документооборота в ее специализированный модуль «электронный архив». Даже если дела в СЭД нуждаются в дополнениях, к примеру в создании описей, а также сдаточной документации, тем не менее этот процесс является практически полностью автоматизированным. Совершенно другим, значительно более затратным и по времени и по финансам является процесс ретроконверсии – оцифровки бумажного архива организации.
Каковы этапы ретроконверсии?
Их несколько:
● получение образа документа. Для этого может быть использовано разнообразное оборудование.
Самым дешевым являются офисные сканеры, функциональность которых может быть расширена лотком автоподачи и системой двустороннего сканирования документа. Далее идут документные сканеры, затем потоковые сканеры, обеспечивающие самую высокую скорость сканирования, богатые возможности, но при этом отличающиеся высокой стоимостью. Штативные фотосканеры переводят документы в цифровую форму посредством фотографирования;
Важно знать! Просмотр PDF-, графических многостраничных (TIFF) и одностраничных (JPEG, PNG), звуковых (WAV, MP3, AMR) файлов и медийных дисков в формате образа (ISO) достигается с помощью дополнительно установленных в системе просмотрщиков/проигрывателей/монтировщиков. |
● формирование метаданных, то есть хранимых отдельно от контента документа полей с описательной информацией, позволяющей ECM-системе этот документ корректно обрабатывать;
● маркировка документа, производимая для автоматизированного заполнения метаданных в архивной системе (для этого используются программное обеспечение для генерации штрихкода, принтер штрихкода, программный считыватель штрихкода, ручной сканер штрихкода, необходимый при непосредственной работе с маркированными документами).
Работая в комплексе, подсистема маркировки, построенная таким образом, обеспечивает возможность проведения процедуры ретроконверсии на адекватном техническом уровне;
● извлечение (распознавание) контента. Производится с использованием OCR-системы. Для этих целей преимущественно используется Abbyy FineReader 7.0 Scripting Editiion. В задачу данной системы входит перевод изображения (образа) документа в текстовый формат с сохранением форматирования либо без такового.
Не оснащенная этим функционалом архивная система не сможет обеспечить полноценную индексацию, а также исключит возможность использования полнотекстового поиска по хранимой в системе документации.
В совокупности перечисленные пункты описывают затраты, необходимые для проведения ретроконверсии документов в рамках одного проекта (не используя аутсорсинг). Эта сумма должна быть разделена на время эксплуатации оборудования и ПО, применяемых для ретроконверсии, стоимость расходных материалов за тот же период, а также затраты на персонал, осуществляющий ввод документных данных в архивную систему. Соотнеся полученные затраты с объемом ретроконверсированной документации, мы получим стоимость ввода в систему единичного документа. Также немаловажно, что само сканирование не является достаточным условием для ввода документа в систему, так как ECM-система требует получения метаданных документа, а поисковая подсистема – текстового контента. Лишь тогда мы можем говорить о полноценном вводе документа в соответствии с требованиями системы электронного архива.
Процесс ретроконверсии столь трудоемок, что перед организацией сразу встает вопрос: проводить ли оцифровку самостоятельно либо передать ее на аутсорсинг компании, для которой этот комплекс задач является профильным.
Рассматривая аутсорсинг именно процедуры ретроконверсии (т. е. пополнения фонда электронного архива из имеющегося архивного фонда предприятия или органа власти), необходимо отметить, что этот рынок настолько мал, что силами единственной хорошо оснащенной компании он покрывается практически полностью (крупнейшей из них, обладающей самой совершенной методической и технической базой, является корпорация «Электронный архив»).
Каковы же причины этого? Самая актуальная – низкая востребованность. Многие компании, обладающие обширным архивным фондом, не нуждаются в возможностях ни электронного доступа к образам документов, ни полнотекстового поиска информации по архивам. Главная их потребность – автоматизация функционала архивной картотеки, так как имеющаяся классическая картотека заметно снижает производительность работы архива. Таким образом, вложения в ретроконверсию слишком затратны и одновременно не так сильно необходимы. Рассмотрим в качестве примера две крупных отечественных компании.
Аэрофлот, крупнейший пассажирский авиаперевозчик в стране, согласно собственным локальным актам, дополнительно регулирующим деятельность архива компании, осуществляет хранение всех корешков билетов всех пассажиров, перевозка которых была осуществлена, на всех рейсах с 1923 г. В современных условиях это означает пополнение документного фонда, передаваемого затем на архивное хранение, не менее чем на 20–25 млн документов в год. Безусловно, хранение образов документов в условиях такого обширного документопотока не является эффективным, учитывая, что истребование документации из архивов компании осуществляется только при чрезвычайных ситуациях. Решение в виде архивной картотеки для этих целей более предпочтительно, чем хранение всех образов документов и их контента.
Сберегательный банк Российской Федерации комплектует свои архивы с 1841 г., когда император Николай I принял устав сберегательных касс. С того момента документы, подтверждающие проведение всех финансовых операций в банке, передаются по окончании текущего делопроизводства по ним в архивы организации. В настоящее время филиальная сеть банка насчитывает более 19 000 офисов и является крупнейшей в Восточной Европе. Документы, подтверждающие каждую оплату коммунальных услуг, услуг связи и иные платежи, сохраняются банком для возможности дальнейшего использования. В таких условиях провести процедуру ретроконверсии не представляется возможным в принципе, и даже внедрение архивной системы типа автоматизированной картотеки вызывает большие затруднения вследствие огромного количества дел в архиве этой организации.
Крупные и средние компании в большинстве своем обзавелись системами электронного документооборота и архива. А что делать небольшим организациям, не обладающим мощными материальными ресурсами для приобретения дорогостоящего ПО?
Если еще год или два назад таким предприятиям СЭД была просто не по карману (необходимость поддержания ее работы требовала немыслимых для малого предприятия затрат), то в настоящее время ситуация изменилась. Принципиально новый подход к созданию СЭД для небольших компаний появился параллельно с массовым проникновением сети Интернет в нашу жизнь и в бизнес – возникла идея не передавать программное обеспечение конечному пользователю, а предлагать ему возможность пользоваться находящимся у исполнителя ПО на временной основе с оплатой по количеству рабочих мест за определенный временной срок. Такая модель предоставления услуг по организации электронного документооборота, получившая название SaaS (software as a service), значительно удешевляет проект. Система электронного документооборота лишилась ключевого для предприятий сектора среднего и малого бизнеса недостатка: больших вложений в техническую поддержку ПО, которая передается на аутсорсинг профильной IT-компании. Доступ в СЭД (с определенного договорными отношениями количества рабочих мест) осуществляется через сеть Интернет.
Пока остается открытым вопрос безопасности хранимых в такой системе документов. Решить возникшую задачу способны современные мощные системы криптографии, которые обеспечивают хранение на сервере зашифрованных криптоалгоритмом документов. Потребность в электронном архиве, создаваемом по модели SaaS, возникнет примерно через 3-4 года после появления на рынке полноценной SaaS-системы электронного документооборота. И это вполне объяснимо жизненным циклом документа, который начинается в форме проекта. В дальнейшем документы формируются в дела, лишь через три года после завершения дела они при условии наличия в них документации, имеющей важность для работников, общества или государства, сдаются на хранение в архив организации. По истечении срока хранения в архиве документация, утратившая актуальность, уничтожается. Для отдельных видов документов срок хранения может быть продлен. Третьи виды документов, имеющих ценность лишь для государства, передаются на хранение в структуры федерального архивного агенства (Росархива). Пока же полноценной СЭД, предлагаемой по модели SaaS, на рынке нет.
Тем не менее подвижки в преодолении недоверия к облачным технологиям уже заметны: появились SaaS-учетные системы, SaaS-CRM-системы. В скором времени можно ожидать и появление полноценных SaaS-СЭД, которые поначалу будут использоваться компаниями малого бизнеса. Возможно, это произойдет уже в 2012–2013 гг., а решения архивных хранилищ следующего поколения появятся не ранее 2015–2017 гг.
Примечание: эта публикация представляет собой часть статьи «Об электронных архивах: отдельные аспекты».
Комментарии 0