Как правильно организовать автоматизированный ввод документов в систему электронного документооборота (СЭД)?
Проблема перевода документационных фондов в электронную форму чрезвычайно актуальна на сегодняшний день. Основными составляющими данного процесса являются сканирование и распознавание электронных образов документов.
Надежда Журавлева,
менеджер по работе с клиентами ЗАО «Компания «ИнтерТраст»
Распознавание документов и хранение в архиве Архив без пыльных полок или способы организации архива документов предприятия Одной из важнейших задач внедрения систем электронного документооборота считается перевод бумажных документов в электронный вид. С системами документооборота также тесно связано создание электронных архивов, которые могут быть их частью или отдельным независимым проектом. Развитие рынка архивирования и потокового ввода документов стимулируется накоплением в управленческих системах электронных документов, часто не имеющих бумажных аналогов. Повсеместное внедрение электронных архивов и систем документооборота увеличивает потребность в обработке уже существующих огромных бумажных масс и потока вновь возникающих документов. Проблема перевода документационных фондов в электронную форму чрезвычайно актуальна на сегодняшний день. Основными составляющими данного процесса являются сканирование и распознавание электронных образов документов.
Сканирование документов — это получение образа бумажного документа в электронном виде. Оно является неотъемлемой составляющей процесса перехода от бумажного ведения дел и бумажных архивов к электронным системам хранения информации и работы с ней.
Объектами сканирования могут быть как простые постраничные тексты на листах разных форматов, так и сложные, сброшюрованные (сшитые) документы с большим количеством реквизитов и внешних отметок. Источниками информации могут быль печатные (книги, журналы, статьи, листовки, рекламные материалы) или рукописные документы, ранее отсканированные изображения, мультимедиа источники и другие электронные ресурсы.
Под потоковым (или массовым) вводом обычно понимают наполнение электронных архивов: совокупность операций сканирования, индексации, создания электронных ресурсов из образов документов разного типа.
При сканировании больших объемов данных возникают следующие задачи:
● необходимо провести сканирование документов различных форматов и качества так, чтобы на выходе всегда иметь четкий образ нужного разрешения;
● сделать это быстро, надежно, экономно и качественно.
Одним из наиболее трудоемких и длительных этапов внедрения любой системы электронного документооборота является первичный ввод информации в СЭД. Будь то сканирование и создание минимальной карточки электронного документа с 4-5 атрибутами или полное распознаванием текста документа.
Ввод данных в систему автоматизации документооборота не ограничивается добавлением значений в таблицы баз данных и копированием новых файлов в хранилища. Данные вводятся с учетом согласованных и утвержденных:
● организационной структуры компании и структуры системы;
● единых справочников и классификаторов, используемых в системе;
● форматов и типов файлов, которые утверждены внутренними положениями о делопроизводстве в данной организации;
Разместить большой массив данных могут помочь и современные технологии.
Существуют два основных канала поступления информации, требующей сканирования для размещения в системе электронного делопроизводства: обработка документов по мере их поступления в офис, обработка накопленных данных.
Обработку документов по мере их поступления в офис ведут секретари-делопроизводители в общих отделах. Скорость сканирования в данном случае не важна, следовательно, на рабочем месте секретаря может работать любой планшетный сканер из тех, что используются в офисах. Весь цикл обработки принятой информации проводится на одном месте — ознакомление, создание учетной карточки, сканирование и прикрепление файла, регистрация документа. При частой обработке больших многостраничных документов стоит задуматься о приобретении потокового сканера.
Обработка накопленных данных, эту важную часть работы по заполнению электронного архива, поручают, как правило, сотрудникам IT-отдела компании или аутсорсинговой компании (если документы не являются коммерческой тайной компании). Для автоматизированного ввода большого объёма информации необходимо использование промышленных, высокопроизводительных сканеров. Требуется организовать распределённую систему обработки, в которой каждый сотрудник должен иметь чёткую специализацию: сканирование, распознавание, верификация, экспорт.
Отсканированный материал сохраняется в следующих форматах: JPEG, TIFF одно/много страничный, PDF одно/много страничный. Необходимые параметры современных сканеров: установка разрешения (DPI), просмотр и изменение размера, поворот изображения, автокоррекция цвета, яркости и контрастности, обрезка страниц, очистка изображения от лишних точек, сохранение в файл и т. д.
Очень важно, чтобы при использовании для работ аутсорсинговой компании полученные электронные документы были в целости и сохранности переданы заказчику, в связи с чем сейчас на проектах перевода документов в электронный вид используются мобильные RAID-накопители. Данные не стираются до тех пор, пока не произойдет передача документов и не наладится резервное копирование данных на серверах заказчика.
Как при первом, так и при втором способе получения информации для ввода в СЭД необходим строгий контроль качества выполнения работ. Причем при промышленном сканировании этому вопросу необходимо уделить пристальное внимание. Проверка качества ввода данных должна осуществляться на всех этапах выполнения проекта. При больших объемах должна производиться выборочная проверка качества ввода. При выявлении определенного процента ошибок по конкретному массиву данных, превышающего оговоренный в соглашении, необходимо проводить постраничную сверку.
Экономически оправданной автоматизация ввода становится при обработке от 100 и более документов в день.
Проведение работ по переводу документационного фонда в электронный вид можно подразделить на следующие этапы:
● обследование существующего бумажного архива — количество, качество, форматы и виды документов, которые необходимо будет отсканировать;
● подготовка к сканированию — сортировка по видам, форматам и качеству документов, определение сроков работ для каждого вида отдельно (!!!);
● подбор оборудования и программного обеспечения, определение настроек сканирования для каждого вида отдельно (!!!);
● сканирование и сохранение изображений в выбранном заказчиком формате;
● проверка соответствия электронной версии бумажному оригиналу, необходимая корректировка, при необходимости пересканирование с другими настройками;
● сохранение полученных данных в требуемых форматах и в заданной структуре, при необходимости запись на электронный носитель;
● автоматическое заполнение уже существующей информационной структуры карточек СЭД — внесение атрибутов, занесение файлов документов при помощи специализированных подсистем;
● распознавание текстов новых документов СЭД и их индексация для осуществления возможностей контекстного поиска.
При реализации проектов по сканированию больших массивов данных применимы все современные методики проектного управления, которые дают возможность снизить сроки выполнения в несколько раз. Подходить к проблеме ввода данных в СЭД надо комплексно и крайне аккуратно.
Любой проект по сканированию фондов документов для создания электронного архива начинается с процесса организации проекта, на котором происходит технико-экономическое обоснование проекта. Проводится тщательно обследование существующего архива документов: качественный и количественный анализ, описание существующих процессов, определение конечной цели проекта и условий наиболее быстрого и качественного достижения данной цели. Пишется итоговый документ (Требования, Техническое задание).
На этапе планирования определяется состав и последовательность работ, пишется расписание всего проекта, планируются человеческие и финансовые ресурсы, определяется необходимое качество электронных документов и описательных метаданных. Очень часто скорость и качество выполнения сканирования документов зависит от правильного выбора сканирующей техники. Поэтому на данном этапе обязательно проводится тестовое сканирование различных партий документов для выбора оптимального оборудования. Немаловажным элементом является планирование всех рисков проекта: техника при высоких нагрузках может выйти из строя, люди могут заболеть, при передаче часть данных может потеряться и т. д. На все риски должны быть подготовлены ответные действия в виде возможности выделить на проект дополнительную технику, людей, помещения, перестроить взаимодействие с заказчиком, привлечь внешних специалистов.
На этапе выполнения работ важно придерживаться календарного плана проекта, вести постоянный контроль качества сканирования, распознавания и ввода данных. Последнее может выполняться различными методами, начиная от многоуровневых выборочных проверок и отбраковок целых партий, заканчивая дублированием действий над одними и теми же документами и сравнением результатов.
Кто должен входит в состав проектной группы по переводу данных в электронный вид? Сложное современное оборудование, большие объемы данных, сжатые сроки и высокое качество выходных документов определяют требования к сотрудникам, ведущим работы. При этом качество и порядок исходных бумажных документов не должны пострадать. Данные условия определяют высокие промышленные требования как к оборудованию и технологиям, так и к методикам работы и квалификации персонала.
Для сканирования расшитых документов используются промышленные сканеры, скорость сканирования которых достигает 200 листов в минуту. Различные функции по улучшению качества изображений встроены на аппаратно-системном уровне. Для сканирования сшитых документов используются различные специализированные книжные сканеры или планшетные приставки документных сканеров, скорость работы которых значительно выше, чем у офисных аналогов.
Скорость работы вышеуказанного оборудования очень высока и соответственно работа группы сканирования должна быть построена наиболее оптимальным образом, чтобы обеспечить его нормальную загрузку. Два специалиста для подготовки документов к сканированию, высококвалифицированный оператор сканирования, два специалиста на привидение документов в исходное состояние и менеджер — вот минимальный состав группы сканирования.
Рынок систем потокового ввода растет на 16% в год. Причины подобного роста делятся на причины технического и экономического характера. К техническим относится постоянно развивающаяся инфраструктура компьютеров и сетей, позволяющая проще и быстрее передавать распознанные документы и их изображения, улучшение качества сканирования при снижении его стоимости, а также повышение эффективности работы систем распознавания и ввода. К экономическим относится в первую очередь необходимость организаций постоянно сокращать издержки для сохранения конкурентоспособности, в том числе за счет снижения затрат на работу с бумажными оригиналами документов и содержание бумажных архивов организации.
Если Вы все правильно организуете и реализуете перевод бумажных документов в электронный вид и дальнейшее их хранение, это позволит Вам значительно ускорить и упростить работу с архивом документов.
Комментарии 0