Взгляд на требования к потоковому вводу финансовых документов
Работа с документами в электронном виде становится все более и более привычной. Технологии дают все больше преимуществ работы с электронными документами и информацией в электронном виде, а не в бумажном.
Работа с документами в электронном виде становится все более и более привычной. Технологии дают все больше преимуществ работы с электронными документами и информацией в электронном виде. Поэтому неудобства работы с большим объемом бумажных документов становится все более очевидным. Но в то же время избавиться совсем от бумажных документов не получается, да и вряд ли получится в ближайшем будущем. Поэтому для многих организаций остро встает вопрос преобразования документов из бумажного вида в электронный. Эту мы попросили осветить Станислава Кима, генерального директора компании АЛЕЕ СОФТВЕР, которая занимается комплексным внедрением электронных архивов финансовой документации более 5 лет.
ECM-Journal. Станислав, скажите, пожалуйста, какие требования необходимо сформулировать, чтобы полноценно решить задачу потокового ввода финансовых документов?
Станислав Ким. Когда речь идет об архивах финансовой документации необходимо изначально понимать, зачем заказчику нужна система с графическими образами финансовой документации и каким образом она может помочь в решении проблем работы с документами. Стоит ли полностью распознавать документы или нужна только часть малая доля информации?
Для начала предлагаю разделить задачу наполнения информационной системы на две:
● Сканирование текущей ежедневной документации.
● Сканирование бумажного архива прошлых лет.
Обе они требуют различного подхода и реализации. Если решение первой задачи достаточно понятно и сканирование текущей ежедневной документации чаще всего уже реализовано в различных СЭД на хорошем уровне. Можно отсканировать пакеты документов, завести на них карточки и включить маршрутизацию, т.е. все, что требуется по принятому в компании делопроизводственному обороту. Со вторым возникают определенные трудности. В чем они заключаются?
Сканирование архива прошлых лет представляет собой проект с ограниченными временными, финансовыми, техническими, технологическими и людскими ресурсами. Часто такая задача сложна для самостоятельного выполнения и отдается на аутсорсинг. В большинстве случаев имеющийся архив документов представляет собой определенным образом структурированную совокупность разнородных документов, часть которых может быть сшита без возможности расшивки (контракты с приложениями). Первичная финансовая документация может быть сгруппирована в пакеты по проводкам и транзакциям, скреплена степлером и уложена в пластиковые фолдеры. Документы могут быть разных форматов от минимальных чеков и мелких бланков до А3 формата. Чтобы не сканировать лишние или продублированные документы, часто требуется архивная обработка опытными специалистами, в процессе работы также выявляется некомплект, ошибочная локализация документов и т.д. Современные протяжные документные сканеры имеют скорость сканирования свыше 100 страниц в минуту и лотки на 500 и более листов. Соответственно для обеспечения высокой скорости этапу сканирования предшествует достаточно кропотливая процедура подготовки документов. После сканирования документы необходимо вернуть в изначальное состояние.
ECM-J. Какие специфические требования предъявляют к потоковому вводу разные сферы?
С.К. Например, разные требования к распознаванию документов.
При обработке финансовой документации для автоматизированного атрибутирования, т.е. присвоения метаданных, предлагаются различные системы ICR или системы интеллектуального распознавания. Для больших массивов однотипной документации это актуально, а, например, для отсканированных контрактов – нет. Документы разнородны, некоторые атрибуты, например номер документа и дата нередко прописываются вручную. Полностью распознавать десятистраничный документ для вычленения 5-7 атрибутов задача дорогостоящая и не особо эффективная.
ECM-J. Почему проекты оцифровки больших массивов документов такие сложные и дорогостоящие?
С.К. Решающее значение играют несколько факторов:
● Большое разнообразие, сложность и дороговизна сканирующего оборудования (документные, книжные, протяжные широкоформатные и т.д.).
● Необходимость закупки дополнительной компьютерной техники: мобильные сервера и хранилища, рабочие станции, принтеры и сканеры штрих-кодов.
● Сложный технологический процесс, необходимость обучения сотрудников (менеджеров проектов, сканировщиков, сортировщиков, операторов ввода, менеджеров по контролю качества).
● Необходимость использования разнородного программного обеспечения: программы сканирования, сортеры, ПО графической постобработки, OCR, конвертеры, вьюверы и т.д.
● Каждый массив документов может потребовать свой комплект ПО, аппаратного обеспечения и процедуру обработки. Например, цветные государственные таможенные декларации с карандашными пометками придется сканировать иначе, чем сшитые черно-белые контракты. Но при этом качество документов должно оставаться приемлемым и в электронном виде читаться не хуже чем с бумажного оригинала.
Учитывая все эти сложности и нюансы, сканирование документов произведено и даже присвоены дополнительные атрибуты. Что дальше? Конечно, нужна информационная система, в которую все документы можно загрузить, сформировать к ним необходимые карточки, структурировать, назначить политики безопасности. Назовем данную систему электронным архивом финансовых документов. Конечно, в первую очередь необходима ее интеграция с финансовой учетной системой, кроме этого крайне полезна интеграция архива с CRM системой. Кстати, далеко не каждая СЭД хорошо справится с задачей построения электронного архива - причины могут быть как идеологические, так и архитектурные. Например, любовь некоторых вендоров хранить файлы в СУБД в виде блобов приводит к резкому снижению производительности системы на определенных объемах документов.
Так что для полноценного решения задачи потокового ввода финансовых документов необходимо тщательно проанализировать развитие таких вендоров как EMC Captiva или Kofax, создать (купить) под каждый процесс набор необходимых программных решений и научить весь этот сложный зоопарк слажено работать.
Каждый отдельный проект предъявляет свои специфические требования независимо от вида бизнеса или министерской принадлежности госкомпании. На российском рынке присутствуют компании, как продвигающие высокотехнологичные продукты поточного сканирования, так и сканирующие «на коленке», и каждая находит своего клиента. На сегодняшний день технологиям и средствам потокового ввода не хватает простоты использования и доступности. Нелегко угадать дальнейшие варианты развития рынка, но, по нашим прикидкам, еще несколько лет технологии будут оставаться сложными и дорогостоящими.
Комментарии 3
Станислав, спасибо большое! Очень доходчиво, толково и по делу!
Единственный вопрос который возникает после статьи: "понятно что дорого, но вот сколько конкретно?". Если это не ком. тайна, можете привести некоторые ориентиры - сколько стоит "типичный" проект создания электронного архива (я понимаю, что "типичный" - категория более чем условная, потому и беру его в кавычки). Или хотябы некоторые ориентиры, как оценить порядок затрат - что для этого надо знать, на что умножать, какой добавлять коэффициент, ...
Заранее благодарю.
Делим затратную часть на две:
1) Программное обеспечение, зависит от требований и предпочтений заказчика. Часто система уже есть и необходимо документы в нее залить. Нередко в процессе приходит понимание, что имеющаяся система, в том виде которая используется, запланированный объем не тянет. Решений два: модернизация имеющегося софта и приобретение другого софта для дополнительной работы с образами документов.
2) Сканирование и атрибутирование.
Исходные данные проекта:
Финансовый архив:
20 тыс документов в среднем по 5 листов (суммарно100 тыс листов) А4 формата
сканирование 1 страницы А4, одностороннее, ч/б, 200 dpi — 1,5 рубля, всего 150 тыс.рублей.
подготовка документа (снятие скрепок, изъятие и вложение обратно в фолдеры и папки, наклейка штрих-кода) - 7 рублей/документ, всего 140 тыс рублей,
атрибутирование (5 атрибутов на документ) — 5 рублей/документ, 100 тыс. рублей,
Итого:390 тыс рублей НДС.
И это только документы расшиваемые. Сканирование А4 сшитого на книжном или быстром планшетном сканере стартует от 5 рублей.
Учитывая, что документов обычно больше, считайте сами.
Спасибо!
И еще вопрос (опять из области "типичных", но что поделаешь) - сколько в среднем по срокам занимает такой проект?