Журнал о системах электронного документооборота (СЭД)
Основы электронного документооборота

Какие инструменты поиска и анализа данных существуют в современных СЭД?

  1 комментариев Добавить в закладки

Вопреки распространенным представлениям, содержимое современной ECM-системы не является однородным массивом информации. Можно условно выделить структурированную и слабоструктурированную часть.

В структурированную часть входят регулярные документы: приказы, договоры, счета, письма, служебные записки. Для этих документов  мы можем установить важные признаки или, иначе говоря, метаданные. Например, для договора это будут контрагенты, дата, номер, предмет договора и т.п. Для счета – сумма, поставщик, дата, номер, товарные позиции и многое другое. В дальнейшем, как правило, поиск производится по этим метаданным.

Есть и другие способы структурирования информации. Например, регистрация документа, когда в дальнейшем документ адресуется по регистрационному номеру. Или же таким примером может служить каталогизация, когда мы присваиваем документу одну или несколько категорий, и в дальнейшем ищем его по этой категории. Такие сложные методы структурирования должны решить задачу полноты списка результатов при поиске информации. Например, если регулирующий орган обратился с запросом, то мы должны предоставить все документы, удовлетворяющие запрошенным реквизитам. Если, скажем, налоговая служба требует предоставить все договоры с контрагентом А за три предыдущих года, мы должны предоставить именно все договоры. Совершая запрос в ECM-системе, мы должны быть уверены в том, что результат будет полным. Иначе нас ждут неприятные штрафные санкции.

В тоже время в ECM-системе есть слабоструктурированная часть – это проекты документов, аналитические записки, результаты исследований, проектные документы. Можно сказать, что эта информация – это «знания» или интеллектуальная собственность организации. Поиск нужной информации в этой области – достаточно сложное занятие. Прежде всего, в силу того, что эта информация менее формализована, и метаданные хранят меньше полезных знаний. Например, если нам известен только предполагаемый автор документа, а этот сотрудник за годы работы создал сотни документов, то найти нужные документы будет нелегко.

В этом случае все чаще применяется поиск по тексту документа и другие интеллектуальные методы поиска, например, лингвистический поиск. Но это тема отдельного разговора.

 

Источник: Журнал "Современные технологии делопроизводства и документооборота"

Ещё материалы автора
Похожие записи
Комментарии (1)
Сейчас обсуждают
Больше комментариев