Журнал о системах электронного документооборота (СЭД)
Управление контентом

Как рационализировать проекты по классификации данных

  0 комментариев Добавить в закладки

Рафаэль Рейч

Необходимость защищать накопленные неструктурированные данные и управлять ими может быстро исчерпать ресурсы любой организации. К неструктурированным данным относятся все документы, таблицы, презентации и многое другое, что хранится на файл-серверах коллективного доступа, сетевых устройствах хранения, сайтах SharePoint и т. д. Они составляют около 80% бизнес-данных. Помимо того что неструктурированные данные составляют основную массу бизнес-данных, они каждый год растут в объеме на 50% с лишним. Поэтому очень трудно поддерживать этот ключевой ресурс бизнеса на должном уровне.

Для облегчения работы с неструктурированными данными многие организации запускают проекты в области классификации данных. При этом они надеются выявить сведения, требующие особой защиты, устранить все имеющиеся проблемы и наладить управление. К сожалению, проблемы в сфере бизнеса и технические трудности не позволяют полностью использовать потенциал систем классификации данных.

С точки зрения бизнеса основная проблема заключается в отсутствии практических результатов. Решения в области классификации данных создают список файлов, содержащих полезные сведения, но, по существу, не дают четкого ответа на вопрос, какова роль этих файлов для бизнеса и что с ними делать. Что касается технических проблем, то решения в области классификации данных просматривают все файлы с целью выявления релевантного контента и, следовательно, работают медленно. А при каждом новом поиске эти решения должны заново просматривать все файлы. На практике это означает, что они не поспевают за разрастанием объема данных и внесением в них изменений.

Ниже перечислены пять способов, которыми могут воспользоваться организации, чтобы ускорить получение практических результатов от классификации данных.

Способ 1: Определите, кому принадлежат данные

Владельцы данных играют важнейшую роль в управлении неструктурированными данными. Они понимают важность этих активов для бизнеса и, следовательно, непременно должны участвовать в процессе их классификации. Они должны помочь определить, кому предоставить к ним доступ, а кому запретить, какие виды защиты данных следует использовать. Они же подскажут, когда эти данные утратят свое значение для бизнеса. Если речь идет о конфиденциальных данных, их владельцы помогут определить, не подвергаются ли они риску и какие защитные меры следует предпринять.

Однако найти владельца данных не так просто. Местонахождение данных и названия папок, каталогов или сайтов часто не содержат указаний на истинного владельца, а имеющиеся в файловой системе метаданные о владельцах быстро устаревают. Наиболее часто используемые методы установления владельцев данных с помощью телефона и электронной почты оказываются недостаточными и неэффективными.

Лучше всего отслеживать владельцев данных с помощью автоматизированного, регулярно повторяющегося процесса. Один из наиболее эффективных способов заключается в фиксации всех, кто обращается к данным. Со временем станет понятно, кто пользуется ими чаще других. Такие пользователи смогут указать организации на владельцев данных.

Способ 2: Задокументируйте, какие данные представляют интерес

Для документирования ключевых слов, фраз и фрагментов текста, представляющих интерес для бизнеса, требуется понять, чем диктуется потребность в поиске данных. Чтобы выявить и задокументировать важные для организации данные, начинать следует, естественно, с владельцев данных и менеджеров, управляющих безопасностью и рисками. Во многих организациях стимулом является необходимость соблюдения нормативных требований. Государство часто определяет, какие данные являются конфиденциальными и какие меры должны быть приняты для их защиты. Интеллектуальная собственность, сведения о клиентах и сотрудниках также представляют собой часто встречающиеся виды информации, которые требуют особого внимания.

Если определить различные степени конфиденциальности, основываясь на типе контента, которым вашей организации необходимо управлять и который она должна защищать, это поможет более точно определить стоящие перед вами задачи. Накопленный в отрасли передовой опыт показывает, что действует выведенное эмпирическим путем хорошее правило, согласно которому количество иерархических уровней в организации следует ограничить четырьмя. Если их больше, это затрудняет управление. Например, можно начать со следующих четырех уровней: секретные, конфиденциальные, частные и общедоступные данные.

Способ 3: Используйте метаданные

Метаданные — сведения о ваших данных (например, типы и местонахождение файлов) следует целенаправленно использовать для ускорения ваших проектов в области классификации. Метаданные создают дополнительный критерий поиска, поскольку содержат указания, где искать и каков будет ожидаемый результат.

Например, если вы хотите выявить подвергающиеся риску сведения о кредитных картах, вы можете использовать метаданные о том, кому разрешен доступ к такой информации, чтобы обнаружить файлы, которыми пользуется слишком много народу. Затем вы можете поискать в этих файлах данные о кредитных картах. И если в открытых для большого числа пользователей файлах содержатся конфиденциальные сведения, то такое положение необходимо исправить. Измените порядок доступа к данным таким образом, чтобы он соответствовал принципу максимального ограничения привилегий (иначе говоря, доступ открывается только при наличии такой необходимости с точки зрения бизнеса). Ниже приведены примеры метаданных и показано, как их можно использовать для целенаправленной и ускоренной классификации данных.

1. Допуск к данным

Тщательный анализ разрешений на доступ к файлам, папкам и сайтам покажет организации, кто обладает правом знакомиться с конфиденциальными сведениями и к каким данным предоставлен излишне широкий доступ.

2. Фактическое обращение к данным

Сведения об обращении к данным содержат важную информацию. Например, какие папки используются наиболее часто, а какие не востребованы вообще. Они подскажут также, какие данные были добавлены или изменены за последнее время. Такая информация имеет огромное значение, например, для сокращения времени поиска. После первоначальной классификации поиск можно ограничить просмотром тех данных, которые еще нуждаются в классификации (иначе говоря, данных, в которых поиск еще не проводился). Организации могут определить, к каким данным получали доступ отдельные пользователи или группы, чтобы видеть, кто реально обращался к конфиденциальным сведениям.

3. Владение данными

Информация о владельцах данных помогает ограничить поиск теми данными, которые принадлежат конкретным людям. Так, если организации работают с частными лицами и хотят помочь им управлять своей конфиденциальной информацией, соответствующие метаданные позволят сузить поиск конфиденциальной информации, ограничив его просмотром только релевантных данных.

Способ 4: Доводите информацию до сведения руководства и вносите усовершенствования

Найти нужные данные, конечно, важно, но для проекта в области классификации это не является конечным результатом. Организации необходимо довести их до сведения лиц, принимающих решения. Обычно это владельцы данных и сотрудники групп, ответственные за управление данными и рисками, а также за соблюдение нормативных требований. Эти люди должны проанализировать ситуацию и приступить к формулированию стратегий и планов внесения усовершенствований.

Обычно владельцы данных могут точнее других определить, о чем говорят данные, там ли они хранятся, где им следует быть и кто должен получить к ним доступ, а кто нет. Они способны также оказать помощь в разработке стратегии и процесса внесения усовершенствований, особенно если у них имеются примеры использования принадлежащих им данных. Группы GRC могут обеспечить общее руководство, которое должно гарантировать, что данные защищены в соответствии с принятыми в организации требованиями. Эти группы могут использовать полученные результаты в качестве основы для составления документации в соответствии с требованиями аудиторов.

Способ 5: Регулярно перепроверяйте данные

Компаниям следует наладить процесс периодической перепроверки данных, чтобы обеспечить корректное представление важных сведений. Данные непрерывно растут в объеме и изменяются, поэтому возникает необходимость в таком процессе. В идеале организации должны ограничить область поиска только добавленными в последнее время данными, чтобы определить, содержат ли они нужную информацию, и теми из накопленных прежде данных, которые подверглись изменениям, чтобы выяснить, не утратили или не приобрели ли они значение с точки зрения классификации.

Заключительные соображения

Чтобы разыскать важные сведения среди всех имеющихся в организации неструктурированных данных, необходимо использовать какое-то решение в области классификации информации. Просто объем данных слишком велик, чтобы их можно было обрабатывать и отслеживать вручную. Хотя перед организациями открывается широкий выбор решений, остановиться следует на том, в котором используются все возможности метаданных для достижения важных с точки зрения практики результатов. Без метаданных классификация занимает слишком много времени, а ее результаты обычно не учитывают контекст, который бывает важен для решения существующих проблем.

Источник: PCWeek, 24 марта 2010

Похожие записи
Комментарии (0)
Сейчас обсуждают
Больше комментариев