Корпоративный поиск: от проблем к возможностям
Какие системы смогут стать для бизнеса и организаций инструментом эффективного управления информационными активами?
Поиск информации — одна из самых распространенных задач в корпоративной среде. Согласно исследованиям, сотрудники в среднем тратят на него треть рабочего времени. От качества поиска зависит скорость и эффективность бизнес-процессов, актуальность и полнота данных для поддержки принятия решений.
Об особенностях современного корпоративного поиска рассказывает Илья Калагин, руководитель Центра когнитивных технологий АйТеко, разрабатывающего интеллектуальные системы обработки информации.
За последние десятилетия процесс корпоративного поиска трансформировался. В первую очередь усложнилась ИТ-инфраструктура компаний: даже для решения стандартных задач специалист может взаимодействовать с пятью и более системами разных классов. Оказывает влияние экспоненциальный рост объемов производимых, хранимых и обрабатываемых данных и увеличение в них доли неструктурированной информации.
Потребности корпоративного поиска изменились, а инструменты во многих компаниях остались прежними: сотрудники продолжают пользоваться поисковыми интерфейсами нескольких систем и хранилищ. Рассмотрим возможности и ограничения такого подхода для создания эффективной цифровой рабочей среды и сопоставим с актуальными задачами поиска.
Поиск по естественному запросу во всех источниках
Современная корпоративная среда подразумевает наличие нескольких ИТ-систем, файловых хранилищ, электронной почты, облачных сервисов. Одним из ключевых ограничений поиска в нескольких системах остается условие, что сотрудник до его начала должен знать местонахождение искомых данных. Если же он не знает название документа и систему, в которой его стоит искать, то высока вероятность завершения поиска неудачей. То есть его запрос пользователя подразумевает не только поиск документа, но и определение места его хранения.
Также становится очевидной необходимость реализации поиска на естественном языке, важность учета словоформ и синонимов. В условиях совместной работы сотрудники могут использовать разные слова и термины для описания одних и тех же объектов и сущностей. На практике пользователи редко применяют специальный поисковый синтаксис, поэтому система должна быть способна извлечь из хранилища искомое при различных формулировках запроса.
Документы и файлы разных форматов
Объем неструктурированных данных среди хранимой и обрабатываемой информации растет. Многие компании находятся в процессе отказа от бумажных носителей и полного перехода к цифровому хранилищу. Поэтому у сотрудников есть потребность в качественном поиске по сканированным документам, оцифрованным копиям, изображениям. Во входящем потоке могут присутствовать разные форматы документов — например, форматы открытых офисных пакетов типа odt и файловые архивы.
Большинство решений для интеллектуального корпоративного поиска взаимодействуют со всеми популярными офисными форматами. Поиск возможен и по графическим образам: PDF-файлам, сканированным документам. Поэтому внедрение корпоративного поиска может помочь организациям с длительной историей деятельности и с большими объемами бумажных архивов, в том числе упростить их переход к единому цифровому хранилищу.
Инструменты навигации и анализа данных
Формирование релевантной выдачи нельзя считать завершением корпоративного поиска. Из-за больших объемов хранимой в организациях информации в ней могут быть десятки и сотни наименований. Необходимы дополнительные инструменты для навигации, оценки качества и анализа полученных данных. Пользователю могут быть интересны все документы, связанные с определенным подрядчиком или продуктом, созданные конкретным сотрудником или в указанный период.
Сегодня технологии обработки естественного языка позволяют извлекать разные типы данных из документов в автоматическом режиме: упоминания физических и юридических лиц, торговых марок, реквизиты, денежные данные, локации и пр. Это дает пользователю возможность их использовать для классификации и фильтрации поисковой выдачи.
Доступно и определение типа документа: акты, заявки, заказы, формы учетной документации, сметы, договоры и т. д. Соответственно выдачу можно отфильтровать и по этому параметру, оставив необходимый пользователю тип. Для расширения полученной выдачи и анализа информации полезна функция установления связей — с ее помощью становятся доступны связанные с искомым документы.
Таким образом, при использовании интеллектуальных систем сотрудники тратят ресурсы не на поиск данных, а на работу с ними: анализ, обработку и извлечение ценности для бизнеса и организаций.
Кастомизация поиска
Одна из особенностей поиска — его повторяемость. Можно оптимизировать существенную часть запросов, которые регулярно повторяются, предоставив пользователю гибкие настройки поисковой выдачи. Кастомизация поиска может быть реализована на уровне личных рубрикаторов, пользовательских коллекций, тегов и фильтров. С одной стороны, это позволяет сотруднику адаптировать и настроить корпоративную систему под специфику своих задач и рабочих процессов, с другой — автоматизировать существенный объем рутинных операций.
Подстройка под пользователя может происходить еще на уровне формирования выдачи. Оценка релевантности найденных документов возможна с учетом таких критериев, как профессиональная область пользователя, его актуальные рабочие задачи, частота обращения к файлу и история поиска. Например, если поиск ведет сотрудник отдела сопровождения проектов, то в его выдаче выше других типов будет находиться исполнительная документация по проекту.
Управление доступом
Распространенным препятствием для использования корпоративного поиска становятся вопросы информационной безопасности. Есть представление, что внедрение подобных решений упростит поиск и несанкционированный доступ к конфиденциальным данным. Оно ошибочно, поскольку в большинстве систем корпоративного поиска предусмотрена интеграция с системами безопасности, и в них может действовать та же политика разграничения доступов, что и в других системах. Управление доступом может быть реализовано как на уровне документов, так и на уровне ролей пользователей.
Корпоративный поиск — часть концепции цифрового рабочего места
Эволюция технологий и корпоративной инфраструктуры привела к возникновению новой концепции цифрового рабочего места. Концепция возникла в ответ на потребность и реальные проблемы компаний на пути к цифровизации. Сотрудник в современном мире вынужден взаимодействовать с десятками веб-приложений и систем, часто используя для этого несколько устройств и платформ. Цифровое рабочее место призвано объединить эти ресурсы в единую эффективную рабочую среду. И в этой концепции важную роль играет корпоративный поиск, обеспечивающий простой доступ к данным вне зависимости от места хранения.
Такой подход фокусируется не только на автоматизации бизнес-процессов, что было характерно для внедрения крупных ИТ-систем в предыдущие годы, но и на эффективности отдельного пользователя, взаимодействующего с несколькими решениями. В частности, большие потери ресурсов могут приходиться на поиск данных в разрозненных местах хранения. Также поиск с помощью встроенных инструментов отдельных систем и приложений не полностью отвечает современным потребностям как корпоративных пользователей, так и компаний в целом.
При этом сегодня доступны интеллектуальные решения для корпоративного поиска, созданные с учетом этих потребностей и предлагающие больше, чем оперативный и простой доступ к искомым данным. Такие системы могут стать для бизнеса и организаций инструментом эффективного управления информационными активами, извлечения из них ценности и превращения их роста из проблемы в новые возможности.
Комментарии 0