Журнал об электронном контенте, документах и бизнес-процессах
Учебники Просто о СЭД ЭП/ЭЦП Внешний документооборот Цифровая трансформация Эксперты
Управление контентом

Большой секрет успеха корпоративного поиска

  0 комментариев Добавить в закладки

Представляем вашему вниманию перевод статьи Джеда Которна, старшего менеджера по цифровым продуктам в канадском TD Bank, который работает над различными проектами, связанными с цифровым рабочим местом. В статье рассказывается о нюансах работы корпоративного поиска в крупных компаниях. (Оригинал доступен на сайте CMSWire). На другой стороне стоит мнение Светланы Гржещук, эксперта по корпоративному поиску DIRECTUM, компании имеющей более чем 20-летний опыт в сфере корпоративных систем управления информацией в различных предприятиях и организациях.

Photography of Person Peeking

Джед Которн, TD Bank (перевод — Эльвира Дёгтева)

Вот что никак не перестает удивлять меня, сколько бы я не внедрял интранет-поиск или корпоративный поиск в крупных компаниях: многие люди считают, что поисковые системы — это своего рода волшебство, и любой контент можно найти «точно, как в Google».

Мартин Уайт, мой хороший друг и автор блога на CMSWire, годами повторяет одно и то же: для обеспечения качественной работы корпоративного поиска нужна целая команда людей. Он подробно описал такую команду и роль каждого ее участника в свой книге «Корпоративный поиск».

Двусторонний подход к решению проблемы метаданных

Опыт подсказывает, что для успешного функционирования поиска в крупных компаниях нужна команда, которая бы объясняла сотрудникам, насколько важно создавать качественный контент и метаданные.

Чтобы продемонстрировать, о чем идет речь, позвольте мне в двух словах пересказать наш с коллегой разговор, который произошел в ходе тестирования релевантности результатов поиска. Мой коллега столкнулся с тем, что по определенному запросу не смог найти нужную информацию в результатах поиска. Он пояснил, что при поиске использовал деловую терминологию сотрудников контакт-центра. Проанализировав страницу и атрибуты ее метаданных, я обнаружил, что эта терминология не присутствовала:

  • ни в заголовке страницы;
  • ни в ключевых словах;
  • ни в краткой сводке с описанием страницы в результатах поиска;
  • ни вообще в тексте на странице.

Неудивительно, что поисковая система не нашла подходящую страницу в результатах поиска по его запросу. Хочу отметить, что мой коллега не из тех, кто считает поиск каким-то волшебством, он довольно хорошо разбирается в вопросах управления контентом. Однако, он не разрабатывал контент страницы и не знал о несоответствии бизнес-процесса контакт-центра метаданным, которые использовались для маркировки страницы ее автором.

Очевидно, автор контента наполнил страницу так, чтобы она находилась с помощью одного или нескольких конкретных сценариев использования. Он не знал или не ожидал, что есть аудитория, которая использует информацию в других целях и будет вводить другие запросы для поиска того же материала.

Что мы можем сделать для решения этого вопроса, который я охарактеризовал бы как широкую проблему управления информацией? Чем может помочь разработчик корпоративного поиска и аналитик данных? Здесь вам помогут два подхода — один касается поисковой системы, второй — контента.

1. Используйте элементы, характерные для поисковых систем

  • Синонимы и словари, чтобы сопоставить новые поисковые запросы существующим метаданным.
  • Выделение сущностей в тексте, чтобы сопоставить контент страницы с новыми поисковыми запросами.
  • Кнопка «Было полезно» в результатах поиска, чтобы связывать подходящий контент с одним или несколькими конкретными запросами.

2. Проработайте специфику контента

  • Убедитесь, что новые условия запроса присутствуют в ключевых словах и метаданных страницы.
  • Проверьте, что в текст страницы добавлены новые бизнес-термины.
  • Используйте теги, добавленные пользователями, как еще одну форму метаданных для страницы.

Поисковые системы сами по себе не гарантируют качественные результаты поиска

Так чему же нас учит эта маленькая истории из жизни? Любой поисковой системе — какой бы хорошей она не была и какие бы возможности не предоставляла — для работы нужен качественный контент.

Высокое качество контента, включая хорошие метаданные — это ключевой аспект использования интрасети во многих отношениях, включая поиск. Тем не менее, по моему опыту, на курсах типа «как правильно писать контент для сайта» не рассказывают, что делать, чтобы контент лучше находился поиском. Сюда можно отнести использование правильной бизнес-терминологии и языка разработчиками контента, а также подбор определенных слов и фраз с такой частотой и близостью друг с другом, чтобы алгоритмы поисковых систем могли использовать их для выдачи релевантных результатов.

Однако, как отмечалось выше, авторы контента могут изначально не знать всей потенциальной аудитории и сценариев использования своего контента. Поэтому для разработки контента, который бы легко находился поиском, важно тщательно анализировать круг заинтересованных лиц и убедиться, что вы хорошо понимаете свою аудиторию.

Помогите людям найти нужную информацию

Неважно, насколько велика команда, ответственная за развитие корпоративного поиска, — в ее обязанности должно входить обучение авторов созданию контента, который легко находится поиском. Эта команда должна помогать потребителям информации находить контент, который нужен им для выполнения задач. Другими словами, создавайте качественный контент — и это обеспечит вам высокую релевантность результатов поиска.

Искусственный интеллект, помоги людям найти нужную информацию

Светлана Гржещук, аналитик DIRECTUM

 

Если задуматься над основной идеей статьи, она хороша: что значит создать «хороший контент» — это наполнить искомые данные полезной смысловой информацией. Дальше же в статье приводится много может и неплохих советов по подготовке контента для обеспечения поиска, но это уже давно всем известно. Можно делать так, как описывает автор по собственному опыту:

  • Потратить время/деньги на обучение людей на создание правильного контента;
  • При заливке/создании информации одним человеком тщательно задумываться о том, как будет воспринимать контент другой человек, который будет делать поиск;
  • Упорно наполнять теги и ключевые слова;
  • Дать пользователям инструменты связывания запросов с искомой информацией и т.п.

Но удивляет, что автор сам подводит к мысли, что описанные методы — весьма трудоемкий ручной процесс целой команды сотрудников!

И при этом даже не пытается упомянуть возможности современных «insight engine» — платформ с технологиями машинного обучения и искусственного интеллекта для когнитивного анализа контента. Они предназначены заменить весь описанный выше человеческий интеллектуальный и ручной труд, способны проанализировать контент и наполнить его семантическим (смысловым) слоем данных, классифицировать данные, извлечь важные сущности, факты и связи между ними из информации любого формата. В результате можно получить быстрый поиск по запросам, вводимым на естественном языке, поиск по смыслу.

Ваш клиент хочет корпоративный поиск как в Google? — это уже возможно.

Безусловно, это выбор каждого предприятия, зависящий от масштаба, объемов информации, бизнес-задач. Но задуматься стоит — продолжать использовать ограниченные возможности встроенных в системы поисковых сервисов, трудоемкие ручные манипуляции по созданию интранет-ресурсов и баз знаний или обратиться к интеллектуальным технологиям уже сегодня.

Похожие записи
Комментарии (0)
Сейчас обсуждают
Больше комментариев