Как обеспечить удобство, скорость и простоту поиска по мультимедиа-контенту?
Поисковые возможности по изображениям, видео- и аудио-материалам можно разделить на три категории: поиск по мета-информации (название, ключевые слова, автор, время создания, координаты, размер, длительность и т.п.), поиск по содержимому, поиск по образцу.
Как и для текстовых документов, принципиально поисковые возможности по изображениям, видео- и аудио-материалам можно разделить на три категории: поиск по мета-информации (название, ключевые слова, автор, время создания, координаты, размер, длительность и т.п.), поиск по содержимому, поиск по образцу. В любом случае качество поиска очень зависит от качества исходного занесения медийных материалов в архивную систему.
Если с мета-данными проблем обычно немного, то вопрос поиска по содержимому выглядит сложнее, чем для текстовых документов. В первую очередь потому, что для поиска нужно текстовое содержимое, которое еще нужно получить для аудио и видео-материалов. В ряде случаев это несложно, например, если разместить видео-ролик собственного производства и одновременно с ним сохранить подстрочник (для удачного поиска роликов в YouTube, например, такой подход является стандартом де-факто). Но когда речь идет о размещении записей, пришедших со стороны, то нужен или долгий и дорогостоящий ручной ввод, или средства распознавания голоса, которые пока еще очень несовершенны. Но если текстовое описание сохранено, то поиск по медиа-документам уже не слишком отличается от поиска по текстовым.
При поиске по содержимому есть очень важная проблема, которая, кстати, касается и текстовых документов: невозможность поиска по смыслу. К сожалению, пока не существует уверенных технологий, способных, например, найти документы или медиа-материалы "где выступает известный корейский певец с песней про девушек и лошадей".
В отличие от текстовых документов для изображений, видео и аудио-материалов гораздо больше применим поиск по образцу. И этот поиск активно применяется и в интернет-сервисах. Найти песню на напетый мотив (SoundHound), похожие на образец изображения (TinEye, Google Images), изображения с преобладанием определенного цвета (Яндекс.Картинки) -- эти и подобные поиски через сравнение могут найти применение и в корпоративных системах-электронных архивах документов.
Кроме непосредственно поиска важную роль в работе с документами играет навигация: переход к документу через структуру папок, связанные документы, общие потоки работ. Также для цифровых медиа-архивов важна поддержка сквозного поиска по различным хранилищам. Впрочем, в большинстве случаев эти же аспекты важны и для многих задач поиска по текстовым документам.
Источник: Журнал "Современные технологии делопроизводства и документооборота"
Комментарии 0