Наверх

Способны ли современные ECM-системы дать простоту и удобство поиска данных на уровне Интернет-сервисов

Время чтения: 1 минута
10
Способны ли современные ECM-системы дать простоту и удобство поиска данных на уровне Интернет-сервисов

Согласно исследованию DOCFLOW 2013 искать информацию в Интернет удобнее и быстрее, чем во внутренних системах поиска в 60% организаций.

Согласно исследованию DOCFLOW 2013 искать информацию в Интернет удобнее и быстрее, чем во внутренних системах поиска в 60% организаций. Способны ли современные ECM-системы дать простоту и удобство поиска данных на уровне Интернет-сервисов? Нужно ли к этому стремиться? 

Искать информацию в интернете стало для многих привычным занятием. Разработчики браузеров приложили невероятные усилия для того, чтобы поиск был возможен буквально в один клик. Очевидно, что пользователи со временем приобретают определённые привычки и, что важно, ожидания от любого программного средства, которым пользуются. Сворачивая окно браузера, они ждут, что поиск будет таким же и в другом месте.

И ещё один момент: речь именно об удобстве поиска, но не о его эффективности. Результаты поиска в интернете представлены в удобном виде, но редко все они релевантны. Поэтому поиск часто предполагает перебор разных поисковых запросов.

Отдельно следует упомянуть визуализацию результатов поиска. Если пользователь сразу увидит результаты поиска с высоты птичьего полёта, не открывая каждый из найденных документов, это позволит быстрее найти необходимую информацию. Решить эту задачу позволяет предпросмотр.

Источник: DOCFLOW

Чтобы прочитать эту статью до конца,
или зарегистрируйтесь

Комментарии 10

Андрей Подкин 7 апреля 2014
Результаты поиска в интернете представлены в удобном виде, но редко все они релевантны.

Я даже боюсь спросить автора, для чего ему релевантность на втором десятке страниц с результатами поиска Google. Пары-тройки страниц с релевантными результатами вполне хватает.

Отредактировано 9 апреля 2014
Согласно исследованию DOCFLOW 2013 искать информацию в Интернет удобнее и быстрее, чем во внутренних системах поиска в 60% организаций

А можно ссылку на вопрос который задавали сотрудники DOCFLOW 2013? Меня не покидает ощущение, что он звучал примерно как "что приятнее - теплое, или мягкое?"

Что понималось под удобством? Вы вот делаете упор на визуализацию. А чем принципиально эта визуалаизация отличается от любой современной СЭД? Возьмите, например представление результатов поиска в последних версиях SharePoint (Office 365) - ну чем он так радикально отличается от того же Bing?

В общем, я так и не понял сути претензий.

Ну а вообще, сравнивать поиск в Internet и во внутренней информационной системе - имхо, это какой-то оксюморон. Это же принципиально разные источники - с разной организацией, схемой наполнения, объемом, ... даже задачи у них - разные.

Отредактировано 9 апреля 2014
Ну а вообще, сравнивать поиск в Internet и во внутренней информационной системе - имхо, это какой-то оксюморон

Не знаю, для сравнения вполне нормально имхо...

Недавно задумался над этой темой. Пришел к выводу, что искать в российских СЭД решительно нечего ). Точнее есть но не то и не так как ищут поисковики, ведь типичное наполнение - сканы регистрируемых документов, ОРД, договора и еще пару видов документов которые нормативно должны быть там по итогам проекта. А их нужно искать не по содержимому и смыслам, а по понятным метаданным. А это скорее фильтрация какая-то... Хотя это тоже поиск, конечно...

Когда и если в России ECM будут использоваться как хранилища информации, тогда встанет вопрос поиска... И тогда две темы будут - "понимание" смысла документа, и сужение области поиска. 

Первую задачу можно решить подключив корпоративный движок от поисковиков, а со вторым проблема. Единство и монолитность архива, его структуры и метаданных, в общем - это не правильно ). Особенно в крупных компаниях. ECM надо давать больше свободы рабочих группам на создание своих "ячеек", тогда и искать будет и проще и удобнее... потому как информация будет "нацелена" на потребность этой группы.

Отредактировано 9 апреля 2014
Решить эту задачу позволяет предпросмотр.

И никаких проблем предпросмотр не решает... Во-первых у гугла на картинке не предпросмотр, а "Информация из Сети знаний в результатах поиска". Это несколько покруче, мягко говоря... 

В СЭД я не ищу текст (высказывание, информацию, и т.д.) я ищу документ. Понять что я нашел то что нужно я могу и из названия документа. Равно как если бы я искал не информацию о жирафе, а статью в журнале "Юный жирафовод" за №12 от 2014 года. Вот тогда мне бы хватило и названия статьи. А если мне нужна информация о жирафе то нужен текст, причем в нужном месте, чтобы понять из контекста том ли речь. А открывшийся за 20 секунд (условно) 50-ти страничный doc-файл на первой страницы при запросе "продажа гвоздей" мне даром не нужен.

Отредактировано 9 апреля 2014
Андрей Подкин 7 апреля 2014
Недавно задумался над этой темой. Пришел к выводу, что искать в российских СЭД решительно нечего ). Точнее есть но не то и не так как ищут поисковики, ведь типичное наполнение - сканы регистрируемых документов, ОРД, договора и еще пару видов документов которые нормативно должны быть там по итогам проекта.

Ришат писал, опираясь, в первую очередь, на опыт компании DIRECTUM. А там в СЭД хранится существенная часть базы знаний.

Первую задачу можно решить подключив корпоративный движок от поисковиков

Не так все просто. Насколько я помню, Google свернул продажу свей коробки. Как у Яндекса дела обстоят - я не в курсе.

Отредактировано 9 апреля 2014
на опыт компании DIRECTUM

Ну да. Я сначала написал про этом, потом стер ибо вспомнил что названия в суе не поминаем ). Но мы же общий случай рассматриваем...

Google свернул продажу свей коробки

Да нет: http://www.google.com/enterprise/search/. И МС активно работает с Bing API... Последний вообще интересен, ходят слухи что его в Azure как то прикрутить хотят, типа как сервис для построения поискового индекса (как на SQL так и на NoSQL и BLOB Storage Азуровские).

Отредактировано 9 апреля 2014
А если мне нужна информация о жирафе то нужен текст, причем в нужном месте, чтобы понять из контекста том ли речь. А открывшийся за 20 секунд (условно) 50-ти страничный doc-файл на первой страницы при запросе "продажа гвоздей" мне даром не нужен.

Отображение контекста технически реализуемо. Оно уже есть в поиске Google и Яндекс, где под названием отображается контекст. Или настольные приложения - поиск текста в файлах с наложением условий на имя файла - SublimeText, Notepad++, ... В результатах поиска виден контекст. В SublimeText контекст - три строки, одна строка в Notepad++, при выборе строки осуществляет переход на неё.

Если можно реализовать предпросмотр всех 50-ти страниц документа, то можно и реализовать предпросмотр только 7-й и 20-й страниц, где есть текст, удовлетворяющий условиям поиска. Или просто предпросмотр только 7-й страницы, с выделением результатов поиска как у http://books.google.ru.

Можно сделать нарезку, чтобы уместить сразу две страницы в области "информация из сети знаний" - отобразить их части, а не страницы целиком.

Отредактировано 9 апреля 2014

А вообще, нравится интерфейс, который позволяет уточнять запрос. Такой как в https://www.wolframalpha.com. Тут нет сложных семантических запросов (семантика под капотом), запрос начинается с простого текста, задающего начальный контекст ("Бронзовый век"), с последующим уточнением. Это позволяет найти объект, не зная есть ли он в системе (не зная точную фразу, соответствующую объекту).

В СЭД, где тексты шаблонны, и есть своя специфика содержимого, можно сделать эмуляцию семантики. Заранее выделить ключевые слова, соответствующие часто используемым объектам поиска. И сделать на их основе построители поисковых запросов. Внешне это может выглядеть как уточнение контекста у www.wolframalpha.com. Или как поиск на естественном языке (никто его не видел, поэтому он может быть каким угодно - пользователь пишет и выбирает, что ему нравится, а построитель поискового запроса формирует группу хороших запросов).

Отредактировано 9 апреля 2014

Ошибся в первом комментарии (20:16). Высказал мнение о поиске текста, а Виктор Золотов как раз пишет, что выполняется поиск документа, а не текста. Это как в случае поиска закона или нормативного акта, в запросе ввожу текст ("квалифицированная подпись"), а в результатах запроса смотрю лишь на названия, ищу глазами нужный ФЗ.

У вольфрамальфа сложный интерфейс. И объекты структурированы заранее. Это не вариант для СЭД.

Отредактировано 9 апреля 2014
У вольфрамальфа сложный интерфейс. И объекты структурированы заранее. Это не вариант для СЭД.

Ну для текущих СЭД нет, а вообще с точки зрения управления информацией ровно это и надо - понять о чем смысл и вытащить из массива информации нужные знания для человека. Тут вам и модную БигДату прикрутить можно ).

Одна беда - мало полезной информации в наших СЭД... но что-то все же есть.

А по структурированию... Гугл вот в свое время не стал покупать вольфрамальфу, а сделал свое... Источников не так много у него - Википедия, свой сервис (для того и сделанный) Гугл Публик Дата (https://www.google.com/publicdata/directory) и т.д. Просто они "понимают" о чем запрос... Пишем "Жираф", ага - животное. Это смотрим в Википедию, выдаем картинку и краткое описание...

В СЭД также можно было бы... пишем "Газпром" - ага, компания. Значит выдаем справку из справочника организаций, последние документы, задачки и т.д.

Отредактировано 9 апреля 2014
Чтобы прокомментировать, или зарегистрируйтесь