Есть ли будущее у корпоративного поиска?
Последние пару лет в бесчисленных книгах и отчётах авторы во главу угла ставят Big Data и преимущества, которые предприятия могут получить, эффективно обрабатывая эти массивные потоки данных. Однако это никак не означает, что поиск теряет актуальность.
В сентябре я участвовал на конференции Европейской Комисии о поисковых вычислениях. Один из участников, генеральный директор одного из крупных поставщиков поисковых технологий заявил: корпоративный поиск умер. Следует концентрироваться на анализе данных, сказал он. Без сомнения, можно получить выгоду из извлечения статистических закономерностей и исключений из массивного потока данных, которые компания продуцирует и собирает, однако это не значит, что можно так смело заявить, что корпоративный поиск мёртв, то есть устарел, остановился в развитии.
Последние пару лет в бесчисленных книгах и отчётах авторы во главу угла ставят Big Data и преимущества, которые предприятия могут получить, эффективно обрабатывая эти массивные потоки данных. В октябрьском выпуске Гарвард Бизнес Ревю — целых три статьи на эту тему. То есть, получается, тема очень важная. Однако всё равно это никак не означает, что поиск теряет актуальность.
Корпоративный поиск и Big Data
Большинство крупных корпоративных приложений предлагают инструменты для поддержки бизнес-процессов и связанных с ними рабочих инструкций. Один из результатов: ответственный за процессы на предприятии участвует в принятии бюджетных решений. Но когда речь идёт о корпоративном поиске, считается, что он сопутствует всем бизнес-процессам, и в этом случае достаточно сложно найти того, кто взял бы на себя ответственность за управление корпоративным поиском на предприятии и за бюджет, выделенный его освоение.
Существует мнение, согласно которому восемьдесят процентов всей информации, генерируемой предприятием, — это неструктурированная информация. Очевидно, что даже если бы сохранялся паритет, и только половина всей информации была бы неструктурированной, это означало бы, что технологии работы с Big Data, то есть с большими объёмами структурированной (и это важно) информации, покрывали бы лишь половину всех потребностей компании по автоматизации работы с информацией.
Также существует великое множество проектных и сервисных отчётов, бизнес-планов и тому подобных данных, среди которых качество поиска по ключевым словам или, допустим, с помощью конструкций естественного языка — очень важное бизнес-требование.
Если вам интересно, насколько требования бизнеса и наличие инструментов, удовлетворяющих им, расходятся в реальной жизни, просто взгляните на результаты опросов, которые MarkLogic, Findwise, Oracle и SmartLogic провели за последние два года (в оригинальной статье).
Несмотря на то, что большинство отчётов о Big Data, вы увидите, что потребность в поиске неструктурированной информации — тоже достаточно важный пункт, показывающий, насколько важен анализ данных. Об этом также говорит один из последних опросов AIIM, на который более 60% респондентов ответили, что возможность связать неструктурированную текстовую информацию и детерминированные, структурированные данные была бы очень кстати для их бизнеса. При этом только два процента уже смогли это реализовать.
На первый план сейчас выходит корпоративный поиск в виде управляемой связной системы поисковых приложений, с помощью которых сотрудники смогут легко находить данные, информацию и знания, доступные им на определённом уровне, которые позволят принимать решения эффективно. Эту идею продвигают HP, IBM и Oracle, поддерживая свои заявления поглощением соответствующих технологических компаний, и также её продвигает опенсорс-сообщество. Lucene и Hadoop — два ярких его представителя, являющие собой приложения уровня энтерпрайз для управления информацией и данными предприятия.
Недостаток опыта
Широкое освоение корпоративного поиска тормозится не только по технологическим причинам. Существует две преграды на его пути. Первая — недостаточное понимание того, как работают технологии поиска, и что хорошего можно от их внедрения получить. И несмотря на то, что об этом написано в книгах, а ведущие поисковые вендоры активно ведут собственные блоги на эту тему, IT-менеджерам тяжело ориентироваться в запутанном мире поиска и понять, что Google не всегда может дать ответ на любую тему.
Второй барьер — тяжело найти людей с подходящими опытом и экспертизой. Работы EMC показывают, что в течение последующих пяти лет будет иметь место ощутимый дефицит специалистов по работе с данными. Немногие университеты разрабатывают и преподают курсы по работе с данными и поиску на уровне крупных предприятий, и выпускники сразу же получают предложения от крупных IT-компаний (таких, как Google), поэтому бороться за таких специалистов достаточно тяжело.
Пульс рынка и технологий
Моя колонка [на CMSWire.com] будет посвящена проблемам поисковых технологий и примерам их освоения на уровне крупных предприятий и больших интернет-ресурсов. Я занимаюсь проблемами поиска с 1974 года, однако, как вижу, только сейчас компании начинают обращать на них пристальное внимание, связывая его с планами развития и бизнеса в целом, и IT в частности. Только сейчас ко многим приходит понимание важности и целесообразности инвестиций в технологии работы с информацией и данными.
Перевод: Ришат Мухаметшин.
Источник: CMSWire. "Is There a Future for Enterprise Search?”
Комментарии 0