Google индексирует старые газеты и новое видео
Google, похоже, не собирается паниковать и с выверенной методичностью радует нас новинками.
Запутавшись в паутине кризисных (и антикризисных) материалов, мы как-то позабыли о здоровенном мешке с технологиями, имя которому Google. Несмотря на то, что акции компании недавно упали до умопомрачительной отметки в 297 долларов за штуку (ровно год назад они стоили 711 долларов - оцените размах драмы), Google, похоже, не собирается паниковать и с выверенной методичностью радует нас новинками. Я опущу рассказы о том, что теперь для iPhone'а работает собственный голосовой поиск, и о том, что в Gmail теперь есть возможность организовать видеоконференцию прямо из браузера. Лучше я сосредоточусь на секторе, который наиболее интересен нашим читателям. Поговорим о новинках Google в области распознавания образов.
В самом начале ноября поисковый гигант анонсировал новую технологию OCR (optical character recognition) - OCRopus, которая, несмотря на столь позднее рассекречивание, уже применялась компанией ранее. С 1-го ноября Google запустила процесс распознавания и индексирования текстов PDF-документов. Теперь на странице поисковой выдачи, помимо всего прочего, можно найти ссылки на такие документы и даже просмотреть их, не выходя из браузера (поисковик давно умеет преобразовывать PDF в HTML).
Несмотря на то, что слухи о существовании у поисковика собственных технологий распознавания образов просочились в Сеть очень давно, общественность достаточно сухо отреагировала на новость о переводе в электронный вид огромного архива старых газет. Что ж, теперь нам, по крайней мере, понятно, что по текстам этих газет в самом ближайшем времени будет доступен полноценный поиск.
Помимо OCRopus, Google обнародовала ещё одну свою инновационную технологию распознавания, которая к сканированию никакого отношения не имеет. GAudi (GoogleAudioIndexing) распознаёт звуковую дорожку и конвертирует её в текст, который, разумеется, индексируется. Эта технология вылилась из обнародованного несколько месяцев назад мини-приложения для стартовой страницы iGoogle, которое позволяло следить за дебатами участвующих в предвыборной гонке политиков. Приложение искало видеоролики по заданным фразам. К сожалению, пока поисковик индексирует лишь видеоматериал, но, очевидно, что это временно. Выходит что совсем не за горами тот момент, когда любой пользователь сможет искать песни в Сети, скармливая поисковику запомнившиеся строчки. А к тому моменту, когда Google начнёт индексировать дорожный трафик, радио-эфир и мысли собственных пользователей у неё уже будет собственная страна с собственной армией.
Комментарии 0