Google индексирует старые газеты и новое видео

Google, похоже, не собирается паниковать и с выверенной методичностью радует нас новинками.
Запутавшись
в паутине кризисных (и антикризисных) материалов, мы как-то позабыли о
здоровенном мешке с технологиями, имя которому Google. Несмотря на то, что
акции компании недавно упали
до умопомрачительной отметки в 297 долларов за штуку (ровно год назад они
стоили 711 долларов - оцените размах драмы), Google, похоже, не собирается
паниковать и с выверенной методичностью радует нас новинками. Я опущу рассказы
о том, что теперь для iPhone'а работает собственный голосовой
поиск, и о том, что в Gmail теперь есть возможность организовать
видеоконференцию прямо из браузера. Лучше я сосредоточусь на секторе,
который наиболее интересен нашим читателям. Поговорим о новинках Google в
области распознавания образов.
В самом начале ноября поисковый гигант анонсировал новую технологию OCR (optical character recognition) - OCRopus, которая, несмотря на столь позднее рассекречивание, уже применялась компанией ранее. С 1-го ноября Google запустила процесс распознавания и индексирования текстов PDF-документов. Теперь на странице поисковой выдачи, помимо всего прочего, можно найти ссылки на такие документы и даже просмотреть их, не выходя из браузера (поисковик давно умеет преобразовывать PDF в HTML).
Несмотря на то, что слухи о существовании у поисковика собственных технологий распознавания образов просочились в Сеть очень давно, общественность достаточно сухо отреагировала на новость о переводе в электронный вид огромного архива старых газет. Что ж, теперь нам, по крайней мере, понятно, что по текстам этих газет в самом ближайшем времени будет доступен полноценный поиск.
Помимо OCRopus, Google обнародовала ещё одну свою инновационную технологию распознавания, которая к сканированию никакого отношения не имеет. GAudi (GoogleAudioIndexing) распознаёт звуковую дорожку и конвертирует её в текст, который, разумеется, индексируется. Эта технология вылилась из обнародованного несколько месяцев назад мини-приложения для стартовой страницы iGoogle, которое позволяло следить за дебатами участвующих в предвыборной гонке политиков. Приложение искало видеоролики по заданным фразам. К сожалению, пока поисковик индексирует лишь видеоматериал, но, очевидно, что это временно. Выходит что совсем не за горами тот момент, когда любой пользователь сможет искать песни в Сети, скармливая поисковику запомнившиеся строчки. А к тому моменту, когда Google начнёт индексировать дорожный трафик, радио-эфир и мысли собственных пользователей у неё уже будет собственная страна с собственной армией.
Комментарии 0