Запутавшись
в паутине кризисных (и антикризисных) материалов, мы как-то позабыли о
здоровенном мешке с технологиями, имя которому Google. Несмотря на то, что
акции компании недавно упали
до умопомрачительной отметки в 297 долларов за штуку (ровно год назад они
стоили 711 долларов - оцените размах драмы), Google, похоже, не собирается
паниковать и с выверенной методичностью радует нас новинками. Я опущу рассказы
о том, что теперь для iPhone'а работает собственный голосовой
поиск, и о том, что в Gmail теперь есть возможность организовать
видеоконференцию прямо из браузера. Лучше я сосредоточусь на секторе,
который наиболее интересен нашим читателям. Поговорим о новинках Google в
области распознавания образов.
В самом начале ноября поисковый
гигант анонсировал
новую технологию OCR (optical character recognition) - OCRopus, которая, несмотря на
столь позднее рассекречивание, уже применялась компанией ранее. С 1-го ноября
Google запустила процесс распознавания и индексирования текстов PDF-документов.
Теперь на странице поисковой выдачи, помимо всего прочего, можно найти ссылки
на такие документы и даже просмотреть их, не выходя из браузера (поисковик
давно умеет преобразовывать PDF в HTML).
Несмотря на то, что слухи о
существовании у поисковика собственных технологий распознавания образов
просочились в Сеть очень давно, общественность достаточно сухо отреагировала на
новость о переводе
в электронный вид огромного архива старых газет. Что ж, теперь нам, по
крайней мере, понятно, что по текстам этих газет в самом ближайшем времени
будет доступен полноценный поиск.
Помимо OCRopus, Google обнародовала
ещё одну свою инновационную технологию распознавания, которая к сканированию
никакого отношения не имеет. GAudi (GoogleAudioIndexing)
распознаёт звуковую дорожку и конвертирует её в текст, который, разумеется,
индексируется. Эта технология вылилась из обнародованного несколько месяцев
назад мини-приложения
для стартовой страницы iGoogle,
которое позволяло следить за дебатами участвующих в предвыборной гонке
политиков. Приложение искало видеоролики по заданным фразам. К сожалению, пока
поисковик индексирует лишь видеоматериал, но, очевидно, что это временно.
Выходит что совсем не за горами тот момент, когда любой пользователь сможет
искать песни в Сети, скармливая поисковику запомнившиеся строчки. А к тому
моменту, когда Google
начнёт индексировать дорожный трафик, радио-эфир и мысли собственных
пользователей у неё уже будет собственная страна с собственной армией.