
История, рассказанная на портале МедиаПедия, могла бы стать ярчайшей иллюстрацией к статье о западном империализме в каком-нибудь советском учебнике истории: некоторые западные издания вовсю оцифровывают свои архивы, но не с помощью последних достижений в области потокового ввода и распознавания текста, а... дешевым трудом наборщиков из третьих стран.
Всем понятно, что оцифровать архив пусть не особо большой, но выходящий хотя бы несколько лет газеты – непростая задача. А для старых изданий, существующих многие годы, задача может оказаться и вовсе непосильной. Потому не удивительно, что издания стремятся отдать эту работу на аутсорсинг организациям, которые специализируются на оцифровке данных. А эти организации, в свою очередь, перезаказывают самые трудоемкие работы компаниям третьих стран, где подобный труд стоит очень дешево.
Одна из таких компаний - Digital Devide Data - расположена в городе Пномпень, столице Камбоджи. Более 600 (шестисот) сотрудников этой компании "ручками" выполняют самую утомительную работу: перебирают полученные данные, структурируют информацию, добавляют к каждому материалу метатеги и дважды проверяют правильность полученного результата. Группа из сотни работников обрабатывают 200 000 газетных полос за один месяц - это почти полтысячи страниц на одного "оператора" в неделю. В результате заказчик получает уникальную XML-базу, которая действительно позволяет быстро и эффективно использовать информацию.
Подробнее об этой практике вы можете прочитать в статье на МедиаПедии. В ней же вы узнаете, что сарказм в названии данного поста полностью нивелируется тем, что Digital Devide Data – это на самом деле некоммерческое предприятие, которое не ставит перед собой цель нажиться на неквалифицированном труде (а он на самом деле очень отличается от сбора риса в болоте). Задача компании - помочь камбоджийцам, находящимся за чертой бедности, получить высшее образование. И с этой задачей Digital Devide Data справляется прекрасно.