Журнал о системах электронного документооборота (СЭД)
Электронные документы и обмен ими (ЮЗЭД)

Свобода форматов документов

  3 комментариев Добавить в закладки

28 марта объявлен днём свободы документов 2012 (Document Freedom Day, DFD, cм. documentfreedom.org/). С такой инициативой выступил Европейский Фонд Свободного Программного Обеспечения (см. fsfe.org/). Событие имеет целью популяризацию открытых форматов документов и открытых стандартов. Что делается для освобождения пользователей работающих с документами от ограничений накладываемых несвободными и закрытыми форматами или возможностью их появления в будущем.

Логотип сайта мероприятия отличается лишь цветом от логотипа OpenDocument Format, поэтому стоит обратить особое внимание именно на него. OpenDocument Format является примером открытого формата документов. На данный момент доступны три версии спецификации формата:

Подробно рассмотрим версию 1.0 (так как она стандартизирована в России, см. ГОСТ Р ИСО/МЭК 26300-2010) в контексте свободы. Если коротко - формат и стандарт свободен, но у этой свободы есть свои рамки.

Анализ свободного использования ZIP в ODF

Свобода есть право делать всё, что дозволено законами.

— «О Духе законов», 1784, Шарль-Луи де Секонда, барон Ля Брэд и де Монтескьё

OpenDocument Format использует форматы XML и ZIP. Формат, XML, в отличие от ZIP, является свободным форматом. А формат ZIP является запатентованным форматом, держателем патентов выступает PKWARE, Inc. А значит если сделать наивную реализацию открытого формата ODF = «ZIP-архив с другим расширением, в котором находится каталоги с XML-файлами особой структуры, а также могут находиться другие файлы», то можно, в последствии, попасть в ловушку PKWARE и других компаний (но о других потом), если при этом использовать какие-то запатентованные особенности формата ZIP.

В России у PKWARE нет ни одного патента. А те два единственных российских документа (из тех, что мне удалось найти), что содержат в тексте упоминание "ZIP" находятся в статусе заявки, где заявителями выступает Microsoft и напрямую к ZIP не относятся:

Но шанс этих заявок стать патентами невелик. Не смотря на то, что в России алгоритмы (идеи) не патентуются, слышал, что были случаи, когда алгоритмы патентовались вместе с конкретной реализацией некой идеи, как часть устройства (то есть запатентовать их каким-то способом можно, но это другая тема). А вот в США, например, идеи патентуются, и если выполнить поиск патентов PKWARE, то можно найти как заявки, так и зарегистрированные патенты.

Патенты можно найти с помощью Google, составив полнотекстовый запрос с использованием кодов ИНИД/WIPO (см. стандарт), в частности:

  • (73) — Имя (имена) получателя(ей), держателя(ей), правопреемника(ов) или владельца(ев) охранного документа.
  • (45) — Дата публикации типографским или иным аналогичным способом патентного документа, по которому на эту или более раннюю дату было принято решение о выдаче охранного документа.

Для этого в разделе поиска по патентам поисковой системы Google выполнялся поиск по строке "(73) Assignee: PKWARE": http://www.google.com/search?q="(73)+Assignee:+PKWARE"&tbm=pts , который возвращает 24 результата, из них 6 являются охранными документами (заполнено поле «(45)»). Или используя возможности расширенного поиска,поиск по строке inassignee:PKWARE: http://www.google.com/search?q=inassignee:PKWARE&tbm=pts, который возвращает 11 результатов, из них 9 являются охранными документами. В любом случае можно выделить те, что относятся или затрагивают ZIP:

  • String searcher, and compressor using same (PDF) от 24.09.1991
  • System and method for manipulating and managing computer archive files (PDF) от 12.04.2005
  • Method and system for encryption of file characteristics of .ZIP files (PDF) от 07.09.2010
  • System and method for manipulating and managing computer archive files (PDF) от 30.11.2010
  • Systems and methods for manipulating and managing computer archive files (PDF) от 15.02.2011
  • Method and system for multiple asymmetric encryption of .ZIP files (PDF) от 22.02.2011

Возможно, это неполный список патентов, которые относятся к ZIP. Есть примеры наличия нескольких держателей подобных патентов. Так до 1 октября 2006 года те или иные особенности LZW были запатентованы разными держателями в разных странах (см. занимательную статью Почему на страницах сайта GNU нет файлов GIF).

В России OpenDocument Format свободен. И даже если использовать формат ZIP согласно общим формулировкам из ГОСТа:

  • 17.1 Введение (лист 863): «Пакет — это стандартный zip-файл структура которого рассмотрена ниже»;
  • 17.2 Структура zip-файла (лист 864), где не сказано, что из спецификации ZIP не надо применять, чтобы не нарушить какой-либо патент;
  • 17.4 Поток типа MIME (лист 865), где сказано каким не должен быть поток типа MIME, но это тоже не указывает на патентую чистоту.

то можно реализовать поддержку формата ODF не нарушив патентов ни одной страны мира (надеюсь на это).

Вывод

В ситуации когда существует множество форматов и стандартов, и не все из них свободны и открыты. Когда для просмотра и/или редактирования документа его получателю могут понадобиться лицензии на:

  • шрифты
  • библиотеки, реализующие запатентованные алгоритмы сжатия
  • использование определённых форматов изображений или видео-вложений
  • средства активации макросов
  • ...

что может поставить получателя документа в зависимость от определённого поставщика программного обеспечения, и тем самым ограничить его свободу. Надо быть внимательным в выборе форматов.

А разработчику программного обеспечения, который не хочет ограничивать свободу пользователей (и не столкнуться с возможными исками со стороны патентодержателей и авторов форматов) надо внимательно читать спецификации и помнить, что у свободы есть свои рамки.

Нарушения

Но отступления от форматов и соглашений встречаются часто. Гонка веб-браузеров породила множество особенностей HTML, последствия чего осложняют работу веб-разработчиков, верстальщиков и вообще пользователей веб-приложений. И это нехорошо, но терпимо.

Нарушение условий использования чего-либо тоже часто встречается. В спецификации того же формата GIF89a, опубликованного 31 июля 1990 года, указано требование размещать в документации или (если нет документации) в отдельном окне программы, использующей формат GIF89a, текст, состоящий из следующих трёх строк:
      "The Graphics Interchange Format(c) is the Copyright property of
      CompuServe Incorporated. GIF(sm) is a Service Mark property of
      CompuServe Incorporated."

Но эти три строки были увидены мною впервые лишь в тексте спецификации самого формата, больше нигде их не видел, хотя, судя по распространённости формата, эти строки должны быть повсюду. И это тоже нехорошо, но терпимо.

Ещё материалы автора
Похожие записи
Комментарии (3)
Михаил Романов 28 марта 2012 г. 14:07  
Я не дока в патентном праве США, но у меня есть смутное ощущение (почерпнутое из различных источников), что в данной статье есть некоторые несогласованности.
 
В частности:
 
А вот в США, например, идеи патентуются
 
Не совсем.
В США можно патентовать конкретный вариант (реализацию). Т.е. нельзя запатентовать "любое преобразование, приводящие к уменьшению объема данных с возможностью восстановления", но можно запатентовать конкретную реализацию арифметического или словарного сжатия.
 
Посему, сам факт наличия патентов еще не есть автоматическая блокировка использования формата.
Вячеслав Смирнов 28 марта 2012 г. 16:15  
В США можно патентовать конкретный вариант (реализацию)

Впечатление о патентовании идей сложилось в свете рассказов о различных патентных спорах, когда всё прямоугольное с кнопкой внизу подпадает под один патент, картинка, отображающая статус выполнения задачи — под другой патент, а колосок или вишенка в бутылке с напитком — под третий.

Понятно, что не надо патентовать идею космического звездолёта, использующего червоточены для перемещения во времени и пространстве, если идея недоработана. Во первых государство скорее всего пожелает сохранить такую разработку как ноу-хау. А во вторых, в отсутствии самого звездолёта, патентование его проекта и возможных особенностей реализации на ограниченное время почти ничего не даст.

 
Посему, сам факт наличия патентов еще не есть автоматическая блокировка использования формата.
Автоматической блокировки конечно нет. Но если у владельца патента напрямую спросить можно ли воспользоваться его идеей, то ответ, скорее всего, будет: «нет». Ведь не зря же патент оформлялся.
 
А без явного разрешения, скорее всего, возможность блокировки появляется, если имя пользователя патента на слуху, а его доходы достаточно велики, чтобы владелец патента мог заинтересоваться таким мероприятием как патентный спор и судебное разбирательство.
Андрей Подкин 28 марта 2012 г. 17:41  
Посему, сам факт наличия патентов еще не есть автоматическая блокировка использования формата.
Насколько мне известно, в США вообще нет никаких автоматических запретов по патентам. Т.е. до тех пор, пока к вам не обратятся напрямую или через суд, вы можете использовать любые технологии, форматы и т.д., защищенные патентами. Например, любой производитель Android-телефонов может не лицензировать патенты у Google и ему ничего за это не будет (с высокой долей вероятности).
Сейчас обсуждают
Больше комментариев