Наверх

Искусственный интеллект по-русски: почему только комплексный подход может решить задачи бизнеса. Интервью с Игорем Беляком, Directum

Время чтения: 9 минут
0
Искусственный интеллект по-русски: почему только комплексный подход может решить задачи бизнеса. Интервью с Игорем Беляком, Directum

Какую роль играет искусственный интеллект (ИИ) при работе с документами? На каких технологиях работают современные умные сервисы? В чем преимущества комплексного решения задач с использованием ИИ? Об этом в первой части интервью рассказывает Игорь Беляк, руководитель департамента интеллектуальных решений Directum.

— Как обстоят дела на рынке систем управления цифровыми процессами и документами в 2022 году?

— Для компаний, которые пользовались иностранным ПО, уход западных вендоров стал серьезным вызовом. Однако отечественным поставщикам цифровых решений ситуация сыграла на руку — чувствуется активный спрос на импортонезависимые продукты.

Развитие российской ИТ-отрасли поддерживает и Правительство РФ: появляются новые гранты, предоставляются льготы для сотрудников компаний в сфере информационных технологий.

Стремление к импортонезависимости — одна из главных движущих сил ИТ-отрасли.

— Система Directum RX может попасть под санкции?

— Directum RX — полностью российская разработка. Система включена в Единый реестр отечественного ПО. Кроме того, еще один наш продукт — Directum Ario One — тоже есть в этом списке. Мы выполнили все самые жесткие требования и исключили риски для наших пользователей. Поэтому нашу систему выбирают крупные госкорпорации, которые априори доверяют только надежному отечественному ПО.

Правда, сейчас обсуждается, что критерии внесения компаний в Единый реестр будут смягчаться. На мой взгляд, это не совсем правильно. Если продукт присутствует в списке импортозамещенного ПО, для клиентов это гарантия защиты от санкций. Поэтому отбор должен быть максимально серьезным.

Однако я должен обратить внимание на следующий момент: все библиотеки, с которыми работают ИИ-сервисы, опенсорсные. А это значит, что доступ к ним для российских компаний может закрыться в любую минуту.

Речь идет о DotNet Framework, Core от Microsoft, у которых пока нет отечественных аналогов. Но я думаю, что локально в РФ приостановить работу этих платформ затруднительно.

— Какие тенденции в сфере ИТ-технологий сейчас наиболее четко прослеживаются?

— Один из главных трендов — программирование без кода, low-code/no-code-разработка. Это сейчас наиболее экономически выгодное решение. Без прикладной разработки, конечно, не обойтись, особенно при интеграции систем между собой.

Но к решению многих задач можно не привлекать разработчиков — с настройкой справятся бизнес-аналитики, уже глубоко погруженные в проект. Трудоемкость значительно снизится.

Еще один тренд — искусственный интеллект. Directum поступательно развивает ИИ-решения, опираясь на фидбэк клиентов. Один из инструментов, который действительно полезен в бизнес-процессах — распознавание текста.

В 2021 году наша компания представила сервис по ИИ-обработке и верификации информации через облачных операторов. Благодаря совместной работе искусственного интеллекта и человека решение распознает данные со 100%-ной точностью.

Наиболее важная особенность — внедрение интеллекта во все процессы системы.

— То есть ключевое отличие от конкурентов — в комплексном решении?

— Верно. Компаниям не нужны отдельные ИИ-инструменты, поэтому мы применяем искусственный интеллект во всех процессах нашей системы и поставляем комплексное решение.

Искусственный интеллект подключается на стадии фоновой индексации документов для полнотекстового поиска. Это важно для файлов, где нет текстового слоя, например, для фотографий, изображений, скан-копий.

Из-за отсутствия текста их можно найти только по реквизитам, а это трудоемко. С помощью фоновой индексации такие документы автоматически находятся и обрабатываются, а со стороны сотрудника это выглядит как обычный поиск.

Умные сервисы участвуют и в занесении документов с внешнего носителя в систему. В Directum RX есть специальная служба ввода, с помощью которой можно легко обработать даже очень большой поток информации с электронных или бумажных носителей.

Служба ввода извлекает документ со сканера, электронной почты или мобильного устройства, заносит в систему, а ИИ-инструменты классифицируют, извлекают реквизиты и заполняют карточки. Сотрудник только проверяет, всё ли верно.

Еще один важный процесс, где задействован искусственный интеллект, — это анализ рисков в договорах. ИИ проверяет версии документа, обнаруживает и подсвечивает правки, если их вносил контрагент. Интеллектуальные сервисы также уведомляют сотрудника, когда условия договора сомнительны, и бухгалтерия или юридический отдел не дадут их согласовать.

Интеллектуальные сервисы экономят 50% времени на согласовании договоров.

— Какие именно рутинные задачи может выполнять искусственный интеллект?

— Всё, что касается обработки входящих документов — классификации, заполнения карточек, распознавания текста, подготовки проекта резолюции. Умные инструменты находят ошибки и различия в контенте и уведомляют об этом сотрудника. При этом ИИ основывается на всех данных о работнике и подобных операциях, которые уже есть в системе.

Интеллектуальные сервисы пригодятся и в бухгалтерии. С их помощью можно сравнивать номенклатуру с информацией в учетной системе, сверять суммы, связывать документы в комплекты, анализировать риски в договорах.

С помощью ИИ-технологий сокращается время на согласование договора как минимум в 2 раза. Благодаря алгоритму по выявлению ошибок сотрудник не может отправить на проверку документ, который с высокой вероятностью вернется на доработку.

— Какие технологии используются в решениях на базе ИИ?

— На этапе предобработки применяется компьютерное зрение. С его помощью можно извлечь текстовый слой, определить положение документа, автоматически настроить яркость и контрастность, исправить геометрические искажения.

Обработка естественного языка помогает определить вид документа, извлечь из него даты, номера, наименования контрагентов, суммы. Причем эта технология работает не только с контентом документов, но и, например, с текстами задач в системе.

То есть если ввести в строку поиска «первичка за прошлый квартал по Газпрому», то найдутся не просто документы с упоминанием этих слов, а список финансовых документов с контрагентом ПАО «Газпром» за соответствующий период.

Благодаря семантическому анализу возможно сопоставлять текстовые блоки по содержанию и значению. Эта технология используется для нахождения различий в версиях документов.

Еще одно перспективное направление — оценка процессов для их оптимизации. Например, выявление лучшего состава исполнителей для ускорения согласования документов, анализ текста задач для выявления трудностей на ранней стадии работ, предсказание сроков завершения процесса с учетом статистики и текущей загрузки сотрудников.

— Какое направление ИИ вы планируете развивать в ближайшие несколько лет?

— В сфере искусственного интеллекта высокими темпами развивается семантический анализ. Например, «Сбер» и «Яндекс» разрабатывают крупные модели для русского языка, которые можно использовать для обработки документов. Модели помогут более глубоко вникать в документ, проводить семантический анализ, автоматически выдавать короткое содержание контента.

Однако семантический анализ у вендоров пока проработан слабо, поэтому мы и хотим развиваться в эту сторону. Например, мы делаем выдержки из сообщений в техподдержку компании Directum. На этом датасете возможно обучить модели и прийти к конкретному результату — автоматическому созданию сжатого содержания.

Семантический анализ пригодится при обработке договоров. Допустим, контрагент присылает новый документ, а сотруднику нужно его отнести к одному из шаблонов. Это влияет на выбор маршрута согласования. Если таких шаблонов около сотни, это уже задачка со звездочкой, но компьютер все-таки сможет ее решить быстрее, чем человек.

Кстати, мы подписали Кодекс этики в сфере ИИ. Поэтому наша компания готова обмениваться опытом с коллегами, делиться репрезентативной выборкой, кроме конфиденциальных данных, конечно.

Главная трудность в том, что качественных данных для обучения просто нет. Так или иначе базу документов составляет закрытая корпоративная информация, которую можно использовать только при подписании NDA.

Но даже в этом случае данные нельзя передавать, например, в сервисы разметки. Поэтому мы разработали такой инструмент у себя. Надеюсь, что скоро можно будет тестировать модели семантического анализа для создания выжимок из содержания, поиска схожих по смыслу документов.

Во второй части интервью Игорь Беляк раскроет, какие российские компании и для каких бизнес-задач уже применяют современные ИИ-сервисы.

Чтобы прочитать эту статью до конца,
или зарегистрируйтесь

Комментарии 0

Чтобы прокомментировать, или зарегистрируйтесь