Искусственный интеллект по-русски: почему только комплексный подход может решить задачи бизнеса. Интервью с Игорем Беляком, Directum
Какую роль играет искусственный интеллект (ИИ) при работе с документами? На каких технологиях работают современные умные сервисы? В чем преимущества комплексного решения задач с использованием ИИ? Об этом в первой части интервью рассказывает Игорь Беляк, руководитель департамента интеллектуальных решений Directum.
— Как обстоят дела на рынке систем управления цифровыми процессами и документами в 2022 году?
— Для компаний, которые пользовались иностранным ПО, уход западных вендоров стал серьезным вызовом. Однако отечественным поставщикам цифровых решений ситуация сыграла на руку — чувствуется активный спрос на импортонезависимые продукты.
Развитие российской ИТ-отрасли поддерживает и Правительство РФ: появляются новые гранты, предоставляются льготы для сотрудников компаний в сфере информационных технологий.
Стремление к импортонезависимости — одна из главных движущих сил ИТ-отрасли.
— Система Directum RX может попасть под санкции?
— Directum RX — полностью российская разработка. Система включена в Единый реестр отечественного ПО. Кроме того, еще один наш продукт — Directum Ario One — тоже есть в этом списке. Мы выполнили все самые жесткие требования и исключили риски для наших пользователей. Поэтому нашу систему выбирают крупные госкорпорации, которые априори доверяют только надежному отечественному ПО.
Правда, сейчас обсуждается, что критерии внесения компаний в Единый реестр будут смягчаться. На мой взгляд, это не совсем правильно. Если продукт присутствует в списке импортозамещенного ПО, для клиентов это гарантия защиты от санкций. Поэтому отбор должен быть максимально серьезным.
Однако я должен обратить внимание на следующий момент: все библиотеки, с которыми работают ИИ-сервисы, опенсорсные. А это значит, что доступ к ним для российских компаний может закрыться в любую минуту.
Речь идет о DotNet Framework, Core от Microsoft, у которых пока нет отечественных аналогов. Но я думаю, что локально в РФ приостановить работу этих платформ затруднительно.
— Какие тенденции в сфере ИТ-технологий сейчас наиболее четко прослеживаются?
— Один из главных трендов — программирование без кода, low-code/no-code-разработка. Это сейчас наиболее экономически выгодное решение. Без прикладной разработки, конечно, не обойтись, особенно при интеграции систем между собой.
Но к решению многих задач можно не привлекать разработчиков — с настройкой справятся бизнес-аналитики, уже глубоко погруженные в проект. Трудоемкость значительно снизится.
Еще один тренд — искусственный интеллект. Directum поступательно развивает ИИ-решения, опираясь на фидбэк клиентов. Один из инструментов, который действительно полезен в бизнес-процессах — распознавание текста.
В 2021 году наша компания представила сервис по ИИ-обработке и верификации информации через облачных операторов. Благодаря совместной работе искусственного интеллекта и человека решение распознает данные со 100%-ной точностью.
Наиболее важная особенность — внедрение интеллекта во все процессы системы.
— То есть ключевое отличие от конкурентов — в комплексном решении?
— Верно. Компаниям не нужны отдельные ИИ-инструменты, поэтому мы применяем искусственный интеллект во всех процессах нашей системы и поставляем комплексное решение.
Искусственный интеллект подключается на стадии фоновой индексации документов для полнотекстового поиска. Это важно для файлов, где нет текстового слоя, например, для фотографий, изображений, скан-копий.
Из-за отсутствия текста их можно найти только по реквизитам, а это трудоемко. С помощью фоновой индексации такие документы автоматически находятся и обрабатываются, а со стороны сотрудника это выглядит как обычный поиск.
Умные сервисы участвуют и в занесении документов с внешнего носителя в систему. В Directum RX есть специальная служба ввода, с помощью которой можно легко обработать даже очень большой поток информации с электронных или бумажных носителей.
Служба ввода извлекает документ со сканера, электронной почты или мобильного устройства, заносит в систему, а ИИ-инструменты классифицируют, извлекают реквизиты и заполняют карточки. Сотрудник только проверяет, всё ли верно.
Еще один важный процесс, где задействован искусственный интеллект, — это анализ рисков в договорах. ИИ проверяет версии документа, обнаруживает и подсвечивает правки, если их вносил контрагент. Интеллектуальные сервисы также уведомляют сотрудника, когда условия договора сомнительны, и бухгалтерия или юридический отдел не дадут их согласовать.
Интеллектуальные сервисы экономят 50% времени на согласовании договоров.
— Какие именно рутинные задачи может выполнять искусственный интеллект?
— Всё, что касается обработки входящих документов — классификации, заполнения карточек, распознавания текста, подготовки проекта резолюции. Умные инструменты находят ошибки и различия в контенте и уведомляют об этом сотрудника. При этом ИИ основывается на всех данных о работнике и подобных операциях, которые уже есть в системе.
Интеллектуальные сервисы пригодятся и в бухгалтерии. С их помощью можно сравнивать номенклатуру с информацией в учетной системе, сверять суммы, связывать документы в комплекты, анализировать риски в договорах.
С помощью ИИ-технологий сокращается время на согласование договора как минимум в 2 раза. Благодаря алгоритму по выявлению ошибок сотрудник не может отправить на проверку документ, который с высокой вероятностью вернется на доработку.
— Какие технологии используются в решениях на базе ИИ?
— На этапе предобработки применяется компьютерное зрение. С его помощью можно извлечь текстовый слой, определить положение документа, автоматически настроить яркость и контрастность, исправить геометрические искажения.
Обработка естественного языка помогает определить вид документа, извлечь из него даты, номера, наименования контрагентов, суммы. Причем эта технология работает не только с контентом документов, но и, например, с текстами задач в системе.
То есть если ввести в строку поиска «первичка за прошлый квартал по Газпрому», то найдутся не просто документы с упоминанием этих слов, а список финансовых документов с контрагентом ПАО «Газпром» за соответствующий период.
Благодаря семантическому анализу возможно сопоставлять текстовые блоки по содержанию и значению. Эта технология используется для нахождения различий в версиях документов.
Еще одно перспективное направление — оценка процессов для их оптимизации. Например, выявление лучшего состава исполнителей для ускорения согласования документов, анализ текста задач для выявления трудностей на ранней стадии работ, предсказание сроков завершения процесса с учетом статистики и текущей загрузки сотрудников.
— Какое направление ИИ вы планируете развивать в ближайшие несколько лет?
— В сфере искусственного интеллекта высокими темпами развивается семантический анализ. Например, «Сбер» и «Яндекс» разрабатывают крупные модели для русского языка, которые можно использовать для обработки документов. Модели помогут более глубоко вникать в документ, проводить семантический анализ, автоматически выдавать короткое содержание контента.
Однако семантический анализ у вендоров пока проработан слабо, поэтому мы и хотим развиваться в эту сторону. Например, мы делаем выдержки из сообщений в техподдержку компании Directum. На этом датасете возможно обучить модели и прийти к конкретному результату — автоматическому созданию сжатого содержания.
Семантический анализ пригодится при обработке договоров. Допустим, контрагент присылает новый документ, а сотруднику нужно его отнести к одному из шаблонов. Это влияет на выбор маршрута согласования. Если таких шаблонов около сотни, это уже задачка со звездочкой, но компьютер все-таки сможет ее решить быстрее, чем человек.
Кстати, мы подписали Кодекс этики в сфере ИИ. Поэтому наша компания готова обмениваться опытом с коллегами, делиться репрезентативной выборкой, кроме конфиденциальных данных, конечно.
Главная трудность в том, что качественных данных для обучения просто нет. Так или иначе базу документов составляет закрытая корпоративная информация, которую можно использовать только при подписании NDA.
Но даже в этом случае данные нельзя передавать, например, в сервисы разметки. Поэтому мы разработали такой инструмент у себя. Надеюсь, что скоро можно будет тестировать модели семантического анализа для создания выжимок из содержания, поиска схожих по смыслу документов.
Во второй части интервью Игорь Беляк раскроет, какие российские компании и для каких бизнес-задач уже применяют современные ИИ-сервисы.
Комментарии 0