24.06.2009 Cognitive Technologies представила подсистему «Понимание документов» для СЭД «Евфрат-Документооборот», которая позволяет регистрировать документ за 3 секунды, что сокращает время регистрации по сравнению с ручным вводом в 5—10 раз.
Таким образом, теперь система может сама, без участия человека, разбирать содержание документа и понимать его — выделять смысловые части, говорится в сообщении Cognitive Technologies. Понятая таким способом информация автоматически заносится в регистрационную карточку документа для дальнейшей работы с ним в СЭД.
В основу подсистемы «Понимание документов» легли результаты научных исследований компании в области анализа информации (синтаксический разбор, структурная модель представления знаний о языке, описание структурных связей). Кроме этого, был учтен опыт, полученный в ходе создания информационных систем с модулями понимания документов для Пенсионного фонда РФ и ОАО ММК.
Специалистами Cognitive Technologies создано XML-представление делового документа, на базе которого осуществляется обучение системы «пониманию». Подсистема «Понимание документов» может обрабатывать поступившие в электронном виде документы текстового и графического (после распознавания) форматов или документы, поступившие в бумажном виде (после сканирования и распознавания). В настоящее время система обучена пониманию тех видов документов, потребность в массовой регистрации и учете которых в организациях наиболее востребована: входящая корреспонденция и договоры по различным видам деятельности, отметили в Cognitive Technologies.
Для договоров подсистема «Понимание документов» автоматически заполняет в «Евфрат-Документооборот» следующие реквизиты: дату заключения, названия компаний, заключающих соглашение, предмет договора, срок действия договора, количество страниц договора, кроме этого она автоматически определяет наличие приложений и дополнительных соглашений, прикрепляя соответствующие файлы к карточке документа. Для входящей корреспонденции система заносит в карточку дату, информацию о корреспонденте (название учреждения, ФИО, должность), адресата (название учреждения, ФИО, должность), краткое содержание, количество страниц.
По информации разработчиков, подсистема «Понимание документов» доступна в рамках проектного решения при условии использования системы «Евфрат-Документооборот». Комплекс работ по внедрению включает: изучение вида и структуры документа; определение информация для «понимания»; создание XML-модели документа; обучение системы «Евфрат-Документооборот» пониманию. Время обучения подсистемы «Понимание документов» для одного вида документов, по данным компании, составляет около одной недели.
«В первую очередь, потенциальными потребителями продукта станут организации, придерживающиеся в своей работе ГОСТов или имеющие четкие внутренние регламенты по виду и типу используемых документов», — прокомментировал выпуск подсистемы «Понимание документов» руководитель направления электронного документооборота Cognitive Technologies Михаил Потапенко.
По словам вице-президента по маркетингу и общественным коммуникациям Cognitive Technologies Николая Никольского: «Сегодня развитие СЭД, как и других ИС, невозможно без активного внедрения новых технологий работы с содержанием (контентом). Ведь, несмотря на мощность современных ПК, они до сих пор не могут решать огромное количество задач, связанных с интеллектуальной обработкой информации, интуитивно понятных человеку. Понимание документов в СЭД «Евфрат-Документооборот» — первый, но очень важный шаг на пути массового распространения технологий контентного документооборота».
В планах по развитию возможностей понимания документов в СЭД «Евфрат-Документооборот» — обеспечение более глубокой интеграции технологий понимания в систему для организации процессов движения документов и контроля исполнения, внедрение самообучающихся алгоритмов понимания, подключение нового аппарата морфологического разбора и анализатора структурных связей, разрабатываемых в лабораториях компании. |