Саранск
А.В.Корочков
Диалоговая процедурная система
обращения
к утилитам ОС ЕС на ограниченном
естественном
(русском) языке (Система "С А Р А Н
С К")
Краткое описание и инструкция по использованию
1.4 Ограничения входного языка системы
Ограничения входного языка системы зависят от содержимого и структуры словаря основ, принятого грамматического описания и алгоритмических возможностей соответствующих анализаторов: морфологического, синтаксического и прагматического. Соответственно, ограничения входного языка ниже условно делятся на лексические, морфологические, синтаксические и прагматические.
Лексика системы, представленная в словаре основ, ограничена предметной областью, охватывающей работу утилит ОС ЕС.
В словаре основ содержится 1780 основ и словоформ (словарных статей), образованных от 260 различных корней. Словарная статья состоит из представления основы или словоформы (словарного входа) и одного или нескольких словарных элементов. В словарном элементе содержится отсылка к соответствующему семантико-синтаксическому модулю, информация о сочетаемости основы с флексиями (парадигматический класс), набор семантических признаков (например, время, род) и, если это словоформа, набор признаков, определяющих синтаксическое взаимодействие этого модуля с другими семантико-синтаксическими модулями.
Некоторые из этих словарных элементов содержат отсылку к семантико-синтаксическим модулям, которых в системе пока нет. При использовании в указании слов, описываемых такими словарными элементами, обработка текущего указания не прерывается, но система выдает соответствующее сообщение.
Для синтеза сообщения (команды) на выходном языке семантико-синтаксические модули должны иметь прагматическую поддержку.
Прагматическая поддержка включает, с одной стороны, определенные возможности анализа семантико-синтаксической структуры (см. подраздел 1.4.4), а с другой, - наличие описания предметной области, с которой система работает на выходе. В данном случае описание предметной области реализовано в виде процедурных сетей.
В настоящей версии системы имеются сети, описывающие перемещение, удаление, создание, каталогизацию, сжатие, инициализацию информационных структур. В этих сетях задействованы следующие информационные структуры: последовательные файлы, библиотеки, разделы, оглавления, каталоги и индексы.
Прагматическую поддержку имеют не все семантико-синтаксические
11
модули.
При употреблении слов, словарные элементы которых ссылаются на такие модули, не имеющие прагматической поддержки, анализ указания завершается построением синтаксической (семантико-синтаксической) структуры предложения. Из-за отсутствия необходимой информации прагматическая обработка либо не проводится, либо не доводится до конца. Использование механизмов вывода недостающей информации, т.е. применение принципов системы искусственного интеллекта, в настоящей версии системы не предусмотрено.
Таким образом, поддержка какого-либо слова является многоступенчатым процессом, требующим внесения изменений или дополнений в различные компоненты системы. Автоматически этот процесс не осуществляется, т.е. система не является самообучающейся.
В приложении Б приведен список слов, содержащих основы с полной поддержкой, которая включает:
- морфологическую поддержку (наличие основы в словаре основ),
- семантико-синтаксическую (наличие семантико-синтаксических модулей),
- прагматическую (наличие соответствующих процедурных сетей).
При этом необходимо иметь в виду, что не все формы соответствующих слов из списка имеют полную поддержку. При выборе соответствующей формы необходимо учитывать ограничения (морфологические, синтаксические, прагматические), перечисленные в последующих подразделах этого раздела. Например, не имеет смысла употреблять существительные или прилагательные в форме множественного числа, т.к. для этой формы нет прагматической поддержки.
Информация в приложении Б представлена в виде четырех колонок, содержащих по традиционной терминологии соответственно глаголы (первая колонка), существительные (вторая), порядковые числительные и прилагательные (третья), и предлоги (четвертая колонка). Для каждой из этих групп выбрана одна из возможных форм для всех элементов группы (колонки).
Так, глаголы представлены в форме инфинитива несовершенного вида, существительные - в форме единственного числа именительного падежа, прилагательные и порядковые числительные - в форме единственного числа именительного падежа мужского рода.
Необходимо, однако, иметь в виду, что при выборе форм представления слов в списке исходным положением было удобство восприятия и унификация с другими подобными списками, а не наличие у соответствующей формы полной поддержки в настоящей версии системы (таких форм может быть несколько). Так, глаголы представлены формой инфинитива, на использование которой синтаксический анализатор накладывает существенные ограничения (через недопущение эллиптических конструкций (см. 1.4.3), в которых эта форма применяется).