Саранск

А.В.Корочков
Диалоговая процедурная система обращения
к утилитам ОС ЕС на ограниченном естественном
(русском) языке (Система "С А Р А Н С К")

Краткое описание и инструкция по использованию


 

1.4 Ограничения входного языка системы

Ограничения входного языка системы зависят от содержимого и структуры словаря основ, принятого грамматического описания и алгоритмических возможностей соответствующих анализаторов: морфологического, синтаксического и прагматического. Соответственно, ограничения входного языка ниже условно делятся на лексические, морфологические, синтаксические и прагматические.

1.4.1 Лексические ограничения

Лексика системы, представленная в словаре основ, ограничена предметной областью, охватывающей работу утилит ОС ЕС.

В словаре основ содержится 1780 основ и словоформ (словарных статей), образованных от 260 различных корней. Словарная статья состоит из представления основы или словоформы (словарного входа) и одного или нескольких словарных элементов. В словарном элементе содержится отсылка к соответствующему семантико-синтаксическому модулю, информация о сочетаемости основы с флексиями (парадигматический класс), набор семантических признаков (например, время, род) и, если это словоформа, набор признаков, определяющих синтаксическое взаимодействие этого модуля с другими семантико-синтаксическими модулями.

Некоторые из этих словарных элементов содержат отсылку к семантико-синтаксическим модулям, которых в системе пока нет. При использовании в указании слов, описываемых такими словарными элементами, обработка текущего указания не прерывается, но система выдает соответствующее сообщение.

Для синтеза сообщения (команды) на выходном языке семантико-синтаксические модули должны иметь прагматическую поддержку.

Прагматическая поддержка включает, с одной стороны, определенные возможности анализа семантико-синтаксической структуры (см. подраздел 1.4.4), а с другой, - наличие описания предметной области, с которой система работает на выходе. В данном случае описание предметной области реализовано в виде процедурных сетей.

В настоящей версии системы имеются сети, описывающие перемещение, удаление, создание, каталогизацию, сжатие, инициализацию информационных структур. В этих сетях задействованы следующие информационные структуры: последовательные файлы, библиотеки, разделы, оглавления, каталоги и индексы.

Прагматическую поддержку имеют не все семантико-синтаксические


11

модули.

При употреблении слов, словарные элементы которых ссылаются на такие модули, не имеющие прагматической поддержки, анализ указания завершается построением синтаксической (семантико-синтаксической) структуры предложения. Из-за отсутствия необходимой информации прагматическая обработка либо не проводится, либо не доводится до конца. Использование механизмов вывода недостающей информации, т.е. применение принципов системы искусственного интеллекта, в настоящей версии системы не предусмотрено.

Таким образом, поддержка какого-либо слова является многоступенчатым процессом, требующим внесения изменений или дополнений в различные компоненты системы. Автоматически этот процесс не осуществляется, т.е. система не является самообучающейся.

 

В приложении Б приведен список слов, содержащих основы с полной поддержкой, которая включает:

- морфологическую поддержку (наличие основы в словаре основ),

- семантико-синтаксическую (наличие семантико-синтаксических модулей),

- прагматическую (наличие соответствующих процедурных сетей).

При этом необходимо иметь в виду, что не все формы соответствующих слов из списка имеют полную поддержку. При выборе соответствующей формы необходимо учитывать ограничения (морфологические, синтаксические, прагматические), перечисленные в последующих подразделах этого раздела. Например, не имеет смысла употреблять существительные или прилагательные в форме множественного числа, т.к. для этой формы нет прагматической поддержки.

Информация в приложении Б представлена в виде четырех колонок, содержащих по традиционной терминологии соответственно глаголы (первая колонка), существительные (вторая), порядковые числительные и прилагательные (третья), и предлоги (четвертая колонка). Для каждой из этих групп выбрана одна из возможных форм для всех элементов группы (колонки).

Так, глаголы представлены в форме инфинитива несовершенного вида, существительные - в форме единственного числа именительного падежа, прилагательные и порядковые числительные - в форме единственного числа именительного падежа мужского рода.

Необходимо, однако, иметь в виду, что при выборе форм представления слов в списке исходным положением было удобство восприятия и унификация с другими подобными списками, а не наличие у соответствующей формы полной поддержки в настоящей версии системы (таких форм может быть несколько). Так, глаголы представлены формой инфинитива, на использование которой синтаксический анализатор накладывает существенные ограничения (через недопущение эллиптических конструкций (см. 1.4.3), в которых эта форма применяется).


Следующая страница (подраздел) || Содержание
Переход на основную страницу сайта || раздела

Переход на основную страницу Рейтинг@Mail.ru
Copyright © 1999 А.В.Корочков
Последнее обновление: Август 19, 2000.
Hosted by www.Geocities.ws

1