Тип проекта:
исследовательский, программный.
Начало работ над проектом:
октябрь 1999.
Основные версии:
Версия 1999 (другое обозначение - 0.5) издание 4/1 (18.12.99 - 26.12.99).
Версия 2002 (другое обозначение - 1.0) издание 1/1 (12.02 - 10.04).
Текущее состояние:
открыт.
Автор:
Описание:
Система KorLang Transcriber преобразует полученный на входе текст в его фонетическую (фонемную) запись, используя для записи преобразованного текста соответствующие знаки транскрипции. Подробнее ...
Компоненты:
- ассоциативно-сетевая база данных (семантическая сеть) KorNet;
- визуальный редактор сети KorNet Walker;
- лингвистическая система KorLang (ее супервизорная и интерфейсная части);
- подсистема специального (частичного) морфологического анализа (для английского языка);
- подсистема слогоделения (слогоделитель);
- подсистема постановки ударения в изолированном слове (акцентуатор);
- подсистема определения типа слога;
- подсистема определения графемно-фонемных соответствий (транскриптор).
Модульность:
Версия 1999: одна часть правил преобразования (правила посимвольного преобразования и часть правил акцентуации) реализована декларативно (отделена от алгоритмической части) через систему ассоциативных сетей KorNet (хранится в файлах ассоциативно-сетевой базы данных - АСБД - KorNet), другая часть (правила частичного морфологического анализа, слогоделения, определения типа слога и основная часть правил акцентуации) - процедурно (алгоритмическая часть системы преобразования).
Версия 2002: все основные правила преобразования реализованы декларативно через систему ассоциативных сетей KorNet.
Расширяемость:
данные могут изменяться пользователем во время сеанса работы с системой (через встроенную систему KorNet Walker) или независимо от нее (при наличии отдельной системы KorNet Walker), алгоритмическая часть - только разработчиком.
Размер:
Версия 1999: данные (АСБД) занимают 27 Кб, программная часть содержит около 1000 строк текста на исходном языке (без развертывания макросов KorNet).
Версия 2002: данные (АСБД) занимают 105+14 Кб (второе число относится к базе, содержащей слова-исключения для раздела по букве A), программная часть содержит около 850 строк текста на исходном языке (без развертывания макросов KorNet).
Реализация:
KorNet
и С++.
Платформа:
Microsoft Windows (32 разрядные).
Язык-объект:
английский.
Переносимость:
для переноса на другой язык-объект требуется (предположительно) незначительное изменение алгоритмической части и разработка базы данных (знаний) графемно-фонемных соответствий для этого языка.
Локализация:
русский язык (поддержка других языков через перевод сообщений из ресурса сообщений системы и последующую перекомпиляцию этого ресурса).
Примеры:
и др. примеры (с используемыми обозначениями).
Документация:
-
Публикации:
- Корочков А.В. Компьютерное моделирование графемно-фонемного преобразования в английском языке (постановка задачи) // Социальные и гуманитарные исследования: традиции и реальности (Межвузовский сборник научных трудов). - Саранск: Ковылк. тип., 2002. - Вып.2. - С. 388-392.
- Корочков А.В. Компьютерное моделирование графемно-фонемного преобразования в английском языке (выбор подхода) // Вестник Морд. ун-та. 2003. N 1-2. С. 79-91.
- Компьютерное моделирование графемно-фонемного преобразования в английском языке (слогоделение) // Обработка текста и когнитивные технологии. Вып.8. Междун. конф. Когнитивное моделирование в лингвистике. Сб. докладов - Варна, 2003. С. 216-228.
- Computer Modeling of Grapheme to Phoneme Conversion for English. In Proc. of Intern. Workshop SPECOM'2003 (Speech and Computer), Moscow, 2003, p. 155-157 (на английском языке).
Журнал изменений:
-
Направления развития:
- введение фразовых компонентов (фразовое ударение и интонация);
- полная стыковка (на входе) с морфологическим и семантико-синтаксическим компонентами KorLang и компонентом синтеза речи (на выходе).
Поддержка (гранты):
-