INFORMATICA II
TEXTUAL DATABASE
MOIRA SOTO
C.I 8674742
An Experimental Model of Chinese Textual Database
Abstract
A textual database
deals with retrieval and manipulation of documents. It allows a user to search
on-line complete documents or parts of documents rather than attributes of
documents. Resembling a formatted database which uses a data model as its
underlying structure, a textual database has to base its development upon a
document model. In this paper, a document model, called the ECHO model, is proposed.
The ECHO model provides a document representation, called th ECHO structure,
for expressing documents and operations on the representation that serve to
express queries and manipulations on documents. It has the ability to provide
multiple document structures for a document, a flexible search unit for
retrieving textual information, and a subrange search on a textual database. In
addition, the ECHO structure is relatively easy to maintain. An architecture of
a textual database based on the ECHO model is also proposed. In order to
improve the query performance, a refined character inversion method, called
ARCIM, is proposed as the text-access method of the Chinese textual database.
The ARCIM can retrieve texts faster than a simple inversion mehtod and requires
less space overhead
http://www.sinica.edu.tw/~cdp/paper/1990/19900601_1.htm
Traducción Online
Un modelo experimental de la base
de datos textual china
Extracto
Una base de datos textual se ocupa de la recuperación y
de la manipulación de documentos. Permite que un usuario busque documentos o
partes completos en línea de documentos más bien que de cualidades de
documentos. Asemejándose a una base de datos ajustada a formato que utilice un
modelo de los datos como su estructura subyacente, una base de datos textual
tiene que basar su desarrollo sobre un modelo del documento. En este papel, se
propone un modelo del documento, llamó el modelo del ECO. El modelo del ECO
proporciona una representación del documento, llamada estructura de th ECHO,
para expresar documentos y las operaciones en la representación que sirven para
expresar preguntas y manipulaciones en documentos. Tiene la capacidad de
proporcionar las estructuras múltiples del documento para un documento, una
unidad flexible de la búsqueda para recuperar la información textual, y una
búsqueda del subrange en una base de datos textual. Además, la estructura del
ECO es relativamente fácil de mantener. Una arquitectura de una base de datos
textual basada en el modelo del ECO también se propone. Para mejorar el
funcionamiento de la pregunta, un método refinado de la inversión del carácter,
llamado ARCIM, se propone como el método del texto-acceso de la base de datos
textual china. El ARCIM puede recuperar los textos más rápidamente que un
mehtod simple de la inversión y requiere menos gastos indirectos del espacio.
Traducción Personal
Un modelo experimental de la base
de datos textual china
Extracto
Una base de datos textual se ocupa de la recuperación y
de la manipulación de documentos. Permite que un usuario busque documentos o
partes completas de documentos en línea en vez de los atributos de los documentos.
Es una base de datos
estructurada que usa a un modelo de datos como su estructura de soporte, una
base de datos textual tiene que basar su desarrollo en un modelo del documento.
En este papel, se propone un modelo del documento, se llama el
modelo del ECO. El modelo del ECO proporciona una representación del documento,
llamada estructura de el ECO, y sirve para expresar documentos y las
operaciones en la representación de los mismos que sirven para expresar
preguntas y manipulaciones en documentos. Tiene la capacidad de proporcionar
las estructuras múltiples del documento para un documento, una unidad flexible
de la búsqueda para recuperar la información textual, y una búsqueda del sub-rango
en una base de datos textual. Además, la estructura del ECO es relativamente
fácil de mantener. Una arquitectura de una base de datos textual basada en el
modelo del ECO también se está proponiendo. Para optimizar el funcionamiento de
la pregunta en la búsqueda, se utiliza el método mejorado de la inversión del
carácter, llamado ARCIM, se propone como el método del acceso-texto de la base de
datos textual china. El ARCIM puede recuperar los textos más rápido que un método
simple de la inversión y requiere menos gastos indirectos del espacio.