|
"El corpus virtual de la
red"
En
las páginas de la red electrónica mundial nos encontramos
con gran número de textos cuyo conjunto podemos considerar
como un gran corpus, el cual debido a que se encuentra en gran
parte indexado mediante buscadores podría ser consultado
de una manera diferente a la habitual para objetivos lingüísticos.
Los sistemas de búsqueda
en la red permiten introducir palabras individuales o grupos
de palabras y obtener una simple contabilidad o estadística
de la presencia de dicha palabra o frase en la red y de en qué
documentos de halla. Además, luego podemos dirigirnos
a las páginas o documentos concretos para examinarlos.
Pongamos
un par de ejemplos, que, también, dan idea de algunas
de las maneras de consultar cualquier corpus:
1) Queremos saber qué
se usa más si la internet o el internet.
_ Tomamos como términos
de búsqueda "la internet" y "el internet".
En algunos buscadores suele ser, así, entrecomillados,
en otros se presentan unas opciones de búsqueda que conviene
mirar. Y hacemos la correspondiente búsqueda para cada
expresión introduciéndola en el espacio de consulta
de un buscador como Yahoo, Infoseek, Netscape,
Voila, Altavista,... (sus direcciones puede
encontrarse en la página del trabajo dedicada a Referencias y Documentación)
Logrado
hacer esto, en la página
de direcciones en relación con dichas expresiones que
recibimos nos aparecerá una nota sobre el número
de páginas en que aparecen, y quizás del número
de casos que se dan, dependiendo de cuál buscador estemos
consultando. En búsqueda hecha el 6 de abril de 1999 se
podía encontrar en páginas indexadas del idioma
español los siguientes datos para el ejemplo propuesto, resumidos en
la tabla:
|
la internet |
el internet |
Yahoo |
3
978 |
3
539 |
Infoseek |
258 |
65 |
Netscape |
2
124 |
2
555 |
Voila |
1
977 |
2
033 |
media |
2
084,25 |
2
048 |
Como
podemos ver la media del número de páginas
para una y otra posibilidad resulta muy igualado, por lo cual
y sin aventurarnos demasiado podemos afirmar que la palabra
«internet» se acompaña tanto del artículo
«la» como del artículo «el».
Nótese que sería incorrecto considerar el total
de páginas en que aparece una palabra o una expresión
como la suma de las páginas encontradas por los
diferentes buscadores dado que es muy probable que estos nos
refieran a conjuntos de páginas que se interseccionan
en cierto número y por tanto estaríamos contando
varias veces muchas de ellas, el usar la media como
referencia es más fiable.
2) Queremos saber cómo
se pronominaliza el atributo en frases con el verbo resultar._ En este caso hemos de tener una idea
de cuáles son las posibles maneras en que esto ocurra.
Tales pueden ser con lo pronombre, con así
adverbio pronominal,
o con esto pronombre demostrativo.
Además, por encontrarnos
con la desventaja de que los buscadores de internet no admiten
el uso de comodines (que si admiten los
programas de concordancias o el sistema de consulta de los
corpus CREA y CORDE), tenemos que examinar una por una expresiones
como: "lo resulta", "lo resultó",
etcétera, "así resulta", "así
resultó", etcétera y "esto resulta",
"esto resulto", etcétera. En este caso, sin
embargo, nos facilita la labor el hecho de que las expresiones
que buscamos son poco frecuentes (es justo por su baja frecuencia,
también, por lo que su búsqueda en un corpus es
el mejor medio de encontrarlas).
Al introducir una expresión
en el buscador nos aparecerá una lista de direcciones
de documentos donde se encuentra la expresión.
El trabajo ahora consiste en activar
el hiperenlace a estos diferentes documentos y una vez descargados
del todo hacer lo siguiente: utilizando la opción de Búscar
en esta página... que se puede encontrar en el menú
del navegador bajo el letrero de Edición se localiza
la expresión en el documento y, si nos interesa lo encontrado,
se guarda el documento en el disco o se selecciona el párrafo
en que aparece la expresión para copiarlo al portapapeles
y pegarlo en un procesador de textos. Nótese que la palabra
o frase puede encontrarse a mitad o al final del documento y,
entonces, que solo lo encontraremos cuando esté completo.
Combiene guardar el párrafo hallado o, sino el documento
completo si nos interesan. No hay que olvidar guardar la dirección
en Internet de la página del documento y las referencias
pertinentes tales como el autor, la publicación o entidad
publicadora y la fecha.
Así, con la búsqueda
que se realizó en Altavista (, pero podía
haber sido algún otro buscador, de lo cuales sus direcciones
puede encontrarse en la página dedicada a Referencias
y Documentación) para el problema que tratamos,
se encontraron:
- muestras de pronominalización
con lo en varios documentos literarios (por ejemplo,
un artículo de Francisco Umbral y otro
de Zoé Valdés en periódicos digitales)
y no literarios, donde para mayor evidencia se podía leer
la frase adjetival atributiva seguida de la pronominalizada.
El desconocido, que mientras más me acercaba
menos lo resultaba, estaba vestido con unas
bermudas color beis, ...
Zoé Valdés
(He pensado tanto en ti que no estoy
seguro de que sea real,
El Mundo)
Un local abarrotado para
oír hablar de libros y de filosofía a alguien tan
escasamente complaciente como lo es Gustavo Bueno, resulta algo
rayano en el prodigio. Lo resulta, al menos,
en un país donde todo cuanto debemos al Estado, en lo
que a filosofía concierne, es la destrucción metódica
de cualquier territorio -mundano como académico- propicio
al pensamiento.
Francisco Umbral (Un cristiano,
El Mundo, 18 abril 1996)
¡Qué proféticas
resultan las palabras de los dos últimos párrafos
leídas en 1996! Ojalá no lo resulten
las palabras finales del primero de estos cuatro textos.
José Simeón
Cañas. Carta a las iglesias. Universidad Centroamericana.
- aunque se encontró la
expresión así resulta y semejantes del
verbo resultar, la palabra así no pronominalizaba
un atributo, aparecía a principio de párrafo y
resultaba un pronominal anafórico que remitía a
la idea del párrafo previo. Sería
demasiado prolijo incluir aquí los ejemplos.
- no se encontró la expresión
esto resulta ni semejantes con el verbo resultar.
Conclusión, la hipótesis
de que las frases atributivas con el verbo «resultar»
por lo general se pronominalizan con el pronombre «lo»
resulta la más plausible.
Del
corpus de textos indexados por un buscador de Internet no conocemos
con exactitud ni su extensión ni la naturaleza de sus
contenidos en un momento dado, además, su extensión
varía de modo impredecible de día a día.
Ha de entenderse que estas limitaciones no invalidan los resultados
de pequeñas investigaciones como las arriba propuestas,
tan solo limitan su precisión. Además, este "corpus"
tiene sus virtudes como son su actualidad, y su facilidad de
uso y acceso.
|
|