Persona en construcción

La información sintáctica en la entrada lexicográfica
Carlos Jiménez Romera
Madrid (España), junio de 2005.


Índice General

 
  • 1 El diccionario (monolingüe)
  • 1.1 La utilidad: comprensión y producción de textos
  • 1.2 La información lingüística
  • 1.2.1 Fonológica: ortografía y fonética
  • 1.2.2 Morfológica: derivación y composición
  • 1.2.3 Morfológica: flexión
  • 1.2.4 Sintáctica
  • 1.2.5 Semántica
  • 1.2.6 Pragmática
  • 1.3 La información enciclopédica
  • 1.4 El usuario
  • 1.5 Conclusiones: problemas por resolver
  • 2 La información sintáctica en el diccionario
  • 2.1 El tratamiento lexicográfico de los predicados
  • 2.1.1 Diccionario de la Real Academia Española
  • 2.1.2 Diccionario Castellano de Construcción y Régimen
  • 2.1.3 Diccionario María Moliner
  • 2.1.4 Diccionario REDES de Ignacio Bosque
  • 2.1.5 Advanced Learner's Dictionary
  • 2.2 Conclusiones
  • 3 Bibliografía


  • 1 El diccionario (monolingüe)

    1.1 La utilidad: comprensión y producción de textos

    La primera reflexión que hay que realizar en torno al diccionario se refiere a su utilidad, no en un sentido abstracto, sino estrictamente referida a la realidad de sus usuarios: ¿para qué emplean el diccionario? El lingüista y el filólogo pueden considerar el diccionario útil en sí mismo, por la información que acumula, al margen de su utilidad en la vida diaria. El hablante común, sin embargo, le otorga una utilidad muy concreta: un instrumento para la comprensión de textos escritos.

    En general, la interacción oral no requiere del diccionario, cuando se desconoce algún término se suele acudir al interlocutor para que lo aclare; en cualquier caso, los interlocutores comparten un mismo lugar y tiempo, y probablemente una importante porción de su formación cultural. Así, la necesidad del diccionario surge principalmente del interés por comprender textos alejados del contexto del lector, ya sea por motivos históricos, geográficos, culturales o técnicos. De hecho, éste es el origen de las primeras obras lexicográficas, una ayuda para comprender textos alejados de la realidad lingüística del lector.

    La producción de textos también suele requerir el uso del diccionario, pero no es tan frecuente como se piensa. De hecho, vivimos en una sociedad tan especializada que, aunque a todo el mundo se le supone una capacidad casi universal de comprender textos escritos en su propio idioma, no se le exige en el mismo grado la capacidad de escribir. En general, la mayoría de las personas se especializa en producir un tipo específico de textos, dentro del campo de su interés (laboral, académico, personal...), y pocas veces se aventuran a otros ámbitos. Así, el sistema educativo produce escritores especializados en textos periodísticos, textos científicos, textos literarios, etc., pero resulta muy difícil (tanto como en épocas remotas) encontrar a escritores competentes de forma general, en el conjunto de los géneros disponibles. Esta especialización endogámica reduce la utilidad del diccionario a la hora de producir textos, ya que el redactor se encontrará en todo momento tratando temas de su competencia especializada y casi siempre dirigidos a personas de sus mismos intereses, con los que comparte vocabulario y conocimiento de mundo.

    Hay otro factor que reduce la utilidad del diccionario a la hora de la producción de textos: su propia organización interna (macroestructura). La habitual ordenación alfabética de la entradas resulta muy útil para la búsqueda de la entrada de una palabra ya conocida; sin embargo, resulta inútil para el redactor que busca la palabra adecuada que, por supuesto, desconoce. Así, son los diccionarios de sinónimos y antónimos, los diccionarios ideológicos y otros diccionarios onomasiológicos, los que pueden resultar de más utilidad para la creación de textos.

    Cuando Martín Mingomance (1994a) se pregunta por la desproporcionada presencia de los diccionarios semasiológicos a los onomasiológicos nos confirma el sentido de esta causalidad: el predominio de los diccionarios ordenados alfabéticamente es consecuencia (y no causa) del uso preferente del diccionario para la comprensión (y no la producción) de textos.

    1.2 La información lingüística

    Cuando el usuario acude al diccionario en busca de ayuda para comprender una expresión lingüística espera encontrar un determinado tipo de información: aquella que le ayude a interpretar el texto, ni más, ni menos. Es labor del lexicógrafo decidir qué tipo de información espera y necesita el usuario y qué importancia debe otorgarse a cada porción de dicha información. En la tradición lexicográfica española se dedica la mayor parte del espacio a la información semántica, aunque mezclada de forma desigual con la información enciclopédica, mientras que se codifica de la forma más sintética posible la información morfológica, sintáctica y pragmática (y se ignora las más de la veces la información fonológica). Este resultado de la tradición bien merece un análisis crítico a la luz de la moderna ciencia lingüística.

    Para realizar este repaso por la información lingüística que debería ofrecer el diccionario, seguiremos el recorrido habitual por las disciplinas tradicionales con una única salvedad: los problemas de la formación de palabras y de la flexión, enmarcados ambos por lo común en la morfología, parecen lo bastante diferentes como para exigir un tratamiento diferenciado.

    1.2.1 Fonológica: ortografía y fonética

    El hablante ideal de cualquier lengua tiene un conocimiento intuitivo pero muy sofisticado de su fonología; no ocurre lo mismo con su representación escrita, cuya historia es independiente de la fonología y cuya capacidad para representar con precisión la lengua hablada es desigual en las distintas lenguas y en las distintas etapas de una misma lengua. Siendo el diccionario un medio fundamentalmente escrito, presenta las palabras en su forma escrita, es decir, una representación más o menos imperfecta de la forma hablada. En función de cada lengua y su forma de escritura, nos encontramos con distintas necesidades por parte de los hablantes y de los usuarios del diccionario.

    En castellano la escritura representa con exactitud todas las unidades fonológicas de la lengua estándar e incluso la prosodia (dentro de la palabra). Sin embargo, a una misma unidad fonológica le pueden corresponder varias representaciones escritas (h-Ø, b-v, c-z, c-k-qu, ll-y, c-s), cuya distribución en ocasiones responde a una regla fija (c-z), pero que en la mayoría de los casos responde a criterios etimológicos opacos para los hablantes. Así pues, el problema de los hablantes de castellano no reside en saber pronunciar correctamente una palabra que sólo han visto en forma escrita, sino en escribir correctamente una palabra que conocen por medio oral. Esta necesidad justifica uno de los usos más habituales del diccionario en el ámbito hispano: la consulta de dudas ortográficas, por el cual el diccionario se transforma en una fuente normativa, sea cual sea su vocación fundacional. (Un problema similar presenta el francés: la pronunciación es inequívoca, la escritura no.)

    En otras lenguas, por ejemplo el inglés, el sistema de escritura no se ajusta tan bien a la fonología, por lo que es preciso aportar información sobre la pronunciación de la palabra. En esta caso, uno de los usos, y no el menos habitual, que hacen los estudiantes de esta lengua es consultar la pronunciación de una palabra que sólo han conocido en su forma escrita.[1]

    Un problema distinto es el fonético y, en relación con la fonología, la existencia de diferentes alófonos para un único fonema y su distribución concreta. Esta información resultará irrelevante (sorprendente e incluso confusa) para el hablante común. Sin embargo, resultará muy útil al estudiante extranjero, que podrá encontrar pautas para identificar más fácilmente las emisiones orales.[2]

    1.2.2 Morfológica: derivación y composición

    La derivación y la composición son los principales instrumentos de cualquier lengua para generar nuevas unidades léxicas a partir de otras ya existentes (todas las lenguas tienen composición, pero no así derivación, aunque ésta también es muy común). El dilema que debe enfrentar el diccionario consiste en decidir si ha de incluir todas las palabras derivadas o si basta con incluir las bases y los afijos derivativos. Esta última solución puede resultar válida siempre que el significado del derivado sea resultado estricto de la composición de los significados de la base y los afijos, tal y como sostiene para los diminutivos Casares (1947). Sin embargo, en contadas ocasiones se cumple este requisito, ya que muchos de los afijos (principalmente sufijos en el caso del castellano) presentes en el vocabulario de una lengua sólo fueron productivos en una época concreta de la historia de la lengua, de forma que, primero, su significado no resulta completamente transparente al hablante y, segundo, cada palabra derivada ha desarrollado su propia historia independiente, tomando su propio camino al margen del significado original de la base y del afijo.

    Por otra parte, asumiendo los casos de afijos perfectamente productivos y bases prototípicas para su aplicación, no todas las posibilidades se incorporan realmente al léxico, por lo que las posibilidades derivativas de una lengua presentan una productividad teórica muy superior a la efectiva. Un ejemplo puede servir para ilustrar los problemas que se surgen en este campo: mientras que procesamiento o desviación están plenamente incorporados al léxico del castellano, las posibles alternativas *procesación y *desviamiento no son aceptadas. Por otra parte nos encontramos con casos en que se emplean varias posibilidades para el mismo fin: el término financia-ción es empleado en España, mientras que financia-miento es empleado en hispanoamérica con el mismo significado; el sistema de la lengua no muestra ninguna preferencia por ninguno de ellos, por lo que las entradas de financiar, -miento y -ción no bastarían por sí mismas para mostrar la distribución geográfica de estas dos palabras.

    Resultaría difícil enunciar una ley que previese todos estos casos, por lo que parecería necesario incluir las palabras efectivamente incorporadas al vocabulario por mecanismos de derivación y composición, aunque después se las defina haciendo referencia exclusiva al significado de sus componentes. En cualquier caso, el problema aquí planteado afecta principalmente al uso del diccionario para la producción de textos, ya que para descodificar procesamiento bastaría, efectivamente, con que en el diccionario aparecieran procesar y -miento, mientras que la aparición de *procesación en un texto que un hablante haya de interpretar será muy improbable (si no imposible).

    1.2.3 Morfológica: flexión

    Entre todas las formas del paradigma flexivo de una palabra, sólo una aparece en el diccionario en representación del conjunto. En este caso, el diccionario, más que ofrecer una información sobre la flexión, exige del usuario un conocimiento bastante preciso de ésta. De hecho, muchas veces tampoco informa de la irregularidad de un paradigma, de forma que se vuelve a limitar innecesariamente la utilidad del diccionario para la producción de textos.

    En castellano, la dificultad de paradigmas flexivos extensos se centra en los verbos. Sin embargo, no resulta difícil para el hablante común identificar rápidamente el paradigma al que pertenece una forma verbal cualquiera, incluso en el caso de las formas irregulares (que no dejan de seguir un número limitado de modelos); por último, el propio contexto permite desambiguar los casos extremos de homofonía (por ejemplo: amase, de amar o amasar). Por otra parte, no es habitual encontrar las formas irregulares en el diccionario para facilitar la identificación del lema correspondiente, algo que sí es común en los diccionarios ingleses.

    Así pues, la mayor parte de la información sobre la morfológica flexiva suele localizarse en las gramáticas y su conocimiento previo suele ser requisito indispensable para el correcto uso del diccionario. Las únicas indicaciones que se encuentran en el diccionario son aquellas asociadas a la clase de palabra. Por ejemplo, en los diccionarios castellanos se distinguen los adjetivos de los sustantivos añadiendo al lema (masculino) el morfema de la forma femenina.

    1.2.4 Sintáctica

    Puesto que las palabras suelen formar parte de una expresión más extensa, resulta imprescindible una mínima información sobre su forma de interactuar con otras palabras. En primer lugar, la sintaxis establece una clasificación de las palabras según la función que pueden realizar dentro de un enunciado más complejo; esta información, que es sintáctica, es imprescindible, en primer lugar, para localizar la palabra dentro del diccionario, ya que es el criterio fundamental para seleccionar el lema correspondiente; en segundo lugar, cualquier definición que se dé en la entrada del diccionario deberá interpretarse a la luz del contexto concreto.

    Partiendo de la clasificación que la propia sintaxis hace de las palabras de una lengua, se pueden observar diversas propiedades que resultan esenciales para su uso correcto y que deben necesariamente tenerse en cuenta a la hora de planificar un diccionario.

    Se ha solido distinguir, en mayor o menor medida, entre palabras llenas, con capacidad para hacer referencia a realidades extralingüísticas, y palabras vacías, cuya única función consiste en establecer relaciones entre las palabras llenas. Las primeras pueden concebirse aisladas, con un significado propio que puede ser modificado o especificado por el contexto; las segundas, por el contrario, sólo pueden ser concebidas dentro de un contexto y su significado se apoya necesariamente en el de las palabras que las rodean. Aunque esta clara distinción parta de una confusión de base entre significado y referencia, es cierto que esconde un comportamiento muy distinto en ambos tipos de palabras que los hablantes no tienen ningún problema en identificar y que debe ser tratado con cuidado por el diccionario, ya que las palabras vacías requerirán una mayor proporción de información contextual o sintáctica.

    Otra distinción relevante es la que, dentro de las palabras llenas, distingue a los predicados. Estas unidades léxicas hacen referencia a situaciones extralingüísticas en las que intervienen diversos actores, cada cual con un papel concreto a desempeñar en relación con el conjunto y con el resto de participantes. El significado de estos términos habrá de adaptarse a todo tipo de variaciones que afectan a la situación que refieren y a los actores que participan en ella; al referirse a situaciones donde intervienen un número determinado de elementos en principio independientes se recurre con frecuencia a las palabras vacías para establecer las diversas relaciones entre ellos. En este caso, puesto que se trata de elementos formados por componentes diversos, parece evidente la necesidad de una información contextual o sintáctica que aclare estas relaciones complejas. En general, los predicados determinan un número determinado de participantes, las propiedades o rasgos que deben presentar cada uno de ellos y el papel concreto que deben desempeñar. El hablante suele tener siempre presente toda esta información, pero en raras ocasiones se explicita ésta en el diccionario, al margen de los ejemplos, donde se echa en falta una generalidad necesaria para la comprensión adecuada del significado del predicado. Analizaremos este punto con más detalle más adelante.

    1.2.5 Semántica

    En este punto llegamos a lo que, a priori, debería ser el corazón del diccionario. En general, el usuario busca en el diccionario el significado de las palabras, con el objetivo de descodificar un texto dado (ya hemos dicho arriba que, efectivamente, éste es el uso fundamental del diccionario). Sin embargo, no queda claro qué significa aquí significado. En principio, la semántica moderna distingue entre significado y referencia, aunque no todas las escuelas terminen de tenerlo claro. Mientras que la referencia es una realidad extralingüística, de eso no hay duda, no queda claro si el significado existe al margen de la referencia o si se confunde con ésta. La opinión de Trujillo (1994) es clara: hay un significado lingüístico, propio de la palabra, y una referencia extralingüística, propia del uso que se da a una determinada palabra en un contexto concreto. Este autor realiza una crítica furibunda contra una tradición lexicográfica que confunde sistemáticamente ambos conceptos y se empeña en enumerar de forma sistemática el conjunto de usos (referencias) que ha tenido una palabra sin intentar en ningún momento describir el significado de la palabra.[3]

    Aún aceptando la existencia de un significado al margen de la referencia circunstancial de una palabra, no queda claro que se pueda definir el conjunto del léxico de una lengua a partir de este único criterio. Tal y como señala Coseriu (1966) hay amplias porciones del léxico, la terminología, que no tienen ninguna relación entre sí, ni con el resto del léxico de la lengua, y cuya principal (¿y única?) función consiste en referirse a una realidad extralingüística. Si este autor está en lo cierto, la pretensión de Trujillo sólo podría afectar a una parte muy limitada del léxico, mientras que el resto de las palabras sólo podrían definirse a partir de sus referentes. Desde luego es un problema abierto, pero que deja entrever la necesidad de un tratamiento diferenciado entre el léxico nuclear de una lengua (en el cual entraría el conjunto de palabras vacías y un subconjunto de las palabras llenas más empleadas) frente al léxico terminológico, que requeriría un tratamiento completamente diferente.

    Por último, conviene reseñar aquí que hay numerosas palabras cuyo significado exacto depende del contexto, lo cual no implica necesariamente la existencia de polisemia, sino en muchas ocasiones la simple indeterminación del significado, que sólo se completa en un contexto dado. Tal es el caso de los predicados, que sólo asumen un valor referencial concreto dentro de un contexto, mientras que su significado no deja de ser único. Analizaremos más abajo el caso de hablar, que sólo tiene un significado («expresar o comunicar»), pero múltiples realizaciones concretas: hablar un idioma, hablar con alguien, hablar de algo...La propuesta de Trujillo permite tratar adecuadamente la diversidad de realizaciones de determinadas palabras (que suelen corresponder con predicados, pero también con las palabras más utilizadas, véase el ejemplo de cosa) sin perder una unidad de significado que el hablante percibe claramente (normalmente con mayor claridad que el lexicógrafo, empeñado en diseccionar hasta los últimos matices del uso de cada palabra).

    1.2.6 Pragmática

    En este apartado debería entrar todo lo referido al uso concreto. Siguiendo la propuesta de Trujillo, la mayor parte de las definiciones que aparecen habitualmente en los diccionarios correponderían en realidad a descripciones de usos específicos, es decir, al campo de la pragmática y no de la semántica.

    Hay otro tipo de información pragmática que, sin embargo, es tratado con cierta solvencia por los diccionarios: la distribución sociolectal. Efectivamente, parece que desde los orígenes más remotos de la lexicografía ha existido una conciencia clara de la utilidad de reflejar con precisión las posibilidades de uso de una palabra, los contextos sociales en los que resulta aceptable o inaceptable. La realización concreta en cada diccionario puede ser más o menos afortunada, pero el problema se afronta y los enfoques tradicionales suelen ser suficientes, bien a través de abreviaturas o de comentario dentro de la propia definición o en alguna de las acepciones.

    Aunque hay coincidencias con el punto anterior, el tema de la distribución geográfica y dialectal presenta una problemática completamente distinta: un hablante puede dominar varios dialectos, pero se ve obligado a dominar varios registros; la convivencia de varios dialectos en una misma realidad lingüística tiene una naturaleza claramente diferente de la convivencia de los diversos registros de un mismo dialecto. Por supuesto, un diccionario puede pretender abarcar un gran número de variedades dialectales, pero no dejará de ser una suma de un núcleo común a todas ellas y un conjunto heterogéneo de realidades lingüísticas más o menos excluyentes entre sí. Probablemente tenga más sentido la creación de diccionarios específicos para los diferentes dialectos e incluso diccionarios contrastivos. En cualquier caso, nos encontramos en la barrera (difusa en el fondo) entre los diccionarios monolingües y los bilingües.

    1.3 La información enciclopédica

    En el caso de un diccionario lingüístico, el significado de cualquier palabra debería requerir exclusivamente información de tipo lingüístico y, por tanto, excluir la información enciclopédica. Sin embargo, la situación real queda muy lejos de ésta teórica: la información enciclopédica es empleada abundantemente en las definiciones lexicográficas; la cuestión, en realidad, que se plantea es si realmente es posible prescindir de ésta o, como asegura Coseriu, gran parte del léxico de una lengua sólo puede definirse en función del conocimiento del mundo. En cualquier caso, es necesario separar esta información de la información lingüística analizada anteriormente; será labor del lexicógrafo definir un criterio claro para unir los dos tipos de información en favor de la claridad, evitando la confusión que generalmente se encuentra en la mayoría de los diccionarios.

    1.4 El usuario

    Hemos visto arriba que el uso del diccionario requiere una serie de conocimientos por parte del usuario. En primer lugar, se espera de él una considerable capacidad de análisis morfológico, en lo referido a la flexión, simplemente para identificar el lema y buscarlo en el interior del diccionario. Una vez localizada la entrada, se encontrará con dos tipos de información: datos perfectamente formalizados, codificados y aislados (las abreviaturas que indican información sintáctica, pragmática o sobre la distribución dialectal) y datos incorporados de manera sintética a la propia definición, para cuya comprensión hay que disponer de una cierta competencia en la lengua en que esté escrita.

    Hay dos perfiles de usuarios que ponen en evidencia estos requisitos: los estudiantes de lenguas extranjeras y los programas informáticos.

    Los estudiantes de una lengua necesitan dominar la morfología flexiva de una lengua para poder consultar el diccionario, del tipo que sea. Sólo a continuación se encuentran con el siguiente problema, a saber, entender las definiciones. Los diccionarios infantiles y los diccionarios monolingües para estudiantes se enfrentan a un mismo problema: definir un léxico para emplear en las definiciones que pueda entender sin problemas un hablante con una competencia limitada. En el caso de los estudiantes de una lengua extranjera es habitual que acudan al principio a diccionarios bilingües, y sólo cuando tienen un nivel suficientemente alto del idioma, a diccionarios monolingües.[4]

    Por último, la proliferación de programas informáticos de procesamiento automático de textos lingüísticos ha puesto en evidencia la incompetencia actual de los sistemas electrónicos. En primer lugar, el problema de la lematización, que para los hablantes resulta relativamente trivial gracias a su capacidad de seleccionar siempre la opción más probable a partir del contexto pragmático, resulta un problema de enorme alcance para las máquinas, sin ningún tipo de competencia pragmática. Desde luego, el problema se resuelve gracias a la gran capacidad de cálculo de los equipos actuales, pero con un coste desproporcionado en comparación con los usuarios humanos. El siguiente problema, éste en principio irresoluble, es la absoluta falta de competencia lingüística de los programas informáticos, lo que les sitúa en una situación similar a la de los estudiantes de nivel más bajo: puesto que no tienen el dominio suficiente de la lengua para comprender las definiciones tienen que recurrir a un diccionario bilngüe; en el caso de los ordenadores, su idioma es el lenguaje lógico, por lo que cualquier diccionario pensado para ser entendido por una máquina deber definir los términos en un lenguaje estrictamente formalizado, donde el significado se corresponda estrictamente con la sintaxis.

    Son evidentes, entonces, las razones que han llevado a preocuparse tanto por la información sintáctica en los nuevos diccionarios electrónicos: la sintaxis es la única información con la que pueden operar los procesadores automáticos. Por ejemplo, todo el trabajo práctico establecido en torno a la gramática léxica que desarrollan Carlos Subirats y su equipo en la Universidad Autónoma de Barcelona (Subirats1992;2001) está centrado en el desarrollo de herramientas que permitan crear un diccionario de predicados léxicos a partir de reglas sintagmáticas. Es un esfuerzo dirigido a las máquinas, pero que bien puede incorporarse a los diccionarios convencionales.

    1.5 Conclusiones: problemas por resolver

    La información semántica frente a la información enciclopédica

    Este es un tema definitivamente abierto y sin solución a la vista. En cualquier caso, ignorar el problema no viene a solucionarlo y la lexicografía debería centrar gran parte de sus esfuerzos en aclarar una serie de conceptos que impiden una adecuada solución al problema. La defensa numantina de la tradición lexicográfica no deja de ser una estrategia miope, cuyo único apoyo posible es el mundo editorial, interesado más por la cantidad que por la calidad de los productos que coloca. Efectivamente, a la industria editorial le puede parecer interesante mantener el status quo de la lexicografía, pero ningún lexicógrafo honesto debería permitir esta evidente disfunción entre los diccionarios y los usuarios, a no ser que considere conveniente que el diccionario termine convirtiéndose en un mero manual de dudas ortográficas.

    La información sintáctica

    En la tradición lexicográfica se ha dado por supuesto que no era necesaria una descripción exhaustiva del comportamiento sintagmático de las palabras, ya que eso era tarea de la gramática. Así, la información sintáctica que aparecía en las entradas solía hacerlo a través de los ejemplos, de forma asistemática e imprevisible, sin atender a ningún programa claro.

    Las últimas tendencias en sintaxis teórica tienden a centrar el foco de interés en los predicados, de forma que gran parte del comportamiento de las estructuras sintácticas viene condicionado directamente desde el léxico. Esta revalorización de las propiedades sintácticas del léxico, sin embargo, no parece haber tenido especial repercusión en la técnica lexicográfica, al margen de una serie de excepciones que no dejan de ser geniales anécdotas.

    En la tradición aristotélica podía considerarse la gramática como un mundo inserto en la lógica y ajeno al léxico, que sólo venía a rellenar los huecos preestablecidos por la gramática. En nuestro tiempo esta concepción está completamente desfasada, la sintaxis viene configurada en gran medida por el propio léxico y entender estas propiedades como parte del contenido de la palabra puede permitir organizar de forma más racional y presentar de forma más transparente el significado de una palabra asociado a todos sus diferentes usos.

    Este es el problema que intentaremos analizar someramente a continuación.


    2 La información sintáctica en el diccionario

    Sobre la pertinencia de la información sintáctica ya se ha hablado arriba. Es posible que se guarden ciertas reservas sobre la importancia de la información sintáctica en un gran número de palabras (principalmente aquellas que Coseriu incluye en el grupo de las terminológicas), pero es indudable que hay al menos dos clases de palabras que requerirán información sintáctica para comprender mínimamente su significado. Por una parte, están las palabras vacías, cuyo significado exclusivamente gramatical hace evidente la necesidad de información sintáctica en su definición. Por otra parte están los predicados, en los que probablemente no se hallará tanta unanimidad, por lo que los trataremos a continuación.

    Generalmente se suele dar una definición sintáctica de predicado, pero parece necesario establecer claramente que el significado de un predicado no puede establecerse al margen de la información sintáctica para tratar de convencer a todos aquellos que consideran que la intaxis debe estar en los anexos gramaticales y no en el cuerpo de los diccionarios. Vamos a tratar, pues, de formular una definición en términos semánticos: predicado es aquella palabra (o grupo de palabras) cuya referencia extralingüística no puede establecerse con precisión fuera de un contexto lingüístico concreto.

    Este es sólo un primer intento de definición, probablemente sea imperfecta,[5] pero analicemos su aplicación a un caso concreto: hablar.

    ¿Qué significa hablar? Los diccionarios no suelen responder esta pregunta, sino a esta otra: ¿a qué nos referimos cuando usamos la palabra hablar? La única respuesta a esta segunda pregunta es: «a muchas cosas distintas». Efectivamente, mientras que los hablantes tienen una conciencia bastante unitaria del significado de hablar, sin embargo se encuentran con un número enorme de acepciones en la entrada correspondiente del diccionario. Así, tenemos «hablar un idioma», «hablar con alguien», «hablar de algo», «hablar por alguien», «hablar algo», etc. Volviendo a la definición propuesta, nos encontramos con que, efectivamente, a la hora de buscar una referencia concreta para un predicado, necesitamos recurrir a un contexto concreto, donde se le suman elementos en principio ajenos para construir una referencia precisa. Cuando confundimos significado y referencia, nos encontramos con múltiples significados; cuando establecemos claramente la distinción, sólo queda un significado y múltiples referencias.

    Para este ejemplo hemos recurrido a un predicado con cierta complejidad, pero no demasiada. Imaginemos los predicados ser, estar, dar o tomar. La mayoría de los hablantes identificarán un único significado para cada uno de estos verbos, pero serán incpaces de precisar este significado. Efectivamente, volviendo de nuevo a la definición propuesta, los predicados sólo adoptan un sentido preciso (una referencia) en un contexto determinado (es decir, cuando se rellenan las casillas libres que vienen definidas por su valencias), por lo que sólo pueden tener una definición precisa para cada contexto posible, lo que explicaría la necesidad de decenas de acepciones para cada uno de estos verbos. Así pues, el método del diccionario choca con la realidad lingüística: los predicados tienen un significado abierto y múltiples (en principio infinitas) posibles realizaciones cerradas, por lo que no es posible una acotación precisa del significado, aunque sí de las referencias históricamente atestiguadas. Aquí radica la crítica sostenida por Trujillo y que ya mencionamos arriba.

    (Redordemos que, aunque el ejemplo aquí estudiado y la mayoría de los predicados son de tipo verbal, también hay predicados adjetivales y nominales.)

    2.1 El tratamiento lexicográfico de los predicados

    Analizaremos a continuación una serie de diccionarios que se han destacado por su tratamiento cuidado de los predicados y la información sintáctica que los acompaña.

    Emplearemos el DRAE como representante de la tradición y de las prácticas más habituales en la redacción de diccionarios, para establecer las comparaciones pertinentes.

    2.1.1 Diccionario de la Real Academia Española

    Notemos en primer lugar, que a cada acepción le precede una indicación del contexto, tal y como preveíamos en la definición propuesta para predicado. Cada una de los usos tiene una construcción sintáctica cracterística, sin embargo, el DRAE sólo distingue tres categorías: intransitivo, transitivo y pronominal. No hay ninguna referencia al régimen preposicional al margen de los ejemplos, aunque hay que reseñar que cada uso preposicional fuera de lo habitual viene acompañado del ejemplo correspondiente. Así, la información sintáctica más relevante no viene indicada en la correspondiente abreviatura sino en los ejemplos ilustrativos.

    En cuanto al orden de las acepciones, no parece haber un criterio claro, sino una combinación de criterios de frecuencia e históricos que no ayudan en nada a la claridad de la entrada.


    (Del lat. coloq. fabulari). 1. intr. Articular, proferir palabras para darse a entender. 2. intr. Dicho de ciertas aves: Imitar las articulaciones de la voz humana. 3. intr. Dicho de una persona: Comunicarse con otra u otras por medio de palabras. Ayer hablé largamente con don Pedro. 4. intr. Pronunciar un discurso u oración. Mañana hablará en las Cortes el ministro de Hacienda. 5. intr. Tratar, convenir, concertar. U. t. c. prnl. 6. intr. Expresarse de uno u otro modo. Hablar bien o mal. Hablar elocuentemente. Hablar como el vulgo. 7. intr. Manifestar, en lo que se dice, cortesía o benevolencia, o al contrario, o bien emitir opiniones favorables o adversas acerca de personas o cosas. Hablar bien o mal. 8. intr. Razonar, o tratar de algo platicando. Hablar de negocios, de artes, de literatura. 9. intr. Tratar de algo por escrito. Los autores antiguos no hablan de esta materia. 10. intr. Dirigir la palabra a alguien. El rey habló a todos los presentes. Nadie le hablará antes que yo. 11. intr. Tener relaciones amorosas con otra persona. Gil habla con Juana. 12. intr. Murmurar o criticar. El que más habla es el que más tiene por qué callar. 13. intr. Rogar, interceder por alguien. 14. intr. Explicarse o darse a entender por medio distinto del de la palabra. Hablar por señas. 15. intr. Dar a entender algo de cualquier modo que sea. En el mundo todo habla de Dios. 16. intr. U. para encarecer el modo de sonar un instrumento con gran arte y expresión. Toca la guitarra, que la hace hablar. 17. tr. Emplear uno u otro idioma para darse a entender. Habla francés. Habla italiano y alemán. 18. tr. Decir algunas cosas especialmente buenas o malas. Hablar pestes. Hablar maravillas. 19. prnl. Comunicarse, tratarse de palabra con alguien. Antonio y Juan se hablaron ayer en el teatro. Tu hermano y yo nos hemos hablado algunas veces. 20. prnl. Dicho de una persona: No tratarse con otra, por haberse enemistado con ella, o tenerla en menos. U. con neg.
    Figura 1: DRAE: hablar


    2.1.2 Diccionario Castellano de Construcción y Régimen

    Sólo por esta obra se puede considerar a su autor, el colombiano Rufino José Cuervo, un genio visionario. No sólo se adelantó a su época, comenzó este diccionario varias décadas antes de que Tesniere teorizara por primera sobre la gramática de valencias, sino que a día de hoy no hay ningún otro diccionario en castellano que pueda competir con éste a la hora de describir el comportamiento sintáctico del léxico.

    Sobre este diccionario hay que señalar varios aspectos relevantes: primero, nace con vocación normativa, de ahí el claro sesgo en favor de los textos de autores clásicos castellanos; segundo, no pretende abarcar el conjunto del léxico de la lengua, sino que desde un principio se centra exclusivamente en aquellas palabras con un comportamiento sintáctico reseñable.

    En general, las entradas son de una extensión considerable, en una búsqueda consciente de la exhaustividad. En primer lugar, aparece una pequeña introducción donde se indican a grandes rasgos las acepciones que se van a tratar.

    A continuación se exponen cada una de las acepciones, clasificadas en grandes grupos, acompañadas de numerosos ejemplos de fuentes literarias diversas y en estricto orden histórico. Este último dato es muy relevante, ya que el autor tomó la decisión de reflejar con precisión la evolución diacrónica de la palabra más que facilitar la consulta de una búsqueda concreta. Así pues, nos encontramos ante un diccionario dirigido principalmente a especialistas que pueden permitirse gastar una tarde completa disfrutando de los vericuetos semánticos de la historia de una palabra.


    Introducción a la entrada

    idicc1.jpg

    Una acepción principal

    idicc2.jpg

    Indicación de régimen

    idicc3.jpg

    Resumen de construcciones

    idicc4.jpg

    Figura 2: DCR: hablar


    Aparte, aparecen testimonios del uso de la palabra en época anteclásica, apartados conscientemente por el autor en favor de la norma que el diccionario pretendía ilustrar.

    Por último aparece un resumen de las construcciones sintácticas que presenta la palabra, indicando las acepciones a las que corresponde cada una.[6]

    Globalmente, la información que presenta este diccionario es exhaustiva y clara, siendo el estilo de la redacción similar al DRAE, en la más ortodoxa tradición lexicográfica. Tan sólo cabría una reserva en cuanto al orden en que aparecen los diferentes usos y acepciones; existe una pequeña contradicción entre un diccionario que muestra principalmente el uso de las palabras dentro de construcciones sintácticas y el criterio histórico elegido para su exposición ordenada. Esta contradicción implica que usos diferentes desde el punto de vista semántico y sintáctico se encuentran entremezclados por azares diacrónicos que en nada ayudan al hablante contemporáneo. Por supuesto, nos encontramos ante un diccionario destinado a especialistas, pero al igual que se recurre al resumen final de construcciones sintácticas para orientar al usuario interesado por ese tema, podría haberse recurrido igualmente a este sistema para orientar al lector interesado en la evolución diacrónica.

    2.1.3 Diccionario María Moliner

    A primera vista, la entrada del María Molines se asemeja bastante a la del DRAE, pero en cuanto a la información sintáctico es sólo apariencia. Precisamente la diferencia fundamental entre ambos diccionarios es el tratamiento de la información sintáctica. El María Moliner incluye al comienzo de cada acepción una indicación del régimen proposicional pertinente, de forma que esta información no depende exclusivamente de la oportunidad del ejemplo.

    El orden, por su parte, parece ser exactamente el mismo que el del DRAE, por lo que habría que suponer que está basado en aquél, con los mismos problemas antes señalados.


    idicc5.jpg
    Figura 3: Maria Moliner: hablar


    2.1.4 Diccionario REDES de Ignacio Bosque

    El diccionario REDES, subtitulado «Diccionario Combinatorio del Español Actual», recién publicado, podría resultar un interesante intento de definir las palabras a partir de sus contextos, es decir, a partir de información sintáctica. Sin embargo, el diccionario resulta muy irregular. Resulta muy de alabar su transparencia en la introducción, donde explica el método aplicado para su confección (a partir de un corpus de textos periodísticos) y los objetivos concretos que persigue. Esta transparencia, sin embargo, se interrumpe bruscamente a la hora de presentar los dos tipos de entradas, completamente distintas, que se pueden encontrar en el diccionario: entradas cortas que se limitan a ofrecer una lista de expresiones (prácticamente estereotipos) que aparecen habitualmente combinadas con la palabra analizada y entradas largas que ofrecen un análisis pormenorizado de las posibilidades combinatorias y de los rasgos semánticos que deben contener las palabras que entren en dichas combinaciones.


    hablar

    idicc6.jpg

    decodificar

    idicc8.jpg

    Figura 4: Diferentes entradas de REDES


    En ningún lugar se explica cuál ha sido el criterio empleado para seleccionar las palabras que reciben el tratamiento más cuidado de las entradas largas, lo que hace sospechar que nos encontramos ante un diccionario a medio hacer, un proyecto que ha salido a la luz mucho antes de estar completo por motivos claramente extralingüísticos.

    El caso que nos ocupa, hablar, tiene una entrada corta que en la práctica supone un listado de expresiones más o menos hechas, colocaciones y locuciones con el verbo hablar, donde no quedan reflejados los usos preposicionales más comunes. Es, desde luego, una gran decepción.

    Sin embargo, si nos imaginamos para hablar una entrada larga como la que presenta decodificar, nos puede ofrecer mucho juego a la hora de combinar regímenes preposicionales y selección de rasgos en los participantes. Esta selección de rasgos, que en el resto de los diccionarios quedaba implícita, se hace explícita y razonada en las entradas largas de este diccionario, por lo que sólo hemos de esperar por que este proyecto llegue algún día a buen puerto y nos ofrezca un producto a la altura de lo prometido.

    2.1.5 Advanced Learner's Dictionary

    La primera edición de este diccionario data de 1948 y es el primer diccionario de este tipo que alcanzó una difusión importante. Está dirigido principalmente a estudiantes de inglés como lengua extranjera, entre los que cuenta con un cosiderable éxito. En un primer vistazo a la entrada de speak[7] se puede apreciar la organización y la disposición, al comienzo de cada acepción, de una indicación sobre los valores sintagmáticos de la palabra: régimen proposicional y valencias de los participantes implicados.


    idicc7.jpg
    Figura 5: Advanced Learner's: speak


    La formalización de esta información sintáctica es bastante sintética y permite repasar rápidamente un gran número de estructuras sintácticas hasta encontrar aquella pertinente. En cualquier caso, esta formalización no es ni mucho menos casual: en la preparación del diccionario se ha realizado el esfuerzo de sistematizar los esquemas sintáticos o patterns y reducirlos a un número limitado (25 patrones generales con sus correspondientes subclases). El esfuerzo de síntesis se aprecia en cada una de las entradas, especialmente en las más complejas, facilitando al máximo su uso por parte de sus destinatarios.

    Las acepciones se suceden de las más generales a las más concretas, es decir, un criterio semántico. Así, se dan casos de una misma construcción sintáctica, en acepciones diferentes y separadas (por ejemplo acepciones 3 y 6), sin que quede claro por qué se produce esta discontinuidad. Es decir, este esquema, a pesar de sus virtudes, aún podría ser mejorado.

    2.2 Conclusiones

    En la pequeña muestra que acabamos de analizar hay ejemplos suficientes, mejores y peores, sobre la inclusión de información sintáctica en entradas para las que resulta evidente su necesidad. El primer paso consiste en decidir qué tipo de información debe incluirse; para los enunciados parece claro que es necesario dar información de la valencia (participantes y rasgos de cada uno) y de las construcciones sintácticas conrrespondientes. Esta información sólo es ofrecida por los dos diccionarios más vocacionalmente sintácticos, es decir, el DCR y el Advanced Learner's, aunque en diferente formatos. En el resto de los diccionarios falta algún tipo de información relevante, siendo el caso pésimo el DRAE, donde no se indica ni el regimen preposicional ni las valencias de los predicados fuera de los ejemplos; en el María Moliner se incorpora información sobre el régimen preposicional, pero aún falta referencia a las características de los participantes predicativos. El caso de REDES es singular: las entradas cortas no dejan de constituir un catálogo de ejemplos (aunque sean validados estadísticamente en un corpus), mientras que las entradas largas facilitan información muy útil y exhaustiva sobre las características de los participantes predicativos.

    Es de esperar que, una vez aclarado el criterio para este caso, se pueda extrapolar éste al resto de las entradas del diccionario. Así, una vez incorporada información sobre los rasgos exigibles a determinados participantes predicativos, sería conveniente que las palabras susceptibles de ocupar dichas posiciones estuvieran convenientemente etiquetados en sus respectivas entradas, organizando un sistema coherente dentro del propio diccionario. Lo mismo podría decirse de las palabras vacías, que deberían encontrar un sitio dentro del conjunto del sistema.

    Hay un punto, sin embargo, en el que no parece haber una solución definitiva, a saber, el orden de las acepciones. Sólo el DCR explicita claramente su criterio de ordenación; el resto de los diccionarios opta por un criterio de frecuencia más o menos matizado por otras variables (históricas, semánticas, sintácticas). Probablemente ninguna de las soluciones es la mejor, pero resulta necesario optar por un criterio claro.


    hablar
    • Significado: «emitir sonidos lingüísticos; expresarse o comunicarse por medio del lenguaje»
    • Predicado de valencia 1-4
    • Participantes habituales:
      1. Agente: humano
      2. Tema: mensaje
      3. Destinatario: humano
      4. Medio: lengua o idioma
    • Usos o sentidos
      1. Pred-1: agente (suj)
        «Los hombres hablan cuando no quieren escuchar»
      2. Pred-2: agente (suj), medio (od)
        «Mi hermano habla francés como cualquier nativo»
      3. Pred-2: agente (suj), tema (od)
        «El hombre sólo habla necedades cuando ha perdido el juicio»
      4. Pred-2: agente (suj), tema (prep=de/sobre)
        «De lunes a domingo, el español medio sólo habla de/sobre fútbol»
      5. Pred-2: agente (suj), destinatario (oi)
        «El padre habló a su hijo con gravedad»
      6. Pred-2: agente (suj), destinatario (prep=con)
        «Después de hablar con el presidente, el ministro presentó su dimisión»
      7. Pred-2: agente (suj), persona (prep=por)
        Expresar lo que otra persona se ve impedida de hacer
        «Su portavoz habló por todos los ausentes en aquella reunión»
      8. Pred-2: agente (suj), persona (prep=por/en lugar de)
        «El ayudante habló por/en lugar del profesor afónico, sin saltarse ninguna de sus indicaciones»
        ...
      9. Pred-4: agente (suj), destinatario (oi), tema (prep=de), modo/medio? (prep=con)
        «Con voz enérgica, el líder habló a los presentes de los retos del futuro»
    Figura 6: Propuesta de entrada


    En la entrada propuesta se ha optado por ordenar las acepciones según la valencia o número de participantes. En cualquier caso, se han de producir contradicciones: ¿deben ir juntas «hablar a alguien» y «hablar con alguien» (siguiendo un criterio semántico), o debería ir esta última (siguiendo un criterio sintáctico) junto a «hablar con ímpetu/voz apagada»? Estas contradicciones, irresolubles, ya las hemos encontrado en los dos diccionarios tomados como ejemplos a seguir; probablemente no haya una solución única. Una posibilidad sería seguir un criterio preferentemente sintáctico para los diccionarios de uso prioritariamente descodificador y un criterio semántico para los diccionarios destinados a la producción de textos.


    3 Bibliografía

    Bosque, Ignacio (dir)  (2004)   REDES. Diccionario combinatorio del español contemporáneo   Ediciones S.M., Madrid 
    Casares, Julio  (1947)   Introducción a la lexicografía moderna   CSIC, Madrid, 1992, 3a. edición 
    Coseriu, Eugeniu  (1966)   «Structure lexicale et enseignement du vocabulaire»,   en Les théories linguistiques et leurs applications, AIDELA, Nancy, 1967, pp 9-51 
    Cuervo, Rufino José  (1994)   Diccionario Castellano de Construcción y Régimen   Instituto Caro y Cuervo, Bogotá 
    Fernández-Sevilla, Julio  (1974)   Problemas de Lexicografía actual   Instituto Caro y Cuervo, Bogotá 
    Folgar, Carlos  (1992)   «Algunos problemas relativos a la confección de un diccionario de valencias verbales del castellano medieval»,   Verba, 19, pp 95-106 
    Gutierrez Maté, Miguel  (2005)   «Notas acerca de la historia, estructura y herencia del Diccionario de Construcción y Régimen de Cuervo»,   Imaginando: lengua, 12, marzo de 2005. http://www.imaginando.com/lengua/archivos/000146.html 
    Haensch, Günter et al.  (1982)   Lexicografía. De la lingüística teórica a la lexicografía práctica   Gredos, Madrid 
    Hernández, Humberto (coord)  (1994a)   Aspectos de lexicografía contemporánea   Bibliograf, Barcelona 
    Hernández, Humberto  (1994b)   «El diccionario entre la semántica y las necesidades de los usuarios»,   en Hernández1994a:107-118 
    Hornby, A. S. (dir)  (1948)   Advanced Learner's Dictionary of Current English   Oxford University Press, 4a. edición, 1989, Oxford 
    Maldonado, Concepción (coord)  (1997)   Clave. Diccionario de uso del español actual   Ediciones S.M., Madrid. http://clave.librosvivos.net 
    Martín Mingorance, Leocadio  (1994a)   «La lexicografía onomasiológica»,   en Hernández1994a:15-27 
    Martín Mingorance, Leocadio  (1994b)   «La lexicografía de valencias»,   en Hernández1994a:29-37 
    Real Academia Española  (2001)   Diccionario de la Lengua Española   Espasa-Calpe, Madrid 
    Rojo, Guillermo  (1992)   «Problemas lingüísticos e informáticos en los diccionarios de construcción y régimen»,   en La lengua española y las nuevas tecnologías, Congreso Internacional de la Lengua Española, Sevilla. http://cvc.cervantes.es/obref/congresos/sevilla/tecnologias/ponenc_rojo.htm 
    Seco, Manuel  (1961)   Diccionario de dudas y dificultades de la lengua española   Espasa, Madrid, 10a. edición, 1998 
    Seco, Manuel  (1999)   Diccionario del español actual   Aguilar, Madrid, 2 vol. 
    Subirats Rüggeberg, Carlos  (1992)   «Sistemas de diccionarios electrónicos del español»,   en La lengua española y las nuevas tecnologías, Congreso Internacional de la Lengua Española, Sevilla. http://cvc.cervantes.es/obref/congresos/sevilla/tecnologias/ponenc_subirats.htm 
    Subirats Rüggeberg, Carlos  (2001)   Introducción a la sintaxis léxica del español   Ed. Iberoamericana, Madrid 
    Swan, Michael  (1980)   Practical English Usage   Oxford University Press 
    Trujillo, Ramón  (1994)   «El diccionario frente a la semántica»,   en Hernández1994a:73-93 


    Notas


     [1]: En el caso de otros sistemas de escritura, no basados en unidades fonológicas (fonemas, sílabas...), el problema es completamente diferente y requeriría otra tipo de aproximación.
     [2]: En este punto, sobre el que volveremos más adelante, hay que distinguir claramente entre diferentes competencias (en principio, al menos entre hablantes nativos y hablantes de otras lenguas).
     [3]: Humberto Hernández (1994b) le responde en otro capítulo de la misma obra (Hernández1994a) defendiendo la práctica tradicional porque es lo que esperan encontrar los usuarios del diccionario. Un argumento bastante insostenible, e increiblemente circular: efectivamente, los usuarios esperan encontrar en un diccionario lo que siempre han visto en un diccionario, pero ello no quiere decir ni que esto sea lo que ellos desearían encontrar ni que las propuestas de Trujillo sean incompatible con la utilidad del diccionario.
     [4]: Otro asunto a discutir sería la conveniencia de emplear en absoluto diccionarios monolingües en lugar de bilingües. Parece que la única ventaja de los primeros es que obligan a una inmersión en la lengua que se está aprendiendo.
     [5]: Por ejemplo, la posibilidad de aplicarla a predicados de valencia cero, como el caso de llover, es dudosa.
     [6]: Hay que señalar que no todas las entradas cuentan con este resumen, por ejemplo, el adjetivo bueno/a carece de él.
     [7]: Hemos acudido a este ejemplo como correspondencia más próxima al hablar castellano, una similitud que alcanza también el comportamiento sintagmático.

    Edición del 10-12-2005
    1