Gödel, Hale & Keyser y la incompletitud de la sintaxis


godel-by-david-greyEn 1930 el gran matemático alemán David Hilbert presentó ante lo más granado de su disciplina lo que precisamente se acabó llamando el programa de Hilbert para las matemáticas. La clave esencial de dicho programa se basaba en dos principios: que toda la matemática se sigue de un sistema finito de axiomas (escogidos correctamente) y que tal sistema axiomático se puede probar consistente. En otras palabras, lo que planteaba Hilbert en su programa, también llamado formalista, era que cualquier verdad de una teoría matemática debía ser demostrable a partir de los axiomas mediante razonamientos cuya validez fuera verificable mecánicamente en una cantidad finita de pasos, esto es, algorítmicamente. El lema que resume esta actitud (y que Hilbert hizo constar en su epitafio) era “tenemos que saber y sabremos”.

El programa de Hilbert se proponía en contra de los llamados “intuicionistas” o “constructivistas”, quienes rechazaban la existencia, entre otras entidades matemáticas, del infinito de facto usado por Cantor, precisamente porque negaban la existencia de números que no se pudieran generar algorítmicamente (esto es, mecánicamente por medio de un número finito de pasos). La maniobra de Hilbert era clara: al considerar la propia demostración como algorítmica introducía de nuevo el infinito de Cantor salvando las reticencias de los intuicionistas, que, en efecto, se rindieron oficialmente en aquel congreso en Königsberg de 1930 (aunque la controversia de fondo, si las entidades matemáticas se crean o se descubren, esto es, si tienen existencia independiente, sigue sin resolver).

Mas, en ese mismo congreso, un joven matemático austrohúngaro, recién doctorado y aún desconocido, levantó la mano y afirmó que en realidad había demostrado un teorema que probaba que si las demostraciones habían de ser algorítmicas, entonces era imposible dar axiomas para la aritmética que permitieran demostrar todas las verdades de la teoría. Más concretamente, el primer teorema de incompletitud de Kurt Gödel, el propietario de la mano que se alzó, establece que para todo sistema axiomático recursivo auto-consistente (por ejemplo uno que pueda describir la aritmética de los números naturales) siempre existen proposiciones verdaderas que no pueden demostrarse a partir de los axiomas. El hecho de que Gödel pudiera demostrar (e incluso convencer a Hilbert) que siempre habrá una afirmación verdadera pero indemostrable a partir de cualesquiera axiomas es lo que realmente tiene interés para un lingüista teórico (aparte, por supuesto, de que se ha considerado una de las mayores proezas intelectuales del siglo pasado). Hemos visto que Hilbert convenció a los intuicionistas exigiendo que la demostración de los teoremas siempre fuera algorítmica, y eso es lo que hizo Gödel para convencer a Hilbert: una demostración algorítmica de su célebre teorema de incompletitud, esto es, una demostración que cumplía escrupulosamente el programa de Hilbert.

Pero veamos qué tiene que ver todo esto con la teoría lingüística. Para ello debo aclarar primero que no soy matemático y no he estudiado personalmente los trabajos de Hilbert y Gödel (ni creo que pudiera entenderlos), de manera que este breve relato se basa en obras de divulgación. Mis noticias sobre Gödel se debían esencialmente a los libros imprescindibles de Hofstadter y, sobre todo, de Penrose. Sin embargo, el que sigo ahora es el delicioso ensayo sobre los teoremas de Gödel del matemático y divulgador Gustavo Ernesto Piñeiro. Piñeiro explica que en lógica matemática se emplea la “dualidad semántico-sintáctica”, de manera que un concepto relativo a una secuencia de símbolos es “sintáctico” si únicamente se refiere a los símbolos sin que tenga relevancia su significado (por ejemplo si decimos que en ktlvd hay cinco letras o que la primera es una k), mientras que es “semántico” si depende del significado que la secuencia transmite (por ejemplo si nos preguntamos a qué se refiere o si es verdadera). En este contexto podría decirse que en lógica matemática lo “sintáctico” es lo algorítmico (computable) y lo “semántico” lo vago e impreciso (no computable). Como señala Piñeiro:

“La premisa fundamental del programa de Hilbert consistía en pedir que la validez de los aspectos semánticos de las matemáticas fuera controlada mediante métodos sintácticos. La sintaxis, clara e indubitable, debía poner coto a la semántica, propensa a paradojas” (p. 98).

A estas alturas mis amigos lingüistas (especialmente los generativistas) ya estarán salivando copiosamente. En efecto, es muy tentador relacionar este episodio crucial de la lógica matemática y de la teoría de la computabilidad con la tensión entre el peso de la semántica y la sintaxis en la lingüística moderna. De hecho (y no me consta que se haya hecho antes, aunque nunca se sabe), es muy tentador equiparar en cierto modo el programa de Hilbert para las matemáticas con lo que podríamos llamar el programa de Chomsky para la lingüística. La gramática generativa podría, en efecto, caracterizarse como un intento de reducir la semántica a la sintaxis, en el sentido preciso de que en el modelo chomskyano la sintaxis no está al servicio de transmitir el significado o de ordenar los símbolos, tal y como se suele entender habitualmente, sino que la sintaxis en realidad crea el significado. La sintaxis construye significados que simplemente no existirían sin ella y, lo que es fundamental, lo hace mecánicamente, algorítmicamente, de manera inambigua.

En mis clases de lingüística, para (intentar) persuadir a mis alumnos del interés de embarcarse en una aproximación formal a la sintaxis (a lo que naturalmente suelen ser reacios) suelo sugerirles (una estrategia que leí en algún sitio que no recuerdo) que consideren la diferencia entre pedirle a alguien que haga una determinada tarea y programar un ordenador para que la efectúe. En el primer caso nos basta con enunciar la tarea a realizar, pues asumimos que nuestro amigo pondrá de su parte los mecanismos y recursos necesarios para llevarla a cabo. Simplemente, la enunciamos “semánticamente” (y allá nuestro amigo con los detalles). Sin embargo, un ordenador no tiene sentido común ni iniciativa: hay que pensar detalladamente el proceso de desarrollo de la tarea, y nos obligamos a hacer explícitos e inambiguos todos y cada uno de los pasos a seguir (y al menor descuido o error el programa se cuelga). Construir una teoría sintáctica es lo más parecido que podemos hacer a convertir en procesos algorítmicos el aparentemente milagroso proceso de construir y transmitir significados empleando el lenguaje.

Pero no nos olvidemos de Gödel (y ahora serán mis amigos cognitivistas, que también los tengo, los que se frotarán las manos). Al fin y al cabo, el teorema de incompletitud precisamente demostraba que el “método sintáctico” es necesariamente incompleto: siempre habrá enunciados verdaderos no demostrables a partir de los axiomas. En lógica matemática parece que tenemos que elegir: o bien tenemos métodos de razonamiento seguros y confiables (“sintácticos”), pero no podemos probar todas las verdades, o bien podemos conocer todas las verdades (empleando métodos “semánticos”), pero sin la certeza de que nuestros razonamientos sean correctos. El problema es complejo y enlaza con la controversia sobre la naturaleza de la consciencia humana y el debate sobre la inteligencia artificial fuerte. Para muchos autores (entre ellos Penrose) el hecho de que podamos tener certeza de verdades matemáticas sin una demostración algorítmica posible es precisamente una prueba de la diferencia cualitativa entre la mente humana y un ordenador. Pero, como señala Piñeiro, entonces resulta que lo que Gödel mostró es que no podemos estar seguros de ser superiores cognitivamente a un ordenador, puesto que “jamás podremos tener la certeza de que nuestros razonamientos semánticos son correctos” (p. 161).

Si nos centramos en el lenguaje, podría parecer que Gödel vendría a dar la razón a quienes lo abordan como un fenómeno esencialmente semántico (no computable, analógico, podríamos decir), pero la propia historia de la gramática generativa es una muestra de que probablemente el futuro pueda depararnos sorpresas. Ante la conclusión de que la mente humana no es plenamente algorítmica, Piñeiro concluye con un interrogante de crucial importancia para nosotros:

“¿Existe un nivel intermedio entre los razonamientos puramente sintácticos y los razonamientos libremente semánticos que permita superar la incompletitud de los teoremas de Gödel asegurando a la vez la consistencia? ¿Existe realmente una diferencia tan tajante entre ‘sintáctico’ y ‘semántico’ o lo que llamamos conceptos semánticos no son más que conceptos sintácticos más sofisticados (en los que se trabaja con grupos de símbolos en lugar de con símbolos individuales)?” (p. 162)

No creo que haya ningún lingüista generativista que al leer esto, aunque hable en realidad de la aritmética, haya podido evitar pensar en la controversia entre lexicismo y anti-lexicismo de los últimos decenios. La tendencia inaugurada en buena medida por los trabajos de Hale y Keyser sobre la “sintaxis léxica” en los años 90 del siglo XX (por mucho que se inspiren en propuestas anteriores) se ha visto continuada por la llamada Morfología Distribuida de Halle y Marantz, la aproximación “exoesquelética” de Borer o la nanosintaxis (atribuida a Starke y desarrollada intensamente por Antonio Fábregas). Lo que todos estos modelos tienen en común es precisamente que son instancias avanzadas del programa chomskyano de ir reduciendo el ámbito no computable, vago y fluctuante de la semántica al ámbito computable, algorítmico y no ambiguo de la sintaxis.

La descomposición del significado léxico en términos de las unidades y principios de la sintaxis oracional es obviamente una instancia de esa posibilidad mencionada en la cita anterior de Piñeiro de intentar evitar la incompletitud por medio de la descomposición de los “símbolos semánticos” en estructuras computables (esto es, sintácticas). Consideremos, por ejemplo, el artículo seminal de Hale y Keyser de 1993 en el que demostraban (¡aunque no en el sentido matemático!) que la estructura argumental de los predicados verbales era en realidad una estructura sintáctica ordinaria. Lo relevante ahora es que gracias a esa hipótesis se puede predecir mucho más adecuadamente por qué existen ciertos verbos y no otros, y por qué significan lo que significan y no otra cosa (así, en español podemos decir que embotellamos el vino, en el sentido de que metimos el vino en botellas, pero no que vinamos las botellas).

De hecho, Hale y Keyser se hacen una relevante pregunta semántica (¿por qué hay tan pocos papeles semánticos?) y ofrecen una interesante respuesta sintáctica (porque los papeles semánticos son en realidad relaciones sintácticas). En efecto, incluso los estudios más detallados al respecto suelen convenir en que las lenguas emplean un número muy reducido de papeles semánticos (del tipo de agente, experimentador, tema, locación, etc.), un número que suele oscilar entre los dos de las teorías más restrictivas hasta la media docena de las más prolijas. La mayoría de las aproximaciones disponibles en la época solían proponer una lista jerárquicamente ordenada de papeles semánticos y no se hacían preguntas tan relevantes como las siguientes: ¿por qué hay tan pocos papeles semánticos? ¿por qué tienden a ser los mismos en todas las lenguas? ¿por qué están ordenados jerárquicamente (en el sentido de que no sucede que un verbo tenga un paciente como sujeto y un agente como objeto directo)? ¿por qué los mismos papeles semánticos tienden a aparecer en las mismas posiciones (los agentes como sujetos, los temas como objetos, etc.)? Dado que no parece que sea un problema que la mente humana pueda aprender una docena o dos de papeles semánticos, Hale y Keyser plantean que quizá las respuestas tengan que ver con la sintaxis, y no con la semántica. Así, proponen la hipótesis de que los papeles semánticos se siguen en realidad de configuraciones sintácticas. Lo relevante en el contexto de nuestra discusión es que el carácter restrictivo y predecible de los papeles semánticos (que son parte del “significado” de los predicados) sería en realidad consecuencia de la naturaleza no ambigua y limitada de las relaciones sintácticas. Así, del cóctel formado por, de un lado, la asimetría de las proyecciones binarias y endocéntricas (en las que, por ejemplo, la relación entre núcleo y complemento no es reversible) y, de otro, el hecho (misterioso en sí mismo) de que hay un número muy limitado de categorías gramaticales, Hale y Keyser derivan una respuesta específica y concreta a las preguntas formuladas, con la respuesta ya adelantada de que en realidad los papeles semánticos no son primitivos de la teoría, sino etiquetas descriptivas de relaciones sintácticas finitas y restringidas.

Por su parte, otro de los desarrollos recientes de la gramática generativa, la aproximación cartográfica, es de nuevo un sólido impulso en la misma dirección de intentar reducir la vaguedad semántica a configuraciones sintácticas restrictas y computables (esto es, algorítmicas).

Pero, por supuesto, todo esto no implica que Gödel esté derrotado, ni mucho menos. Es relativamente fácil imaginar que siempre habrá un momento en el que un tipo verdaderamente ‘atómico’ de significado haya de ser postulado como simplemente “conocido” por la mente, un punto pues en el que ‘un axioma verdadero’ no pueda ser ‘demostrado algorítmicamente’, tal y como requeriría el ‘programa de Hilbert-Chomsky’. Pero, al igual que los matemáticos no han dejado de abordar la demostración de todos los teoremas postulados, podría decirse que los lingüistas formalistas estamos obligados a desarrollar hasta el extremo el programa sintáctico iniciado en los años cincuenta del siglo XX y considerarlo un objetivo científicamente lícito e irrenunciable.

Es posible que haya una ‘semántica irreductible’, pero no deberíamos olvidar que, al fin y al cabo, el teorema que lo demuestra sí tenía una demostración ‘sintáctica’, así que nunca se sabe.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: