Una ecuación para la lingüística (¡por fin!)


Los lingüistas solemos ser envidiosos de la física. Nos encanta presumir frente al resto de practicantes de las llamadas humanidades de hacer una ciencia natural empírica que usa el método hipotético deductivo (algunos hemos escrito pesados tratados intentando demostrar eso). Pero, a la vez, sabemos que las cosas en lingüística (como suele suceder en general en las ciencias cognitivas) son muy diferentes de como lo son en física, en química e incluso en biología. Nuestros objetos de estudio son mucho más elusivos y abstractos, las pruebas de su existencia más alambicadas y nuestra capacidad de observación y medición mucho más limitada e indirecta que en las llamadas ciencias duras.

Una de las carencias de nuestra ciencia frente al espejo de la física es que nuestras teorías no se formulan matemáticamente con ecuaciones (la biología también cojea en eso, pero hace tiempo que ha hecho sus pinitos). Quizá por eso Ernst Rutherford decía que la ciencia, o era física, o era coleccionar sellos.

Pero en los últimos años el lingüista Charles Yang (formado como informático en el MIT y ahora profesor en la Universidad de Pensilvania), especialista indiscutible e influyente en el estudio de los mecanismos de adquisición del lenguaje, nos ha proporcionado una bella ecuación que, a diferencia de otras (como la famosa ley de Zipf), sí nos permite conocer mejor algunos aspectos de la facultad del lenguaje. Aunque la ecuación de Yang aparece en varios artículos previos, la presentación más completa y redonda de su modelo aparece en el excelente libro The Price of Linguistic Productivity de 2016, justamente galardonado con el premio Bloomfield de la Linguistic Society of America de este año.

Antes de entrar en detalles, conviene recordar que una ecuación expresa una igualdad matemática entre dos expresiones y que la ciencia las utiliza para enunciar leyes de forma precisa. La ecuación que nos ocupa no tiene la belleza y relevancia de otras tan célebres como las de Newton, Maxwell, Einstein o Schrödinger, pero aun así tiene una importancia capital para la ciencia del lenguaje, especialmente para nuestra mejor comprensión de cómo es posible que los niños de entre cero y cuatro o cinco años sean capaces de descubrir reglas productivas en su lengua sobreponiéndose a numerosas excepciones y a una exposición incompleta y no sistemática a los datos necesarios (o sea, lo que Chomsky denominaba el problema de Platón: cómo sabemos tanto con tan poca información).

La ecuación de Yang expresa lo que él denomina el principio de tolerancia y, en términos simples, establece con sorprendente precisión cuál es el umbral de tolerancia a las excepciones que los mecanismos de adquisición del lenguaje del niño son capaces de soportar para poder inducir una regla productiva.

No cabe ninguna duda de que los niños están especialmente dotados para la búsqueda de regularidades en el input lingüístico que les rodea (de forma más pedante, decimos que intentan construir la gramática más eficiente para entender y usar la lengua del entorno). Pero esa es una tarea cognitiva que dista de ser sencilla, especialmente cuando las reglas deben inducirse a partir de una muestra limitada. Así, si de comer tenemos como y de beber tenemos bebo, no es extraño que, aunque nunca lo hayan oído antes, de romper los niños produzcan rompo. Parece que han detectado que los verbos de la segunda conjugación en español hacen la primera persona del presente de indicativo añadiendo -o a la raíz (en este caso el resultado de quitar –er al infinitivo). El problema es que junto a bebocomo o rompo, también están en el entorno del aprendiente quepo (de caber), sé (de saber), tengo (de tener), muerdo (de morder), traigo (de traer) o he de haber, todos ellos ejemplos que desacreditan la hipótesis de que el presente se forma simplemente añadiendo –a la raíz del verbo, esto es, todos ellos formas irregulares. La pregunta que se plantea Yang (siguiendo una vastísima tradición de discusión y controversia en ese ámbito, normalmente en torno a los verbos irregulares en inglés) es cómo se las arregla el niño para formular una regla productiva.

Podría parecer una pregunta ociosa: dado que las formas regulares son mucho más abundantes que las irregulares, simplemente se impone el patrón más común, esto es, el regular. Pero las cosas no son así en absoluto: el niño no tiene acceso a un número ilimitado de datos ni, por supuesto, acceso a corpus y herramientas computacionales que le permitan llegar a esa conclusión. Más bien al contrario, como ha mostrado Yang analizando detalladamente el input que reciben los niños y sus propias producciones, la exposición que tienen a los datos es incompleta y necesariamente reducida. De hecho, aunque los verbos irregulares son, por definición, menos abundantes que los regulares, resulta que su uso es mucho más frecuente que el de los regulares (por ello precisamente se mantienen como irregulares, porque se usan mucho y se aprenden muy pronto). Piense el lector en los verbos ser, tener o haber (por no salir de la segunda conjugación) y verá que esto es así sin necesidad de hacer estadística.

Pero, por supuesto, en el input del niño debe haber un número suficiente de ejemplos regulares para que se estimule la formación de la regla. ¿Cuál es ese número? O mejor planteado: ¿a cuántas excepciones o ejemplos irregulares es capaz de sobreponerse el niño para construir una regla productiva?

Aquí es donde entra el principio de tolerancia, expresado en la ecuación mencionada. Veámosla en todo su esplendor:

Yang-1

Aunque esta fórmula puede resultar opaca para los no informados (incluido quien suscribe), lo que el principio de tolerancia predice es lo siguiente: para que una regla R sea productiva, el número de excepciones (e) tiene que ser igual o menor que el número expresado por la función N/LnN, donde N es el número total de ejemplos del input (incluyendo las excepciones) y donde Ln es el logaritmo neperiano. La ecuación establece pues, con precisión, cuántas excepciones dentro del número total de ocurrencias puede tolerar nuestro instinto de formular una regla productiva.

Otra forma de entenderlo es considerar que, aunque una regla productiva es más eficiente que la memorización de cada forma (como parece de sentido común, pues en caso contrario no existiría la conjugación verbal), la regla sólo se formulará si la recompensa por ello hace a la gramática más eficiente que con la memorización de cada forma. Nótese que una vez formulada la regla en la gramática interna del niño, dicha regla tendrá que aplicarse a las formas no memorizadas como irregulares. Pero para saber si un verbo es o no irregular, el niño deberá repasar los verbos irregulares memorizados. Si la lista de verbos irregulares es muy larga, entonces ya no tendría ventaja computacional formular la regla productiva. La fórmula de Yang determina con sorprendente precisión cuál es esa longitud crítica de la lista a partir de la cual los niños formulan las reglas productivas (y también explica, por supuesto, cuándo no lo hacen).

Yang (2016) recoge una impresionante cantidad de estudios empíricos reales de adquisición de morfología, fonología y sintaxis en diversas lenguas en los que la fórmula funciona con precisión matemática. Para no cansar al lector, me centraré solo en el caso estrella, la formación del pasado en inglés. Imaginemos que un niño que está adquiriendo el inglés conoce 120 verbos irregulares (esto es e=120), que son más o menos los que Yang encuentra en el corpus CHILDES de inglés dirigido a los niños, de unos cinco millones de palabras. Con la fórmula en cuestión podemos inferir que entonces N (el número total de verbos sumando regulares e irregulares que tiene que saber el niño) es de 800. Eso implica que para que un niño produzca la regla de formación regular del pasado en inglés (toscamente, añadir –d) debe conocer al menos 680 verbos regulares. Y así es, en efecto: el corpus mencionado contiene unos 900 verbos regulares conjugados según la regla “añadir –d”. Y es precisamente en ese momento cuando los niños que están aprendiendo inglés dan con la regla y la empiezan a aplicar productivamente (incluso erróneamente a los verbos irregulares, exactamente como cuando los niños que aprenden español dicen cosas como cabosabo, etc.). Hasta el momento en el que se alcanza ese umbral crítico de tolerancia, los niños son conservadores y se limitan a repetir las formas que oyen, esto es, operando solo con memorización asociativa. Los niños que dicen cabo o sabo (palabras que no han podido memorizar previamente) ya han superado el umbral crítico y han dejado de memorizar palabras innecesariamente y han pasado a confiar en las reglas productivas. Y por eso conjugan perfectamente verbos que nunca habían oído antes.

En la siguiente tabla, adaptada de Yang, vemos algunos ejemplos concretos de aplicación de la fórmula que nos permitirán captar otra propiedad notable del principio de tolerancia:

N θN %
10 4 40.0
20 7 35.0
50 13 26.0
100 22 22.0
200 38 19.0
500 80 16.0
1.000 145 14.5
5.000 587 11.7

En la primera columna tenemos el número total de casos (N) y en la segunda el resultado de la función N/LnN, que define el umbral de tolerancia (recuérdese, el número de excepciones, e, debe ser igual o menor que ese número). Es llamativo observar la tercera columna, que expresa el porcentaje de excepciones a la regla que tolera cada caso. Nótese que esa proporción no es constante, sino que depende del tamaño de N: cuanto menor es N, mayor porcentaje de excepciones se tolera. Así, para N=10 se toleran hasta un 40% de casos irregulares, mientras que para N=5.000 solo un 11,7%. Esto es muy notable.

De hecho, es muy tentador interpretar esto como una adaptación para la adquisición temprana del lenguaje, esto es, para explicar cómo es posible que las reglas productivas como las que hemos revisado someramente se obtengan a la edad de 2-3 años, cuando la experiencia vital y el tamaño del input recibido es necesariamente restringido. Podría decirse que la facultad del lenguaje no solo está diseñada para aprender la gramática más eficiente posible a la vista de los datos, sino también para aprovechar la ventana de oportunidad definida por el periodo crítico para la adquisición del lenguaje. Como dice Yang, en ocasiones como esta, menos es más. El principio de tolerancia permite que los cerebros en maduración (cuando realmente pueden adquirir la lengua materna de forma plena) puedan sobreponerse al input reducido que necesariamente va asociado a la corta edad.

En un trabajo posterior Yang (2017) ha ido más lejos y ha propuesto que la capacidad humana de contar hasta el infinito (instanciada en la llamada función sucesor) tiene una base lingüística, algo ya sugerido por Chomsky (2007) al relacionar la operación Merge que está en la base de la sintaxis con dicha función. Yang postula que la función sucesor se desarrolla en los niños a la vez que se desarrolla la adquisición del léxico numérico, esto es, a la vez que se desarrolla el sistema morfosintáctico que nos permite construir productivamente palabras para el número siguiente.

En lo que ahora nos interesa, de nuevo el principio de tolerancia hace predicciones sorprendentes. Revisando la bibliografía al respecto, Yang observó que en los estudios sobre la capacidad de contar de niños de lengua inglesa hay un salto cualitativo a partir de 72, esto es, que los niños desarrollan su capacidad en diversas fases, lentas y con regresiones, pero que una vez que saben contar hasta 72 ya no hay un límite superior (esto es, han dado con la función sucesor).

Pero ¿por qué 72? La respuesta, claro, está en el principio de tolerancia. Consideremos los primeros cien números en inglés (abreviando y escribiendo con letras las palabras irregulares y con cifras las regulares):

one two three four five six seven eight nine ten eleven twelve thirteen 14 fifteen 16 17 18 19 twenty 21 22 23 24 25 26 27 28 29 thirty 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 fifty 51 52, etc…

Hay un total de 17 formas no predecibles que hay que aprender de memoria (el resto se forman componiendo sobre estas, como por ejemplo twenty-nine para 29), lo que permite predecir aplicando el principio de tolerancia que si es 17, el menor valor para N es 73, por lo que si un niño aprende a contar en inglés hasta 73 ya no tendrá límites. Señala Yang que en una lengua más regular, como el chino, solo los primeros 12 números tienen que aprenderse de memoria, por lo que un niño aprendiendo chino será capaz de contar sin límite una vez que haya adquirido 46 palabras numéricas, lo que de hecho da cuenta de la previamente observada mayor precocidad en la capacidad de contar de los niños que hablan chino frente a los que hablan inglés.

Está claro que todo esto no equipara a la teoría lingüística con la física en cuanto al uso de las matemáticas y la capacidad de predicción, pero es inevitable no reconocer que es un paso adelante importante en el camino ideal del edificio de la ciencia, que no es otro que la integración. Como ha señalado Chomsky (y como en realidad no puede ser de otra manera), la facultad humana del lenguaje es el resultado de tres factores fundamentales: la dotación biológica, el influjo del entorno lingüístico y los principios generales de la naturaleza, incluyendo los principios de simplicidad y eficacia computacional (el llamado tercer factor en el que pone énfasis el programa minimalista chomskiano). El trabajo de Yang es indudablemente una aportación de primer orden en la ardua tarea de desentrañar cómo se relacionan entre sí estos tres factores a la hora de producir la facultad del lenguaje que atesora cada hablante, el objetivo esencial de la teoría lingüística.

Y ya que he mencionado el tercer factor, cabe señalar que, aunque Yang no lo menciona (que yo sepa), es aún más intrigante conocer (gracias a un amigo matemático, el profesor Manuel Vázquez, que me lo señaló) que la función N/LnN se emplea para calcular cuántos números primos contiene una cifra. Así, si volvemos a la tabla de antes, podemos predecir que 10 incluye 4 números primos (1, 2, 3 y 7) y que 20 incluye 7 números primos (1, 2, 3, 7, 11, 13 y 17), etc. No soy capaz de valorar la importancia de esta coincidencia (y ni si es realmente una coincidencia), pero sí de apreciar la belleza que hay detrás de la misma. Quién sabe si la distribución estadística entre regularidad e irregularidad que favorece la adquisición del lenguaje por parte de cerebros en plena maduración tendrá alguna relación con el misterio esencial de los números primos, pero sería bonito pensar que sí.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

A %d blogueros les gusta esto: