sábado, 27 de marzo de 2010

Recursividad y evidencia psicológica

Nunca antes el concepto de la recursividad había sido objeto de debate o de estudio como lo es ahora. La cantidad de investigaciones y artículos publicados es inabordable y el uso libre que se hace del término en la literatura sobre el tema es desconcertante.

Para el estudiante, es muy difícil entender un fenómeno que a veces es tenido como mero equivalente de la subordinación, otras como el encapsulamiento de un elemento cualquiera dentro de otro elemento del mismo tipo, otras como una propiedad de las reglas que generan las estructuras ling, y otras como el mecanismo computacional central de la infinitud discreta y único componente de la FLN.

En esta entrada me propongo primero aclarar un poco los conceptos más básicos sobre la recursividad y enfocar el fenómeno contrastando la definición clásica chomskiana (su creador) con una serie de datos empíricos provenientes de la psicolingüística y la lingüística de corpus. A partir de ahí espero suscitar (tal como me ha pasado a mí) una serie de dudas más que razonables sobre la centralidad de este mecanismo en la arquitectura del lenguaje.

Los orígenes

En Syntactic Structure (1957) y más tarde en Aspects of the Theory of Syntax (1965) Chomsky introduce la noción de recursividad para aplicarla a su modelo generativo. En particular, establece la gramática como un sistema de procesos recursivos capaz de generar, con arreglo a ese rasgo, un número infinito de oraciones a partir de un conjunto finito y determinado de reglas.

Si una lengua X posee las siguientes reglas:

R1 S→ A + B
R2 A→ C + D
R3 C→ c
R4 D→ d
R5 B→ b + (S)

Diremos que el elemento S es recursivo, ya que la cadena derivada de él puede en algún momento volver a contenerlo. Si S en R5 nos remite a R1, entonces este set finito de elementos puede, en virtud de la aplicación recursiva de las reglas, generar no sólo un número infinito de oraciones sino también producir, potencialmente, una oración que no se acabe nunca (cdb, cdbcdb, cdbcdbcdb, cdbcdbcdb, etc.).
Por tanto, para poseer este potencial generativo infinito una gramática debe tener un sistema recursivo de reglas como el de arriba.

Esta misma definición de recursividad, que recoge la noción de procedimiento generativo basado en la reescritura indefinida de reglas, la definen así

Yule (1985/2006):

“Las reglas de la gramática requieren también la propiedad crucial de la recursividad. Las reglas recursivas (`repetibles un número arbitrario de veces´) tienen la capacidad de ser aplicables más de una vez en la generación de una estructura. Por ejemplo, podemos tener un SP locativo (en la mesa) en la oración El arma estaba en la mesa… De este modo, para generar una oración como El arma estaba en la mesa cerca de la ventana en el dormitorio, debemos poder repetir la regla que crea el SP una y otra vez”.

Pullum y Scholz (2007):

“Aplicar repetidamente una regla para obtener una estructura que ofrece la oportunidad de que la regla pueda volver a aplicarse”.

Baker (200):

“However, the set of rules is recursive in the sense that a sentence contains a VP, and one of the things that a VP can contain is a clause (CP), which always contains a new S. This S in turn contains its own VP, which can contain yet another S. And so on. Thus, with only these rules one can already make an infinite number of grammatical English sentences”.

En estas definiciones se han mencionado, y es muy importante recalcarlo aquí, dos tipos de acepciones de recursividad:
Yule habla de recursive rules mientras que Baker dice the set of rules is recursive.
La diferencia es importante aunque a efectos del sistema el resultado es el mismo:

Una regla es recursiva si un símbolo X es reemplazado por un conjunto de símbolos entre los cuales vuelve a encontrarse X. Esto se conoce como recursividad directa.

N → Adj N

Pero la recursividad emerge también de la aplicación de un conjunto recursivo de reglas, ninguna de las cuales tiene por qué ser recursiva en sí misma. Cuando el set de reglas se usa para expandir un símbolo inicial, éste puede eventualmente volver a ser contenido en la derivación, lo que se conoce como recursividad indirecta o loop recursion.

S → NP VP
VP → V (NP) (CP)
CP → (C) S

Según Baker (ibid.) un único set recursivo de tres operaciones puede producir, si se lo aplica reiteradamente, infinitud discreta:

(1) S → NP VP
(2) VP → V (NP) (CP)
(3) CP → (C) S

Aplicándolas ilimitadamente podemos crear una frase infinita además de un conjunto infinito de frases:

“Mary likes Bill”
“John thinks that Mary likes Bill”
“Ann knows that John thinks that Mary likes Bill”
“Edgar takes for granted that Ann Knows that John thinks that Mary likes Bill”

Es importante notar que la recursividad puede definirse así, en sentido amplio, como una característica general del sistema computacional que genera las estructuras lingüísticas (“a recursive procedure”, en palabras de Chomsky). Como resultado de su aplicación la estructura resultante es el encapsulamiento (embedding) de un sintagma dentro de otro sintagma o de una oración dentro de otra oración.

El siguiente es un ejemplo de right branching o encapsulamiento a la derecha producto de la aplicación recursiva de las reglas u operaciones 2 y 3

(1) S → NP VP
(2) NP → (Det) N (PP)
(3) PP → Prep NP














Este otro es un ejemplo de left branching o encapsulamiento a la izquierda, donde se observa que la regla 2 es recursiva en sí misma (recursividad directa).

(1) NP → (Det) N
(2) N → AdjP N
(3) AdjP → Adj












Tipología

La recursividad nos permite obtener dos tipos de estructuras encapsuladas (embedding).
Nótese que encapsulamiento no equivale a subordinación, sino que puede darse también (y de hecho es más común) a nivel sintagmático.

1. tail recursion (encapsulamiento en los extremos)

a) left branching (encapsulamiento a la izquierda).

“Tom´s brother´s girlfriend´s car”
“New big red car”

b) right branching (encapsulamiento a la derecha).

“The book in the box on the table by the window”
“The man who stole the watch that was on the shelf that collapsed”

2. true recursion o center embedding (encapsulamiento en el centro)

“The rat that the cat killed ate the malt”

¿Recursividad o iteración?

Si bien hasta ahora nos hemos centrado en las diversas estructuras encapsuladas que son producto bien de la aplicación de reglas recursivas o del carácter recursivo de nuestro sistema computacional, no podemos obviar otro mecanismo sumamente productivo que genera estructuras paractácticas de distinos tipos: la iteración.

La coordinación: “Salió a la calle y abrió el paraguas”
La aposición: “Sergio, su hermano, bajo las escaleras”
La serialidad: “Vino, comió, durmió un poco y se fue”

Sin embargo, existen dos características básicas de la recursividad la distinguen de la iteración:

(1) Estructuralmente, el encapsulamiento produce una jerarquía donde el elemento encapsulado es dependiente del elemento que encapsula.

(2) Nocionalmente, la recursividad es un recurso básicamente modificador, donde el o los elementos encapsulados delimitan o especifican aspectos del referente.
Estas son las diferencias que distinguen crucialmente dos frases como:

“El gato persiguió al ratón por el jardín y se lo comió”

“El gato que persiguió al ratón por el jardín se lo comió”

Aunque no son muchos todavía, algunos autores no establecen una frontera nítida entre recursividad e iteración. Pullum y Scholz (ibid: 1), por ejemplo, hablan the “iterable linguistic structure such as recursive embedding or unbounded coordination”.
Otros, por su parte, defienden que cierta recursividad puede generarse o procesarse iterativamente, como veremos a continuación.
Por último, cabe señalar la crítica de Bickerton, presentada en Evolang08, de que Operation Merge (“taking two constructions and putting them together", Chomsky 2000:28) no es un mecanismo recursivo sino puramente iterativo.
No está claro, sin embargo en qué radica la distinción hacen estos autores entre una función recursiva y una iterativa ni tampoco si por iteración entienden repetición, serialidad, unión o cualquier otra cosa.

Peter A. Reich fue uno de los primeros en reaccionar ante el desafío de Chomsky de que jamás un autómata dotado de una gramática de estados finitos podría procesar lenguaje natural (caracterizado por el encapsulamiento central infinito).
En su trabajo The finiteness of natural language (1969) discute que modelar el lenguaje debería significar simular de forma adecuada una gramática de la actuación lingüística y no una gramática de potencialidades infinitas. Propone además un modelo tal que puede generar el encapsulamiento a los extremos de forma iterativa y un grado de encapsulamiento central parecido al humano (es decir, de grado 2).













Otros autores que han trabajado la hipótesis de que el encapsulamiento a los extremos es procesable de forma iterativa son Aho et al. 1986 y Chafe 1988.
Los primeros argumentan que una hilera de oraciones encapsuladas a la derecha, como

“This is to confirm that I would like to enquire whether it would be possible to employ a First Aider for a series of days as we will be using several examinations halls which will be too far away for us to provide first aid service to them”

son interpretadas en realidad como una serie concatenativa de estructuras, lo que no supone mayor complejidad que la comprensión de una secuencia de SN o de oraciones coordinadas.

En cuanto al encapsulamiento a la derecha de that-clauses, del tipo

“This is the farmer sowing the corn, that kept the cock, that crowed in the morn, that waked the priest all shaven and shorn…”

Chafe considera que los pronombres relativos son equivalentes y sustituibles por la conjunción “y” más un pronombre anafórico:

Who = and she/he
which = and it

de modo que la frase anterior es reinterpretable como

“This is the farmer, and he sowed the corn, and he kept the cock, and it crowed in the morn…”

¿Cómo comprendemos y producimos estructuras encapsuladas?

Está demostrado que existe una diferencia entre la productividad práctica (en términos de número de reaplicaciones) del encapsulamiento en el centro y a los extremos.
Esto se debe a que podemos procesar oraciones como (Karlsson 2007:386):

“This is the farmer sowing the corn, that kept the cock, that crowed in the morn, that waked the priest all shaven and shorn, that married the man all tattered and torn, that kissed the maiden all forlorn, that milked the cow with the crumpled horn, that tossed the dog, that worried the cat, that chased the rat, that ate the malt, that lay in the house that Jack built.”

Pero encontramos serias dificultades en la comprensión de (Lewis 1996:4)

“The cat the bird the mouse chased scared ran away.”

El choque entre los datos obtenidos sobre uso real o procesamiento on-line de ambos tipos de estructuras y el axioma sobre el potencial ilimitado de la recursividad, nace prácticamente de la mano de los primeros trabajos de Chomsky.

La hipótesis UCE

Desde sus comienzos, Chomsky ha sostenido que no hay restricciones gramaticales por lo que respecta al número y el nivel de complejidad de los encapsulamientos oracionales.

En 1956 hace explícita la llamada Hypothesis of Unbounded Center-Embedding Complexity (La hipótesis de la complejidad ilimitada del encapsulamiento en el centro), en la que se reafirma en sus convicciones.
Chomsky alega algo así como que aunque ciertas frases con múltiples encapsulamientos son complejas, improbables o poco comprensibles (lo que es debido a las limitaciones propias de la actuación de los individuos) no cabe duda alguna de que son perfectamente gramaticales y no ambiguas.
Esta distinción radical entre competencia y actuación, blinda prácticamente cualquier teoría lingüística al desestimarse radicalmente que cualquier dato extraído de experimentos sobre comprensión o producción pueda revocar o matizar partes del modelo propuesto. De ahí se explica también que los juicios sobre gramaticalidad que realizan los hablantes se conciban como juicios sobre aceptabilidad, lo que los convierte, automáticamente, en irrelevantes para la teoría.
Pese a ello, los intentos de elaborar una propuesta sobre la poca o nula adecuación psicológica de la Hipótesis UCE (que han puesto de manifiesto las limitaciones para procesar el encapsulamiento central) múltiple han sido muchos. Algunos de los más citados son:

Kimball 1973

Elaboró una hipótesis muy atractiva, por su simplicidad. Según su Principio de las dos oraciones el procesador humano analiza de forma top-down y no puede procesar más de dos nodos oracionales al mismo tiempo. La limitación de la capacidad de nuestro procesador reside en que no puede retener en la memoria operativa más de dos oraciones incompletas a la vez, lo que imposibilita el análisis de frases como

“The patient who the nurse who the clinic had hired admitted met Jack”

Cuando llegamos al tercer NP hemos almacenado ya tres oraciones parcialmente procesadas, lo que satura o crea una sobrecarga en nuestra memoria de trabajo.













Por el contrario, si armamos la misma frase con los encapsulamientos a la derecha, este problema desaparece ya que no habría más que una sola oración parcialmente procesada, la principal:

“Jack met the patient who was admitted by the nurse who the clinic was hired”

Bever 1970

Elaboró la que se conoce como Teoría de la doble función. Según ésta, la dificultad en la interpretación de múltiples oraciones subordinadas de relativo reside, precisamente, en la doble función del sujeto del SN en la oración principal, que es, a la vez, el objeto de la oración subordinada. Así, en

“The cat [that the bird [that the mouse chased] scared] ran away”

Tanto “the cat” como “the bird” tienen asignadas una función sintáctica en su oración, pero desempeñan una función nocional distinta (OD) en las oraciones subordinadas siguientes:

“The mouse chased the bird”
“The bird scared the cat”
“The cat run away”

Esto diferenciaría a estas oraciones de las subordinadas sustantivas, donde el sujeto de la principal sigue siendo el sujeto de la subordinada:

“The dog that chased the cat ran away”

Por lo que respecta al encapsulamiento central múltiple con oraciones de relativo donde las partículas subordinantes no se expresan (una posibilidad que se da en inglés pero no en castellano o catalán), por ejemplo

“The pen the author the editor likes used was new”

Bever predijo que la dificultad reside en que los hablantes interpretamos los sujetos de cada oración como un solo SN formado por tres nombres conjuntados, lo que produce el efecto de camino de jardín (garden path effect).

? "After Mary drank the water evaporated "

Se produce una ambigüedad local al asignar a “the water” el papel de OD del verbo “drank” cuando en realidad es el S del verbo “evaporated”.

Según Lewis (ibid) este efecto parece desempeñar un papel clave en la dificultad para procesar correctamente las estructuras con múltiple encapsulamiento en el centro, lo que tiene mucho que ver con la limitación de la memoria operativa de que hemos hablado.

Lewis resume, finalmente, una serie de hechos psicológicos demostrados a través de numerosos experimentos de comprensión y producción:

-El máximo procesable de encapsulamientos en el centro es dos. Los resultados han sido siempre los mismos en inglés, francés, hebreo, alemán, japonés, chino mandarín y español.

-Los encapsulamientos múltiples en el centro generan dificultad independientemente de la longitud de la frase.

-La dificultad en el procesamiento de estas estructuras es independiente de la memoria operativa léxica: se ha demostrado que los sujetos pueden recordar las palabras en una frase con múltiple encapsulamiento en el centro pero no ser capaces de comprender la frase.

-La comprensión de estas estructuras mejora ligeramente con la instrucción.

-El desempeño en tareas de comprensión mejora si el material semántico contenido muestra unas constricciones específicas, en contraposición con frases semánticamente neutras. Así

“The bees that the hives that the farmer built housed stung the children”

se comprende mejor que

“The chef that the waiter that the busboy appreciated teased admired good musicians”

Por último, cabe mencionar el trabajo de Gibson y Thomas (1999), en que los autores analizan la percepción de gramaticalidad y agramaticalidad por parte de los hablantes de estructuras con múltiple encapsulamiento en el centro:
Concretamente, reclutaron a 40 estudiantes del MIT a quienes les pasaron un test de lectura con doce oraciones doblemente encapsuladas, del tipo:

“The ancient manuscript that the graduate student who the new card catalog had confused a great deal was sutying in the library was missing a page.”

A algunas de las frases se les había extraído uno de los VP, de modo que automáticamente se convertían en agramaticales. El objetivo era comprobar (a) si los sujetos percibían esa agramaticalidad y (b) cómo se comporta nuestro procesador cuando se le pone al límite de sus capacidades (1999:226):

“Does the processor simply stop processing as soon as its resource capacity is exceeded?”

Los resultados fueron sorprendentes ya que las oraciones sin un VP no sólo fueron percibidas como gramaticales sino que se valoraron como “más fáciles de comprender” que las completas. A partir de estos hallazgos, los autores han propuesto la hipótesis del olvido estructural: cuando el procesador llega a un punto de máxima sobrecarga tiende a ”deshacerse” de algo de peso contenido al inicio (donde se encuentran los NPs) para continuar analizando.

Centrándonos ahora en la Ling de corpus, vale la pena revisar los resultados que arroja una de las investigaciones más recientes, Karlsson 2007, centrada en el encapsulamiento central múltiple, con el propósito de comprobar la adecuación pragmática de la hipótesis UCE.

En este trabajo de corpus se analizan 119 estructuras de ese tipo en siete lenguas europeas de tipo SVO (inglés, finés, francés, alemán, latín, sueco y danés) y se descubren los límites cuantitativos y constricciones en su uso:

-El número máximo de encapsulamientos en el centro, en la modalidad escrita, es de tres.

-En la modalidad oral, el encapsulamiento central múltiple es prácticamente inexistente.

-Sólo oraciones posmodificadoras sustantivas o de relativo (that-clauses) permiten el autoencapsulamiento en el centro.

-La doble relativización de objetos que se da en el típico ejemplo “The rat the cat the dog chased killed ate the malt” no existe en los corpora consultados.

El autor concluye que: “[t]hese corpus-based `soft constraints´suggest that full-blown recursion creating multiple clausal center-embedding [el tipo de recursividad que según Chomsky y Miller define nuestra gramática y distingue de cualquier GEF] is not a central design feature of language in use”.

Discusión

Lo que se desprende de la investigación psicolingüística y de corpus que se ha presentado es que, desde el punto de vista de la actuación, el encapsulamiento múltiple (producto del potencial recursivo ilimitado de nuestra gramática, generador de la infinitud discreta) constituye un fenómeno periférico del lenguaje y ciertos tipos, como el autoencapsulamiento múltiple en el centro (la doble relativización), son sencillamente inexistentes.
Pese a que no hemos de reducir recursividad a subordinación oracional (ya se ha comentado que es mucho más productiva a nivel sintagmático), resulta inexplicable que el único contenido de la FLN sea un mecanismo tan complejo y restrictivo, si se lo compara con otras propiedades del sistema mucho más básicas, como por ejemplo la estructura jerárquica de constituyentes.

El principal problema que ha surgido en esta presentación es la llamada Paradoja de Chomsky (Christiansen 1999): mientras que los juicios de gramaticalidad de los hablantes, basados en la evidencia empírica, son irrelevantes para la teoría, ésta misma se construye con las intuiciones lingüísticas de sus autores y se basa en ejemplos creados por ellos mismos.
La gramaticalidad, así, sólo es definible en términos del mismo sistema gramatical, lo que hace que éste sea infalsable.
Este derivado indeseable de la dicotomía competencia-actuación: la irrelevancia de los datos, de las pruebas empíricas, lo ha defendido Chomsky en innumerables ocasiones (1981: 283, citado en ibid.):

“Una falacia muy común es asumir que si algún resultado experimental supone una evidencia contra una teoría del procesamiento que incluye una teoría gramatical T y un mecanismo de procesamiento P… es T lo que está en jaque y debe ser cambiado."

Afortunadamente, ésta no es una asunción generalizada en la comunidad lingüística. Varias teorías, entre ellas destacadamente la Gramática Funcional (FG) y la Gramática del Papel y la Referencia (RRG) parten de una serie de principios de adecuación del modelo que deben ser cumplidos (http://www.functionalgrammar.com/):

ADECUACIÓN PRAGMÁTICA: Lo que establece la teoría sobre el lenguaje debe ayudarnos a entender cómo las estructuras lingüísticas son realmente usadas en la interacción comunicativa.

ADECUACIÓN PSICOLÓGICA: lo que la teoría dice sobre el lenguaje debe ser compatible con lo que se sabe acerca de los mecanismos psicológicos involucrados en el procesamiento del lenguaje natural.

Asimismo, Van Valin Jr. (2000:48) señala:

“Respecto a los aspectos cognitivos, RRG… acepta un criterio similar al expuesto en Bresnan y Kaplan (1982) de que los modelos lingüísticos deben estar de acuerdo o ser coherentes con teorías probadas sobre la comprensión y la producción.”

Bibliografía

Baker, M.C. (2001): “Syntax”, en Aronoff, M. y J. Rees-Miller:The Handbook of Linguistics, Oxford: Blackwell.
Bickerton, D. (2008): “Recursion is just an artifact”, delivered at the 7th International Conference on the Evolution of Language, unpublished manuscript.
Chomsky, N. (1957/1969): Syntactic Structures, The Hague/Paris: Mouton.
---------------(1965): Aspects of the Theory of Syntax, Cambridge, MA: The MIT Press.
Christiansen, M.H. (1992): “The (non)necessity of recursion in natural language processing”, in Proceedings of the 14th Annual Conference of the Cognitive Science Society, Indiana: Cognitive Science Society, 664-70.
---------------(2002): “Constituency and recursion in language”, in M. A. Arbib (ed.): The Handbook of Brain Theory and Neural Networks, Cambridge, MA: The MIT Press.
Christiansen, M.H. y N. Chater (1999): “Toward a connectionist model of recursion in human linguistic performance”, Cognitive Science 23, 157-205.
Gibson, E. y J. Thomas (1999): “Memory limitations and structural forgetting: The perception of complex ungrammatical sentences as grammatical”, Language and Cognitive Processes, 14 (3), 225-48.
Heine, B. y T. Kuteva (2007): The Genesis of Grammar, Oxford: OUP.
Karlsson, F. (2007): “Constraints on multiple center-embedding of clauses”, Journal of Linguistics, 43, 365-92.
Lewis, R.L. (1996): “A theory of grammatical but unacceptable embeddings”, unpublished paper.
Lewis, R.L. (1996)b: “Interference in short-term memory: The magical number two (or three) in sentence processing”, Journal of Pschycolinguistics Research 25 (1), 93-115.
Pullum, G.K. y B.C. Scholz (2007): “Recursion and the infinitude claim”, (unpublished paper, meant for the conference on Recursion in Human Languages 2007).
Reich, P.A. (1969): “The finiteness of natural language”, Language 45 (4), 831-43.
Yule, G. (1985): The Study of Language, Cambridge, CUP.

No hay comentarios: