Capítulo I
LOS RETOS DE LA CLASIFICACIÓN
1. Principios de geolingüística
La geolingüística es la disciplina científica que estudia las lenguas del mundo desde
el punto de vista de su situación en el espacio; es decir, de su adscripción territorial.
Por ejemplo, mucha gente cree que la lengua de Francia es el francés y la de Italia
es el italiano. Pero, comparativamente, son pocos quienes saben que en Francia hay
territorios en los que se habla catalán, vasco, bretón o alsaciano, y menos aún quienes
tienen conocimiento de que en Italia hay hablantes de lenguas como por ejemplo el
sardo, el catalán, el friulano, el alemán, el griego y otros.
Una de las fuentes de información fundamentales de la geolingüística son los censos
de población, que, promovidos por la Administración, incluyen a menudo preguntas sobre
las condiciones lingüísticas de los ciudadanos, referidas sobre todo a la primera
lengua. Por ejemplo, un censo hecho en Australia en 1986 dio como resultado el panorama
lingüístico siguiente:
Lengua
|
Número de hablantes
|
Inglés
|
14.000.000 (aprox.)
|
Italiano
|
415.765
|
Griego
|
277.472
|
Chino
|
139.100
|
Árabe
|
119.187
|
Alemán
|
111.276
|
Castellano
|
73.961
|
Polaco
|
68.638
|
Catalán
|
64
|
Lenguas aborígenes
|
40.790
|
Fuente: Censo lingüístico
|
1.1. Cuántas lenguas hay en el mundo
Hay dificultades para establecer con precisión cuántas lenguas hay en el mundo. Según
los autores, las cifras no suelen bajar de las cuatro mil quinientas y rara vez suben
más allá de las seis mil. Este margen tan grande es explicable por diferentes causas.
En primer lugar, hay territorios todavía poco estudiados e incluso difíciles de censar.
Además, aún no hay una autoridad cultural internacional que esté dispuesta de verdad
a poner los medios necesarios para confeccionar el catálogo total de lenguas. Finalmente,
existe una dificultad intrínseca: no siempre es fácil decidir si una forma de habla
es una lengua (diferente de las otras) o tan solo la variedad dialectal de una lengua
común, porque a menudo el límite entre lengua y dialecto es impreciso. Un dialecto
se puede definir como una lengua derivada de otra lengua (en la lingüística historicocomparativa)
y como una variedad geográfica dentro de una lengua.
Si tomamos como base una cifra entre media y baja, por ejemplo cinco mil lenguas,
podremos hacer unas operaciones teóricas muy curiosas sobre la distribución de hablantes
y de lenguas. Si dividimos la población del mundo (que se calcula en unos seis mil
millones de personas) por el número de lenguas, se obtiene una media absoluta de un
millón doscientos mil hablantes por lengua. Es evidente que esta media no se corresponde
con los datos que puede aportar la geolingüística: hay unas pocas lenguas habladas
por centenares de millones de personas y, por otro lado, hay muchas lenguas que tienen
unos centenares, o incluso pocas docenas, de hablantes.
Por ejemplo, según los datos de Voegelin (que trabajó con un total de poco más de
cuatro mil quinientas lenguas), la distribución de las lenguas sería la siguiente:
Lenguas
|
Número de hablantes
|
138
|
Más de un millón
|
258
|
Entre 100.000 y 1 millón
|
597
|
Entre 10.000 y 100.000
|
708
|
Entre 1.000 y 10.000
|
409
|
Entre 100 y 1.000
|
143
|
Han muerto hace poco
|
2.269
|
Sin datos
|
4.522
|
Total de lenguas estudiadas
|
Distribución de las lenguas por el número de hablantes
|
Un estudio como este revela que en el mundo la norma son las lenguas habladas por
grupos humanos más bien pequeños. Y que las lenguas con un número de hablantes que
supere los cien millones son muy pocas (entre diez y doce, sobre un total de cinco
mil). Según Juan Carlos Moreno, un lingüista eminente, las lenguas más habladas del
mundo son las siguientes:
|
|
|
|
Lengua
|
Hablantes (en millones)
|
1
|
Chino (mandarín)
|
778
|
2
|
Inglés
|
440
|
3
|
Hindi
|
294
|
4
|
Español
|
254
|
5
|
Bengalí
|
165
|
6
|
Árabe
|
152
|
7
|
Ruso
|
142
|
8
|
Portugués
|
138
|
9
|
Indonesio
|
125
|
10
|
Japonés
|
120
|
11
|
Alemán
|
106
|
Lenguas más habladas
|
Por otro lado, si dividimos el número de lenguas por el número aproximado de estados
que hay en el mundo, que es de doscientos –en vez de hacerlo por el número de ciudadanos–,
esta operación nos dará una media de 25 lenguas por estado, también en términos absolutos.
La realidad, en cambio, es muy diferente: hay estados, como la India, con más de quinientas
lenguas. También es normal encontrar más de cien lenguas en muchos estados de África
y de Oceanía. En el extremo opuesto, son casi excepcionales los estados en los que
se habla una sola lengua en todo el territorio: por ejemplo, Islandia.
1.2. Una recesión acelerada
La geolingüística constata datos como estos sin introducir juicios de valor: es esta
la realidad lingüística del mundo. En todo caso, cabe decir que el panorama de las
cinco mil lenguas confrontado con la existencia de doscientos estados, muchos de los
cuales tienden a priorizar una sola lengua a efectos oficiales, deja en situación
difícil a las lenguas y a los hablantes que no coinciden con la que es oficial.
A pesar de que muchas lenguas propias de estados plurilingües están en situación de
inferioridad respecto a la lengua o lenguas oficiales, algunas tienen un gran número
de hablantes. Aproximadamente, si se pretendiera dejar una sola lengua para cada estado,
¡esto implicaría eliminar de golpe cuatro mil ochocientas!
De hecho, la situación lingüística del mundo está viviendo un periodo de recesión
acelerada, y hay especialistas que han llamado la atención sobre la extinción rápida
de muchas lenguas. Se calcula que en el siglo XXI se producirá la desaparición de casi la mitad de las lenguas existentes (si no hay
una inversión de la tendencia). Esto es lo que se puede deducir de cifras (que siempre
son aproximativas y muy variables según la fuente) como las siguientes:
Lengua
|
Número de hablantes
|
Nitinat
|
50
|
Chinook
|
30
|
Twana
|
10
|
Eyak
|
3
|
Un cuadro como este (que podría ampliarse mucho) nos presenta algunos ejemplos de
lenguas condenadas a la desaparición (en este caso se trata de lenguas habladas en
la costa noroeste de Norteamérica). En parte, por el escaso número de hablantes; pero
sobre todo porque las personas que todavía conservan estas lenguas son ya muy mayores
y con su muerte se producirá también, inevitablemente, la muerte de la lengua.
2. Las relaciones de parentesco
Se sabe con toda seguridad que lenguas como el catalán, el portugués, el castellano,
el italiano, el rumano y algunas más tienen su origen en la lengua latina como consecuencia
del proceso expansivo y colonizador de la antigua Roma. La vinculación entre estas
lenguas y la latina se suele presentar gráficamente con un diagrama de tipo genealógico:
Detrás de este diagrama está la metáfora de la familia: la lengua latina es la «madre»
y las otras son las «hijas» («hermanas» entre ellas). Esta dependencia genealógica
se justifica, por un lado, por un conjunto de evidencias históricas (presencia de
arte romano, instituciones legales romanas, narraciones de historiadores); pero sobre
todo está avalada por la existencia de un gran corpus de textos latinos y también
por pruebas internas basadas en las similitudes estructurales y de vocabulario entre
estas lenguas «hermanas», hecho que reclama un origen común.
Sucede lo mismo, por ejemplo, con las lenguas germánicas, a pesar de que estas no
disponen de textos escritos en una lengua antigua común. Pero la comparación de las
estructuras y del vocabulario de lenguas como el inglés, el holandés, el noruego y
otras permite establecer un árbol genealógico semejante al anterior (excepto por la
interposición de dos áreas diferenciadas):
En este caso, no hay testimonios ni del antiguo germánico, ni de las etapas intermedias
(una lengua muerta como el gótico, de la rama germánica oriental, que ya no tiene
representantes actuales, se alinearía con las lenguas de las ramas inferiores), pero
la comparación estructural que antes se ha mencionado lleva de manera segura, en casos
como este, a la confección de un diagrama como el propuesto.
Estos dos ejemplos (con lenguas románicas y germánicas) nos permiten introducir algunos
elementos esenciales de la clasificación genética de las lenguas del mundo. Estas
no constituyen una lista desordenada; más bien al contrario, se pueden reunir en familias,
grupos y subgrupos sobre la base bastante segura de parecidos y diferencias. Estos
serían algunos ejemplos de estas similitudes y diferencias (entre algunas lenguas
románicas y una lengua de filogenia desconocida):
Catalán
|
Italiano
|
Castellano
|
Francés
|
Vasco
|
braç
peu
pare
mare
quatre
|
braccio
piede
padre
madre
quattro
|
brazo
pie
padre
madre
cuatro
|
bras
pied
père
mère
quatre
|
beso
urriki
aita
ama
aurgarren
|
Una comparación como esta evidencia que las cuatro primeras lenguas mantienen parecidos
claros en cuanto al vocabulario y, por lo tanto, pueden ser agrupadas bajo un mismo
nudo en un árbol genealógico.
En cambio, el vasco pertenece a una familia diferente, sin que de momento se haya
podido encontrar con seguridad un conjunto de lenguas hermanas. Además, en el cuadro
se puede comprobar que los parecidos entre las lenguas románicas se establecen sobre
la base de palabras referidas a las partes del cuerpo (brazo, pie), a los nombres
de parentesco (padre, madre) y a los numerales (cuatro). Estos tipos de palabras son
muy estables y, dado que cambian muy poco en el decurso del tiempo, permiten establecer
las relaciones de familia con gran seguridad.
Desde el punto de vista de la clasificación genética, las comparaciones sobre la base
de palabras estables, como por ejemplo las utilizadas en el cuadro anterior, facilitan
la agrupación de las lenguas del mundo en familias. Es decir, hacen posible el establecimiento
de una ordenación de las lenguas según el parentesco.
Las lenguas románicas constituirían un grupo subordinado al latín –grupo que, interiormente,
se divide en lenguas románicas occidentales (el catalán, por ejemplo) y lenguas románicas
orientales (el rumano). Estas lenguas, junto con el griego y otras, se encontrarían
en el nudo italogriego, que conectaría con el indoeuropeo siguiendo un esquema teórico
de ramificación como el siguiente:
Este tipo de esquema nos permite explicar metafóricamente las relaciones de parentesco:
el francés, el italiano y el rumano, por ejemplo, son entre sí lenguas «hermanas»;
las tres son «hijas» del latín, que, a su vez, está «hermanado» con el griego y el
protocelta (aunque en la práctica nunca se habla de lenguas «nietas», «tías» o «abuelas»).
Finalmente, el nudo superior representaría la lengua o lenguas indoeuropeas. Este
nudo, además, se podría relacionar con otras familias de lenguas y así se llegaría,
hipotéticamente y si las pruebas lo confirmaran, a constituir el árbol único de todas
las lenguas del mundo, clasificadas desde el punto de vista genético.
La división en especies
Según Darwin, «la formación de las diferentes lenguas y de las diversas especies,
y las pruebas de que las dos realidades se han desarrollado siguiendo un proceso gradual,
son curiosamente paralelas». La clasificación y el grado de parentesco de los diferentes
seres vivos y grupos de seres vivos se establecen en función de su proximidad genética
(mayor o menor), de una manera análoga a la descrita para las lenguas en el cuadro
anterior.
Los árboles genealógicos pueden llegar a ser mucho más complejos. Por ejemplo, una
de las familias más estudiadas es la austronésica. El árbol genealógico de esta familia,
según Carme Junyent, especialista en el estudio de las lenguas del mundo, sería el
siguiente:
Así, esta clasificación nos dice, por ejemplo, que la lengua tagalo pertenece al grupo
occidental de la rama malayopolinesia de la familia austronésica, con lo que queda
definida la lengua en el marco de las relaciones genéticas. La familia austronésica
incluye lenguas habladas en un ámbito geográfico muy extenso; en palabras de Carme
Junyent, lenguas que se extienden «por prácticamente todas las islas que hay desde
Madagascar hasta la isla de Pascua y Hawai, y de Taiwán a Nueva Zelanda». Sin embargo,
algunos autores no la consideran una familia, sino una de las dos ramas principales
de la familia austro-tai, junto con la daica.
Según Merritt Ruhlen, estudioso de los orígenes de las lenguas, actualmente las lenguas
del mundo están reunidas en diecinueve familias (agrupadas en diecisiete fílums),
algunas de las cuales se presentan de forma muy simplificada en la siguiente tabla
y solo con unos pocos ejemplos de las lenguas que las configuran:
|
|
|
Familia
|
Lengua
|
Localización
|
Indoeuropea (2.000.000 de hablantes)
|
Griego
|
Grecia
|
Persa
|
Irán
|
Hindi, gujarati
|
India
|
Francés, catalán, italiano, castellano, rumano
|
Territorios respectivos
|
Irlandés
|
Irlanda
|
Galés
|
Gales
|
Gaélico
|
Escocia
|
Ruso
|
Rusia
|
Polaco
|
Polonia
|
Esquimoaleuta (85.000 hablantes)
|
Esquimal, aleuta
|
Alaska, norte de Canadá
|
Altaica (250.000.000 de hablantes)
|
Turco
|
Turquía
|
Coreano
|
Corea
|
Japonés
|
Japón
|
Ainu
|
Japón
|
Sinotibetana (1.000.000 de hablantes)
|
Mandarín
|
China
|
Cantonés
|
China
|
Tibetano
|
Tíbet
|
Afroasiática (175.000.000 de hablantes)
|
Tamazight (bereber)
|
Norte de África
|
Árabe
|
Norte de África
|
Hausa
|
Nigeria, Níger, Chad...
|
Somalí
|
Somalia, Etiopía...
|
Nigerokurdufaniana (180.000.000 de hablantes)
|
Mandingo
|
Guinea, Gambia
|
Suahelí
|
Tanzania
|
Chona
|
Zimbabwe
|
Ibo
|
Nigeria
|
Amerindia (18.000.000 de hablantes)
|
Yurok
|
Norte de California
|
Cheyenne, dakota
|
Centro de Estados Unidos
|
Cuaquiú
|
Suroeste de Canadá
|
Cheroquí
|
Este de Estados Unidos
|
Nahua
|
México
|
Quechua, aimara
|
Suroeste de América del Sur
|
Na-dene (200.000 hablantes)
|
Navajo, apache
|
Alaska, oeste de Canadá, Oregón, California...
|
Algunas familias lingüísticas
|
Esta síntesis, de solo ocho de las diecinueve familias de lenguas, permite que nos
hagamos una idea aproximada del panorama lingüístico del mundo. Hay cinco lenguas
que todavía no se han podido adscribir a ninguna de las diecinueve familias: vasco,
buruchasky, ket, guiliak y nahali. Son, pues, lenguas «aisladas».
2.1. La familia indoeuropea
La familia lingüística indoeuropea, denominada a veces «indohitita» (y ya nunca más
«indoaria»), es, quizá, el grupo mejor estudiado entre las lenguas del mundo. Y esto
se debe principalmente a tres factores: en primer lugar, se trata de un grupo no excesivamente
numeroso (unas cincuenta lenguas); además, el nivel de semejanzas es notablemente
alto y en muchos casos se puede comprobar con textos antiguos, y finalmente esta familia
ha llamado la atención de los lingüistas desde hace doscientos años, lo que ha permitido
una acumulación impresionante de estudios.
A modo de ejemplo, son miembros de la familia indoeuropea lenguas como: el sánscrito
(la antigua lengua sagrada y literaria de la India), y las actuales hindi, gujarati,
bengalí; el persa, lengua de la antigua Persia y del actual Irán; el griego clásico,
cuya versión hablada ha llegado hasta nuestros días como griego moderno; el latín,
que todavía pervive en las actuales lenguas románicas; el grupo céltico, representado
en nuestros días por lenguas como el bretón, el galés y el irlandés; el grupo germánico,
cuyo antecedente no dejó testigos escritos, que contiene lenguas como el inglés, el
alemán, el holandés o el sueco, y el grupo baltoeslavo: lituano, ruso, polaco o búlgaro.
A primera vista parece un campo muy extenso, e incluso más de uno se sorprendería
si le dijeran que la actual lengua bengalí (en la India) y la lengua sueca (en la
península de Escandinavia) son miembros del mismo árbol genealógico. Pero la comparación
de estas y otras lenguas no deja lugar a ninguna duda.
De hecho, toda la historia de las investigaciones indoeuropeas se inició con un acto
de sorpresa basado en la comparación: el juez británico Sir William Jones, un experto
orientalista residente en la India, escribió en 1788 las palabras (consideradas con
auténtica veneración hoy) siguientes: «La lengua sánscrita, sea cual sea su antigüedad,
tiene una estructura admirable. Es más perfecta que el griego, más rica que el latín
y más exquisita que las dos. Y tiene un parecido tan grande con estas, tanto respecto
a las raíces verbales como a las formas gramaticales, que esto no se puede haber originado
accidentalmente. Hasta tal punto es fuerte el parecido que ningún filólogo podría
investigar estas tres lenguas sin pensar que proceden de una fuente común que, quizá,
ya no existe. Por la misma razón, pero no tan concluyente, el gótico y el céltico,
mezclados con alguna lengua muy diferente, podrían tener el mismo origen. Y también
el antiguo persa podría ser asociado con la misma familia».
La sorpresa y el tono admirativo del juez Jones tenían como base las comparaciones
entre palabras como, por ejemplo, los nombres de parentesco: «padre» es pater en latín y pitár en sánscrito; «hijo» es son en inglés, sunus en gótico, syn en ruso y sunu en sánscrito; «hija» es daughter en inglés, dukté en lituano y duhitar en sánscrito. También en los nombres de los números: «dos» es dúo en latín, dyo en griego y duvá en sánscrito; «siete» es séptem en latín, hepta en griego y saptá en sánscrito; «diez» es décem en latín, déka en griego y dáça en sánscrito. O en el nombre de objetos cotidianos: «barco» es naus en latín, naus en griego y nau en sánscrito; «yugo» es iugum en latín, zygon en griego, juk en gótico, jungas en lituano y yugam en sánscrito.
Estos parecidos (y muchísimos más) dejaban muy clara la pertenencia de una serie de
lenguas a la misma familia indoeuropea. El conjunto de estas lenguas se suele clasificar
en diez grupos, que presentamos de manera simplificada en el cuadro siguiente:
El calificativo indoeuropea se explica porque las lenguas que incluye esta familia alcanzan un territorio que
abarca desde la India hasta las orillas occidentales de Europa. Cada uno de estos
grupos se concreta en una o más lenguas: la antigua lengua hitita es la única representante
conocida del grupo anatólico, como también lo son, por ejemplo, el griego para el
grupo griego y el albanés para el grupo albanés. Otros grupos contienen algunas lenguas
más, como por ejemplo el céltico, que tiene cuatro: escocés, irlandés, galés y bretón.
Los grupos más numerosos del árbol indoeuropeo son el germánico, el indoiraní, el
baltoeslavo y el itálico.
En cuanto al grupo itálico, la lista de lenguas que se situarían bajo la rama correspondiente,
en una disposición aproximada desde las tierras más occidentales a las más orientales,
es esta: galaicoportugués, asturiano, castellano, aragonés, catalán, francés, occitano,
francoprovenzal, sardo, italiano, friulano, dálmata (extinguida) y rumano.
El origen geográfico, la cultura temprana y los movimientos de expansión de los indoeuropeos
son, desde hace tiempo, materia de estudio y de debate. En cuanto a la localización
inicial de este pueblo, la hipótesis más verosímil lo sitúa, hace unos seis o siete
mil años, en las estepas rusas, en el entorno del curso inferior del río Volga, entre
el mar Negro y el mar Caspio (a pesar de que también hay quien lo sitúa en la península
de Anatolia, la actual Turquía). Algunos arqueólogos y lingüistas sitúan los orígenes
de los pueblos indoeuropeos en una zona que se localiza al norte del mar Negro y del
mar Caspio. Otros, en cambio, creen que la protopatria de estos pueblos fue Asia occidental,
donde ya habrían compartido una lengua común hace entre 7.000 y 6.000 años. Lo que
sí que es cierto es que en el tercer milenio antes de Cristo ya había pueblos indoeuropeos
establecidos en las estepas de la Europa oriental:
En cuanto a la cultura original del pueblo indoeuropeo, no tenemos noticias directas
de ella porque no nos ha llegado ni una sola línea escrita que nos hable de esta (como
no sucede con los griegos y los latinos, más tarde). Es más, los indoeuropeos eran
analfabetos por necesidad, ya que la escritura se inició en Mesopotamia hacia el 3300
a. de C.; es decir, dos mil años después de la época de surgimiento de los pueblos
indoeuropeos.
Así, todas las informaciones sobre su cultura se tienen que obtener a partir de los
hallazgos arqueológicos y, muy especialmente, del estudio de las instituciones de
los pueblos indoeuropeos (griegos, latinos, germánicos) y de la comparación de su
vocabulario: por ejemplo, antes hemos visto que en algunas lenguas del grupo hay una
palabra común para «yugo», esto significa que una de las actividades de supervivencia
era la agricultura. También consta una palabra común para «moler», lo que nos pone
sobre la pista del tipo de cultivo. En este sentido, las investigaciones lingüísticas
sobre el vocabulario comparado son muy apreciadas por los arqueólogos y los prehistoriadores.
Con las pruebas arqueológicas y lingüísticas se ha llegado, pues, a dibujar una pintura
cultural que, en síntesis, nos dice lo siguiente: eran agricultores y ganaderos; probablemente
hacían casas mezclando barro con paja; conocían las técnicas del cobre y el bronce,
y usaban la rueda. También fabricaban «cerámica cordada»; es decir, cerámica decorada
con marcas de cuerdas. Además, sabían navegar y tenían algunas armas (arcos y flechas,
espadas y hachas). Su organización social era la familia, el clan y la tribu, en progresión
creciente; la figura del rey era más bien la de un árbitro que hacía de mediador en
caso de conflicto.
En cuanto a la religión, tenían un dios superior (o deus pater) y una serie de dioses sectoriales: el de los sacerdotes, el de los guerreros y el
dios protector del trabajo agrícola, como divinidades más destacadas. Muy probablemente,
el tipo de religión era dualista, basada en las fuerzas del orden y del caos. También
practicaban el sacrificio de animales.
En cuanto a la expansión de los indoeuropeos, queda claro que, ya en tiempos antiguos,
llegaron por un lado hasta la India, y por otro hasta las orillas occidentales de
Europa. Esto se demuestra, especialmente, por los hallazgos de un tipo especial de
entierros denominados kurganos, o tumbas con túmulo, originarios del emplazamiento primitivo. No consta, por otro
lado, que actuasen como conquistadores de territorios extensos. Más bien se cree que
iban ocupando tierras de cultivo y que las dejaban una vez agotadas para trasladarse
a otras.
Los kurganos se asocian con varios movimientos migratorios atribuidos a los pueblos
indoeuropeos, entre los cuales el primero (4400-4200 aC) los llevó hasta la región
del Danubio y los Balcanes; con el segundo (3500-3000 aC) llegaron hasta Transcaucasia,
Irán, parte de Anatolia y Europa central, y el tercero (3000-2800 aC) los dirigió
hacia el Egeo y el Adriático.
Finalmente, las fantasías sobre la «raza indoeuropea» (o «aria») han quedado hoy totalmente
desprestigiadas por la ciencia. Por un lado, esa supuesta «raza» estaba constituida
por un conjunto de pueblos genéticamente mezclados y, por otro, su cultura de supervivencia
los presenta como un grupo de lo más normal, comparable a otros pueblos en circunstancias
parecidas con economía agrícola y ganadera:
3. Parecidos estructurales
La clasificación genética, que toma en consideración los parecidos entre las lenguas
(justificados por el origen común), no es la única manera de relacionar las lenguas
del mundo. También existe la posibilidad de agrupar las lenguas mediante similitudes
estructurales, al margen de que estén emparentadas o no. En este caso, hablamos de
clasificación tipológica, tomando como patrón clasificatorio el hecho de que encontramos
semejanzas como, por ejemplo, una estructura verbal más o menos igual, un mismo sistema
vocálico, una disposición de los elementos oracionales idéntica y, sobre todo, una
misma (o muy parecida) estructuración de la palabra.
Los estudios de tipología lingüística ofrecen un panorama extraordinariamente variado
sobre las lenguas del mundo, pero, al mismo tiempo, permiten marcar los límites de
las lenguas posibles y, así, ayudan a establecer las condiciones que restringen los
productos de nuestra facultad verbal. Dicho de otro modo, parece que podemos hablar
de cualquier tema, con todo tipo de variantes sintácticas y estilísticas; pero no
lo podemos hacer de cualquier manera, o usando estructuras no previstas en las lenguas
del mundo.
Por ejemplo, ninguna lengua presenta estructuras silábicas en las que las consonantes
(C) y las vocales (V) aparezcan como en esta secuencia: CCCCVCCC (lmtbasdp). Tampoco encontramos lenguas que solo tengan consonantes sordas del tipo p, t, k (y sin sonoras, como b, d, g).
Subordinadas imposibles
No encontramos tampoco lenguas en las que se puedan acumular las subordinaciones de
oraciones de la manera siguiente:
(1) El chico ha salido.
(2) El hombre conoce al chico.
(1 + 2) El chico que el hombre conoce ha salido.
(3) El mecánico saludó al chico.
(4) El mecánico nos arregla el coche.
(3 + 4) El mecánico que nos arregla el coche saludó al chico.
Hasta aquí todo es posible y correcto. No obstante, observemos cuál es el resultado
de hacer ahora todas las subordinaciones:
(1 + 2 + 3 + 4) El chico que el hombre que el mecánico que nos arregla el coche saludó
conoce ha salido.
En resumen, parece que nuestra capacidad para procesar información (o las condiciones
de nuestro sistema de conocimiento y de expresión) no acepta estructuras anómalas,
como la del ejemplo. En cierta medida, los estudios de tipología pueden contribuir,
como ya se ha comentado, a las investigaciones sobre la estructura de la mente humana.
3.1. Según las palabras
En cuanto a la estructuración de la palabra, es habitual considerar, desde el punto
de vista tipológico, tres clases principales de lenguas: lenguas flexivas, lenguas
aglutinantes y lenguas aislantes. Pero estas tres clases son tipos ideales, o puntos
situados en una línea continua que va desde la síntesis máxima al análisis máximo.
Observemos tres ejemplos:
Primero, «cant- o»: la forma «-o» es profundamente sintética, porque un solo elemento
contiene la información de «tiempo» (presente), de «número» (singular) y de «persona»
(primera). Estas tres indicaciones se integran (o sintetizan) en un solo morfema y
son características de las lenguas del primer tipo: flexivas.
Segundo, «granj- er - a - Ø»: esta palabra contiene cuatro informaciones, cada una
asignada a un fragmento: «casa de cultivo y de cría de animales», «persona o cosa
relacionada con (el lugar anterior)», «femenino» y «singular» (esto último por oposición
a la forma «granjeras»). En este caso, por lo tanto, los significados (léxico, derivativo
y gramatical) se corresponden, uno a uno, con las unidades que integran la palabra.
Configuraciones como esta son típicas de las lenguas aglutinantes.
Y tercero, «rompe-cabezas»: ahora estamos ante una palabra compleja (o compuesta),
más o menos típica del procedimiento aislante, en la que se han unido dos palabras
independientes. Hemos pasado, pues, de una forma muy sintética («canto») a otra muy
analítica.
Lo curioso del caso es que las tres palabras pertenecen a una misma lengua: por ello
antes nos hemos referido a divisiones tipológicas ideales. En la realidad, la clasificación
tipológica agrupa tendencias dominantes o características sobresalientes de las lenguas,
pero estas son compatibles con distintos procedimientos. Por ejemplo, la lengua castellana
es más flexiva y aglutinante que el inglés (pero también puede crear formas aislantes);
el inglés, en cambio, tiene un componente flexivo reducido, y una capacidad aglutinante
y aislante notables. De todos modos, se debe tener presente que se trata de procedimientos
para la configuración de las palabras, y en ningún caso se puede decir que un sistema
sea mejor o más práctico que otro.
Son lenguas predominantemente flexivas el griego, el árabe, el sánscrito, el latín
y, en menor medida, las lenguas románicas. Estas lenguas se caracterizan por tener
flexiones nominales y adjetivas de caso, o por tener unos paradigmas verbales complejos,
o por las dos cosas.
Observemos, por ejemplo, un paradigma nominal del latín para la palabra «pueblo» (que,
en castellano, solo admite dos formas: «pueblo» y «pueblos»):
Caso
|
Singular
|
Plural
|
Nominativo
|
populus
|
populi
|
Vocativo
|
popule
|
populi
|
Acusativo
|
populum
|
populos
|
Genitivo
|
populi
|
populorum
|
Dativo
|
populo
|
populis
|
Ablativo
|
populo
|
populis
|
Las doce formas de este paradigma (con ocho bien diferenciadas) no solo presentan
marcas específicas para las nociones de singular y de plural, sino que también incluyen
información de género masculino porque populus requiere o se combina con adjetivos masculinos (populus bonus). Pero lo más importante es que incluyen marcas de caso (relativas a la función que
pueden desarrollar en la frase). Por ejemplo, el significado de «agente» en la oración
«el pueblo llama» obligaría a seleccionar la forma populus (nominativo singular). El significado de «objeto» en la frase «él engañó al pueblo»
pediría la forma populum (acusativo singular).
Las lenguas flexivas como esta pueden favorecer el orden más bien libre de los elementos
en la oración porque las formas nominales ya indican, idealmente, la función de los
elementos. Probablemente sea por ello que la lengua castellana, al no tener flexión
nominal, tiene un orden fijo oracional de tipo sujeto-verbo-objeto: «María (sujeto)
visitó a Juan (objeto)» o «Juan (sujeto) visitó a María (objeto)».
Entre las lenguas aglutinantes tenemos el turco, el vasco, algunas lenguas esquimales
o la lengua yana (norteña de California).
Observemos cómo funciona el procedimiento de aglutinación con un ejemplo de la lengua
turca –evlerinden–, a partir de cuatro elementos:
ev significa «casa»
ler significa «plural»
i significa «suyo», «suya»
den significa «origen», «procedencia»
Así,
ev = la casa
evler = las casas
evi = su casa
evleri = sus casas
evden = desde la casa
evlerinden = desde sus casas
La unión de los elementos ev/ler/i/den da la forma evlerinden, que incorpora una «n» (detrás la «i»), consonante que se añade habitualmente al
posesivo de tercera persona.
En las lenguas románicas, encontramos un capítulo importante de aglutinación que es
conocido con el nombre de «derivación». Por ejemplo, una forma como «reproducible»
se puede segmentar de la manera siguiente:
re = repetición (haz la maleta / rehaz la maleta)
produ(ci) = hacer algo
ble = posibilidad (y también «digno de» = amable)
Todo junto, «que se puede hacer otra vez».
En cuanto a las lenguas aislantes, como el chino, el vietnamita, el tibetano o el
birmano, se caracterizan por que los elementos oracionales están configurados como
unidades invariables, y cada uno de ellos aporta una información independiente. Por
ejemplo, en la frase china siguiente:
ta bu tai xihuan ni
ella + no + mucho + querer + tú
Ella no te quiere mucho
Un caso especial es el de las lenguas denominadas «polisintéticas», como por ejemplo
la lengua chinook (del río Columbia), que presentan palabras equivalentes a una oración
entera.
La forma chinook acimlúda quiere decir «Él te lo dará», y se analiza de la manera siguiente:
a = futuro
c = él
i = aquello
m = tú
l = el elemento anterior (m) es el beneficiario
u = alejarse i de c (aquello de él)
d = dar
a = futuro
Aparte del chinook, hay otras lenguas propias de los nativos norteamericanos, como
el cheroquí, que presentan el carácter de polisintéticas. Curiosamente, en los inicios
de la colonización del continente, esta característica hizo que algunas de estas lenguas
fueran calificadas de «primitivas». Al constatar que una palabra podía incorporar
todos los elementos de una frase y variaba para indicar sujeto, objeto y número, se
consideró erróneamente que no podían expresar conceptos generales con palabras genéricas.
Hay que tener muy presente que alguna de las marcas de las lenguas polisintéticas
(que funcionan sin ningún problema y con garantías comunicativas plenas entre los
hablantes del chinook) no son muy diferentes de las nuestras: «a» para marcar el femenino
(gata), «s» para indicar plural (gatos) o «in» como señal de negación o privación
(inútil).
En otras lenguas también encontramos estructuras aislantes; en castellano tiralíneas, correveydile, caradura y muchas más; en inglés teapot (tetera), seaflower (anémona), tramway (tranvía).
3.2. Según el orden en las frases
La clasificación tipológica no solo considera la estructura de las palabras, también
se aplica a la investigación del orden oracional. Hay lenguas que colocan los elementos
siguiendo pautas diferentes para los constituyentes: sujeto (S), verbo (V), objeto
(O)].
S V O: castellano, inglés, árabe, finés (o suomi), thai.
S O V: japonés, turco, coreano.
V S O: tagalo, galés.
Algunos autores antiguos, como Diderot, Beauzée o Condillac, creían que la secuencia
natural del pensamiento era la de sujeto-verbo-objeto («Alguien hace algo») y, en
consecuencia, pensaban que las lenguas como el francés, de estructura SVO, seguía
fielmente el orden del pensamiento.
Sin embargo, desde la perspectiva de la lingüística moderna, está totalmente superada
la vieja polémica sobre las excelencias de la primera respecto de las otras, no hay
evidencia científica que privilegie una ordenación. Además, parece que no podemos
establecer con seguridad cuál es el orden de nuestras producciones mentales. En consecuencia,
la vieja polémica es una controversia vacía de contenido.
3.3. Según los sistemas fonológicos
Finalmente, la distinción tipológica de las lenguas también considera los sistemas
fonológicos, tanto el vocálico como el consonántico. Hay lenguas que tienen una estructura
vocálica con tres elementos (i, a, u: árabe, aleuta, etc.), otras con cinco (i, e,
a, o, u: castellano, vasco, etc.) y también las hay con sistemas de siete vocales:
catalán, albanés y otras (pero estas vocales no siempre se articulan con la misma
configuración bucal).