Las lenguas del mundo

La geolingüística es la disciplina científica que estudia las lenguas del mundo desde el punto de vista de su situación en el espacio; es decir, de su adscripción territorial. Por ejemplo, mucha gente cree que la lengua de Francia es el francés y la de Italia es el italiano. Pero, comparativamente, son pocos quienes saben que en Francia hay territorios en los que se habla catalán, vasco, bretón o alsaciano, y menos aún quienes tienen conocimiento de que en Italia hay hablantes de lenguas como por ejemplo el sardo, el catalán, el friulano, el alemán, el griego y otros.

Una de las fuentes de información fundamentales de la geolingüística son los censos de población, que, promovidos por la Administración, incluyen a menudo preguntas sobre las condiciones lingüísticas de los ciudadanos, referidas sobre todo a la primera lengua. Por ejemplo, un censo hecho en Australia en 1986 dio como resultado el panorama lingüístico siguiente:

Lengua	Número de hablantes
Inglés	14.000.000 (aprox.)
Italiano	415.765
Griego	277.472
Chino	139.100
Árabe	119.187
Alemán	111.276
Castellano	73.961
Polaco	68.638
Catalán	64
Lenguas aborígenes	40.790
Fuente: Censo lingüístico

1.1. Cuántas lenguas hay en el mundo

Hay dificultades para establecer con precisión cuántas lenguas hay en el mundo. Según los autores, las cifras no suelen bajar de las cuatro mil quinientas y rara vez suben más allá de las seis mil. Este margen tan grande es explicable por diferentes causas. En primer lugar, hay territorios todavía poco estudiados e incluso difíciles de censar. Además, aún no hay una autoridad cultural internacional que esté dispuesta de verdad a poner los medios necesarios para confeccionar el catálogo total de lenguas. Finalmente, existe una dificultad intrínseca: no siempre es fácil decidir si una forma de habla es una lengua (diferente de las otras) o tan solo la variedad dialectal de una lengua común, porque a menudo el límite entre lengua y dialecto es impreciso. Un dialecto se puede definir como una lengua derivada de otra lengua (en la lingüística historicocomparativa) y como una variedad geográfica dentro de una lengua.

Si tomamos como base una cifra entre media y baja, por ejemplo cinco mil lenguas, podremos hacer unas operaciones teóricas muy curiosas sobre la distribución de hablantes y de lenguas. Si dividimos la población del mundo (que se calcula en unos seis mil millones de personas) por el número de lenguas, se obtiene una media absoluta de un millón doscientos mil hablantes por lengua. Es evidente que esta media no se corresponde con los datos que puede aportar la geolingüística: hay unas pocas lenguas habladas por centenares de millones de personas y, por otro lado, hay muchas lenguas que tienen unos centenares, o incluso pocas docenas, de hablantes.

Lenguas	Número de hablantes
138	Más de un millón
258	Entre 100.000 y 1 millón
597	Entre 10.000 y 100.000
708	Entre 1.000 y 10.000
409	Entre 100 y 1.000
143	Han muerto hace poco
2.269	Sin datos
4.522	Total de lenguas estudiadas
Distribución de las lenguas por el número de hablantes

Un estudio como este revela que en el mundo la norma son las lenguas habladas por grupos humanos más bien pequeños. Y que las lenguas con un número de hablantes que supere los cien millones son muy pocas (entre diez y doce, sobre un total de cinco mil). Según Juan Carlos Moreno, un lingüista eminente, las lenguas más habladas del mundo son las siguientes:


	Lengua	Hablantes (en millones)
1	Chino (mandarín)	778
2	Inglés	440
3	Hindi	294
4	Español	254
5	Bengalí	165
6	Árabe	152
7	Ruso	142
8	Portugués	138
9	Indonesio	125
10	Japonés	120
11	Alemán	106
Lenguas más habladas

Por otro lado, si dividimos el número de lenguas por el número aproximado de estados que hay en el mundo, que es de doscientos –en vez de hacerlo por el número de ciudadanos–, esta operación nos dará una media de 25 lenguas por estado, también en términos absolutos. La realidad, en cambio, es muy diferente: hay estados, como la India, con más de quinientas lenguas. También es normal encontrar más de cien lenguas en muchos estados de África y de Oceanía. En el extremo opuesto, son casi excepcionales los estados en los que se habla una sola lengua en todo el territorio: por ejemplo, Islandia.

1.2. Una recesión acelerada

La geolingüística constata datos como estos sin introducir juicios de valor: es esta la realidad lingüística del mundo. En todo caso, cabe decir que el panorama de las cinco mil lenguas confrontado con la existencia de doscientos estados, muchos de los cuales tienden a priorizar una sola lengua a efectos oficiales, deja en situación difícil a las lenguas y a los hablantes que no coinciden con la que es oficial.

A pesar de que muchas lenguas propias de estados plurilingües están en situación de inferioridad respecto a la lengua o lenguas oficiales, algunas tienen un gran número de hablantes. Aproximadamente, si se pretendiera dejar una sola lengua para cada estado, ¡esto implicaría eliminar de golpe cuatro mil ochocientas!

De hecho, la situación lingüística del mundo está viviendo un periodo de recesión acelerada, y hay especialistas que han llamado la atención sobre la extinción rápida de muchas lenguas. Se calcula que en el siglo XXI se producirá la desaparición de casi la mitad de las lenguas existentes (si no hay una inversión de la tendencia). Esto es lo que se puede deducir de cifras (que siempre son aproximativas y muy variables según la fuente) como las siguientes:

Lengua	Número de hablantes
Nitinat	50
Chinook	30
Twana	10
Eyak	3

Un cuadro como este (que podría ampliarse mucho) nos presenta algunos ejemplos de lenguas condenadas a la desaparición (en este caso se trata de lenguas habladas en la costa noroeste de Norteamérica). En parte, por el escaso número de hablantes; pero sobre todo porque las personas que todavía conservan estas lenguas son ya muy mayores y con su muerte se producirá también, inevitablemente, la muerte de la lengua.

2. Las relaciones de parentesco

Se sabe con toda seguridad que lenguas como el catalán, el portugués, el castellano, el italiano, el rumano y algunas más tienen su origen en la lengua latina como consecuencia del proceso expansivo y colonizador de la antigua Roma. La vinculación entre estas lenguas y la latina se suele presentar gráficamente con un diagrama de tipo genealógico:

Detrás de este diagrama está la metáfora de la familia: la lengua latina es la «madre» y las otras son las «hijas» («hermanas» entre ellas). Esta dependencia genealógica se justifica, por un lado, por un conjunto de evidencias históricas (presencia de arte romano, instituciones legales romanas, narraciones de historiadores); pero sobre todo está avalada por la existencia de un gran corpus de textos latinos y también por pruebas internas basadas en las similitudes estructurales y de vocabulario entre estas lenguas «hermanas», hecho que reclama un origen común.

Sucede lo mismo, por ejemplo, con las lenguas germánicas, a pesar de que estas no disponen de textos escritos en una lengua antigua común. Pero la comparación de las estructuras y del vocabulario de lenguas como el inglés, el holandés, el noruego y otras permite establecer un árbol genealógico semejante al anterior (excepto por la interposición de dos áreas diferenciadas):

En este caso, no hay testimonios ni del antiguo germánico, ni de las etapas intermedias (una lengua muerta como el gótico, de la rama germánica oriental, que ya no tiene representantes actuales, se alinearía con las lenguas de las ramas inferiores), pero la comparación estructural que antes se ha mencionado lleva de manera segura, en casos como este, a la confección de un diagrama como el propuesto.

Estos dos ejemplos (con lenguas románicas y germánicas) nos permiten introducir algunos elementos esenciales de la clasificación genética de las lenguas del mundo. Estas no constituyen una lista desordenada; más bien al contrario, se pueden reunir en familias, grupos y subgrupos sobre la base bastante segura de parecidos y diferencias. Estos serían algunos ejemplos de estas similitudes y diferencias (entre algunas lenguas románicas y una lengua de filogenia desconocida):

Catalán	Italiano	Castellano	Francés	Vasco
braç peu pare mare quatre	braccio piede padre madre quattro	brazo pie padre madre cuatro	bras pied père mère quatre	beso urriki aita ama aurgarren

En cambio, el vasco pertenece a una familia diferente, sin que de momento se haya podido encontrar con seguridad un conjunto de lenguas hermanas. Además, en el cuadro se puede comprobar que los parecidos entre las lenguas románicas se establecen sobre la base de palabras referidas a las partes del cuerpo (brazo, pie), a los nombres de parentesco (padre, madre) y a los numerales (cuatro). Estos tipos de palabras son muy estables y, dado que cambian muy poco en el decurso del tiempo, permiten establecer las relaciones de familia con gran seguridad.

Desde el punto de vista de la clasificación genética, las comparaciones sobre la base de palabras estables, como por ejemplo las utilizadas en el cuadro anterior, facilitan la agrupación de las lenguas del mundo en familias. Es decir, hacen posible el establecimiento de una ordenación de las lenguas según el parentesco.

Las lenguas románicas constituirían un grupo subordinado al latín –grupo que, interiormente, se divide en lenguas románicas occidentales (el catalán, por ejemplo) y lenguas románicas orientales (el rumano). Estas lenguas, junto con el griego y otras, se encontrarían en el nudo italogriego, que conectaría con el indoeuropeo siguiendo un esquema teórico de ramificación como el siguiente:

Este tipo de esquema nos permite explicar metafóricamente las relaciones de parentesco: el francés, el italiano y el rumano, por ejemplo, son entre sí lenguas «hermanas»; las tres son «hijas» del latín, que, a su vez, está «hermanado» con el griego y el protocelta (aunque en la práctica nunca se habla de lenguas «nietas», «tías» o «abuelas»). Finalmente, el nudo superior representaría la lengua o lenguas indoeuropeas. Este nudo, además, se podría relacionar con otras familias de lenguas y así se llegaría, hipotéticamente y si las pruebas lo confirmaran, a constituir el árbol único de todas las lenguas del mundo, clasificadas desde el punto de vista genético.

La división en especies

Según Darwin, «la formación de las diferentes lenguas y de las diversas especies, y las pruebas de que las dos realidades se han desarrollado siguiendo un proceso gradual, son curiosamente paralelas». La clasificación y el grado de parentesco de los diferentes seres vivos y grupos de seres vivos se establecen en función de su proximidad genética (mayor o menor), de una manera análoga a la descrita para las lenguas en el cuadro anterior.

Los árboles genealógicos pueden llegar a ser mucho más complejos. Por ejemplo, una de las familias más estudiadas es la austronésica. El árbol genealógico de esta familia, según Carme Junyent, especialista en el estudio de las lenguas del mundo, sería el siguiente:

Así, esta clasificación nos dice, por ejemplo, que la lengua tagalo pertenece al grupo occidental de la rama malayopolinesia de la familia austronésica, con lo que queda definida la lengua en el marco de las relaciones genéticas. La familia austronésica incluye lenguas habladas en un ámbito geográfico muy extenso; en palabras de Carme Junyent, lenguas que se extienden «por prácticamente todas las islas que hay desde Madagascar hasta la isla de Pascua y Hawai, y de Taiwán a Nueva Zelanda». Sin embargo, algunos autores no la consideran una familia, sino una de las dos ramas principales de la familia austro-tai, junto con la daica.

Según Merritt Ruhlen, estudioso de los orígenes de las lenguas, actualmente las lenguas del mundo están reunidas en diecinueve familias (agrupadas en diecisiete fílums), algunas de las cuales se presentan de forma muy simplificada en la siguiente tabla y solo con unos pocos ejemplos de las lenguas que las configuran:


Familia	Lengua	Localización
Indoeuropea (2.000.000 de hablantes)	Griego	Grecia
	Persa	Irán
	Hindi, gujarati	India
	Francés, catalán, italiano, castellano, rumano	Territorios respectivos
	Irlandés	Irlanda
	Galés	Gales
	Gaélico	Escocia
	Ruso	Rusia
	Polaco	Polonia
Esquimoaleuta (85.000 hablantes)	Esquimal, aleuta	Alaska, norte de Canadá
Altaica (250.000.000 de hablantes)	Turco	Turquía
	Coreano	Corea
	Japonés	Japón
	Ainu	Japón
Sinotibetana (1.000.000 de hablantes)	Mandarín	China
	Cantonés	China
	Tibetano	Tíbet
Afroasiática (175.000.000 de hablantes)	Tamazight (bereber)	Norte de África
	Árabe	Norte de África
	Hausa	Nigeria, Níger, Chad...
	Somalí	Somalia, Etiopía...
Nigerokurdufaniana (180.000.000 de hablantes)	Mandingo	Guinea, Gambia
	Suahelí	Tanzania
	Chona	Zimbabwe
	Ibo	Nigeria
Amerindia (18.000.000 de hablantes)	Yurok	Norte de California
	Cheyenne, dakota	Centro de Estados Unidos
	Cuaquiú	Suroeste de Canadá
	Cheroquí	Este de Estados Unidos
	Nahua	México
	Quechua, aimara	Suroeste de América del Sur
Na-dene (200.000 hablantes)	Navajo, apache	Alaska, oeste de Canadá, Oregón, California...
Algunas familias lingüísticas

Esta síntesis, de solo ocho de las diecinueve familias de lenguas, permite que nos hagamos una idea aproximada del panorama lingüístico del mundo. Hay cinco lenguas que todavía no se han podido adscribir a ninguna de las diecinueve familias: vasco, buruchasky, ket, guiliak y nahali. Son, pues, lenguas «aisladas».

2.1. La familia indoeuropea

La familia lingüística indoeuropea, denominada a veces «indohitita» (y ya nunca más «indoaria»), es, quizá, el grupo mejor estudiado entre las lenguas del mundo. Y esto se debe principalmente a tres factores: en primer lugar, se trata de un grupo no excesivamente numeroso (unas cincuenta lenguas); además, el nivel de semejanzas es notablemente alto y en muchos casos se puede comprobar con textos antiguos, y finalmente esta familia ha llamado la atención de los lingüistas desde hace doscientos años, lo que ha permitido una acumulación impresionante de estudios.

A modo de ejemplo, son miembros de la familia indoeuropea lenguas como: el sánscrito (la antigua lengua sagrada y literaria de la India), y las actuales hindi, gujarati, bengalí; el persa, lengua de la antigua Persia y del actual Irán; el griego clásico, cuya versión hablada ha llegado hasta nuestros días como griego moderno; el latín, que todavía pervive en las actuales lenguas románicas; el grupo céltico, representado en nuestros días por lenguas como el bretón, el galés y el irlandés; el grupo germánico, cuyo antecedente no dejó testigos escritos, que contiene lenguas como el inglés, el alemán, el holandés o el sueco, y el grupo baltoeslavo: lituano, ruso, polaco o búlgaro.

A primera vista parece un campo muy extenso, e incluso más de uno se sorprendería si le dijeran que la actual lengua bengalí (en la India) y la lengua sueca (en la península de Escandinavia) son miembros del mismo árbol genealógico. Pero la comparación de estas y otras lenguas no deja lugar a ninguna duda.

De hecho, toda la historia de las investigaciones indoeuropeas se inició con un acto de sorpresa basado en la comparación: el juez británico Sir William Jones, un experto orientalista residente en la India, escribió en 1788 las palabras (consideradas con auténtica veneración hoy) siguientes: «La lengua sánscrita, sea cual sea su antigüedad, tiene una estructura admirable. Es más perfecta que el griego, más rica que el latín y más exquisita que las dos. Y tiene un parecido tan grande con estas, tanto respecto a las raíces verbales como a las formas gramaticales, que esto no se puede haber originado accidentalmente. Hasta tal punto es fuerte el parecido que ningún filólogo podría investigar estas tres lenguas sin pensar que proceden de una fuente común que, quizá, ya no existe. Por la misma razón, pero no tan concluyente, el gótico y el céltico, mezclados con alguna lengua muy diferente, podrían tener el mismo origen. Y también el antiguo persa podría ser asociado con la misma familia».

La sorpresa y el tono admirativo del juez Jones tenían como base las comparaciones entre palabras como, por ejemplo, los nombres de parentesco: «padre» es pater en latín y pitár en sánscrito; «hijo» es son en inglés, sunus en gótico, syn en ruso y sunu en sánscrito; «hija» es daughter en inglés, dukté en lituano y duhitar en sánscrito. También en los nombres de los números: «dos» es dúo en latín, dyo en griego y duvá en sánscrito; «siete» es séptem en latín, hepta en griego y saptá en sánscrito; «diez» es décem en latín, déka en griego y dáça en sánscrito. O en el nombre de objetos cotidianos: «barco» es naus en latín, naus en griego y nau en sánscrito; «yugo» es iugum en latín, zygon en griego, juk en gótico, jungas en lituano y yugam en sánscrito.

Estos parecidos (y muchísimos más) dejaban muy clara la pertenencia de una serie de lenguas a la misma familia indoeuropea. El conjunto de estas lenguas se suele clasificar en diez grupos, que presentamos de manera simplificada en el cuadro siguiente:

El calificativo indoeuropea se explica porque las lenguas que incluye esta familia alcanzan un territorio que abarca desde la India hasta las orillas occidentales de Europa. Cada uno de estos grupos se concreta en una o más lenguas: la antigua lengua hitita es la única representante conocida del grupo anatólico, como también lo son, por ejemplo, el griego para el grupo griego y el albanés para el grupo albanés. Otros grupos contienen algunas lenguas más, como por ejemplo el céltico, que tiene cuatro: escocés, irlandés, galés y bretón. Los grupos más numerosos del árbol indoeuropeo son el germánico, el indoiraní, el baltoeslavo y el itálico.

En cuanto al grupo itálico, la lista de lenguas que se situarían bajo la rama correspondiente, en una disposición aproximada desde las tierras más occidentales a las más orientales, es esta: galaicoportugués, asturiano, castellano, aragonés, catalán, francés, occitano, francoprovenzal, sardo, italiano, friulano, dálmata (extinguida) y rumano.

El origen geográfico, la cultura temprana y los movimientos de expansión de los indoeuropeos son, desde hace tiempo, materia de estudio y de debate. En cuanto a la localización inicial de este pueblo, la hipótesis más verosímil lo sitúa, hace unos seis o siete mil años, en las estepas rusas, en el entorno del curso inferior del río Volga, entre el mar Negro y el mar Caspio (a pesar de que también hay quien lo sitúa en la península de Anatolia, la actual Turquía). Algunos arqueólogos y lingüistas sitúan los orígenes de los pueblos indoeuropeos en una zona que se localiza al norte del mar Negro y del mar Caspio. Otros, en cambio, creen que la protopatria de estos pueblos fue Asia occidental, donde ya habrían compartido una lengua común hace entre 7.000 y 6.000 años. Lo que sí que es cierto es que en el tercer milenio antes de Cristo ya había pueblos indoeuropeos establecidos en las estepas de la Europa oriental:

En cuanto a la cultura original del pueblo indoeuropeo, no tenemos noticias directas de ella porque no nos ha llegado ni una sola línea escrita que nos hable de esta (como no sucede con los griegos y los latinos, más tarde). Es más, los indoeuropeos eran analfabetos por necesidad, ya que la escritura se inició en Mesopotamia hacia el 3300 a. de C.; es decir, dos mil años después de la época de surgimiento de los pueblos indoeuropeos.

Así, todas las informaciones sobre su cultura se tienen que obtener a partir de los hallazgos arqueológicos y, muy especialmente, del estudio de las instituciones de los pueblos indoeuropeos (griegos, latinos, germánicos) y de la comparación de su vocabulario: por ejemplo, antes hemos visto que en algunas lenguas del grupo hay una palabra común para «yugo», esto significa que una de las actividades de supervivencia era la agricultura. También consta una palabra común para «moler», lo que nos pone sobre la pista del tipo de cultivo. En este sentido, las investigaciones lingüísticas sobre el vocabulario comparado son muy apreciadas por los arqueólogos y los prehistoriadores.

Con las pruebas arqueológicas y lingüísticas se ha llegado, pues, a dibujar una pintura cultural que, en síntesis, nos dice lo siguiente: eran agricultores y ganaderos; probablemente hacían casas mezclando barro con paja; conocían las técnicas del cobre y el bronce, y usaban la rueda. También fabricaban «cerámica cordada»; es decir, cerámica decorada con marcas de cuerdas. Además, sabían navegar y tenían algunas armas (arcos y flechas, espadas y hachas). Su organización social era la familia, el clan y la tribu, en progresión creciente; la figura del rey era más bien la de un árbitro que hacía de mediador en caso de conflicto.

En cuanto a la religión, tenían un dios superior (o deus pater) y una serie de dioses sectoriales: el de los sacerdotes, el de los guerreros y el dios protector del trabajo agrícola, como divinidades más destacadas. Muy probablemente, el tipo de religión era dualista, basada en las fuerzas del orden y del caos. También practicaban el sacrificio de animales.

En cuanto a la expansión de los indoeuropeos, queda claro que, ya en tiempos antiguos, llegaron por un lado hasta la India, y por otro hasta las orillas occidentales de Europa. Esto se demuestra, especialmente, por los hallazgos de un tipo especial de entierros denominados kurganos, o tumbas con túmulo, originarios del emplazamiento primitivo. No consta, por otro lado, que actuasen como conquistadores de territorios extensos. Más bien se cree que iban ocupando tierras de cultivo y que las dejaban una vez agotadas para trasladarse a otras.

Los kurganos se asocian con varios movimientos migratorios atribuidos a los pueblos indoeuropeos, entre los cuales el primero (4400-4200 aC) los llevó hasta la región del Danubio y los Balcanes; con el segundo (3500-3000 aC) llegaron hasta Transcaucasia, Irán, parte de Anatolia y Europa central, y el tercero (3000-2800 aC) los dirigió hacia el Egeo y el Adriático.

Finalmente, las fantasías sobre la «raza indoeuropea» (o «aria») han quedado hoy totalmente desprestigiadas por la ciencia. Por un lado, esa supuesta «raza» estaba constituida por un conjunto de pueblos genéticamente mezclados y, por otro, su cultura de supervivencia los presenta como un grupo de lo más normal, comparable a otros pueblos en circunstancias parecidas con economía agrícola y ganadera:

3. Parecidos estructurales

La clasificación genética, que toma en consideración los parecidos entre las lenguas (justificados por el origen común), no es la única manera de relacionar las lenguas del mundo. También existe la posibilidad de agrupar las lenguas mediante similitudes estructurales, al margen de que estén emparentadas o no. En este caso, hablamos de clasificación tipológica, tomando como patrón clasificatorio el hecho de que encontramos semejanzas como, por ejemplo, una estructura verbal más o menos igual, un mismo sistema vocálico, una disposición de los elementos oracionales idéntica y, sobre todo, una misma (o muy parecida) estructuración de la palabra.

Los estudios de tipología lingüística ofrecen un panorama extraordinariamente variado sobre las lenguas del mundo, pero, al mismo tiempo, permiten marcar los límites de las lenguas posibles y, así, ayudan a establecer las condiciones que restringen los productos de nuestra facultad verbal. Dicho de otro modo, parece que podemos hablar de cualquier tema, con todo tipo de variantes sintácticas y estilísticas; pero no lo podemos hacer de cualquier manera, o usando estructuras no previstas en las lenguas del mundo.

Por ejemplo, ninguna lengua presenta estructuras silábicas en las que las consonantes (C) y las vocales (V) aparezcan como en esta secuencia: CCCCVCCC (lmtbasdp). Tampoco encontramos lenguas que solo tengan consonantes sordas del tipo p, t, k (y sin sonoras, como b, d, g).

Subordinadas imposibles

No encontramos tampoco lenguas en las que se puedan acumular las subordinaciones de oraciones de la manera siguiente:

(1) El chico ha salido.
(2) El hombre conoce al chico.
(1 + 2) El chico que el hombre conoce ha salido.
(3) El mecánico saludó al chico.
(4) El mecánico nos arregla el coche.
(3 + 4) El mecánico que nos arregla el coche saludó al chico.

Hasta aquí todo es posible y correcto. No obstante, observemos cuál es el resultado de hacer ahora todas las subordinaciones:

(1 + 2 + 3 + 4) El chico que el hombre que el mecánico que nos arregla el coche saludó conoce ha salido.

En resumen, parece que nuestra capacidad para procesar información (o las condiciones de nuestro sistema de conocimiento y de expresión) no acepta estructuras anómalas, como la del ejemplo. En cierta medida, los estudios de tipología pueden contribuir, como ya se ha comentado, a las investigaciones sobre la estructura de la mente humana.

3.1. Según las palabras

En cuanto a la estructuración de la palabra, es habitual considerar, desde el punto de vista tipológico, tres clases principales de lenguas: lenguas flexivas, lenguas aglutinantes y lenguas aislantes. Pero estas tres clases son tipos ideales, o puntos situados en una línea continua que va desde la síntesis máxima al análisis máximo. Observemos tres ejemplos:

Primero, «cant- o»: la forma «-o» es profundamente sintética, porque un solo elemento contiene la información de «tiempo» (presente), de «número» (singular) y de «persona» (primera). Estas tres indicaciones se integran (o sintetizan) en un solo morfema y son características de las lenguas del primer tipo: flexivas.

Segundo, «granj- er - a - Ø»: esta palabra contiene cuatro informaciones, cada una asignada a un fragmento: «casa de cultivo y de cría de animales», «persona o cosa relacionada con (el lugar anterior)», «femenino» y «singular» (esto último por oposición a la forma «granjeras»). En este caso, por lo tanto, los significados (léxico, derivativo y gramatical) se corresponden, uno a uno, con las unidades que integran la palabra. Configuraciones como esta son típicas de las lenguas aglutinantes.

Y tercero, «rompe-cabezas»: ahora estamos ante una palabra compleja (o compuesta), más o menos típica del procedimiento aislante, en la que se han unido dos palabras independientes. Hemos pasado, pues, de una forma muy sintética («canto») a otra muy analítica.

Lo curioso del caso es que las tres palabras pertenecen a una misma lengua: por ello antes nos hemos referido a divisiones tipológicas ideales. En la realidad, la clasificación tipológica agrupa tendencias dominantes o características sobresalientes de las lenguas, pero estas son compatibles con distintos procedimientos. Por ejemplo, la lengua castellana es más flexiva y aglutinante que el inglés (pero también puede crear formas aislantes); el inglés, en cambio, tiene un componente flexivo reducido, y una capacidad aglutinante y aislante notables. De todos modos, se debe tener presente que se trata de procedimientos para la configuración de las palabras, y en ningún caso se puede decir que un sistema sea mejor o más práctico que otro.

Son lenguas predominantemente flexivas el griego, el árabe, el sánscrito, el latín y, en menor medida, las lenguas románicas. Estas lenguas se caracterizan por tener flexiones nominales y adjetivas de caso, o por tener unos paradigmas verbales complejos, o por las dos cosas.

Caso	Singular	Plural
Nominativo	populus	populi
Vocativo	popule	populi
Acusativo	populum	populos
Genitivo	populi	populorum
Dativo	populo	populis
Ablativo	populo	populis

Las doce formas de este paradigma (con ocho bien diferenciadas) no solo presentan marcas específicas para las nociones de singular y de plural, sino que también incluyen información de género masculino porque populus requiere o se combina con adjetivos masculinos (populus bonus). Pero lo más importante es que incluyen marcas de caso (relativas a la función que pueden desarrollar en la frase). Por ejemplo, el significado de «agente» en la oración «el pueblo llama» obligaría a seleccionar la forma populus (nominativo singular). El significado de «objeto» en la frase «él engañó al pueblo» pediría la forma populum (acusativo singular).

Las lenguas flexivas como esta pueden favorecer el orden más bien libre de los elementos en la oración porque las formas nominales ya indican, idealmente, la función de los elementos. Probablemente sea por ello que la lengua castellana, al no tener flexión nominal, tiene un orden fijo oracional de tipo sujeto-verbo-objeto: «María (sujeto) visitó a Juan (objeto)» o «Juan (sujeto) visitó a María (objeto)».

Observemos cómo funciona el procedimiento de aglutinación con un ejemplo de la lengua turca –evlerinden–, a partir de cuatro elementos:

ev significa «casa»
ler significa «plural»
i significa «suyo», «suya»
den significa «origen», «procedencia»

Así,

ev = la casa
evler = las casas
evi = su casa
evleri = sus casas
evden = desde la casa
evlerinden = desde sus casas

La unión de los elementos ev/ler/i/den da la forma evlerinden, que incorpora una «n» (detrás la «i»), consonante que se añade habitualmente al posesivo de tercera persona.

En cuanto a las lenguas aislantes, como el chino, el vietnamita, el tibetano o el birmano, se caracterizan por que los elementos oracionales están configurados como unidades invariables, y cada uno de ellos aporta una información independiente. Por ejemplo, en la frase china siguiente:

Aparte del chinook, hay otras lenguas propias de los nativos norteamericanos, como el cheroquí, que presentan el carácter de polisintéticas. Curiosamente, en los inicios de la colonización del continente, esta característica hizo que algunas de estas lenguas fueran calificadas de «primitivas». Al constatar que una palabra podía incorporar todos los elementos de una frase y variaba para indicar sujeto, objeto y número, se consideró erróneamente que no podían expresar conceptos generales con palabras genéricas.

Hay que tener muy presente que alguna de las marcas de las lenguas polisintéticas (que funcionan sin ningún problema y con garantías comunicativas plenas entre los hablantes del chinook) no son muy diferentes de las nuestras: «a» para marcar el femenino (gata), «s» para indicar plural (gatos) o «in» como señal de negación o privación (inútil).

3.2. Según el orden en las frases

La clasificación tipológica no solo considera la estructura de las palabras, también se aplica a la investigación del orden oracional. Hay lenguas que colocan los elementos siguiendo pautas diferentes para los constituyentes: sujeto (S), verbo (V), objeto (O)].

Algunos autores antiguos, como Diderot, Beauzée o Condillac, creían que la secuencia natural del pensamiento era la de sujeto-verbo-objeto («Alguien hace algo») y, en consecuencia, pensaban que las lenguas como el francés, de estructura SVO, seguía fielmente el orden del pensamiento.

Sin embargo, desde la perspectiva de la lingüística moderna, está totalmente superada la vieja polémica sobre las excelencias de la primera respecto de las otras, no hay evidencia científica que privilegie una ordenación. Además, parece que no podemos establecer con seguridad cuál es el orden de nuestras producciones mentales. En consecuencia, la vieja polémica es una controversia vacía de contenido.

3.3. Según los sistemas fonológicos

Finalmente, la distinción tipológica de las lenguas también considera los sistemas fonológicos, tanto el vocálico como el consonántico. Hay lenguas que tienen una estructura vocálica con tres elementos (i, a, u: árabe, aleuta, etc.), otras con cinco (i, e, a, o, u: castellano, vasco, etc.) y también las hay con sistemas de siete vocales: catalán, albanés y otras (pero estas vocales no siempre se articulan con la misma configuración bucal).

LOS RETOS DE LA CLASIFICACIÓN

1. Principios de geolingüística