Todas las entradas de: Semevadelalengua

Filóloga analiza inteligencia artificial. Lo que pasó después te sorprenderá.

24 abril, 2023Sin categoríaSemevadelalengua

Hace poco leí este artículo sobre inteligencia artificial (gracias, FDM), que es tremendamente pesimista con lo que esta nos puede traer. Por resumir: la destrucción de la especie humana —recomiendo la lectura para conocer los detalles, son interesantes—. Parece que el lema de nuestra época es «Elige tu propio apocalipsis». Hay que admitir que nos ha quedado resultón.

En el artículo se pone el foco —adecuadamente, creo—en un tipo de inteligencia artificial muy concreta: los grandes modelos de lengua (LLM por sus siglas en inglés: large language models). Y ya que, aunque solo sea por la parte de la segunda ele, ese es también un poco mi negociao, voy a opinar yo también. Me parece que el riesgo de estos modelos deriva de algo tan sencillo como que la lengua nos atañe a todos, nos interesa a todos; todos la entendemos y todos sabemos usarla. Una inteligencia artificial que detecta tumores cancerígenos nos beneficiará a todos, pero, como la mayoría de nosotros no nos dedicamos a detectar tumores cancerígenos, no tendremos mucho interés en utilizarla.

Con los modelos de lengua no ocurre eso, porque todos empleamos el idioma constantemente. Por lo tanto, estos modelos pueden sernos útiles a todos. Sin embargo, precisamente nuestra familiaridad con la lengua es la que puede ser la fuente del peligro de los modelos de lengua: enseguida pensamos que sabemos cómo funcionan, igual que sabemos cómo funciona nuestra lengua, pero… quizá nuestro conocimiento previo no es directamente aplicable a la lengua de las inteligencias artificiales. Por muchísimo que parezca que sí. Y esa va a ser una tentación difícil de superar.

En este podcast de Marta García Aller, Julio Gonzalo describía a ChatGPT como un cuñao estocástico, que se ha convertido en mi definición favorita. Es que explica muy bien cómo funciona: simple y llanamente, encadenando palabras una tras otras por estadística. Con ese “simple y llanamente” no pretendo desmerecer el funcionamiento de estos modelos, que tienen detrás un algoritmo tan complejo que literalmente nadie sabe cómo funciona. (Nadie. Tampoco los que la han creado. Mola, ¿no? NO.) Pretendo subrayar que lo que sabe hacer ChatGPT (o GPT-4 o cualquiera de sus amigos) es crear textos, textos que parecen humanos, pero no tiene control sobre el contenido de esos textos. No sabe si es verdad. No sabe si es coherente. No sabe si dice disparate tras disparate. El problema, claro, es que el humano que lo lea tampoco lo sepa. Porque, a quién queremos engañar, somos más de desconfiar del cuñao que todo lo sabe que de lo que leemos en una pantalla.

Estos modelos de lenguaje son la prueba viviente de las tradiciones discursivas, un concepto lingüístico que describe el hecho de que nuestros textos contienen muchas estructuras repetidas entre sí. Estas repeticiones evocan otros textos y, así, a base de evocaciones, forman una tradición de textos. El otro día estuve en una reunión en alemán en la que se pronunció un discurso sobre un tema que conocía. Con mi alemán estándar nivel usuario, en muchos pasajes era capaz de completar las frases cuando la oradora hacía una pausa. ¿Por qué? Porque conozco el tema y, sobre todo, conozco el formato. He escuchado un porrón de discursos en alemán a estas alturas de mi vida. Yo no sabría hacer uno bueno, pero mi cerebro ya tiene la función de autorelleno. Es decir, muchos fragmentos de las cosas que escribimos y decimos son predecibles: cuantos más textos hayamos oído y escuchado, mejor compondremos (y predeciremos) textos nuevos.

Lo mismo hace ChatGPT. Ha estado expuesto a un montón de textos, ha encontrado regularidades estadísticas y las sabe aplicar. Con una pequeña salvedad: ChatGPT no entiende esos textos. Y además no le importa. Le da igual decir verdades o mentiras: ¡no sabe lo que es la verdad ni la mentira! Muchas veces puede parecer que sí, porque los textos presentan cohesión temática (eso es algo que también se aprende), pero el ojo atento y, sobre todo, el ojo conocedor del tema, podrá detectar las meteduras de patas.

El ojo inexperto, sin embargo, podrá ser engañado fácilmente. Un texto bien redactado es ya un buen argumento a favor de su contenido, algo que sabe cualquiera que se sumerge en un tema que no conoce: le convencerán los argumentos de un lado y del otro si están bien expuestos, porque la capacidad crítica viene del conocimiento del contenido. (Paréntesis: seguramente no es el mejor momento para ir contra los contenidos en la educación primaria y secundaria. Nunca lo será, en realidad. Cierro paréntesis.)

Ahí radica el peligro de estos modelos de lenguaje: en su capacidad de engaño. No se trata de que quieran engañarnos, sino de que “su inteligencia” no es como la nuestra. Cuando crean un texto no lo hacen como nosotros, aunque lleguen a un resultado muy parecido. Son inteligencias inhumanas, como dicen Ferguson y también Klein (aquí, gracias a FIC). El problema en realidad es nuestro, que tendemos a creernos cualquier cosa que suene bien: es el poder de la retórica, como tan bien sabían los griegos.

Estos modelos pueden ser utilísimos. Nos pueden ayudar a redactar textos que tienen una estructura muy rutinizada, es decir, que siguen tradiciones discursivas muy asentadas. Cualquiera que tenga que escribir muchos informes sabe de lo que hablo: primero decidimos el contenido y luego… tenemos que redactarlo en un formato que ya hemos usado mil y una veces. Esa es una tarea que puede ser aburrida y que las inteligencias artificiales actuales pueden hacer bastante bien: dándoles unas instrucciones concretas redactan el texto y basta una lectura (¡cuidadosa!) para redondearlo. Una maravilla.

Pero los modelos de lenguaje no están ahí para ayudarnos a recabar información fiable de temas que desconocemos. Aunque pueda parecer que sí, por lo bien que lo dice todo, ChatGPT no consulta fuentes antes de construir un texto. Ese sigue siendo nuestro trabajo, al menos si queremos tener un conocimiento ajustado de la realidad. (Que digo yo que es lo que queremos, aunque a veces dudo.) ChatGPT y sus amigos solo combinan palabras que saben que van bien juntas. Pero lo mismo te puede decir una cosa que la contraria. Debe escribir unos discursos políticos magníficos. Quizá así se vea mejor el problema.

Querido Papá Noel: Este año quiero averiguar qué es una palabra

29 diciembre, 2022Sin categoríaSemevadelalengua

Puede parecer sorprendente, pero los lingüistas no las tenemos todas con nosotros a la hora de decir si algo es una lengua o no o si algo es una palabra o no. Pues vaya fraude, pensará usted. ¿No se ocupan precisamente los lingüistas de las lenguas y las palabras? Así es, sí. Y, precisamente por eso, de tanto mirarlas y pensarlas, sabemos que no es tan fácil ponerle límites ni a lo uno ni a lo otro. Sobre lo de las lenguas podemos hablar otro día, pero vamos hoy con las palabras. ¿Qué es una palabra?

Seguro que usted tiene una idea bastante intuitiva de qué es una palabra, pero me temo que esta vendrá mediada por la escritura. La primera respuesta que nos suele venir a la cabeza es que una palabra es aquello que se escribe entre espacios. Pero si lo pensamos un poco más a fondo, empezamos a verle problemas a esta definición. ¿Qué pasa con una palabra como me, que a veces va entre espacios (me gusta) y a veces no (podría gustarme)? ¿Y qué pasa con las lenguas que se escriben sin espacios o las lenguas que no se escriben? ¿No tienen palabras? Parece poco probable… De hecho, ante esa respuesta, podríamos reformular nuestra pregunta de partida, porque ¿qué criterio seguimos para decidir poner los espacios al escribir? Pues que sean palabras distintas, cuál va a ser. Y vuelta a empezar.

Otra respuesta posible podría tener que ver con cómo decimos las palabras. Seguramente podríamos estar de acuerdo en que cada palabra tiene su propio acento: su propia sílaba tónica o fuerte. Hasta que lo pensemos un poco más, claro. Otra vez el maldito me, que no tiene acento propio. Por mucho que escribamos me gusta, no decimos ME GUSta, sino me GUSta. Y hay otras palabras con dos acentos: decimos perFECtaMENte, aunque no escribamos perféctamente.

De hecho, las palabras como perfectamente son algunas de las que más problemas nos dan a la hora de clasificarlas como tales. Son palabras formadas por la combinación de otras dos palabras (o lexemas): palabras compuestas. Perfectamente viene de perfecta y… de mente, claro. En este caso el significado del compuesto ya no es transparente, porque mente se ha convertido en un elemento para formar adverbios (y los lingüistas ahora nos entretenemos decidiendo si las palabras resultantes son compuestas o derivadas, porque lo que nos gusta es discutir). Pero en otros casos la composición está muy clara: cuellilargo, sacapuntas, aguanieve… Todas estas palabras se formaron originalmente combinando dos palabras y ahora son palabras de propio derecho.

Pero crear palabras por composición puede ser un proceso largo, con estados intermedios, lo que causa cierta variación. Un aspecto en el que esta variación se ve muy claramente es la formación de los plurales. Por ejemplo, existen los plurales bajos relieves y bajorrelieves o guardias civiles y guardiaciviles. Como se ve, cuando el plural solo aparece al final, escribimos todo junto, mientras que, si cada elemento pluraliza individualmente, las escribimos separadas. Es decir, cómo se forma el plural es un criterio para decidir el estatus de palabra. (Más o menos, porque en los casos de guardias civiles hablamos de compuestos sintagmáticos, que es un poco como decir que son una única palabra pero no del todo). En cualquier caso, esto implica que tenemos dos posibles singulares: bajo relieve, bajorrelieve, guardia civil, guardiacivil.

Tenemos otro ejemplo muy navideño a mano, fíjense en este titular de hace unos días en El Confidencial:

Yo me sobresalté doblemente al verlo: primero por si la carencia papanoelística afectaba a mis regalos, claro, y, segundo, por el plural. ¿Papás Noel? Yo no lo he dicho así en mi vida, Hulio. Para saber si estaba sola o no en mi perplejidad, hice una encuesta en Twitter y, como se puede ver, la mayoría de las personas que respondieron afirman usar el plural papanoeles. Con lo que hemos explicado antes, este plural implicaría la grafía Papanoel en singular, todo junto. Papás Noel es la segunda opción más frecuente (pero está a años luz de papanoeles y, sí, he aprovechado para meter años luz, que forma el plural exactamente igual que Papás Noel). Papás Noel supone la grafía Papá Noel en singular, que es definitivamente lo que usamos todos (o casi todos, que de todo habrá). Otra opción menos popular es pluralizar ambas palabras, como si noel fuera un adjetivo (como en guardias civiles). Es lo mismo que ocurre con células madres, donde madre no es un adjetivo, aunque parece interpretarse como tal. Noel viene de un sustantivo francés, pero, puesto que en español solo lo usamos en el compuesto Papá Noel, tiene sentido que lo tratemos de una forma poco ortodoxa. Por último, algunas personas responden que mantienen la forma singular para el plural (los Papá Noel) o que, simplemente, evitan pluralizarlo. Normal, porque es un lío. (Y otros usan Santa Clos.)

Uy, una cosa, encuesta de Nochebuena, decís…
— Carlota dBM (@semevadlalengua) December 24, 2022

El caso de papanoeles es precioso, porque esta forma del plural genera mucho consenso, pero la grafía que le debería corresponder, tanto en plural como en singular (Papanoel) seguramente generaría mucho rechazo. Criterios para ser palabra: ¡fight!

Admito que con Papanoel el problema surge poco. Es un problema morfológico-gráfico fundamentalmente estacional. ¿Pero qué me dicen del plural de de nada? A mí este me fastidia por lo menos una vez a la semana. ¿Y por qué narices pluralizamos de nada? Pues porque como respuesta a muchas gracias, muchas denadas queda fenomenal. Sale con una fluidez que da gusto. Al menos al hablar, porque luego lo quiere uno escribir… Y, claro, surge el problema. ¿Pero cómo lo voy a escribir todo junto, si en «singular» (comillas de que en realidad eso no es un singular) se escribe separado? Así que nosehablemás, yo abogo por Papánoel y por denada. ¿A qué Rey Mago se lo tengo que pedir?

El fantasma del verano (casi) pasado

18 septiembre, 2022Sin categoríaSemevadelalengua

A principios de año me propuse seguir escribiendo con regularidad en el blog, esta vez sobre las otras lenguas de España, y fracasé estrepitosamente. Mañana comienza el segundo semestre en la Universidad de Zúrich, así que hoy es un buen día para renovar propósitos. Pero, como hay que hacer las cosas poquito a poquito, suave, suavecito, hoy traigo la típica entrada de la vagancia: un resumen de algunos hits lingüísticos de mi verano.

Con esto de que el covid ya está integrado en nuestras vidas, han vuelto los congresos ¡y el trabajo de campo! Como ven, de esto último me alegro mucho (de lo primero creo que me alegraré más cuando retomemos un ritmo normal, porque por ahora hemos tenido una acumulación de eventos pospuestos absolutamente excesiva), porque el trabajo de campo es lo más disfrutable de mi trabajo, siendo mi trabajo muy disfrutable. Volvimos a la isla de La Palma, una semanita, casi cuarenta personas… Y fue increíblemente fructífero, además de divertido. Algunos de los alumnos de Zúrich que nos acompañaron han escrito sus impresiones y hallazgos en el blog del proyecto: ¡lectura recomendada!

Pasé una semana en Santander —con mis compañeras y amigas Ana Estrada y Elena Diez del Corral— dando un curso de verano en la Universidad Internacional Menéndez Pelayo. Además de unos alumnos estupendos y una experiencia muy enriquecedora y divertida —a quién no le gusta decir que ha cenado «en Palacio»—, hay que añadir que se nos caía la baba no solo con la comida (¡y los helados de queso!), sino con los leísmos —tierra fertilísima en leísmos, la cántabra— y los diminutivos en -uco, especialidad montañesa muy apreciada.

Este verano he pisado Centroamérica por vez primera y, aunque me encanta tooooodo de lo que dicen en Costa Rica (esa erre retrofleja —como la inglesa—; ese vosearte en San José y tratarte exclusivamente de usted en Puntarenas; ese baile de terminaciones verbales con los clíticos —acompáñelen por acompáñenle—), mi palabra favorita es, sin ningún lugar a dudas, «minisúper». La fusión de lo diminuto y lo excesivo en cuatro sílabas me parece magnífica. Dice el Diccionario de americanismos que se usa en prácticamente toda Centroamérica (¿qué pasa con Guatemala?) y en México y me parece poco. Abogo por extenderla al globo entero.

Minsuper Mercadito. Más no se puede pedir

Voy acabando, pero no sin antes mencionar algunas cosillas que han pasado este verano y me han hecho ilusión. La primera es que salí en Más de Uno hablando de acentos. Si os pica la curiosidad sobre el origen de las distintas formas de hablar español, a lo mejor os interesa. (Y digo yo que sí, porque es un poco de lo que va este blog…)

La segunda es que, por fin, por fin, tras años de reescribir, mejorar, aumentar y reducir la parte más grande de mi tesis doctoral, en agosto salió ya publicado el resultado final. Ha sido un proceso larguísimo, pero ha quedado genial y sale en una editorial muy prestigiosa, así que estoy encantada.

La última, que es la más reciente, también tiene que ver con otro libro que acaba de salir. Este lo hemos editado juntas tres amigas y compañeras, la susomencionada Ana Estrada y Bea Martín:

Conspirando libros en un aula vacía de la UAM

Es un libro para todos los públicos —no como el anterior, me temo—, donde hemos juntado a un grupo de dialectólogos de pro para contar de una forma sencilla y asequible algunas de sus investigaciones sobre el español europeo rural. Con el libro queremos celebrar y acercar a todo el mundo el trabajo de Inés Fernández-Ordóñez y sus discípulos (afortunados nosotros), basado en el corpus COSER, que comenzó hace algo más de treinta años. Ya se puede encargar en la editorial Pie de Página (y podéis leer aquí la entrevista que nos han hecho para explicaros por qué el libro os va a encantar).

¡Con una vaca en la portada y prólogo de Inés Fernández-Ordóñez!

¡Medianoche! Cierro, que empieza el semestre nuevo.

El catalán y el gallego I: hablemos de vocales.

1 febrero, 2022Sin categoríaSemevadelalengua

Por la presente y sin más solemnidad que la estrictamente necesaria —es decir, ninguna—, inauguro con esta una serie de entradas donde voy a hablar de cosillas que tienen nuestras lenguas vecinas, el catalán y el gallego. El objetivo es hablar de ellas como lo que son —lenguas—, ya que sobre todo estamos acostumbradas a oír de ellas como lo que no son —armas—.

Hace ya algún tiempo hablamos por aquí de las vocales del español, llegando a la conclusión de que tener solo cinco vocales es en realidad un poco aburrido y extremadamente mainstream. En realidad, tener siete u ocho, como tienen el gallego o el catalán, tampoco supone el colmo de la originalidad, pero nos puede resultar sorprendente, sobre todo porque el español tiene la suerte de tener tantas vocales como… letras para sus vocales. Tanto el gallego como el catalán tienen esas mismas letras, pero tienen más sonidos vocálicos, por lo que no se distinguen todos en la escritura (ambas lenguas usan tildes en algunas ocasiones para distinguirlas, pero nunca de forma sistemática).

Para explicar las vocales de estas dos lenguas creo que viene bien entender —y sé que me la estoy jugando: el que pase de este párrafo es un incondicional— de dónde venimos, es decir…: saber qué pasaba en latín.

Al principio de los tiempos, el latín tenía 10 vocales. Parecen muchas, pero en realidad podemos decir que tenían dos series de cinco vocales: las mismas que el español, pero una serie larga (escrita con una rayita por encima) y otra serie breve (escrita con un semicírculo por encima). En español, las vocales no se diferencian por su duración, pero en muchas otras lenguas sí: el latín era una de ellas. Básicamente, tenían una /a:/ que duraba más y otra /a/ que duraba menos, una /e:/ que duraba más y otra /e/ que… Bueno, ya lo van pillando. [Los dos puntos indican mayor duración.]

La cuestión es que ese sistema de diez vocales sufrió algunos cambios y acabó quedándose en un sistema de siete vocales, que es el sistema del que descienden las vocales de la mayoría de las lenguas romances (las excepciones son el sardo y el rumano). Lo que ocurrió fue que se perdió la diferencia de duración —que también llamamos de cantidad— y algunas vocales que sonaban parecido se fusionaron. En el esquema de abajo pueden ver ese proceso de fusión, donde habrá un par de cosas que quizá les sorprendan.

La primera es que quizá no saben qué narices es eso de /ɛ/y /ɔ/, que son los símbolos del alfabeto fonético para representar dos vocales más abiertas que la /e/ y la /o/ respectivamente, pero más cerradas que la /a/. Abran la boca para decir una /a/ y vayan soltando el aire continuamente mientras van adaptando su boca para decir una /e/. Paren antes de llegar. ¡Ese sonido (más o menos) es una /ɛ/! Y lo mismo pueden hacer con la /o/ y la /ɔ/.

La segunda cosa sorprendente es que, en vez de fusionarse las dos ues, las dos oes, etc., hubo un poco de batiburrillo: la i breve (ĭ) se fusionó con la e larga (ē) y lo mismo ocurrió con la u breve (ŭ) y la o larga (ō). Esto se debe a que, además de diferenciarse por su duración, en realidad las vocales latinas también se pronunciaban con una abertura de la boca un poco distinta, que permitió que se acabaran pareciendo más esos pares entre sí. Pero dejemos al latín ya en paz.

Simplificando enormemente, podríamos decir que el catalán y el gallego se quedaron con esas siete vocales y santas pascuas. Por ejemplo, en gallego, no es lo mismo oso, pronunciada con /o/ que óso,pronunciada con /ɔ/. La primera significa ‘oso’ y la segunda, ‘hueso’ (en los enlaces pueden escucharlas). Y lo mismo pasa en catalán, donde be (con /ɛ/) significa ‘cordero’ y bé (con /e/) significa ‘bien’.

Lo que ocurre es que esto es verdad solo a medias, porque este sistema de siete vocales en realidad se corresponde a las vocales que aparecen en… ¡sílaba tónica! ¿Cómo? ¿Las vocales del catalán y del gallego son distintas según tengan acento o no? (Ojo, que no estamos hablando del acento gráfico, de la tilde, sino del acento que hace que una sílaba sea más fuerte que otra). Volviendo a la pregunta: pues sí, pero no, pero sí. Vayamos por partes, empezando con el gallego.

En gallego, en sílabas átonas no pueden aparecer ni la /ɛ/ ni la /ɔ/. Y, en sílaba final, solo pueden aparecer tres vocales, la /a/, la /e/ y la /o/. De hecho…, eso es exactamente igual en español. Hay solo unos poquitos sustantivos que acaban en -i o -u en español y, en general, son extranjerismos —tribu, esquí, menú—. Igual que en gallego. (Sí, he especificado sustantivos, porque otros tipos de palabras van por otro camino.) Es más, el sistema vocálico del español y el gallego en realidad son paralelos: lo que pasa es que el español, en vez de conservar la /ɛ/ y la /ɔ/, ¡las diptongó! Pé en gallego es pie en español y, como vimos antes, ósoen gallego es hueso en español. Y tan ricamente.

El catalán, en cambio, va por otro camino. Al menos parte del catalán, porque los dialectos occidentales (es decir, oeste de Cataluña y el valenciano) tienen un sistema átono idéntico al del gallego o el español. Pero los dialectos orientales, que son la base del catalán estándar de Cataluña, van a su bola. En posición átona reducen su sistema vocálico, sí, pero no es que se queden con algunas de las vocales que ya tenían, sino que también añaden una nueva.

El sistema átono del catalán es más reducido que el del español y el gallego, pues tiene solo tres vocales. La /i/ se queda tal cual; fusiona la /o/, la /ɔ/ y la /u/ en /u/, y amalgama la /a/, la /ɛ/ y la /e/ en una vocal distinta, que llaman vocal neutra: la /ə/ (también conocida como schwa). Esta es una vocal que se pronuncia por el medio de la boca, abriendo la boca ni mucho ni poco… Es decir, es como una vocal muy anodina, pero, por lo que sea, como que tiene gancho, no sé. No hay lingüista que no le ponga ojitos a una buena schwa.

En conclusión, las vocales del gallego, el español y el catalán salieron del mismo punto de partida (el sistema de siete vocales del latín), pero fueron tomando caminos ligeramente distintos, a pesar de que les afectaron condicionamientos muy similares (como el hecho de que la vocal sea tónica o no). Una última advertencia: en las dos lenguas hay diferencias dialectales que hacen que lo que he explicado no aplique exactamente a todas las variedades. En realidad, la historia de los tres sistemas es un poco más complicada (que si la diptongación, que si las vocales se influían unas a otras…). ¡Pero si sigo, pierdo hasta a los incondicionales!

Nota: para que puedan saber mejor cómo suenan todas las vocales de las que hemos hablado, aquí les dejo un enlace donde pueden escuchar los sonidos del alfabeto fonético internacional (AFI), aunque la verdad que los audios estos que se graban para ilustrar el AFI son algo exageradillos. ¡Pero muy entretenidos!

Ca padres, por Navidad

28 diciembre, 2021Sin categoríaSemevadelalengua

Acaban de entrar un montón de palabras en el Diccionario de la Lengua Española (las pueden consultar aquí) y acaba de salir un artículo mío sobre una palabra (¿dos?) que todavía no está. ¿Casualidad? Ya lo creo. La palabra en cuestión es ca, con el significado de ‘casa’, que han oído ustedes mil veces en ejemplos como estos (sacados del COSER):

Vamos esta noche en ca mi tía (Barrax, Albacete)
Comían a ca su suegra (Orellana de la Sierra, Badajoz)
Vas a buscarlas an ca los matanchines (Alaraz, Salamanca)

Estos usos en español se consideran vulgares y están bastante restringidos a las variedades rurales, aunque es una pena: fíjense en el francés, que con el mismo origen ha creado una preposición de lo más molona, chez. Ese origen de ca es fácil de imaginar: a partir de una secuencia como en casa de se empieza a producir un proceso de desgaste fonético: la preposición de se pierde con bastante facilidad (maestro escuela), entre otras cosas porque la d que aparece entre vocales se pierde con muchísima facilidad (cantao, to…). El paso de casa a ca es más raro: parece que hubo un paso intermedio cas, del que les hablo luego. Y luego queda una cosa interesante: la preposición que va delante. Si se fijan en los ejemplos de arriba, a veces tenemos en cuando normalmente diríamos a —porque es un verbo de dirección— o viceversa —con verbos estativos tenemos a—, y ¡hasta tenemos una preposición mixta an! Lo primero se debe a usos antiguos de la preposición en; lo segundo, quizá a una sobregeneralización de a, y lo tercero, a una fijación de la secuencia en ca, que al congelarse, puede aparecer precedida de otras preposiciones. Esta preposición puede incluso llegar a perderse (dando un resultado sintácticamente idéntico al chez francés):

Que es que voy ca Ceferina (Pedro Jiménez López, Cascarroteos y Repalandorias, 1912)

En el artículo investigo tanto la distribución dialectal de ca como su historia. Lo primero que llama la atención es la tremenda variación que se encuentra en español a este respecto. Consultando corpus de entrevistas orales y de textos escritos, así como los atlas lingüísticos encontramos que cualquiera de las formas posibles, ya sea ca, cas o casa, puede aparecer seguida o no de la preposición de y precedida de cualquiera de las preposiciones indicadas anteriormente en cualquier contexto o, incluso, sin preposición. Un caos, vamos. Pero en realidad el caos no es absoluto, porque sí hay algunos patrones más frecuentes que otros. La ausencia de de y el uso de en con verbos de dirección, por ejemplo, son mucho más frecuentes con ca que con cualquiera de las otras dos formas.

Otro hallazgo interesante que nos dan los atlas (aunque esta información es bastante parcial), es que las formas reducidas son frecuentes en todas las variedades peninsulares del español excepto… en la zona del navarro-aragonés. La ausencia de ca en español estándar, entonces, no viene de una cuña castellana —¿les suena? Sí, hombre, la hipótesis de Menéndez Pidal de que el español se extendió hacia el sur en forma de cuña desde Castilla—, sino que podría tener origen navarro-aragonés. No sería la primera vez que pasa. (Y, si esto les parece interesante, no puedo más que recomendarles vivamente el discurso de ingreso en la RAE de Inés Fernández-Ordóñez. Lo pueden leer aquí y/o ver aquí.) Ah, por cierto, en Canarias se prefiere la forma casa, pero cuando se usa la reducida, la más común es cas y no ca.

Estos datos vienen del Atlas Lingüístico de la Península Ibérica, del que ya hablamos aquí, y se los tengo que agradecer a Ana Estrada Arráez, que me los prestó en pleno confinamiento

El estudio de la historia de ca es difícil, porque su carácter vulgar o rural hace que sea difícil seguirle la pista en textos escritos… Salvo algunas documentaciones aisladas más tempranas, esta forma empieza a aparecer en los textos a partir del siglo XIX y siempre puesta en boca de hablantes de los estratos sociales bajos o en textos de la oralidad popular:

Estos datos vienen de todos los corpus textuales que pone la RAE a disposición de cualquiera

Pero los textos nos muestran algo muy interesante: la forma semirreducida cas fue bastante usada desde el siglo XV hasta el XVII y entonces no se considera necesariamente una forma vulgar… Miren, miren quiénes la usan:

Pássate por en cas de vn aloxero, y díle que me muero. (Lope de Vega, 1605)
Llevarte en cas de busconas es sola tu medicina […] (Francisco de Quevedo, 1621)

Y esta es un poco toda la movida. Que he pensado que de vez en cuando no está de más compartir las cosas académicas que voy haciendo. Y eso, que… ¡feliz Navidad!

Un par de palabras

1 diciembre, 2021Sin categoríaSemevadelalengua

Empiezo este post con el título de una canción de Hombres G, no porque Spotify acabe de decidir revelarnos ocultos secretos de nuestra personalidad nada sorprendentes, sino porque hace dos semanas exactas descubrí, bueno, confirmé, que mi nivel de alemán estándar es mucho peor del que todo el mundo se empeña en creer. Y una de las estupendas consecuencias fue aprender que la palabra Wort, que significa ‘palabra’, tiene dos plurales en alemán: Wörter y Worte. A ver, tener dos plurales no es lo más fascinante de esto, sino que cada uno de ellos ¡se refiere a una acepción distinta de Wort! Mientras que Wörter se refiere a ‘palabra’ en el sentido estricto, es decir, ‘unidad lingüística con significado’, Worte se refiere a ‘palabra’ como ‘discurso’.

Es decir, para una frase como «En esta oración hay tres palabras que no comprendo» usaríamos Wörter, mientras que en una frase como «Nos dijo algunas palabras de ánimo» usaríamos Worte. Por eso diccionario se dice Wörterbuch (como habrán adivinado, ‘libro de palabras’), mientras que para charlatán existe Wortemacher, que literalmente significa ‘hacedor de palabras’.

Este caso es muy parecido a uno que comenté aquí hace ya un lustro (se dice pronto): el de la contienda entre sé y sepo como primera persona del singular del verbo saber cuando significa ‘tener sabor’. Lo apasionante de estos casos es que en ellos es la flexión y no la derivación la que se emplea para marcar dos acepciones distintas. Esto no es muy común, sobre todo porque la flexión no suele presentar tantas alternativas morfológicas como la derivación. Es decir, para crear sustantivos a partir de verbos tenemos –miento (tratamiento), –ción (perdición), –azgo (liderazgo), –anza (templanza), entre otras muchas posibilidades, y podemos elegir entre ellas con cierta libertad.

Los morfemas flexivos, como los del plural, presentan muchas menos formas y estas suelen repartirse en virtud de criterios fonéticos o morfológicos bastante claros. El caso del plural del español es paradigmático (valga el chiste, que es para muy cafeteros): a grandes rasgos, las palabras acabadas en vocal toman –s (casa ~casas), las palabras acabadas en –s no cambian (crisis ~ crisis) y las palabras acabadas en otras consonantes o en semivocal toman –es (camión ~ camiones, rey ~reyes). El margen de error es muy pequeño: quitando algunos préstamos, que sí dan más problemas, también son problemáticas las palabras agudas que acaba en –í o en –ú (¿esquís, esquíes o esquises?, ¿menús o menúes?), pero son muy pocas.

Con las terminaciones de género viene a pasar lo mismo. El femenino presenta algunas posibilidades más de formación y genera algunos dobletes (como fuerza {motriz/motora}). De hecho, estos dobletes nos dan por lo menos un caso de diferenciación semántica: directriz, que significa’norma’, y directora, que significa ‘mujer que dirige’. Este es un caso equiparable al de Wörter/Worte, que también es posible en alemán porque en esta lengua ~~del infierno~~ maravillosa existe un buen puñado de morfemas del plural.

En fin, que un traductor se encontraría con un problema para traducir el título de la canción de Hombres G. Aunque en principio parece obvio que Un par de palabras debería ser Ein paar Worte, porque aquí palabras vale por ‘discurso, algo que decir’, en otra canción suya, No te tengo a ti, acuden a un interesante juego de dobles sentidos:

Para qué escribir canciones, a quién quiero mentir
Para qué un par de palabras, te quiero y no lloraré

Un par de palabras, Te quiero y No lloraré son títulos de canciones suyas, pero la oración resultante de esta lista de canciones también tiene una lectura literal que se aprovecha del hecho de que un par puede ser un indefinido (cuando significa ‘unas cuantas’) o tener un valor numérico concreto (cuando significa ‘dos’). En el primer caso, el alemán usaría Worte, pero en el segundo… creo que preferiría Wörter.

Así que cuando os digan lo de «El alemán tiene muchas cosas intraducibles, algunos conceptos solo se pueden decir en alemán, por eso es la lengua de la filosofía» podéis contestar ufanamente «Bueno, pero no daría para traducir bien a Hombres G, así que tampoco nos flipemos».

«No sé hablar»

31 octubre, 2021Sin categoríaSemevadelalengua

Antes del verano me llamaron por teléfono para persuadirme de que contribuyera a una ONG (espóiler, teleoperadores del mundo: soy fácil de persuadir) y, ya no recuerdo a cuento de qué, la señora que me llamó me pidió perdón por su forma de expresarse, que «su marido le decía que no sabía ni hablar». Evidentemente, me ofrecí a extenderle un certificado explicándole al pieza de su marido que su mujer habla perfectamente.

Hace unas semanas leí esta entrevista a un futbolista, Fali (parece ser un estupendo futbolista, pero admito que yo no sabía quién era: espóiler, futboleros del mundo, no me sé ni la alineación del Atleti), donde aparece este fragmento:

Otra vez el infame «no saber hablar». Les informo: en el mundo hay muy pocos adultos que no sepan hablar. En el mundo hay muy pocas personas de más de… ocho años, año arriba año abajo, que no sepan hablar. No saber hablar es el resultado de un deterioro cognitivo importante, que no es el caso ni de Fali ni de la teleoperadora que me llamó. En este contexto, «no saber hablar» significa ‘no manejar la lengua estándar’, que es una cosa totalmente distinta. En este blog ya hemos hablado de la norma (y del cambio lingüístico, del uso, de que la lengua la hacen los hablantes, del papel de la RAE) y no somos ajenas al hecho de que no saber manejar la lengua estándar tiene penalizaciones sociales importantes, pero la más grave parece ser la de convencer a la persona que no la maneja de que… no sabe hablar. La falta de autoestima que conlleva esto es tanto más grave cuando nos damos cuenta de que las normas del estándar son absolutamente arbitrarias (desde el punto de vista gramatical, aunque no del social).

Vamos al caso que dice Fali, que es uno de mis favoritos. El me se ha caído. La regla mnemotécnica que menciona el futbolista la habremos oído todos alguna vez (o casi todos los españoles, porque este orden de los pronombres no se encuentra ni en Canarias ni apenas en América), pero no sirve para explicar nada. De hecho, las semanas no van antes que los meses: las semanas forman parte de los meses. Y, aunque lo fueran: ¿qué tendrá que ver eso con los pronombres átonos del español? NADA. NA-DA. ¡Ja!, siempre me escamó esa explicación y por fin me ha llegado la oportunidad de resarcirme. La cuestión es que no hay ningún motivo por el que la secuencia se me ha caído sea mejor que me se ha caído. Estas secuencias de pronombres no existían en latín, así que no podemos aducir un argumento etimológico. Nacen en las lenguas romances. Y ahí está la prueba de que la arbitrariedad gramatical del estándar: en italiano el orden estándar es el contrario: mi si é rotto un dente es como se dice ‘se me ha roto un diente’, pero literalmente es me se ha roto un diente (bueno, me se es roto un diente, pero ese es es por otras cosas que no vienen al caso).

Los lingüistas se han devanado los sesos para explicar los órdenes de los pronombres en las lenguas romances y, honestamente, estamos lejos de llegar a una regla elegante que te haga exclamar «¡Ah, claro, tal orden es el más lógico/eficiente/útil!». No. Son un caos. Son como son porque sí y podrían haber sido de cualquier otra manera, como nos demuestran las diferencias entre lenguas… y la variedad interna de las lenguas. Porque la demostración de que podrían haber sido de otra manera la tenemos en el propio español, que nos da los dos mundos posibles: aquel en el que las semanas van antes que los meses y aquel en el que los meses van antes que las semanas. Uno de esos dos mundos se convirtió en el culto y el otro se consideró vulgar, pero, desde el punto de vista de la eficacia comunicativa o la lógica del sistema, los dos son igualitos. Fali, habla usted divinamente. Simplemente usa una variedad a la que no le ha caído en gracia ser la variedad estándar, pero le puedo asegurar que las dos son exactamente igual de inexplicables. Y, además, no está usted solo: estas formas, aunque cada vez menos usadas, se usan en muchas hablas no normativas y son especialmente frecuentes en el oriente y el sur peninsulares (el levante y el mediodía peninsulares, por si me lee algún meteorólogo). Aquí les dejo un mapita a partir de los datos del COSER.

Dejo por aquí la referencia del artículo para el que hice el mapa, por si quieren saber por qué me apasionan los llamados «vulgarismos»

Pues eso. Que decirle a la gente que no sabe hablar sin haber pasado días tratando de averiguar los condicionamientos sistémicos del orden de pronombres del español es intrusismo laboral y…, venga, otro espóiler: sale regular.

La Palma: isla llena de gracia, de buenas horas y de vida

29 septiembre, 2021Sin categoríaSemevadelalengua

En esa isla bonita que es La Palma y que ahora está en las mentes de todos, teníamos puesta nuestra mente desde hace meses varios intrépidos filólogos , porque es una de las dos islas objeto de estudio del proyecto Rurican, que dirijo desde la Universidad de Zúrich, y con el que queremos recoger los cambios sociales y lingüísticos de las últimas décadas en la isla. La pandemia no nos había dejado acercarnos hasta allí durante el primer año del proyecto, pero el día 5 de septiembre pudimos aterrizar en la isla para empezar el trabajo de campo. Durante dos semanas hicimos entrevistas en las que, además de descubrir muchas cosas sobre la vida y costumbres de La Palma (y de comer divinamente, todo hay que decirlo), pudimos disfrutar de algunas maravillas lingüísticas que paso a compartir.

Por ejemplo, escuchamos la expresión de gracia, que significa ‘gratis’, pero que ya no es la forma más común de decirlo. La palabra gratis viene de un ablativo plural latino, es decir, aunque no contenga ninguna preposición viene a significar algo como ‘por las gracias’ (traducen Corominas y Pascual, no yo). Y es que, si se fijan, gratis puede ser un adjetivo o un… ¡adverbio! Es adverbio cuando decimos lo hicieron gratis. Y, si lo piensan, los pocos adverbios que no acaban en -mente en español tiene significados que parecen fundamentales cognitivamente hablando: espaciales (lejos, cerca), temporales (ahora, entonces), modales (así). Y luego viene gratis, que significa ‘sin pagar’. Que es un significado excelente, no me entiendan mal, pero no parece que se sitúe en el centro de la cognición humana. Pues gratis es adverbio porque lleva dentro ese ablativo original. En cambio, de gracia es ya una forma más castellana (es decir, menos latina) de decir lo mismo, con su preposición y su sustantivo, como debe ser. Y de este pequeño jaleo sale la mezcla de gratis, que con la preposición ya le da una estructura castellana a la cosa, pero se queda con la forma latina que, no nos vamos a engañar, es mucho más chic.

Aprendimos también una expresión que nunca habíamos oído (y que no encuentro documentada en los corpus de referencia más importantes del español): dar las buenas horas. Quizá lo hayan adivinado: es un sinónimo de saludar. Las buenas horas, por tanto, son los buenos días, las buenas tardes, las buenas noches… Eso de buenas horas lo usamos en algunas expresiones: ¡a buenas horas! significa que algo se hace con retraso, en buena hora o enhorabuena sonfelicitaciones, de buena hora significa ‘temprano’… Pero este contexto nos es desconocido y no parece estar documentado en otras fuentes. Hace poquísimo me preguntaba de dónde salía ese femenino cuando saludamos genéricamente con un ¡Buenas!, ¿será que lo que nos hemos comido es un horas? La verdad que merece la pena ponerse a indagar, aunque yo no sepa por dónde.

Un último ejemplo: nos encantó el uso de la palabra vida como sinónimo de ombligo: varias veces nos explicaron cómo las comadronas se ocupaban de cortar la vida (‘el cordón umbilical’) a los recién nacidos. Según el Diccionario Histórico del español de Canarias este uso viene de una etimología popular a partir de la forma portuguesa vide, que, efectivamente, hace referencia a una parte del cordón umbilical. ¿Que qué significa etimología popular? Pues se refiere al cambio fonético que sufre una palabra por influencia de otra que suena parecida y con la que tiene alguna relación de significado: por ejemplo, mondarina en vez de mandarina (ya que hay que mondarla) o vagamundo por vagabundo (¿por dónde se vaga, a ver?). La verdad es que la conexión entre ombligo (vide) y vida es más que evidente.

Si queréis saber algunas de las otras cosas que aprendimos, conté un par más en este hilo de Twitter. Y, si os parece interesante el proyecto, podéis seguirnos en nuestra cuenta de Instagram o consultar nuestra página web, que poco a poco irá teniendo más contenido, porque tengo dos compañeros (Elena Padrón y Antonio Corredor) que siguen allí, continuando su trabajo en unas circunstancias absolutamente excepcionales: muchísimas gracias a ellos y muchísimas gracias a todos los palmeros que siguen prestándose a colaborar y a ayudarnos para poder recoger las formas de vivir y las formas de hablar de una isla espectacular que está sufriendo tremendamente. Una isla que desde hace unos días nos ha hecho entender a todos lo que es de verdad un volcán. Una isla que nos hace reflexionar sobre la contradicción que entraña que la catástrofe terrible que es esta erupción resulte inevitablemente un espectáculo fascinante, porque no puede no serlo la tierra partiéndose para expulsar lava. Y una isla a la que, en cuanto se pueda, habrá que volver para visitar sus pueblos y recorrer su naturaleza, para comer sus plátanos, sus príncipes albertos y, sobre todo, su queso asado, pero no solo porque lo vayan a necesitar, sino porque bien lo merece. Que el próximo día de San Miguel le sea mejor que este.

Lo que no decimos

16 agosto, 2021Sin categoríaSemevadelalengua

Hablar una lengua romance es una suerte, pues te pone al alcance de los dedos un buen puñado de lenguas habladas por mucha gente, que, como se parecen a la tuya, son relativamente fáciles de aprender. De hecho, un entretenimiento más de las vacaciones en un sitio donde hablan una lengua romance desconocida es descifrar los carteles. Pero, de vez en cuando, nos topamos con palabras que se parecen como un huevo a una castaña. Por ejemplo, ¿cómo que en catalán nada se dice res? Pues… ¿y si te digo que estas dos palabras comparten origen? ¿Qué tiene que ver la velocidad con el tocino? ¿A qué huelen las cosas que no huelen?

El origen de res y de nada está en el latín res nata, que significa literalmente ‘cosa nacida’. Res es ‘cosa’ y nata es el participio de nascere ‘nacer’: en español medieval nado ya competía con la forma regularizada nacido, que se acabó imponiendo. ¿Y cómo res nata, que no tiene un valor negativo intrínseco, sino más bien al contrario, pasa a significar ‘nada’? Esto no es tan raro como puede parecer a primera vista, pues expresiones que significan ‘todo’ pueden servir como enfatizadores en contextos negativos:

—¡No hay cosa en el mundo que me guste más! = ¡No hay nada que me guste más!

Si los usamos con suficiente frecuencia, acabarán adquiriendo esos significados negativos. Así ya no parece tan raro que en francés personne signifique ‘nadie’ o pas ‘no’, ¿no? Este otro ejemplo de aquí es precioso:

El sufrimiento de aprender español 🥲

Parte 57%&*]%|~¥=_ pic.twitter.com/h9EmHaNTit
— China Cochina (@mad4yu) April 14, 2021

Más allá de este maravilloso cambio de significado, el catalán y el español tomaron caminos distintos. En las dos lenguas se acortó la frase original*, pero se hizo por sitios distintos: el catalán se quedó con res y el español, con nada (ese paso de -t- a -d- es totalmente regular en la evolución del latín al español). Acortar tampoco es raro, sobre todo en palabras que se usan mucho: si se fijan, las palabras gramaticales (como los artículos, las preposiciones, los auxiliares, etc.) tienen tendencia a ser más breves que las palabras léxicas (sustantivos, adjetivos…): eso es porque las usamos todo el rato y, además, son bastante predecibles, por eso nos permitimos con frecuencia pronunciarlas más rápida o descuidadamente o, incluso, cortar por lo sano, como en este caso.

Lo que me hace gracia de este acortamiento es que el español se quedó con la parte… absurda. ¿Qué es eso de quedarse con el adjetivo (‘nacida’) en vez de con el sustantivo (‘cosa’)? (Quizá esta es la típica cosa que solo me sorprende a mí, no sé.) ¡Y no es el único caso en el que lo hacemos! Cuando un inglés quiere acortar el saludo mañanero te dice «Morning» (sustantivo), comiéndose el good (adjetivo). Y cuando a nosotros se nos hace largo un saludo decimos «Buenas» (adjetivo), comiéndonos los sustantivos (¿tardes?, ¿noches? Días no parece, porque es masculino, aunque «Buenas» lo podamos decir en cualquier momento…). Esto me lo hicieron notar hace poco cuando mencioné que, en alemán suizo, antes de comer te desean «En guete», que significa literalmente ‘un buen’. No dicen el Appetit (sustantivo), porque se sobreentiende. Igual que para despedirse te desean «Schöne», literalmente ‘hermoso, bonito’. ¿Bonito qué? Pues día, tarde o noche, según la hora que sea. Qué va a ser. En todos estos casos, el adjetivo que sobrevive al acortamiento adquiere un significado nuevo, que ha absorbido de la combinación que formaba con el sustantivo que nos hemos comido: se ha lexicalizado.

Lo que no decimos… se sobreentiende. Te esperabas algo más sentido de este título, ¿eh? ¡Ja! Te atrapo con un título cursi y te echo una chapa sobre historia de la lengua y cambio semántico, a ver qué te crees que es esto.

*Parece que en al menos algunas variedades baleares se mantiene la forma res nat, sin acortar.

El español y sus cosas III: ser o estar, esa es la cuestión.

31 julio, 2021Sin categoríaSemevadelalengua

Nunca es tarde si la dicha es buena, así que retomo la serie «El español y sus cosas», de cuyas primera y segunda entrega hace ya por lo menos varios siglos. Vamos a hablar de cópulas. (Breve pausa para que digan «jijiji» para sí mismos.)

Que diferencie tan bien entre ser y estar
— Zarrapatiestos (@ranoeldelbar) July 4, 2018

La sutil (?) diferencia entre ser y estar. Así, de primeras, sin pensarlo mucho.
— Ail. (@Ail_len) July 4, 2018

Me gusta mi idioma por su musicalidad, su amplitud de vocabulario… Y ante todo, por su diferenciación entre "ser" y "estar". Porque es importante saber que no todo lo que es, está. Y viceversa.
— Carmen (@LaGovanilla) July 4, 2018

Empecemos por el principio, que ya saben ustedes que era el verbo. En general, en una oración el verbo es el que nos da la clave de la información que se dice del sujeto: por eso lo llamamos el núcleo del predicado. Predica algo del sujeto. Eso es lo que hace ganar en una frase como:
Carreño gana una medalla de bronce en un partidazo contra Djokovic.

Pero no todos los verbos son así, algunos tienen muy poquito significado y llegamos a decir que están vacíos (o casi). Esto les pasa a los verbos auxiliares: Si digo ha ganado o fue vencido, los verbos haber (ha) o ser (fue) no aportan contenido léxico (eso lo hacen ganar y vencer), sino información gramatical (tiempo pasado o voz pasiva). Los verbos copulativos también son verbos vacíos en ese sentido, pero la diferencia con los auxiliares es que el contenido léxico no lo da otro verbo, sino otras clases de palabras (generalmente sustantivos o adjetivos). Así, en Carreño es medallista olímpico y Carreño estaba feliz, el núcleo de la información que se predica de Carreño es medallista olímpico y feliz, mientras que ser (es) y estar (estaba) nos dan información del tiempo verbal (presente o pasado). Y por eso lo llamamos cópula (o verbo copulativo), porque su función se limita a unir dos piezas fundamentales de información: el sujeto y el predicado.

De hecho, como la cópula aporta tan poca información, hay muchas lenguas que pueden omitirla (o prefieren hacerlo, incluso) cuando está en presente. En ruso, por ejemplo, te basta con decir María simpática (pero en ruso, claro) para que se entienda ‘María es simpática’. En inglés también pasa, aunque con mucha menos frecuencia: You ready? De hecho, diría que también pasa en español en contextos similares (¿Preparadas?), pero, como no tenemos sujeto obligatorio, parece menos sorprendente. En inglés te quedas un poco como «¿Pero ese you qué hace ahí?». Pues ser sujeto, qué va a hacer.

Al grano. ¿Por qué tenemos dos verbos para esto? Si pensamos en otras lenguas cercanas y conocidas, como el inglés, el francés, el alemán, etc., esto parece una peculiaridad del español, ya que estas lenguas solo tienen un verbo (to be, être, sein). Además, es uno de esos rasgos que los extranjeros tardan en dominar (Soy muy contento de ser aquí, por ejemplo). En realidad, es una peculiaridad de las lenguas ibero-rromances, pues la compartimos con el portugués, el gallego y el catalán. En cualquier caso, ¿para qué dos verbos cuando a la mayoría les basta con uno?

Si intentamos pensar en la diferencia entre ser y estar, lo más probable es que lleguemos a la conclusión de que ser sirve para hablar de cosas permanentes y estar, para hablar de cosas temporales. Uno es feliz, pero está contento, por ejemplo. ¿Pero entonces por qué decimos estar muerto? Sin ánimo de trivializar, pero pocas cosas más definitivas que palmarla. La distinción que establecen ser y estar en español es todavía más sutil: es la diferencia entre lo que son características propias de un individuo (predicados de individuo) y los estados (predicados de estadio). Los primeros van con ser y los segundos, con estar. Muerto, como embarazada o acaloradísima, es un estado, independientemente de cuánto duren. Alegre, leal y pelirroja son características, incluso si pueden cambiar a lo largo del tiempo.

Pero, claro, qué es una característica y qué es un estado es prácticamente una cuestión filosófica, así que no siempre está tan clara. De hecho, quizá usted ya haya pensado «¡Pero si también puedo decir Estoy feliz sin ningún problema!». Y tendría mucha razón. No es raro que recategoricemos adjetivos de individuo como adjetivos de estadio: ¡Uy, qué torpe estás hoy! Qué raro, si tú no eres nada torpe. Muchas de estas propiedades pueden conceptualizarse como estados transitorios y al español le basta cambiar de verbo copulativo para indicarlo. Lo contrario (recategorizar un adjetivo de estadio como uno de individuo) es más raro, aunque también ocurre a veces: soltera es un estado y por eso generalmente una lo está, pero no es inaudito decir Es soltera. Con casada también lo podemos hacer, pero es más raro (está casada > es casada): sería más habitual decir Es una mujer casada. Este truco es bueno, porque estar no admite sustantivos: tenemos que usar ser. Bueno, no admite casi ningún sustantivo: sí admite aquellos que, básicamente, conceptualizan estados, como Estar el primero en la cola. Además, hay algunos adjetivos que pueden combinarse con los dos verbos, no porque los conceptualicemos de formas distintas, sino porque son polisémicos. No es lo mismo ser malo que estar malo, ni ser despierto que estar despierto. Ojo: ahí la magia no la hace el verbo, sino el adjetivo.

En cualquier caso, si lo de tener dos cópulas nos parece un lío, qué nos parecerán los verbos pseudocopulativos de cambio de estado. ¿Lo cuálo? Pues eso que en inglés se dice become y en alemán, werden. En español tenemos hacerse, volverse, ponerse y quedar(se). Se hizo médico, se volvió tarumba, se puso como una fiera, se quedó de piedra. Los dos primeros aparecen con predicados de individuo, como ser, mientras que los dos últimos aparecen con predicados de estadio, como estar. Pero, claro, alguna diferencia más debe de haber, porque no es lo mismo Me he hecho suiza que me he vuelto suiza. Lo primero es que he adquirido la nacionalidad; lo segundo, que llego puntual a todas partes y me molesta el ruido. Vamos, un jaleo. Uno que yo no me sé bien, además.

¿Y que por qué los llamamos pseudocopulativos? Pues porque no funcionan igual que los copulativos, siendo la diferencia fundamental que en estos podemos sustituir el atributo por lo, pero en aquellos no:

Es leal – lo es.
Está triste – lo está.
Se hizo médico – * se lo hizo
Se volvió tarumba – *se lo volvió
Se puso como una fiera – *se lo puso
Se quedó de piedra – *Se lo quedó

Vamos, que ya lo decía Alejandro Sanz. No es lo mismo ser que estar, ni estar que quedarse. Al menos en español.