De, la, que, el, en, y, a, los, se, del, las, un, por, con, no. De las 154.212.661 palabras (ciento cincuenta y cuatro millones doscientas doce mil seiscientas sesenta y una) que recoge el Corpus de Referencia del Español Actual (CREA), las quince más frecuentes en español son monosílabas. Y además solo hay una que, en rigor, signifique algo. No.

Nos lo explicaron en la facultad el día de la productividad léxica y las clases abiertas y cerradas de palabras. Pasan los años y hemos inventado cibersexo, chatear, tuiteable o wikipédicamente, pero de primeras no parece posible hacer lo mismo con preposiciones, conjunciones o determinantes. Nos dijeron —y nos lo creímos—que estas palabras tan pequeñas y tan vacías de significado son las que definen nuestro idioma, las que utilizamos constantemente sin darnos cuenta de que lo hacemos; las que nos sostienen. Que lo más importante que tenemos es lo que no quiere decir nada, en suma. Y ahora, mirando esa lista, vemos que sí, que era verdad.

Otro día, tal vez en otra asignatura, nos contaron que la mayor parte de las palabras más frecuentes en nuestro idioma son monosílabas por una mera cuestión de interés o de optimización: si vamos a estar repitiendo todo el rato lo mismo, más nos vale que por lo menos sea breve. No tendría sentido emplear preposiciones de cuatro sílabas: qué largo. Y parece que la lista del CREA también confirma este supuesto.

Volviendo allí, vemos que, en los lugares de honor, bisílabos hay pocos. De las veinte primeras formas, solo una (16) y para (18), a las que siguen como (22) y pero (25); a partir de sobre (32), que añade a lo prepositivo lo sustantivo, ya hay muchas más. Los trisílabos vienen un poco más tarde: prescindiendo de tonicidades y cuestiones métricas y considerando también (42) como bisílabo, entonces el primero es había (44), seguido de lejos por ahora (73), gobierno (86), durante (88), estado (104) y general (111), que es el militar que todos llevamos dentro; o sea: que juega en dos clases.

Es por ahí por donde aparecen los tetrasílabos: apenas dos docenas entre las quinientas primeras palabras, pero muy interesantes: presidente (115), política (152), importante (227), desarrollo (229), realidad (231), información (262), todavía (270), seguridad (314), mayoría (332), político (356), española (365), condiciones (366), policía (373), Barcelona (413), diferentes (416), relaciones (423), movimiento (460), actividad (464), resultados (482), educación (483), capacidad (486), necesario (488), comunidad (495) y necesidad (496). Se podría escribir un libro sobre estas veinticuatro voces, juntas o agrupadas en pequeños subconjuntos; por lo pronto, y visto lo visto, cabe suponer que cuando lleguen los próximos recuentos la mayor parte de ellas habrá escalado unas cuantas posiciones, como hace Amancio Ortega en cada edición de la lista Forbes.

Para quien busque respuestas, es revelador ojear la lista y comprobar que el poder (166) está situado exactamente entre nunca y aquí, y la casa (122) entre hacia y ellos; que el hombre (135, entre España y están) sigue por encima de la mujer (181, entre fueron y frente) en esta sociedad machista (22.546, entre inspirados y neandertales); que la mentira (3471) separa la guerrilla de la tranquilidad, y que la pelea (4663) tiene que ver con (porque afecta a) libertades y escolares.

Pero no tan deprisa: no hay que olvidar que la mitad de los datos del CREA (que arrancan de 1975) proceden de España. Este desequilibrado equilibrio se corregirá en parte cuando llegue el Corpus del Español del Siglo XXI, que parece optará por un cambio de porcentajes, aun así todavía poco representativo (30% para España, 70% para América). Tal vez de ese modo disminuyan ciertas distancias, como las seis mil y pico posiciones que median entre Madrid (140, entre lugar y nacional) y Montevideo (6404, entre trozo y relevante), por ejemplo. Y probablemente se diluyan un poco palabras que no lo son y que sin embargo están bastante arriba, como PSOE (772, entre sola y lejos) o PP (898, entre presenta y revolución).

El Corpus (10.355, entre arresto y funeral) es un proyecto de la Academia (2377, entre cuesta y mando) en colaboración con el Santander (3534, entre renta y misa), sellado aquí con un apretón de manos entre Víctor García de la Concha (5296, entre ajena y meter) y Emilio Botín (9230, entre vocal y divisa), director y presidente respectivos de la una y de lo otro.

Mauro Cadove