Algospeak : la langue humaine garde une longueur d'avance
Anne Gensane, chercheuse en sciences du langage à l'Université d'Artois, travaille notamment sur l’algospeak : ou comment la langue déjoue les règles des algorithmes.
« PC », pour dire plan cul.
La couleur bleue pour dire - sans mots - les violences physiques (les ecchymoses).
« A$$ », pour remplacer « Ass ».
« s3x3 », « s.u.i.c.i.d·e » ou encore « 🇨🇭ide »…
Parce que la langue est vivante, elle est capable de déjouer les censures.
L’expression « algospeak » est née aux alentours 2020. L’idée : éviter la sanction des algorithmes. Se faire comprendre d’autres locuteurs humains, en passant sous les radars des machines. Le langage adopte ici une fonction cryptique.
Anne Gensane, chercheuse en sciences du langage à l’Université d’Artois, consacre une partie de ses recherches à l’algospeak. Vous pouvez la lire notamment chez The Conversation ou (à paraître prochainement) dans « L’algospeak, entre jargon et argot : apports théoriques sur une néologie de l’offuscation » (e-Scripta Romanica).
« L’ambiguïté n’est pas une sorte d’imperfection du langage, mais bien sûr une ressource fonctionnelle qui est mobilisable dans certaines configurations. »
Le mot « algospeak » ne figure pas dans le dictionnaire, mais il est facile à comprendre : parler l’algo, c’est-à-dire concrètement parler malgré l’algo.
Pour qui aime la langue, l’algospeak a des allures de chasse aux trésors, où l’on débusque tantôt des néologismes de forme (modifications graphiques, substitutions phonétiques…) et tantôt des néosémies : glissements ou détournements de sens.
Par nature, l’algospeak évolue constamment : une expression conçue pour échapper à la censure change de forme dès qu’elle est repérée. Pour son travail, Anne cherche à constituer des corpus spécifiques et « des informateurs, des usagers compétents pour m’aider à finaliser une typologie. »
Nous lui avons posé trois questions.
[Le Média sans IA] L’algospeak est crypté, ambigu, éphémère.... Séduisant, en somme ! Dans quelle mesure s’oppose-t-il à la façon d’écrire des IA génératives, dont la langue est par défaut explicite, « propre », fondée sur un langage stable et moyennisé ?
[Anne Gensane] Vous le dites, le langage est vivant, contrairement à ces façons d’écrire de l’IA. L’algospeak est bien une réponse humaine - vivante (et forte) à un potentiellement communicant faux- artificiel, guidé par des humains qui sous prétexte de la protection des publics protègent simplement l’intérêt de leur entreprise.
Les formes que je décris, qu’il s’agisse d’altérations graphiques, de substitutions symboliques, de métaphores ou encore de périphrases) ne fonctionnent qu’à condition d’être replacées dans un faisceau d’indices sémiotiques, c’est-à-dire les dimensions graphique, phonétique, visuelle et finalement plus largement surtout contextuelle. Je pense notamment au fait que l’algospeak est aussi présent à l’oral, dans des vidéos où les silences sont incorporés, ou des signaux sonores. Cette dimension implique une coopération interprétative, mais aussi une part d’incertitude : la compréhension n’est jamais totalement garantie ! Elle est toujours située. En tout cas, c’est précisément cette instabilité contrôlée (la compétence techno-discursive) qui permet à l’algospeak de remplir sa fonction : être suffisamment transparent pour les destinataires humains, tout en restant suffisamment opaque pour l’IA.
Et voilà bien sûr, les algorithmes des plateformes dont nous parlons ne détectent (pas encore ?) les intentions discursives des utilisateurs, le contexte d’énonciation… Le langage humain est encore bien plus complexe qu’un algorithme ! Donc ce contraste permet de reformuler une idée importante, souvent implicite dans les études généralement linguistiques : l’ambiguïté n’est pas une sorte d’imperfection du langage, mais bien sûr une ressource fonctionnelle qui est mobilisable dans certaines configurations. C’est d’ailleurs pour ça que j’étudie l’argot, je le vois comme une essence du langage grâce notamment à cette ambigüité expressive, et c’est pour ça que je me suis vite intéressée à l’algospeak.
« Nommer, c’est déjà exercer un pouvoir sur le réel… Mais ici, ce n’est pas vraiment le locuteur qui choisit ses mots, mais un environnement technique qui l’y a contraint. »
[Le Média sans IA] Vous dites, dans The Conversation notamment, que la créativité linguistique de l’algospeak n’est pas sans ambiguïté : « si elle permet de préserver une libre expression dans un espace public, elle a le pouvoir de transformer la manière de nommer le réel qui dérange. Or, nommer le réel n’est jamais un acte neutre : c’est déjà exercer un pouvoir symbolique sur lui. »
[Anne Gensane] Les conséquences éthiques et sociolinguistiques de l’algospeak m’intéressent beaucoup. Tout est encore à faire de ce côté aussi. Nommer, c’est déjà exercer un pouvoir sur le réel… Mais ici, ce n’est pas vraiment le locuteur qui choisit ses mots, mais un environnement technique qui l’y a contraint. On peut donc déjà dire que ça modifie, quoi qu’il en soit, une première fois le rapport au signifié, la réalité des sens, et donc nos rapports sociaux, conceptuels…
Dans mon corpus, le cas des formes utilisées pour évoquer le viol est très intéressant. Je peux par exemple vous dire que j’ai trouvé une forte prévalence de procédés de réduction et de substitution : c’est-à-dire l’usage de l’initiale (« V »), et le codage chromatique (le violet en cohérence avec la phonétique viol-violet / paronymie, donc) dans des émojis (qui sont surtout ces deux-ci : 💜, 🟣 et un peu 🟪 ). Et voilà, si je prends le cas du 💜 : dans la mesure où il produit un décalage entre la gravité du référent et la dimension tout-à-fait esthétisée du signe, pour moi cela peut être interprété comme une forme de désactivation discursive, au sens où la force illocutoire de l’énoncé se trouve atténuée.
De plus, si je prends l’exemple du cœur, c’est qu’il me semble être un symbole agréable à « lire ». Les effets, selon moi, se doivent d’être étudiés ! On sait par exemple, avec une toute première étude, que les mots algospeakés du suicide n’ont pas du tout contribué à sensibiliser sur le sujet. Au contraire ! Dans les conclusions, apparaît l’idée que les propos cachés par algospeak, en comparaison des propos qui ne l’utilisent pas, sont plus nocifs… On est loin de la protection initialement invoquée.
Une autre étude parle surtout de l’automutilation, qui va exactement dans le même sens. Cela m’intéresse beaucoup. Et, d’ailleurs, les données qualitatives que j’ai recueillies ont confirmé ce phénomène, parce que les répondants évoquent à la fois une volonté de contournement (je cite : « éviter la censure »), mais aussi une atténuation (je cite encore : « rendre moins violent le vocabulaire »). Ces deux dimensions ne sont pas exclusives l’une de l’autre : elles participent au même mouvement de reconfiguration des pratiques discursives. On voit bien l’enjeu politique du phénomène… La modération algorithmique filtre des contenus et contribue à redéfinir les conditions du dicible, et ce faisant les modalités de construction du sens.
Ensuite, à plus long terme, lorsque ces formes sortent de leur contexte initial de contrainte (ce que mon corpus laisse déjà entrevoir, notamment dans les usages en messages privés ou dans l’oralité même), elles peuvent participer à une transformation plus large des normes linguistiques, voire donc, je le pense et le dis à nouveau, à une normalisation de formes euphémisées de désignation.
En revanche, il ne faut pas oublier que l’algospeak est mêlé aux pratiques argotiques des jeunes. Il y a une réelle dimension de jeu. On aime modifier la langue (à n’importe quel âge d’ailleurs !) et c’est l’une des trois fonctions attribuées aux pratiques argotiques : cryptique, ludique, identitaire. Donc je pense qu’il faut bien séparer les pratiques algospeak des journalistes, voire des influenceurs, en tout cas de ceux dont c’est le métier (plutôt jargon), des pratiques algospeak des jeunes qui l’utilisent aussi entre eux, comme je le disais (plutôt argot). Tout reste à faire !
« Le cas des formes utilisées pour évoquer le viol est très intéressant. J’ai trouvé une forte prévalence de procédés de réduction et de substitution. Le 💜 produit ainsi un décalage entre la gravité du référent et la dimension tout-à-fait esthétisée du signe. »
[Le Média sans IA] Comment pouvons-nous vous aider à enrichir votre corpus ?
[Anne Gensane] J’ai effectué une première grosse analyse sur un corpus de réponses d’adolescents constitué de lycéens âgés surtout de 15 à 17 ans (+ quelques-uns jusque 23 ans du même établissement). Je monte en ce moment une équipe dans le cadre du projet COST ENEOLI dont je codirige un groupe de recherches consacré à l’argot, et suis à la recherche de tout locuteur engagé dans des pratiques numériques (jeune ou non), tout lecteur donc qui est susceptible de constituer une source pertinente pour la recherche, dès lors qu’il participe, activement ou passivement, à ces processus d’ajustement linguistique.
Ce que je recherche aussi en ayant des réponses variées de locuteurs/utilisateurs, c’est une contribution qui fournisse des exemples, mais aussi des éléments relatifs à leur écologie discursive : conditions d’apparition (publication publique, commentaire, message privé, live, etc.), perception de la contrainte (peur de la suppression, anticipation d’un shadowban..), modalités d’interprétation (compréhension immédiate, incertitude) et temporalité des formes, dans un contexte où l’obsolescence constitue une propriété intrinsèque du phénomène.
Pour contacter Anne : https://univ-artois.academia.edu/AnneGensane
—
Anne Gensane est sociolinguiste et spécialiste de la néologie. Sa thèse de doctorat soutenue en 2023 dirigée par Gudrun Ledegen et Dávid Szabó interrogeait les représentations et pratiques langagières de jeunes locuteurs du français contemporain.


