Dernièrement, j’ai été confronté à la problématique de spinner des textes… manuellemment. Croyez-le bien, c’est une tâche fort pénible. Finalement, le cerveau n’est pas si flexible lorsque l’exercice consiste à créer plusieurs versions de la même histoire. Et pourtant, un spinning n’est réussi que si une version est structurellement et lexicalement originale à 30%, et si la narration de la version spinnée est cohérente. Il existe des logiciels de spinning de texte, mais les plus évolués n’offre que des solutions anglophones – leur rendu reste souvent très aléatoire – et le français est une langue dont la mécanique sémantique reste dure à capturer pour l’esprit logique à la base des fondements de toute intelligence informatique.
La phase la plus difficile du spinning manuel, c’est le début: il faut se familiariser avec l’histoire qui est racontée, puis il faut activer notre dictionnaire cérébral de synonymes et d’expressions communes. Une fois qu’on est lancé, l’exercice devient complètement différent d’une simple permutation de synonymes, au point de se demander si les techniques de spinning automatisé d’aujourd’hui ne sont simplement pas dans le faux avec la manière dont la diversification textuelle est abordée.
Chez les référenceurs, on va faire du spinning pour deux raisons: soit on travaille pour un client et le contenu spinné doit être propre, auquel cas le spinning est semi-automatisé, cad que des corrections doivent être apportées manuellement sur chaque version spinnée. Soit on bâtit une méga-nébuleuse de sites pour générer du SEO juice, auquel cas les contenus sont juste balancés automatiquement sans relecture. Dans les deux cas, on peut affirmer que le spinning automatisé n’est pas encore à la hauteur du potentiel qu’offre l’informatique aujourd’hui.
En spinnant manuellement les textes, je me rend compte que l’exercice ne consiste pas à gérer un ensemble de synonymes et d’expressions sur des mots-clés donnés, mais plutôt d’adopter plusieurs styles narratifs pour transmettre la même information. Cependant, le spinning de texte ne devrait pas consister à créer des listes de termes interchangeables sur un texte donné, mais il devrait plutôt être capable de créer un texte à partir de certains mots-clés, et à partir de scénario pré-paramétrer.
En gros voici un exemple: la phrase « le cac40 est encore en baisse, mais LVMH affiche des revenus positifs » devrait être soumise à un soft de spinning de la manière suivante:
« Mot-clé 1 » « catégorie mot-clé 1 » « état/attribut mot-clé 1 » « mot-clé 2 » « catégorie mot-clé 2 » « état/attribut du mot-clé 2 » « relation entre mot-clé 1 et mot-clé 2 » etc…
Ce qui donnerait:
>Mot-clé 1: cac40
Catégorie mot-clé 1: bourse, finances
État/attribut mot-clé 1: en baisse, encore
Mot-clé 2: LVMH
Catégorie mot-clé 2: entreprise
État/attribut mot-clé 2: revenus, positifs
Relation entre mot-clé 1 et mot-clé 2: contradiction, dissonance
De cette manière, on se retrouve avec des objets, associés à des champs sémantiques précis, qui traduisent un état précis, et structurés entre eux autour de scénario relationnels définis.
Selon ce paradigme, le rôle du logiciel n’est pas plus de proposer un ensemble de synonymes pour chaque terme identifié, que de suggérer plusieurs structures narratives différentes qui retranscrivent fidèlement l’histoire initiale.
Bien sûr, cette idée n’est qu’une idée: quid de sa réalisation technique…