Twitter dans l’algorithme Google

twitter google

Nous le savons déjà depuis un moment que Google a accès au firehose de Twitter, et à intégrer des suggestions de tweets sur certaines de ses pages de résultat. On entend dire que l’utilisation d’un hashtag est une forme d’optimisation d’un tweet pour les moteurs de recherche (si un flux de tweets est habituellement suggéré dans la requête ciblée).
Cependant, je me suis toujours demandé quelle valeur Google accorde-t-il à ce noeud de liens que sont chaque page Web trouvée sur Twitter.com dans le processus de ranking de contenu Web.

Aujourd’hui, j’ai finalement eu un semblant de réponse. En effet, je venais de uploader une vidéo sur le Web, et j’attendais patiemment que le lien de cette vidéo vienne se caler en première place sur une requête bien spécifique. En moins de 15 minutes, mission accomplie, mais voilà que le premier lien qui fait surface n’est pas celui que j’attendais:

http://www.dailymotion.com/3?utm_source=twitterfeed&utm_medium=twitter 5 (tronché)

Dans son élan, Google ne m’a pas juste donné ma vidéo en première page, mais aussi de quelle manière il l’avait trouvé (ce lien a disparu très vite pour laisser place au lien sans utm).

En faisant une recherche sur Twitter, j’ai remarqué qu’un bot avait scrapé ma vidéo dans la foulée de mon upload, et un tweet reprenant les mots clés de ma vidéo ainsi que le lien (vers la version scrapée) a été posté. C’est le seul tweet qui ait partagé ce lien vers la vidéo. De toute évidence, Google l’a repéré, mais il n’a pas eu le temps de me nettoyer l’URL avant de me la communiquer.

Il est évident que Google pioche dans la banque de données temps réel de Twitter pour participer à l’indexation de ce contenu chaud. Ce qui est plus intrigant, c’est de savoir comment l’algorithme de Google pondère un lien Twitter: Quelle est sa valeur réelle? Dans quel contexte un tweet est-il le plus intéressant pour Google? Quel poids occupe la source du tweet dans la valorisation de celui-ci? Quelle valeur prend le lien quand il est tweeté? Retweeté? Spammé?

Dans le cas que je viens de citer, voilà ce que j’en conclurais: Pour le moment, Google accorde beaucoup de valeur à un tweet, car il suggèrera son lien dans la minute si il le faut. Pour le contexte, je me demande si ce n’est pas le fait que le contenu d’origine était une vidéo qui a fait sursauté Google (Google est très friand de vidéos quand elles sont bien sucrées :). Il semberait que pour le moment, la source du tweet ne pèse pas une plume dans la balance, car ici c’est clairement un spambot qui a balancé ma vidéo via Twitterfeed.

Sur certains types de requêtes, il semblerait que Google soit partant pour accorder une grande importance au contenu chaud. J’espère que nous n’en arriverons pas au point où ce type de requête pourrait varier des dizaines de fois dans la journée, au gré des tweets et retweets des spambots.