4 façons dont vous travaillez probablement pour Google

Avatar Thierry De Marre juillet 28, 2016
4
shares

Google répond à 3 milliards de requêtes par jour. Pour ce faire, ils utilisent un algorithme constitué de quelque 200 facteurs de classement différents et emploient environ 1 million de serveurs. Qui fournit les informations pour tous ces logiciels et tout ce matériel ? Sur quoi se base la pertinence apparente de l’algorithme de recherche de Google ?

Eh bien, si Google souhaite savoir quelque chose, ils n’ont qu’à le demander. Ils embauchent parfois des personnes pour leur donner des réponses. La mise à jour Panda en est l’exemple. Google Panda est un filtre qui empêche les sites et/ou pages de faible qualité d’être bien référencé(e)s dans les résultats de recherche et favorise les sites qui fournissent des informations de haute qualité.

Pour Panda, une armée de travailleurs embauchée pour l’occasion et répondant au nom élégant de Google Quality Raters (Évaluateurs de Qualité Google) a examiné un certain nombre de sites Web et a complété des questionnaires en répondant à des questions telles que « puis-je confier ma carte de crédit à ce site ? »

Google_Panda_Update
Google Panda by dr-discount (licensed under CC BY-SA 4.0)

C’est de cette façon que Google rassemble le « Big Data » dont il a besoin pour satisfaire le demandeur moyen : des informations générées par les humains à grande échelle, et reproduites par des ordinateurs à une échelle encore plus grande.

Mais le plus souvent, il n’y a aucun salaire à la clé. La source principale de renseignements obtenus des usagers (crowd sourcing) de Google, c’est vous et moi.

Voici 4 exemples de comment vous – consciemment ou inconsciemment – travaillez probablement pour Google.

CAPTCHA

Lorsque vous complétez un CAPTCHA pour prouver que vous êtes humain(e), vous travaillez pour Google Maps et Google Books.

Ces cases aux drôles de lettres qui figurent dans les formulaires d’inscription des sites Web ou sur les pages Facebook lorsque vous souhaitez publier une mise à jour sont appelées CAPTCHA, et elles sont utilisées pour dissuader les spammeurs et les robots.

A CAPTCHA (acronyme de “Completely Automated Public Turing test to tell Computers and Humans Apart”), soit “Test de Turing Public Entièrement Automatisé pour Différencier les Ordinateurs des Humains”) est une sorte de test challenge-réponse utilisé en informatique afin de déterminer si l’utilisateur est humain.

L’un des principaux fournisseurs de cette technologie est une entreprise du nom de reCAPTCHA, et devinez qui a acquis l’entreprise…

Pourquoi Google souhaitait-il posséder cette technologie ? L’un de ses usages est Google Maps. Lorsque la voiture de Google passe dans votre rue, son appareil photo enregistre le numéro de votre maison. Qui va le lire et le transformer en nombres numériques pour la base de données de Google Maps ? Google va essayer, mais s’ils ne sont pas 100% sûr de ce qui est écrit, ils feront appel à un humain pour le lire. Gratuitement.

Lorsque vous remplissez un CAPTCHA comme celui-ci, vous aidez Google à confirmer que ce nombre est bien 8001. Et par la même occasion, vous enseignez au système OCR de Google (optical character recognition, soit reconnaissance optique de caractères) à mieux lire les numéros.

recaptcha

La même chose s’applique à Google Books. Les mots qui apparaissent dans de nombreux CAPTCHA et fournis par reCAPTCHA proviennent de journaux d’archives numérisés et de livres anciens. Les ordinateurs risquent d’avoir du mal à reconnaître certains mots car l’encre et le papier se sont dégradés au fil du temps. En les tapant dans un CAPTCHA, le public enseigne aux ordinateurs à lire le texte numérisé.

Et devinez-quoi ? Depuis janvier 2015, il semble que Google n’ait plus besoin de votre aide pour ça !

Likes, shares et tweets

Avec un « j’aime » ou un « partager », vous n’informez pas uniquement les autres usagers d’Internet, mais également Google.

Social-media-phrenology
Phrenologie des Social Media by Kjyrstenolson (licensed under CC BY-SA 4.0)

Ces sont signaux de popularité que nous fournissons volontairement à Google. Mais ce qui est étrange, c’est que Google ne les utilise pas comme facteur de référencement. Tout du moins pas de façon directe. Vous vous demandez peut-être pourquoi le SEO accorde alors tellement d’importance aux réseaux sociaux ? Il existe de nombreux points de vue différents sur ce sujet, mais les experts conviennent qu’il y a une corrélation plutôt qu’un effet de causalité entre les réseaux sociaux et le référencement dans les résultats de recherche.

À chaque fois que vous partagez ou que vous aimez un post, vous votez pour la qualité et vous améliorez la visibilité de la page. De cette façon, les partages et les « j’aime » peuvent conduire à des liens, le principal facteur de référencement. Vous pouvez consulter un point de vue intéressant sur la façon indirecte dont notre activité sur Facebook, Twitter ou Google+ aide Google à afficher de meilleurs résultats de recherche ici.here.

Google Translate

Si vous avez déjà traduit quelque chose depuis un site Web, vous avez travaillé pour Google Translate.

Bon nombre d’entre nous utilisent Google Translate, un service qui prend actuellement en charge environ 90 langues et a grandement contribué à améliorer la compréhension mutuelle dans le monde. Contrairement aux autres outils de traduction, based on grammatical rules, Google Translate fonctionne sur une analyse statistique automatique. Il s’agit du propre algorithme de Google conçu par Franz Joseph Och, informaticien plutôt que linguiste…

Comme vous pouvez le voir dans cette courte vidéo: lorsque Google Translate génère une traduction, il recherche des tendances dans des centaines de millions de documents afin de décider de la meilleure traduction. En détectant les tendances dans des documents déjà traduits par des traducteurs humains, Google Translate fait des suppositions intelligentes quant à la traduction la plus appropriée.

Google_Translate_Icon

Cette méthode statistique se traduit souvent par d’étranges traductions parfois très drôles, mais elle fonctionne en général suffisamment bien pour aider les centaines de millions de personnes qui l’utilisent régulièrement. Et elle s’améliore chaque jour, grâce au public. Il y a trois façons dont nous contribuons à améliorer Google Translate, consciemment ou non.

La première façon, et également la plus évidente, est en cliquant sur l’option « Améliorer cette traduction » et en ajoutant votre suggestion.

Si aider Google vous tient vraiment à cœur, vous pouvez rejoindre la communauté Google Translate et contribuer activement.

Et sans que l’on vous le demande : étant donné que tout ce que vous publiez sur Internet est utilisé par Google pour élargir leur base de données, chaque traduction est introduite dans l’algorithme Translate. En plus des livres et des documents de l’ONU, les pages Web traduites du monde entier servent de sources de données pour Google Translate.

Comportement de recherche

À chaque fois que vous cliquez sur un résultat de recherche, vous travaillez pour Google.

2016-07-21_1535

L’un des facteurs utilisés par Google pour déterminer le référencement des pages web est la façon dont nous nous comportons lorsque nous utilisons les résultats de recherche. La plupart du temps, nous cliquons simplement sur le site qui apparaît en numéro 1. Si nous ne revenons pas en arrière, Google est satisfait étant donné que le résultat a apparemment répondu à notre requête. Mais que se passe-t-il si nous revenons en arrière pour jeter un œil au site numéro 2 ? Toujours aucune raison de s’inquiéter, à moins que de nombreuses personnes agissent de cette façon. Si cela se produit constamment, Google commence à réfléchir : peut-être que le numéro 2 devrait être numéro 1, et ils ajusteront les référencements en conséquence. De nouveau : l’effet du public. Ce phénomène est connu sous le nom de « pogo-sticking »: passer d’un site à l’autre.

La même chose se produit si les gens ne prennent même pas la peine de consulter le numéro 1, mais choisissent un résultat inférieur à la place – le plus souvent entre le n°2 et le n°6. Si un pourcentage significatif de personnes se comporte de cette façon sur une SERP (Search Engine Results Page soit Page de Résultats d’un Moteur de Recherche), Google dira : merci les gars, nous avons saisi le message, et le « préféré du public » grimpera dans les résultats de recherche.

Conclusion

La plupart d’entre nous travaillent avec Google mais nous travaillons tous pour Google, qu’ils nous le demandent ou non.

Quoi que nous fassions sur Internet, Google nous surveille. Ils possèdent le moteur de recherche et ils possèdent probablement le navigateur (Google Chrome est le navigateur le plus populaire au monde). Et si vous êtes webmaster, vous utilisez sans doute Google Analytics, un autre outil stratégique de la société.

Les différentes façons dont les webmasters travaillent pour Google font partie des révélations de notre livre numérique “L’avenir du SEO” Téléchargez-le ici, c’est gratuit.