Technologie Google

Google est la seule société à se consacrer entièrement au développement du "moteur de recherche idéal" qui, selon Larry Page, l'un des deux cofondateurs de la société, "doit comprendre l'objet exact de chaque recherche pour fournir les informations exactes demandées". Dans cette optique, Google a toujours cherché à innover et refusé d'accepter les limites des modèles existants. Google a ainsi développé sa propre infrastructure de traitement des résultats et de classement des pages, baptisée PageRank™, qui a transformé la façon dont les recherches sont réalisées.

Depuis le début, les développeurs de Google se sont aperçus qu'il fallait mettre sur pied une nouvelle configuration de serveurs pour fournir les résultats les plus précis, aussi rapidement que possible. Bien que la plupart des moteurs de recherche reposent sur quelques grands serveurs qui ont souvent tendance à ralentir lors des pics de trafic, Google a mis en place des PC reliés entre eux pour fournir rapidement une réponse à chaque recherche. Cette innovation permet d'obtenir des temps de réponse plus rapides, de bénéficier d'une plus grande évolutivité et de diminuer les coûts. L'idée a depuis été reprise par d'autres organisations, tandis que Google a continué de perfectionner sa technologie afin de la rendre toujours plus efficace.

Les logiciels utilisés dans la technologie de recherche de Google permettent de réaliser une série de calculs simultanés en une fraction de seconde seulement. Les moteurs de recherche classiques s'appuient essentiellement sur la fréquence d'utilisation des mots sur les pages Web. Google utilise la technologie PageRank™ pour examiner la totalité de la structure des liens du Web et déterminer les pages les plus importantes. Une analyse de mise en correspondance des liens hypertexte est ensuite effectuée pour identifier les pages en rapport avec la recherche demandée. Cette combinaison du classement général et du ciblage des pages en fonction de leur contenu permet à Google de fournir les résultats les plus fiables et les plus pertinents en premier.

  • Technologie PageRank : PageRank permet de mesurer objectivement l'importance des pages Web. Ce classement est effectué grâce à la résolution d'une équation de plus de 500 millions de variables et de plus de 2 milliards de termes. Au lieu de compter les liens directs, PageRank interprète chaque lien de la Page A vers la Page B comme un vote par la Page A pour la Page B. PageRank évalue ensuite l'importance des pages en fonction du nombre de votes qu'elles reçoivent.

    PageRank tient également compte de l'importance de chaque page qui "vote" et attribue une valeur supérieure aux votes émanant de pages considérées comme importantes. Les pages importantes bénéficient d'un meilleur classement PageRank et apparaissent en haut des résultats de recherche. La technologie de Google utilise l'intelligence collective du Web pour déterminer l'importance d'une page. Les résultats ne font l'objet d'aucune intervention humaine ni manipulation, ce qui explique pourquoi les internautes font confiance à Google et considèrent ce moteur de recherche comme une source d'informations objective et indépendante.

  • Analyse de mise en correspondance des liens hypertextes : le moteur de recherche de Google analyse également le contenu des pages. Cependant, l'analyse Google ne porte pas uniquement sur le texte (qui peut être manipulé par les éditeurs de sites au moyen de balises Meta), mais sur la totalité du contenu des pages afin de tenir compte des polices, des subdivisions et de l'emplacement de chaque mot. Google analyse également le contenu des pages Web voisines pour s'assurer que les résultats renvoyés sont bien en rapport avec les recherches des internautes.

Les innovations de Google ne se limitent pas aux ordinateurs. Pour fournir rapidement des résultats de recherche précis aux utilisateurs qui accèdent au Web à l'aide de périphériques portables, Google a également mis au point la première technologie de recherche sans fil permettant de convertir automatiquement les pages HTML dans des formats reconnus par les appareils WAP, i-mode, J-SKY et EZWeb. Actuellement, Google fournit sa technologie sans fil à de nombreux leaders du marché, dont AT&T Wireless, Sprint PCS, Nextel, Palm, Handspring et Vodafone.

Cycle de vie d'une recherche Google

La durée de vie d'une recherche Google est habituellement inférieure à une demi-seconde, mais elle implique un certain nombre d'étapes différentes qui doivent être réalisées avant que les résultats soient fournis à l’internaute à l'origine de la demande.


3.
Les résultats de recherche sont renvoyés à l'internaute en une fraction de seconde.
   1. Le serveur Web envoie la requête aux serveurs de l'index. Le contenu de ces serveurs est similaire à l'index d'un livre : il indique sur quelles pages se trouvent les mots correspondant à la requête.
2. La requête poursuit son chemin jusqu'aux serveurs de documents, qui récupèrent les documents stockés. Des extraits sont générés pour décrire chacun des résultats obtenus.
   ©2010 Google - Accueil - À propos de Google - Règles de confidentialité - Conditions d'utilisation