6 milliards de documents indexés sur Google

Pages Web, images, documents aux divers formats et messages Usenet s’accumulent dans les bases de données de Google, qui vient d’annoncer dépasser les 6 milliards de documents indexés

Google a annoncé mardi avoir dépassé les 6 milliards de documents indexés dans ses bases, qui se répartissent en 4,28 milliards de pages Web, 880 millions d’images et 845 millions de messages Usenet.

Si les documents au format HTML sont majoritaires, Google indexe aussi les fichiers aux formats PDF d’Adobe, texte Doc, tableaux XLS, présentations PPT de Microsoft Office, ainsi que les images aux formats GIF, JPG et Corel. Quant aux messages Usenet, ils représentent 20 ans de conversations en ligne, autant dire, dixit Google, « un aperçu de l’histoire et de la culture de l’Internet« . Le leader incontesté de la recherche en ligne OneStat.com a publié le classement des outils de recherche pour 2003, exprimé en ‘parts de marchés‘, et confirme que Google est de loin le premier moteur de recherche mondial : – 56,1% Google – 21,5% Yahoo! – 9,4% MSN – 3,7% AOL – 2,3% Terra Lycos – 1,9% AltaVista – 1,6% AskJeeves