La Google Search Appliance indexe 1 milliard de pages

Bases de donnéesBig DataLogiciels

La mise à jour 7.2 de la Google Search Appliance permet aux entreprises de greffer leurs connecteurs pour élargir les sources de contenus à indexer.

Google vient de mettre a jour en version 7.2 sa GSA, sa Google Search Appliance. Rappelons qu’il s’agit d’un serveur dédié en rack, abritant un moteur de recherche d’entreprise créée il y a bientôt 12 ans par la firme de Mountain View.

Destinée à se greffer sur un réseau ou à se coupler à un site Web, cette « Google in a box » s’est notamment adaptée à l’augmentation exponentielle des volumes de données à traiter, souligne ITespresso.fr. Capable d’indexer jusqu’à 1 milliard de pages (ce qui représente l’intégralité de la base de Google en l’an 2000), l’appliance peut traiter quelque 260 formats de fichiers. Elle agrège des contenus depuis de multiples sources : non seulement les navigateurs Web, mais aussi les terminaux mobiles, les partages de fichiers, le cloud, les réseaux sociaux ou encore les applications métier (ERP, CRM…).

Connecteurs externes

Google a également mis l’accent sur la simplicité de sa solution, en conservant la légendaire ergonomie de la page de recherche de son moteur web, tout en offrant un accès plus spécifique aux données de l’entreprise conservées dans une GED (gestion documentaire).

Introduite en octobre 2012 avec la version 7.0, la fonction de « reconnaissance des entités », qui permet de classer automatiquement les résultats et de les taguer en extrayant automatiquement les attributs de contenu (dates, auteurs…), gagne en souplesse. Il est désormais possible de contrôler au vol lesdits attributs avant de lancer l’indexation.

Reconnaissant les langages aux calligraphies complexes comme l’arabe, le chinois et le japonais, la GSA offre un accès à Google Traduction, qui supporte dorénavant plus de 70 langues. En version 7.2, elle facilite surtout la création, par les clients et les partenaires, des fameux « connecteurs » qui permettent d’accéder à des ressources externes.

Recherche universelle

Outre une refonte de l’interface d’administration, Google améliore également les fonctionnalités de recherche. En tête de liste, l’intégration des caractères de remplacement : lorsque l’utilisateur ignore le terme exact sur lequel lancer une requête (typiquement, pour des numéros de série), il peut utiliser le dièse (#) ou l’étoile (*) pour demander au moteur d’étendre la recherche. La requête « Lot 37* » fera ainsi remonter des résultats comme « Lot 3724 » ou « Lot 3758 ».

Présentée comme un front-end du big data en entreprise, la GSA propose également un optimiseur automatique de classement, qui s’adapte au comportement de l’utilisateur pour hiérarchiser les résultats. L’outil « recherche de spécialistes », basé sur les profils SharePoint et les répertoires LDAP, reste lui aussi d’actualité. Il permet d’identifier, en parcourant l’organigramme de l’entreprise, une personne qui détient une information sur l’objet de la requête.

Pour les organisations concernées, la mise à jour s’effectue depuis le portail de support entreprise de Google.


Voir aussi
Quiz Silicon.fr – 10 questions sur Google


Lire la biographie de l´auteur  Masquer la biographie de l´auteur