Le projet Apache Hadoop est un des piliers de l’informatique distribuée et du big data. Grâce à lui, il est en effet possible d’exploiter des masses de données impressionnantes.
Informatica présente aujourd’hui HParser, un outil d’analyse et de transformation de données conçu pour les infrastructures Hadoop. Il comprend un environnement de développement visuel, qui facilitera la mise au point des traitements. HParser supporte également de multiples formats de données et pourra fonctionner en mode parallèle, au travers de MapReduce.
« Informatica HParser répond à la demande croissante des entreprises qui veulent tirer de la valeur de grands volumes de données non structurées complexes, explique Juan Carlos Soto, vice-président senior et directeur général B2B data exchange & cloud data integration chez Informatica. HParser allie les dernières innovations d’Informatica optimisées pour Hadoop et notre expérience inégalée en matière de parsing de données non structurées et de traitement des formats sectoriels spécifiques. »
Informatica HParser est accessible dans une édition gratuite, HParser for Logs, Omniture, XML and JSON. Un dérivé commercial de cette offre permet de disposer d’un support et de fonctionnalités complémentaires. L’éditeur complète cette gamme avec HParser for Industry Standards and Documents, une solution commerciale.
Crédit photo : © pro motion pic – Fotolia.com
OpenAI orchestre un déploiement très progressif de GPT-4o, y compris de ses capacités multimodales.
Elon Musk avait racheté le nom de domaine X.com à PayPal en 2017. Depuis juillet 2023,…
Des centaines d'ingénieurs en IA et cloud travaillant pour Microsoft se voient proposer de quitter…
Reddit s'ajoute à la liste des « partenaires data » d'OpenAI. Qui rejoint-il ?
Younited a utilisé PaLM 2 puis Gemini pour catégoriser des transactions bancaires en vue de…
Les États-Unis vont tripler leur capacité nationale de fabrication de puces et contrôler 30 %…