Apache Hadoop - Un regard plus attentif
Apache Hadoop propose des solutions pour la collecte et le traitement de données à grande échelle. L'ASF sert de dépôt central et de point de distribution pour les projets, Apache servant de communauté centrale d'utilisateurs et de développeurs. Apache Hadoop vise à faciliter le déploiement de grandes applications grâce à son support de la plateforme Java et Java sur les serveurs. Apache Hadoop a été développé par Juhan Lamb Pedrick, Alex Balcov, Michael J. Cafarella, Gerald M. Glassner et Raymond C. Tsouline. Il est basé sur la technologie du système de gestion de base de données NoSQL qui a d'abord été développé chez Facebook et qui a ensuite été utilisé par Twitter et Google.
Apache Hadoop comprend une technologie de grande envergure qui inclut Map-Reduce, Yago, Summation, et bien plus encore. Apache Hadoop a été développé pour rendre le cadre Map-Reduce plus efficace et plus simple à utiliser, tout en offrant une interface utilisateur intuitive aux programmeurs. Apache Hadoop vise à passer des installations de serveurs traditionnelles à un système distribué entièrement parallèle, exécutant des milliers de tâches en parallèle. Il est capable de traiter de grandes quantités de tâches à forte intensité de données en permettant à chaque travailleur de diviser le travail en petits morceaux, de sorte que les grandes tâches puissent être divisées efficacement par le cluster sous-jacent.
Analyse de données distribuées Avec l'aide d'Apache Hadoop, les utilisateurs peuvent accéder à des données en temps réel depuis n'importe quel appareil, sans avoir besoin de systèmes distribués ou de supports de stockage coûteux. Apache Hadoop offre des technologies d'entreposage et de traitement des données hautement évolutives et très efficaces. Le cadre Map Reduce permet aux utilisateurs de réduire efficacement la complexité des cartes, ce qui permet de développer des graphiques plus complexes et des applications de veille stratégique (BI). Les utilisateurs sont également en mesure de construire des applications simples d'extraction-transformation-chargement (ETL), qui permettent aux gestionnaires ETL de traiter efficacement des transformations complexes.