业界动态
大数据人推荐:60款顶级大数据开源工具
2024-11-14 21:44

摘要:说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。

大数据人推荐:60款顶级大数据开源工具

弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。Market Research的一份报告预测,到2011年,Hadoop市场会以58%的年复合增长率(CAGR)高速增长;到2020年,市场产值会超过10亿美元。

IBM更是非常看好开源大数据工具,派出了3500名研究人员开发Apache Spark,这个工具是Hadoop生态系统的一部分。

这回我们推出了最新的顶级开源大数据工具排行榜。这个领域最近方兴未艾,许多新项目纷纷启动。许多最知名的项目由Apache基金会管理,与Hadoop密切相关

现在很多人对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展。想深入了解学习、转行的读者老爷,可以加学习QQ群:957205962小编准备了大量干货分享给大家,并邀请了清华大学毕业的资深大数据开发工程师为大家答疑解惑,给大家分享目前国内最完整的大数据高端实战实用学习流程体系

请注意:本文不是要搞什么排名;相反,项目按类别加以介绍。与往常一样,要是你知道另外的开源大数据及/或Hadoop工具应该榜上有名,欢迎留言交流。

一、Hadoop相关工具

1. Hadoop

Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。

支持的操作系统:Windows、Linux和OS X。

相关链接:Welcome to Apache™ Hadoop®!

2. Ambari

作为Hadoop生态系统的一部分,这个Apache项目提供了基于Web的直观界面,可用于配置、管理和监控Hadoop集群。有些开发人员想把Ambari的功能整合到自己的应用程序当中,Ambari也为他们提供了充分利用REST(代表性状态传输协议)的API。

支持的操作系统:Windows、Linux和OS X。

相关链接:Ambari -

3. Avro

这个Apache项目提供了数据序列化系统,拥有丰富的数据结构和紧凑格式。模式用JSON来定义,它很容易与动态语言整合起来。

支持的操作系统:与操作系统无关。

相关链接:Welcome to Apache Avro!

4. Cascading

Cascading是一款基于Hadoop的应用程序开发平台。提供商业支持和培训服务。

支持的操作系统:与操作系统无关。

相关链接:Cascading | Cascading

5. Chukwa

Chukwa基于Hadoop,可以收集来自大型分布式系统的数据,用于监控。它还含有用于分析和显示数据的工具。

支持的操作系统:Linux和OS X。

相关链接:Welcome to Apache Chukwa

6. Flume

Flume可以从其他应用程序收集日志数据,然后将这些数据送入到Hadoop。官方网站声称:“它功能强大、具有容错性,还拥有可以调整优化的可靠性机制和许多故障切换及恢复机制。”

支持的操作系统:Linux和OS X。

相关链接:Home - Apache Flume - Apache Software Foundation

7. Hbase

Hbase是为有数十亿行和数百万列的超大表设计的,这是一种分布式数据库,可以对大数据进行随机性的实时读取/写入访问。它有点类似谷歌的Bigtable,不过基于Hadoop和Hadoop分布式文件系统(HDFS)而建。

支持的操作系统:与操作系统无关。

相关链接:Apache Hbase - Apache Hbase™ Home

8. Hadoop分布式文件系统(HDFS)

HDFS是面向Hadoop的文件系统,不过它也可以用作一种独立的分布式文件系统。它基于Java,具有容错性、高度扩展性和高度配置性。

支持的操作系统:Windows、Linux和OS X。

相关链接:HDFS Users Guide

9. Hive

Apache Hive是面向Hadoop生态系统的数据仓库。它让用户可以使用HiveQL查询和管理大数据,这是一种类似SQL的语言。

支持的操作系统:与操作系统无关。

相关链接:Apache Hive TM

10. Hivemall

Hivemall结合了面向Hive的多种机器学习算法。它包括诸多高度扩展性算法,可用于数据分类、递归、推荐、k最近邻、异常检测和特征哈希。

支持的操作系统:与操作系统无关。

相关链接:myui/hivemall

    以上就是本篇文章【大数据人推荐:60款顶级大数据开源工具】的全部内容了,欢迎阅览 ! 文章地址:http://xiaoguoguo.dbeile.cn/news/756.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 多贝乐移动站 http://xiaoguoguo.dbeile.cn/mobile/ , 查看更多   
最新新闻
手机热点不稳定(手机热点不稳定,总是断开)
  关于手机热点不稳定的问题  一、引言  随着移动互联网的普及,手机热点已成为我们日常生活中重要的网络接入方式之一。然
手机自动检测(手机自动检测在哪里)
  关于手机自动检测的文章  随着科技的飞速发展,智能手机已经成为我们日常生活中不可或缺的一部分。为了更好地服务用户,手
手机流量包(如何购买联通手机流量包)
  关于《手机流量包》的文章  随着移动互联网的普及,手机流量已经成为我们日常生活中不可或缺的一部分。为了满足不同用户的
手机桌面宠(手机桌面宠物软件)
  文章标题:《手机桌面宠:一种全新的数字伴侣体验》  随着科技的快速发展,智能手机已经渗透到我们日常生活的方方面面。在
怎样清理手机壳(怎样清理手机壳周围的黑)
  《怎样清理手机壳》  随着智能手机的普及,手机壳成为了保护手机不可或缺的一部分。然而,长时间使用会导致手机壳变脏或积
3000以下的手机(3000以下的手机实用耐用)
  关于《三千元以下手机》的文章  随着科技的快速发展,智能手机已经成为我们日常生活中不可或缺的一部分。如今,市场上充斥
手机换硬盘(手机换硬盘多少钱)
  关于手机换硬盘的文章  随着科技的快速发展,智能手机已成为我们日常生活中不可或缺的一部分。然而,随着使用时间的增长,
国产折叠手机(国产折叠手机性价比排名)
  国产折叠手机:革新科技与未来展望  随着科技的飞速发展,智能手机作为现代生活的必需品,不断推陈出新。近年来,国产折叠
手机当扫描仪(手机当扫描仪扫描头部数据)
  文章标题:《手机当扫描仪:科技革新下的便捷之选》  随着科技的飞速发展,智能手机的功能已经远远超越了单纯的通话和娱乐
手机怎么与电视投屏(手机怎么与电视投屏?)
  《手机怎么与电视投屏》  随着科技的飞速发展,我们的生活越来越离不开各种智能设备。其中,手机与电视作为家庭娱乐的主要