首页 > 娱乐前沿 > 产经
Google大资料管理平台Cloud Dataproc正式上市,执行资料丛集快10倍
阿呆 2016-02-25 12:45:10
图片来源:

Google

Google在2015年9月推出Cloud Dataproc测试版,日前又宣布,大资料服务云端管理平台Cloud Dataproc全面上市(Generally Available,GA),提供Hadoop、Spark、Hive等大资料工具云端管理服务,支援Hadoop 2.7.2、Spark 1.6、Hive 1.2.1和Pig 0.15,且可向下相容。而GA版也支援订制化虚拟机器服务(Custom Machine Types),以分钟计价。

Google产品经理James Malone在官方博客表示,在进行资料分析时,使用者应该要关注资料分析的结果,而不是资料分析的工具,如Hadoop和Spark,需要在成本、规模、复杂性和使用性上谨慎取得平衡。而Cloud Dataproc则矫正了资料分析的结果和工具两者间的平衡。

Cloud Dataproc提供用户可以使用开发者控制工具(Developers Console)和云端开发套件(Cloud SDK)来建立Hadoop或Spark丛集,而传统启动和停止丛集作业要花费10分钟或15分钟以上,不过,Cloud Dataproc平均只需90秒以內就能启动和停止一项丛集作业。Google宣称,这比就地部署(On-Premise)或IaaS服务执行丛集作业的时间快上2至10倍,以减少使用者等待作业执行的时间。

此外,Cloud Dataproc还可以和大资料分析云端平台Dataflow一起使用,用来处理即时批次和串流资料,也可以整合BigQuery、Cloud Bigtable和云端储存(Cloud Storage)等服务。

且因为代管在Google云端平台(Cloud Platform),Cloud Dataproc也适用于订制化VM服务,提供使用者依各自需求,自订VM的vCPU及记忆体,并以分钟计价,最低消费为10分钟,另外,在丛集中每颗虚拟CPU每小时收费1分美元,而丛集也可以采用预留(Preemptible)计价的VM执行个体(Instance), 比1分美元还便宜。

James Malone表示,Cloud Dataproc在测试版时新增了几个重要的功能,包含性能调校、丛集版本管理等,而GA版也会像测试版一样,将频繁释出新的功能、软件元件等。同时,Google也宣布,新增技术合作伙伴Arimo、Attunity、Looker、WANdisco和Zoomdata,共同开发Cloud Dataproc,而服务供应商如Moser、Pythian和Tectonic也提供Cloud Dataproc用户技术支援。

上一篇  下一篇

I 相关 / Other

葛丽个人资料照片曝光 假扮女友收二老6000红包私吞

春节前,在外务工的宋科带着“租来的女友”葛丽回到家中,见到“准儿媳”后,宋科

史学天才高中生自杀事件真相调查 林嘉文生前资料照片遭踢爆

史学天才高中生自杀你说说这究竟是怎么回事呢?“林嘉文去世了,遗憾。”24日凌晨,有网友发布微博称,去年年

夫妻网上募捐却开奔驰秀钻戒引质疑 宋女士夫妇资料照片遭扒

近日,有绍兴网友联系钱江晚报记者,说在朋友圈看到一则募捐消息《好心人,感谢您帮一下我的白血病

王亮是王小利和谁生的 王亮生母温美玲个人资料及最新消息

 

众所周知,王小利同小沈阳一样都是赵本山的徒弟,两人在上春晚之前一直都是出演赵本山拍摄的乡村爱情

Laur Wasser个人资料背景 戴金色假肢走秀燃爆全场

在纽约时装周刚结束的一场秀里,有一个金发模特让整个天桥都燃了。这是妹纸的时装周首秀,但引人注

I 热点 / Hot