合作热线(手机微信同号):13901041470

提供基于Spark的云服务,大数据软件公司Databri

【承包网】 发布于 2018/11/5 9:32:43
点击: 1083

  近日,大数据软件公司Databricks获得6000万美元C轮融资,由New Enterprise Associates领投,Andreessen Horowitz参投,本次投资有望帮助公司完成在数据的组织、计算和交付方面的一次跨跃。

  Databricks成立于2013年,总部设在旧金山,属于Spark的商业化公司,由美国伯克利大学AMP实验室著名的Spark大数据处理系统多位创始人联合创立。Databricks致力于提供基于Spark的云服务,可用于数据集成,数据管道等任务。

  Databricks曾在2014年获得3300万美元的投资,当时他们推出了第一个产品Databricks Cloud,这是一个通过将流程置于云端来简化大数据处理云平台。

  Databricks公司的云解决方案由三部分组成:Databricks平台、Spark和Databricks工作区。该产品背后的理念是提供处理数据的单独空间,不受托管环境和Hadoop集群管理的影响,整个过程在云中完成。该产品有几个核心概念:由Notebooks提供一种与数据交互并构建图形的方法,当用户了解了显示数据的方式时,就可以开始构建主控面板以监视某些类型的数据。最后,用户可以通过该平台的任务启动器来规划Apache Spark的运行时间。

  Spark数据处理引擎据称比Cloudera和MapR的Apache Hadoop要快。Coudera公司在2014年筹集了大约10亿美元高调入场,声称他们有比以前的基础设施技术更好的方式来存储和管理大量的数据。这是Facebook和Google等公司用来处理他们收集的数十亿个数据的工具。Spark关注的地方不再数据的存储,而是如何最有效地管理数据。

  Databricks的Spark系统能使大量数据在下一代应用中易于理解和使用,是数据科学家长期努力的方向。数据处理的速度和容量在当下具有许多应用,能够处理数据并使企业内部人员可以有效地理解和使用数据并提供有效服务的公司将成为最大的赢家。作为Hadoop开源工具组合的一部分,Spark项目已经获得了非常可观的收入。

  去年,该公司就Spark的机器学习能力与IBM建立了合作伙伴关系。不少数据科学家正在涌向Databricks的项目。他们的社区有288,000名成员以及来自250个组织的1,000多名积极贡献者。

  截至目前,Databricks累计融资超过1亿美元。公司CEO兼联合创始人Ali Ghodsi在一份声明中表示:Apache Spark的高级分析解决方案帮助很多企业和早期用户创造了商业价值。随着市场对 Spark 平台的需求和认可的不断提升,这笔资金将帮助我们推进计算机工程和市场战略,解决客户的痛点,同时继续扩大Spark社区。

  2016年11月,在“计算界奥运会”Sort Benchmark全球数据排序大赛公布的结果中,Databricks公司和南京大学计算机科学与技术系PASA大数据实验室以及阿里巴巴组成的参赛团队NADSort荣获2016年CloudSort大数据排序世界冠军。该团队以144美元的成本完成100TB标准数据集的排序处理,将100 TB数据的排序价格从2014年的每TB 4.51美元的记录降到了每TB 1.44美元,同时刷新了多项世界纪录。

  Sort Benchmark是图灵奖获得者Jim Gray发起组织的全球性数据排序基准性能评测大赛,自1987年开始每年举办一次。CloudSort评测竞赛项目又被称为“云计算效率之争”,旨降低云架构的获取成本,包括软件堆栈、硬件堆栈等,鼓励企业将大数据应用程序部署到公共云上。

  随时了解中国服务贸易(外包)行业最新动态,请扫描二维码或搜索"鼎韬洞察",关注我们!

作者:Wheeler