众彩彩票 > 大数据 >

正处于数据科学与机器学习工具 “大爆炸”的时

发布时间: 2019-03-23
 

  日前, Gartner 宣告了 2019 年版面向数据科学与机械进修对象的魔力象限。Gartner 的魔力象限是在某一特准时间内对市场情况进行的图形化描述,根据 Gartner 的定义,它描述了 Gartner 根据尺度对该市场内的厂商所进行的剖析。Datanami 的 Alex Woodie 为我们解读了 2019 年版面向数据科学和机械进修对象的魔力象限。
 
  Gartner 表现,今朝用于数据科学的对象正在敏捷产生变更。该公司在其最新的数据科学和机械进修平台的报告中称,我们正处于 “大爆炸” 中。
 
  1 月 28 日,Gartner 宣告了《数据科学和机械进修平台魔力象限》(Magic Quadrant for Data Science and Machine Learning Platforms),并表现:“数据科学和机械进修市场是健康、活泼的,浩瀚供给商供给了一系列产品。这个市场正在阅历一场‘大年夜爆炸’,这场‘大年夜爆炸’不仅从新定义了应由谁来做数据科学和机械进修,还从新定了数据科学和机械进修应如何实现。”
 
  剖析师小组将数据科学平台定义为综合场合,在这里,数据科学家、平易近间数据科学家和开拓人员不仅可以获得构建数据科学应用所需的所有焦点功能,还可以将它们嵌入到现有营业流程和治理中,并对其进行治理和掩护。
 
  数据科学和机械进修平台必需知足最低要求,并包含以下对象:
 
  Gartner 认为,整合和凝集力是关键,如果应用法式(尤其是开源产品)只是简略地将各类包和库绑缚起来,那么这样的产品并不克不及视为真正的平台。
 
  固然这些焦点要求为数据科学和机械进修平台奠定了基础,但不合的供给商在若何实现这些需求上存在着很大的差异。Gartner 指出,专业数据科学家可能更爱好用 Python 或 R 编写代码,而其他人更爱好数据科学笔记本的易用性,如 Jupyter。还有一些不太懂技能的人更爱好用鼠标在界面上点击,因为对他们来说这样很直观。
 
  领导者象限
 
  在领导者象限中,Gartner 列入了四家供给商,包含:KNIME、RapidMiner、TIBCO Software、SAS。
 
  在 Gartner 的评估中,KNIME 名列前茅,这归功于客户的大年夜力支撑、普遍的产品组合以及市场上 “最平衡的” 愿景之一。苏黎世公司的产品系列(包含开源 KNIME Analytics 产品和贸易 KNIME Server 产品)被誉为剖析领域的 “瑞士军刀”。对深度进修、中级用户供给的的易用性以及与其他包集成的高等功能的支撑受到了夸奖,然而,机能和可扩大性被视为弱点,以及对物联网的吸引力也很有限。
 
  在引诱者象限中,Rapid Miner 也是名列前茅,这得益于它在易用性和支撑庞杂数据科学能力之间的平衡。这款软件支撑深度进修技能并安排到 GPU,Gartner 好像很爱好 Rapid Miner 为机械进修安排供给更高的透明度。它与开源对象的整合有利于数据科学家。重要存眷点是数据准备和可视化、允许和订价、模型操作。
 
  TIBCO 从挑衅者象限中迈出了一大步,购买了一系列剖析领域的企业,包含 Jaspersoft、Spotfire、Statistica 和 Alpine Data,并将它们整合到统一的平台中。Gartner 很欣赏 TIBCO 的这一点:供给端到端工作流程集成以及物联网功能,尤其是流式剖析的整合。它潜在的问题包含机能和稳固性、数据治理及操作方面的问题。
 
  SAS 是这份名单上的多年竞争者。实际上它有多个经由评估的平台。它的 Enterprise Miner 产品在一系列指标中供给了强大年夜靠得住的机能,而可视化数据挖掘与机械进修(Visual Data Mining and Machine Learning,VDMML)在数据筹备和扩充方面得分很高。很高的客户知足度和强大的市场霸占率巩固了 SAS 作为引诱者的位置。但 Gartner 也指出了 SAS 存在的一些毛病,特别是在订价和产品一致性方面,SAS EM 的用户体验并没有达到"平易近众的预期,并且 SAS 的开源方法对 Gartner 来说是个问号。