请选择 进入手机版 | 继续访问电脑版

设为首页 收藏本站
思科社区 关注
思科社区

搜索
热搜: 邮件服务器
查看: 412|回复: 1

【原创翻译】顶级数据科学工具大集合

[复制链接]
发表于 2020-4-20 08:43:13 | 显示全部楼层 |阅读模式

引言:本文向您介绍那些可被用于进行数据收集、分析和可视化的顶级数据科学工具。

无论您在工地搬砖(作者并无瞧不起建筑工人之意),还是在财富500强的企业中工作,拥有一套合适的工具是必不可少的。如今,各个企业为了能够顺畅地“构建出自己的商业大厦”,他们需要通过各种不同的工具,来达到事半功倍的效果。
同时,为了能够在数字全球化的环境中保持竞争力,各大公司都将注意力投向了如何建立一套完备的数据分析策略。因此,他们需要运用各种数据科学工具,通过各种途径,来对运营中的企业数据实现分类、切片(slicing)、和切块(dicing)。可以说,一套周详且实用的数据策略,既能协助您的企业实现更快的关键业务决策,又能达到更准确的结果预测。
但是摆在我们面前的难题往往是:如何判断在哪些应用场景中,采用哪种合适的工具。一般而言,建立一个健全的数据科学堆栈(data science stack,请详见https://www.alooma.com/blog/fueling-the-modern-data-science-stack)不但能够满足现代化数据分析的最低期望目标,而且能够为本企业的数据处理、与分析人员补足各种现有专业知识的短板。
幸运的是,那些提供面向数据解决方案的开发者们,一直致力于根据不断增长和变化的分析需求,通过对工具各项功能的提升,使之能够更快、更深入、更人性化地为各种类型的企业提供数据分析服务。
下面,我们将向您介绍一些能够帮助您对数据进行收集、存储、分析、可视化、以及用于机器学习的各种顶级数据科学工具。
数据收集工具
收集有质量的数据,并将其转化为适合于多种分析的形式,是每一种数据策略在制定之初的基本要求。合适的数据收集工具,不但能够帮助您减少由数据本身所产生的错误和重复,而且能够确保具备更高的精确度,以及各种数据来源的完整性。
业界常见的数据收集工具有如下五种:
u  GoSpotCheckhttps://www.gospotcheck.com/
u  IBM Datacaphttps://www.ibm.com/us-en/marketplace/data-capture-and-imaging
u  Mozendahttps://www.mozenda.com/
u  Ochtoprsehttps://www.octoparse.com/
u  HylandOnBasehttps://www.onbase.com/en/
数据分析工具
在数据中寻找内在的意义,并获取其隐藏的价值,是所有数据分析工作的核心。良好的工具使您能够更容易地理解数据,并从中领悟真正的含义,进而可以帮助您做出那些能够“改变游戏规则”的业务决策,甚至会影响到企业的整体收入、竞争力、创新意识、客户体验、以及运营效率。
下面是五种业界领先的数据分析工具和平台:
u  Alteryxhttps://www.alteryx.com/
u  Domino数据实验室(https://www.dominodatalab.com/
u  Informaticahttps://www.informatica.com/solutions/analytics.html
u  KNIME分析平台(https://www.knime.com/
u  RapidMinerhttps://rapidminer.com/
数据仓库工具
数据仓库能够以存储库的形式,对多种来源的数据进行合并与整合,通过标准化以方便数据被进一步地使用。数据仓库可以让您以实时或批量的方式,查询与自己业务相关的各种精准数据。那些运行在全球最大的云基础设施上的解决方案,如亚马逊的AthenaS3,能够帮助您实现随时随地存储、和检索任意数量级的数据。您不再需要拥有专门的分析系统,便可进行复杂的数据分析。
下面是五种顶级的数据仓库工具:
u  亚马逊的Redshifthttps://www.alooma.com/integrations/to/redshift
u  谷歌的BigQueryhttps://www.alooma.com/integrations/to/bigquery
u  微软的Azurehttps://www.alooma.com/integrations/to/microsoft-azure
u  MySQLhttps://www.alooma.com/integrations/to/mysql
u  Snowflakehttps://www.alooma.com/integrations/to/snowflake
数据可视化工具
可视化分析工具能够识别出数据的不同模型和趋势,并能帮助最终用户理解、和消化那些复杂的概念。它们能够以图表、图形和映射图的形式,让您更容易地访问、理解、以及可视化地共享自己的数据。
如下五种是业界高性能的数据可视化工具:
u  谷歌的Fusion Tableshttps://support.google.com/fusiontables/answer/2571232
u  JinfonetJReporthttps://www.jinfonet.com/
u  微软的Power BIhttps://powerbi.microsoft.com/en-us/data-visualization/
u  Qlikhttps://www.qlik.com/us/
u  SAShttps://www.sas.com/en_us/software/visual-analytics.html
机器学习工具
机器学习的宗旨是通过解析数据、从中学习、进而实现业务预测。如今市面上的机器学习工具都能够使用多种算法来表示、评估和优化各种数据,进而准确地解析出各种泛化(generalizations)和异常(anomalies)。
下面是业界普遍认为的五种最好的机器学习工具:
u  Anacondahttps://www.anaconda.com/
u  Databrickshttps://databricks.com/
u  DataRobothttps://www.datarobot.com/
u  Feature Labshttps://www.featurelabs.com/
u  H20.aihttps://www.h2o.ai/
启用数据分析计划
任何现代化数据分析策略的成功,都取决于对所有数据的完全访问。像亚马逊S3这样完备的数据解决方案势必能够简化、并加速我们从任何数据源中,将大量的数据加载到云端数据仓库、或基于云的存储服务那里。而一旦数据被载入仓库,您就可以根据自己所开发的任意机器学习模型,加深对于海量数据背后知识解读,进而更好地为客户提供服务、或开展商业创新。

【原标题】Top Data Science Tools  (作者: Garrett Alley)
原文链接:https://dzone.com/articles/top-data-science-tools


  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5
平均得分0 (0 评价)
发表于 2020-4-20 10:59:45 | 显示全部楼层
感谢版主分享,谢谢~
  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5
平均得分0 (0 评价)
您需要登录后才可以回帖 思科 CCO 登录 | 思科 CCO 注册   

本版积分规则

Archiver | 思科社区  

GMT+8, 2020-5-29 09:17 , Processed in 0.093061 second(s), 32 queries .

京ICP备11014401号-17

© 2020 思科系统.版权所有 重要声明 | 保密声明 | 隐私权政策 | 商标 |

快速回复 返回顶部 返回列表