WaiMen   发表于 2019-5-11 22:00:06 |栏目:

数据在当今天下意味着款项。随着向基于app的天下的过渡,数据呈指数增长。然而,大多数数据好坏布局化的,因此须要一个过程和方法从数据中提取有用的信息,并将其转换为可理解的和可用的情势。

数据发掘或“数据库中的知识发现”是通过人工智能、机器学习、统计和数据库体系发现大数据会集的模式的过程。

免费的数据发掘工具包括从完备的模子开辟环境如Knime和Orange,到各种用Java、c++编写的库,最常见的是Python。数据发掘中通常涉及到四种使命:

分类: 将认识的布局概括为新数据的使命

聚类: 在数据中以某种方式查找组和布局的使命,而不须要在数据中使用已留意的布局。

关联规则学习: 查找变量之间的关系

回归: 旨在找到一个函数,用最小的错误来模拟数据。

下面列出了用于数据发掘的免费软件工具

数据发掘工具

1.Rapid Miner

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220054q30jdcue3v8sd82s

Rapid Miner,原名YALE又一个学习环境,是一个用于机器学习和数据发掘实验的环境,用于研究和实际的数据发掘使命。毫无疑问,这是天下领先的数据发掘开源体系。该工具以Java编程语言编写,通过基于模板的框架提供高级分析。

它使得实验可以由大量的可任意嵌套的利用符构成,这些利用符在XML文件中是具体的,而且是由快速的Miner的图形用户界面完成的。最好的是用户不须要编写代码。它已经有许多模板和其他工具,让我们可以轻松地分析数据。

2. IBM SPSS Modeler

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220055gaa2n9apadedllx9

IBM SPSS Modeler工具工作台最得当处理文本分析等大型项目,其可视化界面非常有代价。 它允许您在不编程的环境下生成各种数据发掘算法。 它也可以用于异常检测、贝叶斯网络、CARMA、Cox回归以及使用多层感知器进行反向流传学习的根本神经网络。

3.Oracle Data Mining

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220056u4euxqx1re11q2rr

Oracle。 作为“高级分析数据库”选项的一部分,Oracle数据发掘功能允许其用户发现洞察力,进行预测并使用其Oracle数据。您可以构建模子来发现客户举动目标客户和开辟概要文件。

Oracle Data Miner GUI使数据分析师、业务分析师和数据科学家可以或许使用相当优雅的拖放办理方案处理数据库内的数据。 它还可以为整个企业的主动化、调度和摆设创建SQL和PL / SQL脚本。

4. Teradata

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220057oinvjajbfkklunic

Teradata认识到,尽管大数据是令人敬畏的,但假如您实际上并不知道怎样分析和使用它,那么它是毫无代价的。 想象一下,有数百万的数据点没有查询的技能。 这就是Teradata所提供的。它们提供数据堆栈,大数据和分析以及市场营销应用程序方面的端到端办理方案和服务。

Teradata还提供一系列的服务,包括实行,业务咨询,培训和支持。

5. Framed Data

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220057sq1zjsejqwb3sgjb

这是一个完全管理的办理方案,这意味着你不须要做任何事变,而是坐下来期待见解。 框架数据从企业获取数据,并将其转化为可行的见解和决议。 他们在云中练习、优化和存储产物的电离模子,并通过API提供预测,消除根本架构开销。 他们提供了仪表板和景象分析工具,告诉你哪些公司杠杆是驾驶你关心的指标。

6. Kaggle

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220058cmtobbiwfti9zk6l

Kaggle是举世最大的数据科学社区。 公司和研究人员张贴他们的数据,来自天下各地的统计人员和数据发掘者竞相制作最好的模子。Kaggle是数据科学竞赛的平台。 它资助您办理困难,招募强大的团队,并扩大您的数据科学人才的气力。

3个步骤的工作 :

上传预测题目

提交

评估和交流

7. Weka

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220058v2xzhj2hlzo050xo

WEKA是一个非常复杂的数据发掘工具。 它向您展示了数据集、集群、预测建模、可视化等方面的各种关系。您可以应用多种分类器来深入相识数据。

8. Rattle

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220059jj03k81oqmmz0f8f

Rattle代表R分析工具轻松学习。 它提供数据的统计和可视化汇总,将数据转换为可以轻松建模的表单,从数据中构建无监督模子和监督模子,以图形方式呈现模子的性能,并对新数据集进行评分。

它是一个使用Gnome图形界面在统计语言R编写的免费的开源数据发掘工具包。 它运行在GNU / Linux,Macintosh OS X和MS / Windows下。

9. KNIME

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220059dd88iiavv1z1airg

Konstanz信息收罗器是一个用户友爱、可理解、全面的开源数据集成、处理、分析和探索平台。它有一个图形用户界面,资助用户方便地毗连节点进行数据处理。

KNIME还通过模块化的数据流水线概念集成了机器学习和数据发掘的各种组件,并引起了商业智能和财务数据分析的留意。

10. Python

作为一种免费且开放源代码的语言,Python通常与R进行比较,以方便使用。 与R差别的是,Python的学习曲线往往很短,因此成了传奇。 许多用户发现,他们可以开始构建数据集,并在几分钟内完成极其复杂的亲和力分析。 只要您认识变量、数据类型、函数、条件和循环等根本编程概念,最常见的业务用例数据可视化就很简朴。

11. Orange

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220100j0r8n95k4kc09whk

Orange是一个以Python语言编写的基于组件的数据发掘和机器学习软件套件。它是一个开放源码的数据可视化和分析的新手和专家。数据发掘可以通过可视化编程或Python脚本进行。它还包罗了数据分析、差别的可视化、从散点图、条形图、树、到树图、网络和热图的特性。

12. SAS Data Mining

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220101bvn2ifnnsdtczi2v

使用SAS Data Mining商业软件发现数据集模式。 其描述性和预测性建模提供了更好的理解数据的见解。 他们提供了一个易于使用的GUI。 他们拥有主动化的数据处理工具,集群到最终可以找到正确决议的最佳结果。 作为一个商业软件,它还包括可升级处理、主动化、强化算法、建模、数据可视化和勘探等先辈工具。

13. Apache Mahout

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220101nztvf2bsatqwt7ks

Apache Mahout是Apache软件基金会(Apache Software Foundation)的一个项目,用于生成重要会集在协作过滤、聚类和分类领域的分布式或其他可伸缩机器学习算法的免费实现。

Apache Mahout重要支持三种用例:发起发掘采取用户举动,并实验查找用户大概喜好的项目。 集群须要 文本文档,并将它们分组为局部相干的文档。 分类从现有的分类文档中学习到特定种别的文档是什么样子,并可以或许将未标志的文档分配给(希望)正确的种别。

14. PSPP

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220102b6r7p9jcfejj7eg6

PSPP是对采样数据进行统计分析的程序。 它有一个图形用户界面和传统的下令行界面。 它用C语言编写,使用GNU科学图书馆的数学例程,并绘制UTILS来生成图表。 它是专有程序SPSS(来自IBM)的免费更换品,可以自尊地预测接下来会发生什么,以便您可以做出更明智的决议,办理题目并改进结果。

15. jHepWork

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220102jri9x94gzgy1qgcy

jHepWork是一个免费的开放源代码数据分析框架,它是为了使用开放源代码软件包和可理解的用户界面创建一个数据分析环境,并创建一个与商业程序相竞争的工具。

JHepWork显示数据集的交互式2D和3D图,以便更好地分析。 Java中实现了数字科学库和数学函数。 jHepWork基于高级编程语言Jython,但Java编码也可用于调用jHepWork数值库和图形库。

16. R programming Language

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220104f4rnlx9axn4r4k44

为什么R是这个名单上免费数据发掘工具的超等巨星?它是免费的、开源的,而且很轻易为那些没有编程履历的人挑选。实际上,有数以千计的库可以集成到R环境中,使其成为一个强大的数据发掘环境。它是一个免费的软件编程语言和软件环境,用于统计盘算和图形。

在数据采矿者中广泛使用R语言进行统计软件和数据分析。比年来,易用性和可扩展性大大提高了R的着名度。

17. Pentaho

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220104tgg8ggfav77uigg7

Pentaho为数据集成,业务分析和大数据提供了一个全面的平台。 有了这个商业工具,你可以轻松地融合任何泉源的数据。 深入相识您的业务数据,为未来做出更正确的信息驱动决议。

18. Tanagra

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220105un60kddzy61dv1c9

TANAGRA是一个用于学术和研究目标的数据发掘软件。 有探索性数据分析,统计学习,机器学习和数据库领域的工具。 Tanagra包罗一些监督学习,但也包括其他范例,如聚类,因子分析,参数和非参数统计,关联规则,特性选择和构建算法。

19. NLTK

干货I 19款最好用的免费数据挖掘工具大汇总!  最新资讯 220106q6dqpsd3ksqdnddd

自然语言工具包,是一套用于Python语言的符号和统计自然语言处理(NLP)的库和程序。 它提供了一个语言处理工具库,包括数据发掘,机器学习,数据报废,情感分析和其他各种语言处理使命。 构建python程序来处理人类语言数据。

End.

回复
凝链下载站 - 下载导读:
1、不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件购买注册,得到更好的正版服务。本资源如有侵犯您的版权,请联系管理员删除本资源!
2、论坛的所有内容都不保证其准确性,有效性,时间性。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
3、当政府机关依照法定程序要求披露信息时,论坛均得免责。
4、若因线路及非本站所能控制范围的故障导致暂停服务期间造成的一切不便与损失,论坛不负任何责任。
5、注册会员通过任何手段和方法针对论坛进行破坏,我们有权对其行为作出处理。并保留进一步追究其责任的权利。

回复 显示全部楼层 使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表