Tag: dm

数据挖掘工具

今天读到这个blog,先把这些工具记一下。

weka

1:weka。先说下以下这几个工具,我基本上都不熟悉,即使如此,这几个里,我相对熟悉的就是这个weka了。还买过关于那本weka的书。没读完,前半部分讲一些数据挖掘的概念和算法,后半部分讲weka这个工具的使用。基本上数据挖掘的三大部分,分类,聚类和关联分析,该书比较侧重分类部分(因为我看它分类的部分写了很多,然后有很多代码。。),不过此牛人认为分类是weka比较弱势的部分,看来这本书我还有待进一步的研读。

Read more… »

[译]“数据挖掘”是世界上最好的工作的五个理由

原文地址在这里:http://www.dataminingblog.com/five-reasons-why-data-miner-is-the-best-job-in-the-world/

译文:

是的,我的确相信“数据挖掘”是世界上最好的工作,我会告诉你五个理由我为什么会这么想。当然,我自己就是做“数据挖掘”的,这似乎有点主观,但谁管它,这里就是所有人都会羡慕“数据挖掘工作者”的五个理由:

1:我们可以预测未来。

是的,我们可以。尽管不是100%的准确,但是我们还是可以预测未来。一旦我们有足够的包含了某种模式的数据,我们就可以预测未来。客户下次会买什么产品?明天花粉会集中在哪里?下周的股票的走势是怎样的?我们可以预测,尽管会有些错误。是不是很酷?

2:我们换工作而不换工作

听起来很奇怪?让我来解释一下。数据挖掘是一个我们可以应用机器学习和统计学方法的领域。每一个新的项目可能包含不同的领域。这样给了你机会把数据挖掘技术应用到发现和学习新东西的机会,而这在本质上并不会改变你的工作。身为一个数据挖掘工作者,我六年内在气象学,工程学,财经和电信等方面都进行过数据挖掘。多棒的工作啊!

Read more… »