Quantcast
Channel: BlogJava-Change Dir-随笔分类-机器学习
Browsing latest articles
Browse All 6 View Live

Image may be NSFW.
Clik here to view.

贝叶斯决策——总结笔记

        贝叶斯决策论的基本思想非常简单。为最小化总风险,总是选择那些能够最小化条件风险R(a|x)的行为。尤其是,为了最小化分类问题中的误差概率,总是选择那些使后验概率P(wj|x)最大的类别。贝叶斯公式允许我们通过先验概率P(wj)和条件密度p(x|wj)来计算后验概率。如果对在模式wj中所做的误分的惩罚与模式wj的不同,那么在做出判决行为之前,必须先根据该惩罚函数对后验概率加权。...

View Article


Image may be NSFW.
Clik here to view.

weka的java使用(1)——聚类

     摘要: weka是著名的数据挖掘工具,在这里有详细介绍,IDMer老师的博客里也有比较详细的用法描述。当然,如果直接使用weka的工具,自然没有问题,但是如果想用weka的功能在自己的平台框架中呢?我这里放出一个当初对weka的源码学习过程,主要是如何调用weka的api。仅供参考,代码中有什么问题,欢迎邮件联系。...

View Article


Image may be NSFW.
Clik here to view.

weka的java使用(2)——分类

     摘要: 书接上文,既然写了聚类,再把我用到的分类的相关代码奉上。   1/** *//**   2 *    3 */   4package edu.tju.ikse.mi.util;   5   6import j...  阅读全文changedi 2010-11-04 09:51 发表评论

View Article

Image may be NSFW.
Clik here to view.

weka的java使用(3)——特征选择

继续weka的编程系列。数据挖掘的一个重要的过程就是要特征选择,主要作用就是降维,并且降低计算的复杂性,摒弃那些可能的潜在噪声。在我的paper中和硕士论文中都用到了CFS的特征子集选择方法,配以最佳优先的搜索或者贪心搜索,这样可以将维度比较高的训练特征集降维并简化,大概用CFS+Best first可以将我的训练样本中的145维特征降到40-50之间。...

View Article

Image may be NSFW.
Clik here to view.

weka特征预处理的一些tip

首先,提供两个地址,这里包含了全部的内容原文:http://weka.wikispaces.com/Text+categorization+with+Wekahttp://weka.wikispaces.com/ARFF+files+from+Text+Collectionsweka可以以目录形式读入数据。然后再简单说一下weka在做文本特征内容处理时候需要注意的东西:声明一点,在weka的gui下...

View Article


Image may be NSFW.
Clik here to view.

weka定制计划 已添加到github

今天把weka3.7.0官方的开发版本添加到github,有需要的同学可以去下载使用,其中我已经配置好libsvm和liblinear,聚类的clusterEvaluation也定制输出了一些额外的信息比如错误聚类的原始类标和聚类类标的对比(这个功能可以帮助我们定位到类似EM或者KMEANS算法聚类结果中哪些instance被标记的类型)。另外,对weka感兴趣的朋友也欢迎贡献代码和想法需求,我可以...

View Article
Browsing latest articles
Browse All 6 View Live