炼数成金 商业智能机器学习
订阅

机器学习

为KNN分类器增加Cross-Validation功能
为KNN分类器增加Cross-Validation功能
有这么一句很有趣的话,如果一个东西走路象鸭子、叫起来象鸭子、吃起来也象鸭子,那它就是一只鸭子。这是一种很符合我们直觉的思维方式:将未知的对象和已知的东西相比较,如果各个属性相近,我们就把它们归为一个类 ...
基于密度的聚类分析
基于密度的聚类分析
聚类分析是一种无监督学习方法,目的是捕获数据的自然结构,从而将数据划分为有意义的组。聚类分析还可以用来对大数据进行预处理,为进一步的数据挖掘工作起到压缩和降维的作用。在前面的文章中我们已经谈到了K均值聚 ...
降维中的特征选择
降维中的特征选择
在数据挖掘过程中,高维数据是非常棘手的研究对象。特别是在文本挖掘、图像处理和基因数据分析中,维度过高使很多学习器无法工作或效率降低,所以降维也是数据预处理过程的一项必要任务。降维大致有两大类别,一类是 ...
用glmnet包实施套索算法(LASSO)
用glmnet包实施套索算法(LASSO)
当我们使用数据训练分类器的时候,很重要的一点就是要在过度拟合与拟合不足之间达成一个平衡。防止过度拟合的一种方法就是对模型的复杂度进行约束。模型中用到解释变量的个数是模型复杂度的一种体现。控制解释变量个 ...
fMRI数据分析处理原理及方法
fMRI数据分析处理原理及方法
近年来,血氧水平依赖性磁共振脑功能成像(Blood oxygenation level-dependent functional magnetic resonance imaging, BOLD-fMRI)技术得到极快的发展,除了与扫描硬件、扫描技术的进步有关外,更得力于以图形图像等 ...
数据挖掘—决策树ID3分类算法的C++实现
数据挖掘—决策树ID3分类算法的C++实现
数据挖掘课上面老师介绍了下决策树ID3算法,我抽空余时间把这个算法用C++实现了一遍。 决策树算法是非常常用的分类算法,是逼近离散目标函数的方法,学习得到的函数以决策树的形式表示。其基本思路是不断选取产生信息 ...
决策树仍是最好的数据挖掘算法
决策树仍是最好的数据挖掘算法
决策树仍是最好的数据挖掘算法:理由如下: 决策树是白箱「white box」,意味着可以生成简单易懂的规则。你可以通过查看决策树清楚明白各个分支,明白某个分支的影响,并且将其和其他分支进行对比。 决策树术为非参 ...
聚类分析在市场分析中的应用
聚类分析在市场分析中的应用
这种较成熟的统计学方法如果在市场分析中得到恰当的应用,必将改善市场营销的效果,为企业决策提供有益的参考。其应用的步骤为:将市场分析中的问题转化为聚类分析可以解决的问题,利用相关软件(如SPSS、SAS等)求得 ...
基于密度的聚类算法OPTICS
基于密度的聚类算法OPTICS
1 什么是OPTICS算法 在前面介绍的DBSCAN算法中,有两个初始参数E(邻域半径)和minPts(E邻域最小点数)需要用户手动设置输入,并且聚类的类簇结果对这两个参数的取值非常敏感,不同的取值将产生不同的聚类结果,其实这 ...
用matlab做聚类分析
用matlab做聚类分析
Matlab提供了两种方法进行聚类分析。 一种是利用 clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法; 另一种是分步聚类:(1)找到数据集合中变量两两之间的相似性和非 ...
聚类分析在用户分类中的应用
聚类分析在用户分类中的应用
用于聚类的变量数目不是越多越好,没有明显差异的变量对聚类没有起到实质意义,而且可能使结果产生偏差;其次,高度相关的变量相当于给这些变量进行了加权,等于放大了某方面因素对用户分类的作用。
基于用户投票的排名算法(二):Reddit
基于用户投票的排名算法(二):Reddit
上一次,我介绍了Hacker News的排名算法。它的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。 Reddit是美国最大的网上社区,它的每个帖子前面都有向上 ...
基于用户投票的排名算法(一):Delicious和Hacker News
基于用户投票的排名算法(一):Delicious和Hacker News
互联网的出现,意味着"信息大爆炸"。 用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。 各种各样的排名算法,是目前过滤信息的主要手 ...
星座图聚类分析的QAM信号调制识别算法及DSP实现
星座图聚类分析的QAM信号调制识别算法及DSP实现
本文首先讨论基于信号星座图聚类分析的QAM信号识别算法,接着对TS201芯片进行了简介,最后在给出了DSP程序开发流程的基础上,利用TS201芯片完成了算法DSP实现。 QAM(Quadrature Amplitude Modulation)正交幅度调制是 ...
预测分析将在业务中发挥作用
预测分析将在业务中发挥作用
最新研究表明,尽管预测分析的使用存在大量炒作和希望,一小部分的企业将预测分析看成是他们商业智能(BI)战略的关键因素。只有13%的企业表示他们使用预测分析,在一组10个BI功能里它排在最后一位,远远落后于电子 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2019-2-24 09:26 , Processed in 0.096712 second(s), 16 queries .