炼数成金 商业智能机器学习
订阅

机器学习

聚类分析在用户分类中的应用
聚类分析在用户分类中的应用
用于聚类的变量数目不是越多越好,没有明显差异的变量对聚类没有起到实质意义,而且可能使结果产生偏差;其次,高度相关的变量相当于给这些变量进行了加权,等于放大了某方面因素对用户分类的作用。
基于用户投票的排名算法(二):Reddit
基于用户投票的排名算法(二):Reddit
上一次,我介绍了Hacker News的排名算法。它的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。 Reddit是美国最大的网上社区,它的每个帖子前面都有向上 ...
基于用户投票的排名算法(一):Delicious和Hacker News
基于用户投票的排名算法(一):Delicious和Hacker News
互联网的出现,意味着"信息大爆炸"。 用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。 各种各样的排名算法,是目前过滤信息的主要手 ...
星座图聚类分析的QAM信号调制识别算法及DSP实现
星座图聚类分析的QAM信号调制识别算法及DSP实现
本文首先讨论基于信号星座图聚类分析的QAM信号识别算法,接着对TS201芯片进行了简介,最后在给出了DSP程序开发流程的基础上,利用TS201芯片完成了算法DSP实现。 QAM(Quadrature Amplitude Modulation)正交幅度调制是 ...
预测分析将在业务中发挥作用
预测分析将在业务中发挥作用
最新研究表明,尽管预测分析的使用存在大量炒作和希望,一小部分的企业将预测分析看成是他们商业智能(BI)战略的关键因素。只有13%的企业表示他们使用预测分析,在一组10个BI功能里它排在最后一位,远远落后于电子 ...
分段回归的拐点连续性
分段回归的拐点连续性
我翻了一下,上一次写跟统计有关的话题已经是2010年的事情了,多数时候,这里写的都是(计算机)技术类与生活类的话题,于是我又想起来很久以前有客官说,你还不如改成“Keep on eating”算了。废话少说,言归正传。 ...
全网回归之数据分析
全网回归之数据分析
十万个为什么项目主要在于提升全网回归的脚本性能和稳定性,配合这个项目,kelude平台对每天全网回归的数据进行收集,整合后透明数据,初步建立了一套数据分析体系,包括全网回归的整体趋势,产品线的运行情况,实验 ...
流失分析设计
流失分析设计
前段时间说过一些关于玩家生命周期的问题,其实那些有点大,有点虚,从宏观的角度 了解我们此时此刻正在做的分析是属于那一部分,哪一个体系的,说实话,这是为了建立一种意识而要做的工作,玩家生命周期价值源于电信 ...
再说电商网站转化率:变现的算法
再说电商网站转化率:变现的算法
很有趣,过年时候写的文章《说说转化率》,三个月后被几个地方转载了,当时我还觉得自己的科普很没意义似的。   就着最近经常被各种记者和同行问到的“蘑菇街的变现转化”的问题,整理一下,就用上一篇的方式,再跟 ...
十大算法展辉煌历史,十大问题引锦绣前程
十大算法展辉煌历史,十大问题引锦绣前程
上篇博文末尾许下一愿--介绍数据挖掘十大算法。在博友们友好的催促之下,现在才姗姗来迟,歉疚有加。凡人写博是十分个性化的业余活动(非平凡人物可能会雇佣团队写博);在科技的春种秋收季节,人们总会遇到若干突然 ...
基于Kmeans算法、MBSAS算法及DBSCAN算法的文本分类器
基于Kmeans算法、MBSAS算法及DBSCAN算法的文本分类器
本文接数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上),本分类器的完整工程下载见点击打开链接,有详细说明的运行方法,用eclipse可以运行,学习数据挖掘的朋友可以跑一下 ...
基于贝叶斯算法及KNN算法的newsgroup18828的JAVA实现
基于贝叶斯算法及KNN算法的newsgroup18828的JAVA实现
本文主要描述基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现,包括数据预处理、kmeans算法、MBSAS算法及DBSCAN算法的实现。本聚类器的完整工程下载见点击打开链接,有详细说明的运行方 ...
K-均值聚类分析
K-均值聚类分析
K-均值聚类是流行、经典、简单的聚类方法之一。聚类是非监督学习的一种方法,也是常用的统计数据分析技术,应用领域很广,涉及机器学习、数据挖掘、模式识别、图像分析和生物信息学等。 ●下载源码 ●下载样例程序 ...
数据挖掘:神经网络在分类处理中的一个应用实例-C语言实现
数据挖掘:神经网络在分类处理中的一个应用实例-C语言实现
自然计算与应用的一个实验,花了3天左右的时间,在这里和大家分享下,谢绝抄袭。 1.算法设计思想 利用前馈神经网络对数据集diagnosis进行分类。数据集diagnosis中共含有120条记录,每个记录包含8个字段,具体说明如 ...
数据挖掘关联规则之Apriori算法
数据挖掘关联规则之Apriori算法
Apriori algorithm是关联规则里一项基本算法。是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项之间的关系,也被称为购物蓝分析 (Mar ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-9-19 15:13 , Processed in 0.111888 second(s), 16 queries .