炼数成金 商业智能机器学习
订阅

机器学习

全球机器学习领域顶尖的16家公司
全球机器学习领域顶尖的16家公司
机器学习是与人工智能一同急剧发展的领域。IDC预测,人工智能和机器学习的支出会从2016年的80亿美元增加到2020年的470亿美元。虽然这两个术语换着使用,而且常常一起出现,但有所不同。人工智能是自动化的统称,机器 ...
LightGBM大战XGBoost,谁将夺得桂冠?
LightGBM大战XGBoost,谁将夺得桂冠?
如果你是一个机器学习社区的活跃成员,你一定知道 **提升机器**(Boosting Machine)以及它们的能力。提升机器从AdaBoost发展到目前最流行的XGBoost。XGBoost实际上已经成为赢得在Kaggle比赛中公认的算法。这很简单 ...
Google提出新型学习范式,或将彻底改变机器学习领域
Google提出新型学习范式,或将彻底改变机器学习领域
最近,Google提出了一种称之为Deep Memory的新型学习范式,并在生成式建模任务上使用MenGEN算法将此范式得以实现,经过一系列实验表明,科学家们发现,要想尽可能多地保留样本中的信息,最好方法是将它们完全存储起 ...
原创翻译 | 机器学习可以帮助您找到理想的客户
原创翻译 | 机器学习可以帮助您找到理想的客户
基于传统的营销策略来寻找客户已经是老生常谈了。现在,当涉及到寻找客户时,机器学习是主要的吸引力。旧的解决方案要求销售和营销团队创建通用角色,然后通过关注广泛的相似之处将其分配给客户。但是随着大数据挖掘 ...
从结构到性能,一文概述XGBoost、Light GBM的同与不同
从结构到性能,一文概述XGBoost、Light GBM的同与不同
尽管近年来神经网络复兴并大为流行,但是 boosting 算法在训练样本量有限、所需训练时间较短、缺乏调参知识等场景依然有其不可或缺的优势。本文从算法结构差异、每个算法的分类变量时的处理、算法在数据集上的实现等 ...
lightgbm算法优化-不平衡二分类问题
lightgbm算法优化-不平衡二分类问题
本文档采用微软开源的lightgbm算法进行分类,运行速度极快。具体步骤为:读取数据;并行运算:由于lightgbm包可以通过设置相应参数进行并行运算,因此不再调用doParallel与foreach包进行并行运算;特征选择:使用mlr ...
南京大学周志华教授综述论文:弱监督学习
南京大学周志华教授综述论文:弱监督学习
监督学习技术通过学习大量训练样本来构建预测模型,其中每个训练样本都有一个标签标明其真值输出。尽管当前的技术已经取得了巨大的成功,但是值得注意的是,由于数据标注过程的高成本,很多任务很难获得如全部真值标 ...
数据驱动设计:从学习特征到学习算法
数据驱动设计:从学习特征到学习算法
寻找一个函数的最优解,是许多人工智能问题的本质。寻找函数最大值的问题可以被类比为搜索3D拓扑地图上的最高点,比如地球表面的最高点。假设我们事先并不知道珠穆朗玛峰是最高点,那么为了寻找这样的最高点,我们最 ...
机器学习面试指南,非AI领域也可借鉴的方法论
机器学习面试指南,非AI领域也可借鉴的方法论
写在前面本文是机器学习面试不完全指南,因为面试和经验这些东西也往往都是一家之言,可参考,但并不一定就完全适合你。所以,我们搜集了一些比较靠谱的经验,整合起来放送给你,希望能够对你的职业生涯有所帮助。一 ...
从数学到实现,全面回顾高斯过程中的函数最优化
从数学到实现,全面回顾高斯过程中的函数最优化
我们回顾了高斯过程(GP)拟合数据所需的数学和代码,最后得出一个常用应用的 demo——通过高斯过程搜索法快速实现函数最小化。下面的动图演示了这种方法的动态过程,其中红色的点是从红色曲线采样的样本。使用这些 ...
用 KNN 来进行验证码识别
用 KNN 来进行验证码识别
我们要识别,就得逆行之,具体思路就是,首先二值化去掉噪点,然后把单个字符分割出来,最后旋转至标准方向,然后从这些处理好的图片中选出模板,最后每次新来一张验证码就按相同方式处理,然后和这些模板进行比较, ...
从香农熵到手推KL散度:一文带你纵览机器学习中的信息论
从香农熵到手推KL散度:一文带你纵览机器学习中的信息论
信息论是应用数学的一个分支,主要研究的是对一个信号包含信息的多少进行量化。它最初被发明是用来研究在一个含有噪声的信道上用离散的字母表来发送消息,例如通过无线电传输来通信。而本文主要探讨信息熵在 AI 或机 ...
将应用机器学习转化为求解搜索问题
将应用机器学习转化为求解搜索问题
机器学习的应用就是智能系统解决特定可学习问题的发展。可学习问题的主要特征包括由输入数据和输出数据的集合以及两者之间的未知的相关关系。可学习系统的目标是学习输入和输出数据之间的通用映射,以便可以对从输出 ...
2018年值得关注的200场机器学习会议
2018年值得关注的200场机器学习会议
2017年马上就要过去了,这一年你的收获怎么样?在学习的过程中,独自学习与向别人学习同样重要,其中通过各种会议了解AI行业研究成果是个不错的提高自己的方法。对于专注于机器学习的伙伴来说,2018年有哪些值得关注 ...
开源DAWN,Spark和Mesos后Stanford的又一力作
开源DAWN,Spark和Mesos后Stanford的又一力作
随着 ML 应用程序技术的发展,越来越多的组织开始将这种技术用于生产中以提高效率。然而,事实上,这种“高端”技术只有那些资金充足和有庞大技术团队的组织才能享用,为了大幅简化 AI 应用程序构建过程,普及 AI 技 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-4-27 04:34 , Processed in 0.100573 second(s), 16 queries .