炼数成金 商业智能机器学习
订阅

机器学习

Spark团队开源新项目MLflow发布0.2版本,内置TensorFlow集成
Spark团队开源新项目MLflow发布0.2版本,内置TensorFlow集成
MLflow 让开发者可以基于任意机器学习库进行模型训练,只要可以将它们包装在 Python 函数中,但对于常用的库,MLflow 团队希望能够提供内置的支持。该版本增加了 mlflow.tensorflow 包,借助这个包,开发者可以轻松 ...
机器学习 —— 浅谈贝叶斯和MCMC
机器学习 —— 浅谈贝叶斯和MCMC
不论是学习概率统计还是机器学习的过程中,贝叶斯总是是绕不过去的一道坎,大部分人在学习的时候都是在强行地背公式和套用方法,没有真正去理解其牛逼的思想内涵。我看了一下 Chalmers 一些涉及到贝叶斯统计的课程, ...
揭秘:机器究竟是怎么学习的?
揭秘:机器究竟是怎么学习的?
从算法的角度看,机器学习有很多种算法,例如回归算法、基于实例的算法、正则化算法、决策树算法、贝叶斯算法、聚合算法、关联规则学习算法和人工神经网络算法。很多算法可以应用于不同的具体问题;很多具体的问题也 ...
原创翻译 | 使用MLBox的自动机器学习教程
原创翻译 | 使用MLBox的自动机器学习教程
目录 MLBox 是什么? MLBox 与其他机器学习框架的对比 安装 MLBox MLBox 的布局/流水线 使用 MLBox 构建一个机器学习回归器 对 Drift (漂移)的基本理解 对 Entity Embedding (嵌入式实体)的基本理解 MLBox 的优势 ...
原创翻译 | 用LIME来解释复杂的机器学习模型
原创翻译 | 用LIME来解释复杂的机器学习模型
机器学习模型做出的分类决策通常很难--如果不是不可能--我们的大脑就很难理解。一些最精确的分类器(如神经网络)的复杂性使它们表现得如此出色—往往比人类获得更好的结果。但这也使得它们本身很难解释,特别是对非 ...
该如何对「半监督学习算法」实际性应用进行评估?
该如何对「半监督学习算法」实际性应用进行评估?
半监督学习(Semi-supervised learning,SSL)提供了一个强大的框架,可以在标记有限或昂贵的情况下利用无标记数据。近期,基于深度神经网络的SSL算法已被证明在标准基准任务上是成功的。然而,我们认为,这些基准无 ...
全球机器学习领域顶尖的16家公司
全球机器学习领域顶尖的16家公司
机器学习是与人工智能一同急剧发展的领域。IDC预测,人工智能和机器学习的支出会从2016年的80亿美元增加到2020年的470亿美元。虽然这两个术语换着使用,而且常常一起出现,但有所不同。人工智能是自动化的统称,机器 ...
LightGBM大战XGBoost,谁将夺得桂冠?
LightGBM大战XGBoost,谁将夺得桂冠?
如果你是一个机器学习社区的活跃成员,你一定知道 **提升机器**(Boosting Machine)以及它们的能力。提升机器从AdaBoost发展到目前最流行的XGBoost。XGBoost实际上已经成为赢得在Kaggle比赛中公认的算法。这很简单 ...
Google提出新型学习范式,或将彻底改变机器学习领域
Google提出新型学习范式,或将彻底改变机器学习领域
最近,Google提出了一种称之为Deep Memory的新型学习范式,并在生成式建模任务上使用MenGEN算法将此范式得以实现,经过一系列实验表明,科学家们发现,要想尽可能多地保留样本中的信息,最好方法是将它们完全存储起 ...
原创翻译 | 机器学习可以帮助您找到理想的客户
原创翻译 | 机器学习可以帮助您找到理想的客户
基于传统的营销策略来寻找客户已经是老生常谈了。现在,当涉及到寻找客户时,机器学习是主要的吸引力。旧的解决方案要求销售和营销团队创建通用角色,然后通过关注广泛的相似之处将其分配给客户。但是随着大数据挖掘 ...
从结构到性能,一文概述XGBoost、Light GBM的同与不同
从结构到性能,一文概述XGBoost、Light GBM的同与不同
尽管近年来神经网络复兴并大为流行,但是 boosting 算法在训练样本量有限、所需训练时间较短、缺乏调参知识等场景依然有其不可或缺的优势。本文从算法结构差异、每个算法的分类变量时的处理、算法在数据集上的实现等 ...
lightgbm算法优化-不平衡二分类问题
lightgbm算法优化-不平衡二分类问题
本文档采用微软开源的lightgbm算法进行分类,运行速度极快。具体步骤为:读取数据;并行运算:由于lightgbm包可以通过设置相应参数进行并行运算,因此不再调用doParallel与foreach包进行并行运算;特征选择:使用mlr ...
南京大学周志华教授综述论文:弱监督学习
南京大学周志华教授综述论文:弱监督学习
监督学习技术通过学习大量训练样本来构建预测模型,其中每个训练样本都有一个标签标明其真值输出。尽管当前的技术已经取得了巨大的成功,但是值得注意的是,由于数据标注过程的高成本,很多任务很难获得如全部真值标 ...
数据驱动设计:从学习特征到学习算法
数据驱动设计:从学习特征到学习算法
寻找一个函数的最优解,是许多人工智能问题的本质。寻找函数最大值的问题可以被类比为搜索3D拓扑地图上的最高点,比如地球表面的最高点。假设我们事先并不知道珠穆朗玛峰是最高点,那么为了寻找这样的最高点,我们最 ...
机器学习面试指南,非AI领域也可借鉴的方法论
机器学习面试指南,非AI领域也可借鉴的方法论
写在前面本文是机器学习面试不完全指南,因为面试和经验这些东西也往往都是一家之言,可参考,但并不一定就完全适合你。所以,我们搜集了一些比较靠谱的经验,整合起来放送给你,希望能够对你的职业生涯有所帮助。一 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-7-23 05:43 , Processed in 0.111123 second(s), 16 queries .