炼数成金 商业智能机器学习
订阅

机器学习

彻底搞懂机器学习中的正则化
彻底搞懂机器学习中的正则化
在总结正则化(Regularization)之前,我们先谈一谈正则化是什么,为什么要正则化。其实正则化的本质很简单,就是对某一问题加以先验的限制或约束以达到某种特定目的的一种手段或操作。在算法中使用正则化的目的是防 ...
CRF用过了,不妨再了解下更快的MEMM?
CRF用过了,不妨再了解下更快的MEMM?
HMM、MEMM、CRF被称为是三大经典概率图模型,在深度学习之前的机器学习时代,它们被广泛用于各种序列标注相关的任务中。一个有趣的现象是,到了深度学习时代,HMM和MEMM似乎都“没落”了,舞台上就只留下CRF。相信做 ...
将“softmax+交叉熵”推广到多标签分类问题
将“softmax+交叉熵”推广到多标签分类问题
一般来说,在处理常规的多分类问题时,我们会在模型的最后用一个全连接层输出每个类的分数,然后用softmax激活并用交叉熵作为损失函数。在这篇文章里,我们尝试将“softmax+交叉熵”方案推广到多标签分类场景,希望 ...
准确率、精准率、召回率、F1,我们真了解这些评价指标的意义吗?
准确率、精准率、召回率、F1,我们真了解这些评价指标的意义吗?
众所周知,机器学习分类模型常用评价指标有Accuracy, Precision, Recall和F1-score,而回归模型最常用指标有MAE和RMSE。但是我们真正了解这些评价指标的意义吗?在具体场景(如不均衡多分类)中到底应该以哪种指标为 ...
打开AI的黑盒子:模型可解释性的现状、应用前景与挑战
打开AI的黑盒子:模型可解释性的现状、应用前景与挑战
无论在学术界还是工业界,模型可解释性目前都还是一个相当新的领域。我们会在这次分享中用综述的形式对模型可解释性做一个总体介绍,帮助大家了解什么是模型的可解释性,以及它诞生的背景是什么样的,我们为什么需要 ...
AutoML-调参迈入蒸汽时代
AutoML-调参迈入蒸汽时代
抽象,再抽象。 AutoML体验有感。抽象这个词我真的是越来越喜欢了。小时候把看不懂的文字或者画叫抽象,虽然那些东西我现在依然不懂,但是现在对于抽象这两个字多少有点认识。本科的时候老师说“数学是自然科学的抽 ...
周志华:Boosting学习理论的探索 —— 一个跨越30年的故事
周志华:Boosting学习理论的探索 —— 一个跨越30年的故事
AdaBoost的算法流程非常简单,用夏柏尔自己的话说,它仅需“十来行代码(just 10 lines of code)”。但这个算法非常有效,并且经修改推广能应用于诸多类型的任务。例如,在人脸识别领域被誉为“第一个实时人脸检测器 ...
机器学习所需的工程量未来会大大减少
机器学习所需的工程量未来会大大减少
构建一个有用的机器学习产品需要创建大量的工程组件,其中只有一小部分涉及 ML 代码。构建生产级 ML 系统涉及到很多工作,比如构建数据管道、配置云资源和管理服务基础设施。传统上,ML 的研究主要集中于创建更好的 ...
机器学习研究者的养成指南,吴恩达建议这么读论文
机器学习研究者的养成指南,吴恩达建议这么读论文
如何成为一名高效的机器学习研究者,然后在这个领域取得一些成就?在此之前,我们需要养成什么样的习惯?近日,一位网友在 Reddit 上发帖提问:「那些高效的机器学习研究者,都有什么样的习惯?」比如,在 Arxiv 上 ...
Focal Loss--从直觉到实现
Focal Loss--从直觉到实现
做机器学习分类问题,难免遇到Biased-Data-Problem, 例如CV的目标检测问题: 绝大多数检测框里都是 backgroud,NLP的异常文本检测: 绝大多数文本都是 normal。对此,以下套路可以缓解:升/降采样, 或者调整样本权重, ...
Uber开源Manifold:机器学习可视化调试工具
Uber开源Manifold:机器学习可视化调试工具
在 2019 年 1 月,Uber 推出了 Manifold,这是一种与模型无关的机器学习可视化调试工具,用来识别机器学习模型中的问题。为了让其他机器学习从业者能够享受到这个工具带来的好处,日前,Uber 宣布 将 Manifold 作为 ...
手把手教你用 Flask,Docker 和 Kubernetes 部署Python机器学习模型(附代码)
手把手教你用 Flask,Docker 和 Kubernetes 部署Python机器学习模型(附代码)
将机器学习(ML)模型部署到生产环境中的一个常见模式是将这些模型作为 RESTful API 微服务公开,这些微服务从 Docker 容器中托管,例如使用 SciKit Learn 或 Keras 包训练的 ML 模型,这些模型可以提供对新数据的预 ...
机器学习奠基人Michael Jordan:下代技术是融合经济学,解读2项重要进展
机器学习奠基人Michael Jordan:下代技术是融合经济学,解读2项重要进展
电气工程学的前身是一些电子公式,但无法回答研发电路以及实现城市电气化等问题,随着人们开始思考抗阻模块、线路等,便诞生了电子工程学。Michael I.Jordan 认为机器学习的发展,遵循着和上面两种学科类似的理论和 ...
用光点亮黑箱:微软开源可解释机器学习框架InterpretML
用光点亮黑箱:微软开源可解释机器学习框架InterpretML
随着机器学习日益成熟,应用愈渐广泛,构建能让用户理解的模型也正变得越来越重要。在医疗、金融和司法等高风险应用中,这一点尤其显著。可解释性在模型调试、合规性和人机交互等一般应用的机器学习问题方面也很重要 ...
半监督学习的新助力:无监督数据扩增法
半监督学习的新助力:无监督数据扩增法
深度学习的成功在很大程度上离不开一些关键因素的驱动,例如算法改进、并行处理硬件 (GPU/TPU) 以及可获取的大规模标记数据集(如 ImageNet)。然而,当标记数据稀缺时,我们便难以训练神经网络,使其发挥出色性能。 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2020-7-5 06:17 , Processed in 0.126263 second(s), 16 queries .