炼数成金 商业智能机器学习
订阅

机器学习

从香农熵到手推KL散度:一文带你纵览机器学习中的信息论
从香农熵到手推KL散度:一文带你纵览机器学习中的信息论
信息论是应用数学的一个分支,主要研究的是对一个信号包含信息的多少进行量化。它最初被发明是用来研究在一个含有噪声的信道上用离散的字母表来发送消息,例如通过无线电传输来通信。而本文主要探讨信息熵在 AI 或机 ...
将应用机器学习转化为求解搜索问题
将应用机器学习转化为求解搜索问题
机器学习的应用就是智能系统解决特定可学习问题的发展。可学习问题的主要特征包括由输入数据和输出数据的集合以及两者之间的未知的相关关系。可学习系统的目标是学习输入和输出数据之间的通用映射,以便可以对从输出 ...
2018年值得关注的200场机器学习会议
2018年值得关注的200场机器学习会议
2017年马上就要过去了,这一年你的收获怎么样?在学习的过程中,独自学习与向别人学习同样重要,其中通过各种会议了解AI行业研究成果是个不错的提高自己的方法。对于专注于机器学习的伙伴来说,2018年有哪些值得关注 ...
开源DAWN,Spark和Mesos后Stanford的又一力作
开源DAWN,Spark和Mesos后Stanford的又一力作
随着 ML 应用程序技术的发展,越来越多的组织开始将这种技术用于生产中以提高效率。然而,事实上,这种“高端”技术只有那些资金充足和有庞大技术团队的组织才能享用,为了大幅简化 AI 应用程序构建过程,普及 AI 技 ...
理解XGBoost机器学习模型的决策过程
理解XGBoost机器学习模型的决策过程
随着机器学习的产业应用不断发展,理解、解释和定义机器学习模型的工作原理似乎已成日益明显的趋势。对于非深度学习类型的机器学习分类问题,XGBoost 是最流行的库。由于 XGBoost 可以很好地扩展到大型数据集中,并 ...
谷歌用ML模型替代数据库组件,或彻底改变数据系统开发
谷歌用ML模型替代数据库组件,或彻底改变数据系统开发
“如果这项研究取得更多的成果,将来有一天我们很可能回过头看然后说,索引是最先倒下的,接着是其他的数据库组件(排序算法、查询优化、连接),它们都逐渐被神经网络取代。”纽约州立大学布法罗分校的计算机科学和 ...
2018 AI趋势:AI芯片更丰富,用机器学习的企业翻倍
2018 AI趋势:AI芯片更丰富,用机器学习的企业翻倍
这是一个急速变化但又有很强发展衔接性的时代。强大的运算力对训练和推理神经网络来说必不可少。2009年,第一块GPU问世,这种专门为密集型计算、高度并行计算设计的芯片,比CPU更能满足机器学习任务的要求。自此,越 ...
Jeff Dean出品:用机器学习索引替代B-Trees,3倍性能提升
Jeff Dean出品:用机器学习索引替代B-Trees,3倍性能提升
数据库最开始是统一的,一刀切的“黑箱”问题。随着时间的推移,这一观点细化到了“标准尺寸”的 OLAP数据库和 OLTP数据库。数据库使用索引来快速访问数据。B-tree和哈希映射是常用的实现索引的技术。但从“黑箱”的 ...
基于Docker的机器学习--Tensorflow-GPU环境
基于Docker的机器学习--Tensorflow-GPU环境
基于 NVIDIA-Docker 的 CPU 环境中,GPU是可以复用的,可以将1个GPU挂载到多个 docker 容器中使用提高了GPU的使用效率,这是 KVM 虚拟机通过硬件透传无法实现的。由于多个容器共享一个GPU,不能做到对 GPU 资源进行 ...
Andrej Karpathy:神经网络是软件2.0,而非机器学习的一种工具
Andrej Karpathy:神经网络是软件2.0,而非机器学习的一种工具
我有时看到人们把神经网络称为“机器学习工具箱中的另一种工具”。神经网络作为一种工具有这样那样的优点和缺点,在这个任务或那个任务工作,有时你可以利用它们赢得Kaggle的比赛。不幸的是,这种解释只见树木,不见 ...
为什么XGBoost在机器学习竞赛中表现如此卓越?
为什么XGBoost在机器学习竞赛中表现如此卓越?
机器学习算法的目标是减少预期的泛化误差,这也被称为风险(risk)。如果我们知道真实的分布 P(x,y),那么风险的最小化就是一个可以通过优化算法解决的最优化任务。但是,我们并不知道真实分布,只是有一个用于训练 ...
呼之欲出的量子计算机,和它漫长的最后一英里
呼之欲出的量子计算机,和它漫长的最后一英里
图:中国科学院院士、量子计算专家、图灵奖获得者姚期智11月4日,中国科学院院士、量子计算专家、图灵奖获得者姚期智在腾讯WE大会的五周年论坛上远程发布了最新演讲。姚期智用RSA的密码系统作例子说明了量子计算机的 ...
数据缺失的坑,无监督学习这样帮你补了
数据缺失的坑,无监督学习这样帮你补了
无监督学习(UL)有很多没开发的潜力。它是一门从“未标记”数据中推导一个函数来描述其隐藏结构的艺术。但首先,从数据中找到其结构是什么意思呢? 让我们来看以下两个例子:Blobs气泡状分布:这个简单。任何人看到 ...
AUC越大,正确率就越高?
AUC越大,正确率就越高?
近日,一位朋友拿着两个模型预测效果比较的结果来咨询,当然是遇到了一个好像不太正常的现象才来咨询的。两个模型都是二分类结局的,应用常见的Logistic回归模型得到结果如下:模型A的正确率为85%,AUC为0.98;模型B ...
机器学习之确定最佳聚类数目的10种方法
机器学习之确定最佳聚类数目的10种方法
在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多博客,大多泛泛带过。今天把看到的这么多方法进行 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-1-19 02:01 , Processed in 0.027813 second(s), 16 queries .