炼数成金 商业智能机器学习
订阅

机器学习

lightgbm算法优化-不平衡二分类问题
lightgbm算法优化-不平衡二分类问题
本文档采用微软开源的lightgbm算法进行分类,运行速度极快。具体步骤为:读取数据;并行运算:由于lightgbm包可以通过设置相应参数进行并行运算,因此不再调用doParallel与foreach包进行并行运算;特征选择:使用mlr ...
南京大学周志华教授综述论文:弱监督学习
南京大学周志华教授综述论文:弱监督学习
监督学习技术通过学习大量训练样本来构建预测模型,其中每个训练样本都有一个标签标明其真值输出。尽管当前的技术已经取得了巨大的成功,但是值得注意的是,由于数据标注过程的高成本,很多任务很难获得如全部真值标 ...
数据驱动设计:从学习特征到学习算法
数据驱动设计:从学习特征到学习算法
寻找一个函数的最优解,是许多人工智能问题的本质。寻找函数最大值的问题可以被类比为搜索3D拓扑地图上的最高点,比如地球表面的最高点。假设我们事先并不知道珠穆朗玛峰是最高点,那么为了寻找这样的最高点,我们最 ...
机器学习面试指南,非AI领域也可借鉴的方法论
机器学习面试指南,非AI领域也可借鉴的方法论
写在前面本文是机器学习面试不完全指南,因为面试和经验这些东西也往往都是一家之言,可参考,但并不一定就完全适合你。所以,我们搜集了一些比较靠谱的经验,整合起来放送给你,希望能够对你的职业生涯有所帮助。一 ...
从数学到实现,全面回顾高斯过程中的函数最优化
从数学到实现,全面回顾高斯过程中的函数最优化
我们回顾了高斯过程(GP)拟合数据所需的数学和代码,最后得出一个常用应用的 demo——通过高斯过程搜索法快速实现函数最小化。下面的动图演示了这种方法的动态过程,其中红色的点是从红色曲线采样的样本。使用这些 ...
用 KNN 来进行验证码识别
用 KNN 来进行验证码识别
我们要识别,就得逆行之,具体思路就是,首先二值化去掉噪点,然后把单个字符分割出来,最后旋转至标准方向,然后从这些处理好的图片中选出模板,最后每次新来一张验证码就按相同方式处理,然后和这些模板进行比较, ...
从香农熵到手推KL散度:一文带你纵览机器学习中的信息论
从香农熵到手推KL散度:一文带你纵览机器学习中的信息论
信息论是应用数学的一个分支,主要研究的是对一个信号包含信息的多少进行量化。它最初被发明是用来研究在一个含有噪声的信道上用离散的字母表来发送消息,例如通过无线电传输来通信。而本文主要探讨信息熵在 AI 或机 ...
将应用机器学习转化为求解搜索问题
将应用机器学习转化为求解搜索问题
机器学习的应用就是智能系统解决特定可学习问题的发展。可学习问题的主要特征包括由输入数据和输出数据的集合以及两者之间的未知的相关关系。可学习系统的目标是学习输入和输出数据之间的通用映射,以便可以对从输出 ...
2018年值得关注的200场机器学习会议
2018年值得关注的200场机器学习会议
2017年马上就要过去了,这一年你的收获怎么样?在学习的过程中,独自学习与向别人学习同样重要,其中通过各种会议了解AI行业研究成果是个不错的提高自己的方法。对于专注于机器学习的伙伴来说,2018年有哪些值得关注 ...
开源DAWN,Spark和Mesos后Stanford的又一力作
开源DAWN,Spark和Mesos后Stanford的又一力作
随着 ML 应用程序技术的发展,越来越多的组织开始将这种技术用于生产中以提高效率。然而,事实上,这种“高端”技术只有那些资金充足和有庞大技术团队的组织才能享用,为了大幅简化 AI 应用程序构建过程,普及 AI 技 ...
理解XGBoost机器学习模型的决策过程
理解XGBoost机器学习模型的决策过程
随着机器学习的产业应用不断发展,理解、解释和定义机器学习模型的工作原理似乎已成日益明显的趋势。对于非深度学习类型的机器学习分类问题,XGBoost 是最流行的库。由于 XGBoost 可以很好地扩展到大型数据集中,并 ...
谷歌用ML模型替代数据库组件,或彻底改变数据系统开发
谷歌用ML模型替代数据库组件,或彻底改变数据系统开发
“如果这项研究取得更多的成果,将来有一天我们很可能回过头看然后说,索引是最先倒下的,接着是其他的数据库组件(排序算法、查询优化、连接),它们都逐渐被神经网络取代。”纽约州立大学布法罗分校的计算机科学和 ...
2018 AI趋势:AI芯片更丰富,用机器学习的企业翻倍
2018 AI趋势:AI芯片更丰富,用机器学习的企业翻倍
这是一个急速变化但又有很强发展衔接性的时代。强大的运算力对训练和推理神经网络来说必不可少。2009年,第一块GPU问世,这种专门为密集型计算、高度并行计算设计的芯片,比CPU更能满足机器学习任务的要求。自此,越 ...
Jeff Dean出品:用机器学习索引替代B-Trees,3倍性能提升
Jeff Dean出品:用机器学习索引替代B-Trees,3倍性能提升
数据库最开始是统一的,一刀切的“黑箱”问题。随着时间的推移,这一观点细化到了“标准尺寸”的 OLAP数据库和 OLTP数据库。数据库使用索引来快速访问数据。B-tree和哈希映射是常用的实现索引的技术。但从“黑箱”的 ...
基于Docker的机器学习--Tensorflow-GPU环境
基于Docker的机器学习--Tensorflow-GPU环境
基于 NVIDIA-Docker 的 CPU 环境中,GPU是可以复用的,可以将1个GPU挂载到多个 docker 容器中使用提高了GPU的使用效率,这是 KVM 虚拟机通过硬件透传无法实现的。由于多个容器共享一个GPU,不能做到对 GPU 资源进行 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-9-19 15:31 , Processed in 0.079671 second(s), 16 queries .