炼数成金 商业智能机器学习
订阅

机器学习

千锤万凿出深山:且谈特征工程最佳实践
千锤万凿出深山:且谈特征工程最佳实践
作为为机器学习创建新特征的实现过程,特征工程已经成为改进预测模型的最具实效的方法之一。获取特征难度极高、相当耗时且要求具备专业知识。“应用机器学习”在本质上其实就是在实现特征工程。通过特征工程方法,你 ...
大规模机器学习的编程技术、计算模型以及Xgboost和MXNet案例
大规模机器学习的编程技术、计算模型以及Xgboost和MXNet案例
大家好,很高兴和大家一起分享大规模机器学习相关的知识,希望大家能有所收获。现在,机器学习的趋势从传统方法中的简单模型 + 少量数据(人工标注样本),到简单模型 + 海量数据(比如基于逻辑回归的广告点击率预测 ...
基于机器学习的KPI自动化异常检测系统
基于机器学习的KPI自动化异常检测系统
在实际的运维场景中,构建一个异常检测系统往往需要两个角色共同参与:领域专家和算法开发人员。领域专家也就是我们的运维人员,他们对KPI曲线的行为很熟悉,可以通过观察KPI曲线并结合自己的领域知识,判断KPI曲线 ...
重新思考机器学习:大数据消耗已无必要
重新思考机器学习:大数据消耗已无必要
从很多方面看,机器学习可以说是大数据革命的一个延伸,但它比大数据更难攻克。虽然希望常在,但是正如Gartner分析师Nick Heudecker指出的那样:“只有15%的机构能在生产中成功应用大数据”。那么,机器学习呢?Nick ...
横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow
横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow
机器学习(尤其是深度学习)最近已经在语音识别、图像识别、自然语言处理和推荐/搜索引擎等方面取得了变革性的成功。这些技术在自动驾驶汽车、数字医疗系统、CRM、广告、物联网等方面的应用非常有前途。当然,资本带 ...
聊一聊「特征工程」的最佳实践
聊一聊「特征工程」的最佳实践
特征工程是指为机器学习算法创造新特征的过程,这是提高模型预测表现的有力手段。创造新的特征是一件十分困难的事情,需要丰富的专业知识和大量的时间。机器学习应用的本质基本上就是特征工程。——Andrew Ng通过特 ...
成熟的机器学习流如何设计:微博大规模机器学习框架Weiflow揭秘
成熟的机器学习流如何设计:微博大规模机器学习框架Weiflow揭秘
模型训练只是其中耗时最短的一环。如果把机器学习流比作烹饪,那么模型训练就是最后翻炒的过程;烹饪的大部分时间实际上都花在了食材、佐料的挑选,洗菜、择菜,食材再加工(切丁、切块、过油、预热)等步骤。在微博 ...
爬虫工程师如何绕过验证码?寻找阿登高地之路
爬虫工程师如何绕过验证码?寻找阿登高地之路
网站验证码就如同马奇诺防线一样,阻挡了爬虫工程师的正面进攻。随着爬虫和反爬虫双方围绕验证码的不断较量,最终导致了验证码识别难度的不断上升。正面硬刚验证码,想要识别它,是件挺复杂的事,涉及到图像处理技术 ...
Keras之父、谷歌研究员拆解机器自主学习
Keras之父、谷歌研究员拆解机器自主学习
在机器学习领域,我们可以期待的一个必要的转变是:从只能做模式识别和获得局部的泛化,到能够执行抽象和推理的模型,这能获得极端的泛化。当下,具有基本推理形式能力的AI程序都是由人类程序员硬编码的:例如,依赖 ...
Yelp 是如何无损压缩图片的
Yelp 是如何无损压缩图片的
Yelp 承载了上亿张用户上传的照片,这些照片涵盖了美食、发型,甚至我们最新发布的 #yelfies 功能等内容。用户通过手机应用或网站下载这些图片时会占用大量带宽,而图片本身的存储和传输也需要 Yelp 付出不菲的成本 ...
七种常用回归技术,如何正确选择回归模型?
七种常用回归技术,如何正确选择回归模型?
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系 ...
从28303篇论文看机器学习领域的发展变化
从28303篇论文看机器学习领域的发展变化
OpenAI是由诸多硅谷大亨联合建立的人工智能非盈利组织,目的是预防人工智能的灾难性影响,促使人工智能发挥积极作用。本文由OpenAI的研究人员Andrej Karpathy撰写,主要陈述了他通过分析机器学习论文数据库arxiv-san ...
原创翻译 | 机器学习如何革新数字企业
原创翻译 | 机器学习如何革新数字企业
根据IDC未来世界峰会的预言,在全球2000个企业的CEO中有三分之二将把公司的策略集中到数字化转换中。策略的最主要部分包含机器学习解决方案。这些解决方案的应用将会改变这些企业目前看待客户价值和内部操作模式的方 ...
为了分拣2吨乐高积木,这位大牛搭建了一个GPU神经网络
为了分拣2吨乐高积木,这位大牛搭建了一个GPU神经网络
对于许多人,尤其是理工生来说,乐高积木可以算是童年最美好的记忆之一了。那五颜六色的基础版块,层出不穷的创意,对于一个孩子来说,可谓极限是由想象力决定的!其实,还有很多人已经把玩乐高的习惯带进了成年生活 ...
什么是机器学习工程师?
什么是机器学习工程师?
我们已经谈论数据科学和数据科学家有10年了。虽然对“数据科学家”的含义总是存在一些争议,但是我们看到了许多大学、在线学院和培训机构都已经提供数据科学的课程,并给予硕士学位、资格认证等等你能想到的名字。当 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2021-4-18 10:12 , Processed in 0.120001 second(s), 16 queries .