品牌
| 广告主篇:倾听O2O电商的“移动营销”真正需求
文/曾巧在“勾搭机器学习(一)”里我们讲了Arthur Samuel让计算机用西洋棋程序自己与自己下棋的故事,结果计算机的下棋水平比他本人的下棋技术还厉害不少。那么互联广告中,智能程序化媒体采购正在一步步吞噬人工采购的市场。Avazu Holding CEO石一说:“Avazu移动DSP平台的开放将有效帮助手游及移动应用广告主更加精准、高效的进行广告投放,省钱又高效的节奏根本停不下来。当机器学习算法引入DSP系统,并且开放使用,极有可能颠覆广告界。”在传统广告市场,有媒体企划和媒体购买一职,他们主要负责确定广告在什么时候什么媒体的哪个广告位发布,以及媒体关系的建立和维护。而现在,这部分工作可以通过DSP完成,且效率远高于人工。石一说:“Avazu的移动DSP还能实现广告创意的优化,同一产品,针对不同的目标受众投放进行不同创意展现形式的广告轮播,大大提高广告的转化率。”那么,接下来,我将通过对Avazu所使用的“机器学习”最主要的算法“逻辑回归”和“深度学习”来解析DSP如何实现移动广告程序化购买的高效和智能、以及极近精准。1、逻辑回归:智能流量分类和效果预估逻辑回归在DSP中的作用体现在:1、对于流量的分类,比如分类作弊流量与优质流量;2、CTR(点击到达率)预估,用在点击率和转化率的预测上,逻辑回归本质是线性模型的一种,工程师在创建算法模型的时候,会设定很多维度和特征,然后进行特征筛选,这个筛选是建模工程师自己筛选的。逻辑回归Logistic Regression 是一个被logistic方程归一化后的线性回归,之所以用logistic而不用其它,是因为这种归一化的方法往往比较合理(人家都说自己叫logistic了嘛),能够打压过大和过小的结果(往往是噪音),以保证主流的结果不至于被忽视。在互联广告行业中,已成为点击率预估的基础方法。逻辑回归,主要用于概率预测和分类,可能性预测的好处是结果具有可比性:比如我们得到不同广告被点击的可能性后,就可以展现点击可能性最大的N个。这样一来,哪怕得到的可能性都很高,或者可能性都很低,我们都能取最优值。当用于分类问题时,仅需要设定一个阈(yu)值即可,可能性高于阈值是一类,低于阈值是另一类。2、深度学习:对数据更本质的刻画深度学习在国内机器学习业界几乎无人不谈,目前几大互联公司均在尝试,其成果以百度深度学习研究院最为突出,但应用于广告领域,国内外尚未见大量的成功案例。那Avazu为什么使用?石一给出2个理由:1、逻辑回归每个线程只训练自己的数据,而深度学习看到了所有的数据;2、逻辑回归最终模型加权方式是人工指定的,而深度学习则使用了一个复杂的深度神经络来融合。整体来说,深度学习对点击率预估的错误率相对于逻辑回归降低了一些。另外他补充:“使用DeepLearning(以下简称为DL)是因为我们一直在找新的方法提升CTR,而DL在图像识别上公认效果很好,且百度也对外宣称自己利用DL大大提升了CTR,所以我们也实现了DL预测。但是DL在做预测的时候跟逻辑回归还是有些差别,因为广告数据的结构性关系没图片那么强,所以我们会对原始数据做大量预处理和降唯。”让机器自动学习良好的特征,而免去人工选取过程,还有参考人的分层视觉处理系统,多隐层的人工神经络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类。另外深度神经络在训练上的难度,可以通过“逐层初始化”来有效克服。3、机器学习算法,实现100%广告投放自动化当前多数分类、回归等学习方法为浅层结构算法,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约。深度学习可通过学习一种深层非线性络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力。而Avazu差异化同行,做到将逻辑回归和深度学习在DSP中发挥不同的作用,足以体现其“技术范儿”的公司特质。石一表示:“Avazu是技术导向型互联公司,全球化移动DSP解决广告投放渠道问题。100%自动化是宗旨,利用逻辑回归和深度学习,帮助广告主提升广告投放效率,同时做到持续性优化和自动优化。”