二类电商
货到付款商家专属平台

聊聊lookaLike模型的使用技巧

lookaLike模型?

基本上所有大型互联网公司都有其广告投放平台,像今日头条,广点通,OPPO等。广告投放平台是给广告主投放广告的一个页面,广告主可以通过广告提交页面提交自己的广告需求,后台会给广告主圈定一部分潜在用户,这个就是我们称为lookaLike的模块。

它需要具备两个方面的数据基础:首先是要有广告主提供的种子用户;其次是要有充足的用户网络行为用于挖掘。并且,此方法需要比较深入的算法和数据挖掘能力,否则就会退化成简单地在竞争对手之间倒卖用户。

从用户行为学的视角上看,lookaLike的基础假设是和协同过滤一致的,用户的行为存在一定得规律,相似的用户具有相似的偏好,用老祖宗的话就是: 物以类聚、人以群分;

基于这个假设,有了种子用户群,通过LR、SVM、随机森林等方法就是一种有效的渠道了,通过随机或者有设计的负样本采样形成训练模型。

需要哪些特征?

1.行为结果数据

所谓行为结果数据是已经采取了具体行动的数据,例如购买数据,入资数据等。

2.行为意向数据

所谓行为意向数据是倾向于采取某种行为的人群数据,最典型的是搜索引擎的数据,一般来说消费者在做最终的购买决策之前,往往会通过搜索引擎了解产品周边的一些相关信息,相关搜索关键字数据可以定位到一个有强购买倾向的人。这也是很多广告主投入较多预算在SEM上的原因。但这种数据一般很难从搜索引擎侧获取,购买关键字的成本也越来越高。一般来说,通过行为意向数据来寻找人群,转化率会比较高,因为行为意向人群往往已经达到了转化前的最后一步的关键时刻,此时对意向人群进行营销,效果往往很明显。但同时广告主也面临一定的风险,因为这时客户可能已被别的竞品在更早的环节进行了影响,转化成本也相应提高。

3.行为偏好数据

对于大多数第三方DMP平台来说,主要还是通过这一类数据来帮助广告主找到潜在的人群,从业务逻辑来说,具有某种偏好或者属于某种类型的人群往往会更倾向于购买某款产品,对于这部分数据的学习也能促成最终的转化。而且行为偏好数据会保证广告主在潜在客群覆盖规模和精准度之间达到一个很好的平衡,因此也是广告主普遍选用的一种数据。

4.行为模式数据

所谓行为模式是指通过分析消费者的行为与时间、空间的关系,以及一系列行为之间的时间和空间序列关系,总结出的具有一定一致性意义的行为表现,通过这些一致性模式预测相关行为。行为模式数据往往应用于场景营销,但是由于加工行为模式的数据计算复杂度较高,同时对分析的实时性要求也很高,因此目前还处在探索和优化阶段,实际的应用落地不多。

显性定位

广告主根据用户的标签直接定位,比如说通过年龄、性别、地域这样的标签来直接圈定一部分用户进行投放。这个时候我们的技术支持就是后台的用户画像的挖掘。这其实是广告主对自己产品的理解,圈出目标用户。

这种人工定义的方法,可能不够精准,或者可能通过年龄和地域指定的用户量很大,需要做精准筛选。

隐性定位

通过机器学习模型,对种子用户进行模式识别,来定位广告主的潜在用户。此时,广告主提交一批客户名单,我们称之为种子用户,它作为机器学习的正样本。负样本我们会从非种子用户,或者是说平台会积累历史的一些相似的广告作为负样本,这个问题就转化为一个二分类的模型,正负样本组成学习的样本,训练模型之后,利用模型结构对活跃用户进行打分,最后得到广告主需要的目标人群。

通过上述流程,广告主会提供他已有的客户名单作为种子用户,这是机器学习的正样本,然后会从活跃用户里面(非种子用户)或者历史我们已经积累了相似的广告负反馈的用户,作为负样本,训练一个二分类的模型,利用模型结果对这个用户进行打分排序,取出广告主需要的目标数据的用户。

lookaLike应用Tips

1.结合聚类算法一起使用

有时候客户提供过来的种子人群成分是非常复杂的,往往是参杂了大量子类人群的总和,如果直接拿这些种子人群进行lookaLike,则相当于把人群的特征进行了弱化,最终找出来的相似人群特征会变得不明显。例如某奢侈品牌,他们的一方种子人群中包含2类,一类是真正有钱的人群,平时开豪车住别墅的,另外一类是普通的城市小白领,他们往往攒好几个月的工资进行一次消费。这2种人群必须先通过聚类算法区分出来,然后再输入lookaLike算法去扩大。

2.在什么媒体上用

LookaLike算法选出的人群最终是在媒体的流量人群中实现触达,因此媒体自身流量对最终lookaLike算法落地的效果影响非常大,例如我们做过的某次营销案例,选取某DSP做为精准营销的落地媒体,在整个4周的营销过程中,最终选取的精准人群只有2%曝光成功。(一方面由于该DSP媒体流量均为长尾流量,而我们选取的目标人群为金融类目标人群,该DSP对目标人群覆盖率低,另外由于低价策略,竞价成功率低也导致了最终触达的精准人群规模比较小。)最终我们分析了这2%成功曝光的人群,发现他们也是Lookalike算法相似度相对较低的,也就是说最相似的那部分目标人群在该媒体上并没有出现和竞得。

因此为了保证lookaLike算法落地的效果,选取与广告主自身产品相对匹配的目标媒体以及合适的出价都非常重要。

3.根据效果数据优化lookaLike算法

一旦精准营销活动开始后,就可以回收消费者对营销的反馈数据做为正样本来对lookaLike算法进行优化。通过TalkingData对大量历史投放数据的分析,动态优化lookaike算法可以极大的提升算法的转化效果:在同样选取相似度TOP100w样本进行精准投放的情况下,每日优化样本库组相比较不优化组在一周的投放周期内,可提升激活率180%以上。样本库优化的周期可以根据效果数据回收的量级、媒体的技术支持能力、以及DMP平台自身的数据更新周期综合决定,建议每1-2日更新目标用户群。

杭州飞马网络有限公司,是一个专注于二类电商专属的广告推广公司,我们公司的主要股东及核心管理层均来自于阿里原高管,业务经验丰富,人脉资源广泛,资金雄厚,发展迅速,我们有专业的VIP团队进行实时操盘

上百家各行业 领先品牌的选择

请联系我们开户

1000+ 二类电商客户的信任和选择,请联系我们为您快速开户,享受优质的广告投放服务

联系电话:15700190215  qq: 1911930699

未经允许不得转载:马到成功 » 聊聊lookaLike模型的使用技巧
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

联系我们,解答您的疑问,获取免费试用账号

QQ 在线聊天