说一说视频搜索

假期发现身边的人都在刷抖音,短视频成为日常生活不可或缺的一部分。相比于文本,视频有更直接的表现和感知,用户更容易接受以视频为载体的信息触达形式。未来搜索的部分被文本满足的检索需求将被视频代替,比如搜菜谱,广场舞。在淘宝商品搜索中,越来越多的普通用户发的买家秀短视频,相比文字评价更形象,比明星广告更接地气。视频搜索也成了兵家必争之地,微信、头条、快手、爱奇艺等都纷纷在视频搜索上持续发力。

目前视频尤其是短视频的产品形式是以抖音、快手为代表的视频推荐。相比于视频推荐,视频搜索的使用频次相对低一些。但是无论是后台分析还是用户调研表明,搜索在视频生态中仍是一个不可缺少的模块。本文说说视频搜索区别于通用搜索的一些特点。

1、视频搜索的头部query比较集中在几千个类似“搞笑视频”、“美女视频”等头部query。这些头部query的资源也比较丰富,相关性满足不是问题。如何满足时新性、多样性可能是更为关键的问题。对于此类头部query是否一定要通过技术手段来解决?或许对头部query直接运营会是个好的手段。

2、头部query是偏推荐性质的,比如搞笑视频,存在很多完全字面匹配的优质视频,那么在这些好的中间把哪些视频排在top位置是个问题。此问题相比于把好的排到坏的前面会更难一些。结合用户画像对头部query搜索结果采用个性化推荐的形式更好一些。目前搜索服务都有意让用户在登陆状态下去搜索,这样更易积累丰富的用户行为信息,完善用户画像。

3、头部query的结果不是动态不变的,一方面每天都会产生大量头部query相关视频,一方面也和头部query特性相关。比如在网页搜索中搜“大疆官网”这种具体query,其排在第一位的无论资源怎么变化都是官网,而在视频场景则不一定,即使去搜“还珠格格第5集”这样的query。怎么排好这些动态的结果也是一个问题。

4、相关性在视频搜索中的重要性相比于网页搜索会低一些。相比于采用类似dssm去计算query和视频的相关性,可能在视频搜索里更倾向于采用点击率预估的方式直接去预测在query下每个视频被用户点击的概率。这样更容易同时结合query维度、doc维度、query-doc维度的各类信息,不止文本信息。

5、视频搜索有很强的时效性,当发生一些热点事件时,用户通常去搜新闻。此时当用户搜事件相关的实体时(非完整事件名),如果能展示该事件的相关视频也是是不错体验。这需要做好实时事件检测和实体query到在线事件的触发。

6、视频的去重、原创、抄袭相比于文本更难判断。一个热门短视频会经过加水印、部分截取、首尾加帧的方式变成n个新的视频,同一个电影片段被颠过来倒过去剪辑成n个视频,怎么判断原创和抄袭会是一个问题。

7、怎么反垃圾、发黄、政治敏感的视频?分析视频搜索日志会发现很大一部分是搜小视频的query,这些内容对视频生态有一定的影响,如何有效识别这类视频并减少误伤也是一个问题。

8、视频搜索中doc理解比较重要。在通用搜索里query和doc title的相关性匹配比较重要。然而视频doc的文本信息质量很少很差,经常存在一些文不对题的描述,文字写的也很有联想性、抽象性,造成仅从文本信息在某些query上达到很好的效果。因此很重的一个离线工作就是对视频标记上各式各样的标签。

9、多模态理解和匹配,这也是近两年非常热门的方向。如何在文本模态的基础上同时对视频、图片、语音模态统一建模,一种形式将这些信息统一表示成embedding。embedding的出现也使得召回不再局限于倒排召回,embedding召回也是一个热门方向。但是笔者认为embedding不是万能的,Embedding搜索能代替文本搜索吗?,其和文本召回是互补,不是代替。


相关阅读

1. 从搜一搜中检“相关性排序”的排序结果说起...

2. 搜索排序 = 相关性排序?

3. 搜索引擎新的战场 - 百度、头条、微信

4. 搜索引擎的两大问题(1) - 召回

5. 搜索引擎的两大问题(2) - 相关性

6. 你说百度更懂中国人,我说微信也挺懂中国人的

7. 在query理解中能ALL IN BERT吗?

8. Embedding搜索能代替文本搜索吗?

本文内容为星轨数据版权所有,未经授权许可不得任意转载复制,违者必究!

更多精彩,长按图片关注“星轨数据”联系我们

发布于 2020-05-28 23:01