编者荐语:
智能对话,海量的对话数据如何更好的辅导商家进行业务展开。这种话题好像白看不厌,但是作为一个有效工具我认为这是AI好的产品的一个具体展现。
以下文章来源于58AILab ,作者韩伟
58同城AI Lab公众号,关注AI技术和实践经验。
qa-match是一款基于深度学习的问答匹配工具,通过完成问题与问题的匹配来实现。qa-match支撑层级(2层)结构知识库问答,实现了一种类似集成学习bagging方法的模型融合方式。为了实现层级问答,我们要求知识库中的每个问题都包含两个标签:领域标签和意图标签,领域标签是对意图标签的进一步抽象。
对于输入的问题,qa_match会有三种回答:
唯一回答(识别为用户具体的意图)
列表回答(识别为用户可能的多个意图)
拒绝回答(没有识别出具体的用户意图)
为了实现上述目标,qa-match流程如下:
用bilstm对用户语料实现领域级别的文本分类
用dssm对用户语料实现意图级别的语义匹配
通过设置参数对领域分类和意图匹配结果进行融合,支持层级结构知识库问答
58同城连接着数千万的C端用户和数百万的B端商家,IM微聊是连接两端用户的重要沟通渠道,在微聊场景中AI对话机器人可以代替58商家与C端用户进行沟通,帮助商家高效获取商机,同时通过智能辅助等手段提高坐席效率。
58同城技术委员会AI分会联合百林哲举办了一期线上技术沙龙,58同城AI Lab算法高级架构师韩伟分享了《AI技术如何打造58同城智能客服商家版——微聊管家》,以下是PPT内容。
以下是分享PPT:
那这个fasttext做对比确实是比较现实的工业场景中经常用到的分类手段之一。
这也是比较老的技术改进了,在我和58工程交流过程中我发现了58较早的使用了bert并且在其中创新了这种生活场景中的数据。是比较早的应用到了模型蒸馏和模型压缩技术的公司。
现在58技术栈应该是围绕着模型压缩 元学习(各类商品作为以及商品的特征作为元进行学习)模型蒸馏 小样本迁移等等方向的落地AI研究进行展开。
词槽任务的分支任务包括领域词汇聚类(基于社区发现的新词发现算法)以及领域词汇新词发现,领域词汇标注和半监督学习几个部分。
直播录像回放
本次分享录像地址为:http://t.cn/A6wssmII
AI Lab部门介绍
58同城TEG技术工程平台群AI Lab,旨在推动AI技术在58生活服务行业的落地,打造AI中台能力,以提高前台业务的人效和用户体验。AI Lab目前负责的产品包括:智能客服、语音机器人、智能写稿、AI算法平台、智能语音分析平台、语音识别引擎等,未来将持续加速创新,拓展AI应用。
欢迎加入58 AI Lab技术交流社区
团队照片