对话系统+推荐 论文调研
相关数据集
REDIAL(REcommendations through DIALog)[1]: 电影对话推荐数据集,由作者通过Amazon Mechanical Turk(AMT)构建,共包含10004个对话。举例如下:
SEEKER: hi ! i ’m looking for an action filled movie similar to jurassic park
HUMAN: ok , have you seen jurassic world ?
SEEKER: yes i loved that movie as well . are there any good movies without dinosaurs ?
HUMAN: have you seen king kong ?
SEEKER: yes ! that was another great giant monster movie : )
HUMAN: what about jaws & amp ; jaws 2 ? oldies but goodies scary action ? suspense gives me the rumblies
SEEKER: i absolutely loved the first one . one of my favorite movies ever : ) honestly i ca n’t say i remember much about the second one . jaws 3-d was quite funny and jaws : the revenge was just weird . i do love suspense too …
HUMAN: i like suspense but sometimes i can barely handle it ! it gives me anxiety ! lol
SEEKER: that ’s understandable . as long as it ’s not too gory i do n’t generally have a problem with those things .
HUMAN: well , it was great chatting with you ! have a great one !
SEEKER: you too! thanks!
REDIAL + DBpedia[2]: 增加了电影的相关实体,如导演、电影风格等。(实际上是利用REDIAL对话数据集中提及的实体,然后自己到DBpedia中对应查找相关联实体)
QA+Recommendation dataset[3]: 同样是电影领域,但是对应的回复只有电影名称,不适用于对话领域。
Reddit dataset[3]: 相比之下对话更加流畅,但对话的目的并不是推荐电影,不适用。
target-guided dataset[4]: 对话的目的是引导对话中出现提前设置的目标词或相关词,但对话本身为开放领域。
E-commerce Conversational Search and Recommendation Dataset[5]: 其领域是电子商务中的产品推荐,为半合成数据集。包括Electronics, CDs & Vinyl, Kindle Store和Cell Phones。但目前数据下载链接无法访问,下图为论文中的样例。对应论文提出的模型是针对对话中的问题生成。
相对而言,目前只有REDIAL是比较完整的涉及对话加推荐的数据集,但是其仅限于电影领域。
而另一个Amazon的数据集则针对电子产品,但是作者设计出数据集主要用于提出问题(System Ask, user respond,具体论文还没有细看)。同时,与我们所想的用在“售前机器人”这样的场景差别比较大,更加适合用在日常对话中的推荐,即缺乏“售前对话”的数据集。
论文方法
REDIAL baseline[1]: 第一篇考虑多轮推荐对话的论文,相当于baseline。包含一个基于HRED的对话生成系统以及一个基于autoencoder的推荐系统,通过对话中的mentioned items将两个系统连接起来。
Transformer: [2]论文实现的一个baseline模型,与REDIAL类似,但是其对话生成系统是基于Transformer结构完成的,其余部分不变。
KBRD[2]: 端到端框架,通过知识图谱将对话系统和推荐系统连接起来。在生成推荐时,不仅仅考虑在对话中提及的items,还将与这些items相关的实体一并链接到知识图谱中,通过entity attention来得到推荐系统对于所有items的推荐概率;通过推荐系统对应用户的hidden representation可以计算得到一个vocabulary bias($b_u$),随后对话系统基于Transformer框架且结合$b_u$,从而生成对话中词的概率,从而生成response。
其他
推荐系统+强化学习的相关数据集均没有涉及对话方面。
论文列表
[1] Towards deep conversational recommendations, NeurlPS2018
[2] Towards Knowledge-Based Recommender Dialog System, emnlp2019
[3] Evaluating Prerequisite Qualities for Learning End-to-End Dialog Systems, ICLR2016
[4] Target-Guided Open-Domain Conversation, ACL2019
[5] Towards conversational search and recommendation: System Ask, user respond, CIKM2018
其他相关的未列举,大多数是比较久远的年份了。