基于双曲空间的序列推荐方法与基准测试研究
明晓
摘要:推荐系统在人们的生产生活中应用广泛,在信息爆炸时代对于信息的过滤、便民服务等方面发挥了重要作用。序列推荐是推荐系统的重要领域,被广泛应用于电影、电商、短视频等行业,其主要任务是通过分析用户与项目之间的交互序列,利用序列之间的依赖性来捕获用户最近期的偏好,从而预测用户下一次可能交互的项目。推荐系统成功的关键是用户偏好和项目特征的准确表示,许多广泛应用的推荐模型都是基于欧几里得空间(即欧氏空间)的表示学习,即使用内积或欧氏距离来计算用户表示和推荐项目表示之间的相似性。随着大数据时代高维数据的爆炸性增长,推荐系统中的推荐项目信息通常带有层次结构的特征信息,如服装商品中分为上衣等类别,上衣中又包含卫衣。传统基于欧几里得空间的推荐模型,在嵌入无标度和分层结构数据表示时会产生较大的失真现象,从而影响推荐的效果。为了减少失真,有必要增加计算空间的规模,但是随着空间规模的扩大,推荐算法所需的计算资源也随之增加。针对序列推荐方法中暴露出的大数据推荐效果失真等问题,文章采用双曲空间对传统序列推荐算法进行优化,设计新的序列推荐模型,给出系列基准测试。双曲空间是曲率为负常数的一种非欧几里得空间,可以看作是树的连续形式,本质上更适合建模层次结构。针对欧几里得空间无法捕获数据中的层次结构等问题,论文提出了一种基于双曲空间的序列推荐算法,该方法融合因子分解机和深度神经网络,在捕获低阶特征和高阶特征的同时加入平移空间来增强表示能力;将表示模型嵌入双曲空间捕获数据中的层次结构信息,提高推荐的效果。针对双曲空间和双曲嵌入虽然在推荐系统中得到了广泛关注,但是没有一个具体的基准测试问题,论文给出了基于双曲空间的推荐算法性能分析,提供了在推荐系统中何时使用双曲空间和双曲嵌入的理论分析和实证结果。为了检验基于双曲空间的序列推荐模型的效果,论文在MovieLens等3个真实世界公开数据集上进行了大量的实验,结果表明与其他方法相比该方法具有更优的表现,验证了基于双曲空间的序列推荐的合理性和有效性。为了对基于双曲空间的推荐算法进行全面的性能分析,本文选取了 5个不同推荐领域常用的模型,在Epinions等6个真实世界公开数据集上进行了实验,通过比较在不同情况下,各个模型在欧几里得空间和双曲空间的性能,最终得出结论:(1)距离模型比投影模型更适合学习双曲嵌入;(2)当数据集的密度比较小时,双曲空间比欧几里得空间更强大;(3)当潜在空间维度较小时,模型在双曲空间的性能优于欧几里得空间。
双曲空间;序列推荐;双曲嵌入;
10.27272/d.cnki.gshdu.2022.000258
摘要
ABSTRACT
1 绪论
1.1 研究背景和意义
1.2 论文主要研究内容
1.3 论文组织结构
2 相关研究工作
2.1 推荐算法模型
2.1.1 传统推荐模型
2.1.2 基于社交的推荐模型
2.1.3 序列推荐模型
2.2 双曲空间模型
2.2.1 庞加莱球模型
2.2.2 庞加莱球优化与几何空间
2.3 本章小结
3 基于双曲空间的序列推荐模型
3.1 序列推荐问题描述
3.2 模型结构
3.3 实验设计及参数设置
3.4 实验结果及分析
3.4.1 性能对比
3.4.2 嵌入空间维度分析
3.4.3 数据集分析
3.4.4 模型组件分析
3.5 本章小结
4 基于双曲空间的推荐算法性能分析
4.1 潜在空间模型
4.2 假设与理论分析
4.3 实验设计及参数设置
4.3.1 数据集
4.3.2 评估指标和实验设置
4.3.3 基线方法
4.4 实验分析
4.4.1 距离模型vs投影模型
4.4.2 高密度数据集vs低密度数据集
4.4.3 潜在空间大小的影响
4.5 本章小结
结论
参考文献
致谢
附录
攻读学位期间发表的学术论文目录
学位论文评阅及答辩情况表
[1]明晓. 基于双曲空间的序列推荐方法与基准测试研究[D].山东大学,2022.DOI:10.27272/d.cnki.gshdu.2022.000258.
评:构建序列推荐模型并进行基准测试
“C:\Users\tellw\open_title\papers\benchmark\基于双曲空间的序列推荐方法与基准测试研究_明晓.caj”
创建于2023.3.8/19.56,修改于2023.3.8/19.57