● 内容详情
随着互联网规模的不断增长,个性化推荐技术已经成为帮助用户从海量信息中快速获取相关信息的有效方法。个性化推荐技术针对用户喜好为用户自动搜寻信息,从而为用户提供更加快捷的服务提升用户体验。个性化推荐模型的推荐精度直接反映着推荐结果的好坏,因此如何提高个性化推荐系统的精度一直是该领域研究的重点。随着推荐模型的复杂化和训练数据的庞大,在不断改进推荐模型的同时,对训练数据集采取适当的优化方法也是提高推荐精度的有效方法之一。本文对个性化推荐领域中的协同过滤技术进行深入研究,设计了个性化推荐系统训练集优化的方法。通过对训练集的优化可以从数据集中去除不能代表用户喜好的信息或者恶意用户的信息,从而保证训练集的有效性。论文通过对现有基于隐向量模型进行改造,将其融合到AdaBoost迭代算法中。通过迭代过程逐步改变模型对训练数据的针对性,当迭代完成时分析数据集中数据的判定情况并结合每次判定的权重从而筛选出无法被模型接受的数据作为离群样本从数据集中删去。在每一轮的迭代中,以上一轮得到的推荐模型的推荐结果与真实结果的误差值作为是否为离群值的判定依据。文中通过大量实验证明经过这种方法优化过滤后的数据可以有效的帮助推荐系统提升精度。针对基于K近邻模型的建模规则和特点,论文提出了在利用该模型进行AdaBoost迭代筛选时两种更新策略。其一可以通过在迭代结束之后修改样本权重以重新计算相关的相似度和重构K近邻关系表,其二可以通过在离群样本集上最优化当前邻居关系权重。两种方式均有效的解决了K近邻模型在迭代筛选过程中的更新问题。同时为了降低更新中的时间复杂度,文中分别对两种更新策略提出了减低时间消耗的方法。通过对算法的性能进行实验测试可知,算法可较好地分离出离群数据从而获得更有效的数据集合。