看过的“推荐系统”文献

酱油掉“树蛙”比赛后,深感遗憾。准备删掉这群“推荐系统”的文献前,还是做个记录,起码比赛前的那段时间看的那些推荐系统的文献,让我知道了推荐系统还是挺有趣,思想平易近人。更重要的是,让我等从未真实玩过”树蛙“的文盲,终于深刻体会到多挖挖数据比做一个模型重要得多。

  1. 我们最终敲定的模型,参考文献《Pairwise Preference Regression for Cold-start
    Recommendation》
    。只可惜当时用R写的代码慢的让人自杀,不得不放弃,于是用R整理好数据后,让同学代写C程序(大一时候学的C已经忘得差不多了,真是深感惭愧)。但是谁知道一直有个BUG没有解决,直接导致我们最后参赛结果:0提交!择人不善啊~~以后还是找个靠谱的熟悉矩阵的同学来写C代码吧。模型思想:根据推荐者与被推荐者的features与得分矩阵做拟合,得到推荐与被推荐者features之间权矩阵,然后预测得分。直接了当!模型评价:elegant!思想简约,有数学显式解,对推荐系统的冷启动问题效果应该不错。但是不知道对这次婚介的数据做出来效果是否好,真希望我们能够把那程序完善,去测试一次,了结心愿。
  2. 次选模型论文《Hydra: A Hybrid Recommender System》。也很不错,将需要的features信息都能够较好的连接起来,也是通过这个文章,知道了有个对等网络这玩意,也还不错。缺点就是在原基础上扩展的矩阵会很大,特别是对于这次婚介的推荐,SVD做起来消耗估计也会很大,不会太快,效果可能也比较一般。所以对于特征的选取还是得靠前期的数据了解,知道哪些人的特征在此数据中可以省下很多工作。跟这篇文章相关的文章很多,提高精度也罢,改进模型也罢,反正看着挺好,就是不知道用起来如何...sigh~~
  3. 《A Singular Value Decomposition Approach Recommendation Systems》这篇文章还是讲SVD的,但是感觉看了那么多论文,感觉这篇文章前面的Introduction介绍推荐系统比较系统全面,如果对推荐系统问题有了较好的定位,我觉得不管做哪些问题,思路都会清晰很多,把握住了问题的关键点,这样结果才会有好的突破。当然这篇文章也详细论述了SVD用在推荐系统的实际意义。
  4. 最后再提一个我和小南都认为很不错的论文《Learning User Preferences in Online Dating》,思想很简单,高中生也能不过很能够解决问题。当然这篇文章有个致命的缺陷:数据获取,要能够获得双方发MSG时候的信息。这个实际中估计是是不可能的,所以这篇文章只能提供一个比较好的思路,不能解决实际问题,仅供把玩~~
  5. 至于协同过滤的东西,看了挺多,觉得这个东西重要的不是数学,而是他的思想,比如从USER变换到ITEM就可以获得一个很大的突破,真的是让人感觉很畅快。

比赛早已落下帷幕,小南说他已经把PAPER全扔进了垃圾桶,我也想删掉这群文献了。虽然结果让人很XX,但是没有关系,起码都获得了很多,这点只好深埋心里,笑而不语也。看排行榜龙争虎斗也是快事一件!

    • 所以当时在坛子上一看别人提供的秘籍公式,谢老大又说5行R代码就上0.21..,顿时眼黑~~我等只能默然飘过...
      不过要往上提NDCG的值话,这个怕还是不够了,随机推荐的嘛~而且这个方法只是针对静态数据,动态的话基本没用,特别是对于冷启动问题,这个效果肯定更差了~