转载自 | PaperWeekly
作者 | 吴桐
研究方向 | 推荐系统
1
『什么是对比学习?』
1
『什么是对比学习?』
Metrics learning + self-supervised learning
2
『对比学习在解决什么问题?』
2
『对比学习在解决什么问题?』
● 如何学习 representation
● 解决数据稀疏的问题
● 如何更好的利用没有label的数据
未打标的数据远远多于打标的数据,不用简直太浪费了,但是要打标又是一个耗时耗力耗钱的事儿
● 有监督学习的缺点:
泛化能力
spurious correlations(伪相关)
adversarial attacks(对抗攻击)
3
『为什么现有的方法解决不了这个问题?』
3
『为什么现有的方法解决不了这个问题?』
有监督学习天然所带来的问题:泛化能力、过拟合、对抗攻击等等
有监督学习本身就无法使用无标签的数据
4
『现有的对比学习方法』
4
『现有的对比学习方法』
实验结果就没贴了,肯定是牛逼呗,而且因为是比较老的 paper 了,所以看这些 paper 的实验不如看 SOTA 的 paper 的实验结果,但是为什么要看老 paper——温故而知新。
4.1 Noise-contrastive estimation: A new estimation principle for unnormalized statistical models (NCE)
不重复造轮子之 paper 讲解传送门(这篇论文的证明很不错,很值得学习)
知乎:
https://zhuanlan.zhihu.com/p/58369131
CSDN:
https://blog.csdn.net/littlely_ll/article/details/79252064

4.2 Representation Learning with Contrastive Predictive Coding (InfoNCE)




4.3 LEARNING DEEP REPRESENTATIONS BY MUTUAL IN- FORMATION ESTIMATION AND MAXIMIZATION (Deep InfoMax)


多的这部分 local 的 loss,我个人的理解其实也是换了种方式来增大样本数量,进而带来了收益


5
『对比学习在推荐里的应用场景』
5
『对比学习在推荐里的应用场景』
负采样逻辑优化:现在很多推荐系统里的负采样都是随机采样的,虽然随机采样已经能拿到不错的效果了,但是一定还有优化空间,比如 InfoNce 文章中提到的增大负采样的个数能够提升互信息的下界,同时在工业界的 best practice 中,往往也能发现 batch_softmax 的效果也很不错。 i2i 召回:基于 item2item 召回的时候,往往是基于 item1 的 embedding 去召回与 item1 相似的 items,这时候 embedding 的相似性就显得尤为重要,但是这里有个问题,如何选择构造与 item1 相似的 item 作为正样本?(用户点击过的作为 item 作为相似的样本也不合理,毕竟用户的兴趣是多维的,点过的每个样本不可能都属于同一个类别或者相似的,虽然通过推荐的大量数据,协同过滤可能可以在全局找到一个还不错的结果,但是直接拿用户序列作为正样本来做一定是不合理的)。
6
『一点小思考』
6
『一点小思考』
可以比较好的单独优化 representation,和下游任务无关,能够最大程度上的保留 meta-information,如果一旦做有监督的学习,那抽取出来的信息就是和当前目标相关的,不排除可能学到一些噪音特征。 在做 data augumentation,模型见到了更多的样本,记忆的东西更全,效果好也是预期之中的。 去噪
文章转载自深度学习与图网络,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
2025年4月中国数据库流行度排行榜:OB高分复登顶,崖山稳驭撼十强
墨天轮编辑部
1973次阅读
2025-04-09 15:33:27
【DBA坦白局】第一期:在小城市和一线城市做DBA,是“躺”还是“卷”?
墨天轮编辑部
1339次阅读
2025-04-10 14:17:22
Oracle Concepts(Oracle 19c):07 SQL
Ryan Bai
1017次阅读
2025-04-09 10:57:11
【MySQL 30周年庆】MySQL 8.0 OCP考试限时免费!教你免费领考券
墨天轮小教习
954次阅读
2025-04-25 18:53:11
2025年3月国产数据库大事记
墨天轮编辑部
895次阅读
2025-04-03 15:21:16
2025 DBA 薪资观察:做 DBA 还香吗?
墨天轮编辑部
751次阅读
2025-04-24 15:53:21
2025年3月国产数据库中标情况一览:TDSQL大单622万、GaussDB大单581万……
通讯员
616次阅读
2025-04-10 15:35:48
月薪快6万的DBA,有命干不一定有命花
多明戈教你玩狼人杀
577次阅读
2025-04-18 10:36:38
MySQL 30 周年庆!MySQL 8.4 认证免费考!这次是认真的。。。
严少安
568次阅读
2025-04-25 15:30:58
Oracle RAC 一键安装翻车?手把手教你如何排错!
Lucifer三思而后行
565次阅读
2025-04-15 17:24:06