什么是推荐系统中的负反馈?用户的“踩“和“不感兴趣“怎么用?

张开发
2026/4/22 17:43:40 15 分钟阅读

分享文章

什么是推荐系统中的负反馈?用户的“踩“和“不感兴趣“怎么用?
什么是推荐系统中的负反馈用户的踩和不感兴趣怎么用 本文收录于GithubAI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助欢迎 ⭐ Star 支持by Laizhuocheng一、简介你有没有遇到过这种情况刷短视频时系统反复推送你讨厌的内容你点了不感兴趣结果过一会儿类似的视频又冒出来了或者你明明点了踩那个博主的内容还是不断出现在推荐流里这种体验让人抓狂但背后其实涉及一个关键问题推荐系统如何理解和利用用户的负反馈在推荐系统的世界里用户行为分为两大类正反馈点赞、收藏、点击、观看和负反馈点踩、标记不感兴趣、举报。长期以来大家更关注正反馈——毕竟用户喜欢什么我们就推什么这听起来很合理。但负反馈的价值被严重低估了。想想看用户愿意主动点踩说明这个内容真的触碰到了他的厌恶点。这种明确的反感信息比沉默式的不点击要有用得多。就像你问朋友想吃什么他说随便的时候你完全没方向但他说绝对不吃香菜的时候你至少知道该避开什么。这篇文章我们就来聊聊推荐系统如何利用负反馈让推荐变得更懂你。二、什么是负反馈负反馈简单来说就是用户明确表达我不喜欢这个的信号。在推荐系统中负反馈主要包括三种形式负反馈类型用户行为信号强度含义解读不感兴趣点击不感兴趣按钮⭐⭐内容不匹配当前兴趣可能是时机不对或口味变化点踩/不喜欢点击踩或不喜欢⭐⭐⭐对内容有明确厌恶可能涉及质量、价值观冲突举报点击举报按钮⭐⭐⭐⭐⭐内容可能违规涉及合规层面需人工审核这三种信号的强度和含义完全不同。用户对某个搞笑视频点不感兴趣可能只是现在不想看娱乐内容但如果点踩可能是觉得这个博主的笑点太 low而举报则可能涉及不当言论。理解这些差异很重要因为它们决定了后续的处理策略。就像医生看病发烧和骨折都需要治疗但方法完全不同。三、负反馈如何利用负反馈的利用可以从三个层面来理解实时响应、模型优化和内容治理。3.1 实时响应层面用户点踩之后最直观的期待是“别再让我看到这种内容了。”这需要系统在召回和排序阶段都做处理召回阶段建立负反馈内容的索引当用户再次请求推荐时直接从候选集中过滤掉这些内容。排序阶段给负反馈内容打上惩罚因子大幅降低它们的排序分数。更进一步用户踩的是具体某条内容但系统需要扩散到同类内容上。否则用户会觉得“我都点不感兴趣了怎么还推类似的”这里的技术方案是基于内容的 embedding 向量做相似度计算。当用户踩了内容 A系统会检索出与 A 向量距离最近的 Top K 个内容把它们也加入降权列表。# 伪代码示意实时负反馈过滤defhandle_dislike(user_id,item_id,item_embedding):# 1. 直接屏蔽该内容blacklist.add(user_id,item_id,expire_days7)# 2. 扩散到相似内容similar_itemsvector_search.find_similar(item_embedding,top_k50,# 找最相似的50个similarity_threshold0.85# 相似度阈值)# 3. 相似内容降权而非完全屏蔽foriteminsimilar_items:demote_list.add(user_id,item.id,expire_days3)3.2 模型优化层面负反馈在模型训练中的价值更高因为它提供了明确的边界信息。在推荐系统中我们有大量曝光未点击的样本但这些样本很模糊——用户可能是没看到、可能是没兴趣、也可能是有兴趣但没时间点。负反馈不一样用户主动踩了说明模型推荐错了这个错误的方向是明确的。作为 Hard Negative 样本很多团队会把负反馈样本标记为 hard negative在损失函数里给它更大的权重# 伪代码加权损失函数defcalculate_weighted_loss(samples):total_loss0forsampleinsamples:base_lossbinary_cross_entropy(sample.prediction,sample.label)# 负反馈样本应用更高权重weight3.0ifsample.is_negative_feedbackelse1.0total_lossweight*base_lossreturntotal_loss/len(samples)多目标优化在多任务学习框架下负反馈可以作为一个独立的预测目标。除了预测点击率、观看时长还可以单独预测负反馈率最终得分 w1 × CTR分数 w2 × 时长分数 - w3 × 负反馈分数这里的 w3 就是负反馈的惩罚系数通常会设置得比较大比如 2-3体现对用户厌恶偏好的重视。3.3 内容治理层面通过聚合分析负反馈可以识别出低质内容这对整体生态健康很重要。如果某个内容被大量用户踩说明它可能是低质内容需要在全局层面降权甚至下架。这需要实时统计负反馈率等指标设置阈值触发审核机制。四、负反馈利用的优缺点优势劣势信号明确比未点击样本更有学习价值数据稀疏用户主动反馈的比例很低能直接表达用户厌恶偏好避免踩雷存在噪声可能是误触或情绪性操作帮助模型学习更精准的决策边界过度使用会导致推荐过于保守可用于识别低质内容优化平台生态用户兴趣会变化历史负反馈可能过时关键权衡点即时性 vs 准确性用户期待实时响应但负反馈可能有噪声需要平衡个性化 vs 探索性过度依赖负反馈会让推荐变保守损失发现新内容的机会短期体验 vs 长期学习实时过滤保证即时体验但模型训练需要积累数据五、实际应用与发展趋势5.1 实际应用场景短视频平台抖音、快手等平台大量使用负反馈信号。当用户点不感兴趣后系统会追问是内容重复还是不喜欢这类题材这些细分原因帮助模型更精准地理解负反馈含义。电商推荐淘宝、京东等电商平台用户对某类商品的厌恶通常比较稳定。如果用户踩了所有奢侈品广告这个偏好可能长期有效负反馈的时间衰减可以设计得慢一些。新闻资讯用户的兴趣变化快今天关心的话题明天可能就不关心了所以负反馈的时间衰减要设计得快一些可能 7 天后权重就降到很低。5.2 当前局限性与改进方向负反馈稀疏性问题对于新用户或冷门类目负反馈数据往往不足。解决方案是借用相似用户的负反馈模式来补充比如通过聚类算法把用户分成不同的兴趣群体用群体的共同厌恶偏好作为参考信号。恶意负反馈防范在实际场景中还要考虑恶意行为的防范比如竞争对手雇水军批量点踩。解决方案包括行为模式检测识别短时间内集中给同一类内容点踩的异常账号设备指纹和 IP 校验降低来自同一 IP 段或设备指纹的信号权重用户信誉体系给长期活跃、行为正常的老用户更高权重5.3 未来发展趋势更细粒度的负反馈理解不只是喜欢/不喜欢而是理解为什么不喜欢——是内容质量、题材偏好、还是创作者因素动态权重调整根据用户群体、内容类型、业务阶段动态调整负反馈权重而非使用固定值。因果推断应用从相关性走向因果性真正理解负反馈背后的用户意图而非简单关联。多模态负反馈不仅利用显式的点踩行为还通过分析用户的隐式行为如快速滑动、停留时间短来推断负向偏好。六、总结与思考负反馈是推荐系统中一个被低估的宝藏信号。它不像正反馈那样让人愉悦但它告诉系统什么内容会让用户反感这种边界信息对模型学习至关重要。利用负反馈的核心思路可以总结为三点实时响应用户点踩后立即过滤或降权保证即时体验模型学习将负反馈作为 hard negative 样本提高学习权重内容治理聚合分析识别低质内容优化平台生态但负反馈不是万能的。过度依赖会让推荐变得保守只敢推那些安全的内容损失探索性和多样性。好的推荐系统需要在尊重用户厌恶和保持探索精神之间找到平衡。最后思考推荐系统的终极目标不是让用户永远看到喜欢的内容而是帮助用户发现有价值的内容。负反馈告诉我们该避开什么但更重要的是它让我们更清楚地知道该往哪个方向探索。如果这篇文章对你有帮助欢迎 Star AI-From-Zero 项目一起学习 AI

更多文章