什么是知乎威尔逊积分算法

什么是知乎威尔逊积分算法

知乎使用的是威尔逊得积分排序算法,Wilson Score,用于质量排序,数据含有好评和差评,综合考虑评论数与好评率,得分越高,质量越高。

威尔逊积分算法的公式

公式参数含义:u表示正例数(好评),v表示负例数(差评),n表示实例总数(评论总数),p表示好评率,z是正态分布的分位数(参数),S表示最终的威尔逊得分。z一般取值2即可,即95%的置信度。

威尔逊积分算法的性质:

  • 性质:得分S的范围是[0,1),效果:已经归一化,适合排序
  • 性质:当正例数u为0时,p为0,得分S为0;效果:没有好评,分数最低;
  • 性质:当负例数v为0时,p为1,退化为1/(1 + z^2 / n),得分S永远小于1;效果:分数具有永久可比性;
  • 性质:当p不变时,n越大,分子减少速度小于分母减少速度,得分S越多,反之亦然;效果:好评率p相同,实例总数n越多,得分S越多;
  • 性质:当n趋于无穷大时,退化为p,得分S由p决定;效果:当评论总数n越多时,好评率p带给得分S的提升越明显;
  • 性质:当分位数z越大时,总数n越重要,好评率p越不重要,反之亦然;效果:z越大,评论总数n越重要,区分度低;z越小,好评率p越重要;

 

相关推荐

什么是知乎知享

什么是知乎知享 「知享」是知乎推出的一款商业服务产品。为创作者的「商业营销内容」保驾护航,同时也提供营销组件、审核绿色通道、专属客服等其他服务。创 …

什么是知乎创作分

什么是知乎创作分 创作分是根据创作者在社区所有的创作行为,包括「回答、文章、视频、想法、提问」等,结合创作内容的质量、影响力以及关注者的互动情况, …

什么是知乎盐值

什么是知乎盐值 在知乎,不同文化背景、生活经历和价值观的人们分享着自己的知识、经验和见解,并在交流中达成了认真、专业和友善的社区共识。基于社区共识 …