2009年5月20日星期三

关于社区中的 SPAM

SPAM 是社区的顽疾,一般来说都用人肉的方法处理。虽说给了有权限的用户一定
的"特权",多了且每天重复和不同的人肉斗争还是会让人觉得烦恼的。可否有其
他方式减轻 SPAM 的危害呢?

先从 SPAM 的来源说起。一般来说 SPAM 是被用作 SEO 堆砌链接的,而更隐蔽的
是做票证、销售、中介等只留关键信息的 SPAM 。

应对策略:

不提示需要审核,给 SPAM 发布者以发布成功的假象。
防止自动表单提交,注册和头几次发文(某特定用户组)均使用校验码。
需要对用户提交的链接加上"rel=nofollow"标记。
建立链接目标网站黑白名单,为用户提交内容加上 <a> 标签。可根据引用次数进
行人工审核。
特权用户举报,可以随机抽取参与度高的用户。
对被报告为 SPAM 的内容进行学习(贝叶斯、SVM等算法),并对新用户提交的内
容进行过滤。
考虑到部分功能仅对高级用户有意义,可以随等级提升开放签名和头像等功能,并
允许<a>标签。

可以使用评分表对内容进行量化评定,参考用户的注册时间、同IP注册账号数量、
发文间隔时间、用户积分等。考虑到人肉 SPAMMER 的特点是低投入,低产出的劳
动密集型产业,稍微增大发表的成本会限制 SPAM 的数量。

进一步可以强化积分的作用,将用户的付出和回报相联系。如发帖需要扣分而非加
分的积分规则,这在也有助于提高回帖的质量。


人工是不可或缺的环节,但是可以用技术手段减轻人工压力。判别成本降低了,相
对可以减小 SPAM 的停留时间,在和人肉 SPAMMER 斗争中获得优势。
 
Creative Commons License
本作品采用知识共享署名-非商业性使用-相同方式共享 2.5 中国大陆许可协议进行许可。