大鹏方法好,
我觉得首次发帖人工审核足够应付自动机器人。
tctcab 就算第一次发帖需要人工审核,那还是得劳烦我们版主们默默动手封禁、删帖,因为那些帖子还是会发进来。无论如何我觉得还是得在注册上先设置一道门槛,把机器人拦下来。我看了一下这些垃圾用户的邮箱,都是些妖魔鬼怪的域名(什么 263mail.cn)之类的。如果我们限制一下只能用若干主流邮箱,我觉得机器人就没那么容易自动化注册了。目前那些能自动注册都是因为能自动收取验证邮件(反正邮件服务器是自己的)。我们的总管 @Ihavenothing 好一阵子没来了,我得去给他发个邮件。
感觉这个事情比较重要,最近这些小广告太猖獗了
罪过罪过,最近忙一堆别的事,好久没上论坛了,刚看了益辉的邮件才知道这事。我今晚来看看有什么办法没。
Ihavenothing 如果垃圾用户注册的邮箱都是 .cn 后缀的话,那我觉得禁止 .cn 后缀邮箱注册也无妨。先提取出来看看有没有这种明显的特征吧。
yihui 今天事情太多,可能要鸽了……我周末来研究研究吧。
搜到这个 可能有用 How to prevent robot Posting effectively?
发现flagrow上两个可能有用的插件
https://flagrow.io/extensions/fof/stopforumspam
将注册数据与公共免费的spam数据库比对,包括用户名,邮箱域名,ip等
https://flagrow.io/extensions/fof/spamblock
将手动删帖封人简化到标记spammer,自动封20年,隐藏帖子
有没有几个小广告样例我来看看?只看邮箱不确定哪些是机器人。
Ihavenothing
小闪电看不到的话应该是被小扳手永久删除了吧哈哈哈哈哈哈@yihui
tctcab 对,我只要看见广告就彻底删除了。Ihavenothing 你从数据库里找被封禁的用户,那些基本上都是因为发过广告而被禁的,我觉得它们的邮箱应该有特征。
Ihavenothing 我留了一则垃圾示例:https://d.cosx.org/d/421040 它的邮箱又是 263mail.cn。我觉得在注册时单把这样的邮箱域名禁掉(不让注册)应该就可以对付相当大一批垃圾机器人了。
yihui 现在大概的思路是在注册的小插件中建立黑名单的正则表达式,类似之前建议用户不要使用QQ邮箱那样。
Ihavenothing 嗯,这样应该就很好了。最新发垃圾帖的那个邮箱是:owjw2r3c@yxpf.xyz 这种 .xyz 小众域名也可以禁了。
还有 l98wv89s@huaweimali.cn
与其建白名单,我觉得不如统计一下现有用户的邮箱域名建个白名单,只允许大众/正规的邮箱后缀注册
tctcab 上面我正是此意(sort(table(gsub('^.*?@(.*)$', '\\1', email)), decreasing = TRUE) 取前若干位)。
sort(table(gsub('^.*?@(.*)$', '\\1', email)), decreasing = TRUE)
刚才更新了一下插件,用的是保守的方法,匹配已有的黑名单。有新的域名出现时可以到这里去反馈。
Ihavenothing 太好了!这下我觉得应该可以剁翻大部分机器人了。
用户邮箱地址还是只有小扳手看得到啊,小闪电看不到的 😃
比如这算漏网之鱼吧
https://d.cosx.org/d/421081-q-1150353004
tctcab 对,这个邮箱漏网了,我已经提交黑名单。
yihui
观察了一下这些域名都是随机字符串.com域名,所以我觉得白名单会比黑名单效率更高一点,既然黑名单已经实现的话那白名单稍微改改就能用了吧
不过我不是很懂php不然就提起键盘PR了…
tctcab 白名单的问题在于误伤率太高了,比如学校邮箱、公司邮箱什么的。
tctcab 你看看现在是不是可以查看邮箱了?