禅世界论坛

<- 社交登陆。【论坛使用帮助】
网文:”未阅先焚”:微信聊天如何审查图...
 
Notifications
Clear all

网文:”未阅先焚”:微信聊天如何审查图片

1
1 Users
0 Reactions
1,917 查看
Many
 Many
(@many)
Illustrious Member Admin Registered
已加入: 9 年 前
帖子: 12286
Topic starter  

网文:”未阅先焚”:微信聊天如何审查图片

【微信每月活跃用户超过10亿,那么,如何实现实时自动审查巨量的聊天中所发送的图片呢?多伦多大学公民实验室发布了一份最新研究报告。】

wei1

微信

(德国之声中文网)题为”未阅先焚2:微信如何实现实时审查用户对话中的敏感图片”的报告于7月15日发表,其核心发现是:

  • 微信的审查包括识别图片中的敏感文字图形、以及与黑名单上画面相似的图片;
  • 微信使用MD5哈希算法,以实现对话中图片的实时、自动审查;
  • 朋友圈、群聊的审查力度大于一对一的对话;
  • 微信图片审查的主题主要是政治内容以及与政府、社会抗争有关的主题,同时也对新闻事件作出反应。

根据中国法律,互联网平台对内容负责,因而要借助科技手段进行自我审查。

审查:从朋友圈到一对一聊天

多伦多大学公民实验室(Citizenlab)此前曾对微信朋友圈进行研究,发现:在图片发表后,微信会审查图片是否包含敏感关键字、以及图片是否与黑名单画面类似。如果是,图片会被屏蔽,但发图者以及海外账户仍可见该图片。

此次的研究则针对微信聊天。由于上述审查方式需要强大的计算能力,难以实现聊天中图片的实时审查,因此,微信使用MD5哈希算法,即审查图片的MD5值是否在过滤列表上。这样的好处是快,坏处是很不灵活:一旦MD5值有细微变化,尽管图片内容变化不大,仍会过关。

wei2

报告作者发现,微信公众号被屏蔽的文章中,图片也被列入黑名单

为应对这一局限,微信在MD5实时审查后,会再次使用非实时的过后审查。报告作者发现,经修改MD5值的敏感图片第一次发送会成功,但数秒之后再次发送,即会失败。

报告作者还发现,一对一聊天、群聊和朋友圈的审查范围不尽相同。后两者范围更大。

哪些图是敏感图?

报告的另一部分内容,则是对微信审查图片的主题进行分类。研究者首先建立了一个测试敏感图库,来源是香港大学的一个项目WeChatscope,该项目收集了微信公共账号被屏蔽的帖子。报告作者则把这些帖子中的图片集合起来。

由于微信测试账号大多难以获得身份验证,报告作者不得不诉诸审查相似的腾讯另一平台QQ空间,来进行敏感图的测试。

报告作者共发现212张会被过滤的敏感图,其中:与中国政府有关的图片为75张,内容不单有讽刺漫画,也有中性的政府政策、领导人图片。其中一幅被审查的图片是位于法国的欧洲电视台Euronews的一则新闻画面截图,显示的是中国国家主席习近平2019年3月访问意大利前夕,一位艺术家在意大利使用拖拉机在田野上创作出一幅习近平微笑的巨大头像。

在这212张被过滤的图片中,与新闻事件有关的有60张,内容涉及:文革、天安门事件、范冰冰逃税事件、最高法院卷宗丢失事件、华为孟晚舟事件、中美贸易战、2018美国中期选举、胚胎基因编辑事件等。

受到最多审查的图片:最高法卷宗丢失案

其中,最高法院卷宗丢失事件受到审查的图片数最多,为24张。其中绝大多数是一封据说为法官王林清指控最高法院院长周强指使他人盗走卷宗的信件图片。与华为孟晚舟事件相关的被审查图片则为10张。中美贸易战也有8张。

在212张被过滤的图片中,报告作者列入”社会抗争”类别的有25张。其中包括有永元的照片、已故诺贝尔和平奖得主晓波”空椅子”的照片等。此外,涉及裸体的图片无论主题如何也很有可能被屏蔽。不过,也有一些图片被审查的原因不明,如一张大猩猩研究者古道尔的图片。

wei4

@badiucao
 

#巴丢草 漫画 【中国病人】立即释放 #刘晓波 ,还 #刘霞 自由!让他们选择自己的生活与去处!#badiucao cartoon for #Free #liuXiaobo & #LiuXia

报告作者发现,许多微信公众号被屏蔽的文章中的图片,无论其是否敏感,似乎都会受到过滤。作者因此提出假设:腾讯的图片审查黑名单是从被屏蔽的微信公众号帖子中收集而来的。

“未阅先焚” 2:微信如何实现实时审查用户对话中的敏感图片
By Jeffrey Knockel and Ruohan Xiong

本报告延续上一篇针对微信朋友圈图片过滤技术的研究,分析微信如何在聊天功能中实现实时图片过滤。微信是中国腾讯控股有限公司旗下的即时通讯应用,目前是中国最受欢迎的聊天软件之一,也是全球排名第四的最流行聊天软件。朋友圈是微信上最常用的功能之一,其中图片是用户最期望看到的内容分享形式。

根据中国相关法律法规,互联网公司往往需要对内容进行过滤。公民实验室此前的研究报告发现了微信的“一APP两制”关键词过滤机制,在新浪微博,Tom-Skype和新浪UC等即时通讯软件,以及直播平台上的审查机制。此前,我们留意到微信除了过滤关键词,部分与敏感事件相关的图片也会被审查。

主要发现

•微信对用户对话中发送的图片进行实时自动检测和审查,审查是基于图片中包含的文字以及目标图片与系统数据库中的敏感图片的相似度匹配。

•微信通过建立哈希索引(Hash Index)进行实现过滤,该哈希索引由微信用户在聊天对话中发送的图像的MD5值组成。

•本报告对比了微信朋友圈,一对一聊天以及群组聊天的图片审查比例。我们发现这三项功能的敏感图片库并不相同,即朋友圈,一对一聊天及群组聊天所审查的图片不一样。其中,朋友圈和群组聊天所审查的范围要远大于一对一聊天。

•微信主要审查政治敏感的图片,这些图片大多与政府和社会反抗有关。

•与关键词审查一样,微信图片审查与新闻事件相关。我们进行了六个月的审查观察,发现微信过滤的图片内容范围很广,其中包括华为首席财务官孟晚舟一案,中美“贸易战”,2018年美国中期选举等。

July 15, 2019

读者推荐



   
引用
Share:

【声明】:禅世界论坛尊重言论自由,任何人可讨论佛法、政经、生活和科技等话题。言论发表前请根据常识和法规自审。论坛管理员和版主有权删除任何不当内容。使用本论坛即表示接受【禅世界论坛规则】【论坛使用帮助】。 【禅世界免责声明】


【Chanworld.org】2017.06.06-2021.04.30-2025.04.10-MG-RM