【Facebook】我們如何執行我們的社區標準?

作者:產品管理副總裁Guy Rosen

只有在感覺安全的情況下,人們才能在Facebook上輕鬆分享。因此,在過去兩年中,我們在技術和人員方面投入了大量資金,以便更有效地從服務中刪除不良內容。今年春天,我們首次發布了審核小組用於執行社區準則的內部指南,因此我們的社區可以更好地了解Facebook上允許的內容以及原因。在5月份,發布了我們在服務中檢測到的違規內容數據,以便人們可以判斷我們的工作情況。

今天,我們發布了第二份社區準則執行報告。第二份報告顯示了我們對打擊成人裸體、性行為、假賬戶、仇恨言論、垃圾郵件、恐怖分子宣傳、暴力和血腥內容的政策,六個月的執法,從2018年4月至2018年九月報告中還新增兩個新數據類別 欺凌騷擾、兒童裸體和對兒童的性剝削。

查找違反我們標準的內容

我們越來越善於在人們檢舉前識別出違規內容,特別是仇恨言論、暴力以及圖形內容。但仍有些領域有更多的工作要做。

  • 自我們上次報告,我們主動發現的仇恨言論數量從24%增加到52%,增加了一倍以上。針對仇恨言論採取行動的帖子,大多數都是在任何人檢舉之前就發現的帖子。這是非常重要的工作,我們在現階段進行大量投資,並且加強對使用不太廣泛的語言的識別能力。
  • 我們對暴力和圖形內容的主動檢測率提高了25個百分點,從72%提高到97%。


(於2018年11月19日太平洋時間上午10:30更新上圖,以糾正2018年1月至3月期間主動識別的仇恨言論百分比。)

刪除違反我們標準的內容和帳戶

我們不僅在尋找不良內容方面做得更好,我們也在減少更多內容。在2018年第三季度,我們對1540萬件暴力和圖形內容採取了行動。這包括刪除內容,在其上面設置警告屏幕,禁用違規帳戶和/或將內容升級到執法部門。這是我們在2017年第四季度採取行動的數量的10倍以上。由於我們的技術不斷改進,使我們能夠在極其相似或相同的內容上自動應用相同的操作。另外,正如我們上週宣布的那樣,我們在2018年第二季度刪除的恐怖主義內容數量大幅增加。我們擴大了媒體匹配系統的使用範圍,可以主動檢測違反我們數據庫中已有內容極為相似的照片的技術刪除恐怖主義宣傳的舊圖像。其中一些增加也是由於修復了一個錯誤,導致我們無法刪除某些違反我們政策的內容。

我們還在第二季度和第三季度減少了比前幾季度更多的假賬戶,分別為8億和7.54億。大多數這些虛假賬戶都是商業動機的垃圾郵件 攻擊的結果,試圖批量創建虛假賬戶。由於我們能夠在註冊後幾分鐘內刪除大部分這些帳戶,因此我們在第三季度的收入中報告,Facebook上虛假帳戶的流行率穩定在每月活躍用戶的3%到4%。

添加新類別

對於我們在本報告中添加的兩個新類別欺凌和騷擾以及兒童裸體和對兒童的性剝削,這兩個數據將作為起點,因此我們也可以衡量我們在這些違規行為中的進展情況。

欺凌和騷擾往往是個人和特定情境,因此在許多情況下,我們需要一個人在我們識別或刪除之前向我們報告此行為。這導致比其他類型的違規更低的主動檢測率。在上一季度,我們對210萬件違反我們欺凌和騷擾政策的內容採取了行動 – 在報告之前刪除了15%的內容。我們在搜索其他類型的違規行為時會主動發現此內容。受害者通常必須在我們採取行動之前報告此內容這一事實可能會讓他們感到不安。我們決心提高對這些類型濫用行為的理解,以便我們能夠更好地主動檢測它們。

我們的社區標準禁止剝削兒童。但為了避免濫用的可能性,我們也刪除了無性內容,例如浴室中兒童的無辜照片,在另一種情況下很容易被濫用。僅在上個季度,我們就刪除了870萬件違反兒童裸體或兒童性剝削政策的內容,在有人檢舉之前已確定99%。我們最近還宣布了在Facebook上打擊兒童剝削的新技術,我相信這將有助於我們更快地識別更多非法內容。

總的來說,我們知道在防止Facebook上的濫用方面還有很多工作要做。機器學習和人工智能將繼續幫助我們檢測和刪除不良內容。衡量我們的進步至關重要,因為它使我們的團隊專注於挑戰並對我們的工作負責。為了幫助我們評估流程和數據方法,我們一直在與數據透明度諮詢小組(DTAG)合作,這 是一組衡量和治理專家。隨著時間的推移,我們將繼續改進這些數據,因此它更準確,更有意義。

您可以在此處查看最新的社區標準執行報告以及有關政府請求和IP刪除的最新信息。兩份報告將於2019年初以超過15種語言提供。

這是Mark Zuckerberg關於這個主題的說明

下載:
數據快照
討厭語音主動檢測
圖形暴力主動檢測
按Call Transcript
11.13.18內容標準論壇會議紀要

引用:newsroom

About the Author

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *