4月15日,抖音在北京舉辦“安全與信任中心開放日”活動,相關業務負責人就抖音算法原理、平臺治理體系以及社會關切的問題,展開了詳細介紹。
據現場介紹,推薦算法作為人工智能機器學習技術的重要應用場景,本質上是一套高效的信息過濾系統。在抖音的實際應用中,推薦系統采取“人工+機器”協同的方式進行風險治理,始終有人工運營和治理體系為算法導航;同時多目標體系算法能主動打破 “信息繭房”,為用戶帶來更豐富多元、實用可靠的推薦結果。
目前,抖音安全與信任中心網站(95152.douyin.com)處于試運行階段,正廣泛向用戶、創作者、社會各界征集意見。此次開放日活動,旨在鼓勵廣大公眾體驗抖音安全與信任中心,了解算法原理、機制和治理政策,共建平等友善、記錄美好的社區。
抖音算法揭秘:以用戶長期價值為目標,主動多樣化推薦
推薦算法的出現,得益于人工智能技術。近二十年來,機器學習尤其是深度學習的進步,讓人工智能大規模應用于信息分發成為可能。在信息爆炸時代,推薦算法成為人類與巨量信息相處的主流解決方案。
開放日上,抖音算法工程師劉暢講解了算法原理和抖音算法的特點。劉暢介紹,抖音的推薦算法與國內外大部分內容推薦平臺相似,包含召回、過濾、排序等環節,重點是學習用戶行為。

抖音算法工程師劉暢介紹算法原理
抖音基于用戶行為的推薦方法包含多種技術模型,如協同過濾、雙塔召回、Wide&Deep模型等。算法可以在完全“不理解內容”的情況下,找到興趣相似的用戶,把其他人感興趣的內容推薦給該用戶。目前,抖音算法已幾乎不依賴對內容和用戶打標簽,而是通過神經網絡計算,預估用戶行為,計算用戶觀看這條內容獲得的價值總和,把排名靠前的內容推給用戶。

算法基于用戶行為推薦,對可能發生的用戶行為預測打分
“用戶長期價值,是抖音推薦算法的‘北極星指標’,也就是我們最核心的業務目標。”劉暢表示,抖音更關注用戶長期價值,而非追求平臺的短期數據。為此,抖音算法考慮了眾多目標,如完播、評論、點贊、對作者長期消費、分享、跟拍等,力圖計算出更符合用戶長期價值的目標。
為引導算法打破“信息繭房”,抖音算法在多目標建模體系下,設置了專門的探索維度。一是對用戶在平臺上已經表現出的興趣,盡可能推薦更多樣的內容,通過多樣性打散、多興趣召回、扶持小眾(長尾)興趣等方法控制相似內容出現的頻次。二是幫助用戶探索更多新興趣,采用隨機推薦、基于用戶社交關系拓展興趣、搜索推薦聯動、“不感興趣”不再展現等多種方式,讓用戶的主動行為影響推薦系統,使推薦更加個性化和多樣化。

抖音算法主動打破“繭房”:推薦給朋友、不感興趣、屏蔽關鍵詞頁面
平臺治理體系:人工運營為算法護航,守護內容生態安全
算法能學習、預估用戶行為,但因其無法理解內容語義,對內容的理解存在不足,可能導致違法違規、不良內容被推薦傳播。因此,算法在真實使用場景中,必須由平臺治理對其進行約束和規范。
以抖音為例,據抖音生態運營經理陳丹丹介紹,抖音的內容治理體系是“人工參與+機器學習”相結合的模式,并組建了專門的平臺治理團隊為算法設置“護欄”。

抖音生態運營經理陳丹丹介紹平臺治理體系
抖音平臺治理體系包括異常感知、標準定義、機器識別、人工研判、風險處置等過程。治理流程秉持兩大準則:1)所有在平臺發布的內容都會經過評估,流量越高的內容評估次數越多,標準也越嚴格;2)抖音內容審核采用“人工+機器”相互配合的模式,“機器”負責“寬度”評估所有投稿,“人工”負責“深度”,確保專業、敏感或疑難等問題盡可能精準研判。

抖音內容治理采取“人工參與+機器學習”相結合的模式
創作者將內容上傳至抖音后,首先進入機器識別環節。如果內容被識別出含有高危特征,將被直接攔截;若未命中高危特征但模型判斷有問題,則會送至人工審核;若問題概率較低,則獲得基礎流量進入下一環節。視頻被舉報、評論區出現集中質疑、流量激增等情況出現,均可能觸發“人工+機器”審核。一旦內容在任一環節被處置,系統會立即停止進一步推薦和分發。
針對社會普遍關心的、對用戶造成較多困擾的焦點問題,抖音成立了數個專項治理團隊,針對詐騙、網暴、虛假擺拍、未成年人保護、網絡水軍、AIGC技術濫用等一系列重大專項風險進行治理。例如,在不實信息治理方面,抖音于近日上線了辟謠卡,遏制不實信息的傳播。
除了闡釋算法、治理等議題,抖音安全與信任中心網站也公布了平臺倡導的社區價值,以及對優質內容的定義。對于讓用戶有收獲、有驚喜、有共鳴的優質內容,抖音增加了專門的推薦子鏈路,這些標記為優質內容子品牌“抖音精選”的內容,均有機會獲得流量扶持。
未來,抖音將堅定推進各項舉措,讓算法更透明、治理更完善、服務更到位,并以安全與信任中心為依托,持續增加算法和治理透明度,回應社會關切的議題,主動公示違規案例治理情況,接受公眾監督。