從AI風控到社群共治,Soul張璐團隊的Q3生態安全報告解析
隨著網絡普及,社交平台已成為大眾交流、表達情感和建立社交關係的主要渠道。然而,虛假資訊、網絡詐騙及網絡欺凌等問題亦隨之浮現,對用戶安全構成重大挑戰。近日,AI社交平台 Soul張璐團隊發佈《2025 年第三季度生態安全報告》(下稱「報告」),詳細闡述其在維護平台生態安全方面的最新進展及成果。

報告指出,Soul 將生態安全視為平台發展的核心,並從「技術、制度、教育」三大方向著手,透過持續優化 AI 風險控制(風控)技術、升級反詐騙模型及完善社群共治體系,致力提升平台的安全水平,為用戶打造一個健康、友善的社交空間。
在 2025 年第三季,Soul 持續深化 AI 在安全領域的應用,重點提升前端攔截及後續處理能力。針對網絡詐騙,Soul 全面升級 AI 反詐騙模型,顯著提高識別準確率,同時大幅降低誤判率。模型經過升級後,圖片反詐騙模型的識別覆蓋率提升至 90% 以上,誤判個案數量大減約 80%,有效覆蓋主流社交場景。此外,高風險用戶設定的識別覆蓋率亦從不足 50% 提升至 70% 以上,有助平台及早預警。
與此同時,Soul 繼續與監管及執法部門緊密合作,第三季向相關部門提供過百條違法線索,協助多宗警民合作,強化平台與外部的協同治理能力。
在私人訊息安全方面,Soul張璐團隊持續優化策略,第三季共推出逾 20 項新措施,涵蓋防騷擾、反詐騙及內容風險識別等範疇。其中,「訊息僅自己可見策略」成功保護了超過 4.3 萬名用戶免受滋擾;針對屢次違規的帳號,平台平均每日限制其私人訊息功能約 8 萬次,有效遏止不當行為擴散。同時,Soul 亦透過「守護彈窗」等機制,提醒可能正遭受騷擾的用戶,強化其風險防範意識。
在網絡欺凌治理方面,Soul 透過智能監測與快速應對機制,持續打擊相關行為。報告數據顯示,平台在第三季平均每日保護超過 3,000 名用戶免受網絡欺凌及惡意騷擾;並透過系統提示及內容引導,平均每日在私人訊息場景中發出 21.5 萬次文明溝通提醒,引導用戶建立正面的溝通文化。
為加強保護未成年用戶,Soul 透過升級用戶特徵大模型,將年齡與身份識別的覆蓋率提升 200%。配合全新的判斷邏輯,系統能更準確地識別疑似未成年用戶,確保相關帳戶及時得到保護。
安全生態的長遠發展,有賴用戶的共同參與。報告提到,Soul 在第三季持續推動「社群共建共治」計劃,鼓勵用戶參與內容監督及秩序維護。目前,平台擁有超過 7.8 萬名社群共建用戶,當中內容推薦官和風紀委員的每日活躍用戶數量穩定增長。
在用戶教育方面,Soul 透過「風紀球長」等官方帳號,發佈一系列安全資訊,累計發佈 59 篇相關內容,主題涵蓋打擊低俗內容、不實資訊及防止惡意挑釁等,總觸及用戶超過 51 萬人次,有效提升用戶的網絡文明意識與自我保護能力,將安全理念融入社群文化之中。
總結而言,由 Soul張璐團隊發佈的《2025 年第三季度生態安全報告》,不僅展示了平台在 AI 安全治理方面的階段性成果,更體現了其對維護社交生態長遠健康發展的社會責任。透過持續強化風險管理能力、完善用戶保護機制及推動社群共治,Soul 正為用戶提供一個更安全、更友善的社交空間,並在平台治理上建立一個可持續的良好循環。