2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
在今天Face book博客上的一篇文章中,工程師們描述了一種算法-SybilEdge-來檢測假賬戶,這些假賬戶在注冊時逃避Face book的反虐過濾器,但還沒有足夠的朋友來延續(xù)虐待。 目標(biāo)是降低賬戶對其他用戶發(fā)起攻擊的能力,部分是通過比較用戶向擴(kuò)展社交網(wǎng)絡(luò)添加好友的方式。
SybilEdge能夠發(fā)現(xiàn)假的Face book賬戶不到一周,朋友的請求不到20個,它立即申請平臺來處理關(guān)于流行的一波誤導(dǎo)性信息。 路透社牛津大學(xué)新聞學(xué)研究所發(fā)表的一項(xiàng)分析發(fā)現(xiàn),33%的人在Twitter、Face book和YouTube等社交網(wǎng)絡(luò)上看到了某種形式的關(guān)于的錯誤信息。
在設(shè)計SybilEdge時,開發(fā)團(tuán)隊(duì)指出,施虐者需要連接到目標(biāo)才能發(fā)起虐待-也就是說,他們需要找到目標(biāo),向他們發(fā)送朋友請求,并接受請求。 也許不足為奇的是,F(xiàn)ace book內(nèi)部研究表明,非用戶在選擇朋友和那些朋友對朋友請求的回應(yīng)方面都有所不同:假帳戶的請求比真實(shí)用戶的請求更經(jīng)常被拒絕。 此外,假賬戶在選擇朋友請求目標(biāo)時往往很小心,這可能會最大限度地提高他們的請求被接受的概率。
Face book創(chuàng)建了一個語料庫,通過將用戶分成兩組來訓(xùn)練SybilEdge:那些更有可能接受來自真實(shí)帳戶的朋友請求的人和那些可能接受虛假帳戶請求的人。 如果前者拒絕傳入的請求,它將發(fā)出請求者是合法用戶的信號。 另一方面,如果接受更多假請求的用戶接受請求,則表明請求者可能是假的。
西比爾邊緣分兩個階段工作。 首先,它是通過觀察上述樣本的時間來訓(xùn)練的,然后它利用Face book的行為和內(nèi)容分類器的輸出,這些分類器根據(jù)實(shí)際的濫用標(biāo)記帳戶。 這個訓(xùn)練階段為模型提供了所有必要的參數(shù)(即從數(shù)據(jù)中估計的配置變量,以及模型在進(jìn)行預(yù)測時所需的配置變量),以便為每個朋友的請求和響應(yīng)實(shí)時運(yùn)行,并更新請求者被假的概率。
Face book聲稱,SybilEdge在檢測假賬戶方面的準(zhǔn)確率高于90%,平均有15個或更少的朋友請求,在檢測5個朋友請求的假賬戶方面的準(zhǔn)確率高于80%。 此外,與其比較的基線不同,它的性能不會隨著更多的朋友請求而降低(超過45)。
“SybilEdge幫助我們快速識別施虐者,并以一種可以解釋和分析的方式。 在不久的將來,我們計劃研究更多的方法,可以進(jìn)一步加快發(fā)現(xiàn)濫用帳戶,并幫助作出自信的決定,甚至比SybilEdge更快。 我們計劃通過混合基于特征和基于行為的模型來實(shí)現(xiàn)這一點(diǎn),“Face book寫道。
Face book正向一種名為自我監(jiān)督學(xué)習(xí)的人工智能培訓(xùn)技術(shù)邁進(jìn),在這種技術(shù)中,未標(biāo)記數(shù)據(jù)與少量標(biāo)記數(shù)據(jù)一起使用,以提高學(xué)習(xí)精度。 Face book的深度實(shí)體分類(DEC)機(jī)器學(xué)習(xí)框架在部署以來的兩年里導(dǎo)致平臺上濫用賬戶減少了20%。 在一個單獨(dú)的實(shí)驗(yàn)中,F(xiàn)ace book的研究人員能夠訓(xùn)練一個語言理解模型,該模型只有80個小時的數(shù)據(jù),而人工標(biāo)記的數(shù)據(jù)為12,000個小時。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。