您的位置: 首頁 >互聯(lián)網(wǎng) >

在緊急情況下識別Twitter用戶位置的深度學習方法

2019-06-06 16:35:16 編輯: 來源:
導讀 印度國家技術研究所的研究人員最近設計了一種工具,用于識別緊急情況和災害的地理位置,以及相關人員的地理位置。他們的方法在國際減災風險

印度國家技術研究所的研究人員最近設計了一種工具,用于識別緊急情況和災害的地理位置,以及相關人員的地理位置。他們的方法在國際減災風險雜志的一篇論文中概述,使用基于卷積神經(jīng)網(wǎng)絡(CNN)的模型從推文中提取位置信息。

“在緊急情況下,事件的地理位置信息以及受影響的用戶的地理位置信息非常重要,”開展這項研究的研究人員之一Jyoti Prakash Singh告訴TechXplore。“識別這個地理位置是一項具有挑戰(zhàn)性的任務,因為可用的位置字段,例如用戶位置和推文的地名不可靠。用戶的精確GPS位置在推文中很少見,有時在時空信息方面也不正確。”

受自然災害或其他緊急情況影響的人經(jīng)常在社交媒體上分享他們的位置,尋求幫助。這些信息可以幫助響應單位和地方當局及早發(fā)現(xiàn)事件,找到受害者并協(xié)助他們。但是,從推文中提取與位置相關的數(shù)據(jù)是一項非常具有挑戰(zhàn)性的任務,因為這些數(shù)據(jù)通常是用非標準英語編寫的,包含語法錯誤,拼寫錯誤或縮寫。

“人工操作員跟蹤推文幾乎不可能通過每條推文查找其中提到的位置信息,”辛格說。“這促使我們開發(fā)了一種解決方案,可以從推文中尋求幫助自動提取位置信息。在這項工作中,我們利用深度學習來確定推文是否包含位置名稱并突出顯示這些詞。”

Singh和他的同事Abhivan Kumar開發(fā)了一個CNN 模型,可以通過分析他們推文的內(nèi)容來識別用戶的位置。他們選擇了這種特定的深度學習方法,因為它可以自動學習輸入數(shù)據(jù)的最佳表示,并使用它來識別位置參考。

“我們使用字嵌入技術在CNN的輸入層表示推文,并且推文中存在的位置參考以輸出層的形式呈現(xiàn)為零一向量,”Singh解釋說。“位置字編碼為1,非位置字編碼為0.我們使用了2克,3克,4克和5克濾鏡的幾種組合來從推文中提取特征。對于100個時代的模型,它能夠以令人印象深刻的準確度預測推文中提到的位置參考。“

在初步評估中,Singh和Kumar設計的CNN模型能夠以非常高的準確度從推文中提取所有與位置相關的單詞,即使在推文的文本有噪聲時也是如此。研究人員在未經(jīng)預處理的推文上測試了他們的模型,其中包含語法錯誤,拼寫錯誤,縮寫和其他混淆因素。

“我們工作的主要實際意義在于它可以通過事件檢測模型輕松實現(xiàn)流水線化,”Singh說。“事件檢測模型可以識別與所述災難相關的推文,我們的模型可以提取受該災難影響的受害者的位置。”

將來,研究人員開發(fā)的CNN模型可以幫助快速定位緊急事件和需要緊急援助的人。同樣的方法也可以應用于內(nèi)亂,有針對性的廣告,觀察區(qū)域人類行為,實時道路交通管理和其他基于位置的服務。

“在這項工作中,我們只考慮英語推文,但在危機期間,用戶也會發(fā)布地區(qū)語言的推文,”辛格說。“因此,我們正在研究一種解決這種多語言限制的模型,同時還試圖開發(fā)一種半監(jiān)督模型來減少數(shù)據(jù)標記問題。”


免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網(wǎng) 版權歸原作者所有。