神探夏洛克可能要和警方說再見了。最近,英國(guó)警方開始試驗(yàn)一個(gè)叫VALCRI(Visual Analytics for sense-making in Criminal Intelligence Analysis)的計(jì)算機(jī)程序,它可以在短時(shí)間內(nèi)分析犯罪數(shù)據(jù),從而幫助警方破獲案件,可能比夏洛克還厲害。
VALCRI的主要任務(wù)是幫助警察生成合理的場(chǎng)景,也就是何時(shí)何地何人何動(dòng)機(jī)在進(jìn)行犯罪行為。它可以通過掃描數(shù)百萬的刑事檔案記錄、筆錄資料、圖像、視頻等資源來確認(rèn)這些信息是否與案件本身相關(guān)。這些結(jié)果將呈現(xiàn)在兩個(gè)大型觸摸屏上,與犯罪分析師進(jìn)行交互。
一個(gè)關(guān)于邏輯思維游戲
“VALCRI能定位殘留在幾個(gè)犯罪現(xiàn)場(chǎng)的彈殼——分析師判斷彈殼和案件本身有沒有關(guān)系,VALCRI再根據(jù)分析師的判斷調(diào)整結(jié)果”,密德薩斯大學(xué)的Neesha Kodagoda這樣評(píng)價(jià)道。
正由于應(yīng)用了機(jī)器學(xué)習(xí),系統(tǒng)在與分析師交互的基礎(chǔ)上提高了搜索性能。分析師可以通過調(diào)節(jié)不同標(biāo)準(zhǔn)的權(quán)重改變標(biāo)準(zhǔn)的重要性,從而讓VALCRI做出最合適的判斷。
一般來說,分析師在處理未知案件的第一步就是搜尋警察數(shù)據(jù)庫的相關(guān)事件。通過搜集嫌疑人的作案時(shí)間、地點(diǎn)、手法來判斷案件本身與嫌疑人的關(guān)聯(lián)性。,Kodagoda還說,“一位經(jīng)驗(yàn)豐富的分析師需要73人協(xié)助才能收集到所有信息,而VALCRI僅僅通過一次單擊就能完成”。
可以產(chǎn)生聯(lián)想
雖然警察記錄的信息量大且繁冗,但算法會(huì)驅(qū)動(dòng)系統(tǒng)在基礎(chǔ)認(rèn)知水平上理解問題。
在不同的犯罪現(xiàn)場(chǎng)的不同目擊者可能用不同的詞匯描述一個(gè)衣著不整的人??赡軙?huì)用“襤褸”,可能是“亂蓬蓬”,也可能是“凌亂”。人類在聽到這些詞語時(shí)會(huì)正常的聯(lián)想到他們可能描述的是同一人,而VALCRI也可以做出這樣的聯(lián)想。這個(gè)系統(tǒng)甚至也可以利用面部識(shí)別軟件在監(jiān)控或圖片中識(shí)別人臉。
最近,英國(guó)西米德蘭茲警察局正在用三年的匿名數(shù)據(jù)(總計(jì)達(dá)650萬條數(shù)據(jù))訓(xùn)練VALCRI。比利時(shí)的安特衛(wèi)普警察也在進(jìn)行測(cè)試。
施行困難重重
下個(gè)階段的任務(wù)是讓VALCRI在犯罪發(fā)生時(shí)的非匿名數(shù)據(jù)下運(yùn)行。警察在調(diào)查期間使用的技術(shù)可能會(huì)在法庭上遭到質(zhì)疑,所以過早或不正確的部署VALCRI可能會(huì)導(dǎo)致案件難以審判。當(dāng)然,各國(guó)之間允許警察獲取的數(shù)據(jù)也有所不同。
另一個(gè)施行難點(diǎn)是,很多人難以接受計(jì)算機(jī)預(yù)測(cè)犯罪概率并敘述犯罪情況。VALCRI的團(tuán)隊(duì)成員Ifan Shepherd表示,“如果犯罪案件中的數(shù)據(jù)不清晰,那么VALCRI的分析情況也不容樂觀。人類分析師總要在案件中做最后把關(guān)”。
可能引入偏見
喬治亞理工大學(xué)的Mark Riedl表示:“機(jī)器學(xué)習(xí)可以幫助警察,但也會(huì)引入一些新的偏見”。系統(tǒng)確實(shí)會(huì)確定所有的相關(guān)特征,同時(shí)也必定錯(cuò)過了一些信息。
VALCRI試圖通過將過程透明化解決這個(gè)問題。如果每個(gè)決定都可以被溯源,那么正確結(jié)果永遠(yuǎn)不會(huì)被隱瞞。
寫到這里幾乎可以確定,VALCRI比夏洛克還厲害了。