99久久国产亚洲高清观看2020_国产免费成人_四虎国产精品永久地址入口_国产精品免费一区二区久久夜色_美国超碰在线_男人天堂tv

您的位置:首頁 > 管理 >

AI濫用照片刪除也不容易 IBM拒絕披露訓練數據集來源

2019-03-14 10:54:55 來源: 雷鋒網

面部識別技術成為整個AI行業最為常見的技術應用之一;不過,在識別效率越來越高的同時,人們也開始擔心面部識別技術發展過程中的隱私安全問

面部識別技術成為整個AI行業最為常見的技術應用之一;不過,在識別效率越來越高的同時,人們也開始擔心面部識別技術發展過程中的隱私安全問題。比如說最近IBM利用Flickr下載的圖片來進行面部識別訓練,就引起了人們的質疑;NBCNews針對此事進行了詳細的報道,雷鋒網對這篇報道進行了不改變原意的編譯。

近些年來,面部識別技術得到了長足發展,除了幫你解鎖iPhone,還能讓執法機關在人山人海中“一眼”就認出犯罪分子,商店甚至用它來識別自己的“死忠”客戶。不過,法律專家卻警告稱,大量未經允許濫用網絡照片最終會畫地為牢,反過來成為監控你的“幫兇”。

現在的面部識別技術還不完美,它工作時靠的是算法,目標則很簡單——認出那張獨一無二的臉。

想把這個任務完成好,技術人員就必須提前“喂給”算法“養料”,即天量的面部照片。那么這些照片從哪來呢?當然是互聯網。

起初,算法學習的照片都會按照不同的標準進行分類,比如年齡、性別、膚色等,但經過一段時間的學習后,它的能力開始變得有些嚇人了,于是法律和人權專家開始大聲疾呼,他們擔心技術人員對普通人照片的濫用會帶來“反噬”效果。

“這是AI訓練數據集背后的骯臟小秘密。技術人員可不管三七二十一,只要能用的照片他們都不放過。”紐約大學法學院教授JasonSchultz說道。

最近IBM公司也進了“暴風圈”,今年1月它們向研究人員分享了自己的數據集,包含了Flickr上近100萬張照片,雖然IBM號稱此舉是為了減少面部識別的偏差。

了解真相后的攝影師們不愿意了,因為IBM在他們的作品上加了各種細節注釋,包括面部幾何結構、膚色等信息,而這些照片最終可能會成為面部識別算法的“養料”。

“我拍過的人可沒想過,自己的照片居然會被用在面部識別算法訓練上。”公關經理Greg Peverill-Conti氣憤地說道,他有700多張照片被收錄在了IBM的“訓練數據集”中。“IBM太草率了吧,它們怎么能不經同意就使用這些照片”。

IBM公司AI研究主管JohnSmith則表示,公司“致力于保護個人隱私”,如果誰想從數據集中移除照片,盡管聯系IBM。

雖然IBM信誓旦旦的保證Flickr用戶可以隨時移除數據集中的照片,但事情哪有那么簡單,這本就是個有來無回的“不歸路”。

因為IBM需要拍攝者發送想要移除圖片的鏈接(光靠Flickr賬號不管用),而它們卻從沒分享過到底這個數據集用了誰的Flickr照片,所以你大概率會被蒙在鼓里。

對于這個數據集,IBM有自己冠冕堂皇的理由——它將用于學術工作,且擔負著讓面部識別變得更加公平的重任。

當然,在網絡照片濫用方面,IBM并不是獨一家,數十家其他研究機構或公司也在采集網絡照片訓練自己的面部識別系統。

一些法律專家認為,這不僅僅是對數百萬人肖像權和隱私權的侵犯,它還加重了人們對面部識別技術的擔憂,也許有一天執法部門會讓它“雙手沾滿鮮血”。

面部識別技術的進化歷程

面部識別工具剛剛誕生時,研究人員會付錢請人來試驗室“幫忙“,這些人拿錢辦事,將自己不同姿態和光照角度下的照片留了下來以供研究之用。不過,這樣的方案成本高還浪費時間,因此早期的數據集往往只有數百個樣本。

進入新世紀后,互聯網飛速發展,研究人員突然意識到,面部識別的好時光來了,因為網上有天量的照片可供使用。

人臉識別背后“骯臟的小秘密”:肆無忌憚搜集照片

“直接打開搜索引擎,輸入名人的姓名,然后下載各種360度無死角的照片既可。”美國國家標準技術局數據集采集人員P.JonathonPhillips說道。

隨著社交網絡的興盛和自媒體的發展,普通人的照片也突然多了起來。研究人員默認這些照片是對所有人開放的,有時他們甚至會從YouTube的視頻中抓取面部圖片。

由于工作的非經營性質,學術人員用起照片來絕對是近水樓臺,因為他們能繞過版權問題了,而Flickr的性質更是讓它們成了研究人員絕對的安全之選。

為了保證數據集的多樣性,IBM其實從Flickr上Down了超過1億張照片,隨后又精選了100萬張有注釋的面部照片。為了力求精確,它們甚至為這些照片定了200多種分類標準。

人臉識別背后“骯臟的小秘密”:肆無忌憚搜集照片

谷歌學術指出,這種研究方法在業內幾乎已經是盡人皆知,因為有數百篇學術論文都在靠照片采集來佐證自己的論點,沒人敢說自己是完全清白的,或者拿到了授權或同意。

因此,面部識別準確性的提高和分析工具的進步主要就是靠這些“野路子”來的照片。

IBM真沒拿面部數據集賺錢?

“要想讓面部識別系統超常發揮,訓練數據必須足夠多樣化,而且覆蓋范圍足夠廣。”IBM的John Smith說道。

在IBM看來,自己的數據集并未將圖片中的人臉和具體的名字聯系起來,這就意味著系統不會侵犯人們的隱私。不過,依然有人質疑IBM的動機,因為它們可是向政府出售過監控工具。

舉例來說,911襲擊發生后,IBM就將面部識別技術賣給了紐約警方,執法部門通過搜索監控錄像就能識別出特殊的膚色或發色。IBM還曾推出過“智能視頻分析”產品,它們能通過監控攝像頭給人們加標簽(亞裔、黑人或白人)。

如今,IBM則有了Waston視覺識別系統,通過圖片算法就能識別出人的年齡和性別。配合正確的訓練算法,客戶就能從圖片或視頻中識別出特定的人。

在被問到Waston用了什么訓練數據時,IBM稱數據有多個來源,不過卻拒絕披露具體的數據來源,并美其名曰保護知識產權。

一再逼問下,IBM稱從Flickr拿到的相片數據集僅用于研究,不會用來提升公司的商用面部識別工具。不過,有專家指出,類似IBM和Facebook這樣的公司,其研發和商業運營部門之間的界限非常模糊,而且研發部門的知識產權均歸IBM所有。

因此,面部識別公司Kairos前CEO Brian Brackeen斷言,即使學術部門研發的算法有其非商業化性質,這些算法最終還是會被拿來賺錢。

他還打了個形象的比喻,“你可以把它看做拿面部識別技術洗錢,公司將網上的照片洗成了自己的知識產權。”

“被選中”的攝影師們怎么想?

澳大利亞攝影師GeorgHolzer將自己的作品上傳Flickr是為了記錄自己聲明中的精彩瞬間,他也簽署了創意認證,只要是非營利性項目,就能免費使用他的照片。不過,他沒想到自己的照片會成為面部識別技術的“養料”。

“我了解技術能造成的傷害。”Holzer說道。“當然,面部識別技術也有其積極的一面,但如果用得不對,它也能剝奪人的基本權利和隱私。我是無法接受這項技術廣泛應用的。”

“我覺得IBM可不是家慈善公司,最終它們還是會用這項技術牟利,所以面部識別技術還是會進入商業市場。”Holzer說道。

DolanHalbrook也有452張照片被IBM的數據集“侵吞”,他也認為IBM在使用這些照片時應該征得自己的同意。

當然,也有攝影師覺得自己的照片能被IBM選中并用在推動面部識別發展上是一大幸事。

瑞士的Guillaume Boppe就表示:“如果我的照片能幫助AI進化,降低探測錯誤率并最終提升全球安全指數,我舉雙手贊同。”

想從數據集中刪圖?沒那么容易

如果你不同意IBM將自己的照片當成訓練數據,也可以聯系它們刪除,但操作起來沒那么容易。

一位被抓取1000多張照片的攝影師忙活了半天,也只刪除了4張照片,因為他無法找到所有照片的鏈接,而Flickr賬號IBM可不認。

此外,即使從IBM的數據集中刪除了照片,IBM研究伙伴拿到的數據集也無法一并刪除(已經有250多家組織和機構接入了IBM的數據集)。

顯然,IBM的數據集不是公共場所,沒法想來就來想走就走。

好在,各國對隱私數據的保護正在加強。舉例來說,歐洲就將照片看做“敏感個人數據”,如果IBM不按規定刪圖,可能就會被歐盟重罰。

在美國,也有一些州有了相關規定,在不征得當事人同意的情況下采集、存儲和分享生物信息屬違法行為,而生物信息包含指紋、虹膜和面部幾何結構等。

近期,芝加哥的律師Jay Edelson就向Facebook發起了集體訴訟,稱其面部識別工具觸犯了相關法律。

至于典型的法院判例,現在還是一片空白。(大壯旅)

 

關鍵詞: AI 照片 數據來源

精選 導讀

募資55億港元萬物云啟動招股 預計9月29日登陸港交所主板

萬科9月19日早間公告,萬物云當日啟動招股,預計發行價介乎每股47 1港元至52 7港元,預計9月29日登陸港交所主板。按發行1 167億股計算,萬

發布時間: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情況曝光 隱形重倉股多為高端制造業

隨著半年報披露收官,公募基金二季度持股情況曝光。截至今年二季度末,公募基金全市場基金總數為9794只,資產凈值為269454 75億元,同比上

發布時間: 2022-09-02 10:45
資訊   2022-09-02

又有上市公司宣布變賣房產 上市公司粉飾財報動作不斷

再有上市公司宣布變賣房產。四川長虹25日稱,擬以1 66億元的轉讓底價掛牌出售31套房產。今年以來,A股公司出售房產不斷。根據記者不完全統

發布時間: 2022-08-26 09:44
資訊   2022-08-26

16天12連板大港股份回復深交所關注函 股份繼續沖高

回復交易所關注函后,大港股份繼續沖高。8月11日大港股份高開,隨后震蕩走高,接近收盤時觸及漲停,報20 2元 股。值得一提的是,在7月21日

發布時間: 2022-08-12 09:56
資訊   2022-08-12

萬家基金再添第二大股東 中泰證券擬受讓11%基金股權

7月13日,中泰證券發布公告,擬受讓齊河眾鑫投資有限公司(以下簡稱齊河眾鑫)所持有的萬家基金11%的股權,交易雙方共同確定本次交易的標的資

發布時間: 2022-07-14 09:39
管理   2022-07-14

央行連續7日每天30億元逆回購 對債市影響如何?

央行12日再次開展了30億元逆回購操作,中標利率2 10%。這已是央行連續7日每天僅進行30億元的逆回購縮量投放,創下去年1月以來的最低操作規

發布時間: 2022-07-13 09:38
資訊   2022-07-13

美元指數創近20年新高 黃金期貨創出逾9個月新低

由于對美聯儲激進加息的擔憂,美元指數11日大漲近1%創出近20年新高。受此影響,歐美股市、大宗商品均走弱,而黃金期貨創出逾9個月新低。美

發布時間: 2022-07-13 09:36
資訊   2022-07-13

美股三大股指全線下跌 納斯達克跌幅創下記錄以來最大跌幅

今年上半年,美股持續回落。數據顯示,道瓊斯指數上半年下跌15 3%,納斯達克綜合指數下跌29 5%,標普500指數下跌20 6%。其中,納斯達克連續

發布時間: 2022-07-04 09:51
推薦   2022-07-04

融資客熱情回升 兩市融資余額月內增加超344億元

近期A股走強,滬指6月以來上漲4%,融資客熱情明顯回升。數據顯示,截至6月16日,兩市融資余額1 479萬億元,月內增加344 67億元,最近一個半

發布時間: 2022-06-20 09:41
資訊   2022-06-20

4個交易日凈買入超百億元 北向資金持續流入A股市場

北向資金凈流入態勢延續。繼6月15日凈買入133 59億元后,北向資金6月16日凈買入44 52億元。自5月27日至今,除6月13日以外,北向資金累計凈

發布時間: 2022-06-17 09:37
推薦   2022-06-17