騰訊全球新總部于 11 月 28 日正式啟用。這棟位于深圳濱海大廈的新大樓,在門禁上采用了騰訊優圖的人臉識別技術。到目前為止,試運行的
騰訊全球新總部于 11 月 28 日正式啟用。這棟位于深圳濱海大廈的新大樓,在門禁上采用了騰訊優圖的人臉識別技術。到目前為止,試運行的反饋算得上「非常良好」。
也就是說,騰訊上萬名員工出入這棟大樓,都要通過騰訊優圖在極短時間內的「檢視」;而反過來,騰訊優圖的產品每天也在接受著全體員工的把關:在五萬人規模的人臉識別檢測系統中,騰訊優圖將錯誤率降到了千分之一以下。這一系統一方面要保證安全,即不在名單簿的人都無法順利通過;另一方面則要保證應用,所有在名單庫里的人都能夠非常方便、不作任何停留地進出大樓。
騰訊優圖實驗室總監黃飛躍博士在與雷鋒網 AI 科技評論交流的過程中兩次提及了這一成果,不難感覺到,他對這一「作品」還是頗為滿意的。在黃飛躍的理解中,這是「業界真正首家大規模的人臉識別應用」。
而騰訊新總部的人臉識別技術只是騰訊優圖 2017 年的成就之一。回看騰訊優圖的 2017,在黃飛躍的理解里,騰訊優圖年初所定下的三個目標都已經順利開展并且得到實現。他告訴雷鋒網(公眾號:雷鋒網)AI 科技評論,如果滿分是 100 分的話,2017 年「也許可以給優圖打到 80 分」。
而他說出這一段話的背景,則是騰訊優圖已經憑借人臉識別技術及相關應用,拿下了 2017 騰訊重大業務突破獎。這種謙遜而務實的風格或許也影響著這個實驗室研究規劃的節奏。「大多數時候,團隊所定的年初目標都是比較『接地氣』的,因此在我看來,不管是 2017 年還是其它時候,我們給自己定的絕大多數目標,最終都能夠比較好地按照預期來實現。」黃飛躍如是告訴 AI 科技評論。
乘風破浪
不論大環境如何變化,算法研究始終是騰訊優圖的根基。黃飛躍也深知「時勢造英雄」的作用,得益于 AI 在業界受到越來越高的關注,騰訊優圖從 2012 年創立至今,逐步地通過自身的積累獲得了公司內外的技術需求及認可。
專注計算機視覺,希望研究領域處于業界領先水平。
而這也是優圖在 2017 年伊始為自己定的第一個小目標:「乘風破浪」,這是黃飛躍對騰訊優圖 2017 的第一個概括。
在人臉識別領域,2017 年 3 月,騰訊優圖憑借 99.80% 的識別準確率,刷新了團隊在 LFW 人臉數據集的準確率紀錄,并在一個月后,又以 83.290% 的成績登上 MegaFace 在 100 萬級別人臉識別測試的冠軍寶座。
而以 87.76% 的成績刷新 CV 算法評測平臺 KITTI 數據集里車輛追蹤準確率的紀錄,則是騰訊優圖從 2016 年開始著手關注智能交通領域而取得的重要成果。據優圖團隊的介紹,一方面他們以多尺度深度學習模型直接完成端到端訓練檢測目標和追蹤軌跡的關聯矩陣,強化多檢測目標和多追蹤軌跡之間的相關性。另一方面,優圖提出基于視覺關聯矩陣和運動關聯矩陣融合決策的多目標追蹤方案,能夠在復雜場景下完成車輛追蹤任務。
只要是從事計算機視覺相關的企業,多多少少都會嘗試在不同的數據集上「刷新紀錄」,這也普遍被視為企業宣傳自身技術實力的一種方式。雖然算法在數據集上的表現并不能夠直接與應用能力的強弱劃上等號,但不可否認的是,在數據集上取得優秀成績的算法在實際應用上的效果往往也呈正相關。
對于騰訊優圖而言,黃飛躍更愿意把在數據集上的取得的成績當作是一種結果而非目的。「我們在 2016 年開始著手做智能交通相關的準備和研發,在這個過程中,我們也會根據自己的技術水平去參加相關的數據集比賽,但這并不意味著我們需要一個專門的團隊進行『刷榜』。」
而回歸人臉識別,騰訊優圖也在 1:1 人臉驗證與活體檢測技術上取得了突破。騰訊優圖通過「唇語+人臉場景分析」的解決方案,從閱讀隨機詞語排除照片與錄制視頻的可能性,并從合成視頻與邊框、像素紋理等蛛絲馬跡甄別不必要的安全攻擊。比如在微眾銀行上正式應用的極光守衛,正是活體檢測技術的進一步升級。系統通過屏幕發射不同顏色和強度的光線,借助攝像頭接收反射到人臉的信號,通過卷積神經網絡的算法處理,分析活體判斷所需的人臉 3D 與質感信息。利用這一技術,用戶可以在遠程開戶、修改密碼等多種業務下瞬間完成刷臉驗證。
憑借著在計算機視覺的積累,騰訊優圖在全球頂級會議 ICCV 2017 上有 12 篇錄用論文,其中有 3 篇被錄用為口頭報告,占總投稿數的 2.1%,黃飛躍博士也用了「水到渠成」這樣的詞來形容今年學術會議的的豐收。
值得一提的是,據雷鋒網 AI 科技評論的了解,目前企業對待學術論文的態度呈現兩級分化的傾向:部分企業以產品落地和變現為主要目的,對學術會議及相關論文投遞并不關注;而也有企業非常歡迎論文的發表,認為這能從側面為企業的學術水平增添含金量。
黃飛躍表示,在他看來,大部分企業還是歡迎論文的,而這也和公司當下所處的階段不無關系,「如果能發表一些論文提升團隊的影響力,在自我價值的體現與實現上誠然會起到一定的作用,但它并不是唯一和必須的途徑。」以 ICCV 2017 為例,騰訊優圖會鼓勵研究員在學術會議上發表論文,但并不會做強制性的約束。
而在 ICCV 2017 其中一篇口頭報告論文《Makeup-Go: Blind Reversion of Portrait Edit》中,團隊提出了一個名為「成分回歸網絡(component regression network)」的深度網絡結構,對全局美化操作進行盲復原。這篇「一鍵卸妝」的論文也在當時引發了眾多關注及期待。
那么這又帶來了一個新的問題:眾所周知,企業研究院的算法研究與落地應用往往緊密相連,甚至達到了一種微妙的共生關系:技術積淀多半會嘗試向落地應用轉化,而產品在 AI 浪潮下的「智能」需求也可能推動著算法研發的步伐。
如果騰訊優圖的研究成果并不一定會直接轉化為產品應用,那么作為一個企業實驗室,它在研究內容的選擇上能擁有多大的自由度,又是如何協調算法研究與產品落地之間的關系的?
厚積薄發
優圖的圖片壓縮與人臉識別是 2012 年起家時最核心的兩項技術。前者最早可追溯到 2011 年下半年,鑒于當時騰訊內部的眾多業務都有圖像存儲與傳輸的需求,優圖團隊開始研究如何對圖片做二次壓縮實現有效存儲,間接減少存儲需求,以實現節約帶寬與成本的目的。這一項目在作為黃飛躍看來屬于「相對比較短期的研究」,用于解決企業當下的實際需求。
而人臉識別這一技術在 2012 年的大環境下則并未成為熱門,相關的研究與落地還存在很長的一段距離。但盡管如此,騰訊優圖一方面在持續研發壓縮技術的同時,在 2012 年下半年還是將研究重心轉移到了人臉識別檢測方向,并開始進行相關的技術研發與儲備。「囿于環境的限制,優圖當時把人臉識別當作一個中長期的項目在布局,畢竟當時大家未必也看得清(未來的走向)。」
而隨著團隊調整到 SNG 麾下,優圖也慢慢地從原本的純技術研發出發,開始更多地關注和從事與產品業務相關的內容。技術人員會結合自己的能力尋找產品應用的落腳點,或是關注一些新技術的創新探索,并在其中找尋價值實現的空間。而反過來,產品人員在業務落地之時會遇到一些實際問題,提出技術人員可能原本沒有考慮過的需求,
「這可能可以歸因于兩個方面,一是團隊的每一個人都相信,自己所做的研究終究會產生價值,因此愿意潛心去做一些中長期的研究;另一個方面是企業給予了比較大的寬容度,給予團隊一定的選擇權。這兩者是相互推動和促進的,不會做直接的管控。」
提供大量行業解決方案并推動研究成果落地。
在 2017 年,優圖定下的第二個小目標便在于此:有了完備的算法做為基礎,騰訊優圖在政務、公益、醫療、廣告及旅游等多個場景打造了成功的行業方案。
不論是公司內部的業務,或是外部政企的合作,騰訊優圖在 2017 年也收獲了非常多的成功案例。據 AI 科技評論不完全統計,僅在今年,優圖在微信服務號上的公開合作案例就超過 30 個。
2017 年 7 月被李克強總理點贊的「微信辦證」服務就借助了騰訊優圖的 FaceIn 人臉核身技術,進行遠程核驗就可完成原本繁瑣的政務流程。此外,用戶在企業微信上傳營業執照時,優圖所提供支持的 OCR 識別技術便能對公司名稱等相關字段進行自動識別,進一步省卻了用戶輸入及系統審核的時間。除了在陜西省工商進行合作外,依托優圖的實名核身,深圳人社也與騰訊互聯網+合作事業部合作推出了「刷臉」完成養老金領取資格認證的功能,旨在「讓群眾不跑腿就能辦事」。
而騰訊優圖的觸角也正在更多地向零售、旅游及廣告等更多領域進軍。
通過與騰訊社交廣告、微信支付及綾致時裝達成合作,騰訊優圖首次在全國推出人臉智慧時尚店,用戶只需要在智慧試衣間屏幕前「刷臉」,就能成為商家會員,并開啟微信免密支付。在結賬之時,只需要在人臉識別收銀臺直接「刷臉」識別身份即可完成付款流程。
與此同時,借助人臉識別的技術優勢,騰訊優圖在今年協助龍門石窟、武漢等多個地方落地了「刷臉入園」的系統,讓便民利民的應用進一步造福群眾。
去年 9 月,國家工商總局也接入了騰訊優圖的廣告圖像識別技術,能對互聯網廣告中的違法廣告及相關人物、事件進行監管,這也成為人工智能技術在廣告監管中的首次應用。
可以說,2017 年是團隊在算法沉淀后在應用領域百花齊放的一個重要階段,黃飛躍也在采訪中用「厚積薄發」形容了優圖剛剛過去的這一年。
任重道遠
黃飛躍曾經在雷鋒網的采訪中提及優圖實驗室在發展過程中擁有較高的「自主性和自由度」,這一點 AI 科技評論也再次得到了他的確認。騰訊優圖的工作方向、研究內容的選擇并不直接與產業化落地相連,也沒有卡得非常嚴苛的 deadline. 在黃飛躍看來,這些選擇有兩個重要的標準和考量。
第一個是算法,這也與優圖 2017 所立下的第一個目標相呼應:技術的好壞是一個比較科學與客觀的評判體系,相對也容易判斷。
讓優圖的 AI 技術更具社會價值。
而另一個標準就是業務。首先從質和量兩個維度,優圖對于產品和業務做了多少有價值、有影響力的案例?其次,又有多少項目能夠順利落地?有了學術基礎與落地應用,騰訊優圖的第三個目標便變得更加自然而順暢:
作為一個專注計算機視覺的研究部門,騰訊優圖希望能夠通過 AI 領域的技術優勢,為社會帶來積極且有益的貢獻。不論是通過醫學影像技術幫助醫生診療篩查,及時挽救病人生命;或是采用人臉尋親協助公安部門找回走失人員,讓失散的親人重聚團圓;又或是通過開放平臺和開源項目惠及開發者,實現更多的技術輸出,都是騰訊優圖社會價值的體現。
騰訊優圖在醫療領域取得的突破和進步是 2017 年濃墨重彩的一筆,賈佳亞博士在 TSAIC 上也多次提及了騰訊優圖未來對醫療應用的投入。騰訊所推出的首個 AI 醫學影像產品「騰訊覓影」,其中一大核心技術支持方正是騰訊優圖。這一產品在肺癌和糖網早篩領域取得了顯著的效果,并已經分別與廣東省人民醫院肺癌研究所、西安市第四醫院和南山醫院等多家大型醫院落地應用。
在 11 月 15 日,科技部召開「新一代人工智能發展規劃暨重大科技項目」啟動會,明確依靠騰訊公司建設醫療影像國家人工智能開放創新平臺。騰訊優圖入選 AI「國家隊」,既是國家對其醫療影像技術的一種肯定,也反映了國家對人工智能與醫學跨界融合的信心。而隨著醫療 AI 科學家鄭冶楓博士于近期加入騰訊優圖,相信我們將會看到騰訊優圖在醫療領域的更多嘗試與突破。
而通過與蘇州、福建、上海等地的公安部門進行合作,騰訊優圖在社會價值所做的貢獻也有目共睹。不論是在福建省公安廳上線「牽掛你」防走失平臺尋親,或是 QQ 全城助力增加跨年齡識別等人臉尋親應用,騰訊優圖的技術都在發揮著實際作用,讓走失的親人在闊別多年后仍能重新團聚。據福建省公安廳提供的數據,從去年 3 月至 11 月,「牽掛你」防走失平臺已經幫助尋回 545 名走失人員。
而作為一個更加開放的平臺,除了面向開發者提供更多的接入渠道外,騰訊優圖也在開源項目上邁出了堅實的一步。針對移動端深度學習,騰訊優圖在 2017 年 7 月發布了首個深度學習開源項目 ncnn,這個神經網絡前向計算框架能方便開發者將深度學習算法移植到手機端,開發人工智能的相關 App。據介紹,目前 ncnn 已在騰訊多款應用中使用,如 QQ、Qzone、微信及天天 P 圖等。
騰訊優圖給自己的定位是「專注于人工智能、計算機視覺的技術研發與探索落地」,并且致力于「幫助」與「賦能」兩個層面。一方面,騰訊優圖給內部業務團隊提供 AI 的技術與能力;另一方面,它也幫助其它企業的更多業務對外輸出優圖的 AI 技術能力。
2018 年,黃飛躍對騰訊優圖在商業化的發展也有了新的期待。「從算法研發和技術布局的角度上看,我們的發展基本上都是可以符合預期的,也基本上能夠做到對社會有一定的推動力。當然,也有一些事情難以做到盡善盡美,如商業化拓展的能力、整個業界影響力的提升以及市場布局上,仍然需要大量的投入。」
黃飛躍用「任重道遠」這個成語作為優圖 2017 年的第三個關鍵詞,在過去一年,騰訊優圖在學術會議嶄露頭角、在世界級比賽中刷新成績,讓更多的學者關注優圖所取得的算法進展;而在落地合作上,騰訊優圖也嘗試涉足更多的應用領域,為更多的企業提供賦能的能力與可能性。在未來,騰訊優圖希望深化技術研究,并進一步推動業務的落地,讓優圖的 2018,走得更加穩健與扎實。