中興車(chē)聯(lián)網(wǎng)模擬新科技吸引眼球。深圳特區(qū)報(bào)記者 邱海彬 攝
互聯(lián)網(wǎng)產(chǎn)業(yè)之后的又一個(gè)新興熱點(diǎn),深不可測(cè)的市場(chǎng)潛能,萬(wàn)億產(chǎn)值爆發(fā)前夜……關(guān)于人工智能,無(wú)論科技界還是產(chǎn)業(yè)界,都拿出了最具想像力的詞匯與最美好的期待,盡情繪制那未知的藍(lán)圖。作為中國(guó)高新技術(shù)產(chǎn)業(yè)重鎮(zhèn),深圳又一次走在了一個(gè)新興產(chǎn)業(yè)的發(fā)展最前沿。在剛剛起飛的人工智能產(chǎn)業(yè),深圳究竟處于雁陣的什么位置?產(chǎn)業(yè)布局如何?發(fā)展后勁如何?它是否會(huì)成為深圳高科技產(chǎn)業(yè)未來(lái)十年的又一新興推動(dòng)力?本報(bào)今日起推出“聚焦深圳人工智能產(chǎn)業(yè)”系列報(bào)道,希望通過(guò)大量一線采訪,從多個(gè)角度、多個(gè)側(cè)面為深圳人工智能產(chǎn)業(yè)勾勒一個(gè)三維立體圖像。
基礎(chǔ)科研與世界同步
人工智能領(lǐng)域有兩項(xiàng)標(biāo)志性事件:1996年,超級(jí)電腦“深藍(lán)”首次挑戰(zhàn)國(guó)際象棋冠軍卡斯帕羅夫,以失利而告終;2016年,人工智能程序“阿爾法狗”擊敗圍棋冠軍李世石,并隨之在人類(lèi)頂尖職業(yè)棋手中所向披靡。
20年間,一負(fù)一勝,中間橫亙的是人工智能領(lǐng)域近年來(lái)最重要的技術(shù)突破:深度學(xué)習(xí)。
與以往數(shù)次新技術(shù)浪潮不同的是,這一次,中國(guó)科技工作者全程圍觀、同時(shí)深度參與其中,在人工智能定制芯片、算法等基礎(chǔ)領(lǐng)域均有開(kāi)創(chuàng)性貢獻(xiàn)。
更令人驚訝的是,面對(duì)人工智能浪潮的興起,科學(xué)家們直接出手啦!
湯曉歐,麻省理工學(xué)院博士、香港中文大學(xué)信息工程系系主任,全球人臉識(shí)別技術(shù)的開(kāi)拓者與探路者。2014年,湯曉歐團(tuán)隊(duì)發(fā)布的研究成果顯示,其原創(chuàng)的人臉識(shí)別算法,準(zhǔn)確率達(dá)到98.52%,首次超越人眼識(shí)別能力。2016年,他所率領(lǐng)的人工智能團(tuán)隊(duì),與麻省理工、斯坦福大學(xué)等人工智能領(lǐng)域最前沿的研究團(tuán)隊(duì)一起,入選世界十大人工智能先鋒實(shí)驗(yàn)室,成為亞洲唯一入選的實(shí)驗(yàn)室。同時(shí),他所創(chuàng)立的人工智能企業(yè)商湯科技,也始終位于人工智能產(chǎn)業(yè)的第一集團(tuán)軍。
在湯曉歐教授的名片上,記者看到一個(gè)熟悉的“深圳元素”——他同時(shí)兼任著中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院副院長(zhǎng)。這意味著,湯曉歐團(tuán)隊(duì)已經(jīng)在深圳布下了一個(gè)積極推進(jìn)人工智能基礎(chǔ)研究的“尖刀連”。
中科院深圳先進(jìn)院集成所副所長(zhǎng)、多媒體集成技術(shù)研究中心主任喬宇,正是這支“尖刀連”的領(lǐng)隊(duì)者。從日本東京大學(xué)學(xué)成歸國(guó)的喬宇,在接受記者采訪時(shí),舉手投足之間仍是學(xué)者的謙和與嚴(yán)謹(jǐn)。
他告訴記者,在人工智能底層研究的“算法”領(lǐng)域,他們這支“尖刀連”率先提出“軌跡卷積特征TDD”,在一些視頻數(shù)據(jù)集取得領(lǐng)先的識(shí)別率,領(lǐng)先國(guó)際頂尖的牛津、谷歌、斯坦福、臉譜等課題組當(dāng)時(shí)的結(jié)果;他們開(kāi)發(fā)的“運(yùn)動(dòng)向量卷積神經(jīng)網(wǎng)絡(luò)”將處理速度提升40倍。該團(tuán)隊(duì)在CVPR、ICCV、IJCV等國(guó)際頂級(jí)視覺(jué)會(huì)議和期刊上發(fā)表20多篇論文,是全世界在行為識(shí)別領(lǐng)域發(fā)表頂級(jí)論文最多的團(tuán)隊(duì)之一。
躋身世界最前沿研究團(tuán)隊(duì)之列,保持與國(guó)際一流科研團(tuán)隊(duì)交替領(lǐng)先的局面,這是深圳的新高度,也是中國(guó)的新高度。
這樣的技術(shù)領(lǐng)先性,不僅存在于專(zhuān)業(yè)的科研機(jī)構(gòu),同樣出現(xiàn)在了新興的科技創(chuàng)新性企業(yè)中。
在一家成立僅兩年的高科技企業(yè)——鯤云科技,記者見(jiàn)到了世界首款針對(duì)定制芯片的高層編譯軟件HANDEL-C的創(chuàng)始人、英國(guó)工程院院士、帝國(guó)理工大學(xué)教授陸永青。作為率先將定制計(jì)算機(jī)應(yīng)用到金融、AI領(lǐng)域的華人科學(xué)家,陸永青教授與他的學(xué)生牛昕宇聯(lián)合創(chuàng)建了鯤云科技,并將之落地深圳。
這意味著深圳擁有了一家人工智能芯片和解決方案提供商,其核心科研團(tuán)隊(duì)落胎自世界人工智能最前沿團(tuán)隊(duì)之一的帝國(guó)理工大學(xué),將致力于打造數(shù)據(jù)流芯片定制人工智能處理器和端到端自動(dòng)編譯開(kāi)發(fā)平臺(tái)。
應(yīng)用需求催生源頭技術(shù)創(chuàng)新
在記者采訪的過(guò)程中,不少人表達(dá)了這樣的驚訝:人工智能技術(shù)為什么能一夜之間在深圳遍地開(kāi)花,短短數(shù)年間便形成了百舸爭(zhēng)流的繁榮景象?
記者也很快從采訪對(duì)象口中獲得了一個(gè)共同的答案:豐富的應(yīng)用場(chǎng)景是深圳吸引廣大人工智能產(chǎn)業(yè)創(chuàng)業(yè)者的重要原因,來(lái)自應(yīng)用端的需求,同樣積極推動(dòng)著人工智能底層基礎(chǔ)技術(shù)的快速研發(fā)。
在生物醫(yī)學(xué)成像領(lǐng)域,記者從互為戰(zhàn)略合作伙伴的兩家機(jī)構(gòu)身上,看到了基礎(chǔ)研究與落地應(yīng)用相互促進(jìn)、相互依存的生動(dòng)例證。
中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院醫(yī)工所醫(yī)學(xué)人工智能研究中心主任兼勞特伯生物醫(yī)學(xué)成像研究中心副主任梁棟,用盡量通俗的語(yǔ)言向記者解釋他們正在進(jìn)行的研究:一是提高磁共振成像的速度,通過(guò)減少偽影從而提高圖像的質(zhì)量,促進(jìn)磁共振的廣泛臨床應(yīng)用;二是將人工智能技術(shù)引入醫(yī)學(xué)影像鏈條的前端,實(shí)現(xiàn)智能化掃描和成像,從而提供高質(zhì)量的圖像幫助醫(yī)生進(jìn)行分析和識(shí)別。后者便是當(dāng)前人工智能技術(shù)在醫(yī)學(xué)影像領(lǐng)域的一個(gè)重要應(yīng)用。
該研究中心不僅在關(guān)鍵技術(shù)上已經(jīng)申請(qǐng)了相關(guān)專(zhuān)利,而且正與國(guó)內(nèi)影像設(shè)備生產(chǎn)廠商進(jìn)行著密切的開(kāi)發(fā)合作,希望能盡快將這項(xiàng)技術(shù)應(yīng)用到醫(yī)學(xué)成像實(shí)踐中。
“作為中國(guó)最先進(jìn)的影像設(shè)備生產(chǎn)商,上海聯(lián)影是在先進(jìn)院最初參與孵化的高科技企業(yè),與我們研究中心已經(jīng)開(kāi)展了長(zhǎng)期深入的合作。在基于人工智能的醫(yī)學(xué)成像領(lǐng)域,我們已與世界同類(lèi)科研機(jī)構(gòu)處在并駕齊驅(qū)的位置上。世界一流的人工智能技術(shù)必將幫助上海聯(lián)影從GE、西門(mén)子、飛利浦這些老牌跨國(guó)巨頭長(zhǎng)期壟斷的專(zhuān)業(yè)市場(chǎng)中分一杯羹。”在梁棟的語(yǔ)氣里,趕超世界先進(jìn)技術(shù)的迫切之情已不加掩飾。
在高科技企業(yè)云集的南山區(qū),記者見(jiàn)到了一家積極面向產(chǎn)業(yè)應(yīng)用、同時(shí)又擁有相關(guān)領(lǐng)域完整核心技術(shù)的研發(fā)機(jī)構(gòu):深港產(chǎn)學(xué)研基地旗下的深圳語(yǔ)音搜索及應(yīng)用工程實(shí)驗(yàn)室。
實(shí)驗(yàn)室主任王昕告訴記者,該實(shí)驗(yàn)室在語(yǔ)音識(shí)別與搜索領(lǐng)域擁有完整核心技術(shù),采用深度學(xué)習(xí)算法,充分利用大數(shù)據(jù)資源,承擔(dān)了一批國(guó)家省市重大和重點(diǎn)項(xiàng)目,研發(fā)水平在華南地區(qū)首屈一指,進(jìn)入全國(guó)第一方陣。其語(yǔ)音識(shí)別準(zhǔn)確率達(dá)到94-95%,語(yǔ)音搜索實(shí)時(shí)高效,處于國(guó)內(nèi)領(lǐng)先水平。
先進(jìn)的基礎(chǔ)研究能力,使實(shí)驗(yàn)室在深圳豐富的應(yīng)用場(chǎng)景中如魚(yú)得水。王昕介紹說(shuō):“我們與智能硬件和移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)開(kāi)展了深度研發(fā)合作,形成了完整的核心技術(shù)產(chǎn)業(yè)轉(zhuǎn)移應(yīng)用。例如在智能會(huì)議系統(tǒng)方面,該項(xiàng)技術(shù)是云和端、軟件與硬件、產(chǎn)品與服務(wù)、語(yǔ)音與圖像文本等領(lǐng)域深度結(jié)合,對(duì)技術(shù)和產(chǎn)品及服務(wù)應(yīng)用有很高的要求。我們?cè)谠擃I(lǐng)域與政府、機(jī)構(gòu)和企業(yè)保持長(zhǎng)期深度合作?!?/p>
在人工智能的另一個(gè)重要領(lǐng)域——計(jì)算機(jī)視覺(jué)方面,北京大學(xué)信息工程學(xué)院、孔雀團(tuán)隊(duì)“圖像與視頻處理技術(shù)”核心成員、市智能多媒體與虛擬現(xiàn)實(shí)重點(diǎn)實(shí)驗(yàn)室主任王文敏教授團(tuán)隊(duì),在視頻生成領(lǐng)域的研究已取得重要進(jìn)展。
計(jì)算機(jī)圖像處理分為圖像識(shí)別、圖像理解和圖像生成三個(gè)階段;視頻也分為三個(gè)階段,即視頻分析、視頻理解和視頻生成。如何讓計(jì)算機(jī)去理解圖像,甚至根據(jù)文字描述生成一張新的圖像;如何通過(guò)一幅或若干幅圖像,預(yù)測(cè)生成一段新的視頻……這些都是他們正在研究的人工智能黑科技。
王文敏告訴記者,視頻生成技術(shù)的應(yīng)用場(chǎng)景非常廣泛,比如無(wú)人駕駛技術(shù)就可以通過(guò)視頻生成進(jìn)行突發(fā)事件的預(yù)測(cè),從而及時(shí)避險(xiǎn)。