中大研究︰改變世界

他聯同頂尖門生密切關注AI的新發展。 「研究相當密集,意味着很多人同時研究 同一個課題。以往需時50年的課題,現 在可以在半年內解決——然後我的博士就 要另覓新課題。」 目前他門下的博士生多達40人,他們從 教授多年的研究資歷中獲益,有助於看清 科研發展的藍圖,得悉哪些課題是最重要 的,譬如如何結合包括自然語言、圖像、 錄像和聲音在內的多模態信息。 深度視覺實驗室是他設立的非正式學術團 體,旨在匯聚香港以至海外等頂尖大學的 計算機工程友好,共同探究關鍵論文和研 究領域的最新進展,找出未來五到十年最 需要解決的課題。 轉化字為圖像 他現正解決其中一個最棘手的問題:如 何完美銜接計算機視覺和自然語言處理 (NLP)實現多模態複雜推理。「語言和 視覺內容處理屬於不同的研究領域,但它 們正在融合,因為計算機視覺研究人員正 在尋找NLP模型來處理視覺數據,也曾有 一段時間,NLP 研究人員使用計算機視覺 解決方案。」 若然取得成果,用戶有望通過與電腦自然 交談來學習一切感知信號並完成超越人類 能力的推理工作,而不是輸入比較簡單的 關鍵字來連接語言和圖像,這當然知易行 難。「完整解讀視覺和語言編碼信息的方 式截然不同,完美銜接兩者無疑是我當前 最重要的任務之一。」 深度視覺實驗室 13

RkJQdWJsaXNoZXIy NDE2NjYz