中大研究︰改变世界

他联同顶尖门生密切关注AI的新发展。 「研究相当密集,意味着很多人同时研究 同一个课题。以往需时50年的课题,现 在可以在半年内解决——然后我的博士就 要另觅新课题。」 目前他门下的博士生多达40人,他们从 教授多年的研究资历中获益,有助于看清 科研发展的蓝图,得悉哪些课题是最重要 的,譬如如何结合包括自然语言、图像、 录像和声音在内的多模态信息。 深度视觉实验室是他设立的非正式学术团 体,旨在汇聚香港以至海外等顶尖大学的 计算机工程友好,共同探究关键论文和研 究领域的最新进展,找出未来五到十年最 需要解决的课题。 转化字为图像 他现正解决其中一个最棘手的问题:如 何完美衔接计算机视觉和自然语言处理 (NLP)实现多模态复杂推理。「语言和 视觉内容处理属于不同的研究领域,但它 们正在融合,因为计算机视觉研究人员正 在寻找NLP模型来处理视觉数据,也曾有 一段时间,NLP 研究人员使用计算机视觉 解决方案。」 若然取得成果,用户有望通过与计算机自 然交谈来学习一切感知信号并完成超越人 类能力的推理工作,而不是输入比较简单 的关键词来连接语言和图像,这当然知易 行难。「完整解读视觉和语言编码信息的 方式截然不同,完美衔接两者无疑是我当 前最重要的任务之一。」 深度视觉实验室 13

RkJQdWJsaXNoZXIy NDE2NjYz