《深圳特区报》头版:点亮“智能眼”的创新领跑者
人因为眼睛而拥有视觉,经过长达亿万年时间的进化,人眼对光源、物体和环境的感知和判断的优势,一直让计算机无法达到人眼的“视力”。2014年,由中国科学院深圳先进技术研究院副院长、香港中文大学教授汤晓鸥实验室发表人脸识别算法,准确率达98.52%,让机器的“智能眼”首次突破人眼的人脸识别能力。
在20余年的研究和工作经历中,“喜欢走不一样的路”的汤晓鸥在计算机视觉及人工智能领域始终坚持原始创新、基础研究,坚守家国情怀的他凭借原创、领先的科研能力,取得计算机视觉领域一系列卓越的技术成就和顶级奖项,和中国科研工作者一起让中国在该领域跻身世界领先行列。
机器“智能眼”超越人眼
一个十字路口,所有经过的汽车和单车的颜色、型号、车牌,路人的性别、年龄、衣服颜色、背包与否等属性都被监控系统记录下来,直接输入关键词搜索就可找到相关监控录像……这一场景并非出自科幻电影,而是视觉识别技术在安防中的实际应用。
“怎样用‘眼睛’识别出环境与物体,对机器来说,这是非常困难的事。”汤晓鸥说,人工智能最早诞生于1956年,随后人工智能发展的几起几落,并没有真正发掘出有影响力的、对人类社会生活有益的功能。直到2011年,计算机“大脑”算法的突破,也就是深度学习,让人工智能出现拐点。
汤晓鸥带领的研究团队是最早进行深度学习技术研发的华人团队之一。
“深度学习,简单来说,是一项模拟人脑结构的机器学习算法。”汤晓鸥说,在大量数据通过互联网得到积累、计算机并行计算能力获得突破后,深度学习随之获得突破。如果将人工智能比作一艘“火箭”,深度学习就是动力强劲的“引擎”,而大数据就是它的“燃料”。
随着“火箭”喷薄而起,汤晓鸥团队在计算机视觉领域做出了大量深度学习的技术突破,2012年国际计算视觉与模式识别会议(CVPR)上仅有的两篇深度学习文章均出自他们实验室,2013年国际计算机视觉大会(ICCV)上全球学者共发表8篇有关深度学习的文章,其中6篇出自汤晓鸥实验室。
2014年3月,汤晓鸥团队发表GaussianFace人脸识别算法,在LFW数据库上准确率达98.52%,首次突破人眼识别能力(97.53%),超过Facebook同时间发布的DeepFace算法(97.35%)。GaussianFace被评为人工智能领域影响因子最高的国际会议AAAI 2015的最佳学生论文。
同年6月,汤晓鸥团队发表DeepID2算法,人脸识别准确率提升至99.15%,DeepID3算法人脸识别准确率提升至99.55%。DeepID代表人脸识别技术的真正成熟,开启了整个人脸识别行业技术落地。
人工智能与金融、健康、教育、医疗、娱乐、汽车、机器人、无人机等各行业的结合,都将极大提升生产效率。
原始创新的马拉松跑者
去年,NVIDIA评选出了人工智能的十大先锋实验室,汤晓鸥的实验室位列其中,也是亚洲区唯一入选的实验室。同时入选的包括麻省理工学院、斯坦福、伯克利、卡内基梅隆计算机科学四大名校,以及Facebook、谷歌等深度学习负责人带领的实验室。
得到国际上的认可和无数赞誉并非偶然。
人工智能近年来“火山爆发”,目前已上升到国家战略。“我喜欢走不一样的路,想做核心、原创的研发工作。”汤晓鸥说,国内一些硬件行业利润不高,在于核心技术的缺失。作为一个做科研的知识分子,享受精英教育和最好的资源,“有责任去做对国家和社会有意义的事情”。人工智能时代是个新的机会,中国在起步和研发方面没有落后,这令他感到满意。
“人工智能还有很长的路要走,目前深度学习所能做到的是在一些单项的由人定义的任务上开始超过人的能力。还需要我们做很多工作,与传统产业结合,才能真正发挥效力。”汤晓鸥说,“深度学习的研究才刚刚起步,将会是一场学术研究,产业创新的马拉松。我们没有近道可抄,必须做好原创技术研发。”
《深圳特区报》2017年4月25日头版 http://sztqb.sznews.com/html/2017-04/25/content_3776846.htm