引用格式:王海峰. 开源开放 促进技术创新与产业发展[J]. 科技导报, 2021, 39(2): 70-72; doi: 10.3981/j.issn.1000-7857.2021.02.017  






王海峰,百度首席技术官、深度学习技术及应用国家工程实验室主任。

开源开放 促进技术创新与产业发展

王海峰

深度学习技术及应用国家工程实验室,北京 100085

收稿日期:2020-11-08;修回日期:2020-12-18

现代社会构筑在科技发展的基础上,而科学精神的很重要一点就是开放精神。科学无国界,科学发展的过程也是全人类共享科技成果的过程。人们站在巨人的肩膀上,不断推进科学与技术的进步,进而推动人类社会的发展。这其中,开源开放是技术创新和产业发展的重要模式。

1 开源与开放

开源主要针对源代码而言,其本质上是代码共享,代码背后是所有技术人员的智慧,可以理解为群体的智慧一起进行协同创新,已经成为促进技术快速创新突破的重要模式。开放的范围要更加广泛,不止是代码,也包括数据、技术、平台等各方面的开放。

2019年,百度公司在首届世界科技与发展论坛发布了产业级深度学习开源开放平台——飞桨,全方位开源开放核心框架、模型、数据、平台、服务等。对于人工智能的发展,算法、代码、数据、模型、平台等都起到很重要的作用,而这些要素的开源开放,改变了人们的生产协作方式。以飞桨深度学习平台为例,开发者可以使用其中众多训练好的模型、数据等,非常便捷地开发业务模型、研制产品。

2 开源开放成为技术创新和产业发展的重要模式

近年来,人工智能领域越来越多的开源、开放,包括人工智能算法和基础平台等,促进了人工智能的高速发展。开源开放、技术创新和产业发展密切相关、互相促进。在三者的共同作用下,可以凝聚全球创新要素,加速技术创新,同时也打造技术生态,赋能产业发展。另一方面,很多标准在开源社区会先形成事实的标准,进而推动技术和产业的协同发展。

中国的科技工作者一直在积极参与全球的开源开放,例如APACHE、The Linux Foundation等国际著名的开源组织,都包含了很多中国开发者贡献的智慧。随着中国科技的发展壮大,中国科技工作者对全球开源的贡献必将越来越大。

3 中国开源开放快速发展

中国科技工作者在积极加入国际开源组织和国际开源社区,同时也在积极建设和发展自己的社区,例如Gitee托管的项目已超过400万,国产高质量开源软件超过12000个。新一代人工智能产业技术创新战略联盟(AITISA)组织发起成立OpenI启智社区,打造新一代人工智能开源开放平台,促进人工智能开源开放、协同创新,飞桨是其中重要一员。作为人工智能平台型公司,百度是人工智能开源开放的积极参与者和推动者,主导的开源项目超过1000个,百度超级链成为第一个捐赠进入开放原子开源基金会的大项目。

百度人工智能多年技术积累和产业实践的集大成——百度大脑,2010年开始布局,2016年起对外开源开放AI核心技术能力,2018年核心技术发展进入多模态深度语义理解阶段。2019年,全面开源开放的百度大脑软硬件协同优化,打造出软硬一体AI大生产平台,实现了AI技术的标准化、自动化和模块化。2020年,百度大脑升级为AI新型基础设施,更敏捷、更高效支撑AI工业大生产,助力产业智能化提速。

百度大脑由基础层、感知层、认知层、平台层和纵贯各层的安全组成。基础层包括算力和数据技术,以及飞桨深度学习平台;感知层包括与人的感知相关的语音、视觉、虚拟现实/增强现实(AR/VR)等技术;认知层包括自然语言处理、知识图谱等语言与知识技术。基于这些核心技术和安全保障,构建完整的人工智能开源开放平台,发展技术生态。

现代社会要提升效率,要做大规模的工业化大生产,需要技术具备标准化、自动化、模块化的特征。百度大脑就是具备这些特征的开源开放平台,使得人工智能可以规模化生产,更好地落地应用。

4 飞桨深度学习平台核心技术及开放生态

深度学习框架是人工智能开源开放平台的核心部分,向下对接芯片,向上承接应用,相当于“智能时代的操作系统”。当前人工智能技术的发展得益于很多开源软件,而开源深度学习框架在其中起到至关重要的核心作用。

开放是比开源更广的概念,比如开放训练好的模型库,有专门面向自然语言处理的模型库,面向视觉、推荐、语音等的模型库等。在此基础上,开放的平台还包括各种开发套件、工具组件、服务平台等。这样完整的全流程平台支撑大量开发者、企业合作伙伴、生态伙伴基于此开发自己的业务,创新自己的产品。

飞桨深度学习平台是中国首个技术领先、功能完备的产业级深度学习开源开放平台,拥有开发便捷的核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎和覆盖多领域的产业级模型库四大核心技术。飞桨深度学习平台的开源开放,有效降低了人工智能技术的开发与应用门槛,让开发者和企业避免重复“造轮子”,更快速、便捷地开发人工智能应用,加快产业智能化进程。

例如,基于飞桨深度学习平台打造的智能水运调度平台,成功实现了水运船舶的智能调度。这是行业首个且唯一一个基于人工智能识别船舱空满状态的智能水运调度平台。

作为开源软件和开放的生态,生态的兼容必不可少。飞桨深度学习平台全面适配英特尔、英伟达、飞腾等主流硬件,形成软硬件的大生态。

5 百度翻译开源开放

除了百度大脑和飞桨,百度翻译也是业内开源开放的典范。2010年开始布局,2011年百度翻译服务上线,2012年开放通用翻译API,截至目前支持203种语言的互译,日均翻译量超过千亿字符,服务40多万第三方企业与个人开发者。

如此巨大规模的翻译量,得益于翻译需求的持续增长和应用场景的不断增加,以及日益完善的翻译质量和服务。百度翻译促进了经济发展、文化交流与国际合作。

6 应秉持开放合作的精神实现全球互利共赢

开放、共享、协同、合作,是科学精神的体现,是人类发展的重要基石。开放科学、开源创新催生和壮大了新型技术创新的模式和体系。同时,开源开放也是推进科技创新、解决人类共同困难和挑战的重要途径和有效模式。实现人类可持续发展、共建人类命运共同体、共创美好明天,是每一个人的愿景,也需要依靠大家共同努力。

(责任编辑 刘志远)