引用格式:黄鹏, 李宏宽. 中国开源软件生态构建的风险及对策[J]. 科技导报, 2021, 39(2): 83-95; doi: 10.3981/j.issn.1000-7857.2021.02.019  
中国开源软件生态构建的风险及对策
黄鹏1,李宏宽1,2*    
1. 国家工业信息安全发展研究中心,北京 100040
2. 北京理工大学国防科技创新与教育发展战略研究中心,北京 100081
摘要 基于双层嵌入理论和知识溢出理论构建了E-TOMSDECT分析模型,对当前中国开源软件生态构建所面临的风险进行系统性剖析,并结合对全球开源软件生态构建经验的类化分析提出相关对策。分析发现,当前中国开源软件生态构建主要存在关键核心技术支撑与生态运营模式掌握薄弱、生态建设主体动力不足、在国际开源生态中主导权较弱且面临多维度安全风险、软硬件协同发展能力较弱、软件价值评估体系扭曲、生态运营专业性人才匮乏以及国际经验的利用潜能未能完全释放等风险。建议尽快聚焦新兴领域打造“三位一体”开源生态主导核心,同时加强软硬协同整体规划,构建开源软件生态的安全风险评估和应急防控机制,加大开源软件生态构建的人才培养与引进力度。
关键词开源软件生态     双层嵌入理论     知识溢出     风险分析     经验类化    

当前,数字化浪潮与新产业革命正迎来历史性交汇,软件新技术、新应用在对全球经济进行全方位、全角度、全链条的改造,数字对经济发展的放大、叠加和倍增作用不断释放。面对当前国际局势,战略博弈逐渐向科技聚焦,中国软件产业将持续面临外部断供风险,单一产品的突破与创新已难以满足当前产业发展的需求,保障中国软件产业安全及向价值链中高端迈进更需要依靠产业生态的构建与壮大。同时,随着5G、人工智能、工业互联网等新基建的大力发展,软件技术应用场景不断丰富、技术体系复杂度不断提升,全球软件产业的竞争已由单一产品的竞争转向生态系统的竞争[1]。与此同时,开源模式凭借强大的资源汇集和协同创新优势,正逐渐成为全球软件开发的重要模式,并在区块链、人工智能(AI)等新兴信息技术领域发挥着创新引领作用[2]。当前,中国在国际开源软件生态中的参与度和贡献度不断提升,但也面临在国际开源生态中话语权不够而导致的技术体系不可控的巨大风险。因此,探索构建开源软件生态体系已成为当前软件产业抓住新一轮技术变革机遇和形成持续创新动力的关键支撑,同时也是应对当前全球单边主义、孤立主义盛行对中国软件产业发展带来负面影响的重要手段。有必要对中国开源软件生态构建所面临的风险进行系统性挖掘,并对国外开源软件生态构建的成熟经验进行类化分析,提升中国软件产业开源生态体系构建效率,推动中国软件产业高质量发展。

目前,研究者已对开源软件产业生态系统发展的相关问题进行了一定研究。张得光等[3]从自然生态系统的角度,分析软件生态系统的组成成分、知识网结构,从软件项目、同类主题和整个开源社区3个级别构建软件生态系统模型,根据自然生态系统的主要特征分析软件生态系统的开放性、多样性、调控性及可持续性。金芝等[4]对开源软件的发展历史和演化轨迹进行了梳理,分析了开源软件对技术、行业和社会的影响,并对开源软件生态系统的演变趋势进行了研判。Jansen[5]对开源软件生态系统的安全评估进行研究,构建开源软件生态安全评估操作流程,并对4个开源软件生态系统进行了实证分析,为开发者、投资者、生态运营管理者等提供了决策支撑。Mizushima等[6]分析了企业主导的开源软件生态系统内部和外部结构,并基于生态内众多开发者和主导企业间的竞合关系构建协同创新模型,以最大化激发生态内各类创新主体的创新动力,维持开源生态系统的可持续发展。De等[7]、Koch等[8]分别对开源软件生态内开发者的社会网络关系、开发动机等特征及对开源软件生态系统发展的影响效应进行了研究。Kilamo等[9]针对闭源工业软件转向开源发展模式并构建开源生态进行了研究,其基于相关工业案例,分析并提出了企业以原有闭源工业软件的开放为基础构建开源生态的支持过程、指导方针和最佳方案。Liao等[10]认为开源软件生态中开源项目的生命周期不仅取决于项目自身,同时外部其他项目对其生命周期同样存在影响。基于对GitHub代码托管平台上部分项目进行统计分析发现,编程语言的选择、文件的数量、项目的标签格式以及相关的成员表达式对开源项目生命周期存在显著影响,并基于影响分析结果,构建开源项目生命周期预测模型,辅助开源软件生态构建和运营过程中的重大项目合理布局[10]

综上可见,目前针对开源软件生态的已有研究相对较为发散,且多是以单一视角针对开源生态内开发者行为、项目周期、企业发展策略等局部问题进行分析,或对开源软件生态的结构组成、发展历史、安全风险等全球通性问题进行研究,而专门针对中国开源软件生态构建问题的系统化研究仍然较为缺乏。鉴于此,在已有文献研究基础上,基于“双层嵌入理论”和“知识溢出理论”构建E-TOMS-DECT分析模型,对中国开源软件生态构建所面临的风险进行系统化剖析,并对全球开源软件生态构建成熟经验进行类化分析,在此基础上提出相关政策建议。

1 理论基础和研究模型 1.1 双层嵌入理论与知识溢出理论

嵌入理论(embeddedness theory)作为新经济社会学解释经济和社会之间关系的出发点,最早由经济史学家Polanyi提出。该理论认为,经济行动是嵌入在社会网络之中的,经济行为不仅受到行为本身经济动机的影响,同时依托于社会网络中的非经济动机也影响着经济行为的实施[11]。嵌入则是指一个事物内生于或植根于另一个事物的一种状态,是一个事物与另一个事物之间的联系以及联系的程度[12]。嵌入理论自提出以来经历了从单层嵌入关系到双层嵌入关系的演变,其中单层嵌入关系通常是指嵌入理论提出者的最初观点,而双层嵌入理论(double layer embeddedness theory)认为社会网络是经济行为和社会制度文化之间的中介,经济行为嵌入在社会网络中,社会网络又嵌入在社会制度文化之中(图 1)。即经济行为既具有自身的独立性,由行为自身所产生的经济利益所决定,同时社会网络所带来的非经济动机和社会制度文化所形成的外部规则,也会对经济行为产生直接和间接影响[13]

图 1 双层嵌入理论的一般性意义演化

嵌入理论最初仅是一种经济现象的解释理论,但嵌入理论的重大价值在于利用社会网络这一中介,建立了经济学和社会学之间跨学科研究的分析框架,而这一跨学科属性对诸多学科交叉领域的问题研究提供了更具价值性的理论指导,因此该理论逐渐由经济学领域的专有理论演变升华为适用于多学科、多领域且具有一定一般性方法论意义的支撑理论[14]。如图 1所示,具有一般性方法论意义的双层嵌入理论认为,行为自身是嵌入在组织网络中的,而组织网络又嵌入在外部环境之中,行为的实现不仅由行为自身的可行性所决定,同时组织网络所带来的合作支持与对立阻碍,以及来自于外部环境的非实体化激励和限制也会对行为产生相应的影响。近些年国内外诸多学者不断将嵌入理论应用于创新创业[15-16]、组织演化[17]、教育[18]及情报流动[19]等研究领域,其已成为诸多学科研究的重要方法论工具。

知识溢出理论(knowledge spillovers theory)最早起源于产业经济学领域,作为产业集聚的重要原因由Marshall首次提出。该理论认为,知识不同于普通商品之处在于知识具有显著的正外部性溢出效应,在一定区域的同一产业内,任何个体或组织所生产的知识不仅会提升自身的生产率,同时也会促进全产业生产率的提升,其他个体或组织均可以通过学习在一定程度上获取相关知识并提高生产率[20]。Jacobs[21]的相关研究又将知识溢出的范围扩大至互补产业之间,并提出跨区域间的流动和竞争是促进创新和增长的主要动力。随后的发展过程中,人们对知识溢出理论的应用和实践不断丰富,由产业经济学领域逐渐扩散至技术创新[22-23]、高等教育[24]、贸易[25]及环境保护[26]等诸多领域。

1.2 E-TOMSDECT分析模型

开源作为当前全球软件产业技术创新与市场推广的重要模式,构建中国开源软件生态本质上是一种经济行为,同时也具有明显的政策性和社会性特征。此外,当前开源软件生态的构建已并非完全的探索性和颠覆性行为活动,全球已积累相当体量的开源软件生态构建知识,最大限度利用相关知识的溢出效应,借助国际已有相关经验将是助推中国开源软件生态构建的关键力量。基于以上分析,如图 2所示,本研究利用“双层嵌入理论”和“知识溢出理论”系统性地构建E-TOMSDECT分析模型(experience-technology-operation-motivation-sup-port-dominant-evaluation-coordination-talent)对当前中国开源软件生态构建所面临的风险进行深入剖析。

图 2 基于“双层嵌入理论”和“需求拉动理论”构建的E-TOMSDECT分析模型

1)在行为自身的可行性层面。首先,国际较为成功的开源软件生态,无一不是依托某项具备较高原创性和较低可替代性的高价值技术体系而构建[6],拥有高价值技术体系的生态构建技术基础(technology),是一个开源软件生态能够成功构建的基础和关键。其次,开源软件生态的构建除了需要技术基础的硬性支撑外,还需要生态系统运营能力(operation)的支撑,通过对开源规则的多维度应用,从而在保持对生态系统掌控的同时,促进系统内创新的活跃性和市场边界的维持与拓展。再次,开源软件生态的构建并非市场中无序的自发性行为,需要相关个体和组织进行主导和牵引,构建主体需要持续性投入大量资源,因此生态构建主体的意愿及动力(motivation)对开源软件生态构建的成败具有关键性影响。

在组织网络所带来的合作支持与对立阻碍层面,软件产业作为高度国际化的产业,其创新链、资金链、供应链的全球化已高度成熟[10],中国开源软件生态作为全球开源软件生态的一部分,不可能独立存在,其与全球开源软件生态应是协同共存并双向交互的。因此,在开源生态的构建过程中,中国深度融入国际开源软件生态,并扮演具有一定主导性的重要角色(dominant),同时国际力量广泛参与到中国开源软件生态的构建,并提供丰富的高质量资源支持(support),均会在技术支撑、资源聚引、路径决策、方向引导等方面,对开源软件生态的构建起到巨大的促进和保障作用。

2)在外部环境的非实体化激励和限制层面。(1)软件作为信息技术之魂,本身并不直接产生动能和算力,但在以人工智能和万物互联为代表的新一轮全球科技革命和产业革命不断深入的背景下,软件不仅是硬件功能的实现中介,而且是硬件所产生动能和算力的放大器和增效器。当前,单一软件和硬件均无法完全实现设计功能,释放其全部应用潜能,软硬协同发展(coordination)是开源软件生态成功构建并保持稳定运营的决定性因素。(2)正确的价值评估体系(evaluation)是开源软件生态构建过程中引导各类资源合理分配的基础。(3)开源软件生态构建作为一项复杂的系统性工程,人才是该工程设计和推进的直接执行者,完善的人才储备和结构(talent)是生态构建的动力源泉。

3)在知识溢出层面。开源模式源生于美国,在美欧有超过50年的发展历史。当前,美欧已形成完善且成熟的开源软件生态系统,并积累了丰富的开源生态构建经验和知识[4]。而中国软件产业,由于整体发展水平远落后于欧美等发达国家,接触开源模式这种“舶来品”的时间较短,开源软件生态的构建还处于起步和模仿阶段。因此,美欧成熟的软件生态构建经验将在中国软件生态构建过程中扮演重要角色,对相关经验的合理利用(experience)将对中国软件生态构建的效率、成本、路径以及前沿性等多方面产生积极作用。

2 中国开源软件生态构建的风险分析

基于上文所构建的E-TOMSDECT分析模型,从行为可行性、组织网络、外部环境和知识溢出4个维度,对中国开源软件生态构建所面临的风险进行深入剖析,具体包括生态构建的技术基础、生态系统的运营能力、生态构建主体的意愿及动力、国际对中国开源生态的资源支持、中国在国际开源生态中的主导性、软硬协同发展、价值评估体系、人才储备和结构以及国际经验的合理利用9个层面,不同层面的风险相互关联、相互影响,共同对中国开源软件生态的构建形成交织化阻碍。

2.1 行为可行性维度的中国开源软件生态构建风险分析

中国开源软件生态构建的行为可行性维风险分析,主要从生态构建技术基础、生态系统运营能力、生态构建主体的意愿及动力三个层面进行。

1)关键核心技术支撑缺失致使生态建设技术基础薄弱。行业龙头企业、开源软件基金会、开源代码托管平台是中国开源软件生态构建的三大支点,目前中国已建起或正在筹建各类开源代码托管平台和开源软件基金会,多数龙头企业内部也已设立完整的部门建制以专门负责生态构建,但较完备的实体组织架构下生态构建所需的关键核心技术支撑,依然严重缺乏。(1)国内大型软件企业研发投入与国际龙头差距巨大,支撑开源软件生态构建的底层核心技术缺乏原生性,版本迭代和技术演进依赖国外。2018年,阿里、腾讯和百度(BAT)三大国内软件企业的研发经费投入总和不足80亿美元,而美国亚马逊(Amazon)和Alphabet两大软件巨头的年度研发投入均超过200亿美元。在研发投入的差距下,国内大型软件企业推出的操作系统、数据库、开发测试工具等开源软件生态构建所必需的底层核心产品,大多基于国外开源软件技术开发而成,版本演进和技术路径高度依赖国外主导的开源社区。麒麟、深度等桌面操作系统均是基于Linux内核开发而成,除华为鸿蒙外,其余移动操作系统则基本以Andriod为基础,中间件厂商大多基于Oracle JDK开源项目;除阿里云外,其余云计算厂商基本是基于OpenStack开源云计算平台进行二次开发,数据库厂商超半数以开源数据库系统PostgreSQL为基础。(2)国内开源软件基金会和开源代码托管平台仍基本处在模式模仿阶段,内部承载和维护的技术缺乏系统性和高价值性,生态构建支撑能力不足。当前中国正在建立或筹划建立的开源基金会缺乏类似于国外Linux Kernel(Linux基金会核心技术)、HTTPD web(Apache基金会核心技术)、Nova和Swift(OpenStack基金会核心技术)等原创的高价值技术体系。码云、GitCafe等国内开源代码托管平台虽然已具备一定用户基础,但本质上仍属于对国外Gitlab、Github平台的模式模仿和优化,缺少类似于Github “协议存储代码库”等对程序协同开发具有革命性改变的技术创新。

2)开源生态运营模式的掌握和创新能力欠缺。生态运营模式的构建,本质上是设计一套极其复杂的系统性商业模式,谷歌、IBM、亚马逊等美国企业非常擅长生态运营模式的构建,并利用其来维持自身的技术和市场优势。谷歌通过公开Android Open Source Platform(AOSP),建立安卓操作系统的开源生态,但利用系统内嵌套的非开源Google Mobile Service(GMS)移动套件和Open Handset Alliance(OHA)标准,对生态进行垄断和限制。红帽公司通过免费开源的Linux系统,快速占领市场并形成生态优势,同时推出在功能和性能等方面更强、更稳定的付费版Linux系统,并附加相关技术支持与维护服务,借助开源版本构筑的广阔生态,从而在高性能、高标准的企业级市场形成垄断优势。中国软件企业和相关组织由于起步较晚,市场主导力较弱,生态构建经验匮乏,目前对开源规则的运用能力尚较为薄弱,在系统性生态运营模式的设计和创新上鲜有典型的成功案例,对符合中国软件产业当前发展需求的开源软件生态运营模式的构建,仍处于初级探索阶段。

3)国内企业支持开源软件生态的动力仍有待提升。由于国外主导的成熟开源软件生态拥有更为完善的开发环境、技术基础和市场需求等,且当前国内开源软件生态又缺乏有效的资源吸引模式,国内大型企业出于成本和效率的考量,更倾向于将自身产品和技术,依托国外主导的成熟软件生态进行孵化、推广和运营,或直接使用国外成熟开源软件。近年来,腾讯、百度分别将TARS、TSeer、EDL、BAETYL等自研开源项目,捐献给国外较为成熟的Linux开源基金会。截至2020年3月,华为、百度、阿里和腾讯在国外代码托管平台Github上直接注册在企业名下的仓库分别到达159、84、300和97个;而在国内最大开源代码托管平台Gitee上,百度仅有14个仓库直接注册在企业名下,华为、阿里和腾讯甚至并无直接注册在企业名下的仓库,均是以项目名义分散存储,且以上企业重要开源项目的国内外平台同步注册也仍有很大提升空间。此外,国内BAT软件3个巨头曾分别推出过“百度云OS”“阿里YunOS”和“Tencent OS”等智能移动终端操作系统,但终因前期投入成本较高和外部势力干涉而“流产”,并分别加入成熟的安卓操作系统生态。

2.2 组织网络维度的中国开源软件生态构建风险分析

中国开源软件生态构建的组织网络维度风险分析,主要从国际对中国开源生态的资源支持及中国在国际开源生态中的主导性2个层面进行。

2.2.1 国际开源生态丰富的支撑资源伴随多维度安全风险

1)全球经贸摩擦不断加剧且发展形势不确定,国外开源代码依然存在较高的出口管制风险。虽然开源软件代码并不受美国出口管制条例(EAR)等法案的直接约束,但从开源基金会、开源代码托管平台以及美国企业等组织机构下载或获取开源软件代码,可以被视为是接受美国组织提供的一种服务,而服务可以被直接限制出口。Apache开源基金会、Github代码托管平台等美国开源生态的管理组织机构,均明确说明遵循美国出口管制相关法律的要求和约束,Gitlab甚至公开声明,不再给中国公民提供职位录用,有权限访问客户数据的员工也不能移居中国。目前,美国主导的开源软件生态虽未对中国展开实质性限制措施,但规模性的断供风险依然存在。

2)国外开源代码存在复杂的知识产权侵权风险。开源代码的授权使用均需要遵守相应的开源协议。2019年,全球20个最受欢迎的许可证涵盖了大约98%的在用开源代码,而68%的代码库中存在许可证冲突,61%的代码库存在GPL许可证违规[27]。中国主流桌面和服务器操作系统、移动操作系统、数据库、中间件等系统软件产品大量引用开源代码,且均在不同程度上涉及GPL开源协议,存在一定的知识产权诉讼风险。

3)部分国外开源组件带有高风险信息安全漏洞。大量使用国外开源组件在提升中国软件开发效率、减少开发人员重复劳动的同时,也将安全风险带入中国软件产品中,且开源组件的开放性会将软件系统的安全弱点暴露给全球。2019年,全球60%的代码库存在至少1个安全漏洞,40%以上的代码库包含至少1个高危安全漏洞,漏洞平均年龄为6.6年,最早的漏洞在28年前就被公开披露[27]

2.2.2 中国软件研发力量在国际开源软件生态中主导权较弱

近年来,中国软件研发力量虽然积极参与和融入国际开源软件生态,并不断扩大影响力,但当前在国际开源软件生态中的主导权依然较弱。

1)国内软件企业及个人很难进入当前国际主流开源软件生态的管理内核层。在分别以Linux、Apache和Openstack基金会为核心的三大开源生态中,真正掌握Linux开源生态管理权的22位Linux基金会董事中,仅有1位成员来自中国大陆;技术委员会则全部来自美国,对Linux系统内核的技术发展拥有最终决策权的核心团队中,鲜有来自中国大陆的成员;实际管控Apache开源生态的9位Apache董事更无一来自中国大陆;Openstack云计算开源生态中,掌握实际管理权的24位基金会董事中,也仅有4位来自中国大陆。以Github、Gitlab、SourceForge、BitBucket等国外大型开源代码托管平台为载体形成的主流开源软件生态,则均由微软、Gitlab lnc、Geeknet、Atlassian等欧美企业掌控。谷歌、微软、IBM等软件巨头在操作系统、软件开发测试工具、人工智能、云计算等领域构筑的开源软件生态,更是由其自身直接掌控,中国企业在技术发展路径和版本迭代上的影响力非常有限。

2)国内企业在国际软件生态中掌握的重要分支和技术贡献依然较少。Linux全球生态中使用较为广泛的发行版本,例如,Debian、Ret Hat Enterprise Linux、Slackware Linux等均被欧美相关组织掌控,华为作为中国对Linux内核贡献度最高的企业,也仅以1.5% 的贡献率排在第15位[28]。Apache开源生态中,基金会孵化的顶级项目仍以欧美为主导,中国大陆仅有华为ServiceComb、CarbonData及阿里Dubbo等个别项目成功孵化,并成为Apache顶级分支项目。GitHub开源代码托管平台上,前10最受关注的开源项目均来自美国,前10成长最快的开源项目中,有6项来自美国,其余来自俄罗斯、阿根廷等国,均无一来自中国大陆。

2.3 外部环境维度的中国开源软件生态构建风险分析

从软硬协同发展、价值评估体系、人才储备和结构3个层面进行分析。

2.3.1 中国软硬件产业发展的整体协同性较低

1)中国软硬件技术体系适配的系统性不足,软件生态的生长土壤受限。系统化的软硬件技术体系适配是开源软件生态形成的基础,开源软件不仅可以借助硬件的土壤迅速扩散,硬件的技术壁垒也为软件生态提供保护。Windows、Android生态系统能够不断发展并长期稳定,以“Wintel”“Android-ARM”为核心而形成的、包含多种支撑硬件和应用软件的系统化软硬技术适配环境起到决定性作用,“Wintel”体系几乎适配所有主流硬件产品,上游应用软件适配超过70万款。中国CPU和操作系统经过多年发展已基本实现技术适配,但这种技术适配,更多是局限于CPU和操作系统两点间的线性适配;而以CPU和操作系统为核心延展出的外围软硬件产品系统化适配,仍有待进一步提高。

2)中国软硬件业务体系相互独立,难以形成合力以促进开源软件的推广。IBM、谷歌、苹果等全球软件龙头企业均是软硬件业务同时涉及,能够有效调配硬件资源以促进开源软件生态的构建。例如,IBM开源Power芯片有效支持其云计算软件推广,谷歌推出TPU芯片促进其人工智能开发框架的应用等。而国内企业除华为外,其余BAT等大型软件企业现阶段基本以软件业务为主,并不具备较强的软硬资源协同配置能力以促进软件生态的构建。工业软件方面,其作为新一代信息技术与制造业融合的关键媒介,拥有强大的工业基础和对生产工艺的深度理解,是开发高端工业软件的必要条件。与西门子、达索、波音、盖勒普等欧美工业软件龙头同时涉及软硬业务相比,中国的数码大方、中望、用友、金蝶等国内工业软件企业基本均为纯软件企业,这在一定程度上制约了硬件层面的资源对中国工业软件生态构建和推广的协同支持。

2.3.2 价值评估体系扭曲下生态建设的资源支持存在失衡

1)软件开发的成本结构与硬件存在较大差异,但当前国内并未形成专门针对于软件的成熟成本核算体系,软件开发过程中的投入与成本缺乏合理测算,软件企业和产品的发展难以获得有效的市场价值肯定,开源软件生态的构建也难以获得足够的市场资源支持。

2)当前,国内软件价值评估体系对软件的实际价值难以合理度量,主要基于软件代码数量、功能点数量以及市场应用的潜在流量等量化指标进行价值评估,难以充分考虑到软件的创新性、原生性、基础性等开源软件生态构建的必需要素。在此引导下,国内资本投资也更趋向流入周期短、变现快的消费互联网应用领域,而能够有效支撑开源软件生态构建的创新性、原生性、基础性较强的技术研发,以及开源软件生态构建的具体实施活动则无法得到足够的资本支持和青睐。

2.3.3 具备开源软件生态运营能力的专业性人才匮乏

1)当前,中国对于既掌握相关软件技术又具备开源生态运营规则战略设计能力的复合型人才较为缺乏。一套开源生态运营模式的构建,不仅需要紧密结合生态内部核心软件技术本身的特征,同时也需要极高的战略规则设计智慧予以支撑。当前,中国软件产业亟需吸纳和培养对技术的特征和生态的开源运行机制均有深入理解的复合型人才。

2)对于理解并能运用国外开源软件生态底层运行机制的人才,同样较为缺乏。中国软件产业接触开源模式这种“舶来品”的时间较短,真正理解国外开源软件生态底层复杂运行机制,并能熟练运用国外开源生态内部规则的人才非常欠缺。国内众多技术水平较高且极具市场潜力的开源项目,无法在Apache开源基金会内成功孵化并成为Apache开源生态中的顶级分支项目,很重要的原因之一是国内缺少真正理解并掌握Apache开源生态内部孵化机制和进阶规则的人才。

2.4 知识溢出维度的中国开源软件生态构建风险分析

中国开源软件生态构建的知识溢出维度风险分析,主要聚焦于对国际已有开源生态构建经验的合理利用层面。

1)生态构建基础和需求的差异制约外部经验有效迁移。美欧虽已构建多种成熟的开源软件生态并积累丰富经验,但作为行业内的全球巨头和前沿技术探索的排头兵,对开源生态构建通常以绝对领先的产业发展模式和技术优势为基础,其构建开源生态的需求更多聚焦在维持自身在技术和市场方面的垄断优势,面对新兴技术领域快速抢占市场。相比之下,中国软件产业整体上仍处于跟随发展阶段,关键核心技术基础和产业发展模式创新均较为薄弱,构建开源软件生态所面临更为迫切的需求主要是实现关键领域的创新突破。在基础和需求的巨大差异下,中国对国外丰富开源生态构建经验的借鉴过程中面临诸多“水土不服”的问题,相关经验更难以系统化地移植于中国开源软件生态构建过程中。

2)对国外生态构建经验的深层次理解与系统化掌握不足。由于中国软件生态构建的目的和基础与国外不同,导致国外经验无法在中国生态构建过程中被直接借鉴使用。因此,必须对国外开源软件生态构建经验进行“概括化”深入剖析,提炼出构建过程中所采取的关键措施,理解相关措施的深层次作用机理,系统化掌握国外开源软件生态构建的关键路径及演化规律等。但中国当前在该领域存在巨大不足,开源软件生态构建方面的理论远落后于实践,政产学研联动的经验分析与实践机制缺失,对国外开源软件生态构建经验的深层次理解和系统化掌握仍有较大欠缺,国外经验对中国开源软件生态构建的最大支持效应未能完全释放。

3 全球开源软件生态构建经验的类化分析

全球开源软件生态构建经验的类化分析是对全球已有成功经验有效利用的基础(图 3)。Judd(1908)在大量实验的基础上提出经验类化理论(experience generalization theory),即经验概括化理论。该理论认为,已有经验在从一个情境向另一个情境的迁移过程中,两个情境之间存在相似成分只是实现迁移的必要前提,而通过对经验内部深层次逻辑和原理的掌握,从而完成对经验在同类多场景下的概括化理解,才是实现经验在不同场景间实现迁移的决定性因素[29]。当前国际上具有统治力的开源软件生态,主要包括由微软、苹果、谷歌等龙头企业主导的企业开源生态,以及以Linux、Apache、OpenStack等开源基金会和Github、Gitlab、Source-Forge、BitBucket等代码托管平台为核心的社区开源生态,其主导权均被美欧掌控。以下对全球开源软件生态构建经验进行类化分析,挖掘国外开源软件生态构建的关键举措及作用机理,梳理国外开源软件生态构建的路径及演化规律,以最大限度释放全球已有经验对中国开源软件生态建设的支持作用。

图 3 全球开源软件生态构建经验类化分析
3.1 依托先进基础技术赢得先机,形成生态支点

当前国际主流软件生态构建之初,均是依托具备较高原创性和较低可替代性的先进基础性技术体系而占得先发优势,打造生态基础。谷歌凭借开源Android移动操作系统和开源Chromium浏览器内核的先进技术,在移动操作系统、浏览器等领域获取巨大市场占有率,同时基于技术绝对领先的Pagerank专利算法和AdWords广告工具,确立了在搜索引擎领域的市场垄断地位,从而逐步构建起以Android为支点的移动端开源生态体系,以及以Chromium和搜索引擎为支点的互联网开源生态体系。Tensorflow开源平台在计算技术上的绝对优势满足了市场对AI开发标准化的需求,支持谷歌在人工智能开发领域构建起主导性开源生态体系。微软通过Visual Studio Code、“.Net”、ChakraCore等低可替代性的先进开源开发工具,建立起其在上游软件开发领域的市场垄断优势,从而形成生态基础。微软在JavaScript开发领域建立的开源生态系统,也是基于TypeScript、ChakraCore等开源软件在技术上的领先性,有效解决了开发过程中的环境限制等问题。

此外,Linux、Apache、OpenStack开源基金会,也分别依托Linux Kernel、Apache Server、Nova和Swift等高价值原创性技术,为其主导的开源生态系统建立了强大的技术支点。目前,Linux基金会除拥有Linux Kernel技术外,也同时管理OpenPower、RISC-V开源芯片指令集等面向未来的先进基础技术。Apache基金会共管理约1.9亿行开源代码,价值超过200亿美元,拥有能够对产业形成潜在重大影响的顶级项目有330个[30]。OpenStack基金会在云计算领域的开源技术,凭借领先的兼容性和快速部署能力,得到1/2以上世界500强企业的认可和采用,75%以上的已采用企业计划未来继续使用[31]

3.2 掌控运营规则和技术演进,锁定生态主导权

1)核心企业通过掌控技术发展方向和附属闭源软件,对开源生态进行控制。虽然微软、谷歌等对Visual Studio Code开发工具、安卓操作系统、Chromium浏览器内核、TensorFlow人工智能开发框架等进行了开源,并在全球范围形成了强大的开源生态系统,但其依然牢牢掌控产品的技术发展路径和版本迭代方向,对生态系统具有绝对控制力。此外,开源的安卓操作系统若没有得到谷歌对非开源Google Mobile Service(GMS)移动套件的使用授权,则会失去大量使用价值,尤其在欧美市场,甚至无法满足用户对基本功能的需求。基于Chromium开源浏览器内核开发的各类浏览器,若没有得到谷歌对非开源Widevine数字版权管理(DRM)插件的使用授权,则无法实现对多媒体资源的播放功能,这将极大限制浏览器产品的市场生存空间。谷歌基于这种生存依赖性,通过对GMS和Widevine非开源产品的掌控,从而保持着对整个安卓开源生态和Chromium开源生态的主导权和话语权。

2)基金会基于严格的入群机制和原有稳定势力格局,对开源生态治理权进行垄断。开源基金会本质上也是由部分群体所掌控,基金会内部的董事会、技术委员会、项目管理委员会、技术创始人及其团队等组织从顶层掌控技术的发展路径、标准以及基金会的运营等。例如,Linux创始人Torvalds Linus及其团队对Linux系统内核的技术发展路径、版本更迭拥有最终决策权;Linux董事会则管控着基金会的日常运行以及Linux生态的规范、保护、运营等事项;Apache董事会和项目管理委员会则分别管理着基金会的运作和具体项目的技术决策。在严格的入群机制下,外部人员很难进入董事会、技术委员会、项目管理委员会等基金会的核心管理层。Linux和Apache董事会均是从其内部会员中选举产生,且会员级别越高越有可能进入董事会和技术委员会,但高级别会员的加入有着苛刻的技术贡献要求并需要付出高昂的资金成本,Linux白金会员的年会费高达50万美元,同时基金会内部原有势力的决策对高级别会员的加入也具有重要影响。此外,即便个别外部人员进入核心管理层,也会受原有权力格局的限制而无法真正掌握话语权。Linux基金会下属的Open Network Automation Platform(ONAP)项目虽然由华为、中国移动和AT&T初创,且华为和中国移动都成为ONAP项目的白金会员并在技术贡献上占据主力位置,但在项目的实际运作过程中,由于数量占优的美国厂商在基金会和ONAP项目内部已形成稳定的利益集合体,涉及项目运营和技术发展的决策依然被美国厂商势力所把控,华为、中国移动等中国厂商势单力薄,仍然无法从根本上获得话语权。Apache各项目管理委员会的主席更是由董事会直接任命。

3)利用有偿服务和无偿服务互相搭配的产品策略,掌控对开源生态的话语权。Github、Source-Forge、BitBucket等开源代码托管平台,均同时提供有偿和无偿的代码存储和协同开发服务,并利用有偿和无偿服务间的互补,从而实现生态的持续发展和对生态话语权的掌控。Github、SourceForge、Bit-Bucket等开源代码托管平台利用无偿代码存储和协同开发服务吸引行业资源,为平台生态提供持续发展的内生动力,同时又通过有偿服务,在代码存储和协同开发方面提供更为丰富和强大的功能,从而通过垄断高端市场以实现对生态话语权掌控并完成直接盈利。红帽公司开发的核心产品Ret Hat Enterprise Linux需要付费才能使用,但也公开全部源码,源码虽然不能直接进行安装使用,但经开源社区重新编译成后,在市场上推出了如Centos、Whitebox、Dao等各种可无偿直接使用的版本。众多无偿使用的版本在市场上吸引了庞大的用户群体,为生态的形成和垄断提供了广阔的土壤,而付费订阅版本则具有更强的稳定性、更快速的更新和更完善的支持服务,红帽公司借助需要付费订阅的版本实现对高端市场的掌控,并从代码源头控制免费产品的技术路径和版本迭代,从而构建起对整个生态的主导权并直接盈利。

3.3 整合产业资源构筑行业壁垒,打造生态优势

1)通过构建“软硬联盟”或直接整合软硬资源,强化开源软件生态壁垒。在联合构建稳固的“软硬联盟”方面,在谷歌与ARM建立的“Android-ARM”软硬联盟中,安卓操作系统从研发之初即主要针对ARM架构芯片进行设计,相互之间形成极高的技术适配性,从而使得安卓生态的形成和稳定,得到来自ARM芯片市场优势的巨大促进和保障作用。在直接整合软硬件资源方面,IBM基于自身的Power芯片和Red Hat开源云计算软件在市场上的高度适配性,通过对Power芯片指令集开源,以支持Red Hat开源云计算软件的推广和生态稳定。谷歌依靠其强大的TPU芯片,打造跨软硬的系统性人工智能开发支持服务,有效支持TensorFlow开源人工智能开发框架在市场上形成的垄断性生态。

2)高度重视多元化发展战略以广泛吸纳研发资源,从而保持生态活力。Linux、Apache开源基金会内均包含不同技术领域的众多项目,Apache基金会甚至不排斥相似项目同时立项,这为基金会吸引更丰富研发力量和项目资源的加入提供了有力支撑。Github、SourceForge、BitBucket等代码托管平台与开源基金会相比拥有更低的加入门槛,且代码托管平台并不参与开源项目的具体技术事项,对项目技术的发展基本没有干扰和影响,这使得平台能够不断汇集全球开源项目,保持生态系统的运转和更新活力。

3)借助国际统一的认证考试将人才绑定至生态圈,以强化生态的智力支撑。认证考试本质上是对开发人员评价标准的设定,可以将从业人员笼络至自身的技术体系之下,进而确保生态系统对人力资源的垄断。微软、Oracle等企业均在全球范围内开展基于自身产品体系的认证考试,当对立产品和技术出现的时候,可以有效限制对立产品的智慧资源,强化生态系统的稳定性。

3.4 抢占前沿领域技术制高点,深化生态统治

全球软件龙头凭借其强大的资源协调能力和对技术发展趋势的敏锐感知,果断将其主导的开源软件生态布局重点进行战略转向,紧贴人工智能、云计算等新兴技术发展趋势,演化孕育新的开源生态。谷歌开源生态发展战略开始由“移动和互联网优先”转向“人工智能优先”。人工智能技术已贯穿谷歌Android、Gmail、Google Assistant、Google Maps等几乎所有产品,并融汇到其全套互联网服务中。谷歌多达数10亿的海量用户基数直接转化为人工智能消费市场用户,同时产品应用过程中所获取的用户数据,又可用来满足其深度学习训练需求。谷歌开源人工智能开发框架TensorFlow已被部署在数以百万计的设备上,且在推进TensorFlow工程化和产业化的过程中,不断加强与谷歌大脑、TPU、云计算等业务的关联性,未来以TensorFlow为基础的开源生态系统将成为谷歌的新杀手锏。微软也积极加强开源生态发展战略在云计算领域的布局。目前,微软已解散其原有最为核心的Windows业务部门,同时开源了广泛应用于Azure云服务建设的Orleans云计算框架,并收购Github开源代码托管平台,可与Azure云服务进行集成以支持云计算服务的市场拓展。

4 中国开源软件生态构建的对策建议

基于对当前中国开源软件生态构建所面临风险的分析,以及对全球开源软件生态构建经验的类化分析,同时结合复杂严峻的国际竞争格局、以智能化和万物互联为核心的新一轮科技革命和产业革命等对中国软件产业发展所提出的新需求,从“以我为主、面向全球”的视角,有针对性地提出中国开源软件生态构建的如下政策建议。

4.1 聚焦新兴领域打造“三位一体”的开源生态主导核心

基于国家战略定位和行业需求,选取云计算、人工智能、物联网等,中国目前并未取得显著领先地位,但具备一定技术储备和优势的新兴技术领域,以基金会、代码托管平台、龙头企业为依托提前布局中国在新兴领域的开源生态主导权。(1)基于新兴领域的引领性技术构建开源基金会。以国家队企业为主体先建立起开源软件基金会组织架构,并通过项目拉动的方式,吸引国内具有一定原创性、前瞻性的高价值开源软件技术加入基金会,初期不追求在技术和市场上的领先,主要作为实验平台,探索符合中国产业发展需求的开源软件基金会运行机制。(2)以提升开发效率为导向打造开源代码托管平台。抓住当前新兴领域内软件开发过程中影响开发效率的关键问题,打造与国际开源代码托管平台相比服务差异化的开源代码托管平台。通过商业化的战略经费补贴,推进平台在技术和运行模式上的不断改进。以实际利益驱动国内龙头企业、新兴领域专业企业将自身高价值开源项目托管于平台。(3)集中支持国内龙头构建企业主导的产品级开源生态。以领域内龙头企业的优势开源技术或产品为基础,从代码开发、产品应用、开源模式探索试错等多方面,集中支持领域内1~2家龙头企业,打造自己主导的开源生态系统。通过政策牵引的方式吸引潜在参与企业加入生态,助力龙头企业完成生态构建“0”到“1”的突破。政府可依托第三方机构,对生态进行开放性、知识产权、贸易安全风险等方面的评估,从而协调企业间形成稳定的互信机制。

4.2 加强软硬协同整体规划以完善开源软件生态成长环境

加强硬件对开源软件在技术适配和市场协同方面的支撑,构建软硬件协同发展体系,促进和保障开源软件生态的形成和稳定。(1)加强软硬件协同研发顶层规划。基于软硬件协同成熟度分级分类评估体系,从国家层面制定软硬件协同研发的顶层政策指导,对软硬件协同发展的重点领域分级分类进行系统布局。(2)引导国内软硬件企业协同合作。依托重大项目或工程建立软硬件协同创新联合体,对软硬件协同相关的核心技术进行联合攻关,并形成可推广的软硬协同创新模式。鼓励软硬件企业在标准对接、产品配套、市场捆绑等方面形成“战略联盟”。(3)建立软硬协同可靠性和安全风险检测平台。面向软硬协同系统开展试验和检测,评估软硬协同效果,排查软硬协同层面的潜在安全风险。(4)完善软硬协同评估机制。动态化开展软硬件协同评估调查,掌握中国软硬件在技术匹配和市场对接2个层面的协同程度和突出问题。

4.3 构建开源软件生态的安全风险评估和应急防控机制

以企业和产业发展需求为导向,依托第三方专业机构,逐步完善中国对全球开源软件生态体系的风险监控及应对机制。(1)建立动态化的全球软件开源生态安全风险评估机制。持续对中国参与较为广泛,且由国际龙头企业或国际开源软件基金会控制的开源软件生态,以及以国际开源软件代码托管平台为依托形成的开源软件生态,可能面临的出口管制、知识产权、代码漏洞等安全风险进行系统性评估,及时发现苗头性、趋势性风险,同时就潜在风险对整个产业发展可能产生的损害进行预先分析。(2)构建国际开源软件生态安全应急防控机制。针对中国参与较为广泛的各类国际开源软件生态可能面临的各种限制风险,建立针对性的应急防控措施储备,提前布局备用替代方案和应急反制方案,避免突发事件下陷入被动局面。

4.4 加大开源软件生态构建的人才培养与引进力度

基于开源软件生态建设的人才短板和发展需求,实施人才专项培养计划,并面向全球吸纳急需人才,加快建设满足开源软件生态建设需求的人才队伍。(1)加大对国外开源生态构建专业人才的引进力度。设立开源生态人才专项计划,对深入了解国外开源软件生态构建,并具备丰富实操经验的专业人才进行引进,支撑中国开源软件生态建设。(2)加强开源生态构建所需的复合型人才培养。以具体项目为依托,为产业内专业技术人才与生态运营人才创造更多合作空间与协同机会,鼓励技术人才以借调、挂职、轮岗等方式深入参与生态运营性事务,以培养同时具备专业技术和生态运营知识及经验的复合型人才。(3)创新开源生态建设人才的培养模式。推动建立高校、科研机构与企业间的联合培养机制,吸纳高校、科研机构在技术开发和生态运营方面的智慧资源,并以企业为实训基地,加强开源软件生态运营人才培养过程中的实践训练与探索。(4)完善开源生态建设人才的激励和容错机制。有针对性地调整软件产业相关人事、薪酬及评价等制度,对开源生态建设领域的非技术性贡献给予更多关注,对开源软件生态构建的探索性尝试给予更大容错空间,释放开源生态构建及运营人员的创新潜能和实施动力。

5 结论

开源凭借其强大的资源汇集和协同创新优势,正逐渐成为全球软件开发的重要模式,并在区块链、AI等新兴信息技术领域发挥着创新引领作用。开源软件生态建设已成为中国软件产业有效应对复杂多变的国际贸易环境,抢占新一轮科技革命技术制高点,并向全球价值链中高端迈进的重要支撑。本研究基于双层嵌入理论和知识溢出理论构建E-TOMSDECT分析模型,对中国开源软件生态构建所面临的风险进行系统化剖析。当前,中国开源软件生态构建主要存在关键核心技术支撑与生态运营模式掌握薄弱,生态建设主体动力不足,在国际开源生态中主导权较弱且面临多维度安全风险,软硬件协同发展能力较弱,软件价值评估体系扭曲,生态运营专业性人才匮乏,国际经验的利用潜能未能完全释放等风险。全球开源软件生态建设的已有经验主要是依托先进基础技术形成生态支点,掌控运营规则和技术演进锁定生态主导权,整合产业资源构筑生态壁垒,抢占前沿技术制高点,深化生态统治。结合中国自身所面临的风险,并借鉴国际已有经验,提出中国开源软件生态构建应尽快聚焦新兴领域,打造“三位一体”的开源生态主导核心,加强软硬协同整体规划以完善开源软件生态成长环境,构建开源软件生态的安全风险评估和应急防控机制,加大开源软件生态构建的人才培养与引进力度。

参考文献
[1] 董瑞志, 李必信, 王璐璐, 等. 软件生态系统研究综述[J]. 计算机学报, 2020, 43(2):250-271.
[2] Cheng C, Li B, Li Z Y, et al. Automatic detection of public development projects in large open source ecosystems:an exploratory study on GitHub[C]//30th International Conference on Software Engineering and Knowledge Engineering (SEKE). 2018, doi:10.18293/SEKE2018-085.
[3] 张得光, 李兵, 何鹏, 等. 基于软件生态系统的开源社区特性研究[J]. 计算机工程, 2015, 41(11):106-113.
[4] 金芝, 周明辉, 张宇霞. 开源软件与开源软件生态:现状与趋势[J]. 科技导报, 2016, 34(14):42-48.
[5] Jansen S. Measuring the health of open source software ecosystems:Beyond the scope of project health[J]. Information and Software Technology, 2014, 56(11):15081519.
[6] Mizushima K, Ikawa Y. A structure for innovation reproduction in the Eclipse OSS ecosystem[J]. International Journal of Innovation & Sustainable Development, 2017, 6(4):420-440.
[7] De Souza C, Figueira F F, Miranda M, et al. The social side of software platform ecosystems[C]//Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems. New York:Association for Computing Machinery, 2016:3204-3214.
[8] Koch S, Guceri-Ucar G. Motivations of application developers:Innovation, business model choice, release policy, and success[J]. Social Science Electronic Publishing, 2015, 27(3):218-238.
[9] Kilamo T, Hammouda I, Mikkonen T, et al. From proprietary to open source-Growing an open source ecosystem[J]. Journal of Systems and Software, 2012, 85(7):14671478.
[10] Liao Z F, Zhao B H, Liu S Z, et al. A prediction model of the project life-span in open source software ecosystem[J]. Mobile Networks & Applications, 2017, 24(4):110.
[11] Polanyi K. The great transformation:The political and economic origins of our time[M]. Boston:Beaeon Press, 1957:43-68.
[12] Grannovetter M. The strength of weak ties[J]. American Journal of Sociology, 1973, 78(6):1360-1380.
[13] 何海燕, 王馨格, 李宏宽. 军民深度融合下高校国防科技人才培养影响因素研究——基于双层嵌入理论和需求拉动理论的新视角[J]. 宏观经济研究, 2018(4):163175.
[14] Grannovetter M. Economic action and social structure:The problem of embeddedness[J]. American Journal of Sociology, 1985, 91(3):481-510.
[15] 刘刚, 王泽宇, 程熙鎔."朋友圈" 优势、内群体条件与互联网创业——基于整合社会认同与嵌入理论的新视角[J]. 中国工业经济, 2016(8):110-126.
[16] Mian S A, Hattab H W. How individual competencies shape the entrepreneurs social network structure evidence from the MENA region[J]. International Journal of Business and Globalization, 2013, 11(4):399-412.
[17] 傅广宛, 杨宝强. 嵌入理论视角下智库行政化现象研究[J]. 理论与改革, 2016, 1:94-97.
[18] 陈权, 缪烨明. 基于社会嵌入理论的高校课程实施过程研究[J]. 系统科学学报, 2020(3):65-69.
[19] 王馨, 秦铁辉. 基于嵌入理论的人际情报网络影响因素模型研究[J]. 情报理论与实践, 2009, 32(10):13-16.
[20] Marshall A. Principles of economics:An introductory volume[M]. London:Macmillan, 1948.
[21] Jacobs J. The economy of cities[M]. NewYork:Vintage, 1969.
[22] Annegret S, Catharina R B, Tobias S S, et al. The role of inter-sectoral knowledge spillovers in technological innovations:The case of lithium-ion batteries[J]. Technological Forecasting & Social Change, 2019, 148(11):3244.
[23] 梁俊伟, 黄德成. 高校知识溢出与企业创新绩效[J]. 经济理论与经济管理, 2020(1):82-96.
[24] 李阳杰. 一流学科建设中的知识溢出:效应分析与政策建议[J]. 高等工程教育研究, 2020(1):131-136.
[25] 湛柏明, 裴婷. 中间品进口贸易的技术溢出效应研究[J]. 国际商务(对外经济贸易大学学报), 2019(2):25-36.
[26] Zhao S L, Jiang Y H, Wang S Y. Innovation stages, knowledge spillover, and green economy development:moderating role of absorptive capacity and environmental regulation[J]. Environmental science and pollution research international, 2019, 26(24):25312-25325.
[27] Cybersecurity Research Center. 2019 open source security and risk analysis (OSSRA) report[R]. California:Synopsys Cybersecurity Research Center, 2019.
[28] Linux F. Linux kernel development report[R]. California:Linux Foundation, 2017.
[29] Judd C H. Review of pragmatism:A new name for some old ways of thinking[J]. Psychological Bulletin, 1908, 5(5):157-162.
[30] Apache Software Foundation. Apache software foundation annual report-FY2019[R]. Massachusetts:Apache Software Foundation, 2019.
[31] OpenStack Foundation. 2019 openstack foundation annual report[R]. California:OpenStack Foundation, 2019.
Risks and countermeasures of China's open source software ecosystem construction
HUANG Peng1, LI Hongkuan1,2*     
1. China Industrial Control Systems Cyber Emergency Response, Beijing 100040, China
2. Center for National Defense Innovation and Education Development, Beijing Institute of Technology, Beijing 100081, China
Abstract Based on the double layer embeddedness theory and the knowledge spillovers theory, the E-TOMSDECT analysis model is proposed in this paper. With this model, the risks of China's open source software ecosystem are analyzed systematically. Based on a generalization analysis of international experiences of building open source software ecosystem, some recommendations are proposed. It is shown that our problems include the lack of the key core technology and the ecosystem operation pattern, insufficiencyt motivation, security risks and weak leadership in the international open source software ecosystem, the coordination of the software and the hardware, the inadequate software value evaluation system, the lack of professional talents for ecosystem operation, and underutilization of international experiencere. The urgent tasks in China include building a three-in-one leading core on emerging fields, strengthening the coordination of the software and the hardware, building the security risk assessment and emergency response mechanism, and strengthening the talent training.
Key words: open source software ecosystem     double layer embeddedness theory     knowledge spillovers     risk analysis     experience generalization