检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome EdgeFirefox X

首页ISTIS智库智库出版

与数共舞:全球科研范式数字化转型

供稿人:薛菁华供稿时间:2022-11-30 11:16:57关键词:科研范式,数字化转型,数据密集型科研范式,开放科学

随着新一代网络技术的飞速发展,科研环境不断变化,各种科学新问题层出不穷,观察数据、计算数据、模拟数据、仿真数据等各种数据呈现爆炸式增长。科研范式的每一次转变都会促进人类科学技术实现一次重大的突破。根据图灵奖得主吉姆·格雷(Jim Gray)的观点,科研范式经历了四个阶段的发展,即实验科学阶段、理论科学阶段、计算科学阶段以及数据密集型科学阶段。因此,普遍认为如今的科学研究已经步入了基于数据密集型计算的第四范式。之后,随着进入大数据时代,数据密集型科研范式的研究对象又由密集型数据发展至大数据,更加侧重于人、机器及数据之间的交互,强调人的决策机制与数据分析的融合,体现出了数据与智能的有机结合。

和格雷提出的第四范式几乎并行,并同样基于数字化的还有开放科学新范式。经济合作与发展组织(OECD)认为,全球科研工作正在经历数字化转型的深刻影响,催生出一种更强调包容与合作的开放科学新范式,表现为科研成果、数据、设备等资源在数字技术的赋能下实现最大程度的开放共享。

经过系统地研究,作者认为,现阶段科学研究的新范式主要就是数据密集型科研范式和开放科学范式。

数据密集型科学范式由数据而起源,由数据密集型计算而产生,依托各项数据分析理论与应用方法体系不断发展。数据密集型科学的主要研究对象为科学数据,主要是指自然科学、工程技术科学等领域通过基础研究、应用研究、试验开发、检验检测等方式取得并用于科学研究活动的原始数据及其衍生数据。数据密集型科学由三个基本活动组成:科学数据的采集、管理和分析。

开放科学关系整体科研生态,是使资助机构、科研机构、信息服务机构、社会公众等相关方跨越各种障碍,协作参与科研活动,以及科研成果、过程、设施可访问、可理解、可评估与可重用的一种科研场景。作者认为,随着互联网和新一代信息技术的发展,现代意义的开放科学将演变成以数据驱动为核心的,研究过程高度透明的,鼓励公民广泛参与的,以自由、开放和更具包容性的方式促进科学知识的发现、创造和传播的科研新范式。

无论是数据密集型科研范式或是开放科学范式,科学数据管理都是核心问题。科学数据管理已成为全球科学研究管理的重要组成部分,更是科研范式实现数字化转型的关键所在,也是国家科技创新和竞争的重要制高点。我国在科学数据管理方面长期以来都是实践先于政策,2018年出台的《科学数据管理办法》是我国政府首次站在国家层面释放出开放为主的科学数据管理信号,具有里程碑式意义。科学数据已经成为科技创新活动的重要资源和关键成果,科学数据资源的妥善使用和管理,即关乎我国科研力量和进步,也关于国家安全。因此,现阶段我们要特别要对科研范式数字化转型过程中所面临的几大问题加以警惕:第一,我国在科学数据库建设方面的表现与科研投入反差强烈;第二,我国科学数据大量流入国外数据库;第三,我国科研人员极度依赖国外数据库,但又存在数据获取难度日益加大的困难;第四,过度依赖国外数据库将使我国科研工作面临“断供”风险。

本书从政策法规、平台建设、人才培养三个维度,全面梳理了国外主要发达国家在科学数据管理方面的一些经验做法;横向比较国内各地已出台的科学数据管理的地方政策后,作者认为,科学数据管理是上海科研范式数字化转型的地基,为了打好这一地基,上海亟待在以下方面加以突破:在顶层设计方面,应尽快出台上海科学数据管理的地方政策;在支持方向方面,应瞄准优势领域软硬件齐抓并举;在基础设施方面,应加紧落实存算一体的科学数据开放共享平台;在竞争力提升方面,应加快推进科研机构算力共享的进程;在人才培养方面,应建立科研范式数字化转型的人才培养体系;在机制保障方面,应率先突破科研工作相关的体制机制。