生物医学范畴科研合作近况及预测探讨
0 引言
通过科研合作,科研人员不仅可以弥补自身的不足,极大地提高科研活动的效率,还可以集中较大的力量进行自身无法完成的大型任务,提高科学研究的档次,然而不少科研人员和科研管理部门对科研合作的重要性认识仍然不足。本研究对科研合作关系含义、衡量手段、刺激和影响因素、功能以及预测理论的系统研究,有助于改变科研人员和科研管理机构的这种认识,使之更好地理解国家的科研创新体系,营造良好的科研合作氛围,为国家科技创新活动提供有力保障,推进国家创新体系建设。本研究能够帮助我国科研管理部门了解科学研究领域各层面科研合作的现状,遴选高影响力的科研机构和科研人员。尤其是科研合作关系预测理论的应用,可以对科研人员未来潜在的科研合作关系有效预测,从而大大提高科研管理部门的工作效率,降低科研管理成本,实现人力、物力资源和科研经费的合理分配。
............
1 生物医学领域科研合作研究的相关理论基础
1.1 科研合作研究的基本理论
更有意义的是,在通过网络拓扑特征进行科研人员合作关系预测时,对科研人员的国别、隶属机构、所属学科和语言等加以分析和鉴别,可以发现某一些潜在的、有效的跨学科、跨区域或跨语言合作关系,可为有此需求的科研人员提议合适的合作伙伴。而跨学科、跨区域或跨语言的科研合作往往能够创造更大的科研价值。 选择合适的合作伙伴可以大大提高科研人员、科研机构、区域、乃至国家的科研效率,增加科研产量,提高科研质量,加快成果转化速度,进而推动整个社会经济的快速发展。然而利用传统的方法选择合作伙伴,势必需要耗费大量的人力和财力,故一直以来困扰着科研人员和科研管理部门。复杂网络链接预测法将科学计量的方法与机器学习、数据挖掘等方法有机结合,只需通过对论文信息的挖掘便可实现合作关系的有效预测,大大提高了预测效率。
1.2 科研合作的基本研究方法和工具
CINET 是菜单驱动的 Windows 程序,能够输出到 Paje 和 Mage,能够登录到 Netdraw,这 3 个程序和 UCINET是搭配的。UCINET 是面向矩阵的,数据集合是一个或多个矩阵的集合。一个简易的 UCINET文件包含两个文件。UCINET 数据可以直接导入也可以新建表单直接录入。UCINET 提供大量的数据管理和转换工具。UCINET不包含可视化的过程,从而能够实现可视化。此外,如何利用论文合著和专利合作来分析不同类型科研合作也值得研究,科研人员合著了多篇论文,而机构科研人员与机构B没有合作关系,是否存在机构层面的合作是一个值得商榷的问题。首先,其衡量结果具有稳定性,给定同样的数据集,其他科研人员可以得出同样的结果;其次,与调查等方式相比,采用合著论著和专利合作衡量科研合作关系相对比较便宜且操作性强。
3 生物医学领域科研合作现状分析(二) ................. 78
3.1 我国肿瘤研究领域科研合作现状分析 ............................. 78
3.2 国际肿瘤研究领域科研合作现状分析 .................... 92
4 生物医学领域科研合作现状分析(三) ...................... 98
4.1 我国健康管理领域科研合作现状分析 ............................ 98
4.2 国际健康管理领域科研合作现状分析 ........................ 103
5 生物医学领域科研绩效与国际合作关系研究 ................ 119
5.1 科研人员科研绩效与国际科研合作关系研究 ...................... 119
5.2 国家科研绩效与国际科研合作关系研究 ............ 130
5.2.1 研究方法及数据来源 .............. 130
5.2.2 结果分析 ............. 131
5.2.3 讨论与小结 ................ 136
6 生物医学领域科研合作关系预测研究
6.1 研究方法及数据来源
然后,我们只考虑 2-hop的作者对,即两作者之间有不少于 1个的合著者。根据上述限制,我们找到所有在第二阶段产生新链接的作者对,用以作为阳性作者对。第二阶段中共发现 137219个新链接,占所有可能链接的 3.6%。然后,我们随机选取了与阳性作者对相同数量的阴性作者对,使得阳性作者对与阴性作者对数量平衡(作者对总数为 274438)。此外,我们还需要一个参照组,因此我们将总作者对中的一半随机标识为阳性,而将剩余的一半标识为阴性。此时,对于所有的作者对而言,作者对之间的拓扑特征值以及随机标识构成了新的拓扑特征集,我们称之为参照拓扑特征集;。
6.2结果分析
我们还利用 LR 模型对上述 6个拓扑特征进行了单独测试(由于 LR 模型与SVM 模型的测试结果相同,因此这里只罗列 LR 模型的测试结果)。如图 6-3 所示,当使用各个拓扑特征进行单独测试时,其测试结果普遍低于综合各个拓扑特征进行测试的结果。然而,某些拓扑特征仍然在四项准确率指标中得到了较高的分数(如Adamic/Adar:precision 0.699、recall 0.66、F1 score 0.644、AUC 0.74)。让人惊讶的是,PropFlow 的准确率低于 Adamic/Adar、Common Neighbors 和accards coefficient 等,该结果与Yizhou S 等的研究结论不符[162]。此外,PropFlow的precision、recall 和F1 score得分均低于 Munasinghe L等利用 Faceboo 社会网络数据分析的结果[164]。
...........
7讨论与总结
研究结果显示生物医学领域的科研合作趋势不断上升:2000-2021年期间我国心血管病研究领域作者合著率、篇平均作者数呈增长趋势,表明目前我国心血管病研究领域科研人员的合作趋势在不断加大;1981-2021年期间国际冠心病研究篇均作者数、篇均机构数和篇均国家数同样也呈现出上升趋势,表明国际冠心病研究领域各层面的合作趋势也在不断加强;此外,1999-2021年期间,国际健康管理研究领域的作者、机构和国家层面的科研合作呈现出上升趋势。 然而,生物医学领域的科研合作在地理上的分布却不均衡:在我国心血管病研究领域,说明区域的政治、经济和社会发展水平、人力优势和资源优势等不同程度地影响着区域之间的心血管病合作研究;西方国家处于国际冠心病研究科研合作网络的核心,而东方国家处于该网络的边缘地位,美国、法国和英国在国际合作活动中起着重要的调停作用;美国、英国、澳大利亚等国处于国际健康管理研究领域合著网络的中心位置。
..........
参考文献(略)