-
日期: 2017-03-17 | 来源: 武夷山博客 | 有0人参与评论 | 字体: 小 中 大
大数据时代的科学计量学新方向----王贤文着《科学计量大数据及其应用》一书序刘则渊?科学家的一天,似乎与常人不同,但既非不食人间烟火,也无什么惊人之举。后者,迄今科学史上仅有一例,1869年3月1日这一天俄罗斯化学家门捷列夫(Д.И.Менделе?ев,1834~1907)发现了化学元素周期律,史称“伟大发现的一天”。业经手稿、档案的严密考证,确认了门捷列夫一天内编制出完整的元素周期表,同时又查明之前他在写作《化学原理》的过程中对元素分类进行了坚持不懈的探索和尝试[1]。平时积累,成就一天。正如科学计量学之父普赖斯(Derek John de Solla Price, 1922~1983)
的一句名言所说:“科学如今清楚地表明,巨大进步集成于各种方式的小步之中。”[2]当然,一项巨大进步未必集中在一天。

普赖斯的这句名言再次为最近的一项研究结果所印证。该项研究通过实时追踪世界各地科学家借助互联网每天从数字文档数据库中下载科学论文的大数据分析,获得每天0~24小时论文下载量波动的周期曲线,证实了科学家群体的每一天确非平常,平时熬夜、周末加班系工作常态。这项研究以《探索科学家的工作时间表》为题的英文论文[3]公开发表后,引起强烈反响,国内外媒体纷纷加以转发、报道或评论。
现在,作者王贤文博士在《科学计量大数据及其应用》这部专着中,披露了那篇论文的机缘、由来与传播盛况。这项有趣的研究,不独直观地展现出科学家们夜以继日,探赜索隐的不倦努力,并暗示出科研成果源于“积小步,成大步”所铸就,而且初露出当今数字化、互联网、大数据时代的科学计量学新方向。
正是取代纸质出版物的数字文档,才使得科学论文可以不断下载而不会像纸质论文不断消耗,我们也才有了计量和分析的新对象;正是有了遍及全球的互联网,才使得宏大的数字文档数据库,吸引遍布世界各地的科学家前来搜索、浏览和下载所需的论着,我们也才有了监测和追踪科学家网上活动的有效手段;显而易见,仅仅监测和纪录论文下载的少量数据,不足以显现科学家下载论文的世界空间分布特征与时间分布周期规律;因此,这是一项需要大数据且能够产生大数据的计量研究。
在这本着作中,作者敏锐地把握住当今信息时代数字化、互联网、大数据三大技术特征,着眼于当代科学活动及科学文本的大数据引领科学计量学深刻变革的理念,将全书分为两大部分。第一部分为科学计量的大数据基础,分四章先后论述了数字出版、互联网与科学文献大数据,面向科学计量的数据体系,科学论文的使用数据和论文使用数据的开放获取优势;第二部分为论文大数据在科学计量中的应用,分四章分别探讨科学家的工作时间表,科学论文在社交网络中的传播机制,实时追索论文使用数据呈现的研究热点与研究前沿,以及基于使用、引用等多重指标数据的单篇论文评价体系。
该书令人耳目一新,不仅在于汇集了作者近五年来在科学计量学新方法一系列创造性的研究成果,而且还在于从这些成果中提炼出清晰的科学计量大数据思路与分析框架。众所周知,数据的完整性、可靠性与可获得性,是科学计量学方法应用中取得可靠性成果的基础与前提。过去常说科学计量学面对的是科学文献的海量数据,随着科研活动的不断拓宽和科研产出的急剧增长,数据规模亦迅速扩大,如今以“大数据”概念描述数据的大规模特征。因此,数据的挖掘、整理、清洗等一系列的处理方法,并构建有关科学活动的大数据获取利用平台,就成为科学计量学新方法的关键。当初贤文把他带领研究生监测世界各地网上下载论文的研究工作告诉我时,我立即意识到这是一个科学计量的大数据思路,应当作为新领域新方向新方法坚持下去,不断探索。这项研究成果发表后,我将贤文的开创性工作定为“基于大数据网络监测的科学活动计量分析”新领域系列研究成果,作为我们WISE实验室的两项重要成果之一,被大连理工大学人文学部列入985工程三期总结报告中的标志性成果,并上报纳入大连理工大学985工程三期总结报告中。如今,科学计量大数据思维方式已构成这本书的基础与主线。- 新闻来源于其它媒体,内容不代表本站立场!
-
原文链接
原文链接:
目前还没有人发表评论, 大家都在期待您的高见