学术、科研、发文章的三件利器(2)

3.2.4 Mendeley文献文件的组织方法

之前有提到,文献池文件夹是可以清理的,因为被Mendeley检测到的新添加的文件会被转移到Mendeley自己指定的文件夹下。那么它是怎么组织这些文件的,文件目录的层次结构是怎样的,文件和数据库中的内容又是如何对应关联的,这就是这一节需要说明的内容。

首先,文件被导入进来并且已被识别,一些基本信息比如标题、作者等等已经显示出来,与此同时,Mendeley会复制一份文件到自己的文件目录下,这个目录的位置我们是可以定制的,甚至于文件目录的层次结构也是可以设定的。具体方法如下图。

Mendeley - file organize

上图是Mendeley选项界面的file organizer标签。第一个框中所显示的即是所指定的Mendeley的文件根目录。第二个框中所表示的是目录下子文件夹的层次结构,这里我采用了两层结构,第一层为期刊名,第二层为年份,这样,在根目录下会为每一个期刊创建一个文件夹,然后在每一个期刊文件夹下再创建不同年份的文件夹,怎么样,很有条理吧,当然可以自己随意定制,而且只需拖拽不同的标签(fields)到文件路径(folder path)栏就可以了,改动后文件会被自动重新整理。第三个框中所显示的是定制文件名的形式的内容,每个文件被移动到对应的文件夹下后,还可以指定文件名的组织形式,这里我使用的是“年份 – 标题”的形式,同样的,可以自由拖拽定制。

通过以上设定,大量的文件可以被有序地组织起来,真的是赏心悦目。

 3.2.5 Mendeley的数据库结构

这一部分是纯理性探究的内容,对使用没有影响,只是出于好奇,想弄清楚它的运作原理,理解了原理之后当然会能更好地使用它。

Mendeley所使用的数据库是SQLite,从这个SQLite的Lite可以看出,这是一个轻量的服务器,的确如此,SQLite的最大特点是它是没有服务器客户端这样的说法的,它的运行无需外部依赖,不需要安装各种服务,不需要配置,于是响应速度很快,特别适合Mendeley这种管理本地内容的程序。

SQLite数据库的数据库文件以“.sqlite”为扩展名,可以使用SQLite Database Browser等应用程序打开,不过不建议改动Mendeley程序目录下的sqlite文件,感兴趣的话可以复制出来再研究,可以发现很多有趣的东西。

3.2.6 推荐的Mendeley的一些使用方法

对文献的研究主要方法有分类、标签、标注等等。这里介绍我觉得比较好用的方法。

首先,Mendeley将所有导入的文献构成的集合叫做“my library”,并且在软件界面的左侧显示出整个“my library”的文献情况,我们可以在其中建立不同的文件夹,将文献进行各种分类。下图说明了一种利用的情况。

Mendeley - tips

如上图,“my library”下默认有几个常用的分类标签,比如“All Documents”、“Recently Added”、“Unsorted”等,点击这些标签,会在右侧的文献信息显示栏中将其中的文件列出来,比如这里点击了“All Documents”,右侧显示的就是所有文献。

可以自行增减分类,并形成目录层次,比如上图框中显示的。这里我新建了一个叫做“Dissertation”的分类,也就是博士论文中所有引用、参考的文献的合集,然后可以在此类下按照章节等,构建出一个文献目录来。

当然有些人会问,这里新建的这种文件目录会不会对文件的存放位置等等做出改变,或者说这样做会不会在磁盘上新建如此结构的文件树?当然不会,每个文献在Mendeley中只对应一个文件,在存储上也只存储一个文件,并只会按照上上一节的方法组织文件。上面所说的分类目录并不会对文件在磁盘上的存储产生影响。

此外,一个文献可以被添加到多个自定的分类目录中,比如它在博士论文中被引用了,同时又在发表的文章中被引用了,又比如在第一章中然后又在第二章中被引用了,等等。

还有要说明的是,对文献的引用,可以安装一个叫WordPlugin的插件,这样在Word中的参考文献工具下会出现Mendeley的文献引用工具菜单,然后就可以非常方便地添加参考文献了。如果对引用的格式不满意的,可以自行定义引用格式,但是需要一定的编程基础,不过常用的格式偏差不大,Mendeley中也自带了多种,基本够用。

最后Mendeley的文献可以同步到云端,并且提供了2G的免费空间,可以说绰绰有余了,这样就可以在手机、平板电脑和其他电子设备上同步内容了。这样在喝咖啡等公车等女朋友下楼时都可以看上一会儿文献,是不是很酷。


感觉好久没有写这么多东西了,写起来有点挡不住啊。下一篇再说Matlab吧,文献相关的内容到此为止吧。

欢迎提出意见建议,欢迎评论分享。

此外,求关注。桌面用户请点击左侧、移动设备用户点击下方的微博关注按钮,谢谢。

下课。

 

学术、科研、发文章的三件利器(1)

1. 引言

博士论文已经写完了,答辩也进入了最后的准备阶段,有必要将博士期间的一些收获总结一下。

博士论文的撰写总共花了整整一个月的的时间,从4月初到5月中旬左右,自己觉得效率还是蛮高的。特别是博士论文中的很多内容都是新写进去的,之前发表的文章内容毕竟很少,而且为了使通篇更流畅,之前的文章其实可用的内容并不多。

特别是在论文的第二章,做了之前不敢做的一件事情,就是整理出了一个review。单单review部分就参考了50篇左右的文章,并且还对它们的研究内容、方法、结论等等做了不同角度的归纳,说实话工作量还是相当大的。如果在平时,干干停停,个把月的时间写这么一篇文章,都可以说是很厉害了,这次只用了10天左右的时间,还是很自豪的。所以说,人的潜力都是很大的,就是看有没有这样的决心了。好啦,自我表扬到此结束。下面开始正题。

2. 背景

在写博士论文的过程中发现了这样一个问题,对于以前没有好好做review感到惋惜和后怕,甚至惊出一身冷汗。由于下定决心要写出一个像样的review来,的确还是下了狠功夫的。而且,的确在此过程中发现了一些好的方法和经验,于是斗胆献拙,与大家共勉。

此外,还有一些感慨与领悟也一并讲出来,为博士生涯做一个结吧。

这篇文章主要还是以“学术、科研、发文章的三大利器”为主要内容,毕竟题目叫这个嘛,至于题目为何叫这个,主要还是觉得高大上一点能吸引眼球啊。

OK,背景到此结束,下面开始正题。(终于开始正题了……..)

3. 利器

将要介绍的三大利器分别是Google scholar,Mendeley和Matlab。

前两个是文献相关的工具,最后是数据处理相关的工具。

搞科研,其实应该是从整理文献开始的。这一点非常重要,往往是实验什么早已开始了,文献还没看几篇,然后终于有一天发现,这一步还是跳不过去。可以毫不夸张地说,对文献掌握的水平决定了也标志着科研的水平。

那么如何提高文献水平,就是非常迫切需要解决的问题了。每个人的方法都不一样,甚至会有过目不忘的神人,一篇文章看完一遍,数月甚至数年后仍能如数家珍娓娓道来,但是,对于一般人,如何获取和掌握大量的的文献信息是需要技巧的。

此外,工科的同学们往往需要做大量的实验,并且需要获取大量的信息,然后还要对这些信息进行分析处理,这个过程和文献整理的过程其实非常相似,都是从混沌中获得需要的信息并对其进行处理分析,只不过形态和方法上有些差异。

后面的叙述可能处女座的看起来会比较愉悦,因为涉及了大量的将无序的、混乱的信息梳理、分类、整合的过程,这应该会是一种享受吧。反正对我来说是这样的。

3.1 利器一:Google scholar

首先,谈谈文献的获取。

相关的方法有很多,如果您已近觉得您的方法足以获得大量优质的文献资料了,尽可与众分享,如果您还未开始收集文献或者正为选择何种工具发愁,尽可试试我下面描述的方法。

Google是信息检索领域目前最优秀最领先的公司了,至少我是这么认为的。虽然它也曾在涉足其他领域时铩羽,玩坏了不少项目,不过在信息整理、检索等相关技术上,的确无出其右者。

Google scholar即是专门针对文献类信息的一种检索引擎,它基于Google强大的信息检索引擎技术,覆盖了较广的文献来源,排序机制还算比较合理,而且有多种自定义检索设定和组合,还能将检索到的文献收藏,甚至可以检索专利,当然,还是完全免费的。

我是将Google scholar和下面要说的Mendeley配合使用的,目前效果相当不错。

3.2 利器二:Mendeley

Mendeley是非常好用的一款文献管理软件,它可以运行在Windows、Mac和Linux平台,甚至于iOS设备上,功能十分强大,可以完成从文献获取之后到编辑引用的整个流程,而且它还引入了社交元素,并且建立了文献数据库,文献的基本信息可以被分享、收藏等等。

由于版权等原因,一般地,mendeley不提供文献下载的功能,但是支持多种导入方法。

3.2.1 文献的检索和获取

如前文所述,文件的检索由Google完成,在检索到需要的文献时,一般地,我会选择将这个文献用Google收藏起来,目的是表明,这个文献已经被我添加到我自己的文献数据库中了,当然这个数据库不仅仅指Google的数据库,而且表示我已经将它下载到本地了,下次检索到它是,Google会标明只是已收藏的文献,那么就无需再次下载或者浏览它了,相当于给他加了一个已读标签。

如下图,在Google scholar搜索airplane,第一条结果,点击下方的“保存”链接,即可将其加入个人图书馆,之后再次检索到它的时候会显示为已保存,这样就不需要再次浏览或者下载它了。 屏幕快照 2014-07-02 23.37.24

当然,也可以使用Google scholar的“我的图书馆”功能管理文献,不过最大的问题是它不能显示全文,所以,只是用这个功能做一个标记而已。

文献的下载很方便,如果在学校的话由于ip地址在某个期刊或者出版商的许可范围内,Google scholar会在搜索结果的右侧显示下载的地址或者出版商等的该文献页面,我们只需移步然后点击下载就好。当然如果学校没有买该出版商的版权,那么有可能会下载不了,这样的话就需要移步到Google搜索了。

 3.2.2 文献的存放和导入

当我们从网页下载文献的时候,浏览器会问我们这个文件(一般是pdf格式的)要存放到哪里。我建议在硬盘上建立一个文件夹,可以命名为“document pool”,我们称这个文件夹为文献池,所有下载来的文献都放到这里。

建议这么做的原因是,mendeley软件有一种文件导入的功能叫做“文件夹监视”,顾名思义,即是设定一个文件夹被mendeley监视,当新的文件被添加进来的时候,只要mendeley运行着,它会自动被识别,并添加到mendeley数据库中。当然如果mendeley在下载新文件时没有运行,那么在下次它被运行时会自动添加进来。

这时候处女座要问了,那放在这个监视文件夹下的文件是不是不能移动啊,万一删了在mendeley中是不是就没有了?哈哈,当然不会,而且的确建议你过一段时间就清理一下这个文件夹,毕竟占用磁盘空间不是。那么,mendeley是怎么处理这些监控到的文件的呢。这就要谈论到mendeley的文献组织和数据库了,下下一节中讨论。

当然文献的导入不只有这一种方法,在文件工具栏选择导入、将文件拖拽到mendeley,这些方法都是可以的。

3.2.3 Mendeley中文献文件的识别

导入的pdf文件是会被自动识别的。识别的原理会比较复杂,但是这里需要说明的是“doi”这么一个属性,Mendeley估计是将这一项作为识别的最重要的特征。当然此外论文标题、作者、出版信息等其他项目,可以通过与数据库对比特征进行最终的确认。

“doi”(Digital Object Identifier,简称DOI,注意不是Dio)是一套识别数字资源的机制,涵括的对象有视频、报告或书籍等等。对于文献资源来说,一篇文献对应一个DOI代码,一本书也对应一个DOI码,获得了一个文献的DOI码,就可以在多个不同的数据库中把这个文献的详细信息找出来,怎么样,有没有很厉害。所以我们优先从pdf文件中识别出这个文献的DOI,然后检索这个DOI,这个文献的各种信息就都显示出来啦。

Mendeley也是优先从pdf中找DOI,因为现在很多的出版商还是比较上道的,他们会在文件中包含DOI信息,但是也有很多不靠谱的或者很古老的文献,文件里没有DOI信息,那就只能通过找标题等其他信息了。

Mendeley在识别出文件信息后,在界面右侧的“details”里会列出各种信息,比如标题、作者、期刊名称、年份等等,其中有一项叫做“Catalog IDs”的栏目,该栏目下就包括了“ArXiv ID”、“DOI”和“PMID”这三项,如果DOI被Mendeley识别了,会在这里显示出来。

这时候建议点击DOI这行右侧的搜索按钮,Mendeley会以此作为indicator去文献数据库中搜索,更新一些信息,比如摘要、或者识别有误的项目等等。

如果Mendeley识别一个pdf文件不成功,或者它觉得识别结果不是很可靠的时候,它会建议以文件名在Google中搜索,以获取文献的详细信息。您可以这么做,也可以自己找到这个文献的DOI,输入“Catalog IDs”栏目下的“DOI”项中,然后点击检索,结果也会非常好。

当然还有很坏的情况,现在只有文献pdf文件,没有DOI,Mendeley中也不提示Google搜索,那怎么办。很简单,在对应的栏目中自己输入相应的内容就好了,当然会比较累。


忽然发现竟然写了这么多,果然太唠叨。那么就到此分为第一篇。

欢迎多提意见建议,欢迎评论分享。