编辑: 252276522 | 2019-07-17 |
1 李杰1,陈超美2 1.
首都经济贸易大学-安全与环境 工程学院 2. Drexel University- College of Computing and Informatics 配套教程: 李杰, 陈超美著.CiteSpace科技文本挖掘及可视化[M].首都经济贸易大学出版社.2016. 作者博客: 李杰博客:http://blog.sciencenet.cn/u/jerrycueb;
陈超美博客:http://blog.sciencenet.cn/u/ChaomeiChen CiteSpace微信知识分享平台 FAQ part I 对于初学者使用CiteSpace来讲,会遇到一些常见的问题.笔者将比较重要的总结为以下几点, 欢迎大家继续添加. ① 下载的WoS数据为什么不能做文献共被引分析? ② 图谱左上角的参数是什么意思?图谱参数在什么范围比较合理? ③ 可视化界面中的各个界面功能是什么?(包含节点属性、标签属性以及聚类方法的介绍) ④ 关于网络的布局问题,为什么重新运行后图谱整体的布局不一样了? ⑤ 名词性术语的提取,为什么提取不出来? ⑥ 网络中相同含义的词汇如何合并(单复数、英式和美式英语以及同义词合并)? ⑦ 在CiteSpace中关键文献如何确定? 1.下载的WoS数据为什么不能做文献共被引分析?
1 2
3 4 为了保证进行文献共被引分析,收集数据时包含参考文献信息是至关重要的. 可以按照下面步骤收集数据,或可参照详细版数据收集方法 http://cluster.ischool.drexel.edu/~cchen/citespace/doc/tutorial/how_to/1.download_from_WOS.pdf 2.图谱左上角的参数是什么意思?图谱参数在什么范围比较合理? ① CiteSpace, V.3.8 R5(64 bit)表示使用软件的版本信 息②September 28,2014 10:31:41PM CEST表示进行结果 计算时的时间 ③ C:\User\Jerry Lee\.CiteSpace… 表示数据所存放的 文件夹位置 ④ Time Span:2007-2014(slice Length=1)表示所分析 的时间区间,括号中代表的是时间切片.也就是 说把这个时间区间按照多少年为一段进行切割. ⑤ Selection criteria:Top100 per slice表示的是提取了 每个时间切片排名前100位的数据来生成最终的网 络(这里选用的节点类型不同,top100的具体含义 会有差异.如选择的是作者合作分析时,则提取 的是这个时间段内发文量top 100的作者,做共被 引分析时则提取的是被引频次在每个时间切片 top100的数据). ⑥ Network:N=194, E=2352(density=0.1256),N表 示网络节点数量,E表示连线数量,Density则表示 网络的密度 ⑦ Pruning表示网络裁剪的方法,这里None表示没有剪裁. ⑧ Modularity表示网络的模块度,值越大表示网络的聚类结果 越好. ⑨ Mean Silhouette=1, Silhouette值是用来衡量网络同质性的指 标,越接近1,反映网络的同质性越高(注意Silhouette 主 要在聚类后来衡量某个聚类内部的同质性,但是在聚类内 部成员很少时,这个值的信度会降低) 3.可视化界面中的各个界面功能是什么?(包含节点属性、标签属性以及聚类方法的介绍)
1 6
2 3
4 5
8 7
1 2 终止布局优化过程 重启布局优化过程 对网络进行聚类 网络稳定后单击即可 聚类后需要对聚类进行命名, 此时可以从标题、关键词或 摘要中提取 选择聚类命名抽取的方法 对节点按照某一属性进行显示,依 次为引文历史年轮、中心性、Sigma 指数、PageRank、统一尺寸、聚类 类别、Web of Science 范围内引文总 量 节点的基本信息查询 背景颜色调整 3.可视化界面中的各个界面功能是什么?(包含节点属性、标签属性以及聚类方法的介绍)