编辑: 紫甘兰 | 2019-07-10 |
7 系统,安装 SeqMule 之前要先安装必要的软件和环境,相关命令如下: sudo yum install?y gcc gcc?c + + make cmake
9 8
1 第3期李鑫,等:一站式全基因组和外显子组测序数据自动分析软件(SeqMule) ncurses?devel ncurses R unzip automake autoconf git? core gzip tar 图1SeqMule 的工作流程图 Fig.
1 Scheme of SeqMule workflow 2) 下载 SeqMule 程序 git clone https:/ / github. com/ WGLab / SeqMule.git,如果 Https 不支持也可以 用git 模式git clone git:/ / github. com/ WGLab / SeqMule.git. 3)进入 SeqMule 文件夹,利用. / Build freshinstall 进行初始安装. 4) 安装一次后, 利用. / Build installexes 安装missing 的部分. 5)由于 GATK 要单独安装,利用. / Build gatk 看 安装命令,核心就是把 GATK 的jar 文件拷贝到制定 文件夹. 6)把环境变量写到用户的 bashrc 里面,然后用 source 命令更新以下环境变量,这样 Seqmule 就可 以不制 定他的绝对位置来使用了, 否则会出现command 找不到的情况. echo ?export PATH= $ PATH:absolute_path_to _seqmule / bin? >
>
~ / .bashrc source ~ / .bashrc 7)下载 Seqmule 要使用到的 Database,seqmule download -down hg19all. 此部分利用 terminal 下载很缓慢,建议使用专 用下载工具下载,大概有
40 G 左右. 将下载的文件 放到 SeqMule 的database 文件里,再利用 SeqMule download?down hg19all 命令进行解压缩,然后把文 件再按名称放到指定文件夹. 另外,笔者已将下载 好的 database 文件夹都放置到百度云,读者可以通 过shunxirm@ 163.com 获取下载秘钥. 1.3 SeqMule 软件的运行 SeqMule 软件运行在 Linux 系统平台下,命令简 单且易于掌握. 根据测序方法不同,SeqMule 的分 析方式也不同. SeqMule 主要包括三种分析方式, 分别是:典型的外显子组分析、快速转换的全基因组 分析和 基于家系的三人外显子组分析. 此外, SeqMule 软件可以一次性分析多个样本,大大简化 了生物信息学研究人员的操作. 1.3.1 SeqMule 软件的使用命令 在存放需要分析的 FASTQ 格式文件的文件夹 下,打开系统终端,输入以下命令运行 SeqMule: seqmule pipeline?a normal_R1.fastq.gz?b normal_ R2.fastq.gz?prefix example?N 2?capture default?threads 4-e 其中,normal_R1.fastq.gz 和normal_R2.fastq.gz 是DNA 经过测序仪测序后产生的 FASTQ 格式的压 缩文件,分别是一条 DNA 上两条链的基因数据. 参数 ?prefix example 是告诉 SeqMule 软件你的样本 名称是 example;
?capture default 是让 SeqMule 软 件使用默认的区域定义文件― ― ―hg19 外显子区,对 应文件可从安捷伦 SureSelect 工具包中下载;
- threads
4 是令 SeqMule 软件在运行时使用该计算 机的四个线程;
?e 的意思是这个数据集是外显子 组数据或者捕获的测序数据,而不是全基因组数据. 1.3.2 典型的外显子组分析命令 通过测 序仪对外显子组测序后, 得到四个FASTQ 文件的压缩文档,在终端下运行以下命令进 行典型外显子组分析: seqmule pipeline?a sample _ lane1 _ R1. fq. gz, sample_ lane2 _ R1. fq. gz?b sample _ lane1 _ R2. fq. gz, sample _ lane2 _ R2. fq. gz?capture seqmule / database / hg19- nimblegen / nexterarapidcapture _ exome _ targetedregions _ v1. 2. bed?m?e?advanced seqmule / misc / predefined_con- fig / bwa_ gatk _ HaplotypeCaller. config?quick?t 4? prefix mySample 命令 中 -advanced seqmule / misc / predefined _ config / bwa _ gatk _ Hap........