编辑: 苹果的酸 2019-09-10
第14 卷第3期2016年09月生物信息学Chinese Journal of Bioinformatics Vol.

14 No.3 Sep.

2016 收稿日期:2016-04-09;

修回日期:2016-05-26. 作者简介:曹晨,男,博士研究生,研究方向:生物信息学;

E-mail: caochen13@ mails.jlu.edu.cn. ?通信作者:马,男,工程师;

研究方向:生物信息学;

E-mail: hrmakun@ 126.com. doi:10.3969 / j.issn.1672-5565.2016.03.09 蛋白质二级结构指定 曹晨1 ,马2? (1.吉林大学计算机科学与技术学院,长春 130012;

2.江苏恒瑞医药股份有限公司,江苏 连云港 222047) 摘要:蛋白质二级结构是指蛋白质骨架结构中有规律重复的构象. 由蛋白质原子坐标正确地指定蛋白质二级结构是分析 蛋白质结构与功能的基础,二级结构的指定对于蛋白质分类、蛋白质功能模体的发现以及理解蛋白质折叠机制有着重要的作 用. 并且蛋白质二级结构信息广泛应用到蛋白质分子可视化、蛋白质比对以及蛋白质结构预测中. 目前有超过

20 种蛋白质 二级结构指定方法,这些方法大体可以分为两大类:基于氢键和基于几何,不同方法指定结果之间的差异较大. 由于尚没有 蛋白质二级结构指定方法的综述文献,因此,本文主要介绍和总结已有蛋白质二级结构指定方法. 关键词:蛋白质二级结构指定;

蛋白质结构 中图分类号:Q71 文献标志码:A 文章编号:1672-5565(2016)03-181-07 Protein secondary structure assignment CAO Chen1 , MA Kun2? (1.College of Computer Science and Technology, Jilin University, Changchun 130012, China;

2.Jiangsu Hengrui Medicine Co., Ltd., Lianyungang Jiangsu 222047, China ) Abstract:Secondary structure protein refers to regular repeative sub?structures on the protein backbone. The accurate assignment of the secondary structure of proteins from protein atom coordinates underlies the analysis of protein structure and function. It is also very important for protein classification, finding functional motifs in proteins, and understanding the folding mechanisms of proteins as well as for molecular visualization, protein comparison and prediction. Thus, protein secondary structure assignment is still an active research field in structural bioinformatics. More than twenty secondary structure assignment methods have been developed and are generally categorized into two groups, i.e.,geometry?based and hydrogen bond?based. However, the consistence of secondary structure assigned by different methods is relatively low. These is no review paper about protein secondary structure assignment so far.Therefore,this paper mainly introduce and summarize these methods. Keywords:Protein secondary structure assignment;

Protein structure 蛋白质二级结构指定是研究蛋白质结构与功能 的基础,二级结构支撑着蛋白质组织构架并且是产 生蛋白质三维折叠模式的关键,二级结构的指定是 蛋白质结构预测的前提条件并且为蛋白质比较和功 能分析提供有效的方法. 然而由原子坐标正确地指 定蛋白质二级结构是一项重要且具有挑战的工作. 虽然目前已经有超过

20 种蛋白质二级结构指定程 序,但是不同程序指定结果之间差异较大. 由于目 前尚没有二级结构指定方法的综述文献,因此本文 对已有的方法进行总结并且介绍不同方法使用的二 级结构指定模式.

1 蛋白质二级结构介绍 在结构生物学和生物化学中,蛋白质二级结构 是指在蛋白质中有规则重复的构象.

1951 年,Linus Pauling 和同事根据模型蛋白骨架氢键准确地预测 出理想的螺旋和片层结构,同时指出,310 ?螺旋由于 键角不合适而不能出现在蛋白质中[1] ,但是后来发 现,310 ?螺旋残基在蛋白质中占有大概4% 的比例[2] . 随后,在1952 年,Kaj Ulrik Linderstr?m?Lang 在Linus Pauling 工作基础上,首次引入二级结构的 概念,与此同时,蛋白质一级结构和三级结构的概念 也被他一同引入[3] . Pauling 预言 α ?螺旋和 π ?螺 旋是通过蛋白质骨架的氢键: α ?螺旋具有重复的 (i,i+4)氢键而 π ?螺旋具有重复的(i,i+5)氢键[1] . 本文中,(i,i+n)氢键模式是指 i+n 号氨基酸残基的 N-H 基和 i 号氨基酸残基的 C = O 基形成氢键. Pauling 这篇文章在

20 世纪科研中被认为具有里程 碑的意义:第一次在分子生物学中使用了模型并且 获得了巨大的成功;

α ?螺旋和 β ?片层的发现是蛋 白质研究的基石[

4 ] . α ?螺旋和 β ?片层是蛋白质二级结构中最主要 的元素,具有这两种二级结构的残基占蛋白质残基 总数的一半[

1 ,

5 ] . 另外还有一些其他二级结构,例 如除了 α ?螺旋还有其他几种螺旋: π ?螺旋,310 ?螺旋,左手螺旋和 PPII 螺旋. π ?螺旋经常出现在 α ? 螺旋的末端或者 α ?螺旋的中间位置[

6 ] ,而且 π ?螺 旋和左手螺旋被发现和蛋白质功能关系密切[ 6-8 ] ;

α ?片层,在天然状态下虽然稀少,但是被认为是蛋 白质折叠的重要中间媒介结构[

9 ] ;

转角和环,在蛋 白质结构中扮演着连接规则元素的作用[

10 ,

11 ] ;

无 规则卷曲其实并不是一种特定二级结构,它是在不 能被指定为其他规则二级结构情况下的一种统称.

310 ?螺旋, α ?螺旋和 π ?螺旋分别是形成连续的 (i,i+3),(i,i+4),(i,i+5) 氢键模式(见图 1a)[

1 ] . 而左手螺旋又分为左手

310 ?螺旋和左手 α ?螺旋,其 氢键模式和相应的右手螺旋一致. 左手和右手的定 义是采用拇指指向螺旋轴延伸的方向,残基的 Cα 原 子的走向是右手的为右手螺旋,走向是左手则为左 手螺旋. 本文在没有特别说明的情况下,螺旋指的 是右手螺旋. β ?片层是相邻肽链骨架原子的NH基C ? ?O 基之间形成连续的氢键[

5 ] ,因为肽链的走向有两 种:由N端到 C 端;

由C端到 N 端. 因此,根据这两 条相邻肽链的走向, β ?片层可分为平行( 走向一 致)和反平行(走向相反) 两种(见图 1b). 在反平 行的 β ?片层结构中,氢键是平行的,平行的氢键使 反平行 β ?片层结构更加稳定,因此,反平行 β ?片层 在蛋白质结构中含量要比平行 β ?片层多[

12 ] . 图1α?螺旋和 β ?片层氢键模式示意图 Fig.

1 Hydrogen?bond patterns of α?helix and β?sheet 蛋白质二级结构在结构生物学的诸多领域具有 重要 的作用, 具体来说, 在蛋白质结构的可视化[

13 ] 、蛋白质结构的比较与分类[ 14-16 ] 、蛋白质的建 模与结构预测[

17 ] 、蛋白质的结构检查[

18 ] 、蛋白质 折叠[

19 ] ,蛋白质动力学的结构变化[

20 ,

21 ] 以及蛋白 -蛋白相互作用和蛋白质功能分析方面都有着广泛 的应用[

22 ] . 在结构生物学中,很多研究是基于蛋 白质二级结构正确指定基础上进行的.

2 蛋白质二级结构指定方法 Pauling 通过蛋白质骨架原子间氢键准确地预 测出理想的 α ?螺旋、 π ?螺旋和 β ?片层模型,由于 Pauling 第一次将氢键引入二级结构使得后来蛋白 质二级结构的定义也是基于氢键模式. 实际上二级 结构是结构生物学家通过肉眼对三维蛋白质晶体结 构进行的一种指定,然而,这种指定具有主观和任意 性,不同的结构生物学家会有不同的指定结果. 为 了解决这一问题,Levitt 和Greer 通过氢键和连续四 个Cα 原子的距离与二面角开发了第一个蛋白质二 级结 构指定程序[

23 ] . 随后, Kabsch 和Sander 在1983 年开发了基于近似氢键能量的蛋白质二级结 构自动指定方法:DSSP,DSSP 现在依然是蛋白质二 级结构指定领域中最流行的方法[

24 ] ,并且,根据氨

2 8

1 生物信息学第14 卷 基酸序列进行蛋白质二级结构预测的结果一般是和 DSSP 指定结果进行比较来检验预测结果的好坏[

25 ] .

1995 年Frishman 和Argos 开发了另一个基 于氢键模式的二级结构指定程序 STRIDE,STRIDE 可以看作是 DSSP 的一个改进:同样是计算氢键能 量,与DSSP 不同的是,STRIDE 氢键能量计算是基 于经验的氢键公式而不是像 DSSP 那样使用静电能 量近似氢键能量并且 STRIDE 将二级结构残基骨架 二面角( φ/ φ )限制在拉氏图 (Ramachandran plot) 的特定区域,具有相应的氢键模式但是( φ/ φ )在拉 氏图其他区域的残基将不被指定为相应的二级结 构[

26 ] . SECSTR 是Fodje 等人于

2002 年开发的, SECSTR 的主要目标是识别蛋白质中 π ?螺旋的结 构[

27 ] . SECSTR 发现 DSSP 和STRIDE 由于氢键模 式的优先性原因(i,i+4 氢键模式优先于 i,i+5 氢键 模式),经常会将 π ?螺旋错误地指定为 α ?螺旋. 通 过改变氢键模式的优先性,SECSTR 指定的 π ?螺旋 的含量是 DSSP 的10 倍左右,而π?螺旋被发现经 常和蛋白质的功能相联系,因此正确的识别 π ?螺旋 对研究蛋白质结构功能关........

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题