来衡量 式中,w为权重因子,下标o,c表示实测值,计算值。
6. 结构的表达:在获得精确的原子位置以后,要把结构完美的表达出来,这包括键长键角的计算,绘出分子结构图和晶胞图,并从其结构特点探讨某些可能的性能。
(二)生物大分子结构的测定[4]
生物大分子结构的测定,从原理上讲与小分子(无机物,有机物,配合物等)无异,但由于分子大也带来一定的特殊性,需要有一些不同于小分子的方法。
大分子的特点是分子量大,原子多,但原子序数小, 多数是C,H,O,N等轻元素,故散射能力低,不易收集到高角的衍射点,这会使电子密度图的分辨率降低。还因他晶胞大,所含原子数目多,需确定的结构参数就多,这与分辨率低有矛盾。另外,大分子晶体在X射线的照射下易于损坏,如何缩短实验时间也成为一个重要问题。
大分子由于分子量大,要求使用较大体积的单晶体,如对于分子量为5000的蛋白质分子,就要有大于0.3mm3的单晶体。但因其分子大,结晶就困难,而且很易结晶成孪晶,这不合用。得到合用的晶体是整个大分子结构测定中关键的一步,常说有了良好的晶体,结构测定一半的问题已解决了。
一般用回摆法收集衍射数据,用IP或CCD作探测器,可以在几个小时内完成数据收集工作。
关于相角问题,在解小分子结构中目前最常使用的直接法还不能用于大分子,而派特逊法,由于大分子缺少重原子也无法使用。目前是用基于派特逊法的几个方法来解决相角问题的。
(1)分子取代法:
有时, 几个不同的生物大分子是由相同的结构单位以不同方式连接而成的; 同一种生物大分子如在不同的条件中结晶,有可能得到不同的结晶,是为多结晶现象; 还有些生物分子,他们是由共同的分子祖先进化而得, 因此其中有相当部分是相同的。 对于这些类的生物分子,他们的派特逊图常有很大的相似性。 因此,在求解某生物大分子结构时,如能找到与他有类似的结构,且结构已测定的生物大分子结构时,则可按最大重叠原理找出待测物和已知物的派特逊图之间的关系, 从而得出未知物衍射的位相,进而解出结构。若已知物和待测物是同晶化合物,则可利用差值电子密度图来解出结构,更为简单。
若在已知结构的大分子结构数据库中找不到与待测物有类似结构的分子结构时,就不能使用此法,要使用以后的方法。
(2)重原子同晶置换法:
这种方法是设法把对X射线散射能力大的重金属原子,如Hg,Pb,Se等引入生物分子中,作为标识原子。这种置换入重原子的大分子应与无重原子时的原晶体有相同的晶胞参数和空间群,且绝大多数原子的位置相同,故称同晶置换。从这些含重原子晶体的衍射数据,利用基于派特逊法的方法可解出重原子的位置,据此算出其结构因子和相角,进而利用相角关系计算出没有重原子的原晶体的相角,解出结构。
经常使用不只一种重原子进行置换,以得几种同晶置换衍生物, 称多对同晶置换法。同晶置换
衍生物越多, 可正确定出的相角也越多。
(3)反常散射法
晶体衍射中有一条弗里德耳定律, 就是说不论晶体中是否存在对称中心,在晶体衍射中总存在着对称中心,也即有FHKL=FHKL。但是当使用的X射线波长与待测样品中某一元素的吸收边靠近时,就不遵从上述定律,也即FHKL≠FHKL。这是由电子的反常散射造成的, 利用这一现象可以解决待测物的相角问题。 一般, 这一方法常与重原子同晶置换法结合使用。
在收得同晶置换物的衍射数据后, 改变入射线波长至靠近重原子的吸收边处,再次收集数据,这套数据是存在反常散射的,可利用这两套数据来求位相。有如多同晶置换法,如采用几个不同波长的X射线,对所含不同元素收集几套反常散射数据,则可得更正确、更完整的相位信息,是为多波长反常衍射法(MAD),是目前解分子生物大分子的重要方法。实验室X射线光源不易使用这一方法, 因要改变X射线波长是很困难的,而对于同步X射线光源, 改变波长是相当方便的, 因此常被使用。
四.应用
晶体结构的测定对学科的发展、物体性能的解释、新产品的生产和研究等方面都有很大的作用,其应用面很宽,不能尽述,略谈几点如下:
(一).晶体结构的成功测定,在晶体学学科的发展上起了决定的作用。因为他将晶体具有周期性结构这一推测得到了证实,使晶体的许多特性得到了解释:如晶体能自发长成多面体外形(自范性),如立方体的食盐、六角形的水晶等,又如晶体各种物理性质(光性,导热性等)的各向异性和对称性等等。晶体学的发展有了坚实的基础。
(二).矿物学中曾有不少矿物的元素构成很接近,但他们的性质相差很远(如石墨和金刚石都是碳,还如一些硅酸盐),而有的矿物其物理或化学性质相近,但其元素组成又很不相同(如云母类矿物等),使人困惑。晶体结构的测定使性能的异同从结构上得到了合理的解释。如石墨因是层状结构,层间结合力差,故较软,而金刚石为共价键形成的骨架结构,故结合力强,无薄弱环节, 成为最硬的材料。
(三).人类和疾病作斗争,总离不开药物。原始的药物是天然产物,动植物或矿物。以后随着科学的发展,开展了从天然产物中提取有效成分的方法,而有效成分晶体结构的测定进一步将从天然产物中提取的方法改变为人工合成,使有可能大量制造,提高了产量、降低了成本、造福于人类。这种基于结构,设计出合成路线,工业制造的方法在染料,香料等许多工业部门都是广泛使用的。
(四)近年,基于病毒结构、人体内各种大分子结构的测定及人体感染疾病途径的了解,搞清了某些疾病感染及发展的结构匹配需要。人类已经根据这些结构知识设计结构上匹配的、合适的药物,来事先保护病毒和人体的结合点,或阻断病毒的自身繁衍,从而避免感染或控制其繁衍,而不使疾病发展, 这就是所谓的基于结构的、合理的药物设计[6]。图5中为艾滋病毒复制过程中不可缺的蛋白酶及人类设计的对称性抑制剂A-74704(方框内)之间的氢键结合模式。由于抑制剂的结合阻断了病毒的结合,使其无法复制。改变了过去神农尝百草型的经验寻找药物的方法。
图5 抑制剂与蛋白酶的氢键结合
五. 可能的发展方向:
(一)数据的积累
从前述的应用已经看出,晶体结构的测定及结构与性能关系的研究, 是今后走上人类按需设计新材料的基础。今日虽已测了许多晶体的结构,但还有许多未能测定,而且还不断有新化合物,新晶体出现, 因此不断的测定他们的结构,加以总结分析是十分必要的。当今已有多个晶体结构数据库,如:(1)剑桥结构数据库(CSD)。包括各种有机,有机金属化合物及配合物的晶体学数据。(2)无机晶体结构数据库(ICSD)。(3)金属结晶学数据库(CRXSTMET)。(4)蛋白质数据库(PDB)。(5)晶体学数据(CD)。(6)粉末衍射卡片(PDF)。(7)有序无序结构数据库(OD)等。
(二)各种生物大分子结构的测定
2001年2月12日,人类基因组框架图发表。接下来的任务是要把各基因的结构和功能搞清楚,有大量的基因结构需要测定。世界上已经成立了结构基因组的国际合作组织,分配人类基因结构的测定任务。除了人类基因以外,还有水稻基因组,各种病毒等范围更广的生物大分子结构需测定。生物大分子的数量将会远远超过各种无机物,有机物分子的总量。生物大分子结构测定将是今后晶体结构测定的主要任务。
(三)结构与性能关系的研究与应用
按照已知的结构和性能的关系设计制造需要的新材料是进行大量结构测定的目的。如何总结大量已测结构的规律并与其性能、功能相联系是今后的任务之一。特别是生物结构与功能的关系。进一步如何利用这种关系设计制造人类需要的材料,药物等, 更是永不完结的任务。
(四)解生物大分子结构方法的发展
目前虽已有各种方法用来解决相角的问题,但要置换许多同晶化合物还是颇费时和颇昂贵的,如果能如小分子那样用直接法来解决相角问题,将会方便许多。我国科学家范海福院士是研究直接法的世界权威人物,正在进行这方面的研究。
(五) 单晶体结构分析实验方法的发展
目前的实验室单晶体结构分析方法对于测定小分子的单晶体结构已经是相当完美了, 但对于巨大的生物大分子就显得软弱无力,主要是光源强度不够,光的平行性不良,波长又不好调。目前主要要依靠同步辐射作为X射线源。我国二个同步辐射光源之一的位于合肥的国家同步辐射实验室(NSRL)今年上半年已胜利完成用于生物大分子结构测定的光束线与实验站的建设, 并已收集到尖吻蝮蛇蛇毒磷脂酸A2,神经毒等多种生物大分子的衍射数据,并解出了结构。另一个北京同步辐射装置(BSRF) 的生物平台使用的是聚焦光束。也已于2002年12月4日投入试运转,在样品冷冻条件下成功地收集了18套结构数据,情况良好。数据分析正在进行中。
同步辐射是一种大科学装置,设备大投资高,一般都需要政府投资,不是一般实验室所能具备的,需要申请立项才能使用。因此,如果能发展出高强度的实验室光源和极高灵敏度的探测器,使在一般实验室中也能测定生物大分子结构,则绝对是有益的。
有许多生物反应的速度是相当快的, 如血红蛋白与一氧化碳的结合,速度在纳秒级(10-9sec),要对这种反应进行动力学研究,既要有高强度脉冲光源, 又要有快速切换的探测器以连续跟踪反应。现在已有了强脉冲光源,但探测器的切换速度却慢太多,需要作长时间的更大的努力。
参考文献:
[1] 郑培菊,马礼敦. 同步X射线衍射。见马礼敦,杨福家主编。同步辐射应用概论,第2章。上海:复旦大学出版社,2001
[2] 陈鸣琴.X射线单晶体衍射结构分析。见马礼敦主编。高等结构分析,第八章。上海:复旦大学出版社,2002
[3] 周公度. 晶体结构测定. 北京:科学出版社,1981
[4] 卢光莹,华子千. 生物大分子晶体学基础. 北京:北京大学出版社,1995
[5] 钱逸泰. 结晶化学导论,第二版. 合肥:中国科学技术大学出版社,1999
[6] 陈凯先,蒋华良,嵇汝运. 计算机辅助药物设计原理、方法和应用. 上海:上海科学技术出版社,2000
[7] Stephen K,Burley. Anoverviews of structural genomics. Nature Struct Biol. 2000,supplement,7:932~934