分子生物学课程教学讲义 朱玉贤
第一讲 序论
二、现代分子生物学中的主要里程碑
分子生物学是研究核酸、蛋白质等所有生物大分子的形态、结构特征及其重要性、规律性和相互关系的科学,是人类从分子水平上真正揭开生物世界的奥秘,由被动地适应自然界转向主动地改造和重组自然界的基础学科。当人们意识到同一生物不同世代之间的连续性是由生物体自身所携带的遗传物质所决定的,科学家为揭示这些遗传密码所进行的努力就成为人类征服自然的一部分,而以生物大分子为研究对像的分子生物学就迅速成为现代社会中最具活力的科学。
从1847年Schleiden和Schwann提出"细胞学说",证明动、植物都是由细胞组成的到今天,虽然不过短短一百多年时间,我们对生物大分子--细胞的化学组成却有了深刻的认识。孟德尔的遗传学规律最先使人们对性状遗传产生了理性认识,而Morgan的基因学说则进一步将"性状"与"基因"相耦联,成为分子遗传学的奠基石。Watson和Crick所提出的脱氧核糖酸双螺旋模型,为充分揭示遗传信息的传递规律铺平了道路。在蛋白质化学方面,继Sumner在1936年证实酶是蛋白质之后,Sanger利用纸电泳及层析技术于1953年首次阐明胰岛素的一级结构,开创了蛋白质序列分析的先河。而Kendrew和Perutz利用X射线衍射技术解析了肌红蛋白(myoglobin)及血红蛋白(hemoglobin)的三维结构,论证了这些蛋白质在输送分子氧过程中的特殊作用,成为研究生物大分子空间立体构型的先驱。
1910年,德国科学家Kossel第一个分离了腺嘌呤,胸腺嘧啶和组氨酸。
1959年,美国科学家Uchoa第一次合成了核糖核酸,实现了将基因内的遗传信息通过RNA翻译成蛋白质的过程。同年,Kornberg实现了试管内细菌细胞中DNA的复制。
1962年,Watson(美)和Crick(英)因为在1953年提出DNA的反向平行双螺旋模型而与Wilkins共获Noble生理医学奖,后者通过X射线衍射证实了Watson-Crick模型。
1965年,法国科学家Jacob和Monod提出并证实了操纵子(operon)作为调节细菌细胞代谢的分子机制。此外,他们还首次推测存在一种与DNA序列相互补、能将它所编码的遗传信息带到蛋白质合成场所(细胞质)并翻译产生蛋白质的mRNA(信使核糖核酸)。
1972年,Paul Berg(美)第一次进行了DNA重组。
1977年,Sanger和Gilbert(英)第一次进行了DNA序列分析。
1988年,McClintock由于在50年代提出并发现了可移动遗传因子(jumping gene或称mobile element)而获得Nobel奖。
1993年,美国科学家Roberts和Sharp因发现断裂基因(introns)而获得Nobel奖。Mullis由于发明PCR仪而与加拿大学者Smith(第一个设计基因定点突变)共享Nobel化学奖。
此外,Griffith(1928)及Avery(1944)等人关于致病力强的光滑型(S型)肺炎链球菌DNA导致致病力弱的粗糙型(R型)细菌发生遗传转化的实验;Hershey和Chase(1952)关于DNA是遗传物质的实验;Crick于1954年所提出的遗传信息传递规律(即中心法则):Meselson和Stahl(1958)关于DNA半保留复制的实验以及Yanofsky和Brener(1961)年关于遗传密码三联子的设想都为分子生物学的发展做出了重大贡献。
我国生物科学家吴宪20世纪20年代初回国后在协和医科大学生化系与汪猷、张昌颖等人一道完成了蛋白质变性理论、血液生化检测和免疫化学等一系列有重大影响的研究,成为我国生物化学界的先驱。20世纪60年代、70年代和80年代,我国科学家相继实现了人工全合成有生物学活性的结晶牛胰岛素,解出了三方二锌猪胰岛素的晶体结构,采用有机合成与酶促相结合的方法完成了酵母丙氨酸转移核糖核酸的人工全合成,在酶学研究、蛋白质结构及生物膜结构与功能等方面都有世所瞩目的建树。
三、分子生物学的主要研究内容
所有生物体中的有机大分子都是以碳原子为核心,并以共价键的形式与氢、氧、氮及磷以不同方式构成的。不仅如此,一切生物体中的各类有机大分子都是由完全相同的单体,如蛋白质分子中的20种氨基酸、DNA及RNA中的8种碱基所组合而成的,由此产生了分子生物学的3条基本原理:
1. 构成生物体有机大分子的单体在不同生物中都是相同的;
2. 生物体内一切有机大分子的建成都遵循着各自特定的规则;
3. 某一特定生物体所拥有的核酸及蛋白质分子决定了它的属性。
分子生物学研究内容:
DNA重组技术------基因工程
基因表达调控-------核酸生物学
生物大分子结构功能----结构分子生物学
DNA重组技术(又称基因工程)
这是20世纪70年代初兴起的技术科学,目的是将不同DNA片段(如某个基因或基因的一部分)按照人们的设计定向连接起来,在特定的受体细胞中与载体同时复制并得到表达,产生影响受体细胞的新的遗传性状。严格地说,DNA重组技术并不完全等于基因工程,因为后者还包括其他可能使生物细胞基因组结构得到改造的体系。DNA重组技术是核酸化学、蛋白质化学、酶工程及微生物学、遗传学、细胞学长期深入研究的结晶,而限制性内切酶DNA连接酶及其他工具酶的发现与应用则是这一技术得以建立的关键。
DNA重组技术有着广阔的应用前景NA重组技术可用于定向改造某些生物基因组结构,使它们所具备的特殊经济价值或功能得以成百 上千倍的地提高。DNA重组技术还被用来进行基础研究。如果说,分子生物学研究的核心是遗传信息的传递和控制,那么根据中心法则,我们要研究的就是从DNA到RNA,再到蛋白质的全过程,也即基因的表达与调控。在这里,无论是对启动子的研究(包括调控元件或称顺式作用元件),还是对转录因子的克隆及分析,都离不开重组DNA技术的应用。
基因表达调控研究
因为蛋白质分子参与并控制了细胞的一切代谢活动,而决定蛋白质结构和合成时序的信息都由核酸(主要是脱氧核糖核酸)分子编码,表现为特定的核苷酸序列,所以基因表达实质上就是遗传信息的转录和翻译。在个体生长发育过程中生物遗传信息的表达按一定的时序发生变化(时序调节),并随着内外环境的变化而不断加以修正(环境调控)。
原核生物的基因组和染色体结构都比真核生物简单,转录和翻译在同一时间和空间内发生,基因表达的调控主要发生在转录水平。真核生物有细胞核结构,转录和翻译过程在时间和空间上都被分隔开,且在转录和翻译后都有复杂的信息加工过程,其基因表达的调控可以发生在各种不同的水平上。基因表达调控主要表现在信号传导研究、转录因子研究及RNA剪辑3个方面。
转录因子是一群能与基因5'端上游特定序列专一结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。
真核基因在结构上的不连续性是近10年来生物学上的重大发现之一。当基因转录成pre-mRNA后,除了在5'端加帽及3'端加多聚A[polyA]之外,还要将隔开各个相邻编码区的内含子剪去,使外显子(编码区)相连后成为成熟mRNA。研究发现,有许多基因不是将它们的内含子全部剪去,而是在不同的细胞或不同的发育阶段有选择地剪接其中部分内含子,因此生成不同的mRNA及蛋白质分子。
结构分子生物学
生物大分子的结构功能研究(又称结构分子生物学) 一个生物大分子,无论是核酸、蛋白质或多糖,在发挥生物学功能时,必须具备两个前提:首先,它拥有特定的空间结构(三维结构);其次,在它发挥生物学功能的过程中必定存在着结构和构象的变化。
结构分子生物学就是研究生物大分子特定的空间结构及结构的运动变化与其生物学功能关系的科学。它包括结构的测定、结构运动变化规律的探索及结构与功能相互关系的建立3个主要研究方向。最常见的研究三维结构及其运动规律的手段是X射线衍射的晶体学(又称蛋白质晶体学),其次是用二维核磁共振和多维核磁研究液相结构,也有人用电镜三维重组、电子衍射、中子衍射和各种频谱学方法研究生物高分子的空间结构。
------------------------------------------------------------------------------------------------
第二讲 染色体与DNA
一、 DNA的组成与结构
Avery在1944年的研究报告中写道:"当溶液中酒精的体积达到9/10时,有纤维状物质析出。如稍加搅拌,它就会象棉线在线轴上一样绕在硬棒上,溶液中的其它成份则呈颗粒状沉淀。溶解纤维状物质并重复数次,可提高其纯度。这一物质具有很强的生物学活性,初步实验证实,它很可能就是DNA(谁能想到!)"。对DNA分子的物理化学研究导致了现代生物学翻天覆地的革命,这更是Avery所没有想到。
所谓DNA的一级结构,就是指4种核苷酸的连接及其排列顺序,表示了该DNA分子的化学构成。核苷酸序列对DNA高级结构的形成有很大影响,如B-DNA中多聚(G-C)区易出现左手螺旋DNA(Z-DNA),而反向重复的DNA片段易出现发卡式结构等。DNA不仅具有严格的化学组成,还具有特殊的高级结构,它主要以有规则的双螺旋形式存在,其基本特点是:
1、DNA分子是由两条互相平行的脱氧核苷酸长链盘绕而成的。
2、DNA分子中的脱氧核糖和磷酸交替连接,排在外侧,构成基本骨架,碱基排列在内侧。
3、两条链上的碱基通过氢键相结合,形成碱基对,它的组成有一定的规律。这就是嘌呤与嘧啶配对,而且腺嘌呤(A)只能与胸腺嘧啶(T)配对,鸟嘌呤(G)只能与胞嘧啶(C)配对。如一条链上某一碱基是C,另一条链上与它配对的碱基必定是G。碱基之间的这种一一对应的关系叫碱基互补配对原则。组成DNA分子的碱基虽然只有4种,它们的配对方式也只有A与T,C与G两种,但是,由于碱基可以任何顺序排列,构成了DNA分子的多样性。例如,某DNA分子的一条多核苷酸链有100个不同的碱基组成,它们的可能排列方式就是4100。
二、 DNA聚合酶与DNA的合成
The accuracy of translation relies on the specificity of base pairing. The actual rate in bacteria seems to be --10-8-10-10. This corresponds to -1 error per genome per 1000 bacterial replication cycles, or -10-6 per gene per generation.
DNA polymerase might improve the specificity of complementary base selection at either (or both) of two stages:
1,It could scrutinize the incoming base for the proper complementarity with the template base; for example, by specifically recongnizing matching chemical features. This would be a presynthetic error control.
2,Or it could scrutinize the base pair after the new base has been added to the chain, and, in those cases in which a mistake has been made, remove the most recently added base. This would be a proofreading control.
三、DNA的生理意义及成分分析
早在1928年英国科学家Griffith等人就发现肺炎链球菌使小鼠残废的原因是引起肺炎。细菌的毒性(致病力)是由细胞表面荚膜中的多糖所决定的。具有光滑外表的S型肺炎链球菌因为带有荚膜多糖而都能使小鼠发病,而具有粗糙外表的R型因为没有荚膜多糖而失去致病力(荚膜多糖能保护细菌免受运动白细胞攻击)。
首先用实验证明基因就是DNA分子的是美国著名的微生物学家Avery。Avery等人将光滑型致病菌(S型)烧煮杀灭活性以后再侵染小鼠,发现这些死细菌自然丧失了致病能力。再用活的粗糙型细菌(R型)来侵染小鼠,也不能使之发病,因为粗糙型细菌天然无致病力。当他们将经烧煮杀死的S型细菌和活的R型细菌混合再感染小鼠时,实验小鼠每次都死了。解剖死鼠,发现有大量活的S型(而不是R型)细菌。他们推测,死细菌中的某一成分棗转化源(transforming principle)将无致病力的细菌转化成病原细菌。
美国冷泉港卡内基遗传学实验室科学家Hershey和他的学生Chase在1952年从事噬菌体侵染细菌的实验。噬菌体专门寄生在细菌体内。它的头、尾外部都有由蛋白质组成的外壳,头内主要是DNA。噬菌体侵染细菌的过程可以分为以下5个步骤:①噬菌体用尾部的末端(基片、尾丝)吸附在细菌表面;②噬菌体通过尾轴把DNA全部注入细菌细胞内,噬菌体的蛋白质外壳则留在细胞外面;③噬菌体的DNA一旦进入细菌体内,它就能利用细菌的生命过程合成噬菌体自身的DNA和蛋白质;④新合成的DNA和蛋白质外壳,能组装成许许多多与亲代完全相同的子噬菌体;⑤子代噬菌体由于细菌的解体而被释放出来,再去侵染其他细菌。他们发现被感染的细菌中带有70%的噬菌体DNA,但只带有20%的噬菌体蛋白质。子代噬菌体中带有50%标记的DNA,却只有1%的标记蛋白质。
四. C-value和Cot1/2
The total amount of DNA in the haploid genome is a characteristic of each living species known as C-value.
Cot1/2 is the product of concentration and time required for 50% reassociation given in nucleotide-moles × second/liter.
五、 染色体结构
DNA molecules are the largest macromolecules in the cell and are commonly packaged into structures called “chromosomes”, most bacteria & viruses have a single chromosome where as Eukaryotic cells usually contain many.
任何一条染色体上都带有许多基因,一条高等生物的染色体上可能带有成千上万个基因,一个细胞中的全部基因序列及其间隔序列统称为genomes(基因组)。 如果设想将人体细胞中的DNA分子绕地球一周,那么,每个碱基大约只占1-5厘米,而一个2-3kb的基因只相当于地球上一条数十米长,数厘米宽的线段!
Genotype (基因型): The genetic constitution of a given organism (指某个特定生物体细胞内的全部遗传物质)。
Phenotype (表现型): Visible property of any given organism (某个特定生物体中可观察到的物理或生理现象)。
Mutations: 染色体DNA中可遗传的核苷酸序列变化。
六、 染色体的组成
1.染色质和核小体
染色质DNA的Tm值比自由DNA高,说明在染色质中DNA极可能与蛋白质分子相互作用;在染色质状态下,由DNA聚合酶和RNA聚合酶催化的DNA复制和转录活性大大低于在自由DNA中的反应;DNA酶I(DNaseI)对染色质DNA的消化远远慢于对纯DNA的作用。染色质的电子显微镜图显示出由核小体组成的念珠状结构,可以看到由一条细丝连接着的一连串直径为10nm的球状体。
核小体是由H2A、H2B、H3、H4各两个分子生成的八聚体和由大约200bpDNA组成的。八聚体在中间,DNA分子盘绕在外,而H1则在核小体的外面。每个核小体只有一个H1。
在核小体中DNA盘绕组蛋白八聚体核心,从而使分子收缩成1/7,200bpDNA的长度约为68nm,却被压缩在10nm的核小体中。但是,人中期染色体中含3.3×109碱基对,其理论长度应是180cm,这么长的DNA被包含在46个51μm长的圆柱体(染色体)中,其压缩比约为104。
2.染色体中的核酸组成
⑴不重复序列 在单倍体基因组里,这些序列一般只有一个或几个拷贝,它占DNA总量的40%-80%。不重复序列长约750-2000dp,相当于一个结构基因的长度。单拷贝基因通过基因扩增仍可合成大量的蛋白质,如一个蚕丝心蛋白基因可作为模板合成104个丝心蛋白mRNA,每个mRNA可存活4d,共合成105个丝心蛋白,这样,在几天之内,一个单拷贝丝心蛋白基因就可以合成109个丝心蛋白分子 。
⑵中度重复序列 这类重复序列的重复次数在10-104之间,占总DNA的10%-40%。各种rRNA、tRNA 及组蛋白基因等都属这一类。
非洲爪蟾的18S、5.8S及28SrRNA基因是连在一起的,中间隔着不转录的间隔区,这些单位在DNA链上串联重复约5000次。在卵细胞形成过程中这些基因可进行几千次不同比例的复制,产生2×106个拷贝,使rDNA占卵细胞DNA的75%,从而使该细胞能积累1012个核糖体。
⑶高度重复序列——卫星DNA 这类DNA只在真核生物中发现,占基因组的10%—60%,由6—100个碱基组成,在DNA链上串联重复几百万次。由于碱基的组成不同,在CsCl密度梯度离心中易与其他DNA分开,形成含量较大的主峰及高度重复序列小峰,后者又称卫星区带(峰)。
高等真核生物DNA无论从结构还是功能看都极为复杂,以小鼠为例:
1.小鼠总DNA的10%是小于10bp的高度重复序列,重复数十万到上百万次/genome。
2.总DNA的20%是重复数千次、长约数百bp的中等重复序列。
3.总DNA的70%是不重复或低重复序列,绝大部分功能基因都位于这类序列中。
Centromere:是细胞有丝分裂期间纺锤体蛋白质与染色体的结合位点(attachment point),这种结合对于染色体对在子细胞中的有序和平均分配至关重要。在酵母中,centromere的功能单位长约130 bp,富含AT 碱基对。在高等真核细胞中,centromere都是由长约5-10 bp、方向相同的高度重复序列所组成。
Telomeres are sequences at the ends of eukaryotic Chromosomes that help stabilize them。 酵母Telomeres一般以100 bp左右不精确重复序列所组成。
5’(TxGy)n
3’(AxCy)n
其中X、Y一般为1-4,单细胞真核生物中n常为20-100,高等真核生物中>1500。
染色体末端的线性重复序列不能被DNA polymarase 所准确复制,它们一般在DNA复制完成以后由telomarase合成后加到染色体末端。
Alu(长约300bp)是人类高度重复序列,因为该序列中带有AluI的识别序列而得名。数十万个Alu重复序列散布于整个人类基因组中,达到总序列的1-3%。Alu与其它高度重复序列共占人类DNA的10%以上。
3.染色体中的蛋白质
染色体上的蛋白质包括组蛋白和非组蛋白。组蛋白是染色体的结构蛋白,它与DNA组成核小体。通常可以用2mol/L NaCl或0.25mol/L的HCl/H2SO4处理使组蛋白与DNA分开。组蛋白分为H1、H2A、H2B、H3及H4。这些组蛋白都含有大量的赖氨酸和精氨酸,其中H3、H4富含精氨酸,H1富含赖氨酸;H2A、H2B介于两者之间。
⑴组蛋白的一般特性
进化上的极端保守性。牛、猪、大鼠的H4氨基酸序列完全相同。牛的H4序列与豌豆序列相比只有两个氨基酸的差异(豌豆H4中的异亮氨基酸60→缬氨酸60,精氨酸→赖氨酸)。H3的保守性也很大,鲤鱼与小牛胸腺的H3只差一个氨基酸,小牛胸腺与豌豆H3只差4个氨基酸。
无组织特异性。到目前为止,仅发现鸟类、鱼类及两栖类红细胞染色体不含H1而带有H5,精细胞染色体的组蛋白是鱼精蛋白。
肽链上氨基酸分布的不对称性。碱性氨基酸集中分布在N端的半条链上。例如,N端的半条链上净电荷为+16,C端只有+3,大部分疏水基团都分布在C端。
组蛋白的修饰作用。包括甲基化、乙基化、磷酸化及ADP核糖基化等。
⑵非组蛋白的一般特性
染色体上除了存在大约与DNA等量的组蛋白以外,还存在大量的非组蛋白。非组蛋白的多样性。非组蛋白的量大约是组蛋白的60%~70%,但它的种类却很多,约在20-100种之间,其中常见的有15-20种。 非组蛋白的组织专一性和种属专一性。
(3)几类常见的非组蛋白
a.HMG蛋白(high mobility group protein)。这是一类能用低盐(0.35mol/L NaCl)溶液抽提、能溶于2%的三氯乙酸、相对分子质量较低的非组蛋白,相对分子质量都在3.0×104以下。
b. DNA结合蛋白。用2mol/L NaCl除去全部组蛋白和70%非组蛋白后,还有一部分蛋白必须用2mol/L NaCl和5mol/L尿素才能与DNA解离。这些蛋白分子量较低,约占非组蛋白的20%,染色质的8%。
七. 原核与真核染色体DNA比较
原核生物中一般只有一条染色体且大都带有单拷贝基因,只有很少数基因〔如rRNA基因〕是以多拷贝形式存在;
整个染色体DNA几乎全部由功能基因与调控序列所组成;
几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状态。
Viral DNA molecules are relatively small
HIV = 9000 nt RNA
Qβ = 4200 nt
Bactaria DNA is 100 times > than viral
E. coli 4639221 bp double-stranded
Contour length = 1.7mm, 850倍细菌本身长度。细菌中常常带有质粒DNA。
Eucaryotic cells
果蝇带有25倍于E. Coli 的DNA,人类带有600倍于E. Coli 的DNA. Eucaryotic DNA 中基因密度明显低于原核和病毒。如人DNA中平均每毫米只带有50个基因,而E. Coli中基因密度每毫米DNA带有2400个基因!一个人细胞中所带有的DNA约有2m/1.7mm细菌。成人带有1X10^14个细胞,成人体内全部DNA的总长度(Contour Length)= 2X10^11Km |