人类基因组计划

通过基因组研究人类与黑猩猩的异同点

   黑猩猩基因组的测序工作即将完成,遗传学家正忙于对人类和黑猩猩的基因组进行分析,以寻找我们与我们最近的“亲戚”之间的显著差别。与此同时,行为科学家仍在寻找人类与黑猩猩之间的相同之处。以雌性黑猩猩学习使用木棍来找白蚁吃为例。它们从比雄性黑猩猩更小的年龄开始学习,在该本领上也比雄性黑猩猩强,并且使用一种与其母亲相同的技术,而雄性黑猩猩却不是这样。在人类的小孩中,男孩与女孩在学习技能方面也有类似的差别,说明基于性别的学习差别至少可以追溯到黑猩猩与人类的最后一个共同祖先。2004.12

生物进化中自然选择与随机变异所占的比重

   在生物进化过程中所发生的遗传变异并非都是达尔文的自然选择的结果,实际上绝大多数的基因序列变化是近乎中性的突变的随机漂移的结果。自然选择与随机变异所占的比重是一个几十年来有过很多讨论的话题。现在,大鼠和小鼠的基因组序列数据已经出来了,同时又有人类基因组数据作为参考,Bazykin等人对涉及9390个等价基因的360万个小鼠和大鼠密码子之间的核苷取代模式进行了分析研究,发现了一个复杂的变异模式。总体上,由积极的选择引起的碱基取代所占的比例在0.5%-1%左右。令人吃惊的是,在大鼠祖先中由积极的选择(而不是随机的漂移)所引起的取代几乎是在小鼠祖先中的频度的两倍。

中国人类基因组几个研究中心

  上海和北京三个新成立的人类基因组研究中心将需要100位基因组研究人员,而且中国政府预计不久还将准备再建几个基因组研究中心。
  上海人类基因组研究中心主任是上海第二医科大学的陈竺博士。该中心在一年内将需要35-40位研究人员,分成4组:表现型(expression profiles)、疾病的基因型( genotyping of disease)、单核苷酸多形性(single nucleotide polymorphisms)和功能基因组(functional genomics)。肝癌这个在上海发病较多的疾病将是一个研究重点。该中心的6,000万元(700万美元)启动资金由地方政府和中央政府提供。
  北京人类基因组研究中心主任是中国医学科学院副院长强伯勤。该中心将需要约30位研究人员,分成以下3组:测序(sequencing)、基因资源(genetic resources)和生物信息学(bioinformatics)。该中心的研究重点是心血管疾病和神经系统疾病。近1亿元(1,200万美元)启动资金由中央政府、地方政府和一个国营房地产公司提供。
  上海GeneCore BioTechnologies公司是由三家美国公司成立的一个合资企业,这三家美国公司分别是PE应用生物系统公司(PE Applied Biosytems)、Axys制药公司( Axys Pharmaceuticals)、和 Siniwest控股公司(Siniwest Holdings)。 这个合资企业将在一年内使研究人员的数量达到30个左右。它目前正在与当地的研究机构合作寻找肝癌基因,但今后预计还要向基因组研究的其他领域发展。该合资企业首批1,000万美元投资由三家美国公司提供。

专家论衡:人类基因组计划的意义

  自然与人为----杨焕明[人类基因组计划中国项目负责人]

  现在,人们正拿起了基因测序这一先进武器,在“非典”的战场上与病魔展开较量。4月14日,人类基因组全图正式发表,从此全世界的人们都可以免费获得这份资源;50年前的这个时候,沃森和克里克共同发表了DNA分子的双螺旋结构,从此为人类认识、了解自己打开了关键的一道门
  曾几何时,当人类自身的秘密困扰着我们的时候,我们是那样迷惑;但当这秘密渐渐将大白于天下时,我们不自禁地又犹豫起来。
  距离是产生美感的基础,当一切都变得如此清晰,我们还会一如从前吗?科学,是双刃剑,即使在“人类基因组计划”这样从一开始就本着全人类免费共享资源的项目,也曾遇到某些不和谐的声音。
  但是,无论科学,还是人为,都要遵循自然的法则。按照中国传统的哲学思想———天之道,损有余补不足。一切的不平衡都会在宗法自然中找到自己的支点。
  不知不觉间,人类已经在第21个世纪走过了两个半年头,DNA分子的双螺旋结构也已经发表了50周年。回想50年前,生命奥秘答案初现端倪之时,人们的惊喜、迷惑与期待还仿佛如刚刚掠过的那一缕清风,在我们的耳边、心里留下挥之不去的印象。
  时间是最自然的,又是最人为的。自然似乎只通过时间给我们以启示,斗转星移的相应位置造成的物理变化,以及与此有关的生物的生死循环等。作为国际人类基因组计划的执行者,我相信经过我们所有正直的、负责任科学家的努力,人类基因组计划也将造福于人类。
  科学是最人为的。科学之所以谓为科学,它是那些自然存在事物的新发现与自然中并不存在的新事物的新发明。科学又是最自然的。所有科学发现与发明都是基于自然界的固有规律。科学又应该是自然与人为的统一。科学是人类文明的一部分,而人类的文明依赖于其对自然的了解和与自然的和谐。
  科学是人为的,它才成为我们所担心的一柄“双刃剑”。它给人类带来了繁荣幸福,又给人类带来了新的危险。自然与人为的问题,从根本上来说,是如何认识人类在自然界中位置的问题。整个人类在自然界中的位置,是自然界安排的。随着人类的意识的形成,对自然认识的拓展也随之改变。
  我们人类是什么?
  我们是如何来到这个世界,又如何离去?为什么你那高高的鼻子那么像你的爸爸?那漂亮的眼睛又像你的妈妈?为什么我们都一样———无疑是人类这个大家庭的一员,可我们大家又都不一样?生死、衰老、人之异同,已困扰了我们几千年,这些问题的答案现在尚可等候。可疾病对我们的危害确是每一个人、每一个家庭、每一个负责的团体与国家政府都不得不考虑的问题。
  20世纪是物理学最为风光、最为辉煌、为人类文明与科学进步贡献最大的世纪。对物质原子结构的认识,使物理学进入鼎盛时期。原子弹的爆炸与人类走向太空,更使物理学登峰造极。最后,又以最简单的无机硅研制成芯片。
  “不知庐山真面目,只缘身在此山中”。站在太空上,人类以前所未有的视角,重新审视我们的栖息地—地球。它与我们目前所知其他星球的主要区别之一,就是生物的存在。基因使地球郁郁葱葱,生机一片,它使我们对生命的奥秘与神奇充满新的遐想与好奇;也使我们对人类本身的了解提出新的质疑:我们已成为地球的主宰,却不能主宰自己。
  世界上仍有一半以上的人,不同程度地受各种慢性病的折磨。曾肆虐一时的传染病,尽管已得到控制,可并没有像天花一样销声匿迹。抗菌素等药物发现的步子越来越慢,相反,自然界抗药的病原微生物越来越多。
  肿瘤、心血管疾病等主要死因已成为人类祛除不掉的幽灵。艾滋病的出现与肆虐,使人类深感忧虑。从一战期间死于感冒美国士兵身上分离到的病毒又告诉我们:一不小心,它还可能要我们的性命,因为人类对这种致命的感冒病毒仍没有天生的免疫力。在此同时,医学研究的进展、新药的开发的步伐正在一步步减慢。近几十年没有新的抗生素问世。一种重要的药研究需要耗时12年,相当于三架波音747-400飞机的代价。
  人类开始了对人类自己的最大的研究。对于自我、对于生命世界、对大自然开展了空前规模的探索,这就是六国参与的“国际人类基因组计划”。
  我至此刻还不知道文明的确切定义是什么。但人类的有文字记载的文明史至少已有五六千年。
  科学总是与文明、与道义相连的。人类不仅有了科学的巨大发展,也对人类符合人的自然———人性文明的重建有了新的反省。而重建文明的关键,便是重新认识人类在自然科学界中的位置。这正是人类基因组计划将要对人类做出的最大贡献。
  人类基因组研究与自然
  20世纪被很多人认为是物理学的世纪。我很欣赏这样的描述:这一世纪从人类认识物质的基本组成———原子结构开始。原子弹爆炸与人类登月是这一世纪最辉煌成就的一部分,而最后以最简单无机硅制造的马铃薯芯片(Chip)使人类进入了信息时代!
  20世纪还孕育了另一个世纪:这是从我们重新发现生命的最基本信息———基因开始。50年代的遗传物质结构模型的提出与70年代遗传工程技术的成立使之趋于成熟,而90年代开始的国际人类基因组计划把人类带进了另一个世纪。
  现在我想以人类基因组计划的发展来谈一谈人类在自然界中的位置,再谈自然与“人为”的问题。
  从前,当我们讨论“科学是双刃剑”时,我们关心的仅仅是人类的敌人可能也会挥起这柄剑,如希特勒、如山本五十六。现在,我们的问题一下子复杂起来了。我们的法律一下子在克隆人类等新问题前变得无所适从,或无能为力。我们把它们归咎于道义或伦理问题。实际上,就是自然与人为的问题。
  人类基因组计划在科学上的目的,是测定组成人类基因组的30亿个核苷酸的序列。从而奠定阐明人类所有基因的结构与功能,解读人类的遗传信息,揭开人类奥秘的基础。由于生命物质的一致性与生物进化的连续性,这就意味着揭开生命最终奥秘的关键,也就是人类基因组计划的所有理论、策略与技术,是在研究人类这一最为高级、最为复杂的生物系统中形成的。
  规模化就是随着人类基因组计划的启动而诞生,随着人类基因组计划的进展成功而发展的“基因组学”。生物学家第一次从整个基因组的规模去认识、去研究,而不是大家分头一个一个去发现,基因研究将是基因组学区别于基因组(genetics)与所有涉及基因的学科的主要地方。基因组规模也改变了经典的实验室规模,改变了原有的实验方式,这也许是“国际人类基因组计划”只有6个正式成员国与16个中心的原因之一。
  生物的序列化即生命科学以序列为基础。这是新时代的生命科学区别于以前的生物学的最主要的特点。随着人类基因组序列图的最终完成,SNP(单核苷酸多态性,即序列差异)的发现以及比较基因组学古代DNA、“食物基因组计划”、“病原与环境基因组计划”(主要是致命致病学)以及与之有关的人类易感性有关序列的推进,有科学、经济、医学意义的主要物种的基因组序列图都将问世。我们从序列中得到的信息,已经比到现在为止的所有生物研究积累的信息还要多。生物学第一次成为以数据(具体的序列数据)为根据与导向,而不是再以假说与概念为导向的科学。即使进化这一生命最实质的特征以及进化的研究,都把因多种模式及其他生物的基因组序列为基础。古代DNA的研究,也不再是因时间与过去了的环境而惟一不能在实验室重复的进化研究,从而揭示生命进化的奥秘与古今生物的联系。这就帮助人们更好地认识人类在生物世界中的关系。
  生物的信息化,是借助于电子计算机的威力,也借助于把地球变小的网络。没有它们,国际人类基因组计划的协调与全世界的及时公布是不可能的。没有全部的软件与硬件,人类基因组计划一切都不可能。序列一经读出,它的质控、组装,以至于递交、分析都有赖于生物信息学,而现在开始,序列的意义完全决定于生物信息学。没有电子计算机的分析与正在爆炸的信息的比较,序列又有何用?
  人类基因组计划之所以引人注目,首先源于人们对健康的需求。疾病问题是自然影响健康的首要因子,是每一个人、每一对父母、每一个家庭、每一个国家政府所不得不考虑的问题。因为人类对健康的追求,从来都不曾懈怠过。

国际人类基因组计划中国部分通过验收

  国际人类基因组计划中国部分今天通过了由科技部和中国科学院联合组织的专家验收,至此,国际人类基因组计划中国部分“完成图”提前两年完成。

  中国承担的工作区域,位于人类三号染色体短臂上。由于该区域的遗传大小约占人类整个基因组的百分之一,因此简称为“1%项目”。这一项目主要由科技部、中国科学院以及国家自然基金委员会资助。

  经过来自中国科学院基因组信息学中心、国家人类基因组南方中心以及国家人类基因组北方中心的科学家和工作人员的共同努力,共测定了3.84亿个碱基,相当于将所负责的区域重复测定了12次以上。对人类整个基因组的实际贡献为1%左右,并对被国际同行称为“北京区域”的这一部分进行了详细分析,所有指标达到了国际人类基因组计划“协作组对完成图”的要求。所有数据已经递交到国际基因数据库中,可被全球科学家和研究者直接免费享用。

  验收会在国家人类基因组北方研究中心召开,科技部、中国科学院、国家自然基金委员会、北京市科委、北京经济技术开发区管委会等单位负责人到会并给予了热烈祝贺。

  国际人类基因组计划中国部分“完成图”的绘就,是继2000年6月26日中国科学家与国际同行共同发布“人类基因组工作框架图”以及在2001年2月15 日发表《人类基因组:初步测序及分析》论文之后,中国科学家所取得的又一阶段性成果。

  人类基因组“完成图”,即完全覆盖人的基因组,准确率超过99.99%的全DNA序列图。是人类基因组计划最艰巨、最重要的任务。

  国际人类基因组计划中国部分的完成,表明中国在基因组学研究领域已经达到了国际先进水平。

  中国参与国际人类基因组计划并做出重大贡献,充分显示了中国领导人积极参与国际合作重大课题的创新思维与创新策略,显示了中国科学家在科学探索、科研体制方面的创新精神。中国的参与改变了人类基因组研究的国际格局,受到了国际同行,特别是参与人类基因组计划的各个中心以及发展中国家的欢迎与称颂。

  据介绍,在下一阶段,中国科学家将继续参与国际合作,列出完整的人类基因及其产物的清单;对调控区域进行大规模的研究与分析;分离全部的人类单核苷酸多态性等。同时,分析中国人疾病相关基因及其多样性,测定对于中国具有特殊意义的其他生物的基因组,如水稻、家猪等。2001-08-26

科学家绘成"生命之书"

  由美、英、日、法、德和中国科学家参加、被誉为生命科学的"登月计划"的人类基因组草图绘制工作实现了突破性进展。26日,"人类基因组计划"的科学家和美国塞莱拉基因组学公司联合宣布,他们在耗资数十亿美元后,终于绘制人类基因组的草图。"人类基因组计划"首席科学家、美国国家人类基因组研究所所长弗朗西斯,柯林斯说,科学家经过10年的努力,终于完成了人类基因组草图的绘制工作,测定了人类DNA即遗传物质脱氧核糖核酸中90%帆以上的碱基序列。两年前成立的私营塞莱拉公司董事长兼首席科学家克莱格·文特尔宣布,该公司科学家已经将人类23对染色体上的35亿对作为遗传密码基本单位的碱基按照自然顺序排列出来,塞莱拉的超级计算机为此进行了480亿亿次计算。文特尔说:"这是历史上第一次对人类遗传密码进行线性排列。"基因组草图绘制成功后,科学家将继续测定和检验基因的碱基序列,使基因图精度达到99.9%。世界各地科学家将免费获取"人类基因组计划"的数据,用于寻找致病基因、开发预知疾病的基因测试手段以及利用基因信息制造新药等。科学家说,生命科学将进入一个全新时代。由公共资助的"人类基因组计划"始于1990年,由美、英、日、法、德和中国科学家参加,原定于2005年完成。但新技术提高了科学家的测序速度,加快了计划进度。预计,最后的人类基因组草图在2003年完成。

图谱绘制仅是一小步

  遗传学家第—次揭示完整的人类基因密码排序已经在医学和法学领域引起了一阵骚动。这项科学突破最终将会像达尔文提出的那个引起基因轰动的理论一样,可能对人类固有的社会观念发起挑战。
伍斯特工艺研究所宗教和社会伦理学教授汤姆·香农说:"绘制基因图谱将帮助我们对所有的问题----比如隐私权、保密权和人对自己身体各部分的所有权等等----重新加以思考。"对医学界来说,这样的改变需要时间。首先,需要测序的基因组非常长----约有30亿个碱基对。如果有人仅仅想把它们写出来,即使昼夜不停地工作,也需要超过47年的时间。其次,研究人员绘制完成的基因图谱----只是一个工作草图,既不完整,又有许多小错误----直到2003年才有可能最后完成精确的绘制工作。即使到那时,科学家也不可能完全了解人类基因组。马萨诸塞州惠顿学院生物学教授,从事遗传学研究贝齐·戴尔解释说:"想象一下,在你面前摆放着莎士比亚的全部作品,字与字之间没有空格,没有语法,而且你又不懂英语。"完整的基因组图谱就像这种情形。研究人员可能需要几十年时间才能破译这些基因组。震动,隐私权是法律方面的—个漏洞。假如掌握了一个人遗传密码的医生确诊说现在这个20多岁的人50岁会患一种致命的疾病。谁应该知知道这个消息呢?他本人?他的亲属?还是他的老板或是他的保险公司?
圣母大学科学、技术和价值计划负责人菲利普·斯隆预计,最先出现争议的问题之—是越来越多的人对未出生的孩子进行遗传检测,以便确定孩子是否患有新发现的一系列基因缺陷。遗憾的是,医生早在找到治疗方法以前就能发现这些缺陷。这就会在胎儿出生之前使其父母面临着一个错综复杂的伦理问题:他们是否应该放弃医生认为长大后将会患某种遗传疾病的孩子?
也有研究人员说,基因并不能解决人体所有的问题。他们只不过列出了非常复杂的代表蛋白质表达方式的基因密码,而蛋白质并不是每次都是以同样的方式表达。

何为基因组计划

  如果把人类基因组比喻为—本有10亿单词的百科全书,这本书可分23章,每章为一个染色体。而每—个染色体上,又包含着数千个被称为基因的"故事"。这些"故事"由一系列3字母单词组成,其中每个单词词是4个基本化学"字母",即腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶4种碱基的任意排列组合。人类基因组计划,正是要“读出”这30亿个化学"字母",也就是测出人体所有染色体上30亿个碱基对的排列顺序。26日公布的工作草图中包含人体90%以上碱基对的位置信息,这足以帮助科学家掌握人类生命密码的主要框架结构。
人类基因组蕴涵有人类生、老、病、死的绝大多数遗传信息,读出它将为疾病的诊断、新药物性的变革,因此破译人类基因组又被比喻为生物学的"圣杯"。10年来,参与该项目的10000多名各国科学家通力合作,使破译生命密码的进程不断加快,原定的完成时间也一再被提前。尽管每个人身上都有基因,但直到19世纪末、特别是近50年来,随着DNA双螺旋结构等一系列重要发现,科学家们才开始逐渐能够通过研究基因来揭开生命的奥秘。第一个基因被分离成功是在1969年的事。而人类基因组工程集各国科学家之力,10年就基本破译出人体天书,其意义难以估量。正如—些科学家们所言,它的重要性不亚于让人类登上月球的"阿波罗计划"。

中国科学家做了什么

   人类基因组草图绘制完成的消息,迅速在中国科技界引起强烈反响。科技部部长朱丽兰和中国科学院院长路甬祥26日在北京表示,这是人类认识自身、解读生命奥秘、提高健康水平和发展生命科学的重要里程碑,将为全世界人民平等和免费分享科学成果树立楷模,也是全世界积极参与的科学工作者智慧的贡献。朱丽兰说,国际人类基因组1%测序任务由中国顺利完成,表明只要目标集中,措施有力,中国科学家有能力参与国际重大科技合作研究,并做出重要贡献。路甬祥也表示:"这向全世界证明:我国虽然是发展中国家,但有—批杰出的科学家,站在国家科学事业的高度,不畏艰难,顽强拼搏,联合攻关,完全有能力跻身于国际生命科学前沿。"1999年5月,中国积极加入这一研究计划,负责测定人类基因组全部序列的百分之一,也就是三号染色体上的三千万个碱基对,中国因此成为参与这一研究计划的唯一发展中国家。中国利学家仅用半年时间,就基本完成了所承担的人类基因组测序任务,破译了人类三号染色体部分遗传密码,这标志 着中国为国际人类基因组织研究做出了自己的贡献,也证明了中国科学家有能力在重大国际合作中发挥积极的作用。据悉,我国高度重视人类基因组的有关研究,通过863计划、国家自然科学基金等渠道予以支持,并组建了国家人类基因组南方和北方两个中心。

革命浪潮正在涌动

   科学家认为,虽然要真正掌握基因密码及其准备含义仍需数十年时间,但目前的成果足以使医药发生革命性变化。从近期看,医生会因此而比目前更早地诊断出疾病,开出因人而异地合成的药品,而医药公司会因此而制造出新一代更有效的药物。从长远看,可能利用基因本身来矫治身体的缺陷。确定人体蛋白基因密码的工作已经开始。医疗人员也可以为病人订造药品,减少副作用,也可以把有问题的基因去除掉美国国家人类基因组研究学院的主管柯林斯表示,把有关研究应用在实际治疗的工作已经开始了。他说,研究人员在去年使用互联网上免费的基因资料,找到了十多种与遗传病有关的基因,其中两种是致聋的基因,和一种导致癫痫症的基因。私营公司也找到与糖尿病、哮喘和牛皮癣等疾病有关的基因。在美国,医疗人员平均每年进行400万次基因扫描以检查疾病。在此之前,部分病人必须进行器官切片手术才能够确定病因,而现在只要抽取一滴血就可以找到病源。由于多种癌症和和心脏病都与遗传基因有关,透过基因扫描,医疗人员也可以向病人事前发出警告,预防病情恶化
有关调查估计,美国每年有200万名病人因为药物产生副作用而被送进医院,其中10万人因此而死亡。由于每个病人的情况都不一样,因此医疗人员现在可以利用基因组的最新材料,为病人订制新药。最新的治疗方向是利用药品打击人体内个别有害的生物成分,从而把疾病治愈。药品制造商认为,基因组研究可以协助发现有损害性的基因成分,然后制造新的药品,打击这些有害的基因成分。此外,利用基因组研究,把基因本身变成—种药物。这是最明显的效用,但也是最受争议的。基因治疗的方法就是把有病的基因除掉,然后再植入健康的基因,从而把 疾病治好。虽然基因治疗有很多缺点,但是基因最近在血友病的成功例子,意味这种研究还是会继续下去。

科学家首次公布人类基因组草图“基本信息”   

  继去年6月26日人类基因组“工作框架图”绘制完成后,参与人类基因组计划的六国科学家今天共同宣布,经过初步测定和分析,人类基因组共有32亿个碱基对,包含了大约3万到4万个蛋白编码基因。
  题为《人类基因组的初步测定和分析》的学术论文,即将发表在权威科学刊物《自然》上。据悉,这篇论文长达60多页,是人类首次全面介绍人类基因组工作框架图的“基本信息”。
  专家认为,这篇论文的发表,是人类基因组研究的又一重要里程碑,标志着人类基因组研究工作取得了实质性进展,为破译生命之谜奠定了坚实基础。
  “人类基因组计划达到了探索遗传信息的顶点,同时为新世纪人类全面了解这些信息的奥秘奠定了基础。”
  人类基因组计划启动于1990年。去年6月26日,来自美国、英国、日本、法国、德国和中国的科学家绘制出人类基因组框架图,但是这张“图纸”上究竟有些什么基本内容和基本信息?却一直没有公布。
  经过最近几个月的努力工作,六国科学家终于将得到了初步结果:人类基因组是第一个精确测定的脊椎动物的基因组,也是迄今为止测定的最大基因组,比以前测定的任何一种生物的基因组都大25倍以上,是以前测定所有基因组总和的8倍。
  “更为重要的是,这是人类自身的基因组信息。”人类基因组计划中国项目执行人杨焕明研究员说,“尽管要绘制完成图还有很多工作要做,但这些信息已经可使我们对人类基因组有一个总体的认识。”
  科研人员还发现,一些特征性序列在基因组中不同区域的分布有显著的差异,为研究功能提供了重要线索;人类基因组中约有3万到4万个蛋白编码基因,大约是线虫或果蝇基因数目的两倍;人类基因组编码的全部蛋白比无脊椎动物更复杂;通过克隆的方法,科学家至少定位了30种疾病基因。
  研究表明,人类蛋白质有61%与果蝇同源,43%与线虫同源,46%与酵母同源。人类17号染色体上的全部基因几乎都可以在小鼠11号染色体上找到。
  据悉,人类基因组的完成图将于今年绘制出,目前这一任务进展迅速,已有10亿个碱基对的序列达到了完成图标准。
  专家认为,作为探索生命奥秘这一伟大工程的最新进展,人类基因组信息将对医学、生物学等产生不可估量的影响,有助于人类进一步阐明疾病的分子机制。

关于人类基因组的有趣数字一览  

  尽管科学家们已经宣布基因排序工作几近完成,但人类基因组包含的基因数量仍然只能大致地推算出来。无法得知准确数字的原因有以下几个:
  一、人类真正基因的数量太少而且分布过于分散,据估算,人类每一百万个DNA基中,只有十二个真正的基因,而果蝇的基因数量是一百一十七个,蛔虫的基因数量是一百九十七个,阿布属(Arabidopsis)的基因数量是二百二十一个。在这上百万个鱼龙混杂的DNA中寻找十二个真正的基因,其难度可想而知,这项艰巨的工作对于目前的计算机软硬件来说实在是个“难以完成的任务”。
  二、人类的基因与其它生物的基因相比,“碎片化”程度更高。在比细菌复杂的有机体中,基因大都呈现出“碎片化”的特征,这也就是说,包含遗传信息的基因并不是完整、纯粹地呆在那里,而是被分割成许多个碎片,被一些没有包含遗传信息的“连结物”连结在了一起。这就好比看电视剧一样,我们在看电视剧时经常碰到插播广告的情形,一个电视剧很少在从头到尾播放时没有插播过广告,而广告显然并不是我们想要看到的信息。基因就象是一个插播了很多广告的电视剧,我们在观看这个“电视剧”时需要了解的是它的“剧情”,而不是无用的广告。但在得到完整准确的剧情之间,我们不得不将这些广告的内容剔除,对于电视剧来说,这也许并不是什么复杂的任务,但对于基因研究来说,它的难度却大了何止千百倍。包括遗传信息的基因碎片通常比“插播”的那些无用信息小得多,这就好比一个四十五分钟的电视剧插播了数个长达十几分钟的广告一样。基因中的有用碎片被称为“exon”,无用碎片被叫作“intron”。研究发现,很多不包含遗传信息的DNA碎片有一万个碱基大小,这比包含遗传信息的那些碎要大好多。
  目前,已经发现的人类基因中最大的一个有二百四十万个碱基那么长,它构成了人类肌肉蛋白质“营养失调”时(dystrophin)的编码。不过,这个基因中大多数碱基都无用的DNA碎片。已知的有用基因碎片中最大的一个也是有关肌肉蛋白质的,它存在于一种名“titin”的肌肉蛋白质中。这个基因碎片包含了八万零七百八十个碱基,它们被分割成了一百七十八单元,最大的一个单元包括了一万七千一百零个碱基。
  果蝇和蛔虫的“intron”碎片长度比较适宜,通常只有几十个或者上百个碱基,人类的“intron”碎片长度相差很大,大多数都只有八十七个碱基长,但由于相当一部分的“intron”碎片的长度大得惊人,因此平均下来,人类的“intron”碎片的长度约为三千三百多个。相对而言,人类基因的“exon”碎片要小得多,目前已经发现有四十多个“exon”碎片只有十九个碱基大小。
  很明显,现在的问题并不是人类有多少基因,而是这些基因是如何被使用。基因“碎片化”意味着人类的各种蛋白质可以由相同的基因碎片组成,只要它们的组合方式不同,蛋白质的功能也就各不相同。目前,人类基因中至少有百分之三十五可以有不同的组合方式,因此,它们所能结合成的蛋白质种类比果蝇和蛔虫要多四倍。




版权所有 face21cn 文讯发展事业部

 www.face21cn.com 科技、文化、人类学