CN101203611A - 控制基因表达的改良方法 - Google Patents

控制基因表达的改良方法 Download PDF

Info

Publication number
CN101203611A
CN101203611A CNA2006800219915A CN200680021991A CN101203611A CN 101203611 A CN101203611 A CN 101203611A CN A2006800219915 A CNA2006800219915 A CN A2006800219915A CN 200680021991 A CN200680021991 A CN 200680021991A CN 101203611 A CN101203611 A CN 101203611A
Authority
CN
China
Prior art keywords
sequence
expression
gene
rna
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800219915A
Other languages
English (en)
Other versions
CN101203611B (zh
Inventor
P·任
H-S·宋
J·麦克米伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science GmbH
Original Assignee
BASF Plant Science GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36754673&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101203611(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by BASF Plant Science GmbH filed Critical BASF Plant Science GmbH
Publication of CN101203611A publication Critical patent/CN101203611A/zh
Application granted granted Critical
Publication of CN101203611B publication Critical patent/CN101203611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

本发明为遗传学领域,特别是植物遗传学领域,并且提供能够控制基因表达的活性剂。本发明特别提供天然发生的、组织特异性表达的microRNA的序列。本发明还提供包含编码所述microRNA的序列的转基因表达构建体。通过整合microRNA的编码序列,从所述表达构建体的表达在天然存在microRNA所天然表达的组织中被特异性沉默。因此,源于启动子的表达谱被调节并且渗漏性被降低。本发明还通过将码所述microRNA的序列整合入转基因表达构建体中而提供调节转基因表达的方法。本发明的组合物和方法可用于增强作物的农学相关特性,并且可用于累及哺乳动物的疾病和紊乱的治疗、预防、研究和诊断。

Description

控制基因表达的改良方法
发明领域
本发明为遗传学领域,特别是植物遗传学领域,并且提供能够进行基因特异性沉默的活性剂。本发明特别提供能够产生双链RNA(dsRNA)活性剂的多顺反子RNA分子、利用此类分子的方法以及包含此类分子的细胞和生物,特别是植物。
发明背景
许多因素影响植物和其它真核生物的基因表达。最近,作为真核生物基因表达重要调节物的21-26个核苷酸的小RNA凸显出来。已知小的调节RNA分为两个基本类别。一类小RNA是短干扰RNA(siRNA)。它们在RNA沉默中起着本质的作用,RNA沉默是由双链RNA(dsRNA)触发的序列特异性RNA降解过程(关于植物和动物的RNA沉默的最新综述分别见Vance和Vaucheret(2001)Science 292:2277-2280和Zamore(2001)NatStruct Biol 8:746-750)。RNA沉默在防御外源核酸中起着天然的作用,包括在植物中抵抗病毒以及在多种生物中控制转座子。siRNA是带有小的3′悬突的双链并且衍生自诱导沉默的较长的dsRNA。它们指导直接破坏靶RNA,并且在通过细胞内RNA依赖性RNA聚合酶活性的dsRNA扩增中作为引物。在植物中,si-样RNA还与dsRNA诱导的转录基因沉默(TGS)相关,TGS是在其中与启动子区域同源的dsRNA触发DNA甲基化并且抑制转录的过程。与真正的siRNA不同,TGS相关的小RNA不参与RNA降解。
另一组小RNA在类属上称作短的瞬间RNA(stRNA)并且更广义地称作micro-RNA(miRNA)。在动物和植物中miRNA作为进化保守的基于RNA的基因表达调节子出现。miRNA(约21-25nt)从更长的具有茎环结构的前体产生,该前体从非蛋白质编码基因转录而来。miRNA是单链的,并且它们的积累是通过发育调节和/或通过环境刺激调节。它们衍生自从不编码蛋白质的基因转录而来的部分双链RNA。miRNA似乎作为发夹RNA前体被转录,该前体被Dicer加工成约21nt的成熟形式(Lee RD和Ambros,V.Science 294:862-864(2001))。miRNA靶向特异性mRNA以在转录后水平(即降解mRNA)或翻译水平(即抑制蛋白质合成)抑制基因表达。microRNA(miRNA)是进化保守的。最近通过计算机分析和实验方法从诸多植物和动物物种中鉴定出数百种miRNA。一批miRNA在动物界或植物界内是保守的,但是一些是种特异性的或属特异性的。
miRNA基因首先被Pol II RNA转录,产生在5’端具有帽结构并且在3’端具有多聚尾巴的pri-miRNA。pri-miRNA被RNA酶III样酶Dicer剪切,产生成熟的miRNA。然后,miRNA被招募进入RISC(RNA诱导沉默复合体)并靶向细胞质中的特异性mRNA,以在转录后水平抑制基因表达(即降解mRNA)。miRNA还可以在靶向mRNA之后以序列特异性方式抑制蛋白质合成。此种翻译性抑制的机制有待揭开。在动物和植物中均发现,miRNA 5’区域与其靶mRNA的配对对于miRNA的作用至关重要(MalloryA等,EMBO Journal 23:3356-3364,2004;Doench J和Sharp P,基因&Development 504-511,(2004))。
因此认识到,小的内源性编码的发夹RNA可以经由RNAi机制中的成分稳定地调节基因表达。像stRNA一样(并且与RNA沉默中涉及的siRNA不同),大多数miRNA缺乏与任何推定的靶mRNA的完全互补性。虽然它们的功能迄今未知,但猜测它们在发育过程中调节基因表达,可能在发育水平调节基因表达。此外,考虑到这些小的调节性RNA数量众多,则有可能它们的功能更加多种多样,并且在不止一种水平上调节基因表达。在植物中,绝大多数的miRNA靶基因是转录因子,转录因子是分生组织决定、细胞分裂、器官分离和器官极性所必需的。一些miRNA具有独特的组织特异性和/或时间表达模式。McManus等(RNA 8:842-850(2002))还研究了miRNA模拟物,其包含19个核苷酸的连续RNA双链体、12核苷酸的环长度以及一个不对称的茎环凸起,该凸起由相对的一个尿苷和两个尿苷组成。合成的miRNA可以转染进入细胞或者在RNA聚合酶III启动子控制下在细胞内表达,并且导致降低特异性靶核苷酸序列的表达(McManus等,(2002)RNA 8:842-850,在此引入作为参考)。
在植物中,越来越多的证据表明,microRNA靶基因参与植物生长和发育的诸多方面,例如分生组织决定、细胞分裂、器官分离和器官极性。例如,miR164靶向NAC-domai基因,该基因编码包括CUP-SHAPEDCOTYLEDON1、CUC1和CUC2的转录因子家族。miR164抗性形式的CUC1 mRNA从CUC1启动子的表达导致拟南芥(Arabidopsis)胚性生长和花的发育改变(Mallory A等,Current Biology 14:1035-1046,(2004))。miR166在拟南芥和玉米中介导叶的极性(Juarez M等,Nature 428:84-88,(2004)以及Kidner C和Martlenssen R,Nature 428:81-84,(2004))。miR172通过调节APETALA2基因表达指导花的发育(Chen X,Science,303:2022-2025(2004))。miRNA还可以响应环境刺激,如非生物应激而调节植物基因表达。例如,当硫酸盐缺乏时,靶向硫酸化酶的miRNA,即miR395的表达增加(Jone-Rhoades Mw和Bartel D,Molecular Cell 14:787-799,(2004))。miR319c的表达通过冷但非脱水、NaCl或者ABA调节(Sunkar R和Zhu JK,Plant Cell 16:2001:2019,(2004))。一些miRNA具有独特的组织特异性和/或时间表达模式。例如miR398b主要在拟南芥的叶中表达(Sunkar R和Zhu JK.,Plant Cell 16:2001:2019,2004)。
miRNA在动物的生长和发育中也起着关键的作用。例如,在哺乳动物中,miR181调节血液谱系分化(Chen CZ等,Science 303:83-86,(2004)),miR196指导断裂HOXB8 mRNA(Yekta S等,Science 304:594-596,(2004))。在人中,miR-124仅在脑中表达,其可能的作用是神经元分化(Sempere L.F.等,Genome Biology 5:R13(2004)),而miR-1在肌肉中表达(Lagos-Quintana.M等,Current Biology,(2002))。
迄今为止,所公开的miRNA在植物中的应用有:
1)过表达和/或异位表达给定miRNA,以表征其功能或者产生想要的表型(Palatnik J等,Nature 425:257-263,(2003));
2)改造miRNA前体,以产生靶向目的基因的新miRNA(WO2004009779);
3)改造mRNA,以便抗miRNA识别和断裂(即沉默突变-通过改变核苷酸同时编码同一氨基酸)(Palatnik J等,Nature 425:257-263,2003;Mallory A等,Current Biology 14:1035-1046,(2004))。
US 20040268441描述了能够设计调节任何目的核苷酸序列(或者是内源植物基因或者备选地是转基因)表达的microRNA前体构建体。
在生物技术的多个领域(包括但不限于基因治疗和植物生物工程)中存在的一个主要的障碍是很难实现细胞或组织特异性。转录对于每一种活的生物而言是必需的过程,以便将抽象的遗传信息转变成有形的实物。启动子是驱动转录的主要成分。一些启动子在每一种组织中具有活性(例如肌动蛋白启动子),而另外的启动子仅在有限组织中具有活性。很常见的情况是,特定的启动子在一种组织类型中具有主要的活性,但在一些另外的组织中微弱表达,这就是所谓的渗漏启动子。这些启动子对于农业和药物应用是不合乎需要的,因为源于渗漏启动子的目的基因的无意表达对作物或患者造成不利影响。这当然不合乎管理机构的要求。
例如,植物寄生线虫在所有经济作物中致病,据估计导致全球农业每年损失1000亿美元。在美国,大豆胞囊线虫是影响几乎所有大豆生产州(约8000万英亩)的第一位的害虫,并且导致每年30%的产量损失。化学控制手段是不适当的并且对环境不利。转基因植物技术呈现出巨大的潜力,然而到目前为止尚未成功。一个主要的问题是线虫取食部位“特异性”启动子的的渗漏活性。虽然此类启动子(例如TobRB7)能驱动植物毒性分子以“杀死”摄食细胞并减轻线虫感染,但这些植物毒性分子在其它组织(例如花)中的渗漏表达对宿主植物产生不利的影响。因此高度需要控制渗漏表达的新的方法。
例如,癌症化疗和放疗中的主要问题是难以实现肿瘤特异性细胞杀伤。放疗或细胞毒性化疗剂无法区分肿瘤细胞与正常细胞,这必定限制了可以使用的剂量。结果,常常观察到,由于残留肿瘤细胞所导致的疾病复发,因此,明确需要可选的非外科手术策略。基因治疗技术的发展接近于在临床上实现治疗肿瘤和代谢疾病,并且已经鉴定出众多的显示抗肿瘤活性的基因。此外,由于基因治疗构建体所编码的抗肿瘤多肽的全身毒性,限制了基因治疗方法的效用(Spriggs&Yates(1992)in Bentler,ed.,TumorNecrosis Factor:Molecules and Their Emerging Roles in Medicine,pp.383-406 Raven Press,New York,N.Y.;Sigel&Puri(1991)J Clin Oncol9:694-704;Ryffel(1997)Immunopathol 83:18-20)。基因治疗策略领域当前技术水平所面临的问题是无法将治疗基因特异性地递送至靶细胞。这导致在非靶细胞内产生毒性。例如,操作p53基因抑制了肿瘤细胞和正常细胞的生长,并且静脉内施用肿瘤坏死因子α(TNFα)诱导全身毒性,临床表现为发热和高血压。已经尝试克服这些问题。这包括使用策略,如使用组织特异性启动子以将基因表达限制在特异组织中,以及使用热(Voellmy R.等,Proc.Natl.Acad.Sci.USA,82:4949-4953(1985))或电离辐射诱导型增强子和启动子(Trainman,R.H.等,Cell 46:567-574(1986);Prowess,R.等,Proc.Natl.Acad.Sci.USA 85,7206-7210(1988))以增强治疗基因以时空控制方式表达。
腺病毒载体拥有多种优点,使得它们可以用作基因递送载体用于全身基因治疗。理想上,可以设计此系统以致于全身施用的载体可以特异性地靶向肿瘤靶细胞,而不异位感染正常细胞。此外,妨碍该方法应用的障碍是这样一种现实,全身施用的腺病毒载体中,决大多数被肝脏接收。因此,特异性控制所递送转基因表达的措施将施加于基础载体用于腺病毒载体的最佳适用性。
不幸地是,对于大多数当前表达系统,由于可利用的启动子的“渗漏性”导致活性成分的表达不限于肿瘤位点,由此限制了此类方法的有效性。组织特异性启动子可进一步提高转基因表达选择性的程度,但是经体内验证的此类启动子寥寥无几,并且所有的启动子都有一定程度的非特异性活性或“渗漏性”。因此,对于基因治疗高度渴求可控基因表达的通用机制。
控制基因表达的机制理想上包括空间上控制基因表达和时间上控制基因表达。现存的一个策略采用化学调节的信号,例如四环素诱导型基因表达系统(Gossen&Bujard(1992)Proc Natl Acad Sci USA 89:5547-5551;Gossen&Bujard(1993)Nuc Acids Res 21(18):4411-4412;Gossen等,(1995)Science 268:1766-1769)。相似的方法涉及提供电离辐射以活化辐射敏感性启动子,例如EGR-1启动子(Weischelbaum等,(1994)Cancer Res54:4266-4269;Hallahan等,(1995)Nat Med 1(8):786-791;Joki等,(1995)Hum Gen Ther 6:1507-1513)。一个备选的设计依赖于基因表达的内源性控制。例如,CEA启动子在癌细胞中选择性表达(Hauck&Stanners(1995)JBiol Chem 270:3602;Richards等,(1995)Human Gene Ther 6:881-893)。
在过去,尝试了几种方法来解决植物基因表达中的渗漏问题,但不很成功。通过对启动子进行一系列的删除,有可能消除启动子区域中负责渗漏表达的序列。例如,当被线虫感染时,删除形式的TbRB7启动子驱动GUS报告基因在线虫摄食细胞中表达。然而,在花组织中的渗漏表达仍未解决(Opperman CH等,Science 263:221-223,(1994))。通过制造嵌合启动子,即最小功能启动子(例如35S启动子)加组织特异性调节元件,人们可以将基因表达限定在所渴望的组织中。此外,如果组织特异性调节元件是渗漏性的,则嵌合启动子也是渗漏性的。
US 20030045495公开了通过过热选择性表达治疗基因的改良的诱导型系统。此外,低温也很难应用于不连续细胞或者小的组织区。
US 20010049828描述了控制转基因产物在转基因动物的特异性组织内表达的方法和系统。系统基于多种反式激活子的相互作用。反式激活子活性由处于组织特异性启动子控制下的反义分子控制,由此抑制在某些组织内表达。系统相当复杂并且依赖于几种表达构建体和转基因的转录因子。相似的系统描述于US 20020065243。
US 20020022018描述了通过在靶生物中采用进行组织特异性删除或破坏的表达构建体(通过组织特异性表达Cre重组酶)而控制组织特异性。Cre重组酶表达的结果是,在那一组织中表达的同一载体或者另一载体会通过Cre重组酶的作用切割成几段,这是由于LoxP位点已经战略性地置于载体主链中。因此,防止了不需要的转基因和病毒基因的表达。此外,由于驱动Cre表达的启动子的渗漏性,预计在靶组织自身内的表达也降低了,由此降低了该方法的总体效率。
虽然每一个上述系统表现出可诱导性,由此解决了基因表达的时间控制问题,但是基因诱导的空间上的精确性仍然是不足的。迄今为止,本领域所公开的所有系统或者高度复杂,或者降低了在靶细胞中的表达效率。因此,本质上仍然需要改进组织特异性或者控制启动子渗漏性。本发明提供了此种手段和方法,由此实现了本领域中的此种长期需求和渴望。
发明简述
本发明的第一实施方案涉及用于在真核生物中以提高的特异性表达转基因的方法,所述方法包括步骤:
a)提供表达构建体,构建体包含在所述真核生物中具有功能并且功能性连接至待表达成为嵌合RNA序列的核苷酸序列上的启动子序列,所述核苷酸序列包含:
i)至少一个能赋予所述真核生物优选表型或有益效果的序列,和
ii)至少一个与所述真核生物中天然表达的microRNA序列基本互补的序列,其中所述microRNA在不希望此种表达的组织中、时间上和/或环境条件下天然表达,但是在希望此种表达的组织中、时间上和/或环境条件下不表达或者基本上较少表达,
其中至少一个序列i)和序列ii)彼此是异源性的,和
b)将所述表达构建体导入真核生物。
优选地,所述真核生物是人、动物或植物。
在待表达的核苷酸序列中,对于与microRNA基本互补的序列(下文也称作“microRNA标签”)可能存在多个位置。优选地,与microRNA基本互补的序列位于待表达核苷酸序列中对应于该序列5’非翻译区或3’非翻译区的位置。
待表达的核苷酸序列可以具有多种形式和/或功能。例如,其可以包含编码蛋白质的开放阅读框。备选地,其可以编码选自反义RNA、正义RNA、双链RNA或核酶的功能性RNA。所述功能性RNA优选地减弱内源基因的表达。
为了增强表达的特异性,microRNA(待表达核苷酸序列中所包含的序列与其基本互补)优选地非组成型表达,但是在选自组织、空间、时间、发育、环境或其他外源因素中的至少一个参数中表达是变化的。优选地,microRNA为组织特异性表达、空间调节性表达、发育调节性表达和/或生物或非生物应激因素调节性表达。
用于表达包含microRNA标签的核苷酸序列的表达构建体可以是RNA、DNA并且可以是单链或者双链的。优选地,表达构建体是DNA,更优选地是双链DNA。表达构建体可以是更长载体构建体的部分。优选地,表达构建体是质粒。
多种启动子可用于表达包含microRNA标签的核苷酸序列。启动子可以选自例如组成型启动子、组织特异性或组织优先性启动子和诱导型启动子。在本文中,组织特异性启动子优选地意指其以小但可测的程度渗漏(即在除优选的或主要组织之外的组织中具有表达活性)。
本发明具有宽的应用可能性,其可以在植物、人和动物领域应用。
在一个优选的实施方案中,真核生物是植物并且启动子是在植物中具有功能的启动子。对于植物而言,所表达的核苷酸序列优选地调节农学性状、疾病抗性、除草剂抗性和/或谷粒特性所涉及的基因的表达。本领域技术人员知道可以在本文中使用并且增强表达特异性对其有益的多种核苷酸序列。例如所表达的核苷酸序列可以调节选自如下基因的表达,所述基因为参与蛋白质、肽、脂肪酸、脂类、蜡类、油类、淀粉、糖、碳水化合物、香料、气味、毒素、类胡萝卜素、激素、聚合物、类黄酮、贮存蛋白、酚酸、生物碱、木质素、单宁类、纤维素、糖蛋白和糖脂合成和/或降解的基因。
在本文中考虑了多种植物中的应用,对于这些应用以一定方向调节表达谱是有益的。该调节通过以这样的方式选择microRNA标签而实现,即天然存在的miRNA的表达谱与应该实现不表达或较低表达的组织、时间和/或环境条件相吻合。例如,microRNA在植物中具有选自下列的表达谱:
a)基本上组成型表达但在种子中不表达,
b)主要在种子中表达但在其它组织中不表达,
b)干旱或其它非生物应激诱导型表达,
c)植物病原体诱导型表达,
c)时间性表达(例如在早期发育、萌芽、授粉等过程中),和
d)化学诱导型表达。
优选地,microRNA是选自下列的植物microRNA:
a)SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述序列,和
b)SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述序列的衍生物。
在一个优选的实施方案中,所述衍生物与任意的SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述序列具有至少70%、优选地至少80%或85%、更优选地至少90%、最优选地至少95%的同一性。
本文提供的其它应用是用于动物(特别是哺乳动物)或人。特别优选的是药物应用。因此,在本发明的另一个优选实施方案中,靶生物是哺乳动物(更优选地是人)并且启动子是在哺乳动物中(更优选地在人中)具有功能的启动子。所表达的包含miRNA-标签的核苷酸序列优选地调节(例如表达、过表达或抑制)选自人或动物疾病所涉及基因或者治疗性基因的基因表达。备选地,可以表达对靶生物具有疗效的外源基因或序列。疾病优选地选自免疫疾病、癌症、糖尿病、神经变性疾病和代谢疾病。本领域技术人员知道可用于该发明的多种序列。受调节的基因可选自视网膜母细胞瘤蛋白、p53、制管张素、瘦蛋白、激素、生长因子、细胞因子、胰岛素、生长激素、α-干扰素、β-葡糖脑苷脂酶、血清白蛋白、血红蛋白和胶原。治疗基因可选自肿瘤坏死因子α。在该情况下,本文所公开的发明是用于基因治疗或核苷酸介导治疗的改良方法。
在本领域中当前使用多种启动子以在动物、哺乳动物或人中表达序列。它们当中大多数缺乏组织特异性并且可以与本文提供的教导有利组合。例如,启动子可以选自perbB2启动子、乳清酸性蛋白启动子、溶基质蛋白酶3启动子、前列腺特异性抗原启动子、probasin启动子。
在本文中考虑了在动物、哺乳动物或人中的多种应用,其中以确定方向调节表达谱是有利的。该中调节通过以这样的方式选择microRNA标签实现,即天然存在的miRNA的表达谱与将实现不表达或较低表达的组织、时间和/或环境条件相吻合。例如,microRNA在动物、哺乳动物或人中具有选自下列的天然表达谱:
a)在选自脑组织、肝脏组织、肌肉组织、神经元组织和肿瘤组织中组织特异性表达,
b)应激诱导型表达,
c)病原体诱导型表达,
d)赘生生长或致瘤生长诱导型表达,和
e)年龄依赖性表达。
优选地,microRNA是选自下列的动物、哺乳动物或人microRNA:
a)SEQ ID NO:56、57、58、59、60、61、62和63所述序列,和
b)SEQ ID NO:56、57、58、59、60、61、62和63所述序列的衍生物,和
c)任意SEQ ID NO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208所述序列的互补RNA序列,和
d)与任意SEQ ID NO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208所述序列互补的RNA序列的衍生物。
在一个优选的实施方案中,所述衍生物与任意SEQ ID NO:56、57、58、59、60、61、62和63所述miRNA或者与任意SEQ ID NO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208所述序列互补的RNA序列具有至少70%、优选地至少80%或85%、更优选地至少90%、最优选地至少95%的同一性。
通过本发明方法所表达的嵌合RNA(即RNA包含所表达的miRNA-标签)被认为是新的。因此,本发明的另一个实施方案涉及嵌合核糖核苷酸序列,所述核糖核苷酸序列包含:
i)至少一个能赋予所述真核生物优选表型或有益效果的序列,和
ii)至少一个与所述真核生物中天然表达的microRNA序列基本互补的序列,
其中至少一个序列i)和序列ii)彼此是异源性的。
所述嵌合核糖核苷酸序列中的序列i)和/或ii)优选地如上对于本发明方法所定义。
此外,用于表达所述嵌合核糖核苷酸序列的表达构建体(其在本发明方法中采用)被认为是新的。因此,本发明的另一个实施方案涉及包含在所述真核生物中具有功能并且功能性连接至待表达核苷酸序列上的启动子序列的表达构建体,所述核苷酸序列包含:
i)至少一个能赋予所述真核生物优选表型或有益效果的序列,和
ii)至少一个与所述真核生物中天然存在的microRNA序列基本互补的序列,
其中至少一个序列i)和序列ii)彼此是异源性的。
表达构建体及其元件优选地如上面对本发明方法所定义。
本发明的另一个实施方案涉及包含本发明表达构建体的表达载体。优选地,表达载体是真核表达载体。更优选地,真核表达载体是病毒载体、质粒载体或双元载体。
然而,本发明的另一个实施方案涉及包含本发明嵌合核糖核苷酸序列、表达构建体或表达载体的转化细胞或生物(优选非人生物)。优选地,所述表达构建体或表达载体被插入到(至少部分)细胞或生物的基因组中。优选地,所述细胞或生物选择哺乳动物、细菌、真菌、线虫或植物细胞和生物。本发明的另一个实施方案涉及本发明植物的转化的种子。
然而,本发明的另一个实施方案涉及至少一个本发明表达构建体、嵌合核糖核苷酸序列或载体的药物制剂。
附图简述
为了使本发明的上述特征、优点和目的以及其它方面清楚并且可以详细地理解,通过参考其特定的实施方案对上面简短总结的本发明更加具体地描述,所述实施方案在附图中阐明。这些附图形成了说明书的一部分。然而,应当注意,附图阐明了本发明的优选实施方案并且因此不能认为是限制其范围。
图1植物中miRNA的生物发生和作用模式(Bartel D,Cell 116:281-297,2004)
步骤1:miRNA基因被Pol II转录成为Pri-miRNA。越来越多的证据表明至少一些转录本在5’末端具有帽子结构并且在3’末端被多聚腺苷酸化。短暂的Pri-miRNA形成茎环结构并且迅速进入步骤2。
步骤2:Pri-miRNA被Dicer-1加工成Pre-miRNA,导致暴露成熟miRNA的一端。
步骤3:Pre-miRNA被DCL1或另一基因加工成成熟miRNA:miRNA双链体(约22nt)。
步骤4:miRNA从细胞核输出至细胞质。很可能此此输出过程需要哺乳动物核输出蛋白-5的植物直系同源物HASTY。
步骤5,6:单链miRNA最终掺入到RISC(RNA诱导的沉默复合体)中,并且在与miRNA完全或接近完全互补的位点特异性结合至靶mRNA。
步骤7:miRNA在转录后水平或翻译水平抑制基因表达。
图2玉蜀黍(Zea mays)基因表达数据库中玉米microRNA前体的特异表达模式。
A:miR166前体在叶和雄花穗中的表达
B:miR167前体在种子中的优势表达
C:miR159前体在除种子外的各处的表达
D:miR160前体的应激诱导型表达
图3增强的种子特异性表达
玉米miR159在除种子外的所有组织中表达(图3-A)。如果想使用渗漏的“种子特异性”启动子仅在种子表达目的基因(GOI),可以将miRNA-标签(5’-AGAGCTCCCTTCAATCCAAA-3’,其与miR159互补)整合至GOI后的3’UTR中,以便使通用双元载体通过内源性miR159来控制GOI在非种子组织中的渗漏表达(图3-B)。GOI仅在种子中有效表达,但在表达内源性miRNA159的其它组织中其mRNA被降解(用剪刀对表示)。
图4在非种子组织中的增强的表达特异性(防止在种子中表达)
玉米miR167在种子中优势表达(图4-a)。如果目的基因(GOI)不旨在在种子中表达(例如赋予杀虫剂活性的基因),但是所使用的启动子是在种子中渗漏的,人们可以将标签(5’-TGAAGCTGCCAGCATGATCT-3’,与miR167互补)整合入GOI之后的3’UTR,以便使通用载体通过内源性miR167控制GOI在种子中的不需要的表达(图4-B)。GOI仅在内源性miRNA167表达的种子中被有效降解(用剪刀对表示),而在其它组织中表达GOI。
图5控制GOI表达渗漏性的通用载体
本文所公开发明开用于以空间和/或时间方式调节转基因的表达。一些性状(例如用于动物饲料)需要目的基因(GOI)在一定阶段(例如早期胚胎或晚期胚胎)表达。某些miRNA可以在不同发育阶段被调节。因此,可以整合与miRNA X(组织特异性)和/或miRNA Y(发育特异性)互补的miRNA靶位点,以致于GOI的表达可以以最合意的方式控制。
定义
缩写:BAP:6-苄氨基嘌呤;2,4-D:2,4-二氯苯氧乙酸;MS:Mura-shige和Skoog培养基;NAA:1-萘乙酸;MES:2-(N-吗啉)乙磺酸;IAA-吲哚乙酸;Kan:硫酸卡那霉素;GA3:赤霉酸;TimentinTM:替卡西林钠/克拉维酸钾。
应当理解,本发明不限于照此描述的特定方法学、方案、细胞系、植物种或属、构建体和试剂。还应当理解,本文所用的属于仅用于描述特定实施方案的目的,并且不旨在限制本发明的范围,本发明的范围仅由后附权利要求限定。必需注意,如本文和后附权利要求所使用,单数形式“a”、“and”和“the”包括复数,除非上下文明确指出。因此,例如,当提到“a vector”时是指一个或多个载体并且包括本领域技术人员已知的其等效等的国内。在本文使用的术语“约”意思是指近似地、粗略地或在其范围内。当术语“约”与数值范围联合使用时,其通过延伸边界至高于和低于所述数值来限制范围。通常,术语“约”在本文中用于通过高或低(更高或更低)20%、优选10%的差异限定数值高于和低于所述值。如本文所使用,词语“或”意思是指所列的任何一个成员并且还包括所列成员的组合。当词语“包含”和“包括”用于本说明书和后附权利要求时意思是说明存在一个或多个所述特征、整数、成分或步骤,但是它们不排除存在或添加一个或多个它们的其它特征、整数、成分、步骤或组。为了清楚起见,在说明书中使用的某些术语如下定义的使用:
农学上有价值的性状:术语“农学上有价值的性状”指植物中对于食物生产或食物产品,包括植物部分和植物产品有用或有利的任何表型。非食物农产品如纸等也包括在内。特定的农学上有价值的性状包括抗虫性、活力、发育时间(收获时间)、提高的养分含量、新的生长模式、香料或颜色、盐、热、干旱和冷耐受等。优选地,农学上有价值的性状不包括选择标记基因(例如编码仅用于促进检测或选择所转化细胞的除草剂或抗生素抗性的基因)、导致植物激素产生的激素生物合成基因(例如仅用于选择的生长素、赤霉素、细胞激肽类、脱落酸和乙烯)或报告基因(例如荧光素酶、葡糖苷酸酶、氯霉素乙酰转移酶(CAT)等)。此类农学上有价值的重要性状抗包括抗虫性(例如Melchers等,(2000)Curr Opin Plant Biol3(2):147-52)、活力、发育时间(收获时间)、提高的养分含量、新的生长模式、香料或颜色、盐、热、干旱和冷耐受性(例如Sakamoto等,(2000)J ExpBot 51(342):81-8;Saijo等,(2000)Plant J 23(3):319-327;Yeo等,(2000)Mol细胞10(3):263-8;Cushman等,(2000)Curr Opin Plant Biol3(2):117-24)等的改善。技术人员会认识到,存在多种可以选择用来赋予这些和其它农学上有价值的性状的多核苷酸。
改变:“改变”或“调节”核苷酸序列在细胞(例如植物细胞)中的表达意思是指,在应用本发明方法之后,核苷酸序列在细胞中的表达水平不同于应用该方法之前其在细胞中的表达水平。在优选的实施方案中,改变表达意思是指,与应用本发明方法之前相比,应用本发明方法之后核苷酸序列在植物中的表达降低了。“降低”靶基因的表达或靶基因表达的“降低”应当广义理解,并且包括部分或基本完全防止或封闭靶基因或从而衍生的RNA、mRNA、rRNA、tRNA和/或由其编码的蛋白质在细胞、生物或其部分、组织、器官、细胞或种子中的表达,防止或封闭可基于不同的细胞生物学机制。术语“降低的”在本文中意思是指更低、优选显著更低、更优选核苷酸序列的表达检测不到。如本文所使用,活性剂如蛋白质或mRNA水平的“降低”意思是指,相对于缺乏能够降低活性剂的本发明嵌合RNA分子的细胞或生物水平降低了。如本文所使用,活性剂(如靶基因所表达的RNA、mRNA、rRNA、tRNA和/或其所编码的蛋白质产物)水平的“至少部分降低”意思是指,相对于缺乏能够降低所述活性剂的本发明嵌合RNA分子的细胞或生物,水平降低至少25%、优选地至少50%。如本文所使用,活性剂如蛋白质或mRNA水平的“基本降低”意思是指,相对于缺乏能够降低活性剂的本发明嵌合RNA分子的细胞或生物,水平降低了,活性剂水平降低至少75%、优选地至少85%。如本文所使用,“有效消除”活性剂如蛋白质或mRNA是相对于缺乏能够降低活性剂的本发明嵌合RNA分子的细胞或生物而言的,其中活性剂水平降低大于95%、优选地大于98%。降低可通过技术人员熟悉的方法确定。因此,蛋白质数量的降低可以通过例如蛋白质免疫检测确定。此外,也可采用生物化学技术,如Northern杂交、核酸酶保护分析、逆转录(定量RT-PCR)、ELISA(酶联免疫吸附测定)、Western印迹、放射免疫分析(RIA)或其它免疫分析和荧光激活的细胞分析(FACS)。依赖于所降低蛋白质产物的类型,还确定了其活性或对生物或细胞表型的影响。用于测定蛋白质数量的方法是技术人员熟知的。例如,可以提到的方法有micro-Biuret法(Goa J(1953)ScandJ Clin Lab Invest 5:218-222)、Folin-Ciocalteau法(Lowry OH等,(1951)JBiol Chem 193:265-275)或测定CBB G-250吸收(Bradford MM(1976)Analyt Biochem 72:248-254)。在另一个优选的实施方案中,改变表达意思是指,与应用本发明方法之前相比,应用本发明方法之后核苷酸序列在植物中的表达提高了。
氨基酸序列:如本文所使用,术语“氨基酸序列”指代表氨基酸残基的一列缩写、字符或词语。氨基酸可以通过IUPAC-IUB生物化学命名委员会推荐的公知的三字母符号或单字母符号表示。同样,核苷酸可以通过它们通常可接受的单字母密码子表示。
动物:术语“动物”或“动物生物”指非人脊椎动物或无脊椎动物。优选的脊椎动物包括例如鱼类、非人哺乳动物如牛、马、绵羊、山羊、小鼠、大鼠或猪、以及鸟类如鸡或鹅。优选的动物细胞包括CHO、COS、HEK293细胞。无脊椎动物包括线虫或其它虫和昆虫。无脊椎动物包括昆虫细胞,如果蝇(Drosophila)S2和夜蛾(Spodoptera)Sf9或Sf21细胞。此外,优选的是能够攻击动物或人的线虫,例如钩虫属(Ancylostoma)、鸡蛔虫属(Ascaridia)、蛔虫属(Ascaris)、仰口线虫属(Bunostomum)、新杆状线虫属(Caenorhabditis)、毛细线虫属(Capillaria)、夏柏特线虫属(Chabertia)、古柏线虫属(Cooperia)、网尾线虫属(Dictyocaulus)、血矛线虫属(Haemonchus)、异刺线虫属(Heterakis)、细颈线虫属(Nematodirus)、结节线虫属(Oesophagostomum)、胃线虫属(Ostertagia)、尖尾线虫属(Oxyuris)、副蛔虫属(Parascaris)、圆线虫属(Strongylus)、弓蛔线虫属(Toxascaris)、鞭虫属(Trichuris)、毛圆线虫属(Trichostrongylus)、Tfhchonema属、弓蛔虫属(Toxocara)或钩虫属(Uncinaria)线虫。此外,优选的是能够攻击植物的那些,例如Bursaphalenchus属、小环线虫属(Criconemella)、Diiylenchus属、茎线虫属(Ditylenchus)、Globodera属、螺旋线虫属(Helicotylenchus)、异皮线虫属(Heterodera)、长针线虫属(Longidorus)、Melodoigyne属、珍珠线虫属(Nacobbus)、针线虫属(Paratylenchus)、短体线虫属(Pratylenchus)、穿孔线虫属(Radopholus)、Rotelynchus属、垫刃线虫属(Tylenchus)或剑线虫属(Xiphinema)线虫。优选的昆虫包括鞘翅目(Coleoptera)、双翅目(Diptera)、鳞翅目(Lepidoptera)和同翅目(Homoptera)。
反平行:“反平行”在本文中指通过互补碱基残基间氢键成对的两个核苷酸序列,在一个核苷酸序列中在5′-3′方向上具有连续的磷酸二酯键并且在另一个核苷酸序列中在3′-5 ′方向上具有连续的磷酸二酯键。
反义:术语“反义”指相对于其正常方向而言为倒转的核苷酸序列,正常方向为用于转录并因此表达出RNA转录本的方向,反义与宿主细胞中所表达的靶基因mRNA分子互补(例如其通过Watson-Crick碱基配对与靶基因mRNA分子杂交)。可以以多种不同方式构建反义链,只要其能够干扰靶基因的表达即可。例如,可以通过将靶基因的编码区(或其部分)相对于其用于转录的正常方向倒转构建反义链,以便转录出其互补链(例如通过反义基因和正义基因编码的RNA是互补的)。此外,反义寡核苷酸链不需要具有与靶基因相同的内含子或外显子模式,并且在实现靶基因表达的反义抑制中,靶基因的非编码区段与编码区段同样有效。在基因沉默的情况下,术语“反义”应当理解为意思是指具有与靶序列互补的序列的核酸,靶序列例如正在寻找的通过与靶序列的杂交而启动对其表达进行抑制的信使RNA(mRNA)序列。
细胞:如本文中所使用,术语“细胞(cell)”或“植物细胞(plant cell)”优选地指单一细胞。术语“细胞(cells)”指一群细胞。群体可以是包含一种细胞类型的纯的群体。同样,群体可以包含一种以上的细胞类型。在本发明中,对于群体中所包含的细胞类型的数量没有限制。细胞可以是同步化的或者不是同步化的。本发明含义内的细胞可以是分离的(例如在悬浮培养中)或包含于任何发育阶段的组织、器官或生物中。
编码区:如本文所使用,术语“编码区”当用于指结构基因时,意思是指编码在mRNA分子翻译得到的新生多肽中所存在氨基酸的核苷酸序列。编码区在真核生物中是有界限的,在5′侧界限为编码起始甲硫氨酸的核苷酸三联体“ATG”并且在3′侧界限为指定为终止密码子的三个三联体(即TAA、TAG、TGA)之一。基因组形式的基因除了包含内含子之外,还包括位于RNA转录本中所存在序列5′和3′末端的序列。这些序列被称作“侧翼”序列或区域(这些侧翼序列位于mRNA转录本上所存在非翻译序列的5′或3′)。5′侧翼区括包含调节序列,例如控制或影响基因转录的启动子和增强子。3′侧翼区可包含指导转录、转录后切割和多聚腺苷酸化的序列。
互补的:“互补的”或“互补性”指包含反平行核苷酸序列的两个核苷酸序列,其中反平行核苷酸序列在反平行核苷酸序列中互补碱基残基间形成氢键时能够彼此配对(通过碱基配对规则)。例如,序列5′-AGT-3′和序列5′-ACT-3′是互补的。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核酸碱基按照碱基配对规则不匹配。核酸间的“全部”或“完全”互补性是其中在碱基配对规则下每一核酸碱基均匹配。核酸链间的互补程度明显影响核酸链间的杂交效率和强度。如本文所使用,核酸序列的“互补序列”指其核酸显示出与该核酸序列的核酸完全互补的核苷酸序列。
染色体DNA:术语“染色体DNA”或“染色体DNA序列”应理解为不依赖于细胞周期状态的细胞核的基因组DNA。染色体DNA因此可以被组织在染色体中或染色单体中,其可以是凝集的或解旋的。向染色体DNA中的插入可以通过多种本领域熟知的方法,如聚合酶链式反应(PCR)分析、Southern印迹分析、荧光原位杂交(FISH)和原位PCR来证明和分析。
DNA改组:DNA改组是优选随机地向DNA分子中快速、容易和高效引入突变或重排,以便产生两个或两个以上分子间的DNA序列优选随机交换的方法。源于DNA改组的DNA分子是改组的DNA分子,其是从至少一个模板DNA分子衍生的非天然存在的DNA分子。改组的DNA编码相对于模板DNA所编码酶经过改良的酶,并且优选具有相对于模板DNA所编码酶而言改变了的生物学活性。
双链RNA:“双链RNA”分子、“RNAi分子”或“dsRNA”分子包含核苷酸序列的正义RNA片段和核苷酸序列的反义RNA片段,该两个片段包含彼此互补的核苷酸序列,由此允许正义和反义RNA片段配对并形成双链RNA分子。优选地,术语指当将其导入细胞或生物中时能够至少部分地降低细胞或生物细胞中所存在mRNA的水平的双链RNA分子。如本文所使用,“RNA干扰”、“RNAi”或“dsRNAi”指通过双链RNA分子所诱导的基因特异性沉默。
内源的:“内源的”核苷酸序列指在非转化细胞(例如植物或哺乳动物细胞)基因组中存在的核苷酸序列。
必需的:“必需的”基因是编码生物或细胞(例如植物)生长或存活所必需的蛋白质,如生物合成酶、受体、信号转导蛋白、结构基因产物或运输蛋白的基因。
外显子:如本文所使用,术语“外显子”的正常意思是指编码所表达蛋白质的部分或全部的核酸分子(通常是DNA)区段。
表达:“表达”细胞中基因产物的生物合成,优选地指核苷酸序列如内源基因或异源基因的转录和/或翻译。例如,以结构基因为例,表达涉及结构基因转录成mRNA和任选地随后将mRNA翻译成一种或多种多肽。以反义构建体为例,例如,表达可以指仅反义DNA的转录。
表达构建体/表达构件:如本文所使用,“表达构建体”和“表达构件”是同一词,意思是指能够指导特定核苷酸序列在适当宿主细胞(例如植物或哺乳动物细胞)中表达的DNA序列,包含有效连接至目的核苷酸序列的、在将要导入的宿主细胞中具有功能的启动子,而目的核苷酸序列任选地与终止信号连接。如果需要翻译,通常其还包含对于核苷酸序列正确翻译所需要的序列。编码区在正义或反义方向上可以编码目的蛋白质,但是也可以编码目的功能性RNA,例如反义RNA、dsRNA或非翻译RNA。包含目的核苷酸序列的表达构建体可以是嵌合的,这意思是指至少一个其元件相对于其它元件而言是异源的。表达构建体可以是天然存在的表达构建体,但是还可以是以用于异源表达的重组形式得到表达构建体。然而,通常表达构建体相对于宿主而言是异源的,即表达构建体的特定DNA序列在宿主细胞中不天然存在并且必须是已经通过转化事件导入宿主细胞或宿主细胞祖先中。表达构建体中核苷酸序列的表达可以处于组成型启动子或诱导型启动子控制之下,诱导型启动子仅在宿主细胞接触一些特定外界刺激时才启动转录。以多细胞生物如植物为例,启动子可以是对特定组织或器官或发育阶段特异性的。
外源基因:术语“外源基因”指通过实验操作导入细胞基因组中的任何核酸(例如基因序列),并且可以包括在所导入细胞中存在的基因序列,只要所导入基因相对于天然存在的基因包含一些修饰(例如点突变、存在选择性标记基因等)即可。
基因:术语“基因”指与能够以一些方式调节基因产物(例如多肽或功能性RNA)表达的适当调节序列有效连接的编码区。基因包括在编码区(开放阅读框,ORF)之前(上游)和之后(下游)的DNA非翻译调节区(例如启动子、增强子、阻遏子等),以及(如果适用的话)各个编码区(即外显子)之间的插入序列(即内含子)。如本文所使用,术语“结构基因”意思是指被转录成mRNA的DNA序列,而之后mRNA被翻译成特定多肽独特的氨基酸序列。
遗传修饰生物:术语“遗传修饰生物”或“GMO”指包含异源DNA或转基因的任何生物。示例性的生物包括植物、动物或微生物。
基因组和基因组DNA:术语“基因组”或“基因组DNA”指宿主生物的可遗传的遗传信息。所述基因组DNA包括细胞核DNA(也称作染色体DNA),但是也包括质体(例如叶绿体)和其它细胞器(例如线粒体)DNA。优选地,术语基因组或基因组DNA指细胞核染色体DNA。
发夹RNA:如本文所使用,“发夹RNA”指任何自身复性的双链RNA分子。在其最简单的代表中,发夹RNA由通过复性RNA链构成的双链茎组成,双链茎通过单链RNA环连接,其也称作“锅-柄RNA”。此外,术语“发夹RNA”还旨在包括包含自身复性双链RNA序列以及内部膨泡和环的更复杂的二级RNA结构。所采用的特定二级结构会通过RNA分子的自由能决定,并且可以使用适当软件如FOLDRNA(Zuker和Stiegler(1981)Nucleic acids Res 9(1):133-48;Zuker,M.(1989)Method Enzymol.180,262-288)对不同情况进行预测。
异源的:术语“异源的”在指核酸或DNA时,意思是指被连接至或者被操作后连接至在天然情况下其不连接至或者在天然情况下其在不同位置被接连至的核酸序列的核苷酸序列。包含核酸序列和连接至其上的至少一个调节序列(例如启动子转录终止信号)的异源表达构建体例如是通过实验操作产生的构建体,在所述实验操作中a)所述核酸序列,或b)所述调节序列,或c)两者(即(a)和(b))不位于其自然(天然)遗传环境中或者已经通过遗传操作修饰,修饰实例是一个或多个核苷酸残基的取代、添加、缺失、倒转或插入。天然遗传环境指天然的或基因组文库中存在的生物天然染色体基因座。以基因组文库为例,核酸序列的天然遗传环境被优选地保留,至少部分保留。核酸序列至少一侧为环境,并且环境具有长度至少50bp、优选地至少500bp、特别优选地至少1,000bp、非常特别优选地至少5,000bp的序列。天然存在的表达构建体(例如天然存在的启动子与相应基因的组合)被非天然的、合成性(人工)方法,如诱变修饰后其变成了转基因表达构建体。此类方法已有描述(US 5,565,350;WO 00/15815)。例如,蛋白质编码核酸序列与非该序列天然启动子的启动子有效连接时,则核酸序列被认为相对于启动子而言是异源的。优选地,异源DNA相对于其所导入的细胞而言不是内源的或者不是天然相关的,而是从另一细胞得到的。异源DNA还包括包含一些修饰的内源DNA序列、非天然存在的多拷贝内源DNA序列、或与其物理连接的另一DNA序列不是天然相关的DNA序列。虽然不必要,但是异源DNA通常编码表达其的细胞所不能正常产生的RNA和蛋白质。
同源DNA序列:与宿主细胞或另一DNA序列天然相关的DNA序列。
杂交:如本文所使用,术语“杂交”包括“核酸的一条链通过碱基配对与互补链结合在一起的任何过程”(J.Coombs(1994)Dictionary ofBiotechnology,Stockton Press,New York)。杂交和杂交强度(即核酸间结合的强度)受诸多因素影响,例如核酸间互补程度、所涉及条件的严格性、所形成杂交体的Tm以及核酸内G∶C比。如本文所使用,术语“Tm”用于指“解链温度”。解链温度是一群双链核酸分子有一半变成单链的温度。计算核酸Tm的公式是本领域众所周知的。如标准参考书所指出的那样,当核酸在1M NaCl的水溶液中时,可用公式Tm=81.5+0.41(%G+C)计算Tm的简单估计值[见例如Anderson和Young,Quantitative FilterHybridization,in Nucleic Acid Hybridization(1985)]。其它参考书包括更复杂的计算,在其中将结构和序列特征纳入了Tm计算中。严格条件是本领域技术人员众所周知的,并且可以在Current Protocols in MolecularBiology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6.中找到。当用于指核酸杂交时,低严格条件包括与下列条件等效的条件:当采用的DNA探针长度优选约100至约1,000个核苷酸时,在由5×SSPE(43.8g/L NaCl,6.9g/LNaH2PO4.H2O和1.85g/L EDTA,用NaOH调节pH至7.4)、1%SDS、5×Denhardt试剂[50×Denhardt中每500mL包含5g Ficoll(Type 400,Pharmacia)、5g BSA(第V部分;Sigma)]以及100μg/mL变性鲑精DNA组成的溶液中于68℃结合或杂交,然后在包含1×SSC(1×SSC是0.15MNaCl加0.015M柠檬酸钠)和0.1%SDS的溶液中于室温或-优选地37℃-洗涤(优选15分钟一次,更优选15两次,更优选15分钟三次)。当用于指核酸杂交时,中等严格条件包括与下列条件等效的条件:当采用的DNA探针长度优选约100至约1,000个核苷酸时,在由5×SSPE(43.8g/L NaCl,6.9g/L NaH2PO4.H2O和1.85g/L EDTA,用NaOH调节pH至7.4)、1%SDS、5×Denhardt试剂[50×Denhardt中每500mL包含5g Ficoll(Type 400,Pharmacia)、5g BSA(第V部分;Sigma)]以及100μg/mL变性鲑精DNA组成的溶液中于68℃结合或杂交,然后在包含0.1×SSC(1×SSC是0.15MNaCl加0.015M柠檬酸钠)和1%SDS的溶液中于室温或-优选地37℃-洗涤(优选15分钟一次,更优选15两次,更优选15分钟三次)。当用于指核酸杂交时,高严格条件包括与下列条件等效的条件:当采用的DNA探针长度优选约100至约1,000个核苷酸时,在由5×SSPE、1%SDS、5×Denhardt试剂以及100μg/mL变性鲑精DNA组成的溶液中于68℃结合或杂交,然后在包含0.1×SSC和1%SDS的溶液中于68℃洗涤(优选15分钟一次,更优选15两次,更优选15分钟三次)。术语“等效的”指与目的杂交条件相关的杂交条件时,意思是指杂交条件和目的杂交条件导致具有同样同源性百分数(%)范围的核酸序列的杂交。例如,目的杂交条件导致第一核酸序列与同第一核酸序列具有80%至90%同源性的其它核酸序列杂交,如果另一杂交条件也导致第一核酸序列与同第一核酸序列具有80%至90%同源性的其它核酸序列杂交,则可以说另一杂交条件与目的杂交条件是等效的。当用于指核酸杂交时,本领域已知,可以采用多种等效的条件以包括低或高严格条件;可以考虑诸多因素,例如探针的长度和性质(DNA、RNA、碱基组成)以及靶标的性质(DNA、RNA、碱基组成、存在于溶液中还是固定化等)以及盐和其它成分的浓度(例如甲酰胺、硫酸葡聚糖、聚乙二醇存在与否)并且可以变动杂交条件以产生不同于所列条件但等效于所列条件的低或高严格杂交。本领域技术人员已知,虽然优选较高的严格性以降低或消除非特异性结合,但是较低的严格性优选用于检测具有不同同源性的更大数量的核酸序列。
“同一性”:术语“同一性”是如通过比较序列所确定的两个或更多个多肽序列或两个或更多个核酸分子序列之间的关系。在本领域中,“同一性”还指如通过此序列串间匹配所确定的多肽或核酸分子序列之间亲缘关系程度。如本文所使用,“同一性”可在相同核糖核酸类型(例如DNA和DNA序列之间)或不同类型(例如RNA和DNA序列之间)核酸序列之间测定。应当理解,在比较RNA序列与DNA序列时,“相同的”RNA序列会包含核糖核苷酸而DNA序列包含脱氧核糖核苷酸,并且还应当理解,RNA序列会包含尿苷,而在DNA序列中的该位置上包含胸苷。以在RNA和DNA序列间测定同一性为例,RNA序列的尿嘧啶碱基被认为与DNA序列的胸腺嘧啶碱基是相同的。“同一性”可通过已知的方法容易地计算,已知方法包括但不限于在下列文献中描述的那些方法:Computational MolecularBiology,Lesk,A.M.编,Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects,Smith,D.W.编,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part I,Griffin,A.M.和Griffin,H.G.编,Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press(1987);Sequence Analysis Primer,Gribskov,M.和Devereux,J.编,Stockton Press,New York(1991);以及Carillo,H.和Lipman,D.,SIAM J.Applied Math,48:1073(1988)。对确定同一性的方法进行设计,以便给出所测试序列间的最大匹配。此外,确定同一性的方法被编进公众可获得的程序中。可用于确定两个序列间同一性的计算机程序包括但不限于GCG(Devereux,J.等,Nucleic acids Research 12(1):387(1984);五个BLAST程序的软件包,其中三个被设计成用于核苷酸序列查询(BLASTN、BLASTX和TBLASTX),两个被设计成用于蛋白质序列查询(BLASTP和TBLASTN)(Coulson,Trends in Biotechnology,12:76-80(1994);Birren等,GenomeAnalysis,1:543-559(1997))。BLASTX程序可从NCBI和其它资源(BLASTManual,Altschul,S.等,NCBI NLM NIH,Bethesda,Md.20894;Altschul,S.等,J.Mol.Biol.,215:403-410(1990))公开获得。众所周知的SmithWaterman算法也可以用于确定同一性。用于多肽序列比较的参数通常包括下列参数:
-算法:Needleman和Wunsch,J.Mol.Biol.,48:443-453(1970)
-比较矩阵:BLOSUM62,来自Hentikoff和Hentikoff,Proc.Natl.Acad.Sci.USA,89:10915-10919(1992)
-开口罚分:12
-开口长度罚分:4
使用这些参数的程序可以作为“gap”程序从Genetics Computer Group,Madison,Wis公开获得。上述参数和终止开口不罚分是用于肽比较的默认参数。用于核酸分子序列比较的阐述包括下列参数:
-算法:Needleman和Wunsch,J.Mol.Bio.48:443-453(1970)
-比较矩阵:匹配-+10;错配=0
-开口罚分:50
-开口长度罚分:3
如本文所使用,使用上述参数作为核酸分子序列比较的默认参数并且使用来自GCG(版本10.2)的“gap”程序确定了“%同一性”。
感染:被细菌或病毒“感染”指靶生物样品(例如细胞、组织等)与细菌或病毒在使得细菌或病毒中所包含核酸序列被导入靶生物样品的一个或多个细胞内的条件下共孵育。
内含子:如本文所使用,术语“内含子”正常意义上是指核酸分子,通常为DNA中不编码所表达蛋白质的部分或全部的区段,并且在内源条件下,其被转录成RNA分子,但在被翻译成蛋白质之前其被从内源RNA中剪切掉。剪接即内含子去除发生在确定的剪接位点,例如在cDNA与内含子序列之间通常至少约4个核苷酸。例如但无限制,形成双链RNA的本文所述正义和反义内含子区段不包含剪接位点。
等基因的:除了存在或缺乏异源DNA序列而不同之外,其为遗传同一性的生物(例如植物)。
分离的:如本文所使用,术语“分离的”意思是材料已经通过人工移出并且以原始天然环境分离的形式存在,因此其不是天然产物。分离的材料或分子(如DNA分子或酶)可以纯化形式存在或者可以非天然环境,如在转基因宿主细胞中存在。例如,在或动物中天然存在的多核苷酸或多肽不是分离的,但是从天然系统中的一些或全部共存物质分开的相同的多核苷酸或多肽是分离的。此类多核苷酸可以是载体的部分和/或此类多核苷酸或多肽可以是组合物的部分,并且将会是分离的,因为此载体或组合物不是其原始环境的部分。优选地,术语“分离的”当用于指核酸时,如在“分离的核酸序列”中,意思是指从在天然来源中其通常结合的至少一个污染物核酸鉴定和分离的核酸序列。分离的核酸是以不同于天然存在的形式或环境存在的核酸。相反,非分离的核酸是在其天然存在的状态中发现的核酸,例如DNA和RNA。例如,特定DNA序列(例如基因)存在于宿主细胞染色体上的邻近基因附近;RNA序列,例如编码特定蛋白质的特定mRNA序列在细胞中作为与编码众多蛋白质的众多其它mRNA的混合物存在。此外,包含例如SEQ ID NO:1的分离核酸序列以举例方式包括细胞内的此类核酸序列,其通常在核酸序列处于不同于天然细胞的染色体或染色体外位置处包含SEQ ID NO:1或者侧翼为与天然存在的核酸序列不同的核酸序列。分离的核酸序列可以单链或双链形式存在。当分离的核酸序列打算用来表达蛋白质时,核酸序列将最低程度包含至少部分有义链或编码链(即核酸序列可以是单链)。备选地,其可以包含有义链和反义链(即核酸序列可以是双链)。
哺乳动物:术语“哺乳动物”旨在包括其正常含义。虽然本发明最希望意指人,但是还用来包括家养哺乳动物,例如犬科、猫科和马科,以及特别感兴趣的哺乳动物,例如动物园动物、农场牲畜等。
成熟蛋白质:正常靶向至细胞器如叶绿体并且转运肽已经被去除的蛋白质。
最小启动子:在缺乏上游活化的情况下无活性或者启动子活性极大降低的启动子元件,特别是TATA元件。在存在适宜转录因子的情况下,最小启动子起作用,允许转录。
非编码:术语“非编码”指不编码所表达蛋白质的部分或全部的核酸分子序列。非编码序列包括但不限于内含子、启动子区域、3′非翻译区域和5′非翻译区域。
核酸和核苷酸:术语“核酸”和“核苷酸”指天然存在或合成的或人工的核酸或核苷酸。术语“核酸”和“核苷酸”包括单链或双链、有义或反义形式的脱氧核糖核苷酸或核糖核苷酸或其任何核苷酸类似物和多聚物或杂合体。除非另外指出,特定核酸序列还隐含包括其保守修饰的变体(例如简并密码子替换)和互补序列,以及明确指出的序列。术语“核酸”在本文中与“基因”、“cDNA”、“mRNA”、“寡核苷酸”和“多核苷酸”互换使用。核苷酸类似物包括在碱基、糖和/或磷酸的化学结构上具有修饰的核苷酸,修饰包括但不限于5-位嘧啶修饰、8-位嘌呤修饰、胞嘧啶环外胺上的修饰、5-溴尿嘧啶替代等以及2′-位糖修饰,包括但不限于2′-OH被H、OR、R、卤素、SH、SR、NH2、NHR、NR2或CN替换的糖修饰核糖核苷酸。shRNA还可以包括非天然成分,例如非天然碱基如肌苷和黄嘌呤,非天然糖如2′-甲氧基核糖或非天然磷酸二酯键如甲基膦酸酯、硫代磷酸酯和肽。
核酸序列:短语“核酸序列”指从5′末端至3′末端读取的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。其包括染色体DNA、自主复制质粒、感染性DNA或RNA聚合物、以及执行一级结构作用的DNA或RNA。“核酸序列”还指连续的一列代表核苷酸的缩写、字母、字符或字。在一个实施方案中,核酸可以是“探针”,其是相对短的核酸,长度通常小于100个核苷酸。通常,核酸探针长度从约50个核苷酸至约10个核苷酸。核酸的“靶区域”是经鉴定为目的部分的核酸的部分。核酸的“编码区”是当置于适当调节序列控制下时被以序列特异性方式转录和翻译以产生特定多肽或蛋白质的核酸部分。可以说,编码区编码此多肽或蛋白质。
目的核苷酸序列:术语“目的核苷酸序列”指出于任何原因(例如赋予改进的品质)本领域普通技术人员对其的操作被认为是合意的任何核苷酸序列。此类核苷酸序列包括但不限于结构基因的编码序列(例如报告基因、选择标记基因、药物抗性基因、生长因子等)以及不编码mRNA或蛋白质产物的非编码调节序列(例如启动子序列、多聚腺苷酸化序列、终止序列、增强子序列等)。目的核酸序列可以优选编码农学上有价值的性状。
寡核苷酸:术语“寡核苷酸“指核糖核酸(RNA)或脱氧核糖核酸(DNA)的寡聚体或多聚体或其模拟物,以及具有非天然存在部分的功能相似寡核苷酸。通常,此类修饰或替代寡核苷酸相对于其天然形式是优选的,因为它们具有合意的特性,例如增强的细胞吸收、增强的对核酸靶的亲和力以及提高的抗核酸酶稳定性。寡核苷酸优选地包括通过化学键(例如磷酸二酯键)或替代化学键彼此共价结合的两个或两个以上核苷酸单体。
有效连接:术语“有效连接”或“有效连接的”的含义应当被理解为,例如,调节元件(例如启动子)与待表达核酸序列以及根据需要更多调节元件(例如终止子)以这样一种方式连续排列,使得每一调节元件可以行使其预期功能以允许、改变、利于或影响所述核酸序列的表达。会取决于核酸序列相对于有义或反义RNA的排列而表达。为此,化学意义上的连接键是不需要的。遗传控制序列,例如增强子序列也可以对距离更远位置上的靶序列或者其它DNA分子上的靶序列起作用。优选的排列是在其中待表达核酸序列重组性地位于作为启动子起作用的序列之后的排列,以致于两个序列共价连接。启动子序列和待重组表达核酸序列之间的距离优选地小于小于200个碱基对、特别优选地小于100个碱基对、非常特别优选地小于50个碱基对。在优选的实施方案中,待转录的核酸序列以这样一种方式位于启动子之后,以致于转录起始与所渴望的本发明嵌合RNA的起始完全相同。有效连接和表达构建体可以通过所述常规重组和克隆技术(例如Maniatis T,Fritsch EF和Sambrook J(1989)Molecular Cloning:ALaboratory Manual,第2版,Cold Spring Harbor Laboratory,Cold SpringHarbor(NY);Silhavy等,(1984)Experiments with Gene Fusions,ColdSpring Harbor Laboratory,Cold Spring Harbor(NY);Ausubel等,(1987)Current Protocols in Molecular Biology,Greene Publishing Assoc.andWiley Interscience;Gelvin等,(编者)(1990)Plant Molecular BiologyManual;Kluwer Academic Publisher,Dordrecht,Netherlands)产生。此外,在两个序列之间还可以有更多序列,例如作为带有限制性酶特异性切割位点的接头或作为信号肽。序列的插入还可以到这融合蛋白的表达。优选地,由启动子和待表达核酸序列连接所构成的表达构建体可以以载体整合形式存在,并且可以通过例如转化插入到植物基因组中。
器官:术语“器官”当指植物时(或“植物器官”)意思是指植物部分,并且包括(但不限于)例如根、果实、枝、茎、叶、花药、萼片、花瓣、花粉、种子等。术语“器官”当指动物时(“动物器官”)意思是指动物部分,并且包括(但不限于)例如外部器官(例如臂、腿、头等)或内部器官(例如心脏、肾脏、肝脏、胃等)。
悬突:“悬突”是在双链寡核苷酸分子5′-或3′-羟基末端上的相对短的单链核苷酸序列(也称作“延长部分”、“突出端”或“粘性末端”)。
植物:术语“植物”或“植物生物”指能够进行光合作用的任何生物,以及从其衍生的细胞、组织、部分或繁殖材料(例如种子或果实)。本发明范围所包括的植物是植物界中高等和低等植物的所有属和种。一年生、多年生、单子叶植物和双子叶植物和裸子植物是优选的。“植物”指任何发育阶段的任何植物或植物部分。成熟植物指处于幼苗阶段之外的任何发育阶段的植物。包括成熟植物、种子、枝和幼苗,以及从其衍生的部分、繁殖材料(例如块茎、种子或果实)和培养物(例如细胞培养物或愈伤组织培养物)。幼苗指处于早期发育阶段的年轻的未成熟的植物。其还包括插条、细胞或组织培养物以及种子。如在本发明中所使用,术语“植物组织”包括但不限于整个植物、植物细胞、植物器官、植物种子、原生质体、愈伤组织、细胞培养物、以及组织成结构和/或功能单元的任何成群的植物细胞。优选地,如本文所使用,术语“植物”指很大程度上分化成为在植物发育任何阶段所存在结构的多个植物细胞。此类结构包括一个或多个植物器官,所述器官包括但不限于果实、枝、茎、叶、花瓣等。更加优选地,术语“植物”包括整个植物、枝营养器官/结构(例如叶、茎和块茎)、根、花和花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟子房)、植物组织(例如维管组织、基本组织等)和细胞(例如保卫细胞、卵细胞、毛状体等)、以及其它的后代。可在本发明方法中使用的植物种类通常与适于转化技术的高等植物和低等植物种类同样宽,包括被子植物(单子叶植物和双子叶植物)、裸子植物、蕨类植物和多细胞藻类。其包括许多种倍性水平的植物,包括非整倍体、多倍体、二倍体、单倍体和半合子。本发明范围包括植物界中高等植物和低等植物的所有属和种。此外,还包括成熟植物、种子、枝和幼苗,以及从其衍生的部分、繁殖材料(例如种子和果实)以及培养物,例如细胞培养物。优选的是下列科的植物和植物材料:苋科(Amaranthaceae)、十字花科(Brassicaceae)、石竹科(Carophyllaceae)、藜科(Chenopodiaceae)、菊科(Compositae)、葫芦科(Cucurbitaceae)、唇形科(Labiatae)、豆科(Leguminosae)、蝶形花亚科(Papilionoideae)、百合科(Liliaceae)、亚麻科(Linaceae)、锦葵科(Malvaceae)、蔷薇科(Rosaceae)、虎耳草科(Saxifragaceae)、玄参科(Scrophulariaceae)、茄科(Solanaceae)、番杏科(Tetragoniaceae)。一年生、多年生单子叶植物和双子叶植物是用于产生转基因植物的优选宿主生物。此外,在所有观赏植物、林、水果或观赏树、花、切花、灌木和草中使用本发明的重组系统或方法是有利的。所述植物可以包括但不限于苔藓植物,例如苔纲(Hepaticae)(地钱属(hepaticas))和藓(Musci)(藓纲(mosses));蕨类植物,例如凤尾草、马尾和石松;裸子植物,例如松类、苏铁、银杏和Gnetaeae;藻类,例如绿藻纲(Chlorophyceae)、Phaeophpyceae纲、红藻纲(Rhodophyceae)、粘藻纲(Myxophyceae)、黄藻纲(Xanthophyceae)、硅藻纲(Bacillariophyceae)(硅藻)和裸藻纲(Euglenophyceae)。用于本发明目的的植物包括蔷薇科例如玫瑰,杜鹃花科(Ericaceae)例如北美杜鹃花和杜鹃花,大戟科(Euphorbiaceae)例如猩猩木和巴豆,石竹科(Caryophyllaceae)例如石竹,茄科例如牵牛花,苦苣苔科(Gesneriaceae)例如非洲紫堇,凤仙花科(Balsaminaceae)例如凤仙花,兰科(Orchidaceae)例如兰花,鸢尾科(Iridaceae)例如剑兰、鸢尾、小苍兰和番红花,菊科例如金盏菊,牻牛儿苗科(Geraniaceae)例如天竺葵,百合科例如龙血树,桑科(Moraceae)例如ficus,天南星科(Araceae)例如philodendron及其他。此外,根据本发明的转基因植物特别是选自双子叶作物植物,例如豆科例如豌豆(pea)、紫花苜蓿(alfalfa)和大豆(soybean);伞形科(Umbelliferae),特别是胡萝卜属(Daucus)(非常特别地是胡萝卜(Daucus carota)(胡萝卜(carrot))和芹菜属(Apium)(非常特别地是Apium graveolens var.dulce(芹菜))及其它;茄科,特别是番茄属(Lycopersicon),非常特别地是番茄(Lycopersicon esculentum)(西红柿)和茄属(Solanum),非常特别地是马铃薯(Solanum tuberosum)(马铃薯)以及茄(Solanum melongena)(茄子),烟草(tobacco)及其它;和辣椒属(Capsicum),非常特别地是辣椒(Capsicum annum)(胡椒(pepper))及其它;豆科,特别是大豆属(Glycine),非常特别地是大豆(Glycine max)(大豆)及其它;以及十字花科(Cruciferae),特别是芸苔属(Brassica),非常特别地是欧洲油菜(Brassica napus)(油菜(oilseed rape))、芸苔(Brassicacampestris)(甜菜(beet))、Brassica oleracea cv Tastie(卷心菜(cabbage))、Brassica oleracea cv Snowball Y(花椰菜(cauliflower))和Brassica oleraceacv Emperor(绿花椰菜(broccoli));以及拟南芥属(Arabidopsis),非常特别地是拟南芥(Arabidopsis thaliana)及其它;菊科,特别是莴苣属(Lactuca),非常特别地是莴苣(Lactuca sativa)(莴苣(lettuce))及其它。根据本发明的植物特别地选自单子叶作物植物,例如谷物,如小麦(wheat)、大麦(barley)、高梁(sorghum)和稷(millet)、黑麦(rye)、黑小麦(triticale)、玉米(corn)、稻(rice)或燕麦(oats)和甘蔗(sugarcane)。更优选的是树,例如苹果、梨、温悖、李树、樱桃、桃树、蜜桃、杏、番木瓜、芒果和其它木质物种,包括松树落叶树,例如白杨、松树、红杉、香柏、橡树等。特别优选的是拟南芥(Arabidopsis thaliana)、烟草(Nicotiana tabacum)、油菜、大豆、玉米、小麦、亚麻籽(linseed)、马铃薯(potato)和万寿菊。
多核苷酸构建体:术语“多核苷酸构建体”指至少部分通过重组方法产生的核酸。术语“DNA构建体”指由脱氧核糖核苷酸构成的多核苷酸构建体。构建体可以是单链的,或者优选是双链的。构建体可以是环形的或者线形的。技术人员熟悉得到DNA构建体之一的多种方法。构建体可以通过如下列文献所述的常规重组和克隆技术制备:例如Maniatis T,FritschEF和Sambrook J(1989)Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Silhavy等,(1984)Experiments with Gene Fusions,Cold Spring HarborLaboratory,Cold Spring Harbor(NY);Ausubel等,(1987)CurrentProtocols in Molecular Biology,Greene Publishing Assoc.and WileyInterscience;Gelvin等,(编者)(1990)Plant Molecular Biology Manual;Kluwer Academic Pub-lisher,Dordrecht,Netherlands。
多肽:术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在本文中互换使用,指连续氨基酸残基的多聚体或寡聚体。
前蛋白:正常靶向细胞内细胞器,如叶绿体并且仍包含转运肽的蛋白质。
启动子:术语“启动子”、“启动子元件”或“启动子序列”是等效的,并且如本文所使用,指当连接至目的核苷酸序列时能够控制目的核苷酸序列转录成为mRNA的DNA序列。启动子通常(虽然不必须)位于被其控制转录成为mRNA的目的核苷酸序列的5′(即上游)(例如接近结构基因转录起始位点),并且提供RNA聚合酶和用于转录起始的转录因子特异性结合的位点。如果多核苷酸序列源于另一物种,或者虽然源于同一物种但对其天然形式进行了修饰,则多核苷酸相对于生物或第二个多核苷酸而言是“异源的”。例如,有效连接至异源编码序列的启动子指来源于一个物种的编码序列与来源于衍生启动子的物种的编码区不同,或者虽然来源于同一物种,但是编码序列与启动子不是天然相关的(例如遗传工程化编码序列或来自不同生态型或变体的等位基因)。适宜启动子可以衍生自将用于进行表达的宿主细胞内的基因或者衍生自该宿主细胞的病原体(例如植物或植物病原体,如植物病毒)。如果启动子是诱导型启动子,则转录速率会响应诱导剂而提高。相反,如果启动子是组成型启动子,则转录速率不受诱导剂的控制。同样,启动子可以以组织特异性方式或组织优选方式被调节,以致于其仅在特定组织类型,例如叶、根或分生组织中具有转录相关编码区的活性。术语“组织特异性”当适用于启动子时,意思是指指导目的核苷酸序列在特定类型组织(例如花瓣)中选择性表达,而同一目的核苷酸序列在不同类型组织(例如根)中的表达相对缺乏的启动子。启动子的组织特异性可以如下评估,例如,有效连接报告基因与启动子序列以产生报告构建体,将报告构建体导入植物基因组以致于报告构建体被整合进入所得转基因植物的每一组织,和检测报告基因(例如检测由报告基因编码的mRNA、蛋白质或蛋白质活性)转基因的不同组织中的表达。当检测到报告基因在一种或多种组织中的表达水平相对于在其它组织中的表达水平更大时,表明启动子是检测到较大表达水平的组织所特异性的。术语“细胞类型特异性”当适用于启动子时,意思是指指导目的核苷酸序列在特定类型细胞中选择性表达,而同一目的核苷酸序列在同一组织的不同类型细胞中的表达相对缺乏的启动子。术语“细胞类型特异性”当适用于启动子时,还指能够引起目的核苷酸序列在单一组织的区域内选择性表达的启动子。启动子的细胞类型特异性可以使用本领域众所周知的方法,例如GUS活性染色或免疫组织化学染色评价。术语“组成型”当用于指启动子时,意思是指能够在缺乏刺激(例如热休克、化学品、光等)的情况下指导有效连接的核酸序列转录的启动子。通常,组成型启动子能够指导转基因在基本上任何细胞和任何组织中表达。相反,“可调节启动子”是这样的启动子,其能够在存在刺激(例如热休克、化学品、光等)的情况下以不同于不缺乏刺激情况下有效连接核酸序列转录水平的水平指导有效连接的核酸序列的转录。
纯化的:如本文所使用,术语“纯化的”指从其天然环境中移出的、分离的或分开的分子,或者是核酸序列或者是氨基酸序列。“基本上纯化的”分子是至少60%、优选地至少75%并且更优选地至少90%无其天然结合的其它成分。纯化的核酸序列可以是分离的核酸序列。
重组:术语“重组”当指多肽或蛋白质时,意思是指通过重组DNA技术产生多肽或蛋白质,即从用编码目的多肽或蛋白质的外源重组DNA构建体所转化的细胞产生。重组核酸和多肽还可以包括自然界不存在如此分子但被人修饰、改变、突变或操作的分子。优选地,“重组多肽”是与天然存在的多肽序列有至少一个氨基酸残基不同的非天然存在的多肽。用于产生所述重组多肽和/或核酸的优选方法包括定向或非定向诱变、DNA改组或循环重组(recursive recombination)的其它方法。
有义:术语“有义”应该理解为意思是指具有与靶序列同源或相同序列,例如结合蛋白质转录因子并且参与给定基因表达的序列的核酸。根据优选的实施方案,核酸包含目的基因和允许所述目的基因表达的元件。
显著提高或降低:例如酶活性或基因表达大于测量技术本身所固有的误差界限的提高或降低,优选地比对照酶活性或者在对照细胞中的表达提高或降低约2倍或更多、更优选地提高或降低约5倍或更多、并且最优选地提高或降低约10倍或更多。
稳定:“稳定”核苷酸序列在植物细胞中的表达意思是指,在应用本发明方法之后,在植物于相同或可比的条件下生长时,核苷酸序列在来自同一世代或者全部多个世代的不同植物同一组织的细胞中的表达水平近似相同。
基本上互补:术语“基本上互补”当在本文中用于相对于参照或靶核苷酸序列的核苷酸序列时,其最广的含义是指具有这样的同一性百分数的核苷酸序列,即基本上互补的核苷酸序列与所述参照或靶核苷酸序列的完全互补序列的同一性百分数为至少60%、更希望至少70%、更希望至少80%或85%、优选地至少90%、更优选地至少93%、仍更优选地至少95%或96%、仍更优选地至少97%或98%、仍更优选地至少99%或最优选地100%(以后与术语“同一的”等效)。优选地同一性在超过至少19个核苷酸、优选地至少50个核苷酸、更优选地全部长度的核酸序列与所述参照序列上评估(如果下面没有明确指出的话)。序列比较使用威斯康星大学GCG的默认GAP分析,GAP的SEQWEB应用,基于Needleman和Wunsch算法(Needleman和Wunsch(1970)J Mol.Biol.48:443-453;如上所定义)开展。与参照核苷酸序列“基本上互补的”核苷酸序列在低严格条件下、优选中等严格条件下、最优选高严格条件下(如上所定义)与参照核苷酸序列杂交。
基本上相同:术语“基本上相同”当在本文中用于核苷酸序列时,其最广的含义是指核苷酸序列相当于参照或靶核苷酸序列,其中基本上相同的核苷酸序列与参照或靶核苷酸序列之间的同一性百分数希望为至少60%、更希望至少70%、更希望至少80%或85%、优选地至少90%、更优选地至少93%、仍更优选地至少95%或96%、仍更优选地至少97%或98%、仍更优选地至少99%或最优选地100%(以后与术语“同一的”等效)。优选地同一性在超过至少19个核苷酸、优选地至少50个核苷酸、更优选地全部长度的核酸序列与所述参照序列上评估(如果下面没有明确指出的话)。序列比较使用威斯康星大学GCG的默认GAP分析,GAP的SEQWEB应用,基于Needleman和Wunsch算法(Needleman和Wunsch(1970)J Mol.Biol.48:443-453;如上所定义)开展。与参照核苷酸序列“基本上相同的”核苷酸序列在低严格条件下、优选中等严格条件下、最优选高严格条件下(如上所定义)与参照核苷酸序列的完全互补序列(即其在双链分子中的对应链)杂交。特异性核苷酸序列的同系物包括编码与参照氨基酸序列具有至少24%同一性、更优选地至少35%同一性、仍更优选地至少50%同一性、仍更优选地至少65%同一性的核苷酸序列,同一性如使用上述参数确定,其中同系物所编码的氨基酸序列与特定核苷酸所编码蛋白质具有相同的生物学活性。术语“基本上相同”当用于多肽时,意思是指蛋白质相当于参照多肽,其中多肽与参照蛋白质具有基本上相同的结构和功能,例如仅发生不影响多肽功能的氨基酸序列变化。当用于多肽或氨基酸序列时,基本上相似的多肽或氨基酸序列与参照多肽或氨基酸序列之间的同一性百分数希望为至少24%、更希望至少30%、更希望至少45%、优选地至少60%、更优选地至少75%、仍更优选地至少90%、仍更优选地至少95%、仍更优选地至少99%,同一性百分数使用如上所述的默认GAP分析参数分析。同系物是与参照多肽或氨基酸序列具有至少24%同一性、更优选地至少35%同一性、仍更优选地至少50%同一性、仍更优选地至少65%同一性的氨基酸序列,同一性如通过使用上述参数测定,其中同系物编码的氨基酸序列与参照多肽具有相同的生物学活性。
合成的:如本文所使用,“合成的”意思是指全部通过化学手段产生,例如通过化学合成的互补寡核苷酸的退火,而不是通过生物学手段产生,例如通过使用聚合酶链式反应(PCR)或其它的酶介导生物学反应如连接或磷酸化来扩增化学合成的模板。在优选的实施方案中,使用商业寡核苷酸合成仪器合成寡核苷酸,仪器包括但不限于Applied Biosystems,Inc.的ABI394和ABI 3900 DNA/RNA合成仪或其它商业等效的合成仪。
靶基因:术语“靶”、“靶基因”和“靶核苷酸序列”等效。如本文所使用,靶基因可以是真核生物(如植物)中存在的任何目的基因。靶基因可以是内源的或导入的。例如,靶基因是功能已知的基因或者是功能未知但其全部或部分核苷酸序列已知的基因。备选地,靶基因的功能和其核苷酸序列均未知。靶基因是真核生物细胞的天然基因,或者是先前已经通过例如遗传转化导入真核生物细胞或所述真核生物细胞的亲本细胞内的异源基因。异源靶基因稳定整合入真核生物细胞基因组,或者作为染色体外分子存在于真核生物细胞中,例如作为自主复制的染色体外分子存在。靶基因可包括包含编码多肽的区域或者调节复制、转录、翻译或者对于靶蛋白质表达而言重要的其它过程的多核苷酸区域的多核苷酸;或包含编码靶多肽的区域和调节靶多肽表达的区域的多核苷酸;或非编码区域例如5′或3′UTR或内含子。靶基因可以指例如目的基因转录产生的mRNA分子。此外,术语“对应于”,如“包含对应于靶基因序列的序列的嵌合RNA”中的“对应于”意思是指两个序列是互补的或同源的,或者彼此之间具有此类的其它合理生物学关系(例如基于核苷酸单体的序列或者它们的碱基配对特性)。本发明嵌合RNA分子所靶向的“靶基因”可以与病例状态有关。例如,基因可以是病原体相关基因,例如病毒基因、肿瘤相关基因、缺陷基因(例如导致异常癌症的基因)或者自身免疫病相关基因。靶基因还可以是在重组细胞或遗传改变的生物中表达的异源基因。通过确定或调节(例如抑制)此类基因的功能,可以得到在医学、兽医学和生物学方面有价值的信息和治疗益处。
组织:关于生物的术语“组织”(例如植物;“植物组织”)意思是指多细胞的排列,包括生物的分化和非分化组织。组织可以构成器官的部分(例如植物叶的表皮或动物皮肤),但是也可以构成肿瘤组织(例如愈伤组织)和培养中的多种类型细胞(例如单细胞、原生质体、胚、愈伤组织、原基体样体)。组织可以是体内的(例如植物原位(in planta))、器官培养内的、组织培养内的或细胞培养内的。
转化:如本文所使用,术语“转化”指向细胞、组织或生物内导入遗传物质(例如转基因或异源核酸分子)。细胞的转化可以是稳定的或瞬时的。术语“瞬时转化”或“瞬时转化的”指向细胞内导入一个或多个转基因,而转基因不整合进入宿主细胞的基因组。瞬时转化可以通过,例如酶联免疫吸附测定(ELISA)来检测,该测定法检测由一个或多个转基因编码的多肽的存在。备选地,瞬时转化可以通过检测转基因(例如uid A基因)所编码蛋白质(例如β-葡糖苷酸酶)的活性来检测。术语“瞬时转化体”指瞬时性掺入一个或多个转基因的细胞。相反,术语“稳定转化”或“稳定转化的”指向细胞内导入并整合一个或多个转基因,优选地导致产生染色体整合并且在减数分裂中稳定遗传。细胞的稳定转化可以通过用能够结合一个或多个转基因的核酸序列对细胞基因组DNA进行Southern印迹来检测。备选地,细胞的稳定转化还可以通过对细胞基因组DNA进行聚合酶链式反应以便扩增转基因序列来检测。术语“稳定转化体”指一个或多个转基因稳定整合进入基因组DNA的细胞。因此,稳定转化体与瞬时转化体的区别在于,来源于稳定转化体的基因组DNA包含一个或多个转基因,而来自瞬时转化体的基因组DNA不包含转基因。转化也包括向植物细胞导入植物病毒载体形式的遗传物质,其涉及染色体外复制和基因表达,在减数分裂稳定性方面表现出可变的特性。转化的细胞、组织或植物应理解为不仅包括转化过程的终产物,还包括其转基因后代。
转基因:如本文所使用,术语“转基因”指通过实验操作被导入细胞基因组内的任何核酸序列。转基因可以是“内源的DNA序列”或“异源DNA序列”(即“外源DNA”)。术语“内源的DNA序列”指在其所导入的细胞内天然存在的核苷酸序列,只要其相对于天然存在序列而言不包含改变(例如点突变、选择标记基因的存在等)即可。
转基因的:术语“转基因的”,当指细胞、组织或生物时,意思是指用优选包含与目的DNA序列有效连接的适宜启动子的重组DNA分子转化的,优选稳定转化的。
未受影响的:如本文所使用,“实质上未受影响的”指活性剂如蛋白质或mRNA转录本的水平未被特定事件改变,或者仅以不影响该活性剂生理功能的程度被改变。在优选的方面,实质上未受影响的活性剂的水平为处于缺乏能够选择性降低另一活性剂的细胞或生物中所存在水平的20%、更优选地10%、并且更优选地5%之内。如本文所使用,“基本上未受影响的”指活性剂如蛋白质或mRNA转录本具有这样的水平,即基本上未受影响的活性剂的水平为处于缺乏能够选择性降低另一活性剂的细胞或生物中所存在水平的49%、更优选地35%、并且甚至更优选地24%之内。如本文所使用,“部分地未受影响的”指活性剂如蛋白质或mRNA转录本具有这样的水平,即部分地未受影响的活性剂的水平为处于缺乏能够选择性降低另一活性剂的细胞或生物中所存在水平的80%、更优选地65%、并且甚至更优选地50%之内。
载体:如本文所使用,术语“载体”指能够转运与其连接的另一核酸的核酸分子。一种类型的载体是能够整合进入宿主细胞染色体DNA中的基因组整合载体或“整合载体”。另一种类型的载体是附加体载体,即核酸能够在染色体为复制。能够指导与其所有效连接的基因表达的载体在本文中称作“表达载体”。在本说明书中,“质粒”和“载体”可互换使用,除非上下文明确指出。如本文所述,设计能够体外或体内产生RNA的表达载体可以包含处于任何RNA聚合酶控制下的序列,RNA聚合酶包括线粒体RNA聚合酶、RNA pol I、RNA pol II和RNA pol III。根据本发明,这些载体可用于在细胞中转录目的RNA。可将载体设计成利用内源的线粒体RNA聚合酶(例如人线粒体RNA聚合酶,在该情况下此类载体可以利用相应的人线粒体启动子)。线粒体聚合酶可用于体内产生加帽的(通过加帽酶的表达)或非加帽的信使。RNA pol I、RNA pol II和RNA pol III转录本也可以体内产生。此类RNA可以是加帽的或非加帽的,并且根据需要细胞质加帽可以通过多种方法,包括使用加帽酶如牛痘加帽酶或甲病毒加帽酶实现。DNA载体被设计成包含一个启动子或组合的多重启动子(线粒体、RNA polI、II或polIII或病毒、细菌或噬菌体启动子,以及相应的聚合酶)。优选地,当启动子是RNA pol II时,编码RNA分子的序列具有大于约300nt的可读框以避免在细胞核内降解。此类质粒或载体可以包括来源于细菌、病毒或噬菌体的质粒序列。此类载体包括染色体、附加体和病毒来源的载体,例如从细菌质粒、噬菌体、酵母附加体、酵母染色体元件和病毒衍生的载体;从其组合衍生的载体,如从质粒和噬菌体遗传元件粘粒和噬菌粒衍生的载体。因此,一个示例性的载体是单链或双链噬菌体载体。另一个示例性的载体是单链或双链RNA或DNA病毒载体。此类载体可以通过在将DNA和RNA导入细胞方面众所周知的技术作为多核苷酸、优选DNA被导入细胞中。在噬菌体和病毒载体的情况下,载体还可以、并且优选地可以通过众所周知的感染和转导技术作为包装的或壳体化的病毒导入到细胞中。病毒载体可以是可复制性的或者是复制缺陷性的。在复制缺陷的情况下,病毒繁殖通常仅在补充性宿主细胞中发生。
野生型:术语“野生型”、“天然的”或“天然来源”当指生物、多肽或核酸序列时,意思是指所述生物是天然存在的或在至少一个天然存在的生物中可获得,其没有被人为改变、突变或操作。
发明详述
本发明的第一实施方案涉及用于在真核生物中以提高的特异性进行转基因表达的方法,所述方法包括步骤:
a)提供表达构建体,构建体包含在所述真核生物中具有功能并且功能性连接至待表达成为嵌合RNA序列的核苷酸序列上的启动子序列,所述核苷酸序列包含:
i)至少一个能赋予所述真核生物优选表型或有益效果的序列,和
ii)至少一个与所述真核生物中天然表达的microRNA序列基本互补的序列,其中在不希望此种表达的组织中、时间上和/或环境条件下所述microRNA天然表达,但在需要此种表达的组织中、时间上和/或环境条件下不表达或基本上较少表达,其中至少一个序列i)和序列ii)彼此是异源性的,和
b)将所述表达构建体导入真核生物。
优选地,所述真核生物是人、动物或植物。
最通常的情况是,一些“组织特异性”启动子在其它组织种具有渗漏表达,这导致出现不需要的表型,例如植物毒性。在其它情况下,这又向在一些应用中产生组织特异性启动子(例如用于在植物中实现线虫抗性的‘合胞体特异性’启动子)提出挑战。考虑到一些miRNA具有组织特异性和/或时间表达模式,人们可以设计在表达构建体的3’UTR(例如双元载体中所包含的)中具有miRNA-标签(与给定的内源miRNA基本互补或互补的短序列)的通用载体,以致于转基因表达在表达miRNA的组织中的渗漏性会降低或消除。
本文所公开的本发明的必需的、创造性的特征是“与在所述真核生物(即靶生物,在其中将实现表达特异性的提高)中天然表达的microRNA序列基本互补的至少一个序列”的并入。所述序列-下文也称作“microRNA标签”-在内源miRNA表达的组织中、时间上和/或环境条件下抑制或降低嵌合RNA序列的表达或将导致嵌合RNA序列的降解增加(由此抑制或降低表达)。
不受任何作用的特异性功能性机制的限制,认为内源miRNA与嵌合RNA序列中的miRNA-标签相互作用,从而诱导了嵌合RNA序列的降解(或基因沉默)。令人惊奇地发现,该沉默局限于天然表达内源miRNA的组织、时间和/或环境条件,而没有波及整个生物。
1.本发明的miRNA-标签
1.1一般特性
miRNA-标签序列与真核生物中天然表达的microRNA(miRNA)序列(即内源miRNA)基本互补。术语天然存在的miRNA(或microRNA)与内源miRNA(或micro RNA)具有相同的含义并且在本文中可互换使用。
本发明的miRNA-标签与内源miRNA互补或基本互补。虽然本发明不依赖于特定大小的miRNA-标签,但是miRNA-标签将具有与内源miRNA相似的长度,本领域众所周知的此类miRNA一般包括约15和30之间的核苷酸。因此,miRNA-标签将优选地包含约15至约30个核苷酸、约20至约28个核苷酸、更特别地约21-24个核苷酸的小序列。一般地,miRNA-标签将与内源miRNA完全互补,然而,可以忍受错配,因此考虑了miRNA-标签与真核生物天然表达的miRNA基本互补。如该上下文所用,术语基本互补(即对于miRNA-标签与内源miRNA之间的互补性)意思是指可能出现一般1至约6个错配,更特别地与内源miRNA序列相比,miRNA-标签中可以包括约2至3个错配核苷酸。备选地,miRNA-标签的互补链与内源miRNA的序列具有至少60%或70%、优选地至少80%或85%、更优选地至少90%、最优选地至少95%的同一性。虽然错配核苷酸可出现于整个miRNA序列中(即任何位置),但优选地它们位于内源miRNA的3’区域或者附近区域。内源miRNA的3’-区域与miRNA标签的5’-区域互补。因此,所述错配优选地位于miRNA-标签的5’-区域。已经证明,例如,可以将miRNA的3’区域改造成含3个错配和G::U摆动而不影响其功能(Mallory等,EMBO Journal,23:3356-3364,(2004))。因此,在最优选的实施方案中,基本上互补意思是指在miRNA-标签和内源miRNA之间出现3.5个错配(即3个真正的错配加上一个记做0.5的G:U摆动)。以该方式,可将miRNA序列设计成调节任何靶序列的表达。
1.2对用于设计miRNA标签的适宜miRNA的鉴定
为了提高表达特异性,microRNA(待表达的核苷酸序列中所包含的序列与其基本上互补)优选地非组成型表达,但其在选自下列的至少一个参数上表达可变:组织、空间、时间、发育。环境或其它外界因素。优选地,microRNA是组织特异性或优先性表达的、空间性调节的、发育性调节的和/或通过其它因素如生物或非生物应激因素调节的。
组织特异性或优先性表达的miRNA在本文中理解为在给定特定时间(此表达谱可以随时间(例如例如发育过程中或老化过程中)变化或不变化)或在其它条件下(外界因素如应激),在生物的所有组织中不以相同的程度表达。优选地,miRNA仅在一种或少数几种组织中表达,而在其它组织中不以显著量(例如通过标准RNA检测方法如Northern印迹可容易检测的量)表达。
被其它因素调节的miRNA可以包括当生物与一种因素、优选外界因素、更优选应激刺激相互作用时被上调或下调(在一种、多种或全部组织中)的miRNA。此类应激刺激可包括非生物应激因素和生物应激因素。考虑到玉米miR160(详见实施例)是应激诱导的microRNA这一事实,很可能一些其它被广泛的环境刺激(例如生物应激和化学品)诱导。使用上面提出的相似策略,人们可以控制转基因以相应环境刺激的方式在某些组织中表达。
存在多种鉴定和分离多种生物和组织中miRNA的方法。例如,在从生物或特定组织或细胞类型中分离出中RNA之后,将RNA在变性的15%聚丙烯酰胺凝胶上分离。切割下大小在15-26个核苷酸范围的凝胶片段,洗脱小RNA并回收。随后,将小RNA连接至5’和3’RNA/DNA嵌合寡核苷酸接头。使用RT引物开展逆转录反应,随后用合适的引物开展PCR。然后,PCR产物被克隆至用于测序的载体中(Sunkar R和Zhu JK,ThePlant Cell 16:2001:2019,2004)。几种其它的技术和方法也适用于检测生物或组织中的miRNA,例如Northern印迹分析、基于核糖核酸酶保护的PAGE、基于微阵列的miRNA剖析以及qRT-PCR Tagman分析。
存在多种“设计”miRNA-标签以实现某些表达谱的方法。例如,首先选择目的基因在其中渗漏表达(该渗漏表达将被预防)的组织中(或时间上或条件下)表达的miRNA。接着,确定miRNA的互补序列并将此短核苷酸序列插入到目的基因中(例如不影响目的基因功能的5’UTR区、3’UTR区或者甚至编码区)。
1.2所表达嵌合RNA的定位
对于与microRNA基本互补的序列(在下文中也称作“microRNA标签”)而言,在待表达核苷酸序列中的位置有可能有多个。优选地,与microRNA基本互补的序列位于待表达核苷酸序列中相对于5’-非翻译区或3’-非翻译区的区域。
1.3本发明嵌合RNA的产生和/或表达
术语“嵌合RNA”或“嵌合RNA分子”或“嵌合核糖核苷酸序列”在本文中可互换使用,并且意思是指至少部分地由核糖核苷酸组成的多核苷酸分子,所述核糖核苷酸包含
i)至少一个与所述真核生物中天然表达的microRNA序列基本互补的序列,和
i)至少一个另外的序列(优选地序列能够赋予真核生物优选的表型或有益效果),
其中至少一个序列i)和序列ii)彼此是异源性的(即没有天然共价连接或没有在天然(即非遗传修饰的)生物或细胞中共价连接)。
本发明的嵌合RNA序列“至少部分地由核糖核苷酸组成”的表述意思是指-例如-嵌合RNA序列可以不仅包含核糖核苷酸碱基。如下文所述,本发明的嵌合RNA分子还可以通过化学合成得到。通过该方法,除天然存在的核糖核苷酸残基外的残基(例如修饰残基)可以被掺入)。
照这样,通过本发明方法表达的嵌合RNA分子(即包含miRNA-标签的RNA)被认为是具有新颖性和创造性的。不但可以使用这些表达构建体,而且还可以使用具有极大工业应用性潜力、特别是在寻找仅在某些组织中、在某些时间上或在某些情况下具有活性的基于RNA的药物的药物应用领域中具有潜力的嵌合RNA分子。
因此,本发明的另一个实施方案涉及嵌合核糖核苷酸序列,其包含:
i)至少一个能赋予所述真核生物优选表型或有益效果的序列,和
ii)至少一个与所述真核生物中天然表达的microRNA序列基本互补的序列,
其中至少一个序列i)和序列ii)彼此是异源性的。
所述嵌合核糖核苷酸序列中的序列i)和/或ii)优选地如对于本发明方法中所定义。
嵌合RNA分子(即包含miRNA标签的RNA分子)可以通过本领域技术人员多种方法产生并应用于宿主细胞或生物。本发明的嵌合RNA分子可以通过本领域的方法,例如使用重组表达、酶促合成或化学合成来产生或合成。RNA分子可以体外合成(例如使用酶促合成和化学合成)或体内合成(使用本领域众所周知的重组DNA技术)。
例如,嵌合RNA可以在真核靶细胞外产生或者在靶细胞内重组产生(例如通过表达构建体)。在一个实施方案中,本发明的嵌合RNA分子可以通过酶促合成方法或者化学合成方法体外产生。在另一个实施方案中,嵌合RNA分子可以在重组培养物,例如细菌细胞中产生、从其中分离并用于下述的方法中。在另一个实施方案中,在将另一活性剂(例如表达构建体或载体)递送至靶细胞或生物中之后体内产生嵌合RNA分子。靶细胞或生物优选地是哺乳动物、植物细胞或动物(如线虫)细胞或生物。
例如,嵌合RNA分子可以
a)在靶细胞或生物中从表达构建体或表达载体表达,或
b)在体外转录系统中从表达构建体表达,其中嵌合RNA分子从所述转录系统纯化并导入宿主细胞或生物中(例如通过通过饲喂或注射),或
c)化学合成嵌合RNA分子并导入宿主细胞或生物(例如通过饲喂或注射)。
1.3.1重组表达嵌合RNA
本发明的嵌合RNA分子可以通过重组表达产生。因此,在本发明的一个实施方案中,本发明的嵌合RNA通过表达构建体或表达载体在细胞内产生。嵌合RNA分子可以在其可在其中直接发挥其功能的真核靶细胞或生物中直接制造(例如表达),而不需进一步的导入。备选地,嵌合RNA分子可以在另一细胞中表达、任选纯化、并且随后递送至靶细胞或生物中。因此,本发明的RNA分子可以在重组微生物中制造,例如在细菌和酵母或者在重组宿主细胞或生物,例如植物或哺乳动物细胞中制造,并且任选地通过常规技术从其培养物中分离。参见例如Sambrook等,MOLECULAR CLONING,A LABORATORY MANUAL,2nd Ed.;ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989中所述的技术(该文献是实验室手册的范例,其中详细描述了这些技术)以及US5,824,538、5,877,159和65,643,771中描述的技术,这些文献在本文中引用作为参考。
当本发明的RNA分子体内形成时,它们优选地采用表达构建体或表达载体产生。更优选地,表达构建体或载体包含核酸序列、优选双链DNA分子,所述核酸序列编码至少一个上述的本发明嵌合RNA分子并有效连接至能够在所选择宿主或靶细胞中实现所述核酸序列转录以便产生本发明嵌合RNA的转录调节序列(启动子)。如所讨论,许多启动子可用于实践本发明。可以基于所期望的结果选择启动子。因此,取决于所期望的结果,可以将用于表达嵌合RNA的核苷酸序列与组成型、组织优选型、诱导型、发育型或其它启动子组合用于在植物中表达。具体启动子如下所述。
用于所述嵌合核糖核苷酸序列(其用于本发明方法)表达的表达构建体被认为具有新颖性和创造性。因此,本发明的另一个实施方案涉及包含在所述真核生物中具有功能并且功能性连接至待表达核苷酸序列上的启动子序列的表达构建体,所述核苷酸序列包含
i)至少一个能赋予所述真核生物优选表型或有益效果的序列,和
ii)至少一个与所述真核生物中天然存在的microRNA序列基本互补的序列,
其中至少一个序列i)和序列ii)彼此是异源性的。
表达构建体及其元件优选地如上面对本发明方法所定义。
本发明的另一个实施方案涉及包含本发明表达构建体的表达载体。优选地,表达载体是真核表达载体。更优选地,真核表达载体是病毒载体、质粒载体或双元载体。
表达构建体的用途和产生是本领域众所周知的(还可参见WO97/32016;美国专利号5,593,874、5,698,425、5,712,135、5,789,214和5,804,693;以及其中引用的参考文献)。
对于从转基因进行的体内转录或者从表达构建体的转录,可使用调节区(例如启动子、增强子、沉默子、剪接供体和受体、多聚腺苷酸化)来转录嵌合RNA。转录可通过在器官、组织或细胞类型中的特异性转录;通过环境条件的刺激(例如感染、应激、温度、化学诱导物);和/或通过在发育阶段或年龄上的操纵性转录而靶向。RNA链可以是多聚腺苷酸化的或者不是多聚腺苷酸化的;RNA链可以能够被细胞的翻译装置翻译成多肽或者不能够被细胞的翻译装置翻译成多肽。多种启动子可用于表达包含microRNA标签的核苷酸序列。启动子可以-例如-选自组成型启动子、组织特异性或组织优选性启动子和诱导型启动子。在该上下文中,组织特异性启动子优选地指以小但可检测的程度渗漏的启动子(即在优选或主要组织之外的组织中具有表达活性)。优选表达构建体的更具体的实例在下面的具体应用中描述。
待表达形成嵌合RNA分子的核苷酸序列可以具有多种形式和/或功能。例如,它可以包括编码蛋白质的可读框。备选地,其可以编码选自反义RNA、正义RNA、双链RNA或核酶的功能性RNA。所述功能性RNA优选地减弱内源基因的表达。对于功能性RNA的表达,在本发明的这些表达构建体中不包含激活蛋白质表达的序列,例如Kozak区域等是合意的。
用于表达包含microRNA标签的核苷酸序列的表达构建体可以是DNA、RNA并且可以是单链的或双链的。优选地,表达构建体是DNA,更优选地是双链DNA。表达构建体可以是部分的或更大的载体构建体。优选地,表达构建体在质粒中。表达构建体优选地包含于表达载体中。因此,本发明的另一个实施方案涉及包含本发明表达构建体的表达载体。表达载体可以是DNA或RNA分子,可以是单链或双链的,可以是质粒或其它形式的载体(如上所定义并且如下面对于不同应用和技术领域所详细指定)。更优选地,表达载体是双链环状质粒DNA载体。本发明的另外的实施方案涉及包含本发明表达构建体的表达载体。载体实例(见上面在定义部分的详述)可以是质粒、粘粒、噬菌体、病毒或农杆菌(Agrobacteria)。优选地,载体是真核表达载体。更加优选地,真核表达载体是病毒载体或质粒载体。在某些实施方案中,表达构建体或载体是附加体,并且转染是瞬时的。在另外的实施方案中,表达构建体或载体被整合进入染色体,例如产生稳定转染的细胞系。用于形成此类稳定细胞系的优选载体描述于US 6,025,192和WO/9812339,其在本文中引用作为参考。用于在大肠杆菌(E.coli)中表达的载体优选地是pQE70、pQE60和pQE-9(QIAGEN,Inc.);pBluescript载体、Phagescript载体、pNH8A、pNH16a、pNH18A、pNH46A(StratageneCloning Systems,Inc.);ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5(Pharmacia Biotech,Inc.)。
如上所述(以及对于具体生物和细胞在下面进行的详细描述),表达构建体和载体可以导入生物或细胞中。然而,本发明的另一个实施方案涉及包含本发明表达构建体或表达载体的转化细胞或非人生物。优选地,所述表达构建体或表达载体被插入到所述细胞或生物的基因组中(优选染色体DNA或质体DNA中)。优选地,所述细胞或生物选自哺乳动物、细菌、真菌、线虫或植物细胞和生物。本发明的另一个实施方案涉及本发明的转化生物的组织、部分和繁殖材料。在转化植物的情况下,繁殖材料优选地是转化的种子。
表达构建体可以通过适宜的限制性酶切位点插入到载体中(优选质粒载体)。所得到的载体首先被导入大肠杆菌中。选择出正确转化的大肠杆菌并培养,并且通过本领域技术人员熟悉的方法得到重组载体。对于验证克隆步骤,可采用限制性酶分析和测序。优选的载体是可以稳定整合表达构建体至宿主基因组中的那些载体。适宜启动子和载体构建体描述于美国专利申请号20040220130中。
可以将设计产生本发明嵌合RNA的载体按照需要设计成产生两个或两个以上(包括多个)不同的嵌合RNA。该方法是合乎需要的,因为单一载体会通过产生多个不同嵌合RNA而从单一转录单位产生许多个独立有效的嵌合RNA,而不是一个嵌合RNA分子。多种方法可用于实现该目的,包括自催化序列以及用于切割以产生随机和/或预定剪接位点的序列。
多核苷酸构建体的构建一般需要使用能在细菌中复制的载体。对于从细菌中纯化质粒,可以商业性获得众多的试剂盒。对于其它的正确使用按照制造商的说明书进行(见例如,来自Pharmacia Biotech的EasyPrepTM、FlexiPrepTM;来自Stratagene的StrataCleanTM;以及来自Qiagen的QIAprepTM)。分离和纯化的质粒随后可操纵产生用于转染细胞的其它质粒,或者被整合进入其它载体系统中(例如根癌农杆菌(Agrobacteriumtumefaciens))以感染和转化靶细胞或生物(优选植物)。
对于将本发明的嵌合RNA导入靶细胞的其它适宜载体(或递送剂)包括携带有上述所需的RNA多核苷酸序列的活的、减毒的或杀死的、灭活的病毒以及特别是重组病毒。此类病毒可以与基因治疗等中用于递送基因至细胞的重组病毒进行相似地设计,但是优选地不具有表达蛋白质或者蛋白质的功能性片段的能力。可以进行操作以便向哺乳动物细胞体内提供所需RNA分子的有用的病毒或病毒序列为(但不限于)甲病毒、腺病毒、腺相关病毒、杆状病毒、delta病毒、痘病毒、肝炎病毒、疱疹病毒、乳多空病毒(例如SV40)、脊髓灰质炎病毒、伪狂犬病病毒、反转录病毒、痘苗病毒、正链和负链RNA病毒、类病毒和拟病毒或其部分。多种病毒递送活性剂可以通过应用常规技术,尤其是如M.Di Nocola等,Cancer Gene Ther.,5(6):350-6(1998)中所述的技术,以及本发明的教导设计。包装成病毒颗粒的病毒构建体将实现表达构建体向细胞内的有效导入和表达构建体所编码嵌合RNA构建体的转录。
用于在靶细胞或生物中提供本发明的嵌合RNA分子的另一个递送活性剂包括活的、减毒的或杀死的、灭活的供体细胞,所述细胞已经用上述的合成RNA分子或表达构建体或载体体外转染或感染。如下详述,然后供体细胞可以施用于或饲喂于靶生物(例如哺乳动物或病原体如线虫),以在靶生物中刺激介导该抑制效应的机制。这些供体细胞希望是真核生物细胞,例如哺乳动物细胞C127、3T3、CHO、HeLa、人肾脏293、BHK细胞系和COS-7细胞,并且优选是与哺乳动物接受体相同的物种,或植物细胞。此类供体细胞可以使用与例如Emerich等,J.Neurosci.,16:5168-81(1996)中所述的技术相似的技术制造。甚至更优选地,供体细胞可以从处理的具体哺乳动物中收集并通过类似于过继转移技术的先体外后体内操作,例如D.B.Kohn等,Nature Med.4(7):775-80(1998)中描述的那些技术制造成供体细胞。根据需要,供体细胞还可以源自非哺乳动物物种。
1.3.2通过酶促合成产生本发明的嵌合RNA
根据本发明的嵌合RNA分子可以作为体外酶促合成的分子递送至靶细胞或生物中。
因此,本发明的另一个实施方案涉及产生本发明嵌合RNA的方法,包括:
(i)提供包括用于本发明嵌合RNA的表达构建体的体外转录系统,和
(ii)分离所述本发明嵌合RNA。
可采用原核转录系统并且优选真核转录系统。此外,可使用基于分离酶的系统或基于细胞提取物的系统。对于该目的,可以使用真核的、原核的或噬菌体的RNA聚合酶(例如T3、T7或SP6 RNA聚合酶)。描述了用于体外表达RNA的适宜方法(WO 97/32016;US 5,593,874;US 5,698,425;US 5,712,135;US 5,789,214;US 5,804,693)。可以按照如Promega方案及应用指南(第3版,1996),Doyle编,ISBN No.1-882274-57-1中所述的常规方法使用基于分离酶的酶促系统,例如噬菌体T7、T3或SP6 RNA聚合酶。
因此,本发明还提供试剂盒,其包括用于减弱靶基因在细胞中表达的试剂。试剂盒包含DNA模板,该模板含有与编码本发明嵌合RNA的核苷酸序列有效连接的启动子(优选T7启动子、T3启动子或SP6启动子)。试剂盒任选包含用于从DNA模板扩增DNA序列的扩增引物和用于形成RNA的三磷酸核苷酸(即ATP、GTP、CTP和UTP)。试剂盒还任选包含能够结合DNA模板上启动子并导致与启动子有效连接的核苷酸序列转录的RNA聚合酶;用于纯化单链RNA的纯化柱,如体积配制层析柱;一种或多种缓冲液,例如用于使单链RNA退火以得到双链RNA的缓冲液;以及用于纯化双链RNA的RNA酶A或RNA酶T。
在采用真核转录系统的情况下(例如来自兔网织红细胞或小麦胚的提取物;见Movahedzadeh等,″In vitro transcription and translation,″inMethod in Molecular Biology,V.235,N.Casali,A.Preston,Eds.,Totowa,NJ:Humana Press,p.247-55;Lamla等,Acta Biochim Pol,48:453-65,2001),适当去除可去除RNA元件是期望的,因为它们导致可从系统中纯化的嵌合RNA的释放。
在导入细胞、组织或生物中之前,已经体外合成(化学合成或酶促合成)的嵌合RNA可以通过提取、沉淀、电泳、层析或者这些方法的组合从反应混合物中完全纯化或部分纯化。
1.3.3通过化学合成产生本发明的嵌合RNA
本发明的嵌合RNA分子还可以全部或部分地通过化学合成方法合成。线性寡核苷酸的化学合成是本领域众所周知的,并且可以通过液相或固相技术实现。优选地,通过固相方法合成。适宜的合成方法包括但不限于亚磷酰胺、亚磷酸三酯、H-膦酸酯和磷酸三酯法,一般是自动合成方法。此类寡核苷酸合成方法可以在例如US 5,830,653;WO 98/13526;Stec等,1984.J.Am.Chem.Soc.106:6077;Stec等,1985.J.Org.Chem.50:3908;Stec等,J.Chromatog.1985.326:263;LaPlanche等,1986.Nuc.Acid.Res.1986.14:9081;Fasman G.D.,1989.Practical Handbook of Biochemistryand Molecular Biology.1989.CRC Press,Boca Raton,Fla.;Lamone.1993.Biochem.Soc.Trans.21:1;US 5,013,830;US 5,214,135;US 5,525,719;Kawasaki等,1993.J.Med.Chem.36:831;WO 92/03568;US 5,276,019;US 5,264,423中找到。描述了用于体外化学合成本发明RNA分子的备选方法[参见例如Xu等,Nucl.Acids Res.,24(18):3643-4(1996);Naryshkin等,Bioorg.Khim.,22(9):691-8(1996);Grasby等,Nucl.Acids Res.,21(19):4444-50(1993);Chaix等,Nucl.Acids Res.,17(18):7381-93(1989);Chou等,Biochem.,2(6):2422-35(1989);Odai等,Nucl.Acids Symp,Ser.,21:105-6(1989);Naryshkin等,Bioorg.Khim,22(9):691-8(1996);Sun等,RNA,3(11):1352-1363(1997);X.Zhang等,Nucl.Acids Res.,25(20):3980-3(1997);Grvaznov等,Nucl.Acids Res.,26(18):4160-7(1998);Kadokura等,Nucl.Acids Symp Ser,37:77-8(1997);Davison等,Biomed.Pept.Proteins,Nucl.Acids,2(1):1-6(1996);Mudrakovskaia等,Bioorg.Khim.,17(6):819-22(1991)]。
所选择的合成方法依赖于目的寡核苷酸的长度,并且此类选择为本领域普通技术人员的能力范围之内。例如,亚磷酰胺和亚磷酸三酯方法可以产生具有175或更多个核苷酸的寡核苷酸,而H-膦酸酯方法用于小于100个核苷酸的寡核苷酸。如果将修饰碱基掺入到寡核苷酸中,并且特别是使用修饰的磷酸二酯键时,则合成方法要根据已知的方法按照需要修改。关于这一点,Uhlmann等,(1990,Chemical Reviews 90:543-584)提供了用于产生具有修饰碱基和修饰磷酸二酯键的寡核苷酸的参考和大概的过程。用于产生寡核苷酸的其它示例性方法在Sonveaux.1994.″Protecting Groupsin Oligonucleotide Synthesis″;Agrawal.Method in Molecular Biology 26:1中有所教导。示例性的合成方法还在″Oligonucleotide Synthesis--APractical Approach″(Gait,M.J.IRL Press at Oxford University Press.1984)中有所教导。此外,所定义序列的线性寡核苷酸,包括具有修饰核苷酸的一些序列可从一些商业来源容易地获得。
本发明的嵌合RNA分子可包括对磷酸-糖主链或核苷的修饰。例如,天然RNA的磷酸二酯键可以被修饰成包括至少一个氮或硫杂原子。对RNA结构的修饰可以是特制的,以便允许通过dsRNA在一些生物中发生特异性基因抑制而同时避免出现一般反应。同样,可修饰碱基以阻断腺苷脱氨酶的活性。在本发明的一个实施方案中,嵌合RNA分子在一个末端或两个末端具有末端封闭基团(end-blocks)。
本发明的嵌合RNA可以包括“吗啉代寡核苷酸”。吗啉代寡核苷酸是非离子性的并且通过RNA酶H不依赖性机制起作用。吗啉代寡核苷酸的4个遗传碱基(腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶/尿嘧啶)的每一个与六元吗啉环连接。吗啉代寡核苷酸通过例如非离子亚单位间磷酰二胺键连接4种不同亚单位而制造。吗啉代寡核苷酸具有诸多优点,包括:完全抗核酸酶(Antisense&Nuc.Acid Drug Dev.1996.6:267);可预测性靶向(Biochemica Biophysica Acta.1999.1489:141);细胞中可靠活性(Antisense&Nuc.Acid Drug Dev.1997.7:63);有约旦序列特异性(Antisense&Nuc.Acid Drug Dev.1997.7:151);最低的非反义活性(Biochemica BiophysicaActa.1999.1489:141);以及简单的渗透递送或擦伤递送(scrapedelivery)(Antisense&Nuc.Acid Drug Dev.1997.7:291)。吗啉代寡核苷酸也是优选的,因为在高剂量时它们不具有毒性。关于吗啉代寡核苷酸制备的讨论可在Antisense&Nuc.Acid Drug Dev.1997.7:187中找到。
本发明的另一个实施方案包括在正义2′-O-甲基链上存在核苷酸单体-核苷酸单体错配的双链体(并且它们被认为更容易地展开)。作为更多的实例,在希望使细胞内应激反应最小化的情况下使用2′-O-甲基RNA是有益的。具有2′-O-甲基核苷酸单体的RNA不会被细胞内被认为识别非修饰RNA的机制识别。使用2′-O-甲基化或部分2′-O-甲基化RNA可以避免出现针对双链核酸的干扰素反应而同时保持了靶RNA的抑制。在诱导干扰素反应的短RNAi(例如siRNA)序列中以及在会诱导干扰素反应的更长的RNAi序列中,该RNA干扰(“隐形RNAi(stealth RNAi)”)用于避免干扰素反应或其它细胞应激反应。除了2′-O-甲基化之外的其它化学修饰也可达到该效果。
在某些实施方案中,本发明的嵌合RNA分子包括3′和5′末端(环形分子除外)。在一个实施方案中,3′和5′末端通过例如修饰的3′或5′键而基本上被保护不受核酸酶作用(例如US 5,849,902和WO 98/13526)。例如,寡核苷酸可以通过加入“封闭基团”而具有抗性。术语“封闭基团”如本文所使用,指可以作为用于合成的保护基团或者偶联基团而连接至寡核苷酸或核苷酸单体的取代基(例如出OH外的基团)(例如FITC、丙基、磷酸、氢膦酸酯或亚磷酰胺)。“封闭基团”也包括保护寡核苷酸5′和3′末端的“末端封闭基团”或“外切核酸酶封闭基团”,包括修饰的核苷酸和非核苷酸外切核酸酶抗性结构。示例性末端封闭基团包括帽子结构(例如7-甲基鸟苷帽子)、例如具有3′-3′或5′-5′末端倒置的倒置的核苷酸单体(参见例如Ortiagao等,1992.Antisense Res.Dev.2:129)、甲基膦酸酯、亚磷酰胺、非核苷酸基团(例如非核苷酸接头、氨基接头、缀合物)等。3′末端核苷酸单体可以包括修饰糖部分。3′末端核苷酸单体包含3′-O,该3′-O可以任选被防止寡核苷酸被3′-外切核酸酶降解的封闭基团取代。例如,3′-羟基可以与核苷酸通过3′-3′核苷酸间键酯化。例如,烷氧基可以是甲氧基、乙氧基或异丙氧基,并且优选是乙氧基。任选地,在3′末端的3′-3′连接的核苷酸可以通过替代连接键连接。为了降低核酸酶的降解,最5′端的3′-5′连接键可以是修饰的连接键,例如硫代磷酸酯键或P-烷氧基磷酸三酯键。任选地,5′末端羟基部分可以用包含磷的部分,例如磷酸、硫代磷酸或P-乙氧基磷酸酯化。
在本发明的另一个实施方案中,本发明的嵌合RNA分子可以包括一个或多个灵活的接头。此类接头可用于组合或融合两个或两个以上更小的嵌合RNA与更大的嵌合RNA分子。在可以被适当保护或活化的每一末端提供接头作为功能性基团。功能性基团共价连接至每一RNA分子,例如与5′-羟基或3′-羟基的醚键、酯键、氨基甲酸酯键、磷酸酯键或胺键。优选的连接键是与典型寡核苷酸连接键类似的磷酸酯键。例如,六甘醇可以在一个末端用光不稳定保护基团(即NVOC或MeNPOC)保护并且在另一个末端用2-氰乙基-N,N-二异丙基氨基-氯代磷酸酯活化以形成亚磷酰胺。形成醚键、氨基甲酸酯键或胺键的其它方法对于本领域技术人员而言是众所周知的,并且具体试剂和参考可以在教科书例如March,Advanced OrganicChemistry,4th Ed.,Wiley-Interscience,New York,N.Y.,1992中找到。通常,灵活的接头是非核苷酸分子,包括间隔子、附属物、生物缀合物、发光团、报告基团、染料标记的RNA和非天然存在的核苷酸类似物。优选的接头、间隔子、生物缀合物、附属物和发光团更详细描述于美国专利申请号20040058886中,其在本文引用作为参考。
在一个实施方案中,寻找具有基因沉默功能的本发明的嵌合RNA分子可以包括提高对靶序列亲和性的活性剂。术语“亲和性增强剂”包括提高本发明的嵌合RNA分子对其靶的亲和性的活性剂。此类活性剂包括例如嵌入剂和高亲和性核苷酸单体。嵌入剂与核酸强烈但非特异性地相互作用。嵌入剂起到稳定RNA-DNA双链体的作用,因此提高本发明的嵌合RNA分子对其靶的亲和性。嵌入剂对通常连接于寡核苷酸的3′或5′末端。嵌入剂的实例包括吖啶、苯丁酸氮芥、苯并吡啶并喹喔啉、苯并吡啶并吲哚、苯菲啶和吩嗪。活性剂还赋予寡核苷酸其它特性,例如提高对内切核酸酶和外切核酸酶的抗性。
在一个实施方案中,高亲和性核苷酸单体被掺入到本发明的嵌合RNA分子中。措辞“高亲和性核苷酸单体”如本文所使用,包括修饰碱基或碱基类似物,其以与非修饰碱基相比更高的亲和性与靶核酸分子的互补碱基结合,例如通过更积极有利的与互补碱基的相互作用,例如通过与互补碱基形成更多氢键。例如,在术语“高亲和性核苷酸单体”中包括高亲和性核苷酸单体类似物,例如氨基乙氧基吩噁嗪(也称作G夹),其与鸟嘌呤形成四个氢键。高亲和性核苷酸单体如下描述(参见例如Flanagan等,1999.Proc.Natl.Acad.Sci.96:3513)。其它示例性高亲和性核苷酸单体是本领域众所周知的,并且包括可以取代寡核苷酸中腺嘌呤或鸟嘌呤的7-烯基、7-炔基、7-杂芳基-或7-炔基-杂芳基-取代碱基等(参见例如US 5,594,121)。同样,发现7-取代脱氮嘌呤赋予寡核苷酸增强的结合特性,即通过允许它们以比非修饰寡核苷酸更高的亲和性与互补的靶核酸分子结合。高亲和性核苷酸单体可以使用标准技术掺入到本发明的寡核苷酸中。
在另一个实施方案中,提高本发明的嵌合RNA分子对其靶的亲和性的活性剂包括嵌入剂。如本文所使用,短语“嵌入剂”包括能结合DNA双链螺旋的活性剂。当共价连接至本发明的嵌合RNA分子时,嵌入剂增强了寡核苷酸与其互补的基因组DNA靶序列的结合。嵌入剂还提高了对内切核酸酶和外切核酸酶的抗性。示例性嵌入剂由Helene和Thuong(1989.Genome 31:413)教导,并且包括例如吖啶衍生物(Lacoste等,1997.Nucleicacids Research.25:1991;Kukreti等,1997.Nucleic acids Research.25:4264);喹啉衍生物(Wilson等,1993.Biochemistry 32:10614);苯并[f]喹啉并[3,4-b]喹喔啉衍生物(Marchand等,1996.Biochemistry.35:5022;Escude等,1998.Proc.Natl.Acad.Sci.95:3591)。嵌入剂可以使用任何方便的连接键掺入到本发明的嵌合RNA分子中。例如,吖啶或补骨脂素可以通过标准方法通过任何可利用的-OH或-SH连接至寡核苷酸,例如寡核苷酸的末端5′位置、糖部分的2′位置或整合至嘧啶5-位的OH、NH2、COOH或SH。
在一个实施方案中,可以通过在构建体的正义或反义链的5′或3′末端形成环结构使本发明的双链的双联体构建体对核酸酶更稳定。稳定本发明RNA分子的适宜环结构和其它结构描述于美国专利申请号20040014956中。
本发明的嵌合RNA分子(或用于产生其的表达构建体或载体)可以被衍生化、化学修饰、与多种活性剂组合和/或连接以提高其活性或特异性。此类活性剂包括但不限于缀合活性剂(例如用于改善细胞摄取)、蛋白质载体(例如用于改善细胞摄取和更大的细胞积累)、包封剂(例如脂质体;例如为了促进细胞摄取或靶向)、络合剂(例如阳离子脂,例如为了提高细胞摄取)、碱性寡肽、转运肽(例如HIV TAT转录因子、乳铁蛋白、Herpes VP22蛋白质)以及靶向剂(用于靶向细胞受体)。适宜的缀合活性剂、蛋白质载体、包封剂、络合剂、碱性寡肽、转运肽和靶向剂描述于例如美国专利申请号20040014956中。使本发明的嵌合RNA分子与其靶细胞接触的额外方式在下面关于药物应用中描述。备选地,嵌合RNA可以通过对包含用于嵌合RNA的表达构建体的生物的摄入或其感染而递送至靶生物。参见例如US6,506,559。用于提高本发明RNA分子抗核酸酶降解(例如被血清核酸酶和细胞核酸酶以及在其它体液中存在核酸酶)稳定性的方法描述于美国专利申请号20040014956。
如果使用化学合成或者体外酶促合成,则在导入细胞内之前将本发明的嵌合RNA分子纯化。例如,可以通过用溶剂或树脂提取、沉淀、电泳(例如聚丙烯酰胺凝胶电泳)、色谱(例如凝胶色谱和高压液相色谱)或其组合将RNA从混合物中纯化。备选地,嵌合RNA可以不经纯化或最低限度纯化而使用,以避免因样品处理所致的损失。嵌合RNA可以干燥以便储存,或者可以溶解于水溶液中。所合成的本发明合成性嵌合RNA分子的质量可以使用例如Bergot和Egan.1992.J.Chrom.599:35的方法通过毛细管电泳和变性强阴离子HPLC(SAX-HPLC)证实。
1.4嵌合RNA向细胞和生物中的导入
本发明的嵌合RNA或其递送活性剂或生产活性剂(例如表达构建体或载体)(下文统称做“RNA活性剂”)可以用本领域技术人员熟悉的多种方式导入生物或细胞中。“导入”应广义理解,并且为了本发明的目的包括适宜直接或间接将本发明的RNA活性剂引入生物或其细胞、区室、组织、器官或种子中,或者在其中产生本发明的RNA活性剂的那些方法。导入抗导致RNA活性剂瞬时存在或稳定存在。
因此,本发明的进一步的方面涉及包含至少一个本发明嵌合RNA或RNA活性剂(例如编码所述嵌合RNA分子的表达构建体或表达载体)的细胞和生物(例如植物、动物、原生动物、病毒、细菌或真菌)。在某些实施方案中,细胞悬浮于培养基中;而在另外的实施方案中细胞在整个生物(或其部分)中(例如微生物、植物或动物,如非人哺乳动物)。细胞可以是原核细胞或真核细胞。优选地,表达构建体包含于细胞的基因组DNA中、更优选在染色体或质体DNA中、最优选在染色体DNA中。
具有靶基因的细胞可以是种系的或体细胞系的、全能的或多能的、分裂的或非分裂的、薄壁组织的或上皮组织的、永生化的或转化的等等。细胞可以是配子或胚;如果是胚,其可以是单细胞胚或多细胞胚的一个或多个组成细胞。因此,术语“胚”也包括胎儿组织。具有靶基因的细胞可以是未分化细胞,干细胞,或者是分化细胞,例如来自器官、组织(包括胎儿组织)的细胞或生物中存在的任何其它细胞。分化的细胞类型包括脂肪细胞、成纤维细胞、肌细胞、心肌细胞、内皮细胞、神经元、神经胶质、血细胞、巨核细胞、淋巴细胞、巨噬细胞、中性白细胞、嗜酸性粒细胞、嗜碱性粒细胞、肥大细胞、白细胞、粒细胞、角质形成细胞、软骨细胞、成骨细胞、破骨细胞、肝细胞和内分泌腺或外分泌腺的细胞。
优选的原核生物主要是细菌,例如埃希氏菌属(Escherichia)、棒杆菌属(Corynebacterium)、芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、Proionibacterium属、丁酸弧菌属(Butyrivibrio)、丁酸弧菌属(Eubacterium)、乳杆菌属(Lactobacillus)、欧文氏菌属(Erwinia)、农杆菌属(Agrobacterium)、农杆菌属(Flavobacterium)、产碱菌属(Alcaligenes)、Phaeodactylum属、豆形虫属(Colpidium)、被孢霉菌(Mortierella)、虫霉属(Entomophthora)、毛霉菌属(Mucor)、Crypthecodinium属或Cyanobacteria,例如集胞藻属。优选的微生物主要是能够感染植物并因此能够转移本发明构建体的那些微生物。优选的微生物是农杆菌属,特别是根癌农杆菌和毛根农杆菌(Agrobacterium rhizogenes)。
真核细胞和生物包括植物和动物(优选非人动物)和/或细胞以及真核微生物,如酵母、藻类或真菌。可以通过将所述表达系统导入合子、干细胞、原生质体或从生物衍生的另一适宜细胞中,产生相应的转基因生物。从重组表达构建体表达本发明嵌合RNA的转基因动物可以通过将构建体导入合子、胚胎干细胞或从合适生物衍生的另一多能细胞中产生。包装成病毒颗粒的病毒构建体可实现表达构建体向细胞的有效导入和表达构建体所编码RNA的有效转录。适宜载体是本领域众所周知的(见例如Shi,Y.2003.Trends Genet 2003 Jan 19:9;Reichhart J M等,Genesis.2002.34(1-2):160-4,Yu等,2002.Proc Natl Acad Sci USA 99:6047;Sui等,2002.Proc Natl Acad Sci USA 99:5515)。
植物可以是单子叶植物、双子叶植物或裸子植物;动物可以是脊椎动物或无脊椎动物。优选的动物和植物在上面定义部分说明。优选的真菌是曲霉菌属(Aspergillus)、木霉属(Trichoderma)、棉阿舒囊霉属(Ashbya)、链孢霉属(Neurospora)、镰刀菌属(Fusarium)、白僵菌属(Beauveria)或在Indian Chem Engr.Section B.第37卷,第1,2期(1995),第15页表6中描述的更多的真菌。特别优选丝状真菌的半子囊菌纲(Hemiascomycete)的棉阿舒囊霉(Ashbya gossypii)。优选的酵母是念珠菌属(Candida)、酵母菌属(Saccharomyces)、汉逊酵母属(Hansenula)或毕赤酵母属(Pichia),特别优选酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichiapastoris)(ATCC登录号201178)。特别优选的动物是线虫。
优选的生物是植物。优选的植物特别选自作物植物。最优选的是:
a)适于产油的植物,例如油菜、向日葵(sunflower)、芝麻(sesame)、红花(safflower)(Carthamus tinctorius)、橄榄树(olive tree)、大豆、玉米、花生(peanut)、蓖麻油植物(castor-oil plant)、油椰子(oil palm)、小麦、可可灌木(cacao shrub)或多种坚果物种如,胡桃(walnut)、椰子(coconut)或杏树。其中特别优选的是双子叶植物,特别是油菜、大豆和向日葵。
b)用作淀粉生产的植物,例如玉米、小麦或马铃薯。
c)用作粮食和/或饲料的植物和/或有用的植物以及在其中抗病原体
将是有益的植物,例如大麦、黑麦、稻(rice)、马铃薯、棉花(cotton)、亚麻(flax)或亚麻籽。
d)用作精细化学品如维生素和/或类胡萝卜素生产的植物,例如油菜。
根据植物培育权(Plant Breeders Rights)将植物变种排除在外,特别是登记的植物变种。应当注意,不能仅仅因为其在基因组中稳定包含转基因而将植物看作是“植物变种”,其中所述转基因已经导入到植物的细胞中或者其祖先细胞中。除了植物之外,本发明提供了此植物的任何克隆、种子、自交或杂交子代和后代以及它们的任何部分或繁殖体,例如可以用于有性或无性繁殖繁殖或增殖的插条和种子。本发明还可包括有性或无性繁殖的植物后代、此植物的克隆或后代、或所述植物、后代、克隆或子代的任何部分或繁殖体。可以被人或动物使用的本发明的遗传修饰植物还可直接或者在本发明众所周知的加工后用作食物或饲料。本发明还提供生物、特别是植物的部分,特别是繁殖部分或贮藏部分。植物包括但不限于种子、胚乳、胚珠、花粉、根、块茎、茎(stem)、叶、茎(stalk)、果实、浆果、坚果、树皮、豆荚、种子和花。在本发明特别优选的实施方案中,植物部分是种子。
RNA活性剂(例如本发明的嵌合RNA分子)一般以允许递送至每一个细胞中至少一个拷贝的量导入或施用。更高的量(例如每个细胞至少5、10、100、500或1000拷贝)可以根据需要达到更有效的表型(例如靶基因的更高表达或更高抑制)。施用至细胞、组织或生物中的RNA活性剂的量依赖于细胞、组织或生物性质、靶基因性质和RNA活性剂性质,并且可以容易地优化以便得到所希望的表达水平或抑制水平。
优选地至少约100个分子、优选地至少约1000、更优选地至少约10,000个RNA活性剂分子、最优选地至少约100,000个RNA活性剂分子被导入。在通过注射以外的方法,如通过浸泡、电穿孔或脂介导的转染将RNA活性剂施用于培养细胞或组织内细胞的情况下,细胞优选地暴露于相似水平的介质中的RNA活性剂。
例如,RNA活性剂可以通过转化、转染、注射、抛射、结合、内吞作用和吞噬作用导入细胞中。用于导入的优选方法包括但不限于:
a)向靶细胞或生物中直接或物理性导入本发明的嵌合RNA分子的方法,和
b)向靶细胞或生物间接导入本发明嵌合RNA的方法(例如通过首先导入表达构建体,然后在细胞内表达)。
1.4.1向靶细胞或生物中直接和物理性导入RNA
以本发明嵌合RNA(或RNA活性剂)在靶细胞或生物外产生为例,其可与一个或多个细胞或靶生物(优选人、病原体或植物细胞或生物)接触(即使其接触,在下文中也称作施用于或递送至)并被其摄入。接触可以是体外的,例如在试管中或者培养皿中(并且可以导入或不导入受试者),或者是体内的,例如在受试者如哺乳动物、病原体或植物受试者中。病原体优选地是线虫。
本发明嵌合RNA(或RNA活性剂)可以直接导入细胞中(即细胞内方式);或者以细胞外方式导入生物的腔、空隙、循环系统中,其可以通过口服导入或者通过将生物浸浴在含本发明嵌合RNA(或RNA活性剂)的溶液中导入。用于口服导入的方法包括将RNA与生物的食物直接混合,以及将用作食物的物种改造成表达本发明的嵌合RNA(或RNA活性剂)然后用其饲喂待影响生物的工程改造的方法。
导入核酸的物理性方法包括将本发明嵌合RNA(或RNA活性剂)的溶液直接注射入细胞或者细胞外注射入生物中。例如以胚或细胞为例,本发明嵌合RNA(或RNA活性剂)通过微注射容易地施用;向细胞内导入核酸的其它方法包括通过用本发明嵌合RNA(或RNA活性剂)包被的颗粒的轰击、在本发明嵌合RNA(或RNA活性剂)的溶液中浸泡细胞或生物、在本发明嵌合RNA(或RNA活性剂)存在下将细胞膜电穿孔、脂质体介导的本发明嵌合RNA(或RNA活性剂)的递送以及通过化学物质入磷酸钙介导的转染。
本发明嵌合RNA(或RNA活性剂)活性剂可以与增强细胞摄取RNA或者提高其功能性的组分一起导入。向细胞的递送可以通过本领域公认的适宜方法提高,所述方法包括本领域众所周知的磷酸钙、DMSO、甘油或葡聚糖、电穿孔或转染如使用阳离子、阴离子或中性脂成分或脂质体(见例如WO 90/14074;WO 91/16024;WO 91/17424;US 4,897,355;Bergan等,1993.Nucleic acids Research.21:3567)。还可以采用使用化合物如聚赖氨酸、精蛋白或N1,N12-双(乙基)精胺的聚胺或聚阳离子缀合物(参见例如Bartzatt,R.等,1989.Biotechnol.Appl.Biochem.11:133;Wagner E.等,1992.Proc.Natl.Acad.Sci.88:4255)。在细胞培养物或组织外植体的情况下,细胞方便地在包含本发明嵌合RNA(或RNA活性剂)的溶液中孵育或脂介导转染;在完整动物或植物的情况下,本发明嵌合RNA(或RNA活性剂)通过注射或者灌注入生物的腔或空隙或者通过口服全身施用、局部施用、肠胃外施用(包括皮下、肌内和静脉内施用)、阴道施用、直肠施用、鼻内施用、眼部施用或腹膜内施用而方便地导入。
此外,本发明嵌合RNA(或RNA活性剂)可以通过可植入的延迟释放装置而施用。用于口服导入的方法包括将RNA与生物的食物直接混合,以及将用作食物的物种改造成表达本发明的嵌合RNA(或RNA活性剂)然后用其饲喂待影响生物的工程改造的方法。本发明嵌合RNA(或RNA活性剂)可以向植物喷雾,或者植物可以经遗传工程化以便以足够杀死一些或全部已知感染该植物的病原体的量表达RNA。
1.4.2 RNA的间接导入
备选地,可以通过导入(例如通过转化或转染)一个或多个编码本发明的嵌合RNA分子的表达构建体或表达载体而向细胞间接提供RNA活性剂。本发明嵌合RNA的表达可以是瞬时的或者是稳定的,例如整合进入生物的基因组(例如使用选择标记)。优选地对于药物应用,RA活性剂瞬时导入并且不稳定整合入基因组中。优选地对于在植物中的应用,嵌合RNA表达系统整合进入细胞的基因组中,例如染色体DNA或细胞器DNA(例如质体(例如叶绿体)、线粒体等)。优选整合进入染色体DNA。
表达构建体和载体已在上面大概描述(见定义部分和部分1.3.1)。优选的表达构建体在下面对于本发明具体应用组合物和方法中详细描述。用于通过导入表达构建体或载体(其可以被转录)而向细胞提供RNA的方法描述于WO 99/32619中。上面描述的用于向细胞中直接导入RNA分子的所有方法也可以用于导入类似表达构建体或载体的核酸分子。
2.本发明嵌合RNA的应用
本发明具有广的一个能用范围,优选地用于植物、人和动物领域。通常,本发明的方法和主题可用于以更高的特异性提高任何目的基因或序列的表达,包括治疗性或免疫原性肽和蛋白质、用于控制基因表达的核酸、再现酶促途径的基因用于化学品合成、逃避酶促途径(用于提高特定中间产物或终产物表达)工业工程的基因等。
在一个优选的实施方案中,真核生物是植物并且启动子是在植物中具有启动子功能性的启动子。对于植物,所表达的核苷酸序列优选地调节涉及农学性状、疾病抗性、除草剂抗性和/或谷类特性的基因的表达。本领域技术人员知道可以用于本发明并且对于提高表达特异性有益的多种序列。靶核苷酸序列包含任何目的核苷酸序列或基因,包括基因、调节序列等。目的基因包括编码农学性状、昆虫抗性、疾病抗性、除草剂抗性、不育性、谷类特性等的那些基因。基因可以涉及油、淀粉、碳水化合物、营养物等的代谢。目的基因或性状包括但不限于环境或应激相关性状、疾病相关性状和影响农学特性的性状。靶序列还包括负责蛋白质、肽、脂肪酸、脂类、蜡、油、淀粉、糖、碳水化合物、香料、气味、毒素、类胡萝卜素、激素、聚合物、类黄酮、贮存蛋白质、酚酸、生物碱、木质素、单宁类、纤维素、糖蛋白、糖脂等合成和/或降解的基因。
在本文中考虑了植物中的多种应用,在这些应用中以一定方向调节表达谱是有益的。该调节可通过以这样一种方式选择microRNA标签实现,即天然存在的miRNA的表达谱与将实现不表达或较低表达的组织、时间和/或环境条件相符。例如,microRNA在植物中具有选自下列天然表达谱:
a)基本上组成型表达但在种子中不表达,
b)主要在种子中表达但在其它组织中不表达,
c)干旱或其它非生物应激诱导型表达,
d)植物病原体诱导型表达,
e)时间性表达(例如在早期发育、萌芽、授粉等过程中),和
f)化合物诱导型表达。
优选地,microRNA是选自下列的植物microRNA:
a)SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述序列,和
b)SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述序列的衍生物。
衍生物优选地是这样的序列,其在不同物种的生物中(即与公开的miRNA所来源物种不同的物种)行使同一功能性内源的目的(例如某些基因控制功能)。相对于明确公开的序列而言,所述衍生物可以具有一些错配,优选地衍生物的特征在于与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述的任何序列具有至少70%、优选地至少80%或85%、更优选地至少90%、最优选地至少95%的同一性。具体miRNA内的错配可以在整个序列中,但优选在miRNA的3’区(相当于互补miRNA-标签的5’-区)。在植物中的更具体的应用描述于下文。
在本文中提供的本发明的其它应用是用于动物(特别是哺乳动物)或人。特别优选的药物应用。因此,在本发明的另一个优选实施方案中,靶生物是哺乳动物(更优选地是人)并且启动子是在哺乳动物(更优选人)中具有功能性的启动。所表达的包含miRNA-标签的核苷酸序列优选地调节(例如表达、过表达或抑制)选自人或动物疾病所涉及基因或治疗基因的基因的表达。备选地,对靶生物具有治疗作用的外源基因或序列被表达。疾病优选地选自免疫疾病、癌症、糖尿病、神经变性疾病和代谢疾病。本领域技术人员知道在该情况下所有的众多序列。被调节的基因可以选自视网膜母细胞瘤蛋白、p53、制管张素、瘦蛋白、激素、生长因子、细胞因子、胰岛素、生长激素、α-干扰素、β-葡糖脑苷脂酶、血清白蛋白、血红蛋白和胶原。治疗基因可以选自肿瘤坏死因子α(ADD)。在该情况下,本发明所公开的是用于基因治疗或核苷酸介导治疗的改良方法。
当前,本领域使用多种启动子来在动物,哺乳动物或人中表达序列。它们中大多数缺乏组织特异性并且可以有利地与本文所提供的教导相组合。例如启动子可以选自perbB2启动子、乳清酸性蛋白启动子、溶基质蛋白酶3启动子、前列腺特异性抗原启动子、probasin启动子。
在本文中考虑了在动物,哺乳动物或人中的多种应用,在这些应用中以一定方向调节表达谱是有利的。该调节通过以这样的方式选择microRNA标签实现,即天然存在的miRNA的表达谱与将实现不表达或较低表达的组织、时间和/或环境条件相符。例如,microRNA在动物、哺乳动物或人中具有选自下列天然表达谱:
a)在选自脑组织、肝脏组织、肌肉组织、神经元组织和肿瘤组织中组织特异性表达,
b)应激诱导型表达,
c)病原体诱导型表达,
d)赘生生长或致瘤生长诱导型表达,和
e)年龄依赖性表达。
优选地,microRNA是动物、哺乳动物或人microRNA。成千上百个miRNA已经从小鼠和人的器官和细胞系中克隆出来,并且很多额外miRNA已经用计算机算法预测出来(Lagos-Quintana M等,Science 2001,294:853-858;Lagos-Quintana M等,Curr Biol 2002,12:735-739;Lagos-Quintana M等,RNA 2003,9:175-179;Lim LP等,Science 2003,299:1540;Mourelatos Z等,Genes Dev 2002,16:720-728;Dostie J等,RNA2003,9:180-186)。这些microRNA中的多种以及它们的表达谱已在本领域有所描述(见例如Sempere LF等,Genome Biology 2004,5:R13;电子版可)在http://genomebiology.com/2004/5/3/R13中得到);其以及其中所引用参考文献在此完整引用作为参考)。Sempere等使用northern印迹分析表征了119个miRNA在小鼠和人成年器官中的表达。它们当中,有30个miRNA在特定器官(脑、肺、肝脏或骨骼肌)中特异性表达或极大丰富。总共19个脑表达的miRNA(包括lin-4和let-7直向同源物)在神经元发育过程中在人和小鼠胚胎性癌细胞中一致上调。小鼠和人miRNA常具有高同源性(约90%)并且可以互换(见Sempere等,2004中的图5)。
总共17个表达的miRNA仅在特定小鼠器官中检测到;它们包括:7个脑特异性miRNA(miR-9,-124a,-124b,-135,-153,-183,-219),6个肺特异性miRNA(miR-18,-19a,-24,-32,-130,-213),2个脾脏特异性miRNA(miR-189,-212),1个肝脏特异性miRNA(miR-122a)和1个心脏特异性miRNA(miR-208)(Sempere等,2004;图2)。大多数所指出的小鼠脑、肝脏和心脏特异性miRNA也在人的相应器官中检测到。在可以在两个或两个以上小鼠器官中检测到的75个miRNA当中,有14个在特定小鼠器官中的水平比在任何其它器官中的水平高至少2倍;它们包括:7个脑丰富miRNA(miR-9,-125a,-125b,-128,-132,-137,-139),3个骨骼肌丰富miRNA(miR-1d,-133,-206),2个肾脏丰富miRNA(miR-30b,-30c)和1个脾脏丰富miRNA(miR-99a)。所有脑丰富miRNA和骨骼肌丰富miRNA在人的相应器官中具有相似的提高的水平。这些器官特异性和器官丰富miRNA在小鼠和人之间高度保守表达。
一组6个miRNA主要在小鼠脾脏中表达(miR-127,-142-a,-142-s,-151,-189,-212)。一组5个miRNA在小鼠和人肝脏中表达(miR-122a,-152,-194,-199,-215),而在其它器官包括肺和肾脏中散乱表达。
一组7个miRNA在小鼠肺和肾脏中表达(miR-18,-20,-24,-32,-141,-193,-200b)。加在一起至少两组反应出在上皮细胞类型中具有作用,因为肝脏、肺和肾脏是包含上皮组织的器官。
一组17个miRNA在小鼠和人脑中表达(miR-7,-9,-9,-124a,-124b,-125a,-125b,-128,-132,-135,-137,-139,-153,-149,-183,-190,-219),而在)其它器官中散乱表达。
一组6个miRNA在小鼠和人骨骼肌和心脏中表达:miR-1b,-1d,-133和-206在心脏和骨骼肌中提高表达在其它器官中低表达,miR-143和-208几乎仅在心脏和骨骼肌中检测到。
一组5个miRNA表现出在器官当中丰富表达(let-7a,-7b,miR-30b,-30c)。
miRNA序列在本领域众所周知并且描述于例如Sempere等,2004中以及该论文的额外的电子版数据。例如一些miRNA-标签在本文中被指定:hsa-miR-19a(SEQ ID NO:90)、hsa-let7b(SEQ ID NO:91)、hsa-miR-100(SEQ ID NO:92)、hsa-miR-103-1(SEQ ID NO:93)、hsa-miR-107(SEQ IDNO:94)、hsa-miR-10a(SEQ ID NO:95)、hsa-miR-124b(SEQ ID NO:96)、hsa-miR-129a(SEQ ID NO:97)、hsa-miR-139(SEQ ID NO:98)、hsa-miR-147(SEQ ID NO:99)、hsa-miR-148(SEQ ID NO:100)、hsa-miR-15a(SEQ ID NO:101)、hsa-miR-16(SEQ ID NO:102)、hsa-miR-18(SEQ ID NO:103)、hsa-miR-192(SEQ ID NO:104)、hsa-miR-196(SEQ ID NO:105)、hsa-miR-199a(SEQ ID NO:106)、hsa-let7a(SEQ ID NO:107)、hsa-miR-24(SEQ ID NO:108)、hsa-miR-20(SEQ ID NO:109)、hsa-miR-208(SEQ ID NO:110)、hsa-miR-210(SEQ IDNO:111)、hsa-miR-212(SEQ ID NO:112)、hsa-miR-213(SEQ ID NO:113)、hsa-miR-214(SEQ ID NO:114)、hsa-miR-215(SEQ ID NO:115)、hsa-miR-216(SEQ ID NO:116)、hsa-miR-217(SEQ ID NO:117)、hsa-miR-218(SEQ ID NO:118)、hsa-miR-219(SEQ ID NO:119)、hsa-miR-22(SEQ ID NO:120)、hsa-miR-220(SEQ ID NO:121)、hsa-miR-221(SEQ ID NO:122)、hsa-miR-222(SEQ ID NO:123)、hsa-miR-23a(SEQ ID NO:124)、hsa-miR-19b(SEQ ID NO:125)、hsa-miR-96(SEQ ID NO:126)、hsa-miR-26b(SEQ ID NO:127)、hsa-miR-27a(SEQ ID NO:128)、hsa-miR-28(SEQ ID NO:129)、hsa-miR-29(SEQ ID NO:130)、hsa-miR-29b(SEQ ID NO:131)、hsa-miR-30a(SEQ ID NO:132)、hsa-miR-30c(SEQ ID NO:133)、hsa-miR-30d(SEQ ID NO:134)、hsa-miR-30e(SEQ ID NO:135)、hsa-miR-32(SEQ ID NO:136)、hsa-miR-33(SEQ ID NO:137)、hsa-miR-7(SEQ ID NO:138)、hsa-miR-91(SEQ ID NO:139)、hsa-miR-92(SEQ IDNO:140)、hsa-miR-93(SEQ ID NO:141)、hsa-miR-95(SEQ ID NO:142)、hsa-miR-98(SEQ ID NO:143)、hsa-miR-26a(SEQ ID NO:144)。这些序列指定了潜在的miRNA-标签。相应miRNA在RNA中是互补的序列。
优选地,microRNA是选自下列的动物、哺乳动物或人microRNA:
a)SEQ ID NO:56、57、58、59、60、61、62和63所述序列,和
b)SEQ ID NO:56、57、58、59、60、61、62和63所述序列的衍生物,和
c)与SEQ ID NO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208任意所述序列互补的RNA序列,和
d)与SEQ ID NO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208任意所述序列互补的RNA序列的衍生物。
衍生物优选地是这样的序列,其在不同物种的生物中(即与公开的)miRNA所来源物种不同的物种)行使同一功能性内源的目的(例如某些基因控制功能)。相对于明确公开的序列而言,所述衍生物可以具有一些错配,优选地衍生物的特征在于与SEQ ID NO:56、57、58、59、60、61、62和63所述任何序列或者与SEQ ID NO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208所述任何序列互补的RNA序列具有至少70%、优选地至少80%或85%、更优选地至少90%、最优选地至少95%的同一性。具体miRNA内的错配可以在整个序列中,但优选在miRNA的3’区(相当于互补miRNA-标签的5’-区)。
本发明的另一个实施方案涉及根据本发明的至少一个表达构建体、嵌合核糖核苷酸序列或载体的药物制剂。
在下文描述了在动物和人中的更具体的应用,特别是在药物应用领域。
如上所述,本发明的方法和主题可以用于提高嵌合核苷酸序列表达的特异性,嵌合核苷酸序列编码:
i)蛋白质(即通过包含可读框(ORF)),
ii)优选用于基因沉默方法的功能性RNA(例如反义RNA、正义RNA、双链RNA或核酶RNA)。
2.1特异性提高的表达
用于在多种生物中表达或过表达核苷酸序列的方法是本领域技术人员众所周知的(Maniatis T,Fritsch EF和Sambrook J(1989)MolecularCloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Silhavy等,(1984)Experiments with GeneFusions,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Ausubel等,(1987)Current Protocols in Molecular Biology,GreenePublishing Assoc.and Wiley Interscience;对于细节见3.3部分)。
2.2特异性提高的基因沉默
本发明的嵌合RNA分子、用于它们表达的表达构建体和表达载体以及包含所述分子的转基因生物可用于基因沉默(即减弱、降低或抑制靶基因在靶细胞或生物中的表达)。为此,嵌合RNA可以包含能够提供反义RNA(用于反义RNA介导的基因沉默)、双链RNA(用于dsRNA干扰基因沉默)或正义RNA(用于共抑制基因沉默)的序列。
与常规正义、反义或双链RNA核苷酸序列相比,本发明方法产生较好的效果和/或更高的效率。
本发明的另一个实施方案涉及用于改变、优选地降低或减弱靶基因表达的组合物,包含至少一个本发明的嵌合RNA。然而,本发明的另一个实施方案涉及用于减弱(或降低或抑制)至少一个靶基因在真核生物细胞中表达的方法,包括以足以减弱靶基因表达的量向细胞中导入本发明的嵌合RNA分子(或编码它们的表达构建体或载体),其中嵌合RNA分子包含至少一个与靶基因的至少部分核苷酸序列基本相同的核糖核苷酸序列。
可以靶向在细胞(优选真核生物细胞)中表达的任何基因。在细胞中表达的基因是被转录得到RNA(例如mRNA)和任选得到蛋白质的基因。优选地,靶基因是真核生物基因,更优选哺乳动物、线虫、真菌或植物基因。优选地,靶基因是细胞的内源基因或者是相当于细胞基因组而言为异源的基因,如病原体基因。优选地,病原体基因来自能感染真核生物的病原体。最优选地,所述病原体选自病毒、细菌、真菌和线虫。
嵌合RNA可以在细胞(即将实现基因沉默的宿主细胞)外产生,或可以通过表达构建体或表达载体在细胞内重组产生。细胞细胞优选真核生物细胞,更优选线虫、哺乳动物细胞或植物细胞。
优选地,靶基因表达不减弱(或降低或抑制)至少约10%、优选地至少约30%、更优选地至少约50%、甚至更优选地至少约70%、最优选地至少约90%。
为实现基因沉默,本发明嵌合RNA包含至少一个核糖核苷酸序列,所述核糖核苷酸序列与至少一个靶基因的至少一部分基本上相同(如上所定义)、优选相同。优选地,与所述核糖核苷酸序列基本相同的所述靶基因部分具有至少15核苷酸、优选地至少19核苷酸、更优选地至少50个核苷酸、甚至更优选地至少100个核苷酸、最优选地至少250个核苷酸的长度。更加优选地,所述核苷酸序列与至少一个靶基因的至少15核苷酸、优选地至少19核苷酸、更优选地至少50个核苷酸、甚至更优选地100个核苷酸、最优选地至少250个核苷酸的序列具有至少65%、优选地至少80%、更优选地至少90%、最优选地95%、甚至更优选地100%的同一性。优选地,所述第一个核糖核苷酸序列与靶基因的序列杂交(优选地在严格条件下,更优选地在低严格条件下,最优选地在高严格条件下)。
在优选的实施方案中,核苷酸序列与靶基因(优选地真核生物基因,如哺乳动物或植物基因)编码序列或非编码序列的一部分基本上相同、优选相同。非编码序列可以是5’-或3’-非翻译序列或内含子,但是也可以是非转录序列。在靶基因编码基因家族(即编码极其相似蛋白质的不同基因)的一个成员的情况下,非编码序列优选作为靶序列。
靶基因可以是内源基因或外源或外来基因(即转基因或病原体基因)。例如,因病毒递送构建体发生基因组整合而出现在细胞基因组中的转基因可以使用本发明嵌合RNA调节。外源基因可以整合进入宿主基因组中(优选染色体DNA),或者它可以存在于染色体外遗传构建体例如质粒或粘粒中。例如,靶基因可以存在于嵌合RNA所导入细胞的基因组中,或者能够感染此生物或细胞的病原体如病毒、细菌、真菌或原生动物的基因组中。
本发明嵌合RNA可以递送的真核细胞或生物可以源于任何真核生物,例如但不限于植物或动物,例如哺乳动物、昆虫、线虫、真菌、藻类、鱼类和鸟类。同样,本发明的嵌合RNA分子或用于其表达的表达构建体或载体可用于抑制或降低任何靶基因在真核生物中的表达。在本发明的一些实施方案中,包含本发明嵌合RNA的原核生物也是有用的。例如原核细胞和生物可用于产生或扩增本发明嵌合RNA或编码它们的表达构建体或载体。此外,原核生物可用作媒介物以便通过例如饲喂将本发明嵌合RNA导入动物。同样,原核生物如农杆菌可有利地用作媒介物用于例如植物的转化。
因此,本发明的另一方面涉及包含至少一个本发明嵌合RNA或者编码所述嵌合RNA分子的表达构建体或表达载体的细胞和生物(例如植物、动物、原生动物、病毒、细菌或真菌)(如上详细定义)。
本发明的另一实施方案涉及用于减弱(或降低)至少一个靶基因在真核生物细胞中表达的方法,包括以足以减弱靶基因表达的量向细胞中导入本发明的嵌合RNA分子,其中嵌合RNA分子包含至少一个与靶基因的至少部分核苷酸序列基本相同、优选相同的核糖核苷酸序列。取决于特定靶基因和所递送的嵌合RNA的剂量,方法可以部分或全部基因在细胞中的表达。优选地,本发明嵌合RNA能够有效消除、基本降低或至少部分降低RNA(优选mRNA)转录本或靶基因(或基因家族)所编码的蛋白质水平。优选地,靶基因的表达(如通过表达的RNA或蛋白质所测定)降低、抑制或减弱至少10%、优选地至少30%或40%、优选地至少50%或60%、更优选地至少80%、最优选地至少90%或95%。靶产物如转录本或蛋白质的水平可以在整个生物如植物或哺乳动物中降低,或者靶产物的此种降低可位于生物的一个或多个特定器官或组织。例如,产物水平可以在包括但不限于根、决茎、茎、叶、茎、果实、浆果、坚果、树皮、豆荚、种子和花的一个或多个植物组织和器官中降低。优选的器官是植物种子。
可以通过以足以减弱两个或两个以上靶基因表达的量向细胞中导入两个或两个以上嵌合RNA或者一个能提供一个以上嵌合RNA分子的RNA(通过随后的RNA加工)来同时减弱该两个或两个以上基因的表达。
为了克服通过dsRNA所激起的序列不依赖性蛋白激酶PKR应激反应,可对一般将活化干扰素途径的嵌合RNA分子进行修饰,以致于不再活化干扰素途径。在某些实施方案中,细胞可用能抑制宿主细胞广泛dsRNA反应,例如将产生序列不依赖性细胞凋亡的活性剂处理。例如,细胞可用抑制称作PKR(RNA活化的蛋白激酶)的dsRNA依赖性蛋白激酶的活性剂处理。同样,可使用异位活化eIF2α的活性剂的过表达。可用于抑制PKR反应的另外的活性剂包括IκB磷酸化抑制剂、IκB泛素化抑制剂IκB降解抑制剂、NFκB核转位抑制剂、NF-κB与κB应答元件相互作用的抑制剂。抑制细胞中序列不依赖性dsRNA反应的其它抑制剂包括牛痘病毒E3L的基因产物。E3L基因产物包含两个不同的结构域。保守的羧基末端结构域能结合dsRNA并抑制细胞的抗病毒dsRNA反应。E3L基因的至少该部分在宿主细胞中的表达或者使用多肽或其肽模拟物抗用于抑制广泛的dsRNA反应。胱天蛋白酶抑制使细胞对通过dsRNA的杀伤敏感。因此,胱天蛋白酶在细胞内的异位表达或活化可用于抑制广泛的dsRNA反应。
3.具体应用
以实例而非限制方式提到根据本发明的组合物和方法的应用:
3.1在植物生物技术中的应用
根据本发明的方法优选地用于植物生物技术目的以产生具有有利特性的植物。因此,可提高植物或其种子作为食品或饲料的适合性,例如通过改变代谢物的成分和/或含量,尤其是改变蛋白质、油、维生素和/或淀粉的成分和/或含量。同样可提高生长速率、产量或对生物或非生物应激因素的抗性。在植物生物技术领域的后续应用尤其是有利的。
本发明的另一方面涉及包含本发明嵌合RNA或表达所述嵌合RNA的表达构建体或表达载体的转基因植物或植物细胞。另一个实施方案中涉及根据本发明的转基因生物(例如转基因植物)和细胞、细胞培养物、衍生自它们的部分(例如在转基因植物的根、叶等等的情况下)和转基因繁殖材料(如种子或果实)用于生产食物或饲料、药物或精细化学品(如酶、维生素、氨基酸、糖、脂肪酸、天然或合成的调味剂、香料和着色剂)的用途。特别优选的是生产三酸甘油脂、脂类、油、脂肪酸、淀粉、维生素E和三烯生育醇以及类胡萝卜素。可被人和动物消耗的根据本发明的遗传修饰植物也可例如直接或经已知的加工之后用作粮食或饲料。
3.1.1高度特异性表达的植物靶基因
3.1.1.1.除草剂抗性
编码草铵膦乙酰转移酶(bar和pat)的基因、草甘膦耐受的EPSP合酶基因、编码草甘膦氧化还原酶的草甘膦降解酶基因gox、deh(编码钝化茅草枯的去卤化酶)、除草剂抗性(例如磺酰脲和咪唑啉酮)乙酰乳酸合酶和bxn基因(编码降解溴苯睛的腈水解酶)为用于转化的除草剂抗性基因的良好实例。Bar和pat基因编码钝化除草剂草铵膦并防止此化合物抑制谷胺酰胺合成酶的酶,草铵膦乙酰转移酶(PAT)。5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSP合酶)通常受除草剂N-(磷酰甲基)甘氨酸(草甘膦)抑制。然而,已知编码抗草甘膦的EPSP合酶基因。deh基因编码酶茅草枯去卤化酶并赋予其除草剂茅草枯抗性。bxn基因编码将溴苯睛转变成非除草剂降解产物的特异性腈水解酶。
为此应用,允许在绿叶中高特异性表达的miRNA-标签优选地用于设计miRNA标签。例如,在根和花中表达但在叶中不表达的拟南芥miR160b对此应用有利。
3.1.1.2昆虫抗性
本发明的一个重要方面涉及在植物中引入赋予昆虫抗性的基因。可引入的潜在昆虫抗性基因包括苏云金杆菌(Bacillus thuringiensis)结晶毒素基因或Bt基因(Watrud 1985)。Bt基因可提供鳞翅昆虫或鞘翅昆虫抗性,例如欧洲玉米螟(ECB)和谷物根虫(CRW)抗性。用于此类实施方案的优选Bt毒素基因包括CryIA(b)和CryIA(c)基因。影响昆虫生长或发育的苏云金杆菌其它物种的内毒素基因也可据此使用。蛋白酶抑制剂也可提供昆虫抗性(Johnson 1989)并因此在植物转化中有用。认为使用西红柿或马铃薯的蛋白酶抑制剂II基因,pinII尤其有用。甚至更有利的是与Bt毒素基因联合使用pinII基因,发明者已发现其组合作用以产生协同杀虫活性。也可使用编码昆虫消化系统抑制剂的其它基因或编码促进产生抑制剂的酶或辅因子的基因。该组实例为半胱氨酸蛋白酶抑制剂和淀粉酶抑制剂,例如小麦和大麦的半胱氨酸蛋白酶抑制剂和淀粉酶抑制剂。
同样,编码凝集素的基因可赋予额外或备选的杀虫剂特性。凝集素(最初称为植物凝集素)为具有凝集一系列物种的红血细胞能力的多价结合碳水化合物的蛋白质。最近鉴定凝集素为具有抗象鼻虫、ECB和根虫活性的杀虫活性剂(Murdock 1990;Czapla&Lang,1990)。认为有用的凝集素基因包括,例如大麦和小麦胚凝集素(WGA)和稻凝集素(Gatehouse 1984),其中WGA是优选的。
控制引入昆虫害虫时对昆虫发挥作用的大的或小的多肽的产生的基因(例如裂解肽、肽激素和毒素以及毒液)构成了本发明的另一方面。例如,认为直接针对特异性昆虫害虫的保幼激素酯酶的表达也可引起杀虫活性或可能造成变态的停止(Hammock 1990)。
表达编码影响昆虫外皮完整性的酶的基因的转基因植物还构成了本发明的另一方面。此类基因包括编码例如几丁酶、蛋白酶、脂酶的基因并且也包括产生华光霉素的基因(抑制几丁质合成的化合物),任何一个的引入都认为会产生抗昆虫的玉米植物。编码影响昆虫蜕皮活性的基因(如影响蜕皮甾类UDP-葡糖基转移酶的产生)也在本发明有用的转基因范围之内。
本发明也包括编码促进产生降低宿主植物对昆虫害虫的营养质量的化合物的酶的基因。例如也可以通过改变甾类组成赋予植物杀虫活性。甾类由昆虫从其摄食中获得并用于激素合成和膜稳定性。因此通过新基因(例如直接促进不需要的甾类产生的基因或将需要的甾类转变成不需要的形式的基因)的表达改变植物甾类组成可对昆虫生长和或发育具有负面作用并从而使植物杀虫活性。脂氧合酶为天然存在的表明对昆虫显示抗营养作用并降低其摄食质量的植物酶。因此,本发明的其它实施方案涉及可能抵抗昆虫进食的脂氧合酶活性提高的转基因植物。
本发明也提供了实现植物次级代谢物质量或数量改变的方法或组合物。一个实例涉及转化植物以产生DIMBOA,认为其会赋予对欧洲玉米螟、根虫和多种其它玉米昆虫害虫的抗性。尤其考虑用于这方面的候选基因包括位于bx基因座的已知参与合成DIMBOA途径的那些基因(Dunn 1981)。也考虑引入可调节玉米可凝性球蛋白(maysin)生产的基因和参与高粱蜀黍氰苷(dhurrin)生产的基因用于分别促进对耳虫(earworm)和根虫的抗性。
鸭茅状磨擦禾(Tripsacum dactyloides)为抗特定昆虫,包括谷物根虫的物种。预计可从磨擦禾属中分离编码对昆虫有毒的蛋白质的基因或参与对昆虫有毒的化合物的生物合成的基因并且这些新基因在赋予昆虫抗性中有用。已知磨擦禾属中昆虫抗性的基础是遗传的,因为所述抗性通过有性杂交转移到玉蜀黍中(Branson&Guss,1972)。
编码表明具有潜在杀虫活性的特征的蛋白质的其它基因也可据此用作转基因。此类基因包括例如可用作根虫拒食剂的豇豆胰蛋白酶抑制剂(CpTI;Hilder 1987)、编码证明作为谷物根虫拒食剂尤其有用的阿维菌素的基因(Campbell 1989;Ikeda 1987)、核糖体失活蛋白质基因、甚至是调节植物结构的基因。转基因玉米包括抗虫抗体基因和编码可将植物体外的非毒性杀虫剂(原杀虫剂)转化成植物体内的杀虫剂的酶的基因。
为此应用,优选使用如下miRNA标签来设计miRNA标签,所述miRNA标签是在为昆虫(或其它病原体)提供相互作用或进入位点的组织(例如表皮)中高度特异性表达的miRNA标签或对应于由昆虫或病原体诱导的应激因子所内源抑制的miRNA的miRNA标签。例如,玉米miR167主要在种子中表达,在表达杀虫分子的转基因构建体中使用Zm miR167标签可防止种子中此分子的渗漏表达。它们中的一些(例如凝集素)为潜在的人免疫原。
3.1.1.3环境或胁迫抗性
提高植物耐受各种环境胁迫,如但不限于干旱、过湿、寒冷、冷冻、高温、高盐和氧化胁迫的能力也可通过表达异源基因或过量表达同源基因实现。可根据通过引入“抗冻”蛋白质,例如Winter Flounder(Cutler 1989)中的那些或其合成的基因衍生物实现提高冷冻温度抗性的优势。耐寒性提高也可通过增强叶绿体中甘油-3-磷酸乙酰转移酶的表达获得(Murata 1992;Wolter 1992)。氧化胁迫抗性(常因例如寒冷与高光强度而加剧)可通过超氧化物岐化酶的表达获得(Gupta 1993),并可通过谷胱甘肽还原酶提高(Bowler 1992)。此类策略可允许在新出现的地区以及将晚熟高产变种发展成为相对早熟地区耐受冷冻。
表达帮助实现植物含水量、总水势、渗透势和膨压的新基因可增强植物耐受干旱的能力。如本文所使用,术语“抗旱性”和“干旱耐受”用于指与正常条件相比植物对水有效性降低诱导的胁迫的抗性或耐受增强,以及植物在低水环境中技能和存活能力提高和异相对较优的方式生活。在本发明的这个方面,例如编码渗透激活溶质生物合成的基因的表达可给予抗干旱保护。这类基因为编码甘露醇脱氢酶(Lee和Saier,1982)和海藻糖-6-磷酸合成酶(Kaasen 1992)的DNA。这些引入的基因会通过细胞中天然磷酸酶的随后作用或通过特异性磷酸酶的引入或共表达分别造成甘露醇或海藻糖的积累,两者都详细报道为能缓解胁迫效应的保护性化合物。已经证明了甘露醇在转基因烟草中积累并且最初结果表明表达高水平此种代谢物的植物能耐受所用的渗透胁迫(Tarczynski 1992)。
类似地,已经报道了其它代谢物在保护酶功能(例如alanopine或丙酸)或膜完整性(例如alanopine)中的效力(Loomis 1989),因此编码这些化合物生物合成的基因的表达可以与甘露醇类似或互补的方式提供抗旱性。在干旱和/或脱水中渗透有效和/或提供某种直接保护作用的天然存在代谢物的其它实例包括糖和糖衍生物,例如果糖、赤藓醇(Coxson 1992)、山梨醇、卫矛醇(Karsten 1992)、glucosylglycerol(Reed 1984;Erdmann 1992)、蔗糖、水苏糖(Koster&Leopold 1988;Blackman 1992)、芒柄醇和松醇(Vernon&Bohnert 1992),以及棉籽糖(Bernal-Lugo&Leopold 1992)。其它渗透有效的非糖溶质包括但不限于脯氨酸和甘氨酸-甜菜碱(Wyn-Jones andStorey,1981)。胁迫时连续的株冠生长和繁殖适度提高可通过控制上述渗透有效化合物和其它此类化合物(在一个典型实施方案中为肌醇0-甲基转移酶)的基因的引入和表达而增强。
考虑了特异性蛋白质的表达也可增强干旱耐受。基于结构相似性划分了三类晚期胚胎发生蛋白质(见Dure 1989)。在成熟的(即干的)种子中显示了这些蛋白质的所有三个类型。在这三类蛋白质中,一般在营养植物部分的干旱和/或脱水耐受中显示II型(dehydrin型)(例如Mundy和Chua,1988;Piatkowski 1990;Yamaguchi-Shinozaki 1992)。最近,发现烟草中III型LEA(HVA-1)的表达影响植物高度、成熟和干旱耐受(Fitzpatrick,1993)。所有三类蛋白质的结构基因的表达可因此提供干旱耐受。水胁迫中诱导的其它类型蛋白质包括硫醇蛋白酶、醛缩酶和跨膜转运蛋白(Guerrero 1990),其可在干旱胁迫中提供各种保护性和/或修复型功能。影响脂类生物合成并从而影响膜组成的基因的表达也可用于给植物提供抗旱性。
许多提高抗旱性的基因具有互补作用模式。因此,这些基因的组合可在提高玉米抗旱性中具有其它和/或协同作用。许多这些基因也提高耐冻性(或抗冻性);冷冻或干旱中发生的物理胁迫与天然类似并可以相似的方式缓解。可通过组成型表达这些基因提供优势,但表达这些新基因的优选方法可通过使用膨压诱导的启动子(例如Guerrero等,1990和Shagan 1993所述的膨压诱导基因的启动子)。这些基因的空间和时间表达模式可使玉米更好地耐受胁迫。
参与允许提高从干燥土壤中吸收水分的特异性形态性状的基因的表达是有益的。例如,改变根特性的基因的引入和表达可提高水摄入量。在胁迫时提高繁殖适度的基因的表达是很有意义的。例如,促进花粉排放和雌花部分即花丝接受同步性的DNA的表达是有益的。此外,在胁迫时使籽粒吸收最小化的基因的表达会增加收获的谷粒的数量并因此有价值。通过引入或表达异戊烯基转移酶基因与适当调节序列调节单子叶植物中(例如玉米)的细胞因子水平可提高单子叶植物抗胁迫性和产量(Gan 1995)。
根据水在决定产量中的全部作用,考虑到通过引入或表达新基因使植物能更有效地利用水分甚至会在土壤水分有效性没有限制时提高整体性能。通过引入促进植物在水有效性相关的全部胁迫中最大化利用水分的基因可实现产量性能的产量稳定性或一致性。
提高植物对抗非生物胁迫因素(例如干旱、热或寒冷)的保护也可通过例如过量表达短角床杜父鱼(Myoxocephalus Scorpius)(WO 00/00512)的抗冻多肽、Myoxocephalus octodecemspinosus、拟南芥转录激活因子CBF1、谷氨酸脱氢酶(WO 97/12983,WO 98/11240)、依赖钙的蛋白质激酶基因(WO 98/26045)、钙调神经磷酸酶(WO 99/05902)、酵母酪蛋白激酶(WO 02/052012)、法尼基转移酶(WO 99/06580;Pei ZM等,(1998)Science282:287-290)、铁蛋白(Deak M等,(1999)Nature Biotechnology17:192-196)、草酸氧化酶(WO 99/04013;Dunwell JM(1998)BiotechnGenetEng Rev 15:1-32)、DREB1A因子(“dehydration response element B1A”;Kasuga M等,(1999)Nature Biotech 17:276-286)、甘露醇或海藻糖合成的基因(例如海藻糖-磷酸合成酶或海藻糖-磷酸磷酸酶(WO 97/42326)或通过抑制基因例如海藻糖(WO 97/50561)实现。
为此应用,优选地使用如下miRNA标签设计miRNA标签,所述miRNA标签是允许在胁迫敏感性组织中(例如低龄幼苗或胚)中高度特异性表达的miRNA标签或对应于由胁迫因子内源抑制的miRNA的miRNA标签。
3.1.1.4抗病性
有人提出抗病性的提高可通过在植物生命周期中引入基因实现。可能产生病毒、细菌、真菌、根病原体、昆虫和线虫引起的疾病的抗性。也考虑到可通过表达引入的基因实现对产生真菌毒素的生物的控制。
对病毒的抗性可通过新基因的表达产生。例如,已经证明病毒被膜蛋白质在转基因植物中的表达会产生植物对病毒和其它密切相关病毒感染的抗性(Cuozzo 1988,Hemenway 1988,Abel 1986)。考虑到指向必需病毒功能的反义基因的表达可产生对所述病毒的抗性。例如,指向病毒核酸复制有关基因的反义基因可抑制所述复制并引起对病毒的抗性。有人相信通过使用反义基因干扰其它病毒功能也可提高对病毒的抗性。此外,有人提出可能通过其它方法实现对病毒的抗性,包括但不限于使用卫星病毒。
有人提出可通过引入新基因提高对细菌和真菌引起的疾病的抗性。考虑到编码所谓“肽抗生素”、病原体发生相关(PR)蛋白质、抗毒性和影响宿主-病原体相互作用蛋白质(例如形态发生特性)的基因是有用的。肽抗生素为抑制细菌和其它微生物生长的多肽序列。例如,称为杀菌肽和爪蟾抗菌肽的肽类型抑制许多细菌和真菌种类的生长。有人提出PR蛋白质在植物中的表达在提供对细菌疾病的抗性中有用。这些基因在病原体攻击宿主植物之后受到诱导并分成至少五类蛋白质(Bol 1990)。所包括的PR蛋白质为β-1,3-葡聚糖酶、几丁酶、渗透蛋白和其它认为在植物抗致病生物中发挥作用的蛋白质。已经鉴定了具有抗真菌特性的其它基因,例如UDA(荨麻凝集素)和hevein(Broakgert 1989;Barkai-Golan 1978)。已知特定植物疾病由光毒素的产生引起。对这些疾病的抗性可通过表达编码能降解或另外地失活光毒素的酶的新基因实现。表达改变宿主植物和病原体相互作用的新基因可用于降低致病生物侵染宿主植物组织的能力,例如增加叶角质层蜡质或其它形态特性。
植物寄生线虫能在许多植物中引起疾病。有人提出可能通过表达新基因使植物抗这些生物。估计可通过改变线虫识别或黏附宿主植物的能力和/或使植物产生杀线虫化合物(包括但不限于蛋白质)控制线虫感染。
此外,真菌、昆虫、线虫和疾病的抗性可通过定向积累特定代谢物或蛋白质实现。此类蛋白质包括但不限于硫代葡萄糖酸盐(防卫食草动物)、几丁酶或葡聚糖酶和其它破坏寄生虫细胞壁的酶、核糖体失活蛋白质(RIP)和植物受到伤害或微生物攻击或受到例如柳酸、茉莉酸或乙烯的化学伤害或攻击时诱导的其它植物抗性和胁迫反应蛋白质、或者非植物来源的溶酶体(如T4溶酶体或哺乳动物变种的溶酶体)、杀虫蛋白质(例如苏云金杆菌内毒素)、a-淀粉酶抑制剂或蛋白酶抑制剂(豇豆胰蛋白酶抑制剂)、凝集素s(例如小麦胚凝集素)、RNA酶或核糖体。其它实例为编码哈茨木霉(Trichoderma harzianum)chit42内几丁酶(GenBank登录号:S78423)或N-羟基化多功能性细胞色素P-450(CYP79)高粱双色蛋白质(GenBank登录号:U32624)或其功能等效物的核酸。硫代葡萄糖酸盐的积累作为针对昆虫的保护(Rask L等,(2000)Plant Mol Biol 42:93-113;Menard R等,(1999)Phytochemistry 52:29-35)、苏云金杆菌内毒素的表达(Vaeck等,(1987)Nature 328:33-37)或通过表达例如大豆的几丁酶s保护不受真菌的攻击(Broglie等,(1991)Science 254:1194-1197)是有利的。可通过表达雪花莲(Galanthus nivalis)凝集素实现对昆虫的抗性,例如对稻植物中稻昆虫褐飞虱(Nilaparvata lugens)的抗性(Rao等,(1998)植物J15(4):469-77)。编码鞘翅类特异性苏云金杆菌D-内毒素的合成的cryIA(b)和cryIA(c)基因的表达可在多种植物中引起对昆虫害虫的抗性(Goyal RK等,(2000)CropProtection 19(5):307-312)。适于病原体防御的其它靶基因包括“多聚半乳糖酸酶抑制蛋白质”(PGIP)、甜蛋白、蔗糖酶和抗微生物肽,例如乳铁蛋白(Lee TJ等,(2002)J Amer Soc Horticult Sci 127(2):158-164)。
为此应用,优选使用如下miRNA标签设计miRNA标签,所述miRNA标签是提供病原体相互作用或进入位点(例如表皮)组织中高度特异性表达的miRNA标签或对应于由病原体诱导的胁迫因子所内源抑制的miRNA的miRNA标签。例如,玉米miR167主要在种子中表达,在表达病原体分子的转基因构建体中使用Zm miR167可阻止种子中此类分子的渗漏表达。
3.1.1.5减少/消除真菌毒素
与植物相关真菌产生的真菌毒素,包括黄曲霉毒素和烟曲霉毒素是赋予谷粒无用性的一个显著特点。这些真菌生物不引起疾病症状和/或干扰植物生长,但是它们产生对动物有毒的化合物(真菌毒素)。抑制这些真菌的生长会减少这些毒素物质的合成并因此降低真菌毒素污染造成的谷粒损失。新基因可引入抑制真菌毒素合成而不干扰真菌生长的植物中。编码能赋予真菌毒素非毒性的新基因的表达可用于降低真菌谷粒污染。上面机制任何一个的结果都会减少谷粒上真菌毒素的存在。
为此应用,优选使用如下miRNA标签设计miRNA标签,所述miRNA标签是提供真菌病原体相互作用或进入位点(例如表皮)组织中高度特异性表达的miRNA-标签或对应于真菌病原体诱导的胁迫因子所内源抑制的miRNA的miRNA标签。备选地使用确保种子特异性提高或优选表达的miRNA标签。例如,玉米miR156在除种子外的任何位置表达,使用miR156标签可提高种子特异性表达。
3.1.1.6谷粒组成或质量
基因可引入稻植物中,尤其是商业上重要的谷类(例如玉米、小麦或稻)以改进谷类最初生长的谷粒。以这种方式产生的很多新基因可取决于谷粒的特定最终用途而考虑。
例如,玉米谷粒主要用于饲料或食品。引入改变谷粒组成的基因可大大提高饲料或食品价值。玉米谷粒的主要成分是淀粉、蛋白质和油。玉米谷粒的每一种主要成分可通过改变其水平或组成改进。为描述目的可提到多个实例但决不是提供可能性的全部列表。
许多谷类谷粒的蛋白质尤其当给猪、家禽和人食用时对饲料和食品目的不是最佳的。蛋白质缺少这些物种饮食中必需的数种氨基酸,需要加入谷粒的添加成分。有限的必需氨基酸可包括赖氨酸、甲硫氨酸、酪氨酸、苏氨酸、缬氨酸、精氨酸和组氨酸。一些氨基酸仅在谷粒补充用于饲料制剂的其它添加物(inputs)时成为限制性的。例如,当谷粒补充大豆餐以满足赖氨酸需要时甲硫氨酸就变成了限制的。种子和谷粒中这些必需氨基酸的水平可通过包括但不限于引入基因以增加氨基酸的生物合成、减少氨基酸降解、增加蛋白质中氨基酸的贮存或增加氨基酸稻种子或谷粒中的转运的机制提高。
增加氨基酸生物合成的一种机制是引入下调氨基酸生物合成通路的基因以使植物不再能适当控制产生的水平。这可通过下调或分支通常由通路的氨基酸终产物的水平调节的氨基酸生物合成通路中的步骤完成。实例包括引入编码增加赖氨酸和苏氨酸产生的天冬氨酸激酶或二氢吡啶二羧酸(DHDP)合成酶或者增加产生色氨酸的邻氨基苯甲酸合成酶的下调形式的基因完成。氨基酸分解代谢的降低可通过引入降低或消除编码分解通路中催化步骤的酶基因的表达的DNA序列完成,例如赖氨酸酮戊二酸合成酶。
可改变谷粒的蛋白质组成来以多种方式,包括提高天然蛋白质表达、降低劣质成分的表达、改变天然蛋白质的组成或引入编码全新蛋白质加工较优组成的基因改进氨基酸平衡。可引入降低贮存蛋白质的玉米醇溶蛋白家族成员表达的DNA。此DNA可编码核酶或反义序列可解偶联玉米醇溶蛋白蛋白质的表达或玉米醇溶蛋白表达调节因子的表达(例如opaque-2基因产物)。谷粒的蛋白质组成可通过共抑制现象修饰,即通过表达转化引入的相同结构基因或基因片段抑制内源基因的表达(Goring 1991)。此外,引入的DNA可编码降解玉米醇溶蛋白的酶。玉米醇溶蛋白表达降低的同时可以增加蛋白质所需氨基酸组成或增加其它主要种子成分(例如淀粉)。备选地,可引入包含适当氨基酸组成的天然蛋白质(例如球蛋白或10kD玉米醇溶蛋白之一)的编码序列嵌合基因或设计用来提高所述蛋白质表达的启动子或其它调节序列。所述基因的编码序列可包括必需氨基酸的其它或替换密码子。此外,可使用从另一物种获得的编码序列或者部分或完全的合成序列,其编码设计用来提高种子氨基酸组成的完全独特的肽序列。
引入改变谷粒油成分的基因是油价值的。油含量的增加可引起用于饲料和食品的种子的可代谢能和密度的增加。引入的基因可编码去除或减少脂肪酸或脂类合成中速率限制或调节的步骤。此类基因可包括但不限于编码乙酰辅酶A羧化酶、ACP-酰基转移酶、β-酮酰基-ACP合成酶的基因加上其它熟知的脂肪酸生物合成活动的基因。其它可能的为编码不具有酶促活性的蛋白质的基因,例如酰基载体蛋白质。其它实例包括2-乙酰转移酶、油质蛋白丙酮酸脱氢酶复合物、乙酰辅酶A合酶、ATP柠檬酸裂解酶、ADP葡萄糖焦磷酸化酶和肉毒碱-CoA-乙酰基-CoA穿梭的基因。估计油生物合成相关的基因的表达会用质体转移肽序列导向质体并优选地在种子胚中表达。可引入基因改变油中存在的脂肪酸的平衡提供更健康或有营养的饲料。引入的DNA也可编码阻断参与脂肪酸生物合成的酶的表达的序列改变谷粒中存在的脂肪酸的比例,例如下文所述。
可引入基因提高谷粒淀粉成分的营养价值,例如通过增加分支程度在奶牛中通过延迟其代谢改进淀粉利用。
除了影响谷粒的主要成分外,可引入基因影响用作饲料或食品的谷粒的多种其它营养成分、加工或其它质量方面。例如,可增加或降低谷粒的色素沉着。黄色素沉着的提高和稳定性在一些动物饲料中是需要的并可通过引入通过消除其产生过程中的速度限制步骤引起叶黄素和胡萝卜烯产量增加的基因实现。此类基因可编码八氢番茄红素合成酶、八氢番茄红素去饱和酶或番茄红素合成酶的改变形式。备选地,无色素白谷物是生产许多食品所需的并可通过阻断或消除色素生产通路中的步骤产生。
含有一些谷类谷粒的饲料或食品不具有充足的维生素量并且必须补充以提供适当的营养价值。可考虑引入提高种子中维生素生物合成的基因,包括例如,维生素A、E、B12、胆碱等。例如,玉米谷粒也不具有最佳营养价值的充足矿物成分。影响含磷、硫、钙、镁、锌和其它离子的积累或有效性的基因是有价值的。一个实例为引入减少肌醇六磷酸产生的基因或编码促进肌醇六磷酸分解的肌醇六磷酸酶的基因。这些基因会提高食物中可用磷酸的水平,减少补充矿物磷酸的需要。
可描述作为饲料和食物的谷类的改进的大量其它实例。改进可甚至不必需包括谷粒,但可例如改进用作青贮饲料的谷粒的价值。为完成改进引入的DNA包括改变木质素产生的序列,例如那些与家畜较优饲料价值相关的“brown midrib”表型。
除直接改进饲料或食物价值以外,也可引入改进谷粒加工和改进加工得到的产品的价值的基因。加工特定谷粒(例如玉米)的主要方法是通过湿磨。可通过表达提高加工效率和降低加工成本(例如通过减少浸泡时间)的新基因改进玉米。
改进湿磨产品的价值可包括改变淀粉、油、谷物谷蛋白粉或谷蛋白饲料成分。可通过鉴定和消除淀粉生物合成中的速率限制步骤或通过降低淀粉成比例增加引起的谷粒其它成分的水平实现淀粉的提高。前者的实例可为引入编码调节活性改变或以更高水平表达的的ADP葡萄糖焦磷酸化酶的基因。后者的实例可包括例如,在籽粒发育的晚期阶段表达的蛋白质或油生物合成选择性抑制剂。
淀粉的特性可通过改变直链淀粉与支链淀粉的比例、淀粉分子的大小或其分支形式有利地变化。通过这些改变可修饰一系列特性,其包括但不限于胶化温度、胶化热度、薄膜或糊剂的澄清度、流变特性等。为实现这些特性的改变,可单独或联合引入编码结合颗粒的或可溶淀粉合酶活性或分支酶活性的基因。DNA(如反义构建体)也可用于降低这些酶内源活性的水平。引入的基因或构建体可具有使其在淀粉生物合成和淀粉粒发育中的特异性间隔表达的调节序列。此外,建议引入和表达引起淀粉分子的葡萄糖部分体内分化或其它修饰的基因。可考虑任何分子的共价连接,仅受催化淀粉粒中适当底物分化和可用性的酶的限制。重要的分化的实例包括加入功能性基团,例如胺、羧基或磷酸基团,其提供随后体外分化的位点或通过引入离子电荷影响淀粉特性。其它修饰的实例包括葡萄糖单位的直接改变,例如缺失羟基或其氧化成乙醛或羧基。
油为谷物和其它谷粒的湿磨中的另一产品,其价值通过引入和表达基因得到改进。通过湿磨提取的油的数量可通过上述饲料和食品的方法提高。也可改变油的特性以改进其生产性能和烹饪油、酥油、润滑剂或其它油衍生产品的用途或在用于食品相关的应用时改进其健康益处。也可合成新的脂肪酸,其一经合成可用作化学合成的原料。可通过改变油中存在的脂肪酸的类型、水平或脂类排列实现油特性的改变。这反之可通过加入编码催化新脂肪酸和加工其的脂类的合成的酶的基因或通过在可能降低前体水平的同时增加天然脂肪酸的水平实现。备选地,可引入减慢或阻断引起前体脂肪酸中间物增加的脂肪酸合成步骤的DNA序列。可加入的基因包括去饱和酶、环氧酶、水解酶、脱水酶和催化利用脂肪酸中间物的反应的其它酶。可阻断的催化步骤的典型实例包括分别引起硬脂酸和油酸积累的从硬脂酸到油酸和油酸到亚麻酸的去饱和。
也可通过引入基因以获得新植物实现其它主要谷类湿磨产品、谷蛋白粉和谷蛋白饲料的改进。典型的可能性包括但不限于改进食品和饲料价值的那些改进。
此外,也考虑了用于产生或制造这样的有用化合物的植物,所述的有用化合物先前在植物中根本不产生或者不以同一水平产生。可通过转化方法引入或表达基因得到产生这些化合物的新植物。可能性包括但不限于任何生物目前产生的任何生物化合物,例如蛋白质、核酸、初级和中间代谢物、碳水化合物聚合物等。化合物可由植物产生、经收获和/或加工提取并可用于任何目前认为有用的目的,例如药物、香味剂(fragrances)、工业酶等等。
代表可能由转基因植物中引入的基因编码的一系列谷粒性状或特性的其它可能性包括谷粒的较差的易破碎性(用于出口目的)或当通过引入增强γ-玉米醇溶蛋白合成的基因干磨加工时较大的磨粉大小、通过增加果皮厚度基因具有改进的爆裂、质量和膨胀体积的爆裂谷粒、具有通过引入有效阻断参与色素产生通路的酶用于食物目的较白的谷粒的谷物和酒精饮料质量的改进或通过引入影响味道的基因的甜谷物,例如甜谷物的皱缩基因(编码蔗糖合成酶)。
为进行基于种子的应用,可使用确保增强种子特异性或可能表达的miRNA标签。
3.1.1.7块茎或种子组成或质量
可尤其在种子中或块茎中有利地表达多种性状以改进组成或质量。此类性状包括但不限于:
-表达用于食物-饲料部分的代谢酶,例如表达肌醇六磷酸酶s和纤维素酶。特别优选的为核酸,例如编码微生物肌醇六磷酸酶或其功能性等效物的人工cDNA(GenBank登录号:A19451)。
-表达引起精细化合物积累的基因,例如维生素E、三烯生育醇或类胡萝卜素的基因的表达。实例为八氢番茄红素去饱和酶。优选的为编码喇叭水仙(Narcissus pseudonarcissus)八氢番茄红素去饱和酶(GenBank登录号:X78815)或其功能性等效物的核酸。
-通过表达脂肪酸延长酶和/或去饱和酶产生营养制品,例如,多不饱和脂肪酸(例如精胺琥珀酸、十二碳五烯酸或二十二碳六烯酸),或者产生营养价值提高的蛋白质,例如必需氨基酸含量高的蛋白质(例如巴西坚果的高甲硫氨酸2S白蛋白基因)。优选的为编码巴西坚果(Bertholletiaexcelsa)高甲硫氨酸2S白蛋白(GenBank登录号:AB044391)、展叶剑叶藓(Physcomitrella patens)Δ6-酰基-脂去饱和酶(GenBank登录号:AJ222980;Girke等,(1998)植物J 15:39-48)、高山被孢霉(Mortierellaalpina)Δ6-去饱和酶(Sakuradani等,1999基因238:445-453)、秀丽隐杆线虫(Caenorhabditis elegans)Δ5-去饱和酶(Michaelson等,1998,FEBSLetters 439:215-218)、秀丽隐杆线虫Δ5-脂肪酸去饱和酶(des-5)(GenBank登录号:AF078796)、高山被孢霉Δ5-去饱和酶(Michaelson等,JBC 273:19055-19059)、秀丽隐杆线虫Δ6-延长酶(Beaudoin等,2000,PNAS 97:6421-6426)、展叶剑叶藓Δ6-延长酶(Zank等,2000,Biochemical Society Transactions 28:654-657)或其功能性等效物的核酸。
-为工业目的或作为药物(如抗体、血液凝固因子、干扰素、淋巴因子、集落刺激因子、纤溶酶原活化因子、激素或疫苗,如Hood EE,JilkaJM(1999)Curr Opin Biotechnol 10(4):382-6;Ma JK,Vine ND(1999)Curr Top Microbiol Immunol 236:275-92中所述)产生高质量蛋白质和酶。例如,已经可能在转基因玉米植物中大规模生产鸡白蛋白的重组卵白素和生产细菌b-葡糖醛酸糖苷酶(GUS)(Hood等,(1999)Adv Exp MedBiol 464:127-47.综述)。
-例如通过表达乙酰辅酶A羧化酶在增加这些物质产量的目的下实现细胞中贮存能力提高,其通常包括较少的贮存蛋白质或贮存脂类。优选的核酸为编码紫花苜蓿(Medicago sativa)乙酰辅酶A羧化酶(ACCase)(GenBank登录号:L25042)或其功能型等效物的核酸。
-α-葡聚糖L型块茎磷酸酶(GLTP)或优选地马铃薯块茎中的α-葡聚糖H型块茎磷酸酶(GHTP)酶活性(见US 5,998,701)水平降低。显示GLTP或GHTP酶活性降低的块茎中马铃薯块茎中淀粉稻糖的转变减少,尤其是在低于7℃的温度贮存时减少。马铃薯中低温糖化的减少允许马铃薯在更低温度贮存,引起休眠延长、患病率降低和贮存时间延长。马铃薯块茎中GLTP或GHTP活性的降低可通过此类技术完成,如用同源反义或双链RNA抑制基因表达、使用共抑制、调节沉默序列。冷冻贮存特性改进的马铃薯植物,包含用具有可操作地与DNA序列连接的TPT启动子序列表达盒转化的马铃薯植物,其中所述的DNA序列包含编码-葡聚糖磷酸酶的基因的至少20个核苷酸,所述的-葡聚糖磷酸酶选自-葡聚糖L型块茎磷酸酶(GLTP)和-葡聚糖H型磷酸酶(GHTP)。
例如Dunwell JM,Transgenic approaches to crop improvement,J ExpBot.2000;51 Spec No;487-96页中提到了有利基因的其它实例。
为进行基于种子的应用,可使用确保提供种子或块茎特异性或优选表达的miRNA标签。例如,玉米miR156在种子之外的任何位置表达,用miR156标签可提高种子特异性表达。
3.1.1.8植物农学特性
决定植物种植地点的两个因素是生长季节的平均日温度和霜冻间的时间。在可能种植特定植物的区域有各种允许生长稻成熟和收获的最长时间限制。根据其成熟并在最大可能产量所需时间内干燥到可收获水含量的能力选择在特定区域种植的植物。因此,为不同的种植地区开发了不同成熟能力的植物。除充分干燥以允许收获的需要外还需要在田间发生最大程度干燥以使收获后额外干燥所需能量最少。同样,谷粒干燥越容易,生长和籽粒灌浆的时间越长。可鉴定影响成熟和/或干燥的基因并用转化技术引入植物系中以建立适应不同种植地区和相同种植地区但收获时产量与湿度比例提高的新变种。调节植物发育的基因的表达尤其有用,例如植物中鉴定的liguleless和rough sheath基因。
基因可引入适应性和其它植物生长特性提高的植物中。例如,表达赋予更强壮的茎、发达的根系,或者防止或减少掉穗的新基因对谷物农民有重要意义。引入和表达通过例如增强光分布和/或中止增加光同化作用总量的基因时有利的。此外,表达增强光合成和/或叶幕的效率基因还会增加产量。此外方法允许增加田地粒的植物群体。
晚季营养衰老的延迟会增强同化产物流入谷粒并从而增加产量。在植物中过量表达“持绿(stay green)”相关的基因或表达延迟衰老的任何基因是有利的。例如,在草甸羊茅(Festuca pratensis)中鉴定了非黄花突变体(Davies 1990)。此基于及其它基因的表达可防止叶绿体的早熟分解并从而维持株冠功能。
3.1.1.9营养利用
利用可用营养物和矿物质的能力是许多植物生长的限制因素。有人提出可能改变营养摄入、耐受极限pH、通过植物的固定、贮存库和通过引入新基因的代谢活性。这些修饰会允许植物更有效地利用可利用营养物。认为例如通常存在与植物中并参与营养利用的酶的活性的增强会增强营养的利用。此种酶的实例为肌醇六磷酸酶。也认为新基因的表达可使曾经不可利用的营养来源可利用,例如将具有营养价值的成分从更复杂的分子中(可能是大分子)中释放。
为进行基于种子的应用,可使用确保提高种子特异性或优选表达的miRNA标签。例如,玉米miR156在除种子外的任何位置表达,使用miR156标签可提高种子特异性表达。
3.1.1.10雄性不育
雄性不育用于生产杂交种子。有人提出雄性不育可通过表达新基因产生。例如,已经表明编码干扰雄花序和/或配子体发育的蛋白质的基因的表达造成雄性不育。已经证明转基因烟草和油菜的花药中表达的嵌合核糖核酸酶基因导致雄性不育(Mariani 1990)。例如,在玉米中发现了大量赋予胞质雄性不育的突变。称为T胞质的一个突变尤其与南方谷物叶枯萎病的敏感性有关。鉴定了称为TURF-13(Levings 1990)的DNA序列与T胞质相关。可能通过转化引入TURF-13来分离雄性不育与疾病敏感性。因为为繁殖目的和谷粒生产必需能恢复雄性育性,所以有人提出可引入编码雄性育性恢复的基因。
为进行此应用,可使用确保谷粒特异性或优选表达的miRNA标签。
3.1.2用于高度特异性基因沉默的植物靶基因
为表达影响植物表型但不翻译成蛋白质的RNA转录本可在植物中引入DNA。两个实例为反义RNA和具有核酶活性的RNA。两者都可能在或消除内源或引入的植物基因中发挥可能的作用。
当转录、产生育靶信使RNA完全或部分互补的反义RNA或双链RNA时的基因可以是构建的或分离的。反义RNA减少信使RNA多肽产物的产生。多肽产物可以是植物基因组编码的蛋白质。前面提到的基因可称为反义基因。因此可通过转化方法在植物中引入反义基因以产生所选目的蛋白质表达降低的新转基因植物。例如,蛋白质可以是催化植物中反应的酶。酶活性的降低可减少或消除包括植物中酶促合成化合物的反应产物,例如脂肪酸、氨基酸、碳水化合物、核酸等。备选地,蛋白质可以是贮存蛋白质(如玉米醇溶蛋白)或结构蛋白质,其表达减少可分别引起种子氨基酸组成的改变或植物形态变化。上面提到的可能以实例方式提供并不代表所有的应用。
尤其优选通过本发明的一个表达盒表达反义RNA或双链RNA。表达正义RNA也可用于基因沉默(共抑制)。此RNA优选地为非翻译RNA。双链RNA(“双链RNA干扰”;dsRNAi)对基因的调节为本领域所熟知并在各种生物包括植物中描述(例如Matzke 2000;Fire A等,1998;WO 99/32619;WO 99/53050;WO 00/68374;WO 00/44914;WO 00/44895;WO 00/49035;WO 00/63364)。
当转录产生作为内切核糖酶发挥作用并催化切割具有所选序列的RNA分子的RNA酶时基因可以是构建的或分离的。切割所选信使RNA可降低其编码多肽产物的产生。这些基因可用于制备带有其的新转基因植物。转基因植物可具有水平降低的多肽,包括但不限于上面提到的反义RNA影响的多肽。
也可能引入基因以产生通过共抑制机制产生的内源基因表达降低的新转基因植物。已经证明在烟草、西红柿和矮牵牛中(Goring 1991;Smith 1990;Napoli 1990;van der Krol 1990)内源基因正义转录物的表达会以观察到的反义基因的类似方式降低或消除内源基因的表达。引入的基因可编码全部或部分靶内源蛋白质,但是可能不需要其转录来降低那一内源蛋白质的水平。
所述的可能靶基因理解为实例而非限制。
3.1.2.1对非生物胁迫因素(炎热、寒冷、干旱、适度增加、环境毒素、UV射线)的保护增强。优选地降低参与胁迫反应的基因的表达。
为进行此应用,可使用这样的miRNA标签设计miRNA标签,所述miRNA标签是允许在敏感组织(低龄幼苗、胚)中特异性表达增强的miRNA标签或对应于胁迫因素内源抑制的miRNA的miRNA标签。
3.1.2.2修饰脂肪酸、脂类或油的组成和/或含量
油料作物(例如油菜或向日葵)中脂肪酸含量或脂肪酸组成的修饰优选地的例如如下进行:通过降低脂肪酸生物合成基因的基因表达,优选地降低选自编码乙酰转酰基酶、酰基转运蛋白质(“酰基载体蛋白”)、去饱和酶(例如硬脂酰去饱和酶或微粒体D12-去饱和酶)、尤其是Fad2-1基因、丙二酰转酰基酶、β-酮脂酰-ACP合成酶、3-酮-ACP还原酶、烯酰基-ACP水解酶、硫酯酶例如酰基-ACP硫酯酶)、烯酰基-ACP还原酶。描述了修饰脂类组成的各种其它有利方法(Shure M等,(1983)细胞35:225-233;Preiss等,(1987)Tailoring gene for Crop Improvement(Bruening等编辑),Plenum Press,S.133-152;Gupta等,(1988)Plant Mol Biol.10:215-224;Olive等,(1989)Plant Mol Biol 12:525-538;Bhattacharyya等,(1990)Cell60:155-122;Dunwell JM(2000)J Exp Botany 51Spec No:487-96;Brar DS等,(1996)Biotechgenet Eng Rev 13:167-79;Kishore GM和Somerville CR(1993)Curr Opin Biotech 4(2):152-8)。尤其优选的是Fad2基因(例如Genbank登录号:AF124360(埃塞俄比亚芥(Brassica carinata))、AF042841(芜青(Brassica rapa))、L26296(拟南芥)、A65102(欧洲榛(Corylus avellana))所述的)。描述了修饰脂类含量的其它有利基因和方法,例如US 5,530,192和WO 94/18337。脂类含量的提高可通过降低淀粉含量实现,例如作为碳水化合物代谢的酶(例如ADP葡萄糖磷酸酶)表达降低的结果出现。
为进行此应用,优选地用允许种子中特异性表达增强的miRNA标签设计miRNA标签。例如,玉米miR156在除种子外的任何位置表达,使用miR156标签可增强种子特异性表达。
3.1.2.3修饰碳水化合物组成
修饰碳水化合物组成可通过例如降低碳水化合物代谢基因或碳水化合物生物合成基因(例如淀粉、果胶质、纤维素或细胞壁碳水化合物的基因)的基因表达实现。从而可以有利的方式影响许多细胞过程(成熟、贮存、淀粉组成或淀粉含量)。以实例而非限制方式提到的靶基因为磷酸酶、淀粉合成酶、Q酶、蔗糖-6-磷酸合成酶、蔗糖-6-磷酸磷酸酶、ADP-葡萄糖焦磷酸酶、分支酶、去分支酶和各种淀粉酶。描述了相应的基因(Dunwell JM(2000)J Exp Botany 51Spec No:487-96;Brar DS等,(1996)Biotechgenet Eng Rev13:167-79;Kishore GM and Somerville CR(1993) Curr Opin Biotech4(2):152-8)。影响碳水化合物代谢尤其是淀粉代谢的有利基因在WO92/11375、WO 92/11376、US 5,365,016和WO 95/07355中描述。
为进行此应用,优选地用允许种子中特异性表达增强的miRNA标签设计miRNA标签。例如,玉米miR156在除种子外的任何位置表达,使用miR156标签可增强种子特异性表达。
3.1.2.4修饰颜色或色素形成
修饰颜色或色素形成,优选地修饰观赏植物,可通过例如降低黄酮类生物合成基因(如查耳酮合成酶、查耳酮异构酶、苯丙氨酸氨分解酶的基因)、脱氢山奈酚(黄酮)羟基酶(例如二氢黄酮3-羟基酶或二氢黄酮2-羟基酶)、二氢黄酮醇还原酶、二氢黄烷醇2-羟基酶、类黄酮3’-羟基酶、类黄酮5’-羟基酶、类黄酮糖基转移酶(例如葡萄糖基转移酶,例如UDPG:类黄酮3-O-葡萄糖基转移酶、UDPG:黄酮醇7-O-葡萄糖基转移酶或鼠李糖基转移酶)、类黄酮甲基转移酶(如AM:花青素-3-(对-香豆酰)芸香糖苷-5-葡萄糖苷-3’,5’-O-甲基转移酶)和黄酮类酰基转移酶的基因表达实现(Hahlbrock(1981)Biochemistry of Plant,第7卷,Conn编辑;Weiring and de Vlaming(1984)“Petunia”,KC Sink编辑,Springer-Verlag,New York)。尤其适合的是EP-A1 522 880中所述的序列。
为进行此应用,优选地用允许在花和其部分中特异性表达增强的miRNA标签设计miRNA标签。例如,稻miR156I在根和枝中表达,使用miR156I可增强花中目的基因的特异性表达。
3.1.2.5.降低贮存蛋白质含量
编码贮存蛋白质(下文称作SP)的基因的基因表达降低具有许多好处,例如,降低变应原可能性或修饰其它代谢物的组成或数量。EP-A 0 591 530、WO 87/47731、WO 98/26064、EP-A 0 620 281;Kohno-Murase J等,(1994)Plant Mol Biol 26(4):1115-1124中描述了贮存蛋白质。SP用于贮存碳、氮和硫,其为种子或谷粒萌芽的快速异养生长所需。在大多数情况下,其不具备酶促活性。在种子发育过程中SP仅在胚中合成并在此过程中首先在胚或胚乳中积累差异分化细胞的蛋白质贮存泡(PSV)。贮存蛋白质可基于其它特性如其沉降系数或在不同溶液中(水、盐水、乙醇)的溶解性分成亚组。可以技术人员熟悉的方式通过超速离心测定沉降系数(例如Correia JJ(2000)Method in Enzymology 321:81-100所述)。总之,可根据其序列分成四个大的贮存蛋白质基因家族:2S白蛋白(napin-like)、7S球蛋白(豆菜蛋白样)、11S/12S球蛋白(豆球蛋白/cruciferin-like)和玉米谷醇溶蛋白。
2S白蛋白在双子叶植物在种子中广泛存在,包括重要的商业化植物家族,例如豆科(例如大豆)、十字花(例如油菜)、大戟科(例如蓖麻油植物)或菊科(例如向日葵)。2S白蛋白具有保守半胱氨酸残基的致密球状,其经常形成异二聚体。7S球蛋白以三聚体形式出现并且不含半胱氨酸残基。合成之后,它们象2S白蛋白的情况一样被切割成小片段并被糖基化。尽管多肽大小不同,不同的7S球蛋白是高度保守的并可能象2S白蛋白的情况一样追踪到共有的前体蛋白质。只有少量的7S球蛋白存在于单子叶植物中。在双子叶植物中,它们总是少于11S/12S球蛋白。除2S白蛋白外,11S/12S球蛋白构成了双子叶植物中主要的贮存蛋白质。不同植物种类的不同11S球蛋白的高度相似性从而允许推导出进化中的共有前体蛋白质。贮存蛋白质优选地选自2S白蛋白(napin-like)、7S球蛋白(豆菜蛋白样)、11S/12S球蛋白(豆球蛋白/cruciferin-like)或玉米谷醇溶蛋白。特别优选的11S/12S球蛋白优选地包含油菜、大豆和拟南芥、向日葵、亚麻籽、芝麻、红花、橄榄树、大豆或多种坚果种类的11S球蛋白。特别优选的玉米谷醇溶蛋白优选地包括单子叶植物植物的,尤其是玉米、稻、燕麦、大麦或小麦的玉米谷醇溶蛋白。
为进行此应用,优选地用允许种子中特异性表达增强的miRNA标签设计miRNA标签。例如,玉米miR156在除种子外的任何位置表达,使用miR156标签可增强种子特异性表达。
3.1.2.6.获得植物病原体抗性
本发明的方法尤其适于在真核生物细胞或生物,尤其是植物细胞和植物中获得病原体(例如病毒或线虫)抗性。预期在宿主生物(例如植物)中转录产生的嵌合RNA分子(或衍生自其的dsRNA分子)可扩散到整个生物。因此可能降低核酸在植物的非转基因幼枝(移植到包含本发明嵌合基因的转基因原种上)的细胞中的表型表达(或反之亦然),这是一种对园艺学、栽培学或果实产生而言重要的方法。
植物病原体抗性,例如蜘蛛、真菌、昆虫、线虫、原生动物、病毒、细菌和疾病的抗性可通过降低特定病原体生长、存活、特定发育阶段(例如化蛹)或繁殖必需的基因的基因表达实现。适当的降低可引起上述步骤的完全抑制,但也同样延迟。这可以是例如,允许病原体进入的植物基因,但是也可以是病原体同源基因。优选地,嵌合RNA(或衍生自其的dsRNA)直接针对病原体的基因。例如,植物可用适当的上述活性剂制剂处理,例如向植物喷雾或洒粉尘,然而也可包括转基因生物形式的活性剂并将它们传递到病原体,例如胃毒剂形式。多种病原体的必需基因为技术人员已知(例如线虫抗性:WO 93/10251、WO 94/17194)。
因此本发明的一个方面提供了抑制的靶基因编码植物病原体(例如昆虫或线虫)蛋白质的方法。在一个方面,方法包括在病原体靶向植物的基因组中引入一个核酸构建体,其包含病原体(例如昆虫或线虫)摄食或感染所述植物的细胞时转录成能成能降低病原体中靶基因表达的至少一个dsRNA分子的嵌合RNA的DNA。在优选的实施方案中,基因抑制对病原体是致死的。
最优选的病原体是真菌病原体,例如致病疫霉(Phytophthorainfestans)、雪腐镰孢(Fusarium nivale)、禾本科镰孢(Fusariumgraminearum)、大刀镰孢(Fusarium culmorum)、尖镰孢(Fusariumoxysporum)、Blumeria graminis、Magnaporgrisea、Sclerotinia sclerotium、颖枯壳针孢(Septoria nodorum)、小麦壳针孢(Septoria tritici)、芸苔链格孢(Alternaria brassicae)、黑胫茎点霉(Phoma lingam);细菌病原体,例如坏腐棒杆菌(Corynebacterium sepedonicum)、胡萝卜软腐欧文氏菌(Erwiniacarotovora)、解淀粉欧文氏菌(Erwinia amylovora)、疮痂病链霉菌(Streptomyces scabies)、丁香假单胞菌烟草变种(Pseudomonas syringae pv.Tabaci)、丁香假单胞菌栖菜豆变种(Pseudomonas syringaepv.phaseolicola)、丁香假单胞菌番茄变种(Pseudomonas syringae pv.tomato)、Xanthomonas campestris pv.Malvacearum和Xanthomonascampestris pv.Oryzae和线虫,例如金线虫(Globodera rostochiensis)、苍白球胞囊线虫(G.pallida)、甜菜胞囊线虫(Heterodera schachtii)、禾谷胞囊线虫(Heterodera avenae)、鳞球茎线虫(Ditylenchus dipsaci)、小麦粒线虫(Anguina tritici)和北方根结线虫(Meloidogyne hapla)。
病毒抗性可通过例如降低病毒被膜蛋白质、病毒复制酶、病毒蛋白酶等的表达获得。技术人员抑制大量植物病毒和适当靶基因。本发明的方法和组合物尤其用于获得线虫抗性植物(靶基因,见例如WO 92/21757、WO93/10251、WO 94/17194)。
本发明也提供了获得病原体抗性生物,尤其是病原体抗性植物的方法,其包括给生物的细胞提供本发明的嵌合RNA分子,所述嵌合RNA分子能在真核生物细胞中提供至少部分双链RNA分子,所述嵌合RNA分子包括:
a)至少一个第一核糖核苷酸序列,其与病原体至少一个基因的至少部分靶核苷酸序列基本上相同,
b)至少一个第二核糖核苷酸序列,其与所述第一核苷酸序列基本互补并且能与所述第一核苷酸序列杂交形成双链RNA结构,
c)至少一个第三核糖核苷酸序列,其位于所述第一和所述第二核糖核苷酸序列之间,包含至少一个可去除的RNA元件,其可通过真核生物细胞的RNA加工机制去除,而不经随后分别与包含所述第一和所述第二核糖核苷酸序列的序列共价连接。
优选地,所述第一核糖核苷酸序列与病原体基因组的至少部分核苷酸序列具有65-100%的序列同一性,优选地75-100%、更优选地85-100%、最优选地95-100%的序列同一性。更优选的病原体选自病毒、细菌、真菌和线虫。
为进行此应用,优选地使用允许在组织中特异性表达、作为病原体(例如表皮)进入位点的miRNA标签或对应于病原体诱导型胁迫内源抑制的miRNA标签设计miRNA标签。
3.1.2.7.  防止茎损伤
茎损伤已感性降低可通过例如降低碳水化合物代谢(见上文)的基因的基因表达。描述了有利的基因(WO 97/13865)并包括组织特异性多聚半乳糖醛酸酶或纤维素酶。
为进行此应用,优选地用允许在茎中特异性表达增强的miRNA标签设计miRNA标签。例如,玉米miR166在叶和雄花穗中表达,使用miR166标签可增强茎中目的基因的特异性表达。
3.1.2.8.延迟果实成熟
延迟果实成熟可通过例如降低选自多聚半乳糖醛酸酶、果胶酯酶、β-(1-4)葡聚糖酶(纤维素酶)、β-半乳聚糖酶(β-半乳糖苷酶)的基因或乙烯生物合成的基因(例如1-氨基环丙烷-1-羧化物合成酶)、类叶红素生物合成的基因(例如,前八氢番茄红素)或八氢番茄红素生物合成的基因(例如八氢番茄红素去饱和酶)的基因表达实现。其它有利基因为例如WO 91/16440、WO 91/05865、WO 91/16426、WO 92/17596、WO 93/07275或WO 92/04456、US 5,545,366。
为进行此应用,优选地使用允许果实中特异性表达增强的miRNA标签设计miRNA标签。
3.1.2.9.获得雄性不育。适当的靶基因为WO 94/29465、WO89/10396、WO 92/18625中所述的基因。降低植物细胞中转基因的表型表达的特别应用已经描述了恢复雄性育性,后者通过引入包含雄性不育DNA的转基因获得(WO 94/09143、WO 91/02069)。目的核酸尤其是雄性不育DNA。
为进行此应用,优选地用允许在谷粒中特异性表达增强的miRNA标签设计miRNA标签。
3.1.2.10.减少不需要或毒性植物成分,例如硫代葡萄糖酸。尤其在WO97/16559中描述了适当的靶基因。为进行此应用,优选地用允许在种子中特异性表达增强的miRNA标签设计miRNA标签。例如玉米miR156在除种子外的任何位置表达,使用miR156标签可增强种子特异性表达。
3.1.2.11.延迟衰老综合征。适当的靶基因尤其为桂皮烯醛基-CoA:NADPH还原酶或桂皮烯醛基乙醇脱氢酶。其它靶基因尤其在WO95/07993中描述。
3.1.2.12.修饰三种主要物种中的木质化和/或木质素含量。适当的靶基因尤其在WO 93/05159、WO 93/05160中描述。
3.1.2.13.通过降低咖啡酸O-甲基转移酶或桂皮烯醛基乙醇脱氢酶的表达修饰粮食中,优选地种子中的纤维含量。
3.1.2.14.修饰棉花的纤维质量。适当的靶基因尤其在US 5,597,718中描述。
3.1.2.15.通过例如多酚氧化酶(WO 94/03607)等降低例如马铃薯的损伤易感性。
3.1.2.16.例如通过降低高龙胆酸烟分解代谢通路的基因表达(例如,尿黑酸1,2-双加氧酶(HGD;EC No.:1.13.11.5)、马来酰-乙酰乙酸异构酶(MAAI;EC No.:5.2.1.2.)或延胡索酰乙酰乙酸水解酶(FAAH;EC No.:3.7.1.2))促进维生素E的生物合成。
3.1.2.17.通过降低例如,N-甲基-腐胺氧化酶和腐胺N-甲基转移酶的表达降低例如烟草中的尼古丁含量。
3.1.2.18.通过降低咖啡因生物合成的基因,例如7-甲基黄嘌呤3-甲基转移酶的基因表达降低咖啡豆中(例如咖啡树)的咖啡因含量。
3.1.2.19.通过降低生物合成的基因,例如1-甲基黄嘌呤3-甲基转移酶的基因表达降低茶(Camellia sinensis)中的胆茶碱含量。
3.1.2.20.通过例如降低苏氨酸合成酶的表达减少苏氨酸生物合成来增加甲硫氨酸含量(Zeh M等人,(2001)Plant Physiol 127(3):792-802)。
本发明的其它方法和化合物可用于获得shatter抗性(WO 97/13865)、用于获得修饰的花色形式(EP 522 880,US 5,231,020)、用于减少生物中不需要的(次生)代谢物(例如硫代葡萄糖酸盐(WO97/16559))或植物中的叶绿素含量(EP 779 364)、用于通过代谢加工(例如降低参与碳水化合物代谢(WO 92/11375,WO 92/11376,US 5,365,016,WO 95/07355)或脂类生物合成(WO 94/18337,US 5,530,192)的特定基因的表达)修饰真核生物细胞或生物中的代谢物合成模式等。有利基因的其它实例在例如Dunwell JM,Transgenic approaches to crop improvement,J Exp Bot.2000;51 Spec No;487-96页中提到。
每一个上述应用可单独使用。一般地,也可能同时使用一种以上的上述方法。如果在本文中使用所有方法,至少两个上述靶基因的表达会降低。在本文中,这些靶基因可来源于优选用于或另外地分成不同使用组的单个基因组。
3.1.3植物转化和表达技术
可用常规重组DNA技术在植物细胞中表达本发明的嵌合RNA。通常,这包括用本领域已知的标准克隆方法在表达构建体或表达载体中插入编码本发明嵌合RNA。
3.1.3.1.构建植物表达构建体的需要
表达构建体或本发明的表达构建体包含可操作地与编码本发明嵌合RNA的核酸序列连接的一个或更多个遗传控制序列(调节序列)。这些遗传控制序列调节宿主细胞中嵌合RNA的表达。遗传控制序列在例如“Goeddel;Gene Expression Technology:Method in Enzymology 185,Academic Press,San Diego,CA(1990)”或“Gruber and Crosby,in:Methodin Plant Molecular Biology and Biotechnolgy,CRC Press,Boca Raton,Florida,Glick和Thompson编,第7章,89-108”和其中引用的参考文献中描述。意在植物中表达的序列首先可操纵地与植物中有功能的适当启动子连接。此类表达构建体任选地包括转基因表达所需或所选的其它序列。此类序列包括但不限于转录终止子、增强表达的外源序列。这些表达构建体可容易地转到上文所述的植物转化载体中。
3.1.3.1.1.启动子
编码本发明嵌合RNA的核酸序列优选地可操作地与植物特异性启动子连接。术语“植物特异性启动子”主要指植物或植物部分、植物细胞、植物组织、植物培养物中能控制基因表达的任何启动子,尤其是外源核酸序列或基因。在本文中,所述植物特异性启动子的表达特异性可为例如组成型、组织特异性、诱导型或发育特异性。下列是优选的:
3.1.3.1.1.1组成型启动子
当需要转基因植物或其它生物所有组织中的基因表达时可使用“组成型”启动子,其一般在大多数环境条件和发育状态或细胞分化阶段有活性。有用的植物启动子也包括从Ti或Ri质粒、植物细胞、植物病毒或启动子在植物中发挥作用的其它生物的启动子。因此适于用于本发明方法的在植物中发挥作用的细菌启动子包括章鱼氨酸合成酶启动子、胭脂碱合酶启动子和甘露氨酸合成酶启动子。控制本发明嵌合RNA(和/或选择标记)的表达的启动子可为组成型。用于植物的适当组成型启动子包括例如花椰菜花叶病毒(CaMV)35S转录起始区域(Franck等,(1980)Cell 21:285-294;Odell等,(1985)Nature 313:810-812;Shewmaker等,(1985)Virology 140:281-288;Gardner等,(1986)Plant Mol Biol 6:221-228)、19S转录其实区域(US5,352,605和WO 84/02913)、VI启动子区域、衍生自根癌农杆菌T-DNA的1’或2’启动子和本领域技术人员抑制的在植物细胞中有活性的其它启动子。其它适当启动子包括玄参花叶病毒的全长转录本启动子、肌动蛋白启动子(例如稻肌动蛋白启动子;McElroy等,(1990)Plant Cell 2:163-171)、组蛋白启动子、微管蛋白启动子或甘露氨酸合成酶启动子(MAS)。其它组成型植物启动子包括各种泛蛋白或多聚泛蛋白启动子(Sun and Callis(1997)Plant J 11(5):1017-1027,Cristensen等,(1992)Plant Mol Biol 18:675-689;Christensen等,(1989)Plant Mol.Biol.12:619-632;Bruce等,(1989)ProcNatl Acad Sci USA 86:9692-9696;Holtorf等,(1995)Plant Mol Biol29:637-649)、mas、Mac或DoubleMac启动子(US 5,106,739;Comai等,(1990)Plant Mol Biol 15:373-381)、泛蛋白启动子(Holtorf等,(1995)PlantMol Biol 29:637-649)、二磷酸核酮糖氧合酶/羧化酶小亚基(SSU)启动子(US4,962,028)、豆球蛋白B启动子(GenBank登录号X03677)、农杆菌胭脂碱合酶(NOS)启动子、TR二元启动子、农杆菌的章鱼氨酸合成酶(OCS)启动子、Smas启动子、肉桂醇脱氢酶启动子(US 5,683,439)、液泡ATP酶亚单位启动子、pEMU启动子(Last等,(1991)Theor.Appl.genet.81,581-588);MAS启动子(Velten等,(1984)EMBO J.3(12):2723-2730)、玉米H3组蛋白启动子(Lepetit等,(1992)Mol.Gen.genet.231:276-285;Atanassova等,(1992)Plant J 2(3):291-300)、-伴大豆球蛋白启动子、菜豆素启动子、ADH启动子和热激启动子、拟南芥腈水解酶启动子(WO 03/008596;GenBank登录号:U38846,核苷酸3,862-5,325或5342)、小麦富含脯氨酸的蛋白质启动子(WO 91/13991)、豌豆ptxA基因的启动子和本领域技术人员已知的各种植物基因的其它转录起始区域。
此外,需要提到因为本发明嵌合RNA的高效性,本发明的方法不依赖于强启动子区域驱动转录产生嵌合RNA。换言之,完全启动子,尤其是植物表达启动子能指导转录。
3.1.3.1.1.2组织特异性启动子
备选地,可使用仅调节一种或某些组织或器官(例如叶、根、果实、种子、花药、子房、谷粒、分生组织、茎或花)或其部分中表达的启动子。例如,西红柿组织特异性ES启动子尤其用于指导基因表达以使所需基因产物位于果实中(参见例如Lincoln等,(1988)Proc Natl Acad Sci USA84:2793-2797;Deikman等,(1988)EMBO J 7:3315-3320;Deikman等,(1992)Plant Physiol 100:2013-2017)。适当的种子特异性启动子包括衍生自下列基因的启动子:玉米的MAC1(Sheridan等,(1996)Gnetics 142:1009-1020)、玉米的Cat3(GenBank No.L05934)、编码玉米油质蛋白18kD的基因(GenBank No.J05212)、拟南芥viviparous-1(Genbank登录号:U93215)、编码拟南芥油质蛋白的基因(Genbank登录号:Z17657)、拟南芥的Atmycl(Urao等,(1996)Plant Mol Biol 32:571-576)、拟南芥2S种子贮存蛋白质基因家族(Conceicao等,(1994)Plant 5:493-505)、编码欧洲油菜油质蛋白20kD的基因(GenBank No.M63985)、欧洲油菜的napin(GenBankNo.J02798,Joseffson等,(1987)J Biol Chem 262:12196-12201)、napin基因家族(例如欧洲油菜;Sjodahl等,(1995)Planta 197:264-271),US 5,608,152;Stalberg等,(1996)Planta 199:515-519)、编码欧洲油菜2S贮存蛋白质的基因(Dasgupta等,(1993)Gene 133:301-302)、编码大豆油质蛋白A(Genbank登录号:U09118)和油质蛋白B(Genbank No.U09119)的基因、编码大豆低分子量富含硫蛋白质的基因(Choi等,(1995)Mol Gen Genet246:266-268)、菜豆素基因(US 5,504,200,Bustos等,(1989)Plant Cell1(9):839-53;Murai等,(1983)Science 23:476-482;Sengupta-Gopalan等,(1985)Proc.Nat′l Acad.Sci.USA 82:3320-3324(1985))、2S白蛋白基因、豆球蛋白基因(Shirsat等,(1989)Mol Gen Genet 215(2):326-331)、USP(未知种子蛋白质)基因、蔗糖结合蛋白质基因(WO 00/26388)、豆球蛋白B4基因(LeB4;Fiedler等,(1995)Biotechnology(NY)13(10):1090-1093),等,(1992)Plant J 2(2):233-239;
Figure A20068002199101102
等,(1991a)Mol GenGenet 225(3):459-467;等,(1991b)Mol Gen Genet 225:121-128)、拟南芥基因(WO 98/45461)、Brassica Bce4基因(WO 91/13980)、编码“高分子量谷蛋白in”、gliadin、分支酶、ADP葡萄糖焦磷酸酶(AGPase)或淀粉合成酶的基因(HMWG)。其它优选启动子为能在单子叶植物(例如玉米、大麦、小麦、黑麦、稻等)中进行种子特异性表达的启动子。可优选使用的启动子为lpt2或lpt1基因的启动子(WO 95/15389,WO 95/23230)或WO 99/16890中所述的启动子(大豆醇溶蛋白基因、谷蛋白基因、oryzin基因、醇溶谷蛋白基因、麸朊基因、玉米醇溶蛋白基因、kasirin基因或黑麦碱基因的启动子)。其它优选的为叶特异性和光诱导的启动子,如cab或二磷酸核酮糖氧合酶/羧化酶(Timko等,(1985)Nature 318:579-582;Simpson等,(1985)EMBO J 4:2723-2729);花药特异性启动子,如LAT52(Twell等,(1989)Mol Gen Genet 217:240-245);谷粒特异性启动子,如Zml3(Guerrero等,(1993)Mol Gen Genet 224:161-168)和小孢子母细胞优选的启动子,如apg(Twell等,(1983)Sex.Plant Reprod.6:217-224)。其它适当启动子为例如块茎、贮存根或根的特异性启动子,如I型patatin启动子(B33)、马铃薯cathepsin D抑制剂启动子、淀粉合成酶(GBSS1)启动子或sporamin启动子和果实特异性启动子,如西红柿果实特异性启动子(EP-A 409 625)。进一步适用的启动子为确保叶特异性表达的启动子。提到的启动子为马铃薯胞质FBPase启动子(WO 98/18940)、二磷酸核酮糖氧合酶/羧化酶(核酮糖-1,5-二磷酸羧化酶)SSU(小亚基)启动子或马铃薯ST-LSI启动子(Stockhaus等,(1989)EMBO J 8(9):2445-2451)。其它优选启动子为在种子和植物胚中控制表达的启动子。其它适当启动子为例如,果实成熟特异性启动子(如西红柿果实成熟特异性启动子(WO 94/21794))、花特异性启动子(如八氢番茄红素合成酶启动子(WO 92/16635)或P1-rr基因的启动子(WO 98/22593))或可优选使用的EP-A 249676中所述的另一结节特异性启动子。启动子也可为木髓特异性启动子,例如如所述从植物TrpA基因分离的启动子。
3.1.3.1.1.3化学诱导型启动子
表达构建体也可含有化学诱导型启动子(综述文章:Gatz等,(1997)Annu Rev Plant Physiol Plant Mol Biol 48:89-108),通过其编码本发明嵌合RNA的核酸序列可在控制的特定时间点在植物中表达。可同样使用此类启动子,例如柳酸诱导型启动子(WO 95/19443)、苯磺胺诱导型启动子(EP0 388 186)、四环素诱导型启动子(Gatz等,(1991)Mol Gen Gnetics227:229-237)、脱落酸诱导型启动子EP 0 335 528)或乙醇-环己酮诱导型启动子(WO 93/21334)。同样适当的是谷胱甘肽-S转移酶异型体II基因的启动子(GST-II-27),其可通过外源应用的安全剂(例如N,N-二烯丙基-2,2-二氯乙酰胺(W0 93/01294))激活并能在单子叶植物和双子叶植物的大量组织中操作。可在本发明中使用的其它典型诱导型启动子包括对铜反应的ACE1系统(Mett等,PNAS 90:4567-4571(1993))或对苯磺胺除草剂安全剂反应的玉米In2启动子(Hershey等,(1991)Mol Gen Genetics 227:229-237;Gatz等,(1994)Mol Gen Genetics 243:32-38)。可使用对植物天然不反应的诱导剂反应的启动子。典型的诱导型启动子为类固醇激素基因的诱导型启动子,其转录活性由糖皮质类固醇激素(Schena等,(1991)Proc Nat′l Acad Sci USA88:10421)诱导。其它优选启动子为抗生素或非生物胁迫诱导的启动子,例如PRP1基因的病原体诱导型启动子(Ward等,(1993)Plant Mol Biol22:361-366)、西红柿热诱导型hsp80启动子(US 5,187,267)、马铃薯冷诱导型α-淀粉酶启动子(WO 96/12814)或伤害诱导的pinII启动子(EP-A1 0 375091)。
3.1.3.1.1.4应激-或病原体诱导型启动子
可使用指导表达环境控制的启动子。影响诱导型启动子转录的环境条件的实例包括抗生素或非生物胁迫因素或其它环境条件,例如病原体攻击、缺氧情况、乙烯或光的存在。
可由抗生素或非生物胁迫的启动子包括但不限于PRP1基因的病原体诱导型启动子(Ward等,(1993)Plant Mol Biol 22:361-366)、西红柿热诱导型hsp70或hsp80启动子(US 5,187,267)、马铃薯寒冷诱导型α-淀粉酶启动子(WO 96/12814)、光诱导型PPDK启动子或伤害诱导型pinII启动子(EP375091)。病原体诱导型启动子包括病原体攻击诱导的基因的启动子例如,PR蛋白质SAR蛋白质、b-1,3-葡聚糖酶、几丁酶等等的基因(例如Redolfi等,(1983)Neth J Plant Pathol 89:245-254;Uknes等,(1992)Plant Cell4:645-656;Van Loon(1985)Plant Mol Virus 4:111-116;Marineau等,(1987)Plant Mol Biol 9:335-342;Matton等,(1 987)Molecular Plant-MicrobeInteractions 2:325-342;Somssich等,(1986)Proc Natl Acad Sci USA83:2427-2430;Somssich等,(1988)Mol Gen Genetics 2:93-98;Chen等,(1996)Plant J 10:955-966;Zhang和Sing(1994)Proc Natl Acad Sci USA91:2507-2511;Warner等,(1993)Plant J 3:191-201;Siebertz等,(1989)Plant Cell 1:961-968(1989))。同样包括的是伤害诱导型启动子,例如pinII基因(Ryan(1990)Ann Rev Phytopath 28:425-449;Duan等,(1996)NatBiotech 14:494-498)、wun1和wun2基因(US 5,428,148)、win1和win2基因(Stanford等,(1989)Mol Gen Genet 215:200-208)、systemin(McGurl等,(1992)Science 225:1570-1573)、WIP1基因(Rohmeier等,(1993)Plant MolBiol 22:783-792;Eckelkamp等,(1993)FEBS Letters 323:73-76)、MPI基因(Corderok等,(1994)Plant J 6(2):141-150)等的伤害诱导型启动子。
3.1.3.1.1.5发育依赖性启动子
此外,适宜启动子为例如果实成熟特异性启动子,例如来自西红柿的果实成熟特异性启动子(WO 94/21794,EP 409 625)。发育依赖性启动子部分地包括如上所述组织特异性启动子,因为各个组织天然地作为发育的功能形成。尤其描述了发育调节启动子(Baerson和Lamppa(1993)Plant MolBiol 22(2):255-67)。
3.1.3.1.1.6其它适宜启动子和启动子元件
启动子也可包括能够改变表达所控制性状的另外的启动子、启动子元件或最小启动子。因此,例如,组织特异性表达可以额外地作为某些应激因素的功能而发生(由于遗传控制序列)。例如描述了用于水应激、脱落酸(Lam和Chua(1991)J Biol Chem 266(26):17131-17135)和热应激(Schoffl等,(1989)Molecular&General Genetics 217(2-3):246-53)的此类元件。
3.1.3.1.2其它遗传控制元件
此外,遗传控制序列应理解为允许从基因组中去除所插入序列的那些。基于cre/lox(Dale和Ow(1991)Proc Nat′l Acad Sci USA 88:10558-10562;Sauer(1998)Method 14(4):381-92;Odell等,(1990)Mol Gen Genet223:369-378)、FLP/FRT(Lysnik等,(1993)NAR 21:969-975)或Ac/Ds系统(Lawson等,(1994)Mol Gen Genet 245:608-615;Wader等,(1987),西红柿TECHNOLOGY 189-198(Alan R.Liss,Inc.);US 5,225,341;Baker等,(1987)EMBO J 6:1547-1554)的方法允许根据需要以组织特异性和/或诱导型从宿主生物基因组中去除特异性DNA序列。在该情况下的控制序列意思是指允许以后去除(例如通过cre重组酶的方法)的特异性侧翼序列(例如lox序列)。
3.1.3.1.2.1转录终止子
可得到多种用于表达构建体的转录终止子。它们负责在转基因外终止转录和其正确的多聚腺苷酸化。适宜转录终止子是已知在植物中具有功能的那些并包括CaMV 35S终止子、tml终止子、OCS(章鱼碱合酶)终止子和NOS(胭脂碱合酶)终止子以及豌豆rbcS E9终止子。它们可用于单子叶植物和双子叶植物。
3.1.3.1.2.2用于增强或调节表达的序列
遗传控制序列还包括基因的5’-非翻译区域、内含子或非编码3’区,例如,肌动蛋白-1内含子或Adh1-S内含子1、2和6(一般参考:The MaizeHandbook,第116章,Freeling和Walbot编,Springer,New York(1994))。已经证明它们在调节基因表达中具有明显的作用,并且显示特别是在单子叶植物细胞中增强表达。因此,已经证明5’-非翻译序列能增强异源基因的瞬时表达。可以提到的此类翻译增强子的实例是烟草花叶病毒5’前导序列(Gallie等,(1987)Nucl Acids Res 15:8693-8711)等。此外,它们可以促进组织特异性(Rouster J等,(1998)Plant J 15:435-440)。
3.1.3.2.植物转化载体的构建
用于表达本发明的嵌合RNA分子的表达构建体优选地包含于表达载体中。用于植物转化的众多转化载体是植物转化领域技术人员众所周知的。对载体的选择取决于优选的转化技术和用于转化的靶物种。
3.1.3.2.1载体元件
表达构建体和从其衍生的载体可包括更多的功能元件。术语功能元件应广义理解,并且意思是指对本发明的表达构建体、载体或转基因生物的产生、操作或功能具有影响的所有那些元件。下面通过实例提到,但不限于这些:
3.1.3.2.1.1.选择标记基因
选择标记基因用于选择和分离成功转化的细胞。优选地,在本发明方法中,可采用一个标记用于选择原核宿主,而采用另一个标记用于选择真核宿主、特别是植物宿主。标记可赋予对杀生物剂如抗生素、毒素、重金属等的抗性,或者通过互补给予营养缺陷型宿主以原营养而发挥功能。用于植物的优选选择标记基因包括但不限于下列:
3.1.3.2.1.1.1.负选择标记
负选择标记赋予对杀生物化合物,如代谢抑制剂(例如2-脱氧葡萄糖-6-磷酸,WO 98/45456)、抗生素(例如卡那霉素、G 418、博来霉素或潮霉素)或除草剂(例如草铵膦或草甘膦)的抗性。特别优选的负选择标记是赋予对除草剂抗性的那些。这些标记除了作为标记起作用以外,还可用于赋予所得植物抗除草剂的性状。可提到的实例是:
-草铵膦乙酰转移酶(PAT;也称作Bialophos抗性;bar;de Block等,(1987)EMBO J 6:2513-2518;EP 0 333 033;US 4,975,374),
-赋予对草甘膦(N-膦酰甲基谷氨酸)抗性的5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSPS;US 5,633,435)或草甘膦氧化还原酶基因(US 5,463,175)(Shah等,(1986)Science 233:478),
-草甘膦降解酶(草甘膦氧化还原酶;gox),
-茅草枯失活的脱卤素酶(deh),
-磺酰脲和咪唑啉酮失活的乙酰乳酸合酶(例如具有例如S4和/或Hra突变的ALS突变变体),
-降解溴苯腈的腈水解酶(bxn)
-编码例如新霉素磷酸转移酶的卡那霉素或G418抗性基因(NPTII;NPTI)(Fraley等,(1983)Proc Natl Acad Sci USA 80:4803),其表达赋予对抗生素卡那霉素和相关抗生素新霉素、巴龙霉素、庆大霉素和G418的酶,
-赋予对2-脱氧葡萄糖抗性的2-脱氧葡萄糖-6-磷酸磷酸酶(DOGR1-基因产物;WO 98/45456;EP 0 807 836)(Randez-Gil等,(1995)Yeast 11:1233-1240),
-介导对潮霉素抗性的潮霉素磷酸转移酶(HPT)(Vanden Elzen等,(1985)Plant Mol Biol.5:299).
-二氢叶酸还原酶(Eichholtz等,(1987)Somatic Cell and Molecular遗传学13,67-76)。
细菌来源的赋予对抗生素抗性的额外负选择标记基因包括赋予对壮观霉素抗性的aadA基因、庆大霉素乙酰转移酶、链霉素磷酸转移酶(SPT)、氨基糖苷-3-腺苷转移酶和博来霉素抗性决定子(Svab等,(1990)Plant Mol.Biol.14:197;Jones等,(1987)Mol.Gen.Genet.210:86;Hille等,(1986)Plant Mol.Biol.7:171(1986);Hayford等,(1988)Plant Physiol.86:1216)。
特别优选赋予对D-氨基酸如D-丙氨酸和D-丝氨酸所致毒性效应具有抗性的负选择标记(WO 03/060133;Erikson等,Nat Biotechnol.22(4):455-8(2004))。在该上下文中特别优选的负选择标记是来自瘦弱红酵母(Rhodotorula gracilis)(红冬孢酵母菌(Rhodosporidium toruloides))的daol基因(EC:1.4.3.3:GenBank登录号:U60066)和大肠杆菌基因dsdA(D-丝氨酸脱水酶(D-丝氨酸脱氨酶)[EC:4.3.1.18;GenBank登录号:J01603]。取决于所采用的D-氨基酸,可采用D-氨基酸氧化酶标记作为赋予负选择(例如当与例如D-丙氨酸或D-丝氨酸组合时)或反选择(例如当与D-亮氨酸或D-异亮氨酸组合时)的双功能标记。
3.1.3.2.1.1.2.正选择标记
与非转化植物相比,正选择标记赋予转化植物生长优势。基因,例如来自根癌农杆菌的异戊烯基转移酶(菌株:PO22;Genbank登录号:AB025109)作为细胞激动素生物合成的关键酶促进了转化植物的再生(例如通过在无细胞激动素培养基上的选择)。描述了相应选择方法(Ebinuma等,(2000a)Proc Natl Acad Sci USA 94:2117-2121;Ebinuma等,(2000b)Selection of Marker-free transgenic Plant using oncogene(ipt,rol A,B,C)of Agrobacterium as selectable markers,In Molecular Biology of WoodyPlants.Kluwer Academic Publishers)。与非转化植物相比,赋予转化植物生长优势另外的正选择标记描述于例如EP-A 0 601 092中。生长刺激选择标记可包括(但不限于)-葡糖醛酸糖苷酶(与例如细胞激动素葡糖醛酸组合)、甘露糖-6-磷酸异构酶(与甘露醇组合)、UDP-半乳糖-4-差向异构酶(与例如半乳糖组合),其中甘露糖-6-磷酸异构酶与甘露糖的组合是特别优选的。
3.1.3.2.1.1.3.反选择标记
反选择标记特别适用于选择包含所述标记的序列被缺失的生物(Koprek等,(1999)Plant J 19(6):719-726)。反选择标记的实例包括胸苷激酶(TK)、胞嘧啶脱氨酶(Gleave等,(1999)Plant Mol Biol.40(2):223-35;Perera等,(1993)Plant Mol.Biol 23(4):793-799;Stougaard(1993)Plant J3:755-761)、细胞色素P450蛋白质(Koprek等,(1999)Plant J 19(6):719-726)、卤烷脱卤素酶(Naested(1999)Plant J 18:571-576),iaaH基因产物(Sundaresan等,(1995)Gene Develop 9:1797-1810)、胞嘧啶脱氨酶codA(Schlaman和Hooykaas(1997)Plant J 11:1377-1385)或tms2基因产物(Fedoroff和Smith(1993)Plant J 3:273-289)。
3.1.3.2.1.2.报告基因
报告基因编码容易定量的蛋白质,并且通过它们的颜色或酶活性使得评估转化效率、表达位点或表达时间成为可能。在该情况下,非常特别优选的是编码报告蛋白质的基因(Schenborn和Groskreutz(1999)MolBiotechnol 13(1):29-44),例如绿色荧光蛋白(GFP)(Haseloff等,(1997)ProcNatl Acad Sci USA 94(6):2122-2127;Sheen等,(1995)Plant J 8(5):777-784;Reichel等,(1996)Proc Natl Acad Sci USA 93(12):5888-5893;Chui等,(1996)Curr Biol 6:325-330;Leffel等,(1997)Biotechniques.23(5):912-8;Tian等,(1997)Plant Cell Rep 16:267-271;WO 97/41228)、氯霉素转移酶、荧光素酶(Millar等,(1992)Plant Mol Biol Rep 10:324-414;Ow等,(1986)Science 234:856-859)、水母萤光素基因(Prasher等,(1985)BiochemBiophys Res Commun 126(3):1259-1268),β-半乳糖苷酶、R基因座基因(编码调节植物组织中花青素苷色素(红色)产生的蛋白质,并且因此使得不加入额外辅助物质或生色底物而直接分析启动子活性成为可能(Dellaporta等,(1988):Chromosome Structure and Function:Impact of New Concepts,18th Stadler Genetics Symposium,11:263-282;Ludwig等,(1990)Science247:449)),β-葡糖醛酸糖苷酶(GUS)是特别优选的(Jefferson(1987b)PlantMol.Bio.Rep.,5:387-405;Jefferson等,(1987)EMBO J 6:3901-3907)。β-葡糖醛酸糖苷酶(GUS)的表达通过将组织与5-溴-4-氯-3-吲哚-β-D-葡糖醛酸孵育呈蓝色而检测;细菌荧光素酶(LUX)的表达通过光放射检测;萤火虫荧光素酶(LUC)的表达通过与萤光素孵育后的光发射而检测;并且半乳糖苷酶的表达通过组织被5-溴-4-氯-3-吲哚-β-D-半乳糖吡喃糖苷染色后呈现亮蓝色而检测。报告基因还可以用作作为抗生素抗性标记备选的可记分标记(scorable marker)。此类标记可用于检测转基因的存在或者测量转基因表达水平。仅在细胞修饰效率高时,在植物中使用可记分标记鉴定或标记遗传修饰细胞才良好工作。
3.1.3.2.1.3.复制起点
复制起点保证了本发明的表达构建体或载体在例如大肠杆菌中的扩增。可以提到的实例是ORI(DNA复制起点)、pBR322 ori或P15A ori(Maniatis T,Fritsch EF和Sambrook J(1989)Molecular Cloning:ALaboratory Manual,第2版,Cold Spring Harbor Laboratory,Cold SpringHarbor(NY))。对于在大肠杆菌中具有功能的复制系统的额外实例是ColE1、pSC101、pACYC184等。除了或代替大肠杆菌复制系统,可采用广宿主范围复制系统,例如P-1不相容性质粒的复制系统;例如pRK290。这些质粒在向植物宿主转移武装的(armed)和解除武装的(disarmed)Ti-质粒时特别有效。
3.1.3.2.1.4.对于农杆菌介导转化所必需的元件,例如T-DNA的右边界和/或任选的左边界或vir区。
3.1.3.2.1.5.能够并促进一个或多个核酸序列插入的多克隆位点(MCS)。
3.1.3.2.2用于植物转化的载体
3.1.3.2.2.1适于农杆菌转化的载体
如果使用农杆菌,表达构建体要整合至具体载体中,或者穿梭载体或者中间载体或者双元载体。如果Ti或Ri质粒用于转化,待导入植物基因组中的表达构建体的侧翼区是Ti或Ri质粒T-DNA的至少右边界,在大多数情况下是右边界和左边界。优选使用双元载体用于农杆菌转化。双元载体能够在大肠杆菌和农杆菌中复制。它们优选地包含选择标记基因和接头或多接头,它们的两侧为T-DNA右边界序列和任选的左边界序列。它们可直接转化进入农杆菌(Holsters等,(1978)Mol Gen Genet163:181-187)。在载体中可包括允许选择已转化农杆菌的选择标记基因(例如nptIII基因)。在该情况下,作为宿主生物的农杆菌应该已经包括带有vir区的解除武装的(即非致癌)质粒。该区域对于将T-DNA转化进入植物细胞是必需的。T-DNA用于转化植物细胞的用途已经被研究并且被广泛地描述(EP 120 516;Hoekema,The Binary Plant Vector System,Offsetdrukkerij Kanters B.V.,Alblasserdam,第V章;An等,(1985)EMBO J 4:277-287)。已知并可获得用于使用农杆菌转化的多种双元载体,例如,pBI101.2或pBIN19(Clontech Laboratories,Inc.USA;Bevan等,(1984)Nucl Acids Res 12:8711)、pBinAR、pPZP200或pPTV。
3.1.3.2.2.2适于非农杆菌转化的载体
不使用根癌农杆菌进行转化则在所选择的转化载体中无需T-DNA序列,并且除了使用上述包含T-DNA序列的载体以外,还可使用缺乏这些序列的载体。不依赖农杆菌的转化技术包括通过离子轰击的转化、原生质体摄入转化(例如PEG和电穿孔)和微注射转化。对载体的选择极大地依赖于优选选择的待转化物种。适于非农杆菌转化的代表性载体包括pCIB3064、pSOG19和pSOG35。(参见例如,US 5,639,949)。
3.1.3.3.转化技术
3.1.3.3.1一般技术
一旦建立了本发明表达构建体或表达载体,其可以被转化进入植物细胞。  用于向植物基因座中导入核酸序列(例如载体)以及用于从植物组织或植物细胞再生植物的多种方法是已知的(Plant Molecular Biology andBiotechnology(CRC Press,Boca Raton,Florida),第6/7章,第71-119页(1993);White FF(1993)Vectors for Gene Transfer in Higher Plants;在Transgenic Plants,第1卷,Engineering and Utilization,Kung和Wu R编,Academic Press,15-38;Jenes B等,(1993)Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,Kung和R.Wu编,Academic Press,第128-143页;Potrykus(1991)Annu Rev PlantPhysiol Plant Molec Biol 42:205-225;Halford NG,Shewry PR(2000)BrMed Bull 56(1):62-73)。
转化方法可以包括直接或间接的转化方法。适宜的直接方法包括聚乙二醇诱导的DNA摄入、脂质体介导的转化(US 4,536,475)、使用基因枪的生物射弹轰击(“particle bombardment”;Fromm ME等,(1990)Bio/Technology.8(9):833-9;Gordon-Kamm等,(1990)Plant Cell 2:603)、电穿孔、干燥胚在含DNA溶液中孵育和微注射。在这些直接转化方法的情况下,质粒不需要满足任何特定需要。可以使用单纯的质粒,例如pUC系列、pBR322、M13mp系列、pACYC184等。如果从已转化细胞再生完整的植物,优选地在质粒中含有额外的选择标记基因。直接转化技术同等适用于双子叶植物和单子叶植物。
转化也可以通过农杆菌手段的细菌感染(例如EP 0 116 718)、病毒载体手段的病毒感染(EP 0 067 553;US 4,407,956;WO 95/34668;WO 93/03161)或通过花粉(EP 0 270 356;WO 85/01856;US 4,684,611)开展。基于农杆菌的转化技术(特别是用于双子叶植物)在本领域众所周知。农杆菌菌株(例如根癌农杆菌或毛根农杆菌(Agrobacterium rhizogenes))包含质粒(Ti或Ri质粒)和在农杆菌感染后转移至植物的T-DNA元件。T-DNA(转移的DNA)被整合进入植物细胞基因组中。T-DNA可以位于Ri-或Ti-质粒中或者分开包含于上述双元载体中。用于农杆菌介导转化的方法描述于例如HorschRB等,(1985)Science 225:1229f中。农杆菌介导转化最适用于双子叶植物,但也适用于单子叶植物植物。描述了通过农杆菌对植物的转化(White FF,Vectors for Gene Transfer in Higher Plant;在Transgenic Plants,第1卷,Engineering and Utilization,S.D.Kung和R.Wu编,Academic Press,1993,第15-38页;Jenes B等,(1993)Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,S.D.Kung和R.Wu编,Academic Press,第128-143页;Potrykus(1991)Annu Rev PlantPhysiol Plant Molec Biol 42:205-225)。
转化可导致瞬时或稳定转化和表达。虽然本发明的核苷酸序列可插入到广泛种类(如上面定义部分所指出)的任何植物和植物细胞,但是其特别用于作物植物细胞。
导致组织适于农杆菌介导转化方法的起始材料(外植体),其包括但不限于愈伤组织(US 5,591,616;EP-A1 604 662)、未成熟胚(EP-A1 672 752)、花粉(US 54,929,300)、苗端(US 5,164,310)或植物原位转化(US 5,994,624)。本文所述方法和材料可以与本领域已知的几乎所有农杆菌介导转化方法相组合。优选的组合包括但不限于下列起始材料和方法:
表1:植物转化方法
种类 材料/文献
单子叶植物植物: 禾成熟胚(EP-A1 672 752)愈伤组织(EP-A1 604 662胚性愈伤组织(US 6,074,877)
  种类 材料/文献
花序(US 6,037,522)花(植物原位)(WO 01/12828)
  香蕉 US 5,792,935;EP-A1731632;US 6,133,035
  大麦 WO 99/04618
  玉米 US 5,177,010;US 5,987,840
  菠萝 US 5,952,543;WO 01/33943
  稻 EP-A1 897 013;US 6,215,051;WO 01/12828
  小麦 AU-B 738153;EP-A1 856 060
  豆类 US 5,169,770;EP-A1 397 687
  芸苔属 US 5,188,958;EP-A1 270 615;EP-A1 1,009,845
  可可树 US 6,150,587
  柑桔 US 6,103,955
  咖啡 AU 729 635
  棉花 US 5,004,863;EP-A1 270 355;US 5,846,797;EP-A11,183,377;EP-A11,050,334;EP-A11,197,579;EP-A11,159,436花粉转化(US5,929,300)植物原位转化(US5,994,624)
  豌豆 US 5,286,635
  胡椒 US 5,262,316
  白杨 US 4,795,855
  大豆 萌芽大豆幼苗的子叶节苗端(US 5,164,310)萌芽大豆幼苗约7天的基部或更高叶节的腋生分生组织器官性的愈伤组织培养物脱水胚轴US 5,376,543;EP-A1 397 687;US 5,416,011;US5,968,830;US 5,563,055;US 5,959,179;EP-A1 652965;EP-A1 1,141,346
  糖用甜菜 EP-A1 517 833;WO 01/42480
  西红柿 US 5,565,347
3.1.3.3.2.质体转化
在另一个优选的实施方案中,本发明的核苷酸序列(优选用于本发明嵌合RNA分子的表达构建体)直接转化进入质体基因组中。质体表达(其中基因通过同源重组被插入到每一植物细胞中存在的几千个拷贝的环状质体基因组中)利用了超过细胞核所表达基因很多拷贝的优势,从而允许高水平表达。在优选的实施方案中,核苷酸序列被插入到质体靶向性载体中并被转化进入目的植物宿主的质体基因组中。得到对于包含核苷酸序列的质体基因组而言同质性的植物并且植物优选能够高表达核苷酸序列。
质体转化技术例如广泛描述于美国专利号5,451,513、5,545,817、5,545,818和5,877,462、PCT申请号WO 95/16783和WO 97/32977以及McBride等,(1994)Proc.Natl.Acad.Sci.USA 91,7301-7305中,所有文献在本文全部引用作为参考。质体转化的基础技术涉及将所克隆的质体DNA的区域(其位于选择标记和核苷酸序列的侧翼)导入到适宜靶组织中,例如使用生物射弹轰击或原生质体转化(例如氯化钙或PEG介导的转化)。称作靶向序列的1-1.5kb的侧翼区域促进了与质体基因组的同源重组,并且允许替换或改变原质体系的特异性区域。起初,赋予对壮观霉素和/或链霉素抗性的叶绿体16S rRNA和rps12基因中的点突变用作转化的选择标记(Svab等,(1990)Proc.Natl.Acad.Sci.USA 87,8526-8530;Staub等,(1992)Plant Cell 4,39-45)。在这些标记中间存在克隆位点则允许产生用于导入外源基因的质体靶向性载体(Staub等,(1993)EMBO J.12,601-606)。通过用显性选择标记,即编码壮观霉素脱毒酶氨基糖苷-3′-腺苷转移酶的细菌aadA基因替换隐性rRNA或r-蛋白质抗生素抗性基因,转化效率增加(Svab等,(1993)Proc.Natl.Acad.Sc.USA 90,913-917)。用于质体转化的其它选择标记在本领域中已知并处于本发明的范围内。
对于使用根据本发明的方法,技术人员具有可得到的众所周知的工具,例如具有植物适宜的启动子的表达载体以及植物转化和再生的方法。
3.1.3.4.选择和再生技术
为选择已经经历成功转化的细胞,优选地的引入选择标记,选择标记赋予已经经历成功转化的细胞对杀生物剂(例如除草剂)、代谢抑制剂如2-脱氧葡萄糖-6-磷酸(WO 98/45456)或抗生素的抗性。选择标记允许将已转化细胞从非转化细胞中选择出来(McCormick等,(1986)Plant CellReports 5:81-84)。适宜选择标记如上所述。
转基因植物可以已知方式从已转化细胞再生。所得到的小植株可以常规方式种植和生长。优选地,培养两个或两个以上世代以保证基因组整合是稳定的和可遗传的。描述了适宜方法(Fennell等,(1992)Plant Cell Rep.11:567-570;Stoeger等,(1995)Plant Cell Rep.14:273-278;Jahne等,(1994)Theor Appl Genet 89:525-533)。
3.2药物(治疗性或预防性)组合物和方法
本发明化合物、组合物和方法非特异性还可以被本领域技术人员在治疗或预防用途中利用,并且适于治疗人和动物疾病的药物的制备以及药物的生产。
因此,本发明还提供了用于治疗或预防动物或人、优选哺乳动物中疾病或感染的方法。而本发明的另一个实施方案涉及包含至少一个本发明嵌合RNA的药物制剂。优选地,所述制剂包含:
i)至少一个对靶生物(优选动物或人)具有治疗或预防作用的蛋白质,或
ii)至少一个减弱至少一个疾病相关靶基因表达的功能性RNA分子。
另一个实施方案涉及用作药物、优选用于治疗一种或多种人或动物疾病的药物的本发明嵌合RNA、用于其表达的表达构建体或表达载体或包含所述嵌合RNA分子的生物(优选非人生物)。而另一个实施方案涉及本发明嵌合RNA、用于其表达的表达构建体或表达载体或包含所述嵌合RNA分子的非人生物用于制备药物、优选用于治疗一种或多种人或动物疾病的药物的用途。
本发明的嵌合RNA(或用于其表达的表达构建体或载体)以治疗或预防有效量(例如减弱靶基因表达的量,其表达与疾病或感染相关;或者-在蛋白质表达的情况下-适于带来与治疗蛋白质相关效果的量)施用于动物或人(例如哺乳动物)。以疾病基因抑制为例,靶基因的表达(或备选地从其所表达的靶蛋白质的活性)被抑制至少约10%、优选地至少约30%、更优选地至少50%或更高。
多种疾病可以被治疗,包括被异源病原体生物(细胞外病原体或细胞内病原体)的感染。此外,本发明的组合物可用于预防病原体感染或预防因潜伏病原体的复活所致的疾病的发生。这些组合物也用于治疗病原体诱导的癌症。本发明的组合物和方法特别适用于治疗病毒疾病(即HIV,丙型肝炎)。这特别适用于基因沉默方法。
因此,本发明方法采用包含核酸分子的基因治疗构建体,所述核酸分子编码具有治疗生物活性的多肽(在本文也称作“治疗多肽”),包括但不限于免疫刺激分子、肿瘤抑制基因产物/抗原、抗代谢物、自杀基因产物和抗血管生成因子。参见Mackensen等,(1997)Cytokine Growth Factor Rev8(2):119-128;Walther&Stein(1999)Mol Biotechnol 13(1):21-28;Kirk&Mule(2000)Hum Gene Ther 11(6):797-806;及其中引用的参考文献。
此外,其它(非病原体相关)紊乱和疾病可以治疗。可以提供寡核苷酸组合物治疗的疾病实例包括:癌症、视网膜病变、自身免疫病、炎性疾病(即ICAM-1相关紊乱、银屑病、溃疡性结肠炎、克隆病)、心血管病(例如高血压)、中枢和周围神经系统疾病例如阿尔茨海默病、帕金森病或多发性硬化和常染色体显性遗传病如亨廷顿舞蹈症(例如见US 6,506,559;US2002/0,173,478 A1;US 2002/0,086,356 A1;Shuey等,″RNAi:gene-silencingin therapeutic intervention.″Drug Discov.Today 2002年10月15日;7(20):1040-6;Aoki等,″Clin.Exp.Pharmacol.Physiol.2003年1月;30(1-2):96-102;Cioca等,″RNA interference is a functional pathwaywith therapeutic potential in human myeloid leukemia cell lines.CancerGene Ther.2003年3月;10(2):125-33)。存在众多报道基因沉默治疗适用的医学状况(参见例如US 5,830,653)以及呼吸道合胞体病毒感染(WO 95/22,553)流感病毒(WO 94/23,028)和恶性肿瘤(WO 94/08,003)。临床应用反义序列的其它实例在例如Glaser.1996.Genetic Engineering News 16:1中综述。通过寡核苷酸断裂的示例性靶标包括例如蛋白激酶Ca、ICAM-1、c-raf激酶、p53、c-myb和在慢性髓性白血病中发现的bcr/abl融合基因。本发明方法还用于降低或防止对移植组织的排斥反应(例如通过沉默MHC蛋白质)。嵌合RNA hat减弱了移植组织中基因的表达,移植组织中基因的表达引起接受移植组织的受体中的免疫反应。
同样,根据本发明的方法使得并行治疗一种以上疾病成为可能,例如心血管病和中枢神经系统疾病,这在使用传统方法时一般是不可能的。在随着年龄的增长而频发的多发性疾病的情况下,此类方法具有特别的优点。可以提到的实例是高血压和例如阿尔茨海默病或老年性痴呆的并行治疗。
通过向适宜可药用稀释剂或载体中加入有效量的化合物或组合物将本发明的化合物和组合物用于药物组合物中。本发明的寡聚化合物和方法还可以用于预防。
3.2.1优选用本发明的组合物和方法治疗的疾病和紊乱
根据本发明的方法特别适用于治疗下述的疾病和紊乱。
3.2.1.1病原体感染
在病原体感染,如病毒或细菌性疾病的情况下,嵌合RNA(或从其衍生的dsRNA)减弱细菌或病毒基因的表达。特别地,用该方法治疗的更多种疾病中的一些包括但不限于反转录病毒、疱疹病毒、Hepadenovirus、痘病毒、细小病毒、乳头状瘤病毒和乳多空病毒,特别是HIV、HBV、HSV、CMV、HPV、HTLV和EBV。该方法中所用的嵌合RNA向细胞(例如哺乳动物)提供如上所述的至少部分双链RNA分子,其与对于在所感染哺乳动物细胞内的复制和/或发病而言必需的病毒多核苷酸序列的靶序列基本上相同。其中靶多核苷酸序列是病毒增殖所必需的蛋白质的编码序列,例如HIV gag、env、gp41和pol基因,HPV6 L1和E2基因,HPV11 L1和E2基因,HPV16 E6和E7基因,HPV18 E6和E7基因,HBV表面抗原,HBV核心抗原,HBV逆转录酶,HSV gD基因,HSVvp16基因,HSV gC、gH、gL和gB基因,HSVICP0、ICP4活化ICP6基因,水痘带状疱疹(Varicella zoster)gB、gC和GH基因和BCR-abl染色体序列和提供对于感染从一个细胞向一个细胞的转移所必需的调节功能的非编码的病毒多核苷酸序列,例如HIV LTR和其它病毒启动子序列,例如HSV vp16启动子、HSV-ICP0启动子、HSV-ICP4、ICP6和gD启动子、HBV表面抗原启动子、HBV前基因组启动子等。组合物(例如dsRNA活性剂,如本发明的嵌合RNA分子)与多核苷酸摄入增强剂或促进剂和任选的可药用载体一起施用。向哺乳动物施用的量或剂量是有效降低或抑制哺乳动物细胞中病毒序列功能的量或剂量。
方法可用于治疗已经感染病毒的动物(例如哺乳动物),以便关闭或抑制对于病毒复制和/或发病而言必需的病毒基因功能。在本发明的另一个实施方案中,上述组合物可用于预防病毒感染(例如在哺乳动物中)的方法中。当在哺乳动物接触病毒之前施用本发明嵌合RNA时,预计外源RNA分子留在哺乳动物中并抑制任何出现在哺乳动物内的同源的病毒序列。因此,本发明的组合物可用于抑制或降低疫苗用于中病毒多核苷酸序列的功能。上述本发明的“抗病毒”方法的类似实施方案包括用于治疗或预防哺乳动物中病毒诱导癌症的方法(此类癌症包括HPV E6/E7病毒诱导的宫颈癌和EBV诱导的癌症)。
本发明的组合物还可用于治疗或预防非病毒病原体的细胞内或细胞外感染。如本文所使用,术语“细胞内病原体”意思是指至少其部分繁殖周期或生活周期存在于宿主细胞内并且在其中产生或导致产生病原体蛋白质的病毒、细菌、原生动物或其它病原体生物。感染细胞的细胞内病原体(包括在生活周期的一个阶段它们是细胞内病原体)包括但不限于利斯特菌属(Listeria)、衣原体属(Chlamydia)、衣原体属(Leishmania)、衣原体属(Brucella)、分枝杆菌属(Mycobacteria)、志贺菌属(Shigella)和疟原虫属(Plasmodia),例如疟疾病原体恶性疟原虫(P.falciparum)。细胞外病原体是在哺乳动物细胞外复制和/或繁殖的那些,例如奈瑟菌属(Gonorrhoeae)和疏螺旋体属(Borrellia)等等。根据该实施方案,病原体所致的此类感染可治疗或积极预防,即通过向已经感染或预期接触病原体的哺乳动物受试者施用上述可药用组合物和任选的促进细胞摄入多核苷酸的第二种活性剂。在情况下,组合物的RNA分子具有这样的多核苷酸序列,其与病原体在所感染哺乳动物或哺乳动物细胞中复制和/或发病所必需的病原体靶多核苷酸序列基本相同。如上所述,所施用的组合物的量是足以降低或抑制病原体序列在哺乳动物中作用的量。施用的剂量、时间、途径等如下描述。
因此,本发明的一个实施方案涉及降低宿主细胞或宿主生物对病原体感染易感性的方法,包括以足以减弱对于所述病原体的表达而言必需的一个或更多个基因的表达的量向宿主细胞或宿主生物中导入本发明的嵌合RNA。优选地,病原体是病毒、真菌或线虫。优选地,宿主细胞是植物或动物、优选哺乳动物,更优选人细胞。
根据本公开,本领域技术人员可以容易地选择根据本发明可以制造用于其的治疗或预防组合物的病毒科和属或病原体,包括原核和真核原生动物病原体以及多细胞寄生虫。参见例如普通免疫学教科书和US 5,593,972中的此类病原体列表,该文献在从引用作为参考。
3.2.1.2癌症
可治疗癌症(例如实体瘤和/或白血病)和可遗传的紊乱。其中,对根据本发明的治疗或预防特别易感的状况是这样的状况,它们的特征是存在异常多核苷酸序列,而异常多核苷酸序列的功能对于紊乱的引发或进展是必需的,但可以被抑制而不导致对生物(例如哺乳动物)的健康产生有害或不利的影响。因异常和正常多核苷酸序列的存在而导致的哺乳动物癌症(详见例如WO94/13793)包括慢性髓性白血病(CML)和急性成淋巴细胞性白血病(ALL),其中异常的序列是两个正常基因的融合即bcr-abl。在此类癌症或疾病中,例如CML,受累哺乳动物还具有正常拷贝的多核苷酸序列或基因,并且异常和正常序列或基因间的差异是核苷酸序列中的差异。例如,对于CML,异常序列是bcr-abl融合体,而正常序列是bcr和abl。异常,上述方法可采用跨融合区的序列作为靶多核苷酸序列。治疗或预防哺乳动物中此癌症的方法包括向哺乳动物施用本发明的组合物,其中靶多核苷酸是还具有正常拷贝基因的哺乳动物中导致异常癌症的基因中的多核苷酸序列,并且其中异常基因和正常基因之间的差异是多核苷酸序列中的差异。本领域技术人员熟悉用于癌症治疗的大量潜在靶基因(例如癌基因例如ABL1、BCL1、BCL2、BCL6、CBFA2、CBL、CSF1R、ERBA、ERBB、EBRB2、FGR、FOS、FYN、HRAS、JUN、LCK、LYN、MYB、MYC、NRAS、RET或SRC;肿瘤抑制基因例如BRCA1或BRCA2;粘附分子;细胞周期蛋白激酶和它们的抑制剂)。示例性的潜在靶基因包括发育基因、癌基因和酶,并且可以根据本发明治疗的癌症可以在WO 99/32619中找到。来源于病原体的候选靶基因可以是例如导致宿主免疫抑制的基因或病原体复制、病原体传播或感染维持中涉及的基因。
本发明的另一个实施方案提供治疗癌症的方法(例如局限性和转移性乳腺癌、卵巢癌或前列腺癌),包括向患者施用包含细胞毒性基因的本发明表达构建体或载体(或其变体)。
血管发生和抑制免疫反应在恶性疾病的发病和肿瘤生长、侵袭和转移中起着中心作用。因此,优选地治疗多肽具有体内诱导免疫反应和/或抗血管生成反应的能力。在一个实施方案中,本发明的基因治疗构建体编码显示具有免疫刺激和抗血管生成活性的治疗性基因,例如IL12(见Dias等,(1998)Int J Cancer 75(1):151-157和下文引用的参考文献)、干扰素α(O′Byrne等,(2000)Eur J Cancer 36(2):151-169和其中引用的参考文献)或趋化因子(Nomura&Hasegawa(2000)Anticancer Res 20(6A):4073-4080和其中引用的参考文献)。在另一个实施方案中,本发明的基因治疗构建体编码具有免疫刺激活性和抗血管生成活性的基因产物。见例如Narvaiza等,(2000)J Immunol 164:3112-3122。在另一个实施方案中,本发明包括编码IL2多肽的基因治疗构建体。IL12是显示对多种癌症,包括肾癌、乳腺癌膀胱癌和恶性黑素瘤具有治疗活性的免疫刺激分子。IL2的抗肿瘤活性与其扩充(expand)和活化表达IL2受体的NK细胞和T细胞的能力相关。参见例如Margolin(2000)Semin Oncol 27(2):194-203;Gore(1996)Cancer BiotherRadiopharm 1l(5):281-283;Deshmukh等,(2001)J Neurosurgery94(2):287-292;Larchian等,(2000)Clin Cancer Res 6(7):2913-2920;Horiguchi等,(2000)Gene Ther 7(10):844-851;和其中引用的参考文献。IL2还成功地与抗肿瘤疫苗共施用。见Overwijk等,(2000)Cancer J Sci Am6 Suppl 1:S76-80和其中引用的参考文献。
3.2.2制剂和施用
本发明嵌合RNA可直接向需要治疗或预防的动物或人使用或应用,或者可以通过表达载体或构建体的方式间接应用。
3.2.2.1病毒基因治疗载体
本本发明还提供基因治疗构建体或载体。根据本发明方法采用的特定载体不旨在限制于用于通过过热而热诱导治疗基因表达的方法。因此,可使用适于递送基因治疗构建体的任何载体。
载体可以是病毒载体或非病毒载体。适宜的病毒载体包括腺病毒、腺相关病毒(AAV)、反转录病毒、假性反转录病毒(pseudotyped retrovirus)、疱疹病毒、痘苗病毒、西门利克病毒(Semiliki forest virus)和杆状病毒。适宜的非病毒载体包括质粒、水-油乳剂、聚乙烯亚胺、dendrimers、微胶粒、微胶囊、脂质体和阳离子脂类。可以如Goldman等,(1997)NatBiotechnol 15:462以及美国专利号4,551,482和5,714,166中所述使用用于基因治疗构建体的多聚体载体。肽载体描述于美国专利号5,574,172中。根据需要,可一起使用两种或两种以上类型的载体。例如,质粒载体可与脂质体联合使用。当前,本发明的优选实施方案考虑了使用腺病毒、质粒或脂质体,对于每一种在下文详细描述。
如所希望,可以选择载体、特别是病毒载体实现本发明构建体的核酸向待转化或转染细胞基因组中的整合。在复合物中包含对特定细胞标志物具有亲和性的配体也能够增强复合物向靶标的体内递送。配体包括抗体、细胞表面标志物、病毒肽等,它们使复合物靶向于肿瘤脉管系统或者与肿瘤脉管系统相关的内皮细胞或者靶向于肿瘤细胞。复合物可包括构建体或由构建体编码的分泌的治疗多肽。抗体配体可以是特异性针对肿瘤标志物的抗体或抗体片段,所述肿瘤标志物例如Her2/neu(v-erb-b2禽类成红细胞白血病病毒癌基因同系物2)、CEA(癌胚抗原)、铁蛋白受体或与肿瘤脉管系统相关的标志物(整合素、组织因子或β-纤连蛋白同种型)。如本领域所知,抗体或其它配体可与载体如脂质体和病毒偶联。参见例如Neri等,(1997)Nat BioTechnology 15:1271;Kirpotin等,(1997)Biochemistry 36:66;Cheng(1996)Human Gene Therapy 7:275;Pasqualini等,(1997)NatBiotechnology 15:542;Park等,(1997)Proc Am Ass Canc Res 38:342(1997);Nabel(1997)″Vectors for Gene Therapy″在CD-ROM上的Current Protocols in Human Genetics中,John Wiley&Sons,New York,N.Y.;美国专利号6,071,890;和欧洲专利号0 439 095。备选地,假型反转录病毒可用于将病毒靶向于特定细胞(Marin等,(1997)Mol Med Today3:396)。
本发明的病毒载体优选是缺陷的,例如复制缺陷的。即它们缺乏对于复制必需的一个或多个功能基因,这防止了它们自由地体内复制并避免了病毒感染的不良作用。优选地,除了对于将整合有治疗性基因的病毒基因组包装成病毒外壳或衣壳而言所必需的最下基因组元件以外,所有的病毒基因组被去除了。例如,缺失除长末端重复(LTR)或末端倒置重复(ITR)以及包装信号外的所有病毒基因组是合意的。在腺病毒的情况下,一般缺失E1区和任选的E2、E3和/或E4区域中的一个或多个。在反转录病毒的情况下,复制所需的基因,例如env和/或gag/pol可以被缺失。序列的缺失可以通过重组的方法实现,例如包括用合适的限制性酶消化,然后再连接。也可使用复制能力自我限制或自我破坏的病毒载体。
本发明的核酸构建体可通过本领域已知的任何适宜方法整合加入病毒基因组中。一般,此类整合可通过将构建体连接进入病毒基因组中的合适限制性位点实施。然后,可通过任何适宜方法将病毒基因组包装成病毒外壳或衣壳。特别是,任何适宜的包括细胞系可用于产生本发明的病毒载体。这些包装细胞系补充了本发明的复制缺陷病毒的基因组,因为它们包括(一般整合进入其基因组)从复制缺陷的基因组中缺失的基因。
用于反转录病毒的适宜的包装细胞系包括PA317细胞、.psi.-2细胞、CRE细胞、CRIP细胞、E-86-GP细胞和293GP细胞的衍生物。293细胞系可用于腺病毒和腺相关病毒。
将基因治疗构建体导入细胞的适宜方法包括向细胞或细胞团直接注射、微粒介导的基因转移、电穿孔、DEAE-葡聚糖转染、脂质体介导的转染、病毒感染和其组合。基于对例如载体类型、所编码基因的毒性以及待治疗的状况的考虑选择递送方法。
3.2.2.2适宜表达构建体
可采用适宜启动子表达本发明的嵌合RNA分子以实现有益治疗或预防效果。通过本文提供的本发明方法和主题,表达更为特异,这优选地增强有益效果并降低副作用。
当前本领域有多种启动子可用于在动物、哺乳动物或人中表达序列。它们当中大多数缺乏组织特异性并且可与本文提供的教导有利组合。例如启动子可选自perbB2启动子、乳清酸性蛋白启动子、溶基质蛋白酶3启动子、前列腺特异性抗原启动子、probasin启动子。
启动子可以是热或光诱导型启动子或化学诱导型启动子(例如由抗生素(四环素或其衍生物)诱导的启动子,作用于具有四环素反应元件的融合蛋白)。
构建体还包括热诱导启动子。任何热诱导启动子可根据本发明方法使用,包括但不限于热休克基因(例如hsp20-30、hsp27、hsp40、hsp60、hsp70和hsp90)中的热反应元件。见Easton等,(2000)Cell Stress Chaperones5(4):276-290;Csermely等,(1998)Pharmacol Ther 79(2):129-168;Ohtsuka&Hata(2000)Int J Hyperthermia 16(3):231-245;以及其中引用的参考文献。类似于热休克蛋白质和热反应启动子元件的序列也已经在最初表征为其它功能的基因中得到验证,并且赋予热诱导性的DNA序列适用于所公开的基因治疗载体中。例如,葡萄糖反应基因(例如grp94、grp78、寿命蛋白/grp75)(Merrick等,(1997)Cancer Lett 119(2):185-190;Kiang等,(1998)FASEB J 12(14):1571-16-579)、钙网织蛋白(Szewczenko-Pawlikowski等,(1997)Mol Cell Biochem 177(1-2):145-152)、丛生蛋白(Viard等,(1999)JInvest Dermatol 112(3):290-296;Michel等,(1997)Biochem J328(Ptl):45-50;Clark&Griswold(1997)J Androl 18(3):257-263)、组织相容性I类基因(HLA-G)(Ibrahim等,(2000)Cell Stress Chaperones5(3):207-218)和淀粉样蛋白前体蛋白质的Kunitz蛋白酶同种型(Shepherd等,(2000)Neuroscience 99(2):317-325)的表达响应于热而上调。
以丛生蛋白为例,已经描绘出足以进行热诱导的4碱基对元件(Michel等,(1997)Biochem J 328(Pt1):45-50)。类似地,在钙网织蛋白启动子区域内包含10碱基对和14碱基对元件的两个序列单位证明赋予热诱导性(Szewczenko-Pawlikowski等,(1997)Mol Cell Biochem 177(1-2):145-152)。
可使用对非热刺激反应的其它启动子。例如,寿命蛋白启动子由低剂量的电离辐射诱导(Sadekova(1997)Int J Radiat Biol 72(6):653-660),hsp27启动子由17β-雌二醇和雌激素受体激动剂活化(Porter等,(2001)JMol Endocrinol 26(1):31-42),HLA-G启动子由亚砷酸盐诱导,hsp启动子光动力疗法活化(Luna等,(2000)Cancer Res 60(6):1637-1644)。
适宜启动子可合并有诸多因素,例如组织特异性活化。例如,hsp70在应激的成神经细胞瘤细胞中的转录被削弱(Drujan&De Maio(1999)12(6):443-448)。寿命蛋白启动子在人脑瘤中上调(Takano等,(1997)ExpCell Res 237(1):38-45)。如所述,本发明方法中采用的启动子可以在肿瘤细胞中选择性上调,例如寿命蛋白(Takano等,(1997)Exp Cell Res237(1):38-45)、hsp27和钙网织蛋白(Szewczenko-Pawlikowski等,(1997)Mol Cell Biochem 177(1-2):145-152;Yu等,(2000)Electrophoresis21(14):3058-3068)、grp94和grp78(Gazit等,(1999)Breast Cancer ResTreat 54(2):135-146)、hsp27、hsp70、hsp73和hsp90(Cardillo等,(2000)Anticancer Res 20(6B):4579-4583;Strik等,(2000)Anticancer Res20(6B):4457-4552)。
3.2.2.3引用摄取RNA和DNA的制剂
对于药物应用的目的,优选地是本发明的嵌合RNA分子直接应用或施用于靶细胞或生物。本领域描述了用于应用作为药物活性成分的RNA的多种方法。
如本文所使用,“施用”指细胞(例如分离形式的或生物中所包含的)与药物活性剂接触并且可以体外或体内实施。对于体内应用,本发明的制剂可以多种形式向患者施用,所述形式适合于所选择的施用途径,例如肠胃外、口服或腹膜内。优选肠胃外施用,肠胃外施用包括下列途径的施用:静脉内;肌内;间隙内;动脉内;皮下;眼内;滑膜内;经上皮,包括经皮;通过吸入的肺部;眼部;舌下和口腔;局部,包括眼部;真皮;眼镜;直肠;以及通过吹人的鼻吸入。对于多种施用方式(例如肠胃外、经粘膜、经皮、口服或局部应用)的优选药物制剂在本领域众所周知并且例如描述于美国专利申请号20040014956中。本发明的药物活性剂可以向患者全身施用。全身吸收指药物进入血流,然后分布于整个身体。导致全身吸收的施用途径包括:静脉内、皮下、腹膜内和鼻内。所选择的递送方法将导致进入细胞。优选的递送方法包括脂质体(10-400nm)、水凝胶、控释聚合物和其它药物可适用媒介物和微注射或电穿孔(对于先体外后体内治疗)。可以选择药物递送媒介物用于例如体外、全身或局部施用。可将这些媒介物设计成作为缓慢释放的储池起作用或者将其内容物直接递送至靶细胞。使用一些直接递送药物媒介物的优点在于多个分子经由摄入而被递送。属于这一类的专门的药物递送媒介物的一些实例是脂质体、水凝胶、环糊精、生物可降解纳米囊和生物粘附微球体。在一个实施方案中,用寡核苷酸对细胞的体外治疗可用于从受试者取出的细胞的先体内后体外治疗(例如对于白血病或病毒感染的治疗)或用于对非源于受试者但施用于受试者的细胞进行治疗(例如消除待移植进入受试者的细胞上的移植抗原的表达)。此外,细胞的体外治疗可用于非治疗环境,例如评估基因功能、研究基因调节和蛋白质合成或评估对设计成调节基因表达或蛋白质合成的寡核苷酸的改进。体内细胞治疗可用于希望抑制蛋白质表达的某些临床环境。
本发明的用于药物用途的组合物包括嵌合RNA分子或用于其产生的表达构建体(下文称作“药物活性剂”)。任何活性剂可单独使用,或者与可药用载体和用于药物递送的额外的任选成分组合使用。如本文所使用,“可药用载体”包括包括适宜溶剂、分散介质、涂层剂、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂等。用于药物活性物质的此类介质和活性剂的使用在本领域众所周知。适宜的可药用载体促进本发明多核苷酸组合物的施用,但其是生理惰性的和/或无害的。载体可由本领域技术人员选择。此类载体包括但不限于无菌盐水、磷酸、缓冲盐水、葡萄糖、无菌水、甘油、乙醇、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、橄榄油、芝麻油和水及其组合。此外,载体或稀释剂可包括时间延迟物质,例如单独的单硬脂酸甘油酯或二硬脂酸甘油酯或与蜡的组合。此外,可使用缓慢释放多聚体制剂。制剂应该既适合于递送剂的形式又适合于施用方式。依照施用方式选择适宜载体由本本领域技术人员常规开展。对于载体的额外成分可包括但不限于佐剂、防腐剂、化学稳定剂或其它抗原蛋白质。适宜的示例性防腐剂包括三氯叔丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟苯甲酸类、乙基香草醛、甘油、苯酚和对氯酚。可以使用的适宜稳定剂成分包括例如酪蛋白氨基酸、蔗糖、明胶、酚红、N-Z胺、二磷酸一钾、乳糖、乳白蛋白水解物和奶粉。常规佐剂用于吸引白细胞或者增强免疫应答。其中,此类佐剂包括Ribi、矿物油和水、氢氧化铝、Amphigen、Avridine、L121/鲨烯、D-丙交酯-聚交酯/糖苷、pluronic plyois、胞壁酰二肽、杀死的博德特氏菌和皂苷类,例如Quil A。
药物活性剂可以掺入到脂质体中或者用聚乙二醇修饰的或与阳离子脂类混合的脂质体中,用于肠胃外施用。向脂质体中掺入额外的物质,例如对特定靶细胞中存在的膜蛋白具有反应性的抗体可帮助将寡核苷酸靶向于特定细胞类型。脂质体可通过本领域已知的多种技术制备。见例如Betageri等,(1993)Liposome Drug Delivery Systems,TechnomicPublishing,Lancaster;Gregoriadis编,(1993)Liposome Technology,CRCPress,Boca Raton,Fla.;Janoff编,(1999)Liposomes:Rational Design,M.Dekker,New York,N.Y.;Lasic&Martin(1995)Stealth Liposomes,CRCPress,Boca Raton,Fla.;Nabel(1997)″Vectors for Gene Therapy″在CD-ROM上的Current Protocols in Human Genetics中,John Wiley&Sons,New York,N.Y.;以及美国专利号4,235,871;4,551,482;6,197,333和6,132,766。将活性剂包埋于本发明的脂质体中可使用本领域任何常规方法开展。在制备脂质体组合物时,可使用稳定剂如抗氧化剂和其它添加剂。其它脂类载体也可依据所要求保护的本发明使用,例如脂微粒、微胶粒、脂悬液和脂乳液。参见例如Labat-Moleur等,(1996)Gene Therapy3:1010-1017;US 5,011,634;6,056,938;6,217886;5,948,767和6,210,707。
本发明的组合物也可包括冻干多核苷酸(其可与形成粉末的其它可药用赋形剂一起使用)、液体或悬浮剂型(包括用于鼻内或肺部应用的那些)。参见例如Remington:Science and Practice of Pharmacy,第2卷,第19版(1995),例如第95章Aerosols;以及国际专利申请号PCT/US99/05547,其教导在本文引用作为参考。
在一些优选的实施方案中,将本发明的药物组合物制备成例如溶液剂、乳剂、粉剂、气雾剂、片剂、胶囊剂、肠包衣片剂或胶囊剂形式向哺乳动物受试者施用。施用或递送药物活性剂的最佳过程会取决于目的结果和/或待治疗受试者而变化。
本发明的药物制剂可以制备成或配制成乳剂或微乳剂。乳剂通常是一种液体以直接通常超过0.1μm的微滴的形式分散于另一种液体中的异源系统。本发明的乳剂可根据需要包含赋形剂例如乳剂、稳定剂、染料、脂肪、油、蜡、脂肪酸、脂肪醇、脂肪酯、湿润剂、亲水胶体、防腐剂和抗氧化剂。这些赋形剂可以水相、油相或自身作为单独的相存在。用于乳化剂和防腐剂的适宜实例在美国专利申请号20040014956中给出。微乳剂是水、油和两亲化合物的系统,其是单一光学各向同性的和热力学稳定的液体溶液。通常,微乳剂如下制备:首先将油分散于表面活性剂水溶液中,然后加入足够量的第4种成分,一般为中等链长度的醇以形成透明系统。适宜表面活性剂和助表面活性剂的实例描述于美国专利申请号20040014956中。从药物稳定性和增强的药物吸收角度来看,微乳剂是特别好的。基于脂的微乳剂(油/水和水/油)已经被建议用于增强药物的口服利用度。预期本发明的微乳剂组合物和制剂会促进提高本发明药物活性剂从胃肠道的全身吸收以及改善寡核苷酸在胃肠道内、阴道内、口腔和施用的其它区域内的局部细胞摄入。
在一个实施方案中,本发明采用多种渗透促进剂以实现本发明药物活性剂(特别是核酸,特别是寡核苷酸)向人和动物皮肤的有效递送。适宜的渗透促进剂描述于美国专利申请号20040146902中,其在本文引用作为参考。
待施用的有用剂量和特定施用方式会根据此类因素而变,如体内使用的细胞类型、年龄、体重和特定动物和其待治疗区域、所使用的特定寡核苷酸和递送方法、所考虑的治疗或诊断用途和制剂形式如悬浮剂、乳剂、微胶粒或脂质体,这对本领域技术人员是显而易见的。通常,剂量以降低水平施用并且增加直至出现目的效果。无需过多实验,可以调整药物活性剂的剂量以最佳地降低靶基因的表达,例如通过RNA稳定性读数或治疗反应所测量。寡核苷酸的确切剂量和所施用剂量的次数会取决于实验性产生的和在临床试验中产生的数据。几种因素如目的效果、递送媒介物、疾病适应症和施用途径会影响剂量。剂量可由本领域普通技术人员容易地确定,并且被配制成用于受试者的药物组合物。优选地,治疗期会延伸至至少疾病症状的整个病程。例如,当用作药物组合物时,本发明的组合物可包括约1ng至约20mg的本发明药物活性剂(例如合成的RNA分子或递送活性剂,其可以是DNA分子、质粒、病毒载体、重组病毒和其化合物)。在递送活性剂是供体细胞或细菌的情况下,本发明的组合物可以约1个细胞至约107个细胞/剂之间的剂量递送。类似地,在递送活性剂是或的重组病毒时,适宜的基于载体的组合物包含1×102pfu至1×1012pfu/剂。
本发明的药物活性剂可与任何其它药物、优选用于同一医学适应症的药物组合。例如对于具有抗癌特性的药物活性剂,活性剂可与通过非反义机制起作用的一种或多种化疗剂组合(例如柔红霉素、伊达比星、丝裂霉素C、5-氟尿嘧啶(5-FU)、甲氨喋呤(MTX)、紫杉醇、长春新碱和顺铂)。
在本发明范围内可以采用的、用于寡核苷酸化合物的药物组合物及其制备、施用和剂量确定的额外的适宜技术在美国专利申请号20040146902中给出。
在一个实施方案中,本本发明的药物活性剂(例如寡核苷酸)可向受试者施用。受试者的实例包括哺乳动物,例如人和其它灵长类;牛、猪、马和耕作(农业)动物;狗、猫和其它家养宠物;小鼠、大鼠和转基因非人动物。
3.3.生物技术应用
根据本发明的方法和组合物可有利地应用于生物技术应用和方法中,包括但不限于优化例如酵母、真菌或其它真核微生物或细胞中用于发酵产生精细化学品如氨基酸(例如赖氨酸或甲硫氨酸)、维生素(例如维生素B2、维生素C、维生素E)、类胡萝卜素、油和脂肪、多不饱和脂肪酸、生物素等的代谢途径。
用于在真核细胞中表达的优选载体包括pWLNE0、pSV2CAT、pOG44、pXT1和pSG(Stratagene Inc.);pSVK3、pBPV、pMSG和pSVL(Pharmacia Biotech,Inc.)。可以提到的可诱导载体是pTet-tTak、pTet-Splice、pcDNA4/TO、pcDNA4/TO/LacZ、pcDNA6/TR、pcDNA4/TO/Myc-His/LacZ、pcDNA4/TO/Myc-HisA、pcDNA4/TO/Myc-His B、pcDNA4/TO/Myc-His C、pVgRXR(Invitrogen,Inc.)或pMAM下列(Clontech,Inc.;GenBank登录号:U02443)。这些载体已经提供可诱导的调节控制元件,例如DSBI酶的化学诱导表达。编码DSBI酶的核酸序列可直接插入到这些载体中。用于在酵母中表达的载体包括例如pYES2、pYD1、pTEFl/Zeo、pYES2/GS、pPICZ、pGAPZ、pGAPZalph、pPIC9、pPIC3.5、PHIL-D2、PHIL-Sl、pPIC3SK、pPIC9K和PA0815(Invitrogen,Inc.)。原则上,对于动物细胞或酵母细胞的转化,可应用与植物细胞的“直接”转化相似的方法。具体而言,优选方法如磷酸钙或脂质体介导的转化或电穿孔。原则上,可以使用的选择标记是许多选择系统,其对于植物也是优选的。对于哺乳动物细胞而言特别优选的是新霉素(G418)抗性、潮霉素抗性、zeocin抗性或嘌呤霉素抗性。氨苄青霉素抗性、卡那霉素抗性或四环素抗性对于原核生物是特别优选的。
取决于宿主生物,在本发明方法中使用的生物以技术人员熟悉的方式生长或培养。通常,微生物在包含碳源(通常以糖的形式)、氮源(通常以有机氮源的形式,如酵母提取物)或盐如磷酸铵、痕量因素如铁、锰和镁盐以及根据需要的维生素的液体培养基中,于0℃和100℃之间、优选10℃至60℃之间的温度下生长,伴随着通氧。液体培养基的pH可维持在恒定值,即在培养过程中调节,或者不调节。培养可以是分批的、半分批的或连续的。营养物可在发酵开始提供或者以半连续或连续方式补料。
4.实施例部分
本领域技术人员会认识到或能够仅使用常规实验确定本文所述本发明具体实施方案的许多等效物。此类代谢物旨在包括在后附权利要求书内。所有专利、公开的专利申请以及本文引用的其它参考文献的全部内容在本文中完整引用作为参考。
可参照下列实施例更容易地理解已经一般描述的本发明。实施例仅用于说明本发明某些方面和实施方案的目的并且不旨在限制本发明。
除非另外声明,全部化学药品从Fluka(Buchs)、Merck(Darmtadt)、Roth(Karlsruhe)、Serva(Heidelberg)和Sigma(Deisenhofen)获得。限制性内切酶、DNA修饰酶和分子生物学试剂盒购自Amersham-Pharmacia(Freiburg)、Biometra(
Figure A20068002199101381
)、Roche(Mannheim)、New EnglandBiolabs(Schwalbach)、Novagen(Madison,Wisconsin,USA)、Perkin-Elmer(Weiterstadt)、Qiagen(Hilden)、Stratagen(Amsterdam,Netherlands)、Invitrogen(Karlsruhe)和Ambion(Cambridgeshire,United Kingdom)。所用试剂按照制造商说明书进行应用。
除非另外指出,本发明的操作应用细胞生物学、细胞培养、分子生物学、微生物学、重组DNA和免疫学的常规技术,这些技术是本领域技术人员所熟悉的。此类技术在文献中进行了充分说明。见,例如分子克隆实验指南,第2版,Sambrook,J.等编,(Cold Spring Harbor Laboratory Press(1989));Short Protocols in Molecular Biology,第3版,Ausubel,F.等编,(Wiley,N.Y.(1995));DNA Cloning,第I卷和第II卷(D.N.Glover编,1985);Oligonucleotide Synthesis(M.J.Gait编,(1984));Mullis等,美国专利号:4,683,195;Nucleic Acid Hybridization(B.D.Hames和S.J.Higgins编,(1984));论文,Method In Enzymology(Academic Press,Inc.,N.Y.);Immunochemical Method In Cell And Molecular Biology(Mayer和Walker编,,Academic Press,London(1 987));Handbook Of ExperimentalImmunology,第I-IV卷(D.M.Weir和C.C.Blackwell编,(1986));和Miller,J.Experiments in Molecular Genetics(Cold Spring Harbor Press,ColdSpring Harbor,N.Y.(1972))。
使用例如亚磷酰胺方法以已知方法能够进行寡核苷酸的化学合成(Voet,Voet,第2版,Wiley Press New York,第896-897页)。为了本发明的目的,如Sambrook等,(1989)Cold Spring Harbor Laboratory Press;ISBN 0-87969-309-6中所描述进行克隆步骤,例如限制性酶切、琼脂糖凝胶电泳、DNA片段纯化、核酸转移至硝酸纤维素膜和尼龙膜、DNA片段的连接、大肠杆菌细胞的转化、细菌培养物、噬菌体繁殖和重组DNA的序列分析。使用ABI激光荧光DNA测序仪通过Sanger方法(Sanger等,(1977)Proc Natl Acad Sci USA 74:5463-5467)对重组DNA分子进行测序。实施例1:在双子叶和单子叶植物植物中农杆菌介导的转化
1.1转基因拟南芥(Columbia)植物的转化和再生
为了产生转基因拟南芥属植物,用多种ptxA或SbHRGP3启动子/GUS载体构建体转化根癌农杆菌(菌株C58C1 pGV2260)。农杆菌菌株随后用于产生转基因植物。为此,将单个转化的农杆菌菌落在4mL培养物中28℃孵育过夜(培养基:YEB培养基,添加50g/mL卡那霉素和25g/mL利福平)。该培养物随后用于接种含相同培养基的400mL培养物,并且将该培养物孵育过夜(28℃,220转/分)并离心(GSA rotor,8,000转/分,20分钟)。将沉淀重悬于浸润培养基(infiltration medium)(1/2 MS培养基;0.5g/LMES,pH5.8;50g/L蔗糖)中。将悬浮物导入植物盒(Duchefa)中,并且加入100mL SILWET L-77(聚环醚改性七甲基三硅氧烷;Osi Specialties Inc.,目录编号P030196)至终浓度为0.02%。在干燥器内,将盛有8-12株植物的植物盒暴露于真空10-15分钟,随后自然通风。重复该过程2或3次。之后,将全部植物植入装有潮湿土壤的花盆并且在长日照条件下(白天温度为22-24℃,夜间温度为19℃,相对空气湿度为65%)生长。6周后收获种子。
作为选择,可以通过根转化获得转基因拟南芥植物。使用最大龄为8周的植物的白色根芽。为此,使用在无菌条件下维持于1MS培养基(1%蔗糖;100mg/L肌醇;1.0mg/L硫胺素;0.5mg/L吡哆醇;0.5mg/L烟酸;0.5g MES,pH5.7;0.8%琼脂)中的植物。根在诱导愈伤组织的培养基(1×Gamborg’s B5培养基;2%葡萄糖;0.5g/L巯基乙醇;0.8%琼脂;0.5mg/L 2,4-D(2,4-二氯苯氧乙酸);0.05mg/L激动素)中生长3天。将长度为0.5cm的根切段转移至10-20mL诱导愈伤组织的液体培养基(如上所描述的组合物,但不添加琼脂)中,用1mL上述过夜的农杆菌培养物(28℃,200转/分生长于LB中)进行接种,并振荡2分钟。当多余的培养基已经倒掉之后,将根外植体转移至含琼脂的诱导愈伤组织培养基中,随后转移至不含琼脂的诱导愈伤组织液体培养基(含500mg/L羧噻吩青霉素钠,SmithKlineBeecham Pharma GmbH,Munich)中,振荡孵育并最终转移至诱导枝的培养基(5mg/L 2-异戊烯腺嘌呤磷酸;0.15mg/L吲哚-3-醋酸;50mg/L卡那霉素;500mg/L羧噻吩青霉素钠)中。5周后,并且更换1或2次培养基后,将小的绿色的枝转移至萌芽培养基(1MS培养基;1%蔗糖;100mg/L肌醇;1.0mg/L硫胺素;0.5mg/L吡哆醇;0.5mg/L烟酸;0.5g MES,pH 5.7;0.8%琼脂)中并再生形成植物。
1.2转化和农作物植物再生
为了达到转化农作物植物的目的,还可以利用标准转化和再生技术进行农杆菌介导的植物转化(Gelvin和Schilperoort(1995)Plant MolecularBiology Manual,第2版,Dordrecht:Kluwer,Academic Publ.ISBN0-7923-2731-4;Glick和Thompson(1993)Method in Plant MolecularBiology and Biotechnology,Boca Raton:CRC Press,ISBN 0-8493-5164-2)。
例如,油菜可以通过子叶或下胚轴转化进行转化(Moloney等,(1989)Plant Cell Reports 8:238-242,de Block等,(1989)Plant Physiol.91:694-701)。用于筛选农杆菌和植物的抗生素的使用依赖于用于转化的双元载体和农杆菌菌株。油菜的筛选一般使用卡那霉素作为植物选择标记进行。运用例如Mlynarova等,((1994),The Plant Cell Report 13:282-285)所描述的技术可以将农杆菌介导的基因转移入亚麻籽(亚麻(Linumusitatissimum))。大豆的转化可以使用例如描述于EP-A1 0424 047或EP-A10397 687、US 5,376,543、US 5,169,770中的技术进行。玉米和其他单子叶植物植物的转化可以使用例如描述于US 5,591,616中的技术进行。
使用粒子轰击、聚乙二醇介导DNA摄取或者通过碳化硅纤维技术进行的植物转化已经进行了描述,例如,Freeling和Walbot(1993)”The maizehandbook”ISBN 3-540-97826-7,Springer Verlag New York)。
实施例2:报告基因表达的检测
通过轰击植物组织或培养细胞(实施例2.1)、PEG-介导(或相似方法)将DNA导入植物原生质体(实施例2.2),或者通过农杆菌介导的转化(实施例2.3)开展这些试验。用于这些试验的靶组织可以是植物组织(例如叶组织已经被描述为最易支持IRES-介导的翻译(Urwin等,2000))、培养的植物细胞(例如玉米BMS),或者用于农杆菌方案的植物胚。
2.1使用微粒轰击的瞬时分析
使用Qiagen质粒提取试剂盒(目录号12143)分离质粒构建体。按照Sanford等,(1993)描述的方法将DNA沉淀于0.6μM的金颗粒上(Bio-Rad,目录号165-2262),并且使用PDS-1000/He系统装置(Bio-Rad)加速轰击到靶组织(例如2周龄玉米叶、BMS培养的细胞等)上。全部DNA沉淀和轰击步骤在室温无菌条件下进行。
将2mg金颗粒(2mg/3次射击)重悬于100%乙醇中,随后在BeckmanMicrofuge 18离心机中以2000转/分沉淀于Eppendorf管中。将沉淀在无菌蒸馏水中漂洗1次,离心,并重悬成为25μL 1μg/μL的总DNA。随后将以下试剂加入管中:220μL H2O、250μL 2.5M CaCl2、50μL 0.1M亚精胺、游离碱。将DNA溶液简单涡旋振荡并放置于冰上5分钟,随后在BeckmanMicrofuge 18离心机中以500转/分离心5分钟进行沉淀。弃除上清夜。将沉淀重悬于600μL乙醇中,随后以14,000转/分离心1分钟进行沉淀。将最终的沉淀重悬于36μL乙醇中并立即使用,或者在进行轰击前贮存于冰上最长4小时。对于轰击,将2周龄的玉米叶切割至长度大约为1cm并放置于直径2英寸的无菌Whatman滤纸上。对于BMS培养的细胞,将5mL 1周龄悬浮细胞缓慢真空过滤到置于滤器上的直径2英寸的滤纸上,以去除多余的液体。轰击前,将载有植物材料的滤纸在渗透性诱导培养基(N6 1-100-25,0.2M甘露醇、0.2M山梨醇)上黑暗放置2-3小时。射击前几分钟,将滤纸从培养基上移开并放置于灭菌的打开盖的培养皿上允许愈伤组织表面部分干燥。为了保存植物材料的位置,将灭菌金属晒网放在样品上面。对于叶材料,每个平皿用10μL金-DNA溶液以2,200psi射击1次,对于BMS培养的细胞,每个平皿用10μL金-DNA溶液以1100psi射击2次。轰击后,将载有样品的滤纸转移至MS基础培养基上并在瞬时分析前在27℃黑暗孵育2天。为了确定潜在的强的和严紧的候选终止子,使用本领域的方法通过定量报告基因表达和RT-PCR测定报告基因的瞬时表达水平。
2.2使用原生质体的瞬时方法
按照Sheen(1990)开发的方法进行原生质体的分离。将玉米苗在黑暗25℃维持10天并且在制备原生质体之前光照20小时。将叶的中部切割成0.5mm的条(长度约6cm)并在含有1%(w/v)纤维素RS、0.1%(w/v)离析酶R10(均购自Yakult Honsha,Nishinomiya,Japan)、0.6M甘露醇、10mMMes(pH 5.7)、1mM CaCl2、1mM MgCl2、10mM β-巯基乙醇和0.1%BSA(w/v)的酶溶液中23℃孵育3小时,随后以80转/分轻轻振荡10分钟以释放原生质体。100×g离心2分钟收集原生质体,在0.6M冷的甘露醇溶液中洗涤1次,离心,并重悬于冷的0.6M甘露醇溶液中(2×106/mL)。将在总体积100μL无菌水中的总共50μg质粒DNA加入到0.5mL玉米原生质体悬浮液(1×106细胞/mL)中并轻轻混匀。边轻轻振荡边加入70℃预热的0.5mL PEG溶液(40%PEG 4000、100mM CaNO3、0.5甘露醇),随后加入4.5mL MM溶液(0.6M甘露醇、15mM MgCl2和0.1%MES)。将该混合物在室温孵育15分钟。通过以600转/分离心5分钟沉淀并重悬于1.0mL MMB溶液[0.6M甘露醇、4mM Mes(pH 5.7)和雀麦花叶病毒(BMV)盐(可任选)]中将原生质体洗涤2次,并在25℃黑暗孵育48小时。最后洗涤步骤后,收集原生质体于3mL MMB培养基,并在25℃黑暗孵育48小时。为了确定潜在的强的和严紧的候选终止子,使用本领域的方法通过定量报告基因表达和RT-PCR测定报告基因的瞬时表达水平。
2.3检测GUS报告基因
为了鉴定产生组织特异性的启动子和启动子必需元件的特性,有必要在已知的报告基因前面放置其启动子及其各种片断,报告基因允许测定表达活性。可以提及的一个例子是细菌β-葡糖醛酸糖苷酶(Jefferson等,EMBO J 6:3901-3907(1987)。在活性染色法中,借助显色底物例如5-溴-4-氯-3-吲哚-β-D-葡糖醛酸能够在植物原位检测β-葡糖醛酸糖苷酶活性(Jefferson等,Plant Mol Biol Rep 5:387-405(1987))。为了研究组织特异性,如所描述将植物组织切割、包埋、染色和分析(例如
Figure A20068002199101431
等,(1991a)MolGen Genet 225(3):459-467,
Figure A20068002199101432
等,(1991b)Mol Gen Genet225:121-128)。
第二种测定法允许在所研究的组织中定量测定GUS活性。对于定量活性测定,MUG(4-甲基繖形基-β-D-葡糖苷酸)用作β-葡糖苷酸酶的底物,并且MUG被切割成MU(甲基繖形酮)和葡萄糖醛酸。
为此,首先制备目的组织的蛋白质提取物并随后将GUS底物加入提取物中。仅在GUS已经起反应之后能够荧光性测量底物。随后样品在荧光计上各个时间点进行测量。例如可以用不同发育期(开花后21、24或30天)的亚麻籽胚进行该测定。为此,在每个测定中,在振荡研磨碾碎机(型号:Retsch MM 2000)的辅助下将一个胚在放于液氮中的2mL反应器中碾成粉末。加入100μL EGL缓冲液(0.1M KPO4,pH 7.8;1mM EDTA;5%甘油;1M DTT)后,将混合物在25℃以14,000×g离心10分钟。取出上清并重新离心。再次,将上清转移至新的反应器中并保存于冰上直到下次使用之前。用65μL EGL缓冲液(不含DTT)处理25μL该蛋白质提取物并应用于GUS测定。现在加入10μL底物MUG(10mM 4-甲基繖形基-β-D-葡糖苷酸),涡旋振荡混合物,并立即取出30μL作为零点值,并用470μL终止缓冲液(0.2M Na2CO3)进行处理。对于全部样品以30秒的间隔重复该操作。取出的样品贮存于冰箱直到测量之前。1小时之后和2小时之后读取其他读数。对于荧光测量,建立包含浓度从0.1mM至10mM MU(4-甲基繖形酮)的校准系列。如果样品值超出这些浓度,则应用更少的蛋白质提取物(10μL、1μL、来自1∶10稀释的1μL),并且测量更短的时间间隔(0小时、30分钟、1小时)。在Fluoroscan II装置(Labsystem)上以365nm激发光和445nm发射光条件下进行测量。作为备选,如Bustos等,(1989)Plant Cell1(9):839-53中所描述,可以在碱性条件下(365nm激发,测量455nm的发射光;光谱荧光计BMG Polarstar+)通过荧光测量底物裂解。全部样品通过Bradford方法(1976)Anal.Biochem.72:248-254测量蛋白质浓度,从而允许鉴定多种组织和植物中的启动子活性和启动子强度。
2.4荧光蛋白质基因的检测
几种荧光蛋白质基因,例如DsRed、ZsGreen、ZsYellow、ZsCyan和AcGFP(BD Biosciences),来自珊瑚虫和水母新物种。已经显示这些荧光蛋白质能够在多种植物物种中用作报告子(Wenck A.等,Plant Cell Report,22:244-251,2003)。携带荧光蛋白质的植物材料(例如叶和根)可以利用具有适当滤光片的落射荧光显微镜直接观察。此外,可以用荧光成像仪例如Typhoon 9400(Amersham Biosciences)按照制造商推荐的说明书,以定量方式分析指示蛋白质表达水平的荧光蛋白质强度。
实施例3:microRNA表达分析
分析在RNA水平上进行(例如通过Northern印迹分析或实时定量qPCR)。作为备选,可以通过非归一化组织特异性cDNA文库中特异性miRNA序列的出现评价表达谱,并且通过“计算”所述文库中特异性miRNA的cDNA序列的数量能够在计算机上估计表达谱。
3.1 Northern杂交
测定基因转录的量的适宜方法是进行Northern印迹分析(通过参考文献的方法,见Ausubel等,(1988)Current Protocols in Molecular Biology,Wiley:New York,或者上述实施例部分),其中用可检测标记物(通常是放射性标记物或化学发光标记物)标记以结合至目的基因方式设计的引物,以致于当生物培养物的总RNA被提取、在凝胶上分离、转移至稳定基质和用该探针进行孵育时,结合和探针结合的延伸可以指示该基因mRNA的存在和数量。该信息还指示转化基因的转录程度。细胞总RNA能够通过多种方法从细胞、组织或器官进行制备,全部方法在本领域中是熟知的,例如Bormann,E.R.等,(1992)Mol.Microbiol.6:317-326描述的方法。
为了进行RNA杂交,如Amasino(1986,Anal.Biochem.152,304)中所述,将20μg总RNA或1μg poly(A)+RNA通过的使用甲醛强度为1.25%的琼脂糖凝胶进行凝胶电泳的方式分离、使用10×SSC用毛细管方式印迹到带正电荷的尼龙膜(Hybond N+,Amersham,Braunschweig)上、通过UV光方法固定化,并且使用杂交缓冲液(10%硫酸葡聚糖w/v、1M NaCl、1%SDS、100mg鲱鱼精子DNA)在68℃预杂交3小时。在预杂交过程中利用Highprime DNA标记试剂盒(Roche,Mannheim,Germany)用α-32P-dCTP(Amersham Pharmacia,Braunschweig,Germany)标记DNA探针。已经加入标记的DNA探针后,在相同的缓冲液中于68℃杂交过夜。洗涤步骤为在68℃使用2×SSC洗涤2次15分钟并用1×SSC,1%SDS洗涤2次30分钟。密封后的滤膜在-70℃曝光1-14天。
3.2 RT-qPCR
当总RNA从生物或特异性组织或细胞类型分离后,将RNA在变性的15%聚丙烯酰胺凝胶上进行分离。切取代表15-26核苷酸大小范围的凝胶片段,洗脱小RNA并回收。随后,将小RNA连接到RNA/DNA嵌合寡核苷酸接头的5’和3’端。使用RT引物进行逆转录反应,随后用适宜引物进行PCR。然后将PCR产物克隆入载体进行测序(Sunkar R和Zhu JK,The PlantCell 16:2001:2019,2004)。
3.3结果
下面的表显示发现于植物和动物或哺乳动物物种中各种miRNA的一些表达谱。在miRNA克隆和随后的测序过程中,一些miRNA克隆显示出不同的末端核苷酸(尤其是3’末端),在文中用小写字母表示。miRNA的3′末端通常不太重要。
Figure A20068002199101471
Figure A20068002199101481
Figure A20068002199101491
Figure A20068002199101501
Figure A20068002199101511
Figure A20068002199101521
Figure A20068002199101531
Figure A20068002199101541
Figure A20068002199101551
Figure A20068002199101561
Figure A20068002199101571
Figure A20068002199101591
Figure A20068002199101601
Figure A20068002199101611
Figure A20068002199101621
Figure A20068002199101631
表6:在Hyseq数据库中鉴定的玉米miRNA
miRNAID SEQ IDNO: miRNA序列   长度(nt) 玉米miRNA前体
miR167-like 47 UGAAGCUGCCAGCAUGAUCU 20 Contig906562178918ZM
miR171 53 UGAUUGAGCCGCGCCAAUAUC 21 Contig523561430017ZM
miR167-like 48 UGAAGCUGCCAGCAUGAUCUG 21 Contig906562178918ZM
miR167 46 UGAAGCUGCCAGCAUGAUCUGG 22 Contig906562178918ZM
miR167-like 49 UGAAGCUGCCAGCAUGAUCUAU 22 Contig906562178918ZM
miR171-like 54 UGAUUGAGCCGCGCCAAUAU 20 Contig523561430017ZM
miR167-like 50 AUGAAGCUGCCAGCAUGAUCUA 22 Contig906562178918ZM
miR390 55 AAGCUCAGGAGGGAUAGCGCC 21 Contig434059283967ZM
miR167-like 51 GUGAAGCUGCCAGCAUGAUCUA 22 Contig906562178918ZM
miR166 42 UCGGACCAGGCUUCAUUCCCC 21 57507158.f_k09_157507158.f_k09_1
miR156 31 UGACAGAAGAGAGUGAGCAC 20 Contig394558989601ZM
miR159 35 UUUGGAUUGAAGGGAGCUCUA 21 Contig947062202898ZM
miR160 39 UGCCUGGCUCCCUGUAUGCCA 21 65442307.f_l16_165442307.f_l16_1
miR156-like 32 UUGACAGAAGAGAGUGAGCAC 21 Contig394558989601ZM
ASRP754-like 28 AGCUCAGGAGGGAUAGCGCC 20 Contig434059283967ZM
miR166-like-1 43 UCGGACCAGGCUUCAUUCCCCC 22 57507158.f_k09_157507158.f_k09_1
miR159-like 36 UUUGGAUUGAAGGGAGCUCUU 21 Contig947062202898ZM
miR160-like 40 UGCCUGGCUCCCUGUAUGCCAU 22 65442307.f_l16_165442307.f_l16_1
miR160-like 41 GCCUGGCUCCCUGUAUGCCA 20 65442307.f_l16_165442307.f_l16_1
miR159-like 37 UCUUUGGAUUGAAGGGAGCUC 21 Contig947062202898ZM
miR166-like 44 UUCGGACCAGGCUUCAUUCCCC 22 57507158.f_k09_157507158.f_k09_1
miR166-like 45 UUCGGACCAGGCUUCAUUCCC 21 57507158.f_k09_157507158.f_k09_1
miR156-like 33 GUGACAGAAGAGAGUGAGCAC 21 Contig394558989601ZM
ASRP754-like 29 AAGCUCAGGAGGGAUAGCGC 20 Contig434059283967ZM
miR159-like 38 UUUGGAUUGAAGGGAGCUCU 20 Contig947062202898ZM
miRNAID SEQ IDNO: miRNA序列   长度(nt) 玉米miRNA前体
miR170-like 52 UGAUUGAGCCGUGCCAAUAUC 21 58229137.f_c06_158229137.f_c06_1
miR156-like 34 UGACAGAAGAGAGUGAGCACA 21 Contig394558989601ZM
ASRP754-like 30 AGCUCAGGAGGGAUAGCGCCA 21 Contig434059283967ZM
实施例4:用于植物转化的载体构建
典型的植物转化载体或双元载体包含两个植物表达构建体:一个用于选择标记且另一个用于目的基因。每个盒由启动子、待表达基因和终止子组成。通过标准分子克隆操作、PCR或通过Gateway系统(Invitrogen,CA)可以将表达构建体构建入双元载体。
4.1启动子分离
使用Qiagen DNAeasy植物小量提取试剂盒(Qiagen)从玉米和稻中提取基因组DNA。使用常规PCR从基因组DNA分离启动子区域。大约0.1μg消化的基因组DNA用于常规PCR反应(见下)。基于公共数据库中公开的EST候选序列、玉米基因组序列或启动子序列(例如稻咖啡酰CoA-O-甲基转移酶[CCoAMT1],GenBank登录号AB023482;稻未知蛋白质,AP002818;玉米羟脯氨酸丰富糖蛋白质[HRGP],AJ131535;玉米乳酸脱氢酶[LDH],Z11754;稻叶绿体蛋白质12-样,NP914106.1)的玉米或稻基因组DNA序列上游设计引物。在初级PCR反应中1μL稀释的消化基因组DNA用作DNA模板。在包含缓冲液3的混合物中反应包括正向(5’)和反向(3’)引物,按照Expand Long PCR试剂盒(目录号1681-842,Roche-Boehringer Mannheim)概括出的方案。分离的DNA在使用以下引物的PCR扩增反应中用作模板DNA。
表7:用于启动子区域分离的引物序列
  启动子或终止子   大小(bp)   引物序列正向引物(F)和反向引物(R)
  稻咖啡酰-CoA-O-甲基转移酶启动子(Os.CCoAMT1-p)   1,035   F:5’-CAACTACTGCACGGTAAAAGTGATAGG-3’(SEQ ID NO:64)R:5’-GCAGCTTGCTTCGATCTCTCGCTCGCC-3’(SEQ ID NO:65)
  稻C-8,7-甾醇-异构酶启动子(Os.SI-p)   813   FP:5’-TGCCTCGATTCGACCGTGTAATGGAAT-3’(SEQIDNO:66)RP:5’-ACTCCTGGCTTCCTTCCGATCTGGACT-3’(SEQ ID NO:67)
  玉米羟脯氨酸丰富糖蛋白质启动子   1,263   FP:5’-CCGGTGACCTTCTTGCTTCTTCGATCG-3’(SEQID NO:68)
  启动子或终止子   大小(bp)   引物序列正向引物(F)和反向引物(R)
  (Zm.HRGP-p)   RP:5’-CCTCTCTCTCACACACACTCTCAGTAA-3’(SEQ ID NO:69)
  玉米乳酸脱氢酶启动子(Zm.LDH-p)   1,061   FP:5’-AACAAATGGCGTACTTATATAACCACA-3’(SEQ ID NO:70)RP:5’-CGGGCGGAATGGGATGGGATTACGTGT-3’(SEQ ID NO:71)
  稻叶绿体蛋白质12启动子(Os.CP12-p)   998   FP:5’-TTTGTATTTAGGTCCCTAACGCCCTC-3’(SEQ ID NO:#72)RP:5’-TGTTGATGCGGATTTCTGCGTGTGAT-3’(SEQ ID NO:73)
在最适PCR热循环仪程序(T3Thermocycler Biometra;95℃180秒,1个循环;95℃40秒,53℃60秒,72℃2分钟,30个循环;72℃5分钟,1个循环,之后4℃终止反应)下,在反应溶液[1×PCR反应缓冲液(Roche Diagnostics),5μL基因组DNA(对应大约80ng,dATP、dCTP、dGTP和dTTP每种2.5mM(Invitrogen:dNTP混合物),1μL 5’引物(100μM),1μL 3’引物(100μM),1μL Taq DNA聚合酶5U/μL(RocheDiagnostics),终体积为100μL)中扩增启动子区域。
将PCR产物在1%(w/v)琼脂糖凝胶上以80V电压进行电泳分离,随后切胶并利用Qiagen胶提取试剂盒(Qiagen,Hilden,Germany)进行纯化。根据需要,50μL的洗脱液可以被蒸发浓缩。按照制造商的说明书将PCR产物直接克隆入载体pCR4-TOPO(Invitrogen),即利用PCR产物所具有的A悬突和拓扑异构酶将所获得的PCR产物插入到具有T悬突的载体中。
4.2包括3’非翻译区的目的终止子的分离
利用基于公共数据库中所公开序列的序列特异性引物(GenBank登录号AB023482、AJ131535、Z11754;表8),分离包含目的3’非翻译区的基因组DNA片段。使用本领域的方法(Sambrook,1987)进行植物基因组DNA分离和用序列特异性引物的常规PCR扩增。
表8:用于终止子区域分离的引物序列
  终止子   大小(bp)   引物序列正向引物(F)和反向引物(R)
  稻咖啡酰-CoA-O-甲基转移酶终止子(Os.CCoAMT1-t) 1,092   FP:5’-GCCGATGCCCAAGAACTAGTCATTTTA-3’(SEQ ID NO:74)RP:5’-ATTAACACGTCAACCAAACCGCCGTCC-3’(SEQ ID NO:75)
  玉米羟脯氨酸丰富糖蛋白质终止子(Zm.HRGP-t)   541   FP:5’-AAAGCGATGCCTACCATACCACACTGC-3’(SEQ ID NO:76)RP:5’-TGCCCACATTTATTATGGTTTTACACCC-3’(SEQ ID NO:77)
  玉米乳酸脱氢酶终止子(Zm.LDH-t)   475   FP:5’-TGATCACATCACCGTCTCTCTTCATTAA-3’(SEQ ID NO:78)RP:5’-TATCCCAGTCTCGATATTGTCATCCGCT-3’(SEQ ID NO:79)
上表中列出的引物序列代表所用实际引物的3’部分。对于正向引物所述引物还包含SacI限制性酶切位点接头(5’-GAGCTC-3’),对于反向引物还包含PmeI限制性酶切位点接头(5’-GTTTAAAC-3’)(为了进一步克隆将这些接头加入序列特异性引物中)。
4.3基于pUC的载体(目的启动子::内含子(IME)::GUS::终止子)
基本载体(pBPSMM270)包含多克隆位点(MCS),随后按顺序(5’-3’)首先是玉米泛蛋白内含子,然后是GUSint ORF(包括马铃薯转化酶[PIV]2内含子以阻止细菌表达)和胭脂碱合酶(NOS)终止子。可以在BglI和XmaI位点用具有内含子介导增强功能的目的内含子替换玉米泛蛋白内含子。
用PacI和AscI消化Topo载体(Invitrogen)中包含目的启动子(Os.CCoAMT1、Os.SI,Zm.HRGP、Zm.LDH或Os.CP12启动子)的基因组DNA片段,随后将玉米泛蛋白内含子的上游亚克隆入GUS构建体。
使用SacI和PmeI酶消化包含目的终止子的PCR片段(例如包括CCoAMT1终止子的1,092bp稻基因组DNA;包括HRGP终止子的558bp玉米基因组DNA、包括LDH终止子的477bp玉米基因组DNA)。胭脂碱合酶终止子区域用目的终止子替换。
为了在终止子区域内包含miRNA标签,化学合成了目的miRNA的互补序列(最多21bp),在序列的5’和3’末端包含SacI限制性酶切位点(表9),并随后亚克隆入GUS基因和目的终止子之间。标签可以插入到不影响基因功能的目的基因的5’UTR或3’UTG或编码区。
表9:BPS miRNA标签序列和表达模式
 miRNA标签[MRT]ID   SEQ ID NO   标签序列(5’-3’)   miRNA表达
 BPS.MRT1   80   ACAGATCATGCTGGCAGCTTCA   主要在种子中
 BPS.MRT2   81   TAGAGCTCCCTTCAATCCAAA   非种子组织
4.4转化双元载体(不含miRNA标签的启动子构建体)
用AscI或PacI(5’)和PmeI(3’)消化基于pUC的载体中的GUS嵌合表达盒,并在AscI或PacI(5’)和PmlI(3’)位点亚克隆入包含植物选择标记表达盒(pBPSMM344)的单子叶植物双元载体中,以产生用于植物转化的启动子构建体(表10)。
表10:在双元载体中不含miRNA标签的启动子构建体
  启动子构建体   SEQID NO:   构成[启动子(p)::IME-内含子(i)::GUS::终止子(t)](数字表示构建体中的核苷酸位置)
  pBPSMM232   84   玉米泛蛋白-p::玉米泛蛋白-i::GUS(PIV2)::NOS-t玉米泛蛋白启动子和内含子(1981bp):298-2278,GUS(2001bp):2305-4305,NOS终止子(253bp):4376-4628miRNA标签插入位点:4365(Sac I)
  pBPSMM271   85   Os.CCoAMT1-p::玉米泛蛋白-i::GUS(PIV2)::NOS-tOs CCoAMT1启动子(1034bp):227-1260,玉米泛蛋白内含子(1051bp):1319-2369,GUS(2001bp):2389-4389,NOS终止子(253bp).:4461-4713miRNA标签插入位点:4450(Sac I)
  pBPSMM272   86   玉米LDH-p::玉米泛蛋白-i::GUS(PIV2)::NOS-t玉米LDH启动子(1062bp):255-1316,泛蛋白内含子(1051bp):1355-2405,GUS(2001bp):2425-4425,NOS终止子(253bp):4497-4749miRNA标签插入位点:4486(SacI)
  PBPSMM304   87   Os.CP12-p::玉米泛蛋白-i::GUS(PIV2)::NOS-tOs CP12启动子(998bp):3859-4856,
  启动子构建体   SEQID NO:   构成[启动子(p)::IME-内含子(i)::GUS::终止子(t)](数字表示构建体中的核苷酸位置)
  玉米泛蛋白内含子(1051bp):2769-3819,GUS(2001bp):749-2749,NOS终止子(253bp):426-678miRNA标签插入位点:694(Sac I)
  pBPSMM331   88   Os.SI-p::玉米泛蛋白-i::GUS(PIV2)::NOS-tOs SI启动子(814bp):3912-4725,玉米泛蛋白内含子(1051bp):2824-3874,GUS(2001bp):804-2804,NOS终止子(253bp):481-733miRNA标签插入位点:749(Sac I)
  pBPSMM325   89   Os.CCoAMT1-p::玉米泛蛋白-i:GUS(PIV2)::CCoAMT1-tOs CCoAMT1启动子(1034bp):305-1338,玉米泛蛋白内含子:(1051bp)1345-2395,GUS(2001bp):2407-4407,CCoAMT1终止子(1104bp):4446-5549.miRNA标签插入位点:4793(AgeI)
  pBPSET003   玉米HRGP-p::玉米泛蛋白-i::GUS(PIV2)::玉米HRGP-t
  pBPSET007   玉米LDH-p::玉米泛蛋白-i::GUS(PIV2)::玉米LDH-t
上述启动子优选地用如下miRNA标签进行改进以便具有更高的启动子特异性:具有泛蛋白内含子的Os CCoAMT启动子(pBPSMM271)或具有泛蛋白内含子的玉米LDH启动子(pBPSMM272)在根和籽粒中具有强活性。通过使用玉米miR167标签,在籽粒中的表达被去除并且目的基因成为主要在根中表达。
具有泛蛋白内含子的Os CP12启动子在叶中为强活性,而在胚乳中为中度活性,在根和胚中未观察到活性。通过使用玉米miR167标签,在胚乳中的表达被去除并且目的基因成为主要在叶中表达。另外,通过使用玉米miR166h标签,在叶中的表达被降低或去除并且目的基因主要在胚乳中表达。
具有泛蛋白内含子的Os SI启动子在根和籽粒中为强活性,而在叶中为弱活性。通过使用玉米miR166h标签,在叶中的表达被去除并且目的基因主要在根中表达。
利用PCR和标准克隆方法,可以将miRNA标签导入GUS基因终止密码子之后的终止子的起始点。例如,利用唯一的SacI位点(Sac I和Pac I是唯一的位点,以便从pBPSMM271去除NOS终止子)能够实现插入过程。通过使用以下引物进行PCR可以将miR166h的miRNA-标签整合入NOS终止子区域:
正向引物(SEQ ID NO:209):
5’-GGGAGCTCGGGGAATGAAGCCTGGTCCGAgaatttccccgatcgttcaaacatttggca
SacI位点用下划线标出;miR166h标签用粗体标出。
反向引物(SEQ ID NO:210):
5’TCGGACCGTTAATTAACACAAACTGAAGGC
Pac I位点用下划线标出。
模板DNA是miRNA-标签插入之前载体。PCR产物随后用限制性内切酶Sac I和Pac I进行酶切。然后通过亚克隆将MM271中的Sac I-Pac I片段与该片段“交换”。对于其他双元载体,例如pBPS MM 272、MM232和MM304,这种策略可以用于将miRNA标签连接入NOS终止子。
实施例5:具有靶向DsRed mRNA的组织特异性miRNA标签的工程化双元载体
双元载体,pBPSLM185(SEQ ID NO:212),包含报告基因表达构建体:ScBV启动子(1398bp)、全长DsRed cDNA(678bp)和NOS终止子(253bp)。ScBV启动子是从甘蔗杆状病毒分离得到的(Schenk等,Plant MolBiol.39:1221-1230,(2004))。DsRed是来自盘体虫某属(Discosoma sp.)珊瑚虫的红色荧光蛋白(Baird,G.S.等,Proc.Natl.Acas.Sci USA97:11984-11989,(2000))。NOS终止子是从农杆菌分离的胭脂碱合酶基因的3’非翻译区。在携带LM185构建体的转基因玉米中,通过荧光显微镜分析可以容易地在整株植物中检测到强红色荧光。通过使用成像仪(Typhoon9400,Amersham Biosciences)可以实现对DsRed表达的定量分析。DsRed的普遍表达源于在每种玉米组织中都活化的ScBV启动子。
为了降低或去除DsRed在玉米叶和雄花穗中的表达,构建了修饰的LM185双元载体PR100。在载体PR100中,利用LM185 DNA为模板通过PCR将短的核苷酸序列或“标签”克隆入NOS终止子。
正向引物(SEQ ID NO:209):
5’-GGGAGCTCGGGGAATGAAGCCTGGTCCGAgaatttccccgatcgttcaaacatttggca
SacI位点用下划线标出;miR166h标签用粗体标出。
反向引物(SEQ ID NO:211):
5’GATCTGGCCGGCCGGGCCCGAATTC
FseI位点用下划线标出。
PCR产物随后用限制性内切酶Sac I和FseI进行酶切。然后通过亚克隆将LM185中的Sac I-FseI片段与该片段“交换”。所得到的PCR产物在NOS终止子的起点处含有“标签1”。PCR产物每个末端的限制性酶切位点使得易于将此种修饰的NOS终止子亚克隆入双元载体的DsRed编码序列后面。该策略应用于将任意miRNA标签导入表达盒。“标签1”序列,5’GGGGAATGAAGCCTGGTCCGA 3’(SEQ ID NO:82),与玉米miRNAmiR166h,5’TCGGACCAGGCTTCATTCCCC 3’,完全互补。携带PR100的转基因玉米在每一种玉米组织中表达具有“标签1”的DsRed mRNA。由于miR166h仅表达于叶和雄花穗中,miR166h特异性识别并结合至叶和雄花穗中DsRed mRNA的“标签”。结果,通过miRNA介导的基因沉默,使这些组织中DsRed mRNA水平降低或去除。在叶和雄花穗中红色荧光降低或去除,而在其他组织中未受影响。
在动物和植物中已经显示,miRNA的5’区域(例如位置2-8nt)和miRNA靶位点之间的互补性是miRNA作用的关键(Mallory等,EMBO Journal,23:3356-3364,(2004);Doench J和Sharp P,Gene&Development 504-511,(2004)),而miRNA的3’区域(例如位置12-19nt)可以与其靶位点错配。此种错配可以降低miRNA介导的基因沉默的效率。
双元载体PR101与PR100相同,除了用“标签2”替代“标签1”。与“标签1”相比,“标签2”即5’GGGGAATGAAGCgTGGaCCGA 3’(SEQ ID NO:82)包含2个突变,“C突变为g”和“T突变为a”。这导致“标签2”和miR166h之间的2个错配。携带PR101的转基因玉米已经降低了叶和雄花穗中的红色荧光。此外,利用成像仪(例如Typhoon 9400)对携带PR100或PR101的转基因玉米的多个事件进行的定量分析显示,在统计学上PR100玉米的红色荧光的强度低于PR101玉米叶和雄花穗中的荧光强度。这是由于“标签1”与PR100中miR166h之间的完全互补性导致DsRed表达巨大降低,反之,“标签2”与PR101中miR166h之间的错配导致叶和雄花穗中DsRed表达较少的降低。
实施例6:具有靶向特性基因或选择标记的组织特异性miRNA标签的工程化双元载体
种子是最重要的农产品,种子广泛地应用于饲料和食品目的。然而,在种子中的转基因表达绝大多数情况下既不是必需的也不是有利的。例如,象除草剂抗性、抗昆虫、真菌或线虫抗性、寒冷或干旱抗性不需要表达于种子中,因此仅在根或绿色组织中需要表达。在种子中表达可能存在以下一种或多种不利:
1.特性在种子中不必要的表达可能导致更低的萌芽率或至少导致转录/翻译能力的不必要消耗,从而导致产量损失或对种子成分的负面影响。
2.特性在种子中不必要的表达可能抬高去调节过程的门槛(由于更多数量的转基因产品被包含于饲料和食品原料中)。
3.特性在种子中不必要的表达可能对消费者的接受度产生负面影响。
花包括植物繁殖器官(心皮和雄蕊)。对于某些特性,在这些组织中表达也被认为是不利的。例如,Bt蛋白质(赋予谷物的根对蛀虫和其他昆虫害虫的抗性)在强组成型启动子控制下的表达导致其在花粉中的表达,并且这种表达对有益的花粉转移昆虫如黑脉金斑蝶(monarch butterflies)具有毒性作用。
AHAS(乙酰羟酸合酶)基因中单一核苷酸的点突变产生对除草剂咪唑啉酮的抗性。突变的AHAS也用作针对商业应用谷物转化的选择标记。为了消除种子中的AHAS标记物,构建了携带miR-167标签的双元载体。玉米miR167主要表达于种子中,包括种子发育的不同时期。在双元载体PR102中,Ubi启动子驱动AHAS表达。在AHAS cDNA之后,通过PCR和标准克隆步骤将短的核苷酸序列或“标签”克隆入NOS终止子。“标签3”序列,5’ACAGATCATGCTGGCAGCTTCA 3’(SEQ ID NO:80),与玉米miRNAmiR167(5’TGAAGCTGCCAGCATGATCTGT 3’)完全互补。携带PR102的转基因玉米在每一种玉米组织中表达具有“标签3”的AHAS mRNA。由于miR167主要表达于种子中,在种子中miR167特异性识别并结合至AHASmRNA中的“标签”。结果,通过miRNA介导的基因沉默在种子中AHASmRNA水平降低或消除了。在其他组织中AHAS的表达很大程度上未受影响,如通过利用特异性识别突变的AHAS的抗体通过Western印迹分析所确定。
实施例7:从组成型表达到营养组织特异性或籽粒特异性表达
7.1组成型表达[不含有miRNA标签]
与玉米泛蛋白启动子(玉米泛蛋白启动子::玉米泛蛋白内含子)和甘蔗杆状病毒启动子(pBPSMM247)相比,与玉米泛蛋白内含子和CCoAMT1终止子结合的稻CCoAMT1启动子(pBPSMM325)在不同发育期的全部组织和器官显示中至强的组成型和广泛表达。在体外研究植物中也能够检测到强的广泛表达。
表11:由候选单子叶植物组成型启动子控制的GUS表达
Figure A20068002199101741
Figure A20068002199101751
作为组成型启动子正控制(pBPSMM232=玉米泛蛋白启动子::玉米泛蛋白内含子::GUS(PIV2)::NOS终止子;pBPSMM247=甘蔗杆状病毒启动子::GUS(PIV2)::NOS终止子);pBPSMM325=Os.CCoAMT1启动子::玉米泛蛋白内含子::GUS(PIV)2::Os.CCoAMT1终止子;通过组织化学分析法测量的GUS表达水平的范围(-到+++++),ND:未检测到
7.2由终止子区域内的miRNA标签控制的营养组织特异性或籽粒特异性表达
为了控制营养组织特异性表达或籽粒特异性表达,在pBPSMM232、pBPSMM247或pBPSMM235中的SacI位点将BPS.MRT1或BPS.MRT2插入到GUS基因和NOS终止子之间,以分别产生pBPSPR1或pBPSPR002、pBPSPR003或pBPSPR004或者pBPSPR005或pBPSPR006。包含miRNA标签的嵌合构建体可以转化入单子叶植物或双子叶植物,例如稻、大麦、玉米、小麦、黑麦草、拟南芥、芸苔、大豆、烟草,但是不限于这些植物物种。改进在单子叶植物中表达的任意方法是可以应用的,例如将内含子或含有内含子的外显子(非剪接或剪接的)加入到5’UTR。如果需要可以使用本领域进行转化的标准方法。在目的筛选试剂存在条件下筛选转化的植物并使用已知的方法进行再生。在组织或组织培养细胞的早期发育期检验筛选方案。在不同发育期和不同世代(T0到T2植物或更多世代)可以测定基因表达水平。在植物中评价的结果导致确定了用于该启动子构建体的适宜基因。
实施例8:从根和籽粒优先表达到根或籽粒特异性表达
8.1根和籽粒优先表达[不含miRNA标签]
以下4种启动子构建体在玉米中显示出根和籽粒优先表达(表12)。第一,稻咖啡酰-CoA-O-甲基转移酶(CCoAMT1)启动子::泛蛋白-内含子::NOS终止子(pBPSMM271)显示在T1植物的叶和茎中低表达,但在根中强表达。在籽粒和花粉中也检测到GUS染色。第二,OsC-8,7-甾醇-异构酶启动子::玉米泛蛋白内含子::NOS终止子(pBPSMM331)在植物的绝大部分中显示弱表达,而在根和籽粒中显示良好表达。第三,包含泛蛋白内含子和HRGP终止子的玉米HRGP启动子(pBPSET003)显示在叶中不表达,而在根和花丝中强表达。在籽粒中,主要在胚中表达而在胚乳中仅弱表达。第四,玉米乳酸脱氢酶(LDH)启动子::玉米泛蛋白内含子::NOS或LDH终止子(分别是pBPSMM272或pBPSET007)显示在叶中弱表达而在根和籽粒中良好表达。
表12:由候选单子叶植物根和籽粒优先启动子控制的GUS表达
作为组成型启动子正控制(pBPSMM232=玉米泛蛋白启动子::玉米泛蛋白内含子::GUS(PIV2)::NOS终止子);通过组织化学分析法测量的GUS表达水平的范围(-到+++++);ND:未检测到
8.2在终止子区域由miRNA标签控制的根或籽粒特异性表达
为了控制根特异性或籽粒特异性表达,将BPS.MRT1或BPS.MRT2在SacI位点处插入到pBPSMM271、pBPSMM272、pBPSMM331、pBPSET003或pBPSET007中的GUS基因和NOS终止子之间,以便分别产生pBPSPR007或pBPSPR008、pBPRPR009或pBPSPR010、pBPRPR011或pBPSPR012、pBPRPR013或pBPSPR014或者pBPRPR015或pBPSPR016。包含miRNA标签的嵌合构建体可以转化入单子叶植物或双子叶植物中,例如稻、大麦、玉米、小麦、黑麦草、拟南芥、芸苔、大豆、烟草,但是不限于这些植物物种。改进在单子叶植物中表达的任意方法是可以应用的,例如将内含子或含有内含子的外显子(非剪接或剪接的)加入到5’UTR。如果需要可以使用本领域进行转化的标准方法。在目的筛选试剂存在条件下筛选转化的植物并使用已知的方法进行再生。在组织或组织培养细胞的早期发育期检验筛选方案。在不同发育期和不同世代(T0到T2植物或更多世代)能够测定基因表达水平。在植物中评价的结果导致确定了用于该启动子构建体的适宜基因。
实施例9:从叶和胚乳优先表达到叶特异性或胚乳特异性表达
9.1叶和胚乳优先表达[不含miRNA标签]
Os.CP12启动子::玉米泛蛋白内含子::GUS(PIV2)::NOS终止子(pBPSMM304)显示在叶和胚乳中强表达,而在根或胚中不表达。
表13:由叶和胚乳优先单子叶植物启动子控制的GUS表达
Figure A20068002199101771
作为组成型启动子正控制(pBPSMM232=玉米泛蛋白启动子::玉米泛蛋白内含子::GUS(PIV2)::NOS终止子);通过组织化学分析法测量的GUS表达水平的范围(-到+++++);ND:未检测到
9.2在终止子区域由miRNA标签控制的叶或胚乳特异性表达
为了控制叶特异性或胚乳特异性表达,将BPS.MRT1或BPS.MRT2在SacI位点处插入到pBPS304中的GUS基因和NOS终止子之间,以便分别产生pBPSPR017或pBPSPR018。包含miRNA标签的嵌合构建体能够转化入单子叶植物或双子叶植物,例如稻、大麦、玉米、小麦、黑麦草、拟南芥、芸苔、大豆、烟草,但是不限于这些植物物种。改进在单子叶植物中表达的任意方法是可以应用的,例如将内含子或含有内含子的外显子(非剪接或剪接的)加入到5’UTR。如果需要可以使用本领域进行转化的标准方法。在目的筛选试剂存在条件下筛选转化的植物并使用已知的方法进行再生。在组织或组织培养细胞的早期发育期检验筛选方案。在不同发育期和不同世代(T0到T2植物或更多世代)能够测定基因表达水平。在植物中评价的结果导致确定了用于该启动子构建体的适宜基因。
实施例10:成熟的microRNA谱
使用Applied Biosystems开发的46个拟南芥(Ath)miRNA分析法(Chen et al.2005,Nucleic Acids Research.33:e179)得到成熟miRNA在玉米种子中的表达谱。表14代表用于分析表达谱的46个miRNA序列。
使用Trizol试剂根据制造商的推荐的说明书(Invitrogen 15596-026)从11个不同的玉米样品中(表14)提取总RNA。玉米甘油醛-3-磷酸脱氢酶(GADPH)亚基C用于内对照以归一化不同组织样品间的miRNA表达。
表14.用于表达谱分析的miRNA序列
 名称  S序列  SEQ ID NO
 Ath-miR156  UGACAGAAGAGAGUGAGCAC  225
 Ath-miR156g  CGACAGAAGAGAGUGAGCACA  226
 Ath-miR156h  UUGACAGAAGAAAGAGAGCAC  227
 Ath-miR157  UUGACAGAAGAUAGAGAGCAC  228
 Ath-miR158  UCCCAAAUGUAGACAAAGCA  229
 Ath-miR159a  UUUGGAUUGAAGGGAGCUCUA  230
  名称   S序列  SEQ ID NO
  Ath-miR159b   UUUGGAUUGAAGGGAGCUCUU  231
  Ath-miR159c   UUUGGAUUGAAGGGAGCUCCU  232
  Ath-miR160   UGCCUGGCUCCCUGUAUGCCA  1
  Ath-miR161   UUGAAAGUGACUACAUCGGGG  233
  Ath-miR162   UCGAUAAACCUCUGCAUCCAG  234
  Ath-miR163   UUGAAGAGGACUUGGAACUUCGAU  2
  Ath-miR164   UGGAGAAGCAGGGCACGUGCA  235
  Ath-miR164c   UGGAGAAGCAGGGCACGUGCG  236
  Ath-miR165   UCGGACCAGGCUUCAUCCCCC  237
  Ath-miR166   UCGGACCAGGCUUCAUUCCCC  238
  Ath-miR167   UGAAGCUGCCAGCAUGAUCUA  3
  Ath-miR167c   UUAAGCUGCCAGCAUGAUCUU  239
  Ath-miR167d   UGAAGCUGCCAGCAUGAUCUGG  240
  Ath-miR168   UCGCUUGGUGCAGGUCGGGAA  241
  Ath-miR169   CAGCCAAGGAUGACUUGCCGA  242
  Ath-miR169b   CAGCCAAGGAUGACUUGCCGG  243
  Ath-miR169d   UGAGCCAAGGAUGACUUGCCG  244
  Ath-miR169h   UAGCCAAGGAUGACUUGCCUG  245
  Ath-miR170   UGAUUGAGCCGUGUCAAUAUC  246
  Ath-miR171   UGAUUGAGCCGCGCCAAUAUC  247
  Ath-miR171b   UUGAGCCGUGCCAAUAUCACG  248
  Ath-miR172   AGAAUCUUGAUGAUGCUGCAU  4
  Ath-miR173   UUCGCUUGCAGAGAGAAAUCAC  249
  Ath-miR319   UUGGACUGAAGGGAGCUCCC  250
  Ath-miR319c   UUGGACUGAAGGGAGCUCCU  251
  Ath-miR393a   UCCAAAGGGAUCGCAUUGAUC  252
  Atb-miR394a   UUGGCAUUCUGUCCACCUCC  253
  Ath-miR395a   CUGAAGUGUUUGGGGGAACUC  254
  Ath-miR395b   CUGAAGUGUUUGGGGGGACUC  255
  Ath-miR396a   UUCCACAGCUUUCUUGAACUG  256
  Ath-miR396b   UUCCACAGCUUUCUUGAACUU  257
  Atb-miR397a   UCAUUGAGUGCAGCGUUGAUG  258
  Ath-miR397b   UCAUUGAGUGCAUCGUUGAUG  259
  Ath-miR398a   UGUGUUCUCAGGUCACCCCUU  260
  Ath-miR398b   UGUGUUCUCAGGUCACCCCUG  261
  Ath-miR399a   UGCCAAAGGAGAUUUGCCCUG  262
  Ath-miR399b   UGCCAAAGGAGAGUUGCCCUG  263
  Ath-miR399d   UGCCAAAGGAGAUUUGCCCCG  264
  Ath-miR399e   UGCCAAAGGAGAUUUGCCUCG  265
  Ath-miR399f   UGCCAAAGGAGAUUUGCCCGG  266
表15.用于miRNA表达谱分析的玉米材料
  文库ID   组织   描述
  AC094   玉米粒   授粉后16天,谷泡期R2玉米粒
  AC081   玉米粒   授粉后23天,仅玉米粒(乳熟期)
  AC086   玉米粒   授粉后30天,R4玉米粒,早期成熟期
  AC095   玉米粒   授粉后36天,早期凹陷期R5开始的玉米粒
  AC089   根   根(仅)、2叶至9叶期,来自温室植物,12dap(V2),21dap(V6)和35dap(V9)
  AC118   根   干旱玉米根文库组合的两个样品
  AC085   上部叶   56(抽穗前)和84dap和23dpp(R3),灌浆时上部叶
  AC082   下部叶   下部叶组织,来自12dap(V2),21dap(V6)和56dap(抽穗前)
  AC080   穗   授粉后1和9天
  AC079   雄花穗   44,51,56,70dap(开花期)未成熟和成熟雄花穗,阶段为10-叶、13-叶阶段,仅在雄花穗出现和开花期前(V10至R1)
  愈伤组织   21天
通过表达谱分析鉴定了几种组织特异性miRNA(表16)。
Figure A20068002199101811
Figure A20068002199101821
R2,R3,R4和R5代表玉米粒发育过程中的不同生殖阶段:R2期(谷泡期,吐丝后10-14天);R3期(乳熟期,吐丝后18-22天);R4期(成熟期,吐丝后24-28天);R5期(凹陷期,吐丝后35-42天)。愈伤组织代表在再生过程中诱导的胚性愈伤组织。
例如,miR319和miR398a在玉米粒和愈伤组织(胚性愈伤组织)中表达。miR167d和miR167家族成员在玉米粒的不同发育期高度表达。miR172在根、雄花穗和玉米粒中相对高表达。
实施例11.带有miRNA标签的双元载体的构建
基于miRNA表达谱,以如此方式构建了几个双元载体,即与miRNA几乎互补的短核苷酸序列被整合入dsRed的3’UTR。RPR40 (SEQ ID NO:216)是负控制,其中dsRed的表达处于ScBV启动子的NOS终止子控制之下。位于dsRed的翻译终止子密码‘TAG’与NOS终止子之间的两个唯一的限制性酶位点,即Sac I的Ava II用于插入短核苷酸序列,以分别产生RPR41、RPR42、RPR43、RPR44的RPR45。通过分析mRNA中miRNA所潜在靶向的区域鉴定每一个短核苷酸序列。例如,玉米glossy 15的5’CTGCAGCATCATCAGGATTCC 3’区(即miRNA标签)被miR172靶向,其与miR172,即5’AGAAUCUUGAUGAUGCUGCAC 3’几乎互补。化学合成了短寡核苷酸(SEQ ID NO:220),其包含miR172靶向区(在其上下游加上5nt)以及Sac I的Ava II位点。然后将该短寡核苷酸亚克隆到RPR40中产生RPR42。
表17.用于渗漏性控制的载体的miRNA标签
  构建体ID   miRNA标签   包含miRNA标签的特异序列   miRNA表达   预测的DsRed2表达
  RPR40(SEQ ID NO:216)   无   N/A   N/A   各处
  RPR41   miR319   SEQ ID NO:221   玉米粒和愈伤组织   各处,但在玉米粒的愈伤组织中弱或无
  RPR42   miR172   SEQ ID NO:220   根,雄花穗,在玉米粒中低   各处,但在根的雄花穗中弱或无
  RPR43   miR396a   SEQ ID NO:222   玉米粒和愈伤组织   各处,但在玉米粒的愈伤组织中弱或无
  RPR44   miR398a   SEQ ID NO:223   玉米粒   各处,但在玉米粒中弱或无
  RPR45   miR167d   SEQ ID NO:224   在玉米粒中高,愈伤组织   各处,但在玉米粒的愈伤组织中弱或无
实施例12miRNA标签化的DsRed2在玉米愈伤组织中的基因沉默
12.1转基因愈伤组织的产生
未成熟玉米胚用包含质粒RPR40、RPR41或RPR42的农杆菌转化。转化和选择方法是来自Ishida等,(1996,Nature Biotech 14:745-749)的改良方法。切下未成熟胚并置于感染培养基中。去除感染介质并用在包含200μM乙酰丁香酮的感染培养基中预诱导1-4小时的农杆菌悬液替换。农杆菌和胚在液体中保持30分钟用于感染。在感染后,去除农杆菌溶液并将胚置于共培养培养基中(对Ishida的改良培养基,添加有150mg/L L-半胱氨酸)。共培养2-3天。共培养之后,胚置于包含抗生素的恢复培养基中7-10天以抑制农杆菌生长。形成愈伤组织的胚被置于能够抑制非转化组织生长的选择培养基中。
12.2转基因愈伤组织的鉴定和拷贝数分析
在用RPR40和RPR41转化的玉米愈伤组织中的转基因拷贝数通过TaqMan分析确定(Ingham等,2001,Biotechniques 31:132-4,136-40)。将TaqMan探针选择靶向于靶标NOS终止子,其作为这3个构建体的共有区位于DsRed2s的下游。仅转基因玉米愈伤组织用于下面对DsRed2的表达分析。
12.3从转基因玉米愈伤组织中分离RNA
愈伤组织组织用研钵和杵在液氮中研磨,然后加入600μL裂解/结合溶液(mirVana miRNA Isolation Kit,Ambion,Inc.Austin,TX)基于mirVana总RNA提取方法提取总RNA。分离的RNA用无DNA的DNA酶(Ambion,Inc)按照生产商的说明书处理。
12.4 DsRed RNA定量
DsRed2和内源玉米GpC1的第一链cDNA从分离自RPR40和RPR41玉米转基因愈伤组织的RNA合成。使用ImProm-II逆转录系统(Promega,Madison,WI)并根据生产商的说明书以及使用DsRed和GpC1特异性引物将RNA逆转录。来自RPR40和RPR41转基因愈伤组织的DsRed2 RNA的相对水平通过使用DsRed2和GpC1特异性引物的定量Taqman PCR确定。从愈伤组织总RNA合成的第一链cDNA用作模板。基本上如对于拷贝数的分析开展TaqMan分析。为比较愈伤组织间DsRed2 RNA的相对量,数据首先对内部的GpC1内源对照进行归一化。对于每一RNA样品,DsRed2 RNA的定量重复3次。
12.5在表达具有319和172miRNA结合位点标签的DsRed2的玉米愈伤组织中荧光降低
在配备有UV和罗丹明绿光器的显微镜(Zeiss Stemi SV11)下检查包含质粒RPR40、RPR41和RPR42的推定的转基因愈伤组织中的DsRed2荧光。荧光强度记作高、中、低和无(见表18)。
表18.转基因愈伤组织中的DsRed2荧光表达
 构建体ID  高  中  低  无  所检查愈伤组织总数
 RPR40  17  2  11  2  32
 RPR41  0  3  13  17  33
 RPR42  14  8  8  17  47
12.5在玉米愈伤组织中miRNA标签化的DsRed2 RNA明显降低
分析的每一簇愈伤组织通过定量TaqMan PCR分析证实是转基因的。该分析还提供了每一簇愈伤组织中整合DsRed2构建体的拷贝数。为比较RPR40和RPR41愈伤组织群体中DsRed2 RNA的相对水平,从各个转基因阳性愈伤组织中分离RNA,并且DsRed2 RNA的量通过定量TaqMan分析确定。与RPR40愈伤组织相比,DsRed2 RNA在RPR41转基因愈伤组织中极大降低(表19)。DsRed2 RNA水平在RPR40和RPR41愈伤组织群体之间的差异是显著的,p值为0.0026。
表19.转基因愈伤组织中DsRed2 mRNA的表达
                  序列表
<110>巴斯福植物科学有限公司(BASF Plant Science GmbH)
<120>控制基因表达的改良方法
<130>PF 56539 PCT
<160>266
<170>PatentIn 3.3版
<210>1
<211>21
<212>RNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
ugccuggcuc ccuguaugcc a                                               21
<210>2
<211>24
<212>RNA
<213>拟南芥
<400>2
uugaagagga cuuggaacuu cgau                                            24
<210>3
<211>21
<212>RNA
<213>拟南芥
<400>3
ugaagcugcc agcaugaucu a                                               21
<210>4
<211>21
<212>RNA
<213>拟南芥
<400>4
agaaucuuga ugaugcugca u                                               21
<210>5
<211>20
<212>RNA
<213>拟南芥
<400>5
uuggacugaa gggagcuccc                                                 20
<210>6
<211>21
<212>RNA
<213>稻(Oryza sativa)
<400>6
ugacagaaga gagugagcac a                                               21
<210>7
<211>21
<212>RNA
<213>稻
<400>7
cgacagaaga gagugagcau a                                               21
<210>8
<211>21
<212>RNA
<213>稻
<400>8
uuuggauuga agggagcucu g                                               21
<210>9
<211>21
<212>RNA
<213>稻
<400>9
ugccuggcuc ccugaaugcc a                                               21
<210>10
<211>21
<212>RNA
<213>稻
<400>10
ucgauaaacc ucugcaucca g                                               21
<210>11
<211>21
<212>RNA
<213>稻
<400>11
uggagaagca gggcacgugc a                                               21
<210>12
<211>21
<212>RNA
<213>稻
<400>12
uggagaagca gggcacgugc u                                               21
<210>13
<211>21
<212>RNA
<213>稻
<400>13
ucggaccagg cuucauuccc c                                               21
<210>14
<211>21
<212>RNA
<213>稻
<400>14
ugaagcugcc agcaugaucu g                                                21
<210>15
<211>21
<212>RNA
<213>稻
<400>15
ucgcuuggug cagaucggga c                                                21
<210>16
<211>21
<212>RNA
<213>稻
<400>16
uagccaagga ugacuugccu a                                                21
<210>17
<211>21
<212>RNA
<213>稻
<400>17
uagccaagga ugacuugccu g                                               21
<210>18
<211>21
<212>RNA
<213>稻
<400>18
ugauugagcc gugccaauau c                                               21
<210>19
<211>21
<212>RNA
<213>稻
<400>19
uuauugagug cagcguugau g                                               21
<210>20
<211>21
<212>RNA
<213>稻
<400>20
uguguucuca ggucaccccu u                                               21
<210>21
<211>21
<212>RNA
<213>稻
<400>21
ugccaaagga aauuugcccc g                                               21
<210>22
<211>20
<212>RNA
<213>玉蜀黍(Zea mays)
<400>22
ugacagaaga gagugagcac                                                 20
<210>23
<211>21
<212>RNA
<213>玉蜀黍
<400>23
uuuggauuga agggagcucu a                                                21
<210>24
<211>21
<212>RNA
<213>玉蜀黍
<400>24
ugccuggcuc ccuguaugcc a                                                21
<210>25
<211>21
<212>RNA
<213>玉蜀黍
<400>25
ucggaccagg cuucauuccc c                                               21
<210>26
<211>22
<212>RNA
<213>玉蜀黍
<400>26
ugaagcugcc agcaugaucu gg                                              22
<210>27
<211>21
<212>RNA
<213>玉蜀黍
<400>27
ugauugagcc gcgccaauau c                                               21
<210>28
<211>20
<212>RNA
<213>玉蜀黍
<400>28
agcucaggag ggauagcgcc                                                 20
<210>29
<211>20
<212>RNA
<213>玉蜀黍
<400>29
aagcucagga gggauagcgc                                                 20
<210>30
<211>21
<212>RNA
<213>玉蜀黍
<400>30
agcucaggag ggauagcgcc a                                               21
<210>31
<211>20
<212>RNA
<213>玉蜀黍
<400>31
ugacagaaga gagugagcac                                                 20
<210>32
<211>21
<212>RNA
<213>玉蜀黍
<400>32
uugacagaag agagugagca c                                               21
<210>33
<211>21
<212>RNA
<213>玉蜀黍
<400>33
gugacagaag agagugagca c                                               21
<210>34
<211>21
<212>RNA
<213>玉蜀黍
<400>34
ugacagaaga gagugagcac a                                               21
<210>35
<211>21
<212>RNA
<213>玉蜀黍
<400>35
uuuggauuga agggagcucu a                                               21
<210>36
<211>21
<212>RNA
<213>玉蜀黍
<400>36
uuuggauuga agggagcucu u                                               21
<210>37
<211>21
<212>RNA
<213>玉蜀黍
<400>37
ucuuuggauu gaagggagcu c                                               21
<210>38
<211>20
<212>RNA
<213>玉蜀黍
<400>38
uuuggauuga agggagcucu                                                 20
<210>39
<211>21
<212>RNA
<213>玉蜀黍
<400>39
ugccuggcuc ccuguaugcc a                                               21
<210>40
<211>22
<212>RNA
<213>玉蜀黍
<400>40
ugccuggcuc ccuguaugcc au                                              22
<210>41
<211>20
<212>RNA
<213>玉蜀黍
<400>41
gccuggcucc cuguaugcca                                                 20
<210>42
<211>21
<212>RNA
<213>玉蜀黍
<400>42
ucggaccagg cuucauuccc c                                               21
<210>43
<211>22
<212>RNA
<213>玉蜀黍
<400>43
ucggaccagg cuucauuccc cc                                              22
<210>44
<211>22
<212>RNA
<213>玉蜀黍
<400>44
uucggaccag gcuucauucc  cc                                             22
<210>45
<211>21
<212>RNA
<213>玉蜀黍
<400>45
uucggaccag gcuucauucc c                                                21
<210>46
<211>22
<212>RNA
<213>玉蜀黍
<400>46
ugaagcugcc agcaugaucu gg                                              22
<210>47
<211>20
<212>RNA
<213>玉蜀黍
<400>47
ugaagcugcc agcaugaucu                                                 20
<210>48
<211>21
<212>RNA
<213>玉蜀黍
<400>48
ugaagcugcc agcaugaucu g                                               21
<210>49
<211>22
<212>RNA
<213>玉蜀黍
<400>49
ugaagcugcc agcaugaucu au                                              22
<210>50
<211>22
<212>RNA
<213>玉蜀黍
<400>50
augaagcugc cagcaugauc ua                                              22
<210>51
<211>22
<212>RNA
<213>玉蜀黍
<400>51
gugaagcugc cagcaugauc ua                                              22
<210>52
<211>21
<212>RNA
<213>玉蜀黍
<400>52
ugauugagcc gugccaauau c                                               21
<210>53
<211>21
<212>RNA
<213>玉蜀黍
<400>53
ugauugagcc gcgccaauau c                                               21
<210>54
<211>20
<212>RNA
<213>玉蜀黍
<400>54
ugauugagcc gcgccaauau                                                 20
<210>55
<211>21
<212>RNA
<213>玉蜀黍
<400>55
aagcucagga gggauagcgc c                                               21
<210>56
<211>21
<212>RNA
<213>小家鼠(Mus musculus)
<400>56
uggaauguaa agaaguaugu a                                               21
<210>57
<211>23
<212>RNA
<213>小家鼠
<400>57
ucuuugguua ucuagcugua uga                                             23
<210>58
<211>23
<212>RNA
<213>小家鼠
<400>58
uggaguguga caaugguguu ugu                                             23
<210>59
<211>22
<212>RNA
<213>小家鼠
<400>59
uuaaggcacg cggugaaugc ca                                              22
<210>60
<211>22
<212>RNA
<213>小家鼠
<400>60
ucacagugaa ccggucucuu uu                                              22
<210>61
<211>22
<212>RNA
<213>小家鼠
<400>61
uguaacagca acuccaugug ga                                              22
<210>62
<211>22
<212>RNA
<213>小家鼠
<400>62
uggaauguaa ggaagugugu gg                                              22
<210>63
<211>21
<212>RNA
<213>人(Homo sapiens)
<400>63
uugugcuuga ucuaaccaug u                                               21
<210>64
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>64
caactactgc acggtaaaag tgatagg                                         27
<210>65
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>65
gcagcttgct tcgatctctc gctcgcc                                         27
<210>66
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>66
tgcctcgatt cgaccgtgta atggaat                                         27
<210>67
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>67
actcctggct tccttccgat ctggact                                         27
<210>68
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>68
ccggtgacct tcttgcttct tcgatcg                                         27
<210>69
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>69
cctctctctc acacacactc tcagtaa                                          27
<210>70
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>70
aacaaatggc gtacttatat aaccaca                                         27
<210>71
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>71
cgggcggaat gggatgggat tacgtgt                                          27
<210>72
<211>26
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>72
tttgtattta ggtccctaac gccctc                                          26
<210>73
<211>26
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>73
tgttgatgcg gatttctgcg tgtgat                                          26
<210>74
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>74
gccgatgccc aagaactagt catttta                                         27
<210>75
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>75
attaacacgt caaccaaacc gccgtcc                                         27
<210>76
<211>27
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>76
aaagcgatgc ctaccatacc acactgc                                         27
<210>77
<211>28
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>77
tgcccacatt tattatggtt ttacaccc                                        28
<210>78
<211>28
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>78
tgatcacatc accgtctctc ttcattaa                                        28
<210>79
<211>28
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>79
tatcccagtc tcgatattgt catccgct                                        28
<210>80
<211>22
<212>DNA
<213>人工的
<220>
<223>miRNA-标签
<400>80
acagatcatg ctggcagctt ca                                              22
<210>81
<211>21
<212>DNA
<213>人工的
<220>
<223>miRNA-标签
<400>81
tagagctccc ttcaatccaa a                                               21
<210>82
<211>21
<212>DNA
<213>人工的
<220>
<223>miRNA-标签
<400>82
ggggaatgaa gcctggtccg a                                               21
<210>83
<211>21
<212>DNA
<213>人工的
<220>
<223>miRNA-标签
<400>83
ggggaatgaa gcgtggaccg a                                               21
<210>84
<211>4880
<212>DNA
<213>人工的
<220>
<223>表达构建体pBPSMM232
<220>
<221>启动子
<222>(298)..(2278)
<223>Zm泛蛋白启动子和内含子(1981bp)
<220>
<221>misc_feature
<222>(2305)..(4305)
<223>β-葡糖醛酸糖苷酶GUS(2001bp)
<220>
<221>misc_feature
<222>(4365)..(4365)
<223>MiRNA标签插入位点(Sac I)
<220>
<221>终止子
<222>(4376)..(4628)
<223>NOS终止子(253bp)
<400>84
cgttcttccg aatagcatcg gtaacatgag caaagtctgc cgccttacaa cggctctccc     60
gctgacgccg tcccggactg atgggctgcc tgtatcgagt ggtgattttg tgccgagctg    120
ccggtcgggg agctgttggc tggctggtgg caggatatat tgtggtgtaa acaaattgac    180
gcttagacaa cttaataaca cattgcggac gtttttaatg tactgaattg actagtggcg    240
cgccaagctt gcatgcctgc aggtcgactc tagaggatcc ccatcgaatt cctgcagtgc    300
agcgtgaccc ggtcgtgccc ctctctagag ataatgagca ttgcatgtct aagttataaa    360
aaattaccac atattttttt tgtcacactt gtttgaagtg cagtttatct atctttatac    420
atatatttaa actttactct acgaataata taatctatag tactacaata atatcagtgt    480
tttagagaat catataaatg aacagttaga catggtctaa aggacaattg agtattttga    540
caacaggact ctacagtttt atctttttag tgtgcatgtg ttctcctttt tttttgcaaa    600
tagcttcacc tatataatac ttcatccatt ttattagtac atccatttag ggtttagggt    660
taatggtttt tatagactaa tttttttagt acatctattt tattctattt tagcctctaa     720
attaagaaaa ctaaaactct attttagttt ttttatttaa taatttagat ataaaataga     780
ataaaataaa gtgactaaaa attaaacaaa taccctttaa gaaattaaaa aaactaagga     840
aacatttttc ttgtttcgag tagataatgc cagcctgtta aacgccgtcg acgagtctaa     900
cggacaccaa ccagcgaacc agcagcgtcg cgtcgggcca agcgaagcag acggcacggc     960
atctctgtcg ctgcctctgg acccctctcg agagttccgc tccaccgttg gacttgctcc    1020
gctgtcggca tccagaaatt gcgtggcgga gcggcagacg tgagccggca cggcaggcgg    1080
cctcctcctc ctctcacggc accggcagct acgggggatt cctttcccac cgctccttcg    1140
ctttcccttc ctcgcccgcc gtaataaata gacaccccct ccacaccctc tttccccaac    1200
ctcgtgttgt tcggagcgca cacacacaca accagatctc ccccaaatcc acccgtcggc    1260
acctccgctt caaggtacgc cgctcgtcct cccccccccc ccctctctac cttctctaga    1320
tcggcgttcc ggtccatggt tagggcccgg tagttctact tctgttcatg tttgtgttag    1380
atccgtgttt gtgttagatc cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc    1440
agacacgttc tgattgctaa cttgccagtg tttctctttg gggaatcctg ggatggctct    1500
agccgttccg cagacgggat cgatttcatg attttttttg tttcgttgca tagggtttgg    1560
tttgcccttt tcctttattt caatatatgc cgtgcacttg tttgtcgggt catcttttca    1620
tgcttttttt tgtcttggtt gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga    1680
gtagaattct gtttcaaact acctggtgga tttattaatt ttggatctgt atgtgtgtgc    1740
catacatatt catagttacg aattgaagat gatggatgga aatatcgatc taggataggt    1800
atacatgttg atgcgggttt tactgatgca tatacagaga tgctttttgt tcgcttggtt    1860
gtgatgatgt ggtgtggttg ggcggtcgtt cattcgttct agatcggagt agaatactgt    1920
ttcaaactac ctggtgtatt tattaatttt ggaactgtat gtgtgtgtca tacatcttca    1980
tagttacgag tttaagatgg atggaaatat cgatctagga taggtataca tgttgatgtg    2040
ggttttactg atgcatatac atgatggcat atgcagcatc tattcatatg ctctaacctt    2100
gagtacctat ctattataat aaacaagtat gttttataat tattttgatc ttgatatact    2160
tggatgatgg catatgcagc agctatatgt ggattttttt agccctgcct tcatacgcta    2220
tttatttgct tggtactgtt tcttttgtcg atgctcaccc tgttgtttgg tgttacttct    2280
gcagcccggg taggtcagtc ccttatgtta cgtcctgtag aaaccccaac ccgtgaaatc    2340
aaaaaactcg acggcctgtg ggcattcagt ctggatcgcg aaaactgtgg aattggtcag    2400
cgttggtggg aaagcgcgtt acaagaaagc cgggcaattg ctgtgccagg cagttttaac    2460
gatcagttcg ccgatgcaga tattcgtaat tatgcgggca acgtctggta tcagcgcgaa    2520
gtctttatac cgaaaggttg ggcaggccag cgtatcgtgc tgcgtttcga tgcggtcact    2580
cattacggca aagtgtgggt caataatcag gaagtgatgg agcatcaggg cggctatacg    2640
ccatttgaag ccgatgtcac gccgtatgtt attgccggga aaagtgtacg taagtttctg    2700
cttctacctt tgatatatat ataataatta tcattaatta gtagtaatat aatatttcaa    2760
atattttttt caaaataaaa gaatgtagta tatagcaatt gcttttctgt agtttataag    2820
tgtgtatatt ttaatttata acttttctaa tatatgacca aaatttgttg atgtgcaggt    2880
atcaccgttt gtgtgaacaa cgaactgaac tggcagacta tcccgccggg aatggtgatt    2940
accgacgaaa acggcaagaa aaagcagtct tacttccatg atttctttaa ctatgccgga    3000
atccatcgca gcgtaatgct ctacaccacg ccgaacacct gggtggacga tatcaccgtg    3060
gtgacgcatg tcgcgcaaga ctgtaaccac gcgtctgttg actggcaggt ggtggccaat    3120
ggtgatgtca gcgttgaact gcgtgatgcg gatcaacagg tggttgcaac tggacaaggc    3180
actagcggga ctttgcaagt ggtgaatccg cacctctggc aaccgggtga aggttatctc    3240
tatgaactgt gcgtcacagc caaaagccag acagagtgtg atatctaccc gcttcgcgtc    3300
ggcatccggt cagtggcagt gaagggcgaa cagttcctga ttaaccacaa accgttctac    3360
tttactggct ttggtcgtca tgaagatgcg gacttgcgtg gcaaaggatt cgataacgtg    3420
ctgatggtgc acgaccacgc attaatggac tggattgggg ccaactccta ccgtacctcg    3480
cattaccctt acgctgaaga gatgctcgac tgggcagatg aacatggcat cgtggtgatt    3540
gatgaaactg ctgctgtcgg ctttaacctc tctttaggca ttggtttcga agcgggcaac    3600
aagccgaaag aactgtacag cgaagaggca gtcaacgggg aaactcagca agcgcactta    3660
caggcgatta aagagctgat agcgcgtgac aaaaaccacc caagcgtggt gatgtggagt    3720
attgccaacg aaccggatac ccgtccgcaa ggtgcacggg aatatttcgc gccactggcg    3780
gaagcaacgc gtaaactcga cccgacgcgt ccgatcacct gcgtcaatgt aatgttctgc    3840
gacgctcaca ccgataccat cagcgatctc tttgatgtgc tgtgcctgaa ccgttattac    3900
ggatggtatg tccaaagcgg cgatttggaa acggcagaga aggtactgga aaaagaactt    3960
ctggcctggc aggagaaact gcatcagccg attatcatca ccgaatacgg cgtggatacg    4020
ttagccgggc tgcactcaat gtacaccgac atgtggagtg aagagtatca gtgtgcatgg    4080
ctggatatgt atcaccgcgt ctttgatcgc gtcagcgccg tcgtcggtga acaggtatgg    4140
aatttcgccg attttgcgac ctcgcaaggc atattgcgcg ttggcggtaa caagaaaggg 4200
atcttcactc gcgaccgcaa accgaagtcg gcggcttttc tgctgcaaaa acgctggact 4260
ggcatgaact tcggtgaaaa accgcagcag ggaggcaaac aatgaatcaa caactctcct 4320
ggcgcaccat cgtcggctac agcctcggga attgctaccg agctcgaatt tccccgatcg 4380
ttcaaacatt tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat 4440
tatcatataa tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac 4500
gttatttatg agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat 4560
agaaaacaaa atatagcgcg caaactagga taaattatcg cgcgcggtgt catctatgtt 4620
actagatcgg gaattggcat gcaagcttgg cactggccgt cgttttacaa cgtcgtgact 4680
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 4740
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 4800
gcgaatgcta gagcagcttg agcttggatc agattgtcgt ttcccgcctt cagtttgtgt 4860
taattaacgg tccgaggcct                                             4880
<210>85
<211>4960
<212>DNA
<213>人工的
<220>
<223>表达构建体pBPSMM271
<220>
<221>启动子
<222>(227)..(1260)
<223>Os CCoAMT1启动子(1034bp)
<220>
<221>内含子
<222>(1319)..(2369)
<223>Zm泛蛋白内含子(1051bp)
<220>
<221>misc_feature
<222>(2389)..(4389)
<223>β-葡糖醛酸糖苷酶基因GUS(2001bp)
<220>
<221>misc_feature
<222>(4450)..(4450)
<223>MiRNA标签插入位点(SacI)
<220>
<221>终止子
<222>(4461)..(4713)
<223>NOS终止子(253bp)
<400>85
gatgggctgc ctgtatcgag tggtgatttt gtgccgagct gccggtcggg gagctgttgg     60
ctggctggtg gcaggatata ttgtggtgta aacaaattga cgcttagaca acttaataac    120
acattgcgga cgtttttaat gtactgaatt gactagtggc gcgccaagct tgcatgcctg    180
caggtcgact ctagtaacgg ccgccagtgt gctggaattc gcccttcaac tactgcacgg    240
taaaagtgat aggaatcggt cggaaacagt attaatgttt ttattatttt tacaaaaacg    300
aattgaaata attggaaatt ttcatattta tatattaaac tattcagtat caacttcaat    360
tcgacgtcaa tagaaattag aaaagcataa ttatacacag taataggcgt tcaagatatt    420
attgttatta tttagttttg tggaaatggt atcaacgtga tcggaaaatt ttgtacatgt    480
tttcaccctg cgggatatct caattccttc tcctccctct accgccatat cagcacacgt    540
tttagagcac caatcataac ccataaatcc gtgggctact cacttattta atttatatgt    600
gaattcgtga cctgactcac tcacatacta tcaaaaattt gtctcagtca cccatctcct    660
tctttcctgg tccgataagg gtttatccta cggttcgacg gttatcacga tagtcgtgcg    720
gttactgagg tataccgtga tttaaaaata tgataaagtt accgcaggtt ttaactgcgc    780
ggtttggtaa acctgttcct cctcaccaac cttctcctcc ggtctcctta tgtgtctcac    840
cgaggcgagc cgccgcgaga ccgcatggac gcggtccacg cacctggcgg tgcacctcct    900
cctccccggc gaagaagacg tggaggagag taaatgagca atcaggccca cggcccaatc    960
gccgtccacc acccaccacc ctcagcgacc caaaaccacc tcaccaaccc aactctgtac   1020
cgtactgtac ccgccctccc ctcccactga cactccgggc ccacctgtcg gcgcgactct   1080
tccacggtcc ccttctctcc tcagagattt tttccacgca ttttttaatt tttttttctg   1140
cagttcacat gctcttctcc cactcttccg ccgcgctata taaaccgcgc gaggcgtcgt   1200
tgcctcgtcg gcgaagtcaa tccggcgatc cccggcgagc gagagatcga agcaagctgc   1260
aagggcgaat tctgcagata tccatcacac tggcggccgc tcgagcatgc atctagagga   1320
tctcccccaa atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc   1380
ccccccctct ctaccttctc tagatcggcg ttccggtcca tggttagggc ccggtagttc   1440
tacttctgtt catgtttgtg ttagatccgt gtttgtgtta gatccgtgct gctagcgttc   1500
gtacacggat gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc   1560
tttggggaat cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt   1620
tttgtttcgt tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca    1680
cttgtttgtc gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg    1740
gttgggcggt cgttctagat cggagtagaa ttctgtttca aactacctgg tggatttatt    1800
aattttggat ctgtatgtgt gtgccataca tattcatagt tacgaattga agatgatgga    1860
tggaaatatc gatctaggat aggtatacat gttgatgcgg gttttactga tgcatataca    1920
gagatgcttt ttgttcgctt ggttgtgatg atgtggtgtg gttgggcggt cgttcattcg    1980
ttctagatcg gagtagaata ctgtttcaaa ctacctggtg tatttattaa ttttggaact    2040
gtatgtgtgt gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct    2100
aggataggta tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag    2160
catctattca tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta    2220
taattatttt gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt    2280
ttttagccct gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc    2340
accctgttgt ttggtgttac ttctgcagcc cgggtaggtc agtcccttat gttacgtcct    2400
gtagaaaccc caacccgtga aatcaaaaaa ctcgacggcc tgtgggcatt cagtctggat    2460
cgcgaaaact gtggaattgg tcagcgttgg tgggaaagcg cgttacaaga aagccgggca    2520
attgctgtgc caggcagttt taacgatcag ttcgccgatg cagatattcg taattatgcg    2580
ggcaacgtct ggtatcagcg cgaagtcttt ataccgaaag gttgggcagg ccagcgtatc    2640
gtgctgcgtt tcgatgcggt cactcattac ggcaaagtgt gggtcaataa tcaggaagtg    2700
atggagcatc agggcggcta tacgccattt gaagccgatg tcacgccgta tgttattgcc    2760
gggaaaagtg tacgtaagtt tctgcttcta cctttgatat atatataata attatcatta    2820
attagtagta atataatatt tcaaatattt ttttcaaaat aaaagaatgt agtatatagc    2880
aattgctttt ctgtagttta taagtgtgta tattttaatt tataactttt ctaatatatg    2940
accaaaattt gttgatgtgc aggtatcacc gtttgtgtga acaacgaact gaactggcag    3000
actatcccgc cgggaatggt gattaccgac gaaaacggca agaaaaagca gtcttacttc    3060
catgatttct ttaactatgc cggaatccat cgcagcgtaa tgctctacac cacgccgaac    3120
acctgggtgg acgatatcac cgtggtgacg catgtcgcgc aagactgtaa ccacgcgtct    3180
gttgactggc aggtggtggc caatggtgat gtcagcgttg aactgcgtga tgcggatcaa    3240
caggtggttg caactggaca aggcactagc gggactttgc aagtggtgaa tccgcacctc    3300
tggcaaccgg gtgaaggtta tctctatgaa ctgtgcgtca cagccaaaag ccagacagag    3360
tgtgatatct acccgcttcg cgtcggcatc cggtcagtgg cagtgaaggg cgaacagttc    3420
ctgattaacc acaaaccgtt ctactttact ggctttggtc gtcatgaaga tgcggacttg    3480
cgtggcaaag gattcgataa cgtgctgatg gtgcacgacc acgcattaat ggactggatt    3540
ggggccaact cctaccgtac ctcgcattac ccttacgctg aagagatgct cgactgggca    3600
gatgaacatg gcatcgtggt gattgatgaa actgctgctg tcggctttaa cctctcttta    3660
ggcattggtt tcgaagcggg caacaagccg aaagaactgt acagcgaaga ggcagtcaac    3720
ggggaaactc agcaagcgca cttacaggcg attaaagagc tgatagcgcg tgacaaaaac    3780
cacccaagcg tggtgatgtg gagtattgcc aacgaaccgg atacccgtcc gcaaggtgca    3840
cgggaatatt tcgcgccact ggcggaagca acgcgtaaac tcgacccgac gcgtccgatc    3900
acctgcgtca atgtaatgtt ctgcgacgct cacaccgata ccatcagcga tctctttgat    3960
gtgctgtgcc tgaaccgtta ttacggatgg tatgtccaaa gcggcgattt ggaaacggca    4020
gagaaggtac tggaaaaaga acttctggcc tggcaggaga aactgcatca gccgattatc    4080
atcaccgaat acggcgtgga tacgttagcc gggctgcact caatgtacac cgacatgtgg    4140
agtgaagagt atcagtgtgc atggctggat atgtatcacc gcgtctttga tcgcgtcagc    4200
gccgtcgtcg gtgaacaggt atggaatttc gccgattttg cgacctcgca aggcatattg    4260
cgcgttggcg gtaacaagaa agggatcttc actcgcgacc gcaaaccgaa gtcggcggct    4320
tttctgctgc aaaaacgctg gactggcatg aacttcggtg aaaaaccgca gcagggaggc    4380
aaacaatgaa tcaacaactc tcctggcgca ccatcgtcgg ctacagcctc gggaattgcg    4440
taccgagctc gaatttcccc gatcgttcaa acatttggca ataaagtttc ttaagattga    4500
atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg    4560
taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc    4620
cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat    4680
tatcgcgcgc ggtgtcatct atgttactag atcgggaatt ggcatgcaag cttggcactg    4740
gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt    4800
gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct    4860
tcccaacagt tgcgcagcct gaatggcgaa tgctagagca gcttgagctt ggatcagatt    4920
gtcgtttccc gccttcagtt tgtgttaatt aacggtccga                          4960
<210>86
<211>5000
<212>DNA
<213>人工的
<220>
<223>表达构建体pBPSMM272
<220>
<221>启动子
<222>(255)..(1316)
<223>Zm LDH启动子(1062bp)
<220>
<221>内含子
<222>(1355)..(2405)
<223>泛蛋白内含子(1051bp)
<220>
<221>misc_feature
<222>(2425)..(4425)
<223>β-葡糖醛酸糖苷酶GUS(2001bp)
<220>
<221>misc_feature
<222>(4486)..(4486)
<223>MiRNA标签插入位点(SacI)
<220>
<221>终止子
<222>(4497)..(4749)
<223>NOS终止子(253bp):4497-4749
<400>86
cccggactga tgggctgcct gtatcgagtg gtgattttgt gccgagctgc cggtcgggga     60
gctgttggct ggctggtggc aggatatatt gtggtgtaaa caaattgacg cttagacaac    120
ttaataacac attgcggacg tttttaatgt actgaattga ctagtggcgc gccaagcttg    180
catgcctgca ggtcgactct agatgcatgc tcgagcggcc gccagtgtga tggatatctg    240
cagaattcgc ccttaacaaa tggcgtactt atataaccac aatgtactgg tgctgcgtca    300
ttattttata ctacgcatat attattataa gtagagaaag ctcacaaaac catgcgcgcg    360
cccccctgtt tgtttcggtc gctaattaca ccctttgtat cgttggttga tgatggtctc    420
caccggccgt acgagtcatc gatcgttgat ttatttttat caccgacttg cacgcctttc    480
gaacaaagac gcaacaaagg aaagcgaaag cgtcacgaac gaggttgttc cctgacagtt    540
gttcgactaa tacaactgca agacactgaa taagcagtaa aaatcaatat agattaaagt    600
taaacgaaca tgctcaacat cgaatactac tcatatgtgt tattattaag agaataccac    660
caaggtagaa aagttaaagg acctaaactg ttgtgccggg agagttgtgc gacgaacaga    720
tgtaaatatg ataaaataag ttcaaagttc atatagatag cacgatcaca cttagggcta    780
gtttgaagcc ataaaaatgg aagagattaa atgagataaa attcacttat ttaattttaa     840
ataagaagag agttttaacc cctctaattc tctccagtat tttagctcct aaactagctc     900
ttacagcagt aaaagaccct tgatggtagc gtatgcaaag agaaggaact attcaatgaa     960
ttgttttttt aatcactagt agtatggtgg gtaactgtcg tcaaccggcc ctatctactt    1020
cagtttagtg aagcactaaa ccgcaccttg gtatgttcaa atttaagatt ttttttgaaa    1080
cgaaacaatt ttaaccagcg gctccaaacc ggtgaagtgg tttggtcttt ggtgtggggc    1140
cagggtatta atggaattga atatataaag agcagggtgg tggacctttc ccctcccacg    1200
agtcgagtag ccattgccca ttgccattcc ttccttcctc cacagagaaa tccgatccgc    1260
ggagatttga cccaaccaga tcatatcaca cacgtaatcc catcccattc cgcccgaagg    1320
gcgaattcca gcacactggc ggccgttact agtggatctc ccccaaatcc acccgtcggc    1380
acctccgctt caaggtacgc cgctcgtcct cccccccccc ccctctctac cttctctaga    1440
tcggcgttcc ggtccatggt tagggcccgg tagttctact tctgttcatg tttgtgttag    1500
atccgtgttt gtgttagatc cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc    1560
agacacgttc tgattgctaa cttgccagtg tttctctttg gggaatcctg ggatggctct    1620
agccgttccg cagacgggat cgatttcatg attttttttg tttcgttgca tagggtttgg    1680
tttgcccttt tcctttattt caatatatgc cgtgcacttg tttgtcgggt catcttttca    1740
tgcttttttt tgtcttggtt gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga    1800
gtagaattct gtttcaaact acctggtgga tttattaatt ttggatctgt atgtgtgtgc    1860
catacatatt catagttacg aattgaagat gatggatgga aatatcgatc taggataggt    1920
atacatgttg atgcgggttt tactgatgca tatacagaga tgctttttgt tcgcttggtt    1980
gtgatgatgt ggtgtggttg ggcggtcgtt cattcgttct agatcggagt agaatactgt    2040
ttcaaactac ctggtgtatt tattaatttt ggaactgtat gtgtgtgtca tacatcttca    2100
tagttacgag tttaagatgg atggaaatat cgatctagga taggtataca tgttgatgtg    2160
ggttttactg atgcatatac atgatggcat atgcagcatc tattcatatg ctctaacctt    2220
gagtacctat ctattataat aaacaagtat gttttataat tattttgatc ttgatatact    2280
tggatgatgg catatgcagc agctatatgt ggattttttt agccctgcct tcatacgcta    2340
tttatttgct tggtactgtt tcttttgtcg atgctcaccc tgttgtttgg tgttacttct    2400
gcagcccggg taggtcagtc ccttatgtta cgtcctgtag aaaccccaac ccgtgaaatc    2460
aaaaaactcg acggcctgtg ggcattcagt ctggatcgcg aaaactgtgg aattggtcag    2520
cgttggtggg aaagcgcgtt acaagaaagc cgggcaattg ctgtgccagg cagttttaac    2580
gatcagttcg ccgatgcaga tattcgtaat tatgcgggca acgtctggta tcagcgcgaa    2640
gtctttatac cgaaaggttg ggcaggccag cgtatcgtgc tgcgtttcga tgcggtcact    2700
cattacggca aagtgtgggt caataatcag gaagtgatgg agcatcaggg cggctatacg    2760
ccatttgaag ccgatgtcac gccgtatgtt attgccggga aaagtgtacg taagtttctg    2820
cttctacctt tgatatatat ataataatta tcattaatta gtagtaatat aatatttcaa    2880
atattttttt caaaataaaa gaatgtagta tatagcaatt gcttttctgt agtttataag    2940
tgtgtatatt ttaatttata acttttctaa tatatgacca aaatttgttg atgtgcaggt    3000
atcaccgttt gtgtgaacaa cgaactgaac tggcagacta tcccgccggg aatggtgatt    3060
accgacgaaa acggcaagaa aaagcagtct tacttccatg atttctttaa ctatgccgga    3120
atccatcgca gcgtaatgct ctacaccacg ccgaacacct gggtggacga tatcaccgtg    3180
gtgacgcatg tcgcgcaaga ctgtaaccac gcgtctgttg actggcaggt ggtggccaat    3240
ggtgatgtca gcgttgaact gcgtgatgcg gatcaacagg tggttgcaac tggacaaggc    3300
actagcggga ctttgcaagt ggtgaatccg cacctctggc aaccgggtga aggttatctc    3360
tatgaactgt gcgtcacagc caaaagccag acagagtgtg atatctaccc gcttcgcgtc    3420
ggcatccggt cagtggcagt gaagggcgaa cagttcctga ttaaccacaa accgttctac    3480
tttactggct ttggtcgtca tgaagatgcg gacttgcgtg gcaaaggatt cgataacgtg    3540
ctgatggtgc acgaccacgc attaatggac tggattgggg ccaactccta ccgtacctcg    3600
cattaccctt acgctgaaga gatgctcgac tgggcagatg aacatggcat cgtggtgatt    3660
gatgaaactg ctgctgtcgg ctttaacctc tctttaggca ttggtttcga agcgggcaac    3720
aagccgaaag aactgtacag cgaagaggca gtcaacgggg aaactcagca agcgcactta    3780
caggcgatta aagagctgat agcgcgtgac aaaaaccacc caagcgtggt gatgtggagt    3840
attgccaacg aaccggatac ccgtccgcaa ggtgcacggg aatatttcgc gccactggcg    3900
gaagcaacgc gtaaactcga cccgacgcgt ccgatcacct gcgtcaatgt aatgttctgc    3960
gacgctcaca ccgataccat cagcgatctc tttgatgtgc tgtgcctgaa ccgttattac    4020
ggatggtatg tccaaagcgg cgatttggaa acggcagaga aggtactgga aaaagaactt    4080
ctggcctggc aggagaaact gcatcagccg attatcatca ccgaatacgg cgtggatacg    4140
ttagccgggc tgcactcaat gtacaccgac atgtggagtg aagagtatca gtgtgcatgg    4200
ctggatatgt atcaccgcgt ctttgatcgc gtcagcgccg tcgtcggtga acaggtatgg    4260
aatttcgccg attttgcgac ctcgcaaggc atattgcgcg ttggcggtaa caagaaaggg 4320
atcttcactc gcgaccgcaa accgaagtcg gcggcttttc tgctgcaaaa acgctggact 4380
ggcatgaact tcggtgaaaa accgcagcag ggaggcaaac aatgaatcaa caactctcct 4440
ggcgcaccat cgtcggctac agcctcggga attgcgtacc gagctcgaat ttccccgatc 4500
gttcaaacat ttggcaataa agtttcttaa gattgaatcc tgttgccggt cttgcgatga 4560
ttatcatata atttctgttg aattacgtta agcatgtaat aattaacatg taatgcatga 4620
cgttatttat gagatgggtt tttatgatta gagtcccgca attatacatt taatacgcga 4680
tagaaaacaa aatatagcgc gcaaactagg ataaattatc gcgcgcggtg tcatctatgt 4740
tactagatcg ggaattggca tgcaagcttg gcactggccg tcgttttaca acgtcgtgac 4800
tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 4860
tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 4920
ggcgaatgct agagcagctt gagcttggat cagattgtcg tttcccgcct tcagtttgtg 4980
ttaattaacg gtccgaggcc                                             5000
<210>87
<211>4857
<212>DNA
<213>人工的
<220>
<223>表达构建体pBPSMM304
<220>
<221>终止子
<222>(426)..(678)
<223>NOS终止子(253bp)互补链
<220>
<221>misc_feature
<222>(694)..(694)
<223>MiRNA标签插入位点(Sac I)
<220>
<221>misc_feature
<222>(749)..(2749)
<223>β-葡糖醛酸糖苷酶GUS(2001bp)互补链
<220>
<221>内含子
<222>(2769)..(38 19)
<223>Zm泛蛋白内含子(1051bp)互补链
<220>
<221>启动子
<222>(3859)..(4856)
<223>Os CP12启动子(998bp)(互补链)
<400>87
tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat cgagtggtga     60
ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga tatattgtgg    120
tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt taatgtactg    180
aattgactag tggcgcgccc acaaactgaa ggcgggaaac gacaatctga tccaagctca    240
agctgctcta gcattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg    300
cctcttcgct attacgccag ctgcgaaagg ggatgtgctg caagcgatta agttggtaac    360
gccagggttt cccagtcacg acgttgtaaa acgacggcca gtgccaagct tgcatgccaa    420
ttcccgatct agtaacatag atgacaccgc gcgcgataat ttatcctagt ttgcgcgcta    480
tattttgttt tctatcgcgt attaaatgta taattgcggg actctaatca taaaaaccca    540
tctcataaat aacgtcatgc attacatgtt aattattaca tgcttaacgt aattcaacag    600
aaattatatg ataatcatcg caagaccggc aacaggattc aatcttaaga aactttattg    660
ccaaatgttt gaacgatcgg ggaaattcga gctcggtagc aattcccgag gctgtagccg    720
acgatggtgc gccaggagag ttgttgattc attgtttgcc tccctgctgc ggtttttcac    780
cgaagttcat gccagtccag cgtttttgca gcagaaaagc cgccgacttc ggtttgcggt    840
cgcgagtgaa gatccctttc ttgttaccgc caacgcgcaa tatgccttgc gaggtcgcaa    900
aatcggcgaa attccatacc tgttcaccga cgacggcgct gacgcgatca aagacgcggt    960
gatacatatc cagccatgca cactgatact cttcactcca catgtcggtg tacattgagt   1020
gcagcccggc taacgtatcc acgccgtatt cggtgatgat aatcggctga tgcagtttct   1080
cctgccaggc cagaagttct ttttccagta ccttctctgc cgtttccaaa tcgccgcttt   1140
ggacatacca tccgtaataa cggttcaggc acagcacatc aaagagatcg ctgatggtat   1200
cggtgtgagc gtcgcagaac attacattga cgcaggtgat cggacgcgtc gggtcgagtt   1260
tacgcgttgc ttccgccagt ggcgcgaaat attcccgtgc accttgcgga cgggtatccg   1320
gttcgttggc aatactccac atcaccacgc ttgggtggtt tttgtcacgc gctatcagct   1380
ctttaatcgc ctgtaagtgc gcttgctgag tttccccgtt gactgcctct tcgctgtaca   1440
gttctttcgg cttgttgccc gcttcgaaac caatgcctaa agagaggtta aagccgacag   1500
cagcagtttc atcaatcacc acgatgccat gttcatctgc ccagtcgagc atctcttcag   1560
cgtaagggta atgcgaggta cggtaggagt tggccccaat ccagtccatt aatgcgtggt   1620
cgtgcaccat cagcacgtta tcgaatcctt tgccacgcaa gtccgcatct tcatgacgac    1680
caaagccagt aaagtagaac ggtttgtggt taatcaggaa ctgttcgccc ttcactgcca    1740
ctgaccggat gccgacgcga agcgggtaga tatcacactc tgtctggctt ttggctgtga    1800
cgcacagttc atagagataa ccttcacccg gttgccagag gtgcggattc accacttgca    1860
aagtcccgct agtgccttgt ccagttgcaa ccacctgttg atccgcatca cgcagttcaa    1920
cgctgacatc accattggcc accacctgcc agtcaacaga cgcgtggtta cagtcttgcg    1980
cgacatgcgt caccacggtg atatcgtcca cccaggtgtt cggcgtggtg tagagcatta    2040
cgctgcgatg gattccggca tagttaaaga aatcatggaa gtaagactgc tttttcttgc    2100
cgttttcgtc ggtaatcacc attcccggcg ggatagtctg ccagttcagt tcgttgttca    2160
cacaaacggt gatacctgca catcaacaaa ttttggtcat atattagaaa agttataaat    2220
taaaatatac acacttataa actacagaaa agcaattgct atatactaca ttcttttatt    2280
ttgaaaaaaa tatttgaaat attatattac tactaattaa tgataattat tatatatata    2340
tcaaaggtag aagcagaaac ttacgtacac ttttcccggc aataacatac ggcgtgacat    2400
cggcttcaaa tggcgtatag ccgccctgat gctccatcac ttcctgatta ttgacccaca    2460
ctttgccgta atgagtgacc gcatcgaaac gcagcacgat acgctggcct gcccaacctt    2520
tcggtataaa gacttcgcgc tgataccaga cgttgcccgc ataattacga atatctgcat    2580
cggcgaactg atcgttaaaa ctgcctggca cagcaattgc ccggctttct tgtaacgcgc    2640
tttcccacca acgctgacca attccacagt tttcgcgatc cagactgaat gcccacaggc    2700
cgtcgagttt tttgatttca cgggttgggg tttctacagg acgtaacata agggactgac    2760
ctacccgggc tgcagaagta acaccaaaca acagggtgag catcgacaaa agaaacagta    2820
ccaagcaaat aaatagcgta tgaaggcagg gctaaaaaaa tccacatata gctgctgcat    2880
atgccatcat ccaagtatat caagatcaaa ataattataa aacatacttg tttattataa    2940
tagataggta ctcaaggtta gagcatatga atagatgctg catatgccat catgtatatg    3000
catcagtaaa acccacatca acatgtatac ctatcctaga tcgatatttc catccatctt    3060
aaactcgtaa ctatgaagat gtatgacaca cacatacagt tccaaaatta ataaatacac    3120
caggtagttt gaaacagtat tctactccga tctagaacga atgaacgacc gcccaaccac    3180
accacatcat cacaaccaag cgaacaaaaa gcatctctgt atatgcatca gtaaaacccg    3240
catcaacatg tatacctatc ctagatcgat atttccatcc atcatcttca attcgtaact    3300
atgaatatgt atggcacaca catacagatc caaaattaat aaatccacca ggtagtttga    3360
aacagaattc tactccgatc tagaacgacc gcccaaccag accacatcat cacaaccaag    3420
acaaaaaaaa gcatgaaaag atgacccgac aaacaagtgc acggcatata ttgaaataaa    3480
ggaaaagggc aaaccaaacc ctatgcaacg aaacaaaaaa aatcatgaaa tcgatcccgt    3540
ctgcggaacg gctagagcca tcccaggatt ccccaaagag aaacactggc aagttagcaa    3600
tcagaacgtg tctgacgtac aggtcgcatc cgtgtacgaa cgctagcagc acggatctaa    3660
cacaaacacg gatctaacac aaacatgaac agaagtagaa ctaccgggcc ctaaccatgg    3720
accggaacgc cgatctagag aaggtagaga gggggggggg gggaggacga gcggcgtacc    3780
ttgaagcgga ggtgccgacg ggtggatttg ggggagatcc tctagagtcg acctgcaggc    3840
atgcaagctt ggcgcgcctg ttgatgcgga tttctgcgtg tgatgtgggc gtttgtagct    3900
gttgcgacga ggcgttcgtt gcacggattg aagagatggg gtttatatat atatagctcc    3960
gtggggtggg ggagaagggg agagaggatt cgacgacgtg cactcgtttc ttatcgcctc    4020
ctcagccaat cgtcgtgtgc cacgtgggct gtattttgag atatttcatg cgaaatgggg    4080
acttggcaaa ggagatcttt ttcttttccc ttgggtgaat ctaaggtgag agaagcagtt    4140
ttaatttgac cgtgaaaaca tgagcagatg actgtgggtg tgtacatgta tgcagaagtt    4200
caggttggat acgaaattga tgtagaggtt cgtgttgtgc cagcaaagaa tggcttgtag    4260
ggaagtgaac tcggtctaag gccagaaaga tcactttcgg tctcgaaaat atctgagata    4320
ctatggaaaa gtttggtgaa gaacggacaa aatgaaacgt cctagatatc tcaactattt    4380
tggtggaaca gagttattta gtgtacaggt gcagaggtgc tcaaattatt tggtgagtag    4440
caaattattt ttcattttgc ccaataggtg cgtatggttc tttctttgta aagtttttag    4500
attgggacta agctagctcg gatcaagagc ggaattgagg tggtaagaga agtggaaacc    4560
agatggcctt gaagttgtcc ccgcaacctg gacttcctga gttcggacca acaagacaag    4620
cctcttgcaa ggcccagtta cagccggatt agtcgcttat aggcccacag ttgactgggc    4680
cttaggccca tgctgccacc ctgccgagaa ttttttttat ttttacattt tttgattaaa    4740
atatttaaaa ataatttttc attccgaaaa tttacaaatc tagtcgtgcc tcacgtcctc    4800
ctagagggct tttttcaaat cacccttcca gagggcgtta gggacctaaa tacaaag       4857
<210>88
<211>4725
<212>DNA
<213>人工的
<220>
<223>表达构建体pBPSMM331
<220>
<221>终止子
<222>(481)..(733)
<223>NOS终止子(253 bp)互补链
<220>
<221>misc_feature
<222>(749)..(749)
<223>MiRNA标签插入位点(Sac I)
<220>
<221>misc_feature
<222>(804)..(2804)
<223>GUS(2001bp):互补链
<220>
<221>内含子
<222>(2824)..(3874)
<223>Zm泛蛋白内含子(1051bp):互补链
<220>
<221>启动子
<222>(3912)..(4725)
<223>Os SI启动子(814bp)互补链
<400>88
gttgccgttc ttccgaatag catcggtaac atgagcaaag tctgccgcct tacaacggct     60
ctcccgctga cgccgtcccg gactgatggg ctgcctgtat cgagtggtga ttttgtgccg    120
agctgccggt cggggagctg ttggctggct ggtggcagga tatattgtgg tgtaaacaaa    180
ttgacgctta gacaacttaa taacacattg cggacgtttt taatgtactg aattgactag    240
tggcgcgccc acaaactgaa ggcgggaaac gacaatctga tccaagctca agctgctcta    300
gcattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct    360
attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg    420
gttttcccag tcacgacgtt gtaaaacgac ggccagtgcc aagcttgcat gccaattccc    480
gatctagtaa catagatgac accgcgcgcg ataatttatc ctagtttgcg cgctatattt    540
tgttttctat cgcgtattaa atgtataatt gcgggactct aatcataaaa acccatctca    600
taaataacgt catgcattac atgttaatta ttacatgctt aacgtaattc aacagaaatt    660
atatgataat catcgcaaga ccggcaacag gattcaatct taagaaactt tattgccaaa    720
tgtttgaacg atcggggaaa ttcgagctcg gtagcaattc ccgaggctgt agccgacgat    780
ggtgcgccag gagagttgtt gattcattgt ttgcctccct gctgcggttt ttcaccgaag    840
ttcatgccag tccagcgttt ttgcagcaga aaagccgccg acttcggttt gcggtcgcga    900
gtgaagatcc ctttcttgtt accgccaacg cgcaatatgc cttgcgaggt cgcaaaatcg     960
gcgaaattcc atacctgttc accgacgacg gcgctgacgc gatcaaagac gcggtgatac    1020
atatccagcc atgcacactg atactcttca ctccacatgt cggtgtacat tgagtgcagc    1080
ccggctaacg tatccacgcc gtattcggtg atgataatcg gctgatgcag tttctcctgc    1140
caggccagaa gttctttttc cagtaccttc tctgccgttt ccaaatcgcc gctttggaca    1200
taccatccgt aataacggtt caggcacagc acatcaaaga gatcgctgat ggtatcggtg    1260
tgagcgtcgc agaacattac attgacgcag gtgatcggac gcgtcgggtc gagtttacgc    1320
gttgcttccg ccagtggcgc gaaatattcc cgtgcacctt gcggacgggt atccggttcg    1380
ttggcaatac tccacatcac cacgcttggg tggtttttgt cacgcgctat cagctcttta    1440
atcgcctgta agtgcgcttg ctgagtttcc ccgttgactg cctcttcgct gtacagttct    1500
ttcggcttgt tgcccgcttc gaaaccaatg cctaaagaga ggttaaagcc gacagcagca    1560
gtttcatcaa tcaccacgat gccatgttca tctgcccagt cgagcatctc ttcagcgtaa    1620
gggtaatgcg aggtacggta ggagttggcc ccaatccagt ccattaatgc gtggtcgtgc    1680
accatcagca cgttatcgaa tcctttgcca cgcaagtccg catcttcatg acgaccaaag    1740
ccagtaaagt agaacggttt gtggttaatc aggaactgtt cgcccttcac tgccactgac    1800
cggatgccga cgcgaagcgg gtagatatca cactctgtct ggcttttggc tgtgacgcac    1860
agttcataga gataaccttc acccggttgc cagaggtgcg gattcaccac ttgcaaagtc    1920
ccgctagtgc cttgtccagt tgcaaccacc tgttgatccg catcacgcag ttcaacgctg    1980
acatcaccat tggccaccac ctgccagtca acagacgcgt ggttacagtc ttgcgcgaca    2040
tgcgtcacca cggtgatatc gtccacccag gtgttcggcg tggtgtagag cattacgctg    2100
cgatggattc cggcatagtt aaagaaatca tggaagtaag actgcttttt cttgccgttt    2160
tcgtcggtaa tcaccattcc cggcgggata gtctgccagt tcagttcgtt gttcacacaa    2220
acggtgatac ctgcacatca acaaattttg gtcatatatt agaaaagtta taaattaaaa    2280
tatacacact tataaactac agaaaagcaa ttgctatata ctacattctt ttattttgaa    2340
aaaaatattt gaaatattat attactacta attaatgata attattatat atatatcaaa    2400
ggtagaagca gaaacttacg tacacttttc ccggcaataa catacggcgt gacatcggct    2460
tcaaatggcg tatagccgcc ctgatgctcc atcacttcct gattattgac ccacactttg    2520
ccgtaatgag tgaccgcatc gaaacgcagc acgatacgct ggcctgccca acctttcggt    2580
ataaagactt cgcgctgata ccagacgttg cccgcataat tacgaatatc tgcatcggcg    2640
aactgatcgt taaaactgcc tggcacagca attgcccggc tttcttgtaa cgcgctttcc    2700
caccaacgct gaccaattcc acagttttcg cgatccagac tgaatgccca caggccgtcg    2760
agttttttga tttcacgggt tggggtttct acaggacgta acataaggga ctgacctacc    2820
cgggctgcag aagtaacacc aaacaacagg gtgagcatcg acaaaagaaa cagtaccaag    2880
caaataaata gcgtatgaag gcagggctaa aaaaatccac atatagctgc tgcatatgcc    2940
atcatccaag tatatcaaga tcaaaataat tataaaacat acttgtttat tataatagat    3000
aggtactcaa ggttagagca tatgaataga tgctgcatat gccatcatgt atatgcatca    3060
gtaaaaccca catcaacatg tatacctatc ctagatcgat atttccatcc atcttaaact    3120
cgtaactatg aagatgtatg acacacacat acagttccaa aattaataaa tacaccaggt    3180
agtttgaaac agtattctac tccgatctag aacgaatgaa cgaccgccca accacaccac    3240
atcatcacaa ccaagcgaac aaaaagcatc tctgtatatg catcagtaaa acccgcatca    3300
acatgtatac ctatcctaga tcgatatttc catccatcat cttcaattcg taactatgaa    3360
tatgtatggc acacacatac agatccaaaa ttaataaatc caccaggtag tttgaaacag    3420
aattctactc cgatctagaa cgaccgccca accagaccac atcatcacaa ccaagacaaa    3480
aaaaagcatg aaaagatgac ccgacaaaca agtgcacggc atatattgaa ataaaggaaa    3540
agggcaaacc aaaccctatg caacgaaaca aaaaaaatca tgaaatcgat cccgtctgcg    3600
gaacggctag agccatccca ggattcccca aagagaaaca ctggcaagtt agcaatcaga    3660
acgtgtctga cgtacaggtc gcatccgtgt acgaacgcta gcagcacgga tctaacacaa    3720
acacggatct aacacaaaca tgaacagaag tagaactacc gggccctaac catggaccgg    3780
aacgccgatc tagagaaggt agagaggggg ggggggggag gacgagcggc gtaccttgaa    3840
gcggaggtgc cgacgggtgg atttggggga gatcctctag agtcgacctg caggcatgca    3900
agcttggcgc gcctaactcc tggcttcctt ccgatctgga ctggagagga gctgattgga    3960
tcggatcgag caggtcgtcg gggaaggagt gagggggagt ctctctctct ctctgccaag    4020
gaccaaggta ggtcaatgcc tcagccagat cccatagcca taaacccttg ttttgttaaa    4080
gggcattcac aatgggccga cgtggcattc agcctcaacc caaaaaagcg aagactagta    4140
ttcctttgcc tcgtcgtcca accgcgcgcc ctcctcagct cagtgggacc cacaccaccg    4200
ctagaggaga gaggagaggg ggcgaagcag ccgaactcca ggggaggagg gcgccgaccg    4260
ccgcctcgca tccgcccgtc gccgtctccc gctccaagtc gtctgcccgc cgccgacatg    4320
ccgccgccgc cctgctgctc cgagcagccc cgccgctcgg gggggagagg agggggtggt    4380
gcgccggcga gcgcatcccg ccgctcggcg ctgtcgccct gccgtcgctc caccactgct 4440
tggtccggcg ccgtcgccgt ctccgcgcgc caggctctct gcggtggggg aaaggaagag 4500
aggggggaga gagaggggaa agtgaaagag aagtgaaaat gtggtagtcc accataccta 4560
cttgtatcgt ggtcttgtag attttgcact gtggaacata tggcttaaca tagttgttgg 4620
tctaggtgac ataccaggaa caccaaagtg tggagagtgg cttgtggggg tgggggccca 4680
ccaccttcat tccattacac ggtcgaatcg aggcagcgat cgctt                 4725
<210>89
<211>7150
<212>DNA
<213>人工的
<220>
<223>表达构建体pBPSMM325
<220>
<221>启动子
<222>(305)..(1338)
<223>Os CCoAMT1启动子(1034bp)
<220>
<221>内含子
<222>(1345)..(2395)
<223>Zm泛蛋白内含子:(1051bp)
<220>
<221>misc_feature
<222>(2407)..(4407)
<223>β-葡糖醛酸糖苷酶GUS(2001bp)
<220>
<221>终止子
<222>(4446)..(5549)
<223>CCoAMT1终止子(1104bp)
<220>
<221>misc_feature
<222>(4793)..(4793)
<223>MiRNA标签插入(AgeI)
<400>89
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag     60
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat    120
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga    180
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt    240
taatgtactg aattgactag tggcgcgccc acaaacctta aggcgatcgc gctgaggcgg    300
accgcaacta ctgcacggta aaagtgatag gaatcggtcg gaaacagtat taatgttttt     360
attattttta caaaaacgaa ttgaaataat tggaaatttt catatttata tattaaacta     420
ttcagtatca acttcaattc gacgtcaata gaaattagaa aagcataatt atacacagta     480
ataggcgttc aagatattat tgttattatt tagttttgtg gaaatggtat caacgtgatc     540
ggaaaatttt gtacatgttt tcaccctgcg ggatatctca attccttctc ctccctctac     600
cgccatatca gcacacgttt tagagcacca atcataaccc ataaatccgt gggctactca     660
cttatttaat ttatatgtga attcgtgacc tgactcactc acatactatc aaaaatttgt     720
ctcagtcacc catctccttc tttcctggtc cgataagggt ttatcctacg gttcgacggt     780
tatcacgata gtcgtgcggt tactgaggta taccgtgatt taaaaatatg ataaagttac     840
cgcaggtttt aactgcgcgg tttggtaaac ctgttcctcc tcaccaacct tctcctccgg     900
tctccttatg tgtctcaccg aggcgagccg ccgcgagacc gcatggacgc ggtccacgca     960
cctggcggtg cacctcctcc tccccggcga agaagacgtg gaggagagta aatgagcaat    1020
caggcccacg gcccaatcgc cgtccaccac ccaccaccct cagcgaccca aaaccacctc    1080
accaacccaa ctctgtaccg tactgtaccc gccctcccct cccactgaca ctccgggccc    1140
acctgtcggc gcgactcttc cacggtcccc ttctctcctc agagattttt tccacgcatt    1200
ttttaatttt tttttctgca gttcacatgc tcttctccca ctcttccgcc gcgctatata    1260
aaccgcgcga ggcgtcgttg cctcgtcggc gaagtcaatc cggcgatccc cggcgagcga    1320
gagatcgaag caagctgcga gctcgatctc ccccaaatcc acccgtcggc acctccgctt    1380
caaggtacgc cgctcgtcct cccccccccc ccctctctac cttctctaga tcggcgttcc    1440
ggtccatggt tagggcccgg tagttctact tctgttcatg tttgtgttag atccgtgttt    1500
gtgttagatc cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc agacacgttc    1560
tgattgctaa cttgccagtg tttctctttg gggaatcctg ggatggctct agccgttccg    1620
cagacgggat cgatttcatg attttttttg tttcgttgca tagggtttgg tttgcccttt    1680
tcctttattt caatatatgc cgtgcacttg tttgtcgggt catcttttca tgcttttttt    1740
tgtcttggtt gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga gtagaattct    1800
gtttcaaact acctggtgga tttattaatt ttggatctgt atgtgtgtgc catacatatt    1860
catagttacg aattgaagat gatggatgga aatatcgatc taggataggt atacatgttg    1920
atgcgggttt tactgatgca tatacagaga tgctttttgt tcgcttggtt gtgatgatgt    1980
ggtgtggttg ggcggtcgtt cattcgttct agatcggagt agaatactgt ttcaaactac    2040
ctggtgtatt tattaatttt ggaactgtat gtgtgtgtca tacatcttca tagttacgag    2100
tttaagatgg atggaaatat cgatctagga taggtataca tgttgatgtg ggttttactg    2160
atgcatatac atgatggcat atgcagcatc tattcatatg ctctaacctt gagtacctat    2220
ctattataat aaacaagtat gttttataat tattttgatc ttgatatact tggatgatgg    2280
catatgcagc agctatatgt ggattttttt agccctgcct tcatacgcta tttatttgct    2340
tggtactgtt tcttttgtcg atgctcaccc tgttgtttgg tgttacttct gcagccccgg    2400
ggatccatgt tacgtcctgt agaaacccca acccgtgaaa tcaaaaaact cgacggcctg    2460
tgggcattca gtctggatcg cgaaaactgt ggaattggtc agcgttggtg ggaaagcgcg    2520
ttacaagaaa gccgggcaat tgctgtgcca ggcagtttta acgatcagtt cgccgatgca    2580
gatattcgta attatgcggg caacgtctgg tatcagcgcg aagtctttat accgaaaggt    2640
tgggcaggcc agcgtatcgt gctgcgtttc gatgcggtca ctcattacgg caaagtgtgg    2700
gtcaataatc aggaagtgat ggagcatcag ggcggctata cgccatttga agccgatgtc    2760
acgccgtatg ttattgccgg gaaaagtgta cgtaagtttc tgcttctacc tttgatatat    2820
atataataat tatcattaat tagtagtaat ataatatttc aaatattttt ttcaaaataa    2880
aagaatgtag tatatagcaa ttgcttttct gtagtttata agtgtgtata ttttaattta    2940
taacttttct aatatatgac caaaatttgt tgatgtgcag gtatcaccgt ttgtgtgaac    3000
aacgaactga actggcagac tatcccgccg ggaatggtga ttaccgacga aaacggcaag    3060
aaaaagcagt cttacttcca tgatttcttt aactatgccg gaatccatcg cagcgtaatg    3120
ctctacacca cgccgaacac ctgggtggac gatatcaccg tggtgacgca tgtcgcgcaa    3180
gactgtaacc acgcgtctgt tgactggcag gtggtggcca atggtgatgt cagcgttgaa    3240
ctgcgtgatg cggatcaaca ggtggttgca actggacaag gcactagcgg gactttgcaa    3300
gtggtgaatc cgcacctctg gcaaccgggt gaaggttatc tctatgaact gtgcgtcaca    3360
gccaaaagcc agacagagtg tgatatctac ccgcttcgcg tcggcatccg gtcagtggca    3420
gtgaagggcg aacagttcct gattaaccac aaaccgttct actttactgg ctttggtcgt    3480
catgaagatg cggacttgcg tggcaaagga ttcgataacg tgctgatggt gcacgaccac    3540
gcattaatgg actggattgg ggccaactcc taccgtacct cgcattaccc ttacgctgaa    3600
gagatgctcg actgggcaga tgaacatggc atcgtggtga ttgatgaaac tgctgctgtc    3660
ggctttaacc tctctttagg cattggtttc gaagcgggca acaagccgaa agaactgtac    3720
agcgaagagg cagtcaacgg ggaaactcag caagcgcact tacaggcgat taaagagctg    3780
atagcgcgtg acaaaaacca cccaagcgtg gtgatgtgga gtattgccaa cgaaccggat    3840
acccgtccgc aaggtgcacg ggaatatttc gcgccactgg cggaagcaac gcgtaaactc    3900
gacccgacgc gtccgatcac ctgcgtcaat gtaatgttct gcgacgctca caccgatacc    3960
atcagcgatc tctttgatgt gctgtgcctg aaccgttatt acggatggta tgtccaaagc    4020
ggcgatttgg aaacggcaga gaaggtactg gaaaaagaac ttctggcctg gcaggagaaa    4080
ctgcatcagc cgattatcat caccgaatac ggcgtggata cgttagccgg gctgcactca    4140
atgtacaccg acatgtggag tgaagagtat cagtgtgcat ggctggatat gtatcaccgc    4200
gtctttgatc gcgtcagcgc cgtcgtcggt gaacaggtat ggaatttcgc cgattttgcg    4260
acctcgcaag gcatattgcg cgttggcggt aacaagaaag ggatcttcac tcgcgaccgc    4320
aaaccgaagt cggcggcttt tctgctgcaa aaacgctgga ctggcatgaa cttcggtgaa    4380
aaaccgcagc agggaggcaa acaatgaaga tcctctagag tcgacctgca ggcatgcaag    4440
cttggcgcgc cgccgatgcc caagaactag tcattttaaa tttataaatt ataactaaat    4500
tgtataattt ttgccttttt tttttaattt gcaagctact ggaaaatgtt atttaatata    4560
tgtataaatg tcgagacaat aatattattg cattataaat tgacctggtt tttgttagct    4620
ttcgttgcgc gtgagaatgg tgagtgtgtg ctgctgatga aactcgaatg ttcacttttg    4680
ttgtcttgtc cagctttgct aaactttggc agcattagca aagctgtttt gttctgtttc    4740
tgaattgttc ttggattgaa atctctaata ttgacttgat aattaaattt gaccggtttt    4800
tggcagtaaa ttccttcagt attggcagct caaactgaat tcttctacta atagtttagt    4860
gcttgtggag agtgtagtcg tgtagagtgg actggactaa ttcagatctt tacttggtta    4920
gctgaagatg gcatccgtta tctgaattct tcagtagttg gtggataatg acaactcgat    4980
gtagagagat aatttgctgc atgttagttt ggaagtagct tcaaaggatt taattctcag    5040
cgtccgaagt cttaagtaca gttggtttgg agagctgttc ctgtgaagac ttttatgatt    5100
tgtgctagtt atgtcatcac atgatcactt caattatcac ttatcgatct agtgagacca    5160
accatacata ccatacaaag gtaaaaagtg ttcaaactgg attgaacaag ttctgtctcc    5220
atatagatcc tactaaaatg catacatgtt gtagcaatcc catttcatcc aaaccaaaca    5280
aaatctcttt cattcggctc taaccaatca aacagagcca tttgtatccc ccgaaccaaa    5340
ccagccgagc atggatgagg gatcgagggc atccgagcaa ccaaacaggc ccaaagtgaa    5400
tgctttggtc gattttcgat ttgttcccta cgaatccaat tttagtcctt cagccagaag    5460
accagataca attgatccct caactatcaa aacaagtgca gatgagctcc ctcgacagtt    5520
tggacggcgg tttggttgac gtggttaatt aacggtccga ggcctcctca gcaagctgtt    5580
aacgcgatcg cagcgcctta aggggccgct ctagattagt gtacggaata aaagtcctaa    5640
ttcattcttt ttcttatacg tcaccgtttt ctacatttag aaaaatgaag tgggaatcaa    5700
ttgaaacaat tgatagcttt aaatatcaag ctgtcttctc caggaccagg ccccagcaca    5760
tcggcgtgga aagcgctagg ccccagaaca actcgtcaat cgtcatggca aataatgaca    5820
cattgagccg atttgatgca tggaacagac taataaggaa ctcaaatctc tttggagatt    5880
gaatgattga gatgaaaatg aattaatatt ttttctcaat cccctccaat gctaagaaag    5940
tttgagtttc caaattagct ttagagggcg tttagatccc ttcgttttag agaaattaga    6000
attcactcaa taaaataact tatttaattt ggaatttgat attcaaccac ttttcaaagt    6060
ttagatatag gtctatctca aattcatagg gtggatgatg gaaatgattt tatgcattaa    6120
tagaatttgt ttctactgtg taacttacat gacactcttc atctcactcc tgtatagtaa    6180
aaatgtagca tataaatatc tccgacatct tgataataat agtatacaaa tatattttgc    6240
ataaaaccga attaacttaa ttgatatatg ccaaaattac tattattaga atggaattta    6300
attccaatga tccaaaccac gaaaatggat caggtaacta attcagtcaa atgcctcatt    6360
ttttttcact cccctcaaac cacgaaaatg ccattctggt ttgtaaaata gtttgaaatt    6420
gcagccctag cattattcca tacatcatat gttgagttga aattaccaat ataataataa    6480
ctaaaaaagg aaaaaaatag cgaaaacaaa agcaaggacc agttggacac ttaaatttgg    6540
caacagaagc caattcagaa ccactgcata gcagtgctta ttatcttatt tatatgtagc    6600
aaaaggcact taaatgatct cttatgacac atgccagaag gaaaacaaca gactacacaa    6660
ttacaaggtc ggaagctaca taggattacc ataacagata gctgacggcc tacaaaaaaa    6720
gatagaatac aggagaacat cacacagata aaaacatatc acccttgtac tagcagggag    6780
gcggtgcttg ctggatttta gatcagttgc ttgctggatt ttagatcagt acacagtcct    6840
gccatcacca tccaggatca tatccttgaa agccccacca ttagggatca taggcaacac    6900
atgctcctgg tgtgggacga ttatatccaa gaggtacggc cctggagtct cgagcatctt    6960
ctttatcgct gcgcggactt cgttcttctt tgtcacacgg accgctggaa tgttgaaccc    7020
tttggcgatc gtcacgaaat ctggatatat ctcactttca ttctctgggt ttcccaagta    7080
tgtgtgcgct ctgttggcct tatagaacct gtcctcccac tgcaccacca tccccaggtg    7140
ctggttgttt                                                           7150
<210>90
<211>23
<212>DNA
<213>人
<400>90
tcagttttgc atagatttgc aca                                             23
<210>91
<211>22
<212>DNA
<213>人
<400>91
aaccacacaa cctactacct  ca                                             22
<210>92
<211>22
<212>DNA
<213>人
<400>92
cacaagttcg gatctacggg tt                                              22
<210>93
<211>23
<212>DNA
<213>人
<400>93
tcatagccct gtacaatgct gct                                             23
<210>94
<211>23
<212>DNA
<213>人
<400>94
tgatagccct gtacaatgct gct                                             23
<210>95
<211>23
<212>DNA
<213>人
<400>95
cacaaattcg gatctacagg gta                                             23
<210>96
<211>20
<212>DNA
<213>人
<400>96
gcattcaccg cgtgccttaa                                                 20
<210>97
<211>21
<212>DNA
<213>人
<400>97
gcaagcccag accgcaaaaa g                                               21
<210>98
<211>18
<212>DNA
<213>人
<400>98
agacacgtgc actgtaga                                                   18
<210>99
<211>20
<212>DNA
<213>人
<400>99
gcagaagcat ttccacacac                                                 20
<210>100
<211>22
<212>DNA
<213>人
<400>100
acaaagttct gtagtgcact ga                                              22
<210>101
<211>22
<212>DNA
<213>人
<400>101
cacaaaccat tatgtgctgc ta                                              22
<210>102
<211>22
<212>DNA
<213>人
<400>102
cgccaatatt tacgtgctgc ta                                             22
<210>103
<211>22
<212>DNA
<213>人
<400>103
tatctgcact agatgcacct ta                                              22
<210>104
<211>21
<212>DNA
<213>人
<400>104
ggctgtcaat tcataggtca g                                               21
<210>105
<211>21
<212>DNA
<213>人
<400>105
ccaacaacat gaaactacct a                                               21
<210>106
<211>22
<212>DNA
<213>人
<400>106
aacaggtagt ctgaacactg gg                                              22
<210>107
<211>22
<212>DNA
<213>人
<400>107
aactatacaa cctactacct ca                                              22
<210>108
<211>22
<212>DNA
<213>人
<400>108
ctgttcctgc tgaactgagc ca                                              22
<210>109
<211>22
<212>DNA
<213>人
<400>109
tacctgcact ataagcactt ta                                              22
<210>110
<211>22
<212>DNA
<213>人
<400>110
acaagctttt tgctcgtctt at                                              22
<210>111
<211>21
<212>DNA
<213>人
<400>111
cagccgctgt cacacgcaca g                                               21
<210>112
<211>21
<212>DNA
<213>人
<400>112
ggccgtgact ggagactgtt a                                               21
<210>113
<211>24
<212>DNA
<213>人
<400>113
aacccaccga cagcaatgaa tgtt                                            24
<210>114
<211>21
<212>DNA
<213>人
<400>114
ctgcctgtct gtgcctgctg t                                               21
<210>115
<211>21
<212>DNA
<213>人
<400>115
gtctgtcaat tcataggtca t                                               21
<210>116
<211>21
<212>DNA
<213>人
<400>116
cacagttgcc agctgagatt a                                               21
<210>117
<211>24
<212>DNA
<213>人
<400>117
atccaatcag ttcctgatgc agta                                            24
<210>118
<211>21
<212>DNA
<213>人工的
<220>
<223>与hsa-miR-218几乎互补
<400>118
acatggttag atcaagcaca a                                               21
<210>119
<211>21
<212>DNA
<213>人
<400>119
agaattgcgt ttggacaatc a                                               21
<210>120
<211>22
<212>DNA
<213>人
<400>120
acagttcttc aactggcagc tt                                              22
<210>121
<211>21
<212>DNA
<213>人
<400>121
aaagtgtcag atacggtgtg g                                               21
<210>122
<211>23
<212>DNA
<213>人
<400>122
gaaacccagc agacaatgta gct                                             23
<210>123
<211>24
<212>DNA
<213>人
<400>123
gagacccagt agccagatgt agct                                            24
<210>124
<211>21
<212>DNA
<213>人
<400>124
ggaaatccct ggcaatgtga t                                               21
<210>125
<211>23
<212>DNA
<213>人
<400>125
tcagttttgc atggatttgc aca                                             23
<210>126
<211>22
<212>DNA
<213>人
<400>126
gcaaaaatgt gctagtgcca aa                                              22
<210>127
<211>21
<212>DNA
<213>人
<400>127
acctatcctg aattacttga a                                               21
<210>128
<211>22
<212>DNA
<213>人
<400>128
ggcggaactt agccactgtg aa                                              22
<210>129
<211>22
<212>DNA
<213>人
<400>129
ctcaatagac tgtgagctcc tt                                              22
<210>130
<211>22
<212>DNA
<213>人
<400>130
aaccgatttc agatggtgct ag                                              22
<210>131
<211>20
<212>DNA
<213>人
<400>131
actgatttca aatggtgcta                                                 20
<210>132
<211>22
<212>DNA
<213>人
<400>132
gctgcaaaca tccgactgaa ag                                              22
<210>133
<211>23
<212>DNA
<213>人
<400>133
gctgagagtg taggatgttt aca                                             23
<210>134
<211>22
<212>DNA
<213>人
<400>134
cttccagtcg gggatgttta ca                                              22
<210>135
<211>20
<212>DNA
<213>人
<400>135
tccagtcaag gatgtttaca                                                 20
<210>136
<211>21
<212>DNA
<213>人
<400>136
gcaacttagt aatgtgcaat a                                               21
<210>137
<211>19
<212>DNA
<213>人
<400>137
caatgcaact acaatgcac                                                  19
<210>138
<211>21
<212>DNA
<213>人
<400>138
aacaaaatca ctagtcttcc a                                               21
<210>139
<211>24
<212>DNA
<213>人
<400>139
actacctgca ctgtaagcac tttg                                            24
<210>140
<211>22
<212>DNA
<213>人
<400>140
acaggccggg acaagtgcaa ta                                              22
<210>141
<211>22
<212>DNA
<213>人
<400>141
ctacctgcac gaacagcact tt                                              22
<210>142
<211>22
<212>DNA
<213>人
<400>142
tgctcaataa atacccgttg aa                                              22
<210>143
<211>22
<212>DNA
<213>人
<400>143
aacaatacaa cttactacct ca                                              22
<210>144
<211>22
<212>DNA
<213>人
<400>144
agcctatcct ggattacttg aa                                              22
<210>145
<211>22
<212>DNA
<213>小家鼠
<400>145
ctacgcgtat tcttaagcaa ta                                              22
<210>146
<211>20
<212>DNA
<213>小家鼠
<400>146
tcagttatca cagtactgta                                                 20
<210>147
<211>22
<212>DNA
<213>小家鼠
<400>147
acacaaattc ggttctacag gg                                              22
<210>148
<211>23
<212>DNA
<213>人工的
<220>
<223>与mmu-miT-122a互补
<400>148
acaaacacca ttgtcacact cca                                              23
<210>149
<211>22
<212>DNA
<213>人工的
<220>
<223>与mmu-miR-124a互补
<400>149
tggcattcac cgcgtgcctt aa                                              22
<210>150
<211>23
<212>DNA
<213>小家鼠
<400>150
cacaggttaa agggtctcag gga                                             23
<210>151
<211>22
<212>DNA
<213>小家鼠
<400>151
tcacaagtta gggtctcagg ga                                              22
<210>152
<211>21
<212>DNA
<213>小家鼠
<400>152
gcattattac tcacggtacg a                                               21
<210>153
<211>22
<212>DNA
<213>小家鼠
<400>153
agccaagctc agacggatcc ga                                              22
<210>154
<211>22
<212>DNA
<213>人工的
<220>
<223>与mmu-miR-128互补
<400>154
aaaagagacc ggttcactgt ga                                              22
<210>155
<211>22
<212>DNA
<213>小家鼠
<400>155
agcaagccca gaccgcaaaa ag                                              22
<210>156
<211>20
<212>DNA
<213>小家鼠
<400>156
gcccttttaa cattgcactg                                                 20
<210>157
<211>22
<212>DNA
<213>小家鼠
<400>157
cgaccatggc tgtagactgt ta                                              22
<210>158
<211>22
<212>DNA
<213>小家鼠
<400>158
acagctggtt gaaggggacc aa                                              22
<210>159
<211>21
<212>DNA
<213>小家鼠
<400>159
ccctctggtc aaccagtcac a                                                21
<210>160
<211>23
<212>DNA
<213>小家鼠
<400>160
tcacatagga ataaaaagcc ata                                              23
<210>161
<211>23
<212>DNA
<213>小家鼠
<400>161
tccatcatca aaacaaatgg agt                                              23
<210>162
<211>22
<212>DNA
<213>小家鼠
<400>162
tgtgagttct accattgcca aa                                               22
<210>163
<211>21
<212>DNA
<213>小家鼠
<400>163
ccatctttac cagacagtgt t                                                21
<210>164
<211>22
<212>DNA
<213>小家鼠
<400>164
ccataaagta ggaaacacta ca                                              22
<210>165
<211>20
<212>DNA
<213>小家鼠
<400>165
gtagtgcttt ctactttatg                                                 20
<210>166
<211>22
<212>DNA
<213>小家鼠
<400>166
tgagctacag tgcttcatct ca                                              22
<210>167
<211>22
<212>DNA
<213>小家鼠
<400>167
ctagtacatc atctatactg ta                                              22
<210>168
<211>24
<212>DNA
<213>小家鼠
<400>168
aagggattcc tgggaaaact ggac                                            24
<210>169
<211>22
<212>DNA
<213>小家鼠
<400>169
aacccatgga attcagttct ca                                              22
<210>170
<211>22
<212>DNA
<213>小家鼠
<400>170
ggagtgaaga cacggagcca ga                                              22
<210>171
<211>22
<212>DNA
<213>小家鼠
<400>171
cactggtaca agggttggga ga                                              22
<210>172
<211>21
<212>DNA
<213>小家鼠
<400>172
cctcaaggag cctcagtcta g                                               21
<210>173
<211>21
<212>DNA
<213>小家鼠
<400>173
ccaagttctg tcatgcactg a                                               21
<210>174
<211>20
<212>DNA
<213>小家鼠
<400>174
tcacttttgt gactatgcaa                                                 20
<210>175
<211>22
<212>DNA
<213>小家鼠
<400>175
cgaaggcaac acggataacc ta                                              22
<210>176
<211>22
<212>DNA
<213>小家鼠
<400>176
cccctatcac aattagcatt aa                                              22
<210>177
<211>22
<212>DNA
<213>小家鼠
<400>177
tgtaaaccat gatgtgctgc ta                                              22
<210>178
<211>23
<212>DNA
<213>小家鼠
<400>178
actcaccgac agcgttgaat gtt                                             23
<210>179
<211>17
<212>DNA
<213>小家鼠
<400>179
gattcacaac accagct                                                    17
<210>180
<211>22
<212>DNA
<213>小家鼠
<400>180
tcttcccatg cgctatacct ct                                              22
<210>181
<211>22
<212>DNA
<213>小家鼠
<400>181
acccttatca gttctccgtc ca                                              22
<210>182
<211>18
<212>DNA
<213>小家鼠
<400>182
gaactgcctt tctctcca                                                   18
<210>183
<211>23
<212>DNA
<213>小家鼠
<400>183
aagcccaaaa ggagaattct ttg                                             23
<210>184
<211>22
<212>DNA
<213>小家鼠
<400>184
ccggctgcaa cacaagacac ga                                              22
<210>185
<211>22
<212>DNA
<213>小家鼠
<400>185
accctccacc atgcaaggga tg                                              22
<210>186
<211>23
<212>DNA
<213>小家鼠
<400>186
actgatatca gctcagtagg cac                                             23
<210>187
<211>22
<212>DNA
<213>小家鼠
<400>187
acctaatata tcaaacatat ca                                              22
<210>188
<211>22
<212>DNA
<213>小家鼠
<400>188
agctgctttt gggattccgt tg                                              22
<210>189
<211>21
<212>DNA
<213>小家鼠
<400>189
ctgggacttt gtaggccagt t                                               21
<210>190
<211>22
<212>DNA
<213>人工的
<220>
<223>与mmu-miR-194互补
<400>190
tccacatgga gttgctgtta ca                                              22
<210>191
<211>21
<212>DNA
<213>小家鼠
<400>191
gccaatattt ctgtgctgct a                                               21
<210>192
<211>22
<212>DNA
<213>小家鼠
<400>192
aaccaatgtg cagactactg ta                                              22
<210>193
<211>21
<212>DNA
<213>人工的
<220>
<223>与mmu-miR-1b互补
<400>193
tacatacttc tttacattcc a                                               21
<210>194
<211>23
<212>DNA
<213>小家鼠
<400>194
aatacatact tctttacatt cca                                             23
<210>195
<211>23
<212>DNA
<213>小家鼠
<400>195
gtcatcatta ccaggcagta tta                                             23
<210>196
<211>21
<212>DNA
<213>小家鼠
<400>196
agaacaatgc cttactgagt a                                               21
<210>197
<211>23
<212>DNA
<213>小家鼠
<400>197
cagtgaattc taccagtgcc ata                                             23
<210>198
<211>22
<212>DNA
<213>小家鼠
<400>198
cgcaaggtcg gttctacggg tg                                              22
<210>199
<211>22
<212>DNA
<213>人工的
<220>
<223>与mmu-miR-206互补
<400>199
ccacacactt ccttacattc ca                                              22
<210>200
<211>23
<212>DNA
<213>小家鼠
<400>200
gagggaggag agccaggaga agc                                             23
<210>201
<211>23
<212>DNA
<213>小家鼠
<400>201
gtggtaatcc ctggcaatgt gat                                             23
<210>202
<211>20
<212>DNA
<213>小家鼠
<400>202
cagaacttag ccactgtgaa                                                 20
<210>203
<211>22
<212>DNA
<213>小家鼠
<400>203
taaccgattt caaatggtgc ta                                              22
<210>204
<211>21
<212>DNA
<213>小家鼠
<400>204
gctgagtgta ggatgtttac a                                               21
<210>205
<211>23
<212>DNA
<213>人工的
<220>
<223>与mmu-miR-9互补
<400>205
tcatacagct agataaccaa aga                                             23
<210>206
<211>21
<212>DNA
<213>小家鼠
<400>206
actttcggtt atctagcttt a                                               21
<210>207
<211>20
<212>DNA
<213>小家鼠
<400>207
acaagatcgg atctacgggt                                                 20
<210>208
<211>21
<212>DNA
<213>小家鼠
<400>208
ctagtggtcc taaacatttc a                                               21
<210>209
<211>59
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>209
gggagctcgg ggaatgaagc ctggtccgag aatttccccg atcgttcaaa catttggca      59
<210>210
<211>30
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>210
tcggaccgtt aattaacaca aactgaaggc                                      30
<210>211
<211>25
<212>DNA
<213>人工的
<220>
<223>寡核苷酸引物
<400>211
gatctggccg gccgggcccg aattc                                           25
<210>212
<211>12587
<212>DNA
<213>人工的
<220>
<223>载体构建体pBPSLM185
<220>
<221>重复_区
<222>(42)..(66)
<223>左T-DNA边界重复区
<220>
<221>启动子
<222>(157)..(2144)
<223>玉米泛蛋白加内含子启动子
<220>
<221>CDS
<222>(2178)..(4094)
<223>ZmAHAS L2 S653(At)N(XI12)cds.S621N.
<220>
<221>终止子
<222>(4095)..(5310)
<223>带有终止子的玉米AHASL2[XI12]3’/UTR序列
<220>
<221>启动子
<222>(5368)..(6765)
<223>甘蔗杆状病毒[ScBV]启动子
<220>
<221>CDS
<222>(6784)..(7461)
<223>Discosoma sp.红色荧光蛋白[drFP583;1]
<220>
<221>终止子
<222>(7493)..(7745)
<223>胭脂碱合酶poly-A终止子
<220>
<221>重复_区
<222>(7775)..(7919)
<223>pSB11’s full RB
<220>
<221>复制起点
<222>(10197)..(10477)
<223>pBR322复制起点[ecoli]from AF234316pCambia2301
<220>
<221>CDS
<222>(11336)..(12151)
<223>Kanamycin Resistance selection gene/CDS for microorganism.
<400>212
tttgtgccga gctgccggtc ggggagctgt tggctggctg gtggcaggat atattgtggt     60
gtaaacaaat tgacgcttag acaacttaat aacacattgc ggacgttttt aatgtactga    120
attggatccg cccgggcggt accaagcttc cgcggctgca gtgcagcgtg acccggtcgt    180
gcccctctct agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt    240
tttttgtcac acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta    300
ctctacgaat aatataatct atagtactac aataatatca gtgttttaga gaatcatata    360
aatgaacagt tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag    420
ttttatcttt ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata    480
atacttcatc cattttatta gtacatccat ttagggttta gggttaatgg tttttataga    540
ctaatttttt tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa    600
ctctatttta gtttttttat ttaatagttt agatataaaa tagaataaaa taaagtgact    660
aaaaattaaa caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt    720
cgagtagata atgccagcct gttaaacgcc gtcgacgagt ctaacggaca ccaaccagcg    780
aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct    840
ctggacccct ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga     900
aattgcgtgg cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca     960
cggcaccggc agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc    1020
cgccgtaata aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag    1080
cgcacacaca cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt    1140
acgccgctcg tcctcccccc ccccccccct ctctaccttc tctagatcgg cgttccggtc    1200
catggttagg gcccggtagt tctacttctg ttcatgtttg tgttagatcc gtgtttgtgt    1260
tagatccgtg ctgctagcgt tcgtacacgg atgcgacctg tacgtcagac acgttctgat    1320
tgctaacttg ccagtgtttc tctttgggga atcctgggat ggctctagcc gttccgcaga    1380
cgggatcgat ttcatgattt tttttgtttc gttgcatagg gtttggtttg cccttttcct    1440
ttatttcaat atatgccgtg cacttgtttg tcgggtcatc ttttcatgct tttttttgtc    1500
ttggttgtga tgatgtggtc tggttgggcg gtcgttctag atcggagtag aattctgttt    1560
caaactacct ggtggattta ttaattttgg atctgtatgt gtgtgccata catattcata    1620
gttacgaatt gaagatgatg gatggaaata tcgatctagg ataggtatac atgttgatgc    1680
gggttttact gatgcatata cagagatgct ttttgttcgc ttggttgtga tgatgtggtg    1740
tggttgggcg gtcgttcatt cgttctagat cggagtagaa tactgtttca aactacctgg    1800
tgtatttatt aattttggaa ctgtatgtgt gtgtcataca tcttcatagt tacgagttta    1860
agatggatgg aaatatcgat ctaggatagg tatacatgtt gatgtgggtt ttactgatgc    1920
atatacatga tggcatatgc agcatctatt catatgctct aaccttgagt acctatctat    1980
tataataaac aagtatgttt tataattatt tcgatcttga tatacttgga tgatggcata    2040
tgcagcagct atatgtggat ttttttagcc ctgccttcat acgctattta tttgcttggt    2100
actgtttctt ttgtcgatgc tcaccctgtt gtttggtgtt acttctgcag ggtacggatc    2160
cactagttct agaaacc atg gcc acc gcc gcc gcc gcg tct acc gcg ctc       2210
                   Met Ala Thr Ala Ala Ala Ala Ser Thr Ala Leu
                   1               5                   10
act ggc gcc act acc gct gcg ccc aag gcg agg cgc cgg gcg cac ctc      2258
Thr Gly Ala Thr Thr Ala Ala Pro Lys Ala Arg Arg Arg Ala His Leu
            15                  20                  25
ctg gcc acc cgc cgc gcc ctc gcc gcg ccc atc agg tgc tca gcg gcg      2306
Leu Ala Thr Arg Arg Ala Leu Ala Ala Pro Ile Arg Cys Ser Ala Ala
        30                  35                  40
tca ccc gcc atg ccg atg gct ccc ccg gcc acc ccg ctc cgg ccg tgg      2354
Ser Pro Ala Met Pro Met Ala Pro Pro Ala Thr Pro Leu Arg Pro Trp
    45                  50                  55
ggc ccc acc gat ccc cgc aag ggc gcc gac atc ctc gtc gag tcc ctc    2402
Gly Pro Thr Asp Pro Arg Lys Gly Ala Asp Ile Leu Val Glu Ser Leu
60                  65                  70                  75
gag cgc tgc ggc gtc cgc gac gtc ttc gcc tac ccc ggc ggc gcg tcc    2450
Glu Arg Cys Gly Val Arg Asp Val Phe Ala Tyr Pro Gly Gly Ala Ser
                80                  85                  90
atg gag atc cac cag gca ctc acc cgc tcc ccc gtc atc gcc aac cac    2498
Met Glu Ile His Gln Ala Leu Thr Arg Ser Pro Val Ile Ala Asn His
            95                  100                 105
ctc ttc cgc cac gag caa ggg gag gcc ttt gcg gcc tcc ggc tac gcg    2546
Leu Phe Arg His Glu Gln Gly Glu Ala Phe Ala Ala Ser Gly Tyr Ala
        110                 115                 120
cgc tcc tcg ggc cgc gtc ggc gtc tgc atc gcc acc tcc ggc ccc ggc    2594
Arg Ser Ser Gly Arg Val Gly Val Cys Ile Ala Thr Ser Gly Pro Gly
    125                 130                 135
gcc acc aac ctt gtc tcc gcg ctc gcc gac gcg ctg ctc gat tcc gtc    2642
Ala Thr Asn Leu Val Ser Ala Leu Ala Asp Ala Leu Leu Asp Ser Val
140                 145                 150                 155
ccc atg gtc gcc atc acg gga cag gtg ccg cga cgc atg att ggc acc    2690
Pro Met Val Ala Ile Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr
                160                 165                 170
gac gcc ttc cag gag acg ccc atc gtc gag gtc acc cgc tcc atc acc    2738
Asp Ala Phe Gln Glu Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr
            175                 180                 185
aag cac aac tac ctg gtc ctc gac gtc gac gac atc ccc cgc gtc gtg    2786
Lys His Asn Tyr Leu Val Leu Asp Val Asp Asp Ile Pro Arg Val Val
        190                 195                 200
cag gag gct ttc ttc ctc gcc tcc tct ggt cga ccg ggg ccg gtg ctt    2834
Gln Glu Ala Phe Phe Leu Ala Ser Ser Gly Arg Pro Gly Pro Val Leu
    205                 210                 215
gtc gac atc ccc aag gac atc cag cag cag atg gcg gtg cct gtc tgg    2882
Val Asp Ile Pro Lys Asp Ile Gln Gln Gln Met Ala Val Pro Val Trp
220                 225                 230                 235
gac aag ccc atg agt ctg cct ggg tac att gcg cgc ctt ccc aag ccc    2930
Asp Lys Pro Met Ser Leu Pro Gly Tyr Ile Ala Arg Leu Pro Lys Pro
                240                 245                 250
cct gcg act gag ttg ctt gag cag gtg ctg cgt ctt gtt ggt gaa tcc    2978
Pro Ala Thr Glu Leu Leu Glu Gln Val Leu Arg Leu Val Gly Glu Ser
            255                 260                 265
cgg cgc cct gtt ctt tat gtt ggc ggt ggc tgc gca gca tct ggt gag    3026
Arg Arg Pro Val Leu Tyr Val Gly Gly Gly Cys Ala Ala Ser Gly Glu
        270                 275                 280
gag ttg cga cgc ttt gtg gag ctg act gga atc ccg gtc aca act act    3074
Glu Leu Arg Arg Phe Val Glu Leu Thr Gly Ile Pro Val Thr Thr Thr
    285                 290                 295
ctt atg ggc ctc ggc aac ttc ccc agc gac gac cca ctg tct ctg cgc    3122
Leu Met Gly Leu Gly Asn Phe Pro Ser Asp Asp Pro Leu Ser Leu Arg
300                 305                 310                 315
atg cta ggt atg cat ggc acg gtg tat gca aat tat gca gtg gat aag    3170
Met Leu Gly Met His Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp Lys
                320                 325                 330
gcc gat ctg ttg ctt gca ctt ggt gtg cgg ttt gat gat cgt gtg aca    3218
Ala Asp Leu Leu Leu Ala Leu Gly Val Arg Phe Asp Asp Arg Val Thr
            335                 340                 345
ggg aag att gag gct ttt gca agc agg gct aag att gtg cac gtt gat    3266
Gly Lys Ile Glu Ala Phe Ala Ser Arg Ala Lys Ile Val His Val Asp
        350                 355                 360
att gat ccg gct gag att ggc aag aac aag cag cca cat gtg tcc atc    3314
Ile Asp Pro Ala Glu Ile Gly Lys Asn Lys Gln Pro His Val Ser Ile
    365                 370                 375
tgt gca gat gtt aag ctt gct ttg cag ggc atg aat gct ctt ctt gaa    3362
Cys Ala Asp Val Lys Leu Ala Leu Gln Gly Met Asn Ala Leu Leu Glu
380                 385                 390                 395
gga agc aca tca aag aag agc ttt gac ttt ggc tca tgg aac gat gag    3410
Gly Ser Thr Ser Lys Lys Ser Phe Asp Phe Gly Ser Trp Asn Asp Glu
                400                 405                 410
ttg gat cag cag aag agg gaa ttc ccc ctt ggg tat aaa aca tct aat    3458
Leu Asp Gln Gln Lys Arg Glu Phe Pro Leu Gly Tyr Lys Thr Ser Asn
            415                 420                 425
gag gag atc cag cca caa tat gct att cag gtt ctt gat gag ctg acg    3506
Glu Glu Ile Gln Pro Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu Thr
        430                 435                 440
aaa ggc gag gcc atc atc ggc aca ggt gtt ggg cag cac cag atg tgg    3554
Lys Gly Glu Ala Ile Ile Gly Thr Gly Val Gly Gln His Gln Met Trp
    445                 450                 455
gcg gca cag tac tac act tac aag cgg cca agg cag tgg ttg tct tca    3602
Ala Ala Gln Tyr Tyr Thr Tyr Lys Arg Pro Arg Gln Trp Leu Ser Ser
460                 465                 470                 475
gct ggt ctt ggg gct atg gga ttt ggt ttg ccg gct gct gct ggt gct    3650
Ala Gly Leu Gly Ala Met Gly Phe Gly Leu Pro Ala Ala Ala Gly Ala
                480                 485                 490
tct gtg gcc aac cca ggt gtt act gtt gtt gac atc gat gga gat ggt    3698
Ser Val Ala Asn Pro Gly Val Thr Val Val Asp Ile Asp Gly Asp Gly
            495                 500                 505
agc ttt ctc atg aac gtt cag gag cta gct atg atc cga att gag aac    3746
Ser Phe Leu Met Asn Val Gln Glu Leu Ala Met Ile Arg Ile Glu Asn
        510                 515                 520
ctc ccg gtg aag gtc ttt gtg cta aac aac cag cac ctg ggg atg gtg      3794
Leu Pro Val Lys Val Phe Val Leu Asn Asn Gln His Leu Gly Met Val
    525                 530                 535
gtg cag tgg gag gac agg ttc tat aag gcc aac aga gcg cac aca tac      3842
Val Gln Trp Glu Asp Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Tyr
540                 545                 550                 555
ttg gga aac cca gag aat gaa agt gag ata tat cca gat ttc gtg acg      3890
Leu Gly Asn Pro Glu Asn Glu Ser Glu Ile Tyr Pro Asp Phe Val Thr
                560                 565                 570
atc gcc aaa ggg ttc aac att cca gcg gtc cgt gtg aca aag aag aac      3938
Ile Ala Lys Gly Phe Asn Ile Pro Ala Val Arg Val Thr Lys Lys Asn
            575                 580                 585
gaa gtc cgc gca gcg ata aag aag atg ctc gag act cca ggg ccg tac      3986
Glu Val Arg Ala Ala Ile Lys Lys Met Leu Glu Thr Pro Gly Pro Tyr
        590                 595                 600
ctc ttg gat ata atc gtc cca cac cag gag cat gtg ttg cct atg atc      4034
Leu Leu Asp Ile Ile Val Pro His Gln Glu His Val Leu Pro Met Ile
    605                 610                 615
cct aat ggt ggg gct ttc aag gat atg atc ctg gat ggt gat ggc agg      4082
Pro Asn Gly Gly Ala Phe Lys Asp Met Ile Leu Asp Gly Asp Gly Arg
620                 625                 630                 635
act gtg tac tga tctaaaatcc agcaagcaac tgatctaaaa tccagcaagc          4134
Thr Val Tyr
accgcctccc tgctagtaca agggtgatat gtttttatct gtgtgatgtt ctcctgtatt    4194
ctatcttttt ttgtaggccg tcagctatct gttatggtaa tcctatgtag cttccgacct    4254
tgtaattgtg tagtctgttg ttttccttct ggcatgtgtc ataagagatc atttaagtgc    4314
cttttgctac atataaataa gataataagc actgctatgc agtggttctg aattggcttc    4374
tgttgccaaa tttaagtgtc caactggtcc ttgcttttgt tttcgctatt tttttccttt    4434
tttagttatt attatattgg taatttcaac tcaacatatg atgtatggaa taatgctagg    4494
gctgcaattt caaactattt tacaaaccag aatggcattt tcgtggtttg aggggagtga    4554
aaaaaaatga ggcatttgac tgaattagtt acctgatcca ttttcgtggt ttggatcatt    4614
ggaattaaat tccattctaa taatagtaat tttggcatat atcaattaag ttaattcggt    4674
tttatgcaaa atatatttgt atactattat tatcaagatg tcggagatat ttatatgcta    4734
catttttact atacaggagt gagatgaaga gtgtcatgta agttacacag tagaaacaaa    4794
ttctattaat gcataaaatc atttccatca tccaccctat gaatttgaga tagacctata    4854
tctaaacttt gaaaagtggt tgaatatcaa attccaaatt aaataagtta ttttattgag    4914
tgaattctaa tttctctaaa acgaagggat ctaaacgccc tctaaagcta atttggaaac    4974
tcaaactttc ttagcattgg aggggattga gaaaaaatat taattcattt tcatctcaat    5034
cattcaatct ccaaagagat ttgagttcct tattagtctg ttccatgcat caaatcggct    5094
caatgtgtca ttatttgcca tgacgattga cgagttgttc tggggcctag cgctttccac    5154
gccgatgtgc tggggcctgg tcctggagaa gacagcttga tatttaaagc tatcaattgt    5214
ttcaattgat tcccacttca tttttctaaa tgtagaaaac ggtgacgtat aagaaaaaga    5274
atgaattagg acttttattc cgtacactaa tctagagcgg ccgcaagctt gtacaacgcg    5334
taccggttaa ttaaggtace caattgcata tgtaatcctg gctagcaaca ctgaactatg    5394
ccagaaacca catcaaagat atgggcaagc ttcttggccc attatatcca aagacctcag    5454
agaaaggtga gcgaaggctc aattcagaag attggaagct gatcaatagg atcaagacaa    5514
tggtgagaac gcttccaaat ctcactattc caccagaaga tgcatacatt atcattgaaa    5574
cagatgcatg tgcaactgga tggggagcag tatgcaagtg gaagaaaaac aaggcagacc    5634
caagaaatac agagcaaatc tgtaggtatg ccagtggaaa atttgataag ccaaaaggaa    5694
cctgtgatgc agaaatctat ggggttatga atggcttaga aaagatgaga ttgttctact    5754
tggacaaaag agagatcaca gtcagaactg acagtagtgc aatcgaaagg ttctacaaca    5814
agagtgctga acacaagcct tctgagatca gatggatcag gttcatggac tacatcactg    5874
gtgcaggacc agagatagtc attgaacaca taaaagggaa gagcaatggt ttagctgaca    5934
tcttgtccag gctcaaagcc aaattagctc agaatgaacc aacggaagag atgatcctgc    5994
ttacacaagc cataagggaa gtaattcctt atccagatca tccatacact gagcaactca    6054
gagaatgggg aaacaaaatt ctggatccat tccccacatt caagaaggac atgttcgaaa    6114
gaacagagca agcttttatg ctaacagagg aaccagttct actctgtgca tgcaggaagc    6174
ctgcaattca gttagtgtcc agaacatctg ccaacccagg aaggaaattc ttcaagtgcg    6234
caatgaacaa atgccattgc tggtactggg cagatctcat tgaagaacac attcaagaca    6294
gaattgatga atttctcaag aatcttgaag ttctgaagac cggtggcgtg caaacaatgg    6354
aggaggaact tatgaaggaa gtcaccaagc tgaagataga agagcaggag ttcgaggaat    6414
accaggccac accaagggct atgtcgccag tagccgcaga agatgtgcta gatctccaag    6474
acgtaagcaa tgacgattga ggaggcattg acgtcaggga tgaccgcagc ggagagtact    6534
gggcccattc agtggatgct ccactgagtt gtattattgt gtgcttttcg gacaagtgtg    6594
ctgtccactt tcttttggca cctgtgccac tttattcctt gtctgccacg atgcctttgc    6654
ttagcttgta agcaaggatc gcagtgcgtg tgtgacacca ccccccttcc gacgctctgc    6714
ctatataagg caccgtctgt aagctcttac gatcatcggt agttcaccaa gggggtaccg    6774
gtcgccacc atg gcc tcc tcc gag aac gtc atc acc gag ttc atg cgc ttc    6825
          Met Ala Ser Ser Glu Asn Val Ile Thr Glu Phe Met Arg Phe
              640                 645                 650
aag gtg cgc atg gag ggc acc gtg aac ggc cac gag ttc gag atc gag      6873
Lys Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu
        655                 660                 665
ggc gag ggc gag ggc cgc ccc tac gag ggc cac aac acc gtg aag ctg      692l
Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu
    670                 675                 680
aag gtg acc aag ggc ggc ccc ctg ccc ttc gcc tgg gac atc ctg tcc      6969
Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser
685                 690                 695                 700
ccc cag ttc cag tac ggc tcc aag gtg tac gtg aag cac ccc gcc gac      7017
Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp
                705                 710                 715
atc ccc gac tac aag aag ctg tcc ttc ccc gag ggc ttc aag tgg gag      7065
Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu
            720                 725                 730
cgc gtg atg aac ttc gag gac ggc ggc gtg gcg acc gtg acc cag gac      7113
Arg Val Met Asn Phe Glu Asp Gly Gly Val Ala Thr Val Thr Gln Asp
        735                 740                 745
tcc tcc ctg cag gac ggc tgc ttc atc tac aag gtg aag ttc atc ggc      7161
Ser Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly
    750                 755                 760
gtg aac ttc ccc tcc gac ggc ccc gtg atg cag aag aag acc atg ggc      7209
Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly
765                 770                 775                 780
tgg gag gcc tcc acc gag cgc ctg tac ccc cgc gac ggc gtg ctg aag      7257
Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys
                785                 790                 795
ggc gag acc cac aag gcc ctg aag ctg aag gac ggc ggc cac tac ctg      7305
Gly Glu Thr His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu
            800                 805                 810
gtg gag ttc aag tcc atc tac atg gcc aag aag ccc gtg cag ctg ccc      7353
Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro
        815                 820                 825
ggc tac tac tac gtg gac gcc aag ctg gac atc acc tcc cac aac gag      7401
Gly Tyr Tyr Tyr Val Asp Ala Lys Leu Asp Ile Thr Ser His Asn Glu
    830                 835                 840
gac tac acc atc gtg gag cag tac gag cgc acc gag ggc cgc cac cac      7449
Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His
845                 850                 855                 860
ctg ttc ctg tag cggccgccct gcagggagct cgaatttccc cgatcgttca          7501
Leu Phe Leu
aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc    7561
atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta    7621
tttatgagat gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa    7681
aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta    7741
gatcgggaat tcgggcccgg ccggccagat cttgattgtc gtttcccgcc ttcagtttaa    7801
actatcagtg tttgacagga tatattggcg ggtaaaccta agagaaaaga gcgtttatta    7861
gaataatcgg atatttaaaa gggcgtgaaa aggtttatcc gttcgtccat ttgtatgtgc    7921
atgccaacca cagggttccc ctcgggagtg cttggcattc cgtgcgataa tgacttctgt    7981
tcaaccaccc aaacgtcgga aagcctgacg acggagcagc attccaaaaa gatcccttgg    8041
ctcgtctggg tcggctagaa ggtcgagtgg gctgctgtgg cttgatccct caacgcggtc    8101
gcggacgtag cgcagcgccg aaaaatcctc gatcgcaaat ccgacgctgt cgaaaagcgt    8161
gatctgcttg tcgctctttc ggccgacgtc ctggccagtc atcacgcgcc aaagttccgt    8221
cacaggatga tctggcgcga gttgctggat ctcgccttca atccgggtct gtggcgggaa    8281
ctccacgaaa atatccgaac gcagcaagat cgtcgaccaa ttcttgaaga cgaaagggcc    8341
tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag    8401
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt    8461
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa    8521
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt    8581
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt    8641
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt    8701
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg    8761
tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga    8821
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa    8881
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga    8941
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa    9001
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca    9061
ccacgatgcc gggggggggg gggggggaca tgaggttgcc ccgtattcag tgtcgctgat    9121
ttgtattgtc tgaagttgtt tttacgttaa gttgatgcag atcaattaat acgatacctg    9181
cgtcataatt gattatttga cgtggtttga tggcctccac gcacgttgtg atatgtagat    9241
gataatcatt atcactttac gggtcctttc cggtgatccg acaggttacg gggcggcgac    9301
ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg ttcttcttcg    9361
tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg acaggtgctg    9421
aaagcgagct ttttggcctc tgtcgtttcc tttctctgtt tttgtccgtg gaatgaacaa    9481
tggaaccccc cccccccccc cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg    9541
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag    9601
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg    9661
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct    9721
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac    9781
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact    9841
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga    9901
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt    9961
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct   10021
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc   10081
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc   10141
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc   10201
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg   10261
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt   10321
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg   10381
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg   10441
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt   10501
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag   10561
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt   10621
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta   10681
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt   10741
cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg catctgtgcg  10801
gtatttcaca ccgcatatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa  10861
gccagtatac actccgctat cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc  10921
aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc  10981
tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc  11041
gaggcagcag atcccccgat caagtagata cactacatat atctacaata gacatcgagc  11101
cggaaggtga tgtttacttt cctgaaatcc ccagcaattt taggccagtt tttacccaag  11161
acttcgcctc taacataaat tatagttacc aaatctggca aaagggttga ccgggggggg  11221
ggggaaagcc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga taaaaatata  11281
tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg tgtt atg    11338
                                                            Met
agc cat att caa cgg gaa acg tct tgc tcg agg ccg cga tta aat tcc    11386
Ser His Ile Gln Arg Glu Thr Ser Cys Ser Arg Pro Arg Leu Asn Ser
865                 870                 875                 880
aac atg gat gct gat tta tat ggg tat aaa tgg gct cgc gat aat gtc    11434
Asn Met Asp Ala Asp Leu Tyr Gly Tyr Lys Trp Ala Arg Asp Asn Val
                885                 890                 895
ggg caa tca ggt gcg aca atc tat cga ttg tat ggg aag ccc gat gcg    11482
Gly Gln Ser Gly Ala Thr Ile Tyr Arg Leu Tyr Gly Lys Pro Asp Ala
            900                 905                 910
cca gag ttg ttt ctg aaa cat ggc aaa ggt agc gtt gcc aat gat gtt    11530
Pro Glu Leu Phe Leu Lys His Gly Lys Gly Ser Val Ala Asn Asp Val
        915                 920                 925
aca gat gag atg gtc aga cta aac tgg ctg acg gaa ttt atg cct ctt    11578
Thr Asp Glu Met Val Arg Leu Asn Trp Leu Thr Glu Phe Met Pro Leu
    930                 935                 940
ccg acc atc aag cat ttt atc cgt act cct gat gat gca tgg tta ctc    11626
Pro Thr Ile Lys His Phe Ile Arg Thr Pro Asp Asp Ala Trp Leu Leu
945                 950                 955                 960
acc act gcg atc ccc ggg aaa aca gca ttc cag gta tta gaa gaa tat    11674
Thr Thr Ala Ile Pro Gly Lys Thr Ala Phe Gln Val Leu Glu Glu Tyr
                965                 970                 975
cct gat tca ggt gaa aat att gtt gat gcg ctg gca gtg ttc ctg cgc    11722
Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Leu Ala Val Phe Leu Arg
            980                 985                 990
cgg ttg cat tcg att cct gtt tgt  aat tgt cct ttt aac agc gat cgc   11770
Arg Leu His Ser Ile Pro Val Cys  Asn Cys Pro Phe Asn Ser Asp Arg
        995                 1000                 1005
gta ttt  cgt ctc gct cag gcg  caa tca cga atg aat  aac ggt ttg      11815
Val Phe  Arg Leu Ala Gln Ala  Gln Ser Arg Met Asn  Asn Gly Leu
    1010                 1015                 1020
gtt gat  gcg agt gat ttt gat  gac gag cgt aat ggc  tgg cct gtt      11860
Val Asp  Ala Ser Asp Phe Asp  Asp Glu Arg Asn Gly  Trp Pro Val
    1025                 1030                 1035
gaa caa  gtc tgg aaa gaa atg  cat aag ctt ttg cca  ttc tca ccg      11905
Glu Gln  Val Trp Lys Glu Met  His Lys Leu Leu Pro  Phe Ser Pro
    1040                 1045                 1050
gat tca  gtc gtc act cat ggt  gat ttc tca ctt gat  aac ctt att      11950
Asp Ser  Val Val Thr His Gly  Asp Phe Ser Leu Asp  Asn Leu Ile
    1055                 1060                 1065
ttt gac  gag ggg aaa tta ata  ggt tgt att gat gtt  gga cga gtc      11995
Phe Asp  Glu Gly Lys Leu Ile  Gly Cys Ile Asp Val  Gly Arg Val
    1070                 1075                 1080
gga atc  gca gac cga tac cag  gat ctt gcc atc cta  tgg aac tgc      12040
Gly Ile  Ala Asp Arg Tyr Gln  Asp Leu Ala Ile Leu  Trp Asn Cys
    1085                 1090                 1095
ctc ggt  gag ttt tct cct tca  tta cag aaa cgg ctt  ttt caa aaa      12085
Leu Gly  Glu Phe Ser Pro Ser  Leu Gln Lys Arg Leu  Phe Gln Lys
    1100                 1105                 1110
tat ggt  att gat aat cct gat  atg aat aaa ttg cag  ttt cat ttg      12130
Tyr Gly  Ile Asp Asn Pro Asp  Met Asn Lys Leu Gln  Phe His Leu
    1115                 1120                 1125
atg ctc  gat gag ttt ttc taa tcagaattgg ttaattggtt gtaacactgg       12181
Met Leu  Asp Glu Phe Phe
    1130
cagagcatta cgctgacttg acgggacggc ggctttgttg aataaatcga acttttgctg  12241
agttgaagga tcagatcacg catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa  12301
agttcaaaat caccaactgg tccacctaca acaaagctct catcaaccgt ggctccctca  12361
ctttctggct ggatgatggg gcgattcagg gatcacaggc agcaacgctc tgtcatcgtt  12421
acaatcaaca tgctaccctc cgcgagatca tccgtgtttc aaacccggca gcttagttgc  12481
cgttcttccg aatagcatcg gtaacatgag caaagtctgc cgccttacaa cggctctccc  12541
gctgacgccg tcccggactg atgggctgcc tgtatcgagt ggtgat                 12587
<210>213
<211>638
<212>PRT
<213>人工的
<220>
<223>合成构建体
<400>213
Met Ala Thr Ala Ala Ala Ala Ser Thr Ala Leu Thr Gly Ala Thr Thr
1               5                   10                  15
Ala Ala Pro Lys Ala Arg Arg Arg Ala His Leu Leu Ala Thr Arg Arg
            20                  25                  30
Ala Leu Ala Ala Pro Ile Arg Cys Ser Ala Ala Ser Pro Ala Met Pro
        35                  40                  45
Met Ala Pro Pro Ala Thr Pro Leu Arg Pro Trp Gly Pro Thr Asp Pro
    50                  55                  60
Arg Lys Gly Ala Asp Ile Leu Val Glu Set Leu Glu Arg Cys Gly Val
65                  70                  75                  80
Arg Asp Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln
                85                  90                  95
Ala Leu Thr Arg Ser Pro Val Ile Ala Asn His Leu Phe Arg His Glu
            100                 105                 110
Gln Gly Glu Ala Phe Ala Ala Ser Gly Tyr Ala Arg Set Ser Gly Arg
        115                 120                 125
Val Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val
    130                 135                 140
Ser Ala Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Met Val Ala Ile
145                 150                 155                 160
Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu
                165                 170                 175
Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu
            180                 185                 190
Val Leu Asp Val Asp Asp Ile Pro Arg Val Val Gln Glu Ala Phe Phe
        195                 200                 205
Leu Ala Ser Ser Gly Arg Pro Gly Pro Val Leu Val Asp Ile Pro Lys
    210                 215                 220
Asp Ile Gln Gln Gln Met Ala Val Pro Val Trp Asp Lys Pro Met Ser
225                 230                 235                 240
Leu Pro Gly Tyr Ile Ala Arg Leu Pro Lys Pro Pro Ala Thr Glu Leu
                245                 250                 255
Leu Glu Gln Val Leu Arg Leu Val Gly Glu Ser Arg Arg Pro Val Leu
            260                 265                 270
Tyr Val Gly Gly Gly Cys Ala Ala Ser Gly Glu Glu Leu Arg Arg Phe
        275                 280                 285
Val Glu Leu Thr Gly Ile Pro Val Thr Thr Thr Leu Met Gly Leu Gly
    290                 295                 300
Asn Phe Pro Ser Asp Asp Pro Leu Ser Leu Arg Met Leu Gly Met His
305                 310                 315                 320
Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp Lys Ala Asp Leu Leu Leu
                325                 330                 335
Ala Leu Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Ile Glu Ala
            340                 345                 350
Phe Ala Ser Arg Ala Lys Ile Val His Val Asp Ile Asp Pro Ala Glu
        355                 360                 365
Ile Gly Lys Asn Lys Gln Pro His Val Ser Ile Cys Ala Asp Val Lys
    370                 375                 380
Leu Ala Leu Gln Gly Met Asn Ala Leu Leu Glu Gly Ser Thr Ser Lys
385                 390                 395                 400
Lys Ser Phe Asp Phe Gly Ser Trp Asn Asp Glu Leu Asp Gln Gln Lys
                405                 410                 415
Arg Glu Phe Pro Leu Gly Tyr Lys Thr Ser Asn Glu Glu Ile Gln Pro
            420                 425                 430
Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu Thr Lys Gly Glu Ala Ile
        435                 440                 445
Ile Gly Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Tyr Tyr
    450                 455                 460
Thr Tyr Lys Arg Pro Arg Gln Trp Leu Ser Ser Ala Gly Leu Gly Ala
465                 470                 475                 480
Met Gly Phe Gly Leu Pro Ala Ala Ala Gly Ala Ser Val Ala Asn Pro
                485                 490                 495
Gly Val Thr Val Val Asp Ile Asp Gly Asp Gly Ser Phe Leu Met Asn
            500                 505                 510
Val Gln Glu Leu Ala Met Ile Arg Ile Glu Asn Leu Pro Val Lys Val
        515                 520                 525
Phe Val Leu Asn Asn Gln His Leu Gly Met Val Val Gln Trp Glu Asp
    530                 535                 540
Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Tyr Leu Gly Asn Pro Glu
545                 550                 555                 560
Asn Glu Ser Glu Ile Tyr Pro Asp Phe Val Thr Ile Ala Lys Gly Phe
                565                 570                 575
Asn Ile Pro Ala Val Arg Val Thr Lys Lys Asn Glu Val Arg Ala Ala
            580                 585                 590
Ile Lys Lys Met Leu Glu Thr Pro Gly Pro Tyr Leu Leu Asp Ile Ile
        595                 600                 605
Val Pro His Gln Glu His Val Leu Pro Met Ile Pro Asn Gly Gly Ala
    610                 615                 620
Phe Lys Asp Met Ile Leu Asp Gly Asp Gly Arg Thr Val Tyr
625                 630                 635
<210>214
<211>225
<212>PRT
<213>人工的
<220>
<223>合成构建体
<400>214
Met Ala Ser Ser Glu Asn Val Ile Thr Glu Phe Met Arg Phe Lys Val
1               5                   10                  15
Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu
            20                  25                  30
Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys Val
        35                  40                  45
Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln
    50                  55                  60
Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro
65                  70                  75                  80
Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val
                85                  90                  95
Met Asn Phe Glu Asp Gly Gly Val Ala Thr Val Thr Gln Asp Ser Ser
            100                 105                 110
Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn
        115                 120                 125
Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu
    130                 135                 140
Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu
145                 150                 155                 160
Thr His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu
                165                 170                 175
Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr
            180                 185                 190
Tyr Tyr Val Asp Ala Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr
        195                 200                 205
Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu Phe
    210                 215                 220
Leu
225
<210>215
<211>271
<212>PRT
<213>人工的
<220>
<223>合成构建体
<400>215
Met Ser His Ile Gln Arg Glu Thr Ser Cys Ser Arg Pro Arg Leu Asn
1               5                   10                  15
Ser Asn Met Asp Ala Asp Leu Tyr Gly Tyr Lys Trp Ala Arg Asp Asn
            20                  25                  30
Val Gly Gln Ser Gly Ala Thr Ile Tyr Arg Leu Tyr Gly Lys Pro Asp
        35                  40                  45
Ala Pro Glu Leu Phe Leu Lys His Gly Lys Gly Set Val Ala Asn Asp
    50                  55                  60
Val Thr Asp Glu Met Val Arg Leu Asn Trp Leu Thr Glu Phe Met Pro
65                  70                  75                  80
Leu Pro Thr Ile Lys His Phe Ile Arg Thr Pro Asp Asp Ala Trp Leu
                85                  90                  95
Leu Thr Thr Ala Ile Pro Gly Lys Thr Ala Phe Gln Val Leu Glu Glu
            100                 105                 110
Tyr Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Leu Ala Val Phe Leu
        115                 120                 125
Arg Arg Leu His Ser Ile Pro Val Cys Asn Cys Pro Phe Asn Ser Asp
    130                 135                 140
Arg Val Phe Arg Leu Ala Gln Ala Gln Ser Arg Met Asn Asn Gly Leu
145                 150                 155                 160
Val Asp Ala Ser Asp Phe Asp Asp Glu Arg Asn Gly Trp Pro Val Glu
                165                 170                 175
Gln Val Trp Lys Glu Met His Lys Leu Leu Pro Phe Ser Pro Asp Ser
            180                 185                 190
Val Val Thr His Gly Asp Phe Ser Leu Asp Asn Leu Ile Phe Asp Glu
        195                 200                 205
Gly Lys Leu Ile Gly Cys Ile Asp Val Gly Arg Val Gly Ile Ala Asp
    210                 215                 220
Arg Tyr Gln Asp Leu Ala Ile Leu Trp Asn Cys Leu Gly Glu Phe Ser
225                 230                 235                 240
Pro Ser Leu Gln Lys Arg Leu Phe Gln Lys Tyr Gly Ile Asp Asn Pro
                245                 250                 255
Asp Met Asn Lys Leu Gln Phe His Leu Met Leu Asp Glu Phe Phe
            260                 265                 270
<210>216
<211>12590
<212>DNA
<213>人工的
<220>
<223>用于在玉米中表达dsRed的双元载体
<220>
<221>重复_区
<222>(42)..(66)
<223>左T-DNA边界重复区
<220>
<221>启动子
<222>(157)..(2144)
<223>玉米泛蛋白启动子:玉米泛蛋白内含子
<220>
<221>CDS
<222>(2178)..(4094)
<223>ZmAHAS L2 S653(At)N(XI12)cds
<220>
<221>终止子
<222>(4095)..(5310)
<223>带有终止子的玉米AHASL2[XI12]3’/UTR序列
<220>
<221>启动子
<222>(5368)..(6765)
<223>甘蔗杆状病毒[ScBV]启动子
<220>
<221>CDS
<222>(6784)..(7461)
<223>盘体虫某属红色荧光蛋白[drFP583;1]
<220>
<221>终止子
<222>(7496)..(7748)
<223>胭脂碱合酶poly-A终止子
<220>
<221>重复_区
<222>(7778)..(7922)
<223>pSB11’s全长RB
<220>
<221>复制起点
<222>(10200)..(10480)
<223>pBR322复制起点[大肠杆菌],来自AF234316 pCambia2301
<220>
<221>CDS
<222>(11339)..(12154)
<223>对于微生物的卡那霉素抗性选择基因
<400>216
tttgtgccga gctgccggtc ggggagctgt tggctggctg gtggcaggat atattgtggt     60
gtaaacaaat tgacgcttag acaacttaat aacacattgc ggacgttttt aatgtactga    120
attggatccg cccgggcggt accaagcttc cgcggctgca gtgcagcgtg acccggtcgt    180
gcccctctct agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt    240
tttttgtcac acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta    300
ctctacgaat aatataatct atagtactac aataatatca gtgttttaga gaatcatata    360
aatgaacagt tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag    420
ttttatcttt ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata    480
atacttcatc cattttatta gtacatccat ttagggttta gggttaatgg tttttataga    540
ctaatttttt tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa    600
ctctatttta gtttttttat ttaatagttt agatataaaa tagaataaaa taaagtgact    660
aaaaattaaa caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt    720
cgagtagata atgccagcct gttaaacgcc gtcgacgagt ctaacggaca ccaaccagcg    780
aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct    840
ctggacccct ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga    900
aattgcgtgg cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca    960
cggcaccggc agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc   1020
cgccgtaata aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag    1080
cgcacacaca cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt    1140
acgccgctcg tcctcccccc ccccccccct ctctaccttc tctagatcgg cgttccggtc    1200
catggttagg gcccggtagt tctacttctg ttcatgtttg tgttagatcc gtgtttgtgt    1260
tagatccgtg ctgctagcgt tcgtacacgg atgcgacctg tacgtcagac acgttctgat    1320
tgctaacttg ccagtgtttc tctttgggga atcctgggat ggctctagcc gttccgcaga    1380
cgggatcgat ttcatgattt tttttgtttc gttgcatagg gtttggtttg cccttttcct    1440
ttatttcaat atatgccgtg cacttgtttg tcgggtcatc ttttcatgct tttttttgtc    1500
ttggttgtga tgatgtggtc tggttgggcg gtcgttctag atcggagtag aattctgttt    1560
caaactacct ggtggattta ttaattttgg atctgtatgt gtgtgccata catattcata    1620
gttacgaatt gaagatgatg gatggaaata tcgatctagg ataggtatac atgttgatgc    1680
gggttttact gatgcatata cagagatgct ttttgttcgc ttggttgtga tgatgtggtg    1740
tggttgggcg gtcgttcatt cgttctagat cggagtagaa tactgtttca aactacctgg    1800
tgtatttatt aattttggaa ctgtatgtgt gtgtcataca tcttcatagt tacgagttta    1860
agatggatgg aaatatcgat ctaggatagg tatacatgtt gatgtgggtt ttactgatgc    1920
atatacatga tggcatatgc agcatctatt catatgctct aaccttgagt acctatctat    1980
tataataaac aagtatgttt tataattatt tcgatcttga tatacttgga tgatggcata    2040
tgcagcagct atatgtggat ttttttagcc ctgccttcat acgctattta tttgcttggt    2100
actgtttctt ttgtcgatgc tcaccctgtt gtttggtgtt acttctgcag ggtacggatc    2160
cactagttct agaaacc atg gcc acc gcc gcc gcc gcg tct acc gcg ctc       2210
                   Met Ala Thr Ala Ala Ala Ala Ser Thr Ala Leu
                   1               5                   10
act ggc gcc act acc gct gcg ccc aag gcg agg cgc cgg gcg cac ctc      2258
Thr Gly Ala Thr Thr Ala Ala Pro Lys Ala Arg Arg Arg Ala His Leu
                15                  20                  25
ctg gcc acc cgc cgc gcc ctc gcc gcg ccc atc agg tgc tca gcg gcg      2306
Leu Ala Thr Arg Arg Ala Leu Ala Ala Pro Ile Arg Cys Ser Ala Ala
            30                  35                  40
tca ccc gcc atg ccg atg gct ccc ccg gcc acc ccg ctc cgg ccg tgg      2354
Ser Pro Ala Met Pro Met Ala Pro Pro Ala Thr Pro Leu Arg Pro Trp
        45                  50                  55
ggc ccc acc gat ccc cgc aag ggc gcc gac atc ctc gtc gag tcc ctc      2402
Gly Pro Thr Asp Pro Arg Lys Gly Ala Asp Ile Leu Val Glu Ser Leu
60                  65                  70                  75
gag cgc tgc ggc gtc cgc gac gtc ttc gcc tac ccc ggc ggc gcg tcc    2450
Glu Arg Cys Gly Val Arg Asp Val Phe Ala Tyr Pro Gly Gly Ala Ser
                80                  85                  90
atg gag atc cac cag gca ctc acc cgc tcc ccc gtc atc gcc aac cac    2498
Met Glu Ile His Gln Ala Leu Thr Arg Ser Pro Val Ile Ala Asn His
            95                  100                 105
ctc ttc cgc cac gag caa ggg gag gcc ttt gcg gcc tcc ggc tac gcg    2546
Leu Phe Arg His Glu Gln Gly Glu Ala Phe Ala Ala Ser Gly Tyr Ala
        110                 115                 120
cgc tcc tcg ggc cgc gtc ggc gtc tgc atc gcc acc tcc ggc ccc ggc    2594
Arg Ser Ser Gly Arg Val Gly Val Cys Ile Ala Thr Ser Gly Pro Gly
    125                 130                 135
gcc acc aac ctt gtc tcc gcg ctc gcc gac gcg ctg ctc gat tcc gtc    2642
Ala Thr Asn Leu Val Ser Ala Leu Ala Asp Ala Leu Leu Asp Ser Val
140                 145                 150                 155
ccc atg gtc gcc atc acg gga cag gtg ccg cga cgc atg att ggc acc    2690
Pro Met Val Ala Ile Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr
                160                 165                 170
gac gcc ttc cag gag acg ccc atc gtc gag gtc acc cgc tcc atc acc    2738
Asp Ala Phe Gln Glu Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr
            175                 180                 185
aag cac aac tac ctg gtc ctc gac gtc gac gac atc ccc cgc gtc gtg    2786
Lys His Asn Tyr Leu Val Leu Asp Val Asp Asp Ile Pro Arg Val Val
        190                 195                 200
cag gag gct ttc ttc ctc gcc tcc tct ggt cga ccg ggg ccg gtg ctt    2834
Gln Glu Ala Phe Phe Leu Ala Ser Ser Gly Arg Pro Gly Pro Val Leu
    205                 210                 215
gtc gac atc ccc aag gac atc cag cag cag atg gcg gtg cct gtc tgg    2882
Val Asp Ile Pro Lys Asp Ile Gln Gln Gln Met Ala Val Pro Val Trp
220                 225                 230                 235
gac aag ccc atg agt ctg cct ggg tac att gcg cgc ctt ccc aag ccc    2930
Asp Lys Pro Met Ser Leu Pro Gly Tyr Ile Ala Arg Leu Pro Lys Pro
                240                 245                 250
cct gcg act gag ttg ctt gag cag gtg ctg cgt ctt gtt ggt gaa tcc    2978
Pro Ala Thr Glu Leu Leu Glu Gln Val Leu Arg Leu Val Gly Glu Ser
            255                 260                 265
cgg cgc cct gtt ctt tat gtt ggc ggt ggc tgc gca gca tct ggt gag    3026
Arg Arg Pro Val Leu Tyr Val Gly Gly Gly Cys Ala Ala Ser Gly Glu
        270                 275                 280
gag ttg cga cgc ttt gtg gag ctg act gga atc ccg gtc aca act act    3074
Glu Leu Arg Arg Phe Val Glu Leu Thr Gly Ile Pro Val Thr Thr Thr
    285                 290                 295
ctt atg ggc ctc ggc aac ttc ccc agc gac gac cca ctg tct ctg cgc    3122
Leu Met Gly Leu Gly Asn Phe Pro Ser Asp Asp Pro Leu Ser Leu Arg
300                 305                 310                 315
atg cta ggt atg cat ggc acg gtg tat gca aat tat gca gtg gat aag    3170
Met Leu Gly Met His Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp Lys
                320                 325                 330
gcc gat ctg ttg ctt gca ctt ggt gtg cgg ttt gat gat cgt gtg aca    3218
Ala Asp Leu Leu Leu Ala Leu Gly Val Arg Phe Asp Asp Arg Val Thr
            335                 340                 345
ggg aag att gag gct ttt gca agc agg gct aag att gtg cac gtt gat    3266
Gly Lys Ile Glu Ala Phe Ala Ser Arg Ala Lys Ile Val His Val Asp
        350                 355                 360
att gat ccg gct gag att ggc aag aac aag cag cca cat gtg tcc atc    3314
Ile Asp Pro Ala Glu Ile Gly Lys Asn Lys Gln Pro His Val Ser Ile
    365                 370                 375
tgt gca gat gtt aag ctt gct ttg cag ggc atg aat gct ctt ctt gaa    3362
Cys Ala Asp Val Lys Leu Ala Leu Gln Gly Met Asn Ala Leu Leu Glu
380                 385                 390                 395
gga agc aca tca aag aag agc ttt gac ttt ggc tca tgg aac gat gag    3410
Gly Ser Thr Ser Lys Lys Ser Phe Asp Phe Gly Ser Trp Asn Asp Glu
                400                 405                 410
ttg gat cag cag aag agg gaa ttc ccc ctt ggg tat aaa aca tct aat    3458
Leu Asp Gln Gln Lys Arg Glu Phe Pro Leu Gly Tyr Lys Thr Ser Asn
            415                 420                 425
gag gag atc cag cca caa tat gct att cag gtt ctt gat gag ctg acg    3506
Glu Glu Ile Gln Pro Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu Thr
        430                 435                 440
aaa ggc gag gcc atc atc ggc aca ggt gtt ggg cag cac cag atg tgg    3554
Lys Gly Glu Ala Ile Ile Gly Thr Gly Val Gly Gln His Gln Met Trp
    445                 450                 455
gcg gca cag tac tac act tac aag cgg cca agg cag tgg ttg tct tca    3602
Ala Ala Gln Tyr Tyr Thr Tyr Lys Arg Pro Arg Gln Trp Leu Ser Ser
460                 465                 470                 475
gct ggt ctt ggg gct atg gga ttt ggt ttg ccg gct gct gct ggt gct    3650
Ala Gly Leu Gly Ala Met Gly Phe Gly Leu Pro Ala Ala Ala Gly Ala
                480                 485                 490
tct gtg gcc aac cca ggt gtt act gtt gtt gac atc gat gga gat ggt    3698
Ser Val Ala Asn Pro Gly Val Thr Val Val Asp Ile Asp Gly Asp Gly
            495                 500                 505
agc ttt ctc atg aac gtt cag gag cta gct atg atc cga att gag aac    3746
Ser Phe Leu Met Asn Val Gln Glu Leu Ala Met Ile Arg Ile Glu Asn
        510                 515                 520
ctc ccg gtg aag gtc ttt gtg cta aac aac cag cac ctg ggg atg gtg    3794
Leu Pro Val Lys Val Phe Val Leu Asn Asn Gln His Leu Gly Met Val
    525                 530                 535
gtg cag tgg gag gac agg ttc tat aag gcc aac aga gcg cac aca tac      3842
Val Gln Trp Glu Asp Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Tyr
540                 545                 550                 555
ttg gga aac cca gag aat gaa agt gag ata tat cca gat ttc gtg acg      3890
Leu Gly Asn Pro Glu Asn Glu Ser Glu Ile Tyr Pro Asp Phe Val Thr
                560                 565                 570
atc gcc aaa ggg ttc aac att cca gcg gtc cgt gtg aca aag aag aac      3938
Ile Ala Lys Gly Phe Asn Ile Pro Ala Val Arg Val Thr Lys Lys Asn
            575                 580                 585
gaa gtc cgc gca gcg ata aag aag atg ctc gag act cca ggg ccg tac      3986
Glu Val Arg Ala Ala Ile Lys Lys Met Leu Glu Thr Pro Gly Pro Tyr
        590                 595                 600
ctc ttg gat ata atc gtc cca cac cag gag cat gtg ttg cct atg atc      4034
Leu Leu Asp Ile Ile Val Pro His Gln Glu His Val Leu Pro Met Ile
    605                 610                 615
cct aat ggt ggg gct ttc aag gat atg atc ctg gat ggt gat ggc agg      4082
Pro Asn Gly Gly Ala Phe Lys Asp Met Ile Leu Asp Gly Asp Gly Arg
620                 625                 630                 635
act gtg tac tga tctaaaatcc agcaagcaac tgatctaaaa tccagcaagc          4134
Thr Val Tyr
accgcctccc tgctagtaca agggtgatat gtttttatct gtgtgatgtt ctcctgtatt    4194
ctatcttttt ttgtaggccg tcagctatct gttatggtaa tcctatgtag cttccgacct    4254
tgtaattgtg tagtctgttg ttttccttct ggcatgtgtc ataagagatc atttaagtgc    4314
cttttgctac atataaataa gataataagc actgctatgc agtggttctg aattggcttc    4374
tgttgccaaa tttaagtgtc caactggtcc ttgcttttgt tttcgctatt tttttccttt    4434
tttagttatt attatattgg taatttcaac tcaacatatg atgtatggaa taatgctagg    4494
gctgcaattt caaactattt tacaaaccag aatggcattt tcgtggtttg aggggagtga    4554
aaaaaaatga ggcatttgac tgaattagtt acctgatcca ttttcgtggt ttggatcatt    4614
ggaattaaat tccattctaa taatagtaat tttggcatat atcaattaag ttaattcggt    4674
tttatgcaaa atatatttgt atactattat tatcaagatg tcggagatat ttatatgcta    4734
catttttact atacaggagt gagatgaaga gtgtcatgta agttacacag tagaaacaaa    4794
ttctattaat gcataaaatc atttccatca tccaccctat gaatttgaga tagacctata    4854
tctaaacttt gaaaagtggt tgaatatcaa attccaaatt aaataagtta ttttattgag    4914
tgaattctaa tttctctaaa acgaagggat ctaaacgccc tctaaagcta atttggaaac    4974
tcaaactttc ttagcattgg aggggattga gaaaaaatat taattcattt tcatctcaat    5034
cattcaatct ccaaagagat ttgagttcct tattagtctg ttccatgcat caaatcggct    5094
caatgtgtca ttatttgcca tgacgattga cgagttgttc tggggcctag cgctttccac    5154
gccgatgtgc tggggcctgg tcctggagaa gacagcttga tatttaaagc tatcaattgt    5214
ttcaattgat tcccacttca tttttctaaa tgtagaaaac ggtgacgtat aagaaaaaga    5274
atgaattagg acttttattc cgtacactaa tctagagcgg ccgcaagctt gtacaacgcg    5334
taccggttaa ttaaggtacc caattgcata tgtaatcctg gctagcaaca ctgaactatg    5394
ccagaaacca catcaaagat atgggcaagc ttcttggccc attatatcca aagacctcag    5454
agaaaggtga gcgaaggctc aattcagaag attggaagct gatcaatagg atcaagacaa    5514
tggtgagaac gcttccaaat ctcactattc caccagaaga tgcatacatt atcattgaaa    5574
cagatgcatg tgcaactgga tggggagcag tatgcaagtg gaagaaaaac aaggcagacc    5634
caagaaatac agagcaaatc tgtaggtatg ccagtggaaa atttgataag ccaaaaggaa    5694
cctgtgatgc agaaatctat ggggttatga atggcttaga aaagatgaga ttgttctact    5754
tggacaaaag agagatcaca gtcagaactg acagtagtgc aatcgaaagg ttctacaaca    5814
agagtgctga acacaagcct tctgagatca gatggatcag gttcatggac tacatcactg    5874
gtgcaggacc agagatagtc attgaacaca taaaagggaa gagcaatggt ttagctgaca    5934
tcttgtccag gctcaaagcc aaattagctc agaatgaacc aacggaagag atgatcctgc    5994
ttacacaagc cataagggaa gtaattcctt atccagatca tccatacact gagcaactca    6054
gagaatgggg aaacaaaatt ctggatccat tccccacatt caagaaggac atgttcgaaa    6114
gaacagagca agcttttatg ctaacagagg aaccagttct actctgtgca tgcaggaagc    6174
ctgcaattca gttagtgtcc agaacatctg ccaacccagg aaggaaattc ttcaagtgcg    6234
caatgaacaa atgccattgc tggtactggg cagatctcat tgaagaacac attcaagaca    6294
gaattgatga atttctcaag aatcttgaag ttctgaagac cggtggcgtg caaacaatgg    6354
aggaggaact tatgaaggaa gtcaccaagc tgaagataga agagcaggag ttcgaggaat    6414
accaggccac accaagggct atgtcgccag tagccgcaga agatgtgcta gatctccaag    6474
acgtaagcaa tgacgattga ggaggcattg acgtcaggga tgaccgcagc ggagagtact    6534
gggcccattc agtggatgct ccactgagtt gtattattgt gtgcttttcg gacaagtgtg    6594
ctgtccactt tcttttggca cctgtgccac tttattcctt gtctgccacg atgcctttgc    6654
ttagcttgta agcaaggatc gcagtgcgtg tgtgacacca ccccccttcc gacgctctgc    6714
ctatataagg caccgtctgt aagctcttac gatcatcggt agttcaccaa gggggtaccg    6774
gtcgccacc atg gcc tcc tcc gag aac gtc atc acc gag ttc atg cgc ttc    6825
          Met Ala Ser Ser Glu Asn Val Ile Thr Glu Phe Met Arg Phe
              640                 645                 650
aag gtg cgc atg gag ggc acc gtg aac ggc cac gag ttc gag atc gag    6873
Lys Val Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu 1le Glu
        655                 660                 665
ggc gag ggc gag ggc cgc ccc tac gag ggc cac aac acc gtg aag ctg    6921
Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu
    670                 675                 680
aag gtg acc aag ggc ggc ccc ctg ccc ttc gcc tgg gac atc ctg tcc    6969
Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser
685                 690                 695                 700
ccc cag ttc cag tac ggc tcc aag gtg tac gtg aag cac ccc gcc gac    7017
Pro Gln Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp
                705                 710                 715
atc ccc gac tac aag aag ctg tcc ttc ccc gag ggc ttc aag tgg gag    7065
Ile Pro Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu
            720                 725                 730
cgc gtg atg aac ttc gag gac ggc ggc gtg gcg acc gtg acc cag gac    7113
Arg Val Met Asn Phe Glu Asp Gly Gly Val Ala Thr Val Thr Gln Asp
        735                 740                 745
tcc tcc ctg cag gac ggc tgc ttc atc tac aag gtg aag ttc atc ggc    7161
Ser Ser Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly
    750                 755                 760
gtg aac ttc ccc tcc gac ggc ccc gtg atg cag aag aag acc atg ggc    7209
Val Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly
765                 770                 775                 780
tgg gag gcc tcc acc gag cgc ctg tac ccc cgc gac ggc gtg ctg aag    7257
Trp Glu Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys
                785                 790                 795
ggc gag acc cac aag gcc ctg aag ctg aag gac ggc ggc cac tac ctg    7305
Gly Glu Thr His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu
            800                 805                 810
gtg gag ttc aag tcc atc tac atg gcc aag aag ccc gtg cag ctg ccc    7353
Val Glu Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro
        815                 820                 825
ggc tac tac tac gtg gac gcc aag ctg gac atc acc tcc cac aac gag    7401
Gly Tyr Tyr Tyr Val Asp Ala Lys Leu Asp Ile Thr Ser His Asn Glu
    830                 835                 840
gac tac acc atc gtg gag cag tac gag cgc acc gag ggc cgc cac cac    7449
Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His
845                 850                 855                 860
ctg ttc ctg tag cggccgccct gcagggagct cggatatccc tagggatcgt        7501
Leu Phe Leu
tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt    7561
atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg    7621
ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata    7681
gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta    7741
ctagatcggg aattcgggcc cggccggcca gatcttgatt gtcgtttccc gccttcagtt    7801
taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta    7861
ttagaataat cggatattta aaagggcgtg aaaaggttta tccgttcgtc catttgtatg    7921
tgcatgccaa ccacagggtt cccctcggga gtgcttggca ttccgtgcga taatgacttc    7981
tgttcaacca cccaaacgtc ggaaagcctg acgacggagc agcattccaa aaagatccct    8041
tggctcgtct gggtcggcta gaaggtcgag tgggctgctg tggcttgatc cctcaacgcg    8101
gtcgcggacg tagcgcagcg ccgaaaaatc ctcgatcgca aatccgacgc tgtcgaaaag    8161
cgtgatctgc ttgtcgctct ttcggccgac gtcctggcca gtcatcacgc gccaaagttc    8221
cgtcacagga tgatctggcg cgagttgctg gatctcgcct tcaatccggg tctgtggcgg    8281
gaactccacg aaaatatccg aacgcagcaa gatcgtcgac caattcttga agacgaaagg    8341
gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt    8401
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac    8461
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa    8521
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat    8581
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc    8641
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga    8701
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg    8761
cggtattatc ccgtgttgac gccgggcaag agcaactcgg tcgccgcata cactattctc    8821
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag    8881
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc    8941
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg    9001
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg    9061
acaccacgat gccggggggg gggggggggg acatgaggtt gccccgtatt cagtgtcgct    9121
gatttgtatt gtctgaagtt gtttttacgt taagttgatg cagatcaatt aatacgatac    9181
ctgcgtcata attgattatt tgacgtggtt tgatggcctc cacgcacgtt gtgatatgta    9241
gatgataatc attatcactt tacgggtcct ttccggtgat ccgacaggtt acggggcggc    9301
gacctcgcgg gttttcgcta tttatgaaaa ttttccggtt taaggcgttt ccgttcttct    9361
tcgtcataac ttaatgtttt tatttaaaat accctctgaa aagaaaggaa acgacaggtg    9421
ctgaaagcga gctttttggc ctctgtcgtt tcctttctct gtttttgtcc gtggaatgaa    9481
caatggaacc cccccccccc ccccctgcag caatggcaac aacgttgcgc aaactattaa    9541
ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata    9601
aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat    9661
ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc    9721
cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata    9781
gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt    9841
actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga    9901
agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag    9961
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa   10021
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag   10081
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg   10141
tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat   10201
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta   10261
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg   10321
gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc   10381
gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa   10441
gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc   10501
tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt   10561
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct   10621
tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc   10681
gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg   10741
agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt   10801
gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat gccgcatagt   10861
taagccagta tacactccgc tatcgctacg tgactgggtc atggctgcgc cccgacaccc   10921
gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca  10981
agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg  11041
cgcgaggcag cagatccccc gatcaagtag atacactaca tatatctaca atagacatcg  11101
agccggaagg tgatgtttac tttcctgaaa tccccagcaa ttttaggcca gtttttaccc  11161
aagacttcgc ctctaacata aattatagtt accaaatctg gcaaaagggt tgaccggggg  11221
gggggggaaa gccacgttgt gtctcaaaat ctctgatgtt acattgcaca agataaaaat  11281
atatcatcat gaacaataaa actgtctgct tacataaaca gtaatacaag gggtgtt     11338
atg agc cat att caa cgg gaa acg tct tgc tcg agg ccg cga tta aat    11386
Met Ser His Ile Gln Arg Glu Thr Ser Cys Ser Arg Pro Arg Leu Asn
    865                 870                 875
tcc aac atg gat gct gat tta tat ggg tat aaa tgg gct cgc gat aat    11434
Ser Asn Met Asp Ala Asp Leu Tyr Gly Tyr Lys Trp Ala Arg Asp Asn
880                 885                 890                 895
gtc ggg caa tca ggt gcg aca atc tat cga ttg tat ggg aag ccc gat    11482
Val Gly Gln Ser Gly Ala Thr Ile Tyr Arg Leu Tyr Gly Lys Pro Asp
                900                 905                 910
gcg cca gag ttg ttt ctg aaa cat ggc aaa ggt agc gtt gcc aat gat    11530
Ala Pro Glu Leu Phe Leu Lys His Gly Lys Gly Ser Val Ala Asn Asp
            915                 920                 925
gtt aca gat gag atg gtc aga cta aac tgg ctg acg gaa ttt atg cct    11578
Val Thr Asp Glu Met Val Arg Leu Asn Trp Leu Thr Glu Phe Met Pro
        930                 935                 940
ctt ccg acc atc aag cat ttt atc cgt act cct gat gat gca tgg tta    11626
Leu Pro Thr Ile Lys His Phe Ile Arg Thr Pro Asp Asp Ala Trp Leu
    945                 950                 955
ctc acc act gcg atc ccc ggg aaa aca gca ttc cag gta tta gaa gaa    11674
Leu Thr Thr Ala Ile Pro Gly Lys Thr Ala Phe Gln Val Leu Glu Glu
960                 965                 970                 975
tat cct gat tca ggt gaa aat att gtt gat gcg ctg gca gtg ttc ctg    11722
Tyr Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Leu Ala Val Phe Leu
                980                 985                 990
cgc cgg ttg cat tcg att cct gtt tgt  aat tgt cct ttt aac  agc gat  11770
Arg Arg Leu His Ser Ile Pro Val Cys  Asn Cys Pro Phe Asn  Ser Asp
            995                 1000                 1005
cgc gta ttt  cgt ctc gct cag gcg  caa tca cga atg aat  aac ggt     11815
Arg Val Phe  Arg Leu Ala Gln Ala  Gln Ser Arg Met Asn  Asn Gly
        1010                 1015                 1020
ttg gtt gat  gcg agt gat ttt gat  gac gag cgt aat ggc  tgg cct     11860
Leu Val Asp  Ala Ser Asp Phe Asp  Asp Glu Arg Asn Gly  Trp Pro
    1025                 1030                 1035
gtt gaa caa  gtc tgg aaa gaa atg  cat aag ctt ttg cca  ttc tca     11905
Val Glu Gln  Val Trp Lys Glu Met  His Lys Leu Leu Pro  Phe Ser
        1040                 1045                 1050
ccg gat tca  gtc gtc act cat ggt  gat ttc tca ctt gat  aac ctt     11950
Pro Asp Ser  Val Val Thr His Gly  Asp Phe Ser Leu Asp  Asn Leu
        1055                 1060                 1065
att ttt gac  gag ggg aaa tta ata  ggt tgt att gat gtt  gga cga     11995
Ile Phe Asp  Glu Gly Lys Leu Ile  Gly Cys Ile Asp Val  Gly Arg
        1070                 1075                 1080
gtc gga atc  gca gac cga tac cag  gat ctt gcc atc cta  tgg aac     12040
Val Gly Ile  Ala Asp Arg Tyr Gln  Asp Leu Ala Ile Leu  Trp Asn
        1085                 1090                 1095
tgc ctc ggt  gag ttt tct cct tca  tta cag aaa cgg ctt  ttt caa     12085
Cys Leu Gly  Glu Phe Ser Pro Ser  Leu Gln Lys Arg Leu  Phe Gln
        1100                 1105                 1110
aaa tat ggt  att gat aat cct gat  atg aat aaa ttg cag  ttt cat     12130
Lys Tyr Gly  Ile Asp Asn Pro Asp  Met Asn Lys Leu Gln  Phe His
        1115                 1120                 1125
ttg atg ctc  gat gag ttt ttc taa tcagaattgg ttaattggtt gtaacactgg  12184
Leu Met Leu  Asp Glu Phe Phe
        1130
cagagcatta cgctgacttg acgggacggc ggctttgttg aataaatcga acttttgctg  12244
agttgaagga tcagatcacg catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa  12304
agttcaaaat caccaactgg tccacctaca acaaagctct catcaaccgt ggctccctca  12364
ctttctggct ggatgatggg gcgattcagg gatcacaggc agcaacgctc tgtcatcgtt  12424
acaatcaaca tgctaccctc cgcgagatca tccgtgtttc aaacccggca gcttagttgc  12484
cgttcttccg aatagcatcg gtaacatgag caaagtctgc cgccttacaa cggctctccc  12544
gctgacgccg tcccggactg atgggctgcc tgtatcgagt ggtgat                 12590
<210>217
<211>638
<212>PRT
<213>人工的
<220>
<223>合成构建体
<400>217
Met Ala Thr Ala Ala Ala Ala Ser Thr Ala Leu Thr Gly Ala Thr Thr
1               5                   10                  15
Ala Ala Pro Lys Ala Arg Arg Arg Ala His Leu Leu Ala Thr Arg Arg
            20                  25                  30
Ala Leu Ala Ala Pro Ile Arg Cys Ser Ala Ala Ser Pro Ala Met Pro
        35                  40                  45
Met Ala Pro Pro Ala Thr Pro Leu Arg Pro Trp Gly Pro Thr Asp Pro
    50                  55                  60
Arg Lys Gly Ala Asp Ile Leu Val Glu Ser Leu Glu Arg Cys Gly Val
65                  70                  75                  80
Arg Asp Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln
                85                  90                  95
Ala Leu Thr Arg Ser Pro Val Ile Ala Asn His Leu Phe Arg His Glu
            100                 105                 110
Gln Gly Glu Ala Phe Ala Ala Ser Gly Tyr Ala Arg Ser Ser Gly Arg
        115                 120                 125
Val Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val
    130                 135                 140
Ser Ala Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Met Val Ala Ile
145                 150                 155                 160
Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu
                165                 170                 175
Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu
            180                 185                 190
Val Leu Asp Val Asp Asp Ile Pro Arg Val Val Gln Glu Ala Phe Phe
        195                 200                 205
Leu Ala Ser Ser Gly Arg Pro Gly Pro Val Leu Val Asp Ile Pro Lys
    210                 215                 220
Asp Ile Gln Gln Gln Met Ala Val Pro Val Trp Asp Lys Pro Met Ser
225                 230                 235                 240
Leu Pro Gly Tyr Ile Ala Arg Leu Pro Lys Pro Pro Ala Thr Glu Leu
                245                 250                 255
Leu Glu Gln Val Leu Arg Leu Val Gly Glu Ser Arg Arg Pro Val Leu
            260                 265                 270
Tyr Val Gly Gly Gly Cys Ala Ala Ser Gly Glu Glu Leu Arg Arg Phe
        275                 280                 285
Val Glu Leu Thr Gly Ile Pro Val Thr Thr Thr Leu Met Gly Leu Gly
    290                 295                 300
Asn Phe Pro Ser Asp Asp Pro Leu Ser Leu Arg Met Leu Gly Met His
305                 310                 315                 320
Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp Lys Ala Asp Leu Leu Leu
                325                 330                 335
Ala Leu Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Ile Glu Ala
            340                 345                 350
Phe Ala Ser Arg Ala Lys Ile Val His Val Asp Ile Asp Pro Ala Glu
        355                 360                 365
Ile Gly Lys Asn Lys Gln Pro His Val Ser Ile Cys Ala Asp Val Lys
    370                 375                 380
Leu Ala Leu Gln Gly Met Asn Ala Leu Leu Glu Gly Ser Thr Ser Lys
385                 390                 395                 400
Lys Ser Phe Asp Phe Gly Ser Trp Asn Asp Glu Leu Asp Gln Gln Lys
                405                 410                 415
Arg Glu Phe Pro Leu Gly Tyr Lys Thr Ser Asn Glu Glu Ile Gln Pro
            420                 425                 430
Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu Thr Lys Gly Glu Ala Ile
        435                 440                 445
Ile Gly Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Tyr Tyr
    450                 455                 460
Thr Tyr Lys Arg Pro Arg Gln Trp Leu Ser Ser Ala Gly Leu Gly Ala
465                 470                 475                 480
Met Gly Phe Gly Leu Pro Ala Ala Ala Gly Ala Ser Val Ala Asn Pro
                485                 490                 495
Gly Val Thr Val Val Asp Ile Asp Gly Asp Gly Ser Phe Leu Met Asn
            500                 505                 510
Val Gln Glu Leu Ala Met Ile Arg Ile Glu Asn Leu Pro Val Lys Val
        515                 520                 525
Phe Val Leu Asn Asn Gln His Leu Gly Met Val Val Gln Trp Glu Asp
    530                 535                 540
Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Tyr Leu Gly Asn Pro Glu
545                 550                 555                 560
Asn Glu Ser Glu Ile Tyr Pro Asp Phe Val Thr Ile Ala Lys Gly Phe
                565                 570                 575
Asn Ile Pro Ala Val Arg Val Thr Lys Lys Asn Glu Val Arg Ala Ala
            580                 585                 590
Ile Lys Lys Met Leu Glu Thr Pro Gly Pro Tyr Leu Leu Asp Ile Ile
        595                 600                 605
Val Pro His Gln Glu His Val Leu Pro Met Ile Pro Asn Gly Gly Ala
    610                 615                 620
Phe Lys Asp Met Ile Leu Asp Gly Asp Gly Arg Thr Val Tyr
625                 630                 635
<210>218
<211>225
<212>PRT
<213>人工的
<220>
<223>合成构建体
<400>218
Met Ala Ser Ser Glu Asn Val Ile Thr Glu Phe Met Arg Phe Lys Val
1               5                   10                  15
Arg Met Glu Gly Thr Val Asn Gly His Glu Phe Glu Ile Glu Gly Glu
            20                  25                  30
Gly Glu Gly Arg Pro Tyr Glu Gly His Asn Thr Val Lys Leu Lys Val
        35                  40                  45
Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile Leu Ser Pro Gln
    50                  55                  60
Phe Gln Tyr Gly Ser Lys Val Tyr Val Lys His Pro Ala Asp Ile Pro
65                  70                  75                  80
Asp Tyr Lys Lys Leu Ser Phe Pro Glu Gly Phe Lys Trp Glu Arg Val
                85                  90                  95
Met Asn Phe Glu Asp Gly Gly Val Ala Thr Val Thr Gln Asp Ser Ser
            100                 105                 110
Leu Gln Asp Gly Cys Phe Ile Tyr Lys Val Lys Phe Ile Gly Val Asn
        115                 120                 125
Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Met Gly Trp Glu
    130                 135                 140
Ala Ser Thr Glu Arg Leu Tyr Pro Arg Asp Gly Val Leu Lys Gly Glu
145                 150                 155                 160
Thr His Lys Ala Leu Lys Leu Lys Asp Gly Gly His Tyr Leu Val Glu
                165                 170                 175
Phe Lys Ser Ile Tyr Met Ala Lys Lys Pro Val Gln Leu Pro Gly Tyr
            180                 185                 190
Tyr Tyr Val Asp Ala Lys Leu Asp Ile Thr Ser His Asn Glu Asp Tyr
        195                 200                 205
Thr Ile Val Glu Gln Tyr Glu Arg Thr Glu Gly Arg His His Leu Phe
    210                 215                 220
Leu
225
<210>219
<211>271
<212>PRT
<213>人工的
<220>
<223>合成构建体
<400>219
Met Ser His Ile Gln Arg Glu Thr Ser Cys Ser Arg Pro Arg Leu Asn
l               5                   10                  15
Ser Asn Met Asp Ala Asp Leu Tyr Gly Tyr Lys Trp Ala Arg Asp Asn
            20                  25                  30
Val Gly Gln Ser Gly Ala Thr Ile Tyr Arg Leu Tyr Gly Lys Pro Asp
        35                  40                  45
Ala Pro Glu Leu Phe Leu Lys His Gly Lys Gly Ser Val Ala Asn Asp
    50                  55                  60
Val Thr Asp Glu Met Val Arg Leu Asn Trp Leu Thr Glu Phe Met Pro
65                  70                  75                  80
Leu Pro Thr Ile Lys His Phe Ile Arg Thr Pro Asp Asp Ala Trp Leu
                85                  90                  95
Leu Thr Thr Ala Ile Pro Gly Lys Thr Ala Phe Gln Val Leu Glu Glu
            100                 105                 110
Tyr Pro Asp Ser Gly Glu Asn Ile Val Asp Ala Leu Ala Val Phe Leu
        115                 120                 125
Arg Arg Leu His Ser Ile Pro Val Cys Asn Cys Pro Phe Asn Ser Asp
    130                 135                 140
Arg Val Phe Arg Leu Als Gln Ala Gln Ser Arg Met Asn Asn Gly Leu
145                 150                 155                 160
Val Asp Ala Ser Asp Phe Asp Asp Glu Arg Asn Gly Trp Pro Val Glu
                165                 170                 175
Gln Val Trp Lys Glu Met His Lys Leu Leu Pro Phe Ser Pro Asp Ser
            180                 185                190
Val Val Thr His Gly Asp Phe Ser Leu Asp Asn Leu Ile Phe Asp Glu
        195                 200                 205
Gly Lys Leu Ile Gly Cys Ile Asp Val Gly Arg Val Gly Ile Ala Asp
    210                 215                220
Arg Tyr Gln Asp Leu Ala Ile Leu Trp Asn Cys Leu Gly Glu Phe Ser
225                 230                 235                 240
Pro Ser Leu Gln Lys Arg Leu Phe Gln Lys Tyr Gly Ile Asp Asn Pro
                245                 250                 255
Asp Met Asn Lys Leu Gln Phe His Leu Met Leu Asp Glu Phe Phe
            260                 265                 270
<210>220
<211>39
<212>DNA
<213>人工的
<220>
<223>包含miR172标签的短寡聚物
<220>
<221>misc_RNA
<222>(10)..(30)
<223>与miR172几乎互补
<400>220
agctcgccgc tgcagcatca tcaggattcc cactgctag                            39
<210>221
<211>38
<212>DNA
<213>人工的
<220>
<223>miR 319标签
<220>
<221>misc_feature
<222>(10)..(29)
<223>与miR 319几乎互补
<400>221
agctggatgc agagctccct tcaatccaaa gagcctag                              38
<210>222
<211>39
<212>DNA
<213>人工的
<220>
<223>miR 396a标签
<220>
<221>misc_feature
<222>(10)..(31)
<223>与miR 396a互补
<400>222
agctgagggc agttcaataa agctgtggga aattgctag                            39
<210>223
<211>43
<212>DNA
<213>人工的
<220>
<223>miR 398a标签
<220>
<221>misc_feature
<222>(11)..(31)
<223>与miR 398a几乎互补
<400>223
agctctcctc aaggggtgac ctaagaacac caccaccacc tag                       43
<210>224
<211>40
<212>DNA
<213>人工的
<220>
<223>miR 167标签
<220>
<221>misc_feature
<222>(10)..(31)
<223>与miR 167d几乎互补
<400>224
agctccctgt tagatcaggc tggcagcttg tatttcctag                           40
<210>225
<211>20
<212>RNA
<213>拟南芥
<400>225
ugacagaaga gagugagcac                                                 20
<210>226
<211>21
<212>RNA
<213>拟南芥
<400>226
cgacagaaga gagugagcac a                                               21
<210>227
<211>21
<212>RNA
<213>拟南芥
<400>227
uugacagaag aaagagagca c                                               21
<210>228
<211>21
<212>RNA
<213>拟南芥
<400>228
uugacagaag auagagagca c                                               21
<210>229
<211>20
<212>RNA
<213>拟南芥
<400>229
ucccaaaugu agacaaagca                                                 20
<210>230
<211>21
<212>RNA
<213>拟南芥
<400>230
uuuggauuga agggagcucu a                                               21
<210>231
<211>21
<212>RNA
<213>拟南芥
<400>231
uuuggauuga agggagcucu u                                               21
<210>232
<211>21
<212>RNA
<213>拟南芥
<400>232
uuuggauuga agggagcucc u                                               21
<210>233
<211>21
<212>RNA
<213>拟南芥
<400>233
uugaaaguga cuacaucggg g                                               21
<210>234
<211>21
<212>RNA
<213>拟南芥
<400>234
ucgauaaacc ucugcaucca g                                               21
<210>235
<211>21
<212>RNA
<213>拟南芥
<400>235
uggagaagca gggcacgugc a                                               21
<210>236
<211>21
<212>RNA
<213>拟南芥
<400>236
uggagaagca gggcacgugc g                                               21
<210>237
<211>21
<212>RNA
<213>拟南芥
<400>237
ucggaccagg cuucaucccc c                                               21
<210>238
<211>21
<212>RNA
<213>拟南芥
<400>238
ucggaccagg cuucauuccc c                                               21
<210>239
<211>21
<212>RNA
<213>拟南芥
<400>239
uuaagcugcc agcaugaucu u                                               21
<210>240
<211>22
<212>RNA
<213>拟南芥
<400>240
ugaagcugcc agcaugaucu gg                                              22
<210>241
<211>21
<212>RNA
<213>拟南芥
<400>241
ucgcuuggug caggucggga a                                               21
<210>242
<211>21
<212>RNA
<213>拟南芥
<400>242
cagccaagga ugacuugccg a                                               21
<210>243
<211>21
<212>RNA
<213>拟南芥
<400>243
cagccaagga ugacuugccg g                                               21
<210>244
<211>21
<212>RNA
<213>拟南芥
<400>244
ugagccaagg augacuugcc g                                               21
<210>245
<211>21
<212>RNA
<213>拟南芥
<400>245
uagccaagga ugacuugccu g                                               21
<210>246
<211>21
<212>RNA
<213>拟南芥
<400>246
ugauugagcc gugucaauau c                                               21
<210>247
<211>21
<212>RNA
<213>拟南芥
<400>247
ugauugagcc gcgccaauau c                                               21
<210>248
<211>21
<212>RNA
<213>拟南芥
<400>248
uugagccgug ccaauaucac g                                               21
<210>249
<211>22
<212>RNA
<213>拟南芥
<400>249
uucgcuugca gagagaaauc ac                                              22
<210>250
<211>20
<212>RNA
<213>拟南芥
<400>250
uuggacugaa gggagcuccc                                                 20
<210>251
<211>20
<212>RNA
<213>拟南芥
<400>251
uuggacugaa gggagcuccu                                                 20
<210>252
<211>21
<212>RNA
<213>拟南芥
<400>252
uccaaaggga ucgcauugau c                                               21
<210>253
<211>20
<212>RNA
<213>拟南芥
<400>253
uuggcauucu guccaccucc                                                 20
<210>254
<211>21
<212>RNA
<213>拟南芥
<400>254
cugaaguguu ugggggaacu c                                               21
<210>255
<211>21
<212>RNA
<213>拟南芥
<400>255
cugaaguguu uggggggacu c                                               21
<210>256
<211>21
<212>RNA
<213>拟南芥
<400>256
uuccacagcu uucuugaacu g                                               21
<210>257
<211>21
<212>RNA
<213>拟南芥
<400>257
uuccacagcu uucuugaacu u                                               21
<210>258
<211>21
<212>RNA
<213>拟南芥
<400>258
ucauugagug cagcguugau g                                               21
<210>259
<211>21
<212>RNA
<213>拟南芥
<400>259
ucauugagug caucguugau g                                               21
<210>260
<211>21
<212>RNA
<213>拟南芥
<400>260
uguguucuca ggucaccccu u                                               21
<210>261
<211>21
<212>RNA
<213>拟南芥
<400>261
uguguucuca ggucaccccu g                                               21
<210>262
<211>21
<212>RNA
<213>拟南芥
<400>262
ugccaaagga gauuugcccu g                                               21
<210>263
<211>21
<212>RNA
<213>拟南芥
<400>263
ugccaaagga gaguugcccu g                                               21
<210>264
<211>21
<212>RNA
<213>拟南芥
<400>264
ugccaaagga gauuugcccc g                                               21
<210>265
<211>21
<212>RNA
<213>拟南芥
<400>265
ugccaaagga gauuugccuc g                                               21
<210>266
<211>21
<212>RNA
<213>拟南芥
<400>266
ugccaaagga gauuugcccg g                                               21

Claims (39)

1.以提高的特异性在真核生物中转基因表达的方法,所述方法包括步骤:
a)提供表达构建体,构建体包含在所述真核生物中具有功能并且功能性连接至待表达成为嵌合RNA序列的核苷酸序列上的启动子序列,所述核苷酸序列包含:
i)至少一个能赋予所述真核生物优选表型或有益效果的序列,和
ii)至少一个与所述真核生物中天然表达的microRNA序列基本互补的序列,其中所述microRNA在不希望此种表达的组织中、时间上和/或环境条件下天然表达,但是在希望此种表达的组织中、时间上和/或环境条件下不表达或者基本上较少表达,
其中至少一个序列i)和序列ii)彼此是异源性的,和
b)将所述表达构建体导入真核生物。
2.权利要求1所述的方法,其中所述真核生物是人、动物或植物。
3.权利要求1或2所述的方法,其中与microRNA基本互补的序列位于待表达核苷酸序列中相当于所述序列的5’非翻译区或3’非翻译区的位置。
4.权利要求1或3所述的方法,其中与microRNA基本互补的序列在整个序列内与microRNA序列的互补链具有至少60%的同一性或不超过6个错配。
5.权利要求4所述的方法,其中所述错配在相当于所述microRNA的3’区的区域。
6.权利要求1-5中任何一项所述的方法,其中待表达的核苷酸序列包含编码蛋白质的可读框。
7.权利要求1-5中任何一项所述的方法,其中待表达的核苷酸序列编码选自反义RNA、正义RNA、双链RNA或核酶的功能性RNA。
8.权利要求7的所述方法,其中功能性RNA减弱内源基因的表达。
9.权利要求1-8中任何一项所述的方法,其中microRNA是组织特异性表达的、空间性调节的、发育性调节的和/或由生物或非生物应激因素调节的。
10.权利要求1-9中任何一项所述的方法,其中所述表达构建体是DNA。
11.权利要求1-10中任何一项所述的方法,其中所述表达构建体在质粒中。
12.权利要求1-11中任何一项所述的方法,其中所述启动子选自组成型启动子、组织特异性或组织优先性启动子和诱导型启动子。
13.权利要求1-12中任何一项所述的方法,其中真核生物是植物并且启动子是在植物中具有功能的启动子。
14.权利要求13所述的方法,其中表达的核苷酸序列调节农学性状、疾病抗性、除草剂抗性和/或谷粒特性所涉及的基因的表达。
15.权利要求13或14所述的方法,其中所表达的核苷酸序列调节选自如下基因的表达,所述基因为参与蛋白质、肽、脂肪酸、脂类、蜡类、油类、淀粉、糖、碳水化合物、香料、气味、毒素、类胡萝卜素、激素、聚合物、类黄酮、贮存蛋白、酚酸、生物碱、木质素、单宁类、纤维素、糖蛋白和糖脂合成和/或降解的基因。
16.权利要求13-15中任何一项所述的方法,其中microRNA在植物中具有选自下列的表达谱:
a)基本上组成型表达但在种子中不表达,
b)主要在种子中表达但在其它组织中不表达,
c)干旱或其它非生物应激诱导型表达,
d)植物病原体诱导型表达,
e)时间性表达,和
f)化合物诱导型表达。
17.权利要求13-16中任何一项所述的方法,其中microRNA是选自下列的植物microRNA:
a)SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述序列,和。
b)SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述序列的衍生物。
18.权利要求17所述的方法,其中衍生物microRNA与任意的SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、225、226、227、228、229、230、231、232、233、234、235、236、237、238、239、240、241、242、243、245、245、246、247、248、249、250、251、252、253、254、255、256、257、258、259、260、261、262、263、264、265和266所述miRNA具有至少70%的同一性。
19.权利要求1-12中任何一项所述的方法,其中靶生物是动物、哺乳动物或人并且启动子是分别在动物、哺乳动物或人中具有功能的启动子。
20.权利要求19所述的方法,其中所表达核苷酸序列调节选自人或动物疾病所涉及基因或者治疗性基因的基因表达。
21.权利要求19或20所述的方法,其中疾病选自免疫疾病、癌症、糖尿病、神经变性疾病和代谢疾病。
22.权利要求19-21中任何一项所述的方法,其中所调节基因选自视网膜母细胞瘤蛋白、p53、制管张素、瘦蛋白、激素、生长因子、细胞因子、胰岛素、生长激素、α-干扰素、β-葡糖脑苷脂酶、血清白蛋白、血红蛋白和胶原。
23.权利要求20所述的方法,其中所述治疗基因是肿瘤坏死因子α。
24.权利要求19-23中任何一项所述的方法,其中启动子选自perbB2启动子、乳清酸性蛋白启动子、溶基质蛋白酶3启动子、前列腺特异性抗原启动子、probasin启动子。
25.权利要求19-24中任何一项所述的方法,其中microRNA在动物、哺乳动物或人中具有选自下列的天然表达谱:
a)在选自脑组织、肝脏组织、肌肉组织、神经元组织和肿瘤组织的组织中组织特异性表达,
b)应激诱导型表达,
c)病原体诱导型表达,
d)赘生生长或致瘤生长诱导型表达,和
e)年龄依赖性表达。
26.权利要求19-25中任何一项所述的方法,其中microRNA是选自下列的动物、哺乳动物或人microRNA:
a)SEQ ID NO:56、57、58、59、60、61、62和63所述序列,和
b)SEQ ID NO:56、57、58、59、60、61、62和63所述序列的衍生物,和
c)任意SEQ ID NO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208所述序列的互补RNA序列,和
d)与任意SEQ ID NO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208所述序列互补的RNA序列的衍生物。
27.权利要求26所述的方法,其中衍生物microRNA与任意SEQ IDNO:56、57、58、59、60、61、62和63所述miRNA或者与任意SEQ IDNO:90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207或208所述序列互补的RNA序列具有至少70%的同一性。
28.嵌合核糖核苷酸序列,包含:
i)至少一个能赋予真核生物优选表型或有益效果的序列,和
ii)至少一个与真核生物中天然表达的microRNA序列基本互补的序列,
其中至少一个序列i)和序列ii)彼此是异源性的。
29.权利要求28所述的嵌合核糖核苷酸序列,其中序列i)和/或ii)如权利要求3、4、5、6、7、8、9、14、15、16、17、18、19、20、21、22、23、24、25、26或27任意一项所定义。
30.包含在真核生物中具有功能并且功能性连接至待表达核苷酸序列上的启动子序列的表达构建体,所述序列包含:
i)至少一个能赋予所述真核生物优选表型或有益效果的序列,和
ii)至少一个与所述真核生物中天然存在的microRNA序列基本互补的序列,
其中至少一个序列i)和序列ii)彼此是异源性的。
31.权利要求30所述的表达构建体,其中表达构建体及其元件如权利要求1-28中任意一项所定义。
32.包含权利要求30或31所述表达构建体的表达载体。
33.权利要求32所述的表达载体,其中表达载体是真核生物表达载体。
34.权利要求32所述的表达载体,其中真核生物表达载体是病毒载体、质粒载体或双元载体。
35.包含权利要求28或29所述嵌合核糖核苷酸序列、权利要求30或31中任何一项所述表达构建体或权利要求32-34中任意一项所述表达载体的转化细胞或非人生物。
36.权利要求35所述的转化细胞或非人生物,其包含插入到基因组中的表达构建体或表达载体。
37.权利要求35或36所述的转化细胞或非人生物,其中所述细胞或生物选自哺乳动物、细菌、真菌、线虫或植物细胞和生物。
38.权利要求37所述的植物的转化种子。
39.至少一个权利要求30或31所述表达构建体、权利要求28或29所述嵌合核糖核苷酸序列或权利要求32-34任何一项所述载体的药物制剂。
CN2006800219915A 2005-04-19 2006-04-13 控制基因表达的改良方法 Active CN101203611B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67297605P 2005-04-19 2005-04-19
US60/672,976 2005-04-19
PCT/EP2006/061604 WO2006111512A1 (en) 2005-04-19 2006-04-13 Improved methods controlling gene expression

Publications (2)

Publication Number Publication Date
CN101203611A true CN101203611A (zh) 2008-06-18
CN101203611B CN101203611B (zh) 2013-08-14

Family

ID=36754673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800219915A Active CN101203611B (zh) 2005-04-19 2006-04-13 控制基因表达的改良方法

Country Status (9)

Country Link
US (2) US9085774B2 (zh)
EP (1) EP1874936B1 (zh)
CN (1) CN101203611B (zh)
AU (1) AU2006237317B8 (zh)
BR (1) BRPI0608829A2 (zh)
CA (1) CA2604807C (zh)
IL (1) IL186542A0 (zh)
WO (1) WO2006111512A1 (zh)
ZA (1) ZA200709897B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102676525A (zh) * 2012-05-17 2012-09-19 复旦大学 水稻miR399d 及其应用
WO2012143805A1 (en) * 2011-04-21 2012-10-26 Basf Plant Science Company Gmbh Methods of modifying lignin biosynthesis and improving digestibility
WO2013053070A1 (en) * 2011-10-09 2013-04-18 Shanghai Institutes For Biological Sciences, Cas Heat tolerance microrna
CN104830859A (zh) * 2015-04-24 2015-08-12 浙江大学 一种茶树miRNA及其应用
CN104994724A (zh) * 2012-12-18 2015-10-21 洛克菲勒大学 基因沉默
CN105528532A (zh) * 2014-09-30 2016-04-27 深圳华大基因科技有限公司 一种rna编辑位点的特征分析方法
CN108588069A (zh) * 2018-03-07 2018-09-28 承德医学院 桑树miR171a的前体基因及其在增强植物耐盐性中的应用
CN109234305A (zh) * 2018-07-16 2019-01-18 浙江理工大学 一种棉花性状改良的方法
CN110295169A (zh) * 2019-06-27 2019-10-01 江西省农业科学院农业应用微生物研究所(江西省农村能源研究中心) 一种miRNA及其用于杀灭褐飞虱的应用
CN110423749A (zh) * 2019-07-17 2019-11-08 中国农业科学院棉花研究所 棉花纤维长度相关microRNA160及其前体DNA和应用
CN110476817A (zh) * 2019-09-29 2019-11-22 上海市农业科学院 一种鸢尾辐射诱变剂量筛选方法
CN110714013A (zh) * 2019-09-29 2020-01-21 南京农业大学 大豆E2泛素结合酶基因GmUBC1的应用
CN110982921A (zh) * 2019-12-13 2020-04-10 南京林业大学 春兰miR159a在加快植物生命周期中的应用
CN111249299A (zh) * 2020-03-31 2020-06-09 南京财经大学 大豆rna提取物在制备预防及治疗肠炎的药物中的应用
CN112007043A (zh) * 2020-08-24 2020-12-01 谢琦 抗结直肠癌的药物或组合物
CN113430197A (zh) * 2021-05-17 2021-09-24 西北农林科技大学 促进砧木根系发育及抗旱的可移动miRNA及鉴定方法
CN113430295A (zh) * 2013-10-31 2021-09-24 保尔·萨巴梯埃图卢兹第三大学 微肽及其用于调节基因表达的用途
CN113603747A (zh) * 2021-08-27 2021-11-05 上海交通大学 由Pri-miRNA编码的多肽在提高葡萄抗寒性能中的应用

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2163638A1 (en) * 2004-12-20 2010-03-17 BASF Plant Science GmbH Nucleic acid molecules encoding fatty acid desaturase genes from plants and methods of use
US20060200878A1 (en) 2004-12-21 2006-09-07 Linda Lutfiyya Recombinant DNA constructs and methods for controlling gene expression
US8697949B2 (en) 2004-12-21 2014-04-15 Monsanto Technology Llc Temporal regulation of gene expression by MicroRNAs
EP1877557A2 (en) 2005-04-04 2008-01-16 The Board of Regents of The University of Texas System Micro-rna's that regulate muscle cells
CA2625031C (en) 2005-10-13 2016-07-19 Monsanto Technology Llc Methods for producing hybrid seed
AU2007281261B2 (en) 2006-08-01 2013-03-21 Board Of Regents Of The University Of Texas System Identification of a micro-RNA that activates expression of beta-myosin heavy chain
ES2655700T3 (es) 2006-08-31 2018-02-21 Monsanto Technology, Llc ARN pequeños en fase
CA2663811A1 (en) * 2006-10-05 2008-04-17 E.I. Du Pont De Nemours And Company Maize microrna sequences
EP2074227A4 (en) 2006-10-12 2010-03-10 Monsanto Technology Llc PLANT MICRO-RNAS AND METHOD OF USE THEREOF
WO2008071959A1 (en) * 2006-12-12 2008-06-19 Oxford Biomedica (Uk) Limited Lentiviral vectors comprising micrornas
EP2136846A4 (en) * 2007-03-26 2011-04-13 Crc For Asthma And Airways Ltd THERAPEUTIC OBJECTIVES AND MOLECULES
AU2008283794B2 (en) 2007-07-31 2014-03-20 Board Of Regents, The University Of Texas System Micro-RNAs that control myosin expression and myofiber identity
BRPI0815383A2 (pt) 2007-07-31 2015-09-08 Univ Texas família de micro-rna que modula fibrose e usos da mesma
AU2008318778B2 (en) 2007-10-29 2014-10-02 Regulus Therapeutics Inc. Targeting microRNAs for the treatment of liver cancer
US8097712B2 (en) 2007-11-07 2012-01-17 Beelogics Inc. Compositions for conferring tolerance to viral disease in social insects, and the use thereof
BRPI0818901A2 (pt) 2007-11-09 2015-05-12 Univ Texas Micro-rnas da família mir-15 modulam sobrevivência de cardiomiócitos e reparo cardíaco
CN101952443B (zh) * 2007-12-21 2014-11-12 纳幕尔杜邦公司 涉及编码miR827的基因的耐旱植物、以及相关的构建体和方法
WO2009117418A2 (en) 2008-03-17 2009-09-24 The Board Of Regents Of The University Of Texas System Identification of micro-rnas involved in neuromuscular synapse maintenance and regeneration
GB0807424D0 (en) * 2008-04-23 2008-05-28 Isis Innovation Virus
CN102099472A (zh) * 2008-05-19 2011-06-15 新加坡科技研究局 使基因表达靶向于神经胶质瘤的核酸分子和方法
MX2011008190A (es) 2009-02-04 2011-10-06 Univ Texas Direccionamiento dual de mir-208 y mir-499 en el tratamiento de trastornos cardiacos.
US8962584B2 (en) 2009-10-14 2015-02-24 Yissum Research Development Company Of The Hebrew University Of Jerusalem, Ltd. Compositions for controlling Varroa mites in bees
EP2545182B1 (en) 2010-03-08 2017-05-03 Monsanto Technology LLC Polynucleotide molecules for gene regulation in plants
CA3075333C (en) 2010-03-12 2021-10-19 Monsanto Technology Llc Plant health compositions comprising a water-soluble pesticide and a water-insoluble agrochemical
EP2385129A1 (en) * 2010-05-03 2011-11-09 BASF Plant Science Company GmbH Enhanced methods for gene regulation in plants
NZ605420A (en) 2010-07-06 2015-02-27 Interna Technologies Bv Mirna and its diagnostic and therapeutic uses in diseases or conditions associated with melanoma, or in diseases or conditions associated with activated braf pathway
CN102199619B (zh) * 2010-11-29 2013-05-15 北京未名凯拓作物设计中心有限公司 一种利用红色荧光蛋白用做水稻转化筛选标记的转化方法
EA201370139A1 (ru) 2010-12-15 2013-10-30 Мираген Терапеутикс Ингибиторы микро-рнк, содержащие закрытые нуклеотиды
EP2474617A1 (en) 2011-01-11 2012-07-11 InteRNA Technologies BV Mir for treating neo-angiogenesis
CN102168086B (zh) * 2011-03-14 2012-09-05 复旦大学 蝴蝶兰miR172编码序列及其应用
EP2726493B1 (en) 2011-07-01 2020-10-14 Monsanto Technology LLC Methods and compositions for selective regulation of protein expression
US10829828B2 (en) 2011-09-13 2020-11-10 Monsanto Technology Llc Methods and compositions for weed control
US10760086B2 (en) 2011-09-13 2020-09-01 Monsanto Technology Llc Methods and compositions for weed control
UY34328A (es) 2011-09-13 2013-04-30 Monsanto Technology Llc ?composiciones y métodos para controlar malezas comprendiendo un polinucleótido y agente de transferencia, y que modulan protoporfirinógeno ix oxidasa?.
WO2013040057A1 (en) 2011-09-13 2013-03-21 Monsanto Technology Llc Methods and compositions for weed control
UA116090C2 (uk) 2011-09-13 2018-02-12 Монсанто Текнолоджи Ллс Спосіб та композиція для боротьби з бур'янами (варіанти)
BR112014005978A8 (pt) 2011-09-13 2017-09-12 Monsanto Technology Llc Métodos e composições quimicas agricolas para controle de planta, método de redução de expressão de um gene gs em uma planta, cassete de expressão microbiana, método para fazer um polinucleotídeo e método de identificação de polinucleotídeos úteis na modulação de expressão do gene gs
US10806146B2 (en) 2011-09-13 2020-10-20 Monsanto Technology Llc Methods and compositions for weed control
US9840715B1 (en) 2011-09-13 2017-12-12 Monsanto Technology Llc Methods and compositions for delaying senescence and improving disease tolerance and yield in plants
US9920326B1 (en) 2011-09-14 2018-03-20 Monsanto Technology Llc Methods and compositions for increasing invertase activity in plants
KR20140091688A (ko) 2011-10-06 2014-07-22 미라젠 세러퓨틱스 인코포레이티드 마이크로rna 조절에 의한 전신 에너지 항상성의 제어
US10240162B2 (en) 2012-05-24 2019-03-26 A.B. Seeds Ltd. Compositions and methods for silencing gene expression
MX355408B (es) 2012-06-21 2018-04-18 Miragen Therapeutics Inc Inhibidores a base de oligonucleotidos que comprenden un motivo de acido nucleico bloqueado.
US9163235B2 (en) 2012-06-21 2015-10-20 MiRagen Therapeutics, Inc. Inhibitors of the miR-15 family of micro-RNAs
US10077451B2 (en) 2012-10-18 2018-09-18 Monsanto Technology Llc Methods and compositions for plant pest control
WO2014064704A2 (en) * 2012-10-28 2014-05-01 A.B. Seeds Ltd. Transgenic plants with modified sugar content and methods of generating same
WO2014081507A1 (en) 2012-11-26 2014-05-30 Moderna Therapeutics, Inc. Terminally modified rna
US10683505B2 (en) 2013-01-01 2020-06-16 Monsanto Technology Llc Methods of introducing dsRNA to plant seeds for modulating gene expression
UY35252A (es) 2013-01-01 2014-07-31 Seeds Ltd Ab MÉTODOS PARA INTRODUCIR dsRNA EN SEMILLAS DE PLANTAS PARA MODULAR LA EXPRESIÓN GENÉTICA
AU2013374345A1 (en) 2013-01-17 2015-08-06 Moderna Therapeutics, Inc. Signal-sensor polynucleotides for the alteration of cellular phenotypes
US10000767B2 (en) 2013-01-28 2018-06-19 Monsanto Technology Llc Methods and compositions for plant pest control
EP3604535A3 (en) 2013-03-13 2020-04-22 Monsanto Technology LLC Methods and compositions for weed control
BR112015022797A2 (pt) 2013-03-13 2017-11-07 Monsanto Technology Llc método para controle de ervas daninhas, composição herbicida, cassete de expressão microbiano e método de produção de polinucleotídeo
US20140283211A1 (en) 2013-03-14 2014-09-18 Monsanto Technology Llc Methods and Compositions for Plant Pest Control
US10568328B2 (en) 2013-03-15 2020-02-25 Monsanto Technology Llc Methods and compositions for weed control
MX357720B (es) 2013-05-14 2018-07-20 Bayer Cropscience Nv Expresion selectiva mejorada de transgenes en plantas productoras de fibra.
WO2015010026A2 (en) 2013-07-19 2015-01-22 Monsanto Technology Llc Compositions and methods for controlling leptinotarsa
US9850496B2 (en) 2013-07-19 2017-12-26 Monsanto Technology Llc Compositions and methods for controlling Leptinotarsa
AR098295A1 (es) 2013-11-04 2016-05-26 Monsanto Technology Llc Composiciones y métodos para controlar infestaciones de plagas y parásitos de los artrópodos
UA119253C2 (uk) 2013-12-10 2019-05-27 Біолоджикс, Інк. Спосіб боротьби із вірусом у кліща varroa та у бджіл
US10683513B2 (en) 2013-12-31 2020-06-16 Dow Agrosciences Llc Tissue-specific expression and hybrid plant production
EP3116303B1 (en) 2014-01-15 2020-07-22 Monsanto Technology LLC Methods and compositions for weed control using epsps polynucleotides
EP3420809A1 (en) 2014-04-01 2019-01-02 Monsanto Technology LLC Compositions and methods for controlling insect pests
AU2015280252A1 (en) 2014-06-23 2017-01-12 Monsanto Technology Llc Compositions and methods for regulating gene expression via RNA interference
EP3161138A4 (en) 2014-06-25 2017-12-06 Monsanto Technology LLC Methods and compositions for delivering nucleic acids to plant cells and regulating gene expression
AR101348A1 (es) 2014-07-29 2016-12-14 Monsanto Technology Llc Composiciones y métodos para el control de pestes por insectos
SG11201705907XA (en) 2015-01-20 2017-08-30 Miragen Therapeutics Inc Mir-92 inhibitors and uses thereof
JP6942632B2 (ja) 2015-01-22 2021-09-29 モンサント テクノロジー エルエルシー Leptinotarsa防除用組成物及びその方法
CN107750125A (zh) 2015-06-02 2018-03-02 孟山都技术有限公司 用于将多核苷酸递送至植物中的组合物和方法
US10655136B2 (en) 2015-06-03 2020-05-19 Monsanto Technology Llc Methods and compositions for introducing nucleic acids into plants
US10849920B2 (en) 2015-10-05 2020-12-01 Modernatx, Inc. Methods for therapeutic administration of messenger ribonucleic acid drugs
US20190282679A1 (en) 2016-04-18 2019-09-19 Rima McLeod Toxoplasma gondii vaccines and their use
AU2018212986A1 (en) 2017-01-28 2019-08-08 Inari Agriculture Technology, Inc. Novel plant cells, plants, and seeds
CN107312845B (zh) * 2017-07-07 2020-11-03 华中农业大学 鉴别无蜡粉不结球白菜的引物、试剂盒及鉴别方法
US11603536B2 (en) 2017-09-29 2023-03-14 Inari Agriculture Technology, Inc. Methods for efficient maize genome editing
MX2020004017A (es) * 2017-10-17 2020-07-22 Univ California Control de patogenos fungicos utilizando la estrategia basada en arni.
US11802288B1 (en) 2018-01-29 2023-10-31 Inari Agriculture Technology, Inc. Methods for efficient soybean genome editing
US11220694B1 (en) 2018-01-29 2022-01-11 Inari Agriculture, Inc. Rice cells and rice plants
US11926835B1 (en) 2018-01-29 2024-03-12 Inari Agriculture Technology, Inc. Methods for efficient tomato genome editing
US11866719B1 (en) 2018-06-04 2024-01-09 Inari Agriculture Technology, Inc. Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants
CN108834900B (zh) * 2018-07-31 2022-03-11 安徽农业大学 抑制茶树组培中外植体氧化褐变和内生菌污染的培养方法
CN109867715B (zh) * 2019-02-28 2022-06-17 中国科学院昆明植物研究所 一种叶绿体蛋白和ATPase酶活性突变体在提高植物抗逆性中的应用
CN110699375A (zh) * 2019-03-07 2020-01-17 山东舜丰生物科技有限公司 一种特异增强种子休眠的遗传改良方法及其应用
AR118478A1 (es) * 2019-03-28 2021-10-06 Syngenta Crop Protection Ag Modulación de expresión transgénica
TWI738052B (zh) * 2019-09-06 2021-09-01 葉開溫 於特定植物組織中沉默八氫蕃茄紅素合成酶基因表現之dna卡匣構築體及其方法
CN112553245B (zh) * 2019-09-25 2022-06-07 扬州大学 OsPIL16基因的新用途
AU2021312243A1 (en) * 2020-07-20 2023-02-23 Flagship Pioneering, Inc. Viroid-derived polynucleotides for modification of plants
CN112575107A (zh) * 2020-12-21 2021-03-30 北京林业大学 一种用于百合miRNA检测的内参基因及其应用
WO2023010143A2 (en) * 2021-07-30 2023-02-02 The Board Of Trustees Of The Leland Stanford Junior University Genetically-encoded volatile synthetic biomarkers for breath-based cancer detection
CN113564167B (zh) * 2021-07-30 2023-07-07 中山大学 一种水稻抗虫microRNA及其应用
CN113881685B (zh) * 2021-10-09 2024-03-29 江苏省农业科学院 促进植物器官产生红色色泽的基因PpHSP20-like1及其应用
CN115927377B (zh) * 2022-09-22 2023-08-08 北京林业大学 一种湿加松年龄标记基因PtAP2L3及其筛选方法与应用

Family Cites Families (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4407956A (en) 1981-03-13 1983-10-04 The Regents Of The University Of California Cloned cauliflower mosaic virus DNA as a plant vehicle
CA1192510A (en) 1981-05-27 1985-08-27 Lawrence E. Pelcher Rna plant virus vector or portion thereof, a method of construction thereof, and a method of producing a gene derived product therefrom
NL8200523A (nl) 1982-02-11 1983-09-01 Univ Leiden Werkwijze voor het in vitro transformeren van planteprotoplasten met plasmide-dna.
US4536475A (en) 1982-10-05 1985-08-20 Phytogen Plant vector
EP0116718B2 (en) 1983-01-13 1996-05-08 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Process for the introduction of expressible genes into plant cell genomes and agrobacterium strains carrying hybrid Ti plasmid vectors useful for this process
JPH0714349B2 (ja) 1983-01-17 1995-02-22 モンサント カンパニ− 植物細胞での発現に適したキメラ遺伝子
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
WO1985001856A1 (en) 1983-11-03 1985-05-09 Johannes Martenis Jacob De Wet Method for the transfer of exogenous genes in plants using pollen as a vector
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
DK162399C (da) 1986-01-28 1992-03-23 Danisco Fremgangsmaade til ekspression af gener i baelgplanteceller, dna-fragment, rekombineret dna-fragment samt plasmid til brug ved udoevelsen af fremgangsmaaden
US4975374A (en) 1986-03-18 1990-12-04 The General Hospital Corporation Expression of wild type and mutant glutamine synthetase in foreign hosts
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
IL84459A (en) 1986-12-05 1993-07-08 Agracetus Apparatus and method for the injection of carrier particles carrying genetic material into living cells
US5169770A (en) 1987-12-21 1992-12-08 The University Of Toledo Agrobacterium mediated transformation of germinating plant seeds
US5922602A (en) 1988-02-26 1999-07-13 Biosource Technologies, Inc. Cytoplasmic inhibition of gene expression
US5789214A (en) 1988-03-08 1998-08-04 Novartis Finance Corporation Method of inducing gene transcription in a plant
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
EP0333033A1 (en) 1988-03-09 1989-09-20 Meiji Seika Kaisha Ltd. Glutamine synthesis gene and glutamine synthetase
NZ228320A (en) 1988-03-29 1991-06-25 Du Pont Nucleic acid promoter fragments of the promoter region homologous to the em gene of wheat, dna constructs therefrom and plants thereof
AU3756889A (en) 1988-06-01 1990-01-05 The Texas A & M University System Method for transforming plants via the shoot apex
DE3843628A1 (de) 1988-12-21 1990-07-05 Inst Genbiologische Forschung Wundinduzierbare und kartoffelknollenspezifische transkriptionale regulation
AU638448B2 (en) 1989-03-17 1993-07-01 E.I. Du Pont De Nemours And Company External regulation of gene expression
US5106739A (en) 1989-04-18 1992-04-21 Calgene, Inc. CaMv 355 enhanced mannopine synthase promoter and method for using same
EP0409625A1 (en) 1989-07-19 1991-01-23 Calgene, Inc. Fruit-specific transcriptional factors
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
GB9005772D0 (en) 1990-03-14 1990-05-09 Cambridge Advanced Tech Plant promoter
DE69132725T2 (de) 1990-03-16 2002-07-11 Calgene Llc Davis Neue sequenzen vorzugsweise exprimiert während der frühen keimentwicklung und darauf bezogene methoden
US5451513A (en) 1990-05-01 1995-09-19 The State University of New Jersey Rutgers Method for stably transforming plastids of multicellular plants
US5187267A (en) 1990-06-19 1993-02-16 Calgene, Inc. Plant proteins, promoters, coding sequences and use
CA2083948C (en) 1990-06-25 2001-05-15 Ganesh M. Kishore Glyphosate tolerant plants
US5225341A (en) 1990-07-19 1993-07-06 The Regents Of The University Of California Biologically safe plant transformation system using a ds transposon
US5639949A (en) 1990-08-20 1997-06-17 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5641664A (en) 1990-11-23 1997-06-24 Plant Genetic Systems, N.V. Process for transforming monocotyledonous plants
GB9105420D0 (en) 1991-03-14 1991-05-01 Ici Plc Expression of genes in transgenic plants
GB9114259D0 (en) 1991-07-02 1991-08-21 Ici Plc Plant derived enzyme and dna sequences
KR100238904B1 (ko) 1991-08-01 2000-01-15 데이비드 알 맥기 재조합 식물 비루스 핵산
DK152291D0 (da) 1991-08-28 1991-08-28 Danisco Fremgangsmaade og kemiske forbindelser
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
US5593874A (en) 1992-03-19 1997-01-14 Monsanto Company Enhanced expression in plants
PT637339E (pt) 1992-04-13 2002-03-28 Syngenta Ltd Construcoes de adn e plantas que as incorporam
US5428148A (en) 1992-04-24 1995-06-27 Beckman Instruments, Inc. N4 - acylated cytidinyl compounds useful in oligonucleotide synthesis
WO1994000977A1 (en) 1992-07-07 1994-01-20 Japan Tobacco Inc. Method of transforming monocotyledon
EP0689594A1 (en) 1993-03-22 1996-01-03 Zeneca Limited Dna, dna constructs, cells and plants derived therefrom
GB9310177D0 (en) * 1993-05-18 1993-06-30 Cambridge Advanced Tech Cell specific necrosis
ATE267870T1 (de) 1993-09-03 2004-06-15 Japan Tobacco Inc Verfahren zur transformation von monocotyledonen mittels des schildes von unreifen embryonen
US5470353A (en) 1993-10-20 1995-11-28 Hollister Incorporated Post-operative thermal blanket
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
KR100386337B1 (ko) 1993-12-09 2004-03-24 토마스 제퍼슨 대학교 진핵세포에서부위-특이적돌연변이를위한화합물과그방법
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
US5545817A (en) 1994-03-11 1996-08-13 Calgene, Inc. Enhanced expression in a plant plastid
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
GB9421286D0 (en) 1994-10-21 1994-12-07 Danisco Promoter
US5879941A (en) 1995-10-06 1999-03-09 University Of Florida Polypeptides and polynucleotides relating to the α-and β-subunits of a glutamate dehydrogenase and methods of use
ATE333431T1 (de) 1995-10-17 2006-08-15 Inventio Ag Sicherheitseinrichtung für eine aufzugsgruppe
US5693512A (en) 1996-03-01 1997-12-02 The Ohio State Research Foundation Method for transforming plant tissue by sonication
BR9707948A (pt) 1996-03-06 1999-07-27 Univ Rutgers Processo para obter plantas transplastômicas
AR006928A1 (es) 1996-05-01 1999-09-29 Pioneer Hi Bred Int Una molecula de adn aislada que codifica una proteina fluorescente verde como marcador rastreable para la transformacion de plantas, un metodo para laproduccion de plantas transgenicas, un vector de expresion, una planta transgenica y celulas de dichas plantas.
IN1997CH00924A (en) 1996-05-03 2005-03-04 Syngenta Mogen Bv Regulating metabolism by modifying the level of trehalose-6-phosphate
DE19619353A1 (de) 1996-05-14 1997-11-20 Bosch Gmbh Robert Verfahren zur Herstellung eines integriert optischen Wellenleiterbauteiles sowie Anordnung
US6420629B1 (en) 1996-09-09 2002-07-16 B.C. Research Inc. Process of increasing plant growth and yield and modifying cellulose production in plants
US6025192A (en) 1996-09-20 2000-02-15 Cold Spring Harbor Laboratory Modified retroviral vectors
US6255071B1 (en) 1996-09-20 2001-07-03 Cold Spring Harbor Laboratory Mammalian viral vectors and their uses
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
US5955361A (en) 1996-11-20 1999-09-21 Pioneer Hi-Bred International, Inc. P gene promoter constructs for floral-tissue preferred gene expression
WO1998026045A1 (en) 1996-12-13 1998-06-18 The General Hospital Corporation Stress-protected transgenic plants
US5998701A (en) 1997-06-04 1999-12-07 Her Majesty The Queen In Right Of Canada As Represented By The Department Of Agriculture Potatoes having improved quality characteristics and methods for their production
GB9706381D0 (en) * 1997-03-27 1997-05-14 Cambridge Advanced Tech Improvements relating to the specificity of gene expression
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
EP0870836A1 (de) 1997-04-09 1998-10-14 IPK Gatersleben 2-Desoxyglucose-6-Phosphat (2-DOG-6-P) Phosphatase DNA-Sequenzen als Selektionsmarker in Pflanzen
CA2288672A1 (en) 1997-05-02 1998-11-12 Mogen International N.V. Regulating metabolism by modifying the level of trehalose-6-phosphate by inhibiting endogenous trehalase levels
US5929300A (en) 1997-07-15 1999-07-27 The United States Of America As Represented By The Secretary Of Agriculture Pollen-based transformation system using solid media
ZA986308B (en) 1997-07-18 1999-11-24 Pioneer Hi Bred Int The induction of stress-related factors in plants.
WO1999005902A1 (en) 1997-07-30 1999-02-11 Purdue Research Foundation Transgenic plants tolerant of salinity stress
EP1564296A1 (en) 1997-08-01 2005-08-17 Performance Plants, Inc. Stress tolerance and delayed senescence in plants
EP1019517B2 (en) 1997-09-30 2014-05-21 The Regents of The University of California Production of proteins in plant seeds
US5994624A (en) 1997-10-20 1999-11-30 Cotton Incorporated In planta method for the production of transgenic plants
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
US6429293B1 (en) 1998-06-26 2002-08-06 Hsc Research And Development Limited Partnership Sculpin-type antifreeze polypeptides and nucleic acids
US6759236B1 (en) 1998-08-18 2004-07-06 Research Development Foundation Methods to enhance and confine expression of genes
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
DE19852195C2 (de) 1998-11-04 2000-11-02 Inst Pflanzengenetik & Kultur Neue Expressionskassette zur Expression von beliebigen Genen in Pflanzensamen
FR2794772B1 (fr) * 1999-06-10 2001-09-21 Agronomique Inst Nat Rech Promoteur permettant l'expression de transgenes dans toute la plante hormis dans la graine
US20010049828A1 (en) 2000-04-12 2001-12-06 Orosz Charles G. Genetic system for controlling background expression of transgene products
WO2002006451A1 (en) 2000-07-18 2002-01-24 Uab Research Foundation Tissue-specific self-inactivating gene therapy vector
EP1343875B1 (en) 2000-12-22 2012-02-29 CropDesign N.V. Sugar beet genes involved in stress tolerance
CA2349506C (en) 2001-06-14 2009-12-08 Duke University A method for selective expression of therapeutic genes by hyperthermia
AU2002319285A1 (en) 2001-07-13 2003-03-03 Sungene Gmbh And Co. Kgaa Expression cassettes for transgenically expressing selection markers
GB0201043D0 (en) 2002-01-17 2002-03-06 Swetree Genomics Ab Plants methods and means
PT1504126E (pt) * 2002-05-03 2014-06-02 Univ Duke Um método para regular a expressão génica
AU2003254052B2 (en) * 2002-07-19 2008-06-12 University Of South Carolina Compositions and methods for the modulation of gene expression in plants
WO2004085623A2 (en) 2003-03-24 2004-10-07 University Of Pittsburgh Of The Commonwealth System Of Higher Education A compact synthetic expression vector comprising double-stranded dna molecules and methods of use thereof
US20050144669A1 (en) * 2003-07-01 2005-06-30 Whitehead Institute For Biomedical Research MicroRNAs in plants
US20060218673A9 (en) * 2003-10-09 2006-09-28 E.I. Du Pont De Nemours And Company Gene silencing
EP2765189A1 (en) 2004-12-21 2014-08-13 Monsanto Technology LLC Recombinant DNA constructs and methods for controlling gene expression
CA2593238C (en) * 2005-01-07 2014-11-18 State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of Oregon State University Method to trigger rna interference
EP1907549A1 (en) 2005-06-17 2008-04-09 Pioneer-Hi-Bred International, Inc. Methods and compositions for gene silencing
CA2625031C (en) * 2005-10-13 2016-07-19 Monsanto Technology Llc Methods for producing hybrid seed
CN104661454A (zh) 2013-11-22 2015-05-27 鸿富锦精密工业(深圳)有限公司 保护壳及触控电子装置

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012143805A1 (en) * 2011-04-21 2012-10-26 Basf Plant Science Company Gmbh Methods of modifying lignin biosynthesis and improving digestibility
WO2013053070A1 (en) * 2011-10-09 2013-04-18 Shanghai Institutes For Biological Sciences, Cas Heat tolerance microrna
CN102676525A (zh) * 2012-05-17 2012-09-19 复旦大学 水稻miR399d 及其应用
CN104994724A (zh) * 2012-12-18 2015-10-21 洛克菲勒大学 基因沉默
CN113430295A (zh) * 2013-10-31 2021-09-24 保尔·萨巴梯埃图卢兹第三大学 微肽及其用于调节基因表达的用途
CN105528532A (zh) * 2014-09-30 2016-04-27 深圳华大基因科技有限公司 一种rna编辑位点的特征分析方法
CN104830859B (zh) * 2015-04-24 2017-10-10 浙江大学 一种茶树miRNA及其应用
CN104830859A (zh) * 2015-04-24 2015-08-12 浙江大学 一种茶树miRNA及其应用
CN108588069B (zh) * 2018-03-07 2021-11-30 承德医学院 桑树miR171a的前体基因及其在增强植物耐盐性中的应用
CN108588069A (zh) * 2018-03-07 2018-09-28 承德医学院 桑树miR171a的前体基因及其在增强植物耐盐性中的应用
CN109234305A (zh) * 2018-07-16 2019-01-18 浙江理工大学 一种棉花性状改良的方法
CN110295169A (zh) * 2019-06-27 2019-10-01 江西省农业科学院农业应用微生物研究所(江西省农村能源研究中心) 一种miRNA及其用于杀灭褐飞虱的应用
CN110295169B (zh) * 2019-06-27 2022-11-08 江西省农业科学院农业应用微生物研究所(江西省农村能源研究中心) 一种miRNA及其用于杀灭褐飞虱的应用
CN110423749A (zh) * 2019-07-17 2019-11-08 中国农业科学院棉花研究所 棉花纤维长度相关microRNA160及其前体DNA和应用
CN110476817A (zh) * 2019-09-29 2019-11-22 上海市农业科学院 一种鸢尾辐射诱变剂量筛选方法
CN110714013A (zh) * 2019-09-29 2020-01-21 南京农业大学 大豆E2泛素结合酶基因GmUBC1的应用
CN110982921A (zh) * 2019-12-13 2020-04-10 南京林业大学 春兰miR159a在加快植物生命周期中的应用
CN111249299A (zh) * 2020-03-31 2020-06-09 南京财经大学 大豆rna提取物在制备预防及治疗肠炎的药物中的应用
CN111249299B (zh) * 2020-03-31 2022-03-22 南京财经大学 大豆rna提取物在制备预防及治疗肠炎的药物中的应用
CN112007043A (zh) * 2020-08-24 2020-12-01 谢琦 抗结直肠癌的药物或组合物
CN112007043B (zh) * 2020-08-24 2021-07-20 谢琦 抗结直肠癌的药物或组合物
CN113430197A (zh) * 2021-05-17 2021-09-24 西北农林科技大学 促进砧木根系发育及抗旱的可移动miRNA及鉴定方法
CN113430197B (zh) * 2021-05-17 2022-07-29 西北农林科技大学 促进砧木根系发育及抗旱的可移动miRNA及鉴定方法
CN113603747A (zh) * 2021-08-27 2021-11-05 上海交通大学 由Pri-miRNA编码的多肽在提高葡萄抗寒性能中的应用
CN113603747B (zh) * 2021-08-27 2023-11-07 上海交通大学 由Pri-miRNA编码的多肽在提高葡萄抗寒性能中的应用

Also Published As

Publication number Publication date
CN101203611B (zh) 2013-08-14
AU2006237317B2 (en) 2011-03-24
AU2006237317B8 (en) 2011-05-12
CA2604807C (en) 2018-06-12
BRPI0608829A2 (pt) 2011-03-15
US9085774B2 (en) 2015-07-21
IL186542A0 (en) 2008-01-20
EP1874936A1 (en) 2008-01-09
ZA200709897B (en) 2009-03-25
CA2604807A1 (en) 2006-10-26
WO2006111512A1 (en) 2006-10-26
AU2006237317A1 (en) 2006-10-26
US10676752B2 (en) 2020-06-09
US20160152994A1 (en) 2016-06-02
US20090293148A1 (en) 2009-11-26
EP1874936B1 (en) 2013-10-30

Similar Documents

Publication Publication Date Title
CN101203611B (zh) 控制基因表达的改良方法
CN102597237B (zh) 在胚乳的胚乳基部传递层中有效的植物启动子及其应用
CN101128591B (zh) 用于植物中种子偏好性表达的表达盒
CN101268194A (zh) 使用ta-siRNA调控基因表达的方法
KR20090119910A (ko) 외떡잎 식물에서 배-특이적 발현의 조절을 위한 핵산 서열
CN101379080B (zh) 用于产生胚中具有母体基因组的全二倍体组的种子的核酸和方法
CN102575249B (zh) 胚乳中有效的植物启动子及其用途
CN114846022A (zh) 通过阻抑基因的下调增强作物的疾病抗性
BR112020015033A2 (pt) Composições e métodos para aprimorar os rendimentos de cultura através do empilhamento de traços
EP1681347A1 (en) Improved methods for double-stranded RNA mediated gene silencing
AU2017234920A1 (en) Methods and compositions for producing clonal, non-reduced, non-recombined gametes
KR101206928B1 (ko) 배추속 식물의 자가불화합성 인자에 대한 rna 간섭 카세트, 그를 포함하는 벡터 및 상기 rna 간섭 카세트가 도입된 형질전환 배추속 식물
CN108409844A (zh) 蛋白质TaNRT2.5在调控植物产量中的应用
CN102131932A (zh) 人工植物微染色体
CN110734917B (zh) 一种长筒石蒜LlDFRc基因及其表达的蛋白和应用
CN110747179B (zh) 一种长筒石蒜LlDFRb基因及其表达的蛋白和应用
CN104805100B (zh) 水稻基因OsSμBP‑2在延缓植物叶片衰老中的应用
CN108424911B (zh) 种子特异性双向启动子及其应用
WO2004070035A2 (en) Method for increasing efficiency of homologous recombination in plants
KR101730071B1 (ko) 식물 종자의 호분층 또는 배 특이적 OsDOG1L2 프로모터 및 이의 용도
DE10225066A1 (de) Neue Expressionssysteme für Pflanzen
JP5266489B2 (ja) ジーンサイレンシング抑制技術
REN et al. Patent 2604807 Summary
KR101630837B1 (ko) 밀(Triticum asetivum) 유래의 글루테닌 단백질 유전자(TaGlu-Dy10)가 도입된 항생제 마커프리 형질전환 벼
CN117660524A (zh) 利用基因编辑技术创制甜玉米种质的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant