CN102573451A - 具有增加的生物质的转基因植物 - Google Patents

具有增加的生物质的转基因植物 Download PDF

Info

Publication number
CN102573451A
CN102573451A CN2010800417787A CN201080041778A CN102573451A CN 102573451 A CN102573451 A CN 102573451A CN 2010800417787 A CN2010800417787 A CN 2010800417787A CN 201080041778 A CN201080041778 A CN 201080041778A CN 102573451 A CN102573451 A CN 102573451A
Authority
CN
China
Prior art keywords
seq
plant
sequence
nucleic acid
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800417787A
Other languages
English (en)
Inventor
吴传银
金汉宿
G.马格潘泰
周发松
J.索萨
G.纳德赞
R.I.彭内尔
M.阿西里洛艾尔
王五一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ceres Inc
Original Assignee
Ceres Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ceres Inc filed Critical Ceres Inc
Publication of CN102573451A publication Critical patent/CN102573451A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

公开了用于调控植物中的生物质水平的方法和材料。例如,公开了编码生物质调控多肽的核酸及使用所述核酸来转化植物细胞的方法。还公开了具有升高的生物质水平的植物和从具有升高的生物质水平的植物生成的植物产物。

Description

具有增加的生物质的转基因植物
对相关申请的交叉引用
本申请要求2009年7月20日提交的美国临时申请流水号61/226,969的权益。通过提及而完整收录在先申请的公开内容。
技术领域
本文件涉及调控植物生物质(biomass)水平中牵涉的方法和材料。例如,本文件提供了具有升高的生物质水平的植物及用于生成具有升高的生物质水平的植物和植物产物的材料和方法。
发明背景
本发明涉及增加植物中的生物质的方法及由此生成的植物。具有增加的和/或改善的生物质的植物可用于农业、园艺学、生物质向能量的转换、纸生产、植物产物生产、和其它产业。具体地,需要专用的能量作物诸如柳枝稷(Panicum virgatum L.,switchgrass)、奇岗(Miscanthus x gigantus)(芒(miscanthus))、高粱(Sorghum sp.)和甘蔗(Saccharum sp.,sugar cane)的生物质增加。在整个人类历史中,供食物和燃料两者用的植物生物质增加对于维持和提高人口水平是至关重要的。科学家不断努力改善农业作物中的生物质。涉及增加植物生物质(特别地对于专用的能量作物)的大量研究指示在为人口提供可持续能量来源方面放置的重要性水平。目前的事件,诸如提高的油价强调开发可持续的且稳定的供能量用的植物生物质来源的紧迫性。由植物生成的生物质的量是一种受许多生物化学途径影响的数量性状。需要分子遗传方法来更快速地生成具有增加的生物质的植物。还需要生成更有效地生长并且在各种地理和/或气候环境中生成更多生物质的植物物种。会期望此类方法可适用于多种植物物种(Zhang等,Plant Physiol.135:615-621(2004))。尽管在分子遗传方法中有一些进展,还需要鉴定可以用于有效增加植物中的生物质的特定基因和/或序列。
发明概述
本文件提供了涉及具有受调控的生物质水平的植物的方法和材料。例如,本文件提供了具有升高的生物质水平的转基因植物和植物细胞、用于生成具有升高的生物质水平的转基因植物和植物细胞的核酸、用于生成具有升高的生物质水平的植物的方法、和用于生成可用于生成具有升高的生物质水平的植物的植物细胞的方法。可以培养此类植物和植物细胞以生成例如具有增加的高度、增加的分蘖数、或增加的干重的植物。具有升高的生物质水平的植物可用于生成供食物和饲料用的生物质,其可以使人和动物两者受益。具有升高的生物质水平的植物可用于将此类生物质转化成液体燃料(例如乙醇)、或其它化学品,或者可以用作热化学燃料。
本文中提供了生成具有增加的生物质的植物的方法。在一方面,方法包括培养包含外源核酸的植物细胞。所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区。多肽的氨基酸序列的隐马尔可夫模型(HiddenMarkov Model,HMM)比特得分大于约130,340,530,120,635,65,100,480,145,280或1000,其分别使用自图1,2,3,4,5,6,7,8,9,10或11之一中所描绘的氨基酸序列生成的HMM得到。与不包含外源核酸的对照植物的生物质的相应水平相比,所述植物具有生物质水平的差异。
在另一方面,方法包括培养包含外源核酸的植物细胞。所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,所述多肽与下组中所列的氨基酸序列具有80%或更大的序列同一性:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695或697。可以使用从植物细胞生成的植物来生成如下的植物,其与不包含外源核酸的对照植物的生物质的相应水平相比具有生物质水平的差异。
在另一方面,方法包括培养包含外源核酸的植物细胞。所述外源核酸包含与核苷酸序列可操作连接的调节区,所述核苷酸序列与下组中所列的核苷酸序列或其片段具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694或696。与不包含外源核酸的对照植物的生物质的相应水平相比,从植物细胞生成的植物具有生物质水平的差异。
本文中提供了调控植物中的生物质水平的方法。在一方面,方法包括将外源核酸导入植物细胞中,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区。多肽的氨基酸序列的HMM比特得分大于约130,340,530,120,635,65,100,480,145,280或1000,其分别使用自图1,2,3,4,5,6,7,8,9,10或11之一中所描绘的氨基酸序列生成的HMM得到。与不包含外源核酸的对照植物的生物质的相应水平相比,从植物细胞生成的植物具有生物质水平的差异。
在某些实施方案中,使用自图2中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约340,其中多肽包含与SEQ ID NO:263的残基130至192,或序列表中鉴定的Dof域锌指具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的Dof域锌指。
在某些实施方案中,使用自图3中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约530,其中多肽包含与SEQ ID NO:117的残基44至208,或序列表中鉴定的植物螯合肽合成酶样域具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的植物螯合肽(pytochelatin)合成酶样域。
在某些实施方案中,使用自图4中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约120,其中多肽包含与SEQ ID NO:1的残基32至83,或序列表中鉴定的AP2域具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的AP2域。
在某些实施方案中,使用自图5中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约635,其中多肽包含与SEQ ID NO:645的残基88至453,或序列表中鉴定的氨基转移酶I和II类域具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的氨基转移酶I和II类域。
在某些实施方案中,使用自图7中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约100,其中多肽包含与SEQ ID NO:323的残基13至62,或序列表中鉴定的Myb样DNA结合域具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的Myb样DNA结合域。
在某些实施方案中,使用自图8中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约480,其中多肽包含与SEQ ID NO:595的残基35至257具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的alpha/beta水解酶折叠域。
在某些实施方案中,使用自图9中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约145,其中多肽包含与SEQ ID NO:77的残基57至129,或序列表中所鉴定的RALF域具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的快速碱化因子(RALF)域。
在某些实施方案中,使用自图10中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约280,其中多肽包含与SEQ ID NO:209的残基19至152,或序列表中所鉴定的DUF640域具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的未知功能(DUF640)域的蛋白质。
在某些实施方案中,使用自图11中所描绘的氨基酸序列生成的HMM,多肽的氨基酸序列的HMM得分大于约1000,其中多肽包含与SEQ ID NO:426的残基100至509,或序列表中所鉴定的POT家族域具有至少60%或更大(例如,65,70,75,80,85,90,95,99,或100%)序列同一性的POT家族域。
在另一方面,方法包括将外源核酸导入植物细胞中,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,所述多肽与下组中所列的氨基酸序列具有80%或更大序列同一性:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695或697。与不包含外源核酸的对照植物的生物质的相应水平相比,从植物细胞生成的植物具有生物质水平的差异。任何上述方法中的多肽可以具有下组中所列的氨基酸序列:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695或697。
在另一方面,方法包括将外源核酸导入植物细胞中,所述外源核酸包含与核苷酸序列可操作连接的调节区,所述核苷酸序列与下组中所列的核苷酸序列或其片段具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694或696。与不包含外源核酸的对照植物的生物质的相应水平相比,从植物细胞生成的植物具有生物质水平的差异。
本文中提供了包含外源核酸的植物细胞。在一方面,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区。使用基于图1,2,3,4,5,6,7,8,9,10,或11之一中所描绘的氨基酸序列的HMM,多肽的氨基酸序列的HMM比特得分大于约130,340,530,120,635,65,100,480,145,280,或1000。与不包含外源核酸的对照植物的生物质的相应水平相比,植物具有生物质水平的差异。在另一方面,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,所述多肽与选自下组的氨基酸具有80%或更大的序列同一性:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695,或697。与不包含外源核酸的对照植物的生物质的相应水平相比,从植物细胞生成的植物具有生物质水平的差异。在另一方面,所述外源核酸包含与核苷酸序列可操作连接的调节区,所述核苷酸序列与选自下组的核苷酸序列或其片段具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,或696。与不包含外源核酸的对照植物的生物质的相应水平相比,从植物细胞生成的植物具有生物质水平的差异。还提供了包含此类植物细胞的转基因植物。还提供了植物生物质或种子产物。该产物包含来自本文中所描述的转基因植物的营养或胚组织。
还提供了分离的核酸。在一方面,分离的核酸包含与下组中所列的核苷酸序列具有80%或更大序列同一性的核苷酸序列:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,或696。在另一方面,分离的核酸包含编码多肽的核苷酸序列,所述多肽与下组中所列的氨基酸序列具有80%或更大的序列同一性:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695,或697。
在另一方面,提供了鉴定与生物质水平变化有关的遗传多态性的方法。该方法包括提供植物群体,并测定群体中的一种或多种遗传多态性是否与选自下组的多肽的基因座遗传连锁:图1-11中所描绘的多肽及其功能同系物。测量该群体的植物中的组织生物质水平变化与群体的植物中的一种或多种遗传多态性的存在之间的关联,由此容许鉴定一种或多种遗传多态性是否与此类变化有关。
在另一方面,提供了生成植物系的方法。该方法包括测定植物群体中的一种或多种遗传多态性是否与图1-11中所描绘的一种或多种多肽及此类多肽的功能同系物的基因座有关。鉴定所述群体中的一个或多个植物,其中至少一种所述遗传多态性的存在与生物质性状变化有关。上文所描述的步骤可以以任意次序实施。然后,将一个或多个鉴定的植物与自身或不同植物杂交以产生种子,并将至少一个自所述种子种植的后代植物与自身或不同植物杂交。将自交和异型杂交的步骤再重复0-5代以生成至少一种多态性的植物系。生物质性状可以是干物质产量,而植物群体可以是柳枝稷植物。
本文件的特征还在于一种改变植物中的生物质水平的方法。该方法包括修饰内源生物质调控核酸,所述核酸包含具有可读框的核苷酸序列,其与选自下组的核苷酸序列具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,和696。与所述核酸尚未修饰的对照植物的相应水平相比,所述植物具有生物质水平的差异。可以通过在包含所述核酸的基因座中引入遗传修饰来实现所述修饰。所述方法可以进一步包括选择具有改变的生物质的植物。
在一些实施方案中,所述内源核酸编码与选自下组的氨基酸序列具有80%或更大序列同一性的多肽:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695,和697。
在一些实施方案中,所述内源核酸包含具有可读框的核苷酸序列,其与选自下组的核苷酸序列具有90%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,和696。
在一些实施方案中,所述外源核酸包含具有可读框的核苷酸序列,其与选自下组的核苷酸序列具有95%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,和696。
本文件的特征还在于一种生成植物的方法。该方法包括培养含有编码多肽的经修饰的内源核酸的植物细胞,其中所述多肽的氨基酸序列的HMM比特得分大于约65,所述HMM基于图1-11之一中描绘的氨基酸序列,且其中与所述核酸尚未修饰的对照植物的相应水平相比,所述植物具有生物质水平的差异。
在另一方面,本文件的特征在于含有编码多肽的经修饰的内源核酸的植物细胞,其中所述多肽的氨基酸序列的HMM比特得分大于约65,所述HMM基于图1-11之一中描绘的氨基酸序列,且其中与所述核酸尚未修饰的对照植物的相应水平相比,从植物细胞生成的植物具有生物质水平的差异。
本文件的特征还在于含有经修饰的生物质调控内源核酸的植物细胞。所述核酸包含具有可读框的核苷酸序列,其与选自下组的核苷酸序列具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,和696。与所述核酸尚未修饰的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
在本文中所描述的植物细胞中,所述内源核酸可以编码与选自下组的氨基酸序列具有80%或更大序列同一性的多肽:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695,和697,且其中与所述核酸尚未修饰的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
在另一方面,本文件的特征在于一种调控植物中的生物质水平的方法。该方法包括将外源核酸导入植物细胞中,所述外源核酸编码具有E.C.2.6.1.83活性的多肽。
植物细胞的特征还在于包含外源核酸,其中所述外源核酸编码具有E.C.2.6.1.83活性的多肽,且其中与不包含所述核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
除非另有定义,本文中所使用的所有技术和科学术语与本发明所属领域中的普通技术人员的通常理解具有相同的含义。虽然与本文所描述的方法和材料类似或等同的方法和材料可以用于实施本发明,下文描述了合适的方法和材料。通过提及而完整收录本文中所提及的所有出版物、专利申请、专利、和其它参考文献。在矛盾的情况中,应以本说明书(包括定义)为准。另外,材料、方法、和例子仅是例示性的,而并不意图为限制性的。
在下文的附图和描述中列出本发明的一个或多个实施方案的详情。从描述和图看,及从权利要求书看,本发明的其它特征、目标、和优点会是显而易见的。依照专利法的标准实践,权利要求书中的词语“包含”可以用“基本上由...组成”或“由...组成”替换。
附图简述
图1是与Ceres Clone:1384304(SEQ ID NO:554)对应的氨基酸序列CW00733与同源和/或直向同源氨基酸序列的比对。在本文中显示的所有比对图中,比对序列中的短划线代表缺口,即在该位置缺乏氨基酸。比对序列中相同的氨基酸或保守的氨基酸取代通过框来鉴定。使用程序MUSCLE第3.52版来产生图1及本文中提供的其它比对图。
图2是与Ceres Annot:544549(SEQ ID NO:263)对应的氨基酸序列CW00319与同源和/或直向同源氨基酸序列的比对。
图3是与Ceres Annot:1355066(SEQ ID NO:117)对应的氨基酸序列CW00710与同源和/或直向同源氨基酸序列的比对。
图4是与Os01g58420(SEQ ID NO:1)的反义序列对应的氨基酸序列CW00628与同源和/或直向同源氨基酸序列的比对。
图5是与Ceres Clone:625057(SEQ ID NO:645)对应的氨基酸序列CW00297与同源和/或直向同源氨基酸序列的比对。
图6是与Ceres Clone:1356785(SEQ ID NO:253)对应的氨基酸序列CW00604与同源和/或直向同源氨基酸序列的比对。
图7是与Ceres Clone:638126(SEQ ID NO:323)对应的氨基酸序列CW00564与同源和/或直向同源氨基酸序列的比对。
图8是与Ceres Clone:26006(SEQ ID NO:595)对应的氨基酸序列CW00010与同源和/或直向同源氨基酸序列的比对。
图9是与Ceres Clone:4831(SEQ ID NO:77)对应的氨基酸序列CW00469与同源和/或直向同源氨基酸序列的比对。
图10是与Ceres Annot:847799(SEQ ID NO:209)对应的氨基酸序列CW00536与同源和/或直向同源氨基酸序列的比对。
图11是与Ceres Annot:878355(SEQ ID NO:426)对应的氨基酸序列CW00191与同源和/或直向同源氨基酸序列的比对。
发明详述
本发明的特征在于涉及调控植物中的生物质水平的方法和材料。在一些实施方案中,植物也可以具有受调控的例如木质素水平、经修饰的根结构、经修饰的除草剂抗性、经修饰的类胡萝卜素生物合成、或受调控的细胞壁含量。所述方法可以包括用编码生物质调控多肽的核酸转化植物细胞,其中所述多肽的表达导致受调控的生物质水平。可以培养使用此类方法生成的植物细胞以生成具有增加或减少的生物质的植物。可以使用此类植物和此类植物的种子来生成例如具有增加价值的生物质作为生物燃料给料。
I.定义:
“氨基酸”指二十种生物学存在的氨基酸之一和合成的氨基酸,包括D/L旋光异构体。
“细胞类型优先性启动子”或“组织优先性启动子”指分别优先在靶细胞类型或组织中驱动表达,但是也能导致在其它细胞类型或组织中的一些转录的启动子。
“对照植物”指不含感兴趣的转基因植物中存在的外源核酸,但是在其它方面与所述转基因植物具有相同或类似的遗传背景的植物。合适的对照植物可以是非转基因野生型植物、来自转化实验的非转基因分离子、或含有与感兴趣的外源核酸不同的外源核酸的转基因植物。
“域/结构域”是多肽中可以用于表征蛋白质家族和/或蛋白质的一部分的基本上连续的氨基酸的组。此类结构域具有“指纹”或“标志(signature)”,其可以包含保守的一级序列、二级结构、和/或三维构象。一般地,结构域与特定的体外和/或体内活性相关联。结构域可以具有10个氨基酸至400个氨基酸,例如10个至50个氨基酸,或25个至100个氨基酸,或35个至65个氨基酸,或35个至55个氨基酸,或45个至60个氨基酸,或200个至300个氨基酸,或300个至400个氨基酸的长度。
“下调”指相对于基础或天然状态,降低表达产物(mRNA、多肽、或这两者)生成的调节。
“外源的”就核酸而言指明核酸是重组核酸构建体的一部分,但是不在其天然环境中。例如,外源核酸可以是从一个物种导入另一个物种中的序列,即异源核酸。通常,经由重组核酸构建体将所述外源核酸导入另一物种中。外源核酸也可以是如下的序列,其对于生物体而言是天然的,而且已经再导入所述生物体的细胞中。包括天然序列的外源核酸常常可以通过与外源核酸连接的非天然序列(例如重组核酸构建体中的天然序列侧翼的非天然调节序列)的存在来与天然存在的序列相区别。另外,稳定转化的外源核酸通常在与找到天然序列的位置不同的位置处整合。要领会的是,已经可以将外源核酸导入祖先中,而不导入所考虑的细胞中。例如,含有外源核酸的转基因植物可以是稳定转化的植物和非转基因植物之间的杂交后代。认为此类后代含有外源核酸。
“表达”指经由转录(其通过酶,即RNA聚合酶催化)将多核苷酸的遗传信息转化成RNA及通过在核糖体上翻译mRNA而转化成蛋白质的过程。
如本文中所使用的,“异源多肽”指这样的多肽,其不是植物细胞(例如用来自玉蜀黍(Zea mays)植物的氮转运体多肽的编码序列转化并表达该编码序列的转基因柳枝稷植物(Panicum virgatum))中天然存在的多肽。
如本文中所使用的,“分离的核酸”包括天然存在的核酸,只要除去或缺乏其天然存在的基因组中刚好在所述核酸侧翼的序列中的一个或两个。如此,分离的核酸包括但不限于作为纯化的分子或者掺入载体或病毒中的核酸分子存在的核酸。认为在例如cDNA文库、基因组文库、或含有基因组DNA限制性消化物的凝胶切片内的几百至几百万个其它核酸中存在的核酸不是分离的核酸。
生物质水平的“调控”指由于植物细胞和/或植物中外源核酸的表达或自外源核酸的转录而观察到的生物质水平的变化。相对于对照植物中的相应水平来测量水平变化。
“核酸”和“多核苷酸”在本文中可互换使用,指RNA和DNA两者,包括cDNA、基因组DNA、合成的DNA、和含有核酸类似物的DNA或RNA。核酸可以是双链或单链(即有义链或反义链)。多核苷酸的非限制性例子包括基因、基因片段、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、siRNA、微小RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、核酸探针和核酸引物。多核苷酸可以含有非常规的或经修饰的核苷酸。
“可操作连接的”指调节区与要转录的序列在核酸中的如下定位,使得所述调节区对于调节序列的转录或翻译是有效的。例如,为了可操作连接编码序列与调节区,编码序列的翻译阅读框的翻译起始位点通常位于调节区下游1-约50个核苷酸。然而,调节区可以位于翻译起始位点上游多至约5,000个核苷酸,或者转录起始位点上游约2,000个核苷酸。
如本文中所使用的,“多肽”指两个或更多个亚基氨基酸、氨基酸类似物、或其它肽模拟物(peptidomimetic)的化合物,不管翻译后修饰,例如磷酸化或糖基化。亚基可以通过肽键或其它键(诸如例如酯或醚键)连接。此定义涵盖全长多肽、截短的多肽、点突变体、插入突变体、剪接变体、嵌合蛋白、及其片段。
“后代”包括特定植物或植物系的后代。本植物的后代包括在F1、F2、F3、F4、F5、F6和后续世代植物上形成的种子、或在BC1、BC2、BC3和后续世代植物上形成的种子、或在F1BC1、F1BC2、F1BC3和后续世代植物上形成的种子。名称F1指遗传上独特的两个亲本之间的杂交后代。名称F2、F3、F4、F5和F6指F1植物的自花传粉或近缘授粉后代的后续世代。
“调节区”指具有影响转录或翻译起始和速率、和转录或翻译产物的稳定性和/或运动性的核苷酸序列的核酸。调节区包括但不限于启动子序列、增强子序列、应答元件、蛋白质识别位点、诱导元件、蛋白质结合序列、5’和3’非翻译区(UTR)、转录起始位点、终止序列、多腺苷酸化序列、内含子、及其组合。调节区通常至少包含核心(基础)启动子。调节区还可以包含至少一个控制元件,诸如增强子序列、上游元件或上游活化区(UAR)。例如,合适的增强子是来自章鱼碱合酶(ocs)基因上游区的顺式调节元件(-212至-154)。Fromm等,The Plant Cell,1:977-984(1989)。
“上调”指相对于基础或天然状态,提高表达产物(mRNA、多肽、这两者)水平的调节。
“载体”指可以在其中插入另一DNA区段,使得引起所插入的区段复制的复制子,诸如质粒、噬菌体、或粘粒。一般地,当与合适的控制元件联合时,载体能够复制。术语“载体”包括克隆和表达载体,以及病毒载体和整合载体。“表达载体”是包括调节区的载体。
II.多肽
本文中所描述的多肽包括生物质调控多肽。生物质调控多肽在植物或植物细胞中表达时可以有效调控生物质水平。此类多肽通常含有至少一个指示生物质调控多肽的域,如本文中更为详细描述的。生物质调控多肽通常具有大于65的HMM比特得分,如本文中更为详细描述的。在一些实施方案中,生物质调控多肽与下列各项具有大于80%的同一性:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695,或697,如本文中更为详细描述的。
A.指示生物质调控多肽的域
生物质调控多肽可以含有预测为生物质调控多肽特征性的Dof域-锌指(zf-Dof)。SEQ ID NO:263列出了预测为编码含有Dof域-锌指的多肽的拟南芥克隆(本文中称为Ceres Annot:544549(SEQ ID NO:262))的氨基酸序列。例如,生物质调控多肽可以包含与SEQ ID NO:263的残基130至192具有60%或更大序列同一性的Dof域-锌指。在一些实施方案中,生物质调控多肽可以包含与下组中所列的一个或多个多肽的Dof域-锌指具有60%或更大序列同一性的Dof域-锌指:SEQ ID NO:263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,或321。序列表中列出了此类序列的Dof域-锌指。锌指(Znf)域是相对较小的蛋白质基序,其结合一个或多个锌原子,并且其通常含有与其靶分子串联接触的多个指样突出。它们首次鉴定为来自非洲爪蟾(Xenopus laevis)的转录因子TFIIIA中的DNA结合基序,然而,现在公认它们结合DNA、RNA、蛋白质和/或脂质底物。它们的结合特性依赖于锌指域和锌指间接头的氨基酸序列及指的高级结构和数目。经常以簇找到Znf域,其中指可以具有不同结合特异性。存在着许多Znf基序超家族,其在序列和结构两方面都有所变化。它们在结合模式上展现出相当大的多能性(例如一些结合DNA,其它结合蛋白质),提示Znf基序是已经进化出专门功能的稳定支架。例如,基因转录、翻译、mRNA运输、细胞骨架组织、表皮发育、细胞粘着、蛋白质折叠、染色质重建和锌感测中的含有Znf的蛋白质功能,等等。锌结合基序是稳定的结构,并且它们在结合其靶物后很少经历构象变化。DOF 1.3直向同系物可以含有Dof域-锌指。
生物质调控多肽可以含有预测为生物质调控多肽特征性的植物螯合肽合成酶样域。SEQ ID NO:117列出了预测为编码含有植物螯合肽合成酶样域的多肽的拟南芥克隆(在本文中称为Ceres Annot:1355066(SEQ ID NO:116))的氨基酸序列。例如,生物质调控多肽可以包含与SEQ ID NO:117的残基44至208具有60%或更大的序列同一性的植物螯合肽合成酶样域。在一些实施方案中,生物质调控多肽可以包含植物螯合肽合成酶样域,其与下组中所列的一种或多种多肽的植物螯合肽合成酶样域具有60%或更大的序列同一性:SEQ ID NO:117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,或207。序列表中列出了此类序列的植物螯合肽合成酶样域。植物螯合肽合成酶样蛋白可以是一种负责自谷胱甘肽及相关硫醇合成重金属结合肽(植物螯合肽)的酶。酶通常催化GSH供体分子的脱甘氨酸化(deglycination)。酶通常含有半胱氨酸、组氨酸和天冬氨酸残基的催化三联体(catalytic triad)。
生物质调控多肽可以含有预测为生物质调控多肽特征性的AP2域。SEQID NO:1列出了预测为编码含有AP2域的多肽的稻(Oryza sativa)克隆(在本文中称为Os01g58420)的氨基酸序列。例如,生物质调控多肽可以包含与SEQ IDNO:1的残基32至83具有60%或更大序列同一性的AP2域。在一些实施方案中,生物质调控多肽可以包含与下组中所列的一种或多种多肽的AP2域具有具有60%或更大序列同一性的AP2域:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,或75。序列表中列出了此类序列的AP2域。在一些实施方案中,在植物中表达反义序列以调控生物质,如本文中所描述的。例如,可以在植物中表达Os01g58420的反义核酸序列诸如SEQ ID NO:678以调控生物质。AP2域氨基酸残基可以结合DNA,并且通常存在于转录因子蛋白中。
生物质调控多肽可以含有预测为生物质调控多肽特征性的氨基转移酶I和II类域。SEQ ID NO:645列出了预测为编码含有氨基转移酶I和II类域的多肽的大豆(Glycine max)克隆(在本文中称为Ceres Clone:625057(SEQ ID NO:644))的氨基酸序列。例如,生物质调控多肽可以包含与SEQ ID NO:645的残基88至453具有60%或更大序列同一性的氨基转移酶I和II类域。在一些实施方案中,生物质调控多肽可以包含与下组中所列的一种或多种多肽的氨基转移酶I和II类域具有60%或更大序列同一性的氨基转移酶I和II类域:SEQ IDNO:645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,或689。序列表中列出了此类序列的氨基转移酶I和II类域。氨基转移酶与其它吡哆醛磷酸依赖性酶共享某些机制特征,诸如吡哆醛磷酸基团与赖氨酸残基的共价结合。基于序列相似性,这些各种酶可以分组成I类和II类。包含氨基转移酶I和II类域的多肽的例子包括LL-DAP多肽(EC 2.6.1.83)(Watanabe等,Mechanism of Substrate Recognitionand PLP-induced Conformational Changes in LL-Diaminopimelateaminotransferase from Arabidopsis thaliana.J.Mol.Biol.384,1314-1329(2008))。LL-DAP催化LL-2,6-二氨基庚二酸和2-酮戊二酸与(S)-2,3,4,5-四氢吡啶-2,6-二羧酸、L-谷氨酸、和水的相互转化。
生物质调控多肽可以含有预测为生物质调控多肽特征性的Myb样DNA结合域。SEQ ID NO:323列出了预测为编码含有Myb样DNA结合域的多肽的大豆克隆(在本文中称为Ceres Clone:638126(SEQ ID NO:321))的氨基酸序列。例如,生物质调控多肽可以包含与SEQ ID NO:323的残基13至62具有60%或更大序列同一性的Myb样DNA结合域。在一些实施方案中,生物质调控多肽可以包含与下组中所列的一种或多种多肽的Myb样DNA结合域具有60%或更大序列同一性的Myb样DNA结合域:SEQ ID NO:323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,或424。序列表中列出了此类序列的Myb样DNA结合域。Myb样DNA结合域家族含有来自Myb蛋白的DNA结合域及SANT域家族。
生物质调控多肽可以含有预测为生物质调控多肽特征性的alpha/beta水解酶折叠域。SEQ ID NO:595列出了预测为编码含有alpha/beta水解酶折叠域的多肽的大豆克隆(在本文中称为Ceres Clone:26006(SEQ ID NO:594))的氨基酸序列。例如,生物质调控多肽可以包含与SEQ ID NO:595的残基35至257具有60%或更大序列同一性的alpha/beta水解酶折叠域。例如,生物质调控多肽可以包含与SEQ ID NO:595的残基35至257具有60%或更大序列同一性的alpha/beta水解酶折叠域。在一些实施方案中,生物质调控多肽可以包含与下组中所列的一种或多种多肽的alpha/beta水解酶折叠域具有60%或更大序列同一性的alpha/beta水解酶折叠域:SEQ ID NO:595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,或691。序列表中列出了此类序列的alpha/beta水解酶折叠域。alpha/beta水解酶折叠域是系统发生起源和催化功能广泛差异的许多水解酶共同的。每种酶的核心是alpha/beta-片层(而不是桶),其含有通过螺旋连接的8个股。认为该酶已经从共同的祖先趋异,保留催化残基的排布。所有都具有催化三联体,其元件在作为最好的保守折叠结构特征的环上携带。
生物质调控多肽可以含有预测为生物质调控多肽特征性的快速碱化因子(Rapid Alkalinization Factor,RALF)域。SEQ ID NO:77列出了预测为编码含有RALF域的多肽的拟南芥克隆(在本文中称为Ceres Clone:4831(SEQ ID NO:76))的氨基酸序列。例如,生物质调控多肽可以包含与SEQ ID NO:77的残基57至129具有60%或更大序列同一性的RALF域。在一些实施方案中,生物质调控多肽可以包含与下组中所列的一种或多种多肽的RALF域具有60%或更大序列同一性的RALF域:SEQ ID NO:77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,或115。序列表中列出了此类序列的RALF域。RALF域通常存在于植物中的5-kDa遍在多肽中,已经报告了所述多肽在一些植物的根生长和发育停滞中发挥作用。
生物质调控多肽可以含有预测为生物质调控多肽特征性的DUF640域。SEQ ID NO:209列出了预测为编码含有DUF640域的多肽的拟南芥克隆(在本文中称为Ceres Annot:847799(SEQ ID NO:208))的氨基酸序列。例如,生物质调控多肽可以包含与SEQ ID NO:209的残基19至152具有60%或更大序列同一性的DUF640域。在一些实施方案中,生物质调控多肽可以包含与下组中所列的一种或多种多肽的DUF640域具有60%或更大序列同一性的DUF640域:SEQ ID NO:209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,或251。序列表中列出了此类序列的DUF640域。
生物质调控多肽可以含有预测为生物质调控多肽特征性的PTR2 POT家族域。SEQ ID NO:426列出了预测为编码含有PTR2 POT家族域的多肽的拟南芥克隆(在本文中称为Ceres Annot:878355(SEQ ID NO:425))的氨基酸序列。例如,生物质调控多肽可以包含与SEQ ID NO:426的残基100至509具有60%或更大序列同一性的PTR2 POT家族域。在一些实施方案中,生物质调控多肽可以包含与下组中所列的一种或多种多肽的PTR2 POT家族域具有60%或更大序列同一性的PTR2 POT家族域:SEQ ID NO:426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,693,695,或697。序列表中列出了此类序列的PTR2 POT家族域。将肽转运到细胞中是一种充分证明的生物学现象,其是通过存在于与细菌和人一样多样的许多生物体中的特定的、能量依赖性转运体来实现的。PTR蛋白质家族与ABC型肽转运体不同,并且通过对许多最近发现的肽转运蛋白的序列分析来揭示。这些蛋白质似乎主要牵涉小肽的摄取及伴随的质子摄取。在一些实施方案中,如本文中所描述的POT蛋白可以包含N端信号肽。在一些实施方案中,信号肽可以是质膜特异性的。在一些实施方案中,信号肽可以是内质网膜或叶绿体膜特异性的。本申请的序列表中显示了信号肽的例子。可以采用生物信息学技术来预测转运肽的存在和类型。这些方法不仅依赖于序列相似性。因为直向同源蛋白更常具有相同定位,所以推断共定位需要的序列相似性程度高于相似三维结构的,并且相同蛋白质同等型(isoform)可以具有不同定位。可以使用WoLF PSORT来预测信号肽(Horton等,2007“WoLFPSORT:Protein Localization Predictor”,Nucleic Acids Research,doi:10.1093/nar/gkm259,2007;Horton等,2006“Protein SubcellularLocalization Prediction with WoLF PSORT”,第4届年度亚太生物信息学会议会刊(Proceedings of the 4th Annual Asia Pacific Bioinformatics ConferenceAPBC06)APBC06,Taipei,Taiwan.第39页-第48页,2006)。来自公共域中的序列的信号肽的例子可以获自对提供许多直向同源信号肽的序列的WoLFPSORT分析。
在真核生物体中,存在着数种类型的信号肽及相关分选信号,它们都牵涉膜转位和/或插入。通常,对于内质网(ER)而言特异性的信号肽是共翻译的,而对于线粒体或叶绿体而言特异性的信号肽是翻译后的,但是被侣伴蛋白展开。例如,具有可变长度疏水性部分的N端信号引起蛋白质以共翻译方式转运通过或进入内质网膜。N端信号主要依赖于载体蛋白。此类信号肽在不同蛋白质间通常可互换,通常被切割,而且通常限于约前90个氨基酸残基。切割、N端上的存在和共翻译识别使信号肽通常与蛋白质功能直向同源,但是这是一般的关系。在一些实施方案中,如本文中所描述的POT蛋白可以包含C端分选信号。C端分选信号的例子包括但不限于用于ER保留的KDEL(可溶性)或KKXX(膜蛋白)信号、用于过氧化物酶体靶向的SKL(可溶性)、用于液泡的NPIR、和用于细菌细胞壁的LPXTG。在一些实施方案中,如本文中所描述的POT蛋白可以包含内部分选信号。此类信号包括核定位信号,其存在于折叠蛋白质的表面上,但是可以是1维序列上的任何地方。在一些实施方案中,如本文中所描述的POT蛋白可以包含N端信号肽,其长度为约95,90,85,80,75,70,65,60,55,50,45,40,35,30,25,20,15,10,或5个氨基酸,自所述POT蛋白的N端开始。在一些实施方案中,如本文中所描述的POT蛋白缺乏整个或部分的N端信号肽。在一些实施方案中,如本文中所描述的POT蛋白可以让N端信号肽被除去,并用不同N端信号肽替换。例如,本领域技术人员可以取出或合成没有SEQ ID NO:(426)的N端45个氨基酸的序列,并经由融合技术或经由合成添加对相同或不同靶膜具有特异性的另一种信号肽。
在一些实施方案中,生物质调控多肽在天然存在的多肽的氨基或羧基端末端截短。截短的多肽可以保留天然存在的多肽的某些域,而缺乏其它的。如此,或短或长的多至5个氨基酸的长度变体通常展现出截短的多肽的生物质调控活性。在一些实施方案中,截短的多肽是显性失活多肽。与不包含截短的对照植物的相应水平相比,此类截短的多肽在植物中的表达赋予植物生物质水平的差异。
B.通过交互式BLAST鉴定的功能同系物
在一些实施方案中,通过上文指明的一种或多种pfam描述限定的参照生物质调控多肽的一种或多种功能同系物适合于作为生物质调控多肽使用。功能同系物是与参照多肽具有序列相似性,而且执行参照多肽的一种或多种生化或生理学功能的多肽。功能同系物和参照多肽可以是天然存在的多肽,并且序列相似性可能是由于趋同或趋异进化事件所致。因此,功能同系物有时在文献中称为同系物、或直向同系物、或侧向同系物(paralog)。天然存在的功能同系物的变体诸如由野生型编码序列的突变体编码的多肽可以自身是功能同系物。也可以经由定点诱变生物质调控多肽的编码序列,或者通过组合来自不同天然存在的生物质调控多肽的编码序列的结构域(“结构域交换”)来创建功能同系物。术语“功能同系物”有时适用于编码功能上同源的多肽的核酸。
可以通过分析核苷酸和多肽序列比对来鉴定功能同系物。例如,在核苷酸或多肽序列的数据库上实施询问可以鉴定生物质调控多肽的同系物。序列分析可以牵涉对非冗余数据库的BLAST、交互式BLAST、或PSI-BLAST分析,其使用生物质调控多肽氨基酸序列作为参照序列来进行。在一些例子中,氨基酸序列是从核苷酸序列推导的。数据库中具有大于40%序列同一性的那些多肽是进一步评估作为生物质调控多肽的合适性的候选物。氨基酸序列相似性容许保守的氨基酸取代,诸如用一种疏水性残基取代另一种或者用一种极性残基取代另一种。若想要的话,可以对此类候选物实施手动检查以收缩要进一步评估的候选物的数目。可以通过选择那些表现出具有生物质调控多肽中存在的结构域(例如保守的功能域)的候选物来实施手动检查。
可以通过定位生物质调控多肽的一级氨基酸序列内作为重复序列,形成一些二级结构(例如螺旋和beta片层),建立带正电荷或负电荷的结构域,或者代表蛋白质基序或结构域的区域来鉴定保守区。参见例如万维网上于sanger.ac.uk/Software/Pfam/and pfam.janelia.org/的Pfam网站,其描述了多种蛋白质基序和结构域的共有序列。在Pfam数据库上包括的信息的描述记载于Sonnhammer等,Nucl.Acids Res.,26:320-322(1998);Sonnhammer等,Proteins,28:405-420(1997);及Bateman等,Nucl.Acids Res.,27:260-262(1999)。也可以通过比对来自紧密相关物种的相同或相关多肽的序列来确定保守区。优选地,紧密相关物种来自同一科。在一些实施方案中,来自两种不同物种的序列比对是足够的。
通常,展现出至少约40%氨基酸序列同一性的多肽可用于鉴定保守区。相关多肽的保守区展现出至少45%的氨基酸序列同一性(例如至少50%、至少60%、至少70%、至少80%、或至少90%的氨基酸序列同一性)。在一些实施方案中,保守区展现出至少92%、94%、96%、98%、或99%的氨基酸序列同一性。
图1和序列表中提供了SEQ ID NO:554中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,CeresAnnot:564098(SEQ ID NO:556),CeresAnnot:1443290(SEQ ID NO:558),CeresClone:1042157(SEQ IDNO:560),CeresClone:1919714(SEQ ID NO:562),GI:157336039(SEQ ID NO:563),CeresAnnot:8454153(SEQ ID NO:565),CeresAnnot:1722302(SEQ IDNO:567),CeresAnnot:8733140(SEQ ID NO:569),CeresAnnot:1452096(SEQID NO:571),CeresClone:1645639(SEQ ID NO:573),GI:157344920(SEQ IDNO:574),GI:115440865(SEQ ID NO:575),CeresClone:340925(SEQ ID NO:577),CeresAnnot:8669404(SEQ ID NO:579),CeresClone:100028078(SEQ IDNO:581),CeresAnnot:1503869(SEQ ID NO:583),CeresAnnot:1525651(SEQID NO:585),CeresClone:2031281(SEQ ID NO:587),CeresClone:483742(SEQ ID NO:589),CeresClone:100802111(SEQ ID NO:591),或CeresClone:1460255(SEQ ID NO:593)。在一些情况中,SEQ ID NO:554的功能同系物具有与SEQ ID NO:554中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图2和序列表中提供了SEQ ID NO:263中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,GI:157355009(SEQ ID NO:264),CeresAnnot:1464457(SEQ ID NO:266),CeresClone:1584660(SEQ ID NO:268),GI:115474149(SEQ ID NO:269),CeresAnnot:8636233(SEQ IDNO:271),CeresClone:1777035(SEQ ID NO:273),CeresClone:1990929(SEQID NO:275),GI:194692166(SEQ ID NO:276),CeresAnnot:1458507(SEQ IDNO:278),GI:147780712(SEQ ID NO:279),CeresAnnot:8642924(SEQ IDNO:281),GI:115451001(SEQ ID NO:282),AAF87041(SEQ ID NO:283),CeresClone:1573856(SEQ ID NO:285),CeresAnnot:1476818(SEQ IDNO:287),CeresAnnot:1450024(SEQ ID NO:289),CeresAnnot:1503065(SEQID NO:291),GI:147866358(SEQ ID NO:292),CeresClone:230073(SEQ IDNO:294),(SEQ ID NO:295),(SEQ ID NO:296),GI:78708599(SEQ ID NO:297),GI:15451553(SEQ ID NO:298),GI:125542572(SEQ ID NO:299),GI:157342426(SEQ ID NO:300),CeresAnnot:538622(SEQ ID NO:302),CeresAnnot:8460661(SEQ ID NO:304),GI:15983797(SEQ ID NO:305),GI:115435804(SEQ ID NO:306),CeresClone:1599579(SEQ ID NO:308),CeresAnnot:1469831(SEQ ID NO:310),GI:9758342(SEQ ID NO:311),GI:21536859(SEQ ID NO:312),CeresClone:113639(SEQ ID NO:314),GI:15232818(SEQ ID NO:315),CeresClone:1571328(SEQ ID NO:317),CeresClone:1868988(SEQ ID NO:319),GI:1669341(SEQ ID NO:320),或GI:157359317(SEQ ID NO:321)。在一些情况中,SEQ ID NO:263的功能同系物具有与SEQ ID NO:263中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图3和序列表中提供了SEQ ID NO:117中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,GI:90657534(SEQ ID NO:118),CeresClone:1237946(SEQ ID NO:120),GI:118488472(SEQ ID NO:121),GI:38194917(SEQ ID NO:122),GI:157341292(SEQ ID NO:123),CeresClone:1957107(SEQ ID NO:125),CeresAnnot:8640603(SEQ ID NO:127),CeresClone:829440(SEQ ID NO:129),CeresClone:285169(SEQ ID NO:131),GI:116790012(SEQ ID NO:132),GI:157356290(SEQ ID NO:133),CeresAnnot:1450186(SEQ ID NO:135),CeresClone:1804732(SEQ ID NO:137),CeresClone:1781794(SEQ ID NO:139),CeresAnnot:8656625(SEQ IDNO:141),GI:162462515(SEQ ID NO:142),CeresClone:570485(SEQ ID NO:144),GI:125586664(SEQ ID NO:145),GI:116788824(SEQ ID NO:146),GI:115453531(SEQ ID NO:147),CeresClone:17250(SEQ ID NO:149),CeresAnnot:1363625(SEQ ID NO:151),GI:75133694(SEQ ID NO:152),GI:147780878(SEQ ID NO:153),GI:157341291(SEQ ID NO:154),GI:38194916(SEQ ID NO:155),GI:157356291(SEQ ID NO:156),CeresClone:1883580(SEQ ID NO:158),CeresClone:1848658(SEQ ID NO:160),CeresAnnot:1450185(SEQ ID NO:162),GI:13477083(SEQ ID NO:163),GI:115463639(SEQ ID NO:164),CeresClone:98007(SEQ ID NO:166),CeresAnnot:1326475(SEQ ID NO:168),GI:115473243(SEQ ID NO:169),CeresAnnot:870466(SEQ ID NO:171),CeresClone:1806851(SEQ ID NO:173),GI:75133695(SEQ ID NO:174),CeresClone:1788775(SEQ ID NO:176),CeresClone:1546455(SEQ ID NO:178),CeresClone:1902642(SEQ ID NO:180),CeresAnnot:8632643(SEQ ID NO:182),CeresClone:236876(SEQ ID NO:184),GI:90657629(SEQ ID NO:185),GI:30090032(SEQ ID NO:186),CeresAnnot:8640602(SEQ ID NO:188),GI:115453533(SEQ ID NO:189),GI:162462330(SEQ ID NO:190),GI:38230578(SEQ ID NO:191),CeresAnnot:8632641(SEQ ID NO:193),GI:168016456(SEQ ID NO:194),GI:125532513(SEQ ID NO:195),GI:157354382(SEQ ID NO:196),CeresAnnot:1481980(SEQ ID NO:198),CeresAnnot:1535466(SEQ ID NO:200),CeresAnnot:1297618(SEQ ID NO:202),GI:119040466(SEQ ID NO:203),GI:116310381(SEQ ID NO:204),CeresAnnot:8702104(SEQ ID NO:206),或GI:157340500(SEQ ID NO:207)。在一些情况中,SEQ ID NO:117的功能同系物具有与SEQ ID NO:117中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图4和序列表中提供了SEQ ID NO:1中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,GI:84795244(SEQ ID NO:2),CeresClone:1725396(SEQ ID NO:4),CeresAnnot:8669118(SEQ ID NO:6),CeresClone:280241(SEQ ID NO:8),CeresClone:1712594(SEQ ID NO:10),GI:190361125(SEQ ID NO:11),GI:4099921(SEQ ID NO:12),GI:147844573(SEQ ID NO:13),GI:67906426(SEQ ID NO:14),GI:57012757(SEQ ID NO:15),GI:56567583(SEQ ID NO:16),GI:84795246(SEQ ID NO:17),GI:84795248(SEQ ID NO:18),CeresClone:1805203(SEQ ID NO:20),CeresClone:101497672(SEQ ID NO:22),CeresClone:224845(SEQ ID NO:24),GI:115464685(SEQ ID NO:25),CeresClone:1287030(SEQ ID NO:27),CeresAnnot:8733383(SEQ ID NO:29),GI:84795240(SEQ ID NO:30),CeresClone:1806017(SEQ ID NO:32),GI:84795242(SEQ ID NO:33),GI:84795238(SEQ ID NO:34),CeresClone:1733772(SEQ ID NO:36),GI:37625037(SEQ ID NO:37),GI:37625035(SEQ ID NO:38),GI:147805535(SEQ ID NO:39),GI:157358724(SEQ ID NO:40),GI:4099914(SEQ ID NO:41),CeresAnnot:1520029(SEQ ID NO:43),CeresClone:1065091(SEQ ID NO:45),CeresClone:1793792(SEQ ID NO:47),CeresClone:1619220(SEQ ID NO:49),GI:57012875(SEQ ID NO:50),GI:147811787(SEQ ID NO:51),CeresClone:1842925(SEQ ID NO:53),GI:20340233(SEQ ID NO:54),CeresClone:1657843(SEQ ID NO:56),CeresAnnot:1455887(SEQ ID NO:58),GI:118490009(SEQ ID NO:59),CeresClone:1381515(SEQ ID NO:61),CeresClone:22775(SEQ ID NO:63),GI:60459377(SEQ ID NO:64),CeresAnnot:1488231(SEQ ID NO:66),CeresClone:1884969(SEQ ID NO:68),CeresClone:1802100(SEQ ID NO:70),GI:156145802(SEQ ID NO:71),GI:28274832(SEQ ID NO:72),CeresClone:568399(SEQ ID NO:74),或GI:115460458(SEQ ID NO:75)。在一些情况中,SEQ ID NO:1的功能同系物具有与SEQ ID NO:1中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图5和序列表中提供了SEQ ID NO:645中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,CeresClone:1925947(SEQ IDNO:647),CeresAnnot:1514501(SEQ ID NO:649),CeresAnnot:849672(SEQ IDNO:651),GI:157355942(SEQ ID NO:652),GI:115452503(SEQ ID NO:653),CeresClone:1790933(SEQ ID NO:655),CeresAnnot:8641620(SEQ ID NO:657),CeresClone:281497(SEQ ID NO:659),GI:168013851(SEQ ID NO:660),CeresClone:143214(SEQ ID NO:662),CeresClone:1781022(SEQ ID NO:664),CeresClone:618639(SEQ ID NO:666),GI:118483001(SEQ ID NO:667),CeresClone:38404(SEQ  ID  NO:669),GI:3549670(SEQ ID NO:670),GI:37703720(SEQ ID NO:671),GI:152149571(SEQ ID NO:672),GI:125603687(SEQ ID NO:673),GI:108707679(SEQ ID NO:674),GI:157352390(SEQ ID NO:675),GI:159469820(SEQ ID NO:676),GI:145344081(SEQ ID NO:677),或Ceres Annot ID no.1461228(SEQ IDNO:689)。在一些情况中,SEQ ID NO:645的功能同系物具有与SEQ ID NO:645中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图6和序列表中提供了SEQ ID NO:253中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,CeresClone:951785(SEQ ID NO:255),CeresAnnot:1440346(SEQ ID NO:257),CeresClone:1085177(SEQ IDNO:259),或CeresClone:157151(SEQ ID NO:261)。在一些情况中,SEQ IDNO:253的功能同系物具有与SEQ ID NO:253中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图7和序列表中提供了SEQ ID NO:323中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,GI:157340812(SEQ ID NO:324),CeresAnnot:1460824(SEQ ID NO:326),GI:145356202(SEQ ID NO:327),CeresClone:477814(SEQ ID NO:329),CeresClone:1914387(SEQ ID NO:331),GI:7981380(SEQ ID NO:332),CeresClone:1910072(SEQ ID NO:334),CeresClone:331755(SEQ ID NO:336),GI:124360540(SEQ ID NO:337),GI:157335318(SEQ ID NO:338),CeresAnnot:1503394(SEQ ID NO:340),CeresAnnot:1442707(SEQ ID NO:342),GI:147784500(SEQ ID NO:343),CeresAnnot:1514100(SEQ ID NO:345),CeresAnnot:850366(SEQ ID NO:347),CeresAnnot:543794(SEQ ID NO:349),CeresAnnot:1495620(SEQ ID NO:351),CeresClone:1653552(SEQ ID NO:353),GI:147767321(SEQ ID NO:354),CeresAnnot:1510450(SEQ ID NO:356),GI:110931736(SEQ ID NO:357),CeresClone:1916884(SEQ ID NO:359),CeresClone:1847251(SEQ ID NO:361),CeresAnnot:1457249(SEQ ID NO:363),CeresClone:1113584(SEQ ID NO:365),CeresClone:1927753(SEQ ID NO:367),CeresClone:857342(SEQ ID NO:369),CeresClone:100068619(SEQ ID NO:371),GI:145327247(SEQ ID NO:372),CeresAnnot:8461532(SEQ ID NO:374),CeresClone:1722230(SEQ ID NO:376),CeresClone:1897493(SEQ ID NO:378),CeresAnnot:838426(SEQ ID NO:380),CeresAnnot:827713(SEQ ID NO:382),CeresClone:1763593(SEQ ID NO:384),CeresClone:143475(SEQ ID NO:386),CeresAnnot:8456508(SEQ ID NO:388),CeresClone:100002959(SEQ ID NO:390),GI:118137433(SEQ ID NO:391),CeresClone:1523182(SEQ ID NO:393),CeresClone:1761808(SEQ ID NO:395),CeresClone:1069222(SEQ ID NO:397),CeresAnnot:8734209(SEQ ID NO:399),CeresAnnot:8461540(SEQ ID NO:401),CeresClone:1086604(SEQ ID NO:403),CeresClone:41695(SEQ ID NO:405),GI:112292440(SEQ ID NO:406),GI:116830269(SEQ ID NO:407),CeresClone:1775942(SEQ ID NO:409),CeresClone:1723374(SEQ ID NO:411),CeresAnnot:1457230(SEQ ID NO:413),CeresAnnot:8667653(SEQ ID NO:415),GI:115465643(SEQ ID NO:416),GI:5091605(SEQ ID NO:417),GI:125553458(SEQ ID NO:418),CeresAnnot:1510435(SEQ ID NO:420),GI:115438765(SEQ ID NO:421),GI:112292438(SEQ ID NO:422),或CeresAnnot:1770841(SEQ ID NO:424)。在一些情况中,SEQ ID NO:323的功能同系物具有与SEQ ID NO:323中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图8和序列表中提供了SEQ ID NO:595中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,CeresClone:644331(SEQ ID NO:597),GI:15227859(SEQ ID NO:598),CeresAnnot:1504349(SEQ ID NO:600),CeresAnnot:1265088(SEQ ID NO:602),(SEQ ID NO:603),GI:125527987(SEQ ID NO:604),GI:14279437(SEQ ID NO:605),ES902065(SEQ ID NO:606),CeresClone:1065042(SEQ ID NO:608),GI:157329790(SEQ ID NO:609),GI:15227861(SEQ ID NO:610),GI:146272407(SEQ ID NO:611),CeresClone:95094(SEQ ID NO:613),CeresClone:1714893(SEQ ID NO:615),GI:157329890(SEQ ID NO:616),CeresAnnot:859635(SEQ ID NO:618),GI:115440397(SEQ ID NO:619),GI:40549303(SEQ ID NO:620),CeresAnnot:1457048(SEQ ID NO:622),GI:50401192(SEQ ID NO:623),CeresAnnot:1451281(SEQ ID NO:625),CeresAnnot:1510252(SEQ ID NO:627),CeresClone:1822691(SEQ ID NO:629),GI:197312921(SEQ ID NO:630),CeresAnnot:8456439(SEQ ID NO:632),EX096388(SEQ ID NO:633),GI:15028131(SEQ ID NO:634),CeresClone:270875(SEQ ID NO:636),GI:27754457(SEQ ID NO:637),GI:16648679(SEQ ID NO:638),GI:15227863(SEQ ID NO:639),CeresAnnot:1451282(SEQ ID NO:641),GI:53830670(SEQID NO:642),GI:146272405(SEQ ID NO:643),或CeresAnnot:827940(SEQID NO:691)。在一些情况中,SEQ ID NO:595的功能同系物具有与SEQ ID NO:595中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图9和序列表中提供了SEQ ID NO:77中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,CeresClone:1387948(SEQ IDNO:79),CeresClone:1937714(SEQ ID NO:81),GI:157345132(SEQ ID NO:82),CeresClone:464828(SEQ ID NO:84),CeresAnnot:1451368(SEQ ID NO:86),GI:37695575(SEQ ID NO:87),GI:116790033(SEQ ID NO:88),CeresClone:1346042(SEQ ID NO:90),CeresClone:1118610(SEQ ID NO:92),CeresClone:982000(SEQ ID NO:94),CeresClone:959670(SEQ ID NO:96),CeresClone:952522(SEQ ID NO:98),CeresClone:1914539(SEQ ID NO:100),CeresClone:668581(SEQ ID NO:102),CeresClone:1914939(SEQ ID NO:104),CeresClone:723694(SEQ ID NO:106),CeresAnnot:1456949(SEQ ID NO:108),CeresAnnot:1539918(SEQ ID NO:110),CeresAnnot:8456138(SEQ ID NO:112),CeresAnnot:1486506(SEQ ID NO:114),或GI:116786293(SEQ ID NO:115)。在一些情况中,SEQ ID NO:77的功能同系物具有与SEQ ID NO:77中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图10和序列表中提供了SEQ ID NO:209中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,GI:116780542(SEQ ID NO:210),CeresClone:1848017(SEQ ID NO:212),CeresAnnot:1466494(SEQ IDNO:214),CeresAnnot:1449022(SEQ ID NO:216),CeresAnnot:1482911(SEQID NO:218),CeresClone:1118987(SEQ ID NO:220),CeresClone:1073674(SEQ ID NO:222),CeresClone:1084747(SEQ ID NO:224),CeresClone:536345(SEQ ID NO:226),CeresClone:1650005(SEQ ID NO:228),CeresAnnot:8453882(SEQ ID NO:230),CeresAnnot:1373087(SEQ ID NO:232),CeresAnnot:8669372(SEQ ID NO:234),CeresClone:1048839(SEQ IDNO:236),CeresClone:281322(SEQ ID NO:238),GI:147795605(SEQ ID NO:239),CeresClone:2004419(SEQ ID NO:241),GI:125543059(SEQ ID NO:242),AT1G16910_LSH8(SEQ ID NO:243),AT1G78815_LSH7(SEQ ID NO:244),AT2G31160_LSH3(SEQ ID NO:245),AT2G42610_LSH10(SEQ ID NO:246),AT3G04510_LSH2(SEQ ID NO:247),AT3G23290_LSH4(SEQ ID NO:248),AT5G28490_LSH1(SEQ ID NO:249),AT5G58500_LSH5(SEQ ID NO:250),or At1g07090_LSH6(SEQ ID NO:251)。在一些情况中,SEQ ID NO:209的功能同系物具有与SEQ ID NO:209中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
图11和序列表中提供了SEQ ID NO:426中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如,CeresAnnot:1472338_Pb(SEQID NO:428),GI:157344683_Vv(SEQ ID NO:429),GI:87240677_Mt(SEQ IDNO:430),GI:115448297_Os(SEQ ID NO:431),CeresClone:1844568_Pv(SEQID NO:433),CeresClone:797829_Tm(SEQ ID NO:435),GI:168033816_Pp(SEQ ID NO:436),GI:116788004_Ps(SEQ ID NO:437),GI:149900503_Ha(SEQ ID NO:438),GI:4102839_Sl(SEQ ID NO:439),GI:31088360_Vf(SEQID  NO:440),CeresAnnot:8681236_Sb(SEQ ID NO:442),CeresAnnot:8519531_Gm(SEQ ID NO:444),CeresAnnot:8631372_Zm(SEQID NO:446),GI:151426449_Hv(SEQ ID NO:447),GI:192757675_Br(SEQ IDNO:448),GI:2655098(SEQ ID NO:449),GI:194690746(SEQ ID NO:450),CeresClone:752925(SEQ ID NO:452),GI:125540898(SEQ ID NO:453),GI:26451333(SEQ ID NO:454),GI:2160144(SEQ ID NO:455),GI:30696666(SEQ ID NO:456),GI:125556922(SEQ ID NO:457),CeresAnnot:1529287(SEQ ID NO:459),CeresClone:1806748(SEQ ID NO:461),CeresAnnot:8755095(SEQ ID NO:463),GI:147827175(SEQ ID NO:464),CeresClone:1888865(SEQ ID NO:466),GI:157337163(SEQ ID NO:467),GI:115434472(SEQ ID NO:468),CeresAnnot:6252512(SEQ ID NO:470),CeresAnnot:1569074_Mt(SEQ ID NO:472),CeresAnnot:1475845(SEQ ID NO:474),CeresAnnot:1501483(SEQ ID NO:476),CeresAnnot:8755079(SEQ IDNO:478),GI:115470147(SEQ ID NO:479),GI:15240905(SEQ ID NO:480),CeresAnnot:8755085(SEQ ID NO:482),GI:147853446(SEQ ID NO:483),GI:157346087(SEQ ID NO:484),CeresAnnot:1538867(SEQ ID NO:486),CeresAnnot:8755091(SEQ ID NO:488),CeresAnnot:1492702(SEQ ID NO:490),CeresClone:325604(SEQ ID NO:492),GI:108707040(SEQ ID NO:493),CeresAnnot:1302517_At(SEQ ID NO:495),CeresAnnot:1355964(SEQ ID NO:497),CeresAnnot:8755104(SEQ ID NO:499),GI:147802380(SEQ ID NO:500),GI:510238(SEQ ID NO:501),GI:157341962(SEQ ID NO:502),GI:6635838(SEQ ID NO:503),GI:4455276(SEQ ID NO:504),CeresAnnot:8642246(SEQ ID NO:506),CeresAnnot:8633032(SEQ ID NO:508),GI:157337654(SEQ ID NO:509),CeresAnnot:8642241(SEQ ID NO:511),CeresAnnot:1520085(SEQ ID NO:513),CeresAnnot:1514979(SEQ IDNO:515),GI:147858202(SEQ ID NO:516),GI:125545538(SEQ ID NO:517),GI:115451771(SEQ ID NO:518),GI:125587732(SEQ ID NO:519),CeresAnnot:1516968(SEQ ID NO:521),CeresClone:350844(SEQ ID NO:523),CeresAnnot:8658700(SEQ ID NO:525),GI:157346088(SEQ ID NO:526),CeresClone:1926916(SEQ ID NO:528),GI:15226861(SEQ ID NO:529),CeresClone:816960(SEQ ID NO:531),GI:15232435(SEQ ID NO:532),CeresAnnot:8643789(SEQ ID NO:534),CeresAnnot:8631367(SEQ ID NO:536),GI:157339093(SEQ ID NO:537),CeresAnnot:8633031(SEQ ID NO:539),GI:125543029(SEQ ID NO:540),GI:115454995(SEQ ID NO:541),CeresAnnot:8755090(SEQ ID NO:543),CeresAnnot:8755097(SEQ ID NO:545),CeresAnnot:8755098(SEQ ID NO:547),CeresAnnot:8755099(SEQ IDNO:549),(SEQ ID NO:550),(SEQ ID NO:551),(SEQ ID NO:552),CeresAnnot:6086224(SEQ ID NO:693),CeresClone:476769(SEQ ID NO:695),或CeresClone:15650(SEQ ID NO:697)。在一些情况中,SEQ ID NO:426的功能同系物具有与SEQ ID NO:426中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。
生物质调控多肽中保守区的鉴定便于生成生物质调控多肽的变体。生物质调控多肽的变体在一级氨基酸序列内通常具有10处或更少的保守氨基酸取代,例如7处或更少的保守氨基酸取代,5处或更少的保守氨基酸取代,或者1处和5处之间的保守取代。可以基于图1、图2、图3、图4、图5、图6、图7、图8、图9、图10、或图11中所列的比对和/或序列表中鉴定的同系物之一来构建有用的变体多肽。此类多肽包括保守区,它们以图中所描绘的次序从氨基端末端向羧基端末端安排。此类多肽在以短划线标记的位置中也可以包括0个、1个、或超过1个氨基酸。当以短划线标记的位置处不存在氨基酸时,此类多肽的长度是所有保守区中氨基酸残基的总和。当以短划线标记的所有位置处存在氨基酸时,此类多肽具有的长度是所有保守区和所有短划线中的氨基酸残基的总和。
C.通过HMMER鉴定的功能同系物
在一些实施方案中,有用的生物质调控多肽包括那些拟合基于图1-11之任一中所列的多肽的隐蔽马尔科夫模型的。隐蔽马尔科夫模型(HMM)是一组功能同系物的共有序列的统计学模型。参见Durbin等,Biological SequenceAnalysis:Probabilistic Models of Proteins and Nucleic Acids,CambridgeUniversity Press,Cambridge,UK(1998)。使用一组功能同系物的序列作为输入,通过具有缺省程序参数的程序HMMER 2.3.2来产生HMM。通过ProbCons(Do等,Genome Res.,15(2):330-40(2005))第1.11版来产生多序列比对,其使用一套缺省参数:-c,--一致性REPS为2;-ir,--迭代细化(iterative-refinement)REPS为100;-pre,--预练习(pre-training)REPS为0来进行。ProbCons是由斯坦福大学提供的公共域软件程序。
用于构筑HMM的缺省参数(hmmbuild)如下:MAP结构构建所使用的缺省“结构优先”(“architecture prior”,archpri)是0.85,而用于测定有效序列数目的缺省截留阈值(idlevel)是0.62。HMMER 2.3.2于2003年10月3日在GNU一般公共许可下发行,而且可获自万维网上的各种资源诸如hmmer.janelia.org;hmmer.wustl.edu;和fr.com/hmmer232/。Hmmbuild以文本文件输出模型。
可以使用一组功能同系物的HMM来测定候选生物质调控多肽序列比拟合使用结构或功能上无关的一组序列产生的空HMM更好地拟合所述特定HMM的可能性。通过HMM比特得分(即当使用HMMER hmmsearch程序将候选序列拟合至HMM概况(profile)时产生的数目)指明候选多肽序列比拟合空HMM更好地拟合HMM的可能性。在运行hmmsearch时使用下列缺省参数:缺省E值截留(E)是10.0,缺省比特得分截留(T)是负无穷大,数据库中序列的缺省数目(Z)是数据库中序列的实数,按域分级的命中列表(per-domain rankedhit list)的缺省E值截留(domE)是无穷大,而按域分级的命中列表的缺省比特得分截留(domT)是负无穷大。高的HMM比特得分指明候选序列实施用于产生HMM的多肽的一项或多项生化或生理学功能的可能性较大。高的HMM比特得分是至少20,而且常常更高。特定序列的HMM比特得分的略微变化可以由于各因素诸如通过多序列比对算法诸如ProbCons程序进行比对的序列的次序而发生。然而,此类HMM比特得分变化是次要的。
下文所讨论的生物质调控多肽以大于65(例如,大于70,80,90,100,120,140,200,300,500,1000,1500,或2000)的HMM比特得分拟合指明的HMM。在一些实施方案中,下文所讨论的生物质调控多肽的HMM比特得分是本申请的序列表中提供的功能同系物的HMM比特得分的约50%、60%、70%、80%、90%、或95%。在一些实施方案中,下文所讨论的生物质调控多肽以大于210的HMM比特得分拟合指明的HMM,而且具有指示生物质调控多肽的域。在一些实施方案中,下文所讨论的生物质调控多肽以大于210的HMM比特得分拟合指明的HMM,而且与图1-11之任一中显示的氨基酸序列具有65%或更大的序列同一性(例如75%、80%、85%、90%、95%、或100%序列同一性)。
序列表中显示了多肽的例子,其在拟合至从图1中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于130的HMM比特得分。此类多肽包括例如,SEQ ID NO:554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,或593。
序列表中显示了多肽的例子,其在拟合至从图2中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于340的HMM比特得分。此类多肽包括例如,SEQ ID NO:263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,或321。
序列表中显示了多肽的例子,其在拟合至从图3中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于530的HMM比特得分。此类多肽包括例如,SEQ ID NO:117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,或207。
序列表中显示了多肽的例子,其在拟合至从图4中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于120的HMM比特得分。此类多肽包括例如,SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,或75。
序列表中显示了多肽的例子,其在拟合至从图5中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于635的HMM比特得分。此类多肽包括例如SEQ ID NO:645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,或689。
序列表中显示了多肽的例子,其在拟合至从图6中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于65的HMM比特得分。此类多肽包括例如SEQ ID NO:255,257,259,或261。
序列表中显示了多肽的例子,其在拟合至从图7中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于100的HMM比特得分。此类多肽包括例如SEQ ID NO:323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,或424。
序列表中显示了多肽的例子,其在拟合至从图8中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于480的HMM比特得分。此类多肽包括例如SEQ ID NO:595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,或691。
序列表中显示了多肽的例子,其在拟合至从图9中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于145的HMM比特得分。此类多肽包括例如SEQ ID NO:77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,或115。
序列表中显示了多肽的例子,其在拟合至从图10中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于280的HMM比特得分。此类多肽包括例如SEQ ID NO:209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,或251。
序列表中显示了多肽的例子,其在拟合至从图11中所列的并在本申请的序列表中鉴定的氨基酸序列产生的HMM时具有大于1000的HMM比特得分。此类多肽包括例如SEQ ID NO:426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,693,695,或697。
D.百分比同一性
在一些实施方案中,生物质调控多肽具有与下组中所列氨基酸序列之一具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列:SEQ IDNO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695,或697。具有此类百分比序列同一性的多肽常常具有指示生物质调控多肽的结构域和/或具有大于65的HMM比特得分,如上文所讨论的。图1-11和序列表中提供了与下组中所列的氨基酸序列之一具有至少80%序列同一性的生物质调控多肽的氨基酸序列:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695,或697。
“百分比序列同一性”指任何给定的参照序列(例如SEQ ID NO:1)与候选生物质调控序列之间的序列同一性程度。候选序列通常具有如下的长度,其是参照序列长度的80%至200%,例如参照序列长度的82,85,87,89,90,93,95,97,99,100,105,110,115,120,130,140,150,160,170,180,190,或200%。可以如下测定任何候选核酸或多肽相对于参照核酸或多肽的百分比同一性。使用计算机程序ClustalW(第1.83版,缺省参数)将参照序列(例如核酸序列或氨基酸序列)与一种或多种候选序列比对,所述计算机程序ClustalW容许核酸或多肽序列的比对在其整个长度间实施(全局比对)。Chenna等,Nucleic AcidsRes.,31(13):3497-500(2003)。
ClustalW计算参照与一种或多种候选序列之间的最佳匹配,并比对它们,使得可以测定同一性、相似性和差异。可以将一个或多个残基的缺口插入参照序列、候选序列、或这两者中以使序列比对最大化。对于核酸序列的快速成对比对,使用下列缺省参数:字大小:2;窗大小:4;评分方法:百分比;顶部对角线(top diagonal)的数目:4;和缺口罚分:5。对于核酸序列的多重比对,使用下列参数:缺口开放罚分:10.0;缺口延伸罚分:5.0;和权重转换(weight transition):是。对于蛋白质序列的快速成对比对,使用下列参数:字大小:1;窗大小:5;评分方法:百分比;顶部对角线的数目:5;缺口罚分:3。对于蛋白质序列的多重比对,使用下列参数:权重矩阵(weightmatrix):blosum;缺口开放罚分:10.0;缺口延伸罚分:0.05;亲水性缺口:开启;亲水性残基:Gly,Pro,Ser,Asn,Asp,Gln,Glu,Arg,和Lys;残基特定缺口罚分:开启。ClustalW输出是反映序列间相互关系的序列比对。可以在例如贝勒医学院(Baylor College of Medicine)搜索发射器(Search Launcher)站点(searchlauncher.bcm.tmc.edu/multi-align/multi-align.html)和万维网上的欧洲生物信息学研究所(European Bioinformatics Institute)站点(ebi.ac.uk/clustalw)上运行ClustalW。
为了测定候选核酸或氨基酸序列与参照序列的百分比同一性,使用ClustalW来比对序列,用比对中相同匹配的数目除以参照序列的长度,并用结果乘以100。注意到百分比同一性数值可以四舍五入成最近的十分之一。例如,78.11,78.12,78.13,和78.14向下四舍五入成78.1,而78.15,78.16,78.17,78.18,和78.19向上四舍五入成78.2。
在一些情况中,生物质调控多肽具有与SEQ ID NO:554中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图1和序列表中提供了与SEQ ID NO:554中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:263中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图2和序列表中提供了与SEQ ID NO:263中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:117中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图3和序列表中提供了与SEQ ID NO:117中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:1中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图4和序列表中提供了与SEQ ID NO:1中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:645中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图5和序列表中提供了与SEQ ID NO:645中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:253中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图6和序列表中提供了与SEQ ID NO:253中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:323中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图7和序列表中提供了与SEQ ID NO:323中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:595中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图8和序列表中提供了与SEQ ID NO:595中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:77中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图9和序列表中提供了与SEQ ID NO:77中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:209中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图10和序列表中提供了与SEQ ID NO:209中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
在一些情况中,生物质调控多肽具有与SEQ ID NO:426中所列的氨基酸序列具有至少45%序列同一性,例如50%,52%,56%,59%,61%,65%,70%,75%,80%,85%,90%,95%,97%,98%,或99%序列同一性的氨基酸序列。图11和序列表中提供了与SEQ ID NO:426中所列的多肽具有大于45%序列同一性的多肽的氨基酸序列。
F.其它序列
应当领会的是,生物质调控多肽可以包括不牵涉生物质调控的额外氨基酸,并且如此此类多肽可以比其它情况中会是的情况长(longer than wouldotherwise be the case)。例如,生物质调控多肽可以包括添加至氨基或羧基端的纯化标签、叶绿体转运肽、线粒体转运肽、造粉体肽、或前导序列。在一些实施方案中,生物质调控多肽包括发挥报告物功能的氨基酸序列,例如绿色荧光蛋白或黄色荧光蛋白。
III.核酸
本文中所描述的核酸包括在植物或植物细胞中转录时有效调控生物质水平的核酸。此类核酸包括但不限于那些编码生物质调控多肽的核酸和那些可以经由基于核酸的方法用于抑制生物质调控多肽表达的核酸。
A.编码生物质调控多肽的核酸
本文中描述了编码生物质调控多肽的核酸。此类核酸的例子包括SEQ IDNO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,或696,如下文更为详细描述的。核酸也可以是下组中所列全长核酸的长度的至少40%(例如至少45,50,55,60,65,70,75,80,85,90,95,或99%)的片段:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,或696。
生物质调控核酸可以包含SEQ ID NO:553中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:553中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:553中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:262中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:262中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:262中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:116中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:116中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:116中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:678中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:678中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:678中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:644中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:644中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:644中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:252中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:252中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:252中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:322中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:322中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:322中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:594中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:594中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:594中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:76中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:76中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:76中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:208中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:208中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:208中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
生物质调控核酸可以包含SEQ ID NO:425中所列的核苷酸序列。或者,生物质调控核酸可以是具有SEQ ID NO:425中所列的核苷酸序列的核酸变体。例如,生物质调控核酸可以具有与SEQ ID NO:425中所列的核苷酸序列具有至少80%序列同一性,例如81%,85%,90%,95%,97%,98%,或99%序列同一性的核苷酸序列。
可以通过标准的技术来生成分离的核酸分子。例如,可以使用聚合酶链式反应(PCR)技术来获得含有本文中所描述的核苷酸序列的分离的核酸。可以使用PCR来从DNA及RNA(包括来自总基因组DNA或总细胞RNA的序列)扩增特定的序列。各种PCR方法记载于例如PCR Primer:ALaboratory Manual,Dieffenbach和Dveksler编,Cold Spring Harbor Laboratory Press,1995。一般而言,采用来自感兴趣区域末端或之外的序列信息来设计寡核苷酸引物,它们在序列上与要扩增模板的相反链相同或相似。各种PCR策略也是可用的,通过所述策略,可以将位点特异性核苷酸序列修饰引入模板核酸中。分离的核酸也可以以单一核酸分子(例如使用亚磷酰胺技术以3’至5’方向使用自动化DNA合成)或者以一系列寡核苷酸来化学合成。例如,可以合成一对或多对含有想要的序列的长的寡核苷酸(例如>100个核苷酸),其中每对含有短的互补性区段(例如约15个核苷酸),从而当寡核苷酸对退火时形成双链体。使用DNA聚合酶来延伸寡核苷酸,每个寡核苷酸对产生单一的双链核酸分子,然后可以将其连接入载体中。也可以通过诱变例如天然存在的DNA来获得本发明的分离的核酸。
B.使用核酸来调控多肽的表达
i.生物质调控多肽的表达
可以使用编码本文中所描述的生物质调控多肽之一的核酸来在感兴趣的植物物种中表达多肽,其通常通过用具有多肽编码序列的核酸转化植物细胞来实现,所述多肽编码序列以有义取向与一种或多种调节区可操作连接。要领会的是,由于遗传密码的简并性,许多核酸可以编码特定的生物质调控多肽;即对于许多氨基酸,存在有超过一种充当氨基酸密码子的核苷酸三联体。如此,给定生物质调控多肽的编码序列中的密码子可以进行修饰,从而获得特定植物物种中的最佳表达,其使用适合于所述物种的密码子偏爱表来实现。
在一些情况中,生物质调控多肽的表达抑制内源多肽的一种或多种功能。例如,可以使用编码显性失活多肽的核酸来抑制蛋白质功能。显性失活多肽相对于内源野生型多肽是突变的或截短的,而且其在细胞中的存在抑制野生型多肽在所述细胞中的一种或多种功能,即显性失活多肽是遗传上显性的,而且赋予功能丧失。显性失活多肽赋予此类表型的机制可以有所变化,但是常常牵涉蛋白质-蛋白质相互作用或蛋白质-DNA相互作用。例如,显性失活多肽可以是酶,其相对于天然的野生型酶是截短的,使得截短的多肽保留牵涉结合第一蛋白的结构域,但是缺乏牵涉结合第二蛋白的结构域。如此,截短的多肽不能正确调控第二蛋白的活性。参见例如US 2007/0056058。作为另一个例子,在催化域中产生非保守氨基酸替代的点突变可以产生显性失活多肽。参见例如US 2005/032221。作为另一个例子,显性失活多肽可以是转录因子,其相对于天然的野生型转录因子是截短的,使得截短的多肽保留DNA结合域,但缺乏激活域。此类截短的多肽能抑制野生型转录因子结合DNA,由此抑制转录激活。
ii抑制生物质调控多肽的表达
可以使用本文中所描述的多核苷酸和重组构建体来抑制生物质调控多肽在感兴趣的植物物种中的表达。参见例如Matzke和Birchler,Nature ReviewsGenetics 6:24-35(2005);Akashi等,Nature Reviews Mol.Cell Biology6:413-422(2005);Mittal,Nature Reviews Genetics 5:355-365(2004);及NatureReviews RNA interference collection,2005年10月在万维网上于nature.com/reviews/focus/mai。已知许多基于核酸的方法(包括反义RNA、核酶指导的RNA切割、转录后基因沉默(PTGS),例如RNA干扰(RNAi)和转录基因沉默(TGS))抑制植物中的基因表达。合适的多核苷酸包括编码生物质调控多肽的全长核酸或此类全长核酸的片段。在一些实施方案中,可以使用全长核酸的互补物或其片段。通常,片段是至少10个核苷酸,例如至少12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,30,35,40,50,80,100,200,500个核苷酸或更多。一般而言,可以使用较高的同源性来补偿较短序列的使用。
反义技术是一种公知的方法。在此方法中,将要阻抑的基因的核酸克隆,并可操作连接至调节区和转录终止序列,从而转录RNA的反义链。然后将重组构建体转化入植物中,如本文中所描述的,并生成RNA的反义链。核酸不需要是要阻抑的基因的整个序列,但是通常会与要阻抑的基因的有义链的至少一部分基本上互补。
在另一种方法中,可以将核酸转录成核酶或催化性RNA,其影响mRNA的表达。参见美国专利号6,423,885。可以将核酶设计成特异性与实际上任何目标RNA配对,并在特定的位置处切割磷酸二酯主链,由此在功能上使目标RNA失活。异源核酸可以编码设计为切割特定mRNA转录物,如此阻止多肽表达的核酶。锤头状核酶对于破坏特定的mRNA是有用的,虽然可以使用在位点特异性识别序列处切割mRNA的各种核酶。锤头状核酶在由与目标mRNA形成互补碱基对的侧翼区域规定的位置处切割mRNA。唯一的要求是目标RNA含有5’-UG-3’核苷酸序列。锤头状核酶的构建和生成是本领域中已知的。参见例如美国专利号5,254,678和WO 02/46449及其中引用的参考文献。可以将锤头状核酶序列包埋在稳定的RNA诸如转移RNA(tRNA)中以提高体内切割效率。Perriman等,Proc.Natl.Acad.Sci.USA,92(13):6175-6179(1995);de Feyter和Gaudron,Methods in Molecular Biology,第74卷,第43章,“Expressing Ribozymes in Plants”,Turner,P.C.编,Humana Press Inc.,Totowa,NJ.。已经描述过的RNA内切核糖核酸酶诸如嗜热四膜虫(Tetrahymenathermophila)中天然存在的RNA内切核糖核酸酶可以是有用的。参见例如美国专利号4,987,071和6,423,885。
也可以使用PTGS(例如RNAi)来抑制基因的表达。例如,可以制备包含转录成能退火至自身的RNA的序列的构建体,例如具有茎-环结构的双链RNA。在一些实施方案中,双链RNA的茎部分的一条链包含与生物质调控多肽的有义编码序列或其片段相似或相同,而且长度为约10个核苷酸至约2,500个核苷酸的序列。与有义编码序列相似或相同的序列的长度可以是10个核苷酸至500个核苷酸、15个核苷酸至300个核苷酸、20个核苷酸至100个核苷酸、或25个核苷酸至100个核苷酸。双链RNA的茎部分的另一条链包含与生物质调控多肽的编码序列的反义链或其片段相似或相同,而且可以具有比有义序列的相应长度短、相同、或长的长度的序列。在一些情况中,双链RNA的茎部分的一条链包含编码生物质调控多肽的mRNA的3’或5’非翻译区或其片段的序列相似或相同的序列,而双链RNA的茎部分的另一条链包含分别与编码生物质调控多肽的mRNA的3’或5’非翻译区或其片段互补的序列相似或相同的序列。在其它实施方案中,双链RNA的茎部分的一条链包含编码生物质调控多肽的前mRNA中的内含子序列或其片段相同或相似的序列,而茎部分的另一条链包含与如下序列相似或相同的序列,所述序列与前mRNA中的内含子序列或其片段互补。
双链RNA的环部分可以是3个核苷酸至5,000个核苷酸,例如3个核苷酸至25个核苷酸、15个核苷酸至1,000个核苷酸、20个核苷酸至500个核苷酸、或25个核苷酸至200个核苷酸。RNA的环部分可以包含内含子或其片段。双链RNA可以具有0、1、2、3、4、5、6、7、8、9、10、或更多个茎-环结构。
如本文中所描述的,将包含序列的构建体转化入植物中,所述序列可操作连接至调节区和转录终止序列,而且被转录成能形成双链RNA的RNA。使用RNAi抑制基因表达的方法对于本领域技术人员是已知的。参见例如美国专利No.5,034,323;6,326,527;6,452,067;6,573,099;6,753,139;和6,777,588。还可参见WO 97/01952;WO 98/53083;WO 99/32619;WO 98/36083;及美国专利公开文本20030175965,20030175783,20040214330,和20030180945。
也可以使用含有以有义取向与核酸分子可操作连接的调节区的构建体来抑制基因的表达。转录产物可以与生物质调控多肽的有义编码序列或其片段相似或相同。转录产物也可以是未多聚腺苷酸化的,缺乏5’帽结构,或者含有不可剪接的内含子。使用全长cDNA及部分cDNA序列来抑制基因表达的方法是本领域中已知的。参见例如美国专利号5,231,020。
在一些实施方案中,使用含有核酸的构建体来抑制基因的表达,所述核酸具有作为彼此互补的有义和反义序列两者的模板的至少一条链。有义和反义序列可以是较大核酸分子的一部分或者可以是具有不互补的序列的不同核酸分子的一部分。有义或反义序列可以是与mRNA的序列、mRNA的3’或5’非翻译区、或编码生物质调控多肽的前mRNA中的内含子相同或互补的序列或此类序列的片段。在一些实施方案中,有义或反义序列与调节区的序列相同或互补,所述调节区驱动生物质调控多肽的基因转录。在每种情况中,有义序列是与反义序列互补的序列。
有义和反义序列可以是大于约10个核苷酸(例如,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30或更多个核苷酸)的长度。例如,反义序列的长度可以是21或22个核苷酸。通常,有义和反义序列长度范围为约15个核苷酸至约30个核苷酸,例如约18个核苷酸至约28个核苷酸,或约21个核苷酸至约25个核苷酸。
在一些实施方案中,反义序列是与编码本文中所描述的生物质调控多肽的mRNA序列或其片段互补的序列。与反义序列互补的有义序列可以是生物质调控多肽的mRNA内存在的序列。通常,可以将有义和反义序列设计成对应于目标mRNA的15-30个核苷酸序列,从而降低所述目标mRNA的水平。
在一些实施方案中,可以使用含有核酸的构建体来抑制基因表达,所述核酸具有作为超过一个有义序列(例如,2,3,4,5,6,7,8,9,10或更多个有义序列)的模板的至少一条链。同样地,可以使用含有核酸的构建体来抑制基因表达,所述核酸具有作为超过一个反义序列(例如2,3,4,5,6,7,8,9,10或更多个反义序列)的模板的至少一条链。例如,构建体可以含有具有作为两个有义序列和两个反义序列的模板的至少一条链的核酸。多个有义序列可以是相同或不同的,而且多个反义序列可以是相同或不同的。例如,构建体可以具有如下的核酸,该核酸具有作为两个相同的有义序列和与两个相同的有义序列互补的两个相同的反义序列的模板的一条链。或者,分离的核酸可以具有作为下列各项的模板的一条链:(1)长度为20个核苷酸的两个相同的有义序列,(2)与长度为20个核苷酸的两个相同的有义序列互补的一个反义序列,(3)长度为30个核苷酸的有义序列,和(4)与长度为30个核苷酸的有义序列互补的三个相同的反义序列。可以将本文中提供的构建体设计成具有有义和反义序列的适当排布。例如,两个相同的有义序列可以接着有两个相同的反义序列或者可以位于两个相同的反义序列之间。
可以将具有作为一个或多个有义和/或反义序列的模板的至少一条链的核酸可操作连接至调节区以驱动含有有义和/或反义序列的RNA分子的转录。另外,可以将所述核酸可操作连接至转录终止子序列,诸如胭脂氨酸合成酶(nos)基因的终止子。在一些情况中,两个调节区可以指导两个转录物的转录:一个从上部链,而一个从底部链。参见例如Yan等,Plant Physiol.,141:1508-1518(2006)。两个调节区可以是相同的或不同的。两个转录物可以形成双链RNA分子,其诱导目标RNA的降解。在一些情况中,核酸可以位于T-DNA或植物衍生的转移DNA(P-DNA)内,使得左侧和右侧的T-DNA边界序列或P-DNA的左侧和右侧边界样序列在该核酸的侧翼或者在核酸的任一侧上。参见US 2006/0265788。两个调节区之间的核酸序列可以长约15至约300个核苷酸。在一些实施方案中,两个调节区之间的核酸序列长约15至约200个核苷酸,长约15至约100个核苷酸,长约15至约50个核苷酸,长约18个至约50个核苷酸,长约18至约40个核苷酸,长约18至约30个核苷酸,或长约18至约25个核苷酸。
在一些用于在植物中抑制基因表达的基于核酸的方法中,合适的核酸可以是核酸类似物。核酸类似物可以在碱基模块、糖模块、或磷酸酯主链处进行修饰以改善例如核酸的稳定性、杂交、或溶解度。在碱基模块处的修饰包括脱氧尿苷取代脱氧胸苷,和用5-甲基-2’-脱氧胞苷和5-溴-2’-脱氧胞苷取代脱氧胞苷。对糖模块的修饰包括修饰核糖的2’羟基以形成2’-O-甲基或2’-O-烯丙基糖。可以修饰脱氧核糖磷酸酯主链以产生吗啉代核酸(其中每个碱基模块连接至六元吗啉环)或肽核酸(其中脱氧磷酸酯主链被假肽主链替换,而四种碱基得到保留)。参见例如Summerton和Weller,Antisense Nucleic AcidDrug Dev.,7:187-195(1997);Hyrup等,Bioorgan.Med.Chem.,4:5-23(1996)。另外,脱氧磷酸酯主链可以用例如硫代磷酸酯或二硫代磷酸酯主链、亚磷酰胺、或烷基磷酸三酯主链替换。
C.构建体/载体
可以使用本文中提供的重组构建体来转化植物或植物细胞以调控生物质水平。重组核酸构建体可以包含编码如本文中所描述的生物质调控多肽的核酸,其可操作连接至适合于在植物或细胞中表达生物质调控多肽的调节区。如此,核酸可以包含编码如下组中所列的生物质调控多肽的编码序列:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695,或697。下组或序列表中列出了编码生物质调控多肽的核酸的例子:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694,或696。由重组核酸编码的生物质调控多肽可以是天然的生物质调控多肽,或者对于细胞而言可以是异源的。在一些情况中,重组构建体含有与调节区可操作连接的抑制生物质调控多肽表达的核酸。在标题为“调节区”的部分中描述了适合的调节区的例子。
还提供了含有重组核酸构建体诸如那些在本文中所描述的重组核酸构建体的载体。合适的载体主链包括例如那些在本领域中常规使用的,诸如质粒、病毒、人工染色体、BAC、YAC、或PAC。合适的表达载体包括但不限于质粒和自例如噬菌体、杆状病毒和逆转录病毒衍生的病毒载体。众多载体和表达系统可购自诸如(Madison,WI),
Figure BDA0000145034540000552
(Palo Alto,CA),
Figure BDA0000145034540000553
(La Jolla,CA),和Invitrogen/Life
Figure BDA0000145034540000554
(Carlsbad,CA)等公司。
本文中提供的载体还可以包含例如复制起点、支架附着区(SAR)、和/或标志物。标志物基因可以将可选择表型赋予植物细胞。例如,标志物可以赋予杀生物剂(biocide)抗性,诸如对抗生素(例如卡那霉素、G418、博来霉素、或潮霉素)或除草剂(例如草甘膦(glyphosate)、氯磺隆(chlorsulfuron)或膦丝菌素(phosphinothricin))的抗性。另外,表达载体可以包含设计为便于操作或检测(例如纯化或定位)所表达的多肽的标签序列。标签序列诸如萤光素酶、β-葡糖醛酸糖苷酶(GUS)、绿色荧光蛋白(GFP)、谷胱甘肽S-转移酶(GST)、多组氨酸、c-myc、血凝素或FlagTM标签(Kodak,New Haven,CT)序列通常以与编码多肽的融合物表达。此类标签可以插入多肽内的任何地方,包括在羧基或氨基端。
D调节区
要包含在重组构建体中的调节区的选择取决于数个因素,包括但不限于效率、可选择性(selectability)、可诱导性、想要的表达水平、和细胞或组织优先性表达。通过相对于编码序列适当地选择和定位调节区来调控编码序列的表达对于本领域技术人员是常规的事情。可以以类似的方式调控核酸的转录。
一些合适的调节区仅仅或者主要在某些细胞类型中启动转录。用于鉴定和表征植物基因组DNA中的调节区的方法是已知的,包括例如那些记载于下列参考文献的方法:Jordano等,Plant Cell,1:855-866(1989);Bustos等,PlantCell,1:839-854(1989);Green等,EMBO J.,7:4035-4044(1988);Meier等,PlantCell,3:309-316(1991);and Zhang等,Plant Physiology,110:1069-1079(1996)。
下文描述了各类调节区的例子。下文指明的一些调节区及别的调节区更为详细地记载于美国专利申请流水号60/505,689;60/518,075;60/544,771;60/558,869;60/583,691;60/619,181;60/637,140;60/757,544;60/776,307;10/957,569;11/058,689;11/172,703;11/208,308;11/274,890;60/583,609;60/612,891;11/097,589;11/233,726;11/408,791;11/414,142;10/950,321;11/360,017;PCT/US05/011105;PCT/US05/23639;PCT/US05/034308;PCT/US05/034343;和PCT/US06/038236;PCT/US06/040572;及PCT/US07/62762。
例如,PCT/US06/040572的序列表中列出了下列调节区的序列:p326,YP0144,YP0190,p13879,YP0050,p32449,21876,YP0158,YP0214,YP0380,PT0848,PT0633,YP0128,YP0275,PT0660,PT0683,PT0758,PT0613,PT0672,PT0688,PT0837,YP0092,PT0676,PT0708,YP0396,YP0007,YP0111,YP0103,YP0028,YP0121,YP0008,YP0039,YP0115,YP0119,YP0120,YP0374,YP0101,YP0102,YP0110,YP0117,YP0137,YP0285,YP0212,YP0097,YP0107,YP0088,YP0143,YP0156,PT0650,PT0695,PT0723,PT0838,PT0879,PT0740,PT0535,PT0668,PT0886,PT0585,YP0381,YP0337,PT0710,YP0356,YP0385,YP0384,YP0286,YP0377,PD1367,PT0863,PT0829,PT0665,PT0678,YP0086,YP0188,YP0263,PT0743和YP0096;调节区PT0625的序列列于PCT/US05/034343的序列表;调节区PT0623,YP0388,YP0087,YP0093,YP0108,YP0022和YP0080的序列列于美国专利申请流水号11/172,703的序列表;调节区PR0924的序列列于PCT/US07/62762的序列表;及调节区p530c10、pOsFIE2-2、pOsMEA、pOsYp102、和pOsYp285的序列列于PCT/US06/038236的序列表。
要领会的是,调节区可以满足基于其在一种植物物种中的活性的一种分类的标准,而且还满足基于其在另一种植物物种中的活性的不同分类的标准。
i.广泛表达型启动子
当启动子在许多但不必所有植物组织中促进转录时,启动子可以被说成是“广泛表达型”。例如,广泛表达型启动子可以在枝、枝尖(尖端)、和叶的一种或多种中,但弱地或者根本不在诸如根或茎等组织中促进可操作连接的序列转录。作为另一个例子,广泛表达型启动子可以在茎、枝、枝尖(尖端)、和叶的一种或多种中促进可操作连接的序列转录,但可以弱地或者根本不在诸如花的生殖组织或发育中的种子等组织中促进转录。可以包含在本文中所提供的核酸构建体中的广泛表达型启动子的非限制性例子包括p326,YP0144,YP0190,p13879,YP0050,p32449,21876,YP0158,YP0214,YP0380,PT0848,和PT0633启动子。别的例子包括花椰菜花叶病毒(CaMV)35S启动子、甘露氨酸合酶(MAS)启动子、自根癌土壤杆菌(Agrobacterium tumefaciens)的T-DNA衍生的1’或2’启动子、玄参花叶病毒34S启动子、肌动蛋白启动子诸如稻肌动蛋白启动子、和泛素启动子诸如玉米泛素-1启动子。在一些情况中,从广泛表达型启动子的种类排除CaMV 35S启动子。
ii.根启动子
根活性启动子在根组织(例如根内皮层、根表皮、或根维管组织)中赋予转录。在一些实施方案中,根活性启动子是根优先性启动子,即仅或主要在根组织中赋予转录。根优先性启动子包括YP0128、YP0275、PT0625、PT0660、PT0683、和PT0758启动子。其它根优先性启动子包括PT0613、PT0672、PT0688、和PT0837启动子,它们主要在根组织中和以较少的程度在胚珠和/或种子中驱动转录。根优先性启动子的其它例子包括CaMV 35S启动子的根特异性亚域(Lam等,Proc.Natl.Acad.Sci.USA,86:7890-7894(1989))、由Conkling等,Plant Physiol.,93:1203-1211(1990)报告的根细胞特异性启动子、和烟草RD2启动子。
iii.成熟胚乳启动子
在一些实施方案中,在成熟胚乳中驱动转录的启动子可以是有用的。从成熟胚乳启动子进行的转录通常在受精后开始,并且主要在胚乳组织中在种子发育过程中发生,而且通常在细胞化阶段期间为最高。最合适的是主要在成熟胚乳中有活性的启动子,虽然有时可以使用在其它组织中也有活性的启动子。可以包括在本文中所提供的核酸构建体中的成熟胚乳启动子的非限制性例子包括油菜籽蛋白(napin)启动子、Arcelin-5启动子、菜豆蛋白(phaseolin)启动子(Bustos等,Plant Cell,1(9):839-853(1989))、大豆胰蛋白酶抑制剂启动子(Riggs等,Plant Cell,1(6):609-621(1989))、ACP启动子(Baerson等,Plant Mol.Biol.,22(2):255-267(1993))、硬脂酰-ACP去饱和酶启动子(Slocombe等,PlantPhysiol.,104(4):167-176(1994))、β-伴大豆球蛋白(conglycinin)启动子的大豆α’亚基(Chen等,Proc.Natl.Acad.Sci.USA,83:8560-8564(1986))、油质蛋白(oleosin)启动子(Hong等,Plant Mol.Biol.,34(3):549-555(1997))、和玉米醇溶蛋白(zein)启动子,诸如15kD玉米醇溶蛋白启动子、16kD玉米醇溶蛋白启动子、19kD玉米醇溶蛋白启动子、22kD玉米醇溶蛋白启动子和27kD玉米醇溶蛋白启动子。也合适的是来自稻谷蛋白-1基因的Osgt-1启动子(Zheng等,Mol.Cell Biol.,13:5829-5842(1993))、beta-淀粉酶启动子、和大麦大麦醇溶蛋白(hordein)启动子。其它成熟胚乳启动子包括YP0092、PT0676、和PT0708启动子。
iv.子房组织启动子
在子房组织诸如胚珠壁和中果皮中有活性的启动子也可以是有用的,例如多聚半乳糖醛酸酶(polygalacturonidase)启动子、香蕉TRX启动子、甜瓜肌动蛋白启动子、YP0396、和PT0623。主要在胚珠中有活性的启动子的例子包括YP0007,YP0111,YP0092,YP0103,YP0028,YP0121,YP0008,YP0039,YP0115,YP0119,YP0120和YP0374。
v.胚囊/早期胚乳启动子
为了在胚囊/早期胚乳中实现表达,可以使用在极核和/或中央细胞中,或者在极核的前体中有活性,但在卵细胞或卵细胞的前体中无活性的调节区。最合适的是仅或主要在极核或其前体和/或中央细胞中驱动表达的启动子。也可以在胚囊/早期胚乳优先性启动子的情况中发现从极核延伸到早期胚乳发育的转录样式,虽然转录通常在细胞化阶段期间和之后在后期胚乳发育中显著降低。合子或发育中的胚中的表达在胚囊/早期胚乳优先性启动子的情况中通常不存在。
可以为适合的启动子包括那些自下列基因衍生的启动子:拟南芥viviparous-1(参见GenBank No.U93215);拟南芥atmycl(参见Urao,Plant Mol.Biol.,32:571-57(1996);Conceicao,Plant,5:493-505(1994));拟南芥FIE(GenBank No.AF129516);拟南芥MEA;拟南芥FIS2(GenBank No.AF096096);和FIE 1.1(美国专利6,906,244)。可以为合适的其它启动子包括那些自下列基因衍生的启动子:玉米MAC1(参见Sheridan,Genetics,142:1009-1020(1996));玉米Cat3(参见GenBank No.L05934;Abler,Plant Mol.Biol.,22:10131-1038(1993))。其它启动子包括下列拟南芥启动子:YP0039,YP0101,YP0102,YP0110,YP0117,YP0119,YP0137,DME,YP0285,和YP0212。可以为有用的其它启动子包括下列稻启动子:p530c10,pOsFIE2-2,pOsMEA,pOsYp102,和pOsYp285。
vi.胚启动子
优先驱动受精后的合子细胞中的转录的调节区可以提供胚优先性表达。最合适的是在心期(heart stage)前的早期阶段胚中优先驱动转录的启动子,但是后期阶段和成熟胚中的表达也是合适的。胚优先性启动子包括大麦脂质转移蛋白(Ltp1)启动子(Plant Cell Rep 20:647-654(2001)),YP0097,YP0107,YP0088,YP0143,YP0156,PT0650,PT0695,PT0723,PT0838,PT0879和PT0740。
vii.光合组织启动子
在光合组织中有活性的启动子在绿色组织诸如叶和茎中赋予转录。最合适的是仅或主要在此类组织中驱动表达的启动子。此类启动子的例子包括核酮糖-1,5-二磷酸羧化酶(RbcS)启动子诸如来自美洲落叶松(eastern larch,Larix laricina)的RbcS启动子、松cab6启动子(Yamamoto等,Plant Cell Physiol.,35:773-778(1994))、来自小麦的Cab-1启动子(Fejes等,Plant Mol.Biol.,15:921-932(1990))、来自菠菜的CAB-1启动子(Lubberstedt等,Plant Physiol.,104:997-1006(1994))、来自稻的cab1R启动子(Luan等,Plant Cell,4:971-981(1992))、来自玉米的丙酮酸磷酸二激酶(pyruvate orthophosphate dikinase,PPDK)启动子(Matsuoka等,Proc.Natl.Acad.Sci.USA,90:9586-9590(1993))、烟草Lhcb1*2启动子(Cerdan等,Plant Mol.Biol.,33:245-255(1997))、拟南芥(Arabidopsis thaliana)SUC2蔗糖-H+同向转运体(symporter)启动子(Truernit等,Planta,196:564-570(1995))、和来自菠菜的类囊体膜蛋白启动子(psaD,psaF,psaE,PC,FNR,atpC,atpD,cab,rbcS)。其它光合组织启动子包括PT0535,PT0668,PT0886,YP0144,YP0380和PT0585。
viii.维管组织启动子
在维管束中具有高的或优先的活性的启动子的例子包括YP0087、YP0093、YP0108、YP0022、和YP0080。其它维管组织优先性启动子包括富含甘氨酸的细胞壁蛋白GRP 1.8启动子(Keller和Baumgartner,Plant Cell,3(10):1051-1061(1991))、鸭跖草黄斑点病毒(Medberry等,Plant Cell,4(2):185-192(1992))、和稻东格鲁杆状病毒(rice tungro bacilliform virus,RTBV)启动子(Dai等,Proc.Natl.Acad.Sci.USA,101(2):687-692(2004))。
ix.诱导型启动子
诱导型启动子响应外部刺激物诸如化学剂或环境刺激物而赋予转录。例如,诱导型启动子可以响应激素诸如赤霉酸或乙烯,或者响应光或干旱而赋予转录。干旱诱导型启动子的例子包括YP0380,PT0848,YP0381,YP0337,PT0633,YP0374,PT0710,YP0356,YP0385,YP0396,YP0388,YP0384,PT0688,YP0286,YP0377,PD1367和PD0901。氮诱导型启动子的例子包括PT0863、PT0829、PT0665、和PT0886。阴影诱导型启动子的例子包括PR0924和PT0678。由盐诱导的启动子的例子是rd29A(Kasuga等(1999)NatureBiotech 17:287-291)。
x.基础启动子
基础启动子是转录起始所需的转录复合物的装配必需的最小限度序列。基础启动子常常包括“TATA框”元件,其可以位于转录起始位点上游约15和35个核苷酸之间。基础启动子还可以包括“CCAAT框”元件(通常为序列CCAAT)和/或GGGCG序列,其可以位于转录起始位点上游约40和约200个核苷酸之间,通常约60至约120个核苷酸之间。
xi.茎启动子
茎启动子可以是对一种或多种茎组织特异性的或者对茎或其它植物部分特异性的。茎启动子可以在例如,表皮和皮层、维管形成层、原形成层、或木质部中具有高的或优先的活性。茎启动子的例子包括US20060015970中披露的YP0018及CryIA(b)和CryIA(c)(Braga等2003,Journal of New Seeds5:209-221)。
xii.其它启动子
其它种类的启动子包括但不限于枝优先性、愈伤组织(callus)优先性、毛状体细胞优先性、保卫细胞优先性诸如PT0678、块茎优先性、薄壁组织细胞优先性、和衰老优先性启动子。称作YP0086,YP0188,YP0263,PT0758,PT0743,PT0829,YP0119和YP0096的启动子(如上文提及的专利申请中所描述的)也可以是有用的。
xiii.其它调节区
5’非翻译区(UTR)可以包括在本文中所描述的核酸构建体中。5’UTR被转录,但不被翻译,并且位于转录物的起始位点和翻译起始密码子之间,而且可以包括+1核苷酸。3’UTR可以位于翻译终止密码子和转录物末端之间。UTR可以具有特定的功能诸如提高mRNA稳定性或削弱翻译。3’UTR的例子包括但不限于多腺苷酸化信号和转录终止序列,例如胭脂氨酸合酶终止序列。
要理解的是,超过一种调节区可以存在于重组多核苷酸中,例如内含子、增强子、上游激活区、转录终止子、和可诱导元件。如此,例如超过一种调节区可以可操作连接至编码生物质调控多肽的多核苷酸的序列。
调节区诸如内源基因的启动子可以通过化学合成或者通过从包含此类调节区的基因组DNA亚克隆来获得。包含此类调节区的核酸还可以包含侧翼序列,其含有便于后续操作的限制酶位点。
IV.转基因植物和植物细胞
A.转化
本发明的特征还在于包含本文中所描述的至少一种重组核酸构建体的转基因植物细胞和植物。植物或植物细胞可以通过具有整合入其基因组中的构建体来转化,即可以稳定转化。稳定转化的细胞通常随着每次细胞分裂而保留所导入的核酸。也可以瞬时转化植物或植物细胞,使得构建体不被整合入其基因组中。瞬时转化的细胞通常随着每次细胞分裂而丢失所导入核酸构建体的整个或一些部分,从而足够数目的细胞分裂后不能在子细胞中检测出所导入的核酸。瞬时转化的和稳定转化的转基因植物和植物细胞两者在本文中所描述的方法中可以是有用的。
本文中所描述的方法中使用的转基因植物细胞可以构成部分或整个全植物。此类植物可以以适合于所考虑物种的方式,或是在生长室,即温室中或者在大田中种植。根据需要可以为特定目的对转基因植物育种,例如以将重组核酸导入其它品系中,以将重组核酸转移至其它物种,或者用于进一步选择其它想要的性状。或者,对于那些适合此类技术的物种,转基因植物可以进行营养繁殖。如本文中所使用的,转基因植物还指初始转基因植物的后代,只要后代继承转基因。可以种植由转基因植物产生的种子,然后自交(或异型杂交并自交)以获得对于核酸构建体而言纯合的种子。
转基因植物可以以悬浮培养、或组织或器官培养方式培养。就本发明的目的而言,可以使用固体和/或液体组织培养技术。在使用固体培养基时,可以将转基因植物细胞直接放置到培养基上或者可以将其放置到滤纸上,然后将所述滤纸放置得与培养基接触。在使用液体培养基时,可以将转基因植物放置到浮选装置(例如接触液体培养基的多孔膜)上。固体培养基可以是例如Murashige和Skoog(MS)培养基,其含有琼脂和合适浓度的生长素(例如2,4-2,4-二氯苯氧乙酸(2,4-D))及合适浓度的细胞分裂素(例如激动素)。
在使用瞬时转化的植物细胞时,编码具有报告物活性的报告多肽的报告序列可以包括在转化方法中,而且可以在转化后的合适时间进行报告物活性或表达的测定法。适合于进行测定法的时间通常是转化后约1-21天,例如约1-14天、约1-7天、或约1-3天。瞬时测定法的使用对于不同物种中的快速分析,或者对于确认异源生物质调控多肽(其表达先前尚未在特定的接受细胞中得到确认)的表达是特别方便的。
用于将核酸导入单子叶和双子叶植物中的技术是本领域中已知的,包括但不限于土壤杆菌属(Agrobacterium)介导的转化、病毒载体介导的转化、电穿孔和基因枪转化,例如美国专利5,538,880;5,204,253;6,329,571和6,013,863。若使用细胞或培养组织作为供转化用的接受组织,则可以通过本领域技术人员已知的技术来从经转化的培养物再生植物(若想要的话)。
B.筛选/选择
可以对转基因植物的群体筛选和/或选择群体中具有由转基因表达赋予的性状或表型的那些成员。例如,可以对单一转化事件的后代群体筛选那些具有想要水平的生物质调控多肽或核酸表达的植物。可以使用物理和生化方法来鉴定表达水平。这些包括用于检测多核苷酸的Southern印迹或PCR扩增;用于检测RNA转录物的Northern印迹、S1 RNA酶保护、引物延伸、或RT-PCR扩增;用于检测多肽和多核苷酸的酶或核酶活性的酶促测定法;和用于检测多肽的蛋白质凝胶电泳、Western印迹、免疫沉淀、和酶联免疫测定法。也可以使用其它技术诸如原位杂交、酶染色、和免疫染色来检测多肽和/或多核苷酸的存在或表达。用于进行所有提及的技术的方法是已知的。作为备选,可以对包含独立转化事件的植物群体筛选那些具有想要的性状(诸如调控水平的生物质)的植物。可以在一个或多个世代里和/或在超过一处地理位置中进行选择和/或筛选。在一些情况中,可以在诱导想要的表型或在其它情况中对于在转基因植物中产生想要的表型必要的条件下种植和选择转基因植物。另外,可以在预期植物展现表型的特定发育阶段期间应用选择和/或筛选。可以进行选择和/或筛选以选择那些相对于缺乏转基因的对照植物在生物质水平上具有统计学显著差异的转基因植物。与相应的对照植物相比,选择或筛选的转基因植物具有改变的表型,如本文中“转基因植物表型”部分中所描述的。
C.植物物种
可以使用本文中所描述的多核苷酸和载体来转化许多单子叶和双子叶植物和植物细胞系统,包括来自下列各科之一的物种:爵床科(Acanthaceae)、葱科(Alliaceae)、六出花科(Alstroemeriaceae)、石蒜科(Amaryllidaceae)、夹竹桃科(Apocynaceae)、棕榈科(Arecaceae)、菊科(Asteraceae)、小檗科(Berberidaceae)、红木科(Bixaceae)、十字花科(Brassicaceae)、凤梨科(Bromeliaceae)、大麻科(Cannabaceae)、石竹科(Caryophyllaceae)、三尖杉科(粗榧科)(Cephalotaxaceae)、藜科(Chenopodiaceae)、秋水仙科(Colchicaceae)、葫芦科(Cucurbitaceae)、薯蓣科(Dioscoreaceae)、麻黄科(Ephedraceae)、古柯科(Erythroxylaceae)、大戟科(Euphorbiaceae)、豆科(Fabaceae)、唇形科(Lamiaceae)、亚麻科(Linaceae)、石松科(Lycopodiaceae)、锦葵科(Malvaceae)、黑药花科(Melanthiaceae)、芭蕉科(Musaceae)、桃金娘科(Myrtaceae)、蓝果树科(Nyssaceae)、罂粟科(Papaveraceae)、松科(Pinaceae)、车前科(Plantaginaceae)、禾本科(Poaceae)、蔷薇科(Rosaceae)、茜草科(Rubiaceae)、杨柳科(Salicaceae)、无患子科(Sapindaceae)、茄科(Solanaceae)、红豆杉科(紫杉科)(Taxaceae)、山茶科(Theaceae)、或葡萄科(Vitaceae)。
合适的物种可以包括下列属的成员:秋葵属(Abelmoschus)、冷杉属(Abies)、槭属(Acer)、翦股颖属(Agrostis)、葱属(Allium)、六出花属(Alstroemeria)、凤梨属(Ananas)、穿心莲属(Andrographis)、须芒草属(Andropogon)、嵩属(艾属)(Artemisia)、芦竹属(Arundo)、颠茄属(Atropa)、小檗属(Berberis)、甜菜属(Beta)、红木属(Bixa)、芸苔属(Brassica)、金盏花属(Calendula)、山茶属(Camellia)、喜树属(旱莲木属)(Camptotheca)、大麻属(Cannabis)、辣椒属(Capsicum)、红花属(Carthamus)、长春花属(Catharanthus)、三尖杉属(粗榧属)(Cephalotaxus)、茼嵩属(Chrysanthemum)、金鸡纳属(Cinchona)、西瓜属(Citrullus)、咖啡属(Coffea)、秋水仙属(Colchicum)、鞘蕊花属(Coleus)、香瓜属(甜瓜属)(Cucumis)、南瓜属(Cucurbita)、狗牙根属(Cynodon)、曼陀罗属(Datura)、石竹属(Dianthus)、毛地黄属(Digitalis)、薯蓣属(Dioscorea)、油棕属(Elaeis)、麻黄属(Ephedra)、蔗茅属(Erianthus)、古柯属(Erythroxylum)、桉属(Eucalyptus)、羊茅属(狐茅属)(Festuca)、草莓属(Fragaria)、雪花莲属(Galanthus)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、大麦属(Hordeum)、天仙子属(Hyoscyamus)、麻疯树属(Jatropha)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、石松属(Lycopodium)、木薯属(Manihot)、苜蓿属(Medicago)、薄荷属(Mentha)、芒属(获属)(Miscanthus)、芭蕉属(Musa)、烟草属(Nicotiana)、稻属(Oryza)、黍属(Panicum)、罂粟属(Papaver)、银胶菊属(Parthenium)、狼尾草属(Pennisetum)、碧冬茄属(Petunia)、虉草属(Phalaris)、梯牧草属(Phleum)、松属(Pinus)、早熟禾属(Poa)、一品红属(Poinsettia)、杨属(Populus)、萝芙木属(Rauwolfia)、蓖麻属(Ricinus)、蔷薇属(Rosa)、甘蔗属(Saccharum)、柳属(Salix)、血根草属(Sanguinaria)、赛莨菪属(Scopolia)、黑麦属(Secale)、茄属(Solanum)、高粱属(Sorghum)、大米草属(Spartina)、菠菜属(Spinacea)、菊嵩属(艾菊属)(Tanacetum)、红豆杉属(紫杉属)(Taxus)、可可树属(Theobroma)、小黑麦属(Triticosecale)、小麦属(Triticum)、Uniola、藜芦属(Veratrum)、蔓长春花属(Vinca)、葡萄属(Vitis)和玉蜀黍属(Zea)。
合适的物种包括黍(Panicum spp.)、高粱(Sorghum spp.)、芒(Miscanthusspp.)、甘蔗(Saccharum spp.)、蔗茅(Erianthus spp.)、杨(Populus spp.)、大须芒草(Andropogon gerardii,big bluestem)、象草(Pennisetum purpureum,elephant grass)、虉草(Phalaris arundinacea)(草芦(reed canarygrass))、狗牙根(Cynodon dactylon,bermudagrass)、苇状羊茅(Festuca arundinacea)(高羊茅(tall fescue))、草原大米草(Spartina pectinata)(草原绳草(prairie cord-grass))、紫苜蓿(Medicago sativa)(苜蓿)、芦竹(Arundo donax,giant reed)、黑麦(Secalecereale,rye)、柳(Salix spp.,willow)、桉(Eucalyptus spp.,eucalyptus)、小黑麦(Triticosecale)(小麦(triticum)-小麦X黑麦)和竹。
合适的物种还包括向日葵(Helianthus annuus,sunflower)、红花(Carthamus tinctorius,safflower)、麻疯树(Jatropha curcas,jatropha)、蓖麻(Ricinus communis,castor)、油棕(Elaeis guineensis)(棕榈(palm))、亚麻(Linumusitatissimum,flax)、和芥菜(Brassica juncea)。
合适的物种还包括甜菜(Beta vulgaris,sugarbeet)、和木薯(Manihotesculenta,cassava)。
合适的物种还包括番茄(Lycopersicon esculentum,tomato)、莴苣(Lactucasativa,lettuce)、粉芭蕉(Musa paradisiacal)(香蕉)、马铃薯(Solanum tuberosum,potato)、甘蓝(Brassica oleracea)(花椰菜(broccoli)、花椰菜(cauliflower)、孢子甘蓝(Brussels sprouts))、茶(Camellia sinensis,tea)、草莓(Fragaria ananassa,strawberry)、可可(Theobroma cacao,cocoa)、小果咖啡(Coffea arabica)(咖啡)、葡萄(Vitis vinifera,grape)、凤梨(Ananas comosus,pineapple)、辣椒(Capsicumannum)(辣椒和甜椒)、洋葱(Allium cepa,onion)、香瓜(Cucumis melo)(甜瓜(melon))、黄瓜(Cucumis sativus,cucumber)、笋瓜(Cucurbita maxima)(南瓜(squash))、南瓜(番瓜)(Cucurbita moschata,squash)、菠菜(Spinacea oleracea,spinach)、西瓜(Citrullus lanatus,watermelon)、咖啡黄葵(Abelmoschusesculentus)(秋葵(okra))、和茄(Solanum melongena,eggplant)。
合适的物种还包括罂粟(Papaver somniferum,opium poppy)、鬼罂粟(Papaver orientale)、欧洲红豆杉(Taxus baccata)、短叶红豆杉(Taxusbrevifolia)、黄花嵩(Artemisia annua)、大麻(Cannabis sativa)、旱莲木(Camptotheca acuminate)、长春花(Catharanthus roseus)、长春花(Vinca rosea)、正鸡纳树(Cinchona officinalis)、秋水仙(Colchicum autumnale)、Veratrumcalifornica、毛花洋地黄(Digitalis lanata)、毛地黄(Digitalis purpurea)、薯蓣(Dioscorea spp.)、穿心莲(Andrographis paniculata)、颠茄(Atropa belladonna)、曼陀罗(Datura stomonium)、小檗(Berberis spp.)、三尖杉(Cephalotaxus spp.)、草麻黄(Ephedra sinica)、麻黄(Ephedra spp.)、古柯(Erythroxylum coca)、Galanthus wornorii、赛莨菪(Scopolia spp.)、蛇足石松(Lycopodium serratum)(=蛇足石杉(Huperzia serrata))、石松(Lycopodium spp.)、蛇根木(Rauwolfiaserpentine)、萝芙木(Rauwolfia spp.)、加拿大血根草(Sanguinaria canadensis)、天仙子(Hyoscyamus spp.)、金盏花(Calendula officinalis)、小白菊(Chrysanthemum parthenium)、毛喉鞘蕊花(Coleus forskohlii)、和小白菊(Tanacetum parthenium)。
合适的物种还包括灰白银胶菊(Parthenium argentatum)(银胶菊)、橡胶树(Hevea spp.)(橡胶)、留兰香(Mentha spicata)(薄荷)、辣薄荷(Mentha piperita)(薄荷)、红木(Bixa orellana)和六出花(Alstroemeria spp.)。
合适的物种还包括蔷薇(Rosa spp.)(蔷薇/玫瑰(rose))、香石竹(Dianthuscaryophyllus,carnation)、碧冬茄(Petunia spp.,petunia)和一品红(Poinsettiapulcherrima,poinsettia)。
合适的物种还包括烟草(Nicotiana tabacum,tobacco)、白羽扇豆(Lupinusalbus)(羽扇豆(lupin))、海燕麦(Uniola paniculata)(燕麦)、剪股颖(bentgrass,Agrostis spp.)、美洲山杨(Populus tremuloides)(白杨)、松(Pinus spp.,pine)、冷杉(Abies spp.,fir)、槭(Acer spp.,maple)、大麦(Hordeum vulgare,barley)、草地早熟禾(Poa pratensis)(蓝草)、黑麦草(Lolium spp.,ryegrass)和梯牧草(Phleum pretense,timothy)。
在一些实施方案中,合适的物种可以是野生的、杂草似的、或栽培的狼尾草物种,诸如但不限于狼尾草(Pennisetum alopecuroides)、Pennisetumarnhemicum、Pennisetum caffrum、铺地狼尾草(Pennisetum clandestinum)、Pennisetum divisum、Pennisetum glaucum、西藏狼尾草(Pennisetum latifolium)、Pennisetum macrostachyum、非洲狼尾草(Pennisetum macrourum)、东方狼尾草(Pennisetum orientale)、花梗狼尾草(Pennisetum pedicellatum)、多穗狼尾草(Pennisetum polystachion)、Pennisetum polystachion ssp.Setosum、象草(Pennisetum purpureum)、牧地狼尾草(Pennisetum setaceum)、Pennisetumsubangustum、Pennisetum typhoides、羽绒狼尾草(Pennisetum villosum)、或其杂种(例如,象草x Pennisetum typhoidum)。
在一些实施方案中,合适的物种可以是野生的、杂草似的、或栽培的芒物种和/或变种,诸如但不限于奇岗、芒(Miscanthus sinensis)、芒x ogiformis、五节芒(Miscanthus floridulus)、高山芒(Miscanthus transmorrisonensis)、Miscanthus oligostachyus、尼泊尔双药芒(Miscanthus nepalensis)、获(Miscanthus sacchariflorus)、奇岗“Amuri”、奇岗“Nagara”、奇岗“Illinois”、芒“Goliath”变种、芒“Roland”变种、芒“Africa”变种、芒“Fern Osten”变种、芒gracillimus变种、芒variegates变种、芒purpurascens变种、芒“Malepartus”变种、获“Robusta”变种、芒“Silberfedher”变种(又名SilverFeather)、高山芒、Miscanthus condensatus、Miscanthus yakushimanum、芒“Alexander”变种、芒“Adagio”变种、芒“Autumn Light”变种、芒“Cabaret”变种、芒“Condensatus”变种、芒“Cosmopolitan”变种、芒“Dixieland”变种、芒“Gilded Tower”变种(美国专利No.PP14,743)、芒“Gold Bar”变体(美国专利No.PP15,193)、芒“Gracillimus”变种、芒“Graziella”变种、芒“Grosse Fontaine”变种、芒“Hinjo aka Little Nicky”TM变种、芒“Juli”变种、芒“Kaskade”变种、芒“Kirk Alexander”变种、芒“Kleine Fontaine”变种、芒“Kleine Silberspinne”变种(又名“Little Silver Spider”)、芒“LittleKitten”变种、芒“Little Zebra”变种(美国专利No.PP13,008)、芒“Lottum”变种、芒“Malepartus”变种、芒“Morning Light”变种、芒“Mysterious Maiden”变种(美国专利No.PP16,176)、芒“Nippon”变种、芒“November Sunset”变种、芒“Parachute”变种、芒“Positano”变种、芒“Puenktchen”变种(又名“Little Dot”)、芒“Rigoletto”变种、芒“Sarabande”变种、芒“Silberpfeil”变种(又名Silver Arrow)、芒“Silverstripe”变种、芒“Super Stripe”变种(美国专利No.PP18,161)、芒“Strictus”变种、或芒“Zebrinus”变种。
在一些实施方案中,合适的物种可以是野生的、杂草似的、或栽培的高粱物种和/或变种,诸如但不限于杂高粱(Sorghum almum)、Sorghum amplum、Sorghum angustum、Sorghum arundinaceum、高粱(Sorghum bicolor)(诸如高粱(bicolor)、几内亚高粱(guinea)、尾状高粱(caudatum)、高粱(kafir)、和硬秆高粱(durra))、Sorghum brachypodum、Sorghum bulbosum、Sorghum burmahicum、Sorghum controversum、Sorghum drummondii、Sorghum ecarinatum、Sorghumexstans、Sorghum grande、石茅(Sorghum halepense)、Sorghum interjectum、Sorghum intrans、Sorghum laxiflorum、Sorghum leiocladum、Sorghummacrospermum、Sorghum matarankense、Sorghum miliaceum、黑高粱(Sorghumnigrum)、光高粱(Sorghum nitidum)、羽高粱(Sorghum plumosum)、拟高粱(Sorghum propinquum)、Sorghum purpureosericeum、Sorghum stipoideum、苏丹草(Sorghum sudanensese)、Sorghum timorense、Sorghum trichocladum、Sorghum versicolor、Sorghum virgatum、高粱(Sorghum vulgare)、或杂种诸如杂高粱(Sorghum×almum)、苏丹草(Sorghum x sudangrass)或Sorghum×drummondii。
如此,可以在宽范围的植物物种里使用所述方法和组合物,包括来自双子叶植物属芸苔属、红花属、大豆属、棉属、向日葵属、麻疯树属、银胶菊属、杨属和蓖麻属;和单子叶植物属油棕属、羊茅属、大麦属、黑麦草属、稻属、黍属、狼尾草属、梯牧草属、早熟禾属、甘蔗属、黑麦属、高粱属、小黑麦属、小麦属、和玉蜀黍属的物种。在一些实施方案中,植物是下列物种的成员:柳枝稷(Panicum virgatum,switchgrass)、高粱(Sorghum bicolor)(高粱,苏丹草)、奇岗(芒)、甘蔗(Saccharum sp.)(能源蔗(energycane))、小叶杨(Populus balsamifera)(杨)、玉蜀黍(Zea mays)(玉米)、大豆(Glycine max,soybean)、欧洲油菜(Brassica napus)(芸苔)、普通小麦(Triticum aestivum)(小麦)、陆地棉(Gossypium hirsutum)(棉)、稻、向日葵、紫苜蓿(苜蓿)、甜菜(甜菜)、或Pennisetum glaucum(珍珠粟(pearl millet))。
在某些实施方案中,可以使用本文中所描述的多核苷酸和载体来转化许多单子叶和双子叶植物和植物细胞系统,其中此类植物是不同物种的杂种或特定物种的品种(例如甘蔗(Saccharum sp.)X芒(Miscanthus sp.)、高粱X芒,例如柳枝稷x Panicum amarum、柳枝稷x Panicum amarulum、和象草x香蒲狼尾草)。
D.转基因植物表型
在一些实施方案中,生物质调控多肽表达受到调控的植物可以在植物中具有水平升高的生物质。例如,本文中所描述的生物质调控多肽可以在转基因植物中表达,导致营养组织的水平升高。与不表达转基因的相应对照植物中的生物质水平相比,生物质水平可以升高至少2%,例如2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,25,30,35,40,45,50,55,60,或大约60%。在一些实施方案中,生物质调控多肽表达受到调控的植物可以具有水平降低的种子产量。与不表达转基因的相应对照植物中的种子产量水平相比,该水平可以降低至少2%,例如2,3,4,5,10,15,20,25,30,35或超过35%。
此类植物中的种子产量增加可以在植物食物摄取经常不足或生物燃料生产的地理位置提供改善的营养利用度。在一些实施方案中,此类植物中生物质的减少在营养组织不是为了人和动物消耗而收获的主要植物部分(即,收获种子)的情况中可以是有用的。
在一些实施方案中,生物质调控多肽表达受调控的植物在一种或多种植物组织,例如营养组织、生殖组织、或根组织中可以具有升高或降低水平的生物质。例如,与不表达转基因的相应对照植物中的生物质水平相比,生物质水平可以升高至少2%,例如2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,25,30,35,40,45,50,55,60,或超过60%。在一些实施方案中,生物质调控多肽表达受调控的植物在一种或多种植物组织中可以具有降低水平的生物质。与不表达转基因的相应对照植物中的生物质水平相比,生物质水平可以降低至少2%,例如2,3,4,5,10,15,20,25,30,35,或大于35%。
此类植物中的生物质增加可以提供改善的食物质量或改善的能量产生。生物质减少可以对为了人或动物消耗而收获的植物部分提供更有效的营养物分配。
通常,认为相对于对照植物或细胞,转基因植物或细胞中生物质的量的差异在合适的参数或非参数统计量(例如卡方检验(卡方检验)、Student氏t检验、Mann-Whitney检验、或F检验)的情况中在p≤0.05时是统计学显著的。在一些实施方案中,生物质的量的差异在p<0.01、p<0.005、或p<0.001时是统计学显著的。与对照植物的量相比在例如转基因植物中的生物质的量上的统计学显著差异指明转基因植物中存在的重组核酸导致改变的生物质水平。
相对于对照植物评估转基因植物的表型。在植物展现出由感兴趣的植物展现的多肽或编码多肽的mRNA量的小于10%,例如小于9%,8%,7%,6%,5%,4%,3%,2%,1%,0.5%,0.1%,0.01%,或0.001%时,植物被说成“不表达”多肽。可以使用方法来评估表达,所述方法包括例如,RT-PCR、Northern印迹、S1 RNA酶保护、引物延伸、Western印迹、蛋白质凝胶电泳、免疫沉淀、酶联免疫测定法、芯片测定法、和质谱法。应当注意到,如果多肽在组织优先性或广泛表达型启动子的控制下表达,那么可以在整个植物中或者在选定的组织中评估表达。类似地,如果多肽在特定的时间(例如在发育中或诱导后的特定时间)表达,那么可以在想要的时段选择性评估表达。
生物质可以包括可收获的植物组织诸如叶、茎、和生殖结构,或所有植物组织诸如叶、茎、根、和生殖结构。在一些实施方案中,生物质仅涵盖地上植物部分。在一些实施方案中,生物质仅涵盖茎植物部分。在一些实施方案中,生物质仅涵盖植物的除了花序外的地上植物部分和种子部分。可以测量生物质,如实施例部分中所描述的。生物质可以以干物质产量量化,所述干物质产量是在从新鲜物质重量扣除水的贡献时产生的生物质质量(通常以T/英亩报告)。在以下等式中使用新鲜物质重量(FMW)和重量百分比水分(M)的测量来计算干物质产量(DMY)产量。DMY=((100-M)/100)*FMW。生物质可以以新鲜物质产量量化,所述新鲜物质产量是按原样计的所生成生物质的质量(通常以T/英亩报告),其包括水分重量。
V.修饰编码生物质调控多肽的内源核酸
本文件的特征还在于本文中所描述的内源生物质调控核酸已经进行过修饰(例如,已经修饰生物质调控核酸的调节区、内含子、或编码区)的植物细胞和植物。相对于内源核酸未修饰的对照植物的相应水平,改变此类植物的生物质。此类植物在本文中称为经修饰的植物,并且可以用于生成例如,增加量的生物质。
可以通过同源重组技术来修饰内源核酸。例如,可以使用序列特异性内切核酸酶(例如,锌指核酸酶(ZFN))和大范围核酸酶来刺激内源植物基因处的同源重组。参见例如Townsend等,Nature 459:442-445(2009);Tovkach等,PlantJ.,57:747-757(2009);及Lloyd等,Proc.Natl.Acad.Sci.USA,102:2232-2237(2005)。具体地,可以使用工程化改造为在特定基因座处创建DNA双链断裂的ZFN来在内源植物基因中产生靶向性序列变化。例如,可以用含有一处或多处突变(例如使用定点诱变或定向进化产生)的变体来替换内源植物基因。
在一些实施方案中,可以通过甲基化或脱甲基化来修饰内源核酸,从而改变经修饰的内源核酸的表达。例如,可以使用双链RNA来激活基因表达,其通过靶向基因启动子中的非编码调节区来实现。参见Shibuya等,Proc NatlAcad Sci USA,106(5):1660-1665(2009);及Li等,Proc Natl Acad Sci USA,103(46):17337-42(2006)。
在一些实施方案中,可以使用激活标签来修饰内源核酸。例如,可以使用含有来自花椰菜花叶病毒(CaMV)35S基因的组成性活性启动子的多拷贝增强子元件的载体来激活内源基因。参见Weigel等,Plant Physiology,122:1003-1013(2000)。
在一些实施方案中,可以通过引入经工程化改造的转录激活/阻抑因子(例如,锌指蛋白转录因子、或ZFP TF,参见例如,万维网于sangamo.com/tech/tech_plat_over.html#whatarezfp)来修饰内源核酸。经工程化改造的转录激活/阻抑因子(诸如ZFP TF)可以通过特异性结合内源基因的启动子区或编码区来激活、抑制、或转换目标内源生物质基因表达。
在一些实施方案中,可以通过诱变来修饰内源核酸。可以使用一种或多种诱变剂来在可再生的植物组织内引入遗传突变。合适的诱变剂包括例如,甲基磺酸乙酯(EMS)、N-亚硝基-N-乙脲(ENU)、甲基N-亚硝基胍(MNNG)、溴化乙锭、双环氧丁烷、电离辐射、x-射线、UV射线和本领域中已知的其它诱变剂。合适的突变类型包括例如,核苷酸的插入或缺失、和内源核酸序列中的转换或颠换。在一个实施方案中,可以使用TILLING(靶向诱导基因组局部损伤(Targeted Induced Local Lesions In Genomes))来生成具有经修饰的内源核酸的植物。TILLING组合高密度诱变与高通量筛选方法。参见例如,McCallum等,Nat Biotechnol 18:455-457(2000);综述见Stemple,Nat RevGenet 5(2):145-50(2004)。
在一些实施方案中,可以经由基因沉默技术来修饰内源核酸。参见例如,本文中关于“抑制生物质调控多肽表达”的部分。
也可以对植物群体筛选和/或选择群体中那些具有通过经修饰的核酸表达赋予的性状或表型的成员。作为备选,可以对植物群体筛选那些具有期望性状,诸如调控水平的生物质的植物。例如,可以对后代群体筛选那些具有期望水平的生物质调控多肽或核酸表达的植物。可以使用物理和生物化学方法来鉴定经修饰的核酸和/或表达水平,如转基因植物情况中所描述的。可以在一个或多个世代里和/或在超过一处地理位置中进行选择和/或筛选。在一些情况中,可以在诱导想要的表型或在其它情况中对于在经修饰的植物中产生想要的表型必要的条件下种植和选择植物。另外,可以在预期植物展现表型的特定发育阶段期间应用选择和/或筛选。可以进行选择和/或筛选以选择那些相对于核酸尚未修饰的对照植物在生物质水平上具有统计学显著差异的经修饰的植物。与相应的对照植物相比,选择或筛选的经修饰植物具有改变的表型,如本文中“转基因植物表型”部分中所描述的。
虽然内源生物质调控核酸进行过修饰的植物或植物细胞对于所述特定核酸而言不是转基因的,但是应当领会,此类植物或细胞可以含有转基因。例如,经修饰的植物可以含有其它性状,诸如除草剂耐受性或昆虫抗性的转基因。作为另一个例子,经修饰的植物可以含有一种或多种转基因,其与一种或多种内源核酸的修饰一起展现出生物质增加。
如同转基因植物细胞一样,经修饰的植物细胞可以构成部分或整个全植物。可以以与对转基因植物所描述的相同方式种植此类植物,并可以以与对转基因植物所描述的相同的方式育种或增殖。
VI.植物育种
在此类方法中有用的遗传多态性包括简单序列重复(SSR或微卫星)、多态性DNA的快速扩增(RAPD)、单核苷酸多态性(SNP)、扩增片段长度多态性(AFLP)和限制性片段长度多态性(RFLP)。可以例如通过制备序列特异性探针,并通过PCR来扩增来自感兴趣群体中的个体的模板DNA,从而鉴定SSR多态性。例如,可以使用PCR技术来酶促扩增赋予特定性状的核苷酸序列(例如本文中所描述的核苷酸序列)结合的遗传标志物。可以使用PCR来扩增来自DNA的特定序列及RNA,包括来自总基因组DNA或总细胞RNA的序列。在使用RNA作为模板来源时,可以使用逆转录酶来合成互补DNA(cDNA)链。各种PCR方法记载于例如,PCR Primer:A Laboratory Manual,Dieffenbach和Dveksler编,Cold Spring Harbor Laboratory Press,1995。
一般地,采用来自感兴趣区域侧翼或之外的多核苷酸的序列信息来设计寡核苷酸引物,它们在序列上与要扩增模板的相反链相同或相似。引物的长度通常是14至40个核苷酸,但是长度范围可以是10个核苷酸至数百个核苷酸。将模板和扩增的DNA于较高的温度重复变性以分开双链,然后冷却以让引物退火,并延长核苷酸序列到微卫星,生成足以检测PCR产物的DNA。若探针在群体中的SSR侧翼,则会生成不同大小的PCR产物。参见例如美国专利5,766,847。
可以使用数种技术来定性或定量分析PCR产物。例如,可以用荧光分子(例如,
Figure BDA0000145034540000721
Figure BDA0000145034540000722
)将PCR产物染色,并使用分光光度计或毛细管电泳来在溶液中检测。在一些情况中,可以通过电泳将PCR产物在凝胶基质(例如,琼脂糖或聚丙烯酰胺)中分离,并可以使用核酸染色剂来显现包含PCR产物的大小分级条带。合适的染色剂能在UV光下发荧光(例如,溴化乙锭,GR Safe,绿,或
Figure BDA0000145034540000732
金)。可以经由透照法或表-照明(epi-illumination)来显现结果,并可以使用例如照相机或扫描仪来获取荧光样式的图像。可以使用专门的软件(例如,ImageJ)来加工并分析图像以相对于相同凝胶上加载的标准品测量并比较感兴趣条带的强度。
或者,可以通过使用PCR产物作为针对来自群体中不同个体的Southern印迹的探针来鉴定SSR多态性。参见U.H.Refseth等,(1997)Electrophoresis 18:1519。简言之,经由凝胶电泳根据长度分离产物,并将其转移至膜。将SSR特异性DNA探针,诸如用放射性、荧光、或生色分子标记的寡核苷酸应用于膜,并与具有互补核苷酸序列的结合PCR产物杂交。例如,可以通过放射自显影或者通过在膜上显色来显现杂交样式。
在一些情况中,可以使用实时热循环仪检测系统来量化PCR产物。例如,定量实时PCR可以使用形成DNA-染料-复合物的荧光染料(例如,
Figure BDA0000145034540000733
绿),或含有荧光团的DNA探针,诸如与荧光报告物或荧光团(例如6-羧基荧光素或四氯荧光素)和猝灭剂(例如,四甲基罗丹明或二氢环吡咯吲哚三肽小沟结合剂)共价结合的单链寡核苷酸。荧光信号容许实时检测扩增产物,由此指示感兴趣序列的存在,并容许量化细胞DNA中的感兴趣序列的拷贝数或来自细胞mRNA的感兴趣序列的表达水平。
鉴定RFLP的讨论见例如,Alonso-Blanco等(Methods in MolecularBiology,第82卷,“Arabidopsis Protocols”,第137页-第146页,J.M.Martinez-Zapater和J.Salinas编,c.1998 Humana Press,Totowa,NJ);Burr(“Mapping Genes with Recombinant Inbreds”,第249页-第254页,于Freeling,M.和V.Walbot(编),The Maize Handbook,c.1994 Springer-Verlag New York,Inc.:New York,NY,USA;Berlin Germany;Burr等Genetics(1998)118:519;及Gardiner,J.等,(1993)Genetics 134:917)。例如,为了生成用单一或低拷贝表达的序列富集的RFLP文库,可以用甲基化灵敏的酶(例如,PstI)来消化总DNA。经消化的DNA可以在制备凝胶上根据大小分离。可以将多核苷酸片段(500至2000bp)切出,洗脱并克隆入质粒载体(例如,pUC18)中。可以用总的剪切DNA探查质粒消化物的Southern印迹以选择与单一和低拷贝序列杂交的克隆。可以测试别的限制性内切核酸酶以增加所检出多态性的数目。
鉴定AFLP的讨论见例如,EP 0534858和美国专利No.5,878,215。一般地,用一种或多种限制酶消化总细胞DNA。将限制性半位点特异性衔接头连接至所有限制性片段,并用具有相应衔接头和限制性位点特异性序列的两个PCR引物选择性扩增。可以在大小分级后显现PCR产物,如上文所讨论的。
在一些实施方案中,所述方法涉及对植物系育种。此类方法在标志物辅助育种程序中使用如上文所鉴定的遗传多态性以便于开发在生物质性状上具有期望的变化的品系。一旦合适的遗传多态性被鉴定为与性状变化有关,则鉴定拥有与期望的变化相关联的多态性等位基因的一个或多个个体植物。然后,在育种程序中使用那些植物以组合多态性等位基因与其它基因座处的多种其它等位基因,它们与想要的变化相关联。适合于在植物育种程序中使用的技术是本领域中已知的,包括(不限于)回交、混合选择、谱系育种、集团选择、与另一个群体杂交和轮回选择。可以在育种程序中单独或者与一种或多种其它技术联合使用这些技术。如此,将每个鉴定的植物自交或者与不同植物杂交以产生种子,然后使所述种子发芽以形成后代植物。然后将至少一个所述后代植物自交或者与不同植物杂交以形成后续后代世代。育种程序可以酌情将自交或异型杂交步骤再重复0至5个世代以在所得的植物品系中实现想要的一致性和稳定性,所述所得的植物品系保留多态性等位基因。在大多数育种程序中,将在每个世代中进行特定多态性等位基因的分析,虽然可以在交替世代中进行分析(若想要的话)。
在一些情况中,还进行其它有用性状的选择,例如选择真菌抗性或细菌抗性。此类其它性状的选择可以在鉴定拥有想要的多态性等位基因的个体植物之前、期间或之后进行。
VII.制品(Articles of Manu)
本文中提供的转基因植物在农业和能源生产工业中具有多种用途。例如,可以使用本文中所描述的转基因植物来制备动物饲料和食物产品。然而,此类植物作为能源生产的给料常常是特别有用的。
相对于缺乏外源核酸的对照植物,本文中所描述的转基因植物常常产生较高的每公顷谷粒和/或生物质的产率。在一些实施方案中,相对于降低的输入诸如肥料和/或水的条件下种植时的对照植物,此类转基因植物提供相等的或甚至增加的每公顷谷粒和/或生物质的产率。如此,可以使用此类转基因植物来以较低的输入成本和/或在环境应激条件诸如干旱下提供产率稳定性。在一些实施方案中,本文中所描述的植物具有容许更有效地加工成游离糖及随后为乙醇以进行能量产生的组成。在一些实施方案中,相对于对照植物,此类植物提供更高的每千克植物材料的乙醇、丁醇、二甲醚、其它生物燃料分子、和/或糖衍生的副产物产率。认为此类加工效率源自植物材料的组成,包括但不限于葡聚糖、纤维素、半纤维素、和木质素含量。通过以相等的或甚至降低的生产成本提供较高的生物质产率,本文中所描述的转基因植物改善农民和加工者的收益性及降低消费者的成本。
可以将来自本文中所描述的转基因植物的种子条件化(condition),并通过本领域中已知的手段装入包装材料中以形成制品。包装材料诸如纸和布是本领域中公知的。种子包装可以具有描述其中的种子性质的标记,例如缚住包装材料的标签或标记、印刷在包装材料上的标记、或插入包装内的标记。
本发明会在以下实施例中进一步地描述,所述实施例不限制权利要求书中所描述的本发明的范围。
VIII.实施例
实施例1:转基因稻植物
就稻转化而言使用下列符号:T0:自经转化的组织培养物再生的植物;T1:自花传粉的T0植物的第一代后代;T2:自花传粉的T1植物的第二代后代;T3:自花传粉的T2植物的第三代后代。
以下是自拟南芥植物分离的核酸的列表:CeresAnnot:544549(SEQ IDNO:262),CeresAnnot:1355066(SEQ ID NO:116),CeresClone:1356785(SEQID NO:252),CeresClone:26006(SEQ ID NO:594),CeresClone:4831(SEQ IDNO:76),CeresAnnot:847799(SEQ ID NO:208)和CeresAnnot:878355(SEQ IDNO:425)。自玉蜀黍植物分离以下核酸:CeresClone:1384304(SEQ IDNO:553)。自稻植物分离以下核酸:反义序列(SEQ ID NO:678)。自大豆植物分离CeresClone:638126(SEQ ID NO:322)。
将上文所描述的每种分离的核酸克隆入含有膦丝菌素乙酰基转移酶基因(其对经转化的植物赋予FinaleTM抗性)的Ti质粒载体中。使用上文所提及的核酸来生成构建体,所述核酸分别与326启动子可操作连接。通过土壤杆菌介导的转化方案来将构建体导入稻栽培种Kitaake的愈伤组织细胞中(Constructs were made using the above mentioned nucleic acids that containedeach operably linked to a 326 promoter construct was introduced into callus cellsof the rice cultivar Kitaake by an Agrobacterium-mediated transformationprotocol)。自每次转化及对对照质粒(空载体)产生约20-30个独立的T0转基因植物。初步表型分析指示T0转化体在营养器官中没有显示任何显著的表型异常,例外的是一些植物表现为小的及能育性降低,这最可能是由于组织培养效果所致。
将T0植物在温室中种植,容许自花传粉,并收集T1种子。在田间种植T1和T2植物。通过PCR确认每个构建体的存在。
将稻种子浸泡3-4天,之后春天萌发(spring germination),并在约一个月后在中国廊坊(Langfang,China)移植到田间。行间距离是25cm,而植物间距离是15cm。刚好在移植前以25kg/mu(666.7m2)应用组合的肥料(16N-16P-16K)。在圆锥花序形成前的生长季节期间两次应用12.5kg/mu尿素。
在一行内每个转基因事件种植10个植物。仅测量与对照植物明显不同的那些行。在成熟时测量植物高度。
自种植的T1植物收集CW00733,CW00710,CW00628,CW00604,CW00564,CW00469和CW00536的生物质(干重量)测量。将具有叶和叶鞘,但没有圆锥花序的茎在温室中干燥至少一个月,然后对每个植物称重(对于每个植物,将所有分蘖一起称重)。自种植的T2植物收集CW00191,CW00297和CW00319的测量。
将具有叶和叶鞘,但具有分开的圆锥花序的茎在室中干燥至少一个月,然后对每个植物称重(对于每个植物,将所有分蘖一起称重)。在生长4月后对分蘖数目计数。
实施例2:稻事件CW00733,CeresClone:1384304,(SEQ ID NO:553)的结果
分析来自含有CeresClone:1384304的CW00733的一个事件的T1种子,如实施例1中所描述的。表1中显示了与相同位置种植的不含转基因的植物相比转基因T1植物的植物高度、生物质、和圆锥花序重量。每个表数据行对应于田间行。数据点代表10个转基因植物(1行相同事件)的平均值和40个对照植物(4行)的平均值。与不含转基因的植物相比,显示了生物质、高度和圆锥花序重量的增加。
表1
Figure BDA0000145034540000771
表2中显示了与相同位置种植的不含转基因的植物(WT)相比转基因T2CW00733植物的植物高度(cm)、产率(以g/16个植物的每圆锥花序测量)、和生物质(以g仅茎(无花序或根)测量)。表2中也显示了来自CW00604事件(实施例7)的结果。观察到高度和生物质的增加。
表2
来自CW00733和CW00604事件的T2植物
Figure BDA0000145034540000772
实施例3:稻事件CW00319,CeresAnnot:544549(SEQ ID NO:262)的结果
分析从来自含有Ceres Annot:544549的CW00319的一个事件的T2和T3种子种植的植物的生物质,如实施例1中所描述的。表3中显示了与相同位置种植的不含转基因的植物相比转基因T2和T3植物的平均生物质。以随机化区组设计将具有代表多个事件的转基因植物和对照的低氮样地和对照样地各重复3次。每个样地含有40个植物。对于CW00319的一个事件,每个样地测量10个植物。表3中呈现的每个生物质数值代表测量的30个植物的平均值。结果显示了与不含转基因的植物相比在低氮条件下的转基因植物的测量的生物质增加。
表3
Figure BDA0000145034540000781
实施例4:稻事件CW00710,Ceres Annot:1355066(SEQ ID NO:116)的结果
分析来自含有Ceres Annot:1355066的CW00710的一个事件的T1种子,如实施例1中所描述的。表4中显示了与相同位置种植的不含转基因的植物相比转基因T1植物的植物高度、生物质、和圆锥花序重量。表数据行对应于田间行。数据点代表10个转基因植物(1行相同事件)的平均值和40个对照植物(4行)的平均值。与不含转基因的植物相比,显示了生物质和高度的增加。
表4
Figure BDA0000145034540000782
实施例5:稻事件CW00628(SEQ ID NO:678)的结果
分析来自含有SEQ ID NO:678RNAi构建体的CW00628的一个事件的T1种子,如实施例1中所描述的。表5中显示了与相同位置种植的不含转基因的植物相比转基因T1植物的植物高度、生物质、和圆锥花序重量。表数据行对应于田间行。数据点代表10个转基因植物(1行相同事件)的平均值和40个对照植物(4行)的平均值。与不含转基因的植物相比,显示了生物质和高度的增加。
表5
Figure BDA0000145034540000783
实施例6:稻事件CW00297,Ceres Clone:625057(SEQ ID NO:644)的结果
分析从来自含有Ceres Clone:625057的CW00297的一个事件的T2和T3种子种植的植物的生物质,如实施例1中所描述的。表6中显示了与相同位置种植的不含转基因的植物相比转基因T2和T3植物的平均生物质。以随机化区组设计将具有代表多个事件的转基因植物和对照的低氮样地和对照样地各重复3次。每个样地含有40个植物。对于CW00297的一个事件,每个样地测量10个植物。表6中呈现的每个生物质数值代表测量的30个植物的平均值。结果显示了与不含转基因的植物相比在正常的和低的氮条件下的转基因植物的测量的生物质增加。
表6
实施例7:稻事件CW00604,Ceres Clone:1356785(SEQ ID NO:252)的结果
分析来自含有Ceres Clone:1356785的CW00604的一个事件的T1种子,如实施例1中所描述的。表7中显示了与相同位置种植的不含转基因的植物相比转基因T1植物的植物高度、生物质、和圆锥花序重量。每个表数据行对应于田间行。数据点代表10个转基因植物(1行相同事件)的平均值和40个对照植物(4行)的平均值。与不含转基因的植物相比,显示生物质、高度和圆锥花序重量的增加。还对T2植物观察到高度和生物质的增加。参见表2。
表7
Figure BDA0000145034540000792
实施例8:稻事件CW00564,Ceres Clone:638126(SEQ ID NO:322)的结果
分析来自含有Ceres Clone:638126的CW00564的一个事件的T1种子,如实施例1中所描述的。表8中显示了与相同位置种植的不含转基因的植物相比转基因T1植物的植物高度、生物质、和圆锥花序重量。表数据行对应于田间行。数据点代表10个转基因植物(1行相同事件)的平均值和40个对照植物(4行)的平均值。与不含转基因的植物相比,显示生物质、高度和圆锥花序重量的增加。
表8
Figure BDA0000145034540000801
表9中显示了与相同位置种植的不含转基因的植物(WT)相比转基因T2CW00564植物的植物高度(cm)、产率(以g/16个植物的每圆锥花序测量)、和生物质(以g仅茎(无花序或根)测量)。表9中也显示了来自CW00469事件(实施例10)的结果。观察到高度、产率和生物质的增加。
表9
来自CW00564和CW00469事件的T2植物
Figure BDA0000145034540000802
实施例9:稻事件CW00010,Ceres Clone:26006(SEQ ID NO:594)的结果
分析来自含有Ceres Clone:26006的CW00010的3个事件的T1种子,如实施例1中所描述的。表10、11、和12中显示了与相同位置种植的不含转基因的植物相比转基因T1植物的植物高度、生物质、分蘖数目、开花时间和圆锥花序重量。数据点代表10个转基因植物(1行相同事件)的平均值和40个对照植物(4行)的平均值。与不含转基因的植物相比,显示生物质、高度、分蘖数目、和圆锥花序重量的增加。
表10
事件1
  百分比增加   p值   测量的植物数目
  生物质   9   0.307   11
  植物高度   7   0.028   11
  分蘖数目   27   0.002   10
  开花时间   10   0.048   11
  圆锥花序重量   16   0.012   39
表11
事件17
  百分比增加   p值   测量的植物数目
  植物高度   3   0.004   7
  分蘖数目   34   1
  圆锥花序重量   4   0.591   7
表12
事件2
  百分比增加   p值   测量的植物数目
  植物高度   2   0.007   15
  分蘖数目   27   0.013   10
  圆锥花序重量   16   0.011   14
实施例10:稻事件CW00469,Ceres Clone:4831(SEQ ID NO:76)的结果
分析来自含有Ceres Clone:4831的CW00469的一个事件的T1种子,如实施例1中所描述的。表13中显示了与相同位置种植的不含转基因的植物相比转基因T1植物的植物高度、生物质、和圆锥花序重量。表数据行对应于田间行。数据点代表10个转基因植物(1行相同事件)的平均值和40个对照植物(4行)的平均值。与不含转基因的植物相比,显示生物质、高度和圆锥花序重量的增加。在T2植物中显示高度、产率、和生物质的增加(参见表9)。
表13
Figure BDA0000145034540000811
实施例11:稻事件CW00536,Ceres Annot:847799(SEQ ID NO:208)的结果
分析来自含有Ceres Annot:847799的CW00536的16个事件的T1种子,如实施例1中所描述的。表14和15中显示了与相同位置种植的不含转基因的植物相比转基因T1植物的植物高度和圆锥花序重量。数据点代表16个事件(每个事件15个转基因植物)的平均值和数百个对照植物的平均值。与不含转基因的植物相比,显示高度和圆锥花序重量的增加。
表14
Figure BDA0000145034540000821
表15
实施例12:稻事件SR05004,CW00191,CeresAnnot:878355(SEQ IDNO:425)的结果
分析从来自含有CeresAnnot:878355的CW00191的一个事件的T2和T3种子种植的植物的生物质,如实施例1中所描述的。表16中显示了与相同位置种植的不含转基因的植物相比转基因T2和T3植物的平均生物质。以随机化区组设计将具有代表多个事件的转基因植物和对照的低氮样地和对照样地各重复3次。每个样地含有40个植物。对于CW00191的一个事件,每个样地测量10个植物。表16中呈现的每个生物质数值代表测量的30个植物的平均值。结果显示了与不含转基因的植物相比在正常的和低的氮条件下的转基因植物的测量的生物质增加。
表16
Figure BDA0000145034540000823
实施例13:通过交互式BLAST确定功能同系物
若候选和参照序列编码具有相似功能和/或活性的蛋白质,则认为候选序列是参照序列的功能同系物。使用称为交互式BLAST的方法(Rivera等,Proc.Natl.Acad.Sci.USA,95:6239-6244(1998))来从数据库鉴定潜在的功能同系物序列,所述数据库由所有可用的公共和专有肽序列组成,包括来自NCBI的NR和来自Ceres Clone的肽翻译。
交互式BLAST方法开始前,使用BLAST对特定的参照多肽搜索来自其来源物种的所有肽,以鉴定与参照多肽具有80%或更大的BLAST序列同一性和沿着比对中较短的序列具有85%或更大的比对长度的多肽。参照多肽和任何上述鉴定的多肽称为簇。
使用来自华盛顿大学(Saint Louis,Missouri,USA)的BLASTP第2.0版程序来测定BLAST序列同一性和E值。BLASTP第2.0版程序包括下列参数:1)E值截留为1.0e-5;2)字大小为5;和3)-postsw选项。基于鉴定的潜在功能同系物序列与特定的参照多肽的第一BLAST HSP(高得分区段对(High-scoringSegment Pair))的比对来计算BLAST序列同一性。用BLAST HSP比对中完全匹配的残基数目除以HSP长度,然后乘以100以获得BLAST序列同一性。HSP长度通常包括比对中的缺口,但是在一些情况中,排除缺口。
主要的交互式BLAST方法由两轮BLAST搜索组成;即正向搜索和反向搜索。在正向搜索步骤中,针对来自感兴趣物种的所有蛋白质序列对来自来源物种SA的参照多肽序列,即“多肽A”进行BLAST。使用E值截留10-5和序列同一性截留35%来测定顶部命中(top hit)。在顶部命中中,具有最低E值的序列称为最佳命中,而且认为是潜在的功能同系物或直向同系物。认为与最佳命中或初始参照多肽具有80%或更大的序列同一性的任何其它顶部命中也是潜在的功能同系物或直向同系物。对所有感兴趣的物种重复此方法。
在反向搜索轮次中,针对来自来源物种SA的所有蛋白质序列对来自所有物种的在正向搜索中鉴定的顶部命中进行BLAST。认为将来自上述簇的多肽返回为其最佳命中的来自正向搜索的顶部命中也是潜在的功能同系物。
通过手工检查潜在的功能同系物序列来鉴定功能同系物。图1-11中分别显示了SEQ ID NO:554,263,117,1,645,253,323,595,77,209,和426的代表性功能同系物。其它例示性的同系物与序列表中的某些图相关联。
实施例14:通过隐马尔可夫模型确定功能同系物
通过程序HMMER 2.3.2来产生隐马尔可夫模型(HMM)。为了产生每个HMM,使用为了全局比对而配置的缺省HMMER 2.3.2程序参数。
使用图1中所显示的序列作为输入来产生HMM。将这些序列拟合至该模型,并在序列表中显示了每种序列的代表性HMM比特得分。将其它序列拟合至该模型,并在序列表中显示了任何此类其它序列的代表性HMM比特得分。结果指明这些其它序列是SEQ ID NO:554的功能同系物。
重复上述方法,并对图2-11中所显示的每组序列产生HMM,其使用每个图中所显示的序列作为所述HMM的输入来进行。序列表中显示了每个序列的代表性比特得分。将其它序列拟合至某些HMM,并在序列表中显示了此类其它序列的代表性HMM比特得分。结果指示这些其它序列是用于产生所述HMM的序列的功能同系物。
其它实施方案
要理解的是,虽然本发明已经结合其详细的说明书进行了描述,但是前述说明书意图例示而非限制本发明的范围,所述本发明的范围由所附权利要求书的范围限定。其它方面、优点、和修饰在所附权利要求书的范围内。
Figure IDA0000145034600000021
Figure IDA0000145034600000031
Figure IDA0000145034600000041
Figure IDA0000145034600000051
Figure IDA0000145034600000061
Figure IDA0000145034600000071
Figure IDA0000145034600000081
Figure IDA0000145034600000091
Figure IDA0000145034600000111
Figure IDA0000145034600000121
Figure IDA0000145034600000131
Figure IDA0000145034600000141
Figure IDA0000145034600000151
Figure IDA0000145034600000161
Figure IDA0000145034600000181
Figure IDA0000145034600000191
Figure IDA0000145034600000201
Figure IDA0000145034600000211
Figure IDA0000145034600000221
Figure IDA0000145034600000231
Figure IDA0000145034600000251
Figure IDA0000145034600000261
Figure IDA0000145034600000271
Figure IDA0000145034600000281
Figure IDA0000145034600000291
Figure IDA0000145034600000301
Figure IDA0000145034600000311
Figure IDA0000145034600000321
Figure IDA0000145034600000331
Figure IDA0000145034600000341
Figure IDA0000145034600000351
Figure IDA0000145034600000361
Figure IDA0000145034600000371
Figure IDA0000145034600000381
Figure IDA0000145034600000391
Figure IDA0000145034600000401
Figure IDA0000145034600000411
Figure IDA0000145034600000421
Figure IDA0000145034600000461
Figure IDA0000145034600000471
Figure IDA0000145034600000481
Figure IDA0000145034600000491
Figure IDA0000145034600000501
Figure IDA0000145034600000511
Figure IDA0000145034600000521
Figure IDA0000145034600000531
Figure IDA0000145034600000541
Figure IDA0000145034600000561
Figure IDA0000145034600000571
Figure IDA0000145034600000581
Figure IDA0000145034600000591
Figure IDA0000145034600000601
Figure IDA0000145034600000621
Figure IDA0000145034600000661
Figure IDA0000145034600000671
Figure IDA0000145034600000691
Figure IDA0000145034600000701
Figure IDA0000145034600000711
Figure IDA0000145034600000731
Figure IDA0000145034600000741
Figure IDA0000145034600000751
Figure IDA0000145034600000761
Figure IDA0000145034600000771
Figure IDA0000145034600000801
Figure IDA0000145034600000811
Figure IDA0000145034600000821
Figure IDA0000145034600000841
Figure IDA0000145034600000851
Figure IDA0000145034600000871
Figure IDA0000145034600000881
Figure IDA0000145034600000891
Figure IDA0000145034600000901
Figure IDA0000145034600000911
Figure IDA0000145034600000921
Figure IDA0000145034600000941
Figure IDA0000145034600000951
Figure IDA0000145034600000961
Figure IDA0000145034600000971
Figure IDA0000145034600000981
Figure IDA0000145034600000991
Figure IDA0000145034600001001
Figure IDA0000145034600001011
Figure IDA0000145034600001021
Figure IDA0000145034600001031
Figure IDA0000145034600001041
Figure IDA0000145034600001051
Figure IDA0000145034600001061
Figure IDA0000145034600001071
Figure IDA0000145034600001081
Figure IDA0000145034600001091
Figure IDA0000145034600001101
Figure IDA0000145034600001111
Figure IDA0000145034600001121
Figure IDA0000145034600001131
Figure IDA0000145034600001141
Figure IDA0000145034600001151
Figure IDA0000145034600001161
Figure IDA0000145034600001171
Figure IDA0000145034600001181
Figure IDA0000145034600001191
Figure IDA0000145034600001211
Figure IDA0000145034600001221
Figure IDA0000145034600001231
Figure IDA0000145034600001241
Figure IDA0000145034600001251
Figure IDA0000145034600001261
Figure IDA0000145034600001271
Figure IDA0000145034600001281
Figure IDA0000145034600001301
Figure IDA0000145034600001321
Figure IDA0000145034600001331
Figure IDA0000145034600001341
Figure IDA0000145034600001351
Figure IDA0000145034600001371
Figure IDA0000145034600001381
Figure IDA0000145034600001391
Figure IDA0000145034600001411
Figure IDA0000145034600001431
Figure IDA0000145034600001441
Figure IDA0000145034600001461
Figure IDA0000145034600001481
Figure IDA0000145034600001491
Figure IDA0000145034600001511
Figure IDA0000145034600001521
Figure IDA0000145034600001531
Figure IDA0000145034600001541
Figure IDA0000145034600001551
Figure IDA0000145034600001561
Figure IDA0000145034600001581
Figure IDA0000145034600001591
Figure IDA0000145034600001601
Figure IDA0000145034600001611
Figure IDA0000145034600001621
Figure IDA0000145034600001631
Figure IDA0000145034600001641
Figure IDA0000145034600001651
Figure IDA0000145034600001661
Figure IDA0000145034600001681
Figure IDA0000145034600001691
Figure IDA0000145034600001701
Figure IDA0000145034600001711
Figure IDA0000145034600001721
Figure IDA0000145034600001741
Figure IDA0000145034600001761
Figure IDA0000145034600001771
Figure IDA0000145034600001781
Figure IDA0000145034600001791
Figure IDA0000145034600001801
Figure IDA0000145034600001811
Figure IDA0000145034600001821
Figure IDA0000145034600001831
Figure IDA0000145034600001851
Figure IDA0000145034600001861
Figure IDA0000145034600001871
Figure IDA0000145034600001881
Figure IDA0000145034600001891
Figure IDA0000145034600001911
Figure IDA0000145034600001921
Figure IDA0000145034600001931
Figure IDA0000145034600001941
Figure IDA0000145034600001951
Figure IDA0000145034600001961
Figure IDA0000145034600001971
Figure IDA0000145034600001991
Figure IDA0000145034600002001
Figure IDA0000145034600002011
Figure IDA0000145034600002021
Figure IDA0000145034600002031
Figure IDA0000145034600002041
Figure IDA0000145034600002051
Figure IDA0000145034600002061
Figure IDA0000145034600002071
Figure IDA0000145034600002081
Figure IDA0000145034600002091
Figure IDA0000145034600002101
Figure IDA0000145034600002111
Figure IDA0000145034600002121
Figure IDA0000145034600002131
Figure IDA0000145034600002141
Figure IDA0000145034600002151
Figure IDA0000145034600002161
Figure IDA0000145034600002171
Figure IDA0000145034600002181
Figure IDA0000145034600002191
Figure IDA0000145034600002201
Figure IDA0000145034600002221
Figure IDA0000145034600002241
Figure IDA0000145034600002251
Figure IDA0000145034600002261
Figure IDA0000145034600002271
Figure IDA0000145034600002281
Figure IDA0000145034600002291
Figure IDA0000145034600002301
Figure IDA0000145034600002321
Figure IDA0000145034600002341
Figure IDA0000145034600002351
Figure IDA0000145034600002361
Figure IDA0000145034600002371
Figure IDA0000145034600002381
Figure IDA0000145034600002391
Figure IDA0000145034600002411
Figure IDA0000145034600002421
Figure IDA0000145034600002431
Figure IDA0000145034600002441
Figure IDA0000145034600002451
Figure IDA0000145034600002461
Figure IDA0000145034600002471
Figure IDA0000145034600002481
Figure IDA0000145034600002491
Figure IDA0000145034600002501
Figure IDA0000145034600002511
Figure IDA0000145034600002521
Figure IDA0000145034600002531
Figure IDA0000145034600002541
Figure IDA0000145034600002551
Figure IDA0000145034600002561
Figure IDA0000145034600002581
Figure IDA0000145034600002591
Figure IDA0000145034600002601
Figure IDA0000145034600002611
Figure IDA0000145034600002621
Figure IDA0000145034600002631
Figure IDA0000145034600002641
Figure IDA0000145034600002651
Figure IDA0000145034600002661
Figure IDA0000145034600002671
Figure IDA0000145034600002701
Figure IDA0000145034600002711
Figure IDA0000145034600002721
Figure IDA0000145034600002731
Figure IDA0000145034600002751
Figure IDA0000145034600002761
Figure IDA0000145034600002781
Figure IDA0000145034600002791
Figure IDA0000145034600002801
Figure IDA0000145034600002821
Figure IDA0000145034600002831
Figure IDA0000145034600002841
Figure IDA0000145034600002851
Figure IDA0000145034600002861
Figure IDA0000145034600002871
Figure IDA0000145034600002881
Figure IDA0000145034600002891
Figure IDA0000145034600002901
Figure IDA0000145034600002911
Figure IDA0000145034600002921
Figure IDA0000145034600002931
Figure IDA0000145034600002941
Figure IDA0000145034600002951
Figure IDA0000145034600002961
Figure IDA0000145034600002981
Figure IDA0000145034600002991
Figure IDA0000145034600003001
Figure IDA0000145034600003011
Figure IDA0000145034600003021
Figure IDA0000145034600003031
Figure IDA0000145034600003041
Figure IDA0000145034600003051
Figure IDA0000145034600003071
Figure IDA0000145034600003091
Figure IDA0000145034600003101
Figure IDA0000145034600003111
Figure IDA0000145034600003121
Figure IDA0000145034600003131
Figure IDA0000145034600003151
Figure IDA0000145034600003171
Figure IDA0000145034600003181
Figure IDA0000145034600003191
Figure IDA0000145034600003201
Figure IDA0000145034600003221
Figure IDA0000145034600003231
Figure IDA0000145034600003241
Figure IDA0000145034600003251
Figure IDA0000145034600003271
Figure IDA0000145034600003281
Figure IDA0000145034600003291
Figure IDA0000145034600003301
Figure IDA0000145034600003311
Figure IDA0000145034600003321
Figure IDA0000145034600003341
Figure IDA0000145034600003351
Figure IDA0000145034600003361
Figure IDA0000145034600003371
Figure IDA0000145034600003381
Figure IDA0000145034600003391
Figure IDA0000145034600003421
Figure IDA0000145034600003431
Figure IDA0000145034600003441
Figure IDA0000145034600003451
Figure IDA0000145034600003461
Figure IDA0000145034600003471
Figure IDA0000145034600003481
Figure IDA0000145034600003491
Figure IDA0000145034600003501
Figure IDA0000145034600003521
Figure IDA0000145034600003531
Figure IDA0000145034600003541
Figure IDA0000145034600003551
Figure IDA0000145034600003561
Figure IDA0000145034600003571
Figure IDA0000145034600003581
Figure IDA0000145034600003611
Figure IDA0000145034600003621
Figure IDA0000145034600003631
Figure IDA0000145034600003641
Figure IDA0000145034600003651
Figure IDA0000145034600003661
Figure IDA0000145034600003671
Figure IDA0000145034600003681
Figure IDA0000145034600003691
Figure IDA0000145034600003701
Figure IDA0000145034600003711
Figure IDA0000145034600003731
Figure IDA0000145034600003751
Figure IDA0000145034600003761
Figure IDA0000145034600003771
Figure IDA0000145034600003791
Figure IDA0000145034600003801
Figure IDA0000145034600003821
Figure IDA0000145034600003831
Figure IDA0000145034600003841
Figure IDA0000145034600003851
Figure IDA0000145034600003861
Figure IDA0000145034600003871
Figure IDA0000145034600003881
Figure IDA0000145034600003891
Figure IDA0000145034600003901
Figure IDA0000145034600003911
Figure IDA0000145034600003921
Figure IDA0000145034600003931
Figure IDA0000145034600003941
Figure IDA0000145034600003951
Figure IDA0000145034600003961
Figure IDA0000145034600003971
Figure IDA0000145034600003981
Figure IDA0000145034600003991
Figure IDA0000145034600004001
Figure IDA0000145034600004011
Figure IDA0000145034600004021
Figure IDA0000145034600004041
Figure IDA0000145034600004051
Figure IDA0000145034600004061
Figure IDA0000145034600004091
Figure IDA0000145034600004101
Figure IDA0000145034600004121
Figure IDA0000145034600004131
Figure IDA0000145034600004141
Figure IDA0000145034600004151
Figure IDA0000145034600004171
Figure IDA0000145034600004181
Figure IDA0000145034600004191
Figure IDA0000145034600004201
Figure IDA0000145034600004211
Figure IDA0000145034600004221
Figure IDA0000145034600004231
Figure IDA0000145034600004251
Figure IDA0000145034600004261
Figure IDA0000145034600004271
Figure IDA0000145034600004281
Figure IDA0000145034600004291
Figure IDA0000145034600004311
Figure IDA0000145034600004321
Figure IDA0000145034600004331
Figure IDA0000145034600004341
Figure IDA0000145034600004361
Figure IDA0000145034600004371
Figure IDA0000145034600004381
Figure IDA0000145034600004391
Figure IDA0000145034600004411
Figure IDA0000145034600004421
Figure IDA0000145034600004431
Figure IDA0000145034600004441
Figure IDA0000145034600004451
Figure IDA0000145034600004461
Figure IDA0000145034600004471
Figure IDA0000145034600004481
Figure IDA0000145034600004491
Figure IDA0000145034600004501
Figure IDA0000145034600004521
Figure IDA0000145034600004541
Figure IDA0000145034600004551
Figure IDA0000145034600004561
Figure IDA0000145034600004571
Figure IDA0000145034600004581
Figure IDA0000145034600004591
Figure IDA0000145034600004601
Figure IDA0000145034600004611
Figure IDA0000145034600004621
Figure IDA0000145034600004641
Figure IDA0000145034600004651
Figure IDA0000145034600004671
Figure IDA0000145034600004681
Figure IDA0000145034600004691
Figure IDA0000145034600004701
Figure IDA0000145034600004711
Figure IDA0000145034600004741
Figure IDA0000145034600004751
Figure IDA0000145034600004761
Figure IDA0000145034600004771
Figure IDA0000145034600004781
Figure IDA0000145034600004791
Figure IDA0000145034600004801
Figure IDA0000145034600004811
Figure IDA0000145034600004821
Figure IDA0000145034600004831
Figure IDA0000145034600004851
Figure IDA0000145034600004861
Figure IDA0000145034600004871
Figure IDA0000145034600004881
Figure IDA0000145034600004891
Figure IDA0000145034600004901
Figure IDA0000145034600004911
Figure IDA0000145034600004921
Figure IDA0000145034600004931
Figure IDA0000145034600004941
Figure IDA0000145034600004951
Figure IDA0000145034600004961
Figure IDA0000145034600004971
Figure IDA0000145034600004981
Figure IDA0000145034600005001
Figure IDA0000145034600005011
Figure IDA0000145034600005021
Figure IDA0000145034600005041
Figure IDA0000145034600005051
Figure IDA0000145034600005061
Figure IDA0000145034600005071
Figure IDA0000145034600005081
Figure IDA0000145034600005091
Figure IDA0000145034600005101
Figure IDA0000145034600005111
Figure IDA0000145034600005121
Figure IDA0000145034600005141
Figure IDA0000145034600005151
Figure IDA0000145034600005161
Figure IDA0000145034600005181
Figure IDA0000145034600005191
Figure IDA0000145034600005201
Figure IDA0000145034600005211
Figure IDA0000145034600005221
Figure IDA0000145034600005231
Figure IDA0000145034600005241
Figure IDA0000145034600005251
Figure IDA0000145034600005261
Figure IDA0000145034600005281
Figure IDA0000145034600005291
Figure IDA0000145034600005311
Figure IDA0000145034600005321
Figure IDA0000145034600005331
Figure IDA0000145034600005341
Figure IDA0000145034600005351
Figure IDA0000145034600005361
Figure IDA0000145034600005381
Figure IDA0000145034600005401
Figure IDA0000145034600005411
Figure IDA0000145034600005421
Figure IDA0000145034600005431
Figure IDA0000145034600005441
Figure IDA0000145034600005451
Figure IDA0000145034600005461
Figure IDA0000145034600005481
Figure IDA0000145034600005491
Figure IDA0000145034600005501
Figure IDA0000145034600005511
Figure IDA0000145034600005531
Figure IDA0000145034600005571
Figure IDA0000145034600005581
Figure IDA0000145034600005591
Figure IDA0000145034600005601
Figure IDA0000145034600005611
Figure IDA0000145034600005631
Figure IDA0000145034600005641
Figure IDA0000145034600005651
Figure IDA0000145034600005661
Figure IDA0000145034600005671
Figure IDA0000145034600005681
Figure IDA0000145034600005691
Figure IDA0000145034600005701
Figure IDA0000145034600005711
Figure IDA0000145034600005721
Figure IDA0000145034600005731
Figure IDA0000145034600005741
Figure IDA0000145034600005761
Figure IDA0000145034600005771
Figure IDA0000145034600005791
Figure IDA0000145034600005801
Figure IDA0000145034600005811
Figure IDA0000145034600005821
Figure IDA0000145034600005831
Figure IDA0000145034600005841
Figure IDA0000145034600005851
Figure IDA0000145034600005861
Figure IDA0000145034600005871
Figure IDA0000145034600005881
Figure IDA0000145034600005911
Figure IDA0000145034600005931
Figure IDA0000145034600005951
Figure IDA0000145034600005961
Figure IDA0000145034600005971
Figure IDA0000145034600005981
Figure IDA0000145034600005991
Figure IDA0000145034600006001
Figure IDA0000145034600006011
Figure IDA0000145034600006041
Figure IDA0000145034600006051
Figure IDA0000145034600006061
Figure IDA0000145034600006071
Figure IDA0000145034600006081
Figure IDA0000145034600006091
Figure IDA0000145034600006101
Figure IDA0000145034600006111
Figure IDA0000145034600006131
Figure IDA0000145034600006141
Figure IDA0000145034600006151
Figure IDA0000145034600006171
Figure IDA0000145034600006181
Figure IDA0000145034600006191
Figure IDA0000145034600006201
Figure IDA0000145034600006231
Figure IDA0000145034600006241
Figure IDA0000145034600006251
Figure IDA0000145034600006261
Figure IDA0000145034600006281
Figure IDA0000145034600006291
Figure IDA0000145034600006301
Figure IDA0000145034600006311
Figure IDA0000145034600006321
Figure IDA0000145034600006341
Figure IDA0000145034600006351
Figure IDA0000145034600006361
Figure IDA0000145034600006381
Figure IDA0000145034600006391
Figure IDA0000145034600006401
Figure IDA0000145034600006411
Figure IDA0000145034600006421
Figure IDA0000145034600006431
Figure IDA0000145034600006441
Figure IDA0000145034600006451
Figure IDA0000145034600006461
Figure IDA0000145034600006481
Figure IDA0000145034600006491
Figure IDA0000145034600006501
Figure IDA0000145034600006511
Figure IDA0000145034600006521
Figure IDA0000145034600006541
Figure IDA0000145034600006551
Figure IDA0000145034600006571

Claims (42)

1.一种生成植物的方法,所述方法包括培养包含外源核酸的植物细胞,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,其中所述多肽的氨基酸序列的HMM比特得分大于约65,所述HMM基于图1-11之一中描绘的氨基酸序列,且其中与不包含所述核酸的对照植物的相应水平相比,所述植物具有生物质水平的差异。
2.一种生成植物的方法,所述方法包括培养包含外源核酸的植物细胞,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,所述多肽与选自下组的氨基酸序列具有80%或更大的序列同一性:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695和697,其中与不包含所述核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
3.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:209的残基19至152的DUF640域具有60%或更大序列同一性的DUF640域。
4.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:426的残基100至509的PTR2域具有60%或更大序列同一性的PTR2域。
5.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:263的残基130至192的zf-Dof域具有60%或更大序列同一性的zf-Dof域。
6.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:117的残基44至208的植物螯合肽合成酶样域具有60%或更大序列同一性的植物螯合肽合成酶样域。
7.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:1的残基32至83的AP2域具有60%或更大序列同一性的AP2域。
8.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:645的残基88至453的氨基转移酶I和II类域具有60%或更大序列同一性的氨基转移酶I和II类域。
9.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:323的残基13至62的Myb样DNA结合域具有60%或更大序列同一性的Myb样DNA结合域。
10.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:595的残基35至257的alpha/beta水解酶折叠域具有60%或更大序列同一性的alpha/beta水解酶折叠域。
11.权利要求1或2的方法,其中所述多肽包含与SEQ ID NO:77的残基57至129的RALF域具有60%或更大序列同一性的RALF域。
12.一种生成植物的方法,所述方法包括培养包含外源核酸的植物细胞,所述外源核酸包含与核苷酸序列可操作连接的调节区,所述核苷酸序列与选自下组的核苷酸序列或其片段具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694和696,其中与不包含所述核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
13.一种生成植物的方法,所述方法包括培养包含外源核酸的植物细胞,所述外源核酸对于下调植物细胞中的内源核酸是有效的,其中所述内源核酸编码多肽,且其中所述多肽的氨基酸序列的HMM比特得分大于约65,所述HMM基于图1-11之一中所描绘的氨基酸序列。
14.一种调控植物中的生物质水平的方法,所述方法包括将外源核酸导入植物细胞中,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,其中所述多肽的氨基酸序列的HMM比特得分大于约65,所述HMM基于图1-11之一中所描绘的氨基酸序列,且其中与不包含所述外源核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
15.一种调控植物中的生物质水平的方法,所述方法包括将外源核酸导入植物细胞中,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,所述多肽与选自下组的氨基酸序列具有80%或更大的序列同一性:SEQID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695和697,其中与不包含所述核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
16.权利要求1、2、12、13、14、或15中任一项的方法,其中所述多肽选自下组:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695和697。
17.一种调控植物中的生物质水平的方法,所述方法包括将外源核酸导入植物细胞中,所述外源核酸包含与核苷酸序列可操作连接的调节区,所述核苷酸序列与选自下组的核苷酸序列或其片段具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694和696,其中与不包含所述核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
18.包含外源核酸的植物细胞,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,其中所述多肽的氨基酸序列的HMM比特得分大于约65,所述HMM基于图1-11之一中所描绘的氨基酸序列,且其中与不包含所述核酸的对照植物的相应水平相比,所述植物具有生物质水平的差异。
19.包含外源核酸的植物细胞,所述外源核酸包含与编码多肽的核苷酸序列可操作连接的调节区,所述多肽与选自下组的氨基酸序列具有80%或更大的序列同一性:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695和697,其中与不包含所述核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
20.包含外源核酸的植物细胞,所述外源核酸包含与核苷酸序列可操作连接的调节区,所述核苷酸序列与选自下组的核苷酸序列或其片段具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694和696,其中与不包含所述核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
21.包含权利要求18、19或20中任一项的植物细胞的转基因植物。
22.权利要求21的转基因植物,其中所述植物是选自下组的物种成员:柳枝稷(Panicum virgatum)(柳枝稷(switchgrass))、高粱(Sorghum bicolor)(高粱(sorghum),苏丹草(sudangrass))、奇岗(Miscanthus giganteus)(芒(miscanthus))、甘蔗(Saccharum sp.)(能源甘蔗(energycane))、小叶杨(Populus balsamifera)(杨树(poplar))、玉蜀黍(Zea mays)(玉米(corn))、大豆(Glycine max)(大豆(soybean))、欧洲油菜(Brassica napus)(芸苔(canola))、普通小麦(Triticumaestivum)((wheat)小麦)、陆地棉(Gossypium hirsutum)(棉(cotton))、稻(Oryzasativa)(稻(rice))、向日葵(Helianthus annuus)(向日葵(sunflower))、紫苜蓿(Medicago sativa)(苜蓿(alfalfa))、甜菜(Beta vulgaris)(甜菜(sugarbeet))、或Pennisetum glaucum(珍珠粟(pearl millet))。
23.包含权利要求21的植物细胞的转基因植物,其中所述多肽选自下组:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695和697。
24.来自依照权利要求23的转基因植物的包含胚组织的种子产物。
25.包含核苷酸序列的分离的核酸,所述核苷酸序列与如下中所列的核苷酸序列具有85%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686或687。
26.包含核苷酸序列的分离的核酸,所述核苷酸序列编码与如下中所列的氨基酸序列具有80%或更大序列同一性的多肽:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676或677。
27.一种鉴定多态性是否与性状变化有关的方法,所述方法包括:
a)测定植物群体中的一种或多种遗传多态性是否与多肽的基因座有关,所述多肽选自由图1-11中所描绘的多肽及其功能同系物组成的组;并
b)测量所述群体的植物中所述性状变化与所述群体的植物中所述一种或多种遗传多态性的存在之间的关联,由此鉴定所述一种或多种遗传多态性是否与所述性状变化有关。
28.一种生成植物系的方法,所述方法包括:
a)测定植物群体中的一种或多种遗传多态性是否与选自下组的多肽的基因座有关:图1-11中所描绘的多肽及其功能同系物;
b)鉴定所述群体中的一个或多个植物,其中至少一种所述遗传多态性的存在与生物质性状变化有关;
c)将一个或多个所述鉴定的植物与自身或不同植物杂交以产生种子;
d)将至少一个自所述种子种植的后代植物与自身或不同植物杂交;并
e)将步骤c)和d)再重复0-5代以生成所述植物系,其中至少一种所述遗传多态性存在于所述植物系中。
29.权利要求27或28的方法,其中所述生物质性状是干物质产量。
30.权利要求27或28的方法,其中所述群体是柳枝稷植物群体。
31.一种改变植物中的生物质水平的方法,所述方法包括修饰内源生物质调控核酸,所述核酸包含具有可读框的核苷酸序列,其与选自下组的核苷酸序列具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694和696,其中与所述核酸尚未修饰的对照植物的相应水平相比,所述植物具有生物质水平的差异。
32.权利要求31的方法,其中通过在包含所述核酸的基因座中引入遗传修饰来实现所述修饰。
33.权利要求31的方法,所述方法进一步包括选择具有改变的生物质的植物。
34.权利要求31的方法,其中所述内源核酸编码与选自下组的氨基酸序列具有80%或更大序列同一性的多肽:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695和697。
35.权利要求31的方法,所述核酸包含具有可读框的核苷酸序列,其与选自下组的核苷酸序列具有90%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694和696。
36.权利要求31的方法,所述核酸包含具有可读框的核苷酸序列,其与选自下组的核苷酸序列具有95%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694和696。
37.一种生成植物的方法,所述方法包括培养含有编码多肽的经修饰的内源核酸的植物细胞,其中所述多肽的氨基酸序列的HMM比特得分大于约65,所述HMM基于图1-11之一中描绘的氨基酸序列,且其中与所述核酸尚未修饰的对照植物的相应水平相比,所述植物具有生物质水平的差异。
38.含有编码多肽的经修饰的内源核酸的植物细胞,其中所述多肽的氨基酸序列的HMM比特得分大于约65,所述HMM基于图1-11之一中描绘的氨基酸序列,且其中与所述核酸尚未修饰的对照植物的相应水平相比,所述植物具有生物质水平的差异。
39.含有经修饰的生物质调控内源核酸的植物细胞,所述核酸包含具有可读框的核苷酸序列,其与选自下组的核苷酸序列具有80%或更大的序列同一性:SEQ ID NO:3,5,7,9,19,21,23,26,28,31,35,42,44,46,48,52,55,57,60,62,65,67,69,73,76,78,80,83,85,89,91,93,95,97,99,101,103,105,107,109,111,113,116,119,124,126,128,130,134,136,138,140,143,148,150,157,159,161,165,167,170,172,175,177,179,181,183,187,192,197,199,201,205,208,211,213,215,217,219,221,223,225,227,229,231,233,235,237,240,252,254,256,258,260,262,265,267,270,272,274,277,280,284,286,288,290,293,301,303,307,309,313,316,318,322,325,328,330,333,335,339,341,344,346,348,350,352,355,358,360,362,364,366,368,370,373,375,377,379,381,383,385,387,389,392,394,396,398,400,402,404,408,410,412,414,419,423,425,427,432,434,441,443,445,451,458,460,462,465,469,471,473,475,477,481,485,487,489,491,494,496,498,505,507,510,512,514,520,522,524,527,530,533,535,538,542,544,546,548,553,555,557,559,561,564,566,568,570,572,576,578,580,582,584,586,588,590,592,594,596,599,601,607,612,614,617,621,624,626,628,631,635,640,644,646,648,650,654,656,658,661,663,665,668,678,679,680,681,682,683,684,685,686,687,688,690,692,694和696,且其中与所述核酸尚未修饰的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
40.权利要求38或权利要求39的植物细胞,其中所述内源核酸编码与选自下组的氨基酸序列具有80%或更大序列同一性的多肽:SEQ ID NO:1,2,4,6,8,10,11,12,13,14,15,16,17,18,20,22,24,25,27,29,30,32,33,34,36,37,38,39,40,41,43,45,47,49,50,51,53,54,56,58,59,61,63,64,66,68,70,71,72,74,75,77,79,81,82,84,86,87,88,90,92,94,96,98,100,102,104,106,108,110,112,114,115,117,118,120,121,122,123,125,127,129,131,132,133,135,137,139,141,142,144,145,146,147,149,151,152,153,154,155,156,158,160,162,163,164,166,168,169,171,173,174,176,178,180,182,184,185,186,188,189,190,191,193,194,195,196,198,200,202,203,204,206,207,209,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,239,241,242,243,244,245,246,247,248,249,250,251,253,255,257,259,261,263,264,266,268,269,271,273,275,276,278,279,281,282,283,285,287,289,291,292,294,295,296,297,298,299,300,302,304,305,306,308,310,311,312,314,315,317,319,320,321,323,324,326,327,329,331,332,334,336,337,338,340,342,343,345,347,349,351,353,354,356,357,359,361,363,365,367,369,371,372,374,376,378,380,382,384,386,388,390,391,393,395,397,399,401,403,405,406,407,409,411,413,415,416,417,418,420,421,422,424,426,428,429,430,431,433,435,436,437,438,439,440,442,444,446,447,448,449,450,452,453,454,455,456,457,459,461,463,464,466,467,468,470,472,474,476,478,479,480,482,483,484,486,488,490,492,493,495,497,499,500,501,502,503,504,506,508,509,511,513,515,516,517,518,519,521,523,525,526,528,529,531,532,534,536,537,539,540,541,543,545,547,549,550,551,552,554,556,558,560,562,563,565,567,569,571,573,574,575,577,579,581,583,585,587,589,591,593,595,597,598,600,602,603,604,605,606,608,609,610,611,613,615,616,618,619,620,622,623,625,627,629,630,632,633,634,636,637,638,639,641,642,643,645,647,649,651,652,653,655,657,659,660,662,664,666,667,669,670,671,672,673,674,675,676,677,689,691,693,695和697,且其中与所述核酸尚未修饰的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
41.一种调控植物中的生物质水平的方法,所述方法包括将外源核酸导入植物细胞中,所述外源核酸编码具有E.C.2.6.1.83活性的多肽。
42.包含外源核酸的植物细胞,所述外源核酸编码具有E.C.2.6.1.83活性的多肽,且其中与不包含所述核酸的对照植物的相应水平相比,从所述植物细胞生成的植物具有生物质水平的差异。
CN2010800417787A 2009-07-20 2010-07-20 具有增加的生物质的转基因植物 Pending CN102573451A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22696909P 2009-07-20 2009-07-20
US61/226,969 2009-07-20
PCT/US2010/042602 WO2011011412A2 (en) 2009-07-20 2010-07-20 Transgenic plants having increased biomass

Publications (1)

Publication Number Publication Date
CN102573451A true CN102573451A (zh) 2012-07-11

Family

ID=43499627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800417787A Pending CN102573451A (zh) 2009-07-20 2010-07-20 具有增加的生物质的转基因植物

Country Status (10)

Country Link
US (4) US20120297505A1 (zh)
EP (3) EP3437466A1 (zh)
CN (1) CN102573451A (zh)
AU (1) AU2010276372B2 (zh)
BR (1) BR112012001263B1 (zh)
CA (3) CA3208000A1 (zh)
EA (3) EA202091701A1 (zh)
IN (1) IN2012DN01454A (zh)
PL (1) PL2659771T3 (zh)
WO (1) WO2011011412A2 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107012153A (zh) * 2017-03-30 2017-08-04 武汉生物工程学院 氮营养运输基因OsNPF8.1在提高水稻分蘖数中的应用
CN109929851A (zh) * 2019-01-29 2019-06-25 安徽农业大学 一种玉米籽粒淀粉合成调控基因ZmDof36及其应用
CN110684092A (zh) * 2019-06-10 2020-01-14 山东农业大学 一种抗菌肽及其应用
CN111647060A (zh) * 2020-07-08 2020-09-11 重庆市农业科学院 植物氮吸收相关蛋白nar及其编码基因与应用
CN113336835A (zh) * 2020-03-02 2021-09-03 中国科学院分子植物科学卓越创新中心 参与硝酸根转运的蛋白、其编码基因和用途
CN113429467A (zh) * 2020-03-20 2021-09-24 中国科学院微生物研究所 Npf7.6蛋白在调控豆科植物根瘤耐氮性中的应用
CN113907077A (zh) * 2021-09-30 2022-01-11 中国农业科学院烟草研究所(中国烟草总公司青州烟草研究所) Psy1成熟多肽植物衰老抑制剂及其制备方法和应用
CN114214332A (zh) * 2021-12-31 2022-03-22 河南农业大学 一种天目地黄花青素相关基因RcMYB1及其应用
CN114920812A (zh) * 2022-06-13 2022-08-19 中国农业大学 低钾胁迫响应相关的GhERF9蛋白及其相关生物材料与应用
WO2023004969A1 (zh) * 2021-07-28 2023-02-02 凯莱英医药集团(天津)股份有限公司 酯酶突变体及其应用

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013025485A1 (en) 2011-08-12 2013-02-21 Ceres, Inc. Transcription terminators
BR112014013853A2 (pt) 2011-12-09 2020-01-14 Ceres Inc uso de um ácido nucleico isolado, método de obtenção de uma célula vegetal transgênica, método de obtenção de uma planta transgênica, método de produção de uma planta, método de produção de biomassa, método de processamento de biomassa, método de alteração da composição de biomassa, método de modulação de composição de biomassa, método de produção de um produto de forragem
EP3027009A4 (en) * 2013-07-29 2017-05-03 China Agricultural University Compositions and methods for improving abiotic stress tolerance
US10526611B2 (en) * 2014-04-03 2020-01-07 Purdue Research Foundation Gene targeting using mutant Agrobacterium strains
US9101100B1 (en) 2014-04-30 2015-08-11 Ceres, Inc. Methods and materials for high throughput testing of transgene combinations
US10480000B2 (en) * 2014-07-15 2019-11-19 Ceres, Inc. Methods of increasing crop yield under abiotic stress
CR20180164A (es) * 2015-08-18 2018-09-04 Monsanto Technology Llc Métodos para producir plantas de algodón con tolerancia mejorada a la sequía y composiciones de estas
CN105132453B (zh) * 2015-09-18 2018-12-25 中国科学院水生生物研究所 一种聚球藻基因在制备适用于亚热带季风性湿润气候区生长的水稻中的应用
CN105154467B (zh) * 2015-09-18 2018-12-25 中国科学院水生生物研究所 一种聚球藻基因在制备适用于亚热带季风性湿润气候区生长的水稻中的应用
US20220356497A1 (en) * 2019-06-26 2022-11-10 Zymergen Inc. Compositions and methods for synthesis of terpenoids
US11926833B2 (en) 2022-01-25 2024-03-12 Living Carbon PBC Compositions and methods for enhancing biomass productivity in plants

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009056566A2 (en) * 2007-10-29 2009-05-07 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5254678A (en) 1987-12-15 1993-10-19 Gene Shears Pty. Limited Ribozymes
US5766847A (en) 1988-10-11 1998-06-16 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Process for analyzing length polymorphisms in DNA regions
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
US6946587B1 (en) 1990-01-22 2005-09-20 Dekalb Genetics Corporation Method for preparing fertile transgenic corn plants
US5204253A (en) 1990-05-29 1993-04-20 E. I. Du Pont De Nemours And Company Method and apparatus for introducing biological substances into living cells
AU672760B2 (en) 1991-09-24 1996-10-17 Keygene N.V. Selective restriction fragment amplification: a general method for DNA fingerprinting
US6326527B1 (en) 1993-08-25 2001-12-04 Dekalb Genetics Corporation Method for altering the nutritional content of plant seed
US5878215A (en) 1994-05-23 1999-03-02 Mastercard International Incorporated System and method for processing multiple electronic transaction requests
CA2226088A1 (en) 1995-06-30 1997-01-23 Dna Plant Technology Corporation Delayed ripening tomato plants
JPH10117776A (ja) 1996-10-22 1998-05-12 Japan Tobacco Inc インディカイネの形質転換方法
GB9703146D0 (en) 1997-02-14 1997-04-02 Innes John Centre Innov Ltd Methods and means for gene silencing in transgenic plants
US5868905A (en) 1997-04-23 1999-02-09 Voith Sulzer Paper Technology North Amrica Inc. Paper-making machine including a deaerator for a fiber suspension
GB9710475D0 (en) 1997-05-21 1997-07-16 Zeneca Ltd Gene silencing
US6452067B1 (en) 1997-09-19 2002-09-17 Dna Plant Technology Corporation Methods to assay for post-transcriptional suppression of gene expression
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
AUPP249298A0 (en) 1998-03-20 1998-04-23 Ag-Gene Australia Limited Synthetic genes and genetic constructs comprising same I
US20040214330A1 (en) 1999-04-07 2004-10-28 Waterhouse Peter Michael Methods and means for obtaining modified phenotypes
US7511190B2 (en) * 1999-11-17 2009-03-31 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
US7897843B2 (en) * 1999-03-23 2011-03-01 Mendel Biotechnology, Inc. Transcriptional regulation of plant biomass and abiotic stress tolerance
US7365185B2 (en) * 2000-07-19 2008-04-29 Monsanto Technology Llc Genomic plant sequences and uses thereof
US6423885B1 (en) 1999-08-13 2002-07-23 Commonwealth Scientific And Industrial Research Organization (Csiro) Methods for obtaining modified phenotypes in plant cells
GB9925459D0 (en) 1999-10-27 1999-12-29 Plant Bioscience Ltd Gene silencing
US7442853B2 (en) * 2000-04-07 2008-10-28 Basf Plant Science Gmbh Protein kinase stress-related proteins and methods of use in plants
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US7834146B2 (en) * 2000-05-08 2010-11-16 Monsanto Technology Llc Recombinant polypeptides associated with plants
US20070192900A1 (en) 2006-02-14 2007-08-16 Board Of Trustees Of Michigan State University Production of beta-glucosidase, hemicellulase and ligninase in E1 and FLC-cellulase-transgenic plants
CA2427347C (en) 2000-10-31 2011-01-18 Commonwealth Scientific And Industrial Research Organisation Method and means for producing barley yellow dwarf virus resistant cereal plants
US20040209263A1 (en) 2000-12-07 2004-10-21 Clawson Gary A. Selection of catalytic nucleic acids targeted to infectious agents
USPP13008P2 (en) 2001-03-19 2002-09-24 Hortech, Inc. Miscanthus sinensis plant named ‘Little Zebra’
EP1456379A4 (en) 2001-06-22 2006-06-07 Univ California COMPOSITIONS AND METHODS FOR MODULATING PLANT DEVELOPMENT
AU2002324783A1 (en) * 2001-08-09 2003-02-24 Mendel Biotechnology, Inc. Stress-related polynucleotides and polypeptides in plants
US20020182701A1 (en) 2001-08-30 2002-12-05 Saint Louis University Dominant negative variants of methionine aminopeptidase 2 (MetAP2) and clinical uses thereof
US20090158452A1 (en) 2001-12-04 2009-06-18 Johnson Richard G Transgenic plants with enhanced agronomic traits
ES2346645T3 (es) 2002-03-14 2010-10-19 Commonwealth Scientific And Industrial Research Organisation Procedimientos y medios de supervision y modulacion del silenciamiento genico.
BR0308424A (pt) 2002-03-14 2005-02-22 Commw Scient Ind Res Org Métodos e meios para infra-regular eficientemente a expressão de qualquer gene de interesse em células e organismos eucarióticos
US20090183270A1 (en) 2002-10-02 2009-07-16 Adams Thomas R Transgenic plants with enhanced agronomic traits
USPP14743P2 (en) 2003-01-21 2004-05-04 C. Greg Speichert Miscanthus plant named ‘Gilded Tower’
USPP16176P3 (en) 2003-03-27 2006-01-03 Cosner Harlan B Impatiens plant named ‘TiWhit’
US7884261B2 (en) * 2004-06-30 2011-02-08 CERES,Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant growth rate and biomass in plants
US7244879B2 (en) 2005-10-12 2007-07-17 Ceres, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics in response to cold
US7214789B2 (en) 2004-06-30 2007-05-08 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
US7378571B2 (en) 2004-09-23 2008-05-27 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
US7402667B2 (en) 2003-10-14 2008-07-22 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
US7569389B2 (en) * 2004-09-30 2009-08-04 Ceres, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics
US20060150283A1 (en) * 2004-02-13 2006-07-06 Nickolai Alexandrov Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
US20060015970A1 (en) 2003-12-12 2006-01-19 Cers, Inc. Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics
USPP15193P2 (en) 2004-01-05 2004-09-28 Michael Vern Smith Miscanthus plant named ‘Gold Bar’
US20070006335A1 (en) 2004-02-13 2007-01-04 Zhihong Cook Promoter, promoter control elements, and combinations, and uses thereof
US20060260004A1 (en) 2004-04-01 2006-11-16 Yiwen Fang Par-related protein promoters
WO2005098007A2 (en) 2004-04-01 2005-10-20 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
WO2006023766A2 (en) 2004-08-20 2006-03-02 Ceres Inc. P450 polynucleotides, polypeptides, and uses thereof
US8137961B2 (en) 2004-09-08 2012-03-20 J.R. Simplot Company Plant-specific genetic elements and transfer cassettes for plant transformation
WO2006036864A2 (en) 2004-09-22 2006-04-06 Ceres, Inc. Promoter, promoter control elements, and combinations, and uses thereof
US7445654B2 (en) 2004-09-27 2008-11-04 Spectra Logic Corporation Method and apparatus for adsorbing molecules from an atmosphere inside an enclosure containing multiple data storage devices
US7429692B2 (en) 2004-10-14 2008-09-30 Ceres, Inc. Sucrose synthase 3 promoter from rice and uses thereof
US20080148432A1 (en) 2005-12-21 2008-06-19 Mark Scott Abad Transgenic plants with enhanced agronomic traits
US7312376B2 (en) 2005-04-20 2007-12-25 Ceres, Inc. Regulatory regions from Papaveraceae
US7598367B2 (en) 2005-06-30 2009-10-06 Ceres, Inc. Early light-induced protein promoters
JP2009502175A (ja) 2005-07-29 2009-01-29 ターゲット・グロース・インコーポレーテッド 野生型krpによる活性サイクリン−cdk複合体阻害の、優性ネガティブ変異krpタンパク質の防御
MX2008003389A (es) * 2005-09-15 2008-03-27 Cropdesign Nv Plantas que tienen rendimiento incrementado y un metodo para efectuar las mismas.
WO2007055826A1 (en) 2005-11-04 2007-05-18 Ceres, Inc. Modulation of fertility in monocots
WO2007120989A2 (en) 2006-02-24 2007-10-25 Ceres, Inc. Shade regulatory regions
USPP18161P2 (en) 2006-06-15 2007-10-30 Probst Darrell R Miscanthus plant named ‘Super Stripe’
WO2009092009A2 (en) * 2008-01-18 2009-07-23 Ceres, Inc. Modulating light response pathways in plants
WO2008006033A1 (en) * 2006-07-05 2008-01-10 Ceres, Inc. Increasing low light tolerance in plants
JP2010507374A (ja) * 2006-10-27 2010-03-11 アレリクス、ソシエダージ、アノニマ 植物構造を改質し植物バイオマスおよび/またはスクロース収量を高める方法
US8299318B2 (en) * 2007-07-05 2012-10-30 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
WO2009073069A2 (en) * 2007-10-31 2009-06-11 Monsanto Technology, Llc Genes and uses for plant enhancement
US9758905B2 (en) 2012-11-16 2017-09-12 Graftech International Holdings Inc. Process of making carbon fibers derived from lignin/carbon residue

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009056566A2 (en) * 2007-10-29 2009-05-07 Basf Plant Science Gmbh Plants having enhanced yield-related traits and a method for making the same

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王石平 等: "用同源序列的染色体定位寻找水稻抗病基因DNA片段", 《植物学报》 *
诸葛强 等: "植物近等基因系皮培育及其在林木遗传改良上的应用探讨", 《林业科学研究》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107012153A (zh) * 2017-03-30 2017-08-04 武汉生物工程学院 氮营养运输基因OsNPF8.1在提高水稻分蘖数中的应用
CN107012153B (zh) * 2017-03-30 2020-05-29 武汉生物工程学院 氮营养运输基因OsNPF8.1在提高水稻分蘖数中的应用
CN109929851A (zh) * 2019-01-29 2019-06-25 安徽农业大学 一种玉米籽粒淀粉合成调控基因ZmDof36及其应用
CN110684092A (zh) * 2019-06-10 2020-01-14 山东农业大学 一种抗菌肽及其应用
CN110684092B (zh) * 2019-06-10 2021-11-05 山东农业大学 一种抗菌肽及其应用
CN113336835A (zh) * 2020-03-02 2021-09-03 中国科学院分子植物科学卓越创新中心 参与硝酸根转运的蛋白、其编码基因和用途
CN113429467A (zh) * 2020-03-20 2021-09-24 中国科学院微生物研究所 Npf7.6蛋白在调控豆科植物根瘤耐氮性中的应用
CN111647060A (zh) * 2020-07-08 2020-09-11 重庆市农业科学院 植物氮吸收相关蛋白nar及其编码基因与应用
WO2023004969A1 (zh) * 2021-07-28 2023-02-02 凯莱英医药集团(天津)股份有限公司 酯酶突变体及其应用
CN113907077A (zh) * 2021-09-30 2022-01-11 中国农业科学院烟草研究所(中国烟草总公司青州烟草研究所) Psy1成熟多肽植物衰老抑制剂及其制备方法和应用
CN114214332A (zh) * 2021-12-31 2022-03-22 河南农业大学 一种天目地黄花青素相关基因RcMYB1及其应用
CN114214332B (zh) * 2021-12-31 2023-06-30 河南农业大学 一种天目地黄花青素相关基因RcMYB1及其应用
CN114920812A (zh) * 2022-06-13 2022-08-19 中国农业大学 低钾胁迫响应相关的GhERF9蛋白及其相关生物材料与应用

Also Published As

Publication number Publication date
EA201270181A1 (ru) 2012-07-30
EA201791502A3 (ru) 2018-02-28
EA036343B1 (ru) 2020-10-29
CA2782251A1 (en) 2011-01-27
WO2011011412A2 (en) 2011-01-27
US20220056466A1 (en) 2022-02-24
CA3100454A1 (en) 2011-01-27
US20220056465A1 (en) 2022-02-24
WO2011011412A3 (en) 2011-05-05
EP3437466A1 (en) 2019-02-06
EP2659771B1 (en) 2018-10-03
CA2782251C (en) 2021-06-22
AU2010276372B2 (en) 2015-10-22
IN2012DN01454A (zh) 2015-06-05
US11162108B2 (en) 2021-11-02
EP2461667A2 (en) 2012-06-13
CA3100454C (en) 2023-08-01
EP2461667A4 (en) 2013-03-20
BR112012001263A2 (zh) 2017-08-15
CA3208000A1 (en) 2011-01-27
EA028373B1 (ru) 2017-11-30
AU2010276372A1 (en) 2012-03-15
EA202091701A1 (ru) 2021-01-29
US20180079789A1 (en) 2018-03-22
US20120297505A1 (en) 2012-11-22
PL2659771T3 (pl) 2019-05-31
EP2659771A1 (en) 2013-11-06
EA201791502A2 (ru) 2017-10-31
BR112012001263B1 (pt) 2023-11-28

Similar Documents

Publication Publication Date Title
US20220056465A1 (en) Transgenic plants having increased biomass
US10150971B2 (en) Polynucleotide sequences and proteins encoded thereby useful for modifying plant characteristics
US9701726B2 (en) Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
US8344211B2 (en) Plant nucleotide sequences and corresponding polypeptides
US11339403B2 (en) Transgenic plants having increased tolerance to aluminum
US11629352B2 (en) Methods of increasing crop yield under abiotic stress

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120711