CN110719956A - 用于改良真菌菌株的高通量基因组工程改造平台 - Google Patents

用于改良真菌菌株的高通量基因组工程改造平台 Download PDF

Info

Publication number
CN110719956A
CN110719956A CN201880037593.5A CN201880037593A CN110719956A CN 110719956 A CN110719956 A CN 110719956A CN 201880037593 A CN201880037593 A CN 201880037593A CN 110719956 A CN110719956 A CN 110719956A
Authority
CN
China
Prior art keywords
filamentous fungal
strain
gene
library
filamentous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880037593.5A
Other languages
English (en)
Inventor
V·松斯皮拉
J·弗雷德隆德
H·阿卜杜拉
P·博卡齐
S·普斯特
S·D·L·A·克莱托
B·柴金德
D·沃恩
K·S·布鲁诺
P·韦斯特福尔
E·谢夫奇克
K·罗特席尔德-曼奇内里
A·M·方三世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zi Mei Root Co
Original Assignee
Zi Mei Root Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zi Mei Root Co filed Critical Zi Mei Root Co
Publication of CN110719956A publication Critical patent/CN110719956A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Abstract

本发明提供了一种用于改良丝状真菌细胞的HTP基因组工程改造平台,其用计算机驱动且整合了分子生物学、自动化和先进机器学习方案。这种整合平台使用了一套HTP分子工具集来创建HTP基因设计库,所述基因设计库尤其来源于科学见解和迭代模式识别。

Description

用于改良真菌菌株的高通量基因组工程改造平台
相关申请的交叉引用
本申请案主张2017年6月6日申请的美国临时申请案第62/515,907号的权益,其以全文引用的方式并入本文中用于所有目的。
技术领域
本发明涉及自动化真菌基因组工程改造。所公开的自动化基因组工程改造平台需要基因操纵丝状真菌,以产生真菌生产菌株以及促进其纯化。所得真菌生产菌株很适合生长在浸没培养物中,例如大规模生产用于商业应用的所关注的产物(例如抗生素、代谢物、蛋白质等)。
关于序列表的陈述
以文本格式代替纸本拷贝提供与本申请相关的序列表,并且在此以引用的方式并入本说明书中。含有序列表的文本文件的名称是:ZYMR_008_03WO__SeqList_ST25.txt。文本文件约47KB,创建于2018年6月6日,并且以电子方式通过EFS-Web提交。
背景技术
真核细胞是用于生产多肽和次级代谢物的优选生物体。实际上,丝状真菌能够将原生蛋白质和异源蛋白质表达到高水平,使得其很适合大规模生产用于工业、药学、动物健康和食品和饮料应用的酶和其它蛋白质。然而,使用丝状真菌进行大规模生产所关注的产物通常需要基因操纵所述真菌以及使用自动化机器和设备,且丝状真菌生命周期的某些方面可能使得基因操纵和处置变得困难。
举例来说,将引入到真菌中的DNA随机整合到基因组内,产生主要经随机整合的DNA片段,DNA片段通常可整合成多种串联重复序列(参见例如Casqueiro等人,1999,《细菌学》181:1181-1188)。表达盒的这种不受控制的“随机多重整合”可以是一种潜在的有害过程,这可能导致对宿主基因组的不必要修饰。
另外,用于丝状真菌的本发明转染系统可能非常费力(参见Fincham综述,1989,微生物学评论53:148-170),并且本质上尺度相对较小。这可能涉及原生质体形成、粘性液体处置(即聚乙二醇溶液)、玻璃管的单孔涡流和后续选择性镀覆。此外,用于原生质体产生的条件可能难以确定且产量可能通常很低。此外,原生质体可含有多个细胞核,使得引入所期望基因操纵可能导致异核原生质体的形成,异核原生质体可能难以与同核原生质体分离。
此外,典型的丝状真菌细胞(包括来源于原生质体的那些细胞)生长成长纤维,被称为菌丝,菌丝可形成致密菌丝网络,称为菌丝体。这些菌丝可能含有可在基因型上彼此不同的多个细胞核。菌丝可分化并且形成可易于分散在空气中的无性孢子。如果菌丝含有不同基因型的细胞核,那么孢子也将含有细胞核的混合物。由于真菌生长的这一方面,基因操纵本质上产生混合群体,必须将混合群体纯化达到同质性,以便评定基因变化产生的任何影响。此外,在自动化环境中,孢子可造成设备污染,其可不利地影响纯化菌株的能力,且可污染设备上进行的任何其它工作。
为了减轻孢子的空气分散,可使丝状真菌在浸没培养物中生长。然而,由浸没培养物中菌丝丝状真菌生长形成的菌丝体可能影响培养液的流变学特性。一般来说,培养液的粘度越高,氧和养分分布地越均匀,并且搅拌培养物所需的能量越高。在一些情况下,由于菌丝丝状真菌生长,培养液的粘度变得足够高,以显著干扰氧和养分的溶解,借此不利地影响真菌的生长并且最终影响任何所关注的所期望产物的产量和产率。
因此,在所属领域中存在对工程改造丝状真菌的新方法的巨大需求,新方法不受扰于真菌中传统菌株构建程序所固有的前述缺点,并且大大加快了发现和合并有益突变的过程。
发明内容
本发明提供一种用于多核生物体(例如丝状真菌)的高通量(HTP)基因组工程改造平台,其不受扰于与传统微生物菌株改良程序相关的众多问题。尽管本文中所提供的方法在丝状真菌中进行了测试,但预期所述方法可应用到和/或用于其它多核生物体中。在一个实施例中,丝状真菌选自:棉霉属(Achlya)、枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢霉属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球酵母属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内斯菌属(Endothis)、镰孢菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质菌属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)(例如,嗜热毁丝霉(Myceliophthora thermophila))毛霉属(Mucor)、脉孢菌属(Neurospora)、青霉属(Penicillium)、柄孢壳属(Podospora)、射脉菌属(Phlebia)、梨囊鞭菌属(Piromyces)、梨胞霉属(Pyricularia)、根毛霉属(Rhizomucor)、根霉菌属(Rhizopus)、裂褶菌属(Schizophyllum)、节格孢属(Scytalidium)、孢子丝菌属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Tramates)、弯颈霉菌属(Tolypocladium)、木霉属(Trichoderma)、轮枝菌属(Verticillium)、小包脚菇属(Volvariella)物种或其有性世代或无性世代和同物异名或分类等效物。此外,对这个实施例,适用于方法和HTP基因组工程改造平台的丝状真菌为黑曲霉(Aspergillus niger)。
另外,本文教示的HTP平台能够修复丝状真菌菌株,丝状真菌菌株通过数十年的基于随机突变诱发的菌株改良程序已经积累了非有益突变。
本发明还提供独特基因组工程改造工具集和程序,其加强了丝状真菌系统中HTP平台的功能性。丝状真菌可以是曲霉属物种。曲霉可以是黑曲霉。
所公开的HTP基因组工程改造平台由计算机驱动且整合了分子生物学、自动化和先进机器学习方案。这个整合平台使用了一套HTP分子工具集来创建HTP基因设计库,基因设计库尤其来源于科学见解和迭代模式识别。
通过提供用于在丝状真菌中测试的特定基因组变异库,所教示的HTP基因设计库充当了基因组工程改造过程的驱动器。以HTP方式高效对利用特定库或库的组合进行工程改造的微生物进行筛选,以得到所得结果(例如,所关注的产物的产生)。按高效和迭代方式实施这种方法:利用HTP基因设计库定义用于在微生物中测试的特定基因组变异且接着随后筛选具有所述变异的宿主微生物基因组。在一些方面中,基因组工程改造活动的迭代循环数或“轮数”可以是至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100或更多个迭代/循环/轮数。
因此,在一些方面,本发明教示了在丝状真菌宿主系统中进行HTP基因工程改造(例如,SNP交换、PRO交换、终止子(STOP)交换或其组合的轮数)的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、1000或更多“轮”的方法。
在一些实施例中,本发明教示了一种线性方法,其中每一轮后续HTP基因工程改造是基于前一轮基因工程改造中所鉴别的基因变异。在其它实施例中,本发明教示了一种非线性方法,其中每一轮后续HTP基因工程改造是基于任何前一轮基因工程改造(包括先前进行的分析,和单独HTP基因工程改造分支)中所鉴别的基因变异。
这些迭代循环的数据实现了大规模数据分析和模式识别,从而被整合平台利用以告知后续多轮HTP基因设计库实施方案。因此,所教示平台中使用的HTP基因设计库是高度动态工具,其受益于大规模数据模式识别算法且通过每轮迭代微生物工程改造而更加信息化。从未研发出针对丝状真菌的这类系统并且在所属领域中迫切需要所述系统。
在一些实施例中,本发明的基因设计库包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、1000或更多种个别基因变化(例如,PRO交换库中的至少X个启动子:基因组合)。
在一些实施例中,本发明教示了一种使丝状真菌菌株进化以获得所期望表型的高通量(HTP)基因组工程改造的方法,其包含:扰动具有相同菌株背景的多种初始丝状真菌菌株的基因组,借此创建包含具有独特基因变异的个别菌株的初始HTP基因设计丝状真菌菌株库;b)针对所期望表型来筛选和选择初始HTP基因设计丝状真菌菌株库的个别菌株;c)提供各自包含独特基因变异组合的后续多种丝状真菌微生物,所述基因变异选自前一步骤中筛选的至少两种个别丝状真菌菌株中存在的基因变异,借此创建后续HTP基因设计丝状真菌菌株库;d)针对所期望表型来筛选和选择后续HTP基因设计丝状真菌菌株库的个别丝状真菌菌株;以及e)按照线性或非线性方式重复步骤c)至d)一或多次,直至丝状真菌微生物已经获得所期望表型,其中每次后续迭代创建了新的HTP基因设计丝状真菌菌株库,新的HTP基因设计微生物菌株库包含具有独特基因变异的个别丝状真菌菌株,独特基因变异为选自前一HTP基因设计丝状真菌菌株库的至少两种个别丝状真菌菌株的基因变异的组合。
在一些实施例中,本发明教示了初始HTP基因设计丝状真菌菌株库为选自由以下组成的群组的至少一个库:启动子交换微生物菌株库、SNP交换微生物菌株库、起始/终止密码子微生物菌株库、优化序列微生物菌株库、终止子交换微生物菌株库或其任何组合。
在一些实施例中,本发明教示了制备后续多种丝状真菌菌株的方法,丝状真菌菌株各自包含独特基因变异组合,其中组合的基因变异中的每种基因变异来源于初始HTP基因设计丝状真菌菌株库或前一步骤的HTP基因设计丝状真菌菌株库。
在一些实施例中,后续多种丝状真菌菌株中的基因变异的组合将包含初始HTP基因设计丝状真菌菌株库或前一步骤的HTP基因设计丝状真菌菌株库中的所有可能基因变异组合的子集。
在一些实施例中,本发明教示了后续HTP基因设计丝状真菌菌株库是来源于初始HTP基因设计微生物菌株库或前一步骤的HTP基因设计微生物菌株库中的基因变异的完整组合菌株库。
举例来说,如果先前HTP基因设计丝状真菌菌株库仅具有基因变异A、B、C和D,那么所述变异的部分组合可能包括包含三种菌株的后续HTP基因设计丝状真菌菌株库,三种菌株各自包含独特基因变异组合AB、AC或AD(表示突变的顺序不重要)。来源于前一步骤的HTP基因设计库的基因变异的完整组合丝状真菌菌株库将包括六种微生物,每种微生物包含独特基因变异组合AB、AC、AD、BC、BD或CD。
在一些实施例中,本发明的方法教示了利用至少一种选自由以下组成的群组的方法来扰动丝状真菌的基因组:随机突变诱发、靶向序列插入、靶向序列缺失、靶向序列置换或其任何组合。
在本发明所公开的方法的一些实施例中,多种初始丝状真菌独特基因变异来源于工业生产丝状真菌菌株。
在本发明所公开的方法的一些实施例中,多种初始丝状真菌包含工业生产丝状真菌菌株(表示为S1Gen1)和来源于其的任何数目个后续微生物后代(表示为SnGenn)。
在一些实施例中,本发明教示了一种用于产生SNP交换丝状真菌菌株库的方法,其包含以下步骤:a)提供参考丝状真菌菌株和第二丝状真菌菌株,其中第二丝状真菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,基因变异不存在于参考菌株中;b)扰动参考丝状真菌菌株或第二菌株的基因组,借此创建包含多种个别丝状真菌菌株的初始SNP交换丝状真菌菌株库,所述多种个别菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自参考菌株与第二菌株之间的多种已鉴别基因变异中的单一基因变异。
在SNP交换库的一些实施例中,扰动参考丝状真菌菌株的基因组,以添加在第二丝状真菌菌株中发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
在SNP交换库的一些实施例中,扰动参考丝状真菌菌株的基因组,以去除在参考丝状真菌菌株中未发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
在一些实施例中,SNP交换库的基因变异将包含参考微生物菌株与第二微生物菌株之间的所有已鉴别基因变异的子集。
在一些实施例中,SNP交换库的基因变异将包含参考丝状真菌菌株与第二丝状真菌菌株之间鉴别的所有已鉴别基因变异。
在一些实施例中,本发明教示了一种用于修复和改良工业丝状真菌菌株的表型性能的方法,其包含以下步骤:a)提供亲本谱系丝状真菌菌株和来源于其的工业丝状真菌菌株,其中工业菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,基因变异不存在于亲本谱系菌株中;b)扰动亲本谱系菌株或工业菌株的基因组,借此创建包含多种个别菌株的初始SNP交换丝状真菌菌株库,所述多种个别菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自亲本谱系菌株与工业菌株之间的多种已鉴别基因变异中的单一基因变异。c)针对优于参考丝状真菌菌株的表型性能改良来筛选和选择所述初始SNP交换丝状真菌菌株库的个别菌株,借此鉴别赋予所述表型性能改良的独特基因变异;d)提供各自包含独特基因变异组合的后续多种丝状真菌菌株,所述基因变异选自存在于前一步骤中筛选的至少两种个别菌株中的基因变异,借此创建后续SNP交换丝状真菌菌株库;e)针对优于参考菌株的表型性能改良来筛选和选择后续SNP交换丝状真菌菌株库的个别菌株,借此鉴别对所述丝状真菌菌株赋予额外表型性能改良的独特基因变异组合;以及f)按照线性或非线性方式重复步骤d)至e)一或多次,直至相较于工业丝状真菌菌株的表型性能,菌株的表型性能展现出所期望改良水平,其中每次后续迭代创建了新的SNP交换丝状真菌菌株库,新的菌株库包含具有独特基因变异的个别微生物菌株,独特基因变异为选自前一库的至少两种个别微生物菌株的基因变异的组合。
在一些实施例中,本发明教示了用于修复和改良工业丝状真菌菌株的表型性能的方法,其中扰动亲本谱系丝状真菌菌株的基因组,以添加在工业丝状真菌菌株中发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
本发明教示了用于修复和改良工业丝状真菌菌株的表型性能的方法,其中扰动工业丝状真菌菌株的基因组,以去除在亲本谱系丝状真菌菌株中未发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
在一些实施例中,本发明教示了一种用于产生启动子交换丝状真菌菌株库的方法,所述方法包含以下步骤:a)提供对基础丝状真菌菌株具有内源性的多种目标基因和启动子梯,其中所述启动子梯包含在基础丝状真菌菌株中展现出不同表达谱的多种启动子;b)对基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始启动子交换丝状真菌菌株库,所述多种个别菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对基础丝状真菌菌株具有内源性的目标基因之一上的启动子梯的一种启动子。
在一些实施例中,本发明教示了一种使丝状真菌菌株进化以获得所期望表型的启动子交换基因组工程改造的方法,所述方法包含以下步骤:a)提供对基础丝状真菌菌株具有内源性的多种目标基因和启动子梯,其中所述启动子梯包含在基础丝状真菌菌株中展现出不同表达谱的多种启动子;b)对基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始启动子交换丝状真菌菌株库,所述多种个别菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对基础丝状真菌菌株具有内源性的目标基因之一上的启动子梯的一种启动子;c)针对所期望表型来筛选和选择初始启动子交换丝状真菌菌株库的个别菌株;d)提供各自包含独特基因变异组合的后续多种丝状真菌菌株,所述基因变异选自存在于前一步骤中筛选的至少两种个别菌株中的基因变异,借此创建后续启动子交换丝状真菌菌株库;e)针对所期望表型来筛选和选择后续启动子交换丝状真菌菌株库的个别菌株;f)按照线性或非线性方式重复步骤c)至d)一或多次,直至微生物已经获得所期望表型,其中每次后续迭代创建了新的启动子交换丝状真菌微生物菌株库,所述菌株库包含具有独特基因变异的个别菌株,独特基因变异为选自前一HTP基因设计丝状真菌菌株库的至少两种个别丝状真菌菌株的基因变异的组合。
在一些实施例中,本发明教示了一种用于产生终止子交换丝状真菌菌株库的方法,所述方法包含以下步骤:a)提供对基底丝状真菌菌株具有内源性的多种目标基因和终止子梯,其中所述终止子梯包含在基础丝状真菌菌株中展现出不同表达谱的多种终止子;b)对基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别菌株的初始终止子交换丝状真菌菌株库,所述多种个别菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含对基础丝状真菌菌株具有内源性的一种目标基因,基础丝状真菌菌株可操作地连接到来自终止子梯的终止子中的一或多者。
在一些实施例中,本发明教示了一种使丝状真菌菌株进化以获得所期望表型的终止子交换基因组工程改造的方法,所述方法包含以下步骤:a)提供对基底丝状真菌菌株具有内源性的多种目标基因和终止子梯,其中所述终止子梯包含在基础丝状真菌菌株中展现出不同表达谱的多种终止子;b)对基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别菌株的初始终止子交换丝状真菌菌株库,所述多种个别菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含对基础丝状真菌菌株具有内源性的一种目标基因,基础丝状真菌菌株可操作地连接到来自终止子梯的终止子中的一或多者;c)针对所期望表型来筛选和选择初始终止子交换丝状真菌菌株库的个别菌株;d)提供各自包含独特基因变异组合的后续多种丝状真菌菌株,所述基因变异选自存在于前一步骤中筛选的至少两种个别菌株中的基因变异,借此创建后续终止子交换丝状真菌菌株库;e)针对所期望表型来筛选和选择后续终止子交换丝状真菌菌株库的个别菌株;f)按照线性或非线性方式重复步骤c)至d)一或多次,直至微生物已经获得所期望表型,其中每次后续迭代创建了新的终止子交换丝状真菌菌株库,新的菌株库包含具有独特基因变异的个别菌株,独特基因变异为选自前一终止子交换丝状真菌菌株库的至少两种个别菌株的基因变异组合。
在一些实施例中,本发明教示了通过以下迭代地改良候选丝状真菌菌株的设计:(a)访问用训练集填充的预测模型,训练集包含(1)输入表示一或多种背景丝状真菌菌株的基因变化及(2)相应性能度量;(b)将测试输入应用到表示基因变化的预测模型,测试输入对应于并入那些基因变化的候选丝状真菌菌株;(c)至少部分地基于预测模型来预测候选丝状真菌菌株的表型性能;(d)至少部分地基于候选丝状真菌菌株的预测性能来选择候选丝状真菌菌株的第一子集;(e)获得候选丝状真菌菌株的第一子集的所测量的表型性能;(f)至少部分地基于候选丝状真菌菌株的所测量的表型性能来获得其第二子集的选择;(g)将(1)输入对应于候选丝状真菌菌株的所选第二子集以及(2)候选丝状真菌菌株的所选第二子集的对应的所测量的性能添加到训练集的预测模型中;以及(h)重复(b)至(g),直至至少一种候选丝状真菌菌株所测量的表型性能满足了性能度量。在一些情况下,在将测试输入第一次应用到预测模型期间,由测试输入表示的基因变化包括一或多种背景丝状真菌菌株的基因变化;并且在测试输入的后续应用期间,由测试输入表示的基因变化包含经先前选择的候选丝状真菌菌株的第二子集内的候选丝状真菌菌株的基因变异。
在一些实施例中,第一子集的选择可以基于上位效应。这可通过如下实现:在第一子集的第一次选择期间:测定一或多种背景微生物菌株的性能度量之间的差异程度,性能度量响应于将表示基因变化的多种对应输入应用到一或多种背景丝状真菌菌株;以及至少部分地基于一或多种背景丝状真菌菌株的性能度量的差异程度来选择至少两种候选丝状真菌菌株纳入第一子集,性能度量响应于并入至少两种候选丝状真菌菌株中的基因变化的应用。
在一些实施例中,本发明教示了在候选丝状真菌菌株的迭代改良中应用上位效应,方法包含:获得表示所测量的性能的数据,所测量的性能响应于对至少一种丝状真菌背景菌株做出的对应基因变化;至少部分地基于至少两种基因变化的对应响应性能量度之间的差异程度来获得对至少两种基因变化的选择,其中差异程度涉及至少两种基因变化通过不同生物路径影响其对应的响应性能量度的程度;并且将基因变化设计到丝状真菌背景菌株中,从而包括所选的基因变化。在一些情况下,设计至少两种所选基因变化的丝状真菌背景菌株与获得表示所测量的响应性能的数据的至少一种丝状真菌背景菌株相同。
在一些实施例中,本发明教示了仅利用单一类型的基因库的HTP丝状真菌菌株改良方法。举例来说,在一些实施例中,本发明教示了仅利用SNP交换库的HTP丝状真菌菌株改良方法。在其它实施例中,本发明教示了仅利用PRO交换库的HTP丝状真菌菌株改良方法。在一些实施例中,本发明教示了仅利用STOP交换库的HTP丝状真菌菌株改良方法。在一些实施例中,本发明教示了仅利用起始/终止密码子交换库的HTP丝状真菌菌株改良方法。
在其它实施例中,本发明教示了利用两种或更多种类型的基因库的HTP丝状真菌菌株改良方法。举例来说,在一些实施例中,本发明教示了将SNP交换库与PRO交换库组合的HTP丝状真菌菌株改良方法。在一些实施例中,本发明教示了将SNP交换库与STOP交换库组合的HTP丝状真菌菌株改良方法。在一些实施例中,本发明教示了将PRO交换库与STOP交换库组合的HTP丝状真菌菌株改良方法。
在其它实施例中,本发明教示了利用多种类型的基因库的HTP丝状真菌菌株改良方法。在一些实施例中,将基因库组合以产生组合突变(例如应用到一或多种基因的启动子/终止子组合梯)。在又其它实施例中,可以将本发明的HTP丝状真菌菌株改良方法与一或多种传统菌株改良方法组合。
在一些实施例中,本发明的HTP丝状真菌菌株改良方法产生经改良的丝状真菌宿主细胞。也就是说,本发明教示了改良一或多种丝状真菌宿主细胞特性的方法。在一些实施例中,经改良的丝状真菌宿主细胞特性选自由以下组成的群组:由丝状真菌宿主细胞产生的所关注的产物的体积生产率、比生产率、产量或效价。在一些实施例中,经改良的丝状真菌宿主细胞特性为体积生产率。在一些实施例中,经改良的丝状真菌宿主细胞特性为比生产率。在一些实施例中,经改良的丝状真菌宿主细胞特性为产量。
在一些实施例中,本发明的HTP丝状真菌菌株改良方法产生丝状真菌宿主细胞,相较于未经历HTP菌株改良方法的对照丝状真菌宿主细胞,丝状真菌宿主细胞展现出至少一种丝状真菌宿主细胞特性改良1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更高(例如,所关注的生物分子的产量或产率改良X%,其中包括它们之间的任何范围和子范围)。在一些实施例中,本发明的HTP丝状真菌菌株改良方法选自由以下组成的群组:SNP交换、PRO交换、STOP交换和其组合。
因此,在一些实施例中,本发明的SNP交换方法产生丝状真菌宿主细胞,相较于未经历SNP交换方法的对照丝状真菌宿主细胞,丝状真菌宿主细胞展现出至少一种丝状真菌宿主细胞特性改良1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更高(例如,所关注的生物分子的产量或产率改良X%,其中包括它们之间的任何范围和子范围)。
因此,在一些实施例中,本发明的PRO交换方法产生丝状真菌宿主细胞,相较于未经历PRO交换方法的对照丝状真菌宿主细胞,丝状真菌宿主细胞展现出至少一种丝状真菌宿主细胞特性改良1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更高(例如,所关注的生物分子的产量或产率改良X%,其中包括它们之间的任何范围和子范围)。
因此,在一些实施例中,本发明的终止子(STOP)交换方法产生丝状真菌宿主细胞,相较于未经历终止子(STOP)交换方法的对照丝状真菌宿主细胞,丝状真菌宿主细胞展现出至少一种丝状真菌宿主细胞特性改良1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更高(例如,所关注的生物分子的产量或产率改良X%,其中包括它们之间的任何范围和子范围)。
在一个方面,本文提供一种用于产生丝状真菌菌株的方法,方法包含:a.)提供多个原生质体,其中原生质体由丝状真菌细胞的培养物制备;b.)用第一构筑体和第二构筑体转化多个原生质体,其中第一构筑体包含在两侧上由与原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且第二构筑体包含在两侧上由与原生质体的基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,其中转化通过同源重组将第一构筑体整合到第一基因座中并且将第二构筑体整合到第二基因座中,其中至少第二基因座为原生质体基因组中的第一可选标记基因,并且其中第一多核苷酸包含突变和/或基因控制元件;c.)通过进行选择和反向选择来纯化同核转化体;以及d.)使经纯化的转化体在有助于丝状真菌细胞再生的培养基中生长。在一些情况下,将第一构筑体分裂成构筑体A和构筑体B,其中构筑体A包含第一多核苷酸的第一部分和与在第一多核苷酸的第一部分5'端的第一基因座同源的核苷酸,并且其中构筑体B包含第一多核苷酸的第二部分和与在第一多核苷酸的第二部分3'端的第一基因座同源的核苷酸,其中第一多核苷酸的第一部分和第二部分包含重叠互补序列。在一些情况下,其中将第二构筑体分裂成构筑体A和构筑体B,其中构筑体A包含第二多核苷酸的第一部分和与在第二多核苷酸的第一部分5'端的第一基因座同源的核苷酸,并且其中构筑体B包含第二多核苷酸的第二部分和与在第二多核苷酸的第二部分3'端的第一基因座同源的核苷酸,其中第二多核苷酸的第一部分和第二部分包含重叠互补序列。在一些情况下,其中用来自多个第一构筑体的单个第一构筑体和来自多个第二构筑体的单个第二构筑体转化来自所述多个原生质体的每个原生质体,其中来自多个第一构筑体的每个第一构筑体中的第一多核苷酸包含不同突变和/或基因控制元件;并且其中来自多个第二构筑体的每个第二构筑体中的第二多核苷酸相同。在一些情况下,方法进一步包含重复步骤a至d,以产生丝状真菌细胞库,其中库中的每个丝状真菌细胞包含具有不同突变和/或基因控制元件的第一多核苷酸。在一些情况下,其中第一多核苷酸编码目标丝状真菌基因或异源基因。在一些情况下,突变为单核苷酸多态性。在一些情况下,基因控制为启动子序列和/或终止子序列。在一些情况下,基因控制元件为启动子序列,其中启动子序列选自表1中列出的启动子序列。在一些情况下,多个原生质体分布于微量滴定板的孔中。在一些情况下,步骤a至d在微量滴定板的孔中进行。在一些情况下,微量滴定板是96孔、384孔或1536孔微量滴定板。在一些情况下,丝状真菌细胞选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代、无性世代、同物异名或分类等效物。在一些情况下,丝状真菌细胞为黑曲霉。在一些情况下,丝状真菌细胞具有形成非菌丝体表型。在一些情况下,其中真菌细胞具有非功能性非同源末端结合(NHEJ)路径。在一些情况下,通过将细胞暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。在一些情况下,化学抑制剂为W-7。在一些情况下,第一基因座是针对目标丝状真菌基因。在一些情况下,第一基因座是针对原生质体基因组中的第二可选标记基因。在一些情况下,第二可选标记基因为营养缺陷型标记基因、比色标记基因或定向标记基因。在一些情况下,第一可选标记基因为营养缺陷型标记基因、比色标记基因或定向标记基因。在一些情况下,第二多核苷酸为营养缺陷型标记基因、定向标记基因或抗生素抗性基因。在一些情况下,比色标记基因为aygA基因。在一些情况下,营养缺陷型标记基因为argB基因、trpC基因、pyrG基因或met3基因。在一些情况下,定向标记基因为乙酰胺酶(amdS)基因、硝酸还原酶基因(niaD)或硫酸盐通透酶(Sut B)基因。在一些情况下,抗生素抗性基因为ble基因,其中ble基因赋予腐草霉素(pheomycin)抗性。在一些情况下,第一可选标记基因为aygA基因并且第二多核苷酸为pyrG基因。在一些情况下,第一可选标记基因为met3基因,第二可选标记基因为aygA基因且第二多核苷酸为pyrG基因。在一些情况下,多个原生质体通过以下方式制备:将细胞壁从丝状真菌细胞的培养物中的丝状真菌细胞去除;分离多个原生质体;以及将分离的多个原生质体再悬浮于包含最终浓度为7%v/v或更低的二甲亚砜(DMSO)的混合物中。在一些情况下,在进行步骤a至d之前将混合物储存在至少-20℃或-80℃下。在一些情况下,培养物的体积为至少1升。在一些情况下,在制备原生质体之前使培养物生长持续至少12小时。在一些情况下,真菌培养物在至少70%的原生质体更小并且含有更少的细胞核的条件下生长。在一些情况下,通过酶消化来去除细胞壁。在一些情况下,酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。在一些情况下,方法进一步包含在储存原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的混合物中。在一些情况下,添加PEG到最终浓度为8%v/v或更低。在一些情况下,步骤a至d为自动化的。
在另一方面,本文提供一种制备供储存用的丝状真菌细胞的方法,方法包含:从包含丝状真菌细胞的真菌培养物制备原生质体,其中制备原生质体包含将细胞壁从真菌培养物中的丝状真菌细胞去除;分离原生质体;以及将分离的原生质体再悬浮于包含最终浓度为7%v/v或更低的二甲亚砜(DMSO)的混合物中。在一些情况下,将混合物储存在至少-20℃或-80℃下。在一些情况下,真菌培养物的体积为至少1升。在一些情况下,在制备原生质体之前使真菌培养物生长持续至少12小时。在一些情况下,真菌培养物在至少70%的原生质体更小并且具有更少的细胞核的条件下生长。在一些情况下,通过酶消化来去除细胞壁。在一些情况下,酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。在一些情况下,方法进一步包含在储存原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的混合物中。在一些情况下,添加PEG到最终浓度为8%v/v或更低。在一些情况下,方法进一步包括在储存原生质体之前将原生质体分布到微量滴定板中。在一些情况下,真菌培养物中的丝状真菌细胞具有形成非菌丝体表型。在一些情况下,真菌培养物中的丝状真菌细胞选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代、无性世代、同物异名或分类等效物。在一些情况下,真菌培养物中的丝状真菌细胞为黑曲霉或其有性世代或无性世代。
在又一方面中,本文提供一种用于产生真菌生产菌株的系统,系统包含:一或多个处理器;以及一或多个存储器,其与一或多个处理器中的至少一个可操作地联接且其上存储有指令,指令当通过所述一或多个处理器中的至少一个执行时促使系统:a.)用第一构筑体和第二构筑体转化来源于丝状真菌细胞的培养物的多个原生质体,其中第一构筑体包含在两侧上由与原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且第二构筑体包含在两侧上由与原生质体的基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,其中转化通过同源重组将第一构筑体整合到第一基因座中并且将第二构筑体整合到第二基因座中,其中至少第二基因座为原生质体基因组中的第一可选标记基因,并且其中第一多核苷酸包含突变和/或基因控制元件;b.)通过进行选择和反向选择来纯化同核转化体;以及c.)使经纯化的转化体在有助于丝状真菌细胞再生的培养基中生长。在一些情况下,将第一构筑体分裂成构筑体A和构筑体B,其中构筑体A包含第一多核苷酸的第一部分和与在第一多核苷酸的第一部分5'端的第一基因座同源的核苷酸,并且其中构筑体B包含第一多核苷酸的第二部分和与在第一多核苷酸的第二部分3'端的第一基因座同源的核苷酸,其中第一多核苷酸的第一部分和第二部分包含重叠互补序列。在一些情况下,将第二构筑体分裂成构筑体A和构筑体B,其中构筑体A包含第二多核苷酸的第一部分和与在第二多核苷酸的第一部分5'端的第一基因座同源的核苷酸,并且其中构筑体B包含第二多核苷酸的第二部分和与在第二多核苷酸的第二部分3'端的第一基因座同源的核苷酸,其中第二多核苷酸的第一部分和第二部分包含重叠互补序列。在一些情况下,用来自多个第一构筑体的单个第一构筑体和来自多个第二构筑体的单个第二构筑体转化来自所述多个原生质体的每个原生质体,其中来自多个第一构筑体的每个第一构筑体中的第一多核苷酸包含不同突变和/或基因控制元件;并且其中来自多个第二构筑体的每个第二构筑体中的第二多核苷酸相同。在一些情况下,系统进一步包含重复步骤a至c,以产生丝状真菌细胞库,其中库中的每个丝状真菌细胞包含具有不同突变和/或基因控制元件的第一多核苷酸。在一些情况下,突变为单核苷酸多态性。在一些情况下,基因控制为启动子序列和/或终止子序列。在一些情况下,基因控制元件为启动子序列,其中启动子序列选自表1中列出的启动子序列。在一些情况下,在微量滴定板的孔中进行步骤a至c。在一些情况下,微量滴定板是96孔、384孔或1536孔微量滴定板。在一些情况下,丝状真菌细胞选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代、无性世代、同物异名或分类等效物。在一些情况下,丝状真菌细胞为黑曲霉。在一些情况下,丝状真菌细胞具有形成非菌丝体表型。在一些情况下,真菌细胞具有非功能性非同源末端结合路径。在一些情况下,通过将细胞暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。在一些情况下,化学抑制剂为W-7。在一些情况下,第一基因座是针对目标丝状真菌基因。在一些情况下,第一基因座是针对原生质体基因组中的第二可选标记基因。在一些情况下,第二可选标记基因选自营养缺陷型标记基因、比色标记基因或定向标记基因。在一些情况下,第一可选标记基因选自营养缺陷型标记基因、比色标记基因或定向标记基因。在一些情况下,第二多核苷酸选自营养缺陷型标记基因、定向标记基因或抗生素抗性基因。在一些情况下,比色标记基因为aygA基因。在一些情况下,营养缺陷型标记基因选自argB基因、trpC基因、pyrG基因或met3基因。在一些情况下,定向标记基因选自乙酰胺酶(amdS)基因、硝酸还原酶基因(nlaD)或硫酸盐通透酶(Sut B)基因。在一些情况下,抗生素抗性基因为ble基因,其中ble基因赋予腐草霉素抗性。在一些情况下,第一可选标记基因为aygA基因并且第二多核苷酸为pyrG基因。在一些情况下,第一可选标记基因为met3基因,第二可选标记基因为aygA基因且第二多核苷酸为pyrG基因。在一些情况下,多个原生质体通过以下方式制备:将细胞壁从丝状真菌细胞的培养物中的丝状真菌细胞去除;分离多个原生质体;以及将分离的多个原生质体再悬浮于包含最终浓度为7%v/v或更低的二甲亚砜(DMSO)的混合物中。在一些情况下,在进行步骤a至c之前将混合物储存在至少-20℃或-80℃下。在一些情况下,培养物的体积为至少1升。在一些情况下,在制备原生质体之前使培养物生长持续至少12小时。在一些情况下,真菌培养物在至少70%的原生质体更小并且具有更少的细胞核的条件下生长。在一些情况下,通过酶消化来去除细胞壁。在一些情况下,酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。在一些情况下,系统进一步包含在储存原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的混合物中。在一些情况下,添加PEG到最终浓度为8%v/v或更低。
在又一方面中,本文提供一种用于分离来源于单一真菌孢子的克隆群体的方法,方法包含:(a)在液体悬浮液中提供多个真菌孢子,其中多个真菌孢子来源于真菌菌株;(b)将液体悬浮液的离散体积分配到包含多个反应区域的衬底中的个别反应区域,其中多个反应区域中的每个反应区域包含生长培养基,其中分配引起至少75%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率;(c)在包含生长培养基的所述反应区域中培养所述经分配的单一活性真菌孢子;以及(d)选择在所述反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。在一些情况下,方法进一步包含针对离散体积中存在或不存在单一真菌孢子来筛选离散体积,其中仅选择含有单一真菌孢子的离散体积进行步骤(b)。在一些情况下,分配使得至少80%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分配使得至少90%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分配使得至少95%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分配使得至少99%的个别反应区域含有不超过所述多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分配使得大体上所有个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,筛选离散体积需要在光学上辨别离散体积中存在或不存在单一真菌孢子。在一些情况下,筛选使用能够在光学上辨别离散体积中存在或不存在单一真菌孢子的微流体装置来进行。在一些情况下,反应区域存在于微量滴定板中。在一些情况下,微量滴定板含有96个孔、384个孔或1536个孔。在一些情况下,真菌菌株为丝状真菌菌株。在一些情况下,丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代、无性世代、同物异名或分类等效物。在一些情况下,丝状真菌菌株为黑曲霉或其有性世代或无性世代。在一些情况下,丝状真菌菌株具有非菌丝体粒化形态。在一些情况下,丝状真菌菌株表达酿酒酵母SLN1基因的直系同源物的突变体形式。在一些情况下,丝状真菌菌株为黑曲霉并且酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式的核酸序列为SEQ ID NO:13。在一些情况下,酿酒酵母SLN1基因的直系同源物的突变体形式(例如黑曲霉直系同源物)可操作地连接到选自SEQ ID NO:1或2的启动子序列。在一些情况下,真菌菌株具有基因扰动。在一些情况下,基因扰动选自单核苷酸多态性、DNA插入、DNA缺失或其任何组合。在一些情况下,通过用核糖核蛋白复合物(RNP复合物)转化原生质体将基因扰动引入到来源于真菌菌株的原生质体。在一些情况下,RNP复合物包含与引导RNA(gRNA)复合的RNA引导的核酸内切酶。在一些情况下,RNA引导的核酸内切酶为第2类CRISPR-Cas系统RNA引导的核酸内切酶。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶为II型、V型或VI型RNA引导的核酸内切酶。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物、突变体、变异体或修饰形式。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶为Cas9或其同系物、直系同源物或旁系同源物。在一些情况下,gRNA为单独的CRISPR RNA(crRNA)或退火到转录活化CRISPR RNA(tracrRNA)。在一些情况下,gRNA为包含tracrRNA和crRNA的单一引导RNA(sgRNA)。在一些情况下,crRNA包含与真菌菌株的基因组内的目标基因互补的引导序列,其中将RNP复合物引入到原生质体中促进了将基因扰动引入到目标基因中。在一些情况下,目标基因的基因扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将DNA末端通过非同源末端结合(NHEJ)路径在目标基因中进行非同源末端结合。在一些情况下,方法进一步包含共转化包含目标基因的突变形式的供体DNA,其中目标基因的突变形式在两侧上由与目标基因基因座同源的核苷酸侧接。在一些情况下,目标基因的基因扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将目标基因通过同源重组用供体DNA进行置换。在一些情况下,步骤(b)进一步包含共转化包含可选标记的载体。在一些情况下,可选标记在步骤(d)期间使用,以选择来源于转化感受态真菌菌株的克隆群体。在一些情况下,通过用第一构筑体和第二构筑体转化多个原生质体将基因扰动引入到来源于真菌菌株的原生质体中,其中第一构筑体包含在两侧上由与原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且第二构筑体包含在两侧上由与原生质体的基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,转化使得通过同源重组将第一构筑体整合到第一基因座中并且将第二构筑体整合到第二基因座中,其中至少第二基因座为原生质体基因组中的第一可选标记基因,并且其中第一多核苷酸包含基因扰动。在一些情况下,可选标记基因在步骤(d)期间使用,以促进选择来源于包含所述基因扰动的真菌菌株的克隆群体。在一些情况下,真菌菌株具有非功能性非同源末端结合(NHEJ)路径。在一些情况下,通过将真菌菌株暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。在一些情况下,化学抑制剂为W-7。
在另一方面,本文提供一种用于分离来源于单一真菌孢子的克隆群体的方法,方法包含:(a)在液体悬浮液中提供多个真菌孢子,其中多个真菌孢子来源于真菌菌株;(b)稀释液体悬浮液,其中稀释为限制稀释法;(c)将稀释的离散体积分配到包含多个反应区域的衬底中的个别反应区域,其中多个反应区域中的每一反应区域包含生长培养基,其中限制稀释法使得分配到每个反应区域的稀释的离散体积含有一个活性孢子或无活性孢子的概率遵循泊松分布(Poisson Distribution),借此多个反应区域中超过90%的反应区域不含活性孢子且超过90%的含有一或多个活孢子的反应区域仅含有单一活性孢子;(d)在包含生长培养基的所述反应区域中培养所述经分配的单一活性真菌孢子;以及(e)选择在所述反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。在一些情况下,反应区域存在于微量滴定板中。在一些情况下,微量滴定板含有96个孔、384个孔或1536个孔。在一些情况下,真菌菌株为丝状真菌菌株。在一些情况下,丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代、无性世代、同物异名或分类等效物。在一些情况下,丝状真菌菌株为黑曲霉或其有性世代或无性世代。在一些情况下,丝状真菌菌株具有非菌丝体粒化形态。在一些情况下,丝状真菌菌株表达酿酒酵母SLN1基因的直系同源物的突变体形式。在一些情况下,丝状真菌菌株为黑曲霉并且酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式的核酸序列为SEQ ID NO:13。在一些情况下,酿酒酵母SLN1基因的直系同源物的突变体形式(例如黑曲霉直系同源物)可操作地连接到选自SEQ ID NO:1或2的启动子序列。在一些情况下,真菌菌株具有基因扰动。在一些情况下,基因扰动选自单核苷酸多态性、DNA插入、DNA缺失或其任何组合。在一些情况下,通过用核糖核蛋白复合物(RNP复合物)转化原生质体将基因扰动引入到来源于真菌菌株的原生质体。在一些情况下,RNP复合物包含与引导RNA(gRNA)复合的RNA引导的核酸内切酶。在一些情况下,RNA引导的核酸内切酶为第2类CRISPR-Cas系统RNA引导的核酸内切酶。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶为II型、V型或VI型RNA引导的核酸内切酶。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物、突变体、变异体或修饰形式。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶为Cas9或其同系物、直系同源物或旁系同源物。在一些情况下,gRNA为单独的CRISPR RNA(crRNA)或退火到转录活化CRISPR RNA(tracrRNA)。在一些情况下,gRNA为包含tracrRNA和crRNA的单一引导RNA(sgRNA)。在一些情况下,crRNA包含与真菌菌株的基因组内的目标基因互补的引导序列,其中将RNP复合物引入到原生质体中促进了将基因扰动引入到目标基因中。在一些情况下,目标基因的基因扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将DNA末端通过非同源末端结合(NHEJ)路径在目标基因中进行非同源末端结合。在一些情况下,方法进一步包含共转化包含目标基因的突变形式的供体DNA,其中目标基因的突变形式在两侧上由与目标基因基因座同源的核苷酸侧接。在一些情况下,目标基因的基因扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将目标基因通过同源重组用供体DNA进行置换。在一些情况下,步骤(b)进一步包含共转化包含可选标记的载体。在一些情况下,可选标记在步骤(d)期间使用,以选择来源于转化感受态真菌菌株的克隆群体。在一些情况下,通过用第一构筑体和第二构筑体转化多个原生质体将基因扰动引入到来源于真菌菌株的原生质体中,其中第一构筑体包含在两侧上由与原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且第二构筑体包含在两侧上由与原生质体的基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,转化使得通过同源重组将第一构筑体整合到第一基因座中并且将第二构筑体整合到第二基因座中,其中至少第二基因座为原生质体基因组中的第一可选标记基因,并且其中第一多核苷酸包含基因扰动。在一些情况下,可选标记基因在步骤(d)期间使用,以促进选择来源于包含所述基因扰动的真菌菌株的克隆群体。在一些情况下,真菌菌株具有非功能性非同源末端结合(NHEJ)路径。在一些情况下,通过将真菌菌株暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。在一些情况下,化学抑制剂为W-7。
在一个方面,本文提供一种用于产生丝状真菌菌株的方法,方法包含:a.)提供多个原生质体,其中多个原生质体由亲本丝状真菌菌株的培养物制备;b.)用核糖核蛋白复合物(RNP复合物)转化来自多个原生质体的每个原生质体;以及c.)针对优于亲本丝状真菌菌株的表型性能改良来筛选和选择来源于经转化的原生质体的个别丝状真菌菌株,借此鉴别所选择的个别丝状真菌菌株的基因组中赋予表型性能改良的基因扰动。在一些情况下,基因扰动选自单核苷酸多态性、DNA插入、DNA缺失或其任何组合。在一些情况下,RNP复合物包含与引导RNA(gRNA)复合的RNA引导的核酸内切酶。在一些情况下,RNA引导的核酸内切酶为第2类CRISPR-Cas系统RNA引导的核酸内切酶。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶为II型、V型或VI型RNA引导的核酸内切酶。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物、突变体、变异体或修饰形式。在一些情况下,第2类CRISPR-Cas系统RNA引导的核酸内切酶为Cas9或其同系物、直系同源物或旁系同源物。在一些情况下,gRNA为单独的CRISPR RNA(crRNA)或退火到转录活化CRISPR RNA(tracrRNA)。在一些情况下,gRNA为包含tracrRNA和crRNA的单一引导RNA(sgRNA)。在一些情况下,crRNA包含与亲本丝状真菌菌株的基因组内的目标基因互补的引导序列,其中引入RNP复合物扰乱了原生质体中的目标基因。在一些情况下,目标基因的扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将DNA末端通过非同源末端结合(NHEJ)路径在目标基因中进行非同源末端结合。在一些情况下,步骤(b)进一步包含共转化包含目标基因的突变形式的供体DNA,其中目标基因的突变形式在两侧上由与目标基因基因座同源的核苷酸侧接。在一些情况下,将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将目标基因通过同源重组用供体DNA进行置换。在一些情况下,步骤(b)进一步包含共转化包含可选标记的载体。在一些情况下,可选标记在步骤(c)期间使用,针对优于亲本丝状真菌菌株的表型性能改良,选择转化感受态个别丝状真菌菌株进行后续筛选。在一些情况下,亲本丝状真菌菌株具有非功能性非同源末端结合(NHEJ)路径。在一些情况下,通过将细胞暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。在一些情况下,化学抑制剂为W-7。在一些情况下,相较于亲本丝状真菌菌株的表型性能,丝状真菌菌株的表型性能改良包含所关注的产物的所测量的表型变量增加至少10%。在一些情况下,相较于亲本丝状真菌菌株的表型性能,丝状真菌菌株的表型性能改良包含所关注的产物的所测量的表型变量增加至少一倍。在一些情况下,所测量的表型变量选自由以下组成的群组:所关注的产品的体积生产率、所关注的产品的比生产率、所关注的产品的产率、所关注的产品的效价和其组合。在一些情况下,增加所测量的表型变量或更高效地生产所关注的产物,在一些情况下,所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。在一些情况下,亲本丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代、无性世代、同物异名或分类等效物。在一些情况下,丝状真菌菌株为黑曲霉或其有性世代或无性世代。在一些情况下,丝状真菌菌株具有非菌丝体粒化形态。在一些情况下,丝状真菌菌株表达酿酒酵母SLN1基因的直系同源物的突变体形式。在一些情况下,丝状真菌菌株为黑曲霉并且酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式的核酸序列为SEQ ID NO:13。在一些情况下,酿酒酵母SLN1基因的直系同源物的突变体形式(例如黑曲霉直系同源物)可操作地连接到选自SEQ ID NO:1或2的启动子序列。在一些情况下,方法进一步包含在步骤(c)之前产生来源于个别丝状真菌菌株的分离克隆群体。在一些情况下,分离包含:(i)诱导经转化的原生质体,以产生多个真菌孢子,其中多个真菌孢子中的每个真菌孢子来源于单一经转化的原生质体;(ii)将来源于单一经转化的原生质体的多个真菌孢子再悬浮于液体中,以产生液体悬浮液;(iii)将液体悬浮液的离散体积分配到包含多个反应区域的衬底中的个别反应区域,其中多个反应区域中的每个反应区域包含生长培养基,其中分配引起至少75%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率;以及(iv)在包含生长培养基的反应区域中培养经分配的单一活性真菌孢子,借此产生来源于个别丝状真菌菌株的分离克隆群体。在一些情况下,方法进一步包含针对离散体积中存在或不存在单一真菌孢子来筛选离散体积,其中仅选择含有单一真菌孢子的离散体积进行步骤(iii)。在一些情况下,筛选离散体积需要在光学上辨别离散体积中存在或不存在单一真菌孢子。在一些情况下,筛选使用能够在光学上辨别离散体积中存在或不存在单一真菌孢子的微流体装置来进行。在一些情况下,分配使得至少80%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分配使得至少90%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分配使得至少95%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分配使得至少99%的个别反应区域含有不超过所述多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分配使得大体上所有个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。在一些情况下,分离包含:(i)诱导经转化的原生质体,以产生多个真菌孢子,其中多个真菌孢子中的每个真菌孢子来源于单一经转化的原生质体;(ii)将来源于单一经转化的原生质体的多个真菌孢子再悬浮于液体中,以产生液体悬浮液;(iii)稀释液体悬浮液,其中稀释为限制稀释法;(iv)将稀释的离散体积分配到包含多个反应区域的衬底中的个别反应区域,其中多个反应区域中的每一反应区域包含生长培养基,其中限制稀释法使得分配到每个反应区域的稀释的离散体积含有一个活性孢子或无活性孢子的概率遵循泊松分布,借此多个反应区域中超过90%的反应区域不含活性孢子且超过90%的含有一或多个活孢子的反应区域仅含有单一活性孢子;(v)在包含生长培养基的所述反应区域中培养所述经分配的单一活性真菌孢子;以及(vi)选择在所述反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。在一些情况下,反应区域存在于微量滴定板中。在一些情况下,微量滴定板含有96个孔、384个孔或1536个孔。
附图说明
图1描绘了用于增加多样性池中的变异的本发明DNA重组方法。DNA区段(如来自相关物种的基因组区域)可以通过物理或酶/化学手段切割。使所切的DNA区域解链且允许其再退火,以便重叠的基因区域引发聚合酶延伸反应。执行后续的解链/延伸反应,直至产物再组装成嵌合DNA,嵌合DNA包含来自一或多种起始序列的元件。
图2概述了用于产生具有所选择的序列修饰(例如,100个SNP交换)的新的宿主丝状真菌菌株的本发明方法。简单来说,方法包含:(1)使用本文提供的方法中的任一种来设计和产生所期望DNA插入物,(2)将DNA插入物克隆到转化构筑体中,(3)将完成的构筑体转移到所期望菌株中(例如基础或生产菌株),其中将其整合到宿主菌株基因组中,以及(4)将选择标记和其它非所需DNA元件环出宿主菌株。每个DNA组装步骤可能涉及额外质量控制(QC)步骤,诸如将构筑体克隆到丝状真菌细胞中用于扩增和测序。转化步骤可在原生质体产生步骤前进行。可以使用本领域中已知的任何原生质体产生方法执行原生质体产生。在一个实施例中,使用本文所提供的方法进行丝状真菌宿主细胞的原生质体产生。在一个实施例中,在转化之前从丝状真菌宿主细胞产生原生质体。
图3表示使用分裂标记系统将SNP靶向于丝状真菌中的特定基因座。标记基因(在这个实例中为pyrG)扩增成两种组分,其在无同源重组的情况下无法补充目标菌株中的突变,标记基因恢复基因功能。侧接这些片段为直接重复DNA,每个DNA含有待靶向基因座的SNP。每个构筑体上的非重复DNA序列促进了通过原生同源重组路径的恰当整合。在图20B的步骤2期间使这些构筑体接种到目标菌株中。
图4绘示了侧接标记基因的直接重复序列为不稳定的且将通过直接重复序列之间的同源重组使得标记去除。实质上,通过将直接重复序列并入到转化DNA中来促进环出。针对选择标记反向选择的细胞含有直接重复区域所侧接的环DNA的缺失。
图5描绘了本发明的丝状真菌菌株改良方法的实施例。对含有基因修饰(基因设计)的宿主菌株序列在不同菌株背景下(菌株构建)的菌株性能改良进行测试。分析(命中ID和分析)展现出有益突变的菌株且将数据存储在库中进行进一步分析(例如SNP交换库、PRO交换库和其组合等)。本发明的选择规则基于将来自一或多个库的元件组合用于额外迭代分析的预测效果产生新的所提议的丝状真菌宿主菌株序列。
图6A至6B描绘了本发明的实施例中的一者的DNA组装、转化和丝状真菌菌株筛选步骤。图6A描绘了用于构建DNA片段、克隆所述DNA片段、使所述片段转化成宿主丝状真菌菌株和通过反向选择环出选择序列的步骤。图6B描绘了用于高通量培养、筛选和评估所选择的丝状真菌宿主菌株的步骤。这个图还描绘了在培养槽中培养、筛选和评估所选择的菌株的任选步骤。
图7描绘了本发明的自动化系统的一个实施例。本发明教示了自动化机器人系统的使用,机器人系统具有能够对宿主丝状真菌进行克隆、转化、培养、筛选和/或测序的各种模块。
图8描绘了本发明的丝状真菌菌株改良方法的实施例的概述。
图9描绘了根据本发明方法的首轮SNP交换实验。(1)将来自C的所有SNP以个别和/或组合方式克隆到基础菌株A中(A“向上波动”到C)。(2)将来自C的所有SNP以个别和/或组合方式从商业菌株C中去除(C“向下波动”到A)。(3)将来自B的所有SNP以个别和/或组合方式克隆到基础A菌株中(A向上波动到B)。(4)来自B的所有SNP以个别和/或组合方式从商业菌株B中去除(B向下波动到A)。(5)将C独有的所有SNP以个别和/或组合方式克隆到商业菌株B中(B向上波动到C)。(6)将C独有的所有SNP以个别和/或组合方式从商业菌株C中去除(C向下波动到B)。
图10描绘了启动子交换的不同获得方法。确切地说,展示了具有注释的启动子的基因的启动子交换设计。
图11描绘了本发明的一个实施例的DNA组装和转化步骤。流程图描绘了用于构建DNA片段、克隆所述DNA片段、使所述DNA片段转化成宿主丝状真菌菌株和通过反向选择环出选择序列的步骤。
图12描绘了用于高通量培养、筛选和评估所选择的宿主丝状真菌菌株的步骤。这个图还描绘了在培养槽中培养、筛选和评估所选择的丝状真菌菌株的任选步骤。
图13描绘了说明性启动子的表达谱,其展现出根据本发明的启动子梯的调控表达范围。启动子A表达在添加所选衬底后立即达到峰值,但随着衬底浓度降低而快速返回到不可检测的水平。启动子B表达在添加所选衬底后立即达到峰值且缓慢降回到不可检测的水平且衬底出现相应的减少。启动子C表达在所选衬底添加后达到峰值,且在整个培养期间保持高度表达,即使在衬底已消耗之后。
图14图示了用于丝状真菌菌株改良的本发明LIMS系统的一个实施例。
图15图示了本发明LIMS系统的实施例的云计算实施方案。
图16描绘了本发明的迭代预测菌株设计工作流程的实施例。
图17图示了根据本发明实施例的计算机系统的实施例。
图18描绘了根据本发明的一个实施例的、与DNA组装相关的工作流程。这个过程分为4个阶段:部件产生、质粒/构筑体组装、质粒/构筑体QC和针对转化制备质粒/构筑体。在部件产生期间,从寡核苷酸测序供应商订购实验室信息管理系统(LaboratoryInformationManagement System,LIMS)所设计的寡核苷酸,且用于在宿主生物体中通过PCR扩增目标序列。对这些PCR部件进行清洁以去除污染物且通过片段分析、由片段尺寸观察值与理论值的比较进行的计算机模拟质量控制和DNA量化来评估成功性。使部件连同组装载体一起转化成酵母且通过同源重组组装成质粒。从酵母中分离出所组装的质粒且将所组装的质体转化成大肠杆菌中进行后续组装品质控制和扩增。在质粒组装品质控制期间,分离出每种质粒的若干个复制品,使用滚环扩增(Rolling CircleAmplification,RCA)进行扩增,且通过酶消化和片段分析来评估正确组装。命中在QC过程期间所鉴别的正确组装的质粒,以产生永久储备料,接着从质粒PCR扩增包括促进基因组整合所必需的任何侧接序列的特定基因构筑体,以产生线性DNA片段,在转化成目标宿主生物体(例如,丝状真菌宿主细胞)之前对线性DNA片段进行定量。作为产生如上文所述的质粒的替代方案,融合PCR可用于产生包括促进丝状真菌宿主细胞中的基因组整合所必需的任何侧接序列的特定基因构筑体。
图19为绘示了根据本发明的实施例在选择用于设计微生物菌株的突变时考虑上位效应的流程图。
图20A描绘了本文中提供且在实例1所述的同核原生质体的自动转化、筛选和纯化的大体概况。图20B绘示了在丝状真菌中SNP/PRO/STOP交换过程中的步骤。图20C绘示了使用整个本发明提供的交换方法中的任一种来筛选用于恰当整合的转化体的过程中的步骤。
图21描绘了通过在如实例2所述的自动转化和筛选之后,在具有或不具有精氨酸时在基本培养基上观察黑曲霉突变体菌株的生长,利用argB标记来筛选黑曲霉突变体菌株共转化体。成功的共转化使得argB基因破裂,并且在基本培养基上未观察到生长。
图22描绘了异核体/同核体的特征。确切地说,这个图绘示了通过在实例3所述的自动转化和筛选之后观察在基本培养基上的黑曲霉突变体菌株的生长,利用aygA比色基因标记来筛选黑曲霉突变体菌株。来源于同核原生质体的菌落为正黄色并且缺乏黑色孢子。
图23A至B描绘了根据本发明的方法进行黑曲霉转化和验证的结果。图23A是黑曲霉转化体的96孔培养板的图像。经转化的培养物包含aygA中的突变,其使得细胞呈现浅黄色而非黑色(经转化的孔用白色圆圈表示)。图23B描绘了经转化的黑曲霉突变体的下一代测序结果。X轴表示目标DNA与未经转化的亲本菌株的序列一致性。Y轴表示目标DNA与预期突变的序列一致性。靠近图右下方的数据点展现与亲本菌株较高的相似度,以及与预期经转化的序列较低的相似度。靠近图左上方的数据点展现与预期经转化的序列较高的相似度以及与亲本菌株较低的一致性。中部的数据点可能表示具有多个细胞核的异核体。
图24描绘了黑曲霉中的SNP交换实施方案。图24的左侧绘示了用于SNP交换的每个SNP的经设计的基因编辑。图24进一步绘示了共转化,其中将pyrG基因引入到aygA野生型基因的基因座中。图24的右侧展示了用于筛选黑曲霉转化体的96孔培养板的两个图像。浅黄色菌落表示aygA基因已成功断裂的转化体。用于构建图24中描绘的突变体菌株的黑曲霉菌株为降低了NHEJ路径活性的菌株。
图25描绘了基于下一代测序结果鉴别出成功的黑曲霉突变体转化体(顶盒)的质量控制(QC)图。选自培养盘的总共29.2%黄色菌落展现出预期的SNP基因变化。
图26描绘了经转化的黑曲霉突变体的下一代测序结果。X轴表示目标DNA与未经转化亲本菌株的序列一致性。Y轴表示目标DNA与预期突变的序列一致性。靠近图右下方的数据点展现与亲本菌株较高的相似度,以及与预期经转化的序列较低的相似度。靠近图左上方的数据点展现与预期经转化的序列较高的相似度以及与亲本菌株较低的一致性。中部的数据点可能表示具有多个细胞核的异核体。
图27描绘了大规模原生质体产生方法,其中使多批量的500ml培养物在500ml原生质体产生缓冲液中经历原生质体产生,继之以将所产生的原生质体储存在-80℃。相较于在50ml至100ml原生质体产生缓冲液中使用100ml培养物,这种方法增大了比例。
图28描绘了用于构建多核生物体的菌株(例如丝状真菌)的高通量(HTP)系统工作流程的原生质体产生部分。
图29描绘了在黑曲霉的两种菌株(1015;11414)上的化学抑制剂W7的最小抑制浓度(MIC)。
图30描绘了快速分离基因组DNA和制备含有鉴别序列的扩增子的步骤,鉴别序列使特定扩增子与其所来自的孔相关联,孔含有在基因改变后被分离的生物体。方法允许分离和筛选96个转化体/转化。将转化体接种到硝酸杆菌,允许形成孢子和将无菌96针复制器用于快速分离。
图31描绘了选出转化体和随后将其转移到96孔微量滴定种子板中并在其中形成孢子。用牙签(K-pick)选出菌落。种子板含有400μg琼脂培养基。由种子板制备的孢子悬浮液用于制备孢子板,并且从孢子板进行冲压/筛选。
图32描绘了在使用如本文所提供的沸腾制备方法从真菌转化体提取DNA之后核酸片段扩增之后进行的片段分析仪。从真菌中多个样品制备基因组模板可能具有挑战性,因为细胞壁通常需要研磨,从孢子获得DNA可能具有难度并且孢子PCR不适用于大多数真菌。如所示,成功地进行了NGS的短长度PCR。沸腾制备方法显示了PrepMan可用作基因组DNA纯化的有效方法,且可为自动化的。
图33描绘了以不同比率含有不同基因背景的孢子(即,突变体(m)对亲本(p))的混合物的菌株的比色差异。如所示,在所测试的选择方案中,仅不具有亲本孢子的菌株(p/m比率为0:1)呈现黄色。有两种方法确定转化体是否为异核体:1.)表型和2.)测序。在这个图中,通过黄色表型和NGS对转化体进行评分。测试这两种方法的灵敏度对于使转化体评分适应工作流程是重要的。如果核酸的1/10为黑色,那么菌落可呈现黑色且因此NGS可在反向选择之前和之后使用。
图34描绘了来自图33中展示的混合孢子板和图35顶部处的板的扩增子序列的曲线图。Y轴为含有靶向突变的扩增子的百分比,且X轴为仍含有亲本的百分比。大曲线图含有来自整个板的数据,其表示板内的混合孢子的全部范围。右侧的图形是板的个别行的图形。当对细胞核的定义混合物进行测试时,行的这些图形定义了在NGS中观察到的扩增子分布范围。接着可将这种分析用于预测来自SNPSWP菌株构建的数据集内SNP的分布。这种预测可用于菌株构建过程中的QC步骤。
图35描绘了NGS用以检测来自具有不同基因背景的丝状真菌的孢子的混合物中的SNPS的能力的测试,基因背景产生具有pyrG背景(黑色)或met3背景(浅色)的菌株。met3菌株需要具有甲硫氨酸的生长培养基并且对亚硒酸盐具有抗性。顶部含有孢子的板表明,表型可在混合培养物中被掩盖且可难以在视觉上评分。含有高于10倍突变体(黄色)细胞核的行仍呈现黑色。NGS可检测视觉表型无法检测到的突变。饼图是群体可在不同生长条件下移位的实例。确切地说,NGS展示了选择性培养基可迫使细胞核的混合群体达到同核体。这可用于菌株纯化,但其还表明必须在个别SNP水平下监测菌株构建过程期间的生长和繁殖。
图36描绘了用于进行SNP整合的三种方法(具有SNP重复的分裂标记;分裂标记终止子重复;环入单交换)。具有SNP重复的分裂标记可用于产生本发明所述的插入型缺失。分裂标记终止子重复具有促进来自初级整合的所期望表型的优势。相比之下,环入单交换需要质粒克隆和制备,异位整合可能较高,并且可能发生多联体化。
图37描绘了利用二分标记转化在诸如丝状真菌的多核生物体中进行组合SNPSWP的实施例。这个图描绘了一种用于真菌中的组合SNPSWP的工具,其可将具有发散型pyrG基因的各种诱导型启动子与可由葡糖抑制的代谢物的启动子组合,可以在葡糖上选择转化体,使得有利于弱表达基因的多重整合,并且可以将转化体接种到具有FOA的诱导培养基上,得到环出。
图38描绘了使用NGS测序以检测多重整合、异位整合或相同细胞核中SNP和非SNP的存在。
图39描绘了通过产生基因缺失进行SNPSWP。
图40描绘了将四种不同启动子接种到目标基因的前方以产生4种不同菌株。可以在测试中比较这些菌株的所期望性状,并且可以确定理想表达量。
图41绘示了通过使用本发明所述的方法在棒杆菌中进行的输入考虑中数据的相对应菌株性能的分布的实例。相对性能为零表示经工程改造的菌株与盘内基础菌株的性能同样好。本文所述的方法经设计来鉴别性能可能明显高于零的菌株。
图42绘示了使用SNP SWP来整合通过对扩增子的限制分析所展示的两种BP变化。这个图中所描绘的结果是针对kusA+菌株中进行SNPSWP的实验。此处,通过SNPSWP靶向EcoRV限制位点,以便将改变EcoRV位点的两种bp SNP添加到BamHI限制位点。使pyrG基因靶向aygA基因座,以便允许比色选择(即,选出黄色菌落),并且接着进行限制消化以筛选SNP的整合。24/36选出的36个黄色转化体在扩增子中含有BamHI位点。因此,SNPSWP共转化在无kusA的情况下作用。
图43绘示了菌株和其经改良的后代在其对柠檬酸生产培养基的响应方面如何不同。
图44绘示了系统地和全面地探索基因组独立于所定义基因功能的经验设计策略。这个图描绘了2种菌株在其基因组有43个SNP不同。使用在整个本发明提供的SNPSWP方法,可以用自动化对这些SNP中之每一者单独或组合的作用进行检测。
图45绘示了融合PCR在产生用于本发明的分裂标记构筑体的用途。
图46绘示了如图45所描绘的产生的分裂标记构筑体的质量控制分析。
图47绘示了将crRNA退火到tracrRNA并且与Cas9蛋白质复合,借此产生能够进行crRNA定向的DNA裂解的RNP。
图48绘示了用于将GEP转化成黑曲霉原生质体的方法。将100μL或10^6个原生质体(PyrG-)在10μl的STC缓冲液中用RNP和含有PyrG标记的质粒转化。将这些混合并且在冰上培育持续十五分钟。接着将细胞与40%PEG在STC中混合并且在室温下放置持续15分钟。将转化体与+0.8%琼脂糖在以渗透方式稳定的基本培养基中混合且用额外琼脂覆盖。接着对菌落进行计数,并且对由RNG介导的基因组编辑引起的表型变化评分(未示出)。
图49A至49F绘示了AygA基因座处的Cas9RNP裂解的非同源末端结合(NHEJ)修复。通过一个或两个crRNA序列靶向AygA基因,一个或两个crRNA序列与tracrRNA和Cas9复合(图49A)。插入缺失致使分生孢子从黑色(图49B)到黄色(图49C),实现了表型筛选用于成功的RNP转化。来自从原生质体分离的扩增基因组DNA的跟踪文件的实例表明,插入缺失表明插入缺失已形成于目标位点的近端,用与tracrRNA和Cas9蛋白质复合的单一crRNA对所述原生质体进行转化(图49D)。从用RNP靶向两个位点771bp分离的转化分离的扩增基因组DNA的跟踪文件表明,两种RNP都可以共转化成单一原生质体并且介导两个目标位点之间的大型内部缺失(图49E)。转化实验的菌落形成单位(CFU)数目和当用1、2或对照crRNA/tracrRNA序列进行转化时含有插入缺失的那些菌落的估计百分比(图49F)。在总转化的10×稀释之后对CFU进行计数。
图50A至50C绘示了通过线性供体和靶向基因组的RNP介导的HR的效率的测量。原生质体为经共转化的Cas9,其与靶向AygA基因的一种(Ayg.1)或两种(Ayg.1+Ayg.3)cr/tracrRNA以及线性供体和含有pyrG的质粒复合。供体在Ayg.1切割位点周围侧接同源487或438bp。供体含有(图50A)具有启动子和终止子的pyrG基因或(图50B)4bp插入。AygA基因座为从单一发芽孢子扩增的PCR(图50C)。结果表明,对RNP、质粒和供体进行共转化介导了靶向crRNA的存在下而无对照crRNA时插入pyrG基因。这个实验还展示了RNP与来自(图50B)的供体的共转化实现了HR编辑率为86%。
图51绘示了DJV_03_pyrG_insertion_in_AygA展示了具有启动子和终止子(小写字母)的pyrG,启动子和终止子通过5'和3'同源区域(大写字母)侧接到AygA基因。这个图对应于SEQ ID NO:9。
图52绘示了DJV_07_4bp_insertion_in_AygA包含4bp插入(小写字母),其通过5'和3'同源区域(大写字母)侧接到AygA基因。这个图对应于SEQ ID NO:10。
图53绘示了用于引入或改变基因组中的序列的传统策略。分裂基因标记(左)或整合构筑体(右)可以分别用于通过三个或一个交叉事件并入新的基因物质。同源区域、包围标记和突变将整合靶向到所期望基因座。稍后,可以使用标记来选择环入事件,并且可以接着使用反向可选标记来选择环出事件。整合体可以环出以产生(1)中所示的野生型序列或(3)中所示的新突变。
图54A至54B绘示了利用传统和新方法来修饰黑曲霉的工作流程。传统工作流程花费20天并且未明确地实现克隆群体(图54A)。基本培养基上的生长抑制了亲本菌株生长,但未抑制异核体,异核体在相同细胞中含有经转化和未经转化的细胞核。新方案导致在步骤2的母体死亡和纯克隆群体,并且仅花费12天(图54B)。
图55A、图55B和图55C描绘了由CellenONE(法国,里昂,Cellenion)分配的具有高保真度的一个印刷单一孢子。将黄色孢子和黑色孢子在水中以1:1混合,最终浓度为2×106,且由CellenONE(法国,里昂,Cellenion)分配到三个×96孔和一个含有琼脂的×384孔微量滴定板。在4天之后,视觉上对孔进行计数(图55A)。印有黑色孢子和黄色孢子的96孔板的图像(图55B)。不含有发芽孢子的孔的百分比。这可归因于印刷错误(无分配)或归因于印刷了无活性的孢子(图55C)。展示黑色孢子和黄色孢子两者的孔的百分比,指示两个孢子在相同液滴中印刷。
图56A至B绘示了两种经退火的寡核苷酸可在不改变原间隔位点的PAM或种子区域时创建SNP。将双股供体与如实例11所述的RNA和质粒进行共转化。图56A展示了供体含有无义突变(以小写字母展示),无义突变在5'和3'侧通过同源50bp侧接到AygA基因。图56B展示了用桑格技术(Sanger technology)进行测序的分离菌落的两种跟踪文件。第一种跟踪文件与野生型序列比对并且第二种跟踪文件含有预期突变(由星号表示)。
图57绘示了形态基因的启动子交换(即,FungiSNP_18;SEQ ID NO:13)。控制这种基因的表达的不同启动子影响形态。含有manB融合和amyB融合的菌株相对于11414亲本菌株保留多个顶端,而具有较高srpB和mbfA表达的菌株缺乏多个顶端表型。在30℃下,使菌株在柠檬酸生产培养基(14%w/v葡糖,pH为2,亏损Mn++)中生长持续48小时。当培育168小时时,具有较高表达启动子的菌株以及亲本对照都含有长丝状菌丝。使具有来自启动子融合、amyB和manB的较低表达量的菌株保持粒化。
图58绘示了基础1015菌株和11414生产菌株中形态基因目标18的启动子交换。与FungiSNP_18相关的基因产物为对渗透应激起反应的信号传导激酶(即,酿酒酵母SLN1的黑曲霉直系同源物)。这个图展示了当通过将原生启动子用较弱启动子置换来降低所述基因的基因表达时,细胞维持更紧密、不太长的表型,其在本文中称为“粒化”表型(参见右图,针对在基础菌株1015和生产菌株11414中表达manB(p)snp18基因的细胞)。在30℃下使菌株在柠檬酸生产培养基(14%w/v葡糖,pH为2,亏损Mn++)中生长持续24小时。这种生长类型对于搅拌槽发酵可为有利的。
图59绘示了通过在manB(p)启动子(SEQ ID NO:1)的控制下引入FungiSNP_18基因(SEQ ID NO:13)降低了基础菌株(即黑曲霉1015)中FungiSNP_18基因产物水平,使得不能在基础菌株基因背景中形成孢子。当将相同构筑体引入到生产菌株(即,黑曲霉11414)时,未观测到这种表型。
图60绘示了根据本发明的方法进行黑曲霉分裂标记转化和验证的结果。使用经转化的(通过分裂标记)黑曲霉突变体的NGS得到数据,且数据为与目标处的突变的匹配相对于与目标处的亲本的匹配的分布。这个图形左上角中的每个样本为正确的且已通过QC。圆圈内的样品在基因座处含有突变体和亲本两者,并且可以通过图20B的步骤4和5再次处理,以便产生可通过QC的分离物。
图61为来自SNPSWP活动的NGS数据的图形表示。在这个实例中,使用图45中所呈现来设计的构筑体靶向31个基因座。此处,通过对来自所有个别样品的每个扩增子群体进行测序来筛选1264个总分离物。这种数据集含有超过一百万个经测序的扩增子。存在通过所有QC要求的119个样品。质量控制包括检查基因座处亲本突变的存在,并且来自孔的所有扩增子必须匹配整个扩增子中的目标DNA。具有符号+的样品为正确的,具有符号·的样品可含有亲本和突变两者。
图62绘示了含有基础SNP18的菌株在低pH的培养基上生长得更快。
图63绘示了含有基础SNP18的菌株在具有渗透应激的培养基上生长得更快。
图64绘示了基础菌株与生产菌株之间交换FungiSNP_18对形成孢子和径向生长率的影响。
图65绘示了在生产菌株中在含有SNP(即来自表4的FungiSNP)的所有编码序列的基础菌株中的缺失。
图66绘示了含有FungiSNP18的基因对于生产菌株中而非基础菌株中的形成孢子而言并非必需的。
图67绘示了二分构筑体的设计和用于进行实例3所述的PROSWP实验的一般方案。
图68绘示了实例3中所用的较弱启动子影响形态。在弱manB启动子下,相较于含有其它启动子组合的菌株,含有FungiSNP_18(SNP18)的菌株具有更紧密的菌落形态。在渗透应激下,相较于低pH,SNP18对照的影响更显著。
图69绘示了FungiSNP_12(snp_12)的PROSWP,可操作地连接到snp_12的较低强度启动子,并且使得菌丝中的黄色色素和一些形态改变(在菌落的边缘观察到)。这种黄色色素常见于多种突变体并且被认为是代谢应激的标志。
图70绘示了当由较弱启动子驱动时,相较于生产菌株,基础菌株中的FungiSNP_18(snp_18)具有更严格形态表型。
具体实施方式
本发明克服了在自动化、高通量平台中基因操控丝状真菌的许多固有的挑战。本文所提供的方法经设计为使用与自动化筛选转化体组合的自动化共转化、通过并入基因变化来产生真菌生产菌株,借此允许在两种菌株之间交换基因性状而不经历有性杂交。本发明还包含一种用于产生大量原生质体的程序和一种用于将其储存以供稍后使用的装置。大批量易于获得的感受态细胞可极大地促进自动化。
定义
尽管相信所属领域的技术人员充分理解以下术语,但仍阐述以下定义以促进对本发明标的物的解释。
术语“一(a/an)”是指所述实体中的一或多个,即可以指多个指示物。因而,术语“一(a/an)”、“一或多种”和“至少一种”在本文中可互换地使用。此外,通过不定冠词“一(a/an)”提及“一个元件”并不排除存在超过一个元件的可能性,除非上下文明确要求存在一个并且仅存在一个元件。
如本文所用,术语“细胞生物体”、“微生物体”或“微生物”应广义地理解。这些术语可互换地使用并且包括(但不限于)两种原核生物域:细菌和古细菌以及某些真核生物真菌(例如,本文所述的丝状真菌)和原生生物。在一些实施例中,本发明是指本发明所存在的清单/表格和图式中的“微生物体”或“细胞生物体”或“微生物”。这种表征不仅可以指表格和图式的已鉴别分类,而且指已鉴别的分类物种,以及所述表格或图式中的各种新颖和最新鉴别或设计的任何生物体菌株。在本说明书的其它部分(如实例)中对于这些术语的叙述也具有相同表征。
如本文所用,术语“多核体”或“多核生物体”可以指多核细胞或包含多核细胞的生物体。不同于合胞体是由细胞聚集、继之以物质内部细胞膜的溶解产生,多核细胞可由多个核分裂产生而不具有其伴随的胞质分裂。与本文提供的方法、组合物和系统有关的多核生物体的实例可以包括原生生物(例如藻类、原生动物、多连体(粘菌)、囊泡虫、植物、真菌(例如丝状真菌)和/或后生动物(例如果蝇)。
术语“原核生物”在所属领域内已认知且指不含核或其它细胞器的细胞。原核生物通常按照两种结构域之一者归类:细菌和古细菌。古细菌域和细菌域生物体之间的决定性差异是基于16S核糖体RNA中的核苷酸碱基序列的基本差异。
术语“古细菌”是指疵壁菌门(Mendosicutes)的生物体类别,其通常发现于异常环境中且根据若干个准则而与原核生物的其余部分区分开来,准则包括核糖体蛋白的数目和细胞壁中的胞壁酸的缺乏。基于ssrRNA分析,古细菌由系统发生上截然不同的两种群组组成:嗜泉古菌界(Crenarchaeota)和广古生菌界(Euryarchaeota)。古细菌基于其生理学可以分为三类:产甲烷菌(产生甲烷的原核生物);极端嗜盐菌(extreme halophiles)(在极高浓度的盐(NaCl)存在下活着的原核生物)和极端(超)嗜热菌(extreme(hyper)thermophilus)(在极高温度下活着的原核生物)。除有别于细菌的统一古细菌特点(即,细胞壁中没有胞壁质、酯连型膜脂质等)之外,这些原核生物还展现出使其适应其特定栖息地的独特结构或生物化学属性。嗜泉古菌界主要由极端嗜热性硫依赖性原核生物组成且广古生菌界含有产甲烷菌和极端嗜盐菌。
“细菌”或“真细菌”是指原核生物体域。细菌包括如下至少11种不同群组:(1)革兰氏阳性(革兰+)细菌,其存在两大亚门:(1)高G+C群组(放线菌、分枝杆菌、微球菌等),(2)低G+C群组(芽孢杆菌、梭菌、乳杆菌属、葡萄球菌、链球菌、霉浆菌);(2)变形菌,例如紫色光合成+非光合成革兰氏阴性细菌(包括最“常见”的革兰氏阴性细菌);(3)蓝细菌,例如有氧光养型;(4)螺旋菌和相关菌种;(5)浮霉状菌;(6)拟杆菌、黄杆菌;(7)衣原体;(8)绿色硫细菌;(9)绿色非硫细菌(也是无氧光养型);(10)抗放射性微球菌和相关菌种;(11)栖热孢菌和嗜热性热袍菌(Thermosipho thermophiles)。
“真核生物”是其细胞含有核和封闭于膜内的其它细胞器的任何生物体。真核生物属于真核或真核生物分类群。将真核细胞与原核细胞(前述细菌和古细菌)区分开来的定义性特点是其具有结合膜的细胞器,尤其是含有基因物质和封闭于核膜内的细胞核。
术语“经基因修饰的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换地使用且指已经通过本发明的克隆和转化方法经基因修饰的宿主细胞。因此,术语包括宿主细胞(例如细菌、酵母细胞、真菌细胞、CHO、人类细胞等),相较于其所来源的天然存在的生物体,宿主细胞已经基因改变、修饰或工程改造,以便其展现出经改变、修饰或不同的基因型和/或表型(例如当基因修饰影响微生物体的编码核酸序列时)。应了解,在一些实施例中,术语不仅指所讨论的特定重组宿主细胞,而且指这种宿主细胞的后代或潜在后代。
术语“野生型微生物体”或“野生型宿主细胞”描述自然界中存在的细胞,即尚未经基因修饰的细胞。
术语“亲本菌株(parent strain/parental strain)”或“亲本”可以指来源于其的突变体菌株的宿主细胞。因此,“亲本菌株(parent strain/parental strain)”是一种宿主细胞或细胞的基因组受所属领域中已知和/或本文所提供的任何方式干扰以产生一或多种突变体菌株的宿主细胞或细胞。“亲本菌株(parent strain/parental strain)”可以具有或不具有与野生型菌株相同的基因组。
术语“基因工程改造”可以指对宿主细胞的基因组的任何操纵(例如核酸的插入、缺失、突变或置换)。
术语“对照”或“对照宿主细胞”是指适当的比较宿主细胞,用于测定基因修饰或实验处理的影响。在一些实施例中,对照宿主细胞是野生型细胞。在其它实施例中,对照宿主细胞在基因上与经基因修饰的宿主细胞相同,除了分化处理宿主细胞的基因修饰之外。在一些实施例中,本发明教示了使用亲本菌株作为对照宿主细胞(例如使用S1菌株作为菌株改良程序的基础)。在其它实施例中,宿主细胞可以是基因相同的细胞,其缺乏处理宿主细胞中所测试的特定启动子或SNP。
如本文所用,术语“等位基因”意指基因的一或多种替代形式中的任一种,其所有等位基因涉及至少一种性状或特征。在二倍体细胞中,指定基因的两个等位基因占据一对同源染色体上的相应基因座。在实施例中,因为本公开涉及QTL,即可以包含一或多个基因或调控序列的基因组区域,所以在一些情况下,称为“单倍型”(即染色体区段的等位基因)比“等位基因”更准确,然而,在那些情况下,术语“等位基因”应理解为包含术语“单倍型”。
如本文所用,术语“基因座(locus)”(基因座(loci)的复数形式)意指发现有例如基因或基因标记的染色体上的特定位置或位点。
如本文所用,术语“以基因方式连接”是指在育种期间,两种或更多种性状以高比率共同继承,使得其难以通过杂交来分离。
如本文所用,“重组”或“重组事件”是指染色体交叉或独立分类。术语“重组”是指具有由于重组事件而产生的新基因组成的生物体。
如本文所用,术语“表型”是指个别细胞、细胞培养物、生物体或生物体群组的可观察特征,其由那个个体的基因组成(即基因型)与环境之间的相互相用产生。
如本文所用,当描述核酸序列或蛋白质序列时,术语“嵌合”或“重组”是指将至少两个异源多核苷酸或两个异源多肽连接成单个大分子,或使至少一个天然核酸或蛋白质序列的一或多个元件重新排列的核酸序列或蛋白质序列。举例来说,术语“重组”可以指序列中的两个以其它方式分离的区段例如通过化学合成或通过基因工程改造技术操纵核酸的分离区段进行的人工组合。
如本文所用,“合成核苷酸序列”或“合成多核苷酸序列”是已知不存在于自然界中或非天然存在的核苷酸序列。通常,当相较于任何其它天然存在的核苷酸序列时,这类合成核苷酸序列将包含至少一种核苷酸差异。
如本文所用,术语“核酸”是指具有任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)聚合物形式,或其类似物。这一术语是指分子的初始结构,并且因此包括双股和单股DNA,以及双股和单股RNA。其还包括经修饰的核酸,如甲基化和/或封端核酸、含有经修饰的碱基、主链修饰的核酸等。术语“核酸”和“核苷酸序列”可互换地使用。
如本文所用,术语“DNA架构”或“核酸架构”是指人工产生的核酸架构或用作架构的天然存在的序列。在本发明的一个实施例中,核酸架构为合成脱氧核糖核酸架构。合成架构的脱氧核糖核苷酸可以包含嘌呤和嘧啶碱基或其它天然、化学或生物化学修饰的、非天然或衍生的脱氧核糖核苷酸碱基。如本文中更详细描述,本发明的核酸架构用以在空间和时间上组装和固定生物路径中参与的两种或更多种蛋白质(即生物合成酶),以产生功能性复合物。每种生物路径蛋白质在架构上的组装和固定通过架构的蛋白质结合序列(即蛋白质对接点)中的一者与嵌合生物合成酶的相应DNA结合部分之间的结合相互作用进行。因此,核酸架构包含一或多个亚单位,每个亚单位包含两个或更多个蛋白质结合序列,以适应两种或更多种不同嵌合生物路径蛋白质的结合。
如本文所用,“DNA结合序列”或“DNA结合位点”是指通过本发明的嵌合生物合成基因的DNA结合域部分来识别和结合的特定核酸序列。许多DNA结合蛋白域和其同源结合伴侣识别位点(即,蛋白质结合位点)为所属领域中众所周知的。举例来说,多种锌指结合域和其对应DNA蛋白质结合目标位点是所属领域中已知的并且适用于本发明。其它DNA结合域包括(但不限于):亮氨酸拉链结合域和其对应DNA蛋白质结合位点、翼状螺旋结合域和其对应DNA蛋白质结合位点、翼状螺旋-转角-螺旋结合域和其对应DNA蛋白质结合位点、HMG-box结合域和其对应DNA蛋白质结合序列、螺旋-环-螺旋结合域和其对应DNA蛋白质结合序列以及螺旋-转角-螺旋结合域和其对应DNA蛋白质结合序列。具有已知DNA蛋白质结合序列的其它已知DNA结合域包括:免疫球蛋白DNA域、B3DNA结合域和TAL效应DNA结合域。本发明的核酸架构亚单位可包含前述蛋白质结合位点中的任何两个或更多个。
如本文所用,术语“基因”是指与生物功能相关联的任何DNA区段。因此,基因包括(但不限于)编码序列和/或其表达所需的调节序列。基因还可以包括未表达的DNA区段,其例如形成其它蛋白质的识别序列。基因可以从多种来源获得,包括从所关注的来源克隆或从已知或预测的序列信息合成,并且可以包括经设计具有所期望参数的序列。
如本文所用,术语“同源”或“同源物”或“直系同源物”在所属领域中已知并且指具有共同祖先或家族成员并且基于序列一致程度测定的相关序列。术语“同源性”、“同源”、“大体上类似”和“基本上对应”在本文中可互换地使用。其是指核酸片段,其中一或多个核苷酸碱基的变化不影响核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰,如一或多个与初始、未经修饰的片段相比未大体上改变所得核酸片段的功能特性的核苷酸的缺失或插入。因此应理解,如所属领域的技术人员将了解,本发明涵盖除特定例示性序列之外的序列。这些术语描述了一种物种、亚种、变种、栽培品种或品系中所发现的基因与另一种物种、亚种、变种、栽培品种或品系中的相应或等效基因之间的关系。出于本发明的目的,对同源序列进行比较。“同源序列”或“同源物”或“直系同源物”被认为、相信或已知在功能上是相关的。功能性关系可以用多种方式中的任一种表示,包括(但不限于):(a)序列同一性程度和/或(b)相同或相似的生物功能。优选的是,表示(a)和(b)。可以使用所属领域中容易地获得的软件程序来测定同源性,如现代分子生物学实验技术(Current Protocols in Molecular Biology)(F.M.奥斯贝(F.M.Ausubel)等人编,1987)副刊30,章节7.718,表7.71中所论述的那些软件程序。一些比对程序是MacVector(牛津分子有限公司(Oxford Molecular Ltd),英国牛津(Oxford,U.K.))、ALIGN Plus(科学和教育软件(Scientific and Educational Software),宾夕法尼亚州(Pennsylvania))以及AlignX(Vector NTI,英杰公司(Invitrogen),加利福尼亚州卡尔斯巴德(Carlsbad,CA))。另一种比对程序是Sequencher(Gene Codes,密歇根安娜堡(Ann Arbor,Michigan)),其使用默认参数。
如本文所用,术语“内源”或“内源基因”是指天然存在的基因,在其所处位置发现其天然地存在于宿主细胞基因组内。在本发明的背景下,异源启动子可操作地连接到内源基因意指将异源启动子序列基因插入现有基因之前,那个基因天然存在的位置。如本文所述的内源基因可以包括天然存在的基因的等位基因,等位基因已经根据本发明的任一种进行突变。
如本文所用,术语“外源”与术语“异源”可互换地使用且指来自不同于其原生来源的一些来源的物质。举例来说,术语“外源蛋白质”或“外源基因”是指来自非原生来源或位置且已经通过人工方式提供到生物系统中的蛋白质或基因。
如本文所用,术语“异源修饰”可以指特定生物系统原生的来源(例如,如本文所提供的宿主细胞)以外的修饰,或特定生物系统原生的来源但在非原生情境/方位/位置中发现的来源的修饰。因此,就生物系统而言(例如,如本文所提供的宿主细胞,或宿主细胞内的非原生情境/方位/位置),修饰是非原生的或非天然存在的,其中已引入或将引入所述修饰。因此,异源修饰可以认为被人工地引入到生物系统(例如,如本文所提供的宿主细胞,或宿主内的异源情境/方位/位置)。修饰可以是基因或表观基因变异、破裂或扰动。基因变异、破裂或扰动可以例如将基因的原生启动子和/或终止子用并非所述宿主原生的启动子和/或终止子置换,或其可以是来自已移动到非原生异源情境/方位/位置的宿主生物体内的启动子和/或终止子。基因变异、破裂或扰动可以是将原生或天然存在的基因用非原生或天然存在的基因(例如,可选标记基因)置换。或者,基因变异、破裂或扰动可以是将原生或天然存在的基因用来自宿主基因组内的另一种原生基因(例如启动子)置换或交换,另一种原生基因被接种到非天然情境/方位/位置中。基因变异、破裂或扰动可以是将原生或天然存在的基因用非原生或天然存在的基因形式置换。非原生或天然存在的基因形式可以是在特定宿主细胞中非天然发现的基因的突变体形式和/或在可操作地连接到异源启动子和/或终止子的特定宿主细胞中非天然发现的基因的突变体形式。
如本文所用,术语“核苷酸变化”是指例如核苷酸取代、缺失和/或插入,如所属领域中充分理解。举例来说,突变含有可产生沉默取代、添加或缺失,但不改变所编码的蛋白质的特性或活性或蛋白质的制备方式。
如本文所用,术语“蛋白质修饰”是指例如氨基酸取代、氨基酸修饰、缺失和/或插入,如在所属领域中充分理解。
如本文所用,术语核酸或多肽的“至少一部分”或“片段”意指具有这类序列的最小尺寸特征的部分,或全长分子任何更大的片段,至多并且包括全长分子。本发明的多核苷酸片段可以编码基因调节元件的生物活性部分。基因调节元件的生物活性部分可通过分离本公开的一种多核苷酸中包含基因调节元件的部分并且如本文所述评估活性来制备。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,最多是全长多肽。待使用的部分的长度将取决于具体应用。适用作杂交探针的核酸部分可短到12个核苷酸;在一些实施例中,其是20个核苷酸。适用作抗原决定基的多肽的一部分可以短到4个氨基酸。发挥全长多肽功能的多肽的一部分通常将长于4个氨基酸。
变异体多核苷酸还涵盖来源于突变诱发和重组程序(如DNA改组)的序列。用于这类DNA改组的策略在所属领域中已知。参见例如Stemmer(1994)《美国国家科学院院刊(PNAS)》91:10747-10751;Stemmer(1994)《自然(Nature)》370:389-391;Crameri等人(1997)《自然生物技术(Nature Biotech.)》15:436-438;Moore等人(1997)《分子生物学杂志(J.Mol.Biol.)》272:336-347;Zhang等人(1997)《美国国家科学院院刊》94:4504-4509;Crameri等人(1998)《自然》391:288-291;以及美国专利第5,605,793号和第5,837,458号。
就本文所公开的多核苷酸的PCR扩增来说,可以设计用于PCR反应中的寡核苷酸引物来由从所关注的任何生物体提取的cDNA或基因组DNA扩增相应的DNA序列。用于设计PCR引物和PCR克隆的方法在所属领域中通常已知并且公开于萨布鲁克(Sambrook)等人(2001),《分子克隆:实验指南(Molecular Cloning:A Laboratory Manual)》(第3版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约普莱恩维尤(Plainview,New York))。还参见Innis等人编(1990)《PCR方案:方法和应用指导(PCR Protocols:AGuide to Methods and Applications)》(Academic Press,纽约);Innis和Gelfand编(1995)《PCR策略(PCR Strategies)》(Academic Press,纽约);以及Innis和Gelfand编(1999)《PCR方法手册(PCR Methods Manual)》(Academic Press,纽约)。已知的PCR方法包括(但不限于)使用成对引物、巢式引物、单一特异性引物、简并引物、基因特异性引物、载体特异性引物、部分不匹配引物等的方法。
如本文所用,术语“引物”是指一种寡核苷酸,当其在诱导引物延伸产物合成的条件下(即,在核苷酸和聚合药剂(如DNA聚合酶)存在下和在适合温度和pH下)接种时,能够退火到扩增目标,从而允许DNA聚合酶附著,借此充当DNA合成的起始点。(扩增)引物优选单股以获得最大的扩增效率。引物优选寡脱氧核苷酸。引物必须足够长以在用于聚合的试剂存在下引发延伸产物的合成。引物的精确长度将取决于多种因素,包括引物的温度和组成(A/T对G/C含量)。一对双向引物由一个正向和一个反向引物组成,如在DNA扩增(如PCR扩增)领域中通常使用。
术语“严格度”或“严格杂交条件”是指影响杂交物的稳定性的杂交条件,例如温度、盐浓度、pH值、甲酰胺浓度等。这些条件可凭经验最佳化以最大化特异性结合和最小化引物或探针与其目标核酸序列的非特异性结合。所使用的术语包括提及探针或引物将与其目标序列杂交的条件,相较于其它序列,可检测程度更高(例如,至少是背景的2倍)。严格条件具有序列依赖性并且将在不同情形下不同。更长序列在更高温度下特异性地杂交。一般来说,选择严格条件,使其比在所定义离子强度和pH值下的特异性序列的热熔点(Tm)低约5℃。Tm是使50%的互补目标序列与完全匹配的探针或引物杂交的温度(在所定义离子强度和pH值下)。通常,严格条件将是盐浓度在pH 7.0到8.3下低于约1.0M Na+离子,通常为约0.01到1.0M Na+离子浓度(或其它盐),并且对于短探针或引物(例如10到50个核苷酸)温度为至少约30℃和对于长探针或引物(例如大于50个核苷酸)至少为约60℃的条件。严格条件也可以用添加去稳定化剂(如甲酰胺)来实现。例示性低严格度条件或“严格度降低的条件”包括在37℃下与30%甲酰胺、1M NaCl、1%SDS的缓冲溶液杂交并且在40℃下,在2×SSC中洗涤。例示性高严格度条件包括在37℃下,在50%甲酰胺、1M NaCl、1%SDS中杂交,并且在60℃下,在0.1×SSC中洗涤。杂交程序是所属领域中是众所周知的并且由例如Ausubel等人,1998和Sambrook等人,2001所述。在一些实施例中,严格条件是在45℃下,在含有1mMNa2EDTA、0.5-20%十二烷基硫酸钠的0.25M Na2HPO4缓冲液(pH为7.2)杂交,如0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%,继之以在55℃到65℃下,在含有0.1%(w/v)十二烷基硫酸钠的5×SSC中洗涤。
如本文所用,“启动子”是指能够控制编码序列或功能性RNA的表达的DNA序列。在一些实施例中,启动子序列由近端和更远端上游元件组成,后者元件通常称为增强子。因此,“增强子”是能够刺激启动子活性的DNA序列,并且可以是启动子的固有元件或为了增强启动子含量或组织特异性而插入的异源元件。启动子可完全来源于原生基因,或由来源于自然界中所发现的不同启动子的不同元件组成,或甚至包含合成DNA区段。所属领域的技术人员应理解,不同启动子可引导不同组织或细胞类型中基因的表达,或处于不同发育阶段,或响应不同的环境条件。本文所述的方法和系统中使用的启动子可以是诱导型的,使得在所述启动子的控制下的基因的表达通过特定药剂的存在和/或不存在调节。诱导型启动子可以是其转录活性通过化学或物理条件(例如醇、四环素、类固醇、金属或所属领域中已知的其它化合物)的存在或不存在或通过光或低温或高温的存在或不存在调节的任何启动子。另外认识到,由于在大多数情况下,调节序列的确切边界尚未完全界定,因此一些变异的DNA片段可以具有相同的启动子活性。
如本文所用,“终止子”一般是指标记基因组DNA中的基因的末端并且能够终止转录的DNA序列的区段。终止子可完全来源于原生基因或由来源于自然界中所发现的不同终止子的不同元件组成,或甚至包含合成DNA区段。所属领域的技术人员应理解,不同终止子可引导不同组织或细胞类型中基因的表达,或处于不同发育阶段,或响应不同的环境条件。
如本文所用,短语“重组构筑体”、“表达构筑体”、“嵌合构筑体”、“构筑体”以及“重组DNA构筑体”在本文中可互换地使用。重组构筑体包含核酸片段的人工组合,例如自然界中未一同发现的调节和编码序列。举例来说,嵌合构筑体可以包含来源于不同来源的调节序列和编码序列,或来源于相同来源的调节序列和编码序列,但其以不同于自然界中发现的方式排列。这类构筑体可以单独使用或可以与载体结合使用。如所属领域的技术人员众所周知,如果使用载体,那么载体的选择取决于用于转化宿主细胞的方法。举例来说,可以使用质粒载体。所属领域的技术人员深知,为了成功地转化、选择和繁殖包含本发明的任一种分离核酸片段的宿主细胞,基因元件必须存在于载体上。所属领域的技术人员还将认识到不同的独立转化事件将引起不同的表达量和表达模式(琼斯(Jones)等人,(1985),EMBOJ 4:2411-2418;德阿尔梅达(De Almeida)等人,(1989),分子基因遗传学(Mol.Gen.Genetics)218:78-86),且因此必须对多个事件进行筛选以便获得呈现出所期望表达量和模式的株系。这类筛检可尤其通过DNA的Southern分析、mRNA表达的Northern分析、蛋白质表达的免疫印迹分析或表型分析来实现。载体可以是质粒、病毒、噬菌体、前病毒、噬粒、转座子、人工染色体等,其自主地复制并且能整合到宿主细胞的染色体中。载体还可以是非自发复制的裸RNA多核苷酸、裸DNA多核苷酸、由相同股内的DNA和RNA组成的多核苷酸、多聚赖氨酸结合的DNA或RNA、肽结合的DNA或RNA、脂质体结合的DNA等。如本文所用,术语“表达”是指功能性最终产物(例如mRNA或蛋白质(前体或成熟物))的产生。
在这种背景下,“可操作地连接”意指根据本发明的启动子多核苷酸与其它寡核苷酸或多核苷酸的依序排列,从而引起所述其它多核苷酸的转录。
如本文所用,术语“所关注的产物”或“生物分子”是指由来自原料的微生物产生的任何产物。在一些情况下,所关注的产物可以是小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇等。举例来说,所关注的产物或生物分子可以是任何初级或次级细胞外代谢物。初级代谢物尤其可以是乙醇、柠檬酸、乳酸、谷氨酸、谷氨酸盐、赖氨酸、苏氨酸、色氨酸和其它氨基酸、维生素、多糖等。次级代谢物尤其可以是抗生素化合物,如青霉素,或免疫抑制剂,如环孢菌素A(cyclosporin A);植物激素,如赤霉素;抑制素药物,如洛伐他汀(lovastatin);杀真菌剂,如灰黄霉素(griseofulvin)等。所关注的产物或生物分子也可以是微生物产生的任何细胞内组分,如:微生物酶,包括:催化酶、淀粉酶、蛋白酶、果胶酶、葡萄糖异构酶、纤维素酶、半纤维素酶、脂肪酶、乳糖酶、链激酶和其它多种。细胞内组分还可以包括重组蛋白,如:胰岛素、B型肝炎疫苗、干扰素、粒细胞群落刺激因子、链激酶和其它。所关注的产物还可以指“所关注的蛋白质”。
术语“所关注的蛋白质”一般是指期望在丝状真菌中表达的任何多肽。此类蛋白质可以是酶、结合衬底蛋白质、表面活性蛋白质、结构蛋白质等,并且可以在高水平下表达,并且可以出于商业化的目的。所关注的蛋白质可以由相对于变异体菌株和/或亲本菌株的内源基因或异源基因编码。所关注的蛋白质可以细胞内表达或以分泌的蛋白质形式表达。如果所关注的蛋白质不是天然分泌的,那么可根据所属领域中已知的技术对编码蛋白质的多核苷酸进行修饰,以具有信号序列。分泌的蛋白质可以是天然表达的内源性蛋白质,但也可以是异源的。“异源”意指由蛋白质编码的基因不在丝状真菌宿主细胞中的原生条件下产生。可以由本发明的丝状真菌产生的酶的实例为:糖酶,例如纤维素酶(诸如内切葡聚糖酶、β-葡聚糖酶),纤维二糖水解酶或β-葡糖苷酶,半纤维素或果胶分解酶,诸如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、鼠李半乳糖醛酸酶、阿拉伯聚糖酶、聚半乳糖醛酸酶、裂解酶或淀粉分解酶;磷酸酶,诸如植酸酶、酯酶(诸如脂肪酶)、蛋白水解酶、氧化还原酶(诸如氧化酶)、转移酶或异构酶。
术语“碳源”通常是指适用作供细胞生长用的碳源的物质。碳源包括(但不限于)生物质水解产物、淀粉、蔗糖、纤维素、半纤维素、木糖和木质素,以及这些衬底的单体组分。碳源可以包含各种形式的各种有机化合物,包括(但不限于)聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽等。这些包括例如各种单糖,如葡萄糖、右旋糖(D-葡萄糖)、麦芽糖、寡糖、多糖、饱和或不饱和脂肪酸、丁二酸盐、乳酸盐、乙酸盐、乙醇等,或其混合物。光合成生物体可以另外产生光合成产物形式的碳源。在一些实施例中,碳源可选自生物质水解产物和葡萄糖。
术语“原料”定义为一种提供到微生物体或发酵过程的原材料或原材料混合物,利用所述过程能够制备其它产物。举例来说,碳源,如生物质或来源于生物质的碳化合物,是供微生物体在发酵过程中产生所关注的产物(例如小分子、肽、合成化合物、燃料、乙醇等)的原料。然而,原料可以含有不同于碳源的营养物。
术语“体积生产率”或“生产速率”定义为每体积培养基每单位时间形成的产物的数量。体积生产率可以用克/升/小时(g/L/h)报告。
术语“比生产率”定义为产物的形成速率。比生产率在本文中进一步定义为以克产物/克细胞干重(CDW)/小时(g/g CDW/h)为单位的比生产率。对指定微生物体使用CDW与OD600的关系,比生产率还可以用克产物/升培养基/600nm培养液光学密度(OD)/小时(g/L/h/OD)表示。
术语“产量”定义为每单位重量的原材料所得的产物的数量且可以用g产物/g衬底(g/g)表示。产量可以用理论产量的百分比表示。“理论产量”定义为每指定数量的衬底能够产生的最大产物数量,如用于制备产物的代谢途径的化学计量学所指定。
术语“效价(titre/titer)”定义为溶液的强度或溶液中的物质的浓度。举例来说,将所关注的产物(例如小分子、肽、合成化合物、燃料、乙醇等)在发酵液中的效价描述为溶液中的所关注的产物克数/升发酵液(g/L)。
术语“总效价”定义为过程中产生的全部所关注的产物的总和,包括(但不限于)溶液中的所关注的产物、气相(如果适用)中的所关注的产物,以及从过程中去除且相对于过程中的初始体积或过程中的操作体积所回收的任何所关注的产物。
如本文所用,术语“HTP基因设计库”或“库”是指根据本发明的基因扰动的集合。在一些实施例中,本发明的库可以表现为i)数据库或其它计算机文件中的序列信息的集合;ii)编码前述系列的基因元件的基因构建体的集合或iii)包含所述基因元件的宿主细胞菌株。在一些实施例中,本发明的库可以指个别元件的集合(例如用于PRO交换库的启动子的集合,或用于STOP交换库的终止子的集合)。在其它实施例中,本发明的库也可以指基因元件的组合,如启动子::基因、基因:终止子或甚至启动子:基因:终止子的组合。在一些实施例中,本发明的库进一步包含与将库的每个成员应用到宿主生物体中的效果相关的元数据。举例来说,如本文所用的库可以包括启动子::基因序列组合的集合,以及那些组合对特定物种的一或多种表型所产生的影响,因此在未来的启动子交换中利用所述组合来改良未来预测值。
如本文所用,术语“SNP”可以指小核多态性。在一些实施例中,本发明的SNP应广义理解,且包括单核苷酸多态性、序列插入、缺失、反转和其它序列置换。如本文所用,术语“非同义”或“非同义SNP”可以指引起宿主细胞蛋白中的编码变化的突变。
“高通量(HTP)”基因组工程改造方法可能涉及使用自动化设备(例如液体处置机或培养盘处置机)的至少一个零件执行所述方法的至少一个步骤。
CRISPR/Cas系统为向外来基因元件(诸如那些存在于质粒和噬菌体内的外来基因元件)赋予抗性并且提供所获取的免疫性形式的原核免疫系统。CRISPR表示成簇的、规律间隔的短回文重复序列,并且cas表示与CRISPR相关系统,并且指与CRISPR复合物相关的小型cas基因。
CRISPR-Cas系统最广泛地表征为1类或2类系统。这两个系统之间的主要区别特点是Cas效应模块的性质。1类系统需要将多种Cas蛋白质组装在复合物(称为“级联复合物”)中以介导干扰,而2类系统使用大型单一Cas酶来介导干扰。基于特定Cas蛋白质的存在,将1类和2类系统中的每一者进一步划分成多个CRISPR-Cas型。举例来说,1类系统分成以下三种类型:I类系统,其含有Cas3蛋白质;III类系统,其含有Cas10蛋白质;以及推定的IV型系统,其含有Csf1蛋白质,Cas8样蛋白质。2类系统通常比1类系统更不常见,且进一步划分成以下三种类型:II型系统,其含有Cas9蛋白质;V型系统,其含有Cas12a蛋白质(先前称为Cpf1,且本文中称为Cpf1)、Cas12b(先前称为C2c1)、Cas12c(先前称为C2c3)、Cas12d(先前称为CasY)和Cas12e(先前称为CasX);以及VI型系统,其含有Cas13a(先前称为C2c2)、Cas13b和Cas13c。Pyzocha等人,ACS化学生物学,第13(2)卷,第347-356页。在一个实施例中,本文所提供的方法中使用的CRISPR-Cas系统为2类系统。在一个实施例中,本文所提供的方法中使用的CRISPR-Cas系统为II型、V型或VI型2类系统。在一个实施例中,本文所提供的方法中使用的CRISPR-Cas系统选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物或旁系同源物。
本文所公开的方法中所用的CRISPR系统包含Cas效应模块,Cas效应模块包含一或多种核酸引导的与CRISPR相关的(Cas)核酸酶,在本文中被称作Cas效应蛋白质。在一些实施例中,Cas蛋白质可包含一或多个核酸酶域。Cas效应蛋白质可以靶向单股或双股核酸分子(例如DNA或RNA核酸)并且可以产生双股或单股断裂。在一些实施例中,Cas效应蛋白质是野生型或天然存在的Cas蛋白质。在一些实施例中,Cas效应蛋白质为突变体Cas蛋白质,其中在WT或天然存在的Cas蛋白质(例如亲本Cas蛋白质)中制备一或多个突变、插入或缺失,以产生相较于亲本Cas蛋白质具有一或多个改变的特征的Cas蛋白质。
在一些情况下,Cas蛋白质为野生型(WT)核酸酶。适用于本发明的适合Cas蛋白质的非限制性实例包括:C2cl、C2c2、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(还被称作Csn1和Csx12)、Cas10、Cpfl、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx100、Csx16、CsaX、Csx3、Csxl、Csx15、Csf1、Csf2、Csf3、Csf4、MAD1-20、SmCsm1、其同系物、其直系同源物、其变异体、其突变体或其修饰形式。适合核酸引导的核酸酶(例如Cas 9)可以是来自属的生物体,其包括(但不限于):硫微螺菌属(Thiomicrospira)、琥珀酸弧菌属(Succinivibrio)、候选属(Candidatus)、卟啉单胞菌属(Porphyromonas)、氨基酸球菌属(Acidomonococcus)、普雷沃菌属(Prevotella)、史密斯氏菌属(Smithella)、莫拉菌属(Moraxella)、互养菌属(Synergistes)、弗朗西斯氏菌属(Francisella)、钩端螺旋体属(Leptospira)、链型杆菌属(Catenibacterium)、坎德勒氏菌属(Kandleria)、梭菌属(Clostridium)、多尔氏菌属(Dorea)、粪球菌属(Coprococcus)、肠球菌属(Enterococcus)、嗜果糖乳酸菌属(Fructobacillus)、魏斯氏菌属(Weissella)、小球菌属(Pediococcus)、棒杆菌属(Corynebacter)、萨特氏菌属(Sutterella)、军团杆菌属(Legionella)、密螺旋体属(Treponema)、罗斯氏菌(Roseburia)、产线菌属(Filifactor)、真杆菌属(Eubacterium)、链球菌(Streptococcus)、乳杆菌属(Lactobacillus)、霉浆菌属(Mycoplasma)、非病原性腸桿菌属(Bacteroides)、黄沃拉菌属(Flaviivola)、黄杆菌属(Flavobacterium)、球毛菌属(Sphaerochaeta)、固氮螺旋菌属(Azospirillum)、葡糖醋杆菌属(Gluconacetobacter)、奈瑟菌属(Neisseria)、罗斯氏菌属(Roseburia)、细小棒菌属(Parvibaculum)、葡萄球菌属(Staphylococcus)、硝酸盐裂解菌属(Nitratifractor)、霉浆菌属(Mycoplasma)、脂环杆菌属(Alicyclobacillus)、短芽胞杆菌属(Brevibacilus)、芽孢杆菌属(Bacillus)、拟杆菌属(Bacteroidetes)、短芽胞杆菌属(Brevibacilus)、肉食杆菌属(Carnobacterium)、梭菌属(Clostridiaridium)、梭菌属(Clostridium)、脱硫嗜盐碱菌属(Desulfonatronum)、脱硫弧菌属(Desulfovibrio)、创伤球菌属(Helcococcus)、纤毛菌属(Leptotrichia)、李氏菌属(Listeria)、甲烷嗜甲基菌属(Methanomethyophilus)、甲基杆菌属(Methylobacterium)、丰祐菌属(Opitutaceae)、沼杆菌属(Paludibacter)、红细菌属(Rhodobacter)、单丝壳属(Sphaerochaeta)、肿块芽胞杆菌属(Tuberibacillus)和弯曲杆菌属(Campylobacter)。此类属的生物体的物种可以如本文中另外论述。
适合核酸引导的核酸酶(例如Cas 9)可以是来自门的生物体,其包括(但不限于):厚壁菌门(Firmicute)、放线菌门(Actinobacteria)、拟杆菌门(Bacteroidetes)、变形菌门(Proteobacteria)、螺旋体门(Spirochates)和无壁菌门(Tenericutes)。适合核酸引导的核酸酶可以是来自纲的生物体,其包括(但不限于):丹毒丝菌纲(Erysipelotrichia)、梭菌纲(Clostridia)、杆菌纲(Bacilli)、放线菌纲(Actinobacteria)、拟杆菌纲(Bacteroidetes)、黄杆菌纲(Flavobacteria)、α变形菌纲(Alphaproteobacteria)、β变形菌纲(Betaproteobacteria)、γ变形菌纲(Gammaproteobacteria)、δ变形菌纲(Deltaproteobacteria)、ε变形菌纲(Epsilonproteobacteria)、螺旋体纲(Spirochaetes)及柔膜菌纲(Mollicutes)。适合核酸引导的核酸酶可以是来自目的生物体,其包括(但不限于):梭菌目(Clostridiales)、乳杆菌目(Lactobacillales)、放线菌目(Actinomycetales)、拟杆菌目(Bacteroidales)、黄杆菌目(Flavobacteriales)、根瘤菌目(Rhizobiales)、红螺菌目(Rhodospirillales)、伯克氏菌目(Burkholderiales)、奈瑟菌目(Neisseriales)、军团菌目(Legionellales)、鹦鹉螺菌目(Nautiliales)、弯曲菌目(Campylobacterales)、螺旋体目(Spirochaetales)、支原体目(Mycoplasmatales)及硫发菌目(Thiotrichales)。适合核酸引导的核酸酶可以是来自科的生物体,其包括(但不限于):毛螺菌科(Lachnospiraceae)、肠球菌科(Enterococcaceae)、明串珠菌科(Leuconostocaceae)、乳杆菌科(Lactobacillaceae)、链球菌科(Streptococcaceae)、消化链球菌科(Peptostreptococcaceae)、葡萄球菌科(Staphylococcaceae)、优杆菌科(Eubacteriaceae)、棒杆菌亚科(Corynebacterineae)、拟杆菌科(Bacteroidaceae)、黄杆菌科(Flavobacterium)、蟑螂杆状体科(Cryomoorphaceae)、红菌科(Rhodobiaceae)、红螺菌科(Rhodospirillaceae)、醋杆菌科(Acetobacteraceae)、萨特氏菌科(Sutterellaceae)、奈瑟菌科(Neisseriaceae)、军团菌科(Legionellaceae)、鹦鹉螺菌科(Nautiliaceae)、弯曲菌科(Campylobacteraceae)、螺旋体科(Spirochaetaceae)、支原体科(Mycoplasmataceae)及弗朗西斯菌科(Francisellaceae)。
适合用于本发明的方法、系统和组合物中的其它核酸引导的核酸酶(例如,Cas9)包括那些来源于生物体的核酸酶,例如(但不限于):硫微螺菌属物种XS5、直肠真杆菌(Eubacterium rectale)、溶糊精琥珀酸弧菌(Succinivibrio dextrinosolvens)、候选白蚁链甲烷胞菌(Candidatus Methanoplasma termitum)、候选腹部嗜甲烷菌(CandidatusMethanomethylophilus alvus)、犬口腔红棕色单胞菌(Porphyromonas crevioricanis)、嗜鳃黄杆菌(Flavobacterium branchiophilum)、氨基酸球菌物种、毛螺菌COE1(Lachnospiraceae bacterium COE1)、短普雷沃菌ATCC 19188(Prevotella brevis ATCC19188)、史密斯氏菌物种SCADC、牛眼莫拉菌(Moraxella bovoculi)、琼斯氏互养菌(Synergistes jonesii)、口腔拟杆菌274类(Bacteroidetes oral taxon 274)、土拉弗朗西斯菌(Francisella tularensis)、稻田氏钩端螺旋体莱姆血清变型10(Leptospirainadai serovar Lyme str.10)、氨基酸球菌物种晶体结构(5B43)变异链球菌(S.mutans)、二型链球菌(S.agalactiae)、类马链球菌(S.equisimilis)、血链球菌(S.sanguinis)、肺炎链球菌(S.pneumonia);空肠弯曲菌(C.jejuni)、大肠弯曲菌(C.coli);盐水硝酸盐裂解菌(N.salsuginis)、弧后硝酸盐裂解菌(N.tergarcus);耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus);脑膜炎奈瑟菌(N.meningitides)、淋病奈瑟菌(N.gonorrhoeae);李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii);肉毒桿菌(C.botulinum)、艰难梭状芽孢杆菌(C.difficile)、破伤风梭菌(C.tetani)、索氏梭菌(C.sordellii);土伦病弗朗西斯氏菌l(Francisella tularensis l)、苏格兰普雷沃菌(Prevotella albensis)、毛螺菌MC2017 1、解蛋白丁酸弧菌(Butyrivibrio proteoclasticus)、异域菌(Peregrinibacteria)GW2011_GWA2_33_10、俭菌(Parcubacteria bacterium)GW2011_GWC2_44_17、史密斯氏菌物种SCADC、小基因组菌(Microgenomates)、氨基酸球菌物种BV3L6、毛螺菌MA2020、候选白蚁链甲烷胞菌、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉菌237、稻田钩端螺旋体(Leptospira inadai)、毛螺菌ND2006、犬口腔红棕色单胞菌3、解糖胨普雷沃菌(Prevotella disiens)、猕猴卟啉单胞菌(Porphyromonas macacae)、链型杆菌物种CAG:290、反硝化利斯特氏菌(Kandleria vitulina)、梭菌KA00274、毛螺菌3-2、长链多尔氏菌(Dorea longicatena)、灵巧粪球菌GD/7(Coprococcus catus GD/7)、益生肠球菌DSM 7374(Enterococcus columbae DSM 7374)、嗜果糖乳酸菌物种EFB-N1、耐盐魏斯氏菌(Weissella halotolerans)、乳酸片球菌(Pediococcus acidilactici)、弯曲乳杆菌(Lactobacillus curvatus)、产脓链球菌(Streptococcus pyogenes)、植物乳杆菌(Lactobacillus versmoldensis)及龈沟产线菌ATCC 35896(Filifactor alocis ATCC35896)。参见美国专利第8,697,359;8,771,945;8,795,965;8,865,406;8,871,445;8,889,356;8,895,308;8,906,616;8,932,814;8,945,839;8,993,233;8,999,641;9,822,372;9,840,713号;美国专利申请案第13/842,859(US 2014/0068797 A1);9,260,723;9,023,649;9,834,791;9,637,739号;美国专利申请案第14/683,443号(US 2015/0240261 A1);美国专利申请案第14/743,764(US 2015/0291961 A1);9,790,490;9,688,972;9,580,701;9,745,562;9,816,081;9,677,090;9,738,687号;美国申请案第15/632,222号(US 2017/0369879A1);美国申请案第15/631,989号;美国申请案第15/632,001号和美国专利第9,896,696号,其中的每一者以引用的方式并入本文中。
在一些实施例中,Cas效应蛋白质包含以下活性中的一或多者:
切口酶活性,即,使核酸分子单股裂解的能力;
双股核酸酶活性,即,使双股核酸双股裂解的能力并且产生双股断裂;
核酸内切酶活性;
核酸外切酶活性;和/或
解螺旋酶活性,即,解开双股核酸的螺旋结构的能力。
在本发明的各方面中,术语“引导核酸”是指包含以下的多核苷酸:1)能够与目标序列杂交的引导序列(在本文中称为“靶向片段”),以及2)能够与如本文所述的核酸引导的核酸酶相互作用(单独或与tracrRNA分子组合)的架构序列(本文中称为“架构片段”)。引导核酸可以是DNA。引导核酸可以是RNA。引导核酸可以包含DNA和RNA两者。引导核酸可包含经修饰的非天然存在的核苷酸。在引导核酸包含RNA的情况下,RNA引导核酸可由多核苷酸分子上的DNA序列编码,如本文所公开的质粒、线性构筑体或编辑盒。
在一些实施例中,本文所述的引导核酸为RNA引导核酸(“引导RNA”或“gRNA”)并且包含靶向片段和架构片段。在一些实施例中,gRNA的架构片段包含于一个RNA分子中并且靶向片段包含于另一单独RNA分子中。此类实施例在本文中被称作“双分子gRNA”或“两分子gRNA”或“双gRNA”。在一些实施例中,gRNA为单RNA分子且在本文中被称作“单引导RNA”或“sgRNA”。术语“引导RNA”或“gRNA”是包括性的,指两分子引导RNA和sgRNA两者。
gRNA的DNA靶向片段包含与目标核酸序列中的序列互补的核苷酸序列。因此,gRNA的靶向片段通过杂交以序列特异性方式与目标核酸相互作用(即,碱基配对),并且靶向片段的核苷酸序列确定gRNA将结合的目标DNA内的位置。当使用适合的比对算法进行最佳比对时,引导序列与其对应的目标序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。可使用用于比对序列的任何适合算法来确定最优比对。在一些实施方案中,引导序列的长度为约或大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、75个或更多的核苷酸。在一些实施方案中,引导序列的长度小于约75、50、45、40、35、30、25、20个或更少的核苷酸。在各方面中,引导序列长度为10至30个核苷酸。引导序列的长度可以是15至20个核苷酸。引导序列的长度可以是15个核苷酸。引导序列的长度可以是16个核苷酸。引导序列的长度可以是17个核苷酸。引导序列的长度可以是18个核苷酸。引导序列的长度可以是19个核苷酸。引导序列的长度可以是20个核苷酸。
引导RNA的架构片段与一或多种Cas效应蛋白质相互作用,以形成核糖核蛋白复合物(在本文中称为CRISPR-RNP或RNP复合物)。引导RNA通过上文所述的靶向片段将结合的多肽引导到目标核酸序列内的特定核苷酸序列。引导RNA的架构片段包含彼此互补并且形成双股RNA双股的两个核苷酸段。架构序列内促进形成可靶向的核酸酶复合物的足够序列可包括沿架构序列内两个序列区域的长度的互补程度,如参与形成次级结构的一个或两个序列区域。在一些情况下,一个或两个序列区域包含或编码于相同多核苷酸上。在一些情况下,一个或两个序列区域包含或编码于单独多核苷酸上。最优比对可由任何适合比对算法确定,且可进一步考虑次级结构,例如在一个或两个序列区域内的自身互补性。在一些实施例中,当进行最优比对时,沿两个中较短者的长度,一个或两个序列区域之间的互补性程度为约或大于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高。在一些实施例中,两个序列区域的至少一个的长度为约或大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50或更多的核苷酸。
个体gRNA的架构序列可包含次级结构。次级结构可包括假结区域或茎环结构。在一些实例中,引导核酸与核酸引导的核酸酶的相容性至少部分地通过引导RNA的次级结构区域内或邻近于其的序列确定。在一些情况下,将引导核酸与核酸引导的核酸酶的结合动力学部分地通过架构序列内的次级结构测定。在一些情况下,将引导核酸与核酸引导的核酸酶的结合动力学部分地通过具有架构序列的核酸序列确定。
可以通过扫描与原生Cas核酸酶基因座相邻的序列发现gRNA-Cas效应蛋白质组合的相容架构序列。换句话说,原生Cas核酸酶可以在接近于对应的相容引导核酸或架构序列的基因组上进行编码。
核酸引导的核酸酶可以与内源性宿主核酸酶内未发现的引导核酸相容。此类正交引导核酸可以通过经验测试来确定。正交引导核酸可以来自不同细菌物种或以合成或其它方式工程改造为非天然存在的。与共同核酸引导的核酸酶相容的正交引导核酸可包含一或多个共同特点。共同特点可包括假结区域外部的序列。共同特点可包括假结区域。共同特点可包括初级序列或次级结构。
可以通过改变引导序列对引导核酸进行工程改造来靶向所期望目标序列,使得引导序列与目标序列互补,借此允许引导序列与目标序列之间的杂交。具有经工程改造的引导序列的引导核酸可被称为经工程改造的引导核酸。经工程改造的引导核酸通常是非天然存在的并且未在自然界中发现。
在一些实施例中,本发明提供编码gRNA的多核苷酸。在一些实施例中,编码gRNA的核酸包含于表达载体(例如,重组表达载体)中。在一些实施例中,本发明提供一种编码定点修饰多肽的多核苷酸。在一些实施例中,编码定点修饰多肽的多核苷酸包含于表达载体(例如,重组表达载体)中。
在一些实施例中,本发明提供与定点修饰多肽复合的gRNA,以形成能够引入到宿主细胞中的RNP复合物,宿主细胞包含用于靶向gRNA的片段的目标核酸序列,gRNA的靶向片段包含与其互补的序列。定点修饰多肽可以是核酸引导的核酸酶。核酸引导的核酸酶可以是所属领域中已知和/或本文中提供的任何核酸引导的核酸酶(例如,Cas9)。核酸引导的核酸酶可以通过和RNA引导(例如gRNA)并且因此被称为RNA引导的核酸酶或RNA引导的核酸内切酶。
传统的菌株改良方法
传统的菌株改良方法可以广泛地分为两类方法:定向菌株工程改造和随机突变诱发。
菌株改良的定向工程改造方法涉及对特定生物体的少数基因元件进行计划性扰动。这些方法通常集中于调节特定生物合成或开发程序,且依赖于对影响所述路径的基因和代谢因素的先前了解。在其最简单的实施例中,定向工程改造涉及将一种生物体的特征化性状(例如基因、启动子或能够产生可测量表型的其它基因元件)转移到相同或不同物种的另一生物体。
菌株工程改造的随机方法涉及对亲本菌株进行随机突变诱发,以及为了鉴别性能改良而设计的广泛筛选。产生这些随机突变的方法包括暴露于紫外辐射,或突变诱发化学品,如甲烷磺酸乙酯。虽然是随机且大部分不可预测的,但是相较于更多定向基因操纵技术,这种传统的菌株改良方法具有诸多优势。首先,许多工业生物体就其基因和代谢谱系来说具有(且保持)不良的特征,以致替代的定向改良方法困难(如果并非不可能)。
其次,即使在表征相对充分的系统中,也难以预测引起工业性能改良的基因型变化,且基因型变化有时仅以上位表型来表现自身,这要求在具有已知和未知功能的许多基因中累积突变。
另外,多年来,在指定工业生物体中产生定向基因组突变所需的基因工具不可获得,或使用非常缓慢和/或困难。
然而,传统菌株改良程序的扩展应用致使指定菌株谱系中的增益逐渐减少,且最终导致提升菌株效率的可能性耗竭。有益随机突变是相对罕见的事件,且需要较大筛选池和高突变率。这不可避免地引起了许多中性和/或有害(或部分有害)突变在“已改良”菌株中的无意积累,最终阻碍了未来效率增加。
传统累积改良方法的另一种局限是,关于任何特定突变对任何菌株度量的影响的已知信息很少甚至没有。这在根本上限制了研究人员将有益突变组合和合并或去除中性或有害突变诱发“包袱”的能力。
存在着将突变诱发谱系内的菌株之间的突变随机重组的其它方法和技术。举例来说,用于迭代序列重组的一些形式和实例(有时称为DNA改组、进化或分子育种)已经描述于美国专利申请第08/198,431号(1994年2月17日申请)、第PCT/US95/02126号(1995年2月17日申请)、第08/425,684号(1995年4月18日申请)、第08/537,874号(1995年10月30日申请)、第08/564,955号(1995年11月30日申请)、第08/621,859号(1996年3月25日申请)、第08/621,430号(1996年3月25日申请)、第PCT/US96/05480号(1996年4月18日申请)、第08/650,400号(1996年5月20日申请)、第08/675,502号(1996年7月3日申请)、第08/721,824号(1996年9月27日申请)和第08/722,660号(1996年9月27日申请);施特默尔,科学270:1510(1995);施特默尔等人,基因164:49-53(1995);施特默尔,生物技术13:549-553(1995);施特默尔,美国国家科学院院刊91:10747-10751(1994);施特默尔,自然370:389-391(1994);凯默瑞等人,自然·医学2(1):1-3(1996);凯默瑞等人,自然·生物技术14:315-319(1996),其中的每一者出于所有目的以全文引用的方式并入本文中用于所有目的。
这些包括促进突变型菌株两端的基因组重组的技术,如原生质体融合和整个基因组改组。对于一些工业微生物体(如酵母和丝状真菌)来说,还能够利用天然配对周期进行成对基因组重组。以这种方式,能够通过与亲本菌株产生‘回复交换’突变体和合并有益突变来去除有害突变。此外,能够潜在地将来自两种不同菌株谱系的有益突变组合,从而相较于使单一菌株谱系自身发生突变而可能获得的改良可能性,产生额外的改良可能性。然而,这些方法受到许多限制,使用本发明方法则规避了这些限制。
举例来说,上文所述的传统重组方法缓慢且依赖于相对较少数目个随机重组交换事件来交换突变,且因此在任何指定周期或时间段中可以尝试的组合数目受到限制。另外,虽然现有技术中的天然重组事件基本上是随机的,但是其也受到基因组位置偏好的影响。
最重要的是,传统方法提供的关于个别突变影响的信息也很少且由于重组突变的随机分布,无法产生且评估许多特定组合。
为了克服与传统菌株改良程序相关的许多前述问题,本发明阐述了由计算机驱动且整合了分子生物学、自动化、数据分析和机器学习方案的独特HTP基因组工程改造平台。这个整合平台利用了一套HTP分子工具集,工具集用于构筑HTP基因设计库。这些基因设计库将详细说明如下。
本发明所公开的HTP平台和其独特微生物基因设计库在根本上转变了微生物菌株发育和进化的范例。举例来说,基于突变诱发来开发工业微生物菌株的传统方法最终将产生负担有沉重突变诱发负荷的微生物,所述负荷是在多年的随机突变诱发期间积累起来的。
解决这个问题的能力(即去除这些微生物所积累的基因包袱)数十年来一直困扰着微生物研究人员。然而,利用本文公开的HTP平台,能够“修复”这些工业菌株且能够鉴别出和去除有害的基因突变。宜可保留鉴别为有益的基因突变,且在一些情况下能够据以改良。所得微生物菌株相较于其亲本菌株展现出优良的表型性状(例如所关注的化合物产量提高)。
另外,本文教示的HTP平台能够鉴别、表征和量化个别突变对微生物菌株性能的影响。能够得到这种信息,即指定基因变化x对宿主细胞表型y(例如所关注的化合物或产物的产量)的影响并且接着将其存储在下文论述的微生物HTP基因设计库中。即,每种基因排列的序列信息和其对宿主细胞表型的影响存储在一或多种数据库中,且可供后续分析使用(例如上位定位,如下文所论述)。本发明还教示了以物理方式保存/储存有价值的基因排列的方法,基因排列呈基因插入构筑体形式或呈含有所述基因排列的一或多种宿主细胞生物体形式(例如参见下文论述的库)。
当将这些HTP基因设计库结合到与复杂数据分析和机器学习程序整合的迭代程序中时,出现了一种用于改良宿主细胞的截然不同的方法。因此,所教示的平台在根本上不同于先前论述的开发宿主细胞菌株的传统方法。所教示的HTP平台不受扰于与先前方法相关的许多缺点。参照下文论述的HTP分子工具集和所来源的基因设计库将显而易知这些和其它优势。
概述
本发明的一个目标是通过提供用于转化丝状真菌细胞或来源于其的原生质体、纯化同核转化体和筛选经纯化的转化体的高通量方法以规避上文所述的所有限制。一般来说,本文所述的方法和系统需要从丝状真菌细胞制备原生质体、转化所制备的原生质体、通过改变用于制备用于制备原生质体的菌丝的生长条件来纯化含有单一核的原生质体。通过选择和反向选择和任选地筛选具有正确表型的经纯化的转化体和/或产生所关注的产物来实现菌株纯化。所关注的产物可以所期望产量、产率或效价产生。优选地,使用原生质体,但方法适用于其它真菌细胞类型。在一些情况下,本文中所提供的方法和系统为高通量的。在一些情况下,本文所提供的方法和系统包含半自动化的步骤(例如,转化或选择、反向选择)。在一些情况下,本文所提供的方法和系统包括全自动化的步骤。在一些情况下,本文所提供的方法和系统为高通量的并且其中的步骤为半自动化的(例如,转化或选择、反向选择)或全自动化。如本文所用,高通量可以指本文所提供的能够每天评估约1,000个或更多个转化体的任何部分自动化或全自动化方法,且确切地说,指能够每天评估5,000个或更多个转化体的那些方法,且最确切地说,指能够每天评估10,000个或更多个转化体的方法。此外,进行所述方法的适合体积为市售(深阱)微量滴定板的体积,即小于1ml,优选地小于500μl,更优选地小于250μl,最优选地1.5μl到250μl,再最优选地10μl到100μl。
用于制备原生质体的丝状真菌细胞可以是所属领域中已知或本文所述的任何丝状真菌菌株,包括其全型、有性世代或无性世代。可以使用本文所述的用于制备原生质体的方法或所属领域中任何已知方法制备原生质体。
原生质体的转化可以用至少一种经设计以整合到如本文所提供的丝状真菌基因组中的预定基因座中的多核苷酸进行。在一个优选实施例中,将原生质体用至少两种如本文所提供的多核苷酸进行共转化,使得每个多核苷酸构筑体经设计成整合到丝状真菌基因组中的不同预定基因座中。预定基因座可以针对目标丝状真菌基因(例如,一种其蛋白质产物参与柠檬酸生产的基因)或存在于丝状真菌基因组中的可选标记基因。用于使用本文所提供的方法或系统转化或共转化原生质体的多核苷酸可以包含目标丝状真菌基因(例如,一种其蛋白质产物参与柠檬酸生产的基因)的序列,目标丝状真菌基因包含或含有突变和/或基因控制元件。突变可以是小型核多态性,诸如单核苷酸多态性、序列插入、缺失、反转和其它序列置换。基因控制元件可以是启动子序列(内源性或异源性)和/或终止子序列(内源性或异源性)。启动子可以是诱导型的。用于使用本文所提供的方法或系统转化或共转化原生质体的多核苷酸可包含可选标记基因的序列。用于使用本文所提供的方法或系统转化或共转化原生质体的多核苷酸可分离成两个或更多个部分,使得仅当多核苷酸的每个单独部分在经转化的原生质体的基因组中的相同目标位点处整合时,才会进行经转化的原生质体中整个多核苷酸的整合。多核苷酸的每个部分可包含如本文所提供的突变和/或基因控制元件。在一个实施例中,本文所提供的方法和系统需要将本文所提供的原生质体用两种多核苷酸的共转化,使得第一多核苷酸包含目标丝状真菌基因(例如,一种其蛋白质产物参与柠檬酸产生的基因)的序列,目标丝状真菌基因包含或含有突变和/或基因控制元件,而第二多核苷酸包含可选标记基因的序列。此外,对这个实施例,第二多核苷酸可以经设计以整合到原生质体基因组中的额外可选标记基因,而第一多核苷酸可以经设计以整合到目标丝状真菌基因的基因座,或可替代地,整合到又一可选标记基因的基因座。本文所提供的任何实施例中的可选标记基因可以是本文所述的可选标记基因中的任一种。
本发明的目标还提供一种用于制备和储存来自丝状真菌细胞的多个原生质体的方法。方法可能需要将细胞壁从真菌培养物中的丝状真菌细胞去除,分离原生质体,并且将经分离的原生质体再悬浮于包含至少二甲亚砜(DMSO)的混合物中并且储存分离原生质体。储藏可持续至少1、2、3、4、5、6、7、8、9、10、11、12或24小时。储藏可持续至少1天、7天、14天、30天或更久。储藏可持续至少3个、6个、12个或更久。储藏可在4℃、-20℃或-80℃下。真菌培养物可为体积为至少500ml、1升、2升、3升、4升或5升的培养物。丝状真菌细胞可以是本文所提供或所属领域中已知的任何丝状真菌。在制备原生质体之前,可以使真菌培养物生长持续至少6、8、10、12、14、16、18、20、22或24小时。在一个实施例中,真菌培养物在制备原生质体之后至少70%的原生质体为同核的条件下生长。在另一实施例中,通过酶消化来去除细胞壁。酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。酶消化可以用VinoTaste浓缩物进行。在又一实施例中,方法还包含在储存原生质体之前将聚乙二醇(PEG)添加到包含DMSO的混合物中。可添加PEG到最终浓度为50%、40%、30%、20%、15%、10%、5%或更低。在再一实施例中,方法进一步包括在储存原生质体之前将原生质体分布到微量滴定板中。微量滴定板可以是6孔、12孔、24孔、96孔、384孔或1536孔的板。
基因设计及微生物工程改造:利用一套HTP分子工具和HTP基因设计库进行菌株改良的系统组合方法
如前所述,本发明提供了一种通过迭代系统性引入和去除菌株两端的基因变化对微生物生物体进行工程改造的新颖HTP平台和基因设计策略。平台由一套分子工具提供支持,分子工具能够产生HTP基因设计库且允许对指定宿主菌株高效实施基因变异。
本发明的HTP基因设计库充当可以引入到特定微生物(例如,丝状真菌)菌株背景的可能的基因变异的来源。以这种方式,HTP基因设计库是基因多样性的存储库,或基因扰动的集合,其能应用到对指定微生物菌株进行初始或进一步的工程改造。在待决的美国专利申请案第15/140,296号和待决的国际申请案第PCT/US17/29725号,标题为“用于改良大规模生产经工程改造的核苷酸序列的微生物菌株设计系统和方法”中,描述了用于对实施到宿主菌株的基因设计进行编程的技术,其中的每一者以全文引用的方式并入本文中。
这个平台中所用的HTP分子工具集尤其可以包括:(1)启动子交换(PRO交换)、(2)SNP交换、(3)起始/终止密码子交换、(4)STOP交换和(5)序列优化。本发明的HTP方法还教示了指导HTP工具集的合并/组合使用的方法,包括(6)上位定位方案。如前所述,单独或组合的这套分子工具能够产生HTP基因设计宿主细胞库。
如将证明,在所教示的HTP微生物工程改造平台的背景下使用前述HTP基因设计库能够鉴别和合并有益的“致病”突变或基因区段并且还能够鉴别和去除消极或有害突变或基因区段。这种新方法能够对菌株性能进行快速改良,而传统的随机突变诱发或定向基因工程改造则无法实现快速改良。去除基因负荷或将有益变化合并到无基因负荷的菌株中还向能够实现进一步改良的额外随机突变诱发提供新的稳固起点。
在一些实施例中,本发明教示了当在突变诱发菌株谱系的各种离散分支两端鉴别出的正交有益变化时,还能够将其快速地合并到性能更佳的菌株中。还能够将这些突变合并到不属于突变诱发谱系的菌株中,如通过定向基因工程改造获得改良的菌株。
在一些实施例中,本发明与已知的菌株改良方法不同之处在于,其分析了多个不同基因组区域两端突变的全基因组的组合作用,不同基因组区域包括已表达和未表达的基因元件,且利用采集到的信息(例如实验结果)预测预期会产生菌株增强的突变组合。
在一些实施例中,本发明教示了i)能够通过本发明得到改良的工业微生物体和其它宿主细胞;ii)产生用于下游分析的多样性池;iii)用于对大型变异体池进行高通量筛选和测序的方法和硬件;iv)用于机器学习计算分析和预测全基因组突变的协同作用的方法和硬件以及v)用于高通量菌株工程改造方法。
以下分子工具和库结合说明性微生物实例来论述。所属领域的技术人员将认识到,本发明的HTP分子工具与任何宿主细胞(包括真核细胞)相容,并且更高的生命形式,例如相同原理和过程可用于丝状真菌细胞(例如黑曲霉)中。
现将论述已鉴别的HTP分子工具集的每一种,其能够产生微生物工程改造平台中所用的各种HTP基因设计库。
1.启动子交换:用于衍生启动子交换微生物菌株库的分子工具
在一些实施例中,本发明教示了选择具有最佳表达特性的启动子以对整体宿主菌株表型(例如产量或生产率)产生有益作用的方法。
举例来说,在一些实施例中,本发明教示了鉴别一或多种启动子和/或在宿主细胞内产生一或多种启动子的变异体的方法,启动子展现出表达强度范围(例如下文论述的启动子梯)或优良调节特性(例如针对所选基因的更紧密调控)。这些已鉴别和/或产生的启动子的特定组合可以归入同类作为启动子梯,其更详细地解释于下文。
接着使所讨论的启动子梯与所关注的指定基因关联。因此,如果具有启动子P1-P8(表示已鉴别和/或产生以展现出表达强度范围的八种启动子)且使启动子梯与微生物中所关注单一基因关联(即,通过使指定启动子可操作地连接到指定目标基因来对微生物进行基因工程改造),那么能够通过表征由每种组合尝试产生的每种经工程改造菌株来确定八种启动子的每种组合的作用,条件是除与目标基因关联的特定启动子之外,经工程改造的微生物具有基本相同的基因背景。
通过这种方法进行工程改造的所得微生物形成HTP基因设计库。
在一特定实施例中,本文所提供的启动子交换(PRO交换)方法需要使来自表1中所描绘的启动子梯的每个启动子与展示出或疑为在特定条件下生长时发挥作用或影响丝状真菌细胞的形态的基因系统地关联(称为目标形态基因)。基因的扰动可引起所期望形态表型。当在生产培养基(例如,CAP培养基)的浸没培养物中生长时,所期望表型可以是非菌丝体粒化形态。因此,如果具有启动子P1-P4(表示来自表1的已鉴别和/或产生以展现出表达强度范围的四种启动子)且使启动子梯与微生物中的所关注单一目标形态基因关联(即,通过使指定启动子可操作地连接到指定目标形态基因来对微生物进行基因工程改造),那么能够通过表征由每种组合尝试产生的每种经工程改造菌株来确定四种启动子的每种组合的作用,条件是除与目标形态基因关联的特定启动子之外,经工程改造的微生物具有基本相同的基因背景。通过这种方法进行工程改造的所得微生物形成HTP形态基因设计库。展示出或疑为发挥作用或影响丝状真菌细胞的形态的基因可以是此项技术中已知和/或本文中提供的任何这类基因。
HTP基因设计库可以指通过这种方法形成的实际实体微生物菌株集合,其中每个菌株成员表示在基本相同的基因背景下可操作地连接到特定目标基因的指定启动子,所述库称为“启动子交换微生物菌株库”。在丝状真菌(例如黑曲霉)的特定背景下,库可以称为“启动子交换丝状真菌菌株库”或“启动子交换黑曲霉菌株库”,但术语可同义地使用,因为丝状真菌或黑曲霉是微生物或多核生物体的特定实例。
另外,HTP基因设计库可以指基因扰动的集合,在这种情况下,指定启动子x可操作地连接到指定基因y,所述集合称为“启动子交换库”。
另外,能够使用包含启动子P1-P8的相同启动子梯对微生物进行工程改造,其中8种启动子的每个启动子可操作地连接到10种不同基因目标。这种程序得到80种微生物,除可操作地连接到所关注目标基因的特定启动子之外,微生物呈现基本相同的基因背景。可以对这些80种微生物进行适当筛选和表征且产生另一个HTP基因设计库。表征HTP基因设计库中的微生物菌株产生的信息和数据可以存储在任何数据储存构筑体中,包括关系型数据库、面向对象数据库或高度分布式NoSQL数据库。这种数据/信息可以是例如当将指定启动子(例如P1-P8)可操作地连接到指定基因目标时的作用。这种数据/信息还能够是通过使启动子P1-P8中的两种或更多种可操作地连接到指定基因目标而产生的更广泛的组合作用的集合。
八种启动子和10种目标基因的前述实例仅为说明性的,原因是所述概念可以应用到基于表达强度范围的呈现而已经归入同类的任何指定数目个启动子和任何指定数目个目标基因。所属领域中的技术人员还将认识到两个或更多个启动子能够可操作地连接于任何基因目标之前。因此,在一些实施例中,本发明教示了启动子交换库,其中来自启动子梯的1、2、3或更多种启动子可操作地连接到一或多种基因。
总之,利用各种启动子来驱动各种基因在生物体中的表达是一种优化所关注性状的强大工具。本发明人所开发的启动子交换分子工具使用了启动子序列梯(例如,表1),其已经证明可改变至少一个基因座在至少一种条件下的表达。接着使用高通量基因组工程改造将这种启动子序列梯系统地应用到生物体中的一组基因(例如,与本文所提供的FungiSNP_18相同的路径内)。基于多种方法中的任一种方法确定这组基因影响所关注性状的可能性较高。这些方法可以包括基于已知功能或对所关注性状的影响做出的选择,或基于先前测定的有益基因多样性做出的算法选择。在一些实施例中,基因的选择可以包括指定宿主中的所有基因。在其它实施例中,基因的选择可以是指定宿主中的所有基因的随机选择的子集。
接着对含有连接到基因的启动子序列的生物体的所得HTP基因设计微生物菌株库在高通量筛选模型中的性能进行评估,且确定引起性能增强的启动子-基因连接并将信息存储在数据库中。基因扰动的集合(即,指定启动子x可操作地连接到指定基因y)形成“启动子交换库”,其可以用作微生物工程改造处理中所用的潜在基因变异的来源。当针对宿主细胞背景的更大多样性实施基因扰动的更大集合时,每个库作为实验上被证实的数据的主体随时间变得更强大,其能用于根据所关注的任何背景更精确且可预测地设计出靶向变化。
生物体中的基因转录水平是影响生物体行为的控制关键点。转录与翻译(蛋白质表达)紧密关联,且哪种蛋白质以什么数量表达决定了生物体行为。细胞表达了数千种不同类型的蛋白质,且这些蛋白质以多种复杂的方式相互作用以产生功能。通过系统地改变蛋白质集合的表达量,由于复杂性,功能可能会以难以预测的方式进行改变。有些变异可以增强性能且因此与用于评估性能的机制关联,这项技术能够产生功能改良的生物体。
在小分子合成路径的背景下,酶通过其小分子衬底和直链或分支链产物相互作用,始于衬底且终于所关注小分子。由于这些相互作用依序关联,因此这种系统展现出分布式控制,且增加一种酶的表达仅能增加路径通量,直至另一种酶变成速率限制型。
代谢控制分析(Metabolic Control Analysis,MCA)是一种从实验数据和第一原理确定哪种酶具有速率限制性的方法。然而,MCA受到限制,原因是其在每种表达量变化之后需要广泛实验来确定新的速率限制酶。在这种背景下,启动子交换是有利的,原因是通过将启动子梯应用到路径中的每种酶,发现限制酶,且可在随后轮中进行同一件事,以发现成为速率限制的新酶。另外,由于功能读数最好是所关注小分子的产量,因此确定哪种酶具限制性的实验与提高通量的工程改造相同,从而缩短开发时间。在一些实施例中,本发明教示了将PRO交换应用到编码多单位酶的个别亚单位的基因。在又其它实施例中,本发明教示了对负责调节个别酶或整个生物合成路径的基因应用PRO交换技术的方法。
在一些实施例中,本发明的启动子交换工具可以用于鉴别所选基因目标的最佳表达。在一些实施例中,启动子交换的目标可以是增加目标基因的表达,以减少代谢或基因路径中的瓶颈。在其它实施例中,启动子交换的目标可以是减少目标基因的表达,以便在所述目标基因的表达不需要时,避免宿主细胞中不必要的能量消耗。
在其它细胞系统(如转录、转运或信号传导)的背景下,可以利用各种合理方法先验地竭力发现哪种蛋白质是表达变化的目标和那种变化应该是什么。这些合理方法降低了扰动数目,扰动必须进行测试以发现改良性能的扰动,但是这样做的成本很高。基因缺失研究了其存在对特定功能具关键作用的鉴别蛋白质,且接着可以过度表达重要基因。由于蛋白质相互作用的复杂性,这对于增强性能而言通常无效。已开发出不同类型模型,其试图从第一原理描述转录或信号传导行为与细胞中的蛋白质含量的关系。这些模型通常表明其中表达变化的目标可以产生不同或改良的功能。这些模型所基于的假设过分简单化且参数难以测量,因此其所产生的预测通常不正确,尤其对于非模型生物体来说。在基因缺失与建模的情况下,确定如何影响某种基因所需的实验不同于产生使性能改良的变化的后续工作。启动子交换避开了这些挑战,原因是突显了特定扰动的重要性的筑菌株是也已经改良的菌株。
因此,在特定实施例中,启动子交换是一种多步骤方法,其包含:
1.选择一组“x”个启动子充当“梯”。理想的是,这些启动子已展示出引起多个基因组基因座两端的高度可变化表达,但唯一的要求是其以某种方式扰动基因表达。
2.针对目标选择一组“n”个基因。这个集合可以是基因组中的每个开放阅读框架(ORF)或ORF的子集。可以使用与功能相关ORF的注释、根据与先前证实的有益扰动的关系(先前启动子交换或先前SNP交换)、通过基于先前所产生的扰动之间的上位相互作用而进行的算法选择、基于与针对目标的有益ORF有关的假设的其它选择准则或通过随机选择来选择子集。在其它实施例中,“n”个靶向基因可以包含非蛋白质编码基因,包括非编码RNA。在一个实施例中,“n”个基因集可以是酿酒酵母SLN1基因的直系同源物并且是一部分相同路径的一或多个基因的直系同源物。酿酒酵母SLN1基因和一部分相同路径的一或多个基因的直系同源物可以是所述基因的突变体形式。在一个实施例中,丝状真菌菌株或宿主细胞为黑曲霉,且所选择的“n”个基因集为表4中的SNP。在黑曲霉为宿主细胞的另一实施例中,所选择的“n”个基因集为非SNP或含有表4中基因的SNP的野生型形式。当黑曲霉为宿主细胞时,除一部分相同路径的一或多个基因以外,“n”个基因集可为表4中发现的FungiSNP_9的基因。当黑曲霉为宿主细胞时,除一部分相同路径的一或多个基因以外,“n”个基因集可为表4中发现的FungiSNP_12的基因。当黑曲霉为宿主细胞时,除一部分相同路径的一或多个基因以外,“n”个基因集可为表4中发现的FungiSNP_40的基因。在一个优选实施例中,当黑曲霉为宿主细胞时,除一部分相同路径的一或多个基因以外,“n”个基因集可来自表4的FungiSNP_18的基因(即酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式)。酿酒酵母SLN1基因和/或相同路径中的一或多种基因的黑曲霉直系同源物可以是野生型基因或突变体形式基因。酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式可以是SEQ ID NO:13的形式。路径中的一或多种基因可以是酿酒酵母Ypd1、Skn7、Ssk1和Ssk2基因的直系同源物或其任何组合。一部分相同路径的一或多种基因可选自由SEQ ID NO:15、16、17、18、19表示的核酸序列或其任何组合。
3.快速且在一些实施例中并行地进行以下基因修饰的高通量菌株工程改造:当原生启动子存在于目标基因n之前且其序列已知时,将原生启动子用梯中的x种启动子的每种启动子置换。当原生启动子不存在或其序列未知时,将梯中的x种启动子的每种启动子插入基因n之前(参见例如图10)。以这种方式构筑菌株“库”(也称为HTP基因设计库),其中库的每个成员为可操作地连接到目标n的启动子x在基本相同的基因背景下的例子。如先前所述,可以插入启动子组合,从而在构筑库时,扩大组合可能性的范围。
4.在依据一或多种度量的菌株性能指示所优化的性能的背景下,对菌株库进行高通量筛选。
尤其可以扩展这种基本方法,以进一步改良菌株性能:(1)将多个有益扰动合并到单一菌株背景中,以互动程序一次一个地进行,或作为多个变化在单个步骤中进行。多个扰动可以是一组特定的定义变化或部分随机化的变化组合库。举例来说,如果目标集是路径中的每个基因,那么使扰动库在先前菌株库的改良成员中依序再生能够优化路径中的每种基因的表达量,不论哪种基因在任一次指定的迭代时具有速率限制性;(2)将由库的个别和组合产生所得到的性能数据馈送到算法中,算法使用那个数据基于每个扰动的相互作用来预测最佳的扰动集;以及(3)实施上述两种方法的组合。
上述分子工具或技术的特征为启动子交换,但不限于启动子且可包括系统地改变目标集表达量的其它序列变化。用于改变基因集的表达量的其它方法可以包括:a)核糖体结合位点梯(或真核生物中的克扎克序列(Kozak sequences));b)将每个目标的起始密码子用其它起始密码子的每种密码子(例如,下文论述的起始/终止密码子交换)置换;c)使各种mRNA稳定化或去稳定化序列附著到转录物的5'或3'末端或任何其它位置;d)使各种蛋白质稳定化或去稳定化序列在蛋白质中的任何位置附著。
方法以工业微生物体为例说明于本发明中,但适用于可在基因突变体群体中鉴别出所期望性状的任何生物体。举例来说,这可用于改良CHO细胞、酵母、昆虫细胞、藻类以及多细胞生物体(如植物)的性能。
2.SNP交换:用于衍生SNP交换微生物菌株库的分子工具
在某些实施例中,SNP交换不是改良微生物菌株的随机突变诱发方法,而是涉及系统地引入或去除菌株两端的个别小核多态性核苷酸突变(即SNP)(因此称为“SNP交换”)。图9概念性地描绘了本发明的丝状真菌细胞中的一轮SNP交换。丝状真菌细胞中的SNP交换效用的论证展示于图42中。
在一个实施例中,本文所提供的方法和系统用于SNP交换,以便产生包含具有个别SNP或组合SNP的丝状真菌的丝状真菌库。组合SNP交换可以使用如图37所说明的二分转化来实现。
通过这种方法进行工程改造的所得微生物形成HTP基因设计库。
HTP基因设计库可以指通过这种方法形成的实际实体微生物菌株集合,其中每个菌株成员表示在基本相同基因背景下指定SNP存在或不存在,所述库称为“SNP交换微生物菌株库”。在丝状真菌(例如黑曲霉)的特定背景下,库可以称为“SNP交换丝状真菌菌株库”或“SNP交换黑曲霉菌株库”,但术语可同义地使用,因为丝状真菌是微生物或多核生物体的特定实例。
另外,HTP基因设计库可以指基因扰动的集合,在这种情况下,指定SNP存在或指定SNP不存在,所述集合称为“SNP交换库”。
在一些实施例中,SNP交换涉及重新构筑具有目标SNP“构建模块”与已鉴别有益性能作用的最佳组合的宿主生物体。因此,在一些实施例中,SNP交换涉及将多个有益突变合并到单一菌株背景中,以迭代程序一次一个地进行;或作为多个变化在单个步骤中进行。多个变化可以是一组特定的定义变化或部分随机化的突变组合库。
在其它实施例中,SNP交换还涉及将鉴别为有害的多个突变从菌株中去除,以迭代程序一次一个地进行,或作为多个变化在单个步骤中进行。多个变化可以是一组特定的定义变化或部分随机化的突变组合库。在一些实施例中,本发明的SNP交换方法包括添加有益SNP和去除有害和/或中性突变。
SNP交换是一种在经历突变诱发和选择所关注的改良性状的菌株谱系中鉴别和利用有益突变和有害突变的强大工具。SNP交换利用了高通量基因组工程改造技术系统地确定突变诱发谱系中的个别突变的影响。测定一或多代突变诱发谱系两端的菌株的基因组序列,突变诱发谱系具有已知的性能改良。接着系统地利用高通量基因组工程改造在早期谱系菌株中再现已改良菌株的突变,和/或使后期菌株中的突变恢复为早期菌株序列。接着评估这些菌株的性能且可以确定每种个别突变对所关注的改良表型的贡献。如前所述,对这种方法所得的微生物菌株进行分析/表征且形成SNP交换基因设计库的基础,SNP交换基因设计库可以告知宿主菌株两端的微生物菌株改良。
去除有害突变可以提供直接的性能改良,且在未经历突变诱发负荷的菌株背景下合并有益突变可以快速且大大改良了菌株性能。通过SNP交换方法产生的各种微生物菌株形成了HTP基因设计SNP交换库,其是包含各种所添加/缺失/或合并SNP的微生物菌株,但是具有基本相同的基因背景。
如先前所论述,用于性能改良的随机突变诱发和后续筛选是一种改良工业菌株的常用技术,并且经过多年(有的甚至数十年)的迭代方式开发,当前用于大规模制造的许多菌株。产生基因组突变的随机方法(如暴露于UV辐射或化学诱变剂,如甲烷磺酸乙酯)是一种用于改良工业菌株的优选方法,原因是:1)工业生物体在基因或代谢上可能受到不充分的表征,使得定向改良方法的目标选择变得困难或不可能;2)即使在表征相对充分的系统中,也难以预测引起工业性能改良的变化,且可能需要扰动未知功能的基因以及3)在所指定工业生物体中产生定向基因组突变的基因工具无法获得或非常缓慢和/或难以使用。
然而,尽管这种程序存在前述效益,但是也存在多项已知缺点。有益突变是相对罕见的事件,且为了在固定的筛选能力下发现这些突变,突变率必须足够的高。这通常致使将非所需的中性突变和部分有害的突变连同有益变化一起并入菌株中。这种‘突变诱发负荷’随时间积累,产生在总体稳定性和关键性状(如生长速率)方面具有缺陷的菌株。最终,‘突变诱发负荷’越来越难以或不可能通过随机突变诱发获得性能的进一步改良。不使用适合的工具则不可能将菌株谱系的离散和并联分支中发现的有益突变合并。
SNP交换是一种克服了这些限制的方法,其通过系统地再现或恢复在比较突变诱发谱系内的菌株时所观察到的一些或所有突变来实现。以这种方式,能够鉴别和合并有益(‘致病’)突变,和/或能够鉴别和去除有害突变。这允许对菌株性能进行快速改良,而通过进一步随机突变诱发或靶向基因工程改造则无法实现。
去除基因负荷或将有益变化合并到无基因负荷的菌株中还向能够实现进一步改良的额外随机突变诱发提供新的稳固起点。
另外,当突变诱发菌株谱系的各种离散分支两端鉴别出正交有益变化时,能够将其快速地合并到性能更佳的菌株中。还能够将这些突变合并到不属于突变诱发谱系的菌株中,如通过定向基因工程改造获得改良的菌株。
存在将突变诱发谱系内的菌株之间的突变随机重组的其它方法和技术。这些方法和技术包括促进突变型菌株两端的基因组重组的技术,如原生质体融合和整个基因组改组。对于一些工业微生物体(如酵母和丝状真菌)来说,还能够利用天然配对周期进行成对基因组重组。以这种方式,能够通过与亲本菌株产生‘回复交换’突变体且合并有益突变来去除有害突变。然而,这些方法受到许多限制,使用本发明的SNP交换方法规避了这些限制。
举例来说,由于这些方法依赖于相对较少数目个随机重组交换事件来交换突变,因此可以采取许多重组和筛选周期来优化菌株性能。另外,虽然天然重组事件基本上是随机的,但是其也受到基因组位置偏好的影响且一些突变可能难以定址。如果不使用额外基因组测序和分析,这些方法提供的关于个别突变影响的信息也很少。SNP交换克服了这些基本限制,因为其不是随机方法,而是系统地引入或去除菌株两端的个别突变。
在一些实施例中,本发明教示了用于鉴别多样性池的生物体中存在的SNP序列多样性的方法。多样性池可以是分析所用微生物的指定数目n,其中所述微生物的基因组表示“多样性池”。
在特定方面中,多样性池可以是原始亲本菌株(S1),其在特定时间点具有“基线”或“参考”基因序列(S1Gen1),且接着是从所述S1菌株衍生/发育的任何数目个后续子代菌株(S2-n),并且后续子代菌株具有相对于基线基因组S1的基因组(S2-nGen2-n)。
举例来说,在一些实施例中,本发明教示了对多样性池中的微生物基因组进行测序以鉴别每种菌株中存在的SNP。在一个实施例中,多样性池的菌株是历史上的微生物生产菌株。因此,本发明的多样性池可以包括例如工业参考菌株和通过传统菌株改良程序产生的一或多种突变型工业菌株。
在一些实施例中,多样性池内的SNP是参照“参考菌株”测定。在一些实施例中,参考菌株是野生型菌株。在其它实施例中,参考菌株是经历任何突变诱发之前的原始工业菌株。参考菌株可以由从业者定义且不一定是原始野生型菌株或原始工业菌株。基础菌株仅表示被视为“基本”、“参考”或原始基因背景的菌株,借此与由所述参考菌株衍生或发育的后续菌株比较。
鉴别出多样性池中的所有SNP后,本发明教示了用SNP交换方法和筛选方法描绘(即,量化和表征)个别和/或群组中的SNP的效应(例如产生所关注的表型)。
在一些实施例中,本发明的SNP交换方法包含将突变型菌株(例如来自S2-nGen2-n的菌株)中所鉴别的一或多种SNP引入到参考菌株(S1Gen1)或野生型菌株的步骤(“向上波动”)。
在其它实施例中,本发明的SNP交换方法包含将突变型菌株(例如来自S2-nGen2-n的菌株)中所鉴别的一或多种SNP去除的步骤(“向下波动”)。
在一些实施例中,根据本发明的一或多个准则(例如所关注的化学品或产物的产生)对包含一或多种SNP变化(引入或去除)的每种所产生的菌株进行培养和分析。使得来自每种所分析宿主菌株的数据与存在于宿主菌株中的特定SNP或SNP群组关联或相关,且记录以供未来使用。因此,本发明能够产生高度注释的大型HTP基因设计微生物菌株库,菌株库能够鉴别指定SNP对任何数目个所关注微生物基因或表型性状的影响。将这些HTP基因设计库中存储的信息告知HTP基因组工程改造平台的机器学习算法且引导程序的未来迭代,最终产生具有高度所期望特性/性状的进化微生物生物体。
3.起始/终止密码子交换:用于衍生起始/终止密码子微生物菌株库的分子工具
在一些实施例中,本发明教示了交换起始和终止密码子变异体的方法。举例来说,酿酒酵母和哺乳动物的典型终止密码子分别是TAA(UAA)和TGA(UGA)。单子叶植物的典型终止密码子是TGA(UGA),而昆虫和大肠杆菌通常使用TAA(UAA)作为终止密码子(达尔芬(Dalphin)等人(1996),核酸研究(Nucl.Acids Res.)24:216-218)。在其它实施例中,本发明教示了使用TAG(UAG)终止密码子。
本发明类似地教示了交换起始密码子。在一些实施例中,本发明教示了使用大部分生物体(尤其真核生物)所使用的ATG(AUG)起始密码子。在一些实施例中,本发明教示了原核生物大部分使用ATG(AUG),继之以GTG(GUG)和TTG(UUG)。
在其它实施例中,本发明教示了用TTG置换ATG起始密码子。在一些实施例中,本发明教示了用GTG置换ATG起始密码子。在一些实施例中,本发明教示了用ATG置换GTG起始密码子。在一些实施例中,本发明教示了用TTG置换GTG起始密码子。在一些实施例中,本发明教示了用ATG置换TTG起始密码子。在一些实施例中,本发明教示了用GTG置换TTG起始密码子。
在其它实施例中,本发明教示了用TAG置换TAA终止密码子。在一些实施例中,本发明教示了用TGA置换TAA终止密码子。在一些实施例中,本发明教示了用TAA置换TGA终止密码子。在一些实施例中,本发明教示了用TAG置换TGA终止密码子。在一些实施例中,本发明教示了用TAA置换TAG终止密码子。在一些实施例中,本发明教示了用TGA置换TAG终止密码子。
4.终止子交换:用于衍生终止子交换微生物菌株库的分子工具
在一些实施例中,本发明教示了通过优化细胞基因转录来提高宿主细胞生产率的方法。基因转录是若干种不同生物学现象的结果,包括转录起始(RNAp募集和转录复合物形成)、伸长(股合成/延伸)和转录终止(RNAp脱离和终止)。虽然已经通过基因的转录调节(例如通过改变启动子,或诱导调节性转录因子)倾注了广泛的关注来控制基因表达,但是通过基因终止子序列的调节获得转录调节的成果相对较少。
转录影响基因表达量的最明显方式是通过Pol II起始速率,其可以通过启动子或增强子强度与反式活化因子的组合来调节(卡顿加JT(Kadonaga,JT),2004,“序列特异性DNA结合因子对RNA聚合酶II转录的调节(Regulation of RNA polymerase IItranscription by sequence-specific DNA binding factors)”,细胞,2004年1月23日;116(2):247-57)。在真核生物中,伸长率也可以通过影响替代性拼接来决定基因表达模式(克拉默P.(Cramer P.)等人,1997“启动子结构与转录物替代性拼接之间的功能联系(Functional association between promoter structure and transcript alternativesplicing)”,美国国家科学院院刊,1997年10月14日;94(21):11456-60)。基因上的终止失效可以通过减少启动子cPol II的可及性来消弱下游基因的表达(格莱吉IH(Greger IH)等人,2000“酿酒酵母的GAL7启动子的转录干扰和起始之间的平衡(Balancingtranscriptional interference and initiation on the GAL7promoter ofSaccharomyces cerevisiae)”,美国国家科学院院刊,2000年7月18日;97(15):8415-20)。这种过程(称为转录干扰)与低级真核生物尤其相关,因为其通常具有紧密间隔的基因。
终止序列还能够影响序列所属的基因的表达。举例来说,研究表明,真核生物中的低效转录终止致使未拼接的前mRNA积累(参见韦斯特S.(West,S.)和普洛德弗N.J.(Proudfoot,N.J.),2009“转录终止使人类细胞中的蛋白质表达增强(TranscriptionalTermination Enhances Protein Expression in Human Cells)”,分子细胞,2009年2月13日;33(3-9);354-364)。其它研究也已表明,3'末端处理可以通过低效终止来延迟(韦斯特S等人,2008“哺乳动物RNA聚合酶II转录终止的分子剥离(Molecular dissection ofmammalian RNA polymerase II transcriptional termination)”,分子细胞,2008年3月14日;29(5):600-10)。转录终止还能够通过使转录物从合成位点释放来影响mRNA稳定性。
真核生物中的转录机制的终止
真核生物中的转录终止通过终止子信号操作,终止子信号被与RNA聚合酶II相关的蛋白质因子识别。在一些实施例中,裂解和聚腺苷酸化特异性因子(CPSF)和裂解刺激因子(CstF)从RNA聚合酶II的羧基末端域转移到聚A信号。在一些实施例中,CPSF和CstF因子也将其它蛋白质募集到终止位点,接着使转录物裂解且使mRNA从转录复合物释放。终止也触发mRNA转录物的聚腺苷酸化。经验证的真核生物终止因子和其保守结构的说明性实例论述于本文的后续部分中。
终止子序列或信号能够可操作地连接到待表达序列的3'末端。多种已知真菌终止子在本发明的宿主菌株中可为功能性的。实例为构巢曲霉trpC终止子、黑曲霉α-葡糖苷酶终止子、黑曲霉葡糖淀粉酶终止子、白霉菌米黑羧基蛋白酶终止子(参见美国专利第5,578,463号)、金孢霉终止子序列(例如EG6终止子)和里氏木霉(Trichoderma reesei)纤维二糖水解酶终止子。在一个实施例中,终止子序列为直接重复序列(DR)。在一个实施例中,终止子序列为原生黑曲霉pyrG终止子。原生黑曲霉pyrG序列可具有SEQ ID NO:5的序列。
终止子交换(STOP交换)
在一些实施例中,本发明教示了选择具有最佳表达特性的选择终止序列(“终止子”)以对整体宿主菌株生产率产生有益作用的方法。
举例来说,在一些实施例中,本发明教示了鉴别一或多种终止子和/或在宿主细胞内产生一或多种终止子的变异体的方法,其展现出表达强度范围(例如下文论述的终止子梯)。这些已鉴别和/或产生的终止子的特定组合可以归入同类作为终止子梯,其更详细地解释于下文。
接着使所讨论的终止子梯与所关注的指定基因关联。因此,如果具有终止子T1-T8(表示已鉴别和/或产生以便在与一或多种启动子组合时展现出表达强度范围的八种终止子)且使终止子梯与宿主细胞中所关注的单一基因关联(即,通过使指定终止子可操作地连接到指定目标基因的3'末端而对宿主细胞进行基因工程改造),接着可以通过表征由每种组合尝试产生的每种经工程改造菌株来确定终止子的每种组合的影响,条件是除与目标基因相关的特定启动子之外,经工程改造的宿主细胞具有基本相同的基因背景。通过这种方法进行工程改造的所得宿主细胞形成了HTP基因设计库。
HTP基因设计库可以指通过这种方法形成的实际实体微生物菌株集合,其中每个菌株成员表示指定终止子在基本相同的基因背景下可操作地连接到特定目标基因,所述库称为“终止子交换微生物菌株库”或“STOP交换微生物菌株库”。在丝状真菌(例如黑曲霉)的特定背景下,库可以称为“终止子交换丝状真菌菌株库”或“终止子交换黑曲霉菌株库”,但术语可同义地使用,因为丝状真菌或黑曲霉是微生物或多核生物体的特定实例。
另外,HTP基因设计库可以指基因扰动的集合,在这种情况下,指定启动子x可操作地连接到指定基因y,所述集合称为“启动子交换库”或“STOP交换库”。
另外,能够使用包含终止子T1-T8的相同终止子梯对微生物进行工程改造,其中八种启动子的每种启动子可操作地连接到10种不同基因目标。这种程序得到80种宿主细胞菌株,除可操作地连接到所关注目标基因的特定终止子之外,菌株呈现出基本相同的基因背景。可以对这些80种宿主细胞菌株进行适当筛选和表征且产生另一个HTP基因设计库。表征HTP基因设计库中的微生物菌株产生的信息和数据可以存储在任何数据库中,包括(但不限于)关系型数据库、面向对象数据库或高度分布式NoSQL数据库。这种数据/信息可以包括例如当将指定终止子(例如T1-T8)可操作地连接到指定基因目标时的作用。这种数据/信息还可以是通过使启动子T1-T8中的两种或更多种可操作地连接到指定基因目标而产生的更广泛的组合作用的集合。
八种终止子和10种目标基因的前述实例仅为说明性的,原因是所述概念可以应用到基于表达强度范围的呈现而已经归入同类的任何指定数目个启动子和任何指定数目个目标基因。
总之,利用各种终止子来调节各种基因在生物体中的表达是一种优化所关注性状的强大工具。本发明人所开发的终止子交换分子工具使用了终止子序列梯,其已经证明可改变至少一个基因座在至少一种条件下的表达。接着使用高通量基因组工程改造将这种终止子序列梯系统地应用到生物体中的一组基因。基于多种方法中的任一种方法确定这组基因影响所关注性状的可能性较高。这些方法可以包括基于已知功能或对所关注性状的影响而进行的选择,或基于先前测定的有益基因多样性做出的算法选择。
接着对含有连接到基因的终止子序列的生物体的所得HTP基因设计微生物菌株库在高通量筛选模型中的性能进行评估,且确定引起性能增强的启动子-基因连接且将信息存储在数据库中。基因扰动的集合(即,指定终止子x连接到指定基因y)形成“终止子交换库”,其可以用作微生物工程改造处理中所用的潜在基因变异的来源。当针对微生物背景的更大多样性实施基因扰动的更大集合时,每个库作为实验上被证实的数据的主体随时间变得更强大,其能用于根据所关注的任何背景更精确且可预测地设计出靶向变化。即,在一些实施例中,本发明教示了基于先前实验结果将一或多种基因变化引入宿主细胞,先前实验结果嵌入与本发明的任何基因设计库相关的元数据内。
因此,在特定实施例中,终止子交换是一种多步骤方法,其包含:
1.选择一组“x”个终止子充当“梯”。理想的是,这些终止子已展示出可引起多个基因组基因座两端的高度可变化表达,但唯一的要求是其以某种方式扰动基因表达。
2.针对目标选择一组“n”个基因。这个集合可以是基因组中的每个ORF或ORF的子集。可以使用与功能相关ORF的注释、根据与先前证实的有益扰动的关系(先前启动子交换、STOP交换或SNP交换)、通过基于先前所产生的扰动之间的上位相互作用而进行的算法选择、基于与针对目标的有益ORF有关的假设的其它选择准则或通过随机选择来选择子集。在其它实施例中,“n”个靶向基因可以包含非蛋白质编码基因,包括非编码RNA。
3.快速且并行地进行以下基因修饰的高通量菌株工程改造:当原生终止子存在于目标基因n的3'末端且其序列已知时,将原生终止子用梯中的x种终止子的每种终止子置换。当原生终止子不存在或其序列未知时,将梯中的x种终止子的每种终止子插入基因终止密码子之后。
以这种方式构筑菌株“库”(也称为HTP基因设计库),其中库的每个成员是连接到目标n的终止子x在基本相同的基因背景下的例子。如先前所述,可以插入终止子组合,从而在构筑库时,扩大组合可能性的范围。
4.在依据一或多种度量的菌株性能指示所优化的性能的背景下,对菌株库进行高通量筛选。
尤其可以扩展这种基本方法,以改良菌株性能:(1)将多个有益扰动合并到单一菌株背景中,以互动程序一次一个地进行,或作为多个变化在单个步骤中进行。多个扰动可以是一组特定的定义变化或部分随机化的变化组合库。举例来说,如果目标集是路径中的每个基因,那么使扰动库在先前菌株库的改良成员中依序再生能够优化路径中的每种基因的表达量,不论哪种基因在任一次指定的迭代时具有速率限制性;(2)将由库的个别和组合产生所得到的性能数据馈送到算法中,算法使用那个数据基于每个扰动的相互作用来预测最佳的扰动集;以及(3)实施上述两种方法的组合。
方法以工业微生物体为例说明于本发明中,但适用于可以在基因突变体群体中鉴别出所期望性状的任何生物体。举例来说,这可用于改良CHO细胞、酵母、昆虫细胞、藻类以及多细胞生物体(如植物)的性能。
5.序列优化:用于衍生优化序列微生物菌株库的分子工具
在一个实施例中,本发明的方法包含对宿主生物体所表达的一或多种基因进行密码子优化。用于优化密码子以改良各种宿主中的表达的方法在所属领域中已知且描述于文献(参见美国专利申请公开案第2007/0292918号,申请以全文引用的方式并入本文中)中。可以制备含有具体原核生物或真核生物宿主优选的密码子的优化编码序列(也参见莫雷(Murray)等人(1989),《核酸研究(Nucl.Acids Res.)》17:477-508),以例如提高翻译速率或产生具有期望特性的重组RNA转录物,如半衰期比从非优化序列产生的转录物长。
蛋白质表达由大量因素控制,包括影响转录、mRNA处理以及翻译稳定性和起始的那些因素。优化因此可以对任何特定基因的多个序列特点中的任一个进行定址。作为一个特定实例,罕见密码子诱导的翻译暂停能够引起蛋白质表达减少。罕见密码子诱导的翻译暂停包括所关注多核苷酸中存在的密码子,由于在可利用的tRNA池中的罕见性,很少用于宿主生物体中,这可能对蛋白质翻译产生负面影响。
交替翻译起始还会引起异源蛋白质表达减少。交替翻译起始可以包括合成多核苷酸序列,其不经意间含有能够充当核糖体结合位点(RBS)的基元。这些位点可以起始所截断蛋白质从基因内部位点的翻译。一种减少产生所截断蛋白质(其在提纯期间可能难以去除)的可能性的方法包括将推定的内部RBS序列从优化的多核苷酸序列中消除。
重复诱导的聚合酶打滑会引起异源蛋白质表达减少。重复诱导的聚合酶打滑涉及核苷酸序列重复,其已展示出可引起DNA聚合酶打滑或停顿,从而会致使移框突变。这类重复还能够引起RNA聚合酶打滑。在具有高G+C含量偏好的生物体中,可能存在由G或C核苷酸重复组成的较高程度的重复。因此,一种减少诱导RNA聚合酶打滑的可能性的方法包括改变G或C核苷酸的扩展重复。
干扰次级结构还会引起异源蛋白质表达减少。次级结构能够隔离RBS序列或起始密码子且已经与蛋白质表达的减少相关。茎环结构还会参与转录暂停和减弱。优化的多核苷酸序列可以在核苷酸序列的RBS和基因编码区中含有最小次级结构以实现转录和翻译的改良。
举例来说,优化程序可以始于鉴别由宿主表达的所期望氨基酸序列。由氨基酸序列可以设计候选多核苷酸或DNA序列。在合成DNA序列的设计期间,可以对密码子使用频率与宿主表达生物体的密码子使用进行比较且可以将罕见的宿主密码子从合成序列中去除。另外,可以修饰合成候选DNA序列以便去除非期望的酶限制位点和添加或去除任何所期望信号序列、连接子或未翻译区域。可以分析合成DNA序列中所存在的可能会干扰翻译过程的次级结构,如G/C重复和茎环结构。
6.上位定位:能够实现有益基因合并的预测分析工具
在一些实施例中,本发明教示了用于预测有益基因改变且将其组合到宿主细胞中的上位定位方法。基因改变可以利用前述HTP分子工具集(例如启动子交换、SNP交换、起始/终止密码子交换、序列优化及STOP交换)中的任一种产生且根据所衍生的HTP基因设计微生物菌株文库的表征已知那些基因改变的效应。因此,如本文所用,术语上位定位包含鉴别可能会引起宿主性能增强的基因改变组合(例如有益SNP或有益启动子/目标基因关联)的方法。
在实施例中,本发明的上位定位方法是基于如下构思:相较于来自同一功能群组的突变的组合,来自两种不同功能群组的有益突变的组合更可能改良宿主性能。参见例如考斯坦佐(Costanzo),细胞的基因前景(The Genetic Landscape of a Cell),科学,第327卷,第5964期,2010年1月22日,第425-431页(以全文引用的方式并入本文中)。
来自同一功能群组的突变更可能通过相同机制来运作,且因此更可能对总体宿主性能展示负上位或中性上位效应。相比之下,来自不同功能群组的突变更可能通过独立机制来运作,从而能够引起宿主性能改善且在一些情况下产生协同效应。
因此,在一些实施例中,本发明教示了分析SNP突变以鉴别经预测属于不同功能群组的SNP的方法。在一些实施例中,SNP功能群组相似度是通过计算突变相互作用概况的余弦相似度来确定。本发明还通过突变相似度矩阵或树状图来说明SNP的比较。
因此,上位定位程序提供了一种对在一或多种基因背景下所施加的多种多样的基因突变进行分组和/或评级的方法,目的是将所述突变高效且有效地合并到一或多种基因背景中。
在每一方面中,进行合并的目标是产生新颖菌株,所述新颖菌株针对目标生物分子的产生经优化。通过所教示的上位定位程序,可以鉴别突变的功能分组,且所述功能分组能够实现使不期望的上位效应最小化的合并策略。
如此前所解释,供工业发酵使用的微生物的优化是一个重要的难题,其广泛牵涉到经济、社会和自然界。传统上,已经通过随机突变诱发的缓慢和不确定过程进行微生物工程改造。所述方法利用细胞的天然进化能力来适应人工赋予的选择压力。所述方法还受到以下限制:有益突变的稀有性、潜在健康前景的稳固性,且更通常来说,未充分利用细胞和分子生物学的现有技术水平。
现代方法利用了在机制层面对细胞功能的新理解且利用新的分子生物学工具对特定表型末端进行靶向基因操控。在实践中,所述合理方法因生物学的潜在复杂性而发生混淆。对致病机制的了解不充分,尤其当尝试将各自具有所观察到的有益效应的两种或两种以上变化进行组合时。有时,基因变化的所述合并产生正结果(根据所要表型活性的增强所测量),但是净正结果可能低于预期且在一些情况下高于预期。在其它情况下,所述组合产生净中性效应或净负效应。这种现象称为上位,且是微生物工程改造(且一般是基因工程改造)的基本挑战之一。
如前所述,本发明的HTP基因组工程改造平台解决了与传统微生物工程改造方法相关的许多问题。本发明HTP平台利用自动化技术一次进行数百或数千个基因突变。在特定方面中,不同于上述合理方法,所揭示的HTP平台能够并行构筑数千个突变体以更有效地探究相关基因组空间的较大子集,如美国申请第15/140,296号(名称为:用于改良经工程改造的核苷酸序列的大规模生产的微生物菌株设计系统和方法(Microbial Strain DesignSystem And Methods For Improved Large-Scale Production Of EngineeredNucleotide Sequences),其以全文引用的方式并入本文中)中所揭示。通过尝试“所有事物”,本发明的HTP平台避开了我们有限的生物学理解所引起的困难。
然而,同时,本发明的HTP平台面对的问题是根本上局限于基因组空间的组合爆发性规模,以及计算机技术解释所产生的数据集的有效性(鉴于基因相互作用的复杂性)。需要以使产生所要结果的组合的非随机选择最大化的方式探究广大组合空间的子集的技术。
在酶优化的情况下,在某种程度上相似的HTP方法已证明是有效的。在这个小生境问题中,所关注的基因组序列(约1000个碱基)编码具有一些复杂物理构形的蛋白质链。确切的构形是利用其组成性原子组分之间的整体电磁相互作用来确定。短基因组序列与物理上受约束的折叠问题的这种组合使得其自身特别渴望优化策略。也就是说,可以使序列在每个残基处发生个别的突变且使所得突变体改组,从而以与序列活性响应(SequenceActivity Response)建模兼容的解析度有效地对局部序列空间取样。
然而,针对生物分子进行完整基因组优化时,所述以残基为中心的方法因一些重要原因而不充分。第一个原因是与生物分子的基因组优化有关的相关序列空间呈指数级增加。第二个原因是生物分子合成中的调节、表达和代谢相互作用的复杂性增加。本发明人已经通过所教示的上位定位程序解决了这些问题。
用于对一组突变之间的上位相互作用建模以便更高效且有效地将所述突变合并到一或多种基因背景中的所教示方法在所属领域中具有开创性且是非常需要的。
描述上位定位程序时,术语“更高效”和“更有效”是指对于特定表型目标,避免合并菌株间的不期望上位相互作用。
由于所述过程已经大体详述如上,因此现将描述更具体的工作流程实例。
首先,从M个突变的文库和一或多种基因背景(例如亲本丝状真菌菌株)开始。文库的选择和基因背景的选择都不对于在此所述的方法具有特异性。但在特定实施方案中,突变文库可以排他地或组合性地包含:SNP交换文库、启动子交换文库,或本文所述的任何其它突变文库。
在一个实施方案中,仅提供单一基因背景。在这种情况下,首先利用此单一背景产生不同基因背景(微生物突变体)的集合。这可通过以下来实现:将初始突变文库(或其一些子集)施加于所给定的背景,例如将特定SNP的HTP基因设计文库或特定启动子的HTP基因设计文库施加于所给定的基因背景,从而产生具有相同基因背景的微生物突变体群体(可能数百或数千),例外之处为其中并入了来自所给定的HTP基因设计文库的特定基因改变。如下详述,这个实施例可以产生组合文库或成对文库。
在另一个实施方案中,可以简单地给出不同的已知基因背景的集合。如下详述,这个实施例可以产生组合文库的子集。
在一个特定实施方案中,为了使这种方法的有效性最大化,测定基因背景的数目和这些背景之间的基因多样性(以突变数目或序列编辑距离或其类似物来测量)。
基因背景可以是天然的、原生的或野生型菌株或突变的经工程改造的菌株。N种不同背景菌株可以由向量b表示。在一个实例中,背景b可以代表通过如下形成的经工程改造的背景:将N个初始突变m0=(m1、m2、…mN)施加于野生型背景菌株b0以形成N种突变背景菌株b=m0b0=(m1b0、m2b0、…mNb0),其中mib0表示将突变mi施加于背景菌株b0
在任一种情况(即单一所提供的基因背景,或基因背景的集合)下,结果是N种基因上不同的背景的集合。测量每一背景的相关表型。
第二,将M个突变m1的集合中的每一突变施加于N种背景菌株的集合b内的每一背景,以形成M×N突变体的集合。在其中N个背景本身是通过施加初始突变集合m0(如上文所述)而获得的实施方案中,所得突变体集合有时称为组合库或成对库。在其中已经明确提供已知背景集合的另一个实施方案中,所得突变体集合可以称为组合库的子集。类似于经工程改造背景向量的产生,在实施例中,输入接口202(参见图14)接收突变向量m1和背景向量b,以及指定的运算,诸如叉积。
继续以上述经工程改造背景为例,形成M×N组合库可以由m1×m0b0(m1施加至b=m0b0的N个背景的叉积)形成的矩阵表示,其中m1中的每一突变施加至b内的每一背景菌株。所得M×N矩阵中的每一第i行表示m1内的第i个突变施加于背景集合b内的所有菌株。在一个实施例中,m1=m0和矩阵表示将相同突变成对施加于起始菌株b0。在这种情况下,矩阵在其对角线两侧是对称的(M=N),且在任何分析中可以忽略对角线,因为其表示施加相同突变两次。
在实施例中,形成M×N矩阵可以通过向输入接口202(参见图14)中输入复合表达式m1×m0b0来实现。表达式的分量向量可以与明确指定的其元素一起通过一或多种DNA规格直接输入,或如呼叫文库206以便在解释程序204解释期间实现向量的检索。如美国专利申请第15/140,296号(名称为“用于改良经工程改造的核苷酸序列的大规模生产的微生物菌株设计系统和方法(Microbial Strain Design System and Methods for ImprovedLarge Scale Production of Engineered Nucleotide Sequences)”)中所述,LIMS系统200通过解释器204、执行引擎207、发订单引擎208和工厂210产生由输入表达式指定的微生物菌株。
第三,参照图19,分析设备214(参见图14)测量了M×N组合文库矩阵内的每一突变体的表型响应(4202)。因而,响应的集合可以理解为M×N响应矩阵R。R中的每一元素可以表示为rij=y(mi,mj),其中y表示经工程改造的集合b内的背景菌株bj的响应(性能),如通过突变mi而发生突变。为了简单和实用性起见,我们采用成对突变,其中m1=m0。在突变集合表示成对突变文库的情况下(如本文),所得矩阵也可以称为基因相互作用矩阵或更确切地说,突变相互作用矩阵。
所属领域的技术人员将认识到,在一些实施例中,与上位效应和预测菌株设计有关的运算可以完全通过LIMS系统200的自动化方式进行,例如通过分析设备214(参见图14)或通过人工建构,或通过自动化与人工方式的组合。当运算并非完全自动进行时,LIMS系统200的元件(例如分析设备214)可以例如接收人工执行运算的结果,而非通过其自身的运算能力而产生结果。如本文在别处所述,LIMS系统200的组件(诸如分析设备214)可以完全或部分地通过一或多种计算机系统来建构。在一些实施例中,尤其在与预测菌株设计有关的运算是利用自动化与人工方式的组合来执行的情况下,分析设备214不仅可以包含计算机硬件、软件或固件(或其组合),而且还包含由操作人员操作的设备,如下表3中所列的设备,诸如在“评价性能”类别下所列的设备。
第四,分析设备212(参见图14)将响应矩阵归一化。归一化由以下组成:调节测量响应值的人工过程和/或在这个实施例中的自动化过程,以便去除偏差和/或分离出此方法所特有的效果的相关部分。就图19来说,第一步骤4202可以包含获得归一化的测量数据。一般来说,在针对预测菌株设计和上位定位的权利要求书中,术语“性能测量”或“测量性能”或其类似术语可以用于描述一种度量标准,其反映了测量数据(不论未处理或以某些方式处理),例如归一化数据。在一个特定实施方案中,归一化可以通过从测量响应值中减去先前测量的背景响应来进行。在所述实施方案中,所得响应元素可以形成为rij=y(mi,mj)-y(mj),其中y(mj)是由向亲本菌株b0施加初始突变mj引起的经工程改造的集合b内的经工程改造的背景菌株bj的响应。应注意归一化响应矩阵内的每一行是作为其相应突变的相应曲线来处理。也就是说,第i行描述了施加于j=1到N的所有背景菌株bj的相应突变mi的相对效应。
就成对突变的实例来说,由两种突变引起的菌株的组合性能/响应可以大于、小于或等于每一种突变单独引起的菌株的性能/响应。这种效应称为“上位”且在一些实施例中,可以用eij=y(mi,mj)-(y(mi)+y(mj))表示。这种数学表示可以存在变化形式,且可以取决于例如个别变化如何在生物学上发生相互作用。如上文所提及,来自同一功能群组的突变更可能通过相同机制来运作,且因此更可能对总体宿主性能展示负上位或中性上位效应。相比之下,来自不同功能群组的突变更可能通过独立机制来运作,从而能够通过例如减少冗余突变效应来改良宿主性能。因此,产生差异响应的突变比产生相似响应的突变更可能以叠加方式组合。这导向在下一步骤中相似度之计算。
第五,分析设备214测量了响应间的相似度,在成对突变实例中,响应矩阵内的第i个突变和第j个(例如初始)突变的效应之间的相似度(4204)。注意R的第i行表示第i个突变mi在N种背景菌株上的性能效应,其中的每一种本身可以是如上文所述的工程改造突变的结果。因此,第i个和第j个突变的效应之间的相似度可分别由第i和第j行、ρi和ρj之间的相似性sij表示,以形成相似度矩阵S。相似度可以使用多种已知技术测量,诸如交叉相关或绝对余弦相似度,例如sij=abs(cos(ρij))。
作为度量标准(如余弦相似度)的一个替代或补充方案,可以对相应曲线进行聚类以测定相似程度。聚类可以使用基于距离的聚类算法(例如k均值、层次凝聚等)结合适合的距离测量(例如欧几里德(Euclidean)、汉明(Hamming)等)来进行。或者,可以使用基于相似度的聚类算法(例如谱、最小割等)以及适合的相似度测量(例如余弦、相关等)来进行聚类。当然,可以通过任何数目的标准函数运算(例如指数函数)来使距离测量映射于相似度测量且反之亦然。在一个实施方案中,层次凝聚聚类可以结合绝对余弦相似度来使用。
作为聚类的一个实例,假设C为进入k独特集群的突变mi集群。假设C为集群成员资格矩阵,其中cij为突变i属于集群j的程度,是在0与1之间的值。接着通过Ci×Cj(C的第i行与第j行的点积)得到突变i与j之间的基于集群的相似度。一般来说,基于集群的相似度矩阵由CCT给定(即C乘以C-转置)。在硬聚类(突变恰好属于一个集群)的情况下,两个突变之间的相似度是1(如果其属于同一集群)和0(如果其不属于同一集群)。
如考斯坦佐,细胞的基因前景,科学,第327卷,第5964期,2010年1月22日,第425-431页(以全文引用的方式并入本文中)所述,突变相应曲线的这种聚类是指单元潜在功能组织的大致定位。也就是说,聚在一起的突变倾向于与潜在的生物过程或代谢路径相关。所述突变在本文中称为“功能群组”。这种方法的关键观察结果在于,如果两个突变通过相同的生物过程或路径来运作,那么所观察到的效应(和尤其所观察到的效益)可能是冗余的。反之,如果两个突变通过疏远的机制来运作,那么有益效应不大可能是冗余的。
第六,基于上位效应,分析设备214选择产生差异响应的突变对,例如其余弦相似度度量标准低于相似度阈值,或其响应属于充分分离的集群,如图19(4206)所示。基于其差异性,所选突变对应该优于相似对地合并到背景菌株中。
基于所选的产生充分差异响应的突变对,可以使用LIMS系统(例如解释器204、执行引擎207、下单器208和工厂210的全部或一些组合)设计具有那些所选突变的微生物菌株(4208)。在实施例中,如下文所述和本文别处所述,上位效应可以建构成预测模型或与其结合使用,以对菌株选择进行加权或过滤。
假定可以通过一些优选的预测模型估计假想菌株的性能(也称为分数),所述假想菌株是通过将来自文库的突变集合合并到特定背景中来获得。教示方法中所用的代表性预测模型提供于标题为“预测菌株设计”的下述章节中,所述章节见于更大章节:“全基因组基因设计标准的计算分析和效果预测”。
当使用预测菌株设计技术(诸如线性回归)时,分析设备214可以将模型限制到具有低相似度测量值的突变,例如通过过滤回归结果以便仅保留具有充分差异性的突变。或者,可以用相似度矩阵对预测模型进行加权。例如一些实施例可以利用经加权的最小二乘法回归,其使用相似度矩阵来表征提议突变的相互依赖性。作为一实例,可以通过将“内核”策略应用于回归模型来进行加权。(就“内核策略”常用于多种机器学习建模方法来说,这种再加权策略不限于线性回归。)
所述方法为所属领域的技术人员已知的。在实施例中,内核是具有元素1-w×sij的矩阵,其中1是单位矩阵的元素,且w是0与1之间的实值。当w=0时,此简化为标准回归模型。在实践中,当针对成对组合构筑体和其关联效应y(mi,mj)评价时,w值将与预测模型的精确度(r2值或均方根误差(RMSE))相关。在一个简单的实施方案中,w定义为w=1-r2。在这种情况下,当模型完全可预测时,w=1-r2=0且合并仅基于预测模型且上位定位程序不起作用。另一方面,当预测模型完全不可预测时,w=1-r2=1且合并仅基于上位定位程序。在每一迭代期间,可以评估精确度以确定模型性能是否改良。
应清楚,本文所述的上位定位程序不取决于分析设备214使用哪种模型。鉴于所述预测模型,有可能对通过组合合并对突变文库可获取的所有假想菌株进行评分和评级。
在一些实施例中,为了考虑上位效应,分析设备214可以利用差异突变相应曲线来增加与来自预测模型的每一假想菌株相关的分数和等级。这种程序可以大体上被认为是分数的再加权,从而有利于具有差异相应曲线的候选菌株(例如从多种多样的集群中抽取的菌株)。在一个简单的实施方案中,菌株的分数可以由不满足差异性阈值或从同一集群抽取的组成性突变(具有适合权重)的数目降低。在一个特定实施方案中,假想菌株的性能估计值可以由与所有组成性突变对相关的相似度矩阵中的各项的总和降低,所述组成性突变与假想菌株(再次具有适合权重)相关。可以使用这些经增加分数对假想菌株进行再评级。在实践中,所述再加权计算可以结合初始分数估计来进行。
结果是假想菌株的集合,其分数和等级经增加以更有效地避免令人混淆的上位相互作用。此时可以构筑假想菌株,或可以将其送至另一计算方法以供后续分析或使用。
所属领域的技术人员将认识到,如本文所述的上位定位和迭代预测菌株设计不限于仅使用成对突变,而是可以扩展到将许多更多的突变同时施加到背景菌株。在另一个实施例中,可以将额外突变依序施加到已经使用根据本文所述的预测方法选定的突变进行突变的菌株。在另一个实施例中,上位效应如下估算:将相同的基因突变施加到彼此稍微不同的多种菌株背景,且注意经修饰菌株背景当中的正相应曲线中的任何显著差异。
基因设计和微生物工程改造:使用经靶向核酸酶的导向基因组编辑
代谢工程改造很大程度上依赖于直接和间接涉及分子的代谢、调节和分解代谢的关键基因的改变。将小型和大型变化(诸如单核苷酸多形现象、插入或缺失)精确地引入到基因组中以改变代谢路径通常是有用的。所述变化还可以用于引入、删除或置换较大的基因材料区域,诸如启动子、终止子、基因或甚至基因集群。
通过序列同源性,这些crRNA将Cas核酸酶引导到指定的外源性基因材料,其还必须含有称为前间区序列邻近基序(protospacer adjacent motif,PAM)的核酸酶特异性序列。CRISPR复合物结合到外来DNA并且使其分解。
在本文所提供的一个方面中,含有产生所关注分子或生物的所关注代谢路径的真菌(例如如本文所提供的丝状真菌)的宿主或亲本菌株可以通过CRISPR修饰。在一个实施例中,能够转化的原生质体是使用本文所提供的原生质体产生方法自宿主或亲本菌株产生,并且用核糖核蛋白复合物(RNP-复合物或CRISPR RNP)转化。RNP-复合物包括如本文所提供的核酸引导的核酸酶(例如Cas9),其与如本文所提供的向导核酸(例如向导RNA(gRNA))复合。当由RNA引导时,核酸引导的核酸酶可在本文中称为RNA引导的核酸酶或RNA引导的核酸内切酶。向导核酸(例如gRNA)可包括靶向区段,其为与存在于真菌(例如如本文所提供的丝状真菌)的宿主或亲本菌株中的目标基因或核酸序列的部分互补的向导序列。在一个实施例中,原生质体可以用2种或更多种RNP-复合物转化,以使得每一RNP-复合物包括与向导核酸(例如gRNA)复合的核酸引导的核酸内切酶(例如Cas9)。在一些情况下,2种或更多种RNP-复合物中的每一向导核酸(例如gRNA)可包括与不同目标基因或核酸序列互补的向导序列。在一些情况下,2种或更多种RNP-复合物中的每一向导核酸(例如gRNA)可包括相同目标基因或核酸序列的向导序列。在存在3种或更多种RNP-复合物的情况下,可以存在可以包括与相同目标基因或核酸序列互补的向导序列的RNP-复合物的子集,和可以包括与不同目标基因或核酸互补的向导序列的RNP-复合物的一或多个子集。在2种或更多种RNP-复合物经由其各自的靶向区段引导到相同目标核酸序列的情况下,RNP-复合物中的每一种可以包括与所述目标基因或核酸的不同或分开的部分互补的向导序列或靶向区段。此外,对于这些实施例,靶向多个基因座的多个gRNA可以在同一细胞或生物体中表达(gRNA的多重表达)。综合gRNA文库可用于鉴别对于给定表型重要的基因。当前文库可用于基因敲除,以及转录活化或抑制。与下一代定序的能力组合,CRISPR可为用于全基因组筛选的稳固系统。每一gRNA可包括黏接到转录活化crRNA(tracrRNA)的CRISPR RNA(crRNA)或可包括单一gRNA(sgRNA),其包括有包括crRNA及tracrRNA的单一转录物。
在一个实施例中,宿主或亲本真菌具有起作用的NHEJ路径。另外,对这种实施例,衍生自具有单一RNP-复合物或多个RNP-复合物的宿主或亲本真菌的原生质体的转化产生基因组中的目标基因内的股断裂,其通过NHEJ路径修复。使用NHEJ路径的修复可引起目标基因内的插入缺失。目标基因中的插入缺失可以产生引起所靶向基因的开放阅读框架(ORF)内的终止密码子过早的氨基酸缺失、插入或移码突变。在另一实施例中,可以通过使用同源性导向修复(HDR)来修复目标基因内的股断裂。HDR介导的修复可以通过用供体DNA序列共转化衍生自宿主或亲本真菌的原生质体来促进。供体DNA序列可包括所要的基因扰动(例如缺失、插入和/或单核苷酸多形现象)。在这个实施例中,RNP使由一或多种gRNA指定的目标基因分解。供体DNA可以接着用作同源重组机构的模板以并入用于修饰所关注的代谢路径或分子/生物的所要基因扰动。供体DNA可以是单股的、双股的或双股质体。供体DNA可以缺乏PAM序列或包括加扰、改变或非功能性PAM以便防止再裂解。在一些情况下,供体DNA可含有功能性或非改变的PAM位点(参见图56A-B)。供体DNA中的突变或编辑序列(还通过同源性区域侧接)在突变已经并入到基因组中之后防止通过RNP的再裂解。在一些实施例中,HDR路径可通过在衍生自不具有起作用的NHEJ路径的宿主或亲本真菌的原生质体中进行转化而为有利的。可使用本文中所提供的方法中的任一种来实现停用NHEJ路径。
在一些实施例中,原生质体可以用RNP复合物、供体DNA和包括可选标记物的载体共转化。载体可通过实现仅在转化上胜任的原生质体的鉴别和/或存活而与其它组分相互作用。这可促进经转化的和正确编辑的菌株的鉴别。编辑的迭代轮回是可能的,因为质体可以被固化。参见图53。
除以上实施例以外,本文所提供的方法中使用的核酸引导的核酸酶可以是所属领域中已知和/或本文提供的核酸引导的核酸酶中的任一种。在一个实施例中,核酸引导的核酸酶为2类CRISPR-Cas系统核酸引导的核酸酶。2类CRISPR-Cas系统核酸引导的核酸酶可以选自以下中的任何一或多种:如本文所述的II型、IIA型、IIB型、IIC型、V型和VI型核酸引导的核酸酶。2类CRISPR-Cas系统核酸引导的核酸酶可以是以下中的任何一或多种:Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物、突变体、变异体或经修饰型式。
适合于基因设计的生物体
所揭示的HTP基因组工程改造平台虽然以工业微生物细胞培养物(例如黑曲霉(A.niger))为例说明,但是适用于任何多核体宿主细胞生物体,其中可以在基因突变体群体中鉴别出所要特点。
此外,如引言中所阐述,本发明提供HTP基因组工程改造平台以改良丝状真菌系统中的宿主细胞特征,并且解决先前阻碍所述系统非丝状真菌的开发的许多问题。
因此,如本文所用,术语“微生物”应在广义上理解。其包含(但不限于)两个原核域:细菌和古细菌,以及某些真核真菌和原生生物。然而,在某些方面中,本文教示的方法中可以使用“更高级”真核生物体,诸如昆虫、植物和动物。
适合的宿主细胞包含(但不限于):细菌细胞、藻类细胞、植物细胞、真菌细胞、昆虫细胞和哺乳动物细胞。在一个说明性实施例中,适合的宿主细胞包含黑曲霉。
在一个实施例中,本文所提供的方法和系统使用衍生自丝状真菌的真菌元件,其能够在培养基中容易地与其它所述元件分离,并且能够复制自身。例如真菌元件可以是孢子、繁殖体、菌丝片段、原生质体或微集结粒。在一个优选实施例中,本文所提供的系统和方法利用衍生自丝状真菌的原生质体。适合的丝状真菌宿主细胞包含(例如)子囊菌门(Ascomycota)、半知菌门(Deuteromycota)、接合菌门(Zygomycota)或半知菌(Fungiimperfecti)门的任何丝状形式。适合的丝状真菌宿主细胞包含(例如)真菌门(Eumycotina)亚门的任何丝状形式。(参见例如霍克索斯(Hawksworth)等人,于恩索斯(Ainsworth)和毕丝巴(Bisby)的真菌词典,第8版,1995年,CAB国际,大学出版社,英国剑桥,所述文献以引用的方式并入本文中)。在某些说明性但非限制性的实施例中,丝状真菌宿主细胞可以是以下物种的细胞:棉霉属(Achlya)、枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢霉属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球酵母属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内斯菌属(Endothis)、线黑粉酵母属(Filibasidium)、镰孢菌属(Fusarium)、赤霉属(Gibberella)、胶霉属(Gliocladium)、腐殖菌属(Humicola)、肉座菌属(Hypocrea)、毁丝菌属(Myceliophthora)(例如嗜热毁丝霉(Myceliophthora thermophila))、白霉菌属(Mucor)、红霉菌属(Neurospora)、青霉属(Penicillium)、柄孢壳属(Podospora)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨胞霉属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂殖菌属(Schizophyllum)、革节孢属(Scytalidium)、孢子丝菌属(Sporotrichum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、栓菌属(Tramates)、弯颈霉菌属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella),或其有性世代或无性世代,以及其同义词或分类等效物。在一个实施例中,丝状真菌选自由以下组成的群组:构巢曲霉(A.nidulans)、米曲霉(A.oryzae)、酱油曲霉(A.sojae),和黑曲霉群组的曲霉菌(Aspergilli)。在一个优选实施例中,丝状真菌为黑曲霉(Aspergillus niger)。
在一个实施例中,丝状真菌为选自以下的生产菌株:臭曲霉ACM 3996(Aspergillus foetidus ACM 3996)(=FRR 3558)、稻热病菌Guy-11(Magnaporthe griseaGuy-11)或黄孢原毛平革菌RP78(Phanerochaete chrysosporium RP78)。在分开的实施例中,丝状真菌为所属领域中已知的黑曲霉生产菌株。本文所提供的方法中使用的黑曲霉生产菌株的实例可包含黑曲霉ATCC 11414、ATCC 1015、ACM 4992(=ATCC 9142)、ACM 4993(=ATCC 10577)、ACM 4994(=ATCC 12846)、ATCC26550、ATCC 11414、N402、CBS 513.88或NRRL3(ATCC 9029、CBS 120.49)。
在本发明的另一个实施例中,本文提供的方法和系统使用真菌物种的特定突变体。在一个实施例中,使用真菌物种的特定突变体,其适用于本文所提供的高通量和/或自动化方法和系统。所述突变体的实例可以是非常良好地形成原生质体的菌株;主要或更优选仅产生具有单一核的原生质体的菌株;在微量滴定板中高效再生的菌株;再生更快的菌株和/或高效吸收聚核苷酸(例如DNA)分子的菌株;产生低粘度培养物的菌株,例如在培养物中产生菌丝的细胞,所述菌丝的缠结不会阻碍单一克隆的分离和/或提高培养物的粘度;随机整合减少的菌株(例如失能的非同源末端接合路径);或其组合。在又一实施例中,供本文所提供的方法和系统使用的特定突变体菌株可以是缺乏可选标记物基因的菌株,例如需要尿苷的突变体菌株。这些突变体菌株可以缺乏分别由pyrG或pyrE基因编码的乳清酸核苷5磷酸脱羧酶(OMPD)或乳清酸对核糖基转移酶(OPRT)(T.古森(T.Goosen)等人,现代遗传学,1987,11:499 503;J.贝格瑞特(J.Begueret)等人,基因,1984 32:487 92。
在一个实施例中,供本文所提供的方法和系统使用的特定突变体菌株是具有致密细胞形态的菌株,其特征为菌丝较短和更加酵母样的外观。所述突变体的实例可以是如US20140220689中所描述具有改变的gas1表达的丝状真菌细胞。
在再一实施例中,供本文所提供的方法和系统使用的突变型菌株在其DNA修复系统中经过修饰,其方式为使得其在同源重组中极高效和/或在随机整合中极低效。核酸构筑体通过同源重组靶向整合到宿主细胞的基因组中(即在预定目标基因座中整合)的效率可以通过宿主细胞增强的同源重组能力和/或减弱的非同源重组能力增加。同源重组的增强可以通过过度表达涉及同源重组的一或多种基因(例如Rad51和/或Rad52蛋白质)来实现。本发明的宿主细胞中的非同源重组或非同源末端接合(NHEJ)路径的去除、破坏或减少可以通过所属领域中已知的任何方法实现,例如通过使用针对非同源重组(NHR)或NHEJ路径之组分(例如酵母KU70、酵母KU80或其同系物)的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子。可使用化学抑制剂实现NHEJ路径的抑制,所述化学抑制剂诸如阿拉斯SMD(Arras SMD),弗雷泽JA(Fraser JA)(2016),“非同源末端接合的化学抑制剂增加新型隐球菌中的靶向构筑体整合(Chemical Inhibitors of Non-Homologous EndJoining Increase Targeted Construct Integration in Cryptococcus neoformans)”公共科学图书馆·综合11(9):e0163049中所描述,其内容以引用的方式并入本文中。用化学抑制剂处理以促进停用或减少NHEJ路径可以在产生原生质体之前和/或期间进行。或者,用于本文中所提供的方法的宿主细胞可能缺乏NHR路径的一或多个基因(例如酵母ku70、ku80或其同系物)。所述突变体的实例为如WO 05/95624中所描述的缺乏hdfA或hdfB基因的细胞。用于抑制本文所提供的方法中所用的宿主细胞中的NHR的化学抑制剂的实例可以是W7、氯丙嗪、香草精、Nu7026、Nu7441、味淋、SCR7、AG14361或其组合,如阿拉斯SDM等人(2016)非同源末端接合的化学抑制剂增加新型隐球菌中的靶向构筑体整合,公共科学图书馆·综合11(9)中所描述。
在一个实施例中,本文所提供的方法和系统中使用的丝状真菌细胞的突变型菌株具有停用或减少的非同源末端接合(NHEJ)路径并且在培养物(例如浸没培养物)中生长时具有酵母样非菌丝体形成表型。
在另一实施例中,本文所提供的方法和系统中使用的丝状真菌细胞由于用化学抑制剂(例如W7、氯丙嗪、香草精、Nu7026、Nu7441、味淋、SCR7、AG14361或其任何组合)具有停用或减少的NHEJ路径,并且在培养物(例如浸没培养物)中生长时具有酵母样非菌丝体形成表型。在一个实施例中,化学抑制剂为W7。如在图29中所反映,丝状真菌宿主细胞(例如黑曲霉)可以用最低抑制浓度(MIC)的W7(其可以是宿主菌株依赖型的)处理。
在一些实施例中,孢子、繁殖体、菌丝片段、原生质体或微集结粒被分离成克隆群体。在一些实施例中,孢子、繁殖体、菌丝片段、原生质体或微集结粒在分离之前经转化。在一些实施例中,孢子、繁殖体、菌丝片段、原生质体或微集结粒在微量滴定板或微量滴定孔中被分离成克隆群体。此外,对于以上实施例,克隆群体衍生自单一孢子、繁殖体、菌丝片段、原生质体或微集结粒。在一些实施例中,孢子、繁殖体、菌丝片段、原生质体或微集结粒呈稀释溶液形式,且仅将单一孢子、繁殖体、菌丝片段、原生质体或微集结粒转移到微量滴定板或孔中。在一些实施例中,孢子、繁殖体、菌丝片段、原生质体或微集结粒稀释到其可以光学上区分为单一孢子、繁殖体、菌丝片段、原生质体或微集结粒的浓度,接着将其单独转移到微量滴定板或孔中。在一些实施例中,孢子、繁殖体、菌丝片段、原生质体或微集结粒使用泊松分布(Poisson distribution)稀释,其中存在将仅一个孢子、繁殖体、菌丝片段、原生质体或微集结粒转移到微量滴定板或孔中的统计概率。在一些实施例中,孢子、繁殖体、菌丝片段、原生质体或微集结粒转移到任何容器,包含微量滴定板或孔。在一些实施例中,通过CellenONE、伯克利灯标仪器(Berkeley Lights Beacon instrument)、FACS机、Cytena或其它类似仪器来进行光学区别。用于分离本文所提供的方法中使用的单个孢子、繁殖体、菌丝片段、原生质体或微集结粒的工作流程的实例可见于图54B。除以上实施例中的任一个以外,孢子、繁殖体、菌丝片段、原生质体或微集结粒可来自本文所提供的任何真菌细胞。在一个实施例中,真菌细胞为丝状真菌细胞。丝状真菌细胞可以是本文所提供的丝状真菌细胞,例如黑曲霉。
产生基因多样性池供基因设计和HTP微生物工程改造平台使用
在一些实施例中,本发明的方法的特征为基因设计。如本文所用,术语基因设计是指通过鉴别和选择特定基因的最佳变异体、基因的部分、启动子、终止密码子、5'UTR、3'UTR或其它DNA序列来重建或改变宿主生物体基因组,以设计和产生新的优良宿主细胞。
在一些实施例中,本发明的基因设计方法中的第一步骤是获得具有多种序列变异的初始基因多样性池群体,自其可以重建新的宿主基因组。
在一些实施例中,本文所教示的基因设计方法中的后续步骤将使用前述HTP分子工具集(例如SNP交换或启动子交换)中的一或多种构筑HTP基因设计文库,所述HTP基因设计文库接着通过提供用于在宿主细胞中测试的特定基因组改变文库来充当基因组工程改造过程的驱动器。
自现有野生型菌株获取多样性池
在一些实施例中,本发明教示了用于鉴别所给定野生型群体的微生物当中所存在的序列多样性的方法。因此,多样性池可以是用于分析的野生型微生物的给定编号n,其中所述微生物基因组表示“多样性池”。
在一些实施例中,多样性池可以是所述野生型微生物当中的天然基因变异中所存在的现有多样性的结果。这种变异可以由所给定宿主细胞的菌株变异体产生或可以是微生物是完全不同物种的结果。基因变异可以包含菌株基因序列的任何差异,不论是否是天然存在的。在一些实施例中,基因变异尤其可以包含SNP交换、PRO交换、起始/终止密码子交换,或STOP交换。
自现有工业菌株变异体获取多样性池
在本发明的其它实施例中,多样性池是在传统菌种选育过程中所产生的菌株变异体(例如通过随机突变而产生且多年来选用于提高产量的一或多种宿主生物体菌株)。因此,在一些实施例中,多样性池或宿主生物体可以包括历史上生产菌株的集合。
在特定方面,多样性池可以是原始亲本微生物菌株(S1),其在特定时间点具有“基线”基因序列(S1Gen1);且接着是衍生/发展自所述S1菌株和相对于S1的基线基因组具有不同基因组(S2-nGen2-n)的任何数目的后续子代菌株(S2、S3、S4、S5等,可归纳为S2-n)。
举例来说,在一些实施例中,本发明教示了对多样性池中的微生物基因组进行定序以鉴别每一菌株中存在的SNP。在一个实施例中,多样性池中的菌株是历史上微生物生产菌株。因此,本发明的多样性池可以包含(例如)工业基本菌株,和通过传统菌种选育程序所产生的一或多种突变型工业菌株。
一旦鉴别出多样性池中的所有SNP,本发明便教示用SNP交换方法和筛选方法描述(即量化和表征)单独的和群组中的SNP的效应(例如所关注的表型的产生)。因此,如前所述,所教示平台中的初始步骤可以是获得具有多种序列变异(例如SNP)的初始基因多样性池群体。接着,所教示平台中的后续步骤可以是使用一或多种前述HTP分子工具集(例如SNP交换)构筑HTP基因设计文库,其接着通过提供用于在微生物中测试的特定基因组改变文库来充当基因组工程改造过程的驱动器。
在一些实施例中,本发明的SNP交换方法包括将在突变型菌株(例如来自S2-nGen2-n的菌株)中所鉴别的一或多种SNP引入基本菌株(S1Gen1)或野生型菌株的步骤。
在其它实施例中,本发明的SNP交换方法包括将在突变型菌株(例如来自S2-nGen2-n的菌株)中所鉴别的一或多种SNP去除的步骤。
通过突变诱发来产生多样性池
在一些实施例中,所给定多样性池细胞群体中的所关注突变可以利用使菌株发生突变的任何方式(包含突变诱发化学品或辐射)人工产生。术语“突变诱发”在本文中用于指一种诱导细胞核酸材料中发生一或多种基因修饰的方法。
术语“基因修饰”是指DNA的任何改变。代表性基因修饰包含核苷酸插入、缺失、取代以及其组合,且可以小如单个碱基或大如数万个碱基。因此,术语“基因修饰”涵盖核苷酸序列的倒位和其它染色体重排,从而改变包括染色体区域的DNA的位置或方向。染色体重排可以包括染色体内重排或染色体间重排。
在一个实施例中,本发明所主张标的中所用的突变诱发方法大体上是随机的,以便基因修饰能够在待突变诱发的核酸材料内的任何可用核苷酸位置发生。换句话说,在一个实施例中,突变诱发不展示在特定核苷酸序列处发生的偏好或频率的增加。
本发明的方法可以使用任何突变诱发剂,包含(但不限于):紫外光、X射线辐射、γ辐射、N-乙基-N-亚硝基脲(ENU)、甲基亚硝基脲(MNU)、甲基苄肼(procarbazine)(PRC)、三亚乙基三聚氰胺(TEM)、丙烯酰胺单体(AA)、苯丁酸氮芥(CHL)、美法仑(melphalan,MLP)、环磷酰胺(CPP)、硫酸二乙酯(DES)、甲烷磺酸乙酯(EMS)、甲烷磺酸甲酯(MMS)、6-巯基嘌呤(6-MP)、丝裂霉素-C(MMC)、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、3H2O和氨基甲酸酯(UR)(参见例如林奇克(Rinchik),1991;马克(Marker)等人,1997;和拉塞尔(Russell),1990)。额外突变诱发剂已为所属领域的技术人员所熟知,包含http://www.iephb.nw.ru/~spirov/hazard/mutagen_lst.html中所述的那些。
术语“突变诱发”还涵盖了用于改变(例如通过靶向突变)或调节细胞功能以由此增强突变诱发速率、质量或程度的方法。举例来说,可以改变或调节细胞,以由此使其在DNA修复、诱变剂代谢、诱变剂敏感性、基因组稳定性或其组合方面出现功能异常或不足。因此,破坏通常维持基因组稳定性的基因功能可以用于增强突变诱发。破坏的代表性目标包含(但不限于)DNA连接酶I(本特雷(Bentley)等人,2002)和酪蛋白激酶I(美国专利第6,060,296号)。
在一些实施例中,使用定点突变诱发(例如使用市售试剂盒(诸如转化者定点突变诱发试剂盒(Transformer Site Directed mutagenesis kit)(克隆科技公司(Clontech)))进行的引物定向突变诱发)在整个核酸序列中产生多种变化,以便产生编码本发明的裂解酶的核酸。
暴露于一或多种突变诱发剂后发生基因修饰的频率可以通过改变处理剂量和/或重复次数来调节,且可以根据具体应用来定制。
因此,在一些实施例中,如本文所用,“突变诱发”包括所属领域中已知的用于诱导突变的所有技术,包含易错PCR突变诱发、寡核苷酸定向突变诱发、定点突变诱发,以及利用本文所述的任何技术进行的迭代序列重组。
产生多样性的单一基因座突变
在一些实施例中,本发明教示了通过引入、删除或置换基因组DNA的所选部分来使细胞群体发生突变。因此,在一些实施例中,本发明教示了针对特定基因座靶向突变的方法。在其它实施例中,本发明教示了利用基因编辑技术(诸如ZFN、TALENS或CRISPR)选择性地编辑目标DNA区域。
在其它实施例中,本发明教示了使宿主生物体外部的所选DNA区域发生突变且接着将突变序列插回到宿主生物体中。举例来说,在一些实施例中,本发明教示了使原生或合成启动子发生突变,以产生具有各种表达特性的一系列启动子变异体(参见下文的启动子梯)。在其它实施例中,本发明与单基因优化技术兼容,诸如ProSAR(福克斯(Fox)等人,2007,“通过ProSAR驱动型酶演变来改良催化功能(Improving catalytic function byProSAR-driven enzyme evolution)”,自然生物技术(Nature Biotechnology)第25卷(3)338-343,所述文献以引用的方式并入本文中)。
在一些实施例中,DNA的所选区域是活体外通过天然变异体的基因改组或用合成寡核苷酸改组、质体-质体重组、病毒质体重组、病毒-病毒重组来产生。在其它实施例中,基因组区域通过易错PCR产生。
在一些实施例中,在所选基因区域中产生突变是通过“再组装PCR”实现。简单来说,合成寡核苷酸引物(寡核苷酸)用于对所关注的核酸序列区段进行PCR扩增,以便寡核苷酸的序列与两个区段的接合区重叠。重叠区域的长度典型地是约10到100个核苷酸。每一区段用一组所述引物扩增。接着根据组装方案“再组装”PCR产物。简单来说,在组装方案中,首先通过例如凝胶电泳或尺寸排阻层析从引物中纯化PCR产物。将纯化的产物混合在一起,且在聚合酶和去氧核苷三磷酸酯(dNTP)和合适缓冲盐的存在下,在不存在额外引物的情况下(“自引导”)经历约1到10个循环的变性、再粘接和延伸。使用其中引物侧接基因的后续PCR扩增经彻底再组装和改组的基因的产量。
在本发明的一些实施例中,突变的DNA区域(诸如上文所论述的那些)中富集了突变序列,从而更高效地对多个突变范围(即可能的突变组合)取样。在一些实施例中,通过mutS蛋白质亲和力基质(瓦格纳(Wagner)等人,核酸研究(Nucleic Acids Res.)23(19):3944-3948(1995);苏(Su)等人,美国国家科学院院刊(Proc.Natl.Acad.Sci.(U.S.A.)),83:5057-5061(1986))鉴别突变序列,其中优选在组装反应之前活体外扩增亲和性纯化材料的步骤。接着将此扩增材料置于组装或再组装PCR反应中,如本申请的后续部分中所述。
启动子梯
启动子调节基因转录的速率且可以通过多种方式影响转录。举例来说,不论内部或外部细胞条件,组成性启动子均引导其关联基因以恒定速率转录,而可调节、可调谐或可诱导型启动子却取决于内部和/或外部细胞条件提高或降低基因转录的速率,所述条件例如生长速率、温度、对特定环境化学品的响应等。启动子可以从其正常细胞情境中分离出来且经工程改造以调节几乎任何基因的表达,从而能够有效修改细胞生长、产物产量和/或所关注的其它表型。
启动子序列可以可操作地连接到本文所提供的待在如本文所提供的丝状真菌宿主细胞中表达的任何序列的5'末端。多种已知真菌启动子可能在本发明的宿主菌株中具有功能性,例如以下的启动子序列:C1内切葡聚糖酶、55kDa纤维二糖水解酶(CBH1)、甘油酸-3-磷酸去氢酶A、来自金孢霉属的卢氏金孢霉(C.lucknowense)GARG 27K和30kDa木聚糖酶(Xy1F)启动子,以及例如以下中所描述的曲霉启动子:美国专利第4,935,349号;第5,198,345号;第5,252,726号;第5,705,358号;和第5,965,384号;以及PCT申请WO 93/07277。在一个实施例中,本文所提供的方法和系统中使用的启动子为可诱导型启动子。可诱导型启动子可以是转录活性受存在或不存在化学物质(例如醇、四环素、类固醇、金属或所属领域中已知的其它化合物)调节的任何启动子。可诱导型启动子可以是转录活性受存在或不存在光或低或高温调节的任何启动子。在一个实施例中,可诱导型启动子选自丝状真菌基因,诸如srpB基因、amyB基因、manB基因或mbfA基因。在一个实施例中,可诱导型启动子选自表1中列出的启动子。在一个实施例中,可诱导型启动子是由葡萄糖抑制的分解代谢物。由葡萄糖抑制的分解代谢物可以是来自米曲霉的amyB启动子(参见图37)。
在一些实施例中,本发明教示了用于产生启动子梯文库以供下游基因设计方法使用的方法。举例来说,在一些实施例中,本发明教示了鉴别一或多种启动子和/或在宿主细胞内产生一或多种启动子的变异体的方法,所述变异体展示了一定范围的表达强度或优良的调节特性。所鉴别和/或产生的这些启动子的特定组合可以作为启动子梯分组在一起,其更详细地解释于下文。
在一些实施例中,本发明教示了启动子梯的使用。在一些实施例中,本发明的启动子梯包括展示连续范围的表达曲线的启动子。举例来说,在一些实施例中,通过鉴别响应于刺激而展示一定范围的表达强度的天然、原生或野生型启动子,或通过组成性表达来产生启动子梯(参见例如图13)。这些所鉴别的启动子可以作为启动子梯分组在一起。
在其它实施例中,本发明教示了启动子梯的产生,所述启动子梯跨越不同条件展示一定范围的表达曲线。举例来说,在一些实施例中,本发明教示了启动子梯的产生,所述启动子梯具有遍布在发酵的不同阶段的表达峰。在其它实施例中,本发明教示了启动子梯的产生,所述启动子梯响应于特定刺激具有不同表达峰动力学(参见例如图13)。所属领域的技术人员将认识到,本发明的调节性启动子梯可以代表任何一或多种调节曲线。
在一些实施例中,本发明的启动子梯经设计以可预测的方式、跨越响应的连续范围扰动基因表达。在一些实施例中,启动子梯的连续性质赋予菌种选育程序额外的预测能力。举例来说,在一些实施例中,交换选定代谢或信令路径的启动子或终止序列可以产生宿主细胞性能曲线,其标识最佳表达率或曲线;产生其中靶向基因不再是特定反应或基因级联的限制因素的菌株,同时还避免了在不适当情形下的不必要过度表达或错误表达。可以选择的示例信令路径可以是已经识别为或疑似在控制或影响宿主细胞形态中起作用的信令路径。因此,在一些实施例中,交换展示或疑似控制或影响形态的基因的启动子可产生关于形态的宿主细胞性能曲线,其标识用于在所要生长条件下产生具有所要集结粒形态的菌株或宿主细胞的特定基因的最佳表达率或曲线;产生其中靶向基因不再是特定反应或基因级联的限制因素的菌株,同时还避免了在不适当情形下的不必要过度表达或错误表达。展示或疑似控制或影响形态的基因的实例可以是所属领域中已知或本文中提供的任何所述基因。在一些实施例中,启动子梯如下产生:鉴别展示所要曲线的天然、原生或野生型启动子。在其它实施例中,通过使天然存在的启动子发生突变以衍生多种突变启动子序列来产生启动子梯。测试这些突变启动子中的每一种对目标基因表达的影响。在一些实施例中,测试经编辑的启动子跨越多种条件的表达活性,以便记录/表征/注释每一启动子变异体的活性且存储于数据库中。随后将所得经编辑的启动子变异体组织成基于其表达强度而排列的启动子梯(例如其中高表达性变异体靠近顶部,且减弱的表达靠近底部,因此产生术语“梯”)。
在一些实施例中,本发明教示了是所鉴别的天然存在的启动子与突变变异体启动子的组合的启动子梯。
在一些实施例中,本发明教示了鉴别满足以下两个标准的天然、原生或野生型启动子的方法:1)表示组成性启动子梯;和2)可以由短DNA序列(理想地小于100个碱基对)编码。在一些实施例中,本发明的组成性启动子展示跨越两种所选生长条件的恒定基因表达(典型地在工业培养期间所经历的条件间进行比较)。在一些实施例中,本发明的启动子将由约60个碱基对核心启动子和长度在26与40个碱基对之间的5'UTR组成。
在一些实施例中,选择前述所鉴别的天然存在的启动子序列中的一或多种用于基因编辑。在一些实施例中,通过上文所述的任一种突变方法编辑天然启动子。在其它实施例中,本发明的启动子是通过合成具有所要序列的新启动子变异体来编辑。
2015年12月7日提交的美国专利申请第62/264,232号和2016年12月7日申请的国际申请第PCT/US2016/06564号的全部揭示内容出于所有目的以全文引用的方式并入本文中。
本发明启动子的非穷尽性清单提供于下表1中。启动子序列中的每一种可以称为异源启动子或异源启动子聚核苷酸。
表1.本发明的所选启动子序列。
SEQ ID NO: 启动子简称 启动子名称
1 manBp 来自黑曲霉的manB启动子
2 amyBp 来自米曲霉(Aspergillus oryzae)的amyB基因
3 srpBp 来自黑曲霉的srpB启动子
4 mbfAp 来自黑曲霉的mbfA启动子
在一些实施例中,本发明的启动子展示与来自上表1的启动子至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%或75%的序列一致性。
终止子梯
在一些实施例中,本发明教示了通过在RNA编码元件末端的位置3'提供一或多种转录终止序列来改良经基因工程改造的宿主菌株的方法。在一些实施例中,本发明教示了添加终止序列提高在经基因工程改造的宿主中所选基因的RNA转录效率。在其它实施例中,本发明教示了添加终止序列降低在经基因工程改造的宿主中所选基因的RNA转录效率。因此,在一些实施例中,本发明的终止子梯包括展示一定范围的转录效率的一连串终止序列(例如一个弱终止子、一个普通终止子和一个强启动子)。
转录终止序列可以是任何核苷酸序列,其当以转录方式放置于编码开放阅读框架的核苷酸序列的下游时,使得开放阅读框架的转录终止。所述序列在所属领域中已知且可以具有原核、真核或噬菌体来源。终止序列的实例包含(但不限于)PTH终止子、pET-T7终止子、
Figure BDA0002305131530000841
终止子、pBR322-P4终止子、水疱性口炎病毒终止子、rrnB-T1终止子、rrnC终止子、TTadc转录终止子,以及酵母识别的终止序列,诸如Matα(α因子)转录终止子、原生α因子转录终止序列、ADR1转录终止序列、ADH2转录终止序列和GAPD转录终止序列。转录终止子序列的非穷尽性清单可以见于iGEM注册表,其可获得于:http://partsregistry.org/Terminators/Catalog。
在一些实施例中,转录终止序列可以具有聚合酶特异性或非特异性,然而,选用于本发明实施例中的转录终止子应该与所选启动子形成‘功能性组合’,这意味着终止子序列应该能够通过在启动子起始的RNA聚合酶类型来终止转录。举例来说,在一些实施例中,本发明教示了真核RNA pol II启动子和真核RNA pol II终止子、T7启动子和T7终止子、T3启动子和T3终止子、酵母识别的启动子和酵母识别的终止序列等通常会形成功能性组合。所用转录终止序列的一致性也可以基于从所给定启动子终止转录的效率来选择。举例来说,异源转录终止子序列可以转录方式提供于RNA编码元件的下游,以实现从所给定启动子至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的终止效率。
在一些实施例中,从经工程改造的表达构筑体RNA转录的效率可以通过提供形成二级结构的核酸序列来提高,所述二级结构在RNA编码元件末端的位置3'包括两个或两个以上发夹。不希望受到特定理论的束缚,二级结构使转录延伸复合物不稳定且使得聚合酶从DNA模板分离,由此使非功能性序列的非生产性转录最小化且增加所要RNA的转录。相应地,可以提供形成包括两个或两个以上相邻发夹的二级结构的终止序列。一般来说,发夹可以由回文核苷酸序列形成,所述回文核苷酸序列可以回折于自身而形成成对的茎区,所述茎区的臂通过单股环来连接。在一些实施例中,终止序列包括2、3、4、5、6、7、8、9、10个或更多个相邻发夹。在一些实施例中,相邻发夹相隔0、1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个不成对核苷酸。在一些实施例中,发夹茎长度包括4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个碱基对。在某些实施例中,发夹茎长度是12到30个碱基对。在某些实施例中,终止序列包括两个或两个以上中等尺寸的发夹,其具有包括约9到25个碱基对的茎区。在一些实施例中,发夹包括1、2、3、4、5、6、7、8、9或10个核苷酸的成环区域。在一些实施例中,成环区域包括4到8个核苷酸。不希望受到特定理论的束缚,二级结构的稳定性可以与终止效率相关。发夹稳定性由其长度、其所含的错配或凸起数目以及成对区域的碱基组成决定。鸟嘌呤与胞嘧啶之间的配对具有三个氢键且比仅具有两个氢键的腺嘌呤-胸腺嘧啶对更稳定。形成发夹的回文核苷酸序列的G/C含量可以是至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或更大。在一些实施例中,形成发夹的回文核苷酸序列的G/C含量是至少80%。在一些实施例中,终止序列衍生自具有原核、真核或噬菌体来源的一或多种转录终止子序列。在一些实施例中,编码一连串4、5、6、7、8、9、10个或更多个腺嘌呤(A)的核苷酸序列提供于终止序列的3'处。
在一些实施例中,本发明教示了一连串串联终止序列的用途。在一些实施例中,一连串2、3、4、5、6、7或更多个的第一转录终止子序列可以直接放置于dsRNA编码元件的最终核苷酸的3'处或与dsRNA编码元件的最终核苷酸的3'处相隔至少1到5、5到10、10到15、15到20、20到25、25到30、30到35、35到40、40到45、45到50、50到100、100到150、150到200、200到300、300到400、400到500、500到1,000或更多个核苷酸的距离。串联转录终止子序列之间的核苷酸数目可以不同,例如转录终止子序列可以相隔0、1、2、3、4、5、6、7、8、9、10、10到15、15到20、20到25、25到30、30到35、35到40、40到45、45到50或更多个核苷酸。在一些实施例中,转录终止子序列可以基于其预测二级结构(如通过结构预测算法所测定)来选择。结构预测程序在所属领域中是熟知的且包含(例如)CLC主工作台(CLC Main Workbench)。
所属领域的技术人员将认识到本发明的方法与任何终止序列兼容。本发明的转录终止子序列的非穷尽性清单提供于下表1.1中。在一个实施例中,本发明的转录终止子可以是表1.1中所提供的终止序列的直系同源物。举例来说,如果宿主细胞为曲霉,那么终止序列可以是选自表1.1的非曲霉终止序列的直系同源物。
表1.1.本发明的终止序列的非穷尽性清单。
Figure BDA0002305131530000861
假设驱动型多样性池和爬山法
本发明教示了本发明的HTP基因组工程改造方法不需要先验基因了解来实现宿主细胞性能的显著增加。实际上,本发明教示了通过功能上不可知的若干种方法(包含随机突变诱发和鉴别预先存在的宿主细胞变异体当中的基因多样性(诸如在野生型宿主细胞与工业变异体之间的比较))产生多样性池的方法。
然而,在一些实施例中,本发明还教示了设计用于下游HTP工程改造的基因多样性突变的假设驱动型方法。也就是说,在一些实施例中,本发明教示了选定突变的定向设计。在一些实施例中,将定向突变并入本发明的工程改造文库(例如SNP交换、PRO交换或STOP交换)中。
在一些实施例中,本发明教示了基于基因注释、假设(或证实)的基因功能或基因组内的位置来产生定向突变。本发明的多样性池可以包含假设涉及在文献中与宿主细胞的性能提高相关的特定代谢或基因路径的基因中的突变。在其它实施例中,本发明的多样性池还可以包含与宿主性能改良相关的基因的突变。在另外其它实施例中,本发明的多样性池还可以包含基于算法预测功能或其它基因注释的基因的突变。
在一些实施例中,本发明教示了用于对假设驱动型突变的目标进行优先级排序的基于“壳”的方法。目标优先级排序的壳隐喻是基于如下假设:仅少数初始基因负责宿主细胞性能的大部分特定方面(例如单一生物分子的产生)。这些初始基因位于壳的核心处,继之为第二层中的二级效应基因、第三壳中的三级效应以及...等。举例来说,在一个实施例中,壳的核心可能包括编码选定代谢路径(例如柠檬酸的产生)内的关键生物合成酶的基因。位于第二壳上的基因可能包括编码负责产物转移或反馈信令的生物合成路径内的其它酶的基因。依据此说明性隐喻的第三层级基因可能会包括调节基因,其负责调节生物合成路径的表达或负责调节宿主细胞内的一般碳通量。
本发明还教示了用于优化来自每种所鉴别突变的性能增加的“爬山”方法。在一些实施例中,本发明教示了HTP多样性文库中的随机、天然或假设驱动型突变可以实现与宿主细胞性能相关的基因的鉴别。举例来说,本发明方法可以鉴别位于基因编码序列上或靠近基因编码序列的一或多种有益SNP。此基因可能与宿主细胞性能相关,且可以将其鉴别类比为在生物体的组合基因突变空间中发现性能“山”。
在一些实施例中,本发明教示了探索SNP突变中体现的所鉴别山周围的组合空间的方法。也就是说,在一些实施例中,本发明教示了扰动所鉴别的基因和相关调节序列以便优化获自所述基因节点的性能增加(即爬山)。因此,根据本发明的方法,首先可能在来源于随机突变诱发的多样性文库中鉴别出基因,但是基因随后可能通过相同基因内的另一序列的定向突变加以改良以供菌种选育程序使用。
爬山的概念还可以扩展超出单一基因序列周围的组合空间的探索。在一些实施例中,特定基因中的突变可能揭露特定代谢或基因路径对于宿主细胞性能的重要性。举例来说,在一些实施例中,单一RNA降解基因中的突变引起宿主性能显著增加的发现可以用作将使相关RNA降解基因发生突变作为从宿主生物体提取额外性能增益的方式的依据。所属领域的技术人员将认识到上文所描述的定向基因设计的壳和爬山方法的变化形式。
形态相关基因
本文所提供的方法、菌株和系统中使用的形态相关基因可以是所属领域中已知的已经展示或疑似在控制或影响丝状真核微生物(例如丝状真菌宿主细胞或菌株)的形态中起作用的任何基因。调节宿主细胞的形态的基因可以是如本文所提供的任何所述基因。在一个实施例中,基因为酿酒酵母SLN1的直系同源物。在另一实施例中,形态相关基因可以是来自与酿酒酵母SLN1基因的直系同源物相同的路径的任何基因。是相同路径的一部分的基因可以选自酿酒酵母Ypd1、Skn7、Ssk1和Ssk2基因的直系同源物或其任何组合。在另一实施例中,基因为具有核酸SEQ ID NO:11的黑曲霉基因的直系同源物,和/或与所述具有核酸SEQ ID NO:11的黑曲霉基因的直系同源物相同的生物化学路径中的任何基因。在另一实施例中,基因为具有核酸SEQ ID NO:12的黑曲霉基因的直系同源物,和/或与所述具有核酸SEQ ID NO:12的黑曲霉基因的直系同源物相同的生物化学路径中的任何基因。在另一实施例中,基因为具有核酸SEQ ID NO:14的黑曲霉基因的直系同源物,和/或与所述具有核酸SEQ ID NO:14的黑曲霉基因的直系同源物相同的生物化学路径中的任何基因。
本文所提供的方法、菌株和系统中使用的形态相关基因可以是所属领域中已知的已经展示或疑似在控制或影响黑曲霉的形态中起作用的任何基因。在一个实施例中,基因为具有选自SEQ ID NO:11、12、13或14的核酸序列的含有SNP的基因(参见表4)。在一个实施例中,基因为多个基因。多个基因可以是具有选自SEQ ID NO:11、12、13或14的核酸序列的含有SNP的基因的任何组合。多个基因可以是具有选自SEQ ID NO:11和任何存在于相同生物化学路径内的基因的核酸序列的含有SNP的基因的任何组合。多个基因可以是具有选自SEQ ID NO:12和任何存在于相同生物化学路径内的基因的核酸序列的含有SNP的基因的任何组合。多个基因可以是具有选自SEQ ID NO:13和任何存在于相同生物化学路径内的基因的核酸序列的含有SNP的基因的任何组合。多个基因可以是具有选自SEQ ID NO:14和任何存在于相同生物化学路径内的基因的核酸序列的含有SNP的基因的任何组合。在一个实施例中,基因为具有选自SEQ ID NO:11、12、13或14的核酸序列的基因的野生型或不含SNP型式(参见表4)。
在一个实施例中,调节黑曲霉宿主细胞的形态的基因为酿酒酵母SLN1基因的黑曲霉直系同源物。酿酒酵母SLN1基因的黑曲霉直系同源可以是野生型形式或突变型形式。酿酒酵母SLN1基因的黑曲霉直系同源物的突变形式可以是来自表4的真菌SNP_18或具有SEQID NO:13的核酸序列。在另一实施例中,形态相关基因可以是来自与酿酒酵母SLN1基因的黑曲霉直系同源物相同的路径的任何基因。是相同路径的一部分的基因可以选自酿酒酵母Ypd1、Skn7、Ssk1和Ssk2基因的黑曲霉直系同源物或其任何组合。是相同路径的一部分的基因可以选自由SEQ ID NO:15、16、17、18、19或其任何组合表示的核酸序列。
形态相关基因可以是戴(Dai)等人(“通过使用抑制消减杂交在黑曲霉中鉴别与形态有关的基因(Identification of Genes Associated with Morphology inAspergillus niger by Using Suppression Subtractive Hybridization)”应用和环境微生物学(Applied and Environmental Microbiology),2004年4月,第2474-2485页)所揭示的基因或其直系同源物中的任一种,所述文献内容以全文引用的方式并入本文中。形态相关基因可以选自gas1基因、sfb3基因、seb1基因、mpg1基因、crz1基因和tps2基因。形态相关基因中的任一种的表达可取决于基因是否促进丝状或菌丝体形态或集结粒形态而增加或降低。
如本文所描述,本文所提供的形态相关基因或其突变体(例如来自表4的真菌SNP9、12、18或40)中的任一种的表达可以通过用赋予在不同于原生启动子的水平(例如更高或更低)下的表达的异源启动子置换基因的原生启动子来控制。异源启动子可以选自表1。原生启动子的置换可以使用如本文所提供的PRO交换方法进行。
本发明的另一个目的是提供一种包括酿酒酵母SLN1基因的宿主细胞直系同源物的异源修饰的丝状真菌宿主细胞,其中酿酒酵母SLN1基因的经修饰直系同源物具有相对于缺乏异源修饰的亲本丝状真菌宿主细胞降低的活性和/或降低的表达。丝状真菌宿主可具有非菌丝体集结粒形成表型。此集结粒表型可归因于丝状真菌宿主细胞在酿酒酵母SLN1基因的直系同源物中具有异源修饰,其使得丝状宿主细胞的细胞产生相比于不具有所述异源修饰的细胞,酿酒酵母SLN1基因的功能性直系同源物的大体上减少的量和/或大体上更低活性的形式。丝状真菌宿主细胞和衍生所述丝状真菌宿主细胞的任何亲本菌株可以是所属领域中已知和/或本文提供的任何丝状真菌,例如黑曲霉。在一个实施例中,当在非浸没式生长条件(例如在固体培养基上)下生长时,与亲本菌株相比,丝状真菌宿主细胞正常形成孢子。在另一实施例中,只有当含有来自表4的基因的SNP的直系同源物中的一种、全部或组合也在丝状真菌宿主细胞中表达时,当在非浸没式生长条件(例如在固体培养基上)下生长时,与亲本菌株相比,丝状真菌宿主细胞正常形成孢子。在一个实施例中,丝状真菌宿主细胞为黑曲霉,且只有当含有来自表4的基因的SNP中的一种、全部或组合也在所述黑曲霉宿主细胞中表达时,当在非浸没式生长条件(例如在固体培养基上)下生长时,与亲本菌株相比,所述黑曲霉宿主细胞正常形成孢子。在又一实施例中,只有当含有来自表4的基因的SNP的直系同源物中的一种、全部或组合也在丝状真菌宿主细胞中表达时,当在非浸没式生长条件(例如在固体培养基上)下生长时,与亲本菌株相比,丝状真菌宿主细胞正常形成孢子。浸没式培养条件可以包括在CAP培养基中生长变异体菌株。CAP培养基可以包括锰且大体上不含螯合剂。锰可以至少13ppb或更高的量存在。
酿酒酵母SLN1基因的直系同源物的基因改变可以是用酿酒酵母SLN1基因的突变直系同源物置换基因的野生型形式,用相比于原生启动子,更弱地表达酿酒酵母SLN1蛋白质的直系同源物的基因的异源启动子置换基因的原生启动子,或其组合。或者,酿酒酵母SLN1基因的直系同源物的基因改变可以是去除酿酒酵母SLN1基因的直系同源物并且用可选标记物基因置换。酿酒酵母SLN1基因的直系同源物的突变形式可以包括SNP、无义突变、错义突变、缺失、插入或其任何组合。在一个实施例中,丝状真菌宿主细胞为黑曲霉,并且酿酒酵母SLN1蛋白质的黑曲霉直系同源物可以由SEQ ID NO:13编码。异源启动子可以选自表1中列出的启动子。在一个实施例中,异源启动子为manB或amyB启动子。此外,对此实施例,异源启动子可以是SEQ ID NO:1或SEQ ID NO:2。可选标记物可以选自如本文所提供的营养缺陷型标记物基因、比色标记物基因、抗生素抗性基因或方向标记物基因。
具有酿酒酵母SLN1蛋白质的功能性直系同源物的大体上减少的量,和/或大体上更低活性的形式的丝状真菌宿主细胞可进一步包括是与酿酒酵母SLN1基因的直系同源物相同的路径的一部分的一或多种基因的基因破坏或改变。是相同路径的一部分的一或多种基因可以选自酿酒酵母Ypd1、Skn7、Ssk1和Ssk2基因的直系同源物或其任何组合。在一个实施例中,丝状真菌宿主细胞为黑曲霉,并且酿酒酵母SLN1、Ypd1、Skn7、Ssk1和Ssk2基因的直系同源物为黑曲霉直系同源物或其突变体。此外,对此实施例,是相同路径的一部分的一或多种基因可以选自由SEQ ID NO:15、16、17、18、19或其任何组合表示的核酸序列。丝状真菌宿主细胞可以进一步包括一或多种基因的基因破坏或改变,所述基因是已知在控制丝状真菌形态中起作用的不同路径的一部分。是不同路径的一部分的一或多种基因可以是本文所提供的基因中的任一种。是不同路径的一部分的一或多种基因可以选自具有由SEQ ID NO:11、12、14或其任何组合表示的核酸序列的基因的黑曲霉直系同源物。在一个实施例中,丝状真菌宿主细胞为黑曲霉,并且是不同路径的一部分的一或多种基因为具有由SEQ ID NO:11、12、14或其任何组合表示的核酸序列的黑曲霉基因。在另一实施例中,丝状真菌宿主细胞为黑曲霉,并且是不同路径的一部分的一或多种基因为具有由SEQ ID NO:11、12、14或其任何组合表示的核酸序列的黑曲霉基因的不含SNP型式。
是与酿酒酵母SLN1基因的直系同源物相同的路径的一部分,或是已知在控制丝状真菌形态中起作用的不同路径的一部分的一或多种基因的基因破坏或改变可以是用基因的突变形式置换基因的野生型形式,用相比于原生启动子改变基因的表达(例如更高或更低)的异源启动子置换基因的原生启动子,或其组合。启动子可以是表1中列出的启动子。或者,是与酿酒酵母SLN1基因的直系同源物相同的路径的一部分,或是已知在控制丝状真菌形态中起作用的不同路径的一部分的一或多种基因的基因破坏或改变可以是去除基因并且用可选标记物基因置换。可选标记物可以选自如本文所提供的营养缺陷型标记物基因、比色标记物基因、抗生素抗性基因或方向标记物基因。
本文还提供产生具有酿酒酵母SLN1蛋白质的功能性直系同源物的大体上减少的量,和/或大体上更低活性的形式的丝状真菌宿主细胞的方法。所述方法可包括进行如本文所提供的PRO交换方法、SNP交换方法或PRO交换和SNP交换方法的组合。
本发明的另一个目的是提供一种包括具有选自SEQ ID NO.11、12、14或其任何组合的核酸序列的黑曲霉基因的宿主细胞直系同源物的异源修饰的丝状真菌宿主细胞,其中具有选自SEQ ID NO.11、12、14或其任何组合的核酸序列的黑曲霉基因的经修饰直系同源物具有相对于缺乏异源修饰的亲本丝状真菌宿主细胞降低的活性和/或降低的表达。由于丝状宿主细胞拥有具有核酸序列SEQ ID NO:11、12、14或其任何组合的黑曲霉基因的直系同源物的异源修饰,当在浸没培养物中生长时,相比于亲本菌株的细胞,丝状真菌宿主可以具有非菌丝体集结粒形成表型。拥有具有SEQ ID NO:11、12、14或其任何组合的核酸序列的黑曲霉基因的直系同源物可以使得宿主细胞的细胞当在浸没式培养条件下生长时,相比于亲本宿主细胞的细胞,产生由具有所述SEQ ID NO的黑曲霉基因的直系同源物所编码的功能蛋白的大体上减少的量和/或大体上更低活性的形式。丝状宿主细胞和所述丝状真菌宿主细胞的亲本菌株可以是所属领域中已知和/或本文提供的任何丝状真菌,例如黑曲霉。在一个实施例中,当在非浸没式生长条件(例如在固体培养基上)下生长时,与亲本菌株相比,丝状宿主细胞菌株正常形成孢子。在一些情况下,具有SEQ ID NO;11、12或14的黑曲霉基因的直系同源物进一步经基因改变。进一步的基因改变可以是用相比于原生启动子更弱地表达基因的异源启动子置换基因的原生启动子。或者,进一步的基因改变可以是去除具有SEQID NO:11、12或14的黑曲霉基因的直系同源物并且用可选标记物基因置换。可选标记物可以选自如本文所提供的营养缺陷型标记物基因、比色标记物基因、抗生素抗性基因或方向标记物基因。异源启动子可以选自表1中列出的启动子。在一个实施例中,异源启动子为manB或amyB启动子。此外,对此实施例,异源启动子可具有SEQ ID NO:1或SEQ ID NO:2的核酸序列。浸没式培养条件可以包括在CAP培养基中生长变异体菌株。CAP培养基可以包括锰且大体上不含螯合剂。锰可以至少13ppb或更高的量存在。应理解,在其中丝状真菌宿主细胞为黑曲霉的实施例中,具有选自SEQ ID NO.11、12、14的核酸序列的黑曲霉基因或其野生型型式可包括本文详述的异源修饰。
拥有由具有选自SEQ ID NO:11、12或14的序列的黑曲霉基因的直系同源物所编码的功能蛋白的大体上减少的量和/或大体上更低活性的形式的丝状真菌宿主细胞可进一步包括是相同路径的一部分的一或多种基因的基因破坏或改变。丝状真菌宿主细胞可以进一步包括一或多种基因的基因破坏或改变,所述基因是已知在控制丝状真菌形态中起作用的不同路径的一部分。是不同路径的一部分的一或多种基因可以是本文所提供的基因中的任一种。是相同路径的一部分,或是已知在控制丝状真菌形态中起作用的不同路径的一部分的一或多种基因的基因破坏或改变可以是用基因的突变形式置换基因的野生型形式,用相比于原生启动子改变基因的表达(例如更高或更低)的异源启动子置换基因的原生启动子,或其组合。启动子可以是表1中列出的启动子。或者,是相同路径的一部分,或是已知在控制丝状真菌形态中起作用的不同路径的一部分的一或多种基因的基因破坏或改变可以是去除基因并且用可选标记物基因置换。可选标记物可以选自如本文所提供的营养缺陷型标记物基因、比色标记物基因、抗生素抗性基因或方向标记物基因。
本文还提供产生拥有由具有SEQ ID NO:11、12或14的黑曲霉基因的直系同源物所编码的功能蛋白的大体上减少的量和/或大体上更低活性的形式的丝状真菌的变异体菌株的方法。所述方法可包括进行如本文所提供的PRO交换方法、SNP交换方法或PRO交换和SNP交换方法的组合。
本发明的又一个目的是提供一种包括可操作地连接到调节宿主细胞形态的基因的启动子的丝状真菌宿主细胞,其中启动子与基因异源,并且其中启动子具有选自由SEQID NO.1-4组成的群组的序列。丝状真菌宿主细胞可以是所属领域中已知和/或本文提供的任何丝状真菌,例如黑曲霉。在一些情况下,当在非浸没式生长条件(例如在固体培养基上)下生长时,与宿主细胞的亲本菌株相比,真菌宿主细胞正常形成孢子,但当在浸没式培养条件下生长时,形成非菌丝体集结粒形态。在一些情况下,宿主细胞可包括调节形态的一或多种基因,以使得所述一或多种基因中的每一种具有与其连接的异源启动子。调节宿主细胞形态的一或多种基因可以是如本文所提供的任何所述基因,例如单独或呈组合形式的来自表4的由SEQ ID NO:11、12、13或14表示的含有SNP的基因序列或其直系同源物。在一些情况下,来自表4的由SEQ ID NO:11、12、13或14表示的含有SNP的基因序列或其直系同源物可以与来自与相应含有SNP的基因序列相同的路径的一或多种基因组合。在一个实施例中,一或多种基因为单独或呈组合形式的具有选自SEQ ID NO:11、12、13或14的核酸序列的基因或其直系同源物的野生型或不含SNP型式。在另一个实施例中,具有选自SEQ ID NO:11、12、13或14的核酸序列的基因或其直系同源物的野生型或不含SNP型式可以与来自与相应野生型或不含SNP的基因序列相同的路径的一或多种基因组合。在一个实施例中,调节宿主细胞形态的基因可以是酿酒酵母SLN1基因或相同信令路径中的基因的直系同源物。是相同信令路径的一部分的一或多种基因可以选自酿酒酵母Ypd1、Skn7、Ssk1和Ssk2基因的直系同源物或其任何组合。在一个实施例中,丝状真菌宿主细胞为黑曲霉,并且是相同信令路径的一部分的一或多种基因可以选自由SEQ ID NO:15、16、17、18、19或其任何组合表示的核酸序列。酿酒酵母SLN1基因的直系同源物可为基因的野生型或突变型形式。在一个实施例中,丝状真菌宿主细胞为黑曲霉,并且酿酒酵母SLN1基因的突变黑曲霉直系同源物具有SEQ ID NO:13的核酸序列。浸没式培养条件可以包括在CAP培养基中生长变异体菌株。CAP培养基可以包括锰且大体上不含螯合剂。锰可以至少13ppb或更高的量存在。
细胞培养和发酵
本发明的细胞可以在适合于任何所要生物合成反应或选择时在经修改的常规营养培养基中培养。在一些实施例中,本发明教示了在诱导型培养基中培养用于活化启动子。在一些实施例中,本发明教示了具有选择剂的培养基,所述选择剂包含转化体选择剂(例如抗生素),或选择适合于在抑制条件(例如高乙醇条件)下生长的生物体。在一些实施例中,本发明教示了使细胞培养物在中针对细胞生长优化的培养基中生长。在其它实施例中,本发明教示了使细胞培养物在针对产物产量优化的培养基中生长。在一些实施例中,本发明教示了使培养物在培养基中生长,所述培养基能够诱导细胞生长并且还含有产生最终产物所需的前体(例如用于产生乙醇的高含量的糖)。
培养条件(诸如温度、pH值等)是适合与针对表达来选择的宿主细胞一起使用的条件,且对于所属领域的技术人员是显而易见的。如所提及,许多参考文献可供用于培养和产生许多细胞,包含细菌、植物、动物(包含哺乳动物)和古细菌来源的细胞。参见例如萨布鲁克(Sambrook),奥斯贝(Ausubel)(所有均见上文)以及伯杰(Berger),分子克隆技术指南,酶学方法(Guide to Molecular Cloning Techniques,Methods in Enzymology),第152卷,学术出版社有限公司(Academic Press,Inc.),加利福尼亚州圣地亚哥;以及弗瑞旭尼(Freshney)(1994),动物细胞的培养:基本技术手册(Culture of Animal Cells,a Manualof Basic Technique),第三版,威立-利斯(Wiley-Liss),纽约和其中引用的参考文献;多伊尔(Doyle)和格里菲思(Griffiths)(1997),哺乳动物细胞培养:基本技术(MammalianCell Culture:Essential Techniques),约翰·威利父子出版公司(John Wiley andSons),纽约;忽玛逊(Humason)(1979),动物组织技术(Animal Tissue Techniques),第四版,W.H.弗里曼公司(W.H.Freeman and Company);以及里奇埃德尔(Ricciardelle)等人,(1989),活体外细胞(In Vitro Cell),发育生物学(Dev.Biol.)25:1016-1024,所有文献以引用的方式并入本文中。关于植物细胞培养和再生,参见派恩(Payne)等人(1992),液体系统中的植物细胞和组织培养(Plant Cell and Tissue Culture in Liquid Systems),约翰·威利父子公司(John Wiley&Sons,Inc.),纽约州纽约市;冈堡(Gamborg)和菲利浦(Phillips)(编)(1995),植物细胞、组织和器官培养;基本方法施普林格实验室手册(PlantCell,Tissue and Organ Culture;Fundamental Methods Springer Lab Manual),施普林格出版社(Springer-Verlag)(柏林海德堡,纽约);琼斯(Jones)编(1984),植物基因转移和表达方案(Plant Gene Transfer and Expression Protocols),胡马纳出版社(HumanaPress),新泽西州特图瓦市(Totowa,N.J.),以及植物分子生物学(Plant MolecularBiology)(1993)R.R.D.克洛(R.R.D.Croy)编,生物科学出版社(Bios ScientificPublishers),英国牛津(Oxford,U.K.)ISBN 0 12 198370 6,所有文献以引用的方式并入本文中。细胞培养基一般性地阐述于阿特拉斯(Atlas)和帕克斯(Parks)(编),微生物培养基手册(The Handbook of Microbiological Media)(1993)CRC出版社,佛罗里达州波卡拉顿(Boca Raton,Fla.),所述文献以引用的方式并入本文中。用于细胞培养的额外信息见于可获得的商业文献中,诸如来自西格玛-奥德里奇公司(Sigma-Aldrich,Inc)(密苏里州圣路易(St Louis,Mo.))的生命科学研究细胞培养目录(LifeScience Research CellCulture Catalogue)(“西格玛-LSRCCC”)以及例如也来自西格玛-奥德里奇公司(密苏里州圣路易)的植物培养目录和增刊(The Plant Culture Catalogue and supplement)(“西格玛-PCCS”),所有文献以引用的方式并入本文中。
待用的培养基必须以适合方式满足相应菌株的需求。用于各种微生物的培养基的描述存在于美国细菌学学会(American Society for Bacteriology)(美国华盛顿哥伦比亚特区,1981)的“通用细菌学方法手册(Manual of Methods for GeneralBacteriology)”中。
本发明另外提供一种发酵制备所关注产物的过程,包括以下步骤:a)将根据本发明的微生物在适合培养基中培养,从而产生发酵液;和b)将a)的发酵液和/或微生物细胞中的所关注产物浓缩。
在一些实施例中,本发明教示了出于产生所要有机化合物的目的,所产生的微生物可以如例如WO 05/021772中所述连续地培养,或用分批法(分批培养)或分批进料或重复分批进料法不连续地培养。关于已知培养方法的通用性质的概述可获得于希米尔(Chmiel)的教科书(生物技术进展1:生物过程技术中的引入(Bioprozeβtechnik.1:Einführung indie Bioverfahrenstechnik)(古斯塔夫·费希尔出版社(Gustav Fischer Verlag),斯图加特(Stuttgart),1991))或斯托哈思(Storhas)的教科书(生物反应器和外围设施(Bioreaktoren and periphere Einrichtungen)(维尤戈出版社(Vieweg Verlag),不伦瑞克(Braunschweig)/威斯巴登(Wiesbaden),1994))。
在一些实施例中,本发明的细胞是在分批或连续发酵条件下生长。
经典的分批发酵是一种封闭系统,其中在发酵开始时设定培养基的组成且在发酵期间不进行人工改变。分批系统的变化形式是分批进料发酵,其也可用于本发明中。在这种变化形式中,随着发酵进展,按增量添加衬底。当分解代谢物抑制可能会抑制细胞代谢时,且在期望培养基中衬底的量有限的情况下,分批进料系统是适用的。分批和分批进料发酵是所属领域中常见且熟知的。
连续发酵是一种系统,其中将成分确定的发酵培养基连续地添加到生物反应器中且同时去除等量的改良性培养基以供处理,并且收获所关注的所要生物分子产物。在一些实施例中,连续发酵通常使培养物维持在恒定的高密度下,其中细胞主要处于对数生长期。在一些实施例中,连续发酵通常使培养物维持在停滞或对数后/停滞生长期。连续发酵系统力求维持稳态生长条件。
连续发酵工艺中用于调节营养物和生长因子的方法以及使产物形成速率最大化的技术是在工业微生物学领域中所熟知的。
例如本发明的培养物的碳源的非限制性清单包含糖和碳水化合物,例如葡萄糖、蔗糖、乳糖、果糖、麦芽糖、糖蜜、来自甜菜或甘蔗处理的含蔗糖溶液、淀粉、淀粉水解产物和纤维素;油和脂肪,例如大豆油、葵花油、花生油和椰子脂肪;脂肪酸,例如棕榈酸、硬脂酸和亚油酸;醇,例如甘油、甲醇和乙醇;以及有机酸,例如乙酸或乳酸。
用于本发明的培养物的氮源的非限制性清单包含含有机氮的化合物,诸如蛋白胨、酵母提取物、肉提取物、麦芽提取物、玉米浆、大豆粉和尿素;或无机化合物,如硫酸铵、氯化铵、磷酸铵、碳酸铵和硝酸铵。氮源可以单独地或作为混合物使用。
用于本发明的培养物的可能磷源的非限制性清单包含磷酸、磷酸二氢钾或磷酸氢二钾或相应含钠盐。
培养基可以额外包括生长所需的盐,例如呈氯化物形式的盐,或呈金属(例如钠、钾、镁、钙和铁)的硫酸盐,例如硫酸镁或硫酸铁形式的盐。
最后,除上述物质之外,可以使用基本生长因子,诸如氨基酸,例如高丝氨酸和维生素,例如硫胺、生物素或泛酸。
在一些实施例中,培养物的pH值可以适合方式通过任何酸或碱或缓冲盐(包含(但不限于)氢氧化钠、氢氧化钾、氨或氨水);或酸性化合物(诸如磷酸或硫酸)来控制。在一些实施例中,通常将pH值调节到6.0到8.5的值,优选6.5到8。
在一些实施例中,本发明的培养物可以包含消泡剂,例如脂肪酸聚乙二醇酯。在一些实施例中,本发明的培养物通过添加适合的选择性物质(例如抗生素)来修改以使培养物中的质体稳定化。
在一些实施例中,在好氧条件下进行培养。为了维持这些条件,将氧气或含氧气气体混合物(例如空气)引入培养物中。同样可以使用富含过氧化氢的液体。合适时,在高压下,例如在0.03到0.2MPa的高压下进行发酵。培养物的温度通常是20℃到45℃且优选25℃到40℃,特别优选30℃到37℃。在分批或分批进料工艺中,优选持续培养直到已经形成足以回收的量的所关注的所要产物(例如有机化合物)为止。此目标通常可以在10小时到160小时内实现。在连续工艺中,较长培养时间是可能的。微生物的活性使得所关注的产物在发酵培养基中和/或在所述微生物的细胞中浓缩(积累)。
在一些实施例中,在厌氧条件下进行培养。
筛选
在一些实施例中,本发明教示了高通量初始筛选。在其它实施例中,本发明还教示了基于稳定槽罐的对性能数据的验证(参见图6B)。
在一些实施例中,高通量筛选过程经设计以预测菌株在生物反应器中的性能。如此前所述,选择适于生物体且反映生物反应器条件的培养条件。挑取个别群落且转移到96孔盘中且培育适合的时间量。随后将细胞转移到新的96孔盘中以进行额外的种子培养或产生培养物。持续不同长度的时间培育培养物,其中可以进行多次测量。这些测量可以包含预测菌株在生物反应器中的性能的产物、生物质或其它特征的测量。使用高通量培养结果预测生物反应器性能。
在一些实施例中,使用基于槽罐的性能验证确认利用高通量筛选所分离的菌株的性能。针对相关菌株性能特征,诸如生产率或产量,使用实验室规模的发酵反应器(例如本发明的表3中所揭示的反应器)筛选候选菌株。
产物回收和定量
关于所关注的产物的产生的筛选方法是所属领域的技术人员已知的,且在本说明书全文中论述。当筛选本发明的菌株时可以使用所述方法。
在一些实施例中,本发明教示了改良经设计以产生非分泌性细胞内产物的菌株的方法。举例来说,本发明教示了提高细胞培养的稳健性、产量、效率或总体合意性的方法,所述细胞培养产生细胞内酶、油、药品或其它有价值的小分子或肽。非分泌性细胞内产物的回收或分离可以通过所属领域中所熟知的溶解和回收技术(包含本文所述的那些技术)来实现。
举例来说,在一些实施例中,本发明的细胞可以通过离心、过滤、沉降或其它方法收集。接着利用任何方便的方法破坏所收集的细胞,所述方法包含冻融循环、超声处理、机械破坏或使用细胞溶解剂,或所属领域的技术人员所熟知的其它方法。
所得到的所关注的产物(例如多肽)可以利用所属领域中已知的多种方法中的任一种回收/分离并且任选地加以纯化。举例来说,可以利用常规程序从营养物培养基中分离出产物多肽,所述常规程序包含(但不限于):离心、过滤、提取、喷雾干燥、蒸发、色谱法(例如离子交换、亲和、疏水性相互作用、色谱焦聚和尺寸排阻)或沉淀。最后,可以在最终纯化步骤中使用高效液相色谱法(HPLC)。(参见例如如帕瑞(Parry)等人,2001,生物化学杂志(Biochem.J.)353:117和洪(Hong)等人,2007,应用微生物学和生物技术(Appl.Microbiol.Biotechnol.)73:1331中所述的细胞内蛋白质的纯化,两篇文献均以引用的方式并入本文中)。
除上文提及的参考文献之外,多种纯化方法是在所属领域中熟知的,包含(例如)以下文献中所阐述的纯化方法:桑德纳(Sandana)(1997)蛋白质的生物分离(Bioseparation of Proteins),学术出版社有限公司(Academic Press,Inc.);博拉格(Bollag)等人(1996)蛋白质方法(Protein Methods)第2版,威立-利斯,纽约;沃克(Walker)(1996)蛋白质方案手册(The Protein Protocols Handbook),胡马纳出版社,新泽西州;哈里斯(Harris)和安格尔(Angal)(1990)蛋白质纯化应用:实用方法(ProteinPurification Applications:A Practical Approach),牛津IRL出版社,英国牛津;哈里斯和安格尔,蛋白质纯化方法:实用方法(Protein Purification Methods:A PracticalApproach),牛津IRL出版社,英国牛津;斯科普斯(Scopes)(1993)蛋白质纯化:原理和实践(Protein Purification:Principles and Practice)第3版,斯普林格出版社,纽约;詹森(Janson)和赖登(Ryden)(1998)蛋白质纯化:原理、高解析度方法和应用(ProteinPurification:Principles,High Resolution Methods and Applications),第二版,威立-VCH(Wiley-VCH),纽约;以及沃克(Walker)(1998)CD-ROM的蛋白质方案(ProteinProtocols on CD-ROM),胡马纳出版社,新泽西州,所有文献以引用的方式并入本文中。
在一些实施例中,本发明教示了改良经设计以产生分泌性产物的菌株的方法。举例来说,本发明教示了提高细胞培养的稳健性、产量、效率或总体合意性的方法,所述细胞培养产生有价值的小分子或肽。
在一些实施例中,免疫方法可用于检测和/或纯化由本发明的细胞产生的分泌性或非分泌性产物。在一种实例方法中,将使用常规方法针对产物分子(例如针对胰岛素多肽或其免疫原性片段)培养的抗体固定于珠粒上,在使内切葡聚糖酶结合的条件下与细胞培养基混合,且沉淀。在一些实施例中,本发明教示了酶联免疫吸附分析法(ELISA)的用途。
在其它相关实施例中,使用如以下文献中所揭示的免疫色谱法:美国专利第5,591,645号、美国专利第4,855,240号、美国专利第4,435,504号、美国专利第4,980,298号,以及赛旺佩克(Se-Hwan Paek)等人,“快速一步免疫色谱分析的开发,方法(Developmentof rapid One-Step Immunochromatographic assay,Methods)”,22,53-60,2000),所述文献中的每一个以引用的方式并入本文中。通用的免疫色谱法通过使用两种抗体来检测样本。第一抗体存在于测试溶液中或存在于由多孔膜制成的呈大致矩形形状的测试片末端的一部分处,其中将测试溶液滴落。这种抗体用胶乳颗粒或金胶态颗粒标记(这种抗体在下文中称为标记抗体)。当所滴落的测试溶液包含待检测的样本时,标记抗体识别样本以便与样本结合。样本与标记抗体的复合物通过毛细作用流向吸收体,所述吸收体由过滤纸制成且连接到与已包含标记抗体的末端相对的末端。在流动期间,样本与标记抗体的复合物被存在于多孔膜中部的第二抗体(其在下文中称为轻敲抗体)识别且捕获,且因此复合物以可见信号的形式出现在多孔膜的检测部件上且被检测到。
在一些实施例中,本发明的筛选方法是基于光度检测技术(吸收、荧光)。举例来说,在一些实施例中,检测可以基于荧光团检测剂(诸如结合到抗体的GFP)的存在。在其它实施例中,光度检测可以基于来自细胞培养的所要产物的积累。在一些实施例中,产物可以通过培养物的UV或来自所述培养物的提取物来检测。
所属领域中的技术人员将认识到,本发明的方法可与产生任何期望的所关注生物分子产物的宿主细胞兼容。下表2展示了本发明范围内所包含的产物类别、生物分子和宿主细胞的非限制性清单。这些实例是为了说明性目的而提供,且不意图以任何方式限制本发明所揭示的技术的适用性。
表2.本发明的所关注宿主细胞和产物的非限制性清单。
Figure BDA0002305131530000981
Figure BDA0002305131530000991
Figure BDA0002305131530001001
选择标准和目标
应用于本发明方法的选择标准将随着菌种选育程序的特定目标而变。本发明可以经调适以满足任何程序目标。举例来说,在一些实施例中,程序目标可以是最大化单次分批反应产量而无即时时间限制。在其它实施例中,程序目标可以是再平衡生物合成产出以产生特定产物,或产生特定比率的产物。在其它实施例中,程序目标可以是修饰产物的化学结构,诸如延长聚合物的碳链。在一些实施例中,程序目标可以是改良性能特征,诸如产量、效价、生产率、副产物消除、对过程偏移的容许度、最佳生长温度和生长速率。在一些实施例中,程序目标是改良宿主性能,如根据微生物所产生的所关注产物的体积生产率、比生产率、产量或效价所测量。
在其它实施例中,程序目标可以是就按输入量计的最终产物产量(例如每磅蔗糖所产生的乙醇的总量)而言,优化商业菌株的合成效率。在其它实施例中,程序目标可以是优化合成速度,如例如就分批完成率或连续培养系统的生产率而言所测量。在其它实施例中,程序目标可以是增强菌株对特定噬菌体的抗性,或以其它方式增强培养条件下的菌株活力/稳健性。
在一些实施例中,菌种选育项目可以接受超过一个目标。在一些实施例中,菌株项目的目标可以取决于质量、可靠性或总体盈利能力。在一些实施例中,本发明教示了使所选突变或突变群组与上述菌株特性中的一或多种相结合的方法。
所属领域中的技术人员将认识到如何定制菌株选择标准以满足特定项目目标。举例来说,选择在反应饱和下菌株单批最大产量可以适用于鉴别具有高单批产量的菌株。基于跨越一定范围的温度和条件下产量一致性的选择可以适用于鉴别稳健性和可靠性增强的菌株。
在一些实施例中,初始高通量期的选择标准和基于槽罐的验证是相同的。在其它实施例中,基于槽罐的选择可以依据额外和/或不同的选择标准来进行。举例来说,在一些实施例中,高通量菌株选择可能是基于单批反应完成产量,而基于槽罐的选择可以扩展以包含基于针对反应速度的产量的选择。
定序
在一些实施例中,本发明教示了本文所述生物体的全基因组定序。在其它实施例中,本发明还教示了作为对本发明方法的质量对照组的质体、PCR产物和其它寡核苷酸的定序。大型项目和小型项目的定序方法已为所属领域的技术人员所熟知。
在一些实施例中,本发明的方法中可以使用用于核酸定序的任何高通量技术。在一些实施例中,本发明教示了全基因组定序。在其它实施例中,本发明教示了用于鉴别基因变异的扩增子定序超深度定序。在一些实施例中,本发明还教示了新颖的文库制备方法,包含片段化的同时添加标签(tagmentation)(参见WO/2016/073690)。DNA定序技术包含使用经标记的终止子或引物且在平板或毛细管中进行凝胶分离的经典双脱氧定序反应(桑格方法(Sanger method));使用可逆封端的经标记的核苷酸的边合成边定序、焦磷酸定序;454定序;与经标记的寡核苷酸探针文库进行等位基因特异性杂交;使用与经标记的克隆文库的等位基因特异性杂交、随后进行接合的边合成边定序;在聚合步骤期间并入经标记的核苷酸的实时监视;聚合酶克隆定序(polony sequencing);以及SOLiD定序。
在本发明的一个方面中,使用高通量定序方法,其包括对在固体表面上的个别分子进行空间分离的步骤,其中在所述固体表面上所述个别分子被并行定序。所述固体表面可以包含无孔表面(诸如索莱萨定序(Solexa sequencing),例如本特雷等人,自然,456:53-59(2008);或全面基因组学定序(Complete Genomics sequencing),例如德尔马纳茨(Drmanac)等人,科学,327:78-81(2010));孔阵列,其可以包含珠粒或颗粒结合的模板(诸如用454,例如马古利斯(Margulies)等人,自然,437:376-380(2005)或离子激流定序(IonTorrent sequencing),美国专利公开2010/0137143或2010/0304982);微机械加工的膜(诸如用SMRT定序,例如艾德(Eid)等人,科学,323:133-138(2009)),或珠粒阵列(如用SOLiD定序或聚合酶克隆定序,例如金(Kim)等人,科学,316:1481-1414(2007))。
在另一个实施例中,本发明的方法包括在将分子在固体表面上空间分离之前或之后,将经分离的分子扩增。先前扩增可以包括基于乳液的扩增,如乳液PCR,或滚环扩增。还教示了基于索莱萨的定序,其中将个别模板分子在固体表面上空间分离,随后通过桥式PCR对其并行扩增以形成分开的克隆群体或集群,且接着定序,如本特雷等人(上文引用)和制造商说明书(例如TruSeqTM样品制备试剂盒和数据表,启迪公司(Illumina,Inc.),加利福尼亚州圣地亚哥(San Diego,Calif.),2010)中所述;且进一步如以下参考文献所述:美国专利第6,090,592号、第6,300,070号、第7,115,400号;以及EP0972081B1,所述文献以引用的方式并入本文。
在一个实施例中,安置于固体表面上并在固体表面上扩增的个别分子形成密度为每平方厘米至少105个集群,或密度为每平方厘米至少5×105,或密度为每平方厘米至少106个集群的集群。在一个实施例中,使用具有相对较高错误率的定序化学反应。在所述实施例中,所述化学反应所产生的平均质量分数是序列读段长度的单调下降函数。在一个实施例中,所述下降相当于0.5%的序列读段在位置1-75中具有至少一个错误;1%的序列读段在位置76-100中具有至少一个错误;和2%的序列读段在位置101-125中具有至少一个错误。
全基因组基因设计标准的计算分析和效果预测
在一些实施例中,本发明教示了预测并入所给定宿主菌株中的特定基因改变的效果的方法。在其它方面中,本发明提供了用于产生提议基因改变的方法,所述基因改变应该并入所给定的宿主菌株中,以便所述宿主具有特定的表型特点或菌株参数。在给定的方面中,本发明提供可以用于设计新颖宿主菌株的预测模型。新颖宿主菌株可以是丝状真菌宿主菌株,例如黑曲霉。
在一些实施例中,本发明教示了分析每一轮筛选的性能结果的方法以及产生新的提议全基因组序列修饰的方法,所述全基因组序列修饰经预测可增强在下一轮筛选中的菌株性能。
在一些实施例中,本发明教示了系统基于此前筛选结果产生宿主菌株的提议序列修饰。在一些实施例中,本发明系统的建议是基于刚刚前一次筛选的结果。在其它实施例中,本发明系统的建议是基于一或多次之前筛选的累积结果。
在一些实施例中,本发明系统的建议是基于此前开发的HTP基因设计文库。举例来说,在一些实施例中,本发明系统经设计可存储此前筛选的结果,且将那些结果应用于在相同或不同宿主生物体中的不同项目。
在其它实施例中,本发明系统的建议是基于科学见解。举例来说,在一些实施例中,建议是基于基因的已知特性(来自诸如经注释的基因数据库和相关文献的来源)、密码子优化、转录滑移、uORFs,或其它假设驱动型序列和宿主优化。
在一些实施例中,由系统或预测模型推荐的宿主菌株的提议序列修饰是通过利用一或多种所揭示的分子工具集进行的,所述分子工具集包括:(1)启动子交换,(2)SNP交换,(3)起点/终止密码子交换,(4)序列优化,(5)Stop交换,和(5)上位定位。
本文所述的HTP基因工程改造平台关于任何特定微生物或表型特点(例如特定化合物的产生)是不可知的。也就是说,本文教示的平台和方法可以与任何宿主细胞一起使用,以对所述宿主细胞进行工程改造,以使其具有任何所要表型特点。另外,作为在所教示方法期间存在的大量工艺参数的存储、表征和分析的结果,从用于产生一种新颖宿主细胞的给定HTP基因工程改造方法中习得的课程可以应用于任何数目的其它宿主细胞。在特定方面,宿主细胞可以是所属领域中已知的任何多核体生物体。举例来说,宿主细胞可以是丝状真菌宿主细胞。本文中使用的丝状真菌宿主细胞的实例可以是黑曲霉。
如上位定位章节中所提及,可以通过一些优选预测模型估计假想菌株的性能(也称为分数),所述假想菌株是通过将来自HTP基因设计文库的突变集合合并到特定背景中所得到的。鉴于所述预测模型,有可能对通过组合合并对突变文库可获取的所有假想菌株进行评分和评级。以下章节概述了本发明HTP平台中所用的特定模型。
预测菌株设计
本文描述了一种用于预测菌株设计的方法,其包含:描述基因变化和菌株性能、基于菌株中变化的组成来预测菌株性能、推荐预测性能高的候选设计以及过滤预测以针对二级考虑因素(例如与现有菌株的相似度、上位或预测可信度)进行优化的方法。
对菌株设计模型的输入
在一个实施例中,为了易于说明,输入数据可以包括两种组分:(1)基因变化集和(2)相对菌株性能。所属领域的技术人员将认识到,这种模型能容易扩展以考虑广泛多种输入,同时考虑到过度拟合的抵消性考量。除基因变化之外,可以加以调整的一些输入参数(自变量)是细胞类型(属、种、株系、谱系学表征等)和、进行细胞发酵的工艺参数(例如环境条件、处理设备、修饰技术等)。
基因变化集可以来自此前论述的基因扰动集合,称为HTP基因设计文库。可以基于任何给定的所关注参数或表型特点(例如所关注的化合物、小分子或产物的产生)来评估相对菌株性能。
细胞类型可以用通用类别说明,所述通用类别诸如原核和真核系统、属、种、株系、组织培养物(相对于分散细胞)等。能够加以调整的工艺参数包含温度、压力、反应器配置和培养基组成。反应器配置的实例包含反应器体积,不论工艺是分批或连续的,且如果是连续的,那么包含体积流量等。也可以指明其上存在细胞的支持结构(如果存在)。培养基组成的实例包含电解质浓度、营养物、废产物、酸、pH值等。
待用于随后用于建立预测菌株设计模型的初始线性回归模型的来自所选HTP基因设计文库的基因变化集
为了建立预测菌株设计模型,首先选择相同微生物物种的菌株的基因变化。还提供每一基因变化的历史(例如展示这个菌株谱系中最近的修饰:“最后一个变化”)。因此,这种菌株性能与其亲本性能的比较代表关于“最后一个变化”突变的性能的数据点。
所建构的菌株性能的评估
所教示模型的目标是基于引入菌株中的基因变化的组成来预测菌株性能。为了构筑比较标准,通过首先计算每个分析盘每种菌株的中值性能相对于常见参考菌株来计算菌株性能。接着以相同盘内的经工程改造的菌株与常见参考菌株之间的平均性能差异形式计算相对性能。将计算局限于盘内比较可确保考虑中的样品都接受相同实验条件。
图41展示其中考虑输入数据的相对菌株性能的分布的假想实例。相对性能为零表示经工程改造的菌株的性能与盘内基本或“参考”菌株同样好。所关注的是预测模型鉴别性能可能显著高于零的菌株的能力。另外,且更一般来说,所关注的是任何所给定的菌株的性能根据一些标准是否胜过其亲本。在实践中,标准可以是产物效价满足或超过高于亲本水平的某些阈值,尽管也可以改为使用或另外使用在所要方向上与亲本具有统计上显著的差异。基本或“参考”菌株的作用仅仅是充当供在盘内或盘之间进行比较的所添加归一化因子。
值得留意的概念是亲本菌株与参考菌株之间的差异。亲本菌株是当前一轮突变诱发所用的背景。参考菌株是在每个盘中运作以促进比较的对照菌株,尤其是盘之间的比较,且典型地是如上文所提及的“基本菌株”。但是由于基本菌株(例如用于基准测试总体性能的野生型或工业菌株)就在所给定一轮的菌种选育中是突变诱发目标而言不一定是“基本”的,因此更具描述性的术语是“参考菌株”。
总之,基本/参考菌株通常用于基准测试所建构菌株的性能,而亲本菌株用于基准测试相关基因背景下的特定基因变化的性能。
通过线性回归对所建构菌株的性能进行评级
所揭示的模型的目标是通过描述随引入到所建构菌株中的基因变化的组成而变的相对菌株性能,来对所建构菌株的性能进行评级。如本发明全文中所论述,各种HTP基因设计文库提供了引入经工程改造的菌株中的可能基因变化(例如基因扰动/改变)的组库。线性回归是当前所述示范性预测模型的基础。
随后基因变化和其对相对性能的影响是基于回归的建模的输入值。相对于常见基本菌株对随菌株中所含的基因变化的组成而变的菌株性能进行评级。
表征所建构菌株的线性回归
由于易于实施和解释,线性回归是一种用于所述HTP基因组工程改造平台的有吸引力的方法。所得回归系数可以解释为可归因于每一基因变化的存在的相对菌株性能的平均增加或降低。
举例来说,在一些实施例中,这种技术让我们得出结论:在不存在任何负上位相互作用的情况下,将原始启动子变成另一启动子使相对菌株性能改良平均约1、2、3、4、5、6、7、8、9、10个或更多个单位,且因此是潜在高度期望的变化(注意:输入是无单位归一化值)。
所教示的方法因此使用线性回归模型对所建构的菌株进行描述/表征和评级,所述所建构的菌株的基因组中已引入来自各种所教示文库的各种基因扰动。
预测设计建模
使用来自所构筑菌株的数据的上述线性回归模型可以用于对尚未建构的菌株进行性能预测。
程序可以概述如下:通过计算机模拟产生基因变化的所有可能配置→使用回归模型预测相对菌株性能→根据性能订购候选菌株设计。因此,通过利用回归模型预测尚未建构的菌株的性能,方法实现了在进行更少实验的同时产生性能较高的菌株。
产生配置
当构筑模型来预测尚未建构的菌株的性能时,第一步骤是产生设计候选物的序列。这通过确定菌株中的基因变化的总数,且接着定义基因变化的所有可能组合来进行。举例来说,可以将潜在基因变化/扰动的总数设定为29(例如29种可能SNP,或29种不同启动子,或其任何组合,只要基因扰动的范围是29),且接着决定设计29种潜在基因变化的所有可能的3个成员组合,其产生3,654种候选菌株设计。
为了向前述3,654种候选菌株提供上下文,设想可以使用n!/((n-r)!×r!)从n个可能成员计算出尺寸r的非冗余分组的数目。如果r=3,n=29,则得到3,654。因此,如果设计出29种潜在变化所有的可能的3个成员组合,那么结果为3,654种候选菌株。
预测新菌株设计的性能
使用以组合配置作为输入值的以上所构筑的线性回归,接着可以预测每一候选设计的预期相对性能。例如,前100种预测菌株设计的变化组成可以概括于2维图中,其中x轴列出潜在基因变化(29种可能基因变化)的池,且y轴展示等级次序。
当使用新观察结果以迭代方式再训练和再拟合模型时,预测精确度应该随时间增加。本发明人的研究结果说明可以用来对预测模型以迭代方式进行再训练和改良的方法。模型预测质量可以通过若干种方法评估,包含指示预测值与观察值之间关系的强度的相关系数,或者是平均模型误差的度量的均方根误差。使用用于模型评价的选定度量标准,系统可以定义何时应该再训练模型的规则。
对以上模型的几个未陈述假设包含:(1)不存在上位相互作用;以及(2)用于建构预测模型的基因变化/扰动全部是在与所提议的基因变化组合相同的背景中作出。
针对二级特征进行过滤
上述说明性实例集中于基于所预测的宿主细胞性能的线性回归预测。在一些实施例中,本发明的线性回归方法还能够应用于非生物分子因素,诸如饱和生物质、抗性或其它可测量的宿主细胞特征。因此,本发明的方法还教示了在对待建构的候选物进行优先级排序时,考虑除所预测性能外的其它特征。假设存在额外的相关数据,那么回归模型中也包含非线性项。
与现有菌株的接近性
预测菌株类似于已建构的菌株可以节省时间和成本,尽管不是最佳预测候选物。
变化的多样性
构筑前述模型时,由于上位相互作用的存在,无法确定基因变化真正地是叠加性的(如根据线性回归所假定且如上述假设所提及)。因此,对基因变化差异性的了解可以用于提高正叠加性的可能性。如果知道例如来自评级靠前的菌株的变化位于相同代谢路径且具有相似的性能特征,那么这个信息可以用于选择变化组成有差异的另一种评级靠前的菌株。如与上位定位有关的上述章节中所述,可以过滤所预测的最佳基因变化以使选择限于响应曲线有充分差异的突变。或者,线性回归可以是使用相似度矩阵加权预测的经加权的最小二乘法回归。
所预测性能的多样性
最后,可以选择设计预测性能居中或不良的菌株,以便验证且随后改良预测模型。
迭代菌株设计优化
在实施例中,发订单引擎208将工厂订单提供给工厂210以制造并入最佳候选突变的微生物菌株。以反馈回路方式,可以利用分析设备214分析结果,以确定哪种微生物展示所要表型特性(314)。在分析阶段期间,评价经修饰的菌株培养物以确定其性能,即其所要表型特性的表达,包含在工业规模下的生产能力。举例来说,分析阶段尤其使用盘的图像数据测量微生物群落生长作为群落健康状况的指标。使用分析设备214使基因变化与表型性能相关,且将所得基因型-表型相关度数据存储在文库中,其可以存储于文库206中,以告知未来的微生物生产。
确切地说,实际产生足够高的测量性能的候选变化可以作为数据库的行添加到表中。以这种方式,将性能最佳的突变以受监督的机器学习方式添加到预测菌株设计模型中。
LIMS基于从此前工厂运行得出的相关度迭代进行设计/建构/测试/分析循环。在后续循环期间,单独或与操作人员一起的分析设备214可以选择最佳候选物作为基本菌株,以输回输入接口202中去,从而使用相关度数据微调基因修饰以实现更佳的表型性能和更细的精细度。本发明实施例的实验室信息管理系统以这种方式实施质量改良反馈回路。
总之,参照图16的流程图,迭代预测菌株设计工作流程可以描述如下:
产生输入和输出变量的训练集,例如基因变化作为输入值和性能特征作为输出值(3302)。可以由分析设备214基于此前的基因变化和并入那些基因变化的微生物菌株的相应测量性能来进行生产。
产生基于训练集的初始模型(例如线性回归模型)(3304)。这可以由分析设备214进行。
产生设计候选菌株(3306)
在一个实施例中,分析设备214可以变化组合的形式确定待对背景菌株所作出的基因变化的数目。为了表示这些变化,分析设备214可以向解释器204提供表示那些变化组合的一或多种DNA规格表达。(这些基因变化或并入那些变化的微生物菌株可以称为“测试输入值”。)解释器204解释一或多种DNA规格,且执行引擎207执行DNA规格以将已解决的输出值填入DNA规格,所述输出值表示那些变化的个别候选设计菌株。
基于模型,分析设备214预测每一候选设计菌株的预期性能(3308)。
分析设备214选择有限数目的具有最高预测性能的候选设计,例如100种(3310)。
如在本文别处关于上位定位所述,分析设备214可以通过例如针对上位效应过滤最佳设计,或将上位因素包含进预测模型中来顾及诸如上位的二级效应。
基于由发订单引擎208产生的工厂订单建构经过滤的候选菌株(在工厂210处)(3312)。
分析设备214测量所选菌株的实际性能,基于优良的实际性能选择有限数目的那些所选菌株(3314),且将设计变化和其所得性能添加到预测模型中(3316)。在线性回归实例中,将设计变化和其相关性能的集合作为表中的新行添加。
分析设备214接着迭代返回到新设计候选菌株的产生(3306),且继续迭代直到满足停止条件为止。停止条件可以包括(例如)满足性能度量标准的至少一种微生物菌株的测量性能,诸如产量、生长速率或效价。
在以上实例中,菌株设计的迭代优化利用反馈和线性回归来实施机器学习。一般来说,机器学习可以描述为使用有限数目的标记数据实例优化信息任务(诸如分类或回归)的性能的性能标准,例如参数、技术或其它特征,并且接着对未知数据执行相同任务。在受监督的机器学习(诸如上述线性回归实例中的机器学习)中,机器(例如计算装置)例如通过鉴别训练数据所展示的模式、类别、统计学关系或其它属性来学习。学习结果接着用于预测新数据是否将展示相同的模式、类别、统计学关系或其它属性。
当可获得训练数据时,本发明的实施例可以使用其它受监督的机器学习技术。在不存在训练数据的情况下,实施例可以使用无监督的机器学习。或者,实施例可以使用半监督机器学习,其使用少量的标记数据和大量的未标记数据。实施例也可以使用特征选择来选择最相关特征的子集以优化机器学习模型的性能。根据所选的机器学习方法的类型,作为线性回归的替代方案或除线性回归之外,实施例可以使用例如逻辑回归、神经网络、支持向量机(SVM)、决策树、隐式马尔可夫模型(hidden Markov models)、贝叶斯网络(Bayesiannetworks)、格兰施密特正交化(Gram Schmidt)、基于强化的学习、基于集群的学习(包含层次聚类)、基因算法,和所属领域中已知的任何其它合适的学习机器。确切地说,实施例可以使用逻辑回归以得到分类(例如将基因分类成不同功能群组)的概率以及分类本身。参见例如席维德(Shevade),使用稀疏逻辑回归的基因选择的简单和高效算法(A simple andefficient algorithm for gene selection using sparse logistic regression),生物信息学(Bioinformatics),第19卷,第17期,2003,第2246-2253页;冷(Leng)等人,使用用于暂时基因表达数据的功能数据分析的分类(Classification using functional dataanalysis for temporal gene expression data),生物信息学,第22卷,第1期,牛津大学出版社(Oxford University Press)(2006),第68-76页,所有文献以全文引用的方式并入本文。
实施例可以使用图形处理单元(GPU)加速架构,已发现其在执行机器学习任务方面越来越流行,尤其是称为深度神经网络(DNN)的形式。本发明的实施例可以使用基于GPU的机器学习,诸如以下文献中所述的机器学习:基于GPU的深度学习推理:性能和能力分析(GPU-Based Deep Learning Inference:A Performance and Power Analysis),英伟达白皮书(NVidia Whitepaper),2015年11月;达耳(Dahl)等人,用于QSAR预测的多任务神经网络(Multi-task Neural Networks for QSAR Predictions),多伦多大学计算机科学系(Dept.of Computer Science,Univ.of Toronto),2014年6月(arXiv:1406.1231[stat.ML]),所有文献以全文引用的方式并入本文。适用于本发明实施例的机器学习技术也尤其可以见于以下参考文献中:里伯莱奇特(Libbrecht)等人,机器学习在遗传学和基因组学中的应用(Machine learning applications in genetics and genomics),自然评论:遗传学(Nature Reviews:Genetics),第16卷,2015年6月;卡什亚普(Kashyap)等人,生物信息学中的大数据分析:机器学习视角(Big Data Analytics in Bioinformatics:AMachine Learning Perspective),乳胶类文件杂志(Journal of Latex Class Files),第13卷,第9期,2014年9月;普隆浦纳姆(Prompramote)等人,生物信息学技术(Bioinformatics Technologies)的第5章,生物信息学中的机器学习(Machine Learningin Bioinformatics),第117-153页,施普林格(Springer),柏林海德堡(BerlinHeidelberg),2005,所有文献以全文引用的方式并入本文。
迭代预测菌株设计:实例
下文提供上文所概述的迭代预测菌株设计工作流程的示例应用。
制备训练输入和输出变量的初始集合。这种集合包括1864种具有成分确定的基因组成的独特经工程改造菌株。每一菌株含有在5与15种之间的工程改造变化。训练中存在总共336种独特基因变化。
发展初始预测计算机模型。实施方案使用广义线性模型(具有4阶多项式内核的核岭回归)。实施方案对两种不同表型(产量和生产率)建模。将这些表型以加权总和形式组合,以获得用于评级的单一分数,如下文所示。通过对于所指定训练数据的k倍交叉验证来调整各种模型参数,例如正则化因子。
实施方案不并入如上文上位定位章节中所述的相互作用效应的任何明确分析。然而,如所属领域的技术人员将理解,所建构的广义线性模型可以捕捉到内核的二阶、三阶和四阶项隐含的相互作用效应。
模型是针对训练集训练的。在训练之后,可展示出产量模型对训练数据的显著质量拟合。
随后产生候选菌株。这个实施例包含与将新的基因变化引入到亲本菌株相关的串行建构约束条件。在此,不能简单地将候选物视为随所要变化数目而变。取而代之,作为起点,分析设备214选择此前所设计的已知具有高性能度量标准的菌株的集合(“种子菌株”)。分析设备214将基因变化个别地施加到种子菌株的每一种。所引入的基因变化不包含已经存在于种子菌株中的那些基因变化。出于各种技术、生物学或其它原因,明确需要或明确排除某些突变。
分析设备214基于模型预测候选菌株设计的性能。分析设备214基于关于两种所关注表型(产量和生产率)所预测的性能将候选物从“最佳”到“最差”评级。确切地说,分析设备214使用加权总和对候选菌株评分。
分数=0.8×产量/最大(产量)+0.2×生产率/最大(生产率),
其中产量表示候选菌株的预测产量,
最大(产量)表示所有候选菌株的最大产量,
生产率表示候选菌株的生产率,及
最大(生产率)表示所有候选菌株的最大产率。
分析设备214通过施加负载约束和操作约束而从候选物的评级清单产生最终的建议集合。在一些实施例中,负载极限可设置为给定数目,诸如48个计算机产生的候选设计菌株。
可以使用训练模型(上述)预测每一候选菌株的(产量和生产率的)预期性能。分析设备214可以使用上文给出的评分函数对候选菌株评级。可以随后施加负载和操作约束以得到48种候选菌株的过滤集合。接着基于由发订单引擎208产生的工厂订单建构经过滤的候选菌株(在工厂210处)(3312)。订购可以是基于对应于候选菌株的DNA规格。
在实践中,建构过程具有其中未建构随机的菌株集合的预期失败率。
分析设备214还可以用于测量所选菌株的实际产量和生产率性能。分析设备214可以基于三个标准评价模型和所推荐的菌株:模型精确度;菌株性能的改良度;和与人类专家所产生的设计的等效性(或改良度)。
可以测量所推荐菌株的产量和生产率表型且与由模型所预测的值进行比较。
接下来,分析设备214计算所推荐菌株的每一种相对于亲本菌株的性能变化百分比。
预测精确度可以通过若干种方法评估,包含指示预测值与观察值之间关系的强度的相关系数,或者是平均模型误差的度量的均方根误差。经过多轮实验,模型预测可能会发生漂移,且可以将新的基因变化添加到训练输入值中以改善预测精确度。对于这个实例,将设计变化和其所得性能添加到预测模型中(3316)。
基因组设计和工程改造即服务
在本发明的实施例中,图15的LIMS系统软件3210可以建构于图15的云计算系统3202中,以使得多个用户能够设计和建构根据本发明实施例的微生物菌株。图15说明了根据本发明实施例的云计算环境3204。客户端计算机3206,诸如图15中所说明的那些客户端计算机,通过网络3208(诸如因特网)接入LIMS系统。在实施例中,LIMS系统应用软件3210存在于云计算系统3202中。LIMS系统可以采用使用说明于图15中的类型的一或多个处理器的一或多种计算系统。云计算系统自身包含网络接口3212,其使LIMS系统应用3210通过网络3208连接到客户端计算机3206。网络接口3212可以包含应用编程接口(API)以使客户端计算机3206的客户端应用能够访问LIMS系统软件3210。确切地说,通过API,客户端计算机3206可以访问LIMS系统200的组件,包含(但不限于)运行输入接口202、解释器204、执行引擎207、发订单引擎208、工厂210以及测试设备212和分析设备214的软件。软件即服务(SaaS)软件模块3214向客户端计算机3206提供LIMS系统软件3210即服务。云端管理模块3216管理客户端计算机3206对LIMS系统3210的访问。云端管理模块3216可以使采用多租户应用、虚拟化的云端架构或所属领域中已知的其它架构能够服务多个用户。图44描绘应用于丝状真菌宿主细胞系统的LIMS系统的实用性的原理论证。
基因组自动化
本发明方法的自动化能够同时对来自多种测试菌株变异体的目标产物进行高通量表型筛选和鉴别。
前述基因组工程改造预测建模平台是以数百和数千种突变型菌株是以高通量方式构筑为前提的。下述机器人和计算机系统是可借以进行所述高通量过程的结构性机构。
在一些实施例中,本发明教示了提高宿主细胞生产率或修复工业菌株的方法。作为这种过程的一部分,本发明教示了在盘中组装DNA、建构新菌株、筛选培养物,和在模型中筛选培养物以用于槽罐发酵的方法。在一些实施例中,本发明教示了由自动化机器人技术辅助产生和测试新宿主菌株的上述方法中的一或多种。
在一些实施例中,本发明教示了如图6A-B中所描绘的高通量菌株工程改造平台。
HTP机器人系统
在一些实施例中,本文所提供的方法和系统包括自动化步骤。举例来说,可以自动化如本文所描述的原生质体的产生、原生质体的转化、在纯化之前通过NGS筛选经转化的原生质体、通过选择/反选纯化同核体原生质体,以及在纯化之后通过NGS筛选经转化的原生质体。如本文中所描述,方法和系统可以含有筛选经纯化的同核体转化体以用于产生所关注的蛋白质或代谢物的另一步骤。本发明的自动化方法可以包括机器人系统。本文概述的系统通常可以涉及96孔或384孔微量滴定板的使用,但是如所属领域的技术人员将了解,可以使用任何数目的不同盘或配置。另外,可以自动化本文所概述步骤中的任一个或全部;因此,例如可以完全地或部分地自动化系统。自动化方法和系统可为高通量的。出于本发明的目的,高通量筛选可以指能够每天评价约1,000个或更多转化体的任何部分或完全自动化方法,并且尤其指能够每天评价5,000个或更多转化体的那些方法,并且最尤其指能够每天评价10,000个或更多转化体的方法。部分或完全自动化的方法可能需要使用一或多个液体处理步骤。
如本文所描述,本文所提供的方法和系统可包括筛选步骤,使得如本文所描述产生和纯化的转化体针对所关注产物的产生经过筛选或测试。所关注的产物可以是本文所提供的任何所关注产物,例如醇、药品、代谢物、蛋白质、酶、氨基酸或酸(例如柠檬酸)。因此,本文所提供的方法和系统可进一步包括在允许表达和分泌所关注的产物的条件下培养根据本发明的方法纯化的克隆菌落或培养物,并且回收随后产生的所关注的产物。如本文所述,所关注的产物可以是外源性和/或异源性蛋白质,或由外源性和或异源性蛋白质的表达产生的代谢物。
在一些实施例中,本发明的自动化方法包括机器人系统。本文概述的系统通常涉及96孔或384孔微量滴定板的使用,但是如所属领域的技术人员将了解,可以使用任何数目的不同盘或配置。另外,可以自动化本文所概述步骤中的任一个或全部;因此,例如可以完全地或部分地自动化系统。
在一些实施例中,本发明的自动化系统包括一或多个工作模块。举例来说,在一些实施例中,本发明的自动化系统包括DNA合成模块、载体克隆模块、菌株转化模块、筛选模块和定序模块(参见图7)。
如所属领域的技术人员将了解,自动化系统可以包含广泛多种组件,包含(但不限于):液体处理器;一或多个机器人臂;用于放置微量盘的盘处理器;盘密封件、盘穿孔机、用于去除和置换非交叉污染盘上的孔盖的自动化盖处理器;用一次性吸头进行样品分配的一次性吸头组合件;用于样品分配的可洗吸头组合件;96孔加载块;集成式热循环仪;经冷却的试剂架;微量滴定板移液管位置(任选地经冷却);用于盘和吸头的堆叠塔;磁珠处理站;过滤系统;盘振荡器;条形码阅读器和施加器;和计算机系统。图8描绘本发明的整合丝状真菌菌种选育程序的概述。
在一些实施例中,本发明的机器人系统包含使得用高通量移液执行基因靶向和重组应用工艺中的所有步骤的自动化液体和颗粒处理。这包含液体和颗粒操控,诸如抽吸、分配、混合、稀释、洗涤、精确体积转移;收回和丢弃移液管吸头;以及反复对相同体积进行移液,以从单一样品抽吸进行多次递送。这些操控是无交叉污染的液体、颗粒、细胞和生物体转移。仪器进行向过滤器、膜和/或子盘的微量盘样品的自动化复制、高密度转移、全盘串行稀释以及高容量操作。
自动化系统可以是所属领域中已知的任何已知自动化高通量系统。举例来说,自动化系统可以是在日本专利申请公开第11-304666号中描述的自动化微生物处理工具。这种装置能够转移含有个别细胞的微液滴,并且预期本发明的真菌菌株由于其形态而将适合于用这种装置对个别克隆进行微操控。用于本发明的方法和系统的自动化系统的额外实例为贝登(Beydon)等人,生物分子筛选杂志(J.Biomol.Screening)5:13 21(2000)中描述的自动化微生物高通量筛选系统。本文中使用的自动化系统可以是定制自动化液体处理系统。在一些实施例中,本发明的定制自动化液体处理系统是TECAN机器(例如定制的TECANFreedom Evo)。
在一些实施例中,本发明的自动化系统与用于多孔盘、深孔盘、方孔盘、试剂槽、试管、小试管、微量离心管、冷冻管、过滤器、微阵列芯片、光纤、珠粒、琼脂糖和丙烯酰胺凝胶的平台兼容,且将其它固相基质或平台容纳于可升级的模块化台板上。在一些实施例中,本发明的自动化系统含有至少一个模块化台板以用于多位置工作表面,以便放置来源和输出样品、试剂、样品和试剂稀释液、分析盘、样品和试剂储集器、移液管吸头和活动的吸头洗涤站。
在一些实施例中,本发明的自动化系统包含高通量电致孔系统。在一些实施例中,高通量电致孔系统能够在96或384孔盘中转化细胞。在一些实施例中,高通量电致孔系统包含
Figure BDA0002305131530001131
高通量电致孔系统、BTXTM基因脉冲发生器MXcellTM或其它多孔电致孔系统。
在一些实施例中,整合热循环仪和/或热调节器是用于稳定热交换器,诸如受控区块或平台的温度,以对培育样品提供从0℃到100℃的精确温度控制。
在一些实施例中,本发明的自动化系统与具有单个或多个磁性探针、亲和探针、复制器或移液器的可更换的机器头(单或多通道)兼容,能够以机器人方式操控液体、颗粒、细胞和多细胞生物体。多孔或多管式磁性分离器和过滤站按单个或多个样品形式操控液体、颗粒、细胞和生物体。
在一些实施例中,本发明的自动化系统与照相视觉和/或光谱仪系统兼容。因此,在一些实施例中,本发明的自动化系统能够检测和记录进行中的细胞培养中的颜色和吸收变化。
在一些实施例中,本发明的自动化系统经设计具有柔性和对于多种硬件附件具有可适应性,以允许系统执行多种应用。软件程序模块允许方法的产生、修改和运行。系统的诊断模块允许设置、仪器校准和电动机运行。定制的工具、实验室器具以及液体和颗粒转移模式允许编程和执行不同应用。数据库允许方法和参数的存储。机器人和计算机接口允许仪器之间的通讯。
因此,在一些实施例中,本发明教示了如图11和12中所描绘的高通量菌株工程改造平台。
所属领域中的技术人员将认识到,各种机器人平台能够进行本发明的HTP工程改造方法。下表3提供了能够执行如图11和12中所述的本发明HTP工程改造步骤中的每一步骤的科学设备的非排它性清单。
表3-与本发明HTP工程改造方法兼容的科学设备的非排它性清单。
Figure BDA0002305131530001141
Figure BDA0002305131530001151
Figure BDA0002305131530001161
Figure BDA0002305131530001171
计算机系统硬件
图17说明了根据本发明实施例的计算机系统800的实例,所述计算机系统800可以用于执行非暂时性计算机可读媒体(例如存储器)中所存储的程序代码。计算机系统包含输入/输出子系统802,其可以根据应用用于介接人类用户和/或其它计算机系统。I/O子系统802可以包含(例如)键盘、鼠标、图形用户接口、触摸屏,或其它用于输入的接口,以及例如LED或其它平面屏幕显示器,或其它用于输出的接口,包含应用程序接口(API)。本发明实施例的其它元件,诸如LIMS系统的组件,可以用计算机系统(如计算机系统800)实施。
程序代码可以存储于非暂时性媒体,诸如辅助存储器810或主存储器808或两者的永久性存储器中。主存储器808可以包含易失性存储器,诸如随机存取存储器(RAM),或非易失性存储器,诸如只读存储器(ROM),以及不同水平的高速缓存内存,以用于更快地访问指令和数据。辅助存储器可以包含永久性存储器,诸如固态驱动器、硬盘驱动器或光盘。一或多个处理器804从一或多个非暂时性媒体中读取程序代码且执行所述代码以使计算机系统能够实现本文实施例所进行的方法。所属领域的技术人员将了解,处理器可以摄入源码,并且将源码解释或编译成在处理器804的硬件门级处可理解的机器代码。处理器804可以包含用于处理计算密集型任务的图形处理单元(GPU)。尤其是在机器学习中,一或多个CPU 804可以将大量数据的处理分流到一或多个GPU 804。
处理器804可以通过一或多个通讯接口807(诸如网络接口卡、WiFi收发器等)与外部网络通信。总线805以通信方式耦接I/O子系统802、处理器804、周边装置806、通信接口807、存储器808和永久性存储器810。本发明的实施例不限于这种代表性架构。替代实施例可以采用不同的配置和组件类型,例如用于输入-输出组件和存储器子系统的分开的总线。
所属领域的技术人员将了解,本发明实施例中的一些或全部元件和其伴随操作可以完全或部分地通过一或多个计算机系统来实施,所述计算机系统包含一或多个处理器和一或多个存储器系统,如计算机系统800的那些处理器和存储器系统。确切地说,本文所述的LIMS系统200和任何机器人和其它自动化系统或装置的元件可以通过计算机实施。一些元件和功能可以在本地实施,且其它可以通过不同服务器通过网络以分布方式(例如以客户端-服务器方式)实施。确切地说,如图15中所示,可以使服务器侧的操作以软件即服务(SaaS)方式供多个客户使用。
术语组件在此背景中大体上是指软件、硬件或固件(或其任何组合)组件。组件典型地是能够使用所指定的输入数据来产生有用数据或其它输出数据的功能组件。组件可以是或可以不是独立的。应用程序(也称为“应用”)可以包含一或多个组件,或组件可以包含一或多个应用程序。
一些实施例包含一些、所有或不包含组件以及其它模块或应用组件。再者,各种实施例可以将这些组件中的两种或两种以上合并成单一模块和/或使这些组件中的一或多种的一部分功能与不同组件结合。
术语“存储器”可以是用于存储信息的任何装置或机构。根据本发明的一些实施例,存储器打算涵盖(但不限于):易失性存储器、非易失性存储器和动态存储器中的任何类型。举例来说,存储器可以是随机存取存储器、存储器存储装置、光学存储器装置、磁性媒体、软盘、磁带、硬盘驱动器、SIMM、SDRAM、DIMM、RDRAM、DDR RAM、SODIMMS、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、光盘、DVD和/或其类似物。根据一些实施例,存储器可以包含一或多种磁盘驱动器、闪存驱动器、数据库、本地高速缓存存储器、处理器高速缓存存储器、关系数据库、平面数据库、服务器、基于云端的平台和/或其类似物。另外,所属领域的技术人员将了解,许多其它用于存储信息的装置和技术可以用作存储器。
存储器可以用于存储指令,以便在处理器上运行一或多个应用或模块。举例来说,存储器在一些实施例中可以用于容纳执行本申请中所揭示的一或多种模块和/或应用的功能所需的所有或一些指令。
基于基因设计预测的HTP微生物菌株工程改造:示例工作流程
在一些实施例中,本发明教示了基于本发明计算分析系统的建议的新宿主生物体的定向工程改造。
在一些实施例中,本发明与所有基因设计和克隆方法兼容。也就是说,在一些实施例中,本发明教示了传统克隆技术的使用,诸如聚合酶链反应、限制酶消化、接合、同源重组、RT PCR以及所属领域中通常已知的及揭示于例如以下文献中的其它技术:萨布鲁克(Sambrook)等人(2001),分子克隆:实验室手册(Molecular Cloning:A LaboratoryManual)(第3版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),普莱恩维尤(Plainview),纽约,所述文献以引用的方式并入本文中。
在一些实施例中,所克隆的序列可以包含来自本文所教示的HTP基因设计文库中的任一种的可能性,例如:来自启动子交换文库的启动子、来自SNP交换文库的SNP、来自起始/终止密码子交换文库的起始或终止密码子、来自STOP交换文库的终止子,或来自序列优化文库的序列优化。
另外,特定构筑体中应该包含的恰当序列组合可以通过上位定位函数告知。
在其它实施例中,所克隆的序列还可包含基于合理设计(假设驱动型)的序列和/或基于其它来源(诸如科学出版物)的序列。
在一些实施例中,本发明教示了定向工程改造的方法,包含如下步骤:i)产生定制的SNP特异性DNA;ii)组装SNP特异性构筑体;iii)用SNP特异性DNA转化目标宿主细胞;和iv)环出任何选择标记物(参见图2)。
图6A描绘了本发明的菌株工程改造方法的通用工作流程,包含获取和组装DNA、组装任何必需载体、转化宿主细胞和去除选择标记物。
建构特异性DNA寡核苷酸
在一些实施例中,本发明教示了插入和/或置换和/或改变和/或删除宿主细胞生物体的DNA区段。在一些方面中,本文教示的方法涉及建构将并入宿主生物体基因组中的所关注寡核苷酸(即目标DNA区段)。在一些实施例中,本发明的目标DNA区段可以通过所属领域中已知的任何方法获得,包含:复制或从已知模板剪切、突变或DNA合成。在一些实施例中,本发明与用于产生目标DNA序列的市售基因合成产物(例如GeneArtTM、GeneMakerTM、GenScriptTM、AnagenTM、Blue HeronTM、EntelechonTM,GeNOsys有限公司,或QiagenTM)兼容。
在一些实施例中,目标DNA区段经设计以将SNP并入宿主生物体的选定DNA区域中(例如添加有益SNP)。在其它实施例中,DNA区段经设计以从宿主生物体的DNA中去除SNP(例如去除有害或中性SNP)。
在一些实施例中,本发明方法中所用的寡核苷酸可以使用所属领域中已知的酶或化学合成方法中的任一种合成。寡核苷酸可以在固体支撑物上合成,所述固体支撑物诸如受控微孔玻璃(CPG)、聚苯乙烯珠粒,或由可以含有CPG的热塑性聚合物构成的膜。寡核苷酸还可以在并行的微尺度上在阵列上使用微流体(田(Tian)等人,分子生物系统(Mol.BioSyst.),5,714-722(2009))或提供两者组合的已知技术(参见雅各布森(Jacobsen)等人,美国专利申请第2011/0172127号)合成。
在阵列上或通过微流体的合成优于常规固体支撑物合成的优势在于通过减少试剂的使用降低了成本。基因合成所需的规模低,因此通过阵列或通过微流体合成的寡核苷酸产物的规模是可接受的。然而,所合成的寡核苷酸的质量低于使用固体支撑物合成时(参见下文田(Tian);也参见施泰勒(Staehler)等人,美国专利申请第2010/0216648号)。
自从1980年代首次描述传统的四步氨基磷酸酯化学方法以来,所述化学方法已经实现大量的进步(参见例如丝兹查勒(Sierzchala)等人,美国化学学会杂志(J.Am.Chem.Soc.),125,13427-13441(2003),其使用过氧阴离子去除保护基;早川(Hayakawa)等人,美国专利第6,040,439号,其关于替代的保护基团;阿杂叶夫(Azhayev)等人,四面体(Tetrahedron)57,4977-4986(2001),其关于通用支撑物;考兹洛夫(Kozlov)等人,核苷、核苷酸和核酸(Nucleosides,Nucleotides,and Nucleic Acids),24(5-7),1037-1041(2005),其关于通过使用大孔隙CPG改良较长寡核苷酸的合成;以及丹哈(Damha)等人,NAR,18,3813-3821(1990),其关于改良的衍生作用)。
不论合成的类型,所得寡核苷酸接着可以形成用于较长的寡核苷酸的较小的建构嵌段。在一些实施例中,较小寡核苷酸可以使用所属领域中已知的方案接合在一起,诸如聚合酶链组装体(PCA)、连接酶链式反应(LCR)和热力学平衡的由内而外合成(TBIO)(参见兹阿尔(Czar)等人,生物技术趋势(Trends in Biotechnology),27,63-71(2009))。在PCA中,在多个循环(典型地约55个循环)中粘接且延长跨越所要较长产物的整个长度的寡核苷酸,以最终获得全长产物。LCR使用接合酶将两个寡核苷酸接合,所述两个寡核苷酸均粘接到第三寡核苷酸。TBIO合成始于所要产物的中心且通过使用重叠寡核苷酸而在两个方向上逐渐地延长,所述重叠寡核苷酸与位于基因的5'末端的正向股同源且与位于基因的3'末端的反向股非同源。
另一种合成较大双股DNA片段的方法是通过顶股PCR(TSP)合并较小寡核苷酸。在此方法中,多种寡核苷酸跨越所要产物的整个长度且含有相邻寡核苷酸的重叠区域。可以使用通用正向和反向引物执行扩增,且通过多个循环扩增来形成全长双股DNA产物。此产物接着可以经历任选的差错校正和进一步的扩增,其产生所要双股DNA片段最终产物。
在TSP的一种方法中,经组合而形成所要全长产物的较小寡核苷酸集合长度在40到200个碱基之间且彼此重叠至少约15到20个碱基。出于实际目的,重叠区域的长度最小应该足以确保寡核苷酸的特异性粘接且具有足够高的解链温度(Tm),以便在所用反应温度下粘接。重叠可以延伸到所给定寡核苷酸被相邻寡核苷酸完全叠覆的程度。重叠的量似乎对最终产物的质量无任何影响。组装体中的第一个和最后一个寡核苷酸建构嵌段应该含有正向和反向扩增引物的结合位点。在一个实施例中,第一个和最后一个寡核苷酸的终端序列含有互补的相同序列以允许使用通用引物。
组装DNA片段/克隆定制质体
在一些实施例中,本发明传授建构能够将所要目标DNA区段(例如含有特定SNP)插入到宿主生物体的基因组中的DNA片段的方法。图1描绘了用于增加多样性池中的变化的本发明DNA重组方法。DNA区段(诸如来自相关物种的基因组区域)可以通过物理或酶/化学方法剪切。使所切的DNA区域解链且允许其再粘接,以使得重叠的基因区域准备聚合酶延伸反应。进行后续的解链/延伸反应,直到产物再组装成嵌合DNA为止,所述嵌合DNA包括来自一或多种起始序列的元件和启动子。用于SNP交换的整个设计、产生、组装、QC、转化、环出和QC过程的通用流程示于图2中。应注意,此流程可应用于如本文所提供的其它HTP工具(例如PROswp、STOPswp)。在一些实施例中,本发明教示了产生线性DNA片段的方法,所述线性DNA片段包括目标DNA、同源臂和至少一个选择标记物(参见图45和46)。
在一些实施例中,本发明与适合于将DNA片段转化到宿主生物体(例如丝状真菌,诸如黑曲霉)中的任何方法兼容。在一些实施例中,本发明教示了可以将所要目标DNA区段克隆到其中并且从其中扩增的质体或组装载体的用途。当使用时,组装载体可以进一步包括在宿主细胞(例如酵母和/或大肠杆菌(E.coli))中繁殖可能需要的任何复制起点。在某些情况下,可以将目标DNA插入从任何存储库或目录产物获得的载体、构筑体或质体,诸如商业载体(参见例如DNA2.0定制或
Figure BDA0002305131530001221
载体)中。在某些情况下,可以将目标DNA插入从任何存储库或目录产物获得的载体、构筑体或质体,诸如商业载体(参见例如DNA2.0定制或
Figure BDA0002305131530001222
载体)中。用于产生用于最后转化诸如丝状真菌宿主细胞的宿主细胞的线性DNA片段的质体的用途可能需要合成包括待整合到宿主基因组中的所要基因的目标DNA构筑体的部分,用目标DNA构筑体的部分连同组装载体转化酵母细胞,从所述经转化的酵母细胞分离含有目标DNA构筑体的经组装质体,在大肠杆菌中繁殖经分离质体,并且在丝状真菌宿主细胞转化之前,PCR扩增来自大肠杆菌的目标DNA构筑体,以产生包括待整合到宿主基因组中的所要基因的线性DNA片段。
在替代实施例中,包括待整合到宿主基因组(例如丝状真菌细胞)中的所要基因的线性DNA片段的组装或产生可能需要使用融合PCR。融合PCR可以使用所属领域中已知的任何融合PCR方法进行,包含(例如)余(Yu)等人,真菌遗传学和生物(Fungal Genetics andBiology),第41卷,第973-981页(2004)中所述的方法,所述文献以引用的方式并入本文中。图45描绘使用融合PCR来产生两个线性DNA片段的方法,所述线性DNA片段包括在其间分摊的标记物基因(即pyrG)。概念地,融合PCR可以用于产生包括本文所提供的目标基因突变和/或可选标记物基因的构筑体中的任一种。
本文所提供的方法中使用的线性DNA片段可以包括如本文所述用于选择和/或反选的标记物。标记物可以是所属领域中已知和/或本文提供的任何标记物。线性DNA片段可进一步包括本文所提供的任何调节序列。调节序列可以是所属领域中已知或本文中提供的任何调节序列,例如宿主细胞(例如丝状真菌细胞)的基因机构所使用的启动子、起始、停止、信号、分泌和/或终止序列。
在一些实施例中,本发明的组装/克隆方法可采用以下组装策略中的至少一种:i)II型常规克隆,ii)II型S-介导或“金门(Golden Gate)”克隆(参见例如恩格勒(Engler),C.,R.康德兹(Kandzia)和S.马里约内(Marillonnet),2008“具有高通量能力的一锅一步精确克隆方法(A one pot,one step,precision cloning method with high-throughputcapability)”,公共科学图书馆·综合3:e3647;科特纳(Kotera),I.和T.长井(Nagai),2008“使用DNA聚合酶抑制剂和IIS型限制酶的粗PCR产物的高通量和单管重组(A high-throughput and single-tube recombination of crude PCR products using a DNApolymerase inhibitor and type IIS restriction enzyme)”,生物技术学刊(JBiotechnol)137:1-7.;韦伯(Weber),E.,R.格鲁兹勒(Gruetzner),S.沃尔纳(Werner),C.恩格勒和S.马里约内,2011,通过金门克隆进行的设计TAL效应子的组装(Assembly ofDesigner TAL Effectors by Golden Gate Cloning),公共科学图书馆·综合6:e19722),iii)
Figure BDA0002305131530001231
重组,iv)
Figure BDA0002305131530001232
克隆,核酸外切酶介导组装(艾斯兰迪斯(Aslanidis)和德约(de Jong)1990,“PCR产物的接合非依赖型克隆(LIC-PCR)(Ligation-independentcloning of PCR products(LIC-PCR))”,核酸研究(Nucleic Acids Research),第18卷,第20 6069期),v)同源重组,vi)非同源末端接合,vii)吉布森组装法(Gibson assembly)(吉布森等人,2009“至多数百个千碱基的DNA分子的酶组装(Enzymatic assembly of DNAmolecules up to several hundred kilobases)”自然方法(Nature Methods)6,343-345)或其组合。基于IIS型模块化的组装策略揭示于PCT公开WO 2011/154147中,其揭示内容以引用的方式并入本文中。
在一些实施例中,本发明教示了具有至少一个选择标记物的克隆载体。各种选择标记物基因在所属领域中已知,其通常编码抗生素抗性功能以便在原核细胞(例如针对安比西林(ampicillin)、卡那霉素(kanamycin)、四环素(tetracycline)、氯胺苯醇(chloramphenicol)、匀霉素(zeocin)、观霉素/链霉素(spectinomycin/streptomycin))或真核细胞(例如遗传霉素(geneticin)、新霉素(neomycin)、潮霉素(hygromycin)、嘌呤霉素(puromycin)、杀稻瘟菌素(blasticidin)、匀霉素)中在选择性压力下进行选择。其它标记系统允许所需或非所需细胞的筛选和鉴别,诸如熟知的蓝/白筛选系统,其在细菌中用于在X-gal或萤光报导子(诸如在成功转导的宿主细胞中表达的绿色或红色荧光蛋白)存在下选择阳性克隆。另一类选择标记物(其中大部分仅在原核系统中具功能性)涉及反向可选标记物基因,通常也称为“死亡基因”,其表达杀死生产细胞的毒性基因产物。所述基因的实例包含sacB、rpsL(strA)、tetAR、pheS、thyA、gata-1或ccdB,其功能描述于(雷拉特(Reyrat)等人,1998,“可反向选择的标记物:细菌遗传学和发病机理的未开发工具(Counterselectable Markers:Untapped Tools for Bacterial Genetics andPathogenesis)”,感染与免疫(Infect Immun.),66(9):4011-4017)。
图18描绘了根据本发明的一个实施例的与DNA组装相关的工作流程。这个过程可以分为4个步骤:部件产生、质体/构筑体组装、质体/构筑体QC和用于转化的质体/构筑体制备。在部件产生期间,从寡核苷酸定序供应商订购实验室信息管理系统(LaboratoryInformation Management System,LIMS)所设计的寡核苷酸,且用于通过PCR扩增来自宿主生物体的目标序列。对这些PCR部件进行清洁以去除污染物且利用片段分析、所观察到的与理论片段大小的计算机模拟质量控制比较及DNA定量来评估成功率。如图18中所示,在一个实施例中,使所述部件连同组装载体一起转化到酵母中且通过同源重组组装成质体。从酵母中分离出所组装的质体且转化到分开的酵母宿主细胞中以用于后续组装质量控制和扩增。在质体组装质量控制期间,分离出每一质体的若干个复制品,使用滚环扩增(RCA)进行扩增,且利用酶消化和片段分析来评估正确组装。在QC过程期间鉴别的正确组装的质体被挑取以产生永久储备料,并且包含促进基因组整合所必需的任何侧接序列的特定基因构筑体随后从质体进行PCR扩增以产生线性DNA片段,其在转化到目标宿主生物体(例如丝状真菌宿主细胞)中之前经由片段分析经定量和QC。同样如图18中所示,在分开的实施例中,部件经历融合PCR(例如参见图45和46)以产生线性DNA片段,其在转化到目标宿主生物体(例如丝状真菌宿主细胞)中之前经由片段和序列分析经QC。
原生质体产生方法
在一个实施例中,本文所提供的方法和系统需要由如本文所提供的多核体生物体(例如丝状真菌细胞)产生原生质体。适用于制备原生质体的程序可以是所属领域中已知的任何程序,包含(例如)EP 238,023和耶尔顿(Yelton)等人(1984,美国国家科学院院刊(美国国家科学院院刊)81:1470-1474)中所述的那些程序。在一个实施例中,原生质体是通过用一或多种溶胞酶或其混合物处理经预培养的丝状真菌细胞的培养物来产生。溶胞酶可以是β-葡聚糖酶和/或聚半乳糖醛酸苷酶。在一个实施例中,用于产生原生质体的酶混合物是VinoTaste浓缩物。许多用于预培养多核体生物体(例如丝状真菌细胞)的培养物及随后从此产生和利用原生质体以用于本文所提供的的方法和组成的参数可不同。举例来说,可以改变接种物大小、接种方法、预培养培养基、预培养时间、预培养温度、混合条件、洗涤缓冲液组成、稀释比率、溶胞酶处理期间的缓冲液组成、所用溶胞酶的类型和/或浓度、与溶胞酶一起培育的时间、原生质体洗涤程序和/或缓冲液、原生质体和/或聚核苷酸和/或转化试剂在实际转化期间的浓度、转化期间的物理参数、转化至所得转化体之后的程序。在一些情况下,可利用这些变化来优化原生质体的数目和转化效率。在一个实施例中,多核体生物体为如本文所提供的丝状真菌细胞(例如黑曲霉)。此外,对此实施例,预培养培养基可以是YPD或完整培养基。预培养培养基的体积可为至少、至多或约50ml、100ml、150ml、200ml、250ml、300ml、350ml、400ml、450ml、500ml、550ml、600ml、650ml、700ml、750ml、800ml、850ml、900ml、950ml或1000ml。预培养培养基的体积可以为约50ml到约100ml、约100ml到约150ml、约150ml到约200ml、约200ml到约250ml、约250ml到约300ml、约300ml到约350ml、约350ml到约400ml、约400ml到约450ml、约450ml到约500ml、约500ml到约550ml、约550ml到约600ml、约600ml到约650ml、约650ml到约700ml、约700ml到约750ml、约750ml到约800ml、约800ml到约850ml、约850ml到约900ml、约900ml到约950ml或约950ml到约1000ml。在一些情况下,培养多个培养物并且随后进行原生质体产生。多个培养物可以是2、3、4、5、6、7、8、9、10、12、14、16、18、20、25、50、75、100、150、200、300、400、500个或更多。在一个实施例中,通过以106个孢子/毫升接种100ml富培养基(例如YPD或完整培养基)并且在30℃下培育预培养制剂14到18小时来制备预培养制剂。在另一实施例中,通过以至少106个孢子/毫升接种500ml富培养基(例如酵母霉菌培养液、YPD或完整培养基)并且在30℃下培育预培养制剂14到18小时来制备预培养制剂。在原生质体产生之前,可通过所属领域中已知的任何方法(例如离心)分离多核体生物体。在一个实施例中,多核体生物体为丝状真菌(例如黑曲霉)。此外,对此实施例,用106个孢子/毫升丝状真菌细胞接种酵母霉菌培养液(YMB),并且在30℃下生长16小时。仍此外,对此实施例,可通过离心来分离在预培养制剂中生长的丝状真菌细胞。本文所提供的用于本文所提供的方法和组成的预培养制剂可产生用于后续原生质体产生的为约、至少或大于0.5g、1g、1.5g、2g、2.5g、3g、3.5g、4g或5g湿重的菌丝的量。多核体生物体(例如丝状真菌)的预培养/培养可以是诸如图28中所描绘的高通量系统(HTP)中的工作流程的一部分。HTP系统可以自动化或半自动化。如图28中所示,生物体的预培养可需要用106个孢子/毫升生物体(例如黑曲霉)接种小规模体积(例如100ml)的孢子形成培养基(图28中的PDA培养基)并且在30℃下生长14到16小时。如图28中所示,在预培养期间,工作流程可含有其中产生用于从预培养生物体(例如黑曲霉)产生原生质体的酶溶液的步骤。酶溶液可由在包括1.2M MgSO4的磷酸盐缓冲液中的Vinotaste pro(诺维信(Novozymes))酶混合物组成。在预培养之后,可在经由Miracloth过滤之后收集菌丝,且可通过在2.8L烧瓶中用10ul到20ml所收集菌丝接种约500ml完整培养基来培养大规模培养物。接种物大小可基于从预培养步骤获得的培养物的OD而不同。大规模培养物可以在30℃或18℃下在200rpm振荡下在80%湿度下生长6到18小时。在培养之后,可以通过在一或多次洗涤之后离心来分离培养物并且再悬浮。在一个实施例中,将培养物再悬浮于如本文所述的原生质体产生缓冲液中且经历如本文所述的原生质体产生。离心可以在500ml离心管中在4℃下在5500到6100×g下进行10到15分钟。一或多次洗涤中的每一次可在10到50ml洗涤缓冲液(例如具有10%甘油的水)中进行,接着在4℃下在5500到6100×g下离心10到15分钟。
在如上文所描述的分离之后,多核体生物体(例如丝状真菌细胞,诸如黑曲霉)可再悬浮于原生质体产生缓冲液中,以使得原生质体产生缓冲液包括一或多种如本文所提供的酶(例如VinoTaste pro浓缩物(诺维信))以用于产生原生质体。在一个实施例中,原生质体产生缓冲液具有高浓度的渗透质(例如大于或等于1M的渗透质,诸如MgSO4)。在利用具有高渗透质浓度(例如1.2M MgSO4)的原生质体产生缓冲液的实施例中,用于酶处理(例如VinoTaste pro浓缩物(诺维信))的培育时间可在约30℃下为约14到16小时。用于再悬浮的原生质体产生缓冲液的体积可以是50ml、100ml、150ml、200ml、250ml、300ml、350ml、400ml、450ml、500ml、550ml、600ml、650ml、700ml、750ml、800ml、850ml、900ml、950ml或1000ml。用于再悬浮的原生质体产生缓冲液的体积可以是可以是约50ml到约100ml、约100ml到约150ml、约150ml到约200ml、约200ml到约250ml、约250ml到约300ml、约300ml到约350ml、约350ml到约400ml、约400ml到约450ml、约450ml到约500ml、约500ml到约550ml、约550ml到约600ml、约600ml到约650ml、约650ml到约700ml、约700ml到约750ml、约750ml到约800ml、约800ml到约850ml、约850ml到约900ml、约900ml到约950ml或约950ml到约1000ml。在一个实施例中,如例如图28中所示,丝状真菌细胞生长于500ml富培养基(例如YPD或完整培养基)中,且菌丝(可为如图28中所示约1g湿质量)通过经由Miracloth过滤来分离,用100ml洗涤缓冲液(例如具有1.2M MgSO4、pH 5.5的100mM磷酸钠缓冲液)冲洗,并且在1L瓶中再悬浮于包括原生质体产生酶混合物(例如VinoTaste pro浓缩物(诺维信))的约500ml原生质体产生缓冲液(例如图28中具有1.2M MgSO4pH 5.5的100mM磷酸钠缓冲液)中。酶溶液中的菌丝可在30℃下在140rpm振荡下培育14到16小时,伴随持续经由显微检查监测原生质体形成。
在一个实施例中,向所提供的原生质体产生缓冲液中添加NHEJ路径的一或多种化学抑制剂。一或多种化学抑制剂可选自W7、氯丙嗪、香草精、Nu7026、Nu7441、味淋、SCR7、AG14361或其任何组合。将一或多种化学抑制剂添加到原生质体产生缓冲液可在原生质体产生程序期间的任一点进行。在一个实施例中,用一或多种化学抑制剂处理持续整个原生质体产生程序。在分开的实施例中,用一或多种化学抑制剂处理持续时间短于整个原生质体产生程序。用一或多种化学抑制剂处理可以持续约1、5、10、15、20、30、45、60、90、120、150、180、210、240、270或300分钟。在一个实施例中,用W-7处理多核体细胞(例如丝状真菌细胞)。在另一实施例中,用SCR-7处理多核体细胞(例如丝状真菌细胞)。
在酶处理之后,可以使用所属领域中已知的方法分离原生质体。在原生质体的分离之前,可以通过经由多孔障壁(诸如Miracloth)过滤混合物来去除未消化的菌丝片段,在所述多孔障壁中,孔大小在20到100微米范围内,以便产生经过滤的原生质体的滤液。在一个实施例中,经过滤的原生质体接着在适度水平的向心力下离心,以使得原生质体在离心管的底部形成集结粒。向心力可为约500到1500×g。在优选实施例中,所使用的向心力一般低于1000×g(例如,如图28中所示,800×g持续5分钟)。在分开的实施例中,在包括高浓度渗透质的原生质体产生缓冲液中产生原生质体之后,将大体上渗透强度较低的缓冲液温和地施加到原生质体(例如经过滤的原生质体)的表面。大体上渗透强度较低的缓冲液的实例包含包括1M山梨醇、1M NaCl、0.6M硫酸铵或1M KCl的缓冲液(例如Tris缓冲液)。在一个实施例中,如图28中所示,本文所提供的方法中使用的渗透强度较低的缓冲液为包括0.4M山梨醇并且pH值为8的山梨醇-Tris(ST)缓冲液。此分层制剂接着可离心,这可致使原生质体累积在其中其中性漂浮的管中的层处。原生质体随后可从此层分离以用于进一步处理(例如存储和/或转化)。在又一实施例中,将在包括高浓度渗透质(例如包括1.2M MgSO4、pH5.5的100mM磷酸盐缓冲液)的原生质体产生缓冲液中产生的原生质体(例如经过滤的原生质体)转移到细长收集容器(例如刻度量筒)中,并且将如本文所提供的容积渗透浓度较低的缓冲液(例如0.4M ST缓冲液,pH 8)叠加在原生质体(例如经过滤的原生质体)的表面上以产生原生质体中性漂浮的层。细长收集容器(例如刻度量筒)中的容积渗透浓度不同的缓冲液的组合可促进原生质体‘浮动’到细长收集容器(例如刻度量筒;图27)的表面。一旦在收集容器的顶部,就可以分离原生质体。在一个实施例中,生长并且经历如本文所提供的原生质体产生的500ml多核体生物体(例如丝状真菌细胞,诸如黑曲霉)的预培养制剂产生约25ml原生质体。
在原生质体分离之后,剩余的含有酶的缓冲液可以通过将原生质体再悬浮于渗透缓冲液(例如使用10mM TRIS缓冲的1M山梨醇,pH 8)中并且通过如图28中所示的离心再收集来去除。此步骤可重复。在充分去除含有酶的缓冲液之后,可以在也含有氯化钙的渗透稳定缓冲液(例如使用10mM TRIS缓冲的1M山梨醇,pH 8,50mM CaCl2)中进一步洗涤原生质体一或多次(参见例如图28)。
在分离和洗涤之后,原生质体可以再悬浮于渗透稳定缓冲液中。所述缓冲液的组成可以根据物种、应用和需求改变。然而,这些缓冲液典型地含有0.5与2M之间的有机组分,如蔗糖、柠檬酸盐、甘露醇或山梨醇。更优选0.75与1.5M之间;最优选1M。否则,这些缓冲液含有浓度在0.1与1.5M之间的无机渗透稳定组分,如KCl、(NH4)2SO4、MgSO4、NaCl或MgCl2。优选0.2与0.8M之间;更优选0.3与0.6M之间,最优选0.4M。最优选的稳定缓冲液是STC(山梨醇,0.8M;CaCl.sub.2,25mM;Tris,25mM;pH 8.0)或KCl-柠檬酸盐(KCl,0.3-0.6M;柠檬酸盐,0.2%(w/v))。原生质体可以1×105与1×1010个细胞/毫升之间或1-3×107个原生质体/毫升之间的浓度使用。浓度优选在1×106与1×109个细胞/毫升之间;浓度更优选在1×107与5×108个细胞/毫升之间;浓度最优选为1×108个细胞/毫升。为了提高转染效率,可以将载体DNA(如鲑精子DNA或非编码载体DNA)添加到转化混合物中。DNA的使用浓度在0.01与10μg之间;优选在0.1与5μg之间,甚至更优选在0.25与2μg之间;最优选在0.5与1μg之间。
在一个实施例中,在产生和后续分离及洗涤之后,将原生质体与一或多种低温保护剂混合。低温保护剂可以是二醇、二甲亚砜(DMSO)、多元醇、糖、2-甲基-2,4-戊二醇(MPD)、聚乙烯吡咯烷酮(PVP)、甲基纤维素、C-连接防冻糖蛋白(C-AFGP)或其组合。在本文提供的方法和系统中用作低温保护剂的二醇可以选自乙二醇、丙二醇、聚丙二醇(PEG)、甘油或其组合。在本文提供的方法和系统中用作低温保护剂的多元醇可以选自丙-1,2-二醇、丙-1,3-二醇、1,1,1-三-(羟基甲基)乙烷(THME)和2-乙基-2-(羟基甲基)-丙-1,3-二醇(EHMP)或其组合。在本文提供的方法和系统中用作低温保护剂的糖可以选自海藻糖、蔗糖、葡萄糖、棉籽糖、右旋糖或其组合。在一个实施例中,将原生质体与DMSO混合。DMSO可以至少、至多、小于、大于、等于或约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、12.5%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%或75%w/v或v/v的最终浓度与原生质体混合。可以在存储前将原生质体/低温保护剂(例如DMSO)混合物分布到微量滴定板中。原生质体/低温保护剂(例如DMSO)混合物可以在本文提供的任何温度(例如-20℃或-80℃)下存储如本文所提供的长期存储时间(例如数小时、数日、数周、数月、数年)。在一个实施例中,将额外的低温保护剂(例如PEG)添加到原生质体/DMSO混合物中。在又一个实施例中,在存储前将额外的低温保护剂(例如PEG)添加到原生质体/DMSO混合物中。PEG可以是本文提供的任何PEG且可以如本文所提供的任何浓度(例如w/v或v/v)添加。在一个实施例中,PEG溶液以在STC缓冲液中40%w/v来制备。随后可将20%v/v的此40%PEG-STC添加到原生质体。举例来说,800微升1.25×107原生质体将具有200微升40%PEG-STC,产生1ml的最终体积。随后可将七十微升DMSO添加到此1ml以使此制备达到7%v/vDMSO。
本文所提供的任何预培养、培养和/或原生质体产生方案可以高通量方式进行。举例来说,预培养、培养和原生质体产生可以作为工作流程的一部分进行,使得所述工作流程表示诸如图28中所描绘的高通量(HTP)方案的一部分。高通量方案可利用自动化液体处理以用于任何和/或所有步骤。
宿主细胞的转化
在一些实施例中,本发明的载体或构筑体可以使用多种技术中的任一种引入到宿主细胞(例如丝状真菌细胞或由其衍生的原生质体)中,所述技术包含转化、转染、转导、病毒感染、基因枪或Ti介导的基因转移(参见克里斯蒂(Christie),P.J.及戈登(Gordon),J.E.,2014“农杆菌Ti质体(The Agrobacterium Ti Plasmids)”微生物学谱(MicrobiolSPectr.)2014;2(6);10.1128)。具体方法包含磷酸钙转染、DEAE-聚葡萄糖介导的转染、脂质体转染或电致孔(戴维斯(Davis),L.,迪波乐(Dibner),M.,巴特(Battey),I.,1986“分子生物学基础方法(Basic Methods in Molecular Biology)”).其它转化方法包含(例如)乙酸锂转化和电致孔,参见例如杰兹(Gietz)等人,核酸研究27:69-74(1992);伊藤(Ito)等人,细菌学杂志(J.Bacterol.)153:163-168(1983);以及贝克尔(Becker)和加伦特(Guarente),酶学方法(Methods in Enzymology)194:182-187(1991)。在一些实施例中,转化的宿主细胞称为重组宿主菌株。
在一些实施例中,本发明教示了使用本发明的96孔盘机器人平台和液体处理机器高通量转化细胞。
在一个实施例中,本文提供的方法和系统需要将核酸转移到如本文所述衍生自丝状真菌细胞的原生质体中。在另一个实施例中,本文中提供的方法和系统中所用的转化具有高通量性质且/或如本文所述是部分或完全自动化的。部分或完全自动化的方法可能需要使用如本文所提供的自动化液体处理一或多种液体处理步骤。另外,对此实施例,如下进行转化:将如本文所述的构筑体或表达构筑体添加到微量滴定板的孔中,随后将利用本文所提供的方法产生的原生质体等分到微量滴定板的每一孔中。适用于转化/转染原生质体的程序可以是所属领域中已知的任何程序,包含(例如)以下文献中所述的那些程序:国际专利申请PCT/NL99/00618、PCT/EP99/202516;芬科斯坦(Finkelstein)和波耳(Ball)(编),丝状真菌的生物技术,技术和产物(Biotechnology of filamentous fungi,technologyand products),巴特沃斯-海涅曼(Butterworth-Heinemann)(1992)、班尼特(Bennett)和那苏尔(Lasure)(编),真菌的更多基因操控(More Gene Manipulations in fungi),学术出版社(Academic Press)1991),特纳(Turner),于:普勒(Puhler)(编),生物技术(Biotechnology),第二完整修订版,VHC(1992);如EP635574B中所述的原生质体融合以及Ca-PEG介导的原生质体转化。或者,丝状真菌宿主细胞或由其衍生的原生质体的转化还能够利用以下方式进行:电致孔,例如查克拉波提(Chakraborty)和卡普尔(Kapoor),核酸研究18:6737(1990)中所述的电致孔;根癌农杆菌(Agrobacterium tumefaciens)介导的转化;生物弹道引入DNA,例如如克里斯丁森(Christiansen)等人,当代遗传学(Curr.Genet.)29:100 102(1995);杜兰德(Durand)等人,当代遗传学31:158 161(1997);和巴塞罗斯(Barcellos)等人,加拿大微生物学杂志(Can.J.Microbiol.)44:1137 1141(1998)中所述;或“磁力生物弹道”转染细胞,例如美国专利第5,516,670号和第5,753,477号中所述。在一个实施例中,本文提供的方法和系统中所用的转化程序是可修正成如本文所提供的高通量和/或自动化的一种转化程序,例如PEG介导的转化。
使用本文所述方法产生的原生质体的转化可以通过使用所属领域中已知的任何转化试剂促进。适合的转化试剂可以选自聚乙二醇(PEG)、
Figure BDA0002305131530001301
HD(来自罗氏(Roche))、
Figure BDA0002305131530001302
Figure BDA0002305131530001303
(来自英杰公司(Invitrogen))、
Figure BDA0002305131530001304
(来自新英格兰生物实验室(New England Biolabs))、
Figure BDA0002305131530001305
Figure BDA0002305131530001306
(来自英伟杰公司(Invivogen))。在一个实施例中,PEG是最优选的转化/转染试剂。PEG可以不同分子量获得且可以不同浓度使用。PEG 4000优选以在10%与60%之间使用,更优选以在20%与50%之间使用,最优选以40%使用。在一个实施例中,如本文所述在存储前将PEG添加到原生质体中。
选定序列的环出
在一些实施例中,本发明教示了从宿主生物体环出DNA的选定区域的方法。环出方法可以如中岛(Nakashima)等人,2014“通过基因组编辑和基因静默进行的细菌细胞工程改造(Bacterial Cellular Engineering by Genome Editing and Gene Silencing)”,国际分子科学杂志(Int.J.Mol.Sci.)15(2),2773-2793中所述。在一些实施例中,本发明教示了从阳性转化体环出选择标记物。环出缺失技术在所属领域中已知,且描述于(替尔(Tear)等人,2014“不稳定人工基因特异性反向重复序列的切除介导了大肠杆菌中的无痕基因缺失(Excision of Unstable Artificial Gene-Specific inverted Repeats MediatesScar-Free Gene Deletions in Escherichia coli)”,应用生物化学和生物技术(Appl.Biochem.Biotech.)175:1858-1867)中。本文所提供的方法中使用的环出方法可以使用单一交叉同源重组或双重交叉同源重组进行。在一个实施例中,如本文所述环出选定区域可能需要使用如本文所述的单一交叉同源重组。
首先,将环出构筑体插入宿主生物体基因组内的选定目标区域中(例如通过同源重组、CRISPR或其它基因编辑技术)。在一个实施例中,在一或多个构筑体与宿主细胞基因组之间使用双重交叉同源重组,以便整合一或多个构筑体,诸如图3中所描绘。所插入的一或多个构筑体可以用是现有或引入的邻近宿主序列的直接重复序列的序列设计,以使得直接重复序列侧接预定环出和缺失的DNA区域。一旦插入,含有环出一或多个构筑体的细胞可以针对选择区域的缺失而被反选(例如参见图4;不具有对于选择基因的抗性)。在图36-37中描绘环入和环出过程的进一步说明。
所属领域中的技术人员将认识到,环出程序的描述仅表示用于从基因组删除不合需要的区域的一种说明性方法。实际上,本发明的方法与用于基因组缺失的任何方法兼容,包含(但不限于)通过CRISPR、TALENS、FOK或其它核酸内切酶进行的基因编辑。所属领域的技术人员还将了解通过同源重组技术能够置换基因组的不合需要区域。
用于转化的构筑体
在一个实施例中,本文所提供的方法和系统需要用至少一种核酸转化或转染丝状真菌细胞或由其衍生的原生质体。转化或转染可以使用本文所述的方法和试剂。可使用本文中所提供的方法中的任一种进行原生质体的产生。原生质体产生和/或转化可以是如本文所提供高通量和/或自动化的。核酸可以是DNA、RNA或cDNA。核酸可以是聚核苷酸。用于使用本文所提供的方法和系统转化丝状真菌细胞或由其衍生的原生质体的核酸或聚核苷酸可以是相对于变异体菌株和/或亲本菌株的内源基因或异源基因。内源基因或异源基因可编码如本文所述的所关注的产物或蛋白质。如本文所述,所关注的蛋白质可以指需要在丝状真菌中表达的多肽。所述蛋白质可以是酶、衬底结合蛋白质、表面活性蛋白质、结构蛋白质或其类似物,并且可以高水平表达,并且可以是出于商业化目的。所关注的蛋白质可以细胞内表达或以分泌的蛋白质形式表达。内源基因或异源基因可包括突变和/或处于一或多种基因控制或调节元件的控制下或可操作地连接到一或多种基因控制或调节元件。突变可以是本文所提供的任何突变,例如插入、缺失、取代和/或单核苷酸多形现象。一或多种基因控制或调节元件可以是启动子序列和/或终止子序列。内源基因或异源基因可以存在于一个表达构筑体上,或跨越多个表达构筑体分摊,诸如图36-38中所示。当跨越多个表达构筑体分摊时,内源基因或异源基因的每一部分可包括突变和/或处于一或多种基因控制或调节元件的控制下或可操作地连接到一或多种基因控制或调节元件。在一个实施例中,内源基因或异源基因是二分的,其中所述内源基因或异源基因拆分成两个部分,使得所述两个部分中的每一个存在于分开的构筑体上。在一个实施例中,基因是真菌SNP_9(SEQ ID NO:11)、真菌SNP_12(SEQ ID NO:12)、真菌SNP_18(SEQ ID NO:13)或真菌SNP_40(SEQ ID NO:14)。在另一实施例中,基因为融合到或可操作地连接到来自表1的启动子中的任一种的真菌SNP_9(SEQ ID NO:11)、真菌SNP_12(SEQ ID NO:12)、真菌SNP_18(SEQ ID NO:13)或真菌SNP_40(SEQ ID NO:14)。在一个实施例中,基因是真菌SNP_18(SEQ ID NO:13)。在另一实施例中,基因为融合到或可操作地连接到来自表1的man8p或amy8p启动子的真菌SNP_18(SEQID NO:13)。
启动子序列和/或终止子序列可以相对于变异体菌株和/或亲本菌株为内源或异源性。启动子序列可以可操作地连接到待表达的序列的5'端。多种已知真菌启动子可能在本发明的宿主菌株中具有功能性,例如以下的启动子序列:C1内切葡聚糖酶、55kDa纤维二糖水解酶(CBH1)、甘油酸-3-磷酸去氢酶A、来自金孢霉属的卢氏金孢霉GARG 27K和30kDa木聚糖酶(Xy1F)启动子,以及例如以下中所描述的曲霉启动子:美国专利第4,935,349号;第5,198,345号;第5,252,726号;第5,705,358号;和第5,965,384号;以及PCT申请WO 93/07277。在一个实施例中,本文所提供的方法和系统中使用的启动子为可诱导型启动子。可诱导型启动子可以是转录活性受存在或不存在化学物质(例如醇、四环素、类固醇、金属或所属领域中已知的其它化合物)调节的任何启动子。可诱导型启动子可以是转录活性受存在或不存在光或低或高温调节的任何启动子。在一个实施例中,可诱导型启动子是由葡萄糖抑制的分解代谢物(例如参见图37),例如黑曲霉淀粉酶B基因的启动子。在一个实施例中,可诱导型启动子选自丝状真菌基因,诸如srpB基因、amyB基因、manB基因或mbfA基因。在一个实施例中,可诱导型启动子选自表1中列出的启动子。
终止子序列可以可操作地连接到待表达的序列的3'端。多种已知真菌终止子可能在本发明的宿主菌株中具有功能性。实例为构巢曲霉trpC终止子、黑曲霉α-葡糖苷酶终止子、黑曲霉葡糖淀粉酶终止子、白霉菌米黑(Mucor miehei)羧基蛋白酶终止子(参见美国专利第5,578,463号)、金孢霉终止子序列(例如EG6终止子)和里氏木霉(Trichodermareesei)纤维二糖水解酶终止子。在一个实施例中,终止子序列是直接重复序列(DR)。在一个实施例中,本发明的转录终止子序列可选自表1.1中列出的终止子序列或表1.1中提供的终止序列的直系同源物。举例来说,如果宿主细胞为曲霉,那么终止序列可以是选自表1.1的非曲霉终止序列的直系同源物。
在一个实施例中,由丝状真菌细胞产生的原生质体用两种或两种以上核酸或聚核苷酸共转化。此外,对此实施例,两种或两种以上聚核苷酸中的至少一种为相对于产生原生质体的丝状真菌菌株的内源基因或异源基因,并且两种或两种以上聚核苷酸中的至少一种为可选标记物的基因。可选标记物基因可以是如本文所提供的任何可选标记物。如本文所描述,两种或两种以上核酸或聚核苷酸中的每一种可拆分成分开的部分,使得每一分开的部分存在于分开的构筑体(参见图36-38)上。
在一个实施例中,用于转化或转染丝状真菌细胞或由其衍生的原生质体的每一核酸或聚核苷酸包括序列,其与在核酸或聚核苷酸的5'、3'或5'及3'末端上待转化的存在于丝状真菌细胞或由其衍生的原生质体的基因组的预定目标基因座中的DNA序列同源。核酸或聚核苷酸可以是相对于用于转化的丝状真菌细胞的内源基因或异源基因,或可选标记物基因,使得与丝状真菌宿主细胞基因组中的预定基因座同源的序列侧接内源、异源或可选标记物基因。在一个实施例中,使用所属领域中已知的任何方法将每一核酸或聚核苷酸克隆到克隆载体中,所述克隆载体例如
Figure BDA0002305131530001331
(Stratagene)。适合克隆载体可以是能够在所使用的丝状真菌宿主细胞的染色体中的预定目标基因座处整合的克隆载体。优选的整合克隆载体可包括DNA片段,其与待删除或置换的DNA序列同源以将克隆载体的整合靶向到此预定基因座。为了促进靶向整合,克隆载体可在宿主细胞或由其衍生的原生质体的转化之前经线性化。优选地,进行线性化以使得克隆载体的至少一个但优选地任一末端侧接与待删除或置换的DNA序列同源的序列。在一些情况下,可以例如通过在待整合的核酸或聚核苷酸的两侧上的PCR添加DNA的短同源片段。侧接待整合的核酸或聚核苷酸序列的同源序列的长度优选地小于2kb,甚至优选地小于1kb,甚至更优选地小于0.5kb,甚至更优选地小于0.2kb,甚至更优选地小于0.1kb,甚至更优选地小于50bp并且最优选地小于30bp。侧接待整合的核酸或聚核苷酸序列的同源序列的长度可以在约30bp到约1000bp、约30bp到约700bp、约30bp到约500bp、约30bp到约300bp、约30bp到约200bp及约30bp到约100bp之间变化。用于转化丝状真菌细胞或由其衍生的原生质体的核酸或聚核苷酸可以表达盒形式存在。在一个实施例中,克隆载体是pUC19。此外,对此实施例,含有如本文所提供的标记物序列的克隆载体可以通过使用如所属领域中已知的吉布森组装法建构构筑体来与靶向序列结合。或者,可以通过融合PCR添加靶向序列。未与标记物连接的用于共转化的靶向序列可以从基因组DNA扩增。
理论上,可以选择丝状真菌基因组中的所有基因座以用于靶向整合包括本文所提供的核酸或聚核苷酸的表达盒。优选地,其中将发生靶向的基因座使得当存在于此基因座的野生型基因已被包括于表达盒中的基因置换时,所获得的突变型将呈现可通过给定分析法检测到的变化,所述分析法例如如本文所述的选择/反选流程。在一个实施例中,由如本文所述的丝状真菌细胞产生的原生质体用第一构筑体或表达盒和第二构筑体或表达盒共转化,使得第一构筑体或表达盒经设计以整合到原生质体基因组的第一基因座中,而第二构筑体或表达盒经设计以整合到原生质体基因组的第二基因座中。为了促进整合到第一基因座和第二基因座中,第一构筑体或表达盒侧接与第一基因座同源的序列,而第二构筑体或表达盒侧接与第二基因座同源的序列。在一个实施例中,第一构筑体或表达盒包括内源基因的序列,而第二构筑体包括可选标记物基因的序列。此外,对于这一实施例,第二基因座含有存在于本文所提供的方法和系统中所用的原生质体基因组中的额外可选标记物基因的序列,而第一基因座含有存在于本文所提供的方法和系统中所用的原生质体基因组中的内源目标基因的序列。在分开的实施例中,第一构筑体或表达盒包括内源基因或异源基因的序列,而第二构筑体包括第一可选标记物基因的序列。此外,对于此分开的实施例,第二基因座含有存在于本文所提供的方法和系统中所用的原生质体基因组中的第二可选标记物基因的序列,而第一基因座含有存在于本文所提供的方法和系统中所用的原生质体基因组中的第三可选标记物基因的序列。在以上实施例中的每一个中,内源基因和/或异源基因可包括如本文所提供的突变(例如SNP)和/或基因控制或调节元件。
同核体原生质体的纯化
如所属领域的技术人员将了解,衍生自丝状真菌的原生质体通常可含有超过一个核,使得如本文所提供的用构筑体(例如插入DNA片段)的后续转化可产生为异核体的原生质体,使得构筑体(例如插入DNA片段)仅并入到存在于原生质体中的多个核的子集中。为了减少在转化之后的异核体原生质体的数目或百分比,可以采用策略以增加在转化之前衍生自丝状真菌宿主细胞的原生质体群体中的单核原生质体百分比,其例如使用朗西罗(Roncero)等人,1984,突变研究(Mutat.Res.)125:195中描述的方法,其内容以全文引用的方式并入本文中。
在另一实施例中,本文提供一种用于分离衍生自个别孢子的克隆群体的方法。在一些情况下,个别真菌孢子在原生质体的基因扰动之后从衍生自真菌菌株的所述原生质体形成孢子。用于分离衍生自个别孢子的克隆群体的方法可有助于或辅助使用本文所提供的方法中的任一种在基因扰动之后分离同核体真菌菌株。此外,对此实施例,可再悬浮多个孢子(例如,最终衍生自丝状真菌细胞或菌株的孢子)以产生液体悬浮液,且可将液体悬浮液的离散体积中的个别孢子放置或分布到衬底(例如微量滴定板)的孔或反应区域中。微量滴定板可以是96孔、384孔或1536孔盘。
为了实现微量滴定板中的每一反应区域或孔含有单一个别真菌孢子或不含有真菌孢子的较高统计概率,可稀释再悬浮的多个孢子。在一个实施例中,稀释使得孢子的悬浮液处于一定浓度,其中悬浮液的分配或离散体积含有一个或不含孢子的概率遵循泊松分布(Poisson Distribution)。此外,对此实施例,大于90%的孔将不含有孢子且因此是空的。在其余孔中,大于90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%的孔将具有单一细胞,且小于2%、1%、0.5%或0%将具有2个或更多个细胞。孢子悬浮液的分配可以使用本文所提供的(参见表3)和/或所属领域中已知的任何液体处理装置来实现。
在另一实施例中,在再悬浮和稀释多个孢子之后,针对离散体积中存在或不存在单一个别真菌孢子,对悬浮液的离散体积进行筛选。此外,对此实施例,如果悬浮液的离散体积仅含有单一个别真菌孢子,那么将所述离散体积分布、置放或分配到孔或反应区域中。可以使用本文所提供的(参见表3)和/或所属领域中已知的任何单一细胞/孢子分配装置进行筛选。在一个实施例中,装置以光学方式鉴别单一细胞或孢子。所述装置可以是FACS装置、CellenONE装置、Cytena单一细胞打印机或伯克利灯标装置。在再悬浮和稀释之前,可以使用本文中提供的(参见表3)和/或所属领域中已知的任何装置来挑取或分离多个个别真菌孢子。孢子的再悬浮和稀释可以使用本文所提供的(参见表3)和/或所属领域中已知的任何装置实现。
在针对离散体积中存在或不存在单一个别真菌孢子进行筛选之后,本文所描述的用于将个别孢子分布或分配到包括孔或反应区域的衬底的孔或反应区域的方法可使得至少70%、75%、80%、85%、90%、95%、99%或99.5%的衬底中的孔或反应区域含有来自多个孢子的单一个别活孢子。使用本文所描述的用于将个别孢子分布到包括孔或反应区域的衬底的孔或反应区域的方法可使得超过70%、75%、80%、85%、90%、95%、99%或99.5%的衬底中的孔或反应区域含有来自多个孢子的单一个别活孢子。使用本文所描述的用于将个别孢子分布到包括孔或反应区域的衬底的孔或反应区域的方法可使得大体上所有衬底中的孔或反应区域含有来自多个孢子的单一个别活孢子。使用本文所描述的用于将个别孢子分布到包括孔或反应区域的衬底的孔或反应区域的方法可使得所有或100%的衬底中的孔或反应区域含有来自多个孢子的单一个别活孢子。使用本文所描述的用于将个别孢子分布到包括孔或反应区域的衬底的孔或反应区域的方法,可使得存在超过或至少70%、75%、80%、85%、90%、95%、99%或99.5%的微量滴定板中的孔含有单一个别活孢子的统计概率。使用本文所描述的用于将个别孢子分布到包括孔或反应区域的衬底的孔或反应区域的方法,可使得存在所有或大体上所有微量滴定板中的孔含有单一个别活孢子的统计概率。衬底可以是微量滴定板。微量滴定板可以是96孔、384孔或1536孔盘。
多个个别真菌孢子可衍生自丝状真菌菌株。丝状真菌菌株可选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉属、胶霉属、腐殖菌属、肉座菌属、毁丝菌属(例如嗜热毁丝霉)、白霉菌属、红霉菌属、青霉属、柄孢壳属、射脉菌属、瘤胃壶菌属、梨胞霉属、根毛霉属、根霉属、裂殖菌属、革节孢属、孢子丝菌属、踝节菌属、嗜热子囊菌属、梭孢壳霉属、栓菌属、弯颈霉菌属、木霉属、轮枝孢属、小包脚菇属物种,或其有性世代或无性世代,以及其同义词或分类等效物。在一个实施例中,丝状真菌菌株为黑曲霉。在另一实施例中,丝状真菌菌株具有非菌丝体形成表型。在又一实施例中,丝状真菌菌株具有非功能性非同源末端接合(NHEJ)路径。可以通过将细胞暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。
用于再悬浮多个个别孢子的液体可以是培养基或缓冲液。此外,孔或反应区域可包括选择性培养基,其可用以选择含有特定基因扰动的孢子,使得在包括对基因变异具有选择性的培养基的反应区域或孔中培养所分布的个别真菌孢子有助于鉴别和选择衍生自含有所要基因扰动的个别孢子的菌落。
另外或除了在转化之前采用策略以增加单核原生质体的数目或百分比之外,可以采用策略以驱动原生质体(和在所述原生质体再生之后由其衍生的菌落)在转化后为同核体,而不管其是单核还是多核。如本文所提供,增加对于所要或所关注目标基因为同核体的原生质体(和由其衍生的菌落)的数目或百分比,可需要对衍生自经转化的原生质体或经转化的原生质体群体的菌落基于存在和/或不存在一或多种可选标记物而进行选择和/或反选。一或多种可选标记物可以是如本文所提供的任何可选标记物或可选标记物的组合,并且选择和/或反选流程可以是如本文所提供的任何所述流程。
同核体转化体的鉴别
通过本文中所提供的方法产生的同核体转化体可以通过使用表型筛选、基于序列的筛选或其组合来鉴别。换句话说,表型筛选、基于序列的筛选或其组合可以用于检测在用构筑体(例如插入DNA片段)转化所述原生质体之后衍生自原生质体的菌落中存在或不存在亲本基因型。根据一或多种可选标记物基因的引入和/或损失,可以在对所述转化体进行如本文所提供的选择和/或反选流程之前和/或之后,进行同核体转化体的鉴别或检测。表型筛选可用以鉴别具有可辨别表型(生长的变化和/或比色变化)的转化体,而基于序列的筛选可用以鉴别在如本文所提供的一或多构筑体的转化和整合之后具有或不具有可辨别表型的转化体。
基于序列的筛选
如本文中所描述,基于序列的筛选可用于确定在转化体中存在或不存在所要或目标构筑体。以此方式,基于序列的定序可以用于评估所要基因或构筑体的整合是否已经在特定转化体中发生。基于序列的筛选可以用于测定含有所要基因、突变或构筑体的多核细胞或多核细胞群体中的核的百分比。此外,基于序列的筛选可用于测定已经经历所要目标整合的转化体群体的百分比。构筑体可以是如本文所述的任何构筑体或多个构筑体。在一些情况下,如果包括所要基因、突变或构筑体的核与不具有所述所要基因、突变或构筑体的核的百分比或比率低于某一阈值,那么基于序列的筛选的结果可用于选择纯化流程(例如同核体纯化)。
一般来说,基于序列的筛选可能需要分离可能含有所要突变或构筑体的转化体。每一转化体可以含有一或多个核,使得多个核中的一个或每个含有在转化期间引入的核酸的片段(例如包括突变的一或多个构筑体或基因)。转化可以是具有如本文所提供的DNA的特定片段(例如包括突变的一或多个构筑体或基因)的原生质体的靶向转化。
在一些情况下,在分离之后,基于序列的筛选需要使含有核与目标基因(引入的构筑体)和野生型或亲本基因两者的混合物的转化体繁殖在影响目标基因的纯度(即选择性培养基)或可对于任何特定表型或特点完全无选择性的培养基上,由此产生衍生自转化体的菌落。在一个实施例中,将每一经分离的转化体或由其衍生的菌落的一部分转移到或放置在微量滴定板的孔中,所述微量滴定板例如是包括琼脂的Omnitray(参见图30和图31中的种子盘),转化体或由其衍生的菌落的一部分在所述琼脂中形成孢子。微量滴定板可以是96孔、384孔或1536孔微量滴定板。
在单独或与繁殖组合的分离之后,可以从转化体或由其衍生的菌落或孢子提取核酸(例如DNA)。如图30中所示,可以从衍生自转化体的孢子分离核酸,并且可以微量滴定板形式进行,并且可以利用自动化液体处理。核酸的提取可使用所属领域中已知的任何已知核酸提取方法和/或市售试剂盒(例如PrepmanTM(赛默飞世尔科技))进行。在一个实施例中,使用允许DNA扩增的沸腾制备(boil prep)方法从衍生自转化体的孢子提取核酸(参见图32)。沸腾制备方法可以包含将孢子接种到少量生长培养基中。在一个实施例中,将孢子分进适合于PCR的盘中的96个孔中,其中每一孔包括少量生长培养基。可允许孢子生长10到16小时,这可帮助孢子抛弃可抑制PCR的色素。另外,生长还可促进若干回合的核分裂,其可用来增加每一孔的基因组DNA含量。随后,隔夜“迷你培养物”可接着补充有缓冲液,其有助于细胞溶解以及使将在溶解期间释放的DNA稳定。合适的缓冲液的一个实例可为PrepManUltra(赛默飞世尔)。合适的缓冲液的其它实例可包含含有少量离子清洁剂的Tris缓冲溶液。接着可在热循环仪中将迷你-培养物-缓冲液混合物加热到99℃,持续在15分钟与1小时之间的培育时间范围中的任一个。
在提取核酸之后,可以进行基于序列的筛选以评估包括所引入的目标基因或构筑体的目标或突变型核与亲本核(即非转化核)的百分比或比率。基于序列的筛选可以是所属领域中已知的可以用于测定或检测核酸的序列的任何方法。用于进行基于序列的筛选的方法可以选自核酸定序方法或基于杂交的分析法或方法。本文中所提供的方法利用的核酸定序分析法或技术可以是下一代定序(NGS)系统或分析法。用于检测特定核酸序列的基于杂交的分析法可能需要使用微阵列或nCounter系统(Nanostring)。在进行基于序列的筛选之前,可以使用具有引导到目标基因的引物对的PCR扩增所提取的核酸。
在利用核酸定序方法的实施例中,PCR中利用的引物对可包括衔接子序列,其可随后用于使用经编码的标引引物的二级扩增中。通过二级扩增反应产生的扩增子随后可以使用多重定序来定序,其中定序引物被引导到经编码的标引引物。定序可以使用所属领域中已知的任何类型的定序进行。在一个实施例中,定序为下一代定序(NGS)。NGS可为所属领域中已知的任何已知NGS方法,例如启迪公司NGS。图30描绘工作流程的实施例,其中以自动化或半自动化方式进行转化、孢子形成、核酸提取和基于NGS的基于序列的筛选。如图25、26、34和35中所示,可接着使用来自多重定序反应的数据确定存在或不存在目标核。在一些情况下,来自多重定序反应的数据还可以用于测定目标孔内的转化体的亲本核与突变型核的比率(参见图34和35)。此外,对此实施例,可产生标准曲线以便定量亲本与突变型核的百分比或比率。标准曲线可以通过扩增和定序从含有已知比率的亲本与突变型核(诸如图33中所示)的菌株分离的核酸,且随后使用出现在已知比率中的亲本与突变型扩增子的比率来测定测试样品的纯度的近似值来产生。用于产生标准曲线的菌株可以在与测试样品相同的一组盘中处理(例如分离、繁殖和提取)。
在一个实施例中,基于序列的定序在选择和/或反选之后使用,以便评估或确定每一转化体的同核体状态。选择和/或反选后的基于序列的定序可以使用如本文所述的多重定序并且可以是自动化或半自动化的。选择和/或反选后的基于序列的定序还可利用如本文中所描述的标准曲线的产生作为确定是异核体的转化体的存在和/或量(例如比率)的手段。
使用基于序列的筛选来测定转化体的纯度
如本文所论述,本文所提供的方法、系统和工作流程中由多核体宿主细胞(例如丝状真菌宿主细胞)产生的原生质体可以是多核的。随后,用一或多种构筑体(诸如本文所提供的那些构筑体)转化的原生质体可以仅含有其多个核的一部分或一定百分比,其中一或多个特定构筑体整合到其基因组中。取决于经转化的构筑体的性质,由于存在于菌落中的核的混合群体的存在,衍生自经转化的原生质体的菌落可能不会产生可辨别的表型。因此,对于测定在核的混合群体中,含有一或多个所要构筑体的核相对于不含有一或多个所要构筑体的那些核的百分比,使用基于序列的筛选可能是必不可少的。图33-35展示基于NGS的筛选用于检测在含有具有核的混合群体的细胞的菌落中的亲本相对于突变型核的效用。在一个实施例中,使用基于NGS的筛选鉴别含有所要百分比的具有所引入的一或多个构筑体的核的转化体或由其衍生的菌株。所要百分比可以是阈值百分比,其中处于或高于所述阈值百分比的转化体或由其衍生的菌株产生所要的所关注的产物或其含量。所关注的产物可以选自表2中列出的产物。所要百分比可以是50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%。百分比可通过利用如本文所描述的标准曲线来测定。
表型筛选
如本文所述,表型筛选可与基于序列的筛选或转化体组合使用。在一些情况下,基于序列的筛选的结果可用于确定纯化流程以便确保同核体转化体的分离。此外,可以在表型筛选/纯化之后利用基于序列的筛选,以便评估通过表型筛选/纯化获得的分离物是否是同核体。
使用本文所提供的方法、组成或系统产生的转化体的表型筛选可以使用一或多种可选标记物。可选标记物通常可编码基因产物,其提供对于非转化菌株是外来性的特定类型的抗性。一般来说,这可以是对重金属、抗生素或杀生物剂的抗性。原养型还可为非抗生素种类的有用可选标记。营养缺陷型标记物可以在宿主细胞中产生营养缺乏,并且校正那些缺乏的基因可以用于选择。
所属领域中使用广泛的选择标记物,并且这些标记物中的任一种或全部可以应用于本文所提供的方法和系统。本文中使用的可选标记物基因可以是营养缺陷型标记物、原养型标记物、显性标记物、隐性标记物、抗生素抗性标记物、分解代谢标记物、酶标记物、荧光标记物、发光标记物或其组合。这些标记物的实例包含(但不限于):amdS(乙酰胺/氟乙酰胺)、ble(博来霉素(belomycin)-腐草霉素(phleomycin)抗性)、hyg(潮霉素R(hygromycinR))、nat(诺尔斯菌素R(nourseotricin R))、pyrG(尿嘧啶/5FOA)、niaD(硝酸盐/氯酸盐)、sutB(硫酸盐/硒酸盐)、eGFP(绿色荧光蛋白)和所有不同颜色变异体、aygA(比色标记物)、met3(甲硫氨酸/硒酸盐)、pyrE(乳清酸P-核糖基转移酶)、trpC(邻氨基苯甲酸合成酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦乙酰基转移酶)、突变乙酰乳酸合成酶(磺酰脲抗性)和新霉素(neomycin)磷酸转移酶(氨基糖苷阻力)。
在一个实施例中,单一选择标记物用于检查多核体生物体的基因组中目标基因的特定突变的表型效应。多核体生物体可以是丝状真菌,诸如黑曲霉。目标基因可以是涉及生物合成路径的基因,例如涉及柠檬酸生产的基因。这种类型的实施例的实例可见于图39中。在图39顶部,包括与涉及黑曲霉中柠檬酸生产的基因同源的序列侧接的pyrG基因的缺失构筑体被引入到包括有包括突变(例如SNP)且不具有原生pyrG基因的柠檬酸产生基因的型式的宿主原生质体中。pyrG构筑体的同源重组产生可以基于如本文所述的pyrG基因的存在选择的转化体。此外,转化体可以具有可以用于告知所述突变在路径中起的作用的缺失表型。或者,图39的底部描绘实施例,其中将包括涉及柠檬酸产生的具有与宿主原生质体中的原生pyrG基因座同源的序列侧接的特定突变(例如SNP)的基因的构筑体引入到宿主原生质体中。构筑体与原生pyrG基因座之间的同源重组可以产生可以通过在包括FOA的培养基上生长所述转化体来选择的转化体。然后可以如本文所述评估所引入的SNP的表型效应。
本发明的另一个实施例需要使用在丝状真菌中具有活性的两种或两种以上选择标记物。可以使用广泛的选择标记物的组合,并且其全部可以应用于本文所提供的选择/反选流程中。举例来说,选择/反选流程可利用营养缺陷型标记物、原养型标记物、显性标记物、隐性标记物、抗生素抗性标记物、分解代谢标记物、酶标记物、荧光标记物和发光标记物的组合。第一标记物可用于在正向模式(即如果已发生主动整合)中选择,而额外标记物可用于在反向模式(即如果已发生在合宜的基因座处的主动整合)中选择。选择/反选可以通过共转化进行,使得选择标记物可以在分开的载体上或可以在与如本文所述的内源或异源基因相同的核酸片段或载体中。
在一个实施例中,本发明的同核体原生质体纯化流程需要共转化原生质体产生形式丝状真菌宿主细胞,其具有包括内源基因或异源基因的序列的第一构筑体和包括第一可选标记物基因的序列的第二构筑体,以使得第一构筑体针对包括待去除或不活化的目标基因的序列的原生质体基因组的第一基因座,而第二构筑体针对包括第二可选标记物基因的序列的原生质体基因组的第二基因座。在一个实施例中,第一构筑体包括内源基因或异源基因的序列,并且待去除或不活化的目标基因是针对第三可选标记物基因。在分开的实施例中,第一构筑体包括内源基因的序列,并且待去除或不活化的目标基因是在转化之前存在于原生质体的基因组中的内源基因的复本。如本文所述,第一构筑体的内源基因或异源基因可包括突变(例如SNP)和/或基因调节或控制元件(例如启动子和/或终止子)。第一、第二和/或第三可选标记物可以是所属领域中已知和/或本文中所描述的任何营养缺陷型标记物、原养型标记物、显性标记物、隐性标记物、抗生素抗性标记物、分解代谢标记物、酶标记物、荧光标记物、发光标记物。为了针对特定基因座,构筑体中的每一种侧接与如本文所述的原生质体基因组中的所要基因座同源的核苷酸。
其中第一构筑体包括内源基因或异源基因的序列,并且待去除或不活化的目标基因是针对第三可选标记物基因的实施例的实例展示于图23A中。在本实例中,第一构筑体包括涉及丝状真菌中的柠檬酸生产的包括整合到比色可选标记物基因aygA的基因座中的SNP的内源基因的序列,而第二构筑体包括整合到营养缺陷型标记物基因met3的基因座中的营养缺陷型标记物基因pyrG的序列。在本实例中,丝状真菌宿主细胞是pyrG阴性或尿嘧啶营养缺陷型。因此,同核体原生质体转化体的纯化需要在不具有尿嘧啶的基本培养基上生长所述转化体。如图23A中所示,同核体转化体不仅将为尿嘧啶原养型微生物,而且颜色还将为纯黄色,指示pyrG基因的并入和aygA基因的去除。可以通过随后在含有硒酸盐(从而具有met3+核的转化体将在硒酸盐存在下死亡)的基本培养基(具有或不具有尿嘧啶)上涂转化体来实现任何残余异核体菌落的反选和去除。类似于met3基因运作的另一标记物可以是例如编码硝酸还原酶的niaA基因,其可以用于此实施例中所描述的选择/反选流程。对于niaA基因,丝状真菌宿主细胞可以是niaA+,由此第二构筑体的正确整合产生对在反选期间使用的氯酸盐具有抗性的niaA-后代。在一个实施例中,通过使用例如下一代定序(NGS)对原生质体的基因组定序来确认将第一和/或第二构筑体正确整合到原生质体基因组中。
其中第一构筑体包括内源基因的序列,并且待去除或不活化的目标基因是在转化之前存在于原生质体的基因组中的内源基因的复本的实施例的实例展示于图24中。在本实例中,第一构筑体包括涉及丝状真菌中的柠檬酸生产的包括整合到不具有SNP的内源基因的基因座中的所述SNP的所述内源基因的序列,而第二构筑体包括整合到比色标记物基因aygA的基因座中的营养缺陷型标记物基因pyrG的序列。在本实例中,丝状真菌宿主细胞是pyrG阴性或尿嘧啶营养缺陷型。因此,同核体原生质体转化体的纯化需要在不具有尿嘧啶的基本培养基上生长所述转化体。如图24中所示,同核体转化体不仅将为尿嘧啶原养型微生物,而且颜色还将为纯黄色,指示pyrG基因的并入和aygA基因的去除。在一个实施例中,通过使用例如下一代定序(NGS)对原生质体的基因组定序来确认将第一和/或第二构筑体正确整合到原生质体基因组中。所使用的NGS系统或方法可为所属领域中已知的任何NGS系统或方法,例如启迪公司NGS。
在一个实施例中,第二构筑体包括编码可再循环或可逆标记物的表达盒。可再循环或可逆标记物可以是破坏neo-pyrG-neo表达盒。neo-pyrG-neo构筑体可以在丝状真菌宿主细胞(例如黑曲霉)的ura-菌株中用如以上实施例中所描述的第一构筑体共转化,并且同核体转化体可以通过涂在尿嘧啶不足培养基上和选择如上文所描述的纯黄色尿嘧啶原养型微生物来选择。随后,pyrG选择的使用可以通过以下来再生:将所述同核体转化体涂在含5-FOA培养基上,且选择生长在所述5-FOA培养基上的转化体,其指示所述转化体已经经历neo重复序列之间的染色体内重组,其引起pyrG基因的切除。
在另一实施例中,代替如本文所提供的共转化,本发明的同核体原生质体纯化流程需要用包括特定基因的序列(使得构筑体针对包括待去除或不活化的目标基因的序列的原生质体基因组的所要基因座)的缺失构筑体转化原生质体产生形式丝状真菌宿主细胞。为了针对特定基因座,构筑体侧接与如本文所述的原生质体基因组中的所要基因座同源的核苷酸。这种类型的构筑体/转化的使用可以用于提供关于特定基因在特定生物化学路径中起的作用的信息。在一个实施例中,通过使用例如下一代定序(NGS)对原生质体的基因组定序来确认将缺失构筑体正确整合到原生质体基因组中。所使用的NGS系统或方法可为所属领域中已知的任何NGS系统或方法,例如启迪公司NGS。此实施例的实例展示于图39中。在一种情况下,丝状真菌宿主细胞为pyrG阴性,并且缺失构筑体包括可选标记物基因(例如图39中的pyrG基因),而目标基因为SNP。因此,同核体原生质体转化体的纯化需要在不具有尿嘧啶的基本培养基上生长所述转化体。在另一情况下,丝状真菌宿主细胞为pyrG阳性,并且缺失构筑体包括SNP,而目标基因为可选标记物基因(例如图39中的pyrG基因)。因此,同核体原生质体转化体的纯化需要在包括FOA的基本培养基上生长所述转化体。
在又一实施例中,突变基因(例如SNP)经由突变基因的多个部分的转化和整合而整合到多核体生物体(例如丝状真菌,诸如黑曲霉)的基因组中的目标基因座中,使得突变基因的多个部分中的每一个存在于分开的构筑体上。多个构筑体中的每一个可包括突变基因的独特部分加突变基因的重叠部分,所述重叠部分也存在于其它多个构筑体中的一个上,以便促进多个构筑体的重组以产生生物体基因组中突变基因的功能性复本。为了促进突变基因的每一部分整合到生物体的所要基因座中,多个构筑体中的每一个可进一步包括与侧接构筑体中的突变基因的部分的生物体基因组中的所要基因座同源的核苷酸。在一些情况下,突变基因跨越两个构筑体分摊并且经由两个构筑体的二分转化引入到生物体中。在图36中描绘此概念的一个实例。如在图36的左图中所展示,pyrG标记物基因拆分到两个构筑体中,使得构筑体中的每一个包括pyrG的独特部分和与另一构筑体重叠的部分。此外,每一构筑体进一步包括与宿主生物体基因组中的aygA标记物基因同源的序列,使得两个构筑体中的同源序列的部分中的每一个还含有SNP。在使用本文所提供的方法中的任一种转化后,两个构筑体的重组引起包括两种SNP的整个pyrG标记物基因的插入。可以通过如本文所描述的选择/反选检测含有完全整合的pyrG标记物基因的转化体和通过环出丢失pyrG标记物基因的转化体。确切地说,可以通过在具有FOA的培养基上生长转化体来选择环出。
在图37中说明二分转化的另一实例。图37描绘真菌(例如黑曲霉)中的组合SNPSWP的实例,其中目标基因(即aygA基因)的多个突变通过整合到在单一转化中各自包括突变和分摊标记物基因(发散pyrG基因)的一部分的两个分开的构筑体的亲本aygA基因中,而引入到原生质体基因组中。如图37中所示,在含有构筑体的相应pyrG基因的重叠部分之间和构筑体和宿主基因组中的aygA基因的同源部分之间的成功重组后,整个pyrG基因中的每一个的表达可通过葡萄糖的分解代谢物抑制来控制。因此,可以通过在葡萄糖上生长转化体来选择转化体,使得其中出现所要重组和整合事件的转化体的生长是受到青睐的。此外,可以通过在具有FOA的培养基上生长转化体来促进环出。如所属领域的技术人员可理解,图37中所描绘的概念可用于将突变(例如SNP)的组合引入到目标基因中,且随后测试所述组合的表型效应。表型效应可产生所要特性或外源性蛋白质的活性。所关注的特性或活性可以意味与外源性蛋白质相关的任何物理、物理化学、化学、生物或催化特性,或所述特性的任何改进、增加或降低。表型效应还可为一或多种代谢物的产生或产生的缺乏。表型效应还可为蛋白质或代谢物的量增加或减少。此外,预期可以使用类似技术引入其它突变以便建构含有特定突变组合的菌株。
图36的中图和右图说明可以用于本文所提供的用于产生具有目标基因中突变的靶向整合的转化体的方法和系统中的额外方法。在一个实施例中,使用以下进行多核体生物体(例如丝状真菌)的共转化:包括与宿主生物体基因组中的所要基因座同源的序列、具有突变(例如SNP)的目标基因以及由终止子重复序列(例如直接重复序列(DR))侧接的标记物基因(例如pyrG)的一部分的第一构筑体,及包括第一构筑体上的标记物基因的重叠部分,以及由第二终止子重复序列(DR)侧接的标记物基因的其余部分,和与宿主生物体基因组中的所要基因座同源的序列的第二构筑体。包括构筑体的成功重组和到所要基因座中的整合的转化体可以使用本文所提供的选择/反选流程(例如图36中的基于aygA的选择和pyrG损失反选)中的任一种分离。图36的右图描绘了使用环入单一交叉事件的目标基因(例如aygA)中突变(例如SNP)与包括具有突变和一或多个可选标记物(例如抗生素抗性基因(ampR)和营养缺陷型标记物基因(pyrG))的目标基因的复本的构筑体的整合的实例。
文库产生
本发明的另一个方面可以包含建构及筛选真菌突变体文库,及通过本文所揭示的方法制备的真菌突变体文库。如图5中所示,真菌文库可以并入到用于建构真菌菌株的平台中。文库可以通过使用所属领域的技术人员已知的方法用任何整合转化手段转化根据本发明的真菌宿主来获得。基于使用本文所提供的方法和系统产生的优选宿主菌株的真菌文库可以在微型化和/或高通量形式筛选方法中针对外源性蛋白质的所要特性或活性经受处理和筛选。所关注的特性或活性可以意味与文库成员的外源性蛋白质相关的任何物理、物理化学、化学、生物或催化特性,或所述特性的任何改进、增加或降低。文库还可以筛选代谢物,或筛选与代谢物相关的特性或活性,作为外源性和/或内源性蛋白质的存在的结果产生。文库还可针对产生增加或减少的量的所述蛋白质或代谢物的真菌筛选。
在一个实施例中,本文所提供的方法和系统产生多个原生质体,使得来自多个原生质体的每一原生质体通过来自多个第一构筑体的单一第一构筑体和来自多个第二构筑体的单一第二构筑体转化。此外,对此实施例,来自多个第一构筑体的每一第一构筑体中的第一聚核苷酸包括不同突变和/或基因控制或调节元件,而来自多个第二构筑体的每一第二构筑体中的第二聚核苷酸是一致的。方法进一步包括使用如本文所描述的选择/反选来转化和纯化同核体转化体两次或更多次,以便产生丝状真菌细胞文库,使得文库中的每一丝状真菌细胞包括具有不同突变和/或基因控制或调节元件的第一聚核苷酸。在一个实施例中,第一聚核苷酸包括目标丝状真菌基因或包括突变的异源基因的序列,使得迭代过程在原生质体再生时产生丝状真菌细胞文库,使得文库的每一成员包括目标丝状真菌基因或具有不同突变的异源基因。如本文中所描述,第一聚核苷酸可以在超过一个构筑体之间分摊,使得每一构筑体可以包括第一聚核苷酸的重叠部分,以便在引入到宿主生物体中时促进构筑体之间的同源重组。此外,包括第一聚核苷酸的重叠部分的每一构筑体可以进一步包括与宿主基因组中的所要基因座同源的序列,以便促进重组第一聚核苷酸整合到所要基因座中。在一个实施例中,突变为SNP并且方法由此产生SNP交换文库。在一个实施例中,目标丝状真菌基因是涉及柠檬酸生产的基因,并且多个第一构筑体为表4中所提供的SNP文库。在另一实施例中,第一聚核苷酸包括可操作地连接到基因控制或调节元件的目标丝状真菌基因或异源基因的序列,使得本文所描述的迭代过程在原生质体再生时产生丝状真菌细胞文库,使得文库的每一成员包括可操作地连接到不同基因控制或调节元件的目标丝状真菌基因或异源基因。在一个实施例中,基因控制或调节元件是启动子并且方法由此产生启动子或PRO文库。在一个实施例中,基因控制或调节元件是终止子并且方法由此产生终止子或STOP库。启动子和/或终止子序列可以是本文中所提供和/或所属领域中已知的用于在本文中所提供的方法和系统中所使用的丝状真菌宿主细胞中表达的启动子或终止子序列。在一个实施例中,启动子为诱导型启动子。
表4.可能涉及黑曲霉中柠檬酸生产的SNP。
Figure BDA0002305131530001451
实例
出于说明本发明的各种实施例的目的给出以下实例,且不意图以任何方式限制本发明。所属领域的技术人员将认识到涵盖于如由权利要求书范围限定的本发明精神内的其中变化和其它用途。
下文仅出于辅助读者的目的提供简短的导航(即表5)。此导航中的任何内容都不意图限制本申请的实例或解释内容的范围。表5-实例章节的导航
Figure BDA0002305131530001471
实例1:丝状真菌的HTP基因组工程改造:丝状真菌原生质体的产生和存储
原生质体的产生
如图20A中所示,100毫升完整培养基接种有106个分生孢子/毫升黑曲霉并且在150rpm下在30℃下生长隔夜。在隔夜生长之后,通过经由Miracloth过滤培养物来收集菌丝体。随后,菌丝体用无菌水彻底冲洗。对于以下实例中所描述的实验,使用黑曲霉的两种菌株,黑曲霉菌株1015及黑曲霉菌株11414。接着,通过用VinoTaste Pro(VTP)酶混合液对所收集和洗涤的菌丝体进行酶消化处理。在图43中描绘每一菌株的特征。
对于黑曲霉菌株1015,酶消化通过首先制备50ml的60mg/ml含VTP原生质体产生缓冲液(1.2M硫酸镁,50mM磷酸盐缓冲液,pH 5)来进行。在溶解VTP之后,将缓冲液置于干净的奥克里治管(Oakridge tube)中并且在15,000×g下旋转15分钟。然后在离心之后过滤灭菌溶液。一旦制成,将所收集的菌丝体中的一些添加到VTP溶液中,且菌丝体在80rpm下在30℃下消化2到4小时。在VTP消化期间的各种时间间隔下,针对原生质体(即较大圆形细胞,其大于分生孢子并且对渗透溶解敏感)的存在,在400倍放大倍数下检查小份样品。当大部分或所有菌丝体被消化时,经由无菌Miracloth过滤培养物,使得25ml含有原生质体的流动通过物分到2个50ml法尔康管(Falcon tube)中的1个中。将5ml 0.4M ST缓冲液(0.4M山梨醇,100mM Tris,pH 8)温和地叠加到25ml样品中的每一个。接着在800×g下在4℃下旋转叠加样品15分钟,以便在ST和消化缓冲液之间形成可见层。接着用移液管去除原生质体并且与25ml ST溶液(1.0M山梨醇,50mM Tris,Ph 8.0)温和地混合并且在800×g下再旋转10分钟。原生质体应该在管的底部处形成集结粒。接着将原生质体再悬浮于25ml ST溶液中,并且通过在800×g下离心10分钟收集。
对于黑曲霉菌株11414,酶消化通过首先制备40ml的30mg/ml含VTP原生质体产生缓冲液(0.6M硫酸铵,50mM顺丁烯二酸,pH 5.5)来进行。将所有所收集的菌丝体添加到VTP溶液中,且菌丝体在70rpm下在30℃下消化3到4小时。在VTP消化期间的各种时间间隔下,针对原生质体的存在,在400倍放大倍数下检查小份样品。当大部分或所有菌丝体被消化时,经由无菌Miracloth过滤培养物。接着在800×g下在4℃下旋转滤液10分钟以使细胞形成集结粒。添加25ml ST溶液(1.0M山梨醇,50mM Tris,pH 8.0)并且再悬浮和再旋转细胞。然后将细胞在10ml STC缓冲液(1.0M山梨醇,50mM Tris,pH 8.0,50mM CaCl2)中洗涤并且通过在800×g下离心10分钟收集。对原生质体(约108/ml)计数并且调节到1.2×107/ml。
对于由任一黑曲霉菌株(即1015或11414)产生的原生质体,在酶消化之后,将20%v/v 40%PEG溶液(40%含PEG-4000STC缓冲液)添加到原生质体并且温和地混合,接着添加7%v/v二甲亚砜(DMSO)以制备8%PEG/7%DMSO溶液。在再悬浮之后,使用如图20A中所描绘的自动化液体处理器将原生质体分布到96孔(25到50微升)微量滴定板中,随后在转化之前在至少-80℃下存储。
实例2:丝状真菌的HTP基因组工程改造:产生原生质体的替代性方法
如图27中所示,500毫升完整培养基接种有106个分生孢子/毫升黑曲霉并且在150rpm下在30℃下生长隔夜。在隔夜生长之后,通过经由Miracloth过滤培养物来收集菌丝体。随后,菌丝体用无菌水彻底冲洗。接着,通过用VinoTaste Pro(VTP)酶混合液对所收集和洗涤的菌丝体进行酶消化处理。
酶消化通过首先制备50ml的60mg/ml含VTP原生质体产生缓冲液(1.2M硫酸镁,50mM磷酸盐缓冲液,pH 5)来进行。在溶解VTP之后,将缓冲液置于干净的奥克里治管中并且在15,000×g下旋转15分钟。然后在离心之后过滤灭菌溶液。一旦制成,将所收集的菌丝体中的一些添加到VTP溶液中,且菌丝体在80rpm下在30℃下消化2到4小时。在VTP消化期间的各种时间间隔下,针对原生质体(即较大圆形细胞,其大于分生孢子并且对渗透溶解敏感)的存在,在400倍放大倍数下检查小份样品。当大部分或所有菌丝体被消化时,经由无菌Miracloth过滤培养物,并且将滤液收集于刻度量筒中。将经过滤的原生质体转移到刻度量筒,且温和地叠加具有较低渗透质浓度的缓冲液(5ml 0.4M ST缓冲液(0.4M山梨醇,100mMTris,pH 8)。接着在800×g下在4℃下旋转叠加样品15分钟,且接着用移液管去除原生质体,并且与25ml ST溶液(1.0M山梨醇,50mM Tris,Ph 8.0)温和地混合并且在800×g下再旋转10分钟。原生质体应该在管的底部处形成集结粒。接着将原生质体再悬浮于25ml ST溶液中,并且通过在800×g下离心10分钟收集。
实例3:丝状真菌的HTP基因组工程改造:展示丝状真菌原生质体的共转化-原理论证。
靶向DNA的制备
为了提供图20A-C中描绘的自动化丝状真菌转化及筛选方法的原理论证(POC),得到黑曲霉argB基因的DNA序列,且确定恰当的读取范围。然后设计SNP集合以使得所述SNP中的任一种整合到黑曲霉基因组的argB基因座中将引起argB基因的剔除式突变。产生呈计算机模拟构筑体形式的预测了寡聚物集合的设计,其用于使用吉布森组装法建构构筑体。
原生质体的自动化转化
如实例1中所描述,产生衍生自黑曲霉菌株1015的原生质体且存储于96孔盘中(100微升原生质体/孔),然后使用自动化液体处理器进行传统PEG钙介导转化,以将SNPDNA构筑体与96孔盘中的原生质体-PEG/DMSO混合物组合。更确切地说,向100微升原生质体,添加1到10微克SNP DNA构筑体(以10微升或更小的体积)并且在冰上培育混合物15分钟。向此混合物中添加1ml 40%PEG并且培育15分钟,维持室温。随后,添加10ml基本培养基加1M山梨醇,并且在30℃下在80rpm下振荡1小时。在此培育之后,在800×g下向下旋转原生质体5分钟,且接着再悬浮于12ml含有1M山梨醇和0.8%琼脂的基本培养基中。第二天,使用额外自动化液体处理步骤,将原生质体涂到选择性培养基(即基本培养基+精氨酸)和非选择性培养基(即基本培养基)上。预期用自动化转化方案产生的原生质体的成功转化对于精氨酸将是营养缺陷型的,并且因此由于SNP构筑体靶向argB基因而不在不具有精氨酸的基本培养基上生长。
如图21中所示,约3%的转化体展示靶向DNA构筑体在正确(即argB)基因座处的整合,如通过在不具有精氨酸的基本培养基中不生长所证明。将经由下一代定序确认含有SNP的构筑体在正确基因座处的整合。
实例4:丝状真菌的HTP基因组工程改造:展示丝状真菌原生质体的共转化-使用比色选择/反选的原理论证。
本实例展示对于丝状真菌细胞的自动化HTP共转化的额外原理论证,并且进一步展示选择/反选用于分离所要转化体的用途。
黑曲霉原生质体形成和转化
使用含有如实例1中所描述的β-葡聚糖酶活性的市售酶混合物产生大体积(500ml)的黑曲霉的真核真菌菌株ATCC 1015的原生质体。通过离心从酶混合物中分离原生质体,并且最终通过实例1中所描述的方法再悬浮于含有氯化钙的缓冲液中。
将原生质体等分且在如实例1中所描述含有二甲亚砜和聚乙二醇(PEG)的悬浮液的容器中在负80摄氏度下冷冻。在一些实施例中,本发明教示可使用此技术以较大批次来制备及冷冻在每一孔中含有25到50微升原生质体的96孔微量滴定板的储备液,以用于大规模基因组编辑活动。
利用自动化液体处理器进行传统的PEG钙介导转化,所述自动化液体处理器将DNA与原生质体-PEG混合物组合于96孔中。转化之后,使用额外的自动化液体处理步骤将转化体涂于选择性培养基上。
转化体的自动化筛选
如下文更详细地论述,本实例中所用的缺乏功能性pyrG基因(即pyrG-)的黑曲霉细胞用功能性pyrG基因转化,其允许转化细胞在不存在尿嘧啶的情况下生长。如图23A-B中所示,本实例的pyrG基因进一步经设计以并入到黑曲霉野生型met3基因的位置中,因此并入对天然存在的met3基因的破坏。met3基因的破坏进一步使得转化体为甲硫氨酸营养缺陷型,提供用于鉴别转化体的二级筛选方法。
将在不含尿嘧啶的选择性培养基上生长的转化体分离且放置于第二微量滴定板的个别孔中。允许第二微量滴定板中的转化体生长且形成孢子2到3天,随后再悬浮于由水和少量清洁剂组成的液体中,以产生适于存储和下游自动化筛选的孢子储备液。
接着使用前述孢子储备液中的每一种的少量等分试样接种到第三96孔PCR盘的液体培养基中。允许这些少量培养物在固定培育箱中生长隔夜,以使得含有黄色色素的孢子发芽且形成更适合于选择和下游步骤的菌丝。
培养步骤之后,通过添加市售缓冲液和将培养物加热到99摄氏度持续20分钟来溶解第三PCR盘的菌丝。接着将盘离心以将DNA悬浮液上澄液与细胞/细胞器集结粒分离。DNA提取物随后用于PCR分析以鉴别包括所要DNA修饰的细胞系。
用于SNP整合的共转化-SNP的设计
获得黑曲霉基因aygA的DNA序列且确定恰当的读取范围。设计四种不同类型的突变,其如果整合则会产生剔除式突变。
突变包含单一碱基对变化,其并有框内终止密码子、较小二碱基对缺失、三碱基对整合和较大的100个碱基对缺失,所有这些如果正确整合,则会消除aygA活性。不具有aygA活性的菌株具有黄色孢子表型。产生呈计算机模拟构筑体形式的预测了寡聚物集合的设计,其用于使用吉布森组装法建构构筑体。
通过共转化来整合SNP
使用上述转化方法,将含有较小变化的扩增子并入黑曲霉菌株1015的基因组中。如此前论述,黑曲霉的这种菌株包括非功能性pyrG基因,且因此不能够在不存在外源性尿嘧啶的情况下生长。已经成功地整合pyrG基因的细胞现在能够在不存在尿嘧啶的情况下生长。在这些pyrG+转化体中,aygA基因中也整合有较小突变的分离株展示了黄色孢子表型。(参见图22和23A).通过对含有SNP交换所靶向的区域的较小扩增子定序也检测到了突变的存在(图23B)。
实例5:丝状真菌的HTP基因组工程改造:实施HTP SNP文库菌种选育程序以改良真核生物黑曲霉ATCC 11414的柠檬酸生产
上述实例3描述了按照高通量方式自动化本发明基因工程改造技术的技术。这个实例将上述技术应用于黑曲霉菌株ATCC11414的特定HTP菌种选育。
黑曲霉是通过发酵大规模生产柠檬酸所用的丝状真菌物种。此物种的多种菌株已被分离出且已展示具有生产柠檬酸和其它有机酸的不同能力。本发明的HTP菌株工程改造方法可以用于组合致病等位基因和消除有害的等位基因以改良柠檬酸生产。
鉴别来自天然黑曲霉菌株变异体的SNP的基因设计文库。
二十世纪早期黑曲霉菌株ATCC 1015被鉴别为柠檬酸的生产菌株。随后发现命名为ATCC 11414的此菌株的分离株展示的柠檬酸产量相对于其亲本增加(参见图43)。举例来说,黑曲霉菌株ATCC 1015在含有硝酸铵但不具有铁和锰阳离子的培养基中从140克葡萄糖平均产生7克柠檬酸。另一方面,分离菌株ATCC 11414在相同条件下展示10倍的产量增加(70克柠檬酸)。此外,菌株ATCC 11414孢子在柠檬酸生产培养基中的发芽和生长比菌株1015的孢子更佳。
为了鉴别这些表型差异的潜在基因来源,对ATCC 1015与ATCC 11414菌株的基因组进行定序和分析。所得分析结果鉴别出43种区别1015和11414菌株的SNP(即表4)。
交换致病等位基因
为了如实例1中所描述的转化,从菌株ATCC 1015(“基本菌株”)制备原生质体。接着将上文鉴别的43种SNP中的每一种通过本发明的基因编辑技术个别地引入基本菌株中(参见图24)。每一SNP用如上文所述的功能性pyrG和aygA基因突变共转化。基因成功靶向aygA基因座的转化体产生黄色孢子(图24)。
为了成功整合而进行筛选
分离出含有推定SNP的转化体且如上所述繁殖孢子储备液。利用下一代定序来分析含有含推定SNP的DNA区域的扩增子。使用此方法可以测定每一转化体内的成功整合事件,即使在亲本DNA存在下。此能力是在真菌中确定靶向所必需的,所述真菌可以如同含有在相同细胞中具有不同基因型的核的异核体那样生长。
进一步验证转化体的所要SNP变化的存在。具有黄色孢子表型的共转化体也在约30%分离株中含有柠檬酸SNP的恰当整合(图25和26)。
接着,将对所产生的SNP交换微生物菌株文库进行表型筛选,以便鉴别有益于柠檬酸生产的SNP。将在本文所述的HTP基因组工程改造方法的情形下利用所述信息,以衍生具有增加的柠檬酸产量的黑曲霉菌株。
实例6:丝状真菌的HTP基因组工程改造:展示下一代定序(NGS)检测具有不同基因背景的丝状真菌中的SNP的能力。
本实例展示NGS可如何用于检测目标基因亲本菌株的特定背景中的目标基因突变的实例。
为了测试基于序列的筛选相对于表型筛选的敏感性,将目标基因(或测试域)中的单一SNP不同的一对菌株以已知比率混合且生长于96孔微量滴定板中。所使用的菌株为亲本菌株(pyrG-,met+,(P))和突变型菌株(pyrG+,met-,(M))。当在基本培养基(MM)上生长时,亲本菌株孢子呈现黑色或暗色,而当在MM上生长时,突变型菌株孢子呈现黄色或浅色。所测试的P:M的比率为1:0、10:1、5:1、1:1、1:5、1:10和0:1)。如图33中所示,当涂于补充有尿嘧啶(+UU)且不含甲硫氨酸(-met)的MM上时,仅亲本孢子(P)生长,而仅突变型孢子(M)在具有met(+met)且不含尿嘧啶(-UU)的MM上生长。如在图33及图35顶部的盘中所见,当涂于+UU及+met的MM上时,P和M孢子均生长,以使得甚至P/M孢子的最低比率(1:10)产生视觉上与P/M孢子的最高比率(10:1)一致的黑色菌落。换句话说,aygA基因(M孢子)中的单一碱基对突变产生黄色孢子的存在;然而,仅少数含有亲本aygA基因(P孢子)的核的存在产生含有黑色孢子的菌落。因此,难以通过表型筛选将在非选择性培养基上具有少量亲本孢子的菌落评分为携带突变基因。换句话说,突变的存在被甚至少量亲本基因的复本所掩蔽,因此突出显示丝状真菌宿主中表型筛选的局限性。
为了解决表型筛选的局限性,使用来自图33的96孔盘中的每个孔中的NGS定序评估目标基因突变的存在。此处,来自图33中所使用的测试域中单一SNP不同的菌株对的核酸使用本文所述的煮沸制备方法。以96孔微量滴定板形式进行DNA提取,其中从图33中的盘产生复制盘,使得在复制盘的每一孔中进行DNA提取,并且随后使用自动化液体处理系统(例如安捷伦Bravo系统)将分离的DNA转移到额外的微量滴定板,其中在每一孔中进行基于启迪公司的定序(NGS定序)。如可在图34中看出,NGS定序能够检测亲本和突变型DNA以及其混合物的存在,其中NGS数据清楚地展示相同样品中的单一碱基对变化的混合物。鉴于在图33和34中进行的实验是使用并不强迫同核状态的生长条件进行,数据显示NGS定序可在菌株建构过程期间用作质量控制步骤,以便评估特定生长条件下的特定菌株中的特定构筑体的转化/共转化的效率或频率。换句话说,NGS可用于评估或测定特定转化体的纯度。在一些情况下,NGS可用于确定特定转化体是否需要选择/反选。
为了评估NGS在选择流程之后检测突变型相对于亲本目标基因的存在、不存在或百分比的能力,来自图33中所描绘的实验的亲本、突变型和混合突变型/亲本孢子在强迫存在对于突变型或亲本基因型为同核体的菌落的条件下生长。更确切地说,混合群体中的一些在有利于亲本基因型或核的培养基(即补充有尿嘧啶且不含甲硫氨酸的基本培养基)上生长,而混合群体中的一些在有利于突变型基因型或核的培养基(即补充有尿嘧啶且不含甲硫氨酸的基本培养基)上生长。如可在图35中看出,选择性培养基对亲本核(当在补充有尿嘧啶且不含甲硫氨酸的基本培养基上生长时),或突变型核(当在补充有尿嘧啶且不含甲硫氨酸的基本培养基上生长时),强迫核的混合群体进入同核状态。此外,这种通过选择引起的同核状态的强迫易于被NGS检测到。NGS容易检测对于特定类型的核以及其混合物完全是同核体的群体。因此,NGS可在如本文所提供的菌株建构过程期间使用以便评估特定选择/反选流程的效率。当特定突变的引入不产生可辨别的表型或可被甚至低百分比的含有亲本基因型的核掩蔽的表型时,这可尤其有用。本实例还说明NGS作为单独或与表型筛选组合来筛选转化体,以便分离与所引入的DNA插入体是同核体的转化体,或具有阈值百分比的携带引入DNA插入体的核的转化体的方法的效用。阈值百分比可以是其中所述转化体产生所要水平的产物的百分比。产物可以是所属领域中已知的任何产物。产物可以选自表2中的产物。阈值百分比可以是50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%。
实例7:丝状真菌的HTP基因组工程改造:展示下一代定序(NGS)检测丝状真菌中的SNPSWP的能力。
本实例展示NGS可如何用于检测目标基因亲本菌株的特定背景中的目标基因突变的实例。可以在图20B-C中发现用于SNP交换和筛选方法的整个过程的一般流程。
如图38中所示,为了测试使用NGS的基于定序的筛选检测多个整合、异位整合和/或在相同核中SNP和非SNP的存在的能力,将检测三个不同情形,其中经由同源重组将特定构筑体引入到宿主黑曲霉基因组的aygA基因座中。在第一种情形下,两个构筑体之间分摊pyrG标记物基因,使得pyrG基因的重叠部分存在于两个构筑体上。第一构筑体进一步包括与存在于宿主基因组中的aygA基因同源,位于pyrG基因的5'端的序列,而第二构筑体在pyrG基因的部分的3'端进一步包括与宿主aygA基因的第二部分同源的序列。在两个构筑体中,与aygA基因同源的序列进一步包括突变(即SNP)。第二种情形利用与第一种情形中的那些构筑体类似的两个构筑体,但仅第二构筑体在与aygA基因同源的序列中包括突变(即SNP)。最后,第三种情形利用与第二种情形中所用的那些构筑体类似的两个构筑体,但第一或第二构筑体都不在与aygA基因同源的序列中包括突变(即SNP)。
将培养黑曲霉宿主,将产生黑曲霉的原生质体,且将使用实例4中所描述的方法将构筑体中的每一个转化到原生质体中。在转化之后,将针对完整aygA基因的存在(黑色孢子)或完整aygA基因的损失(黄色孢子)表型筛选转化体。另外,将复制涂布转化体中的每一个,且将提取和使用如实例6中所描述的NGS筛选来自复制盘的DNA。表型和基于序列的筛选两者的预期结果概述于图38中。
实例8:丝状真菌的HTP基因组工程改造:使用分摊-标记物环出展示丝状真菌中的SNPSWP。
本实例使用如图3-4中所示的分摊-标记物环出程序,展示在丝状真菌细胞中SNPSWP方法的原理论证。可以在图20B-C中发现用于SNP交换和筛选方法的整个过程的一般流程。
在实例4和5中,通过使用DNA的两个线性片段转化宿主来进行丝状真菌中的靶向SNPSWP。片段中的一个含有允许分离已经吸收DNA的细胞的可选标记物。第二独立片段含有待针对对于所要表型的影响测试的单一碱基对变化。在本实例中,使用两个片段;然而,这些片段都在侧接标记物基因的DNA的直接重复序列内含有SNP。每个片段仅含有一半的可选标记物。如果片段独立地整合,那么其将不重构标记物基因并且将不会产生转化体。当标记物重组以形成功能性基因时,其将通过非同源末端接合进行。当这发生时,侧接序列更可能还恰当地在目标基因座处整合。一旦标记物已经整合在基因座处,直接重复序列将提供不稳定整合,这可引起标记物序列的损失。已经失去标记物的菌株将在相对于基因的恰当位置和情形下留下所要SNP。最终,当SNP在基本基因内并且基因的破坏可能是致死性的时,可以使用实例4和5中所描述的方法。在实例4和5的方法中,共转化的靶向效率可在5到15%之间变化。相比之下,本实例的方法可能是合乎需要的,因为标记物连接到SNP并且靶向效率接近100%。
为了执行本实例的方法,如以上实例4中所描述及图20B-C中所描绘的流程中所展示,培养来自1015亲本菌株和11414亲本菌株的黑曲霉宿主细胞,转换为原生质体,且转化。在本实例中,如图46所展示,来自每一亲本菌株的原生质体用两种构筑体(“分摊-标记物构筑体”)共转化,其中两种构筑体中的每一种含有可选标记物(即图45和46中的pyrG)的重叠部分,并且由包括目标SNP的直接重复序列侧接。使用如图45和46中所描绘的融合PCR产生分摊-标记物构筑体,且使用如图46中所展示的片段分析仪进行质量控制(QC)。此外,这些构筑体中的每一种含有侧接每一构筑体的直接重复序列部分的序列,以便引导整合到宿主细胞基因组中的目标SNP中。通过使用如本文所述的基于序列的筛选筛选转化体来评估正确整合。
使用分摊-标记物方法的基因工程改造
分摊标记物介导的SNP交换的初始步骤如图20B中所示为步骤1和2。在步骤2中,转化DNA由两个分开的线性片段组成,所述线性片段含有融合到同源DNA的标记物的非互补半边以将SNP靶向到恰当基因座。将转化物置于选择性培养基上并且使其生长。具有DNA的稳定整合的恰当互补的菌株形成菌落。手动或通过自动化平台将这些菌落挑取到含有100到200微升选择性琼脂培养基的微量滴定板中的个别孔。使所挑取的转化体生长且繁殖孢子,如步骤4中所指示。黑曲霉的孢子是单核的并且本质上是克隆的。通过获取少量孢子并且将其再次涂到选择性培养基上,将经转化的菌株纯化到同核(细胞中的所有核具有相同基因型)。此过程由图20B中的箭头表示。反复将群体减少到少量克隆孢子使得每一孔中同核。然后将孔中的这些经纯化菌株涂到含有对含有可选标记物的菌株具有毒性的反选剂的培养基上。以与直接重复序列的尺寸直接相关的频率,吸收由含有SNP的直接重复序列侧接的标记物的菌株丢失标记物。举例来说,1,00个碱基对直接重复序列比100个碱基对直接重复序列更不稳定。此环出阶段为图60中的步骤6。图60含有来自利用分摊标记物整合和环出进行的SNPSWP活动的数据。
结果
在本实例中,使用NGS筛选超过1200个个别环出样品。从这一集合,产生119个成功的菌株并且在图60的左上角中呈现为点,因为100%来自所述孔的扩增子含有来自生产菌株的SNP。所圈面积中指示的样品含有具有所要SNP的扩增子和在此基因座处的原生碱基对。这些菌株可使用图20B中的步骤4和5中表示的孢子繁殖和传代来制成同核体。已通过QC的119个样品可针对其对所要菌种选育特点的影响进行分析。图61中展示跨越各种SNP位置的SNP引入的成功率。
实例9:使用Cas9核糖核酸蛋白质(RNP)转化的丝状真菌的非同源末端接合(NHEJ)及HR介导基因组编辑实现SNP、插入及插入缺失,而无需所要编辑的直接选择。
本实例展示在不直接选择所要编辑的情况下,在NHEJ精通背景下,便捷基因组编辑的额外手段。所述方法可通过实现基因组编辑的快速创建而无需选择编辑或环出可选标记物,而适用于高通量基因组编辑。
设计两种crRNA序列以靶向AygA基因。此基因的破坏产生剔除式突变,产生生成含有黄色色素的孢子而非黑色野生型孢子的菌株。可通过NHEJ介导的易错修复或通过提供破坏基因翻译的同源重组供体来实现破坏。
Cas9RNP的组装体(图47)。将化学修饰的crRNA(参见表6)和tracrRNA(获自Synthego)在无核酸酶TE缓冲液中引入到250pmol/μL。将5μL crRNA(250μM)和10μLtracrRNA(250μM)与10μL 5X粘接缓冲液(Synthego)混合且引入到50μL H2O。通过使混合物达到78℃持续10分钟,并且接着37℃持续30分钟,对样品进行粘接。然后使样品在15分钟内达到室温。通过将1μL 3.22μg/μL EnGen Cas9(获自新英格兰生物实验室)和1.5μL crRNA/tracrRNA复合物(25μM)混合于0.7uL STC缓冲液(1.0M山梨醇,50mM Tris,pH 8.0,50 mMCaCl2)中来产生Cas9 RNP。比率是1.875 mol RNA复合物/1 mol Cas9,且Cas9总浓度是1μg/μL。通过在室温下培育10分钟来形成复合物。
通过首先在STC中产生RNP复合物的2倍稀释来进行转化。接着,将1μL此复合物(含有0.5 ug Cas9)与500 ng含有AMA1来源及来自烟曲霉的pyrG的载体至多总共10μL在STC中混合。添加此RNP混合物并且将其混合到100μL解冻的如实例1中所描述制备和冷冻的1015(PyrG-)(即1015黑曲霉菌株)的原生质体。在冰上培育之后,将在STC中制得的1 mL室温40%PEG 4000随后添加到原生质体RNP混合物中,将其涡旋且在室温下培育15分钟。然后将原生质体与12 mL融化的基本培养基+1 M山梨醇和0.8%琼脂混合且涂于10 cm皮氏皿(petri dishes)上。在固化之后,用额外的8 mL融化的基本培养基+1 M山梨醇和0.8%琼脂叠加转化物。还如上涂布转化体的10倍稀释物(图48)。
表6:crRNA原间隔子序列
SEQ ID NO: crRNA名称 crRNA原间隔子序列
6 aygA.1 UCAGUCUAUCCGUUUCACGA
7 aygA.3 UUCCCACGAAGCGAUCACGG
8 对照组 AUGUGUCAGAGACAACUCAA
对于具有两个crRNA/tracrRNA/Cas9复合物的共转化物,将crRNA和tracrRNA对分别地粘接且与Cas9分别地复合。在复合之后,在转化之前将等量的与crRNA/tracrRNA复合的Cas9混合在一起。
对于同源重组实验,通过经由PCR和纯化扩增g块(gBlocks)来产生供体。将纯化产物(800 ng)添加到RNP和质体中并且如上文转化。RNP裂解上调DNA修复机制,用外源提供的供体刺激HR。同源重组供体序列经设计以含有与400-500 bp ayg.1 crRNA原间隔子剪切位点周围的AygA基因的同源物侧接的突变区域。序列展示在此实验中使用的两种同源供体。DJV_03_pyrG_insertion_in_AygA展示了具有与AygA基因的同源物(大写)的5'及3'区侧接的启动子及终止子(小写)的pyrG(图51,SEQ ID NO:9)。同源性区域侧接crRNA原间隔子AygA.1的预测剪切位点。DJV_07_4bp_insertion_in_AygA含有与AygA基因的同源物(大写)的5'及3'区侧接的4 bp插入物(小写)(图52,SEQ ID NO:10)。
通过以下方式测定表型:(1)计数菌落且随后对产孢菌落的颜色评分,(2)在产孢之前挑取菌落,且接着在产孢之后对个别分离的菌落评分,或(3)在转化5到7天之后分离个别孢子,且允许这些孢子发芽和产孢。图49展示分生孢子中菌落计数和表型颜色变化评分的结果;使用方法1,估计35到40%的经转化菌落产生黄色分生孢子。通过在湿润室中在37℃下在静态培育箱中用来自这三种方法中的一种的孢子接种20μL酵母霉菌培养基隔夜来测定基因型。通过混合50μL prepman超级样品制备试剂并且在98℃下培育混合物30分钟来溶解培养物,接着离心以使溶解物形成集结粒。
侧接一或多个剪切位点的区域通过桑格化学方法扩增并且定序(图49D和图49E)。所得经定序的扩增子用于确认在黄色分生孢子中存在NHEJ介导的插入缺失。为了测试同源重组,设计PCR引物以使得正向引物在与修复片段同源的基因组区域的上游粘接,而反向引物在与修复片段同源的区域内粘接。此PCR流程确保仅基因组DNA且不是未整合供体可在AygA基因座产生PCR扩增子。对于同源重组分析法,将经由CellenONE分类的孢子分表型且随后基因分型;将pyrG有效负载以26到36%的效率插入,将4bp有效负载以86%的效率插入(图50A-C)。
实例10:使用Cas9核糖核酸蛋白质(RNP)转化的丝状真菌的HR介导基因组编辑以引入单一SNP,而不扰乱PAM位点。
本实例展示在NHEJ精通背景下,便捷基因组编辑的额外手段,其使用Cas9RNP复合物转化来引入单一SNP,而不扰乱或改变PAM位点且不直接选择所要编辑。所述方法可通过实现基因组编辑的快速创建而无需选择编辑或环出可选标记物,而适用于高通量基因组编辑。
通过将0.2μg EnGen Cas9(与粘接Ayg.1cr/tracRNA复合)与350ng双股DNA供体和200ng含有AMA1来源及来自烟曲霉的pyrG的载体混合来进行转化,引入到在STC缓冲液中4μL。将这添加到40μL原生质体并且如实例9中进行转化。双股供体DNA编码在5'及3'侧与50bpAygA基因的同源物侧接的单一无义突变(参见图56A);供体通过粘接两种互补寡核苷酸制得。挑取个别菌落,且来自菌落的孢子用于生长、分离和PCR扩增基因组DNA。在经分离的24个菌落中,2个含有黑色与黄色孢子的混合物,2个仅含有黄色孢子且仅20个含有黑色孢子。二十四个序列中的八个成功地PCR扩增且定序。其中,所检查的八个序列中的三个含有所要突变而无额外突变(参见图56B中的示例野生型和突变型迹线)。其余序列为野生型AygA基因。结果,本实例展示两个粘接寡核苷酸可在不改变原间隔子位点的PAM或种子区的情况下产生SNP。
实例11:按比例将经转化的真菌菌株纯化成克隆群体
许多丝状真菌在其生命周期中具有某一阶段,其中营养生长包含其中个别细胞中存在多个核的状态。这对于基因操控这些生物体的能力具有影响。必须通过从不含有所要突变的核纯化来对一个核中的任何基因变化进行克隆。一种用于分离这些核的方法是允许生物体经历无性生殖的阶段,其中所得孢子含有极少核,所有具有相同基因型。通过分离个别孢子,从这些孢子繁殖的菌株将含有所要生产特点。本实例描述一种分离含有具有高保真度和高通量的靶向突变的单一孢子,并且因此分离克隆真菌菌株的方法。所述方法允许快速生产和改良真菌生产菌株的纯化。
传统上,孢子纯化可以通过将孢子划到含有选择性培养基的个别皮氏盘上来进行。在此方法中,孢子悬浮液可由相同菌丝体内含有核的混合物的每一经转化的菌落制成。孢子悬浮液可使用无菌环圈收集,且接着以四分之一圆在琼脂盘上涂开,以使得孢子随着每次划动而稀释。所得盘应含有与所有其它孢子分离的一些数目的孢子,且接着可作为克隆个体分离。
本文中阐述的方法消除了对于每一转化使用个别皮氏盘/皿的需要,且有助于使用用于建构菌株的微量滴定板。皮氏皿较大且不与自动化兼容,因此限制了按比例调整到高通量的能力。最重要的是,本发明方法可在>97%的孔中产生克隆群体,而所属领域方法中已知的传统方法可能从不一定产生克隆群体,甚至在连续传代之后(重复施用选择过程,其可能极低效)。在本文详述的方法中,将个别克隆菌株放入微量滴定板的孔中,以用于进一步筛选,其可有助于简单整合到高通量自动化。所述方法还可有助于分离转化体,而不需要在皮氏皿上生长菌落,使得可以微量滴定形式进行整个菌株建构。关于所属领域中已知的传统方法与本实例中描述的方法之间的工作流程比较,参见图54A和54B。
黑曲霉或相关真菌微生物可产生一或多种所关注的代谢物、化学物质或生物制剂。转化方案要求用供体DNA转化黑曲霉孢子。孢子经由泊松分布或基于单一细胞分配以光学方式克隆分离/沉积到微量滴定板中。
在转化后,涂布黑曲霉并且生长到形成孢子。将所得孢子悬浮于液体中并且稀释。以两种方式中的一种进行稀释。
在第一类型的稀释中,孢子被稀释到其中根据泊松分布存在所分配体积中仅存在一个或没有孢子的统计概率的浓度。接着使用ECHO、BIOSPOT或其它液体处理装置将孢子分配到微量滴定板中,在其中所述孢子可发芽。一般来说,对于含有单一孢子的每一孔及理想地含有两个孢子的极少孔,此方法可产生许多空孔。
在第二类型的稀释中,孢子被稀释到其中所述孢子可光学识别为单一细胞的浓度。取决于用于分配的仪器,浓度可不同。在光学验证单一细胞存在于小液滴中之后,将小液滴分配到微量滴定板中。如果多个孢子或无孢子存在于分配体积中,那么可将其置于废料收集处或再抽吸。与泊松分布方法(以上第一类型的稀释)相比,可以预期输出数据的每一孔将在其中具有单一细胞,以及较少的空孔或双孢子孔。
用于第二类型的稀释的仪器可包含(1)CellenONE仪器,其组合使用微流体与光学器件以视觉上验证仅单一孢子被分配到微量滴定板中,在其中所述孢子可发芽;(2)伯克利灯标仪器,其通过将细胞或孢子冲洗到微通道中,且接着使用激光将个别细胞或孢子推送到微围栏中来工作,在所述微围栏中所述细胞或孢子可生长及复制;(3)FACS仪器,其使用微流体流动通道来移动个别细胞通过可检测荧光的光学传感器,且可基于其荧光信号将细胞分拣到输出孔。不利的是,目前市场上的唯一FACS机受限于将来自单一来源的细胞分拣到多个目的地,或经设计以从多个来源选择且分拣到单一目的地。如果开发出可以容易地将细胞从许多来源分拣到许多目的地的机器,那么其将适用于在本实例中描述的高通量使用情况,其中最终要求是所分拣的细胞需要具有荧光活性(天然地或通过基因工程改造);(4)Cytena仪器,其使用与CellenONE仪器类似的光学和微流体技术来工作,但其不与高通量/基于盘的输入兼容。其使用一次性料筒来保持源液体,所述一次性料筒必须手动地栓接到机器,给予其与FACS机类似的通量局限性。CellenONE可以高保真度打印单一孢子,参见图55A-55C。
实例12:丝状真菌的HTP基因组工程改造:鉴别影响丝状真菌形态的基因
本实例展示SNP交换文库在丝状真菌黑曲霉的SNPSWAP方法中的用途,以便鉴别在控制真菌细胞形态中起作用的基因。确切地说,本实例描述了鉴别在黑曲霉突变型菌株中带来非菌丝体形成集结粒样形态表型的基因的群组,其中所述细胞在浸没培养物中生长时维持较紧密的、较不细长的表型,并且每一细胞具有多个顶端。这种类型的生长对于搅拌槽罐发酵可为有利的。
黑曲霉是通过发酵大规模生产柠檬酸所用的丝状真菌物种。此物种的多种菌株已被分离出且已展示具有生产柠檬酸和其它有机酸的不同能力。二十世纪早期黑曲霉菌株ATCC 1015被鉴别为柠檬酸的生产菌株。随后发现命名为ATCC 11414的此菌株的分离株展示的柠檬酸产量相对于其亲本增加。举例来说,黑曲霉菌株ATCC 1015在含有硝酸铵但不具有铁和锰阳离子的培养基中从140克葡萄糖平均产生7克柠檬酸。另一方面,分离菌株ATCC11414在相同条件下展示10倍的产量增加(70克柠檬酸)。此外,菌株ATCC 11414孢子在柠檬酸生产培养基中的发芽和生长比菌株1015的孢子更佳。
为了鉴别这些表型差异的潜在基因来源,对ATCC 1015与ATCC 11414菌株的基因组进行定序和分析。所得分析结果鉴别出43种区别1015和11414菌株的SNP(参见表4)。在这些43种SNP中,发现18种存在于其相应基因的编码域中(参见表4)。
为了鉴别在不同培养条件下在控制丝状真菌的形态/生长中起潜在作用的基因,来自表4的43种SNP被用于如本文所描述的SNP交换过程,以便将来自表4的每一个别SNP系统地引入到基本1015菌株中,并且从形态角度来检查所得亲本及突变型菌株之间的表型差异。相反地,在11414生产菌株中进行相同类型的过程,其中用每一基因的野生型型式系统性置换已经存在于11414的基因组中的来自表4的SNP中的每一种,并且注意亲本及突变型菌株之间的任何所得形态差异。
用于转化原生质体的构筑体
在本实例中,每一菌株(即1015和11414)用两种构筑体(“分摊-标记物构筑体”)共转化,其中两种构筑体中的每一种含有可选标记物(即图45和46中的pyrG)的重叠部分,并且由如图45和46中所示的直接重复序列侧接。使用融合PCR产生分摊-标记物构筑体,且使用如图46中所展示的片段分析仪进行质量控制(QC)。此外,这些构筑体中的每一种进一步包括侧接每一构筑体的直接重复序列部分的序列,以便在来自表4的每一SNP的相应目标基因处在宿主细胞基因组中引导整合。对于1015基本菌株原生质体,分摊构筑体中的直接重复序列包括来自表4的SNP中的一种(参见图3)。相比之下,对于11414生产菌株原生质体,直接重复序列不包括来自表4的SNP。
如本文中所描述,培养黑曲霉基本菌株1015和生产菌株11414,转换成原生质体,进行转化和筛选。综上所述,这些步骤中的每一个如下:
原生质体的产生
对于黑曲霉1015基本菌株和黑曲霉11414生产菌株,以106个分生孢子/毫升接种500毫升完整培养基,并且在150rpm下在30℃下生长隔夜。在隔夜生长之后,通过经由Miracloth过滤每一培养物来收集菌丝体。随后,菌丝体用无菌水彻底冲洗。接着,用VinoTaste Pro(VTP)酶混合液对所收集和洗涤的来自两种菌株的菌丝体各自分别地进行酶消化处理。
两种菌株的菌丝体的酶消化通过首先制备50ml的60mg/ml含VTP原生质体产生缓冲液(1.2M硫酸镁,50mM磷酸盐缓冲液,pH 5)来进行。在溶解VTP之后,将缓冲液置于干净的奥克里治管中并且在15,000×g下旋转15分钟。然后在离心之后过滤灭菌溶液。一旦制成,将所收集的菌丝体中的一些添加到VTP溶液中,且菌丝体在80rpm下在30℃下消化约2到4小时。在VTP消化期间的各种时间间隔下,针对原生质体(即较大圆形细胞,其大于分生孢子并且对渗透溶解敏感)的存在,在400倍放大倍数下检查小份样品。当大部分或所有每一菌株的菌丝体被消化时,经由无菌Miracloth过滤来自每一菌株的培养物,并且将滤液收集于刻度量筒中。将经过滤的原生质体转移到刻度量筒,且温和地叠加具有较低渗透质浓度的缓冲液(5ml 0.4M ST缓冲液(0.4M山梨醇,100mM Tris,pH 8)。接着在800×g下在4℃下旋转叠加样品15分钟,且接着用移液管去除原生质体,并且与25ml ST溶液(1.0M山梨醇,50mMTris,Ph 8.0)温和地混合并且在800×g下再旋转10分钟。原生质体应该在管的底部处形成集结粒。接着将来自每一菌株的原生质体各自分别地再悬浮于25ml ST溶液中,并且通过在800×g下离心10分钟收集。
原生质体的转化
在离心之后,来自两种菌株的原生质体最终再悬浮于含有氯化钙的缓冲液中。随后,使用自动化液体处理器对来自两种菌株的原生质体进行传统PEG钙介导的转化,所述自动化液体处理器将来自上文所描述的分摊构筑体的DNA与96孔中的原生质体-PEG混合物组合。
筛选转化体
如上文所描述,在本实例中利用的分摊标记物构筑体含有侧接pyrG标记物基因的直接重复序列,其随后用于环出标记物基因。结果,含有环出构筑体的菌株针对选择区域的缺失而被反选(例如参见图45和图4;不存在pyrG基因)。通过如本文所述的基于序列的筛选进一步评估正确整合。此外,使用NGS筛选突变型菌株以便评估如本文所提供的转化体的同核体性质。在存在(参见图62和63)或不存在(参见图64)各种补充剂的情况下将同核体或大体上同核体突变型菌株涂于基本培养基上,以便评估所述菌株在低pH值(图62)或渗透应激(图63)下生长或形成孢子(图64)的能力。另外,突变型菌株在CAP培养基中作为浸没培养物生长以便评估其在浸没生产培养基中的表型。
结果
表4之间共享的SNP中的4种到基本黑曲霉菌株1015中的个别整合产生形态表型。确切地说,将真菌SNP_9(SEQ ID NO:11)、真菌SNP_12(SEQ ID NO:12)、真菌SNP_18(SEQ IDNO:13)或真菌SNP_40(SEQ ID NO:14)整合到1015基因组产生的突变型菌株中,在作为浸没培养物在CAP培养基中生长时产生非菌丝体集结粒形态。
在向下波动实验中进一步证实含有4种SNP的基因在影响真菌形态方面的作用,由此去除这4种SNP中的每一种修复所观察到的形态表型。4种SNP的序列可以见于所附序列表中,而其推定或已知蛋白质功能可以见于表4中。
如图62中所示,含有基本SNP18的菌株在低pH值培养基上生长得更快。基本菌株(即图62中的基本snp18prod)中来自生产菌株(11414)的真菌SNP_18的存在相比于基本(即来自图62的基本)减少pH2培养基上的所得菌落的径向生长。相比之下,与来自图62的基本和生产菌株相比,在生产菌株(即图62中的生产SNP18Base)中来自基本菌株的真菌SNP_18的野生型型式的存在允许所述菌株的径向生长。此外,似乎存在于生产菌株中的其它SNP也促成较低的径向生长(参见图62中的小于snp18prod中的生产)。
如图63中所示,含有基本SNP18(即真菌SNP_18的野生型型式)的菌株在提供渗透应激的培养基上生长得更快。基本菌株(即图63中的基本snp18prod)中来自生产菌株(11414)的真菌SNP_18的存在相比于基本(即来自图63的基本)减少渗透应激下所得菌落的径向生长。相比之下,与来自图63的基本和生产菌株相比,在生产菌株(即图63中的生产SNP18Base)中来自基本菌株的真菌SNP_18的野生型型式的存在允许所述菌株的径向生长。此外,似乎存在于生产菌株中的其它SNP也促成较低的径向生长(参见图63中的小于基本snp18prod中的生产)。
有趣的是,当不在浸没培养物中(例如在盘上)生长时,含有真菌SNP_9、真菌SNP_12或真菌SNP_40中的每一种的基本菌株正常生长和正常形成孢子。如图64中所示,在基本菌株(即1015)中表达真菌SNP_18的确展示对径向生长速率(减少)和孢子形成的影响。
实例13:丝状真菌的HTP基因组工程改造:确认所鉴别的基因在丝状真菌形态中起的作用-删除所鉴别的形态控制基因
本实例展示在实例12中鉴别为在真菌形态中起作用的4种基因作用的确认。确切地说,本实例描述使用如本文中所描述的HTP方法在黑曲霉菌株1015和11414中敲除或删除4种基因中的每一种。
如实例12中所描述,培养黑曲霉基本菌株1015和生产菌株11414,转换成原生质体,进行转化和筛选。
用于转化原生质体的构筑体
在本实例中,用一系列单一构筑体转化来自每一菌株(即1015和11414)的原生质体,其中所述系列中的每一构筑体含有侧接与侧接实例12中所鉴别的4种所关注基因中的一种的基因组序列互补的序列的可选标记物基因(即pyrG),以便引导整合标记物基因到宿主细胞基因组中。如图39中所示,将标记物基因整合到4种基因中的一种(1015菌株中的4种野生型基因中的一种和11414菌株中的4种SNP中的一种)的基因座中基本上用于从相应菌株的基因座去除所述野生型基因或含有SNP的基因。
在生长之后,使用NGS筛选突变型菌株以便评估如本文所提供的转化体的同核体性质。将同核体或大体上同核体突变型菌株涂于培养基上,以便评估所述菌株在CAP培养基中作为浸没培养物形成孢子或生长的能力,以便评估其在浸没生产培养基中的表型。
结果
从基本1015菌株以及11414生产菌株去除4种基因中的每一种证实了来自实例12的结果,其在于所述4种基因中的每一种在影响真菌形态方面明确起作用。确切地说,如在实例12中,在1015菌株中去除含有真菌SNP_18的基因的不含SNP型式或在11414菌株中去除含有真菌SNP_18的基因产生最显著的表型,其中在浸没式培养条件下,所述菌株具有集结粒样形态。此外,如图65中所示,在所有条件下,删除真菌SNP18及真菌SNP40基因引起紧密形态。此数据可能指示SNP不是功能缺失突变,前提是缺失表型比SNP本身更显著(对形态的影响更强)。因此,似乎改变这些基因的表达可以对于在发酵槽中生长合乎需要的方式影响形态。
有趣的是,在1015菌株中删除含有真菌SNP_18的基因的不含SNP型式在所得变异体1015菌株中产生负面孢子形成表型,使得所述变异体1015菌株失去形成孢子的能力(参见图66)。在其中去除真菌SNP_18基因的11414菌株中未观察到孢子形成的损失。鉴于11414和1015菌株的基因背景除存在于表4中的SNP以外是相同的,这表明在11414基因背景中来自表4的SNP中的一种、全部或一些组合的存在足以修复在去除真菌SNP_18时产生的负面孢子形成表型。换句话说,存在其它突变(SNP),其针对在不存在SNP18活性的情况下维持生产菌株中的孢子形成以上位方式起作用。
应注意,未在分别通过去除真菌SNP_9、真菌SNP_12或真菌SNP_40或其不含SNP型式产生的变异体11414或1015菌株中观察到孢子形成损失。
应进一步注意,对于4种基因中的每一种,在浸没式培养条件下所观察到的形态表型比在实例12中更显著,这可能归因于实验设计,其中成功的转化体基本上展示缺失表型。此外,11414菌株中的表型也更显著,这可能归因于此菌株相对于1015基本菌株中所存在的其它SNP中的一或多种对表型的贡献,
实例14:丝状真菌的HTP基因组工程改造:通过改变基因表达来改变丝状真菌细胞形态
本实例用作自动化HTP PROSWP方法在丝状真菌细胞中的原理论证,其通过展示自动化HTP PROSWP方法在丝状真菌细胞中的用途,以便测试调节被认为在控制丝状真菌形态中起作用的来自实例1及2的所鉴别的真菌SNP_9、真菌SNP_12、真菌SNP_18及真菌SNP_40基因的表达的作用。
在本实例中,通过使用本文所描述的PROSWP方法用来自表1的四种启动子中的一种置换标注原生启动子,在黑曲霉1015基本菌株和黑曲霉11414生产菌株中调节在实例12和13中所鉴别的真菌SNP_18基因(即SEQ ID NO:13)的表达。更确切地说,对于每一真菌SNP的菌株(即1015亲本菌株或11414亲本菌株)中的每一种,产生一组(4)变异体或突变型菌株,其中第1变异体菌株表达包括在表1中所描述的srp8p启动子的控制下的所述候选真菌SNP(真菌SNP_9(SEQ ID NO:11);_12(SEQ ID NO:12);_18(SEQ ID NO:13);_40(SEQ IDNO:14))基因的第一构筑体,第2变异体菌株具有在表1中所描述的amy8p启动子的控制下的所述候选真菌SNP基因,第3变异体菌株具有在表1中所描述的man8p启动子的控制下的所述候选真菌SNP基因且第4变异体菌株具有在表1中所描述的mbfAp启动子的控制下的所述候选真菌SNP基因。用于产生变异体的构筑体中的每一种进一步包括侧接候选真菌SNP基因的序列和用于引导整合构筑体到相应候选真菌SNP的基因座中的启动子。在本实例中使用的二分构筑体设计和整合流程的一般描述展示于图67中。
在其产生之后,用于产生(4)变异体菌株的每一候选真菌SNP的每一构筑体被个别地转化到针对黑曲霉1015基本菌株以及黑曲霉11414生产菌株产生的原生质体中。培养两种菌株的原生质体,转换成原生质体,进行转化和筛选,以使用如上文实例中所描述的表型和/或基于序列的筛选选择大体上同核体原生质体。因此,如一般在图40中所描绘,每一个别构筑体的转化使得产生每一候选真菌SNP的亲本菌株中的每一种的4种变异体或突变型菌株。然后观察这些菌株中的每一种的形态表型,并且将其与包括在基因的原生启动子的控制下的所鉴别的所述基因的突变型菌株的形态表型进行比较。接着测定所鉴别的基因中的每一种的理想表达水平。
结果
总的来说,对于每一形态控制基因目标(即真菌SNP_9、_12、_18和_40)与来自表1的不同启动子的启动子交换揭露控制这些基因的表达影响形态(参见图68)。在弱manB启动子下含有SNP18的菌株具有比含有其它启动子组合的菌株更紧密的菌落形态。在渗透应激下,相较于低pH值,SNP18控制的影响更显著。此外,在所测试的所有生长条件下,在弱manB启动子下含有SNP40的菌株具有比含有其它启动子组合的菌株更强烈的对菌落形态的作用。
如图69中所示,形态控制基因目标12(真菌SNP_12;SEQ ID NO:12)与来自表1的不同启动子的启动子交换揭露强度较低的启动子在菌丝中产生黄色色素和在菌落边缘观察到的一些形态改变。黄色色素的存在指示变异体或突变型菌株经历代谢应激。
此外,形态控制基因目标18(真菌SNP_18;SEQ ID NO:13)与来自表1的不同启动子的启动子交换揭露控制具有两种较弱启动子的此基因的表达影响形态(参见图57、58和70)。举例来说,含有manB融合体和amyB融合体的菌株保持多个顶端表型,而具有较高表达srpB和mbfA的菌株缺乏多个顶端表型且取而代之展示异常隆起(参见图57)。图58中的图像是在30℃下在柠檬酸生产培养基中生长24小时的菌株。图57中的图像是在30℃下在柠檬酸生产培养基中生长48小时的亲本11414菌株以及表达各种非天然启动子-真菌SNP_18融合体的11414菌株。当培育168小时时,具有较高表达启动子的菌株以及亲本对照菌株都含有长丝状菌丝。使具有来自启动子融合物amyB和manB的较低表达水平的菌株保持集结粒化。应注意,如图70中所示,当通过较弱启动子驱动时,SNP_18在基本菌株中具有比在生产菌株中更严重的形态表型。
类似于来自实例13的缺失实验的结果,降低1015菌株中的真菌SNP_18基因的表达产生经历如图59中所示的孢子形成损失的细胞。在11414突变型菌株中未观察到孢子形成损失。再次,鉴于11414和1015菌株的基因背景除存在于表4中的SNP以外是相同的,这表明在11414基因背景中来自表4的SNP中的一种、全部或一些组合的存在足以修复在真菌SNP_18的表达减少时产生的负面孢子形成表型。
具有SEQ ID NO识别符的本发明序列
Figure BDA0002305131530001661
Figure BDA0002305131530001671
本发明的编号实施例
本发明涵盖的其它标的物阐明于以下被编号的实施例中:
1.一种用于产生丝状真菌菌株的方法,方法包含:
a.)提供多个原生质体,其中多个原生质体由丝状真菌细胞的培养物制备;
b.)用第一构筑体和第二构筑体转化多个原生质体,其中第一构筑体包含在两侧上由与原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且第二构筑体包含在两侧上由与原生质体的基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,其中转化通过同源重组将第一构筑体整合到第一基因座中并且将第二构筑体整合到第二基因座中,其中至少第二基因座为原生质体基因组中的第一可选标记基因,并且其中第一多核苷酸包含突变和/或基因控制元件;
c.)通过进行选择和反向选择来纯化同核转化体;以及
d.)使经纯化的转化体在有助于丝状真菌细胞再生的培养基中生长。
2.根据实施例1所述的方法,其中将第一构筑体分裂成构筑体A和构筑体B,其中构筑体A包含第一多核苷酸的第一部分和与第一多核苷酸的第一部分的第一基因座5'同源的的核苷酸,并且其中构筑体B包含第一多核苷酸的第二部分和与在第一多核苷酸的第二部分3'端的第一基因座同源的核苷酸,其中第一多核苷酸的第一部分和第二部分包含重叠互补序列。
3.根据实施例1或2所述的方法,其中将第二构筑体分裂成构筑体A和构筑体B,其中构筑体A包含第二多核苷酸的第一部分和与在第二多核苷酸的第一部分5'端的第一基因座同源的核苷酸,并且其中构筑体B包含第二多核苷酸的第二部分和与在第二多核苷酸的第二部分3'端的第一基因座同源的核苷酸,其中第二多核苷酸的第一部分和第二部分包含重叠互补序列。
4.根据以上实施例中的任一者的方法,其中用来自多个第一构筑体的单个第一构筑体和来自多个第二构筑体的单个第二构筑体转化来自多个原生质体的每个原生质体,其中来自多个第一构筑体的每个第一构筑体中的第一多核苷酸包含不同突变和/或基因控制元件;并且其中来自多个第二构筑体的每个第二构筑体中的第二多核苷酸相同。
5.根据实施例4所述的方法,进一步包含重复步骤a至d,以产生丝状真菌细胞库,其中库中的每个丝状真菌细胞包含具有不同突变和/或基因控制元件的第一多核苷酸。
6.根据以上实施例中的任一者的方法,其中第一多核苷酸编码目标丝状真菌基因或异源基因。
7.根据以上实施例中的任一者的方法,其中突变为单核苷酸多态性。
8.根据以上实施例中的任一者的方法,其中基因控制为启动子序列和/或终止子序列。
9.根据以上实施例中的任一者的方法,其中基因控制元件为启动子序列,其中启动子序列选自表1中列出的启动子序列。
10.根据以上实施例中的任一者的方法,其中多个原生质体分布于微量滴定板的孔中。
11.根据以上实施例中的任一者的方法,其中步骤a至d在微量滴定板的孔中进行。
12.根据实施例10或11所述的方法,其中微量滴定板是96孔、384孔或1536孔微量滴定板。
13.根据以上实施例中的任一者的方法,其中丝状真菌细胞来自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代、无性世代、同物异名或分类等效物。
14.根据以上实施例中的任一者的方法,其中丝状真菌细胞来自黑曲霉。
15.根据以上实施例中的任一者的方法,其中丝状真菌细胞具有形成非菌丝体表型。
16.根据以上实施例中的任一者的方法,其中真菌细胞具有非功能性非同源末端结合(NHEJ)路径。
17.根据实施例16所述的方法,其中非功能性NHEJ路径归因于将细胞暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子。.
18.根据实施例16所述的方法,其中化学抑制剂为W-7。
19.根据实施例6至18中任一项所述的方法,其中第一基因座是针对目标丝状真菌基因。
20.根据实施例1至18中任一项所述的方法,其中第一基因座是针对原生质体基因组中的第二可选标记基因。
21.根据实施例20所述的方法,其中第二可选标记基因为营养缺陷型标记基因、比色标记基因或定向标记基因。
22.根据以上实施例中的任一者的方法,其中第一可选标记基因为营养缺陷型标记基因、比色标记基因或定向标记基因。
23.根据以上实施例中的任一者的方法,其中第二多核苷酸为营养缺陷型标记基因、定向标记基因或抗生素抗性基因。
24.根据实施例21或22所述的方法,其中比色标记基因为aygA基因。
25.根据实施例21至23中任一项所述的方法,其中营养缺陷型标记基因为argB基因、trpC基因、pyrG基因或met3基因。
26.根据实施例21至23中任一项所述的方法,其中定向标记基因为乙酰胺酶(amdS)基因、硝酸还原酶基因(niaD)或硫酸盐通透酶(Sut B)基因。
27.根据实施例23所述的方法,其中抗生素抗性基因为ble基因,其中ble基因赋予腐草霉素抗性。
28.根据实施例19所述的方法,其中第一可选标记基因为aygA基因并且第二多核苷酸为pyrG基因。
29.根据实施例20至27中任一项所述的方法,其中第一可选标记基因为met3基因,第二可选标记基因为aygA基因且第二多核苷酸为pyrG基因。
30.根据以上实施例中的任一者的方法,其中多个原生质体通过以下方式制备:将细胞壁从丝状真菌细胞的培养物中的丝状真菌细胞去除;分离多个原生质体;以及
将分离的多个原生质体再悬浮于包含二甲亚砜(DMSO)的混合物中,其中DMSO的最终浓度为7%v/v或更低。
31.根据实施例30所述的方法,其中在进行步骤a至d之前将混合物储存在至少-20℃或-80℃下。
32.根据实施例30至31中任一项所述的方法,其中培养物的体积为至少1升。
33.根据实施例30至31中任一项所述的方法,其中在制备原生质体之前使培养物生长持续至少12小时。
34.根据实施例30至33中任一项所述的方法,其中真菌培养物在至少70%的原生质体更小并且含有更少的细胞核的条件下生长。
35.根据实施例30至34中任一项所述的方法,其中通过酶消化来去除细胞壁。
36.根据实施例35所述的方法,其中酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。
37.根据实施例30至36中任一项所述的方法,进一步包含在储存原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的混合物中。
38.根据实施例37所述的方法,其中添加PEG到最终浓度为8%v/v或更低。
39.根据以上实施例中的任一者的方法,其中步骤a至d为自动化的。
40.一种用于制备供储存用的丝状真菌细胞的方法,方法包含:
从包含丝状真菌细胞的真菌培养物制备原生质体,其中制备原生质体包含将细胞壁从真菌培养物中的丝状真菌细胞去除;
分离原生质体;以及
将分离的原生质体再悬浮于包含最终浓度为7%v/v或更低的二甲亚砜(DMSO)的混合物中。
41.根据实施例40所述的方法,其中将混合物储存在至少-20℃或-80℃下。
42.根据实施例40至41中任一项所述的方法,其中真菌培养物的体积为至少1升。
43.根据实施例40至42中任一项所述的方法,其中在制备原生质体之前使真菌培养物生长持续至少12小时。
44.根据实施例40至43中任一项所述的方法,其中真菌培养物在至少70%的原生质体更小并且具有更少的细胞核的条件下生长。
45.根据实施例40至44中任一项所述的方法,其中通过酶消化来去除细胞壁。
46.根据实施例45所述的方法,其中酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。
47.根据实施例40至46中任一项所述的方法,其进一步包含在储存原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的混合物中。
48.根据实施例47所述的方法,其中添加PEG到最终浓度为8%v/v或更低。
49.根据实施例40至48中任一项所述的方法,其进一步包含在储存原生质体之前将原生质体分布到微量滴定板中。
50.根据实施例40至49中任一项所述的方法,其中真菌培养物中的丝状真菌细胞具有形成非菌丝体表型。
51.根据实施例40至50中任一项所述的方法,其中真菌培养物中的丝状真菌细胞选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
52.根据实施例50所述的方法,其中真菌培养物中的丝状真菌细胞为黑曲霉或其有性世代或无性世代。
53.一种用于产生真菌生产菌株的系统,系统包含:
一或多个处理器;以及
一或多个存储器,其与一或多个处理器中的至少一个可操作地联接且其上存储有指令,指令当由一或多个处理器中的至少一个执行时促使系统:
a.)用第一构筑体和第二构筑体转化来源于丝状真菌细胞的培养物的多个原生质体,其中第一构筑体包含在两侧上由与原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且第二构筑体包含在两侧上由与原生质体的基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,其中转化通过同源重组将第一构筑体整合到第一基因座中并且将第二构筑体整合到第二基因座中,其中至少第二基因座为原生质体基因组中的第一可选标记基因,并且其中第一多核苷酸包含突变和/或基因控制元件;
b.)通过进行选择和反向选择来纯化同核转化体;以及
c.)使经纯化的转化体在有助于丝状真菌细胞再生的培养基中生长。
54.根据实施例53所述的方法,其中将第一构筑体分裂成构筑体A和构筑体B,其中构筑体A包含第一多核苷酸的第一部分和与第一多核苷酸的第一部分的第一基因座5'同源的的核苷酸,并且其中构筑体B包含第一多核苷酸的第二部分和与在第一多核苷酸的第二部分3'端的第一基因座同源的核苷酸,其中第一多核苷酸的第一部分和第二部分包含重叠互补序列。
55.根据实施例53或54所述的方法,其中将第二构筑体分裂成构筑体A和构筑体B,其中构筑体A包含第二多核苷酸的第一部分和与在第二多核苷酸的第一部分5'端的第一基因座同源的核苷酸,并且其中构筑体B包含第二多核苷酸的第二部分和与在第二多核苷酸的第二部分3'端的第一基因座同源的核苷酸,其中第二多核苷酸的第一部分和第二部分包含重叠互补序列。
56.根据实施例53至55中的任一项所述的系统,其中用来自多个第一构筑体的单个第一构筑体和来自多个第二构筑体的单个第二构筑体转化来自多个原生质体的每个原生质体,其中来自多个第一构筑体的每个第一构筑体中的第一多核苷酸包含不同突变和/或基因控制元件;并且其中来自多个第二构筑体的每个第二构筑体中的第二多核苷酸相同。
57.根据实施例53至56中的任一项所述的系统,其进一步包含重复步骤a至c,以产生丝状真菌细胞库的指令,其中库中的每个丝状真菌细胞包含具有不同突变和/或基因控制元件的第一多核苷酸。
58.根据实施例53至57中的任一项所述的系统,其中突变为单核苷酸多态性。
59.根据实施例53至58中的任一项所述的系统,其中基因控制元件为启动子序列和/或终止子序列。
60.根据实施例53至58中的任一项所述的系统,其中基因控制元件为启动子序列,其中启动子序列选自表1中列出的启动子序列。
61.根据实施例53至60中的任一项所述的系统,其中在微量滴定板的孔中进行步骤a至c。
62.根据实施例61所述的系统,其中微量滴定板是96孔、384孔或1536孔微量滴定板。
63.根据实施例53至62所述的系统,其中丝状真菌细胞选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
64.根据实施例53至62所述的系统,其中丝状真菌细胞为黑曲霉。
65.根据实施例53至64中的任一项所述的系统,其中丝状真菌细胞具有形成非菌丝体表型。
66.根据实施例53至65中的任一项所述的系统,其中真菌细胞具有非功能性非同源末端结合路径。
67.根据实施例66所述的系统,其中通过将细胞暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。
68.根据实施例67所述的系统,其中化学抑制剂为W-7。
69.根据实施例53至68中任一项所述的系统,其中第一基因座是针对目标丝状真菌基因。
70.根据实施例53至68所述的系统,其中第一基因座是针对原生质体基因组中的第二可选标记基因。
71.根据实施例70所述的系统,其中第二可选标记基因选自营养缺陷型标记基因、比色标记基因或定向标记基因。
72.根据实施例53至71中的任一项所述的系统,其中第一可选标记基因选自营养缺陷型标记基因、比色标记基因或定向标记基因。
73.根据实施例53至72中的任一项所述的系统,其中第二多核苷酸选自营养缺陷型标记基因、定向标记基因或抗生素抗性基因。
74.根据实施例71或72所述的系统,其中比色标记基因为aygA基因。
75.根据实施例71至73中的任一项所述的系统,其中营养缺陷型标记基因选自argB基因、trpC基因、pyrG基因或met3基因。
76.根据实施例71至73中的任一项所述的系统,其中定向标记基因选自乙酰胺酶(amdS)基因、硝酸还原酶基因(nlaD)或硫酸盐通透酶(Sut B)基因。
77.根据实施例73所述的系统,其中抗生素抗性基因为ble基因,其中ble基因赋予腐草霉素抗性。
78.根据实施例69所述的系统,其中第一可选标记基因为aygA基因并且第二多核苷酸为pyrG基因。
79.根据实施例53至68中的任一项所述的系统,其中第一可选标记基因为met3基因,第二可选标记基因为aygA基因且第二多核苷酸为pyrG基因。
80.根据实施例53至79中的任一项所述的系统,其中多个原生质体通过以下方式制备:将细胞壁从丝状真菌细胞的培养物中的丝状真菌细胞去除;分离多个原生质体;以及
将多个分离原生质体再悬浮于包含最终浓度为7%v/v或更低的二甲亚砜(DMSO)的混合物中。
81.根据实施例80所述的系统,其中在进行步骤a至c之前将混合物储存在至少-20℃或-80℃下。
82.根据实施例80至81中的任一项所述的系统,其中培养物的体积为至少1升。
83.根据实施例80至82中的任一项所述的系统,其中在制备原生质体之前使培养物生长持续至少12小时。
84.根据实施例80至83中的任一项所述的系统,其中真菌培养物在至少70%的原生质体更小并且具有更少的细胞核的条件下生长。
85.根据实施例80至83中的任一项所述的系统,其中通过酶消化来去除细胞壁。
86.根据实施例85所述的系统,其中酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。
87.根据实施例53至86中的任一项所述的系统,其进一步包含在储存原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的混合物中。
88.根据实施例87所述的系统,其中其中添加PEG到最终浓度为8%v/v或更低。
89.一种使丝状真菌进化以获得所期望表型的高通量(HTP)基因组工程改造的方法,其包含:
a.扰动多种具有相同基因组菌株背景的初始丝状真菌微生物的基因组,借此创建包含具有独特基因变异的个别丝状真菌菌株的初始HTP基因设计丝状真菌菌株库;
b.针对所期望表型来筛选和选择初始HTP基因设计丝状真菌菌株库中的个别菌株;
c.提供各自包含独特基因变异组合的后续多种丝状真菌微生物,所述基因变异选自前一步骤中筛选的至少两种个别丝状真菌菌株中存在的基因变异,借此创建后续HTP基因设计丝状真菌菌株库;
d.针对所期望表型来筛选和选择后续HTP基因设计丝状真菌菌株库的个别丝状真菌菌株;以及
e.按照线性或非线性方式重复步骤c)至d)一或多次,直至丝状真菌微生物已经获得所期望表型,其中每次后续迭代创建了新的HTP基因设计丝状真菌菌株库,所述库包含具有独特基因变异的个别丝状真菌菌株,所述独特基因变异为选自前一HTP基因设计丝状真菌菌株库的至少两种个别丝状真菌菌株的基因变异的组合。
90.根据实施例89所述的HTP基因组工程改造方法,其中初始HTP基因设计丝状真菌菌株库包含选自由以下组成的群组的至少一个库:启动子交换微生物菌株库、SNP交换微生物菌株库、起始/终止密码子微生物菌株库、优化序列微生物菌株库、终止子交换微生物菌株库和其任何组合。
91.根据实施例89所述的HTP基因组工程改造方法,其中初始HTP基因设计丝状真菌菌株库包含启动子交换微生物菌株库。
92.根据实施例89所述的HTP基因组工程改造方法,其中初始HTP基因设计丝状真菌菌株库包含启动子交换微生物菌株库,所述启动子交换微生物菌株库含有至少一种双顺反子设计(BCD)调节序列。
93.根据实施例89所述的HTP基因组工程改造方法,其中初始HTP基因设计丝状真菌菌株库包含SNP交换微生物菌株库。
94.根据实施例89所述的HTP基因组工程改造方法,其中初始HTP基因设计丝状真菌菌株库包含微生物菌株库,所述微生物菌株库包含:
a.至少一种编码嵌合生物合成酶的多核苷酸,其中所述嵌合生物合成酶包含:
i.参与丝状真菌中的调控路径的酶;
ii.翻译融合到能够结合DNA结合位点的DNA结合域;以及
b.至少一种DNA架构序列,其包含对应于嵌合生物合成酶的DNA结合域的DNA结合位点。
95.根据实施例89所述的HTP基因组工程改造方法,其中后续HTP基因设计丝状真菌菌株库是来源于初始HTP基因设计丝状真菌菌株库中的基因变异的完整组合性菌株库。
96.根据实施例89所述的HTP基因组工程改造方法,其中后续HTP基因设计丝状真菌菌株库是来源于初始HTP基因设计丝状真菌菌株库中的基因变异的完整组合性菌株库的子集。
97.根据实施例89所述的HTP基因组工程改造方法,其中后续HTP基因设计丝状真菌菌株库是来源于前一HTP基因设计丝状真菌菌株库中的基因变异的完整组合性菌株库。
98.根据实施例89所述的HTP基因组工程改造方法,其中后续HTP基因设计丝状真菌菌株库是来源于前一HTP基因设计丝状真菌菌株库中的基因变异的完整组合性菌株库的子集。
99.根据实施例89所述的HTP基因组工程改造方法,其中扰动基因组包含利用至少一种选自由以下组成的群组的方法:随机突变诱发、靶向序列插入、靶向序列缺失、靶向序列置换和其任何组合。
100.根据实施例89所述的HTP基因组工程改造方法,其中多种初始丝状真菌微生物包含来源于工业生产丝状真菌菌株的独特基因变异。
101.根据实施例89所述的HTP基因组工程改造方法,其中多种初始丝状真菌微生物包含工业生产菌株微生物,表示为S1Gen1;和来源于其的任何数目的后续微生物世代,表示为SnGenn。
102.根据实施例89所述的HTP方法,其中丝状真菌选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
103.根据实施例89所述的HTP方法,其中丝状真菌为黑曲霉。
104.一种用于产生SNP交换丝状真菌菌株库的方法,其包含以下步骤:
a.提供参考丝状真菌菌株和第二丝状真菌菌株,其中第二丝状真菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,基因变异不存在于参考丝状真菌菌株中;以及
b.扰动参考丝状真菌菌株或第二丝状真菌菌株的基因组,借此创建包含多种个别丝状真菌菌株的初始SNP交换丝状真菌菌株库,所述多种个别菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自参考丝状真菌菌株与第二丝状真菌菌株之间的多种已鉴别基因变异的单一基因变异。
105.根据实施例104所述的用于产生SNP交换丝状真菌菌株库的方法,其中扰动参考丝状真菌菌株的基因组,以添加第二丝状真菌菌株中发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
106.根据实施例104所述的用于产生SNP交换丝状真菌菌株库的方法,其中扰动第二丝状真菌菌株的基因组,以去除参考丝状真菌菌株中未发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
107.根据实施例104所述的用于产生SNP交换丝状真菌菌株库的方法,其中所得的多种具有独特基因变异的个别丝状真菌菌株一起组成参考丝状真菌菌株与第二丝状真菌菌株之间的所有已鉴别基因变异的完整组合性库。
108.根据实施例104所述的用于产生SNP交换丝状真菌菌株库的方法,其中所得的多种具有独特基因变异的个别丝状真菌菌株一起组成参考丝状真菌菌株与第二丝状真菌菌株之间的已鉴别基因变异的完整组合性库的子集。
109.根据实施例104所述的用于产生SNP交换丝状真菌菌株库的方法,其中丝状真菌选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
110.根据实施例104所述的用于产生SNP交换丝状真菌菌株库的方法,其中丝状真菌为黑曲霉。
111.一种用于修复和改良生产丝状真菌菌株的表型性能的方法,其包含以下步骤:
a.提供亲本谱系丝状真菌菌株和来源于其的生产丝状真菌菌株,其中生产丝状真菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,基因变异不存在于亲本谱系菌株中;
b.扰动亲本谱系丝状真菌菌株或生产丝状真菌菌株的基因组,以创建初始丝状真菌菌株库,其中初始库中的每种菌株包含来自亲本谱系丝状真菌菌株与生产丝状真菌菌株之间的多种已鉴别基因变异的独特基因变异;
c.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择初始库的个别菌株,借此鉴别赋予表型性能改良的独特基因变异;
d.提供各自包含来自基因变异的独特基因变异组合的后续多种丝状真菌微生物,基因变异存在于前一步骤中筛选的至少两种个别丝状真菌菌株中,借此创建后续启动子交换丝状真菌菌株库;
e.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择后续库的个别菌株,借此鉴别赋予额外表型性能改良的独特基因变异组合;以及
f.按照线性或非线性方式重复步骤d)至e)一或多次,直至相较于生产丝状真菌菌株的表型性能,丝状真菌菌株的表型性能展现出所期望改良水平,其中每次后续迭代创建了新的微生物菌株库,其中新的库中的每种菌株包含基因变异,基因变异为选自前一库的至少两种个别丝状真菌菌株的基因变异的组合。
112.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中初始丝状真菌菌株库是包含亲本谱系丝状真菌菌株与生产丝状真菌菌株之间的所有已鉴别的基因变异的完整组合库。
113.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中初始丝状真菌菌株库是包含亲本谱系丝状真菌菌株与生产丝状真菌菌株之间的已鉴别的基因变异的子集的完整组合库的子集。
114.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中后续丝状真菌菌株库是初始库的完整组合库。
115.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中后续丝状真菌菌株库是初始库的完整组合库的子集。
116.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中后续丝状真菌菌株库是前一库的完整组合库。
117.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中后续丝状真菌菌株库是前一库的完整组合库的子集。
118.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中扰动亲本谱系丝状真菌菌株的基因组,以添加生产丝状真菌菌株中发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
119.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中扰动生产丝状真菌菌株的基因组,以去除亲本谱系丝状真菌菌株中未发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
120.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中扰动基因组包含利用选自由以下组成的群组的至少一种方法:随机突变诱发、靶向序列插入、靶向序列缺失、靶向序列置换和其组合。
121.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中重复步骤d)至e),直至相较于生产丝状真菌菌株的表型性能,后续库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少10%。
122.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中重复步骤d)至e),直至相较于生产丝状真菌菌株的表型性能,后续库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少一倍。
123.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中步骤f)的经改良的表型性能选自由以下组成的群组:所关注的产物的体积生产率、所关注的产物的比生产率、所关注的产物的产率、所关注的产物的效价和其组合。
124.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中步骤f)的经改良的表型性能为:增加或更高效生产所关注的产物,所述所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
125.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中已鉴别的基因变异进一步包含来自启动子交换库的人工启动子交换基因变异。
126.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,进一步包含:
对以下任一者的至少一种微生物菌株的基因组进行工程改造:
初始丝状真菌菌株库,或
后续丝状真菌菌株库,
以包含来自可操作地连接到内源性丝状真菌目标基因的启动子梯的一或多种启动子。
127.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中丝状真菌选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
128.根据实施例111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中丝状真菌为黑曲霉。
129.一种用于产生启动子交换丝状真菌菌株库的方法,其包含以下步骤:
a.提供对基础丝状真菌菌株具有内源性的多种目标基因和启动子梯,其中所述启动子梯包含在基础丝状真菌菌株中展现出不同表达谱的多种启动子;以及
b.对基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始启动子交换丝状真菌菌株库,所述多种个别丝状真菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对基础丝状真菌菌株具有内源性的目标基因之一上的启动子梯的一或多种启动子。
130.根据实施例129所述的方法,其中丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
131.根据实施例129所述的方法,其中丝状真菌菌株为黑曲霉菌株。
132.一种用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其包含以下步骤:
a.提供对基础丝状真菌菌株具有内源性的多种目标基因和启动子梯,其中所述启动子梯包含在基础丝状真菌菌株中展现出不同表达谱的多种启动子;
b.对基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始启动子交换丝状真菌菌株库,所述多种个别丝状真菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对基础丝状真菌菌株具有内源性的目标基因之一上的启动子梯的一或多种启动子;
c.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择初始启动子交换丝状真菌菌株库的个别丝状真菌菌株,借此鉴别赋予表型性能改良的独特基因变异;
d.提供各自包含来自基因变异的独特基因变异组合的后续多种丝状真菌微生物,基因变异存在于前一步骤中筛选的至少两种个别丝状真菌菌株中,借此创建后续启动子交换丝状真菌菌株库;
e.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择后续启动子交换丝状真菌菌株库的个别丝状真菌菌株,借此鉴别赋予额外表型性能改良的独特基因变异组合;以及
f.按照线性或非线性方式重复步骤d)至e)一或多次,直至相较于生产丝状真菌菌株的表型性能,丝状真菌菌株的表型性能展现出所期望改良水平,其中每次后续迭代创建了新的微生物菌株的启动子交换丝状真菌菌株库,其中新的库中的每种菌株包含基因变异,基因变异为选自前一库的至少两种个别丝状真菌菌株的基因变异的组合。
133.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中后续启动子交换丝状真菌菌株库是初始启动子交换丝状真菌菌株库的完整组合库。
134.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中后续启动子交换丝状真菌菌株库是初始启动子交换丝状真菌菌株库的完整组合库的子集。
135.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中后续启动子交换丝状真菌菌株库是前一启动子交换丝状真菌菌株库的完整组合库。
136.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中后续启动子交换丝状真菌菌株库是前一启动子交换丝状真菌菌株库的完整组合库的子集。
137.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中重复步骤d)至e),直至相较于生产丝状真菌菌株的表型性能,后续启动子交换丝状真菌菌株库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少10%。
138.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中重复步骤d)至e),直至相较于生产丝状真菌菌株的表型性能,后续启动子交换丝状真菌菌株库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少一倍。
139.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中步骤f)的经改良的表型性能选自由以下组成的群组:所关注的产物的体积生产率、所关注的产物的比生产率、所关注的产物的产率、所关注的产物的效价和其组合。
140.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中步骤f)的经改良的表型性能为:增加或更高效生产所关注的产物,所述所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
141.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
142.根据实施例132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中丝状真菌菌株为黑曲霉菌株。
143.一种用于产生终止子交换丝状真菌菌株库的方法,其包含以下步骤:
提供对基础丝状真菌菌株具有内源性的多种目标基因和终止子梯,其中所述终止子梯包含在基础丝状真菌菌株中展现出不同表达谱的多种终止子;以及
对基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始终止子交换丝状真菌菌株库,所述多种个别丝状真菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对基础丝状真菌菌株具有内源性的目标基因之一的终止子梯的一或多种终止子。
144.根据实施例143所述的方法,其中丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
145.根据实施例143所述的方法,其中丝状真菌菌株为黑曲霉菌株。
146.一种用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其包含以下步骤:
a.提供对基础丝状真菌菌株具有内源性的多种目标基因和终止子梯,其中所述终止子梯包含在基础丝状真菌菌株中展现出不同表达谱的多种终止子;
b.对基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始终止子交换丝状真菌菌株库,所述多种个别丝状真菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对基础丝状真菌菌株具有内源性的目标基因之一的终止子梯的一或多种终止子;
c.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择初始终止子交换丝状真菌菌株库的个别丝状真菌菌株,借此鉴别赋予表型性能改良的独特基因变异;
d.提供各自包含来自基因变异的独特基因变异组合的后续多种丝状真菌微生物,基因变异存在于前一步骤中筛选的至少两种个别丝状真菌菌株中,借此创建后续启动子交换丝状真菌菌株库;
e.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择后续终止子交换丝状真菌菌株库的个别丝状真菌菌株,借此鉴别赋予额外表型性能改良的独特基因变异组合;以及
f.按照线性或非线性方式重复步骤d)至e)一或多次,直至相较于生产丝状真菌菌株的表型性能,丝状真菌菌株的表型性能展现出所期望改良水平,其中每次后续迭代创建了新的微生物菌株的终止子交换丝状真菌菌株库,其中新的库中的每种菌株包含基因变异,基因变异为选自前一库的至少两种个别丝状真菌菌株的基因变异的组合。
147.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中后续终止子交换丝状真菌菌株库是初始终止子交换丝状真菌菌株库的完整组合库。
148.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中后续终止子交换丝状真菌菌株库是初始终止子交换丝状真菌菌株库的完整组合库的子集。
149.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中后续终止子交换丝状真菌菌株库是前一终止子交换丝状真菌菌株库的完整组合库。
150.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中后续终止子交换丝状真菌菌株库是前一终止子交换丝状真菌菌株库的完整组合库的子集。
151.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中重复步骤d)至e),直至相较于生产丝状真菌菌株的表型性能,后续终止子交换丝状真菌菌株库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少10%。
152.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中重复步骤d)至e),直至相较于生产丝状真菌菌株的表型性能,后续终止子交换丝状真菌菌株库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少一倍。
153.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中步骤f)的经改良的表型性能选自由以下组成的群组:所关注的产物的体积生产率、所关注的产物的比生产率、所关注的产物的产率、所关注的产物的效价和其组合。
154.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中步骤f)的经改良的表型性能为:增加或更高效生产所关注的产物,所述所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
155.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
156.根据实施例146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中丝状真菌菌株为黑曲霉菌株。
157.一种丝状真菌宿主细胞,其包含可操作地连接到宿主细胞的内源性基因上的启动子,其中启动子对内源性基因具有异源性,其中启动子具有选自由SEQ ID No.1-4组成的群组的序列。
158.根据实施例157所述的丝状真菌宿主细胞,其中相较于不具有可操作地连接到内源性基因上的启动子的参考丝状真菌菌株的表型性能,丝状真菌宿主细胞具有所期望改良水平的表型性能。
159.根据实施例157所述的丝状真菌宿主细胞,其中丝状真菌宿主细胞选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
160.根据实施例157所述的丝状真菌宿主细胞,其中丝状真菌宿主细胞为黑曲霉。
161.一种丝状真菌菌株库,其中库中的每个丝状真菌菌株包含可操作地连接到宿主细胞的内源性基因上的启动子,其中启动子对内源性基因具有异源性,其中启动子具有选自由SEQ ID No.1-4组成的群组的序列。
162.根据实施例161所述的丝状真菌菌株库,其中丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
163.根据实施例161所述的丝状真菌菌株库,其中丝状真菌菌株为黑曲霉。
164.一种用于分离来源于单一真菌孢子的克隆群体的方法,方法包含:
(a)在液体悬浮液中提供多个真菌孢子,其中多个真菌孢子来源于真菌菌株;
(b)将液体悬浮液的离散体积分配到包含多个反应区域的衬底中的个别反应区域,其中多个反应区域中的每个反应区域包含生长培养基,其中分配引起至少75%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率;
(c)在包含生长培养基的所述反应区域中培养经分配的单一活性真菌孢子;以及
(d)选择在反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。
165.根据实施例164所述的方法,进一步包含针对离散体积中存在或不存在单一真菌孢子来筛选离散体积,其中仅选择含有单一真菌孢子的离散体积进行步骤(b)。
166.根据实施例165所述的方法,其中分配引起至少80%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
167.根据实施例165所述的方法,其中分配引起至少90%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
168.根据实施例165所述的方法,其中分配引起至少95%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
169.根据实施例165所述的方法,其中分配引起至少99%的个别反应区域含有不超过多个真菌孢子的单一活性真菌孢子的概率。
170.根据实施例165所述的方法,其中分配使得大体上所有个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
171.根据实施例165至170中任一项所述的方法,其中筛选离散体积需要在光学上辨别离散体积中存在或不存在单一真菌孢子。
172.根据实施例171所述的方法,其中筛选使用能够在光学上辨别离散体积中存在或不存在单一真菌孢子的微流体装置来进行。
173.一种用于分离来源于单一真菌孢子的克隆群体的方法,方法包含:
(a)在液体悬浮液中提供多个真菌孢子,其中多个真菌孢子来源于真菌菌株;
(b)稀释液体悬浮液,其中稀释为限制稀释法;
(c)将稀释的离散体积分配到包含多个反应区域的衬底中的个别反应区域,其中多个反应区域中的每一反应区域包含生长培养基,其中限制稀释法使得分配到每个反应区域的稀释的离散体积含有一个活性孢子或无活性孢子的概率遵循泊松分布,借此多个反应区域中超过90%的反应区域不含活性孢子且超过90%的含有一或多个活孢子的反应区域仅含有单一活性孢子;
(d)在包含生长培养基的所述反应区域中培养经分配的单一活性真菌孢子;以及
(e)选择在所述反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。
174.根据实施例164至173中任一项所述的方法,其中反应区域存在于微量滴定板中。
175.根据实施例174所述的方法,其中微量滴定板含有96个孔、384个孔或1536个孔。
176.根据实施例164至175中任一项所述的方法,其中真菌菌株为丝状真菌菌株。
177.根据实施例176所述的方法,其中丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
178.根据实施例177所述的方法,其中丝状真菌菌株为黑曲霉或其有性世代或无性世代。
179.根据实施例178所述的方法,其中丝状真菌菌株具有非菌丝体粒化形态。
180.根据实施例179所述的方法,其中丝状真菌菌株表达酿酒酵母(S.cerevisiae)SLN1基因的黑曲霉直系同源物的突变体形式。
181.根据实施例180所述的方法,其中酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式的核酸序列为SEQ ID NO:13。
182.根据实施例179或180所述的方法,其中酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式可操作地连接到选自SEQ ID NO:1或2的启动子序列。
183.根据实施例164至182中任一项所述的方法,其中真菌菌株具有基因扰动。
184.根据实施例183所述的方法,其中基因扰动选自单核苷酸多态性、DNA插入、DNA缺失或其任何组合。
185.根据实施例183或184所述的方法,其中通过用核糖核蛋白复合物(RNP复合物)转化原生质体将基因扰动引入到来源于真菌菌株的原生质体。
186.根据实施例185所述的方法,其中RNP复合物包含与引导RNA(gRNA)复合的RNA引导的核酸内切酶。
187.根据实施例186所述的方法,其中RNA引导的核酸内切酶为第2类CRISPR-Cas系统RNA引导的核酸内切酶。
188.根据实施例187所述的方法,其中第2类CRISPR-Cas系统RNA引导的核酸内切酶为II型、V型或VI型RNA引导的核酸内切酶。
189.根据实施例187所述的方法,其中第2类CRISPR-Cas系统RNA引导的核酸内切酶选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物、突变体、变异体或修饰形式。
190.根据实施例189所述的方法,其中第2类CRISPR-Cas系统RNA引导的核酸内切酶为Cas9或其同系物、直系同源物或旁系同源物。
191.根据实施例186所述的方法,其中gRNA为单独的CRISPR RNA(crRNA)或退火到转录活化CRISPR RNA(tracrRNA)。
192.根据实施例186所述的方法,其中gRNA为包含tracrRNA和crRNA的单一引导RNA(sgRNA)。
193.根据实施例191或192所述的方法,其中crRNA包含与真菌菌株的基因组内的目标基因互补的引导序列,其中将RNP复合物引入到原生质体中促进了将基因扰动引入到目标基因中。
194.根据实施例193所述的方法,其中目标基因的基因扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将DNA末端通过非同源末端结合NHEJ路径在目标基因中进行非同源末端结合。
195.根据实施例193所述的方法,进一步包含共转化包含目标基因的突变形式的供体DNA,其中目标基因的突变形式在两侧上由与目标基因基因座同源的核苷酸侧接。
196.根据实施例195所述的方法,其中目标基因的基因扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将目标基因通过同源重组用供体DNA进行置换。
197.根据实施例185至196中任一项所述的方法,其中步骤(b)进一步包含共转化包含可选标记的载体。
198.根据实施例197所述的方法,其中可选标记在步骤(d)期间使用,以选择来源于转化感受态真菌菌株的克隆群体。
199.根据实施例183或184所述的方法,其中通过用第一构筑体和第二构筑体转化多个原生质体将基因扰动引入到来源于真菌菌株的原生质体中,其中第一构筑体包含在两侧上由与原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且第二构筑体包含在两侧上由与原生质体的基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,转化使得通过同源重组将第一构筑体整合到第一基因座中并且将第二构筑体整合到第二基因座中,其中至少第二基因座为原生质体基因组中的第一可选标记基因,并且其中第一多核苷酸包含基因扰动。
200.根据实施例199所述的方法,其中可选标记基因在步骤(d)期间使用,以促进选择来源于包含所述基因扰动的真菌菌株的克隆群体。
201.根据实施例195至200中任一项所述的方法,其中真菌菌株具有非功能性非同源末端结合(NHEJ)路径。
202.根据实施例201所述的方法,其中通过将真菌菌株暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。
203.根据实施例202所述的方法,其中化学抑制剂为W-7。
204.一种用于产生丝状真菌菌株的方法,方法包含:
a.)提供多个原生质体,其中原生质体由亲本丝状真菌菌株的培养物制备;
b.)用核糖核蛋白复合物(RNP复合物)转化来自多个原生质体的每个原生质体;以及
c.)针对优于亲本丝状真菌菌株的表型性能改良来筛选和选择来源于经转化的原生质体的个别丝状真菌菌株,借此鉴别所选择的个别丝状真菌菌株的基因组中赋予表型性能改良的基因扰动。
205.根据实施例204所述的方法,其中基因扰动选自单核苷酸多态性、DNA插入、DNA缺失或其任何组合。
206.根据实施例204或205所述的方法,其中RNP复合物包含与引导RNA(gRNA)复合的RNA引导的核酸内切酶。
207.根据实施例206所述的方法,其中RNA引导的核酸内切酶为第2类CRISPR-Cas系统RNA引导的核酸内切酶。
208.根据实施例207所述的方法,其中第2类CRISPR-Cas系统RNA引导的核酸内切酶为II型、V型或VI型RNA引导的核酸内切酶。
209.根据实施例207所述的方法,其中第2类CRISPR-Cas系统RNA引导的核酸内切酶选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物、突变体、变异体或修饰形式。
210.根据实施例209所述的方法,其中第2类CRISPR-Cas系统RNA引导的核酸内切酶为Cas9或其同系物、直系同源物或旁系同源物。
211.根据实施例206所述的方法,其中gRNA为单独的CRISPR RNA(crRNA)或退火到转录活化CRISPR RNA(tracrRNA)。
212.根据实施例206所述的方法,其中gRNA为包含tracrRNA和crRNA的单一引导RNA(sgRNA)。
213.根据实施例211或212所述的方法,其中crRNA包含与亲本丝状真菌菌株的基因组内的目标基因互补的引导序列,其中引入RNP复合物扰乱了原生质体中的目标基因。
214.根据实施例213所述的方法,其中目标基因的扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将DNA末端通过非同源末端结合(NHEJ)路径在目标基因中进行非同源末端结合。
215.根据实施例213所述的方法,其中步骤(b)进一步包含共转化包含目标基因的突变形式的供体DNA,其中目标基因的突变形式在两侧上由与目标基因基因座同源的核苷酸侧接。
216.根据实施例215所述的方法,其中目标基因的扰动通过以下来促进:将目标基因由RNP复合物裂解以产生目标基因中的DNA末端,接着将目标基因通过同源重组用供体DNA进行置换。
217.根据实施例204至216中任一项所述的方法,其中步骤(b)进一步包含共转化包含可选标记的载体。
218.根据实施例217所述的方法,其中可选标记在步骤(c)期间使用,针对优于亲本丝状真菌菌株的表型性能改良,选择转化感受态个别丝状真菌菌株进行后续筛选。
219.根据实施例215至218中任一项所述的方法,其中亲本丝状真菌菌株具有非功能性非同源末端结合(NHEJ)路径。
220.根据实施例219所述的方法,其中通过将细胞暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使NHEJ路径为非功能性的。
221.根据实施例220所述的方法,其中化学抑制剂为W-7。
222.根据实施例204至221中任一项所述的方法,其中相较于亲本丝状真菌菌株的表型性能,丝状真菌菌株的表型性能改良包含所关注的产物的所测量的表型变量增加至少10%。
223.根据实施例204至221中任一项所述的方法,其中相较于亲本丝状真菌菌株的表型性能,丝状真菌菌株的表型性能改良包含所关注的产物的所测量的表型变量增加至少一倍。
224.根据实施例222或223所述的方法,其中所测量的表型变量选自由以下组成的群组:所关注的产品的体积生产率、所关注的产品的比生产率、所关注的产品的产率、所关注的产品的效价和其组合。
225.根据实施例222或223所述的方法,其中增加所测量的表型变量或更高效地生产所关注的产物。
226.根据实施例222或223所述的方法,其中所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
227.根据实施例204至226中任一项所述的方法,其中亲本丝状真菌菌株选自:棉霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
228.根据实施例227所述的方法,其中丝状真菌菌株为黑曲霉或其有性世代或无性世代。
229.根据实施例228所述的方法,其中丝状真菌菌株具有非菌丝体粒化形态。
230.根据实施例229所述的方法,其中丝状真菌菌株表达酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式。
231.根据实施例230所述的方法,其中酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式的核酸序列为SEQ ID NO:13。
232.根据实施例230或231所述的方法,其中酿酒酵母SLN1基因的黑曲霉直系同源物的所述突变体形式可操作地连接到选自SEQ ID NO:1或2的启动子序列。
233.根据实施例204至232中任一项所述的方法,进一步包含在步骤(c)之前产生来源于个别丝状真菌菌株的分离克隆群体。
234.根据实施例233所述的方法,其中分离包含:
(i)诱导经转化的原生质体,以产生多个真菌孢子,其中多个真菌孢子中的每个真菌孢子来源于单一经转化的原生质体;
(ii)将来源于单一经转化的原生质体的多个真菌孢子再悬浮于液体中,以产生液体悬浮液;
(iii)将液体悬浮液的离散体积分配到包含多个反应区域的衬底中的个别反应区域,其中多个反应区域中的每个反应区域包含生长培养基,其中分配引起至少75%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率;以及
(iv)在包含生长培养基的反应区域中培养经分配的单一活性真菌孢子,借此产生来源于个别丝状真菌菌株的分离克隆群体。
235.根据实施例234所述的方法,进一步包含针对离散体积中存在或不存在单一真菌孢子来筛选离散体积,其中仅选择含有单一真菌孢子的离散体积进行步骤(iii)。
236.根据实施例235所述的方法,其中分配引起至少80%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
237.根据实施例235所述的方法,其中分配引起至少90%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
238.根据实施例234所述的方法,其中分配引起至少95%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
239.根据实施例234所述的方法,其中分配引起至少99%的个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
240.根据实施例234所述的方法,其中分配使得大体上所有个别反应区域含有不超过一个来自多个真菌孢子的单一活性真菌孢子的概率。
241.根据实施例235所述的方法,其中筛选离散体积需要在光学上辨别离散体积中存在或不存在单一真菌孢子。
242.根据实施例241所述的方法,其中筛选使用能够在光学上辨别离散体积中存在或不存在单一真菌孢子的微流体装置来进行。
243.根据实施例233所述的方法,其中分离包含:(i)诱导经转化的原生质体,以产生多个真菌孢子,其中多个真菌孢子中的每个真菌孢子来源于单一经转化的原生质体;(ii)将来源于单一经转化的原生质体的多个真菌孢子再悬浮于液体中,以产生液体悬浮液;(iii)稀释液体悬浮液,其中稀释为限制稀释法;(iv)将稀释的离散体积分配到包含多个反应区域的衬底中的个别反应区域,其中多个反应区域中的每一反应区域包含生长培养基,其中限制稀释法使得分配到每个反应区域的稀释的离散体积含有一个活性孢子或无活性孢子的概率遵循泊松分布,借此多个反应区域中超过90%的反应区域不含活性孢子且超过90%的含有一或多个活孢子的反应区域仅含有单一活性孢子;(v)在包含生长培养基的反应区域中培养经分配的单一活性真菌孢子;以及(vi)选择在反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。
244.根据实施例234至243中任一项所述的方法,其中反应区域存在于微量滴定板中。
245.根据实施例244所述的方法,其中微量滴定板含有96个孔、384个孔或1536个孔。
*****
引用并入
本文中所引用的所有参考文献、论文、公开、专利、专利公开以及专利申请以全文引用的方式并入以用于所有目的。然而,提及本文引用的任何参考文献、论文、公开案、专利、专利公开案以及专利申请案不是并且不应认为是承认或以任何形式暗示其构成有效现有技术或形成世界上任何国家的公共常识的部分。
另外,以下特定申请以引用的方式并入本文中:20016年12月30日申请的美国申请案第15/396,230(美国公开第US 2017/0159045 A1号);2016年12月7日申请的PCT/US2016/065465(WO 2017/100377A1);2016年4月27日申请的美国申请案第15/140,296(US 2017/0316353 A1);2017年4月26日申请的PCT/US2017/029725(WO 2017/189784 A1);2016年12月7日申请的PCT/US2016/065464(WO 2017/100376 A2);2016年12月7日申请的美国临时申请第62/431,409号;2015年12月7日申请的美国临时申请第62/264,232和2016年7月29日申请的美国临时申请第62/368,786号。另外,以下特定申请以引用的方式并入本文中:2017年12月29日申请的PCT/US2017/069086和2016年12月30日申请的美国临时申请第62/441,040号。
序列表
<110> 齐默尔根公司 (Zymergen, Inc.)
K•S•布鲁诺(Bruno, Kenneth S.)
P•韦斯特福尔(Westfall, Patrick)
E•谢夫奇克(Szewczyk, Edyta)
A•M•方三世(Fong III, Arthur Muir)
K•罗特席尔德-曼奇内里(Rothschild-Manicinelli, Kyle)
<120> 用于改良真菌菌株的高通量基因组工程改造平台
<130> ZYMR-008/03WO 327574-2056
<150> US 62/515,907
<151> 2017-06-06
<160> 19
<170> PatentIn版本3.5
<210> 1
<211> 504
<212> DNA
<213> 黑曲霉
<400> 1
ctgtctccat ccgtattccc cccttcactc tcgtttactc tccgttcctg ctggtcagtc 60
tcttccttga ccgtgtccct cgcttccaac actcgtttcc ttcaatttcc tccccccttt 120
tctctcgttg cccccctcct cccgctccct cccgccatgc gtctcgttcg agattgcctg 180
tatggggggt tattccttaa cacggcgctc ttctcccagc tctcccacgc catcgatatc 240
gatatcagca gtaccagtat gccttccccc cacttcttca atctctttcc cattatatac 300
accactgtct cggcccttgc tttattccgt catccttctc ctctcctaca tacttggacg 360
cagttgcgcc actatatcta agactccatg ccttccattc caacgacata cataaatacc 420
atgaattgac aactgataca catttttatt gtccgtatag gttcaattaa agatgccgcc 480
agtaagacgg cctacgggtc catg 504
<210> 2
<211> 620
<212> DNA
<213> 米曲霉
<400> 2
gaattcatgg tgttttgatc attttaaatt tttatatggc gggtggtggg caactcgctt 60
gcgcgggcaa ctcgcttacc gattacgtta gggctgatat ttacgtaaaa atcgtcaagg 120
gatgcaagac caaagtagta aaaccccgga gtcaacagca tccaagccca agtccttcac 180
ggagaaaccc cagcgtccac atcacgagcg aaggaccacc tctaggcatc ggacgcacca 240
tccaattaga agcagcaaag cgaaacagcc caagaaaaag gtcggcccgt cggccttttc 300
tgcaacgctg atcacgggca gcgatccaac caacaccctc cagagtgact aggggcggaa 360
atttaaaggg attaatttcc actcaaccac aaatcacagt cgtccccggt attgtcctgc 420
agaatgcaat ttaaactctt ctgcgaatcg cttggattcc ccgcccctgg ccgtagagct 480
taaagtatgt cccttgtcga tgcgatgtat cacaacatat aaatactagc aagggatgcc 540
atgcttggag gatagcaacc gacaacatca catcaagctc tcccttctct gaacaataaa 600
ccccacagaa ggcatttatg 620
<210> 3
<211> 1503
<212> DNA
<213> 黑曲霉
<400> 3
gcttccatgg ttggcagggt cacgtagccg taattatttt cggggaaggt tggaatgcaa 60
tggaaggaga tttccgtagc tagggctttg atcgatgcgg ggagcactgc cggtaggagg 120
tctggggtga atggggtgat atgcaggcgc ttcgtatcgg acggtgtggt cgtcatttgc 180
ccaatagata gttagataga tacctgagta cggtagcagt gcaggtgacg gctaagaagt 240
cggagggaaa aaggtgcagt cacaagcgca ttcagcctaa caagtgtctt tgatactcgg 300
tgagaaacaa acttgagtag aataagacag aaagttcttg tgaatggtca caatgggctt 360
ccaacgaagc atcaagcaga ccctgttgca atagatattc caagaccgaa aaattaatga 420
taggatcagt tattggccga gggattttcc gggccgccaa gaccgggtta tggagatgtg 480
gcgcaggcat gccatcctca gccacaggtt tctgtgacat cccaaaagca ttgatcgaag 540
ttggtataag tttcattcta tctaccatgg tgacaaggaa gtacgggtgt agaaaagaaa 600
aatctggtag gaatagctca gcaacaaatg gcggaatgat tgatgtaaga ctcgatgtat 660
ccactggaac gagatgcaag ttgcaacagc aataaatgga tttcagcctc cattacaatg 720
taacagtcgg gccgatactc agccggagca ggatttggcg ggtgaatagt ggatccggag 780
agaaacgatc aggtaatctt tcgtacggga ccagacccga cccggcctgc tttttagtta 840
ccagctgtta cttgtgtaat ccccgtaaaa cgatcagtaa ctgccattga tcttcctgct 900
cttttccctt attccctttt ccccctttga aacttatttt cttcttcctc ttcatcgctt 960
aactacttaa gtactaggat tctcactcgc cactcttccc caatatctaa aagtagtctt 1020
gctacgaaga tcccttcccc ctacattact cctcctcctt caacacaccc acccccccct 1080
gatccggccc cataccagtc ttcccgcggc taactaaagc ccgcacgtct gatctcatcg 1140
ccgcttccag cttcgacctc agtcgctcac atggccactc ggattcctta gcatcatctc 1200
tttttttccc atcccctccc cgccctacca actgagggtc ctctgaagtg tgctccacat 1260
ttccttccct tcacttattt tggatcctca ttttctttct tcctctgttt cggggcgttc 1320
ttcaacatcg ctacttagtc acttctctcc tctcattacc ggacgggaac ttcgctccct 1380
tctccgcttt cttatccgga ccgcctcttg ccaatctcac catcgatcct aacccgtcat 1440
aatccagtca ctcaacccta ctattgtcga catacacgtc ggttcccatt ctcgttcgag 1500
atg 1503
<210> 4
<211> 1503
<212> DNA
<213> 黑曲霉
<400> 4
acagtggcca tgaaatccaa tcatttcctt ctggccgccc tcgggcaaga gatagtgccg 60
cagaggtctc tcacagcatc tacatctgcg accgcaacag ccaccaagcg aggcgcacat 120
gagcttgtcc tcctcccatg ccaaagtttg gccctcttcg tttctgtgat gctgaaggaa 180
gtcaaactcg tcgatgatag gaccagatgg tttgtcaagg gtcaacgctt tccatgcctt 240
ctggcaccgg tagtaatgct cttctgcaag ggagacttga cgtttcggat ccgcgggccc 300
cgggacatgc tggaagggat tttctggctc aataccacgt ctgtatttga ccctttccag 360
acagttaatc cgctgcagga gggcgaactg tagctcctcg ttctccttgt agcgcttgat 420
ccagtctttt tggatgttgc acttgcttgg cctatgcttc tcatataatc ttgccctgtc 480
atagagacga cgtctgagat tgtagcgttc gtctttgatc acccggagcc agataggcct 540
gagtatatct gacattagat caaagggtct gtggatagtc tccttcagca tcagcgacgc 600
atgtgactcg catgtcggag agagcttgtg ggtggtcatc tttgatggcg tcctctgctt 660
tcccttgatt ttcgttgatt gtttttcgaa agttaagtct ggaagtcaag agaatccttc 720
tgccagacat tatatttacg tatactgacg tagtagaaac agcgtcagga tgaggacatg 780
gtgtgtgctg gaccacggaa tcatagttca tcagtatatt gggttggaca aataacgctg 840
agcatgtata tgtctttaca cactataaaa gccagcgaac gccaataaaa tagggcatat 900
tgatgtgaaa atatgacacc agttaaaagc agtgtattga ttttatctct cttcacctcg 960
gacctatact accgtataca agactcaact tacttccaga tatagtaata tacaccctat 1020
ggacgaacca gcacaataat tacagccaaa caacaccacc caaatggcat attcctaatc 1080
agcactaagc acaaatacca ctgtcatcac agcataatca ataagaatcc cagacaaccg 1140
actcactctg actcacctta cacaaacccc caagcaaagc gcagcccaga acctcagcca 1200
acaatcgggc aacgtacggg gaaagattgg ccgatccatg atgtcagcag ccctaaccca 1260
aagcggacta gcgcataccg cccctctgac tccgccatcc cagggctcga gaagcttccg 1320
tggcgtcgat ataaattcag cgggccttga acatccctcc ttacgacaca cctcacgcga 1380
tcgattttga cactcacaca ccgccaccct cacatcctcc acccacacca caccccttaa 1440
tcaacccacc atcaccgcta gaacgtctat ctcatcaccg acttctcatc catcttcaaa 1500
atg 1503
<210> 5
<211> 318
<212> DNA
<213> 黑曲霉
<400> 5
taatactata aaaggaggat cgaagttctg atggttatga atgatataga aatgcaactt 60
gccgcaacgg atacggaagc ggaaacggac caatgtcgag cacgggtagt cagactgcgg 120
catcggatgt ccaaacggta ttgatcctgc aggctactat ggtgtggcac aaggatcaat 180
gcggtacgac gatttgatgc agataagcag gctgcgaagt agtaactctt gcgtagagaa 240
aatggcgacg ggtggctgat aagggcggtg ataagcttaa ttgtcatcgc agataagcac 300
tgctgtctca agacccta 318
<210> 6
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> aygA.1 crRNA原间隔子序列
<400> 6
ucagucuauc cguuucacga 20
<210> 7
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> aygA.3 crRNA原间隔子序列
<400> 7
uucccacgaa gcgaucacgg 20
<210> 8
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 对照crRNA原间隔子序列
<400> 8
augugucaga gacaacucaa 20
<210> 9
<211> 2757
<212> DNA
<213> 人工序列
<220>
<223> DJV_03_pyrG_insertion_in_AygA
<400> 9
gagacccgag acagacagtg acgccccttg ttccctcagc ggccgtggat tggtcagccc 60
ccctgcgttt gtagccctaa gtactctcaa tggtggttgt gatgtcacaa ggtttggagg 120
agagttcatg tgcaacccag tcggcaagtt tcgccgtgag taccttacat tgaatgggct 180
acgtttaaaa agggtccttc aatgctgtct cccgcctgaa ctgtaaatct tcacattgtc 240
tactcacaga ctggacgacg cgaacaagca agcaaacaca atggctcctt ggatcctcgg 300
cgagaagttc aacaccgttt acccccacaa gggctctatc aaagctctct gggaaacgaa 360
gtggaagttt gcagtaagtt ttcactggtg gtcggcatca ccaccccttg ctcagtggtt 420
ggccaaccgc tcagccaggt cttatctaac gtagcatgca gtgtgaaaaa tcagtctatc 480
cgtttcaggg tcgcggtcgt ttgtacggca gcttctactt gcttgcacag ggagctctct 540
ggggcttgac gtcttttgga gttgcgaggg agttgatttc ctacttctaa gtttggactg 600
aatccgtggt gtgattgagg tgattggcga tgtttggcta taccagctat atgtaataat 660
ctctactgta tactactatt caacgcattt tactatgcgt gctgctaggg tcggcaatga 720
caatggcaat ctgactgacg tggtctattt ctccatgtgc agcagggaat acgagctcca 780
atggacctcg ggagtggcac agtcaatggc aaggaaactc cgcctttgca ggtgtggctg 840
aaccccacgg gtcggaggcg gagcaatcca cccccgatgt ggctggtgcg tggaggggct 900
cgcgatgatt ttactgagct tgcttttctt gtcgacattg aacattgtcc ttggtcttcc 960
ttcagattta agggtcagtc actgctacat ttctcagtag tatccgcgca cgtctctgga 1020
tttacgaatc agggtccacc agtcgaaact tcgaactact ctcattatac aatcctcttt 1080
ccattcccgc attaacccct ccatcaacac catgtcctcc aagtcgcaat tgacctacac 1140
tgcccgtgcc agcaagcatc ccaatgctct ggcgaagagg ctgttcgaga ttgccgaggc 1200
caagaagacc aatgtgactg tctcggctga cgttaccacc actaaggagc tactagatct 1260
tgctgaccgt aggccgaccc gctactctgc ctgattatgc tgcatgcaaa cttattaacg 1320
gtgataccgg actgcaggtc tcggtcccta cattgccgtg atcaaaaccc acaactagtt 1380
cctctctgat ttcagcaacg agaccattga gggacttaag gctctcgcgc agaagcacaa 1440
ctttctcatc ttcgaggacc gcaagttcat tgacatcggc aacacggtcc agaagcaata 1500
ccacggcggt accctccgta tctcggaatg ggcccacatc atcaactgca gcattctccc 1560
tggtgagggt atcgtcgagg ctctcgctca gacggcgtct gcaccggact tcgcctacgg 1620
ccccgaacgc ggtctgttga tcttggcaga gatgacctct aagggctcct tggctaccgg 1680
ccagtacact acttcctcgg tcgattatgc ccggaaatac aagaacttcg ttatgggatt 1740
cgtgtcgacg cgcgcgttgg gtgaggtgca gtcggaagtc agctctcctt cggatgagga 1800
ggactttgtg gtcttcacga ctggtgtgaa catttcttcc aagggagata agcttggtca 1860
gcagtaccag acgcccggat cggctatcgg ccggggtgct gacttcatta tcgcgggtcg 1920
cggtatctac gccgcgccgg atccggtgca ggctgcgcaa cagtatcaga aggaggggtg 1980
ggaagcctac ctggcccgtg tcggcggaaa ctaatactat aaaaggagga tcgaagttct 2040
gatggttatg aatgatatag aaatgcaact tgccgcaacg gatacggaag cggaaacgga 2100
ccaatgtcga gcacgggtag tcagactgcg gcatcggatg tccaaacggt attgatcctg 2160
caggctacta tggtgtggca caaggatcaa tgcggtacga cgatttgatg cagataagca 2220
ggctgcgaag tagtaactct tgcgtagaga aaatggcgac gggtggctga taagggcggt 2280
gataagctta attgtcatcg cagataagca ctgctgtctc gacggtgcca tcgaagactt 2340
tcgacctatc ttccaaaagc ttatcgatgt aggttatcat aatcttgcca tgtgcgcctt 2400
acgagcgcaa gggtaaaata ctcacttcta gataggaaaa tatcaacgat gcctacaccg 2460
atgcctacac gcaggctttc ttcccggttg ctgaggcact cgaaaataag gcgtcagctg 2520
ctttgaacaa caacaatgtg gagatggcat ctgacttgct ccgaagagct gctgtggtct 2580
accgtatctc ccgcttccca tatgtcgacc cgaccagaga agacatcaaa aaagaggcct 2640
tcaaccgcca gaagaaggtc tatctgaagg cagcatcctt ctggaagccc accatccagg 2700
aggtcatcat cccgcacaag cataagtcgg ccaccgacgg agcctatgtt ccccttt 2757
<210> 10
<211> 929
<212> DNA
<213> 人工序列
<220>
<223> DJV_07_4bp_insertion_in_AygA
<400> 10
gagacccgag acagacagtg acgccccttg ttccctcagc ggccgtggat tggtcagccc 60
ccctgcgttt gtagccctaa gtactctcaa tggtggttgt gatgtcacaa ggtttggagg 120
agagttcatg tgcaacccag tcggcaagtt tcgccgtgag taccttacat tgaatgggct 180
acgtttaaaa agggtccttc aatgctgtct cccgcctgaa ctgtaaatct tcacattgtc 240
tactcacaga ctggacgacg cgaacaagca agcaaacaca atggctcctt ggatcctcgg 300
cgagaagttc aacaccgttt acccccacaa gggctctatc aaagctctct gggaaacgaa 360
gtggaagttt gcagtaagtt ttcactggtg gtcggcatca ccaccccttg ctcagtggtt 420
ggccaaccgc tcagccaggt cttatctaac gtagcatgca gtgtgaaaaa tcagtctatc 480
cgtttcacta gtgacggtgc catcgaagac tttcgaccta tcttccaaaa gcttatcgat 540
gtaggttatc ataatcttgc catgtgcgcc ttacgagcgc aagggtaaaa tactcacttc 600
tagataggaa aatatcaacg atgcctacac cgatgcctac acgcaggctt tcttcccggt 660
tgctgaggca ctcgaaaata aggcgtcagc tgctttgaac aacaacaatg tggagatggc 720
atctgacttg ctccgaagag ctgctgtggt ctaccgtatc tcccgcttcc catatgtcga 780
cccgaccaga gaagacatca aaaaagaggc cttcaaccgc cagaagaagg tctatctgaa 840
ggcagcatcc ttctggaagc ccaccatcca ggaggtcatc atcccgcaca agcataagtc 900
ggccaccgac ggagcctatg ttccccttt 929
<210> 11
<211> 1273
<212> DNA
<213> 黑曲霉
<400> 11
atgagcttcc gtcaagccct cagacccttc cgtcgcacca tgtccggtga aaagatctac 60
gaaggcgtat tcggtatacc tcactcctag catttctgct ttgatttacc tccaagctaa 120
tactatggaa tgataaatag ccgtccacaa accccaaggc gtctcctccg ccgacgtcgt 180
ccgcaccctc caaacgcact tcaacccctc cacgctcttc gccccctggc tcgctgacga 240
gcgcgcccgt cgcgcccgcg aaagcaccta ccagcgcaag cgccgccgca cccagcgtct 300
cgacgtgaag atcggccacg gaggcaccct cgaccccctc gcgaccggca ttctcgtcgc 360
gggagtcggc aagggcacga aacacctgaa cgagttccta ggatgcacga agcaatatga 420
gaccgttgtg ctgttcggcg ccgagacaga tacctatgat cggctgggga aggtggtgcg 480
caaggcgccc tacgagcatg tgacaaggga gatggtggag aaggcactgg agcagttccg 540
tgggaagatt atgcagaggc cgccaatttt ctcggcgctg aaggtgaatg gcaagaagct 600
ttatgagtat gcccgcgagg gcaaggagcc gccgattgag atccagaaga ggccggtcga 660
ggtgacggat ttgaggattg tcgagtggta cgagcctgga acgcatgagt ttaagtggcc 720
tgaggttgag gcagacgggg aggagaaggc tgttgcggag aagttgttgg cgaaggagga 780
tgagttgccg attgtggaga gggaggcgga tggtgaagga gaggcctctg cgaagagaaa 840
gtccccgcct gcggaggatg ctaaggagga gaaggtagag ggtggtgata ctgagtctgc 900
tccctcggct aagaagcaga aggttgctga tggcgaggct gcgcctgttg cgccggccga 960
gcaggaggcg tcggatgctc ccaatgctga agccgtggaa tcctcggaat ccaagcccca 1020
gtcccagccc cagccggctg cggtgaagat caccatgacg gtgtcatctg gcttctatgt 1080
gcgctccttg gcgcacgatc tgggcaaggc ggtcggaagc tgcgggctga tgtcctcgct 1140
gatccggtct cgtcaggctc agttcgagct tcacccggac aaggtgctcg agtataagga 1200
cctcgaggcc ggcgaggagg tctggggccc caaggtccag cgattcctcg aggactggga 1260
ggagaagcga ctg 1273
<210> 12
<211> 3670
<212> DNA
<213> 黑曲霉
<400> 12
atgactatcc cactgagtcg actatccacc gtggatccgc ggcaaccagg aattagtggc 60
cataatcggg gcctcttgaa cgccgacgtc gtcccgatca acgacaagca gaaagtcttt 120
cttgccggtt ctggccctcc gtcgccaatg catcgcgtac aacctctgga cggatcgcat 180
ggtccgccca gtgctccagc agtctacgag cagccatggc gccctccgta ctcgtcttct 240
tatgacggac atcccgcgga ccagcgtcgc acatcgaatg ctcctcagcc tgcgctccca 300
ccccacggat acccgatgaa cccaaaccgt gagctgccgc agctcccacc agaagtccca 360
tatggccgac agggcagttt gcctggcccc gtgcataccc ctccagaagc ccccactcct 420
catcccagct ttcgtcctat gaatggaact ccccatgagg ccgcccctca ttcagcaccc 480
cccgactatc gctcacggat gtcttttaca cctcaggagc ctcacagcaa tggggacgct 540
ccgctccccg cccacacgtt acccccgact cagtatccca ctccggttcc gcatttgtcg 600
catactccta cgccgtacga ttcaggtctt tacggaaacc aggcgtacgg gatacgccag 660
cagcgaaagg ccgctcgggc gcaacaggtg aattgtctcc ttgcagcgaa gttagctgag 720
atattgatcg ggaaaccctg actaactcgt gagcttttgc tgtctttgaa ggcctgcgat 780
cagtgccgaa cgagaaaggc caagtgcgat gaaggccggc ctgcttgtag ccattgcaag 840
gagaacaact tgatatgtgt ttataaagaa gttccccctc acaagtccgt ggcccggcaa 900
ttgccactct aatagttcga tggacatgtg ctgacgacgt atccaggcaa gaaaaggcaa 960
cacagcttct tctggaccgt atctctcagt tggaagacgg tctcatcgaa aaaatcgatc 1020
gcattaatgc actccaggtc gagcacacga atcaactcac tcagctgtat cctcggttga 1080
aagaggctaa agcgataagc accaaggaga cgacagagaa gcaagccatt cctcggatat 1140
cgaaagcgga tatacctgat atcttacaaa aaacggaaac caaagaagaa gacatgaacg 1200
cgatcgtcgg acaggagctt gaaagagccg aaggggaagt gattccacag ggtgaagacg 1260
gtgatctttc aattcccgtt gagcatacca ctgcagccca caagttgctt tcgtggccgt 1320
ctatcaaggc tcttctcgaa ccgagagagt acgatgaaga ttatgttatg aagctggaag 1380
aggagcgagg attgattctc gtttacggcc gcggtgaagg acacgatact agtgaaagcc 1440
cagcaatgac attctcatca tcatcgtccc ggtccaactg ggatcaaagt tacagcaatg 1500
gtgctcctgc tagcggccag tggaacccag gcgctgtcca aaatggcact catctcaaac 1560
cactcggacc cagtattgat gatttcggga tattcagcac tgatgccaaa accgttcgtc 1620
gttatcatca aagctacctg aaccacatgc ataagcttca tccatttatc aacctgaccg 1680
aattgagcgc aagcatcgaa tcattcattc agaaatactg ctcacctgac gtttctgttc 1740
cggtaaacat cctgaacagc catacgcccg gcgacattcc acgcggtgcg aaaaggaagc 1800
gttcttgcga tacgctacat ggtggcggat gcgacatcca gttttctcct ggtgccaaac 1860
acgaaggctc tagcggacgt cgcgtggaga agtcactgga aaatgctatt gttctcttgg 1920
ttcttgcact tggcagtatt tgtgaagttc cgggagccat ccctggtcca gttactgaca 1980
cgcccgtgga ctttcaaaag gagcggattc ctggaccctc tacacgcagc atgctatcat 2040
cggcagatac agaactagtt atgcagtccc agggaagttt cttctcgcag acaagtaacc 2100
attcattttc atctgctacc ggggggcaga aggctgcttc cgatcggtcg ccatacccgg 2160
ataatagtca cttaaggaac gtggatgtca ttcctggctt ggcatattat gcgtacgccg 2220
cacagatctt ggggagtttg caaggcgcga acgggctgta ccatgttcaa gcagccttac 2280
tagcaggact ttatgcggga caattagcac atcctttcca gagccatgga tggatctacc 2340
aggcggccag agcatgccaa gtgcttgtcc gatcgtatgt attttcctat tttactcttc 2400
tttctctttt tcaccctgaa caccaggagt ttgcaagaaa aatcccgtgc taaccagtct 2460
caggaaacgg tatgaacaaa tgaatgacgg cccgctgaaa gacctatata actttgcgta 2520
ctggacctgc ctgcagctcg agaggtaagc acgttgctct cattatgcga tccatgagta 2580
ctaataagtc attcatatag cgacatcctt gccgaactag atcttccggc tagtggtata 2640
tctcgcgcgg aagcacggat tgagttgcca aagggccgaa ctctctctct acctaacgac 2700
cctgctgctc cgaacaccat gatgatgttt ttctactctg cccagatcca tttgagaaag 2760
gttctgaacc gtgttcacac cgatctatac aaagtcgaaa gtaagttgat cttaggcagg 2820
caggagccct tggctgtact aacgcttctc tgcagaacag aatgagaaca ggtggtctgc 2880
taacgtacag gagattctga gcatgaacct tgaactgtgg agaagcagct tacctgacat 2940
aatgagatgg aaggacacgg accctccaca tgaggatatt aatgtggctc ggatgcgagc 3000
taagtactac ggtgcacgat acattatcca tcgtccactc ctttactggg ctctgcatca 3060
ttcacatccc accgaaaacg gtcgatcggc atcagtggat tcccctacag gatcagcgat 3120
gtcgggagcc aagtcgcagc aggtttcgcc ctcaatggcg cacagccaac gtgctatcaa 3180
tatggcacga ttgtctagtg atgttggccc tatgggtcga tcggcaccga cgccaacccc 3240
cgctccgaca ggatcgcgac cagcactcgc atatcgcgac ctcaatccga agttacgaag 3300
agcgtgcaaa gtatgcatag actccgccat attgagtacc gaggcctttg atggcatcac 3360
aggccggccg gtagtaacta atatcttcgg cacagctcat gcgtaagtgg agcccaaaag 3420
ggagtgtgaa gccggatagt ggacgtcgct gaccttgctg atgctgtgct agtcaattcg 3480
gtaacatgct ggtattgtcg gccacgtata tgtcaagtct ctcagagctg gttgatcgga 3540
acgacctcga tcggttattt aagcgaacca tacgctttct cctccaaagc cgcgagatat 3600
cgccaaccct acgagccgat gcaaagattc tcagcgagat atacgagaag atctttgggg 3660
agccagctga 3670
<210> 13
<211> 4038
<212> DNA
<213> 黑曲霉
<400> 13
atggctggcg cggacgaaac gctcgcggcc gctgctgcca ttttgagagg tcttgcgaaa 60
gaaactcctt cctccagcgc tcctcccttc gacttcgaat tctcccatcc tcccgccaat 120
ggctacgaca caaaactcgc aaaattaccc ggggaaacga gttcagcaaa ggcggctttt 180
gaacaggagt tggaagcttt ggtccgacga gtccgtcatc tggaattcca aaatgtcagt 240
caccaccagt caacccccaa atcctcccag tcttctctca ctcccggcga gaaggacgct 300
gatttcctct ggtcctttgg tctctctcgt gtttcgtccc gtgacggttc tgactcttgc 360
ctctcacagc atcaaaagac aacacaacaa caacaacaac aacaacccca tggatccaga 420
cgatcggcca tcgaaccgga agaccacgaa gtggaggaag acatcgacga tgaggagagt 480
gacgaagatg aggaactgaa ttcaaggaca cgtttggtac gcgaggagga catcagctac 540
ctacggaatc atgttcaaaa acaagcggag gaaataagtt tccagaagga tatcattgct 600
caggtccgtg acgaattaca acaacaggag gagcaaacac gacgggcttt gaccaaggtc 660
gaaaacgaag atgtggtctt gctggagcgg gagctacgca agcaccagca ggccaacgaa 720
gcgttccaaa aggcactacg ggaaatcggc ggcatcatta cccaggtcgc aaacggtgac 780
ctgtccatga aggtgcagat tcacccgttg gagatggacc ccgaaattgc cactttcaag 840
cgtacgatca acaccatgat ggaccaacta caagtcttcg gtagcgaggt gtcgcgagtc 900
gcacgagagg tcggaacaga gggcatactc ggtggtcagg ctcagatcac cggggtgcat 960
ggtatctgga aggagttgac ggagaacgtc aacataatgg ccaagaatct caccgatcag 1020
gtccgtgaga tcgctgcagt cacgacagcg gtcgcccacg gtgacctgag ccagaagatt 1080
gaaagtcggg cccagggtga aatcttggaa ctgcaacaga ctatcaacac catggtggac 1140
caactaagga catttgcaac ggaagtcacc cgcgtcgcgc gtgatgtcgg tacggaaggt 1200
gtgcttggtg gacaggccca aattgaaggg gtgcaaggca tgtggaacga actcacggtg 1260
aatgtcaacg ccatggcgaa caatcttacg acgcaagtgc gtgatatcgc cacggttacc 1320
aaggctgtgg cgaagggtga cttgacgcag aaggttcagg cgaactgcaa gggagagatc 1380
gcagagttga agaatatcat caattccatg gttgaccaac taaggcagtt tgcacaagaa 1440
gtcaccaaga tcgccaagga ggtcggtacg gatggtgtcc ttggtggtca agccaccgtc 1500
aacgatgtgg agggcacatg gaaggatctg accgaaaacg tcaaccgtat ggccaacaat 1560
ctgaccaccc aggtcaggga gatcgccgac gtgaccaccg ccgtcgccaa gggtgatttg 1620
acaaagaagg tgacggctaa tgttcaaggt gaaatactgg acttgaagag cacgatcaac 1680
ggcatggtgg accggctaaa tacctttgcc tttgaagtca gcaaggtcgc gcgtgaagtc 1740
ggcacggatg gtacactggg tggtcaagcc aaggttgata atgtggaagg aaaatggaag 1800
gatctaaccg acaatgtgaa caccatggcc cagaatctga cgtcccaggt gcggagtata 1860
tcggacgtta cgcaagcaat tgcaaagggt gaccttagca agaagatcga ggtccatgca 1920
caaggagaga tactcaccct gaaggtcacc atcaaccaca tggttgaccg actagccaaa 1980
ttcgcgactg aactgaagaa ggtggcgcgc gatgttgggg ttgatggcaa gatgggtggt 2040
caggctaacg tcgaagggat cgctggaaca tggaaggaaa tcacggagga cgtgaatacg 2100
atggccgaga acctgacgtc tcaggtgcgc gcattcggtg agattacgga tgccgccacg 2160
gacggtgatt tcaccaagct catcacggtc aacgcatccg gcgaaatgga tgagttgaag 2220
cggaagatca acaagatggt ttccaacctc cgagacagta tccaacgtaa cacggccgcc 2280
agggaagctg cagaattggc gaaccgcacc aaatccgagt tcctcgcaaa catgagtcac 2340
gagatccgga cgcccatgaa cggtatcatt ggtatgacgc agttgacctt ggacacggat 2400
gatctcaagc cctatacccg agagatgttg aatgtcgtgc acaacctggc caacagcttg 2460
ctcaccatca ttgatgacat actcgatatc tccaagatcg aagcgaaccg tatggtgatt 2520
gagagcatcc cgttcaccgt gaggggaacc gtcttcaacg ccctgaagac gttagccgtc 2580
aaggccaacg agaagttcct gagtttgacg taccaggtgg acaacaccgt tcctgactat 2640
gtcatcggtg atcccttccg tctgcggcag attatcctta accttgtcgg caatgccatc 2700
aagttcaccg agcatggcga agtcaaactt actatctgca aatccgaccg agagcagtgc 2760
gcagcagacg aatatgcgtt tgaattctcc gtctcggata caggtattgg tattgaggaa 2820
gacaagctag atctcatctt cgacaccttc cagcaggcgg acggatcgac cacgcggagg 2880
tttggtggaa ctggtcttgg tctgtccatt tccaagcgcc tcgtgaacct gatgggtggt 2940
gatgtctggg tcacttcgga atacggccat ggcagtacct tccacttcac ttgcgttgtt 3000
aaactggcgg accagtcttt gagcgtcatc gcctcgcagc tgttgccgta caagaaccac 3060
cgtgtcctct ttatcgacaa gggcgagaat ggtggccagg ccgagaatgt gatgaagatg 3120
ctcaagcaaa tcgacctgga accgttagtg gtgcggaacg aggatcatgt cccgccgcct 3180
gagattcagg acccgtcggg caaggagtcc ggccatgcct atgatgtgat aatcgtggac 3240
tcggtggcca ctgctcggct gctgcggacg ttcgatgact tcaagtacgt tcctattgtc 3300
ttggtgtgcc cgctggtctg cgtcagcttg aagtctgccc ttgacctcgg tatcagctcc 3360
tatatgacca cgccatgcca gccaattgat ctcggtaacg gtatgctgcc tgctcttgaa 3420
ggacggtcta cgcccatcac cacggaccac tcccggtcgt tcgacatcct tctggcggag 3480
gataacgacg tcaatcagaa gttggctgtg aagatacttg agaaacacaa ccacaacgtt 3540
tccgtcgtca gtaacggtct cgaagccgta gaagccgtaa agcaacggcg ctacgatgtc 3600
attctgatgg atgttcagat gccagtcatg ggtggtttcg aagccacagg caagatccgc 3660
gagtatgaga gggaaagtgg tctcagccgg acaccgatca tcgcgctaac tgcacacgcc 3720
atgctgggcg atcgagagaa gtgtattcaa gcccagatgg atgagtactt gtcgaaaccc 3780
ctgaagcaga accagatgat gcagaccatt ctcaaatgtg ctacattagg tggttctctt 3840
ttggagaaga gcaggagtcg cgaatctcaa gtagtggtga aatgcacccg gtccatcaca 3900
gtgggcctga tggcaagagc caacagcgtc cggggttgga acctcgatcc gtcaccgcaa 3960
ccagcactat taaccgtggt ggtggcctcg caagcccaaa cgttgaccga gcggatgagc 4020
ttgccgtcga aagggtga 4038
<210> 14
<211> 6133
<212> DNA
<213> 黑曲霉
<400> 14
atggctgctg ctacgattga gttaccgttt atttcgtcgc actacgccat tgccgagtcg 60
acattgagca ccctcaccac agctcctacg gtcgagctag tcaaccagct cttggaagct 120
atcactacga aagcacgcga gcatgacgag ctcaagtctg acaagatacg cctcgaggtg 180
gaactcgata atgccgttcg ctccagagac aacaaaatca aggttctgaa gagctcggtc 240
gagaaaggtc atgccgaagt cgaggaaaca aggaagaaac ttcacgagtc cggttagttc 300
ctatgcggac ccgccaatac gcgtctactt acgctctgca gaaaacactc gttctaccct 360
ggaatccgag atcgctacac tcaagtcgtc ctccacgtca aacgagtctg aagccagctc 420
attgaagtct cgtatctcgt cgctcgaagc ttctaacaga gacactctct cactcctcga 480
atccaagtcc gcagcatatg acaagcttgc cgaggagctc tcaacacaac acaagaagac 540
aatcgaattg agacgcgaac tttccaccgc cgagcagaac ctccaagccg ccaactctgc 600
ttccgccagc gctaagttcc gtgagcagag tctccagcag gatttggaat tgacaaagaa 660
aaacaacgag tggttcgaga cggaattgaa gaccaagtcc gccgaatatc tgaaatttcg 720
caaggagaag agcgcccgga tttcggagct tcagcgtgaa aacgaggaga tcagtgcaaa 780
cgttgactcc ttgagacgaa gcgagaatgc ccttaagagc cgcctggatg aggtggaaca 840
gcgttatgaa gaggctcttt ccagcatcaa ccagctcaga gaagacgcta tcaaggcgac 900
cgagtcgttc agaatcgaat tggacagtgc aagtagacta gccgagttgc agtcgaatgc 960
tgcagagact tcgaagcagc gtgccaagga atgtcaactc gctctggata aagcaaggga 1020
agatgctgcg gagcagattt cccgactccg agtggagatt gaaaccgaac atgccgacaa 1080
agaagctgct gaacgccgcg ttgctgagct tgagctcacg gtcagccagc tcgaatccga 1140
tggttttgct ggaagaagat ccatgagccc tgcactgaat ggcgcagggc ccagcacccc 1200
aatgcgtccc agtaccccag ttggcgcgtt ttcacctaga gcgtcgcgcg gaaagggagg 1260
actcacactg acgcagatgt ataccgagta cgacaagatg agaatttcgc tggccatgga 1320
gcaaaaaaca aaccaagaac ttcgagcaac tctagacgag atggtccaag atctcgaggc 1380
cagcaagcct gaaatcgatg agctgcgtgc ggaccacggt agacttgaaa atgctgttgt 1440
tgagatgtct aacatactgg aaactgctgg gaaggaacga gacgatgcaa ctaaggaggc 1500
aagaaagtgg caaggccagg tggagggatt ggcccgggag ggagacattt tgcgccagca 1560
actcagagac ctgagctccc agattaaggt cttggttttg gaaaatgcaa ttctgaagga 1620
aggcgaaaca acgtacgata gagaggaact cgagaagatt gcgcgccagg agatcgatga 1680
ctcctctgct gatctcaacc caaccggacg gttcatcagt cgcaatctga tgacgttcaa 1740
ggatctccac gagctccaag agcagaatgt cactctccgt cgtatgctga gagagcttgg 1800
ggataagatg gagggtgcag aagctcgcga gcaggatgcc atccgtcaac aagagcaaga 1860
agagttgaag gacctgagaa tccgggtgca gacttaccgt gacgagatcg ctaacctcgt 1920
cgctcaaaca aagagctatg ttaaggagag agatacgttc cggagcatgc ttacccgccg 1980
ccgtcagact gttggcgatg cttctgtctt ctcccaatct cttcctctgg gcgcagctcc 2040
tcccgcttct gaagagccag ccaaggatgt tccagactac gctgatctgt tgcgcaaggt 2100
gcaggcacac ttcgacagct tccgcgagga gtccgccacc gaccatgcag ctttgaagca 2160
acaggtcaat gagttgtcca ggaagaacag tgaattgatg agcgaaatta gccgctctag 2220
cagtcagctt gttgccgcca cacagagagc ggagcttctt cagggtaact tcgatatgct 2280
caagaacgaa aacgcagaaa tgcagaaacg ctacgctacc ctcctggaga acgctaaccg 2340
gcaggatatc aggactcagc aagctgccga agatctggtg gagacgaagg gcctcgttga 2400
gagccttcaa cgggaaaatg ccaacctcaa ggcagaaaag gatctctgga agaatatcga 2460
gaagagactc atcgaggata acgagacact acgtaacgag agaggtcgac ttgattctct 2520
taacgcgaac ctccaaacca ttctcaatga gcgggaacat accgatgctg agagtcgccg 2580
tcgtttgcaa agcagtgtgg agtctctcga atcggagctt caatccacca agcggaagct 2640
taacgatgag gttgaggaag gaaagaaggc atcgctgcgt agggaatacg aacatgagca 2700
aagtcagaag cgaattgacg acttggtgac gagcttgggc gcagctcggg aggagttagt 2760
ggctgcgaag acgacaagag atcacttgca atcgagagtc gatgaactca ctgtcgagct 2820
gcgtagcgcc gaagagcgcc tccaggtcgt gcagactaag cccagtgtgt ctgctgctcc 2880
tactgaagcg cctgcggttc cggaggaagg ccaggagagt ggcctgacac gcgagcagga 2940
acttggtatt gaagtttccg agctccgtcg tgatttggag ttgacaaaga atgagcttca 3000
gcacgctgaa gagcgggtgg aggattataa ggctatcagt cagcagagcg aagagcgtct 3060
gcagtctgtc actgagaccc aggaacagta tcgggaggaa acggagcgtc tcatcgaaga 3120
gaaggataag aagattcagg acctcgaaaa gcgcatcgaa gaaatttccg ccgagctttc 3180
gactacgaac ggcgaactta ccaaattgcg tgacgagcaa ggggaggcta gccgacattt 3240
ggaggagcag aaggccgcgc tggaagcaga gatcacaagg ctgaaggacg agaatgaaag 3300
gcagatcgct tctgcccaat tccaccagga agatctcaag gcacaagctg aaatcgcgca 3360
gcatgcccag cagaactatg agagcgaact gctcaagcat gctgaagccg cgaagaatct 3420
acaattggtc cggtccgaag ctaaccagtt gaagctggaa gttgtcgaac tgcggacaca 3480
ggccgacact ttcaagaagg accttgctca gaaggaggaa agctggaccg agatcaagga 3540
taggtatgag agcgagctta cggaactgca aaagcgccgc gaggaagttc tccaccagaa 3600
ctctttgttg catacccaac tcgagaatat tacaaaccag atcgcagccc tccagcgtga 3660
ccgggctaac attcctgagg gagatgagga cggagaggcc ggcgcgccca acctcgaagg 3720
cctccagggg gtgatcaagt tcctgcgtcg ggagaaggag atcgttgatg tgcagtacca 3780
tctgtcaacc caggaaagca agcgtcttcg tcagcaactc gactacactc agacccagct 3840
tgacgaggcc cggcttaagc tcgagcagca gcgtcgcgcg gctgccgaca gtgaacatag 3900
cgccctcagc cacaacaagc tgatggagac cctgaacgaa ctgaatctgt tccgcgagag 3960
tagtgttacg ctgcgtaacc aggttaagca ggcggaaacc tcacttgcgg agaagtcctc 4020
tcgcatcgaa gaacttgttc agcaaataca gccgctagag actagaatca gggaactgga 4080
gaacactgta gagacaaagg atggagagct gaagttgcta caggatgata gggaccggtg 4140
gcagcaacgt acgcagaata tcctgcagaa gtacgaccgg gtagatcccg cggaaatgga 4200
aggtctgaag gagaagctcg agactttgga aaaggagcgg gatgaggcca ttgctgcccg 4260
ggacactcta cagacccagg ctgctgcttt cccagaacag ctgaagcatg cggaggatcg 4320
cgtgcaagaa ctgcgcacga agctcacgga ccaattcaag gctcggtcca aggagttgac 4380
tggccgtata aacgctaaac aggtggagct caacacggtt atgcaggaga aggaagtcat 4440
tcaagaagaa ctcaagacga ctcgggagga attgaatgag ctgaagacga agatggccga 4500
gcaacccgca gctcctgctg ccccagctgt tgaaggagct actggtgttg actcaacgcc 4560
tgcctctcag ttccctgcgc caacaacgca gccgcctgcc gcttctgacg atcaacgcgt 4620
gaaggctctg gaagagaagg tgcagcgcct cgaggcagct cttgcggaga aggagacggc 4680
gttgaccgcg aaggaaacgg agcacgaggc gaagatcaag gagcggtccg acaagctgaa 4740
ggagatgttc aacagtaagc tggctgagat tcgagctgcg caccggcaag aagttgagcg 4800
gttgaaatcc agtcaaccag ccgctcctca agaacctgga accccagctc ccaaacccga 4860
gcaggtgcca gcaacgccgg cgactcctgc ggctgctcct gcgacaccct ccaaggacac 4920
tgggctgcct gaactgacag atgcgcaagc cagggagctc gttgccaaga acgagacgat 4980
tcgtaacatc attcggagca acatccgcac ccaggtggct aagcaaaagg aatccgacaa 5040
gcaggaaagc caggccaacc aggaggctat gagcacactg gagcagaagt ttaacgaaga 5100
gagagaagcg ttgaagaagg cccacgaaga gggtgtggag gagaagatca aggctgctgt 5160
cgagttgtcg gacaagaaat cactggcgaa actaagcatg ctggacaccc ggtaccggac 5220
agcccaggcc aagatcgatg tggttcagaa ggctgctacg gagacgcctc agaagcctgt 5280
tgtcgaagtc tgggaggtcg caaagaccac tagagcgcct ccagcggcgc aggccaagcc 5340
cgcccaggtg gcatctcctg cgcctgcacc gtctcccgcg cccgctgcgg cccaggcaac 5400
accggtggtg ccatcgccgt cgcctgcccc aacggctact cctgcggcca cacccgcagc 5460
tacgcctgca gctgcacccc aggcccagcc tgtggagcct gcagcagcat ccacagccga 5520
gccagcttct gctgaatcta cgccgcagac aggtgcccca gcgcagcagc aaccgcagca 5580
acaacctgcg cctgaacagg ccgcacaaca acaagctgca cctgcgacgg ctcagccagc 5640
taccaatgct cctccaaacc cattcggtca gagccagaac aagcagccct cgtcgttgcc 5700
cagcaagccc ccagccggta atgcttctgg ccttatgcga gcactgacgt ccggactgcc 5760
cgtcgcgcga ggcggcaggg ccggcggccg cggtgggtcg caagcgaata ctttcggtca 5820
gcaacaggga caacagcaac aggcgcaagg tcaggctcaa gcccagcagc aagctcctag 5880
ccagcgcggc tctggtctac cccggggtcg tggcggacgc ggaggccatg gacgcggcgg 5940
aaaccaaaat gtacagccca cgaatgccgc tcagcaagga caggctagcc caggtcgctc 6000
gctgaatgcc ggtgctcgcc agttcgtccc tcagggcaac aagcgtgctc gcgaggatgg 6060
agaagctgga ggcgaaggag caaccagtgg aggaaagcgc atgaggggag gaggtcatac 6120
ccgggggtca tag 6133
<210> 15
<211> 543
<212> DNA
<213> 黑曲霉
<400> 15
atggcgccca ccactactac aaagaccgtg gaggagcctg taggtgtcgc gaagccgcac 60
actgaagcca aggttgaagc tgacctcccc aagcccaagg agactaagga gatcccctct 120
acattggcgg agatgagtgg gagtatcgac cagagcacat tcgagcagat tttggagatg 180
gacgacgacg acagtgatag agatttcagc aagggtatcg tgtttgggtt cttcgaccag 240
gctgagagca cattcatcaa gatggaggat gctttgaagg cggaagatct gaatgatctg 300
tcttctctgg gacactacct gaaaggttca tcagccacgc tcggactcac caaggtcaag 360
gatgcatgcg agaagattca acactacggc gccggcaagg atgagaccgg tacgacggac 420
gagccggaca agaagacctc cctttcgcgc attgagaaga ccctgaccca ggtgaaaaag 480
gattacaagg aagtagaggc cttcctgcgc aagtattatg gcgaagagga ggaatcctct 540
taa 543
<210> 16
<211> 2685
<212> DNA
<213> 黑曲霉
<400> 16
atgccagacc gtcgctgggc caagctcaag gcaaagctgt tattgcgacg atcgtcgtcg 60
acctcgtccg ctcccgccgc caccagcgac attattgccg agaacaatcc ccatgatgtc 120
cacgcccagc aaagctgcgc ccccgaacaa ttggacgagt cgatcgcgaa ttttccccca 180
gcgcgaccca tcagttccaa tcggcgcgcg atatcattgc aggccgtgcc ccaagccttg 240
aagctgagga aggaggagga cgaggaggag gaggagaggc aggaagagga cgatcgggcg 300
agtgcagctg aagggacgcg gacatcggtg attggcccga aaggcgggcg gtcgagggga 360
tcattggagg aggaagagaa gttcgagaag ttggagaact gcaacttcaa atcgaaatcc 420
tcctctcgcc ccgaaccggt cgcagaacaa cgtgagggac aacggcactc gctcctcgtt 480
cctccaggtg ccggtgccgg tgctggtccc agtgcttccc gccagcgtca gcatcagcaa 540
ttggacgcga caacttcttg cgatcgtgtt cgccccgcgc cctgcaggcg tcacagtcac 600
ggtccctttt ccgagcacgt cctttcccca cccccgacaa ctctatcgcc agatctgctc 660
ccttcgcctt ctccgacccc tcctccccct gtctctgatc gtggtgttgt ctcgccgtct 720
ttccaatttg gccacactca aggccttgat cgcctggggc ctacggtcgg ggagccgcag 780
ttgcccgtgt tggatgtcgt tgcggagaat ccgacggtcg aaccagaatt tcagtcctcc 840
tccaaccata cccccgctgc ttccttccca aagcgtccca gtttaggctc ccgtcgtcag 900
tcgctgctgg ccccgtctca tcaacacctg atcaacagct tgttggaccc cggtgtgact 960
gcagagcctg aaaccaacgg taacggtcgc tccgccacct acagcacagg catgtctcgc 1020
aagatctggg tcaagcggcc aggcgggtcg gccaccttgg tccccatctc gctcgattct 1080
ttggtggacg agctacggga ccaggtgatt ttgaagtact cgaactcgct tggcagaacc 1140
ttcgatgccc ccgatattgt cattcgcatt actccgcgag atggttcgaa caggcaggcc 1200
actcccgatc ggatgcttag ccccgaagag ccgctggcaa gcgtggtgga cacatattac 1260
ccgggaggtc aagctatcga ggaggctcta ataatcgata tcccttcgcg tcgcactccc 1320
aaaccctctc cacgccattc agtatactac aaccaccatc attccgaacc gggcgagcat 1380
ggcgagtact tcccgctcat gccggcgaat cccagcgttc ccacgccgcc gacgcatccg 1440
tcaaactcgt ctgccagtgt taatgctcat cccgccccat caatatcgat cctgacgaca 1500
ggaatggccc ctccgctacc atctccaggg agtcgcggga ctcgacatcc ccgtcggccg 1560
cccttgactc gtcatgccac aaactcaccc accatcctca atcaggcgcc aacagcgaaa 1620
gaccccggaa tcgtccccag tagtatccct ccgcagcctg ctccgtccat ccctactccg 1680
ccaggcccgc cgccagaatc ccctcaggcc aaatccctga ctcctccagc acgcggggca 1740
tcaccgcgtc cacgtccctc cacatcctcc gcgaagccga agaagaccag cgcagcacaa 1800
tcattgagcg gggtctttgg aggcctcatc gagggcacgg taccgcccat caacgtcttg 1860
atcgtggagg acaataacat caaccaacgt ctcttggaag cttttatgaa acgtctcagc 1920
gttcgctgga agtgtgcggc caatggtgaa gaggcggtga acaaatggcg ccagggtggt 1980
ttccatctcg tcttgatgga tatccagttg cccgtcatga acggtctgga tgcgacgaaa 2040
gagatccgca ggctcgaacg cctgaacggc gtcggtgtgt ttcccaagac cgctgacggg 2100
cggtcgagcg ctgcaactgc caatgcggca tcgccctcgg caattgtggg cagtcgggaa 2160
cccctgaagg cagaggatac attacacgat ctgtctctgt tcaaaagtcc cgttattatt 2220
gtagccctga ccgcgagcag tctgcagagc gatcgtcacg aggctctggc agctggctgc 2280
aacgactttt tgaccaagcc ggttcgcttt gaatggctgg agcagaaagt gacagaatgg 2340
ggctgcatgc aagccttgat cgattttgaa ggctggcgca aatggcgcgg ttacgccgat 2400
gacactcagc cttcgcccac gtctgatggt catacgagtc ccatgcaaac tggcggggac 2460
ggaacttcgc ggaaacagtc tcctgttatt ccgctctcac catcctctac cttgagtcaa 2520
ggagccacca aaaaggaccg caaaaccccc agcttcccta aacccatcga cgttacaccc 2580
gaagactctt ccggcagtgg tagcggcgag ggcttggact cacctgccag tccggtgaca 2640
tcagtccctg ttccagatgg gcctgcagat cctgatgcac tctga 2685
<210> 17
<211> 2379
<212> DNA
<213> 黑曲霉
<400> 17
atggatctca acaaacgcct gttccatctc gatatcgaga ataagaccca agcgcaacct 60
ctcaacttct ctatggtaac cacaccaccg gatgatgagg atgatgacga ggtgaaccat 120
ctaaagctca aggtcgagtt gaaacaatct cctcacgatc atgacaagcc gcatcaccgt 180
caaaagaaga tgcccgatac cgatgcgcag caacctccag cggctctagg tcgaatatat 240
cgctataccc ccactcccag cgtcattctt gatccttcgt tacatgtcgt ggaggtatcg 300
gattcccacg tggcatttgc cgggctgtca agggcgctgt tgctcggccg gttcatctgt 360
gacatctgtc cacgcatcct gccggctcta gatgttgcta ttctttttgg cgcattgcgc 420
gccgccatca cgacgcagga cgtccagtcg attgacaaaa tctgtataga tgacgctagc 480
acttgctata ctcttcgcat cacccccatc tttgaaaact ctaacctgtt atacattgtc 540
ctggaggcac ttgatatcac caagcgtcag gctacatcgg tgtccaagcc ccatgagtct 600
tactccaatg agacttacaa agtcctactg gacacggtca aggactatgc catcttcatg 660
ctcgacacac atggccatat tgtaacttgg aacacgggag cggccctgct gaaagggtac 720
tcggccaagg agatcatcgg acgtcacttt tccaccttct atagcctgga ggatcgcatg 780
gcggataagc ccggcaaaga actggaggta tgtctccggg agggcaaagt ggaggacgaa 840
ggctggcggt accgcaagga cggttcgcgg ttctgggcca acgtgctgat cactcccatg 900
tacgccctgg gtcgccatat tggcttcacc aaggtcactc gcgatttaac ggaacgcaat 960
gcagccgaaa cccgcatgat cgcagccttt gaagaatcgt cgagattaaa gacagacttc 1020
ttggccaaca tgagccatga gattcgcacg ccaatgaacg gcatgctctt agcccttaca 1080
tcactgctgg ccacggactt gaacgaacag cagcgcgaat attcctctat catcgaagat 1140
tcgaccaatg ttttgctcca agtcatcaat gacgtcctcg actattcgaa attgtcatcc 1200
gggtctttta ctctgcatcc tgatactttc agtgtcgaca gtattaccaa cgccgtcgtg 1260
cgcaactgca agggcgctct gaaaaccggt gtccaactga ctagctctat ctcatccaac 1320
ttcccatccc aggtcgaggg tgatccgttg cggtaccgtc aggtccttca gaatcttgtc 1380
ggcaatgcag tcaagttcac cgaggagggc tacgtcaaga tcaacaccac cttctcggaa 1440
gatgcggagg atcctagtgt atattacatc cggacggagg ttgccgatac gggcgttggc 1500
gttcccgaag atgctcttgg ctcattgttc acaccgttca cacgcttcgc cgagactggt 1560
tcgaagagat accaaggcac gggccttggc ttatcgatct gcaaaagctt ggccgaactc 1620
atggacggaa gtgtcggata ccgacctaat cctgagagac atggcagtgt cttctgggtc 1680
acagccaaga tgcatcgggt gcgtgtgacg ccgcccgcta gaacgactgg gacagggaca 1740
cccgttgaag acgtcggtga cattgaacga aatatccacg acatcgctcc tcacaaacac 1800
gttctcctgg ttgaggacaa cctggttaac cagatgatga tgctcaagct tctccagaac 1860
atgggcttcg cgcggattga tactgcatgg gatggggcag aggcggttcg actggtgaag 1920
cagcagcctt tatcctacaa tacaattctt atggatatcg gcatgccggt gctggatggc 1980
gtacaggcga cacgacagat ccggcaaatg ggactagaga tgcctatcat tgcgcttacg 2040
gggaacgtca tgccgggaga tatagaggat tatacgaagc agggaatgag cgatcatatt 2100
gggaaaccaa tccaccagaa acagttaatg cgtttgctct ggaatccgac tccgcataag 2160
aaactgagcg ttactgacac cgctttcgcg ttgaaccaac cctgcccatt acactgcaaa 2220
gcagtacgct ctagggcaat cgccatgatg agctcaggtg ctcaagaaca cagaaccatt 2280
cctgtaaagt ggacaggttc cgaagattac aatatgcaag actcacgatc ttctcttctc 2340
atgaagttta cgatgggaac atactacctc gatttatga 2379
<210> 18
<211> 2022
<212> DNA
<213> 黑曲霉
<400> 18
atgttcctcg acggccattt ggccgctctt tccctcgagg agaagtccgc gacaacacac 60
agtgtacgtg tgcccgacga tgactcccca gcggtgtctc cctctctggc atgcatctat 120
cgccatactc cgactcccac gatcgtcctc gattcatcta tgaccatcgt cgaggtctct 180
gatagtcatc tcgctttatc cggcaagacg cgccaatcca tgctgcatgc gaccgttcgt 240
gatctcgacc ctgctgccgt acccgcccct aatatcgcta tcctctgtgg cgcattgcgt 300
gcagcctgct cgacgaagga aattcagata gtcgagagaa ttgtgtctag cgataaatct 360
ttgtacaacc tccgagttac tccgattttc aacgacttta ccctgcttta cattgtgttg 420
gaggcgcaca agctatcggt ggagaccgcc agcattaacc atgcctatac gaacgaaacc 480
tacaagatcc tcgtggatac tgtcaaagag tacgccattt tcatgctgga tacacagggc 540
aatatcacca cctggaaccc gggcgctgcc atcatgaagg gatggccagc agaggagatc 600
cttggcagac atttctctgt cttttacagc ccggaggatc gcctggcagg aaagcctcta 660
agaggtcttg ctgtgtgctt gcgagaaggc cgtatggagg atgaggggtg gaggtatcgg 720
cgcgatggct cgcggttttg ggccaacgta cttatcaccc ccatctacca gtttggacag 780
catgttggtt ttgttaaagt gacccgagat ctcagcgagc gcaaagaagc agaggcgcgc 840
ataattgctg ccttcgaaga gtcatcacgc ctcaaaacag actttctcgc taatattagc 900
catgaaattc gaactccgat gaatgggatg aaacttgcca tgaccatgct ggccgacaca 960
ggtctgtctg cgacacagct cgagcatgcc gcaatcatcc aagactctat gtcactctta 1020
cttgagactg tgaacgatgt tctcgactac tcgaaacttt catctggctc tttctcgtta 1080
cattccgacg tcgtcgatgt caacgatgtg gtcggagcgg tcatacgaaa ttgtcgcccc 1140
tcattgaaga acggggtgga actgactacg gacattgcac ccgactttcc caggaatctt 1200
cgaggagatc ccctacgata tcgccagatt ctgcagaatt tggtcggcaa tgccgtcaag 1260
tttaccgaga gcggccatat tcgggtctcc acagtgtgtt ctccggatga acaagaggag 1320
ggctgctgcc tagtgcgtac agaggtcata gacaccggca ttggcgttcc tgacaatgca 1380
atgaataccc tattcacccc gttcacacgc tttgccaact cgagcactcg acaataccag 1440
gggactggat taggcctttc catttgcaaa agcctggccg aactcatgga cggagaagtg 1500
ggatattcgc caaatcccga aggccgaggc agtgtcttct ggtttactgc caaattagga 1560
gaacgatcca ttactacgtc gctaaagccc cgcagtcctg tattaacacc cgtgggtgat 1620
gatctctgcg ataaaatgcg ggccattgca ccccacaaac atgtcttgtt ggttgaggac 1680
aacatggtca accataccat gatgctgaaa cttcttcgca gcatcggctt cacgcgagtg 1740
gatggggcct ggaatggtgc tgaggcactt tccaagataa agaagaagcc tttatcgtac 1800
aacgtcgttt tgatggatgt ctccatgccc atcatggacg gccttgtcgc caccgggcat 1860
atccgcgaca tggggttaca aatgccgatt atcgcagtca cgggtaatgc tatgcagggc 1920
gatgccgaaa gctacattgc caagggcatg agcgattgca tcggtaagcc ggttcaccga 1980
gatcaactac tgagtatttt atggaagtgg attggatctt ga 2022
<210> 19
<211> 4110
<212> DNA
<213> 黑曲霉
<400> 19
atggaatctc agcaggaccg cgggtttccg atcatggagc atcctgattt aaacaaccat 60
gattcggatg gctccgggtc ctccgatgag cttctgcagc agccatatgc tgtaagagcc 120
aactccagtt tcccggagaa tttcgacacc caggtccaaa ccccggcgac gaccatttcc 180
tcgtcccctc ccccatccat tgcgtctgcc ctgccatcat gggcaaccgg cacgcccaca 240
cgcgcccgcg gggccagtat aggtgcttct gctgctcttg agaaagctcc gccgatggat 300
ggccatccgg tgaccgatcg tgacttgagg ccgcaacgtc cgtccggccc cgctcggacg 360
ccctccaata cctacgcgcc ccaacgacgc ccacctcagt atatcagctt ccaaaatgac 420
cgccaacgga gctcatcaac gaaacgaact tctagacgcg atcccaatgc acagtaccga 480
gctcaggaga aggcgtatgt ccagcgcatt cgtgcggacc ctcaggcctg gtacagtcat 540
ttcgatgagg ctcaaaacat gagcatgacg gtcggggact cggacctaga agaaccctca 600
ccatcctcgg aggttccttt cgaagacgat gcctacgatc cggatattca actcttcctg 660
accgacgaca atcagccgac gatcgaggaa ctcaagaacc caagaaacca agagaggctg 720
gagtggcatt ctatgctttc gtctgtgtta aagggagacg tggtgaagca agagaaacag 780
cgattactcg gctctacaga atcaaaacga tcgtcggccc agaacaacgc aatatggttg 840
ggtgtcagag ccaggacctg tggaaggagt gttgcactgc agaggaaact cattgaagaa 900
gcgagggctg gccttggccc catcatcgaa gaaattatca agttcgagat caaaggtgaa 960
acagagatcg ggaagccacc catcaagcag gttgaggata ttgtcgcaca gatagaacgt 1020
tgtgaaagcc tctactctac tcacaaggag ctggagactg cccaccccag agtcgcttca 1080
gaggagtatc actcgagtcg cgatgctgtt tttgcctggc acaacacgac catcttgatc 1140
aacaccgagc tcgctatcct gcagaaatgg gttggaaacg atgagttgga tttcagcaaa 1200
tcgagaacga aatcaatcaa tagcgacctt tccgacgaaa catccttcct tgaccgcatc 1260
atgaaggagg atggcctcaa aacgctgcaa ggaaaacata acatgctcca cggcattgga 1320
gaagtcatcc aaaaagcaaa gaatacatta attgagaatg ccggttcctt cgccaaacgc 1380
cacttacctc cctatatcga agaacttctt actcttatca atttcccgtc tcgtctcata 1440
caggaaatta tacgggttcg actatcttac gctaagaata tgaaagaccc agcttcgcaa 1500
tccgccatct tagtcgatca aatgatatcg cagttccaga ttttgatgaa ggtggcggtc 1560
gatatcaaac ggcattattt ggatatcgcc agacccgagc ctgggtggga cctgccccct 1620
tgcattgatg acggtttcga cgcagtcgtc ttggatgcga tgaagtatta cttccggctt 1680
ctgaactgga agctgactgc aaataagaac acattcaaag aagcggagat tctagaacag 1740
gattgggaat tttccaacga ggtcggccga caacttgagg gcggagatat cgaggtcgcg 1800
gagcagttta gtgcactgac tgccaagtcg atccaacgct tgatgtacca cttcgagcgg 1860
gagttgcagc ctcgccatga cgaggatcct gccgacatgg acaagcgtta taaaagcgta 1920
ttggactcaa ctcggatccg gcaacggaag ctttaccgat tttcccgatt cttgcgccag 1980
ctgttcgaaa atgcaacgga atacaatttg ccggctgaca ttgcatacga ctttttggag 2040
tcgttgcttg tgtcggatca ttttatgatc aaatcaaacg tctctgttgg tcaaaagggc 2100
gtctatctct ttgcgcaccc tgcattgtgg gatcgccctg cagatatcca agctatccta 2160
ggcacatcat ttcgtgagga tgacaccagc aaggatacac cccatgcacc gtatatactc 2220
gtggttcgtc cggaaaagcc cctttcctgg gctggcaaag aaatgcagct gggcatcatg 2280
gaacagccta cggacttgcg attgggcaaa ttgcgacttg tggttgaagg gacgcagcag 2340
cggctgtcta atgcgagaca tgagctgact catctcactg gtattcagct cgatatggcc 2400
atcgagcaac gtgccaatct tggtcgggtc aacgtggagc taaacaagat caagaagacg 2460
tcatttaagc tatcaatgac tatcatggat agtgttgccc ggatacggga gcaactcaag 2520
gatagagacg tggagaacca cgatctagtc caagcatgct atgcttttgc gaccgagttc 2580
gggaagcgtt cttcaaacgt tgatcccaat agacgcgcaa tgaacagtaa tagacttgtc 2640
gagttgtccc tcgactgggt ttcgttcatc tgtgatgatt gtgatgctgc tgacaggaaa 2700
accttcaagt gggccgttgc tgctctggaa tttgcaatgg ctatcacctc cagcaggcac 2760
ctcctgtcta tggatgatgc tcagtatagt cgactgaggc agaaggttgc cgggtgcatg 2820
tcgctcctta tatctcactt tgatatcatg ggtgctcgat cgtctcgtgc ggctcaagca 2880
gagaagcaac gcttggaaga gcgcggcggt tcgagacgaa tgggcgcagg gcgaatcctt 2940
acagatgaag aggcagccaa gcttgttcgg gagcagcgcg tggctcatct taccgagatc 3000
gaggagagac gcgttgacga agatgctaaa cgccaagcat tgggaagggt tctagagggc 3060
tcaaacgaag cggacaggtc tcttacggtg ctttcatcct cggctacgaa cgttactctg 3120
cgatggcaac agggccagtt cattggtgga ggaacctttg ggtccgttta cgctggaatt 3180
aaccttgaca gcaactacct catggctgtc aaggagatcc gtttgcaaga cccccaactt 3240
atccctaaaa ttgcccagca aatccgtgat gagatgggtg tgttggaagt cttggatcat 3300
cctaacatcg tctcttacca cggtattgaa gtgcaccgcg ataaggtcta catcttcatg 3360
gaatactgtt ctggtgggtc ccttgccagc ttgcttgagc acggacgtgt cgaggatgaa 3420
accgtcatta tggtctacgc tcttcagttg ctggagggat tagcgtacct gcaccaggct 3480
ggcattatcc atcgcgatat caagcctgaa aatatcctgc ttgatcataa cggtatcatc 3540
aaatacgtcg attttggagc tgcaaagatc atcgctcgtc agggcagaac cgttgtccct 3600
atggatgcct tcgctggcgc tggtcataag gacgctatag tgcccaagga cgcccagctg 3660
gctcacaaca attggggcaa gaaccagaaa acgatgaccg gcaccccaat gtacatgtca 3720
cccgaggtga ttcgcggcga taccacaaaa cttatccacc gccagggagc tgtcgacatc 3780
tggtcgttag gatgcgtgat cttagaaatg gccacgggtc gtcgcccttg gtccactctg 3840
gataacgaat gggccatcat gtacaacatt gcccagggca accaaccgca attgccatcc 3900
cgagaccagc tcagcgacct aggtatcgac ttcctccgac gatgcttcga gtgtgacccc 3960
aataaacggt ccactgcagc agaactcctc cagcatgaat ggatcgtctc catccgccag 4020
caagtcgtac tcgagccagc cacgcctggc agcgacaata gcggtggtag ttcccattca 4080
ggcagtcgcc agaactcagc gtatctatga 4110

Claims (245)

1.一种用于产生丝状真菌菌株的方法,所述方法包含:
a.)提供多个原生质体,其中所述原生质体由丝状真菌细胞的培养物制备;
b.)用第一构筑体和第二构筑体转化所述多个原生质体,其中所述第一构筑体包含在两侧上由与所述原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且所述第二构筑体包含在两侧上由与所述原生质体的基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,其中转化作用通过同源重组将所述第一构筑体整合到所述第一基因座中并且将所述第二构筑体整合到所述第二基因座中,其中至少所述第二基因座为所述原生质体基因组中的第一可选标记基因,并且其中所述第一多核苷酸包含突变和/或基因控制元件;
c.)通过进行选择和反向选择来纯化同核转化体;以及
d.)使所述经纯化的转化体在有助于所述丝状真菌细胞再生的培养基中生长。
2.根据权利要求1所述的方法,其中将所述第一构筑体分裂成构筑体A和构筑体B,其中构筑体A包含所述第一多核苷酸的第一部分和与在所述第一多核苷酸的所述第一部分5'端的所述第一基因座同源的核苷酸,并且其中构筑体B包含所述第一多核苷酸的第二部分和与在所述第一多核苷酸的所述第二部分3'端的所述第一基因座同源的核苷酸,其中所述第一多核苷酸的所述第一部分和所述第二部分包含重叠互补序列。
3.根据权利要求1或2所述的方法,其中将所述第二构筑体分裂成构筑体A和构筑体B,其中构筑体A包含所述第二多核苷酸的第一部分和与在所述第二多核苷酸的所述第一部分5'端的所述第一基因座同源的核苷酸,并且其中构筑体B包含所述第二多核苷酸的第二部分和与在所述第二多核苷酸的所述第二部分3'端的所述第一基因座同源的核苷酸,其中所述第二多核苷酸的所述第一部分和所述第二部分包含重叠互补序列。
4.根据权利要求1所述的方法,其中用来自多个第一构筑体的单个第一构筑体和来自多个第二构筑体的单个第二构筑体转化来自所述多个原生质体的每个原生质体,其中来自所述多个第一构筑体的每个第一构筑体中的所述第一多核苷酸包含不同突变和/或基因控制元件;并且其中来自所述多个第二构筑体的每个第二构筑体中的所述第二多核苷酸相同。
5.根据权利要求4所述的方法,其进一步包含重复步骤a至d,以产生丝状真菌细胞库,其中所述库中的每个丝状真菌细胞包含具有不同突变和/或基因控制元件的第一多核苷酸。
6.根据权利要求1所述的方法,其中所述第一多核苷酸编码目标丝状真菌基因或异源基因。
7.根据权利要求1所述的方法,其中所述突变为单核苷酸多态性。
8.根据权利要求1所述的方法,其中所述基因控制为启动子序列和/或终止子序列。
9.根据权利要求1所述的方法,其中所述基因控制元件为启动子序列,其中所述启动子序列选自表1中列出的启动子序列。
10.根据权利要求1所述的方法,其中所述多个原生质体分布于微量滴定板的孔中。
11.根据权利要求1所述的方法,其中步骤a至d在微量滴定板的孔中进行。
12.根据权利要求10或11所述的方法,其中所述微量滴定板是96孔、384孔或1536孔微量滴定板。
13.根据权利要求1所述的方法,其中所述丝状真菌细胞来自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代、无性世代、同物异名或分类等效物。
14.根据权利要求1所述的方法,其中所述丝状真菌细胞来自黑曲霉。
15.根据权利要求1所述的方法,其中所述丝状真菌细胞具有形成非菌丝体表型。
16.根据权利要求1所述的方法,其中所述真菌细胞具有非功能性非同源末端结合NHEJ路径。
17.根据权利要求16所述的方法,其中所述非功能性NHEJ路径归因于将所述细胞暴露于针对所述NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子。
18.根据权利要求17所述的方法,其中所述化学抑制剂为W-7。
19.根据权利要求1所述的方法,其中所述第一基因座是针对所述目标丝状真菌基因。
20.根据权利要求1所述的方法,其中所述第一基因座是针对所述原生质体基因组中的第二可选标记基因。
21.根据权利要求20所述的方法,其中所述第二可选标记基因为营养缺陷型标记基因、比色标记基因或定向标记基因。
22.根据权利要求1所述的方法,其中所述第一可选标记基因为营养缺陷型标记基因、比色标记基因或定向标记基因。
23.根据权利要求1所述的方法,其中所述第二多核苷酸为营养缺陷型标记基因、定向标记基因或抗生素抗性基因。
24.根据权利要求21或22所述的方法,其中所述比色标记基因为aygA基因。
25.根据权利要求21或22所述的方法,其中所述营养缺陷型标记基因为argB基因、trpC基因、pyrG基因或met3基因。
26.根据权利要求21或22所述的方法,其中所述定向标记基因为乙酰胺酶(amdS)基因、硝酸还原酶基因(niaD)或硫酸盐通透酶(Sut B)基因。
27.根据权利要求23所述的方法,其中所述抗生素抗性基因为ble基因,其中所述ble基因赋予腐草霉素抗性。
28.根据权利要求1所述的方法,其中所述第一可选标记基因为aygA基因并且所述第二多核苷酸为pyrG基因。
29.根据权利要求20所述的方法,其中所述第一可选标记基因为met3基因,所述第二可选标记基因为aygA基因并且所述第二多核苷酸为pyrG基因。
30.根据权利要求1所述的方法,其中所述多个原生质体通过以下方式制备:去除所述丝状真菌细胞的培养物中的所述丝状真菌细胞的细胞壁;分离所述多个原生质体;以及
将所述分离的多个原生质体再悬浮于包含二甲亚砜(DMSO)的混合物中,其中DMSO的最终浓度为7%v/v或更低。
31.根据权利要求30所述的方法,其中在进行步骤a至d之前将所述混合物储存在至少-20℃或-80℃下。
32.根据权利要求30所述的方法,其中所述培养物的体积为至少1升。
33.根据权利要求30所述的方法,其中在制备所述原生质体之前使所述培养物生长持续至少12小时。
34.根据权利要求30所述的方法,其中所述真菌培养物在至少70%的所述原生质体更小并且含有更少的细胞核的条件下生长。
35.根据权利要求30所述的方法,其中通过酶消化来去除所述细胞壁。
36.根据权利要求35所述的方法,其中所述酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。
37.根据权利要求30所述的方法,其进一步包含在储存所述原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的所述混合物中。
38.根据权利要求37所述的方法,其中添加所述PEG到最终浓度为8%v/v或更低。
39.根据权利要求1所述的方法,其中步骤a至d为自动化的。
40.一种用于制备供储存用的丝状真菌细胞的方法,所述方法包含:
从包含丝状真菌细胞的真菌培养物制备原生质体,其中所述制备所述原生质体包含去除所述真菌培养物中的所述丝状真菌细胞的细胞壁;
分离所述原生质体;以及
将所述分离的原生质体再悬浮于包含最终浓度为7%v/v或更低的二甲亚砜(DMSO)的混合物中。
41.根据权利要求40所述的方法,其中将所述混合物储存在至少-20℃或-80℃下。
42.根据权利要求40所述的方法,其中所述真菌培养物的体积为至少1升。
43.根据权利要求40所述的方法,其中在制备所述原生质体之前使所述真菌培养物生长持续至少12小时。
44.根据权利要求40所述的方法,其中所述真菌培养物在至少70%的所述原生质体更小并且具有更少的细胞核的条件下生长。
45.根据权利要求40所述的方法,其中通过酶消化来去除所述细胞壁。
46.根据权利要求45所述的方法,其中所述酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。
47.根据权利要求40所述的方法,其进一步包含在储存所述原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的所述混合物中。
48.根据权利要求47所述的方法,其中添加所述PEG到最终浓度为8%v/v或更低。
49.根据权利要求40所述的方法,其进一步包含在储存所述原生质体之前将所述原生质体分布到微量滴定板中。
50.根据权利要求40所述的方法,其中所述真菌培养物中的所述丝状真菌细胞具有形成非菌丝体表型。
51.根据权利要求40所述的方法,其中所述真菌培养物中的所述丝状真菌细胞选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
52.根据权利要求50所述的方法,其中所述真菌培养物中的所述丝状真菌细胞为黑曲霉或其有性世代或无性世代。
53.一种用于产生真菌生产菌株的系统,所述系统包含:
一或多个处理器;以及
一或多个存储器,其与所述一或多个处理器中的至少一个可操作地联接且其上存储有指令,所述指令当通过所述一或多个处理器中的至少一个执行时促使所述系统:
a.)用第一构筑体和第二构筑体转化来源于丝状真菌细胞的培养物的多个原生质体,其中所述第一构筑体包含在两侧上由与所述原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且所述第二构筑体包含在两侧上由与所述原生质体的所述基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,其中转化作用通过同源重组将所述第一构筑体整合到所述第一基因座中并且将所述第二构筑体整合到所述第二基因座中,其中至少所述第二基因座为所述原生质体基因组中的第一可选标记基因,并且其中所述第一多核苷酸包含突变和/或基因控制元件;
b.)通过进行选择和反向选择来纯化同核转化体;以及
c.)使所述经纯化的转化体在有助于所述丝状真菌细胞再生的培养基中生长。
54.根据权利要求53所述的方法,其中将所述第一构筑体分裂成构筑体A和构筑体B,其中构筑体A包含所述第一多核苷酸的第一部分和与在所述第一多核苷酸的所述第一部分5'端的所述第一基因座同源的核苷酸,并且其中构筑体B包含所述第一多核苷酸的第二部分和与在所述第一多核苷酸的所述第二部分3'端的所述第一基因座同源的核苷酸,其中所述第一多核苷酸的所述第一部分和所述第二部分包含重叠互补序列。
55.根据权利要求53或54所述的方法,其中所述第二构筑体分裂成构筑体A和构筑体B,其中构筑体A包含所述第二多核苷酸的第一部分和与在所述第二多核苷酸的所述第一部分5'端的所述第一基因座同源的核苷酸,并且其中构筑体B包含所述第二多核苷酸的第二部分和与在所述第二多核苷酸的所述第二部分3'端的所述第一基因座同源的核苷酸,其中所述第二多核苷酸的所述第一部分和所述第二部分包含重叠互补序列。
56.根据权利要求53所述的系统,其中用来自多个第一构筑体的单个第一构筑体和来自多个第二构筑体的单个第二构筑体转化来自所述多个原生质体的每个原生质体,其中来自所述多个第一构筑体的每个第一构筑体中的所述第一多核苷酸包含不同突变和/或基因控制元件;并且其中来自所述多个第二构筑体的每个第二构筑体中的所述第二多核苷酸相同。
57.根据权利要求53所述的系统,其进一步包含重复步骤a至c以产生丝状真菌细胞库的指令,其中所述库中的每个丝状真菌细胞包含具有不同突变和/或基因控制元件的第一多核苷酸。
58.根据权利要求53所述的系统,其中所述突变为单核苷酸多态性。
59.根据权利要求53所述的系统,其中所述基因控制元件为启动子序列和/或终止子序列。
60.根据权利要求53所述的系统,其中所述基因控制元件为启动子序列,其中所述启动子序列选自表1中列出的启动子序列。
61.根据权利要求53所述的系统,其中在微量滴定板的孔中进行步骤a至c。
62.根据权利要求61所述的系统,其中所述微量滴定板是96孔、384孔或1536孔微量滴定板。
63.根据权利要求53所述的系统,其中所述丝状真菌细胞选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
64.根据权利要求53所述的系统,其中所述丝状真菌细胞为黑曲霉。
65.根据权利要求53所述的系统,其中所述丝状真菌细胞具有形成非菌丝体表型。
66.根据权利要求53所述的系统,其中所述真菌细胞具有非功能性非同源末端结合路径。
67.根据权利要求66所述的系统,其中通过将所述细胞暴露于针对NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使所述NHEJ路径为非功能性的。
68.根据权利要求67所述的系统,其中所述化学抑制剂为W-7。
69.根据权利要求53所述的系统,其中所述第一基因座是针对所述目标丝状真菌基因。
70.根据权利要求53所述的系统,其中所述第一基因座是针对所述原生质体基因组中的第二可选标记基因。
71.根据权利要求70所述的方法,其中所述第二可选标记基因选自营养缺陷型标记基因、比色标记基因或定向标记基因。
72.根据权利要求53所述的系统,其中所述第一可选标记基因选自营养缺陷型标记基因、比色标记基因或定向标记基因。
73.根据权利要求53所述的系统,其中所述第二多核苷酸选自营养缺陷型标记基因、定向标记基因或抗生素抗性基因。
74.根据权利要求71或72所述的系统,其中所述比色标记基因为aygA基因。
75.根据权利要求71或72所述的系统,其中所述营养缺陷型标记基因选自argB基因、trpC基因、pyrG基因或met3基因。
76.根据权利要求71或72所述的系统,其中所述定向标记基因选自乙酰胺酶(amdS)基因、硝酸还原酶基因(nlaD)或硫酸盐通透酶(Sut B)基因。
77.根据权利要求73所述的系统,其中所述抗生素抗性基因为ble基因,其中所述ble基因赋予腐草霉素抗性。
78.根据权利要求53所述的系统,其中所述第一可选标记基因为aygA基因并且所述第二多核苷酸为pyrG基因。
79.根据权利要求70所述的系统,其中所述第一可选标记基因为met3基因,所述第二可选标记基因为aygA基因且所述第二多核苷酸为pyrG基因。
80.根据权利要求53所述的系统,其中所述多个原生质体通过以下方式制备:去除所述丝状真菌细胞的所述培养物中的所述丝状真菌细胞的细胞壁;分离所述多个原生质体;以及
将所述分离的多个原生质体再悬浮于包含最终浓度为7%v/v或更低的二甲亚砜(DMSO)的混合物中。
81.根据权利要求80所述的系统,其中在进行步骤a至c之前将所述混合物储存在至少-20℃或-80℃下。
82.根据权利要求80至81中任一权利要求所述的系统,其中所述培养物的体积为至少1升。
83.根据权利要求80所述的系统,其中在制备所述原生质体之前使所述培养物生长持续至少12小时。
84.根据权利要求80所述的系统,其中所述真菌培养物在至少70%的所述原生质体更小并且具有更少的细胞核的条件下生长。
85.根据权利要求80所述的系统,其中通过酶消化来去除所述细胞壁。
86.根据权利要求85所述的系统,其中所述酶消化用包含β-葡聚糖酶和聚半乳糖醛酸酶的酶的混合物进行。
87.根据权利要求53所述的系统,其进一步包含在储存所述原生质体之前,将40%v/v聚乙二醇(PEG)添加到包含DMSO的所述混合物中。
88.根据权利要求87所述的系统,其中添加所述PEG到最终浓度为8%v/v或更低。
89.一种使丝状真菌进化以获得所需表型的高通量HTP基因组工程改造的方法,其包含:
a.扰动初始多种具有相同基因组菌株背景的丝状真菌微生物的基因组,借此创建包含具有独特基因变异的个别丝状真菌菌株的初始HTP基因设计丝状真菌菌株库;
b.针对所述所需表型来筛选和选择所述初始HTP基因设计丝状真菌菌株库的个别菌株;
c.提供各自包含独特基因变异组合的后续多种丝状真菌微生物,所述基因变异选自前一步骤中筛选的至少两种个别丝状真菌菌株中存在的所述基因变异,借此创建后续HTP基因设计丝状真菌菌株库;
d.针对所述所需表型来筛选和选择所述后续HTP基因设计丝状真菌菌株库的个别丝状真菌菌株;以及
e.按照线性或非线性方式重复步骤c)至d)一或多次,直至丝状真菌微生物已经获得所述所需表型,其中每次后续迭代创建了新的HTP基因设计丝状真菌菌株库,所述库包含具有独特基因变异的个别丝状真菌菌株,所述独特基因变异为选自前一HTP基因设计丝状真菌菌株库的至少两种个别丝状真菌菌株的基因变异的组合。
90.根据权利要求89所述的HTP基因组工程改造的方法,其中所述初始HTP基因设计丝状真菌菌株库包含选自由以下组成的群组的至少一个库:启动子交换微生物菌株库、SNP交换微生物菌株库、起始/终止密码子微生物菌株库、优化序列微生物菌株库、终止子交换微生物菌株库和其任何组合。
91.根据权利要求89所述的HTP基因组工程改造的方法,其中所述初始HTP基因设计丝状真菌菌株库包含启动子交换微生物菌株库。
92.根据权利要求89所述的HTP基因组工程改造的方法,其中所述初始HTP基因设计丝状真菌菌株库包含启动子交换微生物菌株库,所述启动子交换微生物菌株库含有至少一种双顺反子设计BCD调节序列。
93.根据权利要求89所述的HTP基因组工程改造的方法,其中所述初始HTP基因设计丝状真菌菌株库包含SNP交换微生物菌株库。
94.根据权利要求89所述的HTP基因组工程改造的方法,其中所述初始HTP基因设计丝状真菌菌株库包含微生物菌株库,所述微生物菌株库包含:
a.至少一种编码嵌合生物合成酶的多核苷酸,其中所述嵌合生物合成酶包含:
i.参与丝状真菌中的调控路径的酶;
ii.翻译融合到能够结合DNA结合位点的DNA结合域;以及
b.至少一种DNA架构序列,其包含对应于所述嵌合生物合成酶的所述DNA结合域的所述DNA结合位点。
95.根据权利要求89所述的HTP基因组工程改造的方法,其中所述后续HTP基因设计丝状真菌菌株库是来源于所述初始HTP基因设计丝状真菌菌株库中的基因变异的完整组合性菌株库。
96.根据权利要求89所述的HTP基因组工程改造的方法,其中所述后续HTP基因设计丝状真菌菌株库是来源于所述初始HTP基因设计丝状真菌菌株库中的基因变异的完整组合性菌株库的子集。
97.根据权利要求89所述的HTP基因组工程改造的方法,其中所述后续HTP基因设计丝状真菌菌株库是来源于前一HTP基因设计丝状真菌菌株库中的基因变异的完整组合性菌株库。
98.根据权利要求89所述的HTP基因组工程改造的方法,其中所述后续HTP基因设计丝状真菌菌株库是来源于前一HTP基因设计丝状真菌菌株库中的基因变异的完整组合性菌株库的子集。
99.根据权利要求89所述的HTP基因组工程改造的方法,其中扰动所述基因组包含利用至少一种选自由以下组成的群组的方法:随机突变诱发、靶向序列插入、靶向序列缺失、靶向序列置换和其任何组合。
100.根据权利要求89所述的HTP基因组工程改造的方法,其中所述初始多种丝状真菌微生物包含来源于工业生产丝状真菌菌株的独特基因变异。
101.根据权利要求89所述的HTP基因组工程改造的方法,其中所述初始多种丝状真菌微生物包含工业生产菌株微生物,表示为S1Gen1;和来源于其的任何数目的后续微生物世代,表示为SnGenn
102.根据权利要求89所述的HTP方法,其中所述丝状真菌选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
103.根据权利要求89所述的HTP方法,其中所述丝状真菌为黑曲霉。
104.一种用于产生SNP交换丝状真菌菌株库的方法,其包含以下步骤:
a.提供参考丝状真菌菌株和第二丝状真菌菌株,其中所述第二丝状真菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,所述基因变异不存在于所述参考丝状真菌菌株中;以及
b.扰动所述参考丝状真菌菌株或所述第二丝状真菌菌株的基因组,借此创建包含多种个别丝状真菌菌株的初始SNP交换丝状真菌菌株库,所述多种个别菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自所述参考丝状真菌菌株与所述第二丝状真菌菌株之间的所述多种已鉴别基因变异的单一基因变异。
105.根据权利要求104所述的产生SNP交换丝状真菌菌株库的方法,其中扰动所述参考丝状真菌菌株的所述基因组,以添加在所述第二丝状真菌菌株中发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
106.根据权利要求104所述的产生SNP交换丝状真菌菌株库的方法,其中扰动所述第二丝状真菌菌株的所述基因组,以去除在所述参考丝状真菌菌株中未发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
107.根据权利要求104所述的产生SNP交换丝状真菌菌株库的方法,其中所述所得的多种具有独特基因变异的个别丝状真菌菌株一起组成所述参考丝状真菌菌株与所述第二丝状真菌菌株之间的所有所述已鉴别基因变异的完整组合性库。
108.根据权利要求104所述的产生SNP交换丝状真菌菌株库的方法,其中所述所得的多种具有独特基因变异的个别丝状真菌菌株一起组成所述参考丝状真菌菌株与所述第二丝状真菌菌株之间的所有所述已鉴别基因变异的完整组合性库的子集。
109.根据权利要求104所述的产生SNP交换丝状真菌菌株库的方法,其中所述丝状真菌选自绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
110.根据权利要求104所述的产生SNP交换丝状真菌菌株库的方法,其中所述丝状真菌为黑曲霉。
111.一种用于修复和改良生产丝状真菌菌株的表型性能的方法,其包含以下步骤:
a.提供亲本谱系丝状真菌菌株和来源于其的生产丝状真菌菌株,其中所述生产丝状真菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,所述基因变异不存在于所述亲本谱系菌株中;
b.扰动所述亲本谱系丝状真菌菌株或所述生产丝状真菌菌株的所述基因组,以创建初始丝状真菌菌株库,其中所述初始库中的每种菌株包含来自所述亲本谱系丝状真菌菌株与所述生产丝状真菌菌株之间的所述多种已鉴别基因变异的独特基因变异;
c.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择所述初始库的个别菌株,借此鉴别赋予表型性能改良的独特基因变异;
d.提供各自包含来自基因变异的独特基因变异组合的后续多种丝状真菌微生物,所述基因变异存在于前一步骤中筛选的至少两种个别丝状真菌菌株中,借此创建后续丝状真菌菌株库;
e.针对优于所述参考丝状真菌菌株的表型性能改良来筛选和选择所述后续库的个别菌株,借此鉴别赋予额外表型性能改良的独特基因变异组合;以及
f.按照线性或非线性方式重复步骤d)至e)一或多次,直至相较于所述生产丝状真菌菌株的所述表型性能,丝状真菌菌株的表型性能展现出所需改良水平,其中每次后续迭代创建了新的微生物菌株库,其中所述新的库中的每种菌株包含基因变异,所述基因变异为选自前一库的至少两种个别丝状真菌菌株的基因变异的组合。
112.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述初始丝状真菌菌株库是包含所述亲本谱系丝状真菌菌株与所述生产丝状真菌菌株之间的所有所述已鉴别的基因变异的完整组合库。
113.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述初始丝状真菌菌株库是包含所述亲本谱系丝状真菌菌株与所述生产丝状真菌菌株之间的所述已鉴别的基因变异的子集的完整组合库的子集。
114.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述后续丝状真菌菌株库是所述初始库的完整组合库。
115.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述后续丝状真菌菌株库是所述初始库的完整组合库的子集。
116.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述后续丝状真菌菌株库是前一库的完整组合库。
117.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述后续丝状真菌菌株库是前一库的完整组合库的子集。
118.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中扰动所述亲本谱系丝状真菌菌株的所述基因组,以添加在所述生产丝状真菌菌株中发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
119.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中扰动所述生产丝状真菌菌株的所述基因组,以去除在所述亲本谱系丝状真菌菌株中未发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一或多种。
120.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中扰动所述基因组包含利用选自由以下组成的群组的至少一种方法:随机突变诱发、靶向序列插入、靶向序列缺失、靶向序列置换和其组合。
121.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中重复步骤d)至e),直至相较于所述生产丝状真菌菌株的所述表型性能,后续库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少10%。
122.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中重复步骤d)至e),直至相较于所述生产丝状真菌菌株的所述表型性能,后续库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少一倍。
123.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中步骤f)的所述经改良的表型性能选自由以下组成的群组:所关注的产物的体积生产率、所关注的产物的比生产率、所关注的产物的产率、所关注的产物的效价和其组合。
124.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中步骤f)的所述经改良的表型性能为:增加或更高效生产所关注的产物,所述所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢产物、次级胞外代谢产物、胞内组分分子和其组合。
125.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述已鉴别的基因变异进一步包含来自启动子交换库的人工启动子交换基因变异。
126.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其进一步包含:
对以下任一者的至少一种微生物菌株的基因组进行工程改造:
所述初始丝状真菌菌株库,或
后续丝状真菌菌株库,
以包含来自可操作地连接到内源性丝状真菌目标基因上的启动子梯的一或多种启动子。
127.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述丝状真菌选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
128.根据权利要求111所述的用于修复和改良生产丝状真菌菌株的表型性能的方法,其中所述丝状真菌为黑曲霉。
129.一种用于产生启动子交换丝状真菌菌株库的方法,其包含以下步骤:
a.提供对基础丝状真菌菌株具有内源性的多种目标基因和启动子梯,其中所述启动子梯包含在所述基础丝状真菌菌株中展现出不同表达谱的多种启动子;以及
b.对所述基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始启动子交换丝状真菌菌株库,所述多种个别丝状真菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对所述基础丝状真菌菌株具有内源性的目标基因之一上的所述启动子梯的一或多种启动子。
130.根据权利要求129所述的方法,其中所述丝状真菌菌株选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
131.根据权利要求129所述的方法,其中所述丝状真菌菌株为黑曲霉菌株。
132.一种用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其包含以下步骤:
a.提供对基础丝状真菌菌株具有内源性的多种目标基因和启动子梯,其中所述启动子梯包含在所述基础丝状真菌菌株中展现出不同表达谱的多种启动子;
b.对所述基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始启动子交换丝状真菌菌株库,所述多种个别丝状真菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对所述基础丝状真菌菌株具有内源性的目标基因之一上的所述启动子梯的一或多种启动子;
c.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择所述初始启动子交换丝状真菌菌株库的个别丝状真菌菌株,借此鉴别赋予表型性能改良的独特基因变异;
d.提供各自包含来自基因变异的独特基因变异组合的后续多种丝状真菌微生物,所述基因变异存在于前一步骤中筛选的至少两种个别丝状真菌菌株中,借此创建后续启动子交换丝状真菌菌株库;
e.针对优于所述参考丝状真菌菌株的表型性能改良来筛选和选择所述后续启动子交换丝状真菌菌株库的个别丝状真菌菌株,借此鉴别赋予额外表型性能改良的独特基因变异组合;以及
f.按照线性或非线性方式重复步骤d)至e)一或多次,直至相较于所述生产丝状真菌菌株的所述表型性能,丝状真菌菌株的表型性能展现出所需改良水平,其中每次后续迭代创建了新的微生物菌株的启动子交换丝状真菌菌株库,其中所述新的库中的每种菌株包含基因变异,所述基因变异为选自前一库的至少两种个别丝状真菌菌株的基因变异的组合。
133.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换丝状真菌菌株库是所述初始启动子交换丝状真菌菌株库的完整组合库。
134.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换丝状真菌菌株库是所述初始启动子交换丝状真菌菌株库的完整组合库的子集。
135.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换丝状真菌菌株库是前一启动子交换丝状真菌菌株库的完整组合库。
136.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换丝状真菌菌株库是前一启动子交换丝状真菌菌株库的完整组合库的子集。
137.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中重复步骤d)至e),直至相较于所述生产丝状真菌菌株的所述表型性能,后续启动子交换丝状真菌菌株库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少10%。
138.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中重复步骤d)至e),直至相较于所述生产丝状真菌菌株的所述表型性能,后续启动子交换丝状真菌菌株库的丝状真菌菌株的表型性能展现出所测量的表型变量增加至少一倍。
139.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中步骤f)的所述经改良的表型性能选自由以下组成的群组:所关注的产物的体积生产率、所关注的产物的比生产率、所关注的产物的产率、所关注的产物的效价和其组合。
140.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中步骤f)的所述经改良的表型性能为:增加或更高效生产所关注的产物,所述所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢产物、次级胞外代谢产物、胞内组分分子和其组合。
141.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中所述丝状真菌菌株选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
142.根据权利要求132所述的用于改良生产丝状真菌菌株的表型性能的启动子交换方法,其中所述丝状真菌菌株为黑曲霉菌株。
143.一种用于产生终止子交换丝状真菌菌株库的方法,其包含以下步骤:
a.提供对基础丝状真菌菌株具有内源性的多种目标基因和终止子梯,其中所述终止子梯包含在所述基础丝状真菌菌株中展现出不同表达谱的多种终止子;以及
b.对所述基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始终止子交换丝状真菌菌株库,所述多种个别丝状真菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对所述基础丝状真菌菌株具有内源性的目标基因之一上的所述终止子梯的一或多种终止子。
144.根据权利要求143所述的方法,其中所述丝状真菌菌株选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
145.根据权利要求143所述的方法,其中所述丝状真菌菌株为黑曲霉菌株。
146.一种用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其包含以下步骤:
a.提供对基础丝状真菌菌株具有内源性的多种目标基因和终止子梯,其中所述终止子梯包含在所述基础丝状真菌菌株中展现出不同表达谱的多种终止子;
b.对所述基础丝状真菌菌株的基因组进行工程改造,借此创建包含多种个别丝状真菌菌株的初始终止子交换丝状真菌菌株库,所述多种个别丝状真菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含来自可操作地连接到对所述基础丝状真菌菌株具有内源性的目标基因之一上的所述终止子梯的一或多种终止子;
c.针对优于参考丝状真菌菌株的表型性能改良来筛选和选择所述初始终止子交换丝状真菌菌株库的个别丝状真菌菌株,借此鉴别赋予表型性能改良的独特基因变异;
d.提供各自包含来自基因变异的独特基因变异组合的后续多种丝状真菌微生物,所述基因变异存在于前一步骤中筛选的至少两种个别丝状真菌菌株中,借此创建后续终止子交换丝状真菌菌株库;
e.针对优于所述参考丝状真菌菌株的表型性能改良来筛选和选择所述后续终止子交换丝状真菌菌株库的个别丝状真菌菌株,借此鉴别赋予额外表型性能改良的独特基因变异组合;以及
f.按照线性或非线性方式重复步骤d)至e)一或多次,直至相较于所述生产丝状真菌菌株的所述表型性能,丝状真菌菌株的表型性能展现出所需改良水平,其中每次后续迭代创建了新的微生物菌株的终止子交换丝状真菌菌株库,其中所述新的库中的每种菌株包含基因变异,所述基因变异为选自前一库的至少两种个别丝状真菌菌株的基因变异的组合。
147.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换丝状真菌菌株库是所述初始终止子交换丝状真菌菌株库的完整组合库。
148.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换丝状真菌菌株库是所述初始终止子交换丝状真菌菌株库的完整组合库的子集。
149.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换丝状真菌菌株库是前一终止子交换丝状真菌菌株库的完整组合库。
150.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换丝状真菌菌株库是前一终止子交换丝状真菌菌株库的完整组合库的子集。
151.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中重复步骤d)至e),直至相较于所述生产丝状真菌菌株的所述表型性能,后续终止子交换丝状真菌菌株库的丝状真菌菌株的所述表型性能展现出所测量的表型变量增加至少10%。
152.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中重复步骤d)至e),直至相较于所述生产丝状真菌菌株的所述表型性能,后续终止子交换丝状真菌菌株库的丝状真菌菌株的所述表型性能展现出所测量的表型变量增加至少一倍。
153.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中步骤f)的所述经改良的表型性能选自由以下组成的群组:所关注的产物的体积生产率、所关注的产物的比生产率、所关注的产物的产率、所关注的产物的效价和其组合。
154.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中步骤f)的所述经改良的表型性能为:增加或更高效生产所关注的产物,所述所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢产物、次级胞外代谢产物、胞内组分分子和其组合。
155.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中所述丝状真菌菌株选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
156.根据权利要求146所述的用于改良生产丝状真菌菌株的表型性能的终止子交换方法,其中所述丝状真菌菌株为黑曲霉菌株。
157.一种丝状真菌宿主细胞,其包含可操作地连接到所述宿主细胞的内源性基因上的启动子,其中所述启动子对所述内源性基因具有异源性,其中所述启动子具有选自由SEQID No.1-4组成的群组的序列。
158.根据权利要求157所述的丝状真菌宿主细胞,其中相较于不具有可操作地连接到所述内源性基因上的所述启动子的参考丝状真菌菌株的表型性能,丝状真菌宿主细胞具有所需改良水平的表型性能。
159.根据权利要求157所述的丝状真菌宿主细胞,其中所述丝状真菌宿主细胞选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
160.根据权利要求157所述的丝状真菌宿主细胞,其中所述丝状真菌宿主细胞为黑曲霉。
161.一种丝状真菌菌株库,其中所述库中的每个丝状真菌菌株包含可操作地连接到所述宿主细胞的内源性基因上的启动子,其中所述启动子对所述内源性基因具有异源性,其中所述启动子具有选自由SEQ ID NO.1-4组成的群组的序列。
162.根据权利要求161所述的丝状真菌菌株库,其中所述丝状真菌菌株选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
163.根据权利要求161所述的丝状真菌菌株库,其中所述丝状真菌菌株为黑曲霉。
164.一种用于分离来源于单一真菌孢子的克隆群体的方法,所述方法包含:
(a)在液体悬浮液中提供多个真菌孢子,其中所述多个真菌孢子来源于真菌菌株;
(b)将不连续体积的所述液体悬浮液分配到包含多个反应区域的衬底中的个别反应区域,其中所述多个反应区域中的每个反应区域包含生长培养基,其中所述分配引起至少75%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率;
(c)在包含生长培养基的所述反应区域中培养所述经分配的单一活性真菌孢子;以及
(d)选择在所述反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。
165.根据权利要求164所述的方法,其进一步包含针对所述不连续体积中存在或不存在单一真菌孢子来筛选所述不连续体积,其中仅选择含有单一真菌孢子的所述不连续体积进行步骤(b)。
166.根据权利要求165所述的方法,其中所述分配引起至少80%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
167.根据权利要求165所述的方法,其中所述分配引起至少90%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
168.根据权利要求165所述的方法,其中所述分配引起至少95%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
169.根据权利要求165所述的方法,其中所述分配引起至少99%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
170.根据权利要求165所述的方法,其中所述分配引起大体上所有所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
171.根据权利要求165所述的方法,其中所述筛选所述不连续体积需要在光学上辨别所述不连续体积中存在或不存在单一真菌孢子。
172.根据权利要求171所述的方法,其中所述筛选使用能够在光学上辨别所述不连续体积中存在或不存在单一真菌孢子的微流体装置进行。
173.一种用于分离来源于单一真菌孢子的克隆群体的方法,所述方法包含:
(a)在液体悬浮液中提供多个真菌孢子,其中所述多个真菌孢子来源于真菌菌株;
(b)稀释所述液体悬浮液,其中所述稀释为限制稀释法;
(c)将不连续体积的所述稀释液分配到包含多个反应区域的衬底中的个别反应区域,其中所述多个反应区域中的每一反应区域包含生长培养基,其中所述限制稀释法引起分配到每个反应区域的不连续体积的所述稀释液含有一个活性孢子或无活性孢子的概率遵循泊松分布,借此所述多个反应区域中超过90%的所述反应区域不含活性孢子且超过90%的含有一或多个活性孢子的反应区域仅含有单一活性孢子;
(d)在包含生长培养基的所述反应区域中培养所述经分配的单一活性真菌孢子;以及
(e)选择在所述反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。
174.根据权利要求164或173所述的方法,其中所述反应区域存在于微量滴定板中。
175.根据权利要求174所述的方法,其中所述微量滴定板含有96个孔、384个孔或1536个孔。
176.根据权利要求164或173所述的方法,其中所述真菌菌株为丝状真菌菌株。
177.根据权利要求176所述的方法,其中所述丝状真菌菌株选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
178.根据权利要求177所述的方法,其中所述丝状真菌菌株为黑曲霉或其有性世代或无性世代。
179.根据权利要求178所述的方法,其中所述丝状真菌菌株具有非菌丝体球粒形态。
180.根据权利要求179所述的方法,其中所述丝状真菌菌株表达酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式。
181.根据权利要求180所述的方法,其中所述酿酒酵母SLN1基因的所述黑曲霉直系同源物的所述突变体形式的核酸序列为SEQ ID NO:13。
182.根据权利要求179或180所述的方法,其中所述酿酒酵母SLN1基因的所述黑曲霉直系同源物的所述突变体形式可操作地连接到选自SEQ ID NO:1或2的启动子序列上。
183.根据权利要求164或173所述的方法,其中所述真菌菌株具有基因扰动。
184.根据权利要求183所述的方法,其中所述基因扰动选自单核苷酸多态性、DNA插入、DNA缺失或其任何组合。
185.根据权利要求183所述的方法,其中通过用核糖核蛋白复合物(RNP复合物)转化来源于所述真菌菌株的原生质体将所述基因扰动引入到所述原生质体中。
186.根据权利要求185所述的方法,其中所述RNP复合物包含与引导RNA(gRNA)复合的RNA引导的核酸内切酶。
187.根据权利要求186所述的方法,其中所述RNA引导的核酸内切酶为第2类CRISPR-Cas系统RNA引导的核酸内切酶。
188.根据权利要求187所述的方法,其中所述第2类CRISPR-Cas系统RNA引导的核酸内切酶为II型、V型或VI型RNA引导的核酸内切酶。
189.根据权利要求187所述的方法,其中所述第2类CRISPR-Cas系统RNA引导的核酸内切酶选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物、突变体、变异体或修饰形式。
190.根据权利要求189所述的方法,其中所述第2类CRISPR-Cas系统RNA引导的核酸内切酶为Cas9或其同系物、直系同源物或旁系同源物。
191.根据权利要求186所述的方法,其中所述gRNA为单独的CRISPR RNA(crRNA)或退火到转录活化CRISPR RNA(tracrRNA)。
192.根据权利要求186所述的方法,其中所述gRNA为包含tracrRNA和crRNA的单一引导RNA(sgRNA)。
193.根据权利要求191或192所述的方法,其中所述crRNA包含与所述真菌菌株的所述基因组内的目标基因互补的引导序列,其中将所述RNP复合物引入到所述原生质体中促进了将所述基因扰动引入到所述目标基因中。
194.根据权利要求193所述的方法,其中所述目标基因的所述基因扰动通过以下来促进:将所述目标基因由所述RNP复合物裂解以产生所述目标基因中的DNA末端,继之以将所述DNA末端通过所述非同源末端结合NHEJ路径在所述目标基因中进行非同源末端结合。
195.根据权利要求193所述的方法,其进一步包含共转化包含所述目标基因的突变形式的供体DNA,其中所述目标基因的所述突变形式在两侧上由与所述目标基因基因座同源的核苷酸侧接。
196.根据权利要求195所述的方法,其中所述目标基因的所述基因扰动通过以下来促进:将所述目标基因由所述RNP复合物裂解以产生所述目标基因中的DNA末端,继之以将所述目标基因通过同源重组用所述供体DNA进行置换。
197.根据权利要求185所述的方法,其中步骤(b)进一步包含共转化包含可选标记的载体。
198.根据权利要求197所述的方法,其中所述可选标记在步骤(d)期间使用,以选择来源于转化感受态真菌菌株的克隆群体。
199.根据权利要求183或184所述的方法,其中通过用第一构筑体和第二构筑体转化所述多个原生质体将所述基因扰动引入到来源于所述真菌菌株的原生质体中,其中所述第一构筑体包含在两侧上由与所述原生质体的基因组中的第一基因座同源的核苷酸侧接的第一多核苷酸,且所述第二构筑体包含在两侧上由与所述原生质体的所述基因组中的第二基因座同源的核苷酸侧接的第二多核苷酸,其中所述转化作用使得通过同源重组将所述第一构筑体整合到所述第一基因座中并且将所述第二构筑体整合到所述第二基因座中,其中至少所述第二基因座为所述原生质体基因组中的第一可选标记基因,并且其中所述第一多核苷酸包含所述基因扰动。
200.根据权利要求199所述的方法,其中所述可选标记基因在步骤(d)期间使用,以促进选择来源于包含所述基因扰动的真菌菌株的克隆群体。
201.根据权利要求195所述的方法,其中所述真菌菌株具有非功能性非同源末端结合NHEJ路径。
202.根据权利要求201所述的方法,其中通过将所述真菌菌株暴露于针对所述NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使所述NHEJ路径为非功能性的。
203.根据权利要求202所述的方法,其中所述化学抑制剂为W-7。
204.一种用于产生丝状真菌菌株的方法,所述方法包含:
a.)提供多个原生质体,其中所述多个原生质体由亲本丝状真菌菌株的培养物制备;
b.)用核糖核蛋白复合物(RNP复合物)转化来自所述多个原生质体的每个原生质体;以及
c.)针对优于所述亲本丝状真菌菌株的表型性能改良来筛选和选择来源于所述经转化的原生质体的个别丝状真菌菌株,借此鉴别所述所选个别丝状真菌菌株的所述基因组中赋予表型性能改良的基因扰动。
205.根据权利要求204所述的方法,其中所述基因扰动选自单核苷酸多态性、DNA插入、DNA缺失或其任何组合。
206.根据权利要求204所述的方法,其中所述RNP复合物包含与引导RNA(gRNA)复合的RNA引导的核酸内切酶。
207.根据权利要求206所述的方法,其中所述RNA引导的核酸内切酶为第2类CRISPR-Cas系统RNA引导的核酸内切酶。
208.根据权利要求207所述的方法,其中所述第2类CRISPR-Cas系统RNA引导的核酸内切酶为II型、V型或VI型RNA引导的核酸内切酶。
209.根据权利要求207所述的方法,其中所述第2类CRISPR-Cas系统RNA引导的核酸内切酶选自Cas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c或其同系物、直系同源物、突变体、变异体或修饰形式。
210.根据权利要求209所述的方法,其中所述第2类CRISPR-Cas系统RNA引导的核酸内切酶为Cas9或其同系物、直系同源物或旁系同源物。
211.根据权利要求206所述的方法,其中所述gRNA为单独的CRISPR RNA(crRNA)或退火到转录活化CRISPR RNA(tracrRNA)。
212.根据权利要求206所述的方法,其中所述gRNA为包含tracrRNA和crRNA的单一引导RNA(sgRNA)。
213.根据权利要求211或212所述的方法,其中所述crRNA包含与所述亲本丝状真菌菌株的所述基因组内的目标基因互补的引导序列,其中引入所述RNP复合物扰动了所述原生质体中的所述目标基因。
214.根据权利要求213所述的方法,其中所述目标基因的所述扰动通过以下来促进:将所述目标基因由所述RNP复合物裂解以产生所述目标基因中的DNA末端,继之以将所述DNA末端通过所述非同源末端结合NHEJ路径在所述目标基因中进行非同源末端结合。
215.根据权利要求213所述的方法,其中步骤(b)进一步包含共转化包含所述目标基因的突变形式的供体DNA,其中所述目标基因的所述突变形式在两侧上由与所述目标基因基因座同源的核苷酸侧接。
216.根据权利要求215所述的方法,其中所述目标基因的所述扰动通过以下来促进:将所述目标基因由所述RNP复合物裂解以产生所述目标基因中的DNA末端,继之以将所述目标基因通过同源重组用所述供体DNA进行置换。
217.根据权利要求204所述的方法,其中步骤(b)进一步包含共转化包含可选标记的载体。
218.根据权利要求217所述的方法,其中所述可选标记在步骤(c)期间使用,从而针对优于所述亲本丝状真菌菌株的表型性能改良,选择转化感受态个别丝状真菌菌株进行后续筛选。
219.根据权利要求215至218中任一权利要求所述的方法,其中所述亲本丝状真菌菌株具有非功能性非同源末端结合NHEJ路径。
220.根据权利要求219所述的系统,其中通过将所述细胞暴露于针对所述NHEJ路径的组分的抗体、化学抑制剂、蛋白质抑制剂、物理抑制剂、肽抑制剂或反义或RNAi分子而使所述NHEJ路径为非功能性的。
221.根据权利要求220所述的方法,其中所述化学抑制剂为W-7。
222.根据权利要求204所述的方法,其中所述丝状真菌菌株的所述表型性能改良包含相较于所述亲本丝状真菌菌株的所述表型性能,所关注的产物的所测量的表型变量增加至少10%。
223.根据权利要求204所述的方法,其中所述丝状真菌菌株的所述表型性能改良包含相较于所述亲本丝状真菌菌株的所述表型性能,所关注的产物的所测量的表型变量增加至少一倍。
224.根据权利要求222或223所述的方法,其中所述所测量的表型变量选自由以下组成的群组:所关注的产物的体积生产率、所关注的产物的比生产率、所关注的产物的产率、所关注的产物的效价和其组合。
225.根据权利要求222或223所述的方法,其中增加所述所测量的表型变量或更高效地生产所述所关注的产物。
226.根据权利要求222或223所述的方法,其中所述所关注的产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、醇、初级胞外代谢产物、次级胞外代谢产物、胞内组分分子和其组合。
227.根据权利要求204所述的方法,其中所述亲本丝状真菌菌株选自:绵霉属、枝顶孢属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、头孢霉属、金孢霉属、旋孢腔菌属、棒囊壳属、隐丛赤壳属、隐球酵母属、鬼伞属、革盖菌属、色二孢属、内斯菌属、镰孢菌属、赤霉菌属、粘帚霉属、腐质菌属、肉座菌属、毁丝霉属(例如,嗜热毁丝霉)、毛霉属、脉孢菌属、青霉属、柄孢壳菌属、射脉菌属、梨囊鞭菌属、梨胞霉属、根毛霉属、根霉菌属、裂褶菌属、节格孢属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、栓菌属、弯颈霉菌属、木霉属、轮枝菌属、小包脚菇属物种或其有性世代或无性世代和同物异名或分类等效物。
228.根据权利要求227所述的方法,其中所述丝状真菌菌株为黑曲霉或其有性世代或无性世代。
229.根据权利要求228所述的方法,其中所述丝状真菌菌株具有非菌丝体球粒形态。
230.根据权利要求229所述的方法,其中所述丝状真菌菌株表达酿酒酵母SLN1基因的黑曲霉直系同源物的突变体形式。
231.根据权利要求230所述的方法,其中所述酿酒酵母SLN1基因的所述黑曲霉直系同源物的所述突变体形式的核酸序列为SEQ ID NO:13。
232.根据权利要求230或231所述的方法,其中所述酿酒酵母SLN1基因的所述黑曲霉直系同源物的所述突变体形式可操作地连接到选自SEQ ID NO:1或2的启动子序列上。
233.根据权利要求204所述的方法,其进一步包含在步骤(c)之前产生来源于所述个别丝状真菌菌株的分离克隆群体。
234.根据权利要求233所述的方法,其中所述分离包含:
(i)诱导所述经转化的原生质体,以产生多个真菌孢子,其中所述多个真菌孢子中的每个真菌孢子来源于单一经转化的原生质体;
(ii)将来源于单一经转化的原生质体的所述多个真菌孢子再悬浮于液体中,以产生液体悬浮液;
(iii)将不连续体积的所述液体悬浮液分配到包含多个反应区域的衬底中的个别反应区域,其中所述多个反应区域中的每个反应区域包含生长培养基,其中所述分配引起至少75%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率;以及
(iv)在包含生长培养基的所述反应区域中培养所述经分配的单一活性真菌孢子,借此产生来源于所述个别丝状真菌菌株的分离克隆群体。
235.根据权利要求234所述的方法,其进一步包含针对所述不连续体积中存在或不存在单一真菌孢子来筛选所述不连续体积,其中仅选择含有单一真菌孢子的所述不连续体积进行步骤(iii)。
236.根据权利要求235所述的方法,其中所述分配引起至少80%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
237.根据权利要求235所述的方法,其中所述分配引起至少90%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
238.根据权利要求235所述的方法,其中所述分配引起至少95%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
239.根据权利要求235所述的方法,其中所述分配引起至少99%的所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
240.根据权利要求235所述的方法,其中所述分配引起大体上所有所述个别反应区域含有不超过一个来自所述多个真菌孢子的单一活性真菌孢子的概率。
241.根据权利要求240所述的方法,其中所述筛选所述不连续体积需要在光学上辨别所述不连续体积中存在或不存在单一真菌孢子。
242.根据权利要求241所述的方法,其中所述筛选使用能够在光学上辨别所述不连续体积中存在或不存在单一真菌孢子的微流体装置来进行。
243.根据权利要求233所述的方法,其中所述分离包含:(i)诱导所述经转化的原生质体,以产生多个真菌孢子,其中所述多个真菌孢子中的每个真菌孢子来源于单一经转化的原生质体;(ii)将来源于单一经转化的原生质体的所述多个真菌孢子再悬浮于液体中,以产生液体悬浮液;(iii)稀释所述液体悬浮液,其中所述稀释为限制稀释法;(iv)将不连续体积的所述稀释液分配到包含多个反应区域的衬底中的个别反应区域,其中所述多个反应区域中的每一反应区域包含生长培养基,其中所述限制稀释法引起分配到每个反应区域的不连续体积的所述稀释液含有一个活性孢子或无活性孢子的概率遵循泊松分布,借此所述多个反应区域中超过90%的所述反应区域不含活性孢子且超过90%的含有一或多个活性孢子的反应区域仅含有单一活性孢子;(v)在包含生长培养基的所述反应区域中培养所述经分配的单一活性真菌孢子;以及(vi)选择在所述反应区域中生长的克隆群体,借此分离来源于单一真菌孢子的克隆群体。
244.根据权利要求234至243中任一权利要求所述的方法,其中所述反应区域存在于微量滴定板中。
245.根据权利要求244所述的方法,其中所述微量滴定板含有96个孔、384个孔或1536个孔。
CN201880037593.5A 2017-06-06 2018-06-06 用于改良真菌菌株的高通量基因组工程改造平台 Pending CN110719956A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762515907P 2017-06-06 2017-06-06
US62/515,907 2017-06-06
PCT/US2018/036360 WO2018226900A2 (en) 2017-06-06 2018-06-06 A htp genomic engineering platform for improving fungal strains

Publications (1)

Publication Number Publication Date
CN110719956A true CN110719956A (zh) 2020-01-21

Family

ID=63080458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880037593.5A Pending CN110719956A (zh) 2017-06-06 2018-06-06 用于改良真菌菌株的高通量基因组工程改造平台

Country Status (7)

Country Link
US (4) US10954511B2 (zh)
EP (1) EP3635112A2 (zh)
JP (1) JP7227162B2 (zh)
KR (1) KR20200026878A (zh)
CN (1) CN110719956A (zh)
CA (1) CA3061984A1 (zh)
WO (1) WO2018226900A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114774455A (zh) * 2022-04-19 2022-07-22 中国农业科学院农产品加工研究所 一种适用于拟轮枝镰孢菌的CRISPR/Cas9载体及其构建方法和应用

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN2014CN02136A (zh) * 2011-08-24 2015-05-29 Novozymes Inc
CN110268063A (zh) * 2016-12-30 2019-09-20 齐默尔根公司 利用自动化遗传操作和菌株纯化步骤建立真菌生产菌株的方法
CN110719956A (zh) 2017-06-06 2020-01-21 齐默尔根公司 用于改良真菌菌株的高通量基因组工程改造平台
US11028401B2 (en) 2018-06-06 2021-06-08 Zymergen Inc. Manipulation of genes involved in signal transduction to control fungal morphology during fermentation and production
WO2020061503A1 (en) * 2018-09-20 2020-03-26 Perfect Day, Inc. Methods and compositions for producing homokaryotic filamentous fungal cells
CA3117805A1 (en) 2018-10-31 2020-05-07 Zymergen Inc. Multiplexed deterministic assembly of dna libraries
US11053515B2 (en) 2019-03-08 2021-07-06 Zymergen Inc. Pooled genome editing in microbes
JP2022524043A (ja) 2019-03-08 2022-04-27 ザイマージェン インコーポレイテッド 微生物の反復ゲノム編集
AU2020305509A1 (en) * 2019-06-27 2022-01-20 Basf Plant Science Company Gmbh Methods for transformation of fungal spores
US11479779B2 (en) 2020-07-31 2022-10-25 Zymergen Inc. Systems and methods for high-throughput automated strain generation for non-sporulating fungi
EP4219719A1 (en) * 2020-09-24 2023-08-02 Chigenovo Co., Ltd. Nucleic acid molecule targeting mutation site of cyp4v2 gene and use thereof
WO2022216560A1 (en) * 2021-04-09 2022-10-13 Thrive Bioscience, Inc. A method for identifying a cell line during incubation of the cell line
US11530406B1 (en) 2021-08-30 2022-12-20 Sachi Bioworks Inc. System and method for producing a therapeutic oligomer
WO2023039346A1 (en) * 2021-09-10 2023-03-16 The Regents Of The University Of California Temperature regulated crispr-cas systems and methods of use thereof
WO2023148291A1 (en) * 2022-02-02 2023-08-10 Biotalys NV Methods for genome editing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030162218A1 (en) * 2000-04-13 2003-08-28 Emalfarb Mark A. High-throughput screening of expressed DNA libraries in filamentous fungi

Family Cites Families (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4435504A (en) 1982-07-15 1984-03-06 Syva Company Immunochromatographic assay with support having bound "MIP" and second enzyme
GB8406752D0 (en) 1984-03-15 1984-04-18 Unilever Plc Chemical and clinical tests
US5198345A (en) 1985-04-15 1993-03-30 Gist-Brocades N.V. Vectors in use in filamentous fungi
US5364770A (en) 1985-08-29 1994-11-15 Genencor International Inc. Heterologous polypeptides expressed in aspergillus
US4935349A (en) 1986-01-17 1990-06-19 Zymogenetics, Inc. Expression of higher eucaryotic genes in aspergillus
US5766912A (en) 1986-03-17 1998-06-16 Novo Nordisk A/S Humicola lipase produced in aspergillus
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
CA1303983C (en) 1987-03-27 1992-06-23 Robert W. Rosenstein Solid phase assay
US4855240A (en) 1987-05-13 1989-08-08 Becton Dickinson And Company Solid phase assay employing capillary flow
US5252726A (en) 1987-09-04 1993-10-12 Novo Nordisk A/S Promoters for use in aspergillus
US6060296A (en) 1991-07-03 2000-05-09 The Salk Institute For Biological Studies Protein kinases
US5516670A (en) 1991-09-30 1996-05-14 Kuehnle; Adelheid R. Magnetophoretic particle delivery method and apparatus for the treatment of cells
BE1005432A4 (nl) 1991-10-01 1993-07-20 Dsm Nv Expressiecassette voor heterologe eiwitten.
WO1993012237A1 (en) 1991-12-09 1993-06-24 Unilever N.V. Process for producing/secreting a protein by a transformed mould using expression/secretion regulating regions derived from an aspergillus endoxylanase ii gene
IL106049A0 (en) 1992-06-17 1993-10-20 Univ Hawaii Expression system having a functional mtr locus and its use
DE69432543T2 (de) 1993-07-23 2003-12-24 Dsm Nv Selektionmarker-genfreie rekombinante Stämme: Verfahren zur ihrer Herstellung und die Verwendung dieser Stämme
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5741665A (en) 1994-05-10 1998-04-21 University Of Hawaii Light-regulated promoters for production of heterologous proteins in filamentous fungi
US6090592A (en) 1994-08-03 2000-07-18 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid on supports
EP0758020B1 (en) * 1995-08-03 2008-12-24 DSM IP Assets B.V. amdS gene from Aspergillus niger coding for an acetamidase
US5532148A (en) 1995-08-30 1996-07-02 Ntec, Inc. Process for producing of citric acid and monovalent citrate salts
US5753477A (en) 1996-03-19 1998-05-19 University Technology Corporation Magneto-biolistic methods
JP2002503954A (ja) 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
JPH1180185A (ja) 1997-09-05 1999-03-26 Res Dev Corp Of Japan オリゴヌクレオチドの化学合成法
JPH11304666A (ja) 1998-04-24 1999-11-05 Hitachi Ltd 試料ハンドリングツールおよびその使用方法
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
EP1117808B1 (en) 1998-10-06 2004-12-29 Mark Aaron Emalfarb Transformation system in the field of filamentous fungal hosts: in chrysosporium
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
WO2005021772A1 (en) 2003-08-29 2005-03-10 Degussa Ag Process for the preparation of l-lysine
ES2350048T3 (es) * 2004-04-02 2011-01-17 Dsm Ip Assets B.V. Mutantes fúngicos filamentosos con eficiencia mejorada de recombinación homóloga.
WO2007044091A2 (en) * 2005-06-02 2007-04-19 Fluidigm Corporation Analysis using microfluidic partitioning devices
JP2009538622A (ja) 2006-05-30 2009-11-12 ダウ グローバル テクノロジーズ インコーポレイティド コドン最適化法
ATE503018T1 (de) 2006-06-26 2011-04-15 Dsm Ip Assets Bv Transektion filamentöser pilze mit hohem durchsatz
US9862956B2 (en) 2006-12-10 2018-01-09 Danisco Us Inc. Expression and high-throughput screening of complex expressed DNA libraries in filamentous fungi
WO2008113847A2 (en) * 2007-03-21 2008-09-25 Dsm Ip Assets B.V. Improved method for homologous recombination
US9133464B2 (en) 2007-12-19 2015-09-15 Glycofi, Inc. Yeast strains for protein production
WO2010025310A2 (en) 2008-08-27 2010-03-04 Westend Asset Clearinghouse Company, Llc Methods and devices for high fidelity polynucleotide synthesis
WO2010039889A2 (en) 2008-09-30 2010-04-08 Novozymes, Inc. Methods for using positively and negatively selectable genes in a filamentous fungal cell
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8783382B2 (en) 2009-01-15 2014-07-22 Schlumberger Technology Corporation Directional drilling control devices and methods
EP2398915B1 (en) 2009-02-20 2016-08-24 Synthetic Genomics, Inc. Synthesis of sequence-verified nucleic acids
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8881797B2 (en) 2010-05-05 2014-11-11 Ametek, Inc. Compact plate-fin heat exchanger utilizing an integral heat transfer layer
JP2013533737A (ja) 2010-06-03 2013-08-29 ダニスコ・ユーエス・インク 糸状菌宿主株及びdna構築物並びにその使用方法
EP2395087A1 (en) 2010-06-11 2011-12-14 Icon Genetics GmbH System and method of modular cloning
US20150368639A1 (en) 2011-04-14 2015-12-24 Ryan T. Gill Compositions, methods and uses for multiplex protein sequence activity relationship mapping
CA2833765C (en) 2011-04-22 2021-05-11 Danisco Us Inc. Filamentous fungi having an altered viscosity phenotype
JP5846476B2 (ja) 2011-07-08 2016-01-20 独立行政法人酒類総合研究所 微生物のコウジ酸生産性を向上させる方法
CN104603273B (zh) * 2012-03-12 2019-09-10 帝斯曼知识产权资产管理有限公司 重组系统
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
LT3241902T (lt) 2012-05-25 2018-06-25 The Regents Of The University Of California Būdai ir kompozicijos, skirti rnr nukreiptos tikslinės dnr modifikacijai ir rnr nukreiptos transkripcijos moduliacijai
US20130319861A1 (en) 2012-05-30 2013-12-05 Berkeley Lights, Inc. Outputting A Droplet Of Liquid Medium From A Device For Processing Micro-Objects In The Medium
JP2015530074A (ja) 2012-07-13 2015-10-15 バークレー ライツ,インコーポレイテッド 生物学的マイクロ物体の結合
UA116639C2 (uk) 2012-10-09 2018-04-25 Рег'Юлес Терап'Ютікс Інк. Способи лікування синдрому альпорта
US8921055B2 (en) 2012-10-30 2014-12-30 Berkeley Lights, Inc. Detecting cells secreting a protein of interest
US9857333B2 (en) 2012-10-31 2018-01-02 Berkeley Lights, Inc. Pens for biological micro-objects
US9403172B2 (en) 2012-11-08 2016-08-02 Berkeley Lights, Inc. Circuit based optoelectronic tweezers
PT2921557T (pt) 2012-12-12 2016-10-19 Massachusetts Inst Technology Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências
SG11201504519TA (en) 2012-12-12 2015-07-30 Broad Inst Inc Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
DK2931898T3 (en) 2012-12-12 2016-06-20 Massachusetts Inst Technology CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS
CN110982844A (zh) 2012-12-12 2020-04-10 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
DK2931891T3 (da) 2012-12-17 2019-08-19 Harvard College Rna-styret modificering af menneskelige genomer
US9889445B2 (en) 2013-10-22 2018-02-13 Berkeley Lights, Inc. Micro-fluidic devices for assaying biological activity
EP3783094B1 (en) 2013-10-22 2023-10-11 Berkeley Lights, Inc. Micro-fluidic devices for assaying biological activity
KR102113377B1 (ko) 2013-10-22 2020-05-21 버클리 라잇츠, 인크. 격리 펜을 갖는 미세유체 소자 및 이를 사용한 생물학적 미세 물체를 시험하는 방법
KR102380245B1 (ko) 2013-11-07 2022-03-30 에디타스 메디신, 인코포레이티드 지배적인 gRNA를 이용하는 CRISPR-관련 방법 및 조성물
US20160304905A1 (en) 2013-12-03 2016-10-20 Novozymes A/S Fungal Gene Library By Double Split-Marker Integration
US20150166326A1 (en) 2013-12-18 2015-06-18 Berkeley Lights, Inc. Capturing Specific Nucleic Acid Materials From Individual Biological Cells In A Micro-Fluidic Device
US11318479B2 (en) 2013-12-18 2022-05-03 Berkeley Lights, Inc. Capturing specific nucleic acid materials from individual biological cells in a micro-fluidic device
US20150306599A1 (en) 2014-04-25 2015-10-29 Berkeley Lights, Inc. Providing DEP Manipulation Devices And Controllable Electrowetting Devices In The Same Microfluidic Apparatus
US20150306598A1 (en) 2014-04-25 2015-10-29 Berkeley Lights, Inc. DEP Force Control And Electrowetting Control In Different Sections Of The Same Microfluidic Apparatus
US11192107B2 (en) 2014-04-25 2021-12-07 Berkeley Lights, Inc. DEP force control and electrowetting control in different sections of the same microfluidic apparatus
EP3137613A4 (en) 2014-04-28 2017-11-22 The Regents Of The University Of California Biological platform for production of commodity chemicals
WO2015188171A1 (en) 2014-06-06 2015-12-10 Berkeley Lights, Inc. Isolating microfluidic structures and trapping bubbles
EP3628732B1 (en) 2014-11-05 2023-05-03 Illumina, Inc. Transposase compositions for reduction of insertion bias
WO2016073990A2 (en) * 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
EP3227025B1 (en) 2014-12-05 2019-03-27 The Regents of The University of California Single-sided light-actuated microfluidic device with integrated mesh ground
CA2970174C (en) 2014-12-08 2024-01-23 Berkeley Lights, Inc. Microfluidic device comprising lateral/vertical transistor structures and process of making and using same
US10058865B2 (en) 2014-12-08 2018-08-28 Berkeley Lights, Inc. Actuated microfluidic structures for directed flow in a microfluidic device and methods of use thereof
EP3230717B1 (en) 2014-12-09 2021-08-18 Berkeley Lights, Inc. Automated detection and identification of micro-objects in microfluidic devices
US10578630B2 (en) 2014-12-09 2020-03-03 Berkeley Lights, Inc. Automated identification of assay areas in a microfluidic device and detection of assay positive areas based on rate of change of image light intensity
US9744533B2 (en) 2014-12-10 2017-08-29 Berkeley Lights, Inc. Movement and selection of micro-objects in a microfluidic apparatus
US10384204B2 (en) 2014-12-10 2019-08-20 Berkeley Lights, Inc. Systems for operating electrokinetic devices
KR102350405B1 (ko) * 2014-12-16 2022-01-11 다니스코 유에스 인크. 진균 게놈 변형 시스템 및 사용 방법
DK3242950T3 (da) 2015-01-06 2021-12-20 Dsm Ip Assets Bv Crispr-cas-system til en trådformet svampeværtscelle
RU2713328C2 (ru) 2015-01-28 2020-02-04 Пайонир Хай-Бред Интернэшнл, Инк. Гибридные днк/рнк-полинуклеотиды crispr и способы применения
JP2018504936A (ja) * 2015-02-09 2018-02-22 ダニスコ・ユーエス・インク 真菌株および使用方法
WO2016141343A1 (en) 2015-03-04 2016-09-09 Berkeley Lights, Inc. Generation and selection of embryos in vitro
KR20170135957A (ko) 2015-04-10 2017-12-08 펠단 바이오 인코포레이티드 표적 진핵세포의 세포질로의 폴리펩타이드 카고의 형질 도입 효과를 향상시키기 위한 폴리펩타이드계 셔틀제, 이의 용도, 방법 및 이에 관련된 키트
IL293366B2 (en) 2015-04-22 2023-10-01 Berkeley Lights Inc Kits and methods for preparing a microfluidic device for cell culture
WO2016172623A1 (en) 2015-04-22 2016-10-27 Berkeley Lights, Inc. Manipulation of cell nuclei in a micro-fluidic device
US10751715B1 (en) 2015-04-22 2020-08-25 Berkeley Lights, Inc. Microfluidic reporter cell assay methods and kits thereof
WO2016172621A2 (en) 2015-04-22 2016-10-27 Berkeley Lights, Inc. Freezing and archiving cells on a microfluidic device
KR102415433B1 (ko) 2015-04-22 2022-06-30 버클리 라잇츠, 인크. 미세유체 디바이스를 위한 배양 스테이션
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
KR102356072B1 (ko) 2015-09-10 2022-01-27 에스케이하이닉스 주식회사 메모리 시스템 및 그 동작 방법
DK3356046T3 (da) 2015-10-01 2022-02-14 Berkeley Lights Inc Brøndpladeinkubator
ES2699848T3 (es) 2015-10-23 2019-02-13 Caribou Biosciences Inc Acido nucleico CRISPR clase 2 de tipo cruzado modificado que se dirige a ácidos nucleicos
US10799865B2 (en) 2015-10-27 2020-10-13 Berkeley Lights, Inc. Microfluidic apparatus having an optimized electrowetting surface and related systems and methods
WO2017091601A1 (en) 2015-11-23 2017-06-01 Berkeley Lights, Inc. In situ-generated microfluidic isolation structures, kits and methods of use thereof
KR102006320B1 (ko) 2015-12-07 2019-08-02 지머젠 인코포레이티드 Htp 게놈 공학 플랫폼에 의한 미생물 균주 개량
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US11151497B2 (en) 2016-04-27 2021-10-19 Zymergen Inc. Microbial strain design system and methods for improved large-scale production of engineered nucleotide sequences
JP6821598B2 (ja) 2015-12-07 2021-01-27 ザイマージェン インコーポレイテッド Corynebacterium glutamicum由来のプロモーター
CN114878807A (zh) 2015-12-08 2022-08-09 伯克利之光生命科技公司 微流体设备和试剂盒及其使用方法
WO2017117567A1 (en) 2015-12-30 2017-07-06 Berkeley Lights, Inc. Droplet generation in a microfluidic device having an optoelectrowetting configuration
EP3397586A4 (en) 2015-12-30 2019-07-17 Berkeley Lights, Inc. MICROFLUIDIC DEVICES FOR CONVECTION AND DISPLACEMENT WITH OPTICAL CONTROL, KITS AND RELATED METHODS
WO2017117521A1 (en) 2015-12-31 2017-07-06 Berkeley Lights, Inc. Tumor infilitrating cells engineered to express a pro-inflammatory polypeptide
EP3889176A1 (en) 2016-01-15 2021-10-06 Berkeley Lights, Inc. Methods of producing patient-specific anti-cancer therapeutics and methods of treatment therefor
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
EP3429753A4 (en) 2016-03-16 2019-11-06 Berkeley Lights, Inc. METHODS, SYSTEMS AND DEVICES FOR SELECTION AND PRODUCTION OF GENERICALLY WORKED CLONES
US20180135011A1 (en) 2017-03-13 2018-05-17 Berkeley Lights, Inc. Selection and cloning of t lymphocytes in a microfluidic device
KR20220139426A (ko) 2016-03-31 2022-10-14 버클리 라잇츠, 인크. 핵산 안정화 시약, 키트들, 및 그 이용 방법들
CA3020976A1 (en) 2016-04-15 2017-10-19 Berkeley Lights, Inc. Methods, systems and kits for in-pen assays
US10675625B2 (en) 2016-04-15 2020-06-09 Berkeley Lights, Inc Light sequencing and patterns for dielectrophoretic transport
KR20190010641A (ko) 2016-05-26 2019-01-30 버클리 라잇츠, 인크. 공유 결합으로 개질된 표면들, 키트들, 및 준비 및 사용 방법들
JP2019519243A (ja) 2016-07-05 2019-07-11 ザイマージェン インコーポレイテッド Rnaデグラドソームタンパク質複合体の遺伝的攪乱
KR102456488B1 (ko) 2016-07-21 2022-10-19 버클리 라잇츠, 인크. 미세유체 디바이스에서의 t 림프구들의 분류
CN109563522A (zh) * 2016-09-15 2019-04-02 诺维信公司 真菌宿主细胞中dna片段的基因组整合
CA3038535A1 (en) 2016-10-01 2018-04-05 Berkeley Lights, Inc. Dna barcode compositions and methods of in situ identification in a microfluidic device
EP3529611B1 (en) 2016-10-23 2022-11-23 Berkeley Lights, Inc. Methods for screening b cell lymphocytes
IL267008B1 (en) 2016-12-01 2024-02-01 Berkeley Lights Inc Imaging mechanisms and systems and methods for micro objects
EP3548602A4 (en) 2016-12-01 2020-07-15 Berkeley Lights, Inc. WELL PLATE INCUBATOR
IL267009B (en) 2016-12-01 2022-07-01 Berkeley Lights Inc Automatic detection and repositioning of micro-objects in micropoloidal devices
JP6994730B2 (ja) * 2016-12-26 2022-02-04 独立行政法人酒類総合研究所 ゲノム編集タンパク質の直接導入による糸状菌ゲノム編集方法
CN110268063A (zh) 2016-12-30 2019-09-20 齐默尔根公司 利用自动化遗传操作和菌株纯化步骤建立真菌生产菌株的方法
WO2018200872A1 (en) 2017-04-26 2018-11-01 Berkeley Lights, Inc. Biological process systems and methods using microfluidic apparatus having an optimized electrowetting surface
CN110719956A (zh) 2017-06-06 2020-01-21 齐默尔根公司 用于改良真菌菌株的高通量基因组工程改造平台
USD844471S1 (en) 2017-06-30 2019-04-02 Berkeley Lights, Inc. Analytical instrument
CA3096161A1 (en) 2018-03-28 2019-10-03 Berkeley Lights, Inc. Methods for preparation of nucleic acid sequencing libraries
US11028401B2 (en) 2018-06-06 2021-06-08 Zymergen Inc. Manipulation of genes involved in signal transduction to control fungal morphology during fermentation and production
US20200123491A1 (en) 2018-09-21 2020-04-23 Berkeley Lights, Inc. Functionalized well plate, methods of preparation and use thereof
SG11202103296RA (en) 2018-10-18 2021-05-28 Berkeley Lights Inc Proto-antigen-presenting synthetic surfaces, activated t cells, and uses thereof
CN114901587A (zh) 2019-10-25 2022-08-12 伯克利之光生命科技公司 用于操作微流体装置的系统
KR20220113683A (ko) 2019-11-17 2022-08-16 버클리 라잇츠, 인크. 생물학적 샘플의 분석을 위한 시스템 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030162218A1 (en) * 2000-04-13 2003-08-28 Emalfarb Mark A. High-throughput screening of expressed DNA libraries in filamentous fungi

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
GENBANK: "Aspergillus niger contig An05c0060, genomic contig", 《GENBANK》, pages 270106 *
GENBANK: "Aspergillus niger contig An07c0240, genomic contig", 《GENBANK》, pages 270141 *
GENBANK: "Aspergillus niger contig An14c0130, genomic contig", 《GENBANK》, pages 270320 *
J.W. BETZ等: "Use of Flow Cytometry in Industrial Microbiology for Strain Improvement Programs", 《CYTOMETRY》 *
J.W. BETZ等: "Use of Flow Cytometry in Industrial Microbiology for Strain Improvement Programs", 《CYTOMETRY》, vol. 5, 31 December 1984 (1984-12-31), pages 145 - 150 *
JAVIER COLLADO等: "High-throughput culturing of fungi from plant litter by a dilution-to-extinction technique", 《FEMS MICROBIOLOGY ECOLOGY》 *
JAVIER COLLADO等: "High-throughput culturing of fungi from plant litter by a dilution-to-extinction technique", 《FEMS MICROBIOLOGY ECOLOGY》, vol. 60, no. 3, 27 April 2007 (2007-04-27), pages 521 - 533 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114774455A (zh) * 2022-04-19 2022-07-22 中国农业科学院农产品加工研究所 一种适用于拟轮枝镰孢菌的CRISPR/Cas9载体及其构建方法和应用

Also Published As

Publication number Publication date
US20200071693A1 (en) 2020-03-05
KR20200026878A (ko) 2020-03-11
US11180753B2 (en) 2021-11-23
CA3061984A1 (en) 2018-12-13
US11242524B2 (en) 2022-02-08
WO2018226900A3 (en) 2019-01-17
WO2018226900A2 (en) 2018-12-13
US20220145288A1 (en) 2022-05-12
EP3635112A2 (en) 2020-04-15
US20200123535A1 (en) 2020-04-23
US10954511B2 (en) 2021-03-23
US20210284993A1 (en) 2021-09-16
JP2020524489A (ja) 2020-08-20
JP7227162B2 (ja) 2023-02-21

Similar Documents

Publication Publication Date Title
US11242524B2 (en) HTP genomic engineering platform for improving fungal strains
US11155807B2 (en) Automated system for HTP genomic engineering
EP3858996B1 (en) Microbial strain improvement by a htp genomic engineering platform
US11299741B2 (en) Manipulation of genes involved in signal transduction to control fungal morphology during fermentation and production
US11312951B2 (en) Systems and methods for host cell improvement utilizing epistatic effects
US20190323036A1 (en) Method to build fungal production strains using automated steps for genetic manipulation and strain purification
US20200102554A1 (en) High throughput transposon mutagenesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40014774

Country of ref document: HK