conception de la voie synthétique acétyl-CoA
la façon la plus simple de synthétiser le carbone organique à partir d’un seul carbone est de le construire un par un., Afin de construire une voie artificielle acétyl-CoA à partir d’un carbone, nous avons proposé la voie synthétique acétyl-CoA (SACA), où deux molécules de formaldéhyde seraient transférées dans une molécule d’acétyl-CoA par seulement trois étapes (Fig. 1a). Premièrement, le formaldéhyde serait condensé en glycolaldéhyde (GALD) par la glycolaldéhyde synthase (GALS). Et puis le glycolaldéhyde serait converti en acétyl-phosphate (AcP) par l’acétyl-phosphate synthase (ACPS) en utilisant du phosphate inorganique. Enfin, AcP serait utilisé pour produire de l’acétyl-CoA par l’enzyme connue phosphate acétyltransférase (PTA)25., Pendant ce temps, le formaldéhyde peut être obtenu en réduisant le dioxyde de carbone et le formate26 ou en oxydant le méthane et le méthanol27. Ainsi, nous pourrions réaliser la biosynthèse de l’acétyl-CoA à partir du formaldéhyde et même d’autres ressources en carbone.
la thermodynamique peut vivo ou in vitro. Nous avons calculé la force motrice chimique thermodynamique de la voie SACA conçue., La réaction globale du formaldéhyde à l’acétyl-CoA est très thermodynamiquement favorable, où le changement D’énergie de Gibbs total (Δrg’m) de la réaction entière est d’environ -96,7 kJ mol−1 (Fig. 1b et tableau supplémentaire 1). La valeur du MDF (force motrice maximale) est généralement utilisée pour évaluer la qualité thermodynamique et cinétique de différents chemins 28. Si le MDF est suffisamment élevé, la voie ne contient aucun goulot d’étranglement thermodynamique qui entraverait son fonctionnement in vivo. La voie SACA a obtenu la valeur relativement élevée du MDF de 26.,9 kJ mol-1, ce qui est évidemment plus élevé que les voies FLS et MCC (leurs valeurs MDF sont respectivement de 1,9 et 5,8 kJ mol−1). Par conséquent, la voie SACA est thermodynamiquement favorable à la biosynthèse de l’acétyl-CoA à partir du formaldéhyde.
Identification d’une nouvelle enzyme de C1 à C2
la condensation du formaldéhyde peut être catalysée par la carabine n-hétérocyclique en chimique29,30. En biologie, le cycle thiazolium du cofacteur thiamine diphosphate (ThDP) a une fonction similaire, qui pourrait activer un aldéhyde et former ensuite un dimère avec un autre aldéhyde31., Afin de trouver une enzyme pour condenser deux molécules de formaldéhyde en une molécule de glycolaldéhyde, nous nous sommes référés aux mécanismes catalytiques des enzymes dépendantes du ThDP et avons construit un modèle de théozyme, qui comprend le ThDP, le glycolaldéhyde et l’acide glutamique qui fournit des électrons pour la réaction32 (Fig. 2a). Toutes les enzymes de la Banque de données sur les protéines (PDB) ont été virtuellement criblées sur la base du modèle de théozyme et 37 structures protéiques non redondantes avec ligand ThDP ont été obtenues (fig. supplémentaire. 1 et Note complémentaire)., Selon les mécanismes catalytiques des enzymes dépendantes33,34,35, l’atome de C2 dans ThDP est le centre actif. La distance entre l’atome de C2 et le produit du glycolaldéhyde est critique pour déclencher la réaction catalytique (Fig. 2a). Ainsi, nous avons analysé la distance entre l’atome de C2 et le glycolaldéhyde dans chaque protéine candidate.
sur la base des distances moyennes dans chaque protéine en utilisant l’amarrage moléculaire (données supplémentaires 1)36, six candidats avec des distances courtes et des annotations fonctionnelles claires ont été définis comme candidats (Fig. 2b et tableau supplémentaire 2). De plus, trois protéines ayant de longues distances ont été choisies au hasard comme témoins. Les candidats et les témoins ont été exprimés et purifiés pour tester leur capacité à produire du glycolaldéhyde à partir du formaldéhyde., Trois candidats sur six présentaient l’activité souhaitée, tandis que trois témoins n’avaient pas la fonction, indiquant que la distance entre l’atome de C2 et le glycolaldéhyde joue un rôle critique sur la condensation du formaldéhyde. Parmi les trois candidats actifs, la protéine 2UZ1 (https://www.rcsb.org/structure/2UZ1), appelée benzaldéhyde lyase (BAL), génère préférentiellement de la dihydroxyacétone (DHA) malgré le rendement minimal de glycolaldéhyde lorsque la concentration de formaldéhyde est plus faible37., The other two proteins 3FZN (https://www.rcsb.org/structure/3FZN) and 4K9Q (https://www.rcsb.org/structure/4K9Q) that produce glycolaldehyde from formaldehyde were named as benzoylformate decarboxylases (BFD) in PDB database. And BFD (3FZN) from Pseudomonas putida was selected as candidate for subsequent modification since it has higher activity and expression level (Fig. 2c).,
évolution dirigée de la glycolaldéhyde synthase
étant donné que BAL avait été conçu pour produire du DHA à partir de formaldéhyde 22, nous avons proposé de détecter si les mutations correspondantes dans BFD contribueraient également à améliorer l’activité enzymatique (fig. 2). En criblant tous les résidus mutés, nous avons en effet trouvé une mutation hautement active W86R-N87T qui se trouvait dans le canal de substrat de BFD (fig. 3). Ainsi, cette mutation (W86R-N87T) a été introduite dans BFD et la variante a été marquée comme M1., Afin d’améliorer encore l’activité catalytique de BFD, nous avons proposé de filtrer tous les résidus autour du centre actif de BFD, où 25 positions à une distance de 8 Å du centre actif ont été sélectionnées pour effectuer une mutagenèse de saturation en un seul point (fig. supplémentaire. 4). Nous avons développé une approche de criblage à haut débit pour détecter le glycolaldéhyde par réaction de couleur entre le glycolaldéhyde et la diphénylamine, qui a été mesurée par moniteur spectrophotométrique à 650 nm (fig. 5)., Après le dépistage, nous avons constaté que 14 positions sur 25 présentaient des activités plus élevées que le mutant M1 (fig. 6). Par la suite, 14 positions ont été divisées en 8 groupes: A (N27/G402), B (N27/S236), C (N27/A460), D (F397/C398), E (L109/L110), F (H281/Q282), G (N374/S378) et H (T379/T380). N27 a été utilisé trois fois puisque les variantes dans cette position affichaient l’activité la plus élevée. En utilisant M1 comme modèle, nous avons introduit chaque groupe de mutations dans M1 et sélectionné le mutant actif le plus élevé, qui a été étiqueté comme M2., En effectuant trois séries de mutagenèse combinatoire itérative parmi ces positions, nous avons totalement examiné 64 512 clones et obtenu un mutant à forte activité qui contient cinq nouvelles mutations autour du centre actif. Enfin, la variante avec 7 mutations résiduelles a été nommée glycolaldéhyde synthase (GALS). Le kcat des GALS a été amélioré d’environ 160 fois et l’efficacité catalytique finale des GALS est de 9,6 M·1 * s−1, soit environ 70 fois plus que l’enzyme de départ (Fig. 3a et fig. supplémentaire. 7).
afin de comprendre comment ces mutations améliorer l’activité de l’enzyme, nous avons proposé de refaire la cristallisation de FILLES. La poche active se situe à l’interface de l’homodimère de GALS38., La structure protéique des GALS peut différer de la protéine de départ après plusieurs cycles de mutation. Ici, nous avons cristallisé la protéine de GALS et récupéré la structure cristalline de GALS en utilisant la structure de BFD comme modèle de recherche (tableau supplémentaire 3). La structure cristalline des GALS a été analysée (fig. 8, Fig. Supplémentaire. 9). Nous avons constaté que la mutation de L110E introduit deux liaisons hydrogène supplémentaires dans le groupe hydroxyle de l’analogue intermédiaire (IMA), ce qui peut contribuer à stabiliser l’état de transition et à cliver la liaison C–C entre le produit et le cofacteur ThDP (Fig. 3b)., La mutation de L109G a élargi le volume de la poche de liaison du substrat en remplaçant le grand groupe isobutyle par un groupe Hydrogène. La troisième mutation d’A460M peut réorienter le substrat et améliorer ensuite l’interaction entre ThDP et le substrat. Les deux dernières mutations H281V et Q282F ont élargi le rayon des pores de la surface extérieure et peuvent faciliter l’accès au substrat ou au produit (Fig. 3c). En comparaison avec M1, Le volume de poche de réaction chez les GALS a été élargi de plus de 30%, ce qui serait la principale raison de l’amélioration de l’activité catalytique.,
Identification de l’acétyl-phosphate synthase
dans la nature, aucune enzyme n’a été rapportée pour réaliser la synthèse de L’AcP à partir du glycolaldéhyde. Les phosphokétolases (PKs) peuvent produire des AcP à partir du fructose-6-phosphate (F6P)ou du xylulose-5-phosphate (X5P) 39. Selon le mécanisme catalytique du PKs, il est possible que le glycolaldéhyde interagisse avec le ThDP et génère ensuite du 2-α, β-dihydroxyéthylidène-ThDP (DHEThDP) (Fig. 4a), qui est l’intermédiaire clé de la formation AcP à partir de F6P ou X5P par PKs. Pour confirmer notre hypothèse, nous avons sélectionné huit candidats (Fig., 4b) basé sur l’arbre phylogénétique de PKs de 111 familles de bactéries (fig. 10). Après synthèse des gènes et purification des protéines (fig. 11), nous avons examiné l’activité catalytique de toutes les protéines candidates en utilisant le glycolaldéhyde comme substrat. Heureusement, cinq des huit PK ont montré des activités catalytiques importantes. Seuls PK1, PK4 et PK8 n’ont pas montré de différence significative par rapport au contrôle vide. Ainsi, PK2 avec l’activité la plus élevée a été appelée acétyl-phosphate synthase (ACPS), dont le kcat/Km atteint 3,21 M−1·s−1 (fig. supplémentaire. 12).,
pour révéler le mécanisme de formation du DHEThDP à partir du glycolaldéhyde, nous avons proposé d’effectuer une analyse théorique basée sur le modèle de calcul précédent de PK40. Tous les acides aminés possibles liés à la formation de DHEThDP ont été utilisés pour construire le modèle de calcul (fig. 13)., Sur la base d’une simulation informatique, nous avons constaté que la barrière énergétique n’est que de 11,36 kcal mol−1 pour la formation D’IM1 (intermédiaire 1) lorsque le glycolaldéhyde est protoné par His553, considéré comme le donneur de protons le plus possible40 (Fig. 4c). Ensuite, IM1 tautomérise en IM2 à l’aide de Glu479 et Glu437. IM2 est énergétiquement plus stable que IM1. Lorsque le proton D’IM2 a été enlevé par N4 ‘ dans ThDP, la barrière énergétique de IM2 à L’intermédiaire clé DHEThDP est de 15.,13 kcal mol-1, qui est aussi similaire que l’énergie de déformation pendant la formation de DHEThDP en utilisant F6P comme substrate40. Après la formation de DHEThDP, les processus catalytiques suivants sont les mêmes que les autres PKs (fig. supplémentaire. 14), C’est-à-dire que H97 agit comme donneur de protons du processus de déshydratation de DHEThDP, et His142 et Gly155 accélèrent le processus de déshydratation de DHEThDP, à en juger par le fait que His142 et Gly155 forment des liaisons hydrogène avec la molécule d’eau dans la structure de l’intermédiaire post-déshydratation (AcThDP)., His64, Tyr501 et Asn549 sont importants pour l’attaque nucléophile par Pi et ils forment ensemble le site de liaison de Pi39. Les expériences de mutagenèse dirigées sur le Site ont également indiqué que ces résidus sont essentiels pour l’activité enzymatique(fig. 15).
synthèse de l’acétyl-CoA à partir du formaldéhyde in vitro
avec la conception initiale réussie de GALS et D’ACP, nous avions l’intention de construire la voie SACA in vitro pour synthétiser l’acétyl-CoA à partir du formaldéhyde. Premièrement, nous avons mesuré le rendement en glycolaldéhyde par les GALS sous différentes concentrations de formaldéhyde., Les résultats ont montré que les GALS peuvent catalyser efficacement la dimérisation du formaldéhyde et que le rendement en glycolaldéhyde augmente avec l’amélioration de la concentration du substrat (Fig. 5a). Par exemple, le rendement en glycolaldéhyde à partir du formaldéhyde est passé de 45% à 0,5 g L−1 à 80% à 2 g L−1. Deuxièmement, nous avons examiné l’efficacité catalytique du glycolaldéhyde à L’AcP, qui a été quantifiée par la teneur en acide acétique puisque L’AcP serait rapidement dégradé en acide acétique (fig. supplémentaire. 16)23., Les résultats ont montré que le rendement en AcP atteignait plus de 80% sous différentes concentrations de glycolaldéhyde via les ACP (fig. supplémentaire. 17). Malheureusement, L’ACPS était manifestement inhibé par le formaldéhyde (fig. 5b). Ainsi, il est nécessaire de prendre un équilibre pour la concentration de formaldéhyde dans la résolution de ce conflit.
afin d’optimiser la concentration de formaldéhyde, une expérience de gradient a été réalisée en utilisant le système réactionnel contenant 2 mg mL−1 de GALS et D’ACP. Avec l’augmentation de la concentration de formaldéhyde, le rendement en acide acétique dans le système a d’abord augmenté puis diminué (Fig. 5c). Lorsque la concentration de formaldéhyde est de 1 g L-1, le rendement en acide acétique atteint 50,6%., Fait intéressant, le rendement final en acide acétique est encore plus élevé que celui dans le système réactionnel du glycolaldéhyde à L’AcP avec la même quantité de formaldéhyde (Fig. 5B, ligne grise). Cela serait causé par la libération partielle de la fonction des ACP puisque le formaldéhyde a été progressivement consommé par les GALS. Sur la base de ce système, nous avons ajouté une autre enzyme connue, la phosphate acétyltransférase (PTA), qui convertirait L’AcP en acétyl-CoA. Enfin, la voie SACA a produit 5,5 mm d’acétyl-CoA à la concentration de formaldéhyde de 1 g L-1. Le rendement en acétyl-CoA du formaldéhyde était d’environ 33% (fig. 5d)., Cependant, le rendement en acide acétique (7,8 mM) du formaldéhyde (33,3 mM) a atteint 50% si la PTA et le CoA n’étaient pas fournis. Le rendement en acétyl-CoA inférieur à celui de l’acide acétique serait dû à l’instabilité de l’acétyl-CoA et de L’AcP. Nos résultats ont indiqué qu’il est efficace pour la biosynthèse de l’acétyl-CoA à partir du formaldéhyde par la voie SACA in vitro.,
Validation de la voie SACA par marquage au 13C
Après avoir déterminé la voie SACA avec des enzymes purifiées in vitro, nous avons ensuite tenté de tester la biosynthèse de l’acétyl-CoA et de ses dérivés de la voie SACA in vivo par des tests de traceurs métaboliques au 13C (Fig. 6a). Tout d’abord, des lysats cellulaires ont été utilisés pour vérifier la biosynthèse de l’acétyl-CoA par addition de formaldéhyde et de CoA marqués au 13C. Nous avons détecté une augmentation significative de l’acétyl-CoA double marqué au 13C par rapport aux autres témoins (valeur P < 0,001, test T) (Fig. 6b et fig. supplémentaire. 18)., De plus, l’augmentation de l’acétyl-CoA marqué en double 13C a disparu si nous avons omis l’un des gènes de la voie SACA tels que L’ACPS et le PTA (fig. 19). De plus, l’acétyl-CoA serait convergé avec l’oxaloacétate pour entrer dans le cycle de l’acide tricarboxylique (TCA). Nous avons également détecté significativement plus de fumarate double marqué au 13C (valeur P < 0,001, t-test) et de malate (valeur P < 0,001, t-test) uniquement dans la souche avec la voie SACA et l’alimentation en formaldéhyde marqué au 13C (Fig. 6b et fig. supplémentaire. 18)., Cependant, nous n’avons pas détecté de différences significatives dans les isotopomères de masse d’ordre supérieur. Elle serait causée par la faible quantité d’isotopomères doubles marqués au 13C dans le cycle de TCA.
par la Suite, nous avons proposé de tester flux de carbone à l’intérieur des cellules. En raison de la toxicité du formaldéhyde pour les cellules, nous avons introduit la méthanol déshydrogénase de Bacillus stearothermophilus (BsMDH)41 pour maintenir une faible concentration continue de formaldéhyde in vivo (Fig. 6a). Les cellules cultivées ont été récoltées à différents moments et ont été utilisées pour détecter les acides aminés protéinogènes et les métabolites intracellulaires (Fig. 6c)., Nous avons constaté que la souche avec la voie SACA (BSMDH-SACA) contenait plus d’aspartate et de glutamate marqués au double 13C, qui dérivaient du cycle TCA. De plus, le glucose et le phosphoénolpyruvate marqués au 13C, qui pourraient générer à partir d’un oxaloacétate marqué au double 13C par la voie de la gluconéogenèse, ont été détectés davantage dans la souche BSMDH-SACA que dans la souche témoin (BsMDH-28a). Ainsi, nos résultats ont indiqué que la voie SACA est fonctionnelle pour produire des métabolites dérivés de l’acétyl-CoA et de l’acétyl-CoA à partir du formaldéhyde.,
Evaluation de la voie SACA par la croissance cellulaire
afin d’évaluer plus avant la voie SACA in vivo, nous avons proposé de tester la croissance cellulaire par étapes en alimentant chaque intermédiaire de la voie. Initialement, E. coli a grandi sous le milieu riche, puis le glycolaldéhyde a été ajouté comme source de carbone supplémentaire. En ajoutant différentes concentrations de glycolaldéhyde (fig. 20), nous avons constaté que la souche machinée qui contient la voie SACA avec plus de 0.,4 G L−1 apport de glycolaldéhyde a od600 remarquable plus élevé que les souches sans glycolaldéhyde ou la voie SACA (Fig. 7a et fig. supplémentaire. 21). La contribution du glycolaldéhyde à la biomasse (poids sec cellulaire, CDW) était de 0,681 ± 0,028 gcdwg−1 (n = 3) glycolaldéhyde.
lorsque nous avons testé la croissance cellulaire en utilisant du formaldéhyde comme source de carbone supplémentaire, la croissance de la souche à vecteur vide a été totalement inhibée par 80 mg L−1 de formaldéhyde (Fig. 7b). La souche contenant la voie SACA a été inhibée initialement et a ensuite grandi normalement dans la même condition, ce qui peut être causé par son taux de consommation de formaldéhyde plus rapide que la souche à vecteur vide (fig. supplémentaire. 22)., Malheureusement, la souche contenant la voie SACA n’avait pas plus de biomasse avec supplément de formaldéhyde que celles sans formaldéhyde. Ces résultats indiquent que bien que la voie SACA soit plus efficace pour éliminer le formaldéhyde toxique, elle ne suffit pas à fournir de la biomasse.
enfin, nous avions l’intention d’évaluer la voie SACA en alimentant le méthanol, qui serait continuellement converti en formaldéhyde. Nous avons constaté que la souche contenant à la fois le bsmdh et la voie SACA a une OD600 plus élevée que les témoins sans apport de méthanol ou la voie SACA (Fig. 7c et fig. supplémentaire., 23). Après 26 h d’incubation, nous avons constaté que la valeur de OD600 dans la souche contenant à la fois BsMDH et la voie SACA augmentait d’environ 0,2, ce qui est significativement plus élevé que la souche sans voie SACA (valeur P = 0,005, test T). En comparant avec la souche sans la voie SACA, nous avons constaté que la quantité de biomasse dérivée du méthanol était de 0,03 ± 0,006 gcdw g−1 (n = 3) méthanol dans la souche qui contient la voie SACA.