Thèse en Quoi les Phénomènes d'Expansion - Contraction dans les Familles d'Oxydo-Réductases Ont-Ils Participé au Retour à l'Eau des Plantes H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université de Toulouse École doctorale : SEVAB - Sciences Ecologiques, Vétérinaires, Agronomiques et Bioingenieries Laboratoire de recherche : LRSV - Laboratoire de Recherche en Sciences Végétales Direction de la thèse : Catherine MATHÉ ORCID 0009000480185048 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-01T23:59:59 Ce projet vise à établir le lien entre les expansions/contractions au sein des familles d'oxydoréductases, acteurs clés de la régulation des ROS et de la plasticité pariétale, et le retour d'une centaine d'Angiospermes à une vie aquatique. Après une redéfinition fine des familles en sousfamilles, nous analyserons les signatures de sélection (dN/dS) afin d'identifier les néo et subfonctionnalisations associées aux duplications. L'intégration de données de RNAseq et la recherche de motifs cis-régulateurs permettra d'identifier des signatures transcriptionnelles liées au mode de vie. Enfin, l'étude des pangenomes apportera une vision intraespèce des variations du nombre de copies et des polymorphismes affectant les régions régulatrices ou les sites soumis à sélection. Les nouvelles technologies de séquençage permettent aujourd'hui d'avoir accès à une grande quantité de séquences génomique de nombreuses espèces qui reste largement sous-exploitée. Nous avons un intérêt particulier - et une notoriété établie - pour les enzymes catalysant des réactions d'oxydo-réduction et régulant l'homéostasie des espèces actives de l'oxygène (ROS). La base de données RedoxiBase (Savelli et al., 2019), créée et maintenue par l'équipe, regroupe actuellement plus de 18000 séquences réparties dans plus de 2 500 organismes, et constituant souvent de larges familles multigéniques sujet à de nombreux événements de duplications et de pseudogènisations.
La colonisation des terres par les plantes il y a 450 MA a créé une transition majeure sur Terre, avec la diminution du CO2 atmosphérique et une augmentation du O2 atmosphérique. Cette transition a constitué la base de la majorité des écosystèmes terrestres existants. Les plantes terrestres (embryophytes) sont composées des bryophytes non vasculaires (e.g. l'hépatique Marchantia polymorpha), et des plantes vasculaires comme les angiospermes (e.g. l'ensemble des plantes cultivées). Au cours de l'évolution, plus de 100 espèces d'angiospermes sont revenues à la vie aquatique. La faible disponibilité en O2 et en CO2 dans l'environnement ont conduit à l'émergence de tissus spécialisés. Avec la réduction de la gravité et l'augmentation de la pression de l'eau, la matrice extracellulaire, incluant la cuticule, a été grandement modifiée. A l'inverse on peut supposer que certaines des innovations des premières plantes terrestres ont été perdues dans ces espèces d'angiospermes aquatiques.
Les adaptations à la vie aquatique peuvent s'être produites de manière convergente dans les multiples exemples de retour au mode de vie aquatique. Ces adaptations peuvent être associées à des gains/pertes de gènes, à des néo ou sub-fonctionnalisations, mais aussi à des modifications des profils d'expression.
Nous souhaitons aborder ce sujet du retour à la vie aquatique, de façon volontairement ciblée sur le rôle des oxydo-réductases, du fait des compétences de l'équipe sur ces familles de protéines, mais aussi parce qu'elles font partie des acteurs majeurs liés à la plasticité pariétale et à la régulation des ROS.
En effet, les RBOH interviennent dans les étapes primaires de la signalisation de l'hypoxie (liée à a submersion), modulant l'expression de gènes en aval. Et nombre d'oxydo-réductases sont susceptibles d'intervenir comme les catalases, les ascorbate peroxydases, les glutathione peroxydases, ou les superoxyde dismutases afin d'éliminer les ROS produites. Les peroxydases de classe III interviennent quant à elles dans les modifications de la composition et l'architecture de la paroi cellulaire des plantes, la rendant tantôt élastique tantôt de rigide et pouvant participer à la formation des aérenchymes. Les objectifs de ce projet de thèse seront de développer des méthodes pour comprendre les événements de gain/perte au sein des familles d'oxydo-réductases ainsi que la variation de l'expression des différentes copies dans le contexte du retour à l'eau des angiospermes aquatiques. Nous nous intéresserons sur ces familles aux phénomènes d'expansion et contraction, en cherchant à identifier précisément les membres concernés, en lien avec l'environnement aquatique ou terrestre des angiospermes.
Si un certain nombre d'études se sont déjà intéressées à cette problématique, elles sont souvent restées assez générales en regardant les processus et fonctions impactés par ses adaptations et les orthogroupes associés, sans rentrer dans le détail du contenu de ses orthogroupes. Parmi les oxydo-réductases beaucoup constituent de larges familles multigéniques, dont le nombre de membres peut être très variable d'une espèce à lautre : les peroxydases de classe III par exemple vont de 57 chez Physcomitrella à 191 chez l'Eucalyptus, avec une très forte expansion chez les plantes terrestres (Mbadinga Mbadinga et al 2020).
Les explications des expansions de gènes couramment avancées sont : la néo-fonctionnalisation, la sub-fonctionnalisation ou la nécessité d'un dosage élevé du produit du gène (Taylor and Raes 2004, Saccone et al 2025). Plusieurs études récentes ont montré que les duplications de gènes peuvent être liés aux mécanismes d'adaptation à des changement dans l'environnement (De Smet et al. 2017, Yang et al 2025), avec des néo-fonctionnalisations principalement dans le cas des duplications en tandem (Almeida-Silva and Van de Peer, 2025)
Une étude très récente s'est intéressée spécifiquement aux familles d'expansines et a montré que leur perte/contraction avait un lien avec la simplification morphologique de certains organes chez les plantes aquatiques (Zhang et al, 2026).
Une méthode similaire pourra être adoptée sur nos familles, et les mêmes espèces aquatiques (incluant différentes formes : à feuilles flottantes, submergées, flottantes et émergentes) et terrestres d'Angiospermes seront étudiées.
Aussi le projet s'articulera selon les étapes suivantes :
1- Redéfinition des familles (et définition de sous-familles) et mise en évidence d'expansion/contractions au sein de chaque (sous-)famille
L'identification de tous les membres, y compris des pseudogènes (grâce à notre logiciel P-Gre (Cabanac et al, 2026) sera d'abord faite chez toutes les espèces. Les séquences seront ensuite scindées en orthogroupes : OrthoFinder (Emms and Kelly 2019) sera probablement utilisé mais nos expériences précédentes nous ayant souvent montré des erreurs dans les orthogroupes générés sur nos familles, d'autres méthodes seront aussi mises en oeuvre. L'objectif sera de réellement de distinguer entre in-paralogues et out-paralogues. Des analyses phylogénétiques, ainsi que des comparaisons de la structure des gènes avec GECA (Fawal et al, 2012) viendront en complément.
Une fois établi le catalogue des membres de chaque famille dans toutes les espèces, devraient pouvoir être identifiés des phénomènes d'expansion ou de contractions en lien avec les différentes formes de vie des espèces. Des méthodes dédiées à l'identification des expansions comme CAFE (Mendes et al. 2021) pourront être utilisées à cette étapes sur les grandes familles. Pour plus de robustesse, ces analyses pourront être couplées a des recherches de synténie, comme dans l'étude de Zhang et al 2026
2- Analyse de la vitesse évolutives au sein des sous-familles obtenues
Si les expansions de gènes sont liées à des néo- ou sub-fonctionnalisation, on s'attend à des modifications de séquences associées à une sélection positive. Afin d'appréhender ce problème, le calcul du rapport entre taux de substitution non synonymes et synonymes (dN/dS), permettra d'obtenir des mesures de vitesse évolutive au sein des différentes sous-familles. Si dN/dS > 1, cela signifie que les substitutions non-synonymes se sont fixées plus facilement au cours de l'évolution que les substitutions synonymes. C'est la sélection positive qui permet d'expliquer cela, avec comme finalité une modification de la fonction. Les méthodes actuelles de calcul de dN/dS, permettant, en plus du rapport global, d'analyser chaque position de l'alignement des séquences, des sites précis, soumis à des sélections positives, pourraient être identifiés en lien avec l'acquisition d'une nouvelle fonction.
3- Analyse de l'expression et de la régulation des sous-familles obtenues
Au sein de chaque sous-famille, et pour étayer les hypothèses de néo- ou sub-fonctionnalisation, des données de RNA-seq disponibles dans les bases de données seront collectées et analysées, en espérant identifier des expressions différentielles pour certaines sous-familles entre espèces terrestres et aquatiques.
Une recherche de sites de régulation connus (en utilisant les banques dédiées comme PlantPAN4 (Chow et al. 2024) ou les matrices de JASPAR (Ovek Baydar et al. 2026) sera également effectuée sur les régions promotrices des sous-familles, couplée le cas échéant à des méthodes d'identification de motifs conservés entre les séquences (comme la suite MEME (Bailey et al. 2009)). Dans un contexte proche du nôtre, de nouveaux éléments Cis-regulateurs ont ainsi été mis en évidence chez le riz directement liés à la réponse à l'excès de Fer (Kakei et al. 2021).
4- Analyse intra-espèces : des pangenomes existent déjà chez certaines espèces mais leur analyse reste souvent globale. Nous nous focaliserons sur les familles d'oxydo-réductases afin d'identifier les CNV (Copy Number Variation). Le parallèle sera fait avec les données précédentes d'expansion/contraction entre espèces afin de voir si ce sont les mêmes gènes qui sont sujets à variation en nombre non seulement entre espèce mais aussi intra-espèce. De même, les signaux de régulation identifiés à l'étape précédentes seront analysés quant à leur propension à contenir des SNP, ainsi que les sites soumis à une sélection positive mis en évidence dans l'étape 2.
Le profil recherché
Le/la candidat.e aura des compétences en programmation, sera à l'aise sous environnement Linux, et avec les méthodes classiques d'analyse de séquences. Il/elle aura la capacité à comprendre les manuels d'utilisations des logiciels, ainsi qu'à élaborer des pipelines
Il/elle aura aussi des connaissances en statistiques et saura manipuler et traiter les données avec R, ainsi que trouver les meilleures façons de représenter les résultats.