Mini projets
Liens vers vos projets ici
Projet 1
: caractérisation de la famille des peroxydases de classe III
Les peroxydases de classe III sont une famille d'oxydo-réductases spécifiques aux plantes. Dans la banque InterPro elles sont retrouvées sous les numéros d'accession IPR010255 et IPR002016,
mais avec les classes I et II. Vous chercherez comment caractériser spécifiquement les classes III et les différencier des classes I et II.
Banques de domaines, Recherche dans les banques, Alignement multiple, signature, HMM, Linux
Projet 2 : THAP chez des organismes non animaux ?
Cherchez par tous les moyens à votre disposition s'il existe des protéines de la famille des THAP chez des expèces non animales.
Vous pouvez interroger toutes les banques disponibles (séquences et domaines). Une fois les protéines identifiées, il faudra vérifier qu'elles ont bien un domaine THAP, les comparer aux THAP des autres organismes, en les alignant. Vous vérifierez si ces séquences correspondent aux profils ou signatures des THAP, et essayerez éventuellement d'en définir de nouveaux.
Recherche dans les banques, BLAST, PsiBLAST, Alignement multiple, signature, HMM
Projet 3 : définition de la famille des RBOH
Vous allez chercher à caractériser la famille des "Respiratory burst oxidase homolog".
Cherchez dans les bases des données de domaines protéiques si cette famille est caractérisée.
Pour vous aider, il s'agit d'une sous-famille (chez les plantes) des NADPH oxidases : on les trouve notamment dans les entrées Ferredoxin reductase type FAD-binding domain (PS51384 dans PROSITE) ou FAD_binding_8 (PF08022 dans PFAM)
.
Vous essayerez d'établir un pattern et/ou une HMM spécifique de cette famille.
Recherche dans les banques, Alignement multiple, HMM, signatures, Linux
Projet 4 : caractérisation du domaine CBM1 des Oomycètes
Le domaine CMB1 (aussi appelé fCBD) a été initialement identifié chez les champignons. On le trouve également dans beaucoup de séquences d'Oomycètes, la première identifiée étant O42830.
Vous devrez vous constituer un échantillon de séquences d'Oomycètes ayant ce domaine, réaliser un alignement multiple du domaine, et caractériserez le domaine par un pattern, une matrice et/ou un profil. Vous comparerez votre modèle au domaine général CBM1.
Vous pourrez aussi comparer votre matrice ou votre profil aux banques protéiques pour voir si vous trouvez d'autres séquences, ainsi que sur la base de données dédiée à l'Oomycète Aphanomyces AphanoDB.
Banques de domaines, BLAST, Alignement multiple , Signature, MEME, HMM
Projet 5 : protéines spécifiques du cerveau de plantes
La protéine BAA03711 est annotée "brain specific protein [Oryza sativa]" : comment cela est-il possible ?
Vous essayerez de comprendre d'où vient cette annotation.
Vous chercherez dans les banques s'il y a d'autres cas similaires
En fonction des résultats, vous pourrez chercher à définir et caractériser des domaines "brain specific" ou non ?
BLAST, Recherche dans les banques, Banques de domaines, Signatures, HMM
Projet 6 : analyse d'un protéome
Le génome de la sphaigne a récemment été séquencé et annoté. Les prédictions sont disponibles sur le site de Phytozome.
Vous devez tester la validité des séquences de peroxydases. Utilser BIOMART pour récupérer les séquences avec un domaine peroxydase (PF00141). Pour cela, vous pouvez utiliser la base de données PeroxiBase, via le Web, mais vous pouvez aussi (plutôt) télécharger les données et travailler sous Linux (normalement vous avez déjà le fichier peroxibase.fa).
Vous travaillerez sur le serveur GENOLOGIN
BLAST, BLAT, Shell ou Python ou Awk, HMM, Linux
Projet 7 : analyse d'un protéome
Cf projet 6, sur l'Oropetium
Projet 8 : annotation
structurale
Dans la
publication
de Hammer et
al. (Molecular Biology and Evolution, avril 2005) (lien PDF), les auteurs
localisent l'orthologue de THAP9 chez le zebrafish sur la
séquence BX511023 aux
positions : join(199271-199302, 200078-200230, 201890-204500).
Vous vérifierez que cette information est exacte d'une part, et
essayerez de retrouver ce résultat par vous-même, en vous aidant
notamment de la démarche décrite dans la publication.
Vous vous assurerez que la protéine trouvée contient bien
le motif caractéristique de la famille THAP. Vous devrez donc
caractériser ce motif... Vous devrez vous rendre compte que le domaine trouvé sur THAP9 de Zebrafish n'est pas correct : essayer d'ajuster la prédiction de la protéine.
BLAST, Alignement par paire, Alignement multiple, recherche de domaines