Mini projets

Liens vers vos projets ici


Projet 1 : caractérisation de la famille des peroxydases de classe III
Les peroxydases de classe III sont une famille d'oxydo-réductases spécifiques aux plantes. Dans la banque InterPro elles sont retrouvées sous les numéros d'accession IPR010255 et IPR002016, mais avec les classes I et II. Vous chercherez comment caractériser spécifiquement les classes III et les différencier des classes I et II.
Banques de domaines, Recherche dans les banques, Alignement multiple, signature, HMM, Linux



Projet 2 : THAP chez des organismes non animaux ?
Cherchez par tous les moyens à votre disposition s'il existe des protéines de la famille des THAP chez des expèces non animales.
Vous pouvez interroger toutes les banques disponibles (séquences et domaines). Une fois les protéines identifiées, il faudra vérifier qu'elles ont bien un domaine THAP, les comparer aux THAP des autres organismes, en les alignant. Vous vérifierez si ces séquences correspondent aux profils ou signatures des THAP, et essayerez éventuellement d'en définir de nouveaux.

Recherche dans les banques, BLAST, PsiBLAST, Alignement multiple, signature, HMM



Projet 3 : définition de la famille des RBOH
Vous allez chercher à caractériser la famille des "Respiratory burst oxidase homolog".
Cherchez dans les bases des données de domaines protéiques si cette famille est caractérisée.
Pour vous aider, il s'agit d'une sous-famille (chez les plantes) des NADPH oxidases : on les trouve notamment dans les entrées Ferredoxin reductase type FAD-binding domain (PS51384 dans PROSITE) ou FAD_binding_8 (PF08022 dans PFAM) .
Vous essayerez d'établir un pattern et/ou une HMM spécifique de cette famille.

Recherche dans les banques, Alignement multiple, HMM, signatures, Linux



Projet 4 : caractérisation du domaine CBM1 des Oomycètes
Le domaine CMB1 (aussi appelé fCBD) a été initialement identifié chez les champignons. On le trouve également dans beaucoup de séquences d'Oomycètes, la première identifiée étant O42830.
Vous devrez vous constituer un échantillon de séquences d'Oomycètes ayant ce domaine, réaliser un alignement multiple du domaine, et caractériserez le domaine par un pattern, une matrice et/ou un profil. Vous comparerez votre modèle au domaine général CBM1.
Vous pourrez aussi comparer votre matrice ou votre profil aux banques protéiques pour voir si vous trouvez d'autres séquences, ainsi que sur la base de données dédiée à l'Oomycète Aphanomyces AphanoDB.

Banques de domaines, BLAST, Alignement multiple , Signature, MEME, HMM



Projet 5 : protéines spécifiques du cerveau de plantes
La protéine BAA03711 est annotée "brain specific protein [Oryza sativa]" : comment cela est-il possible ?
Vous essayerez de comprendre d'où vient cette annotation.
Vous chercherez dans les banques s'il y a d'autres cas similaires
En fonction des résultats, vous pourrez chercher à définir et caractériser des domaines "brain specific" ou non ?

BLAST, Recherche dans les banques, Banques de domaines, Signatures, HMM

Projet 6 : analyse d'un protéome
Le génome de la sphaigne a récemment été séquencé et annoté. Les prédictions sont disponibles sur le site de Phytozome. Vous devez tester la validité des séquences de peroxydases. Utilser BIOMART pour récupérer les séquences avec un domaine peroxydase (PF00141). Pour cela, vous pouvez utiliser la base de données PeroxiBase, via le Web, mais vous pouvez aussi (plutôt) télécharger les données et travailler sous Linux (normalement vous avez déjà le fichier peroxibase.fa).
Vous travaillerez sur le serveur GENOLOGIN

BLAST, BLAT, Shell ou Python ou Awk, HMM, Linux


Projet 7 : analyse d'un protéome
Cf projet 6, sur l'Oropetium



Projet 8 : annotation structurale
Dans la publication de Hammer et al. (Molecular Biology and Evolution, avril 2005) (lien PDF), les auteurs localisent l'orthologue de THAP9 chez le zebrafish sur la séquence BX511023 aux positions : join(199271-199302, 200078-200230, 201890-204500).
Vous vérifierez que cette information est exacte d'une part, et essayerez de retrouver ce résultat par vous-même, en vous aidant notamment de la démarche décrite dans la publication.
Vous vous assurerez que la protéine trouvée contient bien le motif caractéristique de la famille THAP. Vous devrez donc caractériser ce motif... Vous devrez vous rendre compte que le domaine trouvé sur THAP9 de Zebrafish n'est pas correct : essayer d'ajuster la prédiction de la protéine.

BLAST, Alignement par paire, Alignement multiple, recherche de domaines



Quelques liens utiles :

EBI
EMBnet
Ensembl
ExPASy
Génopole Toulouse
MaxPlanck
MEME
NCBI
NPS@
Pasteur
PRABI
WebPRC










aide complémentaire