Mini projets


Projet 1
: annotation structurale
Dans la publication de Hammer et al. (Molecular Biology and Evolution, avril 2005), les auteurs localisent l'orthologue de THAP9 chez le zebrafish sur la séquence BX511023 aux positions : join (199271-199302, 200078-200230, 201890-204500).
Vous vérifierez que cette information est exacte d'une part, et essayerez de retrouver ce résultat par vous-même, en vous aidant notament de la demarche décrite dans la publication.
Vous vous assurerez que la protéine trouvée contient bien le motif caractéristique de la famille THAP (vous devrez donc trouver quel est ce motif...)

Projet 2 : analyse de séquences et recherche de motifs
Les séquences disponibles sur ce lien viennent d'être séquencées par votre équipe. Elles proviennent d'une banque d'ADNc de l'oomycète Aphanomyces euteiches.
Vous assemblerez d'abord ces séquences en utilisant le logiciel d'assemblage CAP3.
Vous analyserez ces séquences pour savoir si elles ont des homologues chez d'autres organismes, si elles présentent un ou des domaines connus.
Vous essayerez d'établir un motif commun à ces séquences (avec des outils de recherche de motifs, d'alignement multiple), et rechercherez si ce motif est spécifique à Aphanomyces ? ou s'il est présent sur d'autres types d'organismes ?

Projet 3 : analyse d'une annotation existante
Sur le site du JGI, vous vous intéresserez à un morceau du scaffold 24 de Selaginella (de 286000 à 298000).
Vous essayerez de comprendre l'information qui vous est donnée dans le Browser, et analyserez par vous-même cette séquence afin de la ré-annoter.

Projet 4 : analyse d'une séquence de la banque trEMBL
On s'intéresse à la séquence de Uniprot/trEMBL Q0U8Y8.
A quel organisme appartient cette séquence ? regardez la classification taxonomique associée. Quelle est sa fonction ?
Comparez cette séquence à la banque nr protéique. Qu'en pensez-vous ?
Sur le site du NCBI, allez dans le BLAST contre les génomes assemblés de RefSeq, choisissez les génomes de champignons (fungi), et comparer la protéine à tous les génomes d'Ascomycètes (Ascomycota) de type Pezizomycotina. Qu'en concluez-vous ?
Cherchez par tous les moyens à améliorer la prédiction et proposer une autre annotation de ce gène. Vous pourrez utiliser toutes les variantes de BLAST pour trouver des protéines homologues, des ESTs, etc; GeneSeqer ou WebScipio pour faire de la prédiction par homologie, et FgenesH pour faire de la prédiction pure ou en intégrant prédiction pure et similarité).

Projet 5 : annotation fonctionnelle
Le cas de la séquence spécifique du cerveau de maïs (MZEORFG) qui s'alignait avec celle de boeuf (BOV1433P)
Analysez ce cas pour trouver d'où provient le problème. Quelles sont vos hypothèses ? Comment les tester ?
Quelles informations trouvez-vous sur cette famille ? Y a-t-il d'autres plantes avec des séquences de cerveau ?


Projet 6 : analyse d'un EST inconnu
Un laboratoire qui étudie la réponse au stress salin du riz a isolé un ADNc, dont voici la séquence :

>cDNA, 490 bases, Oryza sativa
cgaatgaacatccagaggaagccaggagactggaactgcaaatcgtgcca
gcatctcaacttcagccgccgggactactgccagcgctgccataccccac
gccaggacctgccgcttggcgatggttatgtcccaggtggtgtgctgtcc
tccctggacattcgcccgggcgactggtactgcaactgcggctatcacaa
ctttgctagccgagcaagctgcttcaaatgtggcgccattgtgaaggacc
ttccagcaggccaaggtggtggtgttgccaacggtgactttgcccgtgcc
ctcgacagcagcgcagttcgtgctgggtggaaggcgggtgactggatttg
cacaaggcctggttgcaacgtccacaactttgcaagtaggattgagtgct
ataggtgcaatgcacctaggaaataaacaaataggggttccgcgcacatt
tccccgaaaagtgccacctaaattgtaagcgttaatattt

Questions

- est-ce une séquence déjà connue ?
- est-ce un ADNc complet ? Essayer de reconstruire l'ADNc complet (programme CAP3).
- quelle est la structure du gène (exons, introns, UTRs) ? (programme SIM4)
- retrouve-t-on des motifs protéiques connus ?




Quelques liens utiles :

EBI
EMBnet
Ensembl
ExPASy
GeneStream
Génopole Toulouse
NCBI
Pasteur
Pôle Bioinformatique Lyonnais
Prodom