DESS Bioinformatique Toulouse
Annotation - Prédiction de gènes sur un génome eucaryote



 
 

Voici un fragment de séquence génomique (6 kb) issu du génome de la plante modèle Arabidopsis thaliana.
Proposer un protocole d'annotation. Puis, mettez-le en pratique pour faire la meilleure annotation possible de ce fragment.
Vous trouverez quelques liens utiles en dessous.



 
ATTCGTTCAAAATTCAGAAATTGCGAATCGACGGAGACTATGGAGGAGTGGAATTTCAAGCGCCGGAGAA
GATTAATAGACCGCCGCGTGATATAATAACGTATTGCCGGTTTATCTGCCAATTCGTTTGCACCGACGTG
GCTTGAGAATGACAATAGTACCCTCAGCTTTTAAATAAAATAACGAAACTACCTCCTCTTCTCTATTGGA
ACTATTCCGATTCCAGTAAAACGGCACACAACTGCAAAACCCTAATCTCAAGTTTTCTGTCGATTTTGAT
CTTTTGGTTGTAATTTTGTTTGTGAAAGTTTCGGACTTTTGGAATTTGAGGTAGAAGAGATGAACAGAGG
AAGAAGGAATCTGAAACAAGCGGCGTCGGACCAGGATTTCACGCTTGAGGAATGTCAGAGCATTGCCCAA
GTCGTCTCTCTCAGAGGTTCCAATCAAATTGAGGTAAAAGATAAACGCTTTTTTCTTAGGTTTCATACAA
TCTCGCCAATTCATAGCATTTTCTTCGGAATTTTCTTTGGATGGGTTGGCTTGTTTGTATGTATGTATGT
ACTGAATTAAAGTTTGTGTTTTAACTGCTGTAGTTGTTTTGTTGTCTCTTTGAAGATAATGGATGCAAAA
GGAGAGAACTCATTAGCTTTGTTTCCAGCCAAGTTTCGTGAGAGCATGTGGATCAGACGAGGTACTTTTT
CTTGTTAGTCTTCTCTGGTTTGTTCTTTCTTGAATGGTTAGATTTACTGCATGATTTGGTGTGGATTGGA
GGAGTTTGAGATGTGCTACACTGATTTGCAGGAAGCTTTGTAGTGATTGACCATACAGGAAAGGAAAAGG
CTCAAGAGTCTGGTAGCAAAGTTACATCTATTGTATGTAAAGTTCTATTCTTTGAGCAAGTCCGTCTTCT
TCAAAAGTCTCCGGAATGGTATAGCTTCTATCTTTTGTTCTGTATGGATGGCTTCTCATATTGAGTAATT
ATAGCTCATGTTAGTTTGGACATGGTGAATGCAGGCCAGAAATCTTCAAAGATACTAGACCGATTCCAGC
TGAGAAAAGCTCACCCATTGAACAGCATGAAGATGACGGTGAAGTTGATTCGAGTGATGATGATGATGGT
ATGCCTCCATTGCAAGCAAACACAAACAGATTGAGACCGTTTGGGGTGAAGTGTGATGCAGAAACTGATT
CAGGGTCAGATTCCGATTCATAGAAACATCCGGTACATTTCTTTTCGCAGCCTCAACTTAATTTCTCAAT
ATAGGGGATTTATAGTTGCAAGCTGTATTTTATAAACAGTATGTAACCAACACAGATCTGCTGATAAAGC
AGAGTTTTGCTTTGCACTAAATCGATAATTGATTTATATAACATGCTTCTCATTCTCTTCTTGCAATTCT
TGATAAGTCTTAATAAGGAGTCAGAAAAGTTAATATTGGTTGATTGAGATTAACACTACAAGAGTGCATC
AAAGTTAATAACAAAAATCTCAGTGATACCAACATGATCTGCATATAAATACTGGTCAACTTTTTATTTG
GATAATTTTCTGACATGGAAACTAGAAAAAACGTTAAGATTGTCTAAGAAGGAGATTTGCAGCTGCTGCA
GTTTTCTTCTGAAGCTCTGCAGCATCTCCACCTACAAGTTTATCCATTTGCCTCCCATCTTTAAGGAACA
CTACTGTTGGAGTTGCATCCACGTTCCATTCATGACTAAACTCCTGTATCAAACATATTTTAACACCCAA
ATCGCTCAGTTTCGAGATCTCTCATCTTCACAAAGAATCATTCTAAGTAACAGAAGTTGATTGGTTACTT
ACAGCGAGCTCTTCGACGTCTATAGTGACAAATATCATTGAGGTGTATGTGGATGCAAGCTCCTGGTATA
TTGGTAATATTGTTTTACTAGGTAAACACCACGAAGCCTTGAAATTCACTACAAGCTGTTCCATGTTACA
AAGAATCAGATCATGTCGAGCTATCTACAGAGGAAGAATGCAAAACAACATAGAAAGGCAAATCATAGGA
GGAAGAGCTTACAATTTTGCCATGACTATTAGCTTCTGTGATCTTCTCCTCCCACTTCTCCATTCTACTT
ACCGGATGGACCTTCCCTTTTATAAAGTAGGACCCTTTCTGGCTCCTAGCTTGAGTCTTGTTCCTTCTGT
TGCAACAGCAGATACATGAACACACCTGTTTCAGAACATGAGATTTTCTATCACCATTTTCATCTGAAAC
TGCACAATGCTTATGAACATTCAACGGGTTTAATAAAAATTTGCTAGTTAGATTCGACATGTTCTCCATG
AAACTCGTAAATTTTAAGGTAAAGGTCTTACCTTTTTACAACAAGGAATTCTTGTACAATGATTCCCCAT
TAACTTTCTATACTAGCTTGGATCATTAGCTCTCTGAATCAACAGCACAAACAAAAAACCATTTTTCTCG
ATATTAACAATTCTAAACAGATAAGGAGAAATTTACAGATAGAATTATAAGGATCTCAAATAAAGGACCT
AGCTATTTATGGTTTGATAAAAGAAGAAGATTAAGAACGGATTACTTCTAGATCTTGCCAACTTAAGATT
GTTCATGTTCTTGCATGAATAAGAGATAAATCCGTGATCAAAGATCAAAAGTTTCTGTGAAAAGAATCAA
AAACATCAACAAGAAGGATCCAGAGAACGTTCAATTTAAGCAACAAAACATTATATTTGTCTTGGGTTAC
ATCATACATGCGATGGGAAATTGGTTCGATTAACCATAACTAATTTTGTAGACCAGAAACTGGTTGAAGA
CGACATAGAAAATGACGCTGTGTCTATTTTGGGCGGGCTATGGTGGGCCTTTATTAAGCTTACACCAGTT
TATACTTTGGAAGACAAAAGTTCTAAACCAAACGGTTTTTCACAGCACAGGCTGCTCTAACAAGGAGATA
CATCTTGTATGAAGAAGAATCAGTAATCACAATAGCATCCTCTGATCAACATAGCCAGGGAAATTTATTT
CTCGAAAGTTAGCAAAAACAAAAAAAAAACTGGGTTTTGGAAAAGATTCATGGTGTTGTTCTTATATCCA
CCGAAGAAGAAAATATTTCTGGGGAAGAAAATACGAGTTATGAGCCCTCCTTCTCGAGTTTCTCGATCTC
TTCACGATGCTTTCTTTCAGCTTCTTGAAGTTCTCTTTCAGCGTCTTCTTCCTCTTCGATTCTATCAAGA
TTATCGAACTCCTTAGTTGCTGCCATTGCTTTCACAACAGGGTCTCTTAACACAGAGATTAAACCACCAC
CAATTCTGTACTCTTCTTCATCGCCAATCAGAAATAACCGTTGGTCGGGACCAGATGCCATTGGAATATC
TACCGCCAAAAGCTTCATGTCATACTGAAGAAACAGACACATGAACATAAGAAGTAGACCAAACTCACAA
TATAGGGAGCGTGATTGGTAATAGGGATTCGCTGATGGTATGAAAAAATGAAAGCACCTAAAAGACTAGA
CAGGCATACGCAATGTCATGTAATATCAGTTTCCACATGTTATATATACAAGCCTAAACGTTTAACTGAA
ACTGAAAGAACAGCTATGAAACTCCAATTCTTCTTCCAAATTCACCAGCATAGAGAGATTGATGAATGAA
AAGATTATCTCTCCGCTTAACCAAATGCCCAACCAACCTTACGAAATCTACAACCAAAAAATCTGCCGAG
ACATCCTTATAAACTCAGCCCTTCGCAAACTGCACTCTAGCCAACTCACAACAGCTCTAATCTACAACAT
TCAGTCCTAGGCTAGATACAGTAGACCTATAGCTAAGAGTTGAGCTGCTGAACTTTGTCAAAGCTAATTA
CAACTCTGAAGATTACAACATGAACAAGACAGAAGAAAGTTGAGTAAACGAGGAACTGAGGAGTTGAGAA
AGTGAAACCTGGCCTTTCTTCTTCTTAACTTCAACGCTAACAAGGCCCTTTTGCTCAGAACCCTGAACGG
GGAATAGAAGAAAGCAGCGCTTGCTCCTAATTGTTGGCTTGAATTTCTTAAATGTTATGCCACCACCTGA
CATCACATACGCTCGTAAATCTGATCCTGACAGAGGAGCACCCATAACTTCTAGAATTTCAGCTGCCGTG
TTGATCTTCCTCATGGTCATTCTATAAACTTTATCCGGATTAATTGTAAACCTTGAGCGGAGGTATAATC
CCTATTATTAGAAAAATGCAGATAGCTGTCAAGGAGTGATTCCTAAATGATACGGGAGTAGGAGACTGTA
ACAGCAACAAACCATATCATATAGCAGTTTTTGCATTCCATAAACAATATCATGCTATAAGACACTTGAA
ATATACAGTGCAAGATCTCCTGTATTTCTGTGAAGGAGATCAGTTAACAAGGAGAATGAACCTATACTCT
AGTCGTGGTAAAATCAAACCAATATCATTGTAAGCTCCACATCCATTCACTATCAACCAATAACCCTACA
GAGAAATTCCTCAGTTTCATTTTTATTCAGGACAACTTCATGGCACTGAGTTGGGCAAACATTGCGAGAT
CATCACTGAAACATTACTAAGAAATGGAGCCAACCACCAAGAATTGAAGCACAAATTCCCATCGAAAAGC
ACATAAAGAGCGAAACTTACAGAAAATGCTACAATGGCTGAGGAGAGTGCAAGAAACCCATACTTGGCCA
TGCCCTCTGAGAGGCCAACAAACGTACTAGCAATTCCAAACATAATCCGCCAAAGGAAAATACATACAAA
AACACCTGCAGCTCCAAACACAACAAGACTATTCTTTTTCCAAAATGCATCAATGTGCAACCCTATAGCC
TCACGGTATCTAGCAAAAGTAGAACTAACAGCTTTGACAGGCTTATCAACAACCTTTCTCGCAAAACTCC
CATCAACCTTTCGAAATCCAGAGCTCTTAGTGGATACCAATCTAAACGCCGATGCAAAACTCACATTCAC
ACGAGGCAAACCCAAAGCTTGCTGCAACTTAGGATTGAGCTTAGGAGACGACAGAATCTGATATAATCCC
ACGTTTTTGGAAGTGGGTTTCGAGGATAAGCTGTGGAAGCTAAACTTAGGCTGAAGCTGAGAAACACCAT
TGGAGGGAATAGCTGGAGAAGACAAAGCTGATGGGTTTGATCGGCCAATTGTGACAGGGTTGACCCGAGT
GTAATGCAGCCGAATAAACCCTTGAATTGCTTTGAAATCCGATGGTTTCACCATATTCTATAGCCTTTTA
GATCGATCACACAAAAGCTCGAACCGAAGATCCTAACTTGGAGTATCGCGCCTGATTCAAAATTACCTTC
GACTTGAGAACTGATCAAAGGAATCAATGGAAATGCGAGTTTTCAAATTGGGATCGATGAGTTAAAGAGT
CGTAATGAATCCCATTTTCGCCGAAGCTTGCTGTTCGTAGCAGCGATTGGGGATCAATGGTGATCGATCG
AATTGAAGAAATATCGGGTCGGGTCGGGTCAGGTTGATTCGTCCGGGTCGGGTTTAATTGGATACCGAAT
TATTGATCGGGTTTTACGTCTTACTTTCTTGAAGGAAGGAACAAAGCACAACACAAAGGACCCACAAGTG
TCTCAGTTCAAAACTCCATGCCCACTCACTACTTTGGTCGGTTCGCAGATGACAGGTAGGCAGGGGTAAG
ATTGTCATATGTTATAATTCTGTCTCTAAACGTTTTTTAAAATTTACTTAATTAGCAATTACTATATATG
TAATTTAATATACATTTTTTAAAAAAAATCTGATAATAAAGATTGAATTGATTAAAATAGTTTAAAAGAA
GATTTCATGTAGAGATGCATAGAATCAAAGGTAGCAGCCTAAAGTTTGTTTTCTACCAATTTAATAAAAT
TGGAACAATATAGAATATAAGCATGGTCCATGCTCAAAAATAACAAGCATAAATAGAGAAATAGACCATA
AGTATGAAACCATGCATAGACCAAATCTTAATTATATTAATATGAAAACA




 
 
Génopole Toulouse                      (EMBOSS, BLAST)
NCBI                                         (BLAST, ORF finder...)
Institut Pasteur                            (EMBOSS)
Pôle Bioinformatique Lyonnais     (SIM4, CAP3, Fasta)

Spidey - mRNA to genomic alignment
DynAlign
Wise2
GeneSeqer

GenomeScan
GeneMark.hmm
Genscan
EuGene
Prediction Servers Danemark






Annotation de ce fragment.
Résultat de Blastn contre nt Genopole
Résultat de Blastn contre Est Genopole
Résultat de Blastx contre nr Genopole