TP Bioinformatique (2h)


UE de Biologie Moléculaire (EDSVB3BM et EDSVA3BM)

Quelques liens

EBI    EMBOSS nederlands    EMBOSS Génopole    ExPASy    NCBI   Pôle BIoinfo Lyonnais    Primer3

    Quelques "trucs" utiles :
- Ctrl A permet de tout sélectionner sur une page
- Ctrl C permet de copier un texte sélectionné
- Ctrl V permet de le coller.
- Ctrl F permet de chercher un mot sur une page


    Avant de commencer :

Ouvrez l' éditeur de texte Bloc-notes, vous y collerez certains résultats. 



Vous vous intéressez à une protéine humaine, potentiellement impliquée dans l'apoptose, dont voici la partie codante de la séquence d'ADNc :
>THAP1_humaine
ATGGTGCAGTCCTGCTCCGCCTACGGCTGCAAGAACCGCTACGACAAGGACAAGCCCGTTTCTTTCCACA
AGTTTCCTCTTACTCGACCCAGTCTTTGTAAAGAATGGGAGGCAGCTGTCAGAAGAAAAAACTTTAAACC
CACCAAGTATAGCAGTATTTGTTCAGAGCACTTTACTCCAGACTGCTTTAAGAGAGAGTGCAACAACAAG
TTACTGAAAGAGAATGCTGTGCCCACAATATTTCTTTGTACTGAGCCACATGACAAGAAAGAAGATCTTC
TGGAGCCACAGGAACAGCTTCCCCCACCTCCTTTACCGCCTCCTGTTTCCCAGGTTGATGCTGCTATTGG
ATTACTAATGCCGCCTCTTCAGACCCCTGTTAATCTCTCAGTTTTCTGTGACCACAACTATACTGTGGAG
GATACAATGCACCAGCGGAAAAGGATTCATCAGCTAGAACAGCAAGTTGAAAAACTCAGAAAGAAGCTCA
AGACCGCACAGCAGCGATGCAGAAGGCAAGAACGGCAGCTTGAAAAATTAAAGGAGGTTGTTCACTTCCA
GAAAGAGAAAGACGACGTATCAGAAAGAGGTTATGTGATTCTACCAAATGACTACTTTGAAATAGTTGAA
GTACCAGCATAA


I- Criblage d'une banque d'ADNc


Afin d'étudier le rôle de cette protéine vous décidez de travailler sur la souris.
Vous disposez dans votre laboratoire d'une banque d'ADNc de souris que vous allez cribler avec une sonde spécifique de votre séquence d'intérêt.

On choisit de prendre comme sonde les 27 premiers nucléotides (soulignés).
Avec le programme BLAST, vous allez comparer ce fragment aux séquences de souris disponibles sur le serveur du NCBI.
Coller le fragment de séquence en haut et choisir la Database "RefSeq RNA"
Cochez la case Exclude Models (XM/XP) excl   (supprime les séquences hypothétiques)

puis cliquer sur BLAST 

Le programme BLAST permet de comparer rapidement une séquence à tout un ensemble de séquences.
- Trouvez-vous des ARNm de souris alignés avec votre sonde ? Combien ?
- Au(x)quel(s) la sonde est-elle complètement alignée ?
- Votre sonde vous paraît-elle spécifique ?

II- Recherche de la protéine codée par un ARNm



Votre sonde vous permet donc d'hybrider un ADNc, que vous faites séquencer. Cet ADNc devrait être exactement le même que celui obtenu avec BLAST.
Cliquer donc sur le lien NM_199042.2.
En haut de la page, cliquez sur le lien FASTA (FASTA est un format de présentation des séquences).
Coller cette séquence dans l'éditeur.
Au niveau de l'entête FASTA, donnez-lui un nom parlant, par exemple >ADNc_souris (NB : jamais d'espace dans les noms !)

1- Cherchez sur cette séquence l'ORF la plus probable. Pour cela : 
Avec la suite logicielle EMBOSS, dans la rubrique Nucleic translation, utilisez sixpack en modifiant les paramètres suivants :
   
  • ORF at the begining of the sequence: No
  • ORF at the end of the sequence: No
  • ORF start with an M : yes
  • Minimum size of ORFs=30
    Regardez les traductions dans les différents cadres de lecture
    (les zones en majuscules sont des ORF potentielles (régions entre 2 codons Stop, plus grandes que 30 AA après traduction).
    Quelle ORF vous paraît être la plus probable ? Pourquoi ?
  • 2- Utilisez maintenant le programme ORF Finder au NCBI pour refaire la recherche d'ORF :
        Interprétez le graphique obtenu.
       Notez bien les positions de l'ORF.

        Récupérez la séquence protéique. Collez cette séquence dans l'éditeur. Comme précédemment, changer son nom.




    III- Comparaison de séquences


    Vous devez maintenant vérifier que cette protéine est bien l'homologue chez la souris de la protéine THAP humaine.

    1- Il vous faut donc d'abord déduire la protéine THAP humaine de sa séquence d'ADNc : choisissez la méthode que vous voulez (SixPack ou ORFfinder).
        Pourquoi la protéine correspond-elle à la totalité de la séquence nucléique ?
        Collez la protéine déduite dans l'éditeur.


    2- Retournez sur EMBOSS, dans la rubrique Alignment global, utilisez needle pour aligner les séquences protéiques de souris et humaine.
       Quelle est votre conclusion ?

    3- De la même manière, comparez les séquences d'ADNc : quelles sont vos conclusions ?


    IV- Amplification par PCR et clonage


     Vous voulez maintenant amplifier par PCR la séquence codante de l'ARNm de THAP1 murine, puis la cloner dans un vecteur.

    1- A partir de la séquence de l'ARNm NM_199042.2, faites une recherche d'amorces PCR avec le programme Primer3
        Pour amplifier la zone souhaitée, vous pourrez mettre comme paramètres :
    Targets : 283,1 915,1
    Excluded Regions : 280,650

      N'hésitez pas à regarder aussi les autres paramètres !

      Notez les positions
    des oligonucléotides.

    Pour le clonage dans un vecteur, vous devez établir la carte de restriction de la séquence et trouver des sites de restriction uniques, aux extrémités du produit PCR.

    2- Vous devez d'abord extraire le fragment amplifié par PCR : utiliser extractseq (rubrique Edit) de la suite EMBOSS.

    3- Puis faites la digestion du produit PCR avec Web Map Preferences. (Cliquez sur Detail )
        Trouvez-vous des enzymes qui permettraient de cloner toute la séquence codante ?

        Quelle(s) solution(s) pouvez-vous proposer ?












    Principaux résultats :
    Blastn avec la sonde contre les séquences de souris
    Recherche d'ORF avec sixpack sur NM_199042.2
    Recherche d'ORF avec ORF finder sur NM_199042.2
    Alignement des protéines avec needle
    Alignement des ADNc avec needle
    Résultat de Primer3
    Résultat de Web Map Preferences