TP Bioinformatique (2h)
UE de Biologie Moléculaire (EDSVB3BM et EDSVA3BM)
Quelques liens
EBI
EMBOSS
nederlands EMBOSS
Génopole ExPASy
NCBI Pôle
BIoinfo Lyonnais Primer3
Quelques "trucs"
utiles :
- Ctrl A permet de tout sélectionner sur une page
- Ctrl C permet de copier un texte sélectionné
- Ctrl V permet de le coller.
- Ctrl F permet de chercher un mot sur une page
Avant de commencer :
Ouvrez l' éditeur de texte Bloc-notes, vous y collerez certains résultats.
|
Vous vous intéressez à une protéine humaine,
potentiellement impliquée dans l'apoptose, dont voici la
partie codante de la séquence d'ADNc :
>THAP1_humaine
ATGGTGCAGTCCTGCTCCGCCTACGGCTGCAAGAACCGCTACGACAAGGACAAGCCCGTTTCTTTCCACA
AGTTTCCTCTTACTCGACCCAGTCTTTGTAAAGAATGGGAGGCAGCTGTCAGAAGAAAAAACTTTAAACC
CACCAAGTATAGCAGTATTTGTTCAGAGCACTTTACTCCAGACTGCTTTAAGAGAGAGTGCAACAACAAG
TTACTGAAAGAGAATGCTGTGCCCACAATATTTCTTTGTACTGAGCCACATGACAAGAAAGAAGATCTTC
TGGAGCCACAGGAACAGCTTCCCCCACCTCCTTTACCGCCTCCTGTTTCCCAGGTTGATGCTGCTATTGG
ATTACTAATGCCGCCTCTTCAGACCCCTGTTAATCTCTCAGTTTTCTGTGACCACAACTATACTGTGGAG
GATACAATGCACCAGCGGAAAAGGATTCATCAGCTAGAACAGCAAGTTGAAAAACTCAGAAAGAAGCTCA
AGACCGCACAGCAGCGATGCAGAAGGCAAGAACGGCAGCTTGAAAAATTAAAGGAGGTTGTTCACTTCCA
GAAAGAGAAAGACGACGTATCAGAAAGAGGTTATGTGATTCTACCAAATGACTACTTTGAAATAGTTGAA
GTACCAGCATAA
I-
Criblage d'une banque d'ADNc
Afin d'étudier le rôle de cette protéine vous décidez
de travailler sur la souris.
- Vous disposez dans
votre laboratoire d'une banque d'ADNc de souris que
vous allez cribler avec une sonde spécifique de votre séquence d'intérêt.
- On choisit de
prendre comme sonde les 27 premiers nucléotides
(soulignés).
- Avec le programme
BLAST, vous allez comparer ce fragment aux séquences de souris disponibles sur le serveur du NCBI.
- Coller le fragment de séquence en haut et choisir la Database "RefSeq RNA"
Cochez la case Exclude Models (XM/XP)
(supprime les séquences hypothétiques)
- puis cliquer sur
- Le programme BLAST
permet de comparer rapidement une séquence à tout un
ensemble de séquences.
- - Trouvez-vous des ARNm de
souris alignés avec votre sonde ? Combien ?
- - Au(x)quel(s) la sonde est-elle complètement
alignée ?
- - Votre sonde vous paraît-elle
spécifique ?
II-
Recherche de la protéine codée par un ARNm
Votre
sonde vous permet donc d'hybrider un ADNc, que vous faites séquencer.
Cet ADNc devrait être exactement le même que celui obtenu avec BLAST.
Cliquer donc sur le lien NM_199042.2.
En haut de la page, cliquez sur le lien FASTA (FASTA
est un format de présentation des séquences).
Coller cette séquence dans l'éditeur.
Au niveau de l'entête FASTA, donnez-lui un nom parlant, par exemple >ADNc_souris (NB : jamais d'espace dans les noms !)
1- Cherchez sur cette séquence l'ORF la plus probable. Pour cela
:
Avec la suite logicielle
EMBOSS,
dans la rubrique
Nucleic
translation, utilisez
sixpack
en modifiant les paramètres suivants :
ORF at the begining of the sequence: No
ORF at the end of the sequence: No
ORF start with an M : yes
Minimum size of ORFs=30
Regardez les traductions dans les différents cadres de lecture
(les zones en
majuscules sont des ORF potentielles (régions entre 2 codons Stop, plus grandes que 30 AA après traduction).
Quelle ORF vous paraît être la plus probable ? Pourquoi ?
2- Utilisez
maintenant le programme ORF Finder au NCBI pour
refaire la recherche
d'ORF :
Interprétez
le graphique obtenu.
Notez bien les positions de l'ORF.
Récupérez la séquence protéique. Collez cette séquence
dans l'éditeur. Comme précédemment, changer son nom.
III- Comparaison de séquences
Vous
devez maintenant vérifier que cette protéine est bien
l'homologue chez la souris de la protéine THAP humaine.
1- Il vous faut
donc d'abord déduire la protéine THAP humaine de sa séquence
d'ADNc : choisissez la méthode que vous voulez (SixPack ou ORFfinder).
Pourquoi la protéine
correspond-elle à la totalité de la séquence nucléique ?
Collez la protéine
déduite dans l'éditeur.
2- Retournez sur EMBOSS,
dans la rubrique
Alignment global, utilisez needle
pour
aligner
les séquences protéiques de souris et humaine.
-
Quelle est votre conclusion ?
3- De la même manière, comparez les séquences d'ADNc : quelles
sont vos conclusions ?
IV-
Amplification par PCR et clonage
Vous voulez maintenant amplifier par PCR la séquence
codante de l'ARNm de THAP1 murine, puis la cloner dans un
vecteur.
1- A partir de
la séquence de l'ARNm NM_199042.2, faites une recherche
d'amorces PCR avec le programme Primer3
Pour amplifier la zone souhaitée, vous pourrez mettre comme paramètres :
Targets :
283,1 915,1
Excluded Regions
: 280,650
N'hésitez pas à regarder aussi
les autres paramètres !
Notez les positions
des
oligonucléotides.
Pour le clonage dans un vecteur, vous devez établir la
carte de restriction de la séquence et trouver des sites de restriction
uniques, aux extrémités du produit PCR.
2- Vous devez d'abord extraire le fragment amplifié par PCR : utiliser extractseq (rubrique Edit) de la suite
EMBOSS.
3- Puis faites la digestion du produit PCR avec Web
Map Preferences. (Cliquez sur )
Trouvez-vous des enzymes qui
permettraient de cloner toute la séquence codante ?
Quelle(s) solution(s) pouvez-vous proposer ?
Principaux résultats :
Blastn
avec la sonde contre les
séquences de souris
Recherche
d'ORF avec sixpack
sur NM_199042.2
Recherche
d'ORF avec ORF finder
sur NM_199042.2
Alignement
des protéines avec needle
Alignement
des ADNc avec needle
Résultat
de Primer3
Résultat de
Web Map Preferences