TP3. Annotation Du Génome Eucaryote: Genomic Sequence

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 3

TP3.

Annotation du génome eucaryote

Objectif : identifier les gènes dans les séquences génomiques

Nous voulons identifier des gènes dans une genomic sequence et déterminer les positions précises
de leurs exons, introns, sites d'initiation de la traduction et sites de terminaison de la traduction.
Nous utiliserons trois approches différentes pour identifier les gènes. Vous devrez comparer les
résultats des trois méthodes, essayer de comprendre les écarts entre les différentes prévisions, et
décider lequel est le plus fiable.

1- Prédiction des gènes par les méthodes ab initio

Utiliser ces liens

 FGENESH Mirror sites: FGENESH SoftBerry


 Genscan Mirror sites: Genscan (Heidelberg) , Genscan (Paris)

2- Recherche des régions transcrites (EST, ADNc) dans l'ADN génomique

 Recherche des EST correspondant à la séquence génomique MEGABLAST (NCBI)


(utilisez la base de données EST) https://blast.ncbi.nlm.nih.gov/Blast.cgi?
DATABASE=nr&PAGE=MegaBlast&FILTER=L&QUERY=CR926887
 Sélectionner toutes les EST (au moins 98% d'identité,> 70 pb) et extraire les séquences de
la sortie NCBI BLAST
 Déterminer les emplacements de tous les exons et les introns
Assembler les ESTs avec https://usegalaxy.eu/

 Chercher le tool CAP3 et cliquer sur le lien


 Cliquer sur upload data
 Cliquer sur choose local file et Télécharger votre fichier
 Cliquer sur run tool
 Récupérer les contigues

Prédiction des gènes

 Chercher le programme Augustus


 Télécharger les contigues
 Cliquer sur run tool

Donc le programme va te donner

Augustus on data 12: GTF/GFF

Augustus on data 12: Protein sequence

Augustus on data 12 : Coding sequence

Approche comparative : recherche de protéines codant des régions par


similarité

 La recherche de similarité des protéines prédites par BlastP

Prédiction des domaines conservés des protéines

Pour confirmer les fonctions prédites des protéines par BLAST P

 Chercher le programme interproscan dans la plateforme Galaxy


 Télécharger les protéines prédites
 Chercher les domaines conservés
 Télécharger les résultats et les ouvrir par exel
 Donner les GO prédits de ces proteines

Prédiction des voies métabolique dans une séquence génomique

Copier coller la séquence génomique dans le serveur KAAS http://www.genome.jp/tools/kaas/

Cliquer sur Request

Cliquer sur compute

Présenter les résultats

Prédiction des interactions entres les protéines traduites et les autres protéines

Cliquer sur https://string-db.org/cgi/input?


sessionId=bTbY3CJ3zsMt&input_page_show_search=on

Copier-coller chaque séquence protéine

Chercher l’espèce

Cliquer sur search

Interpréter les résultats

Vous aimerez peut-être aussi