Aaaaaaaa
Aaaaaaaa
Aaaaaaaa
INTRODUCTION
Dans le but précis de lier la biologie à l’informatique ,nait l’idée de la bio-informatique qui est un champ
de recherche multidisciplinaire de la biotechnologie dont l’objectif est de résoudre un problème
scientifique poser par la biologie .De ce fait plusieurs techniques ont été mise en place pour étudier,
comprendre, prédire, les phénomènes et les processus biologiques tel que l’expression du gène, le gène
qui est une portion de l’ADN portant l’information génétique codant pour une protéine donnée qui va
assurer une fonction biologique donnée indispensable pour la vie des êtres vivants. Ainsi la PSME3 est
un gène qui fait l’objet de notre étude et que l’on soumettra à une étude INSILICO afin de prédire la
source du gènes protéines fonction, son origine et ses interactions ainsi que ses paramètres physico
chimique ses domaines membranaires et la séquence signale, la structure 3D y compris de faire la PCR à
partir de la séquence en nucléotides du gène en utilisant les sites de stockages, de trainement et
d’analyses des données biologiques comme :UNIPROT,NCBI,SIGNAL P-5 .0,TRANSMEMBRANE
PREDICTION,EXPASY TOOLS,COIL SERVER,STRING PREDICTION,PDB,PDRAWS.
II. OBJECTIFS
Nous avons deux type d’objectifs :
Objectif général : faire l’étude IN SILICO du gène PSME3 et de la protéine
correspondante tout en apprenant l’utilisation des outils informatique disponible sur
internet.
Objectifs spécifique :
-Caractériser la protéine
-Faire la PCR et l’électrophorèse sur gène d’agarose de la séquence FASTA du gène du PSME3
Matériel
2. METHODE
Nous sommes entrés premièrement sur le moteur de recherche GOOGLE où nous avons lancé une
recherche sur UNIPROT, une fois sur UNIPROT : nous avons inscrit le nom de notre gène PSME3 puis
lancé la recherche. Après apparition de la liste des gènes, nous avons fait le choix de notre gène en
regardant sur organisme ( homo sapiens ), la taille ( 254 ) et cliqué sur le code ( P61289 ) de notre gène
qui nous a ensuite donné les informations sur le gène : la séquence en protéine avec le nombre des
acides aminés indiqué au-dessus de la séquence, nous avons ensuite cliqué sur FASTA pour copier la
séquence en acides aminés puis enregistrer sur une page Word.
A partir du moteur de recherche Google nous avons saisi ¨signal P-5.0¨ pour obtenir la séquence signal,
une fois dans la page signal P-5.0 nous avons introduit notre séquence en protéine dans l’espace
indiqué puis soumis et copier l’image apparue.
De la même manière nous sommes revenus sur Google lancer une recherche sur TRANSMEMBRANE
PREDICTION cliquer sur TMHMM, une fois sur la page nous avons inséré notre séquence protéique dans
la zone requise puis soumit et obtenu un graphe sur les domaines membranaires, que nous avons
enregistrer dans un dossier Word. En se servant toujours du moteur de recherche Google, nous avons
lancé une recherche sur ¨ COIL SERVER¨ une fois dans coil server, nous avons inséré notre séquence en
protéine copier au départ sur UNIPROT, soumit et copié le graphe apparu en format image puis
enregistrer.
Nous sommes revenus sur Google pour lancer une recherche sur STRING PREDICTION, une fois sur la
page STING, nous avons inséré le nom de la protéine suivi du nom de l’organisme (HOMO SAPIENS) dans
la zone requise pour voir les interactions de notre protéine et des autres protéines.
Par le biais de la séquence copier sur UNIPROT, nous avons analysé notre protéine sur EXPASY TOOLS,
sélectionné une fois dans EXPASY TOOLS la fenêtre PROTPARAM afin d’avoir les paramètres physico-
chimiques de notre protéine, et refait les recherches sur d’autre fenêtre : COILED COILS, SAGNIL P,
TMHMM, STUCTURE 3D, modification post-traductionnelle, SWISS MODEL la molécule cristallisée en
structure 3D. Nous avons enregistré tout notre travail en format Word.
Nous sommes retournés sur Google pour lancer une recherche sur NCBI pour voir les homologues de
notre protéine en cliquant sur BLAST-P.
Pour la séquence en nucléotide, nous nous sommes servi de notre séquence en acides aminés comme
biais sur le site EMBL EMBOSS BACK Trans seq saisi à partir de Google, une fois dans le site nous avons
inséré la séquence puis soumit et obtenu notre séquence en nucléotide.
- PCR
Nous avons copié la séquence en nucléotide ensuite nous avons lancé application PDRAW32, une fois
dans PDRAW32, nous avons cliqué sur FILE puis NEW et ensuite sur ENTER NEW SEQUENCE où nous
avons collé la séquence en nucléotide puis cliquer sur OK et obtenu un gène de 762 paires de bases.
Après cela nous avons cliqué sur SETTINGS et sur ENZYME SELECTION pour insérer les enzymes de
restrictions, puis sur explicitly select et nous avonssélectionné7 enzymes : BamHI, EcoRI, EcoRV, KpnI,
PstI, SalI, XholI. Ensuite nous avons cliqué sur explicitly selected enzyme only, apply puis OK. Après cela
nous sommes passés à l’édition des oligonucléotides. Nous avons cliqué UTILITIES et après sur EDIT
OLIGONUCLEOTIDE DATABASE :nous avons cliqué sur NAME où nous avons edité le 1er oligo PSME3 1
comptant 15 nucléotides, le 2eme oligo anti sens de 16 nucléotides, le 3eme oligo sens PSME3 I1 de
15nucléotides à l’intérieur de la chaine à partir du 130 eme nucléotide et le 4eme oligo anti sens PSME3
I2 de 15 nucléotide à l’intérieur dans l’autre sens à partir du 188eme nuléotide allant du dernier vers le
1er pour chaque oligo, cliqué sur ADD, SAVE DATABASE et enfin une clique sur ANALYSE + CLOSE.
Application à la PCR
- PCR normal: clique sur FILE dans PDRAW32, ensuite sur NEW qui fait apparaitre une liste puis
nous avons cliqué sur PCR fragment:
On fait la PCR normale entre l’oligo sens PSME3 1 et anti sens PSME3 2 puis on clique sur OK
- PCR nichée: on procède de la même manière en faisant la PCR nichée entre l’oligo sens PSME3
I1 et anti sens PSME3 I2
RESULTAT S ET ANALYSES
MASLLKVDQEVKLKVDSFRERITSEAEDLVANFFPKKLLELDSFLKEPILNIHDLTQIHS
DMNLPVPDPILLTNSHDGLDGPTYKKRRLDECEEAFQGTKVFVMPNGMLKSNQQLVDIIE
KVKPEIRLLIEKCNTVKMWVQLLIPRIEDGNNFGVSIQEETVAELRTVESEAASYLDQIS
RYYITRAKLVSKIAKYPHVEDYRRTVTEIDEKEYISLRLIISELRNQYVTLHDMILKNIE
KIKRPRSSNAETLY
Notre séquence compte 254 acides aminés débutée par une Méthionine
SIGNAL PEPTIDE:
Figure1:signal peptide
ANALYSE:
Ce graphe présente la probabilité d’avoir la séquence signal en fonction de la séquence
protéique dePSME3. En analysant notre graphe, nous constatons que la courbe indiquant le
système d’exportation sec/SPI en rouge ( ) et le site de clivage CS en vert ( ) a une
probabilité constante de 0%.
INTERPRETATION:
La séquence signal permet l’exportation de la protéine hors du cytoplasme où vers
milieu extérieur. Pour le cas de notre protéine il n’y a pas cette séquence, cela signifie
que notre protéine est sécrétée dans le milieu intracellulaire.
DOMAINES MEMBRANAIRES
Figure2 : domaines membranaires
ANALYSE :
INTERPRETATION :
Notre protéine ne présentant pas de séquence signal, elle ne peut donc pas être exporté au niveau de la
membrane par conséquent ne peut interagir avec la membrane.
INTERACTION PROTEINE - PROTEINE
Structure 3D
Figure : structure 3D vu de ?
La structure 3D de la PSME3 ne
présente que les domaines alpha.
COILED COILS
Analyse et Interprétation :
Nous observons l’apparition des coiled coils sous forme d’histogrammes en bâton de couleur
différente indiquant le type de fenêtre prédit (Windows 14,21,28) le long de la chaine
peptidique. Les windows les plus probables (entre 1O% et 40%) pour notre protéine sont : le
windows 14 représentant 2X 3 heptades et le windows 21 représentant 1 heptade et dont la
composition en acides aminée est donnée par les tableau ci-dessous :
Tableau N°1 : premier, second et troisieme Windows 14
PARAMETRES PHYSICO-CHIMIQUES
Tableau N°1: paramètres
Coefficients Absorbance
Cystines 19035 0,645
Cystines réduits 18910 0,641
Coefficient d’extinction caractérise la capacité de la protéine a absorbé de la lumière, il est
proportionnel à l’absorbance.
L’indice d’instabilité est l’indice qui classe la protéine comme instable. Pour notre protéine cet indice est
égal à 47,09
V- Gène
ATGGCCAGCCTGCTGAAGGTGGACCAGGAGGTGAAGCTGAAGGTGGACAGCTTCAGGGA
G
AGGATCACCAGCGAGGCCGAGGACCTGGTGGCCAACTTCTTCCCCAAGAAGCTGCTGGAG
CTGGACAGCTTCCTGAAGGAGCCCATCCTGAACATCCACGACCTGACCCAGATCCACAGC
GACATGAACCTGCCCGTGCCCGACCCCATCCTGCTGACCAACAGCCACGACGGCCTGGAC
GGCCCCACCTACAAGAAGAGGAGGCTGGACGAGTGCGAGGAGGCCTTCCAGGGCACCAAG
GTGTTCGTGATGCCCAACGGCATGCTGAAGAGCAACCAGCAGCTGGTGGACATCATCGAG
AAGGTGAAGCCCGAGATCAGGCTGCTGATCGAGAAGTGCAACACCGTGAAGATGTGGGTG
CAGCTGCTGATCCCCAGGATCGAGGACGGCAACAACTTCGGCGTGAGCATCCAGGAGGAG
ACCGTGGCCGAGCTGAGGACCGTGGAGAGCGAGGCCGCCAGCTACCTGGACCAGATCAGC
AGGTACTACATCACCAGGGCCAAGCTGGTGAGCAAGATCGCCAAGTACCCCCACGTGGAG
GACTACAGGAGGACCGTGACCGAGATCGACGAGAAGGAGTACATCAGCCTGAGGCTGATC
ATCAGCGAGCTGAGGAACCAGTACGTGACCCTGCACGACATGATCCTGAAGAACATCGAG
AAGATCAAGAGGCCCAGGAGCAGCAACGCCGAGACCCTGTAC
C’est la séquence en nucléotide du gène PSME3 ; c’est un gène eucaryote or un gène eucaryote, pour
avoir la séquence en nucléotide ne contenant que des exons nous avons soumis la séquence en acides
aminés de notre gène sur EMBL EMBOSS BACK Trans seq.
LA protéine PSME3 se trouve dans plusieurs espèces à des scores différents dont le maximum est 518,
nous avons choisi l’espèce Rattus norvegicus où notre protéine est homologue à 100% et réalisé
l’alignement multiple obtenu dans la figure ci-dessous :
DEFINITIONS
Homologie : c’est un caractère commun observé chez deux individus différents issu d’un même ancêtre.
Identité : c’est la correspondance des acides aminés sur deux ou plusieurs séquences alignées.
Similarité : c’est la similitude de forme ou de structure entre deux individus homologues d’un même
ancêtre commun.
Arbre généalogique
Figure : arbre généalogique
Sur cet arbre nous avons les
homologues de PSME3, nous avons un
groupe phylogénétique qui un
regroupe l’ancêtre commun et
l’ensemble de ses descendants au
cours du temps
Diagramme de RAMACHANDRAN
Figure: diagramme de RAMACHANDRAN
Le diagramme montre deux angles dièdres ɸ et Ψ qui varient entre -180° et 180°
VI- PCR et application
La taille du fragment de notre gène est de 762 paires de basse qui correspond bel et bien à notre
séquence en acides aminés (254 acides aminés).
Les sept enzymes(BamH, EcoRI, EcoRV, KpnI, plstI, SalI, XholI) de restrictions choisis, ne coupent pas
notre séquence en nucléotide (pas de site de clivage) tout simplement parce que ces enzymes ne
reconnaissent aucun site catalytique et ont toutes la même taille que notre séquence. Cela signifie que
ces enzymes ne sont pas spécifiques au gène PSME3.
VI -3 Electrophorèse sur gel d’agarose
Oligonucleotides TM
PSME3 1 59,1°C
PSME3 2 59°C
PSME3 I1 52,22°C
PSME3 I2 51,62°C
PCR classique ou normale
La PCR classique entre l’oligo sens PSME3 1 et l’oligo anti-sens PSME3 2 a amplifié un fragment
ayant la même taille que le fragment d’origine (762 paires de base) cela s’explique du fait que
les oligo choisis sont à l’extérieure du fragment. De ce fait la migration sur gel d’agarose reste le
même
PCR nichée
La PCR nichée se fait à l’intérieure du fragment en utilisant les amorces spécifiques d’une zone
concernée ce qui explique la réduction du nombre de paires de bases après amplification (en
passe de 762 à 446)
Electrophorèse sur gel d’agarose après la PCR nichée
Figure :
LES EPITOPES
Figure : épitopes
ANALYSE ET INTERPRETATION :
Ce graphe présente les positions possibles des Epitopes sur la séquence en acides aminé de PSME3. On
compte 14 positions sur notre séquence se traduit dans le tableau ci-dessous :
Par exemple, l’épitope 2 débute au niveau N (Asparagine) en position 63 et prend fin au niveau de P
(Proline) en position 67 qui compte 5 résidus d’acides aminés.
Ces épitopes (parties variable de l’Ag) permettent la reconnaissance de la PSME3 par le système
immunitaire.
VII- Discussion
L’étude du gène PSME3 à montrer que ce dernier code pour la sous-unité 3 du complexe activateur
protéasome qui, est une protéine de 254 acide aminée trouvé dans plusieurs espèces : Pongo abeli,
Cavia porcellus, Rattus norvegicus y compris chez l’Homo sapiens où nous avons fait l’étude de cette
protéine dont le gène se trouve au niveau du chromosome 17 et la taille du fragment d’ADN est de 762
paires de bases. Ainsi, l’étude des paramètres physico-chimiques de notre protéine montre que le point
isoélectrique (PI), qui est le pH auquel la molécule tant vers l’équilibre des charges c’est-à-dire où elle se
comporte comme un ZWITTERION, est égal à 5,69 : à ce pH notre protéine compte 41 charges négatives
et 36 charges positives, la charge globale Q=- 5, les acides aminés acides quand ils sont chargés
deviennent les bases conjuguées par conséquent, notre protéine se comporte comme une base , ce PI
comparé aux PI des protéines des autres groupes à l’instar du groupe 9 (CCDC106) PI=9,47, du groupe 2
(Gcg) PI=5,95 , on peut affirmer que chaque protéine à un point isoélectrique donné.
VIII- Conclusion
Les résultats de l’étude in silico montrent clairement que le gène Psme3 code pour la sous unité 3 du
complexe activateur protéasome qui est une protéine d’organisme homo-sapiens, qui intervient dans
l’interaction MDM2-P53/TP53 et la régulation du cycle cellulaire. La protéine de Psme3 est
intracellulaire et est de nature hydrophobe, sa structure 3D est constituée de plusieurs hélices formant
les domaines alpha ; son indice d’instabilité est 47,09 ; son temps de demi-vie est 30h, son point
isoélectrique est 5,9 et présente plusieurs épitopes. Celle-ci est localisée dans le noyau ainsi que dans le
cytoplasme. La Psme3 est donc une protéine indispensable à l’organisme. Ainsi, malgré certaines
difficultés rencontrées, ce TP de bio-informatique nous a permis des comprendre le fonctionnement et
l’utilisation des sites liés aux études biologiques