Bioinformatica 2

Curso Bioinformática I: Conceptos y herramientas web
Guía de actividad práctica 2 y Pauta de Informe
Estimadas/os estudiantes
La actividad práctica 2 tiene como objetivo reforzar lo aprendido sobre alineamiento de
secuencias y entregarles herramientas que les permitan comparar secuencias. Para lograr
los objetivos de este práctico vamos a utilizar distintas secuencias las cuales analizaremos
en herramientas online. Los resultados deben quedar registrados en un informe que
prepararán en sus casas para ser entregado en formato PDF el miércoles 21 de junio.
La siguiente guía representa un esquema de actividades que deben ser resueltos a modo
de informe. Las respuestas deben ser breves y apoyadas de imágenes (capturas de
pantalla) según corresponda.
Sección 1: Identificación del estudiante.

Escribir su nombre, carrera y su email institucional
● Nombre:Vicente Rivera Silva;Thiaris Martinez Quezada
● Carrera:Bioquímica Licenciatura en Bioquímica, Ingeniería en Biotecnología
● Email institucional: [email protected]; [email protected]
● Universidad:Universidad Santiago de Chile
Sección 2: Introducción (máx. 200 palabras).

En esta sección deben desarrollar una breve explicación de la actividad utilizando los
conceptos entregados en la clase y/o complementando con información que obtenga desde
la bibliografía recomendada.
Un alineamiento es una comparación de la posición de monómeros entre una
cadena de polinucleótidos(desoxirribonucleótidos) o de polipéptidos con otra igual,
determinando una similitud que de una interpretación de la función y homología de
una secuencia desconocida con varias de una base de datos, para determinar una
similitud óptima se utilizan varias herramientas donde la más famosa es
"Herramienta básica de búsqueda de alineación local" ( BLAST ) el cuál utiliza un
alineamiento local que consiste en encontrar tramos de alta similitud(como motivos
de proteínas) para obtener resultados rápidos.Y fast-all(FASTA) es similar a BLAST
pero que extiende la búsqueda de similitud a la alineación global determinando la
similitud entre secuencias menos similares.
Sección 3: Identificación de proteína desconocida.
Existen dos estrategias de alineamiento de secuencias: alineamiento local y alineamiento
global. Dependiendo del objetivo que uno tenga, usar una y otra estrategia puede marcar
una gran diferencia. BLAST es una herramienta de alineamiento local que podrá encontrar
en el sitio de NCBI. FASTA es una herramienta de alineamiento local-global (no confundir
con el ‘formato FASTA’... acá estamos hablando de la herramienta de alineamiento de
proteínas). En la siguiente actividad Ud. comparará los resultados de ambas aplicaciones al
alinear la siguiente secuencia contra la base de datos de UniProtKB/Swiss-Prot (The
manually annotated section of UniProtKB). Esta es una comparación de una proteína contra
una base de datos de proteínas.
>Secuencia P2
DCEELLTGMMCRVLGGTTGKTSSPERLASSNDSSRKGELIGCGAFGRVYMGMNLGSGELL
AVKQVLIAANGASKEKAQAQVQELEEEVKLLKDLSHPNIVRYLGTVREDDSLNILLEFVPGGS
IASLLGKFGAFPEAVLRTYTKQLLLGLEYLHKNGIMHRDIKGANILVDNKGCIKLADFGASKQV
VELATISGAKSMKGTPYWMAPEVILQTGHSFSADIWSVGCTFIEMATGKPPWSQQYQEVAA
LFHIGTTKSHPPIPEQLSVEAKDFLLKCLQKEPNLRPTASELLKIFHHQEPLKIYSPQCTSELE
MSKTPTHPGSSDICNLDSLSCSKVYSTNKLESDMWGRNSDDEMCQIDDKDDFMLDEVKIG
SSIIHENMKSYNPICEPSDDEDCQFDRSPVVDQGSSLHEEALAPGSCSGAFDEEQNFSFPS
GRSLSEDEDELTESKIKAFLDEKALELKKLQSPLYEEFYNSLNASCSPVFIESKQDESTPKYL
KLPPKSRSPSRSPGNPSPAHDAFGTGSPGSGSRGNANDQRSQLNDWKDCEELLTGMMC
RVLGGTTGKTSSPERLASSNDSSGLHGQSEAGSPSSKNYSEIQRKWKEELDQELERKREM
RQAGVGGKTSSPKDKAMGRPRERTRFASPFRKYKLYYGNLHDCEELLTGMMCRVLGGTT
GKTSSPERLASSNDS
Actividad 3.1:
Reporte los 10 primeros hits usando FASTA (http://www.ebi.ac.uk/fasta3/) y BLAST (Protein
BLAST) (http://www.ncbi.nlm.nih.gov/BLAST). En ambos casos debe hacerlo contra la base
de datos UniProtKB/Swiss-Prot así que revise los parámetros para seleccionar la base de
datos correcta. Debe entregar un listado de los 10 primeros resultados obtenidos desde
BLAST y los obtenidos desde FASTA (si viene con e-value y score es suficiente).
El e-value (Expect) es el número de alineamientos que esperamos para una
puntuación (score) X (o superior) en la búsqueda que estamos realizando si la base
de datos fuese una colección de letras al azar.
BLAST
HITS Secuencia ID e-value score
1 Q40541.1 0 678
2 O22040.2 0 627
3 Q9FZ36.1 0 619
4 O22042.1 0 562
5 Q54R82.2 2x 10
−85 291
6 F4HRJ4.1 8 x 10
−82 274
7 Q9CAD5.1 3 x 10
−77 268
8 P28829.1 5 x 10
−75 257
9 G4N7X0.1 1 x 10
−73 258
10 Q56UN5.1 1 x 10
−71 256
FASTA
HITS Secuencia ID e-value score
1 Q56UN5.1 2,6 x 10
−70 269,1
2 SP:Q9FZ36 8,3 x 10
−67 257,4
3 SP:Q40541 2,1 x 10
−65 252,9
4 SP:O22042 3,8 x 10
−56 222
5 SP:Q54R82 1,4 x 10
−33 147,6
6 SP:F4HRJ4 −31 139,1

3,1 x 10
7 SP:Q9CAD5 5,9 x 10
−31 138,7
8 SP:P28829 4,6 x 10
−29 132
9 SP:G4N7X0 7 x 10
−29 131,9
10 SP:Q56UN5 3 x 10
−28 130,4
Actividad 3.2:
¿Qué diferencias observa a nivel del alineamiento global y local?
Ayuda: Revisen la sección de los alineamientos (Tool Output en FASTA y Alignments en
BLAST). Vean primero uno de los mejores alineamientos (parte superior) y luego uno de los
peores alineamientos (final del listado, más allá de los mejores 10). Al comparar deben
notar en el alineamiento la diferencia en apertura de GAPs y, en general, la asignación de la
zona de homología.
Se observa que en el local hay un alineamiento centrado más en tramos entre las
secuencias para alcanzar un puntaje, mientras que en el global se centre en toda la
secuencia lo más posible, haciendo que cada uno utilice gaps para cumplir con cada
objetivo pero éste último al alinear segmentos muy grandes se generan imprecisiones en
forma de alineamiento correcto entre 2 aminoácidos distintos, cosa que no pasa en el local.
Tabla 3.2.1: Comparación de Gaps presentes en el alineamiento por FASTA.
ID de secuencia de proteína Alineamiento Número de GAPs en FASTA
O22040 Mejor alineamiento 16 en 643 aa
Q9Y6R4 Peor alineamiento 7 en 262 aa
Tabla 3.2.1: Comparación de Gaps presentes en el alineamiento por BLAST.
ID de secuencia de Proteína Alineamiento Número de GAPS en

BLAST
ABR67413.1 Mejor alineamiento 55/638
XP_050940677.1 Peor alineamiento 78/630
Lo que se observa es ¿Dónde hay más zonas con GAPs?

Según lo que se evidencia del algoritmo BLAST en el peor alineamiento deben haber
más GAPs por que el alineamiento más largo es de 70 aa, en cambio en el mejor es
de 265 aa. En FASTA el mejor alineamiento tiene más GAPs pero en proporción con
el largo total del alineamiento son mayores los GAPs en el peor alineamiento, sin
embargo FASTA no considera el largo del GAP y esto se evidencia por que los
GAPs en el mejor alineamiento son más largos que los de el peor alineamiento.
Prueben también la representación visual (Visual Output en FASTA y Graphic Summary en

BLAST).
Graphic summary en BLAST :
Visual Output en FASTA:

Actividad 3.2:
Un alineamiento global comete más errores pero alinea más secuencias pues se fija en el
patrón ‘global’ de la secuencia omitiendo errores específicos de alineamiento. ¿Cuándo cree
Ud, que se debe usar uno u otro tipo de alineamiento?
Uno global se usa cuando las secuencias a alinear tienen una baja distancia
evolutiva y aproximadamente del mismo tamaño donde es obligatoria que haya un
alineamiento completo entre los monómeros de las secuencias lo que lo hace útil
para genes homólogos y proteínas ortólogas, mientras la local se usa cuando las
secuencias a alinear tienen una alta distancia evolutiva que se concentra en
determinar solo alinear regiones cortas entre las secuencias donde no se requiere
uno completo lo que lo hace útil en descubrir dominios y motivos conservados entre
proteínas.
Sección 4: Alineamiento global vs alineamiento local simulado.

En el siguiente ejercicio usted analizará las diferencias encontradas de una búsqueda por
Homología utilizando secuencia completa versus utilizar fragmentos más cortos de la misma
secuencia, es decir, las diferencias entre la búsqueda local y global. El caso de estudio
corresponde a la proteína plasminógeno, cuya secuencia Ud. comparará con las secuencias
de Swiss-protein usando FASTA (http://www.ebi.ac.uk/fasta3) tal como la actividad anterior.
Hago entrega de la secuencia en dos formatos distintos (GenBank y FASTA) para facilitar la
selección de subsegmentos.
1 mdhkevillf llllkpgqgd sldgyistqg aslfsltkkq laaggvsdcl akcegetdfv
61 crsfqyhske qqcvimaens ktssiirmrd vilfekrvyl secktgigng yrgtmsrtks
121 gvacqkwgat fphvpnysps thpnegleen ycrnpdndeq gpwcyttdpd krydycnipe
181 ceeecmycsg ekyegkiskt msgldcqawd sqsphahgyi pakfpsknlk mnychnpdge
241 prpwcfttdp tkrweycdip rcttppppps ptyqclkgrg enyrgtvsvt vsgktcqrws
301 eqtphrhnrt penfpcknle enycrnpdge tapwcyttds qlrweyceip scessaspdq
361 sdssvppeeq tpvvqecyqs dgqsyrgtss ttitgkkcqs waamfphrhs ktpenfpdag
421 lemnycrnpd gdkgpwcytt dpsvrweycn lkrcsetggs vvelptvsqe psgpsdsetd
481 cmygngkdyr gktavtaagt pcqgwaaqep hrhsiftpqt npradlekny crnpdgdvng
541 pwcyttnprk lydycdiplc asassfecgk pqvepkkcpg rvvggcvanp hswpwqislr
601 trftgqhfcg gtliapewvl taahclekss rpefykvilg aheeyirgld vqeisvakli
661 lepnnrdial lklsrpatit dkvipaclps pnymvadrti cyitgwgetq gtfgagrlke
721 aqlpvienkv cnrveylnnr vkstelcagq laggvdscqg dsggplvcfe kdkyilqgvt
781 swglgcarpn kpgvyvrvsr fvdwieremr nn
>EMBOSS_001
mdhkevillfllllkpgqgdsldgyistqgaslfsltkkqlaaggvsdclakcegetdfv
crsfqyhskeqqcvimaensktssiirmrdvilfekrvylsecktgigngyrgtmsrtks
gvacqkwgatfphvpnyspsthpnegleenycrnpdndeqgpwcyttdpdkrydycnipe
ceeecmycsgekyegkisktmsgldcqawdsqsphahgyipakfpsknlkmnychnpdge
prpwcfttdptkrweycdiprcttpppppsptyqclkgrgenyrgtvsvtvsgktcqrws
eqtphrhnrtpenfpcknleenycrnpdgetapwcyttdsqlrweyceipscessaspdq
sdssvppeeqtpvvqecyqsdgqsyrgtssttitgkkcqswaamfphrhsktpenfpdag
lemnycrnpdgdkgpwcyttdpsvrweycnlkrcsetggsvvelptvsqepsgpsdsetd
cmygngkdyrgktavtaagtpcqgwaaqephrhsiftpqtnpradleknycrnpdgdvng
pwcyttnprklydycdiplcasassfecgkpqvepkkcpgrvvggcvanphswpwqislr
trftgqhfcggtliapewvltaahclekssrpefykvilgaheeyirgldvqeisvakli
lepnnrdiallklsrpatitdkvipaclpspnymvadrticyitgwgetqgtfgagrlke
aqlpvienkvcnrveylnnrvkstelcagqlaggvdscqgdsggplvcfekdkyilqgvt
swglgcarpnkpgvyvrvsrfvdwieremrnn
Actividad 4.1
a) Realice la búsqueda con la secuencia completa. Guarde los resultados para que usted
pueda compararlos usando los resultados siguientes.
b) Realice la búsqueda sólo con el segmento entre las posiciones 121 y 240.
c) Realice una tercera búsqueda usando sólo el segmento 601 al 780.
Revise los resultados obtenidos en a, b y c.
4.1.1 ¿Son idénticos o no? (si o no y cuál con cuál)

No, en las 10 primeras proteínas de la base de datos:
● En la secuencia completa se encuentra una alta similitud exclusivamente
con:
❖ P08519(Apolipoproteína)
❖ O18783(Plasminógeno)
● En el segmento entre las posiciones 121 y 240 se encuentra una alta
similitud exclusivamente con:
❖ Q08048(Factor de crecimiento para hepatocito)
● En el segmento entre las posiciones 601 y 780 se encuentra una alta
similitud exclusivamente con:
❖ P80009(plasminógeno)
4.1.2 ¿Existe alguna secuencia encontrada en b o c que no fue encontrada en a? (¿cuál?)

No, todas se encontraron en las 3 pero en b se mostraba mayor similitud en Q08048
que en a, esto repitiendose con c en P80009.
4.1.3 Si la respuesta anterior es afirmativa ¿cómo puede usted explicarlo? Recuerde que
FASTA usa alineamiento global, si cambia el tamaño del query seguirá haciendo
alineamiento global pero el patrón a buscar será más específico.
Es porque antes del global usa uno local para alinear las regiones cortas entre las
secuencias y luego deben ser mantenidos en la global dando una similitud más
óptima.
Sección 5: Proteína misteriosa

Use la siguiente secuencia para realizar un BLASTP (Protein BLAST) sin cambiar los
parámetros iniciales y asegurándose de usar la base de datos NR.
>Mystery vertebrate protein
VLGHGNGGTVYKVRHKRTSAIYALKVVHGDSDPEIRRQILREISILRRTESPYVIKCHGVIDM
PGGDIGI
LMEYMNAGTLENLLKSQLTFSELCLARIAKQVLGGLDYLHSHKIIHRDLKPSNLLVNREMEVK
IADFGVS
KIMGRTLDPCNSYVGTCAYMSPERFDPDTYGGNYNGYAADIWSLGLTLMELYMGHFPFLPP
GQRPDWATL
MCAICFGEPPSLPENTSEKFNDFMKCCLQKESSKRWSAHQLLQHPFIQSIDLKSTYLHSHKII
HRDLKPSNLL
VNREMEVKIADFGVSKIMGRTLDPCNSYVGTCAYMSPERFDPDTYGGNYNGY
Actividad 5.1
Diríjase a los resultados gráficos (Graphic Summary). En la parte superior Ud. podrán
observar los resultados de los dominios conservados predichos para dicha proteína
mediante un pre análisis que realiza la herramienta BLASTP contra una base de datos de
dominios conservados. (CD = Conserved Domains). Haga clic en el gráfico de los dominios
conservados y aparecerá un listado amplio de distintas secuencias de dominios
conservados que hicieron match con la secuencia.
5.1.1 ¿Qué nombres obtuvo (CD) y qué significan?
Desde luego aparecen varios, pero si están en el mismo sector es porque son el mismo
dominio. Por ejemplo, MAPKK. Debe reconocer y describir 2 sectores, es decir, dos
dominios.
● PKc_MAPKK_plant_like: Dominio catalítico de proteína quinasa quinasa activada por
mitógeno de especificidad dual vegetal y proteínas similares que cataliza la
transferencia del grupo gamma-fosforilo del ATP a los residuos de serina/treonina
(ST) o tirosina en sustratos proteicos.
● PLN00034: Proteína provisional quinasa quinasa activada por mitógeno
● S_TKc: Dominio catalítico de proteína Serina/treonina quinasas de la subfamilia de
las fosfotransferasas
● Pquinasa: Dominio de proteína quinasa
● SPS1: Proteina Serina/treonina quinasa [Mecanismos de transducción de señales]
● STKc_LKB1_CaMKK: Dominio catalítico de las serina/treonina quinasas, hígado
quinasa B1, proteína quinasa quinasa dependiente de calmodulina y proteínas
similares
● PknB_PASTA_kin: Ser/Thr quinasa que contiene el dominio PASTA de la familia Stk1
● TOMM_kin_cyc: Proteína de fusión quinasa/ciclasa del sistema TOMM
● SPS1: Proteína Serina/treonina quinasa [Mecanismos de transducción de señales]
● PknB_PASTA_kin: Quinasa Ser/Thr que contiene el dominio PASTA de la familia
Stk1
● STYKc: Proteína quinasa; especificidad no clasificada
● PTZ00263: Subunidad provisional catalítica de proteína quinasa A
● TOMM_kin_cyc: Proteína de fusión quinasa/ciclasa del sistema TOMM
5.1.2 ¿Cuál es su proteína: query o subject? ¿Qué información se muestra para los CDs?
En la sección “List of domain hits” verán el detalle de cada dominio encontrado... Estos son
los subject.
Es una proteína query. En cada dominio descubierto, su información muestra un
dominio conservado coincidente de la base datos así como su descripción, su
intervalo (su ubicación dentro de la secuencia query), su longitud, su ID de
identificador único para la matriz de puntuación específica de la posición (PSSM), su
E-valor y bit-score respecto al dominio de la base de datos.
5.1.3 Revise el e-value y score obtenido. ¿Son significativas? No aparece el score. Vean el
e-value y, según lo visto en clases (o el detalle del alineamiento), pueden determinar cuáles
son significativos.
Los únicos significativos son:
● PKc_MAPKK_plant_like
● PLN00034
● S_TKc
● Pquinasa
● SPS1
Actividad 5.2
Abra los resultados del BLASTP, es decir, regrese al resultado del BLASTP original pues
hasta ahora estábamos en la sección de dominios conservados (CD). Entre en la sección
“Graphic Summary”.
5.2.1 ¿Cuántos aminoácidos tiene su secuencia? Sale en la cabecera del informe de

resultado.
335 aminoácidos.
5.2.2 ¿Qué significa el color en la gráfica?

NOTA: Dos secuencias en la misma línea del gráfico son diferentes a menos que estén
conectadas por una línea.
● Naranja:Los dominios que pertenecen a la superfamilia proteína serina/treonina
quinasa (SPS1).
● Celeste:Los dominios que pertenecen a la superfamilia proteína quinasa quinasa
mitógeno activado (PLN00034).
● Azul oscuro:Los dominios que pertenecen a la superfamilia Proteína de fusión
quinasa/ciclasa del sistema TOMM (TOMM_kin_cyc).
● Rosa rojizo:Los dominios que pertenecen a la superfamilia subunidad catalítica
provisional de proteína quinasa A (PTZ00263).
Actividad 5.3
Revise la tabla resumen obtenida (sección “Descriptions”).
5.3.1 ¿Cuál es su proteína misteriosa (función biológica)? ¿Son el score y evalúe
significativos? ¿Cuál es el %identidad y %similitud obtenido?
Es una quinasa quinasa la cuál es activada por mitógenos para catalizar la
fosforilación de un residuo serina/treonina de proteínas estimuladoras de la división
celular en plantas del género Solanum .
Cuya secuencia alineada tiene el score y e-valor más significativo que son 714 y 0
respectivamente, la cuál corresponde a “mitogen-activated protein kinase kinase 9
[Solanum pennellii]” cuyo %identidad y %similitud es 100% en ambas.
5.3.2 ¿Cuál es la cobertura total del segundo mejor alineamiento (número total de
aminoácidos alineados)? Elijo el segundo mejor hit (proteína NP_001234595.1) por un tema
práctico: tiene mayor información que podremos analizar en las siguientes preguntas. Haga
clic en "Related Information" -> "Gene" para obtener la información de la proteína que tuvo
el segundo mejor hit contra su proteína. (Aparece a la derecha de cada sección de los
alineamientos).
El alineamiento con “MAPKK [Solanum lycopersicum]” tiene una cobertura total de
265 aminoácidos alineados.
5.3.3 ¿Qué está graficado en la sección " Genomic regions, transcripts, and products"?
En la parte superior de la gráfica se encuentra la cobertura de exones de la
secuencia de RNA y en la parte inferior se encuentra la cobertura de intrones
derivados de alineaciones de la secuencia empalmada. Está además filtrada para
eliminar alineaciones de baja abundancia y de alineaciones aparentes de intrones
retenidos cerca de las uniones de empalme.
5.3.4 ¿Qué literatura está asociada a esta proteína/gen? (Bibliography)
1. Tomate SlMKK2 y SlMKK4 contribuyen a la resistencia a enfermedades contra

Botrytis cinerea.LiX, et al . BMC Plant Biol, 15 de junio de 2014. PMID 24930014,
artículo gratuito de PMC
2. Identificación de MAPKs y sus posibles activadores de MAPK quinasas implicados
en la respuesta de defensa mediada por Pto del tomate.Pedley KF, et al . J Biol
Chem, 19 de noviembre de 2004. PMID 15371431
3. Análisis a gran escala de ADNc de longitud completa del cultivo de tomate (Solanum
lycopersicum) Micro-Tom, un sistema de referencia para la genómica de las
solanáceas.Aoki K, et al . BMC Genomics, 30 de marzo de 2010. PMID 20350329,
artículo gratuito de PMC
5.3.4 Interprete los resultados obtenidos para la proteína agregando en su respuesta los
siguientes elementos:
1. ¿Qué función/es realiza la proteína?
Es una proteína con actividad quinasa, lo que implica que cataliza la transferencia de
grupos fosforilo hacia aminoácidos hidroxilados que forman parte de una proteína,
específicamente a residuos de serina/treonina.
2. ¿Por qué ha llegado a esa conclusión?
Al observar los resultados que se entregan de los dominios de la proteína, todos
poseen actividad quinasa.
3. ¿Podría asegurar que la proteína realiza dicha/s función/es?
Lo que se evalúa para conocer la función de la proteína es el sitio activo
determinado por el alineamiento de los aminoácidos de esta, por lo tanto la
seguridad en que esta sea realmente lo que se indica es según la calidad del
alineamiento y los mecanismos de análisis de esta.
4. ¿Puede deducir el origen de la proteína (especie, género del organismo de origen)?
Se podría esperar que el origen de la proteína es de una planta del género Solanum
porque muchas de las mejores alineaciones tienen dicho género como origen.
5. ¿Tiene alguna diferencia respecto de las secuencias con las cuales fue alineada?
Las secuencias representan diferentes estructuras y dominios, algunas con dominio
de la superfamilia serina/treonina, otras quinasa quinasa, etc. Por lo que la
secuencia es diferente de por sí.
6. ¿Por qué se ven 2 tipos de colores en una misma línea del gráfico resumen?
Los colores indican las diferentes puntuaciones de alineación según la distribución
de los mejores blast hits, osea que en los alineamientos entre la consulta 240 y 300
cambia el puntaje de mayor o igual a 200 a un rango entre 80 y 200.
Actividad 5.4
Regrese al resultado del BLASTP original y entre en la sección “Taxonomy”.
Actividad 5.4.1
Considerando que Ud. ya definió el origen de la secuencia (especie o género) ¿Por qué hay
varios hits de la proteína con diferentes scores en otras especies? (Por ejemplo, prunus
armeniaca (damasco).
Por la presencia de genes ortólogos en la especie a la cual pertenece la proteína y
entre las que se compararon de p. armeniaca
Actividad 5.4.2
Veo entre 6 a 9 hits con secuencias en Damasco ¿son iguales entre ellas? ¿por qué?
En algunos casos son proteínas con igual función, pero diferente estructura; y en
otros casos difiere estructura y función comparando entre las de la misma especie.
Esto es porque son lecturas diferentes que se compararon a distintas proteínas
conocidas de una misma especie.
Actividad 5.4.3
Los hits que no pertenecen a la especie identificada ¿están biológicamente relacionadas
con su proteína? ¿Son homólogos, ortólogos, parálogos de su proteína?
Al pertenecer también a otra especie diferente a la identificada, se trataría de genes
ortólogos.
Conclusiones (máx. 200 palabras):

Desarrolle sus conclusiones de la actividad.
En el presente documento se reconocieron las funciones y utilidades de dos
algoritmos de secuenciación de genes y proteínas, estas comparan alineamientos
según la información en bases de datos disponibles, facilitando el análisis de los
resultados utilizando las herramientas que entrega cada una, por ejemplo en BLAST
se reconocieron dominios y procedencias de distintas secuencias y en FASTA se
reconocen los mismos dominios y funciones pero en comparación con otras
proteínas de otras procedencias. Es menester indicar que gracias a la utilización de
dichos algoritmos se logró pasar de una secuencia incomprensible a poder analizar
la función de cada dominio de la proteína, la taxonomía que la procede entre otras
cosas, en minutos. Dicho esto, es posible indicar que se lograron conocer las
herramientas y funcionalidades de tales algoritmos recalcando la importancia de
tales para el análisis de secuencias en la biología.

Bioinformatica 2

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Bioinformatica 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Bioinformatica 2

Cargado por

Copyright:

Formatos disponibles

Curso Bioinformática I: Conceptos y herramientas web

Guía de actividad práctica 2 y Pauta de Informe

Sección 1: Identificación del estudiante.

Sección 2: Introducción (máx. 200 palabras).

HITS Secuencia ID e-value score

HITS Secuencia ID e-value score

6 SP:F4HRJ4 −31 139,1

Tabla 3.2.1: Comparación de Gaps presentes en el alineamiento por FASTA.

ID de secuencia de proteína Alineamiento Número de GAPs en FASTA

O22040 Mejor alineamiento 16 en 643 aa

Q9Y6R4 Peor alineamiento 7 en 262 aa

Tabla 3.2.1: Comparación de Gaps presentes en el alineamiento por BLAST.

ID de secuencia de Proteína Alineamiento Número de GAPS en

ABR67413.1 Mejor alineamiento 55/638

XP_050940677.1 Peor alineamiento 78/630

Lo que se observa es ¿Dónde hay más zonas con GAPs?

Prueben también la representación visual (Visual Output en FASTA y Graphic Summary en

Visual Output en FASTA:

Sección 4: Alineamiento global vs alineamiento local simulado.

4.1.1 ¿Son idénticos o no? (si o no y cuál con cuál)

4.1.2 ¿Existe alguna secuencia encontrada en b o c que no fue encontrada en a? (¿cuál?)

Sección 5: Proteína misteriosa

5.2.1 ¿Cuántos aminoácidos tiene su secuencia? Sale en la cabecera del informe de

5.2.2 ¿Qué significa el color en la gráfica?

5.3.4 ¿Qué literatura está asociada a esta proteína/gen? (Bibliography)

1. Tomate SlMKK2 y SlMKK4 contribuyen a la resistencia a enfermedades contra

Conclusiones (máx. 200 palabras):

También podría gustarte