JP2011 Santos
JP2011 Santos
JP2011 Santos
Editores
Francisco Almeida
Vicente Blanco
Coromoto Len
Casiano Rodrguez
Francisco de Sande
79 Septiembre 2011
Actas de las XXII Jornadas de Paralelismo JP2011
Editores: Francisco Almeida, Vicente Blanco, Coromoto Len,
Casiano Rodrguez y Francisco de Sande
ISBN: 978-84-694-1791-1
Servicio de Publicaciones. Universidad de La Laguna, Tenerife, 2011
Edicin: 1a
Impresin: 1a
No de pginas: 744
Formato: 17 x 24
Materia CDU: 004 Ciencia y tecnologa de los ordenadores. Infor-
mtica
Reservados los derechos para todos los pases de lengua espaola. De conformidad con lo dispuesto en el
artculo 270 y siguientes del cdigo penal vigente, podrn ser castigados con penas de multa y privaci6n de
libertad quienes reprodujeren o plagiaren, en todo o en parte, una obra literaria, artstica o cientfica fijada
en cualquier tipo de soporte sin la preceptiva autorizacin. Ninguna parte de esta publicacin, incluido el
diseo de la cubierta, puede ser reproducida, almacenada o trasmitida de ninguna forma, ni por ningn medio,
sea ste electrnico, qumico, mecnico, e1ectroptico, i grabacin, fotocopia o cualquier otro, sin la previa
autorizacin escrita por parte de la editorial.
COPYRIGHT
2011
c UNIVERSIDAD DE LA LAGUNA.
1a Edicin, 1a Impresin
ISBN: 978-84-694-1791-1
http://jp2011.pcg.ull.es
Crditos:
Diseo de Portada: Jose A. de Luis [email protected]
Maquetacin LATEX: LOS EDITORES
con la clase LATEXconfproc (por V. Verfaille)
JP2011-vii
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
JP2011-viii
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
Redes y comunicaciones
367 Desarrollo de un Prototipo para la Noticacin Automtica de Accidentes de Trco usando Redes Vehiculares
Manuel Fogue, Piedad Garrido, Francisco J. Martinez, Carlos T. Calafate, Juan Carlos Cano, Pietro Manzoni
373 Hierarchical Analysis of Resilience Benchmarking Results Using LSP: Ad Hoc Networks As a Case Study
Jess Friginal, Juan-Carlos Ruiz, David de Andrs, Pedro Gil
379 Protocolo para entrega able de contenidos en redes inalmbricas basado en codicacin Raptor
Miguel Bguena, Carlos T. Calafate, Juan Carlos Cano, Pietro Manzoni
385 Evaluating video streaming performance in MANETs using a testbed
Tim Bohrloch, Carlos T. Calafate, Alvaro Torres, Juan Carlos Cano, Pietro Manzoni
391 Statistical Modeling of Transmission Path Loss in Underwater Acoustic Networks
J. Llor, Manuel P. Malumbres
397 Predictive and Distributed Routing Balancing for High Speed Interconnection Networks
C. Nez Castillo, D. Lugones, D. Franco, Emilio Luque
403 Evaluacin de una alternativa para aumentar el nmero de puertos de los conmutadores
Juan Antonio Villar, Francisco J. Andjar, Jos L. Snchez, Francisco J. Alfaro, Jos Duato
JP2011-ix
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
409 Combinando diferentes enfoques para el control de congestin en redes de interconexin de altas prestaciones
Jess Escudero-Sahuquillo, E. G. Gran, Pedro Javier Garca, Jos Flich, T. Skeie, O. Lysne, F. J. Quiles, Jos
Duato
415 Un acercamiento a la ecacia de las tcnicas de control de congestin en redes de interconexin con topologas
directas
Daniel Gmez-Garca, Pedro Javier Garca, Francisco Jos Quiles, Jess Escudero-Sahuquillo, Juan Antonio
Villar, Jos Flich, Jos Duato
421 Peripheral twists for torus topologies with arbitrary aspect ratio
Enrique Vallejo, Miquel Moret, Carmen Martnez, Ramn Beivide
427 Performance analysis of an IEEE 802.21 based Vertical Handover protocol using ns-2
Johann Mrquez-Barja, Carlos T. Calafate, Juan Carlos Cano, Pietro Manzoni
433 Mecanismos de Comunicacin Ecientes en Redes de Altas Prestaciones para Bibliotecas de Paso de Mensajes
en Java
Roberto R. Expsito, Guillermo L. Taboada, Juan Tourio, Ramn Doallo
439 Comunicaciones Escalables en Memoria Compartida para Paso de Mensajes en Java
Sabela Ramos, Guillermo L. Taboada, Juan Tourio, Ramn Doallo
445 Aproximacin distribuida de incendios forestales con WSN usando la envolvente convexa
M. ngeles Serna, Aurelio Bermdez, Rafael Casado, Pawel Kulakowski
451 A First Approach to King Topologies for On-Chip Networks
E. Stafford, J.L. Bosque, C. Martinez, F. Vallejo, Ramn Beivide, C. Camarero
JP2011-x
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
543 Comparacin del rendimiento entre los hipervisores XEN y KVM usando virtualizacin por hardware
Isaac Zablah, R. Valin, Antonio Garca-Loureiro, Javier Lpez Cacheiro, Fernando Gomez-Folgar
583 E-Assessment of Matlab Assignments in Moodle: Application to an Introductory Programming Course for En-
gineers
Julin Ramos, Mara A. Trenas, Sergio Romero, Eladio Gutirrez
589 Sobre la integracin del Curriculum Initiative on Parallel and Distributed Computing en los planes de estudio del
Grado en Ingeniera Informtica
Francisco Almeida, Domingo Gimnez, Jos Miguel Mantas, Antonio M. Vidal
595 Experiencias en Docencia de Diseo y Evaluacin de Conguraciones
A.M. Mora, P. Garca-Snchez, P.A. Castillo, M.G. Arenas, J.J. Merelo, J. Ortega
599 Diseo de un cluster de computadores como actividad para Arquitectura de Computadores
F. Javier Fernndez-Baldomero, Mancia Anguita
Evaluacin de prestaciones
607 Achieving interactive multiagent simulations over Jason through Java tuning
Vctor Fernndez Bauset, Francisco Grimaldo Moreno, Miguel Lozano Ibez, Juan Manuel Ordua Huertas
613 Dynamically Tuning Master/Worker Applications with MATE
A. Martnez, A. Morajko
619 Anlisis de un sistema Android como plataforma para juegos de realidad aumentada
A.L. Sarmiento, M. Amor, C.V. Regueiro, E.J. Padrn
625 Un modelo analtico mejorado para la arquitectura CUDA
M. Vias, B.B. Fraguela, M. Amor, Ramn Doallo
631 Anlisis de Escalabilidad en Aplicaciones Paralelas con Carga de Trabajo No Equilibrada
J.L. Bosque, OD. Robles, P. Tohara, L. Pastor
637 Mejorando las aplicaciones de red en arquitecturas multincleo heterogneas
A. Ortiz, J. Ortega, Antonio F. Daz, A. Prieto
643 Estimacin del efecto de los fallos cache en el rendimiento de aplicaciones paralelas
D.R. Martnez, Vicente Blanco, J.C. Cabaleiro, T.F. Pena, Francisco F. Rivera
649 Metodologa para la sintonizacin de aplicaciones OpenMP en sistemas multicore
C. Allande, J. Jorba, E. Csar, A. Morajko
655 Herramientas para la monitorizacin de los accesos a memoria de cdigos paralelos mediante contadores hard-
ware
Oscar G. Lorenzo, Juan A. Lorenzo, Dora B. Heras, Juan C. Pichel, Francisco F. Rivera
661 Evaluacin del Benchmark Rodinia en los sistemas del SAII
L. Cerrudo, A. J. Dorta, J. J. Fumero, C. Gonzlez, L. Grillo, I. Lpez, F. de Sande
JP2011-xi
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
JP2011-xii
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
Resumen El uso de simuladores de sistema comple- Simics [4] es una herramienta de simulacion de sis-
to para evaluar el desarrollo de un determinado com- tema completo, capaz de modelar diferentes tipos de
ponente en un sistema de computacion, es una practi-
ca frecuente. Esto permite obtener mejores resultados arquitecturas. Sin embargo, cuando el sistema es muy
y conclusiones en comparacion a una simulacion par- complejo las simulaciones pueden requerir horas o in-
cial donde solo se modela una parte del sistema y se cluso das en completarse.
descarta su interaccion con el resto del sistema.
Sin embargo, realizar una simulacion de sistema En este trabajo se revisa la version 4 de Simics
completo trae consigo inconvenientes como un ma- analizando sus nuevas caractersticas. Estas surgen
yor tiempo para realizar las pruebas y un mayor con- como resultado de las nuevas tendencias en el uso de
sumo de recursos. Esto puede generar una demanda
creciente proporcional a la complejidad del modelo a
maquinas multiprocesador y clusters. Una de las mas
analizar, como se da en la investigacion de sistemas importantes es la inclusion de Simics Accelerator [2],
multiprocesador al aumentar el numero de procesa- que permite reducir el tiempo de ejecucion haciendo
dores o al realizar simulaciones en paralelo. un uso mas eciente del hardware donde se realiza la
En este trabajo se describen las mejoras de ren-
dimiento en terminos de tiempo de simulacion que simulacion.
ofrece la version 4 del simulador Simics, con la incor- Para determinar como inuyen las nuevas carac-
poracion de nuevas tecnologas pensadas para mejo- tersticas de Simics 4, se realizaran diversas simu-
rar el uso de sistemas multiprocesador, como es Si-
mics Accelerator. Se realizan pruebas con el bench- laciones usando el benchmark PARSEC [3], el cual
mark PARSEC, midiendo el tiempo de simulacion y agrupa un largo y variado conjunto de aplicaciones
comparando el rendimiento con la version 3 de Simics, que han sido correctamente paralelizadas con dife-
analizando las ventajas y desventajas en optar por la
actualizacion de version. rentes tecnicas. Se trata de ofrecer argumentos para
Palabras clave Simulacion, rendimiento, Simics4. poder decidir sobre la actualizacion o no del sistema
y dependiendo del modelo a simular poder tomar una
decision.
I. Introduccion
Este artculo esta organizado de la siguiente mane-
JP2011-297
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
TABLA I
Mejoras en rendimiento y escalabilidad debido
Nuevas arquitecturas soportadas por Simics 4.
a la inclusion de Simics Accelerator 2.0. Permi-
te ejecutar simulaciones de sistemas distribuidos
y maquinas multiprocesador acelerando el desa-
rrollo de software y hardware ayudados tambien
con las herramientas de depuracion y checkpoin- Modelos Procesadores Componentes
ting. IBM Po- PPC464FP AMCC
Mejoras en los modelos a simular, permitien- werPC 464 PPC440GX
do la comprension de los programas a traves de SoC, Me-
un visualizador de rendimiento y facilitando el moria DDR,
diagnostico de errores. FLASH,
Mejoras en la interfaz de usuario logrando in- Conectivi-
tegrarse con Eclipse a traves de plugins para dad serial y
iniciar y controlar las sesiones de Simics. Esto Ethernet
hace util las herramientas y ujos de trabajo de Freescale Po- MPC8347, Memoria
Eclipse. wer QUICC MPC8360E DDR,
Conectividad a traves de telnet, un visor de me- II Pro FLASH,
moria y soporte unicode. MPC83xx Conectivi-
dad serial y
Ethernet
ARM Integra- ARM926, Memoria
tor/CP ARM1136, DDR,
ARM1176 FLASH,
Conectivi-
dad serial y
Ethernet
ARM Basic Intel Strong RAM, Conec-
ARM tividad serial
JP2011-298
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
jas adicionales que repercuten en el rendimiento del como el de una sola maquina simulada en un compu-
sistema. A continuacion se resumen las principales tador de un solo nucleo.
ventajas que mejoran la velocidad en la simulacion. La memoria compartida es uno de los medios que
usa Simics para liberar la demanda de memoria en
A. Simics Accelerator 2.0 el sistema a simular. Lo que hace es vericar que
Uno de los principales requisitos al realizar simu- los contenidos dentro de las memorias RAM, ROM,
laciones es que estas, ademas de precisas, puedan ser FLASH o del disco simulado no sean redundantes de
realizadas en el menor tiempo posible. Esto debera tal forma que no se duplique contenido y solo se tenga
cumplirse incluso simulando sistemas y cargas de tra- una copia del mismo en la memoria de la maquina
bajo grandes sacando provecho del uso de servidores en donde se realiza la simulacion.
y clusters. La simulacion distribuida que ofrece esta nueva
Simics busca este objetivo a traves de este nuevo version de Simics permite el uso de multiples hosts
modulo donde se implementan mejoras relacionadas para aumentar la escalabilidad y aprovechar mejor el
con la decision en el nivel correcto de abstraccion del uso de clusters. Esto mejora directamente el rendi-
tiempo, en la metodologa de modelado basada en miento en la ejecucion de multiples sesiones de Simics
transacciones entre los distintos dispositivos, crea- en paralelo, especicandose la cantidad de nucleos
cion de modelos de procesadores rapidos y simula- que seran usados para cada sesion de Simics, logran-
ciones multihilo [1]. Estas ultimas estan orientadas do de esta forma escalabilidad, particionando los re-
a ser aplicadas en la ejecucion de modelos mas com- cursos del host para la simulacion y evitando blo-
plejos, como se muestra en la Figura 2. Empezando queos entre las simulaciones.
con un modelo sencillo se simula una maquina en una La sincronizacion es importante cuando se realiza
computadora de un solo nucleo. El host provee cier- una simulacion distribuida. Idealmente los procesos
to porcentaje de procesamiento, lo que equivale a la podran realizarse simultaneamente en tiempo simu-
velocidad de simulacion en terminos del rendimien- lado y en tiempo real pero eso no se puede por la gran
to del sistema global y de como es percibido por el cantidad de sobrecarga que sera necesaria para la
usuario. sincronizacion dejando muy poco tiempo para el tra-
Cuando se realiza un modelo mas complejo, de 4 bajo real. Simics introduce un pequeno retardo que
maquinas simuladas en el mismo host con el mismo hace que la simulacion distribuida no este completa-
poder de procesamiento, el rendimiento esta vez tie- mente sincronizada, a costa de no producir tanta so-
ne que ser dividido por la cantidad de maquinas si- brecarga permitiendo que los distintos componentes
muladas. Esta vez el usuario percibira una reduccion puedan comunicarse solamente a intervalos especi-
de cuatro veces la velocidad de simulacion. Usan- cados, los cuales son denidos desde la conguracion
do Simics Accelerator y un host con cuatro nucleos, de la simulacion.
el mismo modelo complejo de cuatro maquinas pue- Simics permite la simulacion de maquinas inter-
de aprovechar la capacidad de procesamiento, ahora conectadas mediante una red de area local logrando-
mayor en el host, logrando que cada procesador del se conectar varias maquinas mediante ethernet-links,
host pueda realizar el procesamiento de cada maqui- con las que se modela una red Ethernet a nivel de
na simulada. Esto producira para el usuario una per- trama. Esta conexion se puede ver como un cable
cepcion de la misma velocidad que en el caso inicial, ethernet que va conectado a un dispositivo ethernet
JP2011-299
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
de la maquina virtual o como un switch/hub al que lacion de sistemas multiprocesadores de forma mas
pueden conectarse varios dispositivos. El traco que detallada.
se enva sobre dicha conexion puede ser TCP/IP o Basicamente, GEMS esta formado por dos modu-
cualquier otro protocolo que funcione en Ethernet. los: Ruby y Opal. Ruby permite simular la jerarqua
A esta conexion tambien se le puede anadir ciertos de memorias cache, controladores de memoria, ban-
servicios IP simulados mediante una clase llamada cos de memoria principal y la red que interconecta
service-node que proporciona un nodo de red simu- todos estos elementos. Opal permite la simulacion
lado a modo de servidor y que puede actuar como un con ejecucion fuera de orden, para modelar diferentes
router IP entre redes. arquitecturas, desde monoprocesadores hasta mul-
Simics permite mejoras en el modelado de siste- tiprocesadores como SMPs, CC-NUMAs y CMPs,
mas, lo cual es de suma importancia para obtener donde es posible la ejecucion de varios hilos de forma
mayores benecios de la simulacion, como se puede simultanea.
ver en la Figura 3, donde se representan un cluster de Si bien originalmente fue desarrollado para el es-
procesadores, SoCS, memorias, placa y demas partes tudio de sistemas de memoria proporcionando mo-
de un sistema interconectados para luego ser com- delos de temporizacion detallados, enfocados a la si-
binados a traves de una estructura jerarquica. Todo mulacion de arquitecturas concretas, ahora tambien
ello usando las herramientas de diseno de dispositi- permite profundizar en otros tipo de investigaciones
vos con los que cuenta Simics Accelerator. como las de redes de interconexion en el chip [8].
Para poder realizar simulaciones en paralelo se de-
El inconveniente que por ahora mantiene Simics4
be cumplir con ciertos requisitos como que los mo-
es no ser compatible con la actual version de GEMS
delos simulados no deben compartir memoria y que
2.1.1. En la pagina de GEMS se cuenta con un parche
las arquitecturas a simular permitan simulacion mul-
externo que funciona con las versiones 3.0, 3.2, 4.0,
tihilo. Dentro de los modelos ya disenados, los que
4.2, y 4.4. Sin embargo, tambien se hace mencion que
permiten simulacion multihilo son el x86-440bx y
este no ofrece soporte para el modulo Opal y se retira
MPC8641.
el soporte para la version Simics2.2, y en caso de que
se desee trabajar con estos modulos se sugiere usar
la version de Simics3 [9]. Tambien se indica que el
parche no ha sido probado por el equipo de GEMS
y no se brindara soporte para el mismo. Segun la
informacion que se tiene actualmente en los foros y
la documentacion hay bastantes problemas para la
integracion de GEMS con Simics4. Recientemente,
GEMS informo de su integracion con el simulador
M5 [10], otro simulador de sistema completo, el cual
ahora se encuentra integrado en un nuevo simulador
llamado GEM5, por lo cual aparentemente GEMS
estara mas abocado a dicha integracion, dejando un
poco de lado su continuidad con Simics.
A. Arquitectura modelada
Fig. 3. Ejemplo de componentes jerarquicos. Para la realizacion de las pruebas se uso la ar-
quitectura x86-440BX, la cual puede modelar varios
sistemas con procesadores x86 y AMD64 basados en
B. Simics 4 y GEMS el chipset 440BX. Tango es la maquina simulada,
Una de las razones para comparar las versiones de que viene ya instalada con Fedora Core 5 con soporte
Simics, es para poder determinar si es conveniente o para desarrolladores.
no realizar la actualizacion a la version 4 en los tra- En la Tabla II se pueden ver las principales carac-
bajos ya desarrollados con la version 3, teniendo en tersticas de la maquina simulada utilizada para las
cuenta, por ejemplo, la compatibilidad con otras he- pruebas. Por el tipo de arquitectura se tiene el lmi-
rramientas que extienden Simics como es el caso de te de un maximo de ocho procesadores en la placa
GEMS (General Execution-driven Multiprocessor Si- base. En las pruebas se haran mediciones de tiem-
mulator) [7]. GEMS es un programa compuesto por po de simulacion en donde se variara la cantidad de
un conjunto de modulos que hace posible la simu- procesadores.
JP2011-300
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
TABLA II
estadsticas del tiempo de simulacion de los distintos
Caractersticas de la maquina simulada.
programas usados. Tambien hay que tener en cuenta,
de igual forma que para la instrucciones magicas, que
Modelo x86-440BX algunas funciones ya no son soportadas por el nuevo
Slots para CPU 8 maximo. API, como es el caso de la funcion run(), que se usaba
Dump de disco tango1-fedora5.cra desde la version de Simics 2 y que aun era compatible
Kernel 2.6.15 para la version de Simics 3. La version 4 solo soporta
Procesador 2 GHz Pentium 4 la funcion SIM run command().
Disco duro 20GB Para la creacion de los checkpoints se ha de tener
Memoria RAM 2 GB en cuenta que no son compatibles para las versiones
anteriores, lo que quiere decir que en caso de que
creemos un checkpoint con la version de Simics 4 no
podra ser leda con la de Simics 3. Otro punto a tener
B. Aplicaciones PARSEC en cuenta es que la nueva version de Simics asigna
Para la evaluacion de rendimiento se han realiza- un codigo al momento de crear el checkpoint que se
do pruebas con el benchmark PARSEC, midiendo guarda en la variable build id en el archivo de con-
el tiempo de simulacion al ejecutar las aplicaciones guracion. Al migrar un checkpoint este codigo puede
que forman esta suite. Para poder realizar la medi- dar problemas al no identicar la misma version por
cion se hace uso de las Instrucciones Magicas (Magic lo que en caso de que sea necesario tendra que ser
Instructions), para lo cual se compilo el benchmark modicado.
PARSEC con la opcion gcc-hooks y determinar as el Las imagenes del disco trabajadas entre distintas
momento en que entra a una fase la ejecucion de la versiones pueden ser reutilizadas entre versiones, de
aplicacion. igual forma las que han sido agrupadas con las dife-
Dependiendo de la arquitectura, se podra pasar un rencias de disco con la herramienta cra de Simics.
valor a traves de las instrucciones magicas, teniendo Lo unico que se tiene que tener en cuenta es la com-
como referencia el archivo magic-instruction.h don- patibilidad con las instrucciones magicas de cada ver-
de se detalla las instrucciones para cada tipo de ar- sion.
quitectura y para el caso de la arquitectura X86
en Simics3 solo se retorna el valor 0 por lo que se D. Resultados
tendra que pasar el valor a traves de los registros del Una vez realizadas las ejecuciones de las aplicacio-
procesador de la maquina simulada [11]. nes se obtuvieron los tiempos de simulacion por cada
De todos los programas de la suite PARSEC, una. En la Figura 4 se puede ver el tiempo de simu-
aqu se mostraran resultados de las aplicaciones freq- lacion para las dos versiones de Simics a estudiar,
mine (fm), uidanimate (fa) y x264 (x2). y para las aplicaciones utilizadas. En las gracas se
puede apreciar que las simulaciones realizadas con la
C. Realizacion de pruebas nueva version de Simics se completan con un menor
Para las pruebas se crearon checkpoints base con tiempo de simulacion que con la version anterior. En
una cantidad determinada de procesadores para cada general, y como parece logico, al aumentar la canti-
prueba. Se simularon maquinas con 2, 4 y 8 proce- dad de procesadores el tiempo de simulacion tambien
sadores. Teniendo en cuenta las diferencias en como aumenta, lo que se puede apreciar mas claramente
se pasan las instrucciones magicas en las dos versio- para la version de Simics 3.
nes de Simics, para cada una de ellas se compilo el De las pruebas realizadas, se obtiene un mayor ran-
benchmark con las instrucciones magicas correspon- go de diferencia en el tiempo de simulacion para el
dientes. caso de la aplicacion freqmine. Para este caso se ob-
Una vez compilado el benchmark a traves del API tiene una reduccion del tiempo de simulacion de 61 %
de Simics y con un script en python se recogen las para 2 procesadores, 70,1 % para 4 procesadores y
JP2011-301
Actas XXII Jornadas de Paralelismo (JP2011) , La Laguna, Tenerife, 7-9 septiembre 2011
Referencias
[1] Jakob Engblom, Daniel Aarno, and Bengt Werner Full-
System Simulation from Embedded to High-Performance
Systemsl, Processor and System-on-Chip Simulation, pp.
25-44 , 2010.
[2] Jakob Engblom, Simics Accelerator, in Whitepaper Vir-
tutech, March 2009.
[3] Christian Bienia, Sanjeev Kumar, Jaswinder Pal
Singh,and Kai Li, The PARSEC Benchmark Suite:
Characterization and architectural implications, in Pro-
ceedings of the 17th International Conference on Parallel
Architectures and Compilation Techniques, October 2008
[4] Simics Models, http://www.virtutech.com/products /si-
micsmodels
[5] Jakob Engblom, Transaction-Level Modeling in Simic, in
Whitepaper Virtutech, August 2009.
[6] Magnusson, P., Christensson, M., Eskilson, J., Forsgren,
Fig. 5. Tiempos totales de simulacion. D., Hallberg, G., Hogberg, J.,Larsson, F., Moestedt, A.,
Werner, B. Simics: A full system simulation platform,
Computer, Innovative Technology for Computer Profes-
sionals, pp. 50-58, Febrary 2002.
IV. Conclusiones [7] Milo M. K. Martin, Daniel J. Sorin, Bradford M. Beck-
mann, Michael R. Marty, Min Xu, Alaa R. Alameldeen,
Las mejoras en cuanto a aceleracion de procesos y Kevin E. Moore, Mark D. Hill, and David A. Wood, Multi-
tiempo de simulacion para la nueva version de Simics facets general execution-driven multiprocessor simulator
eliminan cuellos de botella y mejoran el rendimiento (GEMS) toolset,, SIGARCH Comput. Archit.News, vol.
33, no. 4, pp. 92-99, 2005.
en modelos complejos, realizando varias simulaciones [8] Francisco Trivino, Francisco J. Andujar, Alberto Ros,
en paralelo y aprovechando el poder de procesamien- Jose L. Sanchez, Francisco J. Alfaro Sistema Integrado
de Simulacion de NoCs, XX Jornadas de Paralelismo La
to de un host multinucleo o incluso un cluster. Coruna(Spain). Septiembre 2009.
Las mejoras en cuanto a sincronizacion de tiempos [9] Multifacet GEMS: External patches for Simics,
en la simulacion y la administracion de informacion http://www.cs.wisc.edu/gems/common/release notes/
gems2.1.1 patch1 releasenotes.txt
redundante al momento de ejecutar el benchmark lle- [10] The GEM5 Simulator System, http://gem5.org/
gan a reducir en promedio un 60 % de tiempo de [11] Virtutech: Simics User Guide for
simulacion para las pruebas realizadas con las apli- Unix, pp 143-145, Febrary 2008.
https://www.simics.net/pub/simics/3.0 fyr609/simics-
caciones freqmine, uidanimate y x264 del PARSEC. user-guide-unix.pdf
Y para el caso de una simulacion con una maquina
con 8 procesadores se llega a obtener hasta un 10 %
de reduccion en tiempo de simulacion por cada pro-
cesador.
En general, las mejoras obtenidas por la nueva ver-
sion de Simics4 son muy positivas permitiendo rea-
lizar simulaciones con una mayor cantidad de pro-
cesadores sin tener una gran demanda en tiempo
de simulacion, permitiendo as analizar modelos mas
complejos.
El punto debil por el momento de la nueva version
de Simics es la no compatibilidad con otros progra-
mas que lo extienden, como es el caso de GEMS, el
JP2011-302
ndice de Autores