Manual Simulador DLX
Manual Simulador DLX
Manual Simulador DLX
NDICE
5. TRAPS...............................................................................................................................30
WinDLX (Windows De LuXe simulator) es un simulador del pipeline del procesador DLX que se estudia
en el libro Arquitectura de Computadores: Una Aproximacin Cuantitativa 1 de, Patterson y Hennessy.
En caso de no disponer de un disquete con el software y tener acceso a un ordenador con conexin a
Internet, dos direcciones en donde se puede conseguir el simulador son:
1.1. Instalacin
Todos los programas que conforman el software de simulacin vienen comprimidos en un fichero auto-
expandible denominado WINDLX_D.EXE. Para proceder a su instalacin en el disco duro del ordenador
siga los siguientes pasos:
1. Cree un directorio WINDLX en algn lugar del disco duro de su ordenador y sitese en ese directorio.
2. Escriba el siguiente comando y ejectelo: A:\WINDLX_D.EXE. Esto ocasionar que los archivos sean
desempaquetados e instalados en el directorio actual del disco duro. Los archivos que deben haber
sido creados son:
WINDLX.EXE (222.621 bytes) Simulador
WINDLX .HLP (92.389 bytes) Archivo de ayuda (idioma: ingls)
WDLXTUT.DOC (341.802 bytes) Breve tutorial (idioma: ingls, formato: Word)
FACT.S (1.279 bytes) Archivo ejemplo en ensamblador de DLX
GCM.S (1.395 bytes) Archivo ejemplo en ensamblador de DLX
INPUT.S (1.539 bytes) Archivo ejemplo en ensamblador de DLX
PRIM.S (1.308 bytes) Archivo ejemplo en ensamblador de DLX
README (2.139 bytes) Informacin sobre la instalacin (ASCII)
README.TXT (2.777 bytes) Informacin sobre la instalacin (Bloc de Notas)
3. Si no est en Windows 3.1, entre y cree un nuevo grupo de programa denominado WinDLX. Dentro
de l cree dos elementos del programa que correspondan a los ficheros WINDLX.EXE y
WINDLX.HLP. Debern aparecer dos iconos con el siguiente aspecto:
4. Haga doble clic sobre el icono del simulador para comenzar a realizar experimentos.
Una vez abierta la aplicacin podr observar que aparece una ventana principal que a su vez contiene 6
ventanas inicialmente minimizadas, mostrando cada una de ellas diferentes aspectos relacionados con
el procesador que se est simulando. El nombre de cada una de estas seis ventanas es:
Registros (Register).
Cdigo (Code)
Pipeline.
Diagrama de Ciclos de Reloj (Clock Cycle Diagram)
Estadsticas (Statistics)
Puntos de ruptura (Breakpoints)
Una caracterstica de estas ventanas es que no pueden cerrarse por lo que permanecen abiertas o
minimizadas durante todo el tiempo que se est empleando el simulador. Junto con estas ventanas,
existen otras que son creadas dinmicamente (hasta un mximo de 10) y que muestran el estado de la
memoria asociada al procesador.
La Barra de mens de WinDLX contiene 7 mens con los comandos necesarios para manejar las
distintas posibilidades del simulador. En realidad el nmero de mens es superior, ya que el quinto
comenzando por la izquierda cambia segn sea la ventana que se encuentre activa en ese instante. Por
lo tanto, tendremos los siguientes mens: File, Window, Execute, Memory, Configuration, Register,
Code, Pipeline, Clock Cycle Diagram, Statistics, Breakpoints y Help.
Todos los valores de los registros disponibles en el procesador son visualizados en esta ventana (Figura
3). Los registros existentes son:
Para modificar el contenido de los registros basta con hacer doble clic sobre uno de ellos en la ventana
de registros; tras esto aparecer una ventana de dilogo en la que se puede introducir el nuevo valor.
Los registros que pueden modificarse son los de propsito general, coma flotante y los especiales PC
y FPSR. Valores legales para los registros enteros son expresiones enteras que pueden incluir nombres
de registros (por ejemplo, R19 * 20), admitindose para los registros en coma flotante nicamente
valores constantes (es decir, R19 * 20 no sera validado, mientras que 12.9, s).
0 78 15 16 23 24 31
Byte 0 Byte 1 Byte 2 Byte 3 Formato de un registro de coma flotante en simple precisin
0 78 15 16 23 24 31
Byte 0 Byte 1 Byte 2 Byte 3
32 39 40 47 48 55 56 63 Formato de un registro de coma flotante en doble precisin
Byte 4 Byte 5 Byte 6 Byte 7
FPSR (Floating-Point Status Register). Es un registro de estado de 1 bit de longitud, utilizado para
comparaciones y excepciones de coma flotante. Todos los movimientos desde y hacia este
registro se realizan a travs de los registros de propsito general. Las comparaciones en punto
flotante asignan el bit de este registro, estando disponibles instrucciones de salto que basan su
resultado en el valor del bit (1 cierto, 0 falso).
PC (Program Counter). Siempre contiene la direccin de la prxima instruccin que va a ser
ejecutada. Los saltos y las bifurcaciones pueden cambiar el contenido del mismo.
IMAR (Instruction Memory Address Register). Este registro es inicializado con el contenido del
contador de programa en la etapa IF a causa de que est conectado con el sistema de memoria,
mientras que el PC no.
IR (Instruction Register). En la etapa IF es cargado con la prxima instruccin a ejecutarse.
A, B. Son cargados en la etapa ID y sus valores son enviados a los operandos de la unidad
aritmtico lgica en la siguiente etapa, la EX. En WinDLX, adems existen los pseudo-registros
AHI y BHI que contienen los 32 bits superiores para valores en coma flotante de doble precisin.
BTA (Branch Target Address). En la etapa ID, la direccin de salto/bifurcacin es calculada y
escrita en este registro (ver pgina 292 del texto base de la asignatura).
ALU (Aritmethic Logical Unit). El resultado de una operacin en la ALU es transferido a este
registro. En WinDLX existe un pseudo-registro llamado ALUHI que contiene los 32 bits superiores
para valores en coma flotante de doble precisin.
DMAR (Data Memory Address Register). La direccin de memoria a la que se va acceder es
transferida a este registro en la etapa EX. En la etapa MEM, el acceso a la memoria para lectura
o escritura es efectuado con el valor almacenado en este registro.
SDR (Store Data Register). El dato que se va a escribir en memoria por medio de una instruccin
es almacenado previamente en este registro. En WinDLX existe un pseudo-registro llamado
SDRHI que contiene los 32 bits superiores para valores en coma flotante de doble precisin.
LDR (Load Data Register). El dato que es ledo de memoria se almacena en este registro. En
WinDLX existe un pseudo-registro llamado LDRHI que contiene los 32 bits superiores para
valores en coma flotante de doble precisin.
Los comandos situados en el men Register permiten visualizar uno o varios subconjuntos de registros,
as como especificar si el contenido de los registros se representan en decimal o hexadecimal. Los
registros en punto flotante siempre se representan en forma decimal.
En la ventana Code son visualizadas tanto en forma hexadecimal como desemsambladas las
instrucciones de DLX que hay almacenadas en memoria junto con sus direcciones. Por otra parte, los
puntos de ruptura (breakpoints) de cada instruccin son indicados con Bxx, siendo xx el tipo de punto
de ruptura.
Cuando una instruccin est ejecutndose en una etapa determinada del pipeline, un color
caracterstico de cada etapa es utilizado como color de fondo para la instruccin. Junto con el color y a
la derecha de la representacin hexadecimal de la instruccin aparece una etiqueta indicando la etapa
en que se encuentra (ver Figura 4).
Para obtener informacin detallada de las instrucciones que estn en el pipeline se selecciona la
instruccin con el cursor del ratn o con la tecla TAB y se pulsa ENTER, o se hace doble clic
directamente sobre la instruccin. Tras esto aparecer la ventana de informacin de la instruccin como
se puede apreciar en la Figura 5 (ms adelante se describirn con mayor detalle los contenidos de esta
ventana). Para deseleccionar una instruccin pulse la tecla ESC.
En principio, para establecer y suprimir los puntos de ruptura desde la ventana Code es necesario
seleccionar la instruccin tal y como se ha descrito y recurrir a los comandos del men Code.
From Address. Al activar este comando aparece una ventana de dilogo similar a la que se puede
apreciar en la siguiente figura. Por medio de este comando es posible especificar la primera
direccin de memoria que se comienza a visualizar en la ventana Code. El valor que se especifica
puede ser cualquier expresin entera (se permiten operadores y smbolos).
Set Breakpoint. Al activar este comando aparece una ventana de dilogo en la que es posible
asignar un punto de ruptura a la instruccin seleccionada (mximo 20 puntos de ruptura).
En la ventana Pipeline se visualizan las etapas por las que pasan las instrucciones dentro de la
estructura del pipeline del procesador. Si la ventana tiene un tamao suficientemente grande, las cajas
coloreadas que representan las etapas visualizan la instruccin que en ese preciso instante se est
ejecutando.
Haciendo doble clic con el puntero del ratn sobre las cajas, es posible obtener informacin detallada
sobre las instrucciones que en ese instante se estn ejecutando en cada etapa. La informacin se
visualiza por medio de la ventana de informacin de la instruccin (Figura 8).
El men Pipeline contiene un nico tem denominado Display Floating point stages. Su utilidad es la de
mostrar en la ventana Pipeline las etapas en coma flotante existentes o por el contrario, visualizar slo
las cinco etapas bsicas del pipeline del DLX (en la Figura 8 se puede apreciar el aspecto de la ventana
Pipeline con la opcin Display Floating point stages activa).
En esta ventana se visualizan las operaciones que se realizan en cada ciclo de reloj y en cada etapa.
Como puede apreciarse en la Figura 9, cada columna representa el estado del pipeline en un ciclo de
reloj. El estado actual del pipeline es representado en color gris en la columna situada en el extremo
derecho de la ventana. Al igual que en la ventana Code, es posible obtener ms informacin sobre una
instruccin haciendo doble clic sobre ella.
Las detenciones (stalls) son representadas en cajas coloreadas en el color asociado a la etapa detenida.
La etiqueta que aparece en el interior de las cajas proporciona ms informacin sobre el tipo de
detencin:
R-Stall (Read After Write Stall). Una flecha en color rojo seala la instruccin que est
produciendo la detencin por causa de este tipo de riesgo de datos.
T-Stall (Trap Stall). Esta detencin slo se produce ante una instruccin de trap. La instruccin
de trap permanece en la etapa IF hasta que no queden ms instrucciones en el interior del
pipeline.
W-Stall (Write After Write Stall). Una flecha roja seala la instruccin que causa la detencin.
Este riesgo slo se presenta en pipelines que escriben en los registros o en memoria en varias
etapas. El pipeline de DXL escribe slo los registros en la etapa WB, evitando esta clase de
riesgos para las instrucciones enteras, pero no con las operaciones en coma flotante, como
veremos ms adelante.
S-Stall (Structural Stall). No existen suficientes recursos hardware para ejecutar la instruccin.
Stall. Cuando una instruccin de coma flotante est en la etapa MEM, la prxima instruccin ser
detenida en la etapa intEX etiquetndola con la palabra Stall.
Display Forwarding. Si esta opcin est activa, tanto la etapa origen como la etapa destino del
adelantamiento de datos son unidas con una flecha verde en el diagrama de ciclos de reloj.
Display Cause of Stalls. Si esta opcin est activa, la instruccin que causa una detencin por
riegos de datos (RAW o WAW) es marcada con una flecha roja.
Delete History. Su activacin provoca que el historial de instrucciones ejecutadas que aparecen
en el diagrama de ciclos de reloj sea eliminado. Estas instrucciones no podrn volver a ser
visualizadas en el diagrama.
Set History Length Su ejecucin provoca la aparicin de una ventana de dilogo (Figura 8) en
la que se puede especificar la longitud del historial entre 0 y 100. Un historial de longitud 0
implica que slo se visualiza en el diagrama la instruccin que est siendo ejecutada en ese
momento.
La ventana Statistics es utilizada para visualizar estadsticas sobre la simulacin que est siendo
realizada. Los datos son organizados en los siguiente grupos:
Total. Este grupos siempre es visualizado y contiene el nmero de ciclos consumidos, el nmero
de instrucciones ejecutadas que han pasado por la etapa ID y el total de instrucciones que estn
siendo ejecutadas en el pipeline en ese instante.
Conditional Branches. Detalla el nmero de saltos condicionales. Si la opcin Detail Info est
activada se amplia la informacin mostrando los saltos efectivos y los no efectivos.
Floating point stages instructions. Proporciona el total de instrucciones ejecutadas en las etapas
de coma flotante (faddEX, fmulEX, fdivEX). Si la opcin Detail Info est activa la informacin es
dividida en:
El men Statistics contiene varios comandos para configurar la informacin que aparece en la ventana.
Uno de ellos, el comando Display, es a su vez un men desplegable que ofrece las siguientes opciones:
Hardware, Stalls, Conditional Branches, Load/Store-Instructions, Floating point stages instructions, Traps
y All. La activacin/desactivacin de una de estas opciones origina el despliegue o no del
correspondiente grupo de datos en la ventana Statistics
Otros comandos del men son Detail Info y Reset. Este ltimo realiza una inicializacin de todos los
valores de los grupos de datos que aparecen en la ventana Statistics.
El contenido de esta ventana es el conjunto de instrucciones que tienen puntos de ruptura asignados (el
nmero mximo de puntos de ruptura que es posible tener es de 20). Por medio de los comandos del
men propio de esta ventana es posible visualizar, modificar o eliminar los puntos de ruptura ya
existentes. Como ya se describi, otra posibilidad de asignar o eliminar puntos de ruptura es a travs de
la ventana Code.
Para modificar un punto de ruptura sin recurrir al men basta con hacer doble clic sobre alguna de las
instrucciones que aparecen en la ventana. Los comandos que ofrece el men son:
SetTras activar el comando se visualiza una ventana de dilogo (Figura 10) en la que es
posible fijar un punto de ruptura con los siguientes datos:
Address. La direccin puede ser una expresin entera formada por valores, operadores y
smbolos. El resultado de evaluar la expresin debe ser mltiplo de 4 (de lo contrario la
direccin es convertida al siguiente mltiplo de 4).
Type. El tipo de punto de ruptura indica que la instruccin almacenada en la direccin
Address ser abortada cuando alcance esa etapa del pipeline. Un punto de ruptura del tipo
Read se produce cuando se efecta la lectura del dato (o parte de l) almacenado en la
direccin Address (por ejemplo, por medio de una instruccin de carga o de fecth).
Anlogamente ocurre con el tipo Write: escritura del dato especificado por la direccin
Address (por ejemplo, por medio de una instruccin de almacenamiento o de ciertos traps).
Delete. Elimina el punto de ruptura que est seleccionado.
Delete All .
Change Similar a la accin de doble clic sobre la instruccin.
Junto con los mens asociados a las seis ventanas de trabajo del entorno de simulacin existen otros
seis mens: File, Window, Execution, Memory, Configuration y Help.
Reset All. Junto con todas las tareas efectuadas por el comando Reset DLX, la memoria es
inicializada a ceros y todos los smbolos son eliminados. Los smbolos $TEXT y $DATA
permanecen inalterados por estar fijados en la configuracin del simulador.
Load Code or Data. La seleccin de esta opcin ocasiona la aparicin de una ventana de dilogo
similar a la que se puede apreciar en la Figura 11. Es posible seleccionar un nmero arbitrario de
ficheros con cdigo DLX siempre que tengan la extensin .s mediante la pulsacin del botn
Select. Los ficheros seleccionados aparecern en el campo situado en la zona inferior de la
ventana. Tras la seleccin de los ficheros y para proceder a la carga y ensamblado de los
mismos en la memoria del simulador hay que pulsar el botn Load. Si se producen errores, estos
se visualizan en una caja de dilogo alternativa y todos los datos escritos en memoria sern
considerados invlidos.
La posibilidad de cargar mltiples mdulos al mismo tiempo permite definir smbolos globales que
pueden ser utilizados en varios mdulos. Por otra parte, es posible cargar mdulos con
independencia del orden
Quit WINDLX. Antes de abandonar el simulador, aparecer una caja de dilogo en la que se
contempla la posibilidad de almacenar la configuracin actual del entorno (Figura 12).
Los comandos contenidos en este men son los tpicos de cualquier aplicacin Windows, por lo que no
se entrar en mayor detalle. Debajo de estos comandos (Cascade, Tile, Arrange Icons) se encuentran
las opciones para visualizar o seleccionar alguna de las seis ventanas de trabajo descritas
anteriormente.
En este men se encuentran los comandos necesarios para ejecutar el cdigo ensamblado en la
memoria y visualizar la ventana de entrada/salida:
Single Cycle. Su activacin ocasiona que un nico ciclo del procesador DLX sea simulado.
Siempre que suceda una entrada o salida durante este ciclo la ventana DLX-I/O ser visualizada.
Si durante la simulacin ocurre un error, se ejecuta un trap indefinido o un punto de ruptura es
alcanzado, una ventana de mensajes mostrar informacin detallada sobre el estado de la
instruccin causante del mensaje.
Multiple Cycles. Esta opcin permite fijar en una ventana de dilogo (Figura 13) el nmero de
ciclos que van a ser simulados. Al igual que ocurre con las opciones Run o Run to..., la ventana
DLX-I/O es visualizada. La simulacin ser abortada cuando:
Run. Si se activa este comando, la simulacin del procesador DLX continuar hasta que:
Run to... Es similar a Run, excepto que permite asignar un punto de ruptura temporal por medio
de una ventana de dilogo. Este punto de ruptura slo es vlido durante el proceso de ejecucin
de la simulacin, pero por defecto es almacenado para la prxima vez que se utilice este
comando.
Redirect to File. Esta opcin tiene un submen con las siguientes posibilidades:
Es posible redireccionar cualquiera de estas entradas y salidas de datos y errores a un archivo mediante
una ventana de dilogo (Figura 15). Las extensiones que por defecto se colocan a los nombres de los
archivos de entrada y salida son:
Redirect to Window. Esta opcin realiza la funcin contrario que el comando anterior, es decir,
obliga a que una de las tres vas de datos sea redireccionada hacia la ventana anulando la
redireccin a un archivo. Las opciones del comando son:
Standard input.
Standard output.
Standard error.
Este men proporciona comandos para crear ventanas de memoria, cambiar el contenido de las
posiciones de memoria y manipular smbolos. Las rdenes del men son:
Display... Permite la creacin de hasta 10 ventanas en las que se visualiza el contenido de las
posiciones de memoria en varios tipos y formatos. La activacin de este comando provoca la
aparicin de una ventana de dilogo (Figura 16) en la que se puede seleccionar el tipo, formato y
la direccin de comienzo de la seccin de memoria que se desea visualizar:
Tipo Formato
Byte (8 bits) hexadecimal, decimal o carcter
Half-word (16 bits) hexadecimal o decimal
Word hexadecimal o decimal
Single floating point (32 bits) decimal
double floating point (64 bits) decimal
La direccin de memoria puede ser una expresin entera formada por valores, operadores y
smbolos. Las opciones que se seleccionen en la ventana de dilogo sern almacenadas y
utilizadas como valores por defecto la prxima vez que se active este comando del men.
Change... Mediante la activacin de este comando se obtiene una ventana de dilogo (Figura 17)
desde la que es posible cambiar o visualizar el contenido de una posicin de memoria. Es posible
seleccionar el formato del dato que va a ser visualizado en la ventana.
Los botones Next y Previous muestran el contenido de las posiciones de memoria inmediatamente
anterior y posterior a la direccin especificada. La direccin es incrementada o decrementada por
en tantos bytes como lleve asociado el tipo de formato seleccionado.
Figura 17. Ventana de dilogo del comando Change del men Memory
Para definir smbolos globales, se introduce el nombre y valor del nuevo smbolo (una expresin
entera) y se presiona el botn New.
Figura 18. Ventana de dilogo del comando Symbol del men Memory
Siempre que se dispone de una ventana de memoria activa, se aade un nuevo tem a la Barra de
mens denominado Memory Display con comandos que se aplican sobre la ventana de memoria activa.
Estos comandos son:
Los comandos para la configuracin del procesador DLX situados dentro de este men son los
siguientes:
Floating point stages Por medio de este comando es posible determinar el nmero de unidades
en punto flotante (1..8) o sus latencias (1..50 ciclos). La modificacin de estos valores implica la
inmediata reinicializacin del procesador.
Figura 19. Ventana de dilogo del comando Floating Point Stages del men Configuration
Figura 20. Ventana de dilogo del comando Memory size del men Configuration
Symbolic Addresses. Si se habilita este comando, las direcciones de memoria sern visualizadas
como smbolo+desplazamiento. En caso contrario sern presentadas en hexadecimal.
Absolute Cycle Count. Si se habilita este comando, los ciclos de reloj se cuentan desde 0,
reinicializando el procesador y las estadsticas. De lo contrario, los ciclos de reloj son contados a
partir del instante actual, es decir, el ciclo actual es el 0 y los previos son etiquetados como -1, -2,
etc.
Enable Forwarding. Permite activar o desactivar el mecanismo de adelantamiento de datos.
Load Mediante este comando es posible recuperar un fichero de configuracin del procesador.
Tras cargar la nueva configuracin, el entorno WinDLX ser reinicializado con los nuevos valores,
pero los contenidos de la memoria y los smbolos permanecern sin cambios.
Figura 21. Ventana de dilogo del comando Load del men Configuration
Save Permite almacenar la configuracin actual del procesador en un archivo con la extensin
".WDC". Por defecto, y si no se especifica otro, el nombre del archivo ser "WINDLX.WDC".
Cuando se arranca WinDLX por primera vez, la configuracin almacenada en el fichero
WINDLX.WDC ser recuperada automticamente.
El men Help contiene un conjunto de comandos que permite acceder al sistema de ayuda del entorno
WinDLX. En cualquier instante se puede obtener informacin de ayuda presionando la tecla F1.
El sistema de ayuda est constituido por un manual de usuario y una descripcin del procesador DLX y
de su repertorio de instrucciones. Prcticamente toda la informacin contenida en el sistema de ayuda
de WinDLX se ha traducido y trasladado a este manual con el fin de proporcionar al estudiante una
pequea gua en castellano del entorno de simulacin, junto con las caractersticas ms importantes del
procesador DLX.
Como ya sabemos, la estructura del pipeline del procesador DLX est compuesta por cinco etapas. En el
grfico siguiente (Figura 22) se pueden apreciar junto con las etapas correspondiente a las operaciones
en coma flotante.
MEM fdivEX-4
WB
3.1. Etapa IF
Una instruccin es leda de memoria y almacenada en el registro de instrucciones, al mismo tiempo que
el contador de programa se incrementa para apuntar a la siguiente instruccin.
3.2. Etapa ID
La instruccin leda en la etapa anterior es decodificada y los registros implicados en la instruccin son
transferidos del banco de memoria y almacenados en los registros A y B. Los saltos condicionales son
calculados en esta etapa con el fin de reducir los riesgos de control.
3.3 Etapas EX
En esta etapa, la unidad adecuada es seleccionada para que opere sobre los operandos ya preparados
en el paso anterior. Las unidades de procesamiento implicadas en esta etapa pueden ser:
intEX (1 unidad entera). Esta unidad realiza operaciones aritmticas enteras (excepto multiplicar
y dividir) y calcula las direcciones efectivas de salto para las referencias a memoria y
bifurcaciones.
faddEX (hasta 8 unidades). Esta unidad efecta sumas y restas en coma flotante tanto en simple
como en doble precisin.
fmulEX (hasta 8 unidades). Realiza multiplicaciones en simple y doble precisin en coma flotante
y sobre nmeros enteros con y sin signo.
fdivEX (hasta 8 unidades). Realiza divisiones en simple y doble precisin en coma flotante y
sobre nmeros enteros con y sin signo.
Las nicas instrucciones activas en esta etapa son las cargas y almacenamientos. Si la instruccin es
una carga los datos son ledos de la memoria, y si es un almacenamiento los datos son transferidos a la
memoria. En ambos casos, las direcciones utilizadas han sido calculadas en la etapa anterior.
3.5. Etapa WB
En entorno de simulacin WinDLX permite cargar uno o ms ficheros con cdigo ensamblador,
efectundose la carga de los mismo siempre en orden alfabtico. Junto con las instrucciones DLX, el
ensamblador que soporta el simulador dispone de varias directivas que afectan a la forma de situar los
datos e instrucciones en memoria.
Todas las instrucciones son de 32 bits de longitud con un cdigo de operacin de 6 bits.
Son empleadas para la transferencia de datos entre registros y memoria, o entre registros enteros y
registros de coma flotante o especiales. El nico modo de acceso a memoria es
Adr = (16 bits de desplazamiento con signo + registro de propsito general) = Desp(RPG)
DLX proporciona instrucciones de transferencia de datos con y sin signo tanto de bytes como de medias
palabras. Una carga con signo de un byte o de media palabra sita los datos transferidos en la parte
baja del registro, llenando la parte superior con el valor del bit de signo. Una carga sin signo de media
palabra o de un byte situar la cantidad cargada en la parte baja del registro llenando el resto con ceros.
MOVI2FP Fd, Rs Mueve 32 bits desde un registro entero a uno en coma flotante
Tipo R
Fd 32 Rs
MOVFP2I Rd, Fs Mueve 32 bits desde un registro en coma flotante a uno entero
Tipo R
Rd 32 Fs
IMPORTANTE: En las instrucciones de coma flotante en doble precisin LD, SD y MOVD, los registros
Fs y Fd a los que se hace referencia son siempre registros pares de coma flotante, es decir, F0, F2,
F4
Son utilizadas para la realizacin de operaciones enteras o lgicas en los registros de propsito general.
Los desbordamientos a causa de operaciones entre nmeros con signo no producen ningn aviso.
OR Rd,Ra,Rb Or
Tipo R
Rd 32 Ra | Rb
Rd 32 [(Rs)0] desp
|| Rs0..[31-desp] siendo desp = Rc27..31
S_ Rd,Ra,Rb Asignacin condicional: "_" puede ser EQ, NE, LT, GT, LE o GE
Tipo R
Si Ra _ Rb entonces Rd32 (0 31 || 1)
de lo contrario Rd32 (0 32)
S_I Rd,Ra,Imm Asignacin condicional con inmediato: "_" puede ser EQ, NE, LT, GT, LE o GE
Tipo I
Si Ra _ [(Imm0)16|| Imm] entonces Rd32 (0 31 || 1)
de lo contrario Rd32 (0 32)
S_U Rd,Ra,Rb Asignacin condicional sin signo: "_" puede ser EQ, NE, LT, GT, LE o GE
Tipo R
S__UI Rd,Ra,Imm Asignacin condicional sin signo con inmediato: "_" puede ser EQ, NE, LT,
GT, LE o GE
Tipo I
NOP No realiza ninguna operacin
Tipo R
El flujo de control en los programas es soportado por medio de un conjunto de instrucciones de salto
y bifurcacin. Las instrucciones de bifurcacin se diferencian por las dos formas de especificar la
direccin destino y por la existencia o no de enlace. Dos de las bifurcaciones emplean un
desplazamiento de 26 bits con signo aadido al contador de programa para determinar la direccin
destino; las otros dos utilizan un registro para especificar la direccin de salto, el R31. Por lo tanto,
hay bifurcaciones sin y con enlace (estas ltimas se emplean para realizar llamadas a
procedimientos).
Todos los saltos son condicionales, estando la condicin especificada en el cdigo de operacin de
la instruccin, la cual debe chequear el registro fuente para comprobar si es cero o no (este valor
puede ser el resultado de una comparacin o de una operacin). La direccin destino del salto se
construye con un desplazamiento de 16 bits con signo que se suma al contador de programa.
En WinDLX, los saltos y bifurcaciones se completan al final de la etapa ID con el objeto de reducir el
nmero de detenciones. En el pipeline de DLX, el esquema de predecir-no-efectivo es
implementado ejecutando la siguiente instruccin del programa como si nada sucediese; en caso de
que el salto sea efectivo entonces habr que detener el pipeline y leer de memoria la nueva
instruccin destino.
BFPT Dest Test de bit de comparacin en el registro de estado FP. Bifurca si cierto; el
desplazamiento es de 16 bits sobre el PC
Tipo I
Si ( FPSR = 1 ) entonces PC 32 { [ PC+4 ] + [ (Dest0)16 || Dest ] }
BFPF Dest Test de bit de comparacin en el registro de estado FP. Bifurca si falso; el
desplazamiento es de 16 bits sobre el PC
Tipo I
Si ( FPSR = 0 ) entonces PC 32 { [ PC+4 ] + [ (Dest0)16 || Dest ] }
TRAP Imm Transfiere el control a una rutina del sistema operativo; ver Traps. El
desplazamiento es de 26 bits. Mueve el PC+4 al IAR
Tipo J
IAR 32 PC+4
PC 32 06 || Dest
RFE Dest Devuelve el control al usuario despus de una excepcin. Mueve IAR al PC
Tipo J
PC 32 IAR
Este conjunto de instrucciones manipula los registros en coma flotante e indican si la operacin que va a
ser realizada es de simple o doble precisin. Operaciones en simple precisin pueden ser efectuadas
sobre cualquiera de los registros, mientras que las de doble precisin slo se aplican a parejas de
registros par-impar (por ejemplo, F4-F5), lo que se especifica por el nmero del registro par.
_D Da,Db Compara en doble precisin: "_" puede ser EQ, NE, LT, GT, LE o GE;
asigna el bit de comparacin en el registro de estado FP
Tipo R
Si ( [ Fa || Fa+1 ] _ [ Fb || Fb+1 ] ) entonces FPSR 1 1
de lo contrario FPSR 1 0
_F Fa,Fb Compara en simple precisin: "_" puede ser EQ, NE, LT, GT, LE o GE;
asigna el bit de comparacin en el registro de estado FP
Tipo R
Si ( Fa _ Fb ) entonces FPSR 1 1
de lo contrario FPSR 1 0
La sintaxis para las expresiones es similar a C (por ejemplo, los strings deben estar encerrados entre ).
Nmeros: WinDLX acepta nmeros en notacin decimal, notacin hexadecimal si los dos primeros
caracteres son 0x, o notacin octal si el primer carcter es 0.
El valor de una expresin debe estar dentro del rango apropiado al tipo de la expresin:
4.3. Directivas
Cuando el ensamblador procesa un archivo de instrucciones, los datos y las sentencias son situadas en
memoria de acuerdo a un puntero de texto o de datos, el cual no se selecciona por el tipo de
informacin, sino en funcin de si la ms reciente directiva era .data o .text. El programa inicialmente se
carga en el segmento de texto fijado por defecto a partir de la posicin $CODE (inicialmente asignada a
0x100), y los datos son almacenados a partir de la posicin $DATA (inicialmente asignada a 0x1000).
El ensamblador soporta varias directivas que afectan a la carga del cdigo DLX en memoria:
.global label Hace pblica la etiqueta para que pueda ser referenciada por cdigo
perteneciente a archivos cargados en memoria despus de ste.
.space size Mueve size bytes hacia adelante el actual puntero de almacenamiento con
el fin de dejar libre algn espacio en memoria.
.text [address] Ocasiona que el siguiente cdigo o dato que aparezca en el fichero sea
almacenado en el rea de texto (cdigo). Si una direccin es
proporcionada, los datos sern situados a partir de esa direccin. En caso
contrario, se utilizar el ltimo valor del puntero de texto. Si estuvisemos
leyendo datos por medio del puntero de texto, es necesario almacenar la
direccin para poder continuar ms tarde (por medio de una directiva
.data).
.word word1, ,... Almacena secuencialmente en memoria las direcciones de los smbolos
indicados en la directiva. Si por ejemplo, el smbolo PrintFormat hace
referencia a la direccin 1017, se almacenar en memoria este valor.
5. TRAPS
Los traps constituyen la interfaz entre los programas DLX y el sistema de entrada/salida. Hay cinco traps
definidos en WinDLX:
Es posible abrir un archivo tanto para lectura como escritura. Todos los archivos abiertos sern
automticamente cerrados despus de un reset del procesador o cuando se abandone el simulador.
1. Nombre del archivo: Direccin de un string terminado en cero que contiene el path del
archivo que va a ser abierto.
2. Modo en que se va abrir el archivo: Los siguientes modos pueden ser combinados utilizando
el operador lgico OR.
(Aviso: Estos flags estn predefinidos en MS-DOS y no son compatibles con UNIX).
3. Flags adicionales:
(Aviso: Estos flags estn predefinidos en MS-DOS y no son compatibles con UNIX).
Ejemplo:
.DATA
FileName: .asciiz "C:\BSP\DATEI.DAT"
.align 2
Par: ;*****Parmetros para el Trap1 (OPEN)
;Direccin de la cadena que especifica el path al fichero
.word FileName
;Creado para R/W:
.word 0x0104
;Permisos de acceso de R/W:
.word 0x0180
FileDescr: .space 4
Error: .space 4
_errno: .word Error
.TEXT
; Carga la direccin de comienzo los parmetros en r14
addui r14,r0,Par
trap 1
;Almacena el descriptor en el espacio de memoria reservado
sw FileDescr,R1
Parmetros:
El valor cero es devuelto en el registro R1 si la operacin concluy con xito; de lo contrario -1.
Ejemplo:
.DATA
.TEXT
;Previamente ser necesario disponer del descriptor del archivo
;a cerrar en la posicin de memoria FileDescr
lhi r14,FileDescr>>16 ; higher 16 bits
addui r14,r14,FileDescr&0xffff ; lower 16 bits
trap 2
Mediante este trap es posible leer un bloque de un archivo o una lnea de stdin.
Parmetros:
Ejemplo:
.DATA
.TEXT
;Previamente hay que obtener el descriptor del fichero y escribirlo
;en la posicin de memoria reservada para ello
;.
lhi r14,Par>>16 ; higher 16 bits
addui r14,r14,Par&0xffff ; lower 16 bits
trap 3
Parmetros:
Ejemplo:
.DATA
Buffer: .space 500
Par: ;Descriptor del archivo, direccin del buffer, tamao del bloque
.space 4
.word Buffer
.word 500
.TEXT
;...
lhi r14,Par>>16 ; higher 16 bits
addui r14,r14,Par&0xffff ; lower 16 bits
trap 4
Parmetros:
Ejemplo:
.DATA
FormatStr: .asciiz "Pi=%f, N=%d\n"
.align 2
Par: ;Direccin de la cadena, valores
.word FormatStr
;El argumento en coma flotante especificado en "Pi=%f, N=%d\n"
.double 3.141592654
;El argumento entero especificado en "Pi=%f, N=%d\n"
.word 17
.TEXT
;...
lhi r14,Par>>16 ; higher 16 bits
addui r14,r14,Par&0xffff ; lower 16 bits
trap 5
Con la excepcin de las operaciones de coma flotante, todo el repertorio de instrucciones de DLX puede
ser descompuesto en cinco pasos bsicos: fetch, decodificacin, ejecucin, acceso a memoria y
escritura de los resultados. Estos pasos se asocian a las cinco etapas de la estructura del pipeline de
DLX. La tabla siguiente muestra los eventos que ocurren en cada una de las etapas del pipeline de DLX.
Las siguientes instrucciones de DLX utilizan las unidades funcionales de procesamiento en coma
flotante:
Instrucciones Etapa
ADDF, ADDD, SUBF, SUBD faddEX
MULT, MULTU, MULTF, MULTD fmulEX
DIV, DIVU, DIVF, DIVD fidvEX
Las etapas de procesamiento en coma flotante consumen ms de un ciclo de reloj para efectuar la
operacin. El nmero de unidades en coma flotante y su latencia pueden ser configuradas en el
simulador.
Los riesgos WAW pueden ocurrir con las instrucciones en coma flotante. Este conflicto es detectado en
WinDLX antes de que la instruccin se introduzca en la etapa EX y cause la detencin a consecuencia
del riesgo WAW.
Un ejemplo sera:
A continuacin se listan los tres programas desarrollados en el ensamblador de DLX y que van incluidos
en el software de simulacin. Son bastante ilustrativos y su anlisis ayuda de forma notoria a
comprender el objetivo y el empleo de las directivas del ensamblador, as como de las instrucciones de
DLX. Estos tres ejemplos son:
Este primer ejemplo es muy ilustrativo ya que implica la carga simultnea en memoria de dos ficheros:
una se ocupa de realizar la toma de datos (fichero INPUT.S) y el segundo de realizar el clculo y enviar
la solucin a la pantalla (GCM.S).
Fichero GCM.S
;------------------------------------------------------------------------
; Program begins at symbol main
; requires module INPUT
; Read two positive integer numbers from stdin, calculate the gcm
; and write the result to stdout
;------------------------------------------------------------------------
.data
.text
.global main
main:
;*** Read two positive integer numbers into R1 and R2
addi r1,r0,Prompt1
jal InputUnsigned ;read uns.-integer into R1
add r2,r1,r0 ;R2 <- R1
addi r1,r0,Prompt2
jal InputUnsigned ;read uns.-integer into R1
bnez r3,r1Greater
;*** end
trap 0
Fichero INPUT.S
;-----------------------------------------------------------------------------
;Subprogram call by symbol "InputUnsigned"
;expect the address of a zero-terminated prompt string in R1
;returns the read value in R1
;changes the contents of registers R1,R13,R14
;-----------------------------------------------------------------------------
.data
SaveR2: .space 4
SaveR3: .space 4
SaveR4: .space 4
SaveR5: .space 4
.text
.global InputUnsigned
InputUnsigned:
;*** save register contents
sw SaveR2,r2
sw SaveR3,r3
sw SaveR4,r4
sw SaveR5,r5
;*** Prompt
sw PrintfPar,r1
addi r14,r0,PrintfPar
trap 5
Este ejemplo es ilustrativo del uso de instrucciones de coma flotante. Al igual que en el ejemplo anterior
requiere del fichero INPUT.S para realizar la lectura del nmero.
Fichero FACT.S
.data
.text
.global main
main:
;*** Read value from stdin into R1
addi r1,r0,Prompt
jal InputUnsigned
;*** end
trap 0
Programa que realiza el clculo de una tabla de nmeros primos, la cual es almacenada en memoria a
partir de la posicin especificada por el smbolo Table. En el ejemplo, el tamao de la tabla es 10
(smbolo Count) y se reservan 40 bytes en memoria para su almacenamiento (Count*4).
Listado de PRIM.S
;-------------------------------------------------------------------
; Program begins at symbol main
; generates a table with the first 'Count' prime numbers from 'Table'
;-------------------------------------------------------------------
.data
.text
.global main
main:
;*** Initialization
addi r1,r0,0 ;Index in Table
addi r2,r0,2 ;Current value
8. PRCTICA A REALIZAR
Se puede elegir entre dos clases de enunciado, aunque la realizacin de ambos repercutir
especialmente sobre la nota final.
ENUNCIADO A)
Considerar las latencias de las unidades funcionales en coma flotante que por defecto trae el simulador.
a) Programar el cdigo anterior en un fichero denominado BUCLE.S. Utilizar las directivas del
ensamblador con el objeto de reservar el espacio de memoria para las dos tablas aunque su
contenido sea cero, y cargar las direcciones de comienzo en los registros R1 y R2. Modificar el
cdigo ensamblador si fuese necesario.
b) Mostrar el nmero de ciclos de detencin para cada instruccin y en qu ciclos de reloj comienza la
ejecucin de la instruccin en la primera iteracin del bucle. Cuntos ciclos de reloj necesita cada
iteracin del bucle?
c) Desenrollar el cdigo DLX para el bucle anterior tres veces, y planificarlo para la segmentacin
estndar de DLX (consultar el apartado 6.8, pg. 338). Al desenrollar se debera optimizar el cdigo
tal y como se especifica en el apartado 6.8. Para maximizar el rendimiento ser necesario reordenar
significativamente el cdigo. Calcular la aceleracin sobre el bucle original.
Calcular el CPI medio que se obtiene en cada iteraccin del bucle propuesto en los apartados (a) y (c)
Para la realizacin de este clculo slo se contabilizarn las instrucciones que conforman el cuerpo del
bucle, ignorndose las de inicializacin del mismo.
Todas las ejecuciones y clculos se efectuarn con el adelantamiento de datos entre etapas habilitado
(comando Enable Forwarding en el men Configuration).
ENUNCIADO B)
a) Tras la lectura, reescribir la versin segmentada por software del bucle que aparece en el ejemplo
de la pgina 349 del texto base de la asignatura de forma que funcione. Es decir, es necesario
desarrollar los cdigos de arranque y terminacin as como modificar el cuerpo del bucle. Para ello
tener en cuenta que:
Hay que decrementar en 16 el registro R1 antes de entrar en el bucle con el fin de realizar dos
iteraciones menos.
Una vez decrementado R1, hay que ajustar los desplazamientos de las instrucciones de carga y
almacenamiento tanto en el bucle como en la secuencia de terminacin.
No considerar para la solucin la tcnica del hueco de retardo en el salto que aparece en la
solucin parcial de la pgina 349 del texto base de la asignatura, ya que el simulador no la
soporta. Por lo tanto, mantener en la solucin el orden de las instrucciones SUB y BNEZ tal y
como refleja el enunciado del ejemplo.
b) Calcular el CPI obtenido para el bucle sin y con segmentacin software considerando que el vector
consta de 50 elementos.
Todas las ejecuciones y clculos se efectuarn con el adelantamiento de datos entre etapas habilitado
(comando Enable Forwarding en el men Configuration).
Habr nicamente dos niveles de calificacin: APTO y NO APTO. Las prcticas que consigan el APTO
contribuirn a la nota final de la asignatura con 1 punto. Salvo casos excepcionales, la prctica no
servir para aprobar la asignatura, ya que slo se evala la prctica si previamente se ha aprobado el
examen.
Las hojas deben ser DIN-A4, con nmero de pgina centrado en el pi de pgina, y grapadas en la
esquina superior izquierda. No se aceptarn memorias escritas con letra manuscrita con el fin de evitar
problemas de legibilidad y comprensin.