Tema2 Instalación y Puesta en Marcha

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Micro-Mooc Integración de traducción automàtica neuronal en proyectos de traducción

con MTUOC - Tema 2. Instalación y puesta en marcha del servidor MTUOC

2.1. ¿Qué es y para qué sirve el servidor MTUOC-


server?
El servidor MTUOC es una aplicación que permite poner en marcha y comunicarser con servidores de
traducción Marian, OpenNMT, Moses y también comunicarse con servidores ModernMT y ofrecer servicios de
traducción a programas cliente. El servidor MTUOC, a su vez, puede comportarse como si fuese un servidor de
diferentes tipos (MTUOC, Moses, OpenNMT, NMTWizard y ModernMT). Esta manera múltiple de comportarse
permite que los servidores MTUOC sean compatibles con muchos programas cliente. En la siguiente figura
podemos observar un esquema de su funcionamiento:

El programa cliente, que tanto puede ser MTUOC-Translator como una herramienta de traducción asistida
envía una petición (un segmento a traducir) al servidor MTUOC. Cuando lo recibe, lo preprocesa (tokeniza, aplica
BPW o SentencePiece, etc., el preproceso dependerá del tipo y arquitectura del sistema de TA utilizado) y lo
envía al servidor de traducción (que puede ser un Marian, Moses, OpenNMT o ModernMT). Este servidor de
traducción le devuelve el segmento traducido (pero preprocesado también) y el servidor MTUOC lo "desprocesa"
para obtener un segmento correcto en la lengua de destino y después lo envía al cliente.

2.2. ¿Dónde puedo obtener el servidor MTUOC?


El servidor MTUOC se puede obtener de Github, concretamente del siguiente repositorio: https://github.com/
aoliverg/MTUOC-server. Ahora bien, estos archivos sólo servirán para aquellos usuarios expertos que son

Page 1 / 6 - last modified by Antoni Oliver on 2020/09/26 10:19


Micro-Mooc Integración de traducción automàtica neuronal en proyectos de traducción
con MTUOC - Tema 2. Instalación y puesta en marcha del servidor MTUOC

capaces de entrenar sus propios sistemas de traducción.  El proyecto MTUOC también proporciona una serie de
motores de traducción listos para utilizar. En la siguiente sección explicamos de dónde obtenerlos.

2.2. ¿Dónde puedo obtener motores ya


preentrenados?
Los motores ya preentrenados se pueden descargar de: http://lpg.uoc.edu/MTUOC/. La listra de motores
disponibles se va actualizando regularmente. Los motores se pueden descargar en dos formatos:

• Archivo comprimido zip que contiene todos los archivos necesarios para poner en marcha el motor. Estos
motores de traducción sólo se pueden ejecutar en un ordenador con sistema operativo Linux (o con la
cónsola de Ubuntu de Windows 10).
• Máquina virtual para importar en Virtiual Box en formato ova. Una vez importada, como explicaremos un
poco más adelante, en Virtual Box, dispondremos de un servidor en funcionamiento en nuestro propio
ordenador. La máquina virtual Virtual Box puede funcionar tanto en Windows, Linux y Mac.

2.2.a. Uso en ordenadores con Linux


Recuerda que esta opción es válida tanto si dispones de un ordenador con Linux como si utilizas Windows 10 e
instalas el subsistema Linux. En este enlace puedes encontrar más detalles de esta opción.

MTUOC-server está programado en Python versión 3. Para ejecutarlo simplemente tienes que escribir en un
terminal:

python3 MTUOC-server.py

Ahora bien, es muy posible que te falten librerías y otras dependencias. Podrás instalar todas estas
dependencias con pip3, pero es posible que tu sistema no tenga instalado pip3, en cuyo caso tendrás que
escribir:

sudo apt install python3-pip

Y una vez hecho esto podrás instalar todas las dependencias haciendo:

sudo pip3 install lxml, pyonmttok, websocket, websocket-client, SimpleWebSocketServer, flask

Y ahora sí que podrás poner en marcha el sistema haciendo:

python3 MTUOC-server.py

Una vez puesto en marcha se mostrará un mensaje como el siguiente:

MTUOC server IP: 192.168.1.39  port: 8000


 

(el mensaje dependerá del tipo de servidor que esté seleccionado en el fichero de configuración). Más adelante
en este mismo curso explicaremos algunas de las configuraciones básicas.

Una vez puesto en marcha el servidor podemos hacer peticiones de traducción a la IP y puerto que se muestra
en el mensaje. Para detener el servidor podemos escribir la instrucción:

MTUOC-stop-server.py

Page 2 / 6 - last modified by Antoni Oliver on 2020/09/26 10:19


Micro-Mooc Integración de traducción automàtica neuronal en proyectos de traducción
con MTUOC - Tema 2. Instalación y puesta en marcha del servidor MTUOC

Como ya hemos visto, el servidor MTUOC puede comportarse como diferentes servidores. Si queremos
ponerlos en marcha todos podemos hacer:

./startAllServers.sh

y si los queremos parar todos:

./stopAllServers.sh

2.2.b. Uso de la máquina virtual en VirtualBox


Para poder utilizar la máquina virtual es necesario tener instalado VirtualBox en nuestro ordenador. Esta
aplicación es gratuita y hay versiones para Windows, Linux y Mac. Se puede obtener de su página web: https://
www.virtualbox.org/. Antes de instalarlo tenéis que verificar que vuestro sistema operativo sea de 64 bits (si es
un ordenador relativamente moderno, seguramente será de 64 bits). Si no, con VirtualBox no podrás ejecutar
máquinas virtuales con sistemas operativos de 64 bits.

Si cuando pongáis en marcha la máquina virtual importada (más adelante explicamos cómo hacerlo) se
produce algún error relacionado con la virtualización, querrá decir que vuestro ordenador tiene desactivada la
virtualización. Para solucionar esto se tienen que seguir los siguientes pasos:

1. Entrar en la Bios del sistema. Para ello se tiene que reinicializar el ordenador y mientras se reinicializa
pulasr una tecla determinada. Esta tecla puede variar según el fabricante del ordenador. Habitualmente son las
siguientes (lista obtenida de https://www.tomshardware.com/reviews/bios-keys-to-access-your-firmware,5732.html)

• ASRock: F2 or DEL
• ASUS: F2 for all PCs, F2 or DEL for Motherboards
• Acer: F2 or DEL
• Dell: F2 or F12
• ECS: DEL
• Gigabyte / Aorus: F2 or DEL
• HP: F10
• Lenovo (Consumer Laptops): F2 or Fn + F2
• Lenovo (Desktops): F1
• Lenovo (ThinkPads): Enter then F1.
• MSI: DEL for motherboards and PCs
• Microsoft Surface Tablets: Press and hold volume up button.
• Origin PC: F2
• Samsung: F2
• Toshiba: F2
• Zotac: DEL

2. Una vez en la Bios se tiene que activar la virtualización. Para ello se tiene que ir al menú adecuado y activar
la opción adecuada. Podrás encontrar estas opciones haciendo una búsqueda en google que inclya "activate
virtualization bios" y tu marca y modelo de ordenador. Por ejemplo, si buscas: "enable virtualization hp pavilion"
encontrarás la página https://support.hp.com/us-en/document/c04760917 que te ofrece todos los detalles.

Una vez instalado VirtualBox y solventados los posibles problemas de las opciones de virtualización, podemos
poner en marcha Virtual Box. Para importar la máquina haremos File > Import Appliance y seleccionar el
archivo .ova que has descargado. Pasados unos minutos ya tendrás disponible tu máquina virtual. Antes de
ponerla en marcha conviene verificar algunas configuraciones. Selecciona la máquina en VirtualBox y haz clic en
el botón Settings.

En System > Motherboard podremos verificar si la memoria RAM asignada a la máquina virtual no es


excesiva respecto a la memoria total del sistema.

Page 3 / 6 - last modified by Antoni Oliver on 2020/09/26 10:19


Micro-Mooc Integración de traducción automàtica neuronal en proyectos de traducción
con MTUOC - Tema 2. Instalación y puesta en marcha del servidor MTUOC

En System > Processor podremos ver si el número de procesadores asignados a la máquina virtual es


adecuado respecto el número de procesadores total del sistema.

Y para finalizar es necesario comprobar en Network > Adapter 1 que Attached to tenga


seleccionado Bridged Adapter y que el Name esté seleccionado en uno existente en el sistema (este nombre
puede variar si nuestro ordenador está conectado a la red por cable o por wifi).

Page 4 / 6 - last modified by Antoni Oliver on 2020/09/26 10:19


Micro-Mooc Integración de traducción automàtica neuronal en proyectos de traducción
con MTUOC - Tema 2. Instalación y puesta en marcha del servidor MTUOC

Una vez verificado todo esto podemos seleccionar la máquina virtual y hacer clic en el botón Start de
VirtualBox. Cuando acabe de ponerse en marcha por la pantalla aparecerá una información similar a la siguiente
(esta información puede depender de la máquina virtual que utilices):

Page 5 / 6 - last modified by Antoni Oliver on 2020/09/26 10:19


Micro-Mooc Integración de traducción automàtica neuronal en proyectos de traducción
con MTUOC - Tema 2. Instalación y puesta en marcha del servidor MTUOC

Los servidores indicados estarán disponibles en la IP y puertos indicados. Si quieres entrar en el sistema
para realizar alguna configuración o bien investigar un poco, recuerda que el nombre de usuario es mtuoc y la
contraseña también mtuoc

2.3. EJERCICIO PRÁCTICO


Pon en marcha un servidor MTUOC, ya sea en un sistema Linux o como una máquina virtual y utiliza MTUOC-
Translator para traducir algunas oraciones de prueba. En alguna de tus oraciones pon etiqutas XML inventadas,
por ejemplo:

This is an <b>interesting</b> example.

¿Las etiquetas se mantienen en la traducción en la posición correcta?

Page 6 / 6 - last modified by Antoni Oliver on 2020/09/26 10:19

También podría gustarte