Curso Linux Capitulo 2
Curso Linux Capitulo 2
Curso Linux Capitulo 2
El kernel de Linux puede ejecutar una gran variedad de software a través de muchas
plataformas de hardware. Una computadora puede actuar como un servidor, que significa que
principalmente maneja datos en nombre de otro o puede actuar como un escritorio lo que
significa que un usuario puede interactuar con él directamente. La máquina puede ejecutar el
software o puede ser utilizada como máquina de desarrollo en el proceso de creación de
software. Incluso puede ejecutar múltiples roles ya que no hay distinción en el Linux en cuanto
a la función de la máquina; es simplemente una cuestión de configurar cuáles de las
aplicaciones se ejecutarán.
Una ventaja de esto es que se pueden simular casi todos los aspectos de un entorno de
producción, desde el desarrollo a las pruebas y hasta la verificación en un hardware reducido,
lo cual ahorra costos y tiempo. Como estudiante de Linux puedes ejecutar las mismas
aplicaciones de servidor en tu escritorio o un servidor virtual no muy costoso que funciona a
través de un gran proveedor de servicios de Internet. Por supuesto no vas a poder manejar el
mismo volumen que un proveedor de servicios grande, ya que éste posee un hardware mucho
más caro. Sin embargo, vas a poder simular casi cualquier configuración sin necesidad de un
hardware muy potente o un servidor de licencias para el servidor.
El software de Linux cae generalmente en una de tres categorías:
Software de servidor – software que no tiene ninguna interacción directa con
el monitor y el teclado de la máquina en la que se ejecuta. Su propósito es
servir de información a otras computadoras llamados clientes. A veces el
software de servidor puede no interactuar con otros equipos, sin embrago, va
a estar ahí sentado y "procesando" datos.
Software de escritorio – un navegador web, editor de texto, reproductor de
música u otro software con el que tú interactúas. En muchos casos, como un
navegador web, el software consultará a un servidor en el otro extremo e
interpretará los datos para ti. Aquí, el software de escritorio es el cliente.
Herramientas – una categoría adicional de software que existe para que sea
más fácil gestionar el sistema. Puedes tener una herramienta que te ayude a
configurar la pantalla o algo que proporcione un shell de Linux o incluso
herramientas más sofisticadas que convierten el código fuente en algo que la
computadora pueda ejecutar.
Adicionalmente, vamos a ver las aplicaciones móviles, principalmente para el beneficio del
examen LPI. Una aplicación móvil es muy parecida a una aplicación de escritorio pero se
ejecuta en un teléfono o una tableta en lugar de una maquina de escritorio.
Cualquier tarea que quieras hacer en Linux probablemente pueda ser acomodada por
cualquier número de aplicaciones. Hay muchos navegadores, muchos servidores web y
muchos editores de texto (los beneficios de cada uno son objeto de muchas guerras santas de
UNIX). Esto no es diferente que el mundo de código cerrado. Sin embargo, una ventaja del
código abierto es que si a alguien no le gusta la manera en la que funciona su servidor web,
puede empezar a construir su propio. Una cosa que aprenderás mientras vayas progresando
con Linux es cómo evaluar el software. A veces querrás ir con el líder de la manada y otras
querrás conocer la última vanguardia de la tecnología.
Aplicaciones de Servidor
Linux destaca en la ejecución de aplicaciones de servidor gracias a su confiabilidad y
eficiencia. Cuando queremos hablar de un software de servidor la pregunta más importante es
"¿Qué tipo de servicio estoy ejecutando?" ¡Si quieres proporcionar un servicio de páginas web
necesitas un software de servidor web, no un servidor de correo!
Uno de los primeros usos de Linux era para servidores web. Un servidor web aloja contenido
para páginas web a las que ve el explorador web mediante el Protocolo de transferencia de
hipertexto (HTTP - Hypertext Transfer Protocol) o su forma cifrada HTTPS. La propia
página web puede ser estática, lo que significa que cuando el navegador solicita una página,
el servidor web envía sólo el archivo tal y como aparece en el disco. El servidor también puede
proporcionar un contenido dinámico, esto es, el servidor web envía la solicitud a una
aplicación que genera el contenido. WordPress es un ejemplo popular. Los usuarios pueden
desarrollar contenidos a través de su navegador en la aplicación de WordPress y el software
lo convierte en un sitio web completamente funcional. Cada vez que realizas compras en línea
estás viendo un sitio dinámico.
Hoy en día, Apache es el servidor web dominante. Apache fue originalmente un proyecto
independiente, pero el grupo ha formado la Apache Software Foundation y mantiene más de
cien proyectos de software de código abierto.
Otro servidor web es nginx con su base en Rusia. Se centra en el rendimiento haciendo uso
de kernels UNIX más modernos y solo se puede hacer un subconjunto de lo que Apache
puede hacer. Más de un 65% de los sitios web funcionan mediante Apache o nginx.
El correo electrónico (e-mail) siempre ha sido un uso popular para servidores Linux. Cuando
se habla de servidores de correo electrónico siempre es útil considerar las 3 funciones
diferentes para recibir correo electrónico entre personas:
Agente de transferencia de correo (MTA- Mail Transfer Agent) – decide qué
servidor debe recibir el correo electrónico y utiliza el Protocolo simple de
transferencia de correo (SMTP- Simple Mail Transfer Protocol) para mover el
correo electrónico hacia tal servidor. No es inusual que un correo electrónico tome
varios "saltos" para llegar a su destino final, ya que una organización puede tener
varios MTAs.
Agente de entrega de correo (MDA- Mail Delivery Agent, también llamado
el Agente de entrega local) se encarga de almacenar el correo electrónico en el
buzón del usuario. Generalmente se invoca desde el MTA al final de la cadena.
Servidor POP/IMAP – (Post Office Protocol e Internet Message Access
Protocol) son dos protocolos de comunicación que permiten a un cliente de correo
funcionando en tu computadora actuar con un servidor remoto para recoger el correo
electrónico.
A veces un software implementará varios componentes. En el mundo de código cerrado,
Microsoft Exchange implementa todos los componentes, por lo que no hay ninguna opción
para hacer selecciones individuales. En el mundo del código abierto hay muchas opciones.
Algunos servidores POP/IMAP implementan su propio formato de base de datos de correo
para el rendimiento, por lo que también incluirá el MDA si se requiere una base de datos
personalizada. Las personas que utilizan formatos de archivo estándar (como todos los
correos en un archivo) pueden elegir cualquier MDA.
El MTA más conocido es sendmail. Postfix es otro MDA popular y pretende ser más simple y
más seguro que sendmail.
Si utilizas formatos de archivo estándar para guardar mensajes de correo electrónico, tu MTA
también puede entregar el correo. Como alternativa, puedes usar algo como procmail que te
permite definir filtros personalizados para procesar el correo y filtrarlo.
Dovecot es un servidor POP/IMAP popular gracias a su facilidad de uso y bajo
mantenimiento. Cyrus IMAP es otra opción.
Para compartir archivos, Samba es el ganador sin duda. Samba permite que una máquina
Linux se parezca a una máquina Windows para que pueda compartir archivos y participar en
un dominio de Windows. Samba implementa los componentes del servidor, tales como
archivos disponibles para compartir y ciertas funciones de servidor de Windows, así como el
cliente para que una máquina de Linux puede consumir un recurso compartido de archivos de
Windows.
Si tiene máquinas Apple en la red, el proyecto Netatalk permite que tu máquina Linux se
comporte como un servidor de archivos de Apple.
El protocolo para compartir el archivo nativo para UNIX se llama Sistema de Archivos de
Red (NFS-Network File System). NFS es generalmente parte del kernel lo que significa que
un sistema de archivos remoto puede montarse como un disco regular, haciendo el acceso al
archivo transparente para otras aplicaciones.
Al crecer tu red de computadoras, necesitarás implementar algún tipo de directorio. El
directorio más antiguo se llama Sistema de nombres de dominio y se utiliza para convertir un
nombre como http://www.linux.com a una dirección IP como 192.168.100.100 lo que es un
identificador único de ese equipo en Internet. DNS contiene también información global como
la dirección de la MTA para un nombre de dominio proporcionado. Una organización puede
ejecutar su propio servidor DNS para alojar sus nombres públicos y también para servir como
un directorio interno de servicios. El Consorcio de Software de Internet (Internet Software
Consortium), mantiene el servidor DNS más popular, llamado simplemente bind, esto tras el
nombre del proceso que ejecuta el servicio.
El DNS se centra en gran parte en nombres de equipos y direcciones IP y no es fácilmente
accesible. Han surgido otros directorios para almacenar información distinta tales como
cuentas de usuario y roles de seguridad. El Protocolo ligero de acceso a directorios
(LDAP- Lightweight Directory Access Protocol) es el directorio más común que alimenta
también el Active Directory de Microsoft. En el LDAP, un objeto se almacena en una forma de
árbol (ramificada), y la posición de tal objeto en el árbol se puede utilizar para obtener
información sobre el objeto, además de lo que se almacena en el objeto en sí. Por ejemplo, un
administrador de Linux puede almacenarse en una rama del árbol llamado "Departamento TI",
que está debajo de una rama llamada "Operaciones". Así uno puede encontrar personal
técnico buscando bajo la rama del Departamento TI. OpenLDAP es aquí el jugador
dominante.
Una última pieza de la infraestructura de red se denomina el Protocolo de configuración
dinámica de Host (DHCP- Dynamic Host Configuration Protocol). Cuando un equipo
arranca, necesita una dirección IP para la red local por lo que puede identificarse de manera
unica. El trabajo de DHCP sirve para identificar las solicitudes y asignar una dirección
disponible del grupo DHCP. La entidad Internet Software Consortium también mantiene el
servidor ISC DHCP que es el jugador más común.
Una base de datos almacena la información y también permite una recuperación y consulta
fáciles. Las bases de datos más populares son MySQL y PostgreSQL. En la base de datos
podrías ingresar datos de venta totales y luego usar un lenguaje llamado Lenguaje de
consulta estructurado (SQL- Structured Query Language) para agregar ventas por
producto y fecha con el fin de producir un informe.
Aplicaciones de Escritorio
El ecosistema de Linux tiene una amplia variedad de aplicaciones de escritorio. Puedes
encontrar juegos, aplicaciones de productividad, herramientas creativas y mucho más. Esta
sección es un mero estudio de lo que existe centrándose en lo que LPI considera más
importante.
Antes de considerar las aplicaciones individuales, es útil conocer el entorno de escritorio. Un
escritorio de Linux ejecuta un sistema llamado X Window, también conocido como X11. Un
servidor Linux X11 es un X.org que hace que el software opere en un modo gráfico y acepte la
entrada de un teclado y un ratón. Otro software controla a las ventanas y a los iconos, y se
llama administrador de ventanas o entorno de escritorio. El administrador de ventanas es una
versión más simple del entorno de escritorio, ya que sólo proporciona el código para dibujar
menús y gestionar las ventanas de las aplicaciones en la pantalla. Los niveles de funciones en
el entorno de escritorio como ventanas de inicio, sesiones, administrador de archivos y otras
utilidades. En resumen, una estación de trabajo Linux de sólo texto se convierte en un
escritorio gráfico con la adición de X-Windows y un entorno de escritorio o un administrador de
ventanas.
Los administradores de ventanas incluyen: Compiz, FVWM y Enlightenment, aunque hay
muchos más. Los entornos de escritorio principalmente son KDE y GNOME, los cuales tienen
sus propios administradores de ventanas. KDE y GNOME son proyectos maduros con una
cantidad increíble de utilidades construidas, y la elección es a menudo una cuestión de
preferencia personal.
Las aplicaciones de productividad básicas, tales como un procesador de textos, hoja de
cálculo y paquete de presentación son muy importantes. Conocidos como la suite ofimática
(de oficina), en gran parte debido a Microsoft Office el jugador dominante en el mercado.
OpenOffice (a veces llamado OpenOffice.org) y LibreOffice ofrecen una suite ofimática (de
oficina) completa, incluyendo una herramienta de dibujo que busca la compatibilidad con
Microsoft Office, tanto en términos de características como en formatos de archivo. Estos dos
proyectos también sirven de gran ejemplo de cómo influir en política de código abierto.
En 1999 Sun Microsystems adquirió una compañía alemana relativamente desconocida que
estaba haciendo una suite ofimática (de oficina) para Linux llamada StarOffice. Pronto
después de eso, Sun cambio la marca a OpenOffice y la había liberado bajo una licencia de
código abierto. Para complicar más las cosas, StarOffice seguía siendo un producto
propietario que se separó de OpenOffice. En 2010 Sun fue adquirido por Oracle, que más
tarde entregó el proyecto a la fundación Apache.
Oracle ha tenido una historia pobre de soporte a los proyectos de código abierto que va
adquiriendo, así pues pronto después de la adquisición por parte de Oracle el proyecto se
bifurcó para convertirse en LibreOffice. En ese momento se crearon dos grupos de personas
desarrollando la misma pieza de software. La mayor parte del impulso fue al proyecto
LibreOffice, razón por la cual se incluye por defecto en muchas distribuciones de Linux.
Para navegar por la web, los dos principales contendientes son Firefox y Google Chrome.
Ambos son navegadores rápidos de código abierto, ricos en funciones y tienen un soporte
excelente para desarrolladores web. Estos dos paquetes son un buen ejemplo de cómo la
diversidad es buena para el código abierto – mejoras de uno dan estímulo al otro equipo para
tratar de mejorar al otro. Como resultado, Internet tiene dos navegadores excelentes que
empujan los límites de lo que se puede hacer en la web y el trabajo a través de una variedad
de plataformas.
El proyecto Mozilla ha salido también con Thunderbird, un cliente integral de correo
electrónico de escritorio. Thunderbird se conecta a un servidor POP o IMAP, muestra el correo
electrónico localmente y envía el correo electrónico a través de un servidor SMTP externo.
Otros clientes de correo electrónico notables son Evolution y KMail que son clientes de
correo electrónico de los proyectos GNOME y KDE. Los formatos de estandarización a través
de POP, IMAP y correo electrónico local significa que es fácil cambiar entre clientes de correo
electrónico sin perder datos. El correo electrónico basado en web también es otra opción.
Para los tipos creativos existen Blender, GIMP y Audacity que controlan la creación de
películas 3D, manipulación de imágenes 2D y edición de audio respectivamente. Han tenido
diversos grados de éxito en los mercados profesionales. Blender se utiliza para todo, desde
películas independientes hasta películas de Hollywood, por ejemplo.
Herramientas de Consola
La historia del desarrollo de UNIX muestra una considerable superposición entre las
habilidades de administración de sistemas y desarrollo de software. Las herramientas que te
permiten administrar el sistema tienen funciones de lenguajes de programación tales como
ciclos (loops), y algunos lenguajes de programación se utilizan extensivamente en la
automatización de las tareas de administración de sistemas. Por lo tanto, uno debe considerar
estas habilidades complementarias.
En el nivel básico, interactúan con un sistema Linux a través de un shell sin importar si te
conectas al sistema de forma remota o desde un teclado. El trabajo de shell consiste en
aceptar los comandos, como manipulación de archivos y aplicaciones de inicio y pasarlos al
kernel de Linux para su ejecución. A continuación se muestra una interacción típica con la
shell de Linux:
sysadmin@localhost:~$ ls -l /tmp/*.gz
-rw-r--r-- 1 sean root 246841 Mar 5 2013 /tmp/fdboot.img.gz
sysadmin@localhost:~$ rm /tmp/fdboot.img.gz
El usuario recibe un mensaje, que normalmente termina en un signo de dólar $ para indicar
una cuenta sin privilegios. Cualquier cosa antes del símbolo, en este
caso sysadmin@localhost:~, es un indicador configurable que proporciona información
extra al usuario. En la imagen anterior, sysadmin es el nombre del usuario
actual, localhost es el nombre del servidor, y ~ es el directorio actual (en UNIX, el símbolo
de tilde es una forma corta para el directorio home del usuario). Los comandos de Linux los
trataremos con más detalle más adelante, pero para terminar la explicación, el primer
comando muestra los archivos con el comando ls, recibe información sobre el archivo y luego
elimina ese archivo con el comando rm.
El shell de Linux proporciona un rico lenguaje para iterar sobre los archivos y personalizar el
entorno, todo sin salir del shell. Por ejemplo, es posible escribir una sola línea de comando
que encuentra archivos con un contenido que corresponda a un cierto patrón, extrae la
información del archivo, y luego copia la nueva información en un archivo nuevo.
Linux ofrece una variedad de shells para elegir, en su mayoría difieren en cómo y qué se
puede modificar para requisitos particulares y la sintaxis del lenguaje “script” incorporado. Las
dos familias principales son Bourne shell y C shell. Bourne shell recibió su nombre de su
creador y C shell porque la sintaxis viene prestada del lenguaje C. Como ambos de estos
shells fueron inventados en la década de 1970 existen versiones más modernas, el Bourne
Again Shell (Bash) y tcsh (tee-cee-shell). Bash es el shell por defecto en la mayoría de los
sistemas, aunque casi puedes estar seguro de que tcsh es disponible si lo prefieres.
Otras personas tomaron sus características favoritas de Bash y tcsh y han creado otros shells,
como el Korn shell (ksh) y zsh. La elección de los shells es sobre todo personal. Si estás
cómodo con Bash entonces puedes operar eficazmente en la mayoría de los sistemas Linux.
Después de eso puedes buscar otras vías y probar nuevos shells para ver si ayudan a tu
productividad.
Aún más dividida que la selección de los shells son las alternativas de los editores de texto.
Un editor de texto se utiliza en la consola para editar archivos de configuración. Los dos
campos principales son vi (o vim más moderno) y emacs. Ambos son herramientas
extraordinariamente poderosas para editar archivos de texto, que se diferencian en el formato
de los comandos y manera de escribir plugins para ellos. Los plugins podrían ser cualquier
cosa desde el resaltado de sintaxis de proyectos de software hasta los calendarios integrados.
Ambos vim y emacs son complejos y tienen una curva de aprendizaje extensa. Esto no es útil
si lo que necesitas es editar un pequeño archivo de texto simple. Por lo
tanto pico y nano están disponibles en la mayoría de los sistemas (el último es un derivado
del anterior) y ofrecen edición de texto muy básica.
Incluso si decides no usar vi, debes esforzarte a ganar cierta familiaridad básica porque
el vi básico está en todos los sistemas Linux. Si vas a restaurar un sistema Linux dañado
ejecutando el modo de recuperación de la distribución, seguramente tendrás un vi disponible.
Si tienes un sistema Linux necesitarás agregar, quitar y actualizar el software. En cierto
momento esto significaba descargar el código fuente, configurarlo, construirlo y copiar los
archivos en cada sistema. Afortunadamente, las distribuciones crearon paquetes, es decir
copias comprimidas de la aplicación. Un administrador de paquetes se encarga de hacer el
seguimiento de que archivos que pertenecen a que paquete, y aun descargando las
actualizaciones desde un servidor remoto llamado repositorio. En los sistemas Debian las
herramientas incluyen dpkg, apt-get y apt-cache. En los sistemas derivados de Red Hat
utilizas rpm y yum. Veremos más de los paquetes más adelante.
Herramientas de Desarrollo
No es una sorpresa que siendo un software construido sobre las contribuciones de
programadores, Linux tiene un soporte excelente para el desarrollo de software. Los shells se
construyen para ser programables y existen editores potentes incluidos en cada sistema.
También hay disponibles muchas herramientas de desarrollo y muchos lenguajes modernos
tratan a Linux como un ciudadano de primera clase.
Los lenguajes informáticos proporcionan una manera para que un programador ingrese
instrucciones en un formato más legible por el ser humano y que tales instrucciones sean
eventualmente traducidas en algo que la computadora entiende. Los lenguajes pertenecen a
uno de los dos campos: interpretado o compilado. Un lenguaje interpretado traduce el código
escrito en código de computación mientras se ejecuta el programa, y el lenguaje compilado se
traduce todo a la vez.
Linux fue escrito en un lenguaje compilado llamado C. El beneficio principal del lenguaje C es
que el lenguaje en sí es similar a al código de máquina generado, por lo que un programador
experto puede escribir un código que sea pequeño y eficiente. Cuando la memoria del equipo
se medía en Kilobytes, esto era muy importante. Hoy, incluso con tamaños de memoria de
gran capacidad, el C sigue siendo útil para escribir código que debe ejecutarse rápidamente,
como un sistema operativo.
El C se ha ampliado durante los años. Existe el C++ que añade soporte de objetos al C (un
estilo diferente de programación) y Objective C que tomó otro rumbo y se usa mucho en
productos de Apple.
El lenguaje Java toma un rumbo diferente del enfoque compilado. En lugar de compilar al
código máquina, Java primero imagina un hipotético CPU llamado la Máquina Virtual de Java
(JVM-Java Virtual Machine) y compila todo el código para ésta. Cada equipo host entonces
corre el software JVM para traducir las instrucciones de JVM (llamadas bytecode) en
instrucciones nativas.
La traducción adicional con Java podría hacer pensar que sería lento. Sin embargo, la JVM es
bastante simple, por lo que se puede implementar de manera rápida y confiable en cualquier
cosa, desde un equipo potente hasta un dispositivo de baja potencia que se conecta a un
televisor. ¡Un archivo compilado de Java también se puede ejecutar en cualquier equipo
implementando la JVM!
Otra ventaja de la compilación frente a un objetivo intermedio, es que la JVM puede
proporcionar servicios a la aplicación que normalmente no estarían disponibles en una CPU.
Asignar memoria a un programa es un problema complejo, pero esto está construido dentro de
la JVM. Esto también significa que los fabricantes de la JVM pueden enfocar sus mejoras en la
JVM como un todo, así cualquier mejora está inmediatamente disponible para las
aplicaciones.
Por otra parte, los lenguajes interpretados se traducen a código máquina como se van
ejecutando. La potencia extra del equipo consumida para esta tarea a menudo puede ser
recuperada por el aumento de la productividad del programador, quien gana por no tener que
dejar de trabajar para compilar. Los lenguajes interpretados también suelen ofrecer más
funciones que los lenguajes compilados, lo que significa que a menudo se necesita menos
código. ¡El intérprete del lenguaje generalmente está escrito en otro lenguaje tal como C y a
veces incluso en Java! Esto significa que un lenguaje interpretado se ejecuta en la JVM, que
se traduce durante el tiempo de ejecución al código máquina.
Perl es un lenguaje interpretado. Perl fue desarrollado originalmente para realizar la
manipulación de texto. Con los años, se ganó su lugar entre los administradores de sistemas y
todavía sigue siendo mejorado y utilizado en todo, desde la automatización hasta la
construcción de aplicaciones web.
PHP es un lenguaje que fue construido originalmente para crear páginas web dinámicas. Un
archivo PHP es leído por un servidor web como Apache. Etiquetas especiales en el archivo
indican que partes del código deben ser interpretadas como instrucciones. El servidor web
reúne las diferentes partes del archivo y lo envía al navegador web. Las ventajas principales
del PHP son que es fácil de aprender y está disponible en casi cualquier sistema. Debido a
esto, muchos proyectos populares se construyen en PHP. Los ejemplos notables incluyen
WordPress (blogging), cacti (para monitoreo) e incluso partes de Facebook.
Ruby es otro lenguaje que fue influenciado por Perl y Shell junto con muchos otros lenguajes.
Convierte tareas de programación complejas relativamente fáciles y con la inclusión del marco
de referencia (framework) Ruby on Rails, es una opción popular para crear aplicaciones web
complejas. Ruby es también el lenguaje que potencia muchas de las principales herramientas
de automatización como Chef y Puppet, que hacen que la gestión de un gran número de
sistemas Linux sea mucho más fácil.
Python es otro lenguaje de desarrollo de uso común. Al igual que Ruby facilita las tareas
complejas y tiene un marco de referencia llamado Django que facilita la construcción de las
aplicaciones web. Python tiene capacidades de procesamiento estadístico excelente y es una
de las herramientas favoritas en el mundo académico.
Un lenguaje es una herramienta que te ayuda a decirle al equipo lo que quieres hacer. Una
librería empaqueta las tareas comunes en un paquete distinto que puede ser utilizado por el
desarrollador. ImageMagick es una librería o biblioteca que permite a los programadores
manipular las imágenes en código. ImageMagick también incluye algunas herramientas de
línea de comandos que le permiten procesar las imágenes desde un shell y aprovechan las
capacidades de scripting.
OpenSSL es una librería criptográfica que se utiliza en todo, desde servidores web hasta la
línea de comandos. Proporciona un interfaz estándar para que puedas agregar criptografía en
tu programa de Perl, por ejemplo.
En un nivel mucho más bajo está la librería de C. Esto proporciona un conjunto básico de
funciones para leer y escribir a los archivos y pantallas que son utilizadas por las aplicaciones
y otros lenguajes por igual.