El Lenguaje C
El Lenguaje C
El Lenguaje C
Aprender a programar no es lo mismo que aprender un lenguaje de programacin. Los conceptos importantes de la programacin que aparecen en un lenguaje generalmente son traspasables a otro. En trminos de paradigmas de programacin, C y Python pueden ser clasificados como lenguajes procedurales, y como tales comparten muchos de sus componentes fundamentales: expresiones, variables, sentencias, condicionales, ciclos, funciones, etctera. Sintcticamente, ambos lenguajes se ven diferentes a simple vista, pero veremos que muchas de las diferencias son slo cosmticas:
es_primo = True for d in range(2, n): if n % d == 0: es_primo = False break es_primo = 1; for (d = 2; d < n; d++) { if (n % d == 0) { es_primo = 0; break; } }
No todas las diferencias sintcticas son tan sutiles, y haremos nfasis en las que son ms importantes. Ms all de las diferencias visibles en el cdigo, ambos lenguajes son fundamentalmente diferentes en la manera que usan los recursos del computador. Estas diferencias no son apreciables con slo mirar el cdigo, sino que deben ser comprendidas desde el principio. La imagen mental que uno se forma sobre el programa que est escribiendo es mucho ms importante al programar en C que en Python. Este apunte est diseado para que usted pueda familiarizarse rpidamente con el lenguaje C despus de haber aprendido Python. No nos detendremos mucho tiempo en aspectos que son similares a Python, sino que nos enfocaremos en las diferencias.
Cuando programamos en Python, en cierto modo estamos haciendo trampa. El cdigo Python no es ejecutado fsicamente por el computador, sino por un intrprete, que es el programa que ejecuta los programas. El lenguaje C permite hacer menos trampa, ya que s es un medio para dar instrucciones al procesador. El procesador es el componente del computador que ejecuta las instrucciones de un programa. Las instrucciones que el procesador recibe no estn en un lenguaje de programacin como Python o C, sino en un lenguaje de mquina, que es mucho ms bsico. Cada procesador viene diseado de fbrica para entender su propio lenguaje de mquina, que se compone de instrucciones muy bsicas, como leer un dato, aplicar una operacin sobre un par de datos o saltar a otra parte de la memoria para leer una nueva instruccin. Si bien es posible programar directamente en el lenguaje de la mquina, esto es extremadamente engorroso, y lo ms probable es que usted nunca tenga la necesidad de hacerlo. Decimos que el lenguaje de mquina es de bajo nivel, que en computacin no es un trmino peyorativo, sino que significa que est tan ligado al hardware que no es lo suficientemente expresivo para describir algoritmos de manera abstracta. Es ms razonable programar en un lenguaje de programacin de alto nivel, que nos ofrezca abstracciones como: variables, condicionales, ciclos, funciones, tipos de datos, etc., que permiten describir algoritmos en trminos ms humanos y menos ferreteros. C y Python son lenguajes tales, pero difieren en la forma en que son ejecutados. Python es un lenguaje pensado para ser interpretado, mientras que C debe ser compilado. Un programa llamado compilador recibe como entrada el cdigo C y genera como salida cdigobinario que el procesador es capaz de entender. El binario puede ser un programa ejecutable, o una biblioteca con funciones que pueden ser llamadas desde un programa.
.c Compilador BIN Procesador
A pesar de que el compilador acta de intermediario entre nuestro cdigo y el procesador, el lenguaje C sigue siendo de ms bajo nivel que Python. El programador tiene la libertad (y la responsabilidad) de lidiar con aspectos de la ejecucin que no son accesibles desde Python. Principalmente, la administracin de la memoria que usa el programa.
Lecturas adicionales
Aqu termina el bla bla de este apunte. De aqu en adelante, usted estar probando y analizando lnea por lnea programas enteros escritos en C. Para profundizar acerca de la relevancia del lenguaje C y las razones para estudiarlo, le sugerimos leer los siguientes enlaces.
cd sirve para cambiar el directorio actual, pwd muestra el directorio actual, ls muestra los archivos en el directorio actual.
Esta instruccin indica a GCC que debe compilar el archivo fuente test.c, y crear un binario ejecutable llamado test. La opcin -o seala que lo que viene a continuacin es el nombre del archivo de salida (output) que debe ser creado por el compilador. Si usted omite esta opcin, entonces el ejecutable ser creado con el nombrea.out:
$ ls test.c $ gcc test.c $ ls a.out test.c
Para programas pequeos como los que haremos aqu no es mucho lo que ayuda, pero conviene aprender a usarlo porque es muy utilizado para automatizar la compilacin de proyectos ms grandes. Al ejecutar make, no se debe indicar cmo compilar, sino lo que uno quiere obtener. En nuestro caso, es el ejecutable test:
$ ls test.c $ make test cc test.c -o test $ ls test test.c $
Make sabe que si queremos obtener un binario llamado test, y en el directorio hay un archivo fuente llamado test.c, lo que hay que hacer es invocar al compilador de C. Por omisin, make usa el compilador cc cuando le toca compilar un archivo .c. De todos modos, lo ms probable es que en su sistema cc sea un enlace simblico a gcc:
$ which cc /usr/bin/cc $ ls -o /usr/bin/cc lrwxrwxrwx. 1 root 3 ene 5 22:01 /usr/bin/cc -> gcc $
Para indicar explcitamente a make que utilice el compilador GCC (o cualquier otro) para compilar, se debe asignar el nombre del compilador a la variable de entorno CC usando la instruccin export:
$ make test cc test.c -o test $ rm test $ export CC=gcc $ make test gcc test.c -o test $
Una de las gracias de make es que slo hace la compilacin si es que el archivo con el cdigo ha sido modificado desde la ltima vez que se compil. Si no ha habido cambios desde entonces, make no hace nada:
$ ls test.c
$ make test cc test.c -o test $ make test make: `test' est actualizado. $
Ejecucin de un programa
Para ejecutar un programa, se debe escribir su nombre precedido de ./ desde el mismo directorio donde qued el ejecutable:
$ ./test Felicidades! Usted ha ejecutado el programa test.
Ahora que sabemos compilar y ejecutar programas, analizaremos varios programas en orden creciente de complejidad, e iremos presentando gradualmente las caractersticas de C.
Hola mundo
El siguiente es un programa que le muestra al usuario el mensaje Hola mundo:
#include <stdio.h> int main() { printf("Hola mundo\n"); return 0; }
Escriba este programa en su editor favorito. No copie y pegue, escrbalo a mano! As se ir familiarizando con la sintaxis del lenguaje. Guarde el programa con el nombre hola.c. Compile el programa. Si el programa no compila, entonces cometi algn error al transcribirlo. Lea el mensaje de error del compilador, descubra los errores, y arregle el programa todas las veces necesarias hasta que compile y se ejecute correctamente.
Funcin main
En un programa en C, todas las instrucciones deben estar dentro de una funcin.
Todos los programas deben tener una funcin con nombre main. El cdigo que est dentro de la funcinmain es lo que hace el programa cuando es ejecutado. La lnea int main() es la que indica que el cdigo que viene a continuacin, entre los parntesis de llave ({ y }) es parte de esta funcin. Cuando la funcin main retorna un valor, entonces el programa se termina. El valor que debe retornar debe ser un entero (esto es lo que significa el int de la definicin). Si el programa se ejecuta correctamente, entonces debe retornarse cero. Si se retorna un valor distinto de cero, se est indicando que ocurri algn error durante la ejecucin del programa. Como regla general, al final de la funcin main siempre debe ir un return 0, como en el ejemplo. En C, todas las sentencias deben obligatoriamente terminar con un punto y coma.
A diferencia del print de Python, printf no pone un salto de lnea al final del mensaje. El salto de lnea debe ser agregado explcitamente usando su representacin \n. Por ejemplo, el siguiente cdigo tambin imprime el mensaje Hola mundo en una nica lnea, y pone un salto de lnea al final:
printf("Ho"); printf("la mu"); printf("ndo\n");
Inclusin de cabeceras
Tcnicamente, la funcin printf no es parte del lenguaje (como lo es el print de Python), sino que es parte de la biblioteca estndar de C. La biblioteca estndar es una coleccin de funciones, constantes y tipos que son comnmente usados en la mayora de los programas. Basta con tener instalado el compilador de C para tener toda la biblioteca estndar a disposicin.
Para poder usar una funcin en un programa, ella debe ser declarada en alguna parte del cdigo. Afortunadamente, la biblioteca estndar provee archivos de cabecera (header files) que contienen las declaraciones de todas sus funciones, organizadas de acuerdo a su utilidad. Los archivos de cabecera suelen tener nombres terminados en la extensin .h. La funcin printf est declarada en el archivo de cabecera stdio.h, que agrupa las funciones de entrada y salida (io) de la biblioteca estndar (std). Para poder usar la funcin, hay que incluir la cabecera usando la directiva #include, tal como se muestra en el ejemplo. Ms adelante veremos otros archivos de cabecera. Tambin podremos crear nuestras propias bibliotecas, que requerirn sus respectivas cabeceras.
Ejercicios
Modifique el programa para que imprima el siguiente haiku:
Al programar, cuando digo "hola mundo", aprendo C.
Puede hacerlo con un nico printf o con varios. Averige cmo hacer para imprimir las comillas. Qu ocurre si la funcin tiene un nombre diferente de main? Qu ocurre si omite la lnea del include? Qu ocurre si no pone el return 0? Haga la prueba.
scanf("%d", &nacimiento); printf("Ingrese el anno actual: "); scanf("%d", &actual); edad = actual - nacimiento; printf("Usted tiene %d annos de edad\n", edad); return 0; }
Como siempre, el cdigo del programa debe estar includo dentro de una funcin llamada main, y la ltima sentencia del programa debe ser return 0. Escriba, compile y ejecute este programa.
Declaracin de variables
Este programa utiliza tres variables, llamadas nacimiento, actual y edad. En Python, las variables eran creadas automticamente al momento de asignarlas por primera vez:
nacimiento = int(raw_input("Ingrese su anno de nacimiento: ")) actual = int(raw_input("Ingrese el anno actual: ")) edad = actual - nacimiento
En C no es as. Las variables deben ser declaradas antes de ser usadas. Adems, uno debe indicar de qu tipo sern los datos que se almacenarn en cada variable. Una variable slo puede almacenar valores de un nico tipo. Las tres primeras sentencias del programa declaran las variables nacimiento, actual y edad para almacenar valores de tipo int (entero). En C, todas las declaraciones deben cumplir con esta sintaxis:
tipo variable;
Por qu es necesario declarar las variables? Una caracterstica del lenguaje C es que entrega al programador el poder (y la responsabilidad) de decidir muy de cerca cmo usar la memoria del computador. En Python, al contrario, el intrprete decide por uno cundo, cmo y cunta memoria el
programa utilizar, lo que es muy conveniente a la hora de programar pero que puede conducir a un uso ineficiente de los recursos disponibles en ciertas ocasiones. En nuestro programa de ejemplo, el compilador analizar el cdigo y sabr que el programa slo almacenar tres valores, y que cada uno slo necesitar el espacio suficiente para guardar un nmero entero. Todo esto ocurre antes de que el programa sea siquiera ejecutado por primera vez!
nacimiento es el valor que tiene la variable nacimiento, &nacimiento es la ubicacin en la memoria de la variable nacimiento .
El operador & se lee como la direccin de. Ms adelante veremos qu significa esto. En resumen, la sentencia:
scanf("%d", &nacimiento);
La funcin printf imprime slo strings, no enteros. Sin embargo, es posible insertar enteros dentro del mensaje usando descriptores de formato idnticos a los de la funcin scanf. En las posiciones del string en las que se desea mostrar un nmero entero, debe insertarse el texto %d. Luego, cada uno de los valores enteros por imprimir deben ser pasados como parmetros adicionales a la funcin. Los siguientes ejemplos muestran usos correctos e incorrectos de printf. Haga el ejercicio de darse cuenta de los errores:
/* Correctos */ printf("Hola mundo\n"); printf("Usted tiene %d annos.", edad); printf("Usted tiene %d annos.\n", edad); printf("Usted tiene 18 annos."); printf("Usted tiene %d annos.", 18); printf("Usted tiene %d annos y %d meses.", edad, meses); /* Incorrectos */ printf("Usted tiene %d annos."); printf("Usted tiene annos.", edad); printf("Usted tiene annos.", 18); printf("Usted tiene", edad, "annos."); printf("Usted tiene edad annos."); printf("Usted tiene"); printf(edad); printf("annos."); printf("Usted tiene %d annos y %d meses.", edad);
Ejercicio
Escriba un programa que pregunte al usuario las notas de sus cuatro certmenes, y le muestre cul es su promedio, con decimales:
Nota 1: 37 Nota 2: 95 Nota 3: 77 Nota 4: 50 Su promedio es 64.75
Para declarar una variable de tipo real, se debe indicar que el tipo es float. Para leer y para mostrar un nmero real con decimales, se usa el descriptor de formato %f.
Nmeros primos
El siguiente programa muestra la cantidad de nmeros primos indicada por el usuario:
#include <stdio.h> int main() { int primos_por_mostrar, n, d; int es_primo; printf("Cuantos primos desea mostrar: "); scanf("%d", &primos_por_mostrar); n = 2; while (primos_por_mostrar > 0) { /* determinar si n es primo */ es_primo = 1; for (d = 2; d < n; ++d) { if (n % d == 0) { es_primo = 0; break; } } /* mostrar el numero * y actualizar el contador */ if (es_primo) { printf("%d ", n); primos_por_mostrar--; } n++; } printf("\n"); return 0; }
En este programa, vemos que es posible declarar varias variables del mismo tipo en una nica sentencia (primos_por_mostrar , n y d). Tambin aprovechamos de presentar cmo se hacen los comentarios en C: comienzan con /* y terminan con */. Escriba, compile y ejecute este programa.
(Aunque al compilador la indentacin no le interesa, a los seres humanos s les ayuda a entender mejor el cdigo, por lo que no indentar es una psima idea.) Al igual que en Python, el if puede ir seguido de un else. El elif de Python no existe en C, pues es legal escribir else if. El ciclo for es un poco diferente. Entre los parntesis tiene tres partes separadas por punto y coma:
for (inicializacion; condicion; actualizacion) { /* ... */ }
La inicializacin se ejecuta una vez, antes de iniciar el ciclo. Aqu se suele asignar un valor inicial a un contador. La actualizacin es la parte donde se modifica el valor del contador al final de cada iteracin. La condicin es evaluada despus de cada actualizacin, para decidir si se contina o no ejecutando el ciclo. Algunos ejemplos de ciclos for en C, junto con sus equivalentes en Python:
for for for for (i (i (i (i = = = = 0; i 5; i 2; i 40; < N; ++i) /* for i in range(N): */ < 10; ++i) /* for i in range(5, 10): */ < 30; i += 2) /* for i in range(2, 30, 2): */ i > 0; --i) /* for i in range(40, 0, -1): */
Ambas modifican el valor de n de la misma manera, pero existe una diferencia sutil entre ambos que por ahora omitiremos.
Valores lgicos
En C no existe un tipo de datos para representar valores lgicos, como el tipo bool de Python. En C, los valores lgicos son enteros. El valor cero es interpretado como falso, y cualquier otro valor como verdadero. Como ilustracin, nuestro programa usa la variable es_primo para recordar si el nmero n que se est analizando en cada iteracin es o no primo. Esta variable es entera, y su valor es cambiado a cero apenas se encuentra un divisor. Como los enteros pueden ser interpretados como valores lgicos, el ciclo while de nuestro programa tambin podra haber sido escrito as:
while (primos_por_mostrar) { /* ... */ }
ya que esto tambin hara que el ciclo terminara cuando la variable llega a cero, porque en este caso sera interpretado como una condicin falsa. Haga la prueba, y convnzase de que funciona.
Por ejemplo, si uno quisiera modificar el programa para que mostrara slo los nmeros compuestos que terminan en 7, habra que cambiar la condicin del ltimo if por la siguiente:
if (!es_primo && n % 10 == 7) { /* ... */ }
Los operadores ==, !=, <, >, <= y >= funcionan de la misma manera que en Python. Uno de los errores ms comunes en C es confundir el operador de igualdad == con la asignacin =. En C es legal poner una asignacin dentro de la condicin de un if o de un while, por lo que un programa como ste:
if (x = 2) { /* ... */ }
compilar y se ejecutar sin errores, pero probablemente no har lo que nosotros esperamos: en vez de verificar que x vale 2, modificar x para que lo valga!
Ejercicios
Modifique el programa de arriba para que, en vez de mostrar una cierta cantidad de nmeros primos, muestre todos los nmeros primos menores que m. A continuacin, modifquelo para que en lugar de mostrar slo los nmeros primos los muestre todos, indicando para cada uno de ellos si es primo o compuesto:
2 primo 3 primo 4 compuesto 5 primo 6 compuesto ...
Calculadora simple
El siguiente programa es una calculadora simple:
#include <stdio.h> float potencia(float base, int exponente) { float resultado = 1; int i; for (i = 0; i < exponente; ++i) { resultado *= base; } return resultado; } int main() { float x, y, resultado; char op; int valido = 1; printf("Ingrese operacion: "); scanf("%c", &op); printf("Ingrese x: "); scanf("%f", &x); printf("Ingrese y: "); scanf("%f", &y); switch (op) { case '+': resultado = break; case '-': resultado = break; case '*': case 'x': resultado = break; case '/': resultado = break; case '^': resultado = break; default: valido = 0; }
x + y; x - y;
Al ejecutar el programa, primero uno ingresa la operacin que ser aplicada, que puede ser: Sign o
+ * / ^
La multiplicacin tambin puede ser indicada con una x minscula. A continuacin, se debe ingresar los dos operandos. Finalmente, el programa muestra el resultado de la operacin. Escriba, compile y ejecute este programa. En este programa puede ver que es posible asignar un valor inicial a una variable al momento de declararla:
float resultado = 1.0; int valido = 1;
Tambin note que tanto en el if como en el else del final se ha omitido los parntesis de llave ({}) ya que en ambos casos hay includa solamente una nica sentencia.
Definicin de funciones
Al principio del programa, se ha definido una funcin llamada potencia . Ella recibe como parmetros la base (un nmero real) y el exponente (un entero), y retorna el resultado de elevar la base al exponente.
En C no existe un operador elevado a (como el ** de Python), por lo que s es til definir una funcin como sta. Es necesario especificar explcitamente cul ser el tipo del valor retornado (en este caso float) y los tipos de cada uno de los parmetros (en el ejemplo, float e int). Las variables declaradas dentro de la funcin se llaman variables locales. Estas variables comienzan a existir al momento de llamar a la funcin, y desaparecen cuando la funcin termina. Son invisibles desde fuera de la funcin. En nuestro programa, las dos funciones main y potencia tienen una variable local llamada resultado. Ambas variables son distintas, y sus valores respectivos estn almacenados en regiones diferentes de la memoria.
Tipo char
El tipo char se usa para representar caracteres (smbolos) solitarios. La variable op que almacena la operacin es de este tipo. Un valor de tipo char se representa en un programa entre comillas simples. Por ejemplo, el signo ms est representado como '+'. Tcnicamente, los valores de tipo char son nmeros enteros que estn comprendidos entre 128 y 127. Cada nmero est asociado a un caracter a travs de la tabla ASCII. Los enteros y los caracteres asociados son intercambiables; por ejemplo, la expresin 'm' == 109 es evaluada como verdadera. No hay que confundir un caracter con un string de largo uno: 'a' y "a" son dos cosas distintas.
Sentencia switch
El switch es una sentencia de control condicional que permite indicar qu hacer si el resultado de una expresin es igual a alguno de ciertos valores constantes indicados Un ejemplo de uso de switch es el siguiente:
switch (expresion) { case 1: /* que hacer cuando expresion == 1 */ case 2: /* que hacer cuando expresion == 2 */
default: /* que hacer cuando la expresion no es igual * a ninguno de los casos anteriores */ }
Cuando el resultado de la expresin es igual a alguno de los valores indicados, la ejecucin del programa salta al case con ese valor. Si el valor con el resultado no existe, salta a default. Hay que tener cuidado con una caracterstica extraa del switch: cuando se cumple un caso, los casos que vienen a continuacin tambin se ejecutan. En este ejemplo:
si expresion == 1, el programa saltar a case 1, y luego continuar con case 2 y default; si expresion == 2, el programa saltar a case 2, y luego continuar con default; si expresion no es ni 1 ni 2, el programa saltar a default.
Para evitar que los casos siguientes sean ejecutados, debe ponerse un break al final de cada caso. Esto es lo que se hizo en el programa de la calculadora.
Conversin de tipos
El segundo parmetro de la funcin potencia es entero, pero los operandos ingresados por el usuario son almacenados como nmeros reales. Para convertir el exponente de real a entero, basta con anteponer al valor el tipo entre parntesis. En este caso particular, la conversin se hace truncando los decimales del nmero real. As, si y vale 5.9, entonces (int) y vale 5. Para conversiones entre otros tipos, se siguen otras reglas diferentes. En ingls, el nombre de esta operacin es cast. Posiblemente usted escuche ms de una vez a alguien refirindose a esta operacin como castear.
Ejercicios
Modifique el programa de modo que soporte una nueva operacin: obtener el coeficiente binomial entre xe y. Esta operacin debe ser indicada con el smbolo b:
Ingrese operacion: b
El coeficiente binomial es una operacin entre nmeros enteros. Tenga cuidado y use conversiones apropiadas.
Promedios de alumnos
El siguiente programa pide al usuario ingresar las notas de uno o ms alumnos, y va mostrando los promedios de cada uno de ellos:
#include <stdio.h> float promedio(int valores[], int cantidad) { int i; float suma = 0.0; for (i = 0; i < cantidad; ++i) suma += valores[i]; return suma / (float) cantidad; } int main() { int notas[10]; char nombre[20]; char opcion[3]; int n, i; do { printf("Ingrese nombre del alumno: "); scanf("%s", nombre); printf("Cuantas notas tiene %s? ", nombre); scanf("%d", &n); for (i = 0; i < n; ++i) { printf(" Nota %d: ", i + 1); scanf("%d", ¬as[i]); } printf("El promedio de %s es %.1f\n", nombre, promedio(notas, n));
printf("Desea calcular mas promedios (si/no)? "); scanf("%s", opcion); } while (opcion[0] == 's' || opcion[0] == 'S'); return 0; }
El especificador de formato %.1f sirve para mostrar un nmero float con una cifra decimal. Por ejemplo, una ejecucin del programa podra verse as:
Ingrese nombre del alumno: Perico Cuantas notas tiene Perico? 5 Nota 1: 17 Nota 2: 26 Nota 3: 66 Nota 4: 41 Nota 5: 30 El promedio de Perico es 36.0 Desea calcular mas promedios (si/no)? si Ingrese nombre del alumno: Yayita Cuantas notas tiene Yayita? 3 Nota 1: 15 Nota 2: 70 Nota 3: 91 El promedio de Yayita es 58.7 Desea calcular mas promedios (si/no)? no
Arreglos
Un arreglo es una regin continua en la memoria del computador en la que se almacenan varios valores del mismo tipo. En C se usa los arreglos como colecciones de valores, tal como se haca con las listas de Python. Un arreglo llamado notas de tipo int y tamao 10 se declara de la siguiente manera:
int notas[10];
Los arreglos son mucho ms limitados que las listas de Python. Todos los elementos de un arreglo deben ser del mismo tipo. El tamao de un arreglo est fijo, y debe
estar especificado al momento de compilar el programa. Por ejemplo, es ilegal hacer lo siguiente:
int n; scanf("%d", &n); float arreglo[n]; /* ilegal */
Por lo tanto, lo que suele hacerse es declarar arreglos suficientemente grandes, y llevar la cuenta de cuntos elementos han sido asignados. Hay que tener en cuenta que, al igual que todas las variables, cada elemento del arreglo siempre tiene un valor, aunque no haya sido asignado explcitamente:
int a[5]; a[0] = 1000; a[1] = 700; printf("%d\n", a[2]); /* Esto algo va a imprimir, pero no sabemos que. */
Cada elemento est identificado a travs de su ndice, que es su posicin dentro del arreglo. Los ndices parten de cero: si el arreglo tiene diez elementos, entonces los ndices van de cero a nueve. Cada elemento del arreglo puede ser considerado por s solo como una variable, a la que se accede usando el ndice entre corchetes:
int a[10]; /* Todas las instrucciones a continuacion son validas. */ a[0] = 5; a[1] = a[0] + 3; a[0]++; a[2] = (a[0] + a[1]) / 2.0;
Es ilegal tratar de acceder a un elemento del arreglo cuyo ndice est fuera de los lmites definidos por su tamao. Lamentablemente, nunca se verifica que los ndices utilizados sean vlidos, ni al momento de compilar ni durante la ejecucin del programa. Esto es una fuente de errores difciles de detectar. Por ejemplo, al ejecutar este cdigo el programa podra seguir funcionando, o tambin podra caerse estrepitosamente:
int a[10]; a[20] = 5; /* ilegal */
La funcin promedio recibe como primer parmetro el arreglo con los valores que se van a promediar. Lo ideal es que la funcin sirva para arreglos de cualquier tamao, no slo para los de tamao 10 como el del ejemplo. En la declaracin del parmetro, hay que especificar que se trata de un arreglo, pero no su tamao. Para esto, hay que poner los corchetes sin el tamao:
int valores[]
Sin embargo, cada vez que se llame a la funcin s es importante conocer el tamao del arreglo. De otro modo, sera imposible saber hasta qu valor promediar. Por lo tanto, es imprescindible pasar el tamao del arreglo como parmetro adicional, que en esta funcin hemos bautizado como cantidad. Note que aunque siempre estamos pasando el mismo arreglo notas a la funcin, cantidad no necesariamente tiene el mismo valor cada vez. Esto no es importante para la funcin, que operar slo con la cantidad de valores que se le indica. Eso s, la cantidad debe ser siempre menor o igual que el tamao verdadero del arreglo (en este caso, 10).
Strings
En C no existe un tipo de datos para representar los strings, como el tipo str de Python. En C, un string es simplemente un arreglo de caracteres. Ya vimos que los arreglos deben tener un tamao fijo. Sin embargo, en general uno no conoce de antemano el largo de los textos que sern almacenado. Esto en teora representa un problema: cmo sabe el programa cules de los caracteres del arreglo son parte del texto, y cules son simplemente caracteres que estn all slo porque el arreglo es ms largo de lo que corresponde? La manera con la que C resuelve este problema es marcando el final del texto con un caracter especial representado como '\0'. Por ejemplo, despus de ingresar el nombre Perico, el contenido del arreglo nombre podra ser el siguiente:
0 1 2 3 4 5 6 7 8 ... 19 nombre: P e r i c o \0 x m ... q
Lo que hay a continuacin del caracter '\0' es irrelevante. Todas las operaciones de strings saben que el texto llega solamente hasta ah. Como el texto "Perico" tiene seis caracteres, se utilizar siete casillas del arreglo para almacenarlo. En general, siempre debe declararse un arreglo de caracteres cuyo tamao sea uno ms que el ms largo de los textos que se podra almacenar. Para leer un string como entrada usando la funcin scanf, se debe usar el descriptor de formato %s. Una diferencia importante con la lectura de otros tipos de variables es que, al leer strings, el segundo parmetro del scanf no debe ir con el operador &, sino que debe ser la variable desnuda:
scanf("%s", nombre);
Hay una razn tcnica muy precisa para esto que ser ms sencilla de comprender una vez que sepamos ms sobre la organizacin de la memoria, pero por ahora aceptmoslo como un dogma: los strings se leen sin &, valores de otros tipos con &. Todas las operaciones de strings estn implementadas como funciones cuyas declaraciones estn en la cabecera string.h:
strlen(s) retorna el largo del string s, sin incluir el '\0' del final. strcpy(s, t) copia el contenido del string t en el string s; es necesario que el
char s[30], t[30]; strcpy(s, "Hola "); strcpy(t, "mundo"); strcat(s, t); printf("%s\n", s); /* imprime Hola mundo */ printf("%d\n", strlen(s)); /* imprime 10 */
Ciclo do-while
El do while es un ciclo similar al while. El cdigo es ejecutado mientras la condicin es verdadera. La nica diferencia es que la condicin del do while es evaluada al final de cada iteracin, mientras que la del while es evaluada al principio. En otras palabras, esto significa que el do while hace algo una o ms veces, mientras que el while lo hace cero o ms veces.
En nuestro programa de ejemplo es apropiado usar do while, ya que no tiene sentido ejecutar el programa para no calcular ningn promedio. Por lo tanto, calculamos uno y al final decidimos si queremos continuar. La sintaxis del ciclo do while es:
do { /* ... */ } while (condicion);
Ejercicios
Qu ocurre con el programa si intenta ingresar ms de una palabra al ingresar el nombre de un alumno (por ejemplo el nombre completo: Perico Los Palotes)? Haga la prueba. Investigue cmo hacer para que el programa sea capaz de leer un nombre con espacios. Qu ocurre si intenta ingresar un nombre que tenga ms de 20 caracteres, como por ejemploPeriiiiiiiiiiiiiiiiico)? Haga la prueba.
struct persona { char nombre[LARGO_NOMBRE + 1]; char rut[LARGO_RUT + 1]; struct fecha fecha_nacimiento; }; int fecha_es_valida(struct fecha f) { int dias_mes[] = {0, 31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31}; if (f.mes < 1 || f.mes > 12) return 0; if (f.dia < 1 || f.dia > dias_mes[f.mes]) return 0; return 1; } int main() { struct persona p; printf("Nombre completo: "); scanf("%[^\n]", p.nombre); printf("Rut: "); scanf("%s", p.rut); printf("Fecha de nacimiento (dia mes anno): "); scanf("%d", &p.fecha_nacimiento.dia); scanf("%d", &p.fecha_nacimiento.mes); scanf("%d", &p.fecha_nacimiento.anno); if (!fecha_es_valida(p.fecha_nacimiento)) { fprintf(stderr, "Fecha es invalida\n"); exit(1); } printf("\n"); printf("%s tiene %d annos.\n", p.nombre, ANNO_ACTUAL - p.fecha_nacimiento.anno); exit(0); }
Adems, el programa verifica que la fecha de nacimiento sea vlida, revisando que el mes est entre 1 y 12, y que el da tenga sentido para ese mes. Para simplificar, nos hemos echado los aos bisiestos al bolsillo.
Macros de preprocesador
La primera cosa extraa que vemos en este programa son las lneas que comienzan con #define. Estas lneas son instrucciones para el preprocesador, que es un componente del compilador que hace algunas sustituciones en el cdigo antes de que comience realmente a ser compilado. Estas sustituciones se llaman macros, y son definidas por el programador usando la instruccin #define. Cada vez que aparece la macro en el cdigo, el preprocesador la reemplaza literalmente por lo que aparezca a su derecha en el #define. Es comn usar macros para definir una nica vez al principio del programa los largos de los arreglos. Estos valores suelen aparecer muchas varias veces durante el programa; por ejemplo, en las declaraciones y en los ciclos que los recorren. En nuestro programa, hemos definido las macros LARGO_NOMBRE y LARGO_RUT , que son los largos de los strings. Si ms adelante uno quisiera modificar el programa para que alguno de estos strings tenga un largo diferente, bastara con modificar la macro asociada para que automticamente el programa siga estando correcto. Hay que tener muy claro que las macros no son variables. Son slo abreviaciones que son reemplazadas tal cual cada vez que aparecen en el cdigo. Para distinguirlas de las variables, se sigue la convencin de ponerle a las macros nombres en maysculas. En la lnea de comandos, usted puede usar el programa cpp para ver cmo queda el cdigo despus de ser preprocesado:
$ cpp personas.c
Estructuras
Una estructura es un tipo de datos que agrupa varios valores en uno solo. A diferencia de los arreglos, los componentes de una estructura pueden ser de tipos diferentes.
Las estructuras en C se usan para lo mismo que las tuplas en Python: para agrupar datos que, por su naturaleza, deben ser tratados como un nico valor. El ejemplo tpico es crear una estructura para almacenar una fecha:
struct fecha { int dia; int mes; int anno; };
Esta definicin crea un nuevo tipo de datos llamado struct fecha, que contiene tres valores enteros. El punto y coma despus de la llave es obligatorio; un error muy comn es omitirlo. Una variable de tipo struct fecha debe ser declarada de la misma forma que las dems variables:
struct fecha f;
Una vez declarada la variable f, sus miembros pueden ser accedidos poniendo su nombre despus de un punto:
f.dia = 21; f.mes = 5; f.anno = 1879;
Note que las estructuras no se desempaquetan como las tuplas de Python. No es necesario ya que se puede acceder a los campos a travs de su nombre, y no por su posicin. Los campos de una estructura pueden ser de cualquier tipo, incluso arreglos u otra estructura. En el ejemplo, la estructura persona est compuesta de dos strings y una estructura fecha.
Al inicializar el arreglo de esta manera no es necesario especificar su tamao. En nuestro programa, el arreglo dias_mes ser de largo trece. La misma sintaxis se puede usar para inicializar los elementos de una estructura:
struct fecha hoy = {29, 2, 2011};
La sintaxis de inicializacin slo puede ser usada en la misma declaracin, no ms adelante en el programa:
int a[5]; a = {900, 100, 600, 300, 200}; /* Esto es ilegal. */
En todos los programas en C, la salida estndar est disponible para escribir cosas en ella. Pero adems los programas tienen tambin otro flujo de datos, llamado salida de error, que est destinada exclusivamente para escribir en ella mensajes de error. Los nombres de las salidas estndar y de error en un programa son, respectivamente, stdin y stderr. En nuestro programa, usamos la salida de error para imprimir un mensaje antes de abortar el programa cuando se ha ingresado una fecha invlida. Para esto, usamos la funcin fprintf. Esta funcin es muy parecida a printf , salvo que recibe como primer parmetro el flujo de datos en que se escribir el mensaje. Ms adelante utilizaremos fprintf para escribir datos en archivos. Por omisin, ambas salidas estn conectadas con la consola, por lo que los mensajes impresos en ambas aparecen mezclados unos con otros, sin distincin. La gracia es que es posible redirigir por separado a cualquiera de ellas hacia otros mecanismos de salida, como un archivo, o de frentn suprimirlos. Por lo tanto, es una buena prctica escribir los mensajes de error en stderr.
Ejercicios
Qu imprime el siguiente programa? Pruebe el programa y explique el resultado.
#include <stdio.h> #define DOS 1 + 1 #define SIETE 3 + 4 int main() { int m = DOS * SIETE; printf("%d\n", m); return 0; }
La memoria puede ser vista como un gran arreglo de bits. Un bit es la unidad bsica de informacin que se puede representar en un computador, y puede tener los valores 0 o 1:
Memoria ...0001001111011000001010110111110001010011...
Los bits estn agrupados en bytes. En cualquier computador moderno, un byte est formado por ocho bits:
...0001001111011000 001010110111110001010011...
Para que no pase vergenzas: byte se pronuncia bait. Cualquier valor que aparezca en un programa debe ser representado como uno o varios bytes. Tanto el tamao como la manera de interpretar un valor estn determinados por su tipo de datos.
Tipos de datos
El tamao de un valor de tipo char es de 1 byte, y el significado de los bits est determinado usando la codificacin ASCII (pronnciese asqui). Una variable de tipo char estar almacenada, por lo tanto, en uno de los bytes de la memoria. Casi nunca nos interesar cules son exactamente los bits del valor, por lo que podemos considerar que lo que hay en ese byte es un caracter:
char a; a ... 'u' 11011000001010110111110001010011...
El tamao de un int no es igual en todas las plataformas. Si su procesador tiene una arquitectura de 32 bits, lo ms probable es que los enteros sean de 4 bytes. Si es de 64 bits, probablemente son de 8 bytes. Los enteros son almacenados en su representacin binaria. La manera ms comn de representar los enteros negativos es el complemento a dos.
El operador sizeof entrega el tamao en bytes de una variable o de un tipo. Para conocer los tamaos que tienen varios tipos de datos en la plataforma que est usando, ejecute el siguiente programa:
#include <stdio.h> int main() { printf("Tama~nos de los tipos:\n"); /* Tipos enteros */ printf("char: %u bytes\n", sizeof(char)); printf("int: %u bytes\n", sizeof(int)); printf("long int: %u bytes\n", sizeof(long int)); printf("short int: %u bytes\n", sizeof(short int)); /* Tipos reales */ printf("float: %u bytes\n", sizeof(float)); printf("double: %u bytes\n", sizeof(double)); return 0; }
Direcciones de memoria
Todos los bytes en la memoria tienen una direccin, que no es ms que un ndice correlativo. Por conveniencia, las direcciones de memoria suelen escribirse en notacin hexadecimal, pero no hay que espantarse: se trata simplemente de un nmero entero.
Direccin Valor ... 0xf1e568 00010011 0xf1e569 11011000 0xf1e56a 00101011 0xf1e56b 01111100 0xf1e56c 01010011 ...
En C, el operador unario & permite obtener la direccin de la memoria en que est almacenada una variable, o ms precisamente, la direccin de su primer byte.
Las variables locales de una funcin estn almacenadas consecutivamente en una regin de la memoria llamada pila de llamadas. Copie y ejecute este programa, e interprete cmo estn distribuidas las variables en la pila:
#include <stdio.h> struct fecha { int anno; int mes; int dia; }; int main() { int n = 10; char c = '\n'; float x = 3.14159; struct fecha h = { 2012, 2, 29 }; char d = '!'; printf("var\taddress\t\tsizeof\n"); printf("n:\t%p\t%u\n", &n, sizeof(n)); printf("c:\t%p\t%u\n", &c, sizeof(c)); printf("x:\t%p\t%u\n", &x, sizeof(x)); printf("h:\t%p\t%u\n", &h, sizeof(h)); printf("d:\t%p\t%u\n", &d, sizeof(d)); printf("\n"); printf("h.anno:\t%p\t%u\n", &h.anno, sizeof(h.anno)); printf("h.mes :\t%p\t%u\n", &h.mes, sizeof(h.mes)); printf("h.dia :\t%p\t%u\n", &h.dia, sizeof(h.dia)); return 0; }
Por ejemplo, yo ejecut el programa una vez en el computador y obtuve esta salida:
var n: c: x: h: d: address sizeof 0xe49808 4 0xe4980f 1 0xe49804 4 0xe497f0 12 0xe4980e 1
Punteros
Un puntero es un tipo de datos cuyo valor es una direccin de memoria. Nunca olvide esta sencilla definicin. Los punteros son un concepto que suele causar mucha confusin a quienes estn aprendiendo C. Sin embargo, no se trata de un concepto difcil si uno comprende cmo estn representadas las variables en la memoria. Por otra parte, el uso incorrecto de punteros es una fuente muy comn de errores crticos, y que no siempre son fciles de depurar. Por esto es importante siempre entender muy bien lo que se est haciendo cuando hay punteros involucrados. Cuando una variable de tipo puntero tiene almacenada una direccin de memoria, se dice que apunta al valor que est en esa direccin.
0x3ad900 398 int n 0x3ad904 ???????? 0x3ad908 0x3ad900 int *p 0x3ad90c 0x3ad904 float *q 0x3ad910 2.717 float x
En general no importa cul es valor exacto de un puntero, sino que basta con comprender qu es lo que hay al otro lado. Por esto, en los diagramas de la memoria se suele preferir usar flechas en lugar de las direcciones explcitas:
int n 398 ???????? int *p float *q float x 2.717
Un valor especial llamado NULL puede ser asignado a cualquier puntero para indicar an no est apuntando a ninguna parte de la memoria.
Declaracin de punteros
La siguiente es la manera de declarar un puntero que apunte a un entero:
int *x;
Esto se puede leer lo apuntado por x es un entero. En este caso, * no es una multiplicacin, sino una derreferenciacin, como veremos ms abajo. Una vez declarada x de la manera ya mostrada, los nicos valores vlidos que se puede asignar a x sonNULL o una direccin de memoria donde haya un entero:
int a, b, c; float z; int *p; int *q; p p p p p q q q q = = = = = = = = = NULL; /* valido */ &a; /* valido */ &b; /* valido */ &z; /* invalido (z no es un entero) */ 142857; /* invalido (142857 no es una direccin de memoria) */ &b; /* valido */ p; /* valido */ NULL; /* valido */ &p; /* invalido (p no es un entero) */
Por supuesto, es posible cambiar int por cualquier otro tipo para declarar punteros a datos de otra naturaleza. Ojo con la siguiente sutileza al declarar varios punteros de una vez:
int *x, *y; int *x, y; /* x e y son punteros */ /* x es puntero, y es entero */
Derreferenciacin de punteros
El operador unario * de los punteros es el operador de derreferenciacin. Lo que hace es entregar el valor que est en la direccin de memoria. En otras palabras, * significa lo apuntado por. Al derreferenciar un puntero a entero, se obtiene un entero. El puntero derreferenciado puede ser usado en cualquier contexto en que un entero sea vlido:
int x, y; int *p; x = 5; p = &x; printf("%d\n", *p); /* imprime 5 */ y = *p * 10 - 7; /* y toma el valor 43 */ *p = 9; /* x toma el valor 9 */
En la ltima sentencia, se est asignando el valor 9 en la memoria que est reservada para la variable x, por lo que la asignacion cambia en efecto el valor de la variable x de manera indirecta. Derreferenciar el puntero NULL no est permitido. Al hacerlo, lo ms probable es que el programa se termine abruptamente y sin razn aparente. Errores de este tipo son muy fastidiosos, pues son difciles de detectar, e incluso pueden ocurrir en un programa que ha estado funcionando correctamente durante mucho tiempo. Si existe alguna remota posibilidad de que un puntero pueda tener el valor NULL , lo sensato es revisar su valor antes de derreferenciarlo:
if (p != NULL) hacer_algo(*p);
Ejercicio
Qu imprime el siguiente programa?
#include <stdio.h> int main() { float w, z; float *p, *q; w = 20; p = &z; q = p; *q = 7; z += *q; w -= *p; p = &w; *q += *p; z += *(&w); p = q; *p = *q;
Si intenta compilar este programa tal como viene hacindolo hasta ahora, es probable que el compilador arroje un error parecido a referencia indefinida a sin. Para evitar este error, debe agregar la opcin -lmal momento de compilar ya explicaremos por qu:
Transcriba, compile y ejecute el programa. Ver que un archivo llamado trig.txt fue creado. Vea el contenido de ese archivo. Si est trabajando en la consola, puede usar la instruccin cat:
$ cat trig.txt
En nuestro programa decidimos declarar la variable theta como double, que es otro tipo de datos asociado a los nmeros reales. Los nmeros reales no pueden ser representados exactamente en un computador, sino que deben ser aproximados de alguna manera que sea lo suficientemente general como para abarcar a la vez valores muy grandes y muy pequeos, como los que suelen aparecer en ciencia e ingeniera. La manera estndar que utilizan los computadores para esto es la representacin de coma flotante, que es una especie de notacin cientfica en base 2. El tipo float que habamos usado hasta ahora utiliza 32 bits para representar nmeros reales. Lo podemos verificar al imprimir el valor de sizeof(float). De estos 32 bits, 1 es para almacenar el signo del nmero, 8 son para almacenar el exponente de la base, y el resto son para el factor que la acompaa (llamado mantisa). Esto permite al tipo float representar nmeros reales con aproximadamente 7 cifras decimales de precisin. A veces esta precisin no es suficiente, y para ello existe el tipo double, que dedica 64 bits para representar el nmero. Esto permite alcanzar una precisin de aproximadamente 15 cifras decimales. A pesar de lo que parecen indicar sus nombres, ambos tipos son representaciones de coma flotante. A los valores float se le llama de precisin simple y a los double, bueno, de precisin doble.
Biblioteca matemtica
La cabecera math.h provee declaraciones de funciones y constantes matemticas de la biblioteca estndar de C. Las constantes e y estn declaradas, respectivamente, como M_E y M_PI. Adems, tambin estn disponibles otras constantes precalculadas como /2 (M_PI_2) y la raz de 2 (M_SQRT2 ). La mayora de las funciones matemticas viene en dos versiones: una para float y una para double. Las primeras llevan una letra f al final de su nombre. Las funciones sin y cos que usamos en nuestro programa estn declaradas en math.h. Si theta hubiera sido declarada como float en vez de double, habramos tenido que usar las funciones sinf y cosf.
Para explorar todas las funciones que estn disponibles, consulte el manual de math.h.
Enlazado de bibliotecas
Por qu hubo que agregar el -lm al compilar? En general, al usar bibliotecas, no basta con slo incluir al archivo de cabecera, sino que adems es necesario indicar al compilador que debe enlazar nuestro programa compilado con la biblioteca. La razn es que la cabecera contiene slo las declaraciones, pero no las implementaciones de las funciones, que estn en algn archivo ya compilado que se encuentra instalado en alguna parte de nuestro sistema. Las funciones de la mayora de las cabeceras estndares estn implementadas en una biblioteca llamadalibc. que es enlazada automticamente al compilar cualquier programa. Por razones histricas que podemos obviar, las funciones matemticas no estn implementadas en libcsino en otra biblioteca llamada libm, que no es enlazada automticamente. Para enlazar libm al momento de compilar es que se agrega la opcin -lm. Si quisiera enlazar explcitamente con libc, podra agregar -lc, pero esto no tendra ningn efecto. Cuando usted, ms adelante, sea ya una experta programadora en C y comience a usar bibliotecas escritas por otros desarrolladores (o incluso por usted misma), deber siempre tener el cuidado de enlazarlas correctamente al momento de compilar usando la opcin -lnombre_de_la_biblioteca .
Ejercicios
Interprete qu es lo que ocurre al usar los siguientes descriptores de formato para imprimir los valores en el archivo:
%lf %lg
Modifique el programa para que escriba una columna adicional con el logaritmo natural de cada nmero.
void mover_pieza(int i0, int j0, int i1, int j1) { tablero[i1][j1] = tablero[i0][j0]; tablero[i0][j0] = '.'; } void inicializar_tablero() { int i, j; char primera_fila[] = "tcadract"; FOR (j) { tablero[0][j] = primera_fila[j]; tablero[1][j] = 'p'; for (i = 2; i < 6; ++i) tablero[i][j] = '.'; tablero[6][j] = 'P'; tablero[7][j] = toupper(primera_fila[j]); } } void imprimir_tablero() { int i, j; printf("\n "); FOR (j) printf("%d ", j); printf("\n"); printf(" +---------------+\n"); FOR (i) { printf("%c |", 'a' + i); FOR (j) printf("%c ", tablero[i][j]); printf("\b|\n"); } printf(" +---------------+\n"); } enum color color_pieza(int i, int j) { if (isupper(tablero[i][j])) return BLANCO; else if (islower(tablero[i][j])) return NEGRO; else
return VACIO; } void leer_jugada(int *i_inicial, int *j_inicial, int *i_final, int *j_final) { char desde[5], hasta[5]; if (turno == BLANCO) printf("Juega blanco: "); else if (turno == NEGRO) printf("Juega negro: "); scanf("%s", desde); scanf("%s", hasta); *i_inicial = desde[0] - 'a'; *j_inicial = desde[1] - '0'; *i_final = hasta[0] - 'a'; *j_final = hasta[1] - '0'; } int juego_terminado() { return 0; }
Las piezas blancas sern letras maysculas, y las negras, minsculas. En cada turno, el programa mostrar la disposicin del tablero, y pedir a uno de los jugadores que ingrese su jugada:
01234567 +---------------+ a |t c . d r a . t| b |p p p . p p p p| c |. . . . . c . .| d |. . . p . . . .|
La jugada se ingresa indicando la casilla donde est la pieza que se mover, y la casilla a la que se mover. Cada casilla se ingresa como sus coordenadas (una letra y un nmero), y ambas casillas van separadas por un espacio. Por ejemplo:
Juega blanco: f5 e6
Nuestro juego de ajedrez es realmente malo. No hace cumplir las reglas, por lo que se puede mover las piezas como a uno se le d la gana. Incluso el jugador blanco puede mover las piezas negras! Si uno ingresa jugadas que no tengan sentido, el programa puede fallar de maneras inesperadas. Intntelo!
Tipos enumerados
Un tipo enumerado es un tipo de datos que puede respresentar slo una lista de valores discretos indicados por el programador. Para crear un tipo enumerado, en C se usa la sentencia enum, en la que se enumera cules son los valores posibles. Por ejemplo:
enum sexo {MASCULINO, FEMENINO}; enum semaforo {ROJO, AMARILLO, VERDE}; enum palo {CORAZON, PICA, TREBOL, DIAMANTE};
Al principio de nuestro programa, creamos un tipo enumerado llamado enum color, que podemos usar cuando necesitemos guardar algn color:
enum color {BLANCO, NEGRO, VACIO};
El valor VACIO nos permite usar variables enum color, por ejemplo, para almacenar el color que tiene la pieza que est en una casilla, siendo que podra no haber ninguna pieza en ella.
La verdad es que en C los tipos enumerados son una farsa. Al declarar una variable de tipo enum color, realmente estamos declarando una variable entera, y los valores BLANCO , NEGRO y VACIO son en realidad los enteros 0, 1, y 2. Al compilador le da lo mismo si uno mezcla los valores enumerados con los enteros, y no descubrir ningn error que podamos haber cometido. Al final, usar un tipo enumerado sirve slo para hacer que el cdigo sea ms fcil de comprender. Pero si cometemos alguna barbaridad como color = -9000 , que probablemente es un error lgico de nuestro programa, el compilador har odos sordos. En nuestro programa, nosotros nos aprovechamos de la dualidad enum-entero para cambiar el turno despus de cada jugada. Lo lgico habra sido hacerlo de este modo:
if (turno == BLANCO) turno = NEGRO; else if (turno == NEGRO) turno = BLANCO;
Pero nosotros sabemos que BLANCO y NEGRO son 0 y 1, por lo que podemos abreviarlo ingeniosamente (pero no ms claramente):
turno = 1 - turno;
Arreglos bidimensionales
No debera ser ningn misterio que un arreglo bidimensional es un arreglo cuyos elementos estn numerados por dos ndices en lugar de uno. Es bastante evidente que, dada la forma que escogimos para representar las piezas, la mejor manera de representar un tablero de ajedrez en nuestro programa es usar un arreglo bidimensional de 8 8 caracteres:
char tablero[8][8];
Esto hace que tengamos 64 variables de tipo char a nuestra disposicin, indexadas desde tablero[0][0] hasta tablero[7][7]. La manera de indexar correctamente un elemento del tablero es usar la sintaxis tablero[fila][columna] . Es incorrecto usar la sintaxis tablero[fila, columna] que se usa en otros lenguajes de programacin. Por supuesto, se pueden crear arreglos de todas las dimensiones que uno quiera, que no necesariamente deben ser de los mismos tamaos:
Variables globales
Las variables tablero y turno no fueron declaradas dentro de ninguna funcin, sino al principio del programa. Ambas son, pues, variables globales, y por lo mismo pueden ser usadas desde cualquier parte del programa. Las variables globales existen desde que el programa comienza hasta que termina. Jams son destruidas ni borradas durante la ejecucin. En contraste, las variables declaradas dentro de una funcin son variables locales: slo pueden ser usadas dentro de la funcin, son creadas al llamar la funcin y destruidas cuando la funcin retorna. Nuestro programa es ms bien pequeo, y por lo tanto las variables globales no entorpecen el entendimiento. Al contrario: sabemos que slo hay un juego en curso (que tiene un tablero y un jugador de turno), por lo que tener que pasar explcitamente el tablero y el turno a cada funcin hara que el cdigo fuera ms engorroso. En este caso es apropiado usar variables globales. Sin embargo, al desarrollar aplicaciones grandes, uno debe evitar usar las variables globales como medio de comunicacin entre partes del programa. Idealmente, cada funcin debera recibir toda la informacin que necesita a travs de sus parmetros, y entregar sus resultados como valor de retorno. Al usar informacin global, el comportamiento de un trozo de cdigo puede ser diferente dependiendo del estado de variables que son asignadas en partes bien alejadas del cdigo. Esto hace que los programas sean ms difcil de entender (porque hay que figurarse en la cabeza cul es el estado global), y los errores ms difciles de depurar. Si usamos slo informacin local (variables locales, parmetros, valores de retorno) entonces todo el comportamiento de una seccin de programa est determinado por informacin que se encuentra cercana a ella en el cdigo.
Para esto, hay que poner que su tipo de retorno es void, que se puede interpretar como ningn tipo. Hay varias razones por la que una funcin podra no retornar nada:
la funcin hace entrada o salida (como imprimir_tablero), la funcin acta sobre variables globales (como mover_pieza ), la funcin debe retornar ms de un valor, por lo que se usan los parmetros para entregar los valores (como leer_jugada , explicado ms adelante).
Como parmetro, debemos pasarle a FOR el nombre de la variable que queremos usar como contador en nuestro ciclo. Note que no estamos pasando el valor de la variable: la sustitucin es meramente textual. En esencia estamos modificando la sintaxis del lenguaje. En general es una mala prctica hacer cosas como sta. Como la sustitucin es puramente textual y nunca se verifica que tenga sentido, esto puede causar errores muy extraos si no se programa con cuidado. Tambin estamos haciendo ms difcil a otros programadores entender nuestro cdigo, ya que ellos estn familiarizados con la sintaxis del lenguaje pero no con nuestras construcciones. Uno puede ponerse muy creativo para crear macros. Casi nunca es buena idea ceder a la tentacin. Slo hay que hacerlo cuando en efecto se logra hacer que el programa resulte ms legible. Cree usted que lo conseguimos con este ejemplo?
Declaraciones de funciones
El compilador analiza el cdigo del programa de arriba hacia abajo. Es necesario que todos los nombres (como variables, tipos y funciones) ya hayan sido declarados antes de que aparezcan en el cdigo. Por esto mismo, cuando crebamos funciones, lo hacamos antes de la funcin main. De otro modo, el compilador no sabra que las funciones que llamamos desde main existen. En el caso de las funciones, hay que distinguir entre dos cosas:
la declaracin de la funcin, que consiste en especificar su nombre, su tipo de retorno y los tipos de los parmetros para que el compilador los conozca, y la definicin de la funcin, que es especificar cul es el cdigo de la funcin.
En el programa del ajedrez, las funciones estn declaradas pero no definidas al principio del cdigo. Gracias a esto, las podemos llamar desde main. El compilador sabr exactamente a qu nos referimos cuando decimos color_pieza o juego_terminado, y podr verificar que estos nombres estn siendo usados correctamente. An as, las funciones deben estar definidas en alguna otra parte (nica) del programa para que la compilacin pueda ser completada. Para declarar las funciones, no es necesario explicitar los nombres de los parmetros, pero est permitido hacerlo. Las siguientes dos declaraciones son vlidas:
float potencia(float, int); float potencia(float base, int exponente);
En C, se le llama prototipo a la declaracin de una funcin. Los tipos de retorno y de los parmetros conforman la firma de la funcin. Las cabeceras .h que inclumos siempre en nuestros programas contienen slo las declaraciones de las funciones que proveen, no las definiciones. Al compilar nuestro cdigo, al compilador no le importa qu hacen esas funciones, sino solamente cules son sus firmas. Recin en la fase final de la compilacin (llamada enlazado) el compilador se encarga de averiguar dnde est el cdigo (ya compilado) de esas funciones. Si una funcin est definida pero no declarada, entonces la definicin acta tambin como declaracin. Si una funcin est declarada antes de ser definida, entonces las firmas del prototipo y de la definicin deben coincidir.
/* imprime 11 */
Se dice que C hace paso de parmetros por valor, en oposicin a lenguajes donde el paso de parmetros es por referencia. En C se puede emular el paso por referencia para que s se pueda modificar una variable definida fuera de la funcin. Para que esto funcione, no hay que pasar a la funcin el valor de la variable, sino su direccin de memoria. Por supuesto, el parmetro debe ser ahora un puntero (que es el tipo apropiado para guardar direcciones de memoria):
#include <stdio.h> void f(int *x) { *x = 9999; } int main() { int a = 11; f(&a); printf("%d\n", a); return 0; }
/* imprime 9999 */
Compare ambos programas y asegrese de entender las diferencias. Note que la funcin debe derreferenciar el parmetro cada vez que haya que referirse a la variable original.
Una razn comn para usar paso por referencia es permitir que una funcin entregue ms de un resultado. Por ejemplo, nuestra funcin leer_jugada le pide al usuario ingresar cuatro datos que debe usar el programa. Como en C no se pueden retornar 4 valores (a no ser que se los junte en una estructura), es mejor pasarle las variables por referencia. Esto es como decirle a la funcin deja aqu los resultados. Otra razn para usar paso por referencia es evitar que se copien muchos datos cuando los parmetros son estructuras o arreglos grandes, incluso si no es necesario modificarlos dentro de la funcin:
struct grande { int a, b, c; /* 4 bytes cada uno */ float x, y; /* 4 bytes cada uno */ char z[100]; /* 100 bytes */ } g; fv(g); /* se copian 120 bytes */ fr(&g); /* se copian 4 bytes (taman~o de un puntero) */
Se puede indicar al compilador que la funcin no modificar la variable original usando el calificadorconst:
void fr(const struct grande *g) { printf("%s\n", (*g).z); }
Conversiones de caracteres
Los valores de tipo char en realidad son enteros. El mapeo entre smbolos y enteros est dado por el cdigo ASCII_. Al igual como hicimos con los tipos enumerados, podemos mezclar libremente enteros y caracteres al hacer operaciones. Esto no es as en otros lenguajes con sistemas de tipos ms fuertes. Recordemos que en Python era un error sumar un entero a un caracter:
>>> 'a' + 3 Traceback (most recent call last): File "<console>", line 1, in <module> TypeError: cannot concatenate 'str' and 'int' objects
En este ejemplo, estamos sumando 3 al cdigo ASCII de 'a', y pasa que el resultado es el cdigo ASCII de 'd'. Estamos usando la propiedad del cdigo ASCII de que las letras minsculas en orden alfabtico tienen cdigos correlativos. Lo mismo ocurre con las maysculas y con los dgitos del '0' al '9'. Sin necesidad de recordar cul es el cdigo exacto de cada smbolo, es posible usar estas propiedades para hacer conversiones entre caracteres y enteros. Por ejemplo, para llevar un caracter entre '0' y '9' a su entero correspondiente, basta con restarle el valor '0':
'0' - '0' == 0 '1' - '0' == 1 '2' - '0' == 2 etc.
De manera anloga, podemos obtener la posicin de una letra en el abecedario restndole el cdigo de la letra a:
'a' - 'a' == 0 'b' - 'a' == 1 'c' - 'a' == 2 etc.
Nosotros aprovechamos estas propiedades en la funcin leer_jugada . El usuario ingresa las coordenadas de una casilla como un par de caracteres letra-dgito, mientras que el programa representa las casillas como pares entero-entero. Para convertir a entero, simplemente restamos 'a' o '0' segn corresponda. Otro truco muy usado para convertir un caracter de minsculas a maysculas es el siguiente:
char may = min - 'a' + 'A';
Este truco tiene su encanto, pero no es muy confiable (qu pasa si min ya est en maysculas?). Siempre es mejor usar la funcin toupper (provista por ctype.h), como hicimos en inicializar_tablero.
ctype.h provee varias otras funciones para operar sobre caracteres.
if (strcmp(palabra_actual, palabras[i]) == 0) { cuentas[i]++; } } } for (i = 0; i < n; ++i) { printf("%6d\t %s\n", cuentas[i], palabras[i]); } fclose(f); free(cuentas); exit(EXIT_SUCCESS); }
El programa contar-palabras est diseado para recibir parmetros por lnea de comandos. Al momento de ejecutar el programa, usted debe indicar inmediatamente despus del nombre del programa cul es el archivo que quiere leer, y cules son las palabras que quiere contar:
$ ./contar-palabras archivo.txt perro gato
Para probar el programa, descargue El Quijote de la Mancha en formato de texto plano. El archivo se llama pg2000.txt ; gurdelo en el mismo directorio donde est el programa compilado. Contemos cuntas veces aparecen los nombres del Quijote, de Sancho Panza y de Dulcinea en el libro:
$ ./contar-palabras pg2000.txt Sancho Dulcinea Quijote 950 Sancho 165 Dulcinea 894 Quijote
Contemos tambin cuntas veces aparecen los artculos del idioma espaol en toda la obra:
$ ./contar-palabras pg2000.txt el la los las 7957 el 10200 la 4680 los 3423 las
Por supuesto, hay que verificar que f no es NULL para asegurarnos que el archivo s pudo ser abierto. La manera ms sencilla de leer datos desde el archivo es usar la funcin fscanf de la misma manera que usamos scanf para leer de la entrada estndar. Como en nuestro programa nos interesa leer palabra por palabra, usamos el descriptor de formato %s. Para comprobar si ya se lleg al final del archivo, y por lo tanto ya no queda nada ms que leer, se usa la funcin feof. Una manera tpica de leer todo el archivo es hacerlo como lo hicimos en nuestro programa: un ciclo while que va verificando antes de cada lectura si quedan o no cosas por leer:
while (!feof(f)) { fscanf(f, "%s", s); /* ... */ }
Arreglos son punteros, punteros son arreglos Parmetros del programa por lnea de comandos
Para que nuestro programa reciba parmetros al momento de ejecutarlo, debemos modificar la declaracin de main para que incluya dos parmetros:
int main(int argc, char **argv) {
La variable argc tomar como valor la cantidad de argumentos pasados en la lnea de comandos,incluyendo el nombre del programa. El puntero argv apunta a un arreglo de argc strings, que son precisamente estos parmetros. (Recordemos que un string es un arreglo de char, y que un arreglo es en la prctica un puntero) Por esoargv es un puntero a puntero a char). Por ejemplo, cuando ejecutamos el programa de la siguiente manera:
$ ./contar-palabras abc.txt azul rojo verde "amarillo patito"
entonces argc tendr el valor 6 y los valores del arreglo argv sern:
argv[0] argv[1] argv[2] argv[3] argv[4] argv[5] "./contar-palabras" "abc.txt" "azul" "rojo" "verde" "amarillo patito"
Aritmtica de punteros
Un puntero es una direccin de memoria, y una direccin de memoria no es ms que un entero. Estar permitido entonces aplicar operaciones aritmticas a los punteros para obtener otros punteros? En C s es posible hacerlo. Sin embargo, los punteros tienen sus propias reglas para hacer aritmtica. La nica operacin permitida es puntero + entero, y el resultado es un puntero del mismo tipo, Para verificarlo con sus propios ojos, puede ejecutar el siguiente programa:
#include <stdio.h> #include <stdlib.h> #include <string.h> #define MAX_LARGO_PALABRA 50 int main(int argc, char **argv) {
int n; char **palabras; int *cuentas; FILE *f; char palabra_actual[MAX_LARGO_PALABRA]; int i; if (argc < 3) { fprintf(stderr, "Uso: %s ARCHIVO PALABRA1 PALABRA2 ...\n", argv[0]); exit(EXIT_FAILURE); } n = argc - 2; palabras = argv + 2; cuentas = malloc(argc * sizeof(int)); if (cuentas == NULL) { fprintf(stderr, "Memoria insuficiente para ejecutar el programa.\n"); exit(EXIT_FAILURE); } f = fopen(argv[1], "r"); if (f == NULL) { fprintf(stderr, "No se pudo abrir el archivo %s\n", argv[1]); exit(EXIT_FAILURE); } for (i = 0; i < n; ++i) { cuentas[i] = 0; } while (!feof(f)) { fscanf(f, "%s", palabra_actual); for (i = 0; i < n; ++i) { if (strcmp(palabra_actual, palabras[i]) == 0) { cuentas[i]++; } } } for (i = 0; i < n; ++i) { printf("%6d\t %s\n", cuentas[i], palabras[i]); } fclose(f); free(cuentas); exit(EXIT_SUCCESS); }
Un char ocupa un byte en la memoria. Por lo tanto, p + 1 apuntar a un byte ms que p. Un float ocupa cuatro bytes. Luego, q + 1 apuntar a cuatro bytes ms all de q. La aritmtica de punteros es til cuando hay arreglos involucrados. Si p apunta a arreglo[0], entonces p+ 1 apunta a arreglo[1], independientemente del tipo del arrego. En otras palabras, p + 1 siempre apunta a lo que hay en la memoria inmediatamente despus de lo apuntado por p. En nuestro contador de palabras, contamos desde el principio con un arreglo con todos los parmetros del programa. Pero las palabras que interesan estn slo desde el tercer parmetro en adelante. En vez de declarar un nuevo arreglo (con el consiguiente uso extra de memoria) y copiar all las palabras, simplemente introducimos el puntero palabras que apunta al tercer elemento de argv. Hacer esto es muy fcil gracias a la aritmtica de punteros:
palabras = argv + 2;
Desde esta lnea en adelante, palabras y argv se ven como dos arreglos que comparten su memoria.palabras[0] es lo mismo que argv[2]:
argv palabras
En C siempre se cumple que a[i] es lo mismo que *(a + i). Puede darse cuenta de por qu? Esta relacin debera resultarle natural despus de estudiar arreglos, punteros y su aritmtica.
Modifique el programa para que cuente cada palabra independiente de si aparece con maysculas o minsculas en el archivo. Modifique el programa para que cuente cada palabra incluso si aparece precedida o sucedida de un signo de puntuacin.
Referencias adicionales
Este tutorial pretende ser slo una introduccin, y no es de ninguna manera una referencia completa acerca del lenguaje C. Para complementar su aprendizaje y para usar como referencia futura, le recomendamos los siguientes libros.