|
Consejo Superior de Investigaciones Científicas |
Fernando López Santoveña http://www.iata.csic.es/~fernando/ |
| 01 / 04 / 1999 | Serie Varios |
[saltar al estudio comparativo] [saltar a las conclusiones]
Introducción
Típicamente, los archivos gráficos en formato TIFF conservan muy bien los detalles de la imagen pero son enormemente voluminosos (otro tanto se puede decir del formato BMP ). Los archivos en formato JPG (o JPEG), en cambio, ocupan menos espacio a cambio de perder un poco de definición que se aprecia esencialmente cuando ampliamos la imagen.
El grado de compresión de un JPG puede ser variable: cuanta más compresión el archivo resultante será más pequeño y perder&aaute; más detalles de la imagen original. Los programas de gráficos tienen opciones para regular ese grado de compresión.
Cuando es fundamental conservar los detalles, por ejemplo para poder hacer "zoom" de una parte de la imagen sin perder demasiada calidad ni definición, es más adecuado el formato TIFF. Pero cuando no es necesaria una definición gráfica excepcional, sino que basta con que sea buena o muy buena, podemos guardar la imagen en formato JPG.
En particular, para enviar a otra persona una "fotocopia" de un documento (por ejemplo copia de una artículo científico o una disposición del BOE) o cualquier imagen cuyo objeto principal sea texto, basta con una buena definición. Incluso basta con una definición pobre. Véase si no el estudio comparativo al final de esta página.
Cuando, además, lo que digitalizamos con un escáner es todo texto, también tenemos la opción del "OCR". Son las siglas de "Optical Character Recognition" y se refieren a programas que analizan la imagen, detectan y reconocen las letras y crean un archivo equivalente que ya no es gráfico sino de texto. Y este texto podemos luego editarlo con cualquier procesador de textos, mientras que la imagen no: en ella sólo hay "rayas" que no representan nada para el procesador de textos.
Cuando además lo que queremos es enviarlo por correo electrónico, la disyuntiva es más grave: el envío de archivos grandes presenta serios inconvenientes:
Como tardan mucho tiempo en ser transmitidos totalmente, las sesiones de conexión son prolongadas, y aumentan por tanto las posibilidades de que se corten y haya que empezar de nuevo. Para atender a esas conexiones abiertas los servidores dedican recursos y responden más lento a otras tareas u otros mensajes.
Esto se suele hacer para evitar abusos y "empachos" de los servidores que dejarían sin correo a todos los usuarios en caso de atascarse. Son típicos tamaños máximos de 5 MBytes, 2.5 MB, 2 MB y hasta 1MB en algunos organismos o universidades.
Para incluir un archivo binario en un mensaje de correo, se transforma internamente en un formato especial que puede suponer entre un 20% y un 50% más de tamaño. Por ejemplo, para transmitir un archivo de 2MB, el mensaje correspondiente puede tener fácilmente un tamaño de 2.8MB. En FTP o HTTP no se genera esta redundancia y se transmitirán exactamente los 2MB (ni uno más), reduciendose el tiempo de conexi&oacue;n a lo imprescindible.También hay formas de hacer conexiones FTP o HTTP en diferido para no tener que estar "pegado a la pantalla" mientras se realiza la transmisón, o para hacerla por la noche o en un horario favorable: consulta a tu Administrador de Sistemas.
Se tomo una página del BOE y se escaneó como "fotografía en
escala de grises ". Era una de las opciones ofrecidas a primera vista por el
escáner y con ella se presuponían mayores posibilidades de perder
detalles de las letras al reducir el tamaño de los ficheros JPG. Para guardar
después la página digitalizada en archivos con distintos formatos, se
usaron también las opciones comunes ofrecidas directamente por el programa y
sin necesidad de manipulaciones adicionales.
Los formatos ensayados fueron: TIFF. TIFF comprimido y JPG en grados de compresión mínimo, 10%, 21%, 50% y máximo. Se procedió también a la conversión de la imagen en texto con dos programas diferentes, Cuneiform y OmniPage que lo grabaron directamente en formato Word y RTF respectivamente (de esta forma ocupan ya más que en texto simple).
En la lista de archivos se añade la versión ZIP del archivo TIFF (no es igual "comprimir" un TIFF que usar el formato de imagen "TIFF comprimido" que es una variante del formato TIFF ).
Se ofrecen a continación los tamaños resultantes (en KBytes) de todos ellos así como enlaces a los mismos para que podais recuperarlos y analizarlos en detalle. Os recomiendo no ver directamente con el programa Web los que sean mayores de 500 KBytes. En vez de éso, pulsad con el botón derecho del ratón sobre el enlace y elegid la opción "Guardar el enlace". De esta forma podeis guardar directamente el archivo en vuestro ordenador para abrirlo después localmente con algún programa gráfico.
Detrás se ofece la comparación de un detalle para los formatos de más interés.
| Tamaño | Nombre | Tipo de enlace | Descripción | |
| 1850 | boe_t.tif | Guardar | archivo TIFF |
|
| 1747 | boe_t_c.tif | Guardar | archivo "TIFF comprimido" | |
| 1478 | boe_t.zip | --- | compresión ZIP del archivo TIFF | |
| 3942 | boe_0.jpg | --- | JPG sin compresión | |
| 1224 | boe_10.jpg | Guardar | JPG 10% compresión |
|
| 812 | boe_21.jpg | Guardar | JPG 21% compresión |
|
| 480 | boe_50.jpg | Ver | JPG 50% compresión |
|
| 316 | boe_100.jpg | Ver | JPG compresión máxima |
|
| 9 | boe_op.rtf | Ver | TEXTO en RTF (OmniPage) | |
| 8 | boe_ocr.doc | Ver | TEXTO en Word (Cuneiform) |
Fijándose mucho se puede apreciar una ligera degradación en la definición del trazo de las letras y de la uniformidad del color del fondo a medida que se aumenta el grado de compresión del JPG. El formato JPG sin comprimir no es adecuado ya que ocupa mucho más espacio que el propio TIFF.
El formato "TIFF comprimido" no reduce apreciablemente el volumen del TIFF nativo. Y la compresión ZIP aún da un archivo muy grande.
El texto el perfectamente legible ocupando 6 veces menos en el formato JPG totalmente comprimido. 316 KBytes es un tamaño muy aceptable para enviarlo por correo electrónico a una persona.
ATENCIÓN: NO ENVIEIS ARCHIVOS GRÁFICOS NI BINARIOS EN GENERAL A LISTAS DE CORREO. Daros cuenta de que, por ejemplo, 400 KBytes enviadas a una lista de 100 personas son en total 40 MBytes... que es mucho más que el humilde archivo inicial.
Si tenemos la oportunidad de convertir la imagen en texto, es la opción ideal, tanto por el escaso tamaño que ocupa como por la posibilidad de edición posterior. No siempre es posible, bien por no disponer del programa OCR, bien por que el documento incluya gráficos o fotografías en medio del texto.
Podemos utilizar por tanto sin ninguna preocupación el formato JPG con altos grados de compresión para guardar y enviar documentos, artículos científicos fotocopiados, etc. Evitemos sistemáticamente el empleo de formato TIFF o BMP para estos menesteres.
Para distribuir estos archivos a una lista, coloquese el archivo en una página Web e informese a la lista de la dirección HTTP del mismo (son tres o cuatro líneas de texto), de forma que quien esté intresado en el archivo lo pueda recuperar por Web. Consultad a vuestro administrador de sistemas y os informará de los detalles.
|
Página escrita por
Fernando López Santoveña fernando@iata.csic.es |
|