Formatos y procesamiento de imagen

Ortografía

Esta página o sección necesita una revisión de ortografía y gramática.
Puedes ayudar editándolo

Este recurso de aprendizaje es una lección creada originalmente como material didáctico del proyecto de aprendizaje Tecnologías multimedia e interacción.

La imagen digital toma vida mediante un archivo de diferentes formatos, que puede ser almacenado en un ordenador, enviado por email o también ser impreso.

Introducción

La imagen digital es un producto del desarrollo de la informática que tiene como antecesor a la fotografía. Y como principio básico de los multimedios permite alterar la tradicional estructura del medio en si, en la imagen digital podemos ver incluidos los dos hechos , la originalidad de la imagen cuando es tomada por primera vez y luego el resultado de compresión, optimización, filtrado y otros procesos que forman parte del arte digital contemporánea. La increíble diversidad de aplicaciones que se pueden usar para el procesamiento de imágenes o técnicas de análisis es uno de los aspectos que convierten al procesamiento de imágenes en un tópico muy interesante de estudio.

Formatos de Imagen

A grandes rasgos, los formatos de las imágenes se pueden dividir en dos grupos principales:

Imágenes Vectoriales

Archivo:TMI - Fotografia Vectorial.jpg

Imagen vectorial basada en la imagen de mapa de bits.

Las imágenes vectoriales son imágenes constituidas por objetos geométricos autónomos (líneas, curvas, polígonos, etc), definidos por ciertas funciones matemáticas (vectores) que determinan sus características (forma, color, posición, etc). Los elementos gráficos presentes en un archivo vectorial se denominan objetos. Cada objeto es una entidad completa con propiedades tales como color, forma, contorno, tamaño y posición en la pantalla, que están incluidas en su definición. Considerando que cada objeto es una entidad completa, se puede mover, cambiar sus propiedades una y otra vez manteniendo su claridad y nitidez originales, sin afectar a los restantes objetos de la imagen. Las imágenes vectoriales no dependen de la resolución. Esto significa que se muestran con la máxima resolución permitida por el dispositivo de salida: impresora, monitor, etc. Por lo tanto, la calidad de imagen será mejor si lo imprimes en una impresora superior o igual a 600 puntos por pulgada (ppp) que en una impresora de 300 ppp. Los formatos de las imágenes vectoriales o la extensión del fichero está muy ligados al tipo de software que se utiliza para crearlas o interpretarlas, y aunque existen maneras de convertir de un formato a otro, siempre existe pérdida de información en dicha conversión, pudiendo llegar a estropear la imagen.

Formatos Vectoriales

Los formatos o extensiones de los archivos de imagen vectoriales están directamente relacionados al software de edición con el que se los diseño.

Adobe Illustrator Artwork

Extensión: *.ai
Formato vectorial para Adobe Illustrator. Como características interesantes de este formato cabe mencionar que es compatible con PDF, por lo que cualquier programa que lea PDF podrá leer este tipo de imagen. Además, permite incluir mapas de bits en su interior. Herramienta de Edición: Adobe Ilustrator... 12345

CorelDRAW

Extensión: *.cdr Formato vectorial para aplicaciones CorelDRAW. Herramienta de Edición: CorelDRAW

Drawing Exchange (o Interchange) Format

Extensión: *.dxf Formato de fichero para datos CAD creado por Autodesk para facilitar la interoperabilidad de datos entre AutoCAD y otros programas. Herramienta de Edición: AutoCAD Autodesk

Windows Metafile

Extensión: *.xwmf Almacena gráficos vectoriales y rasterizados como secuencia de comandos para ser usados con el sistema operativo Microsoft Windows y normalmente sirve para formatos de mapas y graficaciones a escala.

Encapsulated PostScript

Extensión: *.eps Es un archivo PostScript que almacena pequeños gráficos vectoriales, a diferencia de los que almacenan una o varias páginas enteras.

Open Office Draw

Extensión: *.odg Este formato basado en XML supone que no está atado a Draw. Puede acceder a sus gráficos desde cualquier programa compatible con OpenDocument. Permite incluir mapa de bits en su interior. Herramienta de Edición: OpenOffice Draw LibreOffice Draw

Scalable Vector Graphics

Extensión: *.svg / *.svgz Formato vectorial basado en XML como un estándar abierto, definido por el W3C para su uso en navegadores web que permite incluir mapas de bits en su interior.

ShockWave Flash

Extensión: *.swf Formato creado por Macromedia, es ejecutado por el plugin Flash, el cual permite mostrar animaciones vectoriales contenidas en ficheros SWF. Diversas aplicaciones pueden crear ficheros SWF, incluido el programa Macromedia Flash. Aunque básicamente es un formato vectorial, admite también bitmaps.

Imágenes de Mapa de Bits

Archivo:TMI - Fotografia en Mapa de Bits.jpg

Imagen de mapa de bits.

Mosaico decorativo

Las imágenes de Mapa de Bits también conocidas como imágenes ráster, están compuestas por puntos individuales denominados píxeles, dispuestos y coloreados de formas diversas para formar un patrón, cada uno de los cuales contiene información de color y luminosidad. Salvando la diferencia, podemos compararla con un mosaico y sus teselas.

Si aumenta el tamaño del mapa de bits, también aumentará el número de píxeles individuales, haciendo que las líneas y las formas tengan un aspecto dentado. De acuerdo a la cantidad de píxeles incluida en el mapa de bits, queda determinada la resolución de la imagen. Es muy común oír valores como 1280 x 720, o 1920 x 1080, y no es más que el número de puntos expresado de forma que definan el ancho por el alto. Los mapas de bits, por otra parte, pueden diferenciarse según la cantidad de colores que puede presentar cada uno de los píxeles. Esta información se expresa en potencia de 2 y en la unidad conocida como bit; hoy en día, el mínimo aceptable es 16 bits, siendo 24 y 32 más comunes. Por otro lado, tenemos el tipo RGB, donde sólo es posible un resultado opaco, y RGBA, que acepta un cuarto valor, para producir añadir transparencia a cada punto. Cabe aclarar que la calidad no está ligada necesariamente a las características antes mencionadas, sino que depende del buen uso que se haga de los recursos disponibles.

Formatos de Mapa de Bits

Cuando trabajamos con imágenes, es muy importante elegir bien el formato adecuado. Para efectuar una elección adecuada de un formato de imagen, conviene valorar previamente:

El contenido de la imagen: foto, dibujo, gráfico, logotipo, etc.
La calidad que se desea obtener en función de su destino: publicación en la web impresión en impresora doméstica. Impresión profesional,...
El tamaño que tendrá el archivo resultante.

A continuación vamos a ver los formatos de imagen de mapa de bits más comunes y su valoración en función de la tres características antes mencionadas.

Windows Bitmap

Extension: *.bmp

Comúnmente usado por los programas de Microsoft Windows y por el sistema operativo propiamente dicho.
Se le puede aplicar compresión sin pérdidas, aunque no todos los programas son compatibles.
Es un formato muy conocido aunque su compresión comparada con gif o jpeg es muy pobre.
Si deseas conocer mas respecto a este formato, puedes hacerlo ingresando al siguiente enlace:BMP file format

Graphics Interchange Format

Gif Animado

Imagen comprimida en formato GIF. Como se puede observar el texto se lee perfectamente y la calidad de la imagen es buena.

Como el texto es de un único color y contrastado con la foto queda muy borroso

Extension: *.gif
Formato bastante antiguo desarrollado por Compuserve con el fin de conseguir archivos de tamaño muy pequeños. Admite solo 256 colores por lo que no es adecuado para imágenes fotográficas pero si es muy apropiado para logotipos, dibujos, etc.
Permite crear animaciones por cuadros (gif animado) y transparencias.
Es un formato gráfico utilizado ampliamente en la World Wide Web, tanto para imágenes como para animaciones.
GIF utiliza dos técnicas para comprimir, una de ellas conocida como CLUT (Color look-up table ó Tabla de consulta de colores) y la otra es la LZW (Lemple-Zif-Welch).

El mecanismo de la Tabla de consulta de colores (CULT) es el siguiente: Para cada píxel hay una información de 24 bits de color, esto nos puede llegar a proporcionar una imagen de 16 millones de colores, ya que no es necesario tanto número de color para ver una imagen con calidad, la técnica CLUT se encarga de reducir los 16 millones a 256 colores; esto tiene como consecuencia que en vez de guardar 24 bits de información para cada píxel sean solo necesarios 8 bits por píxel, ya que para definir cada píxel solo tendremos que hacer referencia a una posición dentro de la tabla de Las imágenes que se tratan con esta técnica se denominan indexadas. La relación de compresión de una fotografía que se pasa a GIF es de 4 a 1.

Si deseas conocer mas respecto a este formato, puedes hacerlo ingresando al siguiente enlace:GIF file format

Joint Photographic Experts Group.

Extension: *.jpg / *.jpeg

Imagen comprimida con jpeg, sin texto, muestra muy buena calidad.

Si el formato GIF es uno de los más adecuados para la compresión en 256 colores, el JPEG lo es para las imágenes que contienen más de 256.
JPEG no es un formato de imagen propiamente dicho si no de compresión; en contraste con GIF, JPEG guarda toda la información referente al color en millones de colores y sin que por ello el archivo resultante sea demasiado grande, eso si, a mayor nivel de compresión mayor pérdida de la imagen.
JPEG es usado ampliamente para fotografías e imágenes de gran tamaño y variedad de color en la web y por las cámaras digitales.
Usado para fotografías digitales ya que admite millones de colores. Lo admiten la mayor parte de las cámaras fotográficas y escáneres y es muy utilizado en páginas web, envío de fotografías por correo electrónico, presentaciones multimedia y elaboración de vídeos de fotografías.
JPEG admite distintos niveles de compresión, de forma que:

A más compresión menor calidad y archivos más pequeños (menos Kbytes)
A menos compresión mayor calidad y archivos más grandes (más Kbytes)

Cada vez que se abre y manipula una foto JPEG en un ordenador, la imagen al comprimirse y descomprimirse se degrada, por lo que conviene no guardarlas en JPEG si se van a modificar. En este caso usar TIFF o BMP para editarlas y convertirlas a JPEG al final. Si no queda más remedio que editar en JPEG, manipularlas con cuidado y no excesivamente.
La técnica de compresión que utiliza el JPEG se llama DCT (Discrete cosine transform ó transformación discreta de coseno).

Esta compresión está basada en la idea de que el ojo humano percibe peor los cambios de color que las variaciones de brillo.
JPEG no guarda el valor RGB para cada píxel sino que lo que hace es dividir la información en dos partes, por una el color y por otra el brillo, y además, las comprime por separado. Esto hace que JPEG no sea el formato adecuado para imágenes con contrastes de color altos.
A mayor suavidad en los cambios de color mejor nivel de compresión.

JPEG/Exif (“Exchangeable Image File Format”) es una especificación para formatos de archivos de imagen usado por las cámaras digitales.
Las etiquetas (tags) de metadatos definidas en el estándar Exif cubren un amplio espectro incluido:

Información de fecha y hora. Las cámaras digitales registran la fecha y la hora actual y la almacenan en los metadatos.
Configuración de la cámara. Esta incluye información estática como el modelo de cámara y el fabricante, e información que varía con cada imagen como la orientación, apertura, velocidad del obturador, distancia focal, medidor de exposición y la velocidad de la película.
Información sobre localización, la cual podría provenir de un GPS conectado a la cámara.

Tagged Image File Format.

Extensión: *.tif / *.tiff
TIFF se utiliza masivamente en gráficos de imprenta.
Se pueden emplear algoritmos con pérdida o sin pérdida, bien muchos programas sólo son compatibles con un pequeño subconjunto de las opciones disponibles y mayormente utilizados en escáner. Es admitida prácticamente por todas las aplicaciones de edición e imagen.
Es un formato que permite muchas posibilidades y que es compatible tanto para Mac como Pc
Si deseas conocer mas respecto a este formato, puedes hacerlo ingresando al siguiente enlace: TIF File format

Portable Network Graphic Format.

PNG Demostración de Transparencia

Extensión: *.png
PNG ofrece profundidades desde 8 bits con paleta optimizada, 24, 48 bits: 281 trillones de colores y en escala de grises se puede obtener archivos desde 8 y 16 bits igual a 65536 tonos de grises. También se puede salvar un canal más con alpha channel para video e interlaced. Fue diseñado para reemplazar al GIF en la web. Utiliza sistemas de compresión gratuitos, y admite muchos más colores que GIF.
PNG en sí no admite animaciones pero con la extensión APNG(Animated PNG) sí que se añade esta característica. Al admitir más colores es posible crear imágenes transparentes con mayor detalle. PNG es el formato que esta empezando a cobrar protagonismo en la Web, ya que une las ventajas del JPEG y del GIF.
PNG permite a compresión sin pérdidas con el algoritmo Deflate Algorithm donde utiliza para la compresión técnicas como la compresión LZW o la compresión Huffman. Además, tiene 256 niveles de transparencias, esto permite que cualquier borde de la imagen se funda perfectamente con el fondo.
Aparentemente PNG es mejor formato que JPEG O GIF, sin embargo no es capaz de producir imágenes animadas (GIF sí) y las imágenes de PNG son siempre de mayor peso que las de JPEG

PNG usa un proceso de compresión de 2 etapas:

Pre-Compresión: Filtración (predicción)

Se define un único tipo de filtro, que incluye 5 modos de predicción del valor del píxel, que resulta muy útil para mejorar la compresión, donde se elige para cada línea de la imagen (scanline) un método de filtrado que predice el color de cada píxel basándose en los colores de los píxeles previos y resta al color del píxel actual, el color pronosticado. Los cinco métodos son: None, Sub, Up, Average y Paeth.

Compresión: DEFLATE.

El algoritmo deflación, en inglés denominado DEFLATE, es un algoritmo de compresión de datos sin pérdidas que usa una combinación del algoritmo LZ77, LZW y la codificación Huffman.
Fue originalmente definido por Phil Katz para la versión 2 de su herramienta de archivado PKZIP, y fue más tarde especificado como RFC 1951.

Comparativa entre imágenes de mapas de bits

Para ver qué formatos de imágenes vectoriales se comporta mejor con respecto a la compresión y el tamaño que ocupan se muestra una tabla en la que se relaciona el formato de imagen en que se guardó una imagen y qué tamaño ocupa con dicho tamaño.

Comparación entre imagen Mapa de Bits y Vectorial

Imágenes de mapas de bits	Imágenes vectoriales
Los píxeles requieren menos operaciones del procesador para ser decodificados.	Requieren mayor cantidad de operaciones del procesador para ser decodificados y desplegados en la pantalla, ya que siempre se convierten finalmente en una imagen de píxeles a través de un proceso de render
Como consecuencia del almacenamiento de cada punto de la imagen, ocupan mayor espacio en memoria, y requieren un tiempo mayor de transferencia a través de las redes.	Almacenan en pocos bytes información compleja, de manera que se transfieren rápidamente a través de las redes.
Tienen una resolución fija, determinada por la cantidad de pixeles que se hayan almacenado en el archivo. Cualquier operación de reducción o ampliación de la cantidad de pixeles, redunda en una pérdida de información o aliasing.	Son independientes de la resolución, es decir, con la descripción geométrica almacenada se pueden generar imágenes de diversos tamaños de pixeles, tan sólo ampliando la escala del vector.
Son buenos para almacenar texturas complejas.	No son buenos para almacenar texturas, sino más bien áreas de color plano.
Son aptas para la representación de objetos del mundo real.	En general, no son aptas para la representación de objetos del mundo real aunque se puede utilizar con ese propósito. El resultado da la impresión de ser de "dibujos animados".

Imagen Digital

Una imagen digital es un conjunto de números secuenciales a los que se agrega una descripción de lo que ellos representan y el formato en que esta información está codificada. El píxel (contracción del inglés PICture ELement) es la representación de un punto en el plano en una imagen bidimensional. El conjunto ordenado de píxeles forman una imagen. Mientras mayor es el número de píxeles, mejor es la calidad de la representación de la realidad, lo que se denomina como resolución espacial. Si se considera el grosor de corte, se tendrá que aceptar que cada píxel tiene una tercera dimensión. De ahí que en realidad cada número representa un volumen, y por tanto se comienza a hablar de voxel (VOLume ELement). De esta forma al apilar un grupo de imágenes bidimensionales, se obtiene una base de datos que representa una realidad tridimensional.

Clasificación Las imágenes se clasifican según la cantidad y tipo de información que se asigne a cada píxel. Las imágenes digitales se pueden generar en monocromo, en escala de grises o a color RGB:

Imagen monocromo (binarias): Se representan por píxeles que constan de un solo bit, que representan dos tonos (negro y blanco), utilizando el valor 0 para el negro y 1 para el blanco o viceversa.
Imagen en escala de grises: Están representados por un byte, por lo que cada píxel puede tener 256 valores distintos, que corresponden cada uno con valores de grises diferentes.
Imagen a color RGB. Está representada por 24 bits, que están divididos en tres grupos de 8 bits: para el rojo, el verde y el azul. La combinación de estos bits representa otros colores. Una imagen de 24 bits (224) muestra 16,7 millones de tonos de colores distintos.

Expresión de la imagen digital

Una imagen digital a niveles de gris es una función bidimensional de la intensidad de luz cuyos valores se han obtenido muestreando la intensidad sobre una casilla rectangular. Por lo tanto, una imagen digital se expresa como (𝑥,), en donde la 𝑥 y la 𝑦 son las coordenadas espaciales y el valor de 𝑓 en cada punto (𝑥,𝑦) es proporcional a la intensidad de la luz (i.e. al nivel de gris) de ese punto. La expresión matemática de la imagen en color, en el espacio RGB, es la combinación de tres funciones bidimensionales, cada una de ellas correspondientes a cada uno de los componentes principales del color (Rojo, Verde y Azul):

F(x,y) = fR(x,y)·fG(x,y)·fB(x,y)

La representación discreta o digitalizada, de una imagen en color real, corresponde a una matriz tridimensional en que cada elemento representa un píxel en una fila y columna con los valores de cada plano de la imagen o componente RGB del color. (RGB: acrónimo formado por las iniciales en inglés de los nombres de los tres colores principales Red, Green, Blue).

Procesamiento

Para el tratamiento de una imagen digital se emplean diversos procederes y algoritmos que tienen en su trasfondo una aplicación de múltiples ecuaciones matemáticas. Estos métodos son generalmente transparentes al usuario común y son principio básico de los grandes software que realizan este tipo de trabajo(Editores de imágenes).Entre los principales procesos que llevan a cabo desde que se captura una imagen hasta su puesta a punto, podemos citar los siguientes:

Métodos para variar la información gráfica
Métodos para variar el tamaño
Transformaciones
Compresión.
Optimizaron.

Métodos para variar la información gráfica

El análisis físico de una imagen se realiza con el histograma; una gráfica de barras que muestra el número de pixeles para cada nivel de grises. Los procesos de mejora de la imagen se basan fundamentalmente en los métodos para cambiar matemáticamente la información gráfica. Podemos utilizar 3 formas diferentes de manipular la información gráfica de un histograma.

El barrido de desplazamiento (Slide Mapping): Cambia la luminosidad a base de agregar o sustraer un valor constante. Por ejemplo; añadir una constante de 50 a cada pixel de la imagen, desplaza el histograma hacia la derecha en 50 niveles de gris.

El barrido de extensión (Stretch Mapping): Mejora los contrastes pobres a base de multiplicar o dividir cada pixel por una constante. La multiplicación "extiende" los valores del pixel, de modo que se puede utilizar una mayor gama de grises.

El barrido Complementario (Complement Mapping): Cambia el valor digital de cada pixel para invertir la imagen. Los pixeles negros se vuelven blancos. Los pixeles blancos se vuelven negros y los pixeles grises se convierten en sus complementarios.

Para realizar correcciones de color en imagen de 24 bits de color, las operaciones de barrido pueden aplicarse a los estratos del rojo, verde y azul.

Al reducir el color rojo 50 niveles, se desplaza el balance de color hacia el can.
Al reducir el color verde 50 niveles, se desplaza el balance de color hacia el magenta.
al reducir el estrato del color azul 50 niveles, se desplaza el balance de color hacia el amarillo.

Métodos para variar el tamaño

La decimación es un proceso mediante el cual se eliminan los pixeles para reducir el tamaño de una image. Para reducirla a la mitad, se eliminan filas y columnas de pixeles de forma alterna.
La replicaron aumenta el tamaño de las imagen por la duplicación de los pixeles.
La interpolación agranda las imágenes promediando el valor de los pixeles vecinos, para calcular el valor de los pixeles añadidos. Esto origina un aumento de tamaño de mayor calidad que la replicación.

Transformaciones

Las transformaciones son tratamientos de ecuador que trasladan los datos de la imagen a otro espacio o dominio para que puedan ser manipulados de formas mas rápida.
Las transformaciones también pueden suministrar un filtrado de precisión mediante la separación de una imagen en sus componentes de frecuencia espacial manipulando luego las frecuencias especificas. Así por ejemplo, los bordes pueden realzarse (edge enhancement) incrementado las frecuencias espaciales altas.

Compresión

La compresión de las imágenes trata de aprovecharse de esta redundancia para reducir el numero de bits necesarios para representar la imagen, consiguiendo de esta formar ahorrar recursos tanto de almacenamiento como de transmisión.
Una imagen 2D posee unas dimensiones en MxNxK, donde 2^K se corresponde con el rango de niveles gris.
Hay dos técnicas de compresión de imagen: reversibles(lossless o noiseless) e Irreversibles (lossy o noisy).

La compresión reversible quiere decir "sin perdida" se refiere a que si se comprime una imagen y se almacena, cuando se recupera, la imagen obtenida coincide exactamente con la original, hasta en el mas pequeño detalle, En otras palabras, no se pierde información utilizando esta técnica de compresión.
La compresión irreversible, es decir "con perdida" se refiere a que se puede suprimir cierta información de la imagen para hacerla mas pequeña y sin que el ojo note la diferencia, o permitiendo perder pequeños detalles no significativos. Es decir, al volver a descomprimir la imagen se recupera con alguna diferencia respecto a la original.

Los factores de compresión logrados con técnicas "lossless" están alrededor de 1:2, mientras que con técnicas "lossy" se puede obtener factures de 1:10, 1:50 o mayores.
Esta mayor compresión se logra mediante una degradación de la imagen. Así la calidad de la imagen dependerá del grado de compresión que se logre.

La historia del Procesamiento digital de imágenes (PDI) se remonta a la década de los 60 como consecuencia de su aplicación en medicina y en los programas espaciales. A partir de entonces, se han extendido a un amplio rango de aplicaciones tales como: imágenes médicas, satelitales, astronómicas, geográficas, arqueológicas, biológicas y aplicaciones industriales entre otras. El PDI está directamente vinculado con el desarrollo y evolución de los ordenadores. Su progreso ha ido de la mano con el desarrollo de las tecnologías de hardware, ya que requiere una alta potencia y recursos computacionales para almacenar y procesar las imágenes. De igual manera el desarrollo de los lenguajes de programación y los sistemas operativos han hecho posible el crecimiento continuo de aplicaciones relacionadas con el procesamiento de imágenes.

El momento histórico que hace que estas técnicas confluyan y den un cuerpo de conocimiento propio, surge en la década de los 80. La revolución de la Electrónica, con las cámaras de vídeo CCD y los microprocesadores, junto con la evolución de las Ciencias de la Computación hace que sea factible la Visión Artificial.

La separación entre el Procesamiento de imágenes y la Visión Artificial es muy difusa. PDI hace referencia a los algoritmos de computación que convierte la imagen digital adquirida en otra de mayor relevancia.

Visión artificial

Relación PDI - Vision Artificial

La historia del Procesamiento digital de imágenes (PDI) se remonta a la década de los 60 como consecuencia de su aplicación en medicina y en los programas espaciales. A partir de entonces, se han extendido a un amplio rango de aplicaciones tales como: imágenes médicas, satelitales, astronómicas, geográficas, arqueológicas, biológicas y aplicaciones industriales entre otras.

El PDI está directamente vinculado con el desarrollo y evolución de los ordenadores. Su progreso ha ido de la mano con el desarrollo de las tecnologías de hardware, ya que requiere una alta potencia y recursos computacionales para almacenar y procesar las imágenes. De igual manera el desarrollo de los lenguajes de programación y los sistemas operativos han hecho posible el crecimiento continuo de aplicaciones relacionadas con el procesamiento de imágenes.

El momento histórico que hace que estas técnicas confluyan y den un cuerpo de conocimiento propio, surge en la década de los 80. La revolución de la Electrónica, con las cámaras de vídeo CCD y los microprocesadores, junto con la evolución de las Ciencias de la Computación hace que sea factible la Visión Artificial.

La separación entre el Procesamiento de imágenes y la Visión Artificial es muy difusa. PDI hace referencia a los algoritmos de computación que convierte la imagen digital adquirida en otra de mayor relevancia.

Proceso de la Visión Artificial

Diagrama de las Etapas de la Vision Artificial

La visión artificial o visión por computador es una disciplina científica que incluye métodos para adquirir, procesar, analizar y comprender las imágenes del mundo real con el fin de producir información numérica o simbólica para que puedan ser tratados por un computador.

Aunque cada aplicación de Visión Artificial tiene sus especificaciones, se puede decir que existe un tronco común de etapas entre ellas. No necesariamente debe cubrirse todas en una implementación concreta. Hay algunas veces que sólo se tiene un subconjunto de las fases que se van a citar.

Una vez adquirida la imagen se pasará a la etapa de preprocesado. El objetivo es mejorar la calidad informativa de la imagen adquirida. Se incluyen operaciones de mejora de la relación señal-ruido (denoising), SNR, de atenuar las imperfecciones de la adquisición de mejorar el contraste o de optimizar la distribución de la intensidad.

Segmentación es la fase donde se particiona la imagen en áreas con significado.

Una vez dividida la imagen en zonas con características de más alto nivel se pasará a su extracción de las características. Con las características analizadas de cada región se debe de clasificar e interpretar. Por tanto, se diseñarán clasificadores que le dé a cada área segmentada una etiqueta de alto nivel, como por ejemplo, redes neuronales, sistemas expertos, lógica borrosa, clasificadores estadísticos, etc.

Usos de las Imágenes

Formato de imágenes médicas

DICOM (Digital Imaging and Communications in Medicine) es un estándar de imágenes médicas y comunicación en medicina, que hace posible que los archivos médicos puedan viajar de forma segura entre hospitales, centros de investigación y departamentos. Luego esa información puede verse remotamente para que los médicos puedan diagnosticar desde su casa y buscar diferentes opiniones de otros expertos de un modo fácil y sencillo.

El formato DICOM se diferencia de otros ficheros de datos en que agrupa la información dentro de un conjunto de datos, es decir, tiene sus metadatos. Por ejemplo, una radiografía de pecho contiene además de la imagen generada por el dispositivo de captura, el identificador del paciente que realizó la prueba, información sobre la captura realizada, parámetros clínicos, etc. de manera que la imagen no puede ser separada por error de su información clínica.

Cuestionario de auto-evaluacion

Conclusiones

El uso adecuado de los recursos gráficos en cualquier aplicación informática es fundamental para obtener el mejor rendimiento de cara al usuario, en las aplicaciones multimedia esto es vital a tomar en cuenta, pues como siempre se ha dicho "una imagen vale mas que mil palabras" por lo que saber "Que", "Cual" y "Como" utilizarlas en las aplicaciones multimedia que se desarrollen, es la diferencia entre una aplicación de éxito y algo que será pasajero e inútil en el tiempo. En esta lección, nos enfocamos principalmente en las ventajas y desventajas que tienen cada uno de los formatos de imagenes y sus usos respectivos en las aplicaciones. Pero al final del día, la decisión de cual y como, usarlas, esta en las manos del desarrollador quien es el que tendrá la ultima palabra.

Referencias

Participantes activos

Esteban Armas Vega (discusión)
Grupo 5 (discusión)

	Son siete los tipos en los que están divididas
	Fractales y Redimensionables
	Vectoriales y de Mapa de Bits
	GIF y TIFF

	Pixel
	Cuadricula
	Punto por Pulgada
	Unidad Cubica.

	GIF, PNJF y GHIO
	PNG, TYFF y JIF
	RAW, PNG y WMA
	GIF, PNG y TIFF

	La resolución en megapixeles y la compresión
	La profundidad del color y la compresión.
	La profundidad del color y la compañía digitalizadora.
	Su uso en la web o no y la calidad de la imagen.

	La imagen a color RGB, está representada por 24 bits, que están divididos en tres grupos de 8 bits.
	Un conjunto ordenado de píxeles forman una imagen.
	La representación digitalizada de una imagen en color, corresponde a una matriz en que cada elemento representa un píxel en una fila y columna con los valores de cada plano de la imagen o componente RGB del color.
	El voxel es la representación de un punto en el plano en una imagen bidimensional.

	Los pixeles requieren menos operaciones del procesador para ser decodificados.
	Son buenos para almacenar texturas complejas.
	Almacenan en pocos bytes información compleja, de manera que se transfieren rápidamente a través de las redes.
	Como consecuencia del almacenamiento de cada punto de la imagen, ocupan mayor espacio en memoria.

	La separación entre el Procesamiento de imágenes y la Visión Artificial está claramente marcada.
	PDI está directamente vinculado con el desarrollo y evolución de los ordenadores.
	La visión artificial es una disciplina científica que incluye métodos para adquirir, procesar, analizar y comprender las imágenes del mundo real.
	PDI hace referencia a los algoritmos de computación que convierte la imagen digital adquirida en otra de mayor relevancia.

	Es un estándar de imágenes médicas y comunicación en medicina.
	Hace posible que los archivos médicos puedan viajar de forma segura entre hospitales, centros de investigación y departamentos.
	Es relativamente secillo que la imagen pueda ser separada por error de su información clínica.
	El formato DICOM se diferencia de otros ficheros de datos en que agrupa la información dentro de un conjunto de datos, es decir, tiene sus metadatos.