Imágenes I, P y B

Las imágenes I, P y B son las que resultan de la compresión de la señal de vídeo en los estándares ITU-T o MPEG. Estas imágenes atienden a los siguientes tipos:

  • Las imágenes I: son las que se codifican por sí mismas.
  • Las imágenes P: son las predichas por extrapolación.
  • Las imágenes B: son las predichas por interpolación.

Contexto general

En los estándares de compresión de video, como ITU-T o MPEG, se utilizan estos tipos de imágenes para comprimir los datos. De hecho, en lugar de codificar cada imagen que compone el video, uno puede codificar una imagen totalmente y después las diferencias entre esta imagen y las imágenes * siguientes, explotando así la redundancia en las imágenes que siguen. Por ejemplo, en una secuencia de video con un segundo plano fijo, podemos representar solo las partes que se mueven, para no codificar cada vez el segundo plano que no cambia y ganar así mucho en capacidades de compresión.

En estos tipos de algoritmos, se codifican algunas imágenes por sí mismas y se predicen las otras. Las imágenes son divididas en macrobloques (en general de 16 X 16 píxeles) y siguen el concepto de compensación de movimientos para la predicción: por cada macrobloque de una imagen que queremos codificar a partir de una imagen de referencia (que puede ser una anterior o una posterior), se busca donde está en la imagen de referencia, y se define un vector de movimiento que va a dar el movimiento relativo entre los dos macrobloques que se corresponden. Por supuesto, entre dos imágenes, no se pueden encontrar siempre macrobloques todos completamente idénticos y se utiliza una técnica de comparación entre los macrobloques para buscar los que son los más correlacionados entre ellos. Se puede predecir una imagen a partir de la imagen de referencia y los vectores de movimiento, así obtenemos la diferencia entre ésta imagen predicha y la imagen original que queremos codificar.
Entonces, solo se puede enviar las imágenes codificadas por sí mismas, las matrices de vectores de movimiento, y las diferencias entre las imágenes de referencia y las otras para codificar todo el vídeo.

  • Las imágenes I pueden ser codificadas por el formato JPEG además de otros, se utilizan para decodificar las otras imágenes que componen el vídeo y pueden ser utilizadas como puntos de acceso aleatorio para empezar a decodificar los videos a partir de cualquier momento. En general, la codificación de estas imágenes ocupa más espacio que las otras.
  • Las imágenes P son las imágenes predichas con referencia a una imagen que puede ser de tipo I o P anterior en el tiempo, así que necesitan la decodificación de la imagen de referencia antes de poder ser decodificadas.
  • Las imágenes B son las imágenes predichas con referencia a dos imágenes que pueden ser de tipo I o P, una anterior y una posterior, así que necesitan la decodificación de las dos imágenes de referencia así como la reordenación de las imágenes para poder ser descodificadas.

Algunos macrobloques de las imágenes P o B pueden ser codificados por sí mismos para refrescarlos y para evitar errores demasiado importantes que se pueden producir si hay muchas imágenes predichas entre la imagen I anterior y la imagen actual.

Secuencia de imágenes. Los vectores inferiores indican las referencias predictivas que hay entre ellas. Se ha escogido una ordenación IBBPBBPBBI a modo de ejemplo, ya que permite establecer lazos de predicción bastante usuales.
Other Languages