Histograma

Histograma.

En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua (como la longitud o el peso). De esta manera ofrece una visión de grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. Así pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere un valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según sea el caso, que se ubica en un determinado valor o sub-rango de valores de la característica que toma la característica de interés, evidentemente, cuando este espectro de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o comportamiento de la población, en otras ocasiones este espectro es extendido para mostrar el alejamiento o ubicación de la población o la muestra analizada respecto de un valor de interés.

Se utilizan para relacionar variables cuantitativas continuas. Para variables cuantitativas discretas las barras se dibujan separadas y el gráfico se llama diagrama de frecuencias, porque la variable representada en el eje horizontal ya no representa un espectro continuo de valores, sino valores cuantitativos específicos, igual que ocurre en un diagrama de barras, usado para representar una característica cualitativa o categórica. Su utilidad se hace más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han agrupado en intervalos de clase.

Ejemplos de su uso es la representación de edades o estaturas de una población. Por comodidad, sus valores se agrupan en clases, es decir, en intervalos continuos. En los casos en los que los datos son cualitativos (no numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.

Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Tipos de gráficos relacionados con el histograma

  • Histograma de frecuencias absolutas
Representa la frecuencia absoluta mediante la altura de las barras. Se usa mucho en educación no universitaria por su sencillez, pero sólo se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las alturas y las superficies son proporcionales. En esos niveles educativos se introduce una estadística elemental y todavía no se puede profundizar en estos detalles.
  • Histograma de frecuencias relativas
Representa la frecuencia relativa mediante la altura de las barras. Igual que en el caso anterior se usa mucho en educación no universitaria. La elaboración del gráfico es más complicada pues los números ya no son enteros. Como en el caso anterior sólo se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las alturas y las superficies son proporcionales.
  • Histograma
Representa la frecuencia relativa mediante la superficie de las barras. Aunque esto sea cierto en todos los histogramas, cuando se agrupan los datos en intervalos desiguales hay que atender a la superficie de las barras, que no se corresponderá con la altura como ocurría en los casos anteriores. Es el que se suele usar en educación universitaria. Para su elaboración debe introducirse el concepto de altura de histograma, que es un concepto equivalente al de densidad de probabilidad, y que se calcula dividiendo la frecuencia relativa de ese intervalo (o sea la superficie que queremos darle) entre la anchura del intervalo (la base del rectángulo). Ahora las barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas esas superficies (de todas las barras) será 1, o sea el 100%.
  • Función densidad
Representa la probabilidad mediante la superficie de las barras. Es un gráfico idéntico al histograma pero aplicado a distribuciones teóricas. El concepto de frecuencia relativa se cambia por el de probabilidad, pero también se representa por superficies y la suma de todas esas superficies (de todas las barras) será 1, como en el histograma, o sea el 100% de probabilidad.
  • Curva acumulativa u ojiva
Es un gráfico acumulativo (véase Función_de_distribución) que representa la frecuencia relativa acumulada hasta cada valor de la variable. Si el rango es finito el primer valor del rango tiene frecuencia acumulada (anterior) cero y el último tiene frecuencia acumulada 1 (100%). Así el eje vertical siempre toma valores de cero a uno y representa frecuencias relativas (o probabilidades si se trata de distribuciones teóricas). Se utiliza para introducir el concepto y el cálculo de la mediana, los cuartiles, los deciles y en general los parámetros llamados de posición. Si el rango es infinito, como suele ocurrir en las distribuciones teóricas (Normal, student, chi-cuadrado, etc,) el cero puede no alcanzarse y será el valor asintótico por la izquierda, si tampoco se alcanza el uno también será el valor asintótico derecho, y en muchos casos no se alcanza ni uno ni otro, teniendo dos asintotas. Este gráfico es la integral del histograma (cuando trabajamos con distribuciones reales) o de la función densidad (cuando trabajamos con distribuciones teóricas).
  • Curva acumulativa de frecuencias absolutas
Es un gráfico acumulativo que representa la frecuencia absoluta acumulada hasta cada valor de la variable. Realmente no es un gráfico relacionado con el histograma, pero es muy parecido a la curva acumulativa y a la función de distribución. Se usa mucho en enseñanza no universitaria por su sencillez, ya que permite trabajar con números enteros (frecuencias absolutas) y, como la anterior, permite introducir y calcular mediana, cuartiles, etc. Esta curva no irá entre cero y uno sino entre cero y el total de individuos de la muestra.
  • Nota
En todos estos diagramas la muestra o la población se divide en intervalos (del parámetro a estudiar, por ejemplo estatura) y aparece el dilema de si incluir el extremo del intervalo (por ejemplo 180 cm) en el primer o en el segundo intervalo en los que aparece. Tradicionalmente se incluye en el segundo y los intervalos quedan abiertos por la derecha: [170, 180) y [180,190). Sin embargo, dependiendo del problema a estudiar (problemas en que los extremos salen con mucha frecuencia frente a otros en que no salen nunca) y de la costumbre, se pueden encontrar otras elecciones.
Other Languages
العربية: مدرج تكراري
azərbaycanca: Histoqram
български: Хистограма
català: Histograma
čeština: Histogram
dansk: Histogram
Deutsch: Histogramm
Ελληνικά: Ιστόγραμμα
English: Histogram
eesti: Histogramm
euskara: Histograma
français: Histogramme
עברית: היסטוגרמה
हिन्दी: आयतचित्र
magyar: Hisztogram
Bahasa Indonesia: Histogram
italiano: Istogramma
қазақша: Гистограмма
한국어: 히스토그램
Кыргызча: Гистограм
latviešu: Histogramma
македонски: Хистограм
Nederlands: Histogram
norsk nynorsk: Histogram
norsk bokmål: Histogram
ਪੰਜਾਬੀ: ਆਇਤ ਚਿੱਤਰ
polski: Histogram
Piemontèis: Istograma
português: Histograma
русский: Гистограмма
sicilianu: Istogramma
Simple English: Histogram
slovenčina: Histogram
slovenščina: Histogram
српски / srpski: Histogram
Basa Sunda: Histogram
svenska: Histogram
Türkçe: Histogram
українська: Гістограма
ייִדיש: היסטאגראם
中文: 直方图