Varianza

En teoría de probabilidad, la varianza o variancia (que suele representarse como ) de una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.

Está medida en la unidad de medida de la variable al cuadrado. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una medida de dispersión alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza tiene como valor mínimo 0.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

El término varianza fue acuñado por Ronald Fisher en un artículo publicado en enero de 1919 con el título The Correlation Between Relatives on the Supposition of Mendelian Inheritance.[1]

Definición

Si tenemos un conjunto de datos de una misma variable, la varianza se calcula de la siguiente forma:

Siendo:

  • : cada dato
  • : número de datos
  • : media aritmética de los datos

Variable aleatoria

Aplicando este concepto a una variable aleatoria con media μ = E[X], se define su varianza, Var(X) (también representada como o, simplemente σ2), como

Desarrollando la definición anterior, se obtiene la siguiente definición alternativa (y equivalente):

Si una distribución no tiene esperanza, como ocurre con la de Cauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando su índice k satisface 1 < k ≤ 2.

Caso continuo

Si la variable aleatoria X es continua con función de densidad f(x), entonces

donde

y las integrales están definidas sobre el rango de X.

Caso discreto

Si la variable aleatoria X es discreta con pesos x1 ↦ p1, ..., xn ↦ pn y n es la cantidad total de datos, entonces tenemos:

donde

.
Other Languages
العربية: تباين (إحصاء)
azərbaycanca: Dispersiya
বাংলা: ভেদাঙ্ক
català: Variància
dansk: Varians
Ελληνικά: Διακύμανση
English: Variance
Esperanto: Varianco
euskara: Bariantza
فارسی: واریانس
suomi: Varianssi
Gaeilge: Athraitheas
galego: Varianza
עברית: שונות
हिन्दी: प्रसरण
magyar: Variancia
Bahasa Indonesia: Varians
íslenska: Dreifni
italiano: Varianza
日本語: 分散
ქართული: დისპერსია
한국어: 분산
lietuvių: Dispersija
македонски: Варијанса
Bahasa Melayu: Varians
Nederlands: Variantie
norsk nynorsk: Varians
norsk bokmål: Varians
polski: Wariancja
português: Variância
sicilianu: Varianza
srpskohrvatski / српскохрватски: Varijansa
Simple English: Variance
slovenščina: Varianca
српски / srpski: Варијанса
Basa Sunda: Varian
svenska: Varians
தமிழ்: பரவற்படி
Türkçe: Varyans
اردو: تفاوت
Tiếng Việt: Phương sai
中文: 方差
粵語: 變異數