Wikipedia:Sesgo intrínseco

Wikipedia sufre de un sesgo intrínseco debido a una representación irregular de los grupos demográficos entre sus contribuyentes. La consecuencia es un desigual tratamiento de los temas y la infrarrepresentación de aquellos temas relacionados con los grupos demográficos menos numerosos y/o afectados por la brecha digital. Este sesgo choca con el objetivo de Wikipedia de presentar los temas desde un punto de vista neutral, y debe ser evitado en la medida de lo posible.

Origen del sesgo

Porcentaje de internautas por país.

En la Wikipedia en español hay una sobrerrepresentación de hispanohablantes (nativos o no nativos), de un país de mayoría cristiana, jóvenes, de clase media o media-alta, con estudios y con fácil acceso a un ordenador (sea en el trabajo o en el tiempo libre). Asimismo, muchos de los artículos creados en la Wikipedia en español son traducciones de la Wikipedia en inglés, que sufre de sesgos similares (salvo en el aspecto idiomático). La consecuencia es que España, Argentina, México y los Estados Unidos están mucho más ampliamente tratados que, por ejemplo, Albania, Vietnam o Argelia; y que, en general, América estará más ampliamente tratada que África o Asia. De manera análoga, el cristianismo estará tratado con mucho mayor detalle que el islam, el jainismo o el budismo.

La conexión a Internet es necesaria para contribuir en Wikipedia. La mayor parte de la población mundial, y concretamente la mayor parte de la población de países en vías de desarrollo y los pobres de los países desarrollados, no tiene acceso a Internet y por ello los ámbitos que son relevantes a dichas personas pueden verse infrarrepresentados. Asimismo, cabe mencionar a los ancianos y a las personas que tienen algún tipo de minusvalía, pues pueden tener un acceso más restringido a Internet que las personas jóvenes y sanas. Otros grupos demográficos infrarrepresentados son las minorías étnicas (tales como los gitanos y los magrebíes en España, o los indios americanos en Estados Unidos) debido a su mayor tasa de pobreza y a su acceso más limitado a la educación y a las tecnologías de la información.

Además, existe una barrera tecnológica que dificulta el acceso a aquellos contribuyentes potenciales que no tienen facilidad en el manejo de ordenadores. Esta barrera se manifiesta en el complejo código wiki y su uso profuso de corchetes, llaves y otros símbolos, así como en el funcionamiento de las redirecciones. Otra dificultad añadida es el uso de caracteres en los títulos que muchos usuarios no saben introducir, a menudo porque utilizan una distribución de teclas que no se lo permite, al tiempo que no saben cambiar dicha distribución. La consecuencia es que muchos usuarios acabarán pensando «esto no está hecho para mí», por lo que Wikipedia quedará sesgada hacia las áreas de interés de aquellos usuarios más familiarizados con los ordenadores. Por ejemplo, la informática, la astronomía y la cultura popular son áreas que están más representadas que la agricultura, el arte medieval o la paleolingüística.

Finalmente, los wikipedistas son personas que tienen suficiente tiempo libre como para permitirse colaborar en el proyecto. Los puntos de vista de editores que invierten su tiempo en otros proyectos, por ejemplo, ganarse la vida incluso a través del pluriempleo o mediante el cuidado de otros, se verán menos representados. Además, debido de nuevo a las características demográficas de los wikipedistas, los intelectuales, grandes empresarios, profesores y miembros de subculturas estarán mejor representados que los obreros y trabajadores manuales.

Otra fuente de sesgos es la censura gubernamental de algunos países, que puede suponer el bloqueo de Wikipedia para sus ciudadanos. Además, las políticas de Wikipedia prohíben el uso de proxies abiertos, que serían la forma más típica de burlar dicha censura.

El uso de fuentes fiables para respaldar el contenido de los artículos es necesario según la política de Wikipedia, pero la disponibilidad de dichas fuentes no es uniforme. De nuevo, la disponibilidad de las fuentes también está sometida a un fuerte sesgo por el cual están sobrerrepresentadas aquellas en español (en inglés en el caso de las traducciones), de países desarrollados, relativas a fechas recientes o relacionadas con la informática, las tecnologías y la cultura popular. Debe tenerse en cuenta también que el estudio de lenguas extranjeras tampoco es uniforme entre los hispanohablantes: muchos tienen conocimientos de inglés, bastantes han estudiado francés y muy pocos entienden serbocroata o árabe, por ejemplo, por lo que BBC News y TV5 Monde serán fuentes más utilizadas que Večernje novosti o Assahra Al Maghribiya. También debe tenerse en cuenta que no todos los periódicos disponen de una amplia hemeroteca consultable a través de Internet, por lo que es más fácil obtener una referencia de un periódico de 2009 que de un periódico de 1923. El coste de suscripción puede ser otra barrera más que limite seriamente la adición de referencias. La mayor parte de las investigaciones astronómicas está libremente disponible al público a través de arXiv o NASA ADS, pero los textos de jurisprudencia a menudo solo están disponibles a través de una costosa suscripción.

Tampoco está exenta de sesgos la traducción de un artículo de la Wikipedia en otro idioma. No olvidemos que, si bien en la Wikipedia en español los hispanohablantes están sobrerrepresentados, ocurre exactamente lo mismo con los angloparlantes en la Wikipedia en inglés, los francoparlantes en la Wikipedia en francés, etc. Y, además, se une la desproporción de hispanohablantes que pueden traducir artículos en inglés o francés frente a aquellos que pueden traducirlos de otros idiomas (finlandés, ruso, coreano...).

Other Languages