Seven years after Nature, pilot study compares Wikipedia favorably to other encyclopedias in three languages
Improving the quality of articles has long been one of the primary aims of contributors to Wikipedia, and is one of the Wikimedia movement’s 2010-15 strategic priorities, but measuring it objectively has remained a challenge. In 2005, Nature famously reported that Wikipedia articles on scientific topics contained just four errors per article on average, compared to three errors per article in the online edition of Encyclopaedia Britannica. Britannica objected to the report, but Nature stood by it, and the report remains widely cited today.

With increase in size and reach, how has quality evolved? How does Wikipedia compare today to other online encyclopedias, quality-wise? And what are good methods to measure the quality of encyclopedic articles?
The Wikimedia Foundation is announcing the release of a pilot study conducted by Epic, an e-learning consultancy, in partnership with Oxford University – “Assessing the Accuracy and Quality of Wikipedia Entries Compared to Popular Online Alternative Encyclopaedias: A Preliminary Comparative Study Across Disciplines in English, Spanish and Arabic.”

The small size of the sample does not allow us to generalize the results to Wikipedia as a whole. However, as a pilot primarily focused on methodology, the study offers new insights into the design of a protocol for expert assessment of encyclopedic contents. For our editor community and for the Foundation, which commissioned the study in 2011, it also offers evidence to inform the design of quality assessment mechanisms and quality metrics that may be used on Wikipedia itself.
The results suggest that Wikipedia articles in this sample scored higher altogether in each of the three languages, and fared particularly well in categories of accuracy and references. As the report notes, the English Wikipedia fared well in this sample against Encyclopaedia Britannica in terms of accuracy, references and overall judgement, with little differences between the two on style and overall quality score. Similar results were found when comparing Wikipedia articles in Spanish to Enciclonet. In Arabic, Mawsoah and Arab Encyclopaedia articles scored higher on style than Wikipedia, but no significant differences were found on accuracy, references, overall judgment and overall quality score. None of the encyclopedias considered in this study were rated highly by the academics in terms of suitability for citation in academic publications.
We hope that the results of this study will encourage further independent research on the quality of Wikipedia articles. To this end, Epic and Oxford University are releasing the full version of the report of this study under a Creative Commons Attribution-Share Alike license. They have announced the report here and have released an anonymized dataset under a Creative Commons Zero dedication. The team welcomes comments and feedback on the talk page of the project.
We are very encouraged by the results for this small sample of Wikipedia articles in three languages. While pointing the way forward for further research, these results affirm the quality of the collaborative work of our editor community.
Dario Taraborelli, Senior Research Analyst
Siete años tras “Nature”, estudio piloto compara favorablemente a Wikipedia frente a otras enciclopedias en tres diferentes lenguas.
Hace tiempo que mejorar la calidad de los artículos es uno de los principales objetivos de los editores de Wikipedia. Es además una de las prioridades estratégicas del movimiento Wikimedia para 2010-2015, pero la capacidad de medir objetivamente este aspecto continúa siendo un desafío. En 2005, una famosa publicación de la revista “Nature” encontró que Wikipedia contenía un promedio de sólo cuatro errores por artículo sobre temas científicos contra los tres por artículo de la edición en línea de la Enciclopedia Británica. Enciclopedia Británica cuestionó el trabajo pero Nature lo reivindicó y continúa siendo citado con frecuencia hasta el día de hoy.
Desde entonces, sin embargo, hubo relativamente pocos análisis independientes de la calidad de los artículos de Wikipedia, esto a pesar del enorme crecimiento del proyecto. Wikipedia cuenta hoy con más de 23 millones de artículos en todos los idiomas (más de cuatro millones sólo en inglés) frente a los 3,7 millones de artículos en total que tenía en 2005. Hoy es el sexto sitio con mayor tráfico general según las estadísticas de Alexa, cuando en 2005 ocupaba el puesto 37. ¿Cómo evolucionó la calidad con este incremento de alcance y tamaño? ¿Cómo se compara hoy la calidad de los artículos de Wikipedia con otras enciclopedias en línea? ¿Qué métodos son apropiados para medir la calidad de un artículo enciclopédico?
La Fundación Wikimedia anuncia el lanzamiento de un estudio piloto realizado por Epic, una consultora de enseñanza en línea, en colaboración con la Universidad de Oxford: “Assessing the Accuracy and Quality of Wikipedia Entries Compared to Popular Online Alternative Encyclopaedias: A Preliminary Comparative Study Across Disciplines in English, Spanish and Arabic” (“Evaluación de la exactitud y calidad de las entradas de Wikipedia en comparación con otras conocidas enciclopedias alternativas en línea: un estudio preliminar comparativo interdisciplinario en inglés, español y árabe”).
El estudio compara una muestra de artículos de Wikipedia en inglés con sus equivalentes en la Enciclopedia Británica, Wikipedia en español con Enciclonet, y Wikipedia en árabe con Mawsoah y la Enciclopedia Árabe. 22 artículos de cada una de estas obras fueron presentados a dos o tres expertos académicos hablantes nativos de estas lenguas, quienes las evaluaron en términos cuantitativos y cualitativos.
Lo pequeño de la muestra nos impide generalizar los resultados a toda Wikipedia. Sin embargo, desde lo metodológico, el estudio ofrece nuevas líneas para el diseño de un protocolo que permita la revisión por expertos de contenido enciclopédico. También brinda a nuestra comunidad de editores y a la Fundación, que encargó el estudio en 2011, información para respaldar el diseño de mecanismos de control y medición de calidad que pueden ser usados en la propia Wikipedia.
Los resultados sugieren que los artículos de Wikipedia muestreados tienen en general un puntaje superior a sus contrapartes en los tres idiomas evaluados, con un desempeño especialmente bueno en cuanto a exactitud y provisión de referencias. Según destaca el informe Wikipedia en inglés se compara positivamente frente a la Enciclopedia Británica en términos de exactitud, referencia y juicio general, con una pequeña diferencia de puntaje entre ambas en estilo y calidad general. Los resultados de la comparación entre Wikipedia en español y Enciclonet fueron similares. En árabe, los artículos de Mawsoah y la Enciclopedia Árabe superaron a Wikipedia en cuanto a estilo, pero no se encontraron diferencias significativas en exactitud, referencias, juicio ni calidad general. Los expertos no consideraron que ninguna de las enciclopedias evaluadas fuera superior a las demás en cuanto a la posibilidad de cita en publicaciones académicas.
Esperamos que los resultados del estudio incentiven posteriores investigaciones independientes sobre la calidad de los artículos de Wikipedia. Para contribuir a ese fin Epic y la Universidad de Oxford publican la versión completa del informe con licencia Creative Commons Atribución-CompartirIgual. Con licencia Creative Commons Zero se publica también una colección de información anónima generada por el estudio. El equipo de trabajo espera comentarios y retroalimentación en la página de discusión del proyecto.
Estamos muy motivados por los resultados de esta pequeña muestra de artículos de Wikipedia en tres idiomas. Aún cuando abren un camino para la investigación futura, estos resultados confirman la calidad del trabajo colaborativo de nuestra comunidad de editores.
Dario Taraborelli, analista de investigación senior
بعد سبع سنوات من دراسة مجلة نيتشر، دراسة جديدة تقارن محتويات ويكيبيديا بموسوعات أخرى بثلاث لغات
إن تطوير جودة المحتويات هو أحد الأهداف الرئيسية للمساهمين في ويكيبيديا، وأحد أهداف الخطة الخمسية الاستراتيجية لحركة ويكيبميديا بين الأعوام ٢٠١٠-٢٠١٥، إلا أن قياس تلك الأهداف بشكل موضوعي كان ولازال أحد التحديات القائمة. في عام ٢٠٠٥ قامت مجلت نيتشر بنشر مقالة عرضت بأن مقالات ويكيبيديا احتوت ٤ أخطاء بالمعدل في مقابل ٣ أخطاء في مقالات موسوعة بريتانيكا على الإنترنت. اعترضت بريتانيكا على التقرير إلا أن مجلة نيتشر أصرت عليه، ولا زال التقرير واسع الانتشار حتى اليوم.
منذ ذلك الحين ظهر فقط بعض الدراسات التحليلية عن جودة محتويات ويكيبيديا، على الرغم من التوسع الكبير للمشروع. يبلغ تعداد مقالات ويكيبيديا اليوم ما يزيد على ٢٣ مليون مقالة عبر اللغات المتعددة (أكثر من ٤ مليون مقالة منها باللغة الإنكليزية وحدها) بالمقارنة مع ٣.٧ مقالة بالمجموع في عام ٢٠٠٥، تحتل ويكيبيديا اليوم وفقا لترتيب موقع ألكسا المركز السادس من حيث عدد الزيارات، بينما كان ترتيبها ٣٧ في عام ٢٠٠٥.
ومع الزيادة في الحجم والانتشار، فيكون التساؤل المطروح عن تغير جودة المحتويات؟ كيف من الممكن مقارنة ويكيبيديا اليوم بالموسوعات الأخرى المنتشرة على الإنترنت من حيث الجودة؟ وما هي الطرق المثلى لقياس جودة المقالات الموسوعية؟
وهنا تعلن مؤسسة ويكيميديا عن إطلاق دراسة أولية تم القيام بها من قبل مجموعة إيبك الاستشارية بالمشاركة مع جامعة أوكسفورد تحت عنوان “تقييم دقة وجودة مقالات ويكيبيديا بالمقارنة مع موسوعات الإنترنت المنتشرة الأخرى : دراسة مقارنة أولية باللغات الإنكليزية والإسبانية والعربية”
قامت الدراسة بمقارنة نماذج من ويكيبيديا الإنكليزية مع مقالات مقابلة من موسوعة بريتانيكا، وويكيبيديا الإسبانية بمقالات مقابلة من موسوعة إينسيسلونيت، وويكيبيديا العربية مع الموسوعة العربية العالمية، والموسوعة العربية، حيث تم تقييم عينة من ٢٢ مقالة من قبل ٢ – ٣ متحدثين أصليين باللغات الثلاث من المجتمع الأكاديمي وذلك من حيث الكم والجودة.
إن حجم العينة الصغير لا يسمح بتعميم النتائج على ويكيبيديا عموما. إلا أن الدراسة الأولية ركزت بشكل رئيسي على الطريقة، كما أن الدراسة طرحت تصميم جديد لتقييم الخبراء للمحتويات الموسوعية. كما أن الدراسة تقدم لمجتمع ويكيبيديا ولمؤسسة ويكيميديا التي مولت الدراسة في عام ٢٠١١ دليلا يساعد على تصميم آليات لتقييم الجودة ووضع معايير لها لاستخدامها على ويكيبيديا نفسها.
تلخص الدراسة إلى أن مقالات ويكيبيديا سجلت علامات أعلى بشكل عام في كل من اللغات الثلاث، وتميزت بشكل خاص في فئتي الدقة والمراجع المستخدمة. وكما يشير التقيري إلى ويكيبيديا الإنكليزية حققت علامات جيدة مقابل موسوعة بريتانيكا من ناحية الدقة واستخدام المراجع والتقييم العام مع فروقات صغيرة بين من حيث التنسيق وعلامة الجودة الكلية. كما أن نتائج مماثلة تم الوصول إليها عند مقارنة ويكيبيديا الإسبانية مع موسوعة إينسيسلونيت. وفي اللغة العربية فقد حققت الموسوعة العربية العالمية والموسوعة العربية علامات أعلى من ويكيبيديا من حيث التنسيق، لكن لم يكن هناك أي فروقات من حيث الدقة، استخدام المراجع، أو التقييم الكلي للجودة. ولم تحصل أي من الموسوعات في هذه الدراسة على علامة عالية من حيث قابليتها للاستخدام كمرجع في الأبحاث الأكاديمية.
نحن نأمل بأن نتائج هذه الدراسة ستشجع أبحاث مستقلة أخرى حول مواضيع تقييم جودة مقالات ويكيبيديا. إن إيبك وجامعة أوكسفورد تنشران النسخة الكاملة من التقرير تحت رخصة المشاع الإبداعي. كما تم نشر نسخة ببيانات مجهولة الأسماء تم توليدها من قبل هذه القائمة تحت رخصة المشاع الإبداعي صفر. إن فريق الدراسة يرحب بالملاحظات والتقييم على صفحة نقاش المشروع.
لقد شجعتنا هذه النتائج عن مقالات ويكيبيديا بلغات ثلاث بشكل كبير. وبالإضافة إلى أنها تسهل الطريق إلى أبحاث مستقبلية أخرى، فإن هذه النتائج تؤكد على جودة العمل المشترك لمحرري مجتمع ويكيبيديا.
Dario Taraborelli, Senior Research Analyst

















