Авторы Википедии, кто они?

Aaron Swartz провел довольно интересный анализ данных о редактировании статей Википедии, который дал результаты, в корне отличающиеся от принятого до этого мнения.

Так вот, Jimmy Wales (основатель и председатель Wikimedia Foundation) приводит следующие данные, полученные на основе подсчета количества правок (т.е. числа транзакций, без учета веса изменений):

Я ожидал обнаружить что-то вроде правила 80-20: 80% работы выполняют 20% пользователей, просто потому что такое ощущение возникало постоянно. Но на самом деле разграничение оказалось еще резче: оказалось, что свыше 50% всех правок внесли всего лишь 0,7% пользователей… 524 человека. На самом деле самые активные 2% пользователей (1400 человек), внесли 73,4% всех правок.


Остальные 25% правок по его словам исходят от людей

вносящих второстепенные коррективы содержания… или исправляющих небольшую орфографическую ошибку

Вместо подсчета числа правок Swartz строил распределение на основе веса внесенных изменений, точнее, на количестве введенных пользователем символов, сохранившихся в результирующем тексте. Полученные результаты можно проиллюстрировать на примере одной из статей (статье Alan Alda):

Если просто считать правки, то окажется, что самый большой вклад в статью Alan Alda (7 из 10 пользователей) внесли зарегистрированные пользователи, из которых у пятерых, по несколько тысяч правок по всему сайту. Так #4 внес всего свыше 7000 правок, а #7 свыше 25000. Другими словами, если использовать такой метод подсчета, то действительно приведенные выше данные подтверждаются: кажется, что большая часть информации записана активными редакторами.

Но если подсчитать символы, картина радикально изменится: лишь немногие участники (всего двое из первой десятки) вообще зарегистрированы, а большинство (шесть из десяти) внесли менее 25 правок по всему сайту. Например, #9 вообще внес ровно одну правку – именно в эту статью.

Всего Aaron проверил 200 случайно выбранных статей, о статистической значимости эксперимента, конечно, говорить не приходится, но тем не менее, такая картина оказалась довольно характерна. Swartz сделал из этого следующие выводы:

Если свести все воедино, то вырисовывается следующая картина: неактивный участник вносит одну правку, добавляя блок информации, затем активные участники вносят несколько правок, приглаживая и форматируя эту информацию. Кроме того, активные участники получают сразу до нескольких тысяч очков за одно изменение по всему сайту имени какого-нибудь раздела, которое может волновать только их. В результате подавляющее большинство правок приходится на активное меньшинство. Но большая часть наполнения энциклопедии введена сторонними люди.

И, если подумать, это совершенно логично. Писать энциклопедию – тяжкий труд. Чтобы делать это на сколько-нибудь приемлемом уровне, необходимо обладать очень большим объемом знаний по широкому кругу вопросов. Записать такой объем текста уже непросто, не говоря уже о том, что провести такой объем исследований попросту невозможно.

С другой стороны, у каждого найдется несколько не очень распространенных вопросов, в которых он по тем или иным причинам хорошо разбирается. И они делятся этими знаниями нажимая на ссылке “Править” и добавляя в Википедию параграф-другой. В тоже время небольшое количество людей очень сильно увлеклись самой Википедией, настолько, что изучили ее правила и особый синтаксис и теперь занимаются “причесыванием” внесенных другими текстов.

Другие энциклопедии устроены подобным же образом только в миниатюре: большая группа людей пишет статьи по вопросам, в которых они хорошо разбираются, и несколько человек приводит их к единому стилю. Эта вторая группа, очевидно, очень важна – именно благодаря ей энциклопедия обладает единым форматом и стилем, но будет большим преувеличением считать, что это именно они написали энциклопедию.

Кстати по поводу этих расчетов была недавно статья на Вебпланете, правда там автор сразу подался в философию (что тоже не плохо, но на любителя), а техническую сторону вопроса помянул только мимоходом.



8 комментариев к “Авторы Википедии, кто они?”

  1. Crash Override 2.0 says:

    Весьма интересная заметка.

  2. Dan says:

    Это подтверждает, что большинство людей потребители. Статистика удивительно напоминает статистику кликов по опросам проводимым в интернете. В моих экспериментах отклик составлял менее 2.4% в среднем 0.96%

  3. Вот еще недавняя статья Якоба Нильсена на эту тему – “Participation Inequality: Encouraging More Users to Contribute“.

  4. sheller says:

    Из сотни читателей только один писатель и 5-10 комментаторов…

  5. Литературовед says:

    По-моему, вполне предсказуемые результаты… почему они считали, что 20% пишет и корректирует статьи – не понятно.

  6. Gorky says:

    Интересно :) Будем надеяться что постепенно ситуация изменится…

  7. menace says:

    Считаю, что так и должно быть!

  8. Татьяна says:

    Правильно, так и должно быть. А то все будут писателями, а кто будет сеять, строить, шить, лечить, детй воспитывать?
    Сама достаточно много знаю, но Википедию ни разу не павила из скромности.
    В жизни я вовсе не потребитель, работаю учителем в школе и делюсь всем, что знаю и умею с детьми почти бесплатно.

Leave a Reply to Crash Override 2.0