?

Log in

No account? Create an account
Гауссиана как закон природы - Книга бревна [entries|archive|friends|userinfo]
Книга бревна

[ картинки | галерея ]

Гауссиана как закон природы [Dec. 11th, 2011|01:07 pm]
Книга бревна
[dow |12099.30]

Статистика посещения на русской википедии статей "Логнормальное распределение":



"Нормальное распределение":



и "Гаусс":



Тут в российском интернете по итогам выборов наблюдается тенденция возвести гауссоиду в ранг законов природы. Так как не все знают что такое "гауссоида", и когда правильно искать нормального, а когда логнормального распределения, то натурально наблюдается всплеск интереса к предмету. Что мы и видим на википедии. Ожидаемо, посещаемость "нормального распределения" больше, чем "логнормального" - второе слово хоть и намного более релевантно, но зато длиннее, да и симметричный колокол красивее асимметричного. А грамотных людей меньше чем неграмотных.

Да, но назад к законам природы. Люди склонны скакать через ступеньку в логических построениях. А статистический аргумент он вообще довольно неинтуитивен и нетривиален, что к слову сказать ведёт обыденное сознание к разным расизмам-сексизмам.

Что можно сказать, гляда на графики вроде этого или лучше даже вроде этих (тут хоть выборы и прошлые, зато исследование более подробное)?

Только то, что мы наблюдаем аномалии. Ожидалось бы (лог)нормальное распределение, а получается вот такое. Статистика сама по себе не даёт никаких объяснений аномалиям. А сам по себе факт наличия аномалий не даёт оснований утверждать, что они имеют искусственное происхождение.

Дальнейшая линия рассуждений уже не опирается на статистику, а идёт примерно так:
- аномалии распределения голосов по участкам требуют объяснения;
- теория фальсификации итогов выборов в пользу ЕР объясняет все наблюдаемые аномалии;
- теории, объясняющей все аномалии естественными причинами пока не предложено.

Ergo: теория фальсификации лучшая из теорий, имеющихся в нашем распоряжении. Этого вполне достаточно любому практическому уму, но конечно мало для того, чтобы опротестовывать выборы в судебном порядке.
LinkReply

Comments:
Page 1 of 2
<<[1] [2] >>
From: saccovanzetti
2011-12-11 06:12 pm (UTC)
и все-таки, когда логнормальное должно быть при честных выборах? внятного ответа от учОных мне получить не удалось, зато есть данные что даже не фальсифицированное распределение может выглядеть несимметричным (2008-2009 год, КОИбы, зеленые линии):

http://corbulon.livejournal.com/77300.html
(Reply) (Thread)
[User Picture]From: fat_yankey
2011-12-11 09:09 pm (UTC)
Логнормальное и есть несимметричное. Аномалия тут не в несимметрии, а в задранном вверх хвосте в районе 100%. Ну и в пиках в области круглых цифр.
(Reply) (Parent) (Thread) (Expand)
(no subject) - (Anonymous) Expand
[User Picture]From: chsvover9000
2011-12-11 06:18 pm (UTC)
Да тут даже не по участкам, вот например данные по ЕР:

Таганрог - 30
Ростов - 42
Аксай - 30 или 33
Батайска - внезапно 65

притом что Аксай и Батайск по сути районы Ростова уже давно... и еще в Советском районе Ростова, который почему-то относится к Таганрогской избирательной комиссии тоже около 30.

В свете того что о нарушения на выборах известно в некоторых случаях достоверно, то да, теория фальсификации выглядит наиболее близкой к истине.
(Reply) (Thread)
[User Picture]From: geophoto
2011-12-11 06:19 pm (UTC)
только не "теория фальсификаций" а гипотеза, т.к. не были сформулированны из нее следствия и не было их проверки. Будьте уж тоже более строгим, а то начинаете критиковать других и тут же допускаете методологический ляп.
(Reply) (Thread)
[User Picture]From: fat_yankey
2011-12-11 09:17 pm (UTC)
Спасибо.
(Reply) (Parent) (Thread)
[User Picture]From: shultz_flory
2011-12-11 06:24 pm (UTC)
Чорт, достаточно было последней фразы.
(Reply) (Thread)
[User Picture]From: bytebuster463
2011-12-11 07:56 pm (UTC)
Пару слов в защиту чистой математики. Безотносительно выборов.
Любая неслучайная исчислимая величина, имеющая в совокупности ограниченную дисперсию, при достаточно большом количестве попарно независимых измерений подчиняется закону больших чисел Чебышева.
Это написано, например, в классическом учебнике Чистякова по терверу.
1) Неслучайная = обусловленная некоторыми законами, в том числе, неустановленными.
2) Исчислимая = её можно выразить числовым значением.
3) Ограниченая дисперсия - число может быть из ограниченного (пункт номер 1...7) диапазона, но не (0...бесконечность).

Всё, что Вы в постинге сказали, равносильно такому утверждению: "я не знаю законов из пункта (1), потому Чебышев неправ".
Чебышев прав вне зависимости от того, известны ли законы, по которым изменяется величина.

Сама по себе гауссиана, бесспорно, не является юридическим аргументом.
Однако её отсутствие позволяет предположить, что распределение ненормально.
Это как если бы Вы шли по городу, где обычно живут люди ростом 160-180см (хотя бывают и 130 и 210), и вдруг внезапно стали встречать людей пятиметрового роста. При этом средний рост населения в городе не превысил бы, скажем, 200см. В общем, нормальная величина.

Статистика, действительно, не даёт ответа о том, каковы законы, определяющие величину. Она может лишь сказать, одинаковы ли эти законы, или разные.
У всех остальных графиков почти всё нормально, а у одного - "аномалии". Следует предположить, что этим графиком управляют другие законы. Какие - статистика не говорит. Но - другие.

P.S. "Гауссоида" - неправильное слово.
P.P.S. Логнормальное распределение симметрично на логарифмической шкале. Целесообразность применения лог шкалы в данном случае довольно спорно.
(Reply) (Thread)
[User Picture]From: fat_yankey
2011-12-11 09:22 pm (UTC)
> Всё, что Вы в постинге сказали, равносильно такому утверждению: "я не знаю законов из пункта (1), потому Чебышев неправ".

Перечитал ещё раз свой постинг. Не могу понять откуда выводится его равносильность этому утверждению. Не поясните?

Edited at 2011-12-11 09:22 pm (UTC)
(Reply) (Parent) (Thread) (Expand)
(no subject) - (Anonymous) Expand
(Deleted comment)
(Deleted comment)
[User Picture]From: vir77
2011-12-11 08:09 pm (UTC)
Смотря каким аномалиям.

Если условия центральной предельной теоремы соблюдаются, а нам предъявляют не Гауссово распределение, то нас обманывают.

Конечно, можно сказать, что это гигантская флуктуация. Но чтобы на нескольких выборах подряд, и в пользу одной и той же партии, то я не знаю кем надо быть чтобы поверить в такую флуктуацию.

(Reply) (Thread)
[User Picture]From: fat_yankey
2011-12-11 09:16 pm (UTC)
Я в своей работе видел достаточно двугорбых распределений, чтобы не молиться на нормальное. Встречаются, встречаются в жизни системы не подпадающие под ЦПТ.
(Reply) (Parent) (Thread) (Expand)
[User Picture]From: charon
2011-12-11 09:43 pm (UTC)
Прошу прощения, но если это "теория фальсификации", какие предсказанные ею следствия известны и достоверны?
(Reply) (Thread)
[User Picture]From: fat_yankey
2011-12-11 10:31 pm (UTC)
(Reply) (Parent) (Thread) (Expand)
[User Picture]From: vir77
2011-12-11 11:00 pm (UTC)
Вот вопрос, а почему Чуров и Ко. заранее не подготовились? Вполне могли бы пригласить специалистов, которые расписали бы заранее голоса по участкам так, чтобы фальсификация была статистически не распознаваема.

Денег что ли пожалели?

Или решили, что и так сойдет - их ведь не первый раз ловят за руку, но до сих пор сходило
(Reply) (Thread)
[User Picture]From: charon
2011-12-11 11:44 pm (UTC)
Вот вопрос, а почему Чуров и Ко. заранее не подготовились? Вполне могли бы пригласить специалистов, которые расписали бы заранее голоса по участкам так, чтобы фальсификация была статистически не распознаваема.

Есть мнение (мнение), что большая часть этих подтасовок суть "инициативы снизу". Т.е. самодеятельность местной администрации.

Ведь, если разобраться, единственный практический выхлоп всей этой выборной канители - численно выраженные показатели лояльности местного населения к центральной власти. Там, где эти цифры предельно низки, очевидно, что местная администрация (ассоциированная с центральной властью естественным образом) не делает ничего для поддержания лояльности населения. Что, в свою очередь оборачивается оргвыводами по итогам голосования. Отсюда и творческая самодеятельность на местах — попытка местных властей хоть как-то натянуть сову на глобус — чтобы не оказаться в роли той самой совы малое время спустя.


(Reply) (Parent) (Thread) (Expand)
[User Picture]From: alextutubalin
2011-12-12 04:54 am (UTC)
Почему "ожидалось бы (лог)нормальное распределение"?

У нормального - хвосты в две стороны (ниже 0 и выше 100%), у логнормального - хвост только выше 100%, но еще больше.

Может быть начать с поисков подходящего распределения? Ну там модели сферического в вакууме избирателя....
(Reply) (Thread)
[User Picture]From: vir77
2011-12-12 07:32 am (UTC)
Какое распределение у официальных данных избиркома можно легко установить - и по регионам и по стране в целом. Кстати, любопытно, меняются ли от региона к региону только параметры распределения, или и сам характер распределения.

Для этого в MATLAB есть специальный toоl, чтобы самому не программировать, в котором заложены ну не меньше пары десятков всяких рапределений, и который позволяет определить какое из них лучше всего фитит распределение ваших данных.

С этого следовало бы и начать всем кто проверяет данные избиркома "на статистику". Может они это и сделали, но не приводят в своих статьях, поскольку, как я думаю, не хотят загружать техническими деталями, чтобы было понятно и неспециалистам.

"Выступая на сессии отделения АН, надо говорить так чтобы поняли не только академики, но и их жены" (В. Гинзбург)
(Reply) (Parent) (Thread) (Expand)
[User Picture]From: otrubon
2011-12-12 05:42 am (UTC)
(Reply) (Thread)
From: (Anonymous)
2011-12-14 01:22 pm (UTC)
Почему "Мудак"? Просто волшебник.
(Reply) (Parent) (Thread)
[User Picture]From: claire_1973
2011-12-12 06:00 am (UTC)
Несколько аргументов в пользу версии об истинности гипотезы:
http://www.gazeta.ru/science/2011/12/10_a_3922390.shtml
(Reply) (Thread)
From: gleb_kgi
2011-12-12 06:20 am (UTC)
Ну то что условия ЦПТ не выполняются это как бы очевидный факт
(определение ЦПТ http://ru.wikipedia.org/wiki/%D0%A6%D0%B5%D0%BD%D1%82%D1%80%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%82%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0)

Условия ЦПТ означают, что у партии должна быть примерно одинаковая поддержка по ВСЕЙ стране, по всем ее регионам. Но очевидно, что это не так . Есть регионы(густонаселенные) где поддержка ЕР существенно выше чем средняя по стране(в районе 40%). "Мю" существенно отличается в некоторых регионах, в большую сторону. Причем есть вполне очевидные объяснения почему она там у них выше безо всяких фальсификаций.
(Reply) (Thread)
[User Picture]From: semonsemenich
2011-12-12 07:31 am (UTC)
"густонаселённость" при разрезе "по участкам" особой роли не играет. Участки ведь создаются с учётом именно населённости территории.

Но Вы правы в том, что разрез "по участкам" не учитывает специвику структуры населения.

Т.е. (условно, только для пояснения) если за какого-то кандидата очень активно и охотно голосуют военные, а другие слои практически не голосуют , то его голоса по участкам будут распределяться совершенно диким образом.
В большой стране, с учетом всех слоёв населения, это, видимо,"смажется". (Но осадок останется).
(Reply) (Parent) (Thread) (Expand)
[User Picture]From: calcin
2011-12-12 08:55 am (UTC)
Ну, у меня, например, есть другая теория.
Допустим, что те, кому все по... и они не ходят на выборы, если их всё-таки на выборы загнать, голосуют в основном за ЕР.

Просто потому что им по..., и они ничего не хотят менять.

В этом случае ЕР, задействовав административный ресурс для того, чтобы обеспечить явку, одновременно получает бонус к своим голосам.

По-моему, эта теория также объясняет все факты - и, кстати, может быть подвержена фальсификации (проверке). Достаточно опросить большое количество народу, приписанное к разным участками - ходили ли они на выборы или нет. Можно даже не спрашивать, за кого голосовали. И сравнить статистику с явкой по участкам.

При этом, если выяснится, что голосовать ходило куда меньше народу, чем отмечено на участке - это, наоборот, аргумент в сторону приписок.
(Reply) (Thread)
From: gleb_kgi
2011-12-12 09:10 am (UTC)
>Допустим, что те, кому все по... и они не ходят на выборы, если их всё-таки на выборы загнать, голосуют в основном за ЕР.

Хочется раскрыть механизьм такого загоняния. Желательно чтоб это был рассказ от первого лица, а не ОБС.
(Reply) (Parent) (Thread)
(no subject) - (Anonymous) Expand
From: dr_stockmann
2011-12-12 01:01 pm (UTC)
Если уж выбирать какое-нибудь стандартное распределение, я бы взял биномиальное. Если горб расположен в середине шкалы (около 50%), оно приблизительно описывается нормальным. Если горб близок к началу шкалы (около 0%) биномиальное распределение приблизительно описывается какой-то вариацией на тему пуассоновского распределения (закон редких событий). Если горб близок к концу шкалы (100%), то получим симметричное отражение пуассоновского распределения относительно середины шкалы.
Фальсификации, разумеется, доказываются в юридическом смысле этого слова не статистиками, а прокурорами. Берется председатель УИК с подозрительными результатами, сажается на 10 суток в СИЗО по подозрению в нарушении избирательных прав граждан. А вот на предмет выявления подозрительных участков статистика очень даже может помочь:)
Логнормальное распределение ИМХО не при чем.
(Reply) (Thread)
From: gleb_kgi
2011-12-12 01:46 pm (UTC)
А может выявить еще проще можно. При каждом УИК есть наблюдатели - представители разных партий и беспартийные, в каждом УИК есть представители разных партий и беспартийные в качестве членов с решающим голосом. Вот пусть они и пишут жалобы в соответствующие инстанции, с приложениями соответствующих материалов. Тут как грится нету трупа - нету дела.
(Reply) (Parent) (Thread) (Expand)
Page 1 of 2
<<[1] [2] >>