Валерий Суриков,surikovvv (surikovvv) wrote,
Валерий Суриков,surikovvv
surikovvv

Когда статистика разоблачает...

Оригинал взят у holmogor в Нет таких законов математики, которые не могли бы одолеть большевики
Оригинал взят у oude_rus в Статистика выборов по Москве: двуголовая гидра
Любезный podmoskovnik прислал цифирки голосования по Москве. Ну, я их покрутил немножко. Вот милый графичег:


Здесь показано количество избирательных участков (УИКов), на которых такая-то партия получила столько-то голосов. Например, КПРФ получила 20% голосов на 226 участках.

Разумно ожидать, что количество участков распределяется поровну вправо и влево от середины. Это т.н. "нормальное" (или гауссово) распределение. Если приглядеться к графикам голосования за Яблоко, ЛДПР, СР и КПРФ, то так оно и получается. Для облегчения задачи я изобразил для вас "идеальные" распределения, которые лучше всего подходят под реальные данные. Видите тоненькие линии? вот это они и есть. Отсюда можно надыбать всякую интересную информацию. Например, избиратель ЛДПР решителен как штык (распределение узенькое), а избиратель Яблока так и не понял, надо ли ему голосовать за эту партию.

Тут внимательный читатель воскликнет: "а где же ваше нормальное, или, по науке, гауссово распределение за ЕР?". А нет его, поскольку распределение голосов за ЕР по участкам иначе как порнографией странным не назовешь. Ну ладно, есть какой-то пик на 25% голосов. Пик слегка спадает до ровного участка между 30 и 50%, а там... ну да, снова взвивается, как кострами синие ночи. И доходит до второго, еще более высокого пика аккурат на... 51%. Ну, и дальше этот пик не торопясь спадает до нуля (уффф! все же не Кавказ) на 98%.

Вот какой затейливый избиратель у ЕР: часть его дает ЕР 25%, а вторая часть - аж 50% плюс! Интересно, как так может быть?

Мой   комментарий:
 
Хорошо   известно  следующее  изречение:
«Существуют   три  типа  лжи:    ложь,  наглая  ложь   и  математическая   статистика».  Деяния   волшебника   Чурова   дают  возможность   расширительного   толкования  этой   максимы - допустить  существование  четвертого   типа   лжи(   запредельной,  трансцендентальной     лжи),  по  отношению  к  которой    математическая   статистика  является    разоблачительной.
 Уже  по  внешнему   виду  ясно,  что  кривые  распределения  у  коммунистов  и  мироновцев   близки  к  нормальному распределению   и при  строгой    статистической обработки   дадут  нулевые  значения    асимметрии  и  эксцесса    с   хорошим (0.9-0.95 )уровнем   вероятности.  У  жириновцев  с  той  же  вероятностью  будет  нулевая  асимметрия,  но небольшой   отрицательный  эксцесс(  с  вероятностью 0.8-  0.85  он  также  может  оказаться  нулевым)  .Значит,  у  трех  этих  партий  кривая  распределения   подчиняется  нормальному   закону  и  следовательно,   выборочное среднее  значение   является    максимально правдоподобной     оценкой    генерального   среднего.  О  кривой  яблочников  по   внешнему   виду  сказать  ничего  определенного   нельзя -  надо   считать  асимметрию  и  эксцесс.
А   вот ЕР-кривая  и  без    расчетов   очень   информативна.
   В   принципе   ее  можно  представить   как  суперпозицию  двух  кривых,  претендующих называться  нормальными. Но  очевидно,  что  у   обеих   будут   сильные отрицательные   асимметрии (  растянутый  вправо хвост)  и  сильные  отрицательные  эксцессы(  приплюснутость ).  И  эта  корреляция   асимметрии  и  эксцесса  -  сверхинформативна.  Можно  предположить , что   за  этими  двумя    кривыми -  два  процесса: некий  естественный(    левая  кривая)  и  некий   искусственный (  правая  кривая).
 Теперь    мысленный     эксперимент.
  Задаем для  ЕР  в   районе,  скажем,  25%    кривую  нормального  распределения  (с   нулевыми   асимметрией  и эксцессом ) -  такого  же естественного  вида,  как     у   трех  других   партий.  Призываем   волшебника,  который  каким-то   искусственным  образом  начинает   увеличивать  на  отдельных  участках  число   проголосовавших    за ЕР  до  50,  60   и   далее   процентов.  То  есть  начинает   растягивать  вправо  (  отрицательная   асимметрия) кривую распределения.   Поскольку  общее  число  участков    остается  неизменным,  то  неизбежно, растягиваясь   вправо,  кривая  будет   сжиматься  по  вертикали (  отрицательный   эксцесс ).
  Ему  бы,  волшебнику,  вовремя   остановиться     -  обойтись   без  пупыря     в  районе 52  % .  Тогда была  бы  одна  кривая,  которая  бы  подпадала  под  логнормальное   распределение  и    эту    аномальность  вполне   можно  было  списать   за  счет   природной  особенности    партий  власти .
  Но   жадность,  оказывается,  губит  не только   фраеров,  но   даже  волшебников.   К   тому  же  ,  видимо,   и  установка   была:   «чтобы  не  злить  и  без  того   шибко рассерженный   народ,  от   конституционного   большинства  отвести,  но  за 50  %    не  уводить…»    Вот   и    появился   разоблачительный      пупырь….
   Все  что  я  здесь  написал  -   не  более   чем рабочая  гипотеза. Неплохо было   бы   всю  массу   данных   обработать….
 
  Валерий   Суриков

Subscribe
  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments