Взять хотя бы парламентские выборы, где, как известно из средств массовой информации, имели место масштабные фальсификации. Это как бы достоверный факт, который даже не обсуждается – масштаб фальсификаций огромен.
«Реальные масштабы фальсификаций никого совершенно не интересуют. Более того, результаты выборов никого не интересуют»
Я человек, как известно, довольно тупой. Поэтому иду на сайт пресловутой ассоциации «Голос», дабы оценить колоссальные масштабы фальсификаций. Там написано, что обнаружено двадцать четыре факта расхождения итоговых протоколов с копиями протоколов у наблюдателей. На девяносто пять тысяч участков. Ну хорошо, данные обрабатываются, поступают новые сведения – и на сегодняшний день таковых расхождений зафиксировано уже триста сорок одно. Но о масштабах же говорили тогда, когда было двадцать четыре!
Средний % за ЕР на участках с КОИБ (3+к участков) - 34% ( http://podmoskovnik.livejournal.com/134962.html )
У Чурова в интервью на Эхе спрашивали почему так, он ответил что типа репрезентативность выборки никем не доказана. Как по мне, так не очень убедительно.
Со статистикой там отдельная песня. Столько в инете разговоров было как "статистика доказывает", что выборы фальсифицированы. Меня в разговорах сильно удивляло, что "доказательства" опираются на неграмотные, с точки зрения математики, заключения. Что не удивительно: мало кто из "доказывальщиков" математику помнит (или знал, вообще).
Кроме того, удивило, что некоторые данные очень уж странные (на правильные данные не похожи, но и на фальсификацию тоже). Из удивления скачал распределение голосов по участкам, обработал и опа. Оказывается "разоблачители" сами неправильно обрабатывали результаты, вносили туда свои "коррективы". И не ясно уже: специально или по-неграмотности.
С одним "разоблачителем" поспорил. Он не мог придраться к моей обработке, но объяснял, что у меня ничего такого не видно, потому что я не так все представляю. Мол, так и так надо делать: тут цифирки по другому поставить, тут ось передвинуть, тут линию пожирнее. В общем, сработало известное эмпирическое правило: "маленькая" ошибка, в нужном месте, позволяет получить какой угодно результат.
> Средний % за ЕР на участках с КОИБ (3+к участков) - 34%
Когда ВЦИОМ опрашивает 2 тысячи человек, и опрос совпадает с результатами выборов - это хорошая, годная выборка, она полностью доказывает отсутствие каких бы то ни было фальсификаций.
Когда КОИБы, стоящие на 3282 участках (в среднем на каждом более 500 человек проголосовало, то есть полтора миллиона человек выборка) дают результат на 15% меньше официального, всем очевидно: выборка нерепрезентативна и такой результат ничего не доказывает.
Это элементарно объясняется тем, что КОИБ устанавливали не чисто случайным образом, а именно на тех участках, где были готовы к работе с ними и их установка имела смысл (зачем КОИБ на участке в 50-100 избирателей?). Это, скорее всего, крупные участки в достаточно больших городах.
> Когда КОИБы, стоящие на 3282 участках (в среднем на каждом более 500 человек проголосовало, то есть полтора миллиона человек выборка) дают результат на 15% меньше официального, всем очевидно: выборка нерепрезентативна и такой результат ничего не доказывает.
Ты просто плохо себе представляешь, что такое репрезентативность. Она не определяется просто числом или долей выборки. Даже половина выборки может быть нерепрезентативной, если эту половину выбирать по некоторому правилу. Другими словами, сколько не опрашивай людей в интернете "пользуетесь ли вы интернетом?", данных о доле пользующихся среди всего населения, все равно не получишь.
> У Чурова в интервью на Эхе спрашивали почему так, он ответил что типа репрезентативность выборки никем не доказана. Как по мне, так не очень убедительно.
Ты можешь не верить ни Чурову, ни кому еще и сам оценить репрезентативность, но для этого понадобятся некоторые усилия.
Есть некоторая величина, которую вряд ли фальсифицировали: это количество избирателей на участках.
Скачай данные по числу избирателей на участках. Раздели их на участки с КОИБ (выборка 1) и без (выборка 2). Подсчитай среднее кол-во избирателей для обоих выборок и дисперсию этого числа. Теперь по формуле (см. интернет) получи t-критерий Стьюдента и по таблице оцени вероятность того, что эти 2 выборки принадлежат одной, т.е. того, что выборка 1 - репрезентативна. Если вероятность будет очень мала: единицы процентов, то выборку 1 можешь полагать нерепрезентативной.
> Без суда и следствия.
> Лучше всего сажать вообще все избирательные комиссии с Центризбиркомом в главе. Прошли выборы — всех на тюрьму, нужно проводить новые — поголовная амнистия.
Камрад, ты специально передергиваешь?
доводишь, так сказать, градус абсурда до полного идиотизма.
я по моему писал
> любая информация о вбросе, нарушении процедур на участках должна была сразу же жесточайшим образом расследоваться вне зависимости от того, влияет ли это на общие итоги выборов.
расследоваться - это не значит сажать, это значит проводить комплекс следственных мероприятий. В случае подтверждения информации - виновные в нарушении процедур выборов заезжают в тюрьму; в случае отсутствия подтверждения - проверяемые имеют полное право инициировать административное и/или уголовное преследование в отношении тех, кто подавал недостоверную информацию в их адрес.
> Кроме того, удивило, что некоторые данные очень уж странные (на правильные данные не похожи, но и на фальсификацию тоже). Из удивления скачал распределение голосов по участкам, обработал и опа. Оказывается "разоблачители" сами неправильно обрабатывали результаты, вносили туда свои "коррективы". И не ясно уже: специально или по-неграмотности.
> С одним "разоблачителем" поспорил. Он не мог придраться к моей обработке, но объяснял, что у меня ничего такого не видно, потому что я не так все представляю. Мол, так и так надо делать: тут цифирки по другому поставить, тут ось передвинуть, тут линию пожирнее. В общем, сработало известное эмпирическое правило:
> Поделись результатами, а то мне тоже надо кое-кого переубедить.
Не знаю, можно ли давать тут ссылки на скачку, но если прокатит вот: http://files.mail.ru/VD9LSX Речь была о том, что якобы существует некоторая "пила", которая показывает, что кол-во голосов за ЕР подгонялось к "круглым" значениям (т.е. кратным 0,05), что само по себе очень странно (к таким значениям подогнать не так уж просто). Как видно из этого графика, пилы нет. Не ясно, как она получена у тех, кто ее везде развешивал.
> Тут интересно то, что на избирательных участках тех же ТИК (то есть соседних), но без КОИБ, процент ЕР на 20 процентных пунктов выше в среднем - 54%.
Тут я могу ответить тебе твоими словами: "пруфлинк или враньё". Обрати внимание, что тебе понятно, подтверждение чего я хочу получить: на участках ТИК, где были КОИБ, после исключения участков с КОИБ, средняя доля голосов за ЕР будет равна 54%.
Это просто красивая фраза или тебе нужен ответ. Другими словами, на какой факт тебе нужен пруфлинк? Что распределение голосов не может быть по нормальному закону? Это в любом учебнике написано. Просто сравни носители распределений.
Что обличители неправильно обрабатывали результаты? Сравни приведенную мной выше, со многими, приведенными в инете (я уж не буду тут давать на них ссылок).
Камрад, это ж не обработка, это ее результаты. Я даже не очень понимаю, что у тебя в каком столбце. "левый край середина правый край часть1 часть2" - что это? Бин у тебя какой?
> Тут я могу ответить тебе твоими словами: "пруфлинк или враньё". Обрати внимание, что тебе понятно, подтверждение чего я хочу получить: на участках ТИК, где были КОИБ, после исключения участков с КОИБ, средняя доля голосов за ЕР будет равна 54%.
#104
> Другими словами, на какой факт тебе нужен пруфлинк?
на это
>Оказывается "разоблачители" сами неправильно обрабатывали результаты, вносили туда свои "коррективы".
и на это
> Он не мог придраться к моей обработке, но объяснял, что у меня ничего такого не видно, потому что я не так все представляю. Мол, так и так надо делать: тут цифирки по другому поставить, тут ось передвинуть, тут линию пожирнее.
> Камрад, это ж не обработка, это ее результаты. Я даже не очень понимаю, что у тебя в каком столбце. "левый край середина правый край часть1 часть2" - что это? Бин у тебя какой?
В математике (да и не только в математике) обработкой результатов называют не только метод, но и полученный результат.
Это обычная гистограмма. В каждом интервале кол-во УИК, в которых получено кол-во голосов за ЕР, попадающих в интервал. Гистограмма примерно соответствует плотности распределения выборки, что очень полезно и удобно. Как построить гистограмму, написано во многих учебниках.
"левый край", "середина", "правый край" - соответствующие точки интервала.
"часть1 часть2" - УИК пришлось разбить на 2 части, так как строчек в Экселе 65536, это меньше чем всего УИК. Что такое Бин?
Все, понял где ссылка. Сразу ошибка. Если строишь гистограмму по долям голосов, следует складывать количество участков с заданным числом голосов (1 участок = 1 вхождение), но нельзя складывать количество голосов на них. Это примерно тоже самое, что при построении распределяя людей по росту (естественно, ожидая получить нормальный закон), складывать не кол-во людей попадающих в интервал, а их рост. Все графики, где сложены голоса, а не участки, следует отбросить.
Ошибка 2. Сложены все участки с КОИБ и все участки без КОИБ. Получены 37% и 54%. К чему это среднее? Ни к чему. Как минимум, эти 37 и 54 следует было подсчитать по каждому региону, где использовались КОИБ и тогда уже говорить о некоторой корреляции отклонений от среднего для того и другого числа. Это, хотя бы, говорило о технической грамотности исполнителя.
Самое интересное. О чем говорят результаты, если выборка с КОИБ нерепрезентативна? Ни о чем. То что выборка репрезентативная, надо еще доказать. Автор не пытался это сделать, а ведь именно с этого нужно было начинать.
Теперь, с точки зрения математики, можно с равной достоверностью полагать как: а) если на участке привозили КОИБ, то он менял распределение голосов за ЕР, так и: б) КОИБ использовали на тех участках, где голосов за ЕР было больше.
> и на это
Там была личная переписка, но теперь она не нужна. Ибо даже тут, по твоей ссылке, видно, что "разоблачительная" статистика - это результат некорректной работы с данными, некорректного их анализа.
> УИК пришлось разбить на 2 части, так как строчек в Экселе 65536
То есть считал тоже в экселе? Дай файл с расчётом, проверю. Видишь ли, я полагаю, что ты либо ошибся, либо врёшь. Я видел примерно 10 разных расчётов этого графика, сделаных независимо, разными людьми, не связанными между собой, в разных программах и пр, и везде пила была. Собственно, пика на 50% не может не быть - это артефакт http://kobak.livejournal.com/102646.html То, что у тебя его нет, говорит о том, что у тебя либо ошибка, либо ты врешь. То, что ты не знал, что он должен быть - говорит о твоей малограмотности и о том, что ты слабо изучал вопрос - все, кто хоть сколько-то интересуются вопросом, знают про этот пик и про то, что это артефакт.
> Что такое Бин?
Длина интервала.
> Как минимум, эти 37 и 54 следует было подсчитать по каждому региону
> б) КОИБ использовали на тех участках, где голосов за ЕР было больше.
меньше, ты хотел сказать? То есть сознательно ставили КОИБ на те участки, где ЕР возьмёт меньше? Проведя работу по предварительному исследованию по участкам? Удалось из 17 млн проголосовавших на этих тик найти участков на 3,2 млн, где электоральные предпочтения так сильно различаются? Даже если это делалось специально (хотя зачем бы) - абсолютно невероятно.
> Ошибка 2. Сложены все участки с КОИБ и все участки без КОИБ. Получены 37% и 54%. К чему это среднее? Ни к чему.
Дядя в статейке пишет, что он на ютубе ничего не нашел про фальсификацию выборов 4 декабря. типа, какая-то хрень только присутствует. может дядя искать не умеет?
довольно много новостных и прочих роликов
+ к сказанному в #119 - построй гистограмму с шириной интервала в 0,0025 или 0,005 а не 0,01. Начинай интервал с целого, а не с полуцелого (т.е. интервалы должны идти 0 - 0,0025; 0,0025 - 0,005; 0,005 - 0,0075 и тд.) Будут тебе пики.
Мало кто знает, но некоторые турфирмы всерьез подумывают о включении столичных митингов протеста в гостевую программу. Готовы и слоганы.
Принять участие в русской революции! Демократический бунт -- продуманный и гуманный! Прогулка в приятной либеральной кампании без предрассудков. До зубов вежливый ОМОН и металлодетекторы. Культурная программа с участием звезд политики, эстрады и бизнеса. Карнавал. Костюмы кондомов бесплатно.
> ателей на участках. Раздели их на участки с КОИБ (выборка 1) и без (выборка 2). Подсчитай среднее кол-во избирателей для обоих выборок и дисперсию этого числа. Теперь по формуле (см. интернет) получи t-критерий Стьюдента
Можно даже этого не делать - среднее число избирателей на участках с КОИБ значительно больше, на треть. Как из того, что чило избирателей на участках с КОИБ распределено иначе, чем на участках без, следует нерепрезентативность выборки? То, что был какой-то отбор по численности избирателей на участках - следует. И что?
Во-первых, требуется время на то, чтобы собрать нарушения. Сейчас их гораздо больше.
Во-вторых, согласно правилам статистического исследования нельзя делить найденные нарушения на общее количество случаев и заявлять, что это и есть реальный процент нарушений.
Это процент выявленных и зафиксированных наблюдений, что говорит о том, что реальных нарушений, скорее всего, гораздо больше.
> сделаных независимо, разными людьми, не связанными между собой, в разных программах и пр, и везде пила была.
Как я заметил, это делают люди не имеющие представления о статистике. Уметь рисовать какие-то графики и делать многочисленные не обоснованные выводы, еще не значит знать статистику. Скорее, наоборот.
Кстати, по твоей первой ссылке есть еще серьезная ошибка, которую поленился вчера писать. Она в носителе. Для построения гистограммы, его нужно выбрать правильно. Можно построить плотность распределения участков по посещаемости - это даст вероятность получить посещение выше определенного, можно построить плотность распределение по голосам за ЕР - это даст соответствующую вероятность. Но строить распределение по голосам, используя в качества носителя посещаемость - несколько бессмысленное занятие. Впрочем, там много бессмысленных графиков. Хуже другое. Есть y=g(x), есть f(y)=f(g(x)). Теперь есть попытка показать вероятность df/dx, подсовывая вместо нее df/dy. Это обычная не грамотность, если человек не знает математику, или жульничество, если знает.
> обственно, пика на 50% не может не быть - это артефакт http://kobak.livejournal.com/102646.html То, что у тебя его нет, говорит о том, что у тебя либо ошибка, либо ты врешь. То, что ты не знал, что он должен быть - говорит о твоей малограмотности и о том, что ты слабо изучал вопрос - все, кто хоть сколько-то интересуются вопросом, знают про этот пик и про то, что это артефакт.
Я прекрасно знаю о том, что при малых выборках на кратных дробях будут скачки, если интервалы для кратных дробей подбирать правильно. И что? О чем это говорит? О том, что человек баловался, игрался с интервалами, подбирал их (вручную, потому что не знает математики) пока не получил любимых ему скачков. И что? Какие математические выводы? От такого занятия - никаких. Некоторые люди могут тащится от деления цифр на бухгалтерском калькуляторе и получения периодических дробей. Такое глупое занятие не имеет математической ценности.
Скачка на 0,5 у меня тут нет, потому что в соседних интервалах есть другие кратные дроби. И что? Скачка на 4/7, например, у меня тоже не видно, а он есть. Вот в этом "анализе" в нем нет смысла, как во всех остальных глупых игрищах в кратные дроби. Статистика это не безумный подгон интервалов до тех пор, пока они не начнут нравиться.
> Что такое Бин?
> Длина интервала.
В нашей математике нет слова "Бин". Есть длина интервала и шаг. Четкое ощущение, что люди математику или не учили вообще, или забыли напрочь, скачали программу, переводную инструкцию к ней в стиле "вырезаем аппендицит для чайников" и делают вид, что понимают то, чем занимаются.
> Можно даже этого не делать - среднее число избирателей на участках с КОИБ значительно больше, на треть. Как из того, что чило избирателей на участках с КОИБ распределено иначе, чем на участках без, следует нерепрезентативность выборки? То, что был какой-то отбор по численности избирателей на участках - следует. И что?
Вот из этого и следует. Чтобы она могла претендовать на репрезентативность, следует доказать, что нет корреляции между размером участков и распределением голосов. Пока это не сделано, она не репрезентативна, все. Статистика на этом заканчивается, все остальные разговоры - околонаучное жевание соплей.
> То есть сознательно ставили КОИБ на те участки, где ЕР возьмёт меньше? Проведя работу по предварительному исследованию по участкам? Удалось из 17 млн проголосовавших на этих тик найти участков на 3,2 млн, где электоральные предпочтения так сильно различаются? Даже если это делалось специально (хотя зачем бы) - абсолютно невероятно.
Не сознательно и без всякого исследования. Участки ставили например, в городах, где предпочтения свои. Этого достаточно, чтобы получить не репрезентативную выборку. Вообще, в исследованиях это стандартная проблема - сделать правильную выборку. Много научных работ публикуются с ложными результатами, потому что выборка сделана неправильно.
Еще есть отдельная проблема с выводами. Это у "исследователей" отдельная большая проблема. Опишу ситуацию на примере.
Юному исследователю вдруг пришла в голову потрясная идея: новое средство от облысения не помогает от лысины, а наоборот - уменьшает число волос. Он занялся "научной работой" и обнаружил следующее: если общее число волосатых там, где это средство вообще не продают 50%, то если провести исследование среди покупателей этого средства, то волосатых среди них всего 37%! Юный ученый, радуется этому факту, считает, что вредность средства однозначна доказана, публикует результаты и находит огромное число юных сторонников, которые занимаются тем же самым представляя результаты в разных комбинациях, проводя опросы и рисуя графики. Юным исследователям кажется, что чем больше графиков, тем "доказано наиболее явно" (реальная фраза, почитал и поржал от души).
Тут им кто-то говорит, что это не средство такое, просто лысые люди покупают это средство чаще, потому что им оно нужно, значит выборка не репрезентативна. Юные исследователи не понимают что такое репрезентативность (хоть и постоянно используют это слово). У них есть встречный аргумент: зато среди тех покупателей, кто это средство не использовал, волосатых аж 54%! По их мнению это "уже точно доказывает", что люди пользуются средством и лысеют. Чтобы сделать доказательство "еще более сильным" они рисуют все больше красивых и разнообразных графиков, используют умные термины, тащатся от собственной крутости, "знания статистики" и умения "разоблачать неразоблачимое".
Если бы они знали статистику или хотя бы математику они бы понимали, что оба факта: волосы выпадают от средства или лысые люди покупают его чаще, одинаково достоверны (или не достоверны), но ни знаний, ни мозгов понять это у них, видимо, нет.
> У Чурова в интервью на Эхе спрашивали почему так, он ответил что типа репрезентативность выборки никем не доказана. Как по мне, так не очень убедительно.
"А тебя никто нихуя и не убеждает"(почти с)
А по делу - если нет обоснования репрезентативности выборки, то результаты опроса идут в ведро без вариантов
> Кстати, по твоей первой ссылке есть еще серьезная ошибка
Это не серьёзная ошибка, это ты не понял, зачем это делалось.
> И что? Какие математические выводы?
Очень просто, камрад. Есть гипотеза, что количество протоколов, в которых процент ЕР равен или очень близок к круглым или полукруглым числам - аномальное. Предлагается эту гипотезу проверить. В ходе проверки находится всякое интересное, типа пиков на 70%, которые никак не могут быть объяснены эффектами малых дробей и деления. Находятся и интересные частные случаи, типа этого: http://kireev.livejournal.com/703723.html
> Не сознательно и без всякого исследования. Участки ставили например, в городах, где предпочтения свои. Этого достаточно, чтобы получить не репрезентативную выборку.
Камрад, понятно ли тебе, что результаты на участках с КОИбами сравниваются не с результатами в целом по стране, а с участками тех же ТИК без КОИБов? Понятно ли, что сказать: "а, да это, наверное, в городах, да и средний размер участка на треть больше" - недостаточно для объяснения такой разницы? Это ж не 300 человек, а 3,2 млн.
> Четкое ощущение, что люди математику или не учили вообще, или забыли напрочь, скачали программу, переводную инструкцию к ней в стиле "вырезаем аппендицит для чайников" и делают вид, что понимают то, чем занимаются.
Чёткое ощущение, что ты принял расказ Шукшина "Срезал" как руководство к действию.
> Это не серьёзная ошибка, это ты не понял, зачем это делалось.
Я не понял? Ха-ха! Я прекрасно понял, тем более много раз подобное видел. Нужно было подогнать результаты под собственные представления. Для этого все средства хороши, подменить производные, например. Если математика мешает идеологии, то тем хуже для математики.
> Есть гипотеза, что количество протоколов, в которых процент ЕР равен или очень близок к круглым или полукруглым числам - аномальное.
Давай начнем с того, что ты дашь определение границ аномального, хотя бы приближенно. Пока у тебя получается, что аномальное это то, что именно тебе кажется неправильным. В математике так нельзя, это же не искусствоведение. Объективные оценки есть? Это - математика. Нет? Это - болтология.
> Предлагается эту гипотезу проверить.
В ссылках столько всего понаписано, но нигде нет ни одной проверки гипотезы в математическом смысле. Знаешь почему? Потому что все это все не гипотезы, а бессмысленные рассуждения на произвольную тему.
> В ходе проверки находится всякое интересное, типа пиков на 70%, которые никак не могут быть объяснены эффектами малых дробей и деления.
Мне нравится этот подход. Мы не можем это объяснить, более того, ничего в этом не понимаем, значит все это неправильно, а правильно именно так, как мы из пальца высосали. При этом ни доказательств, ни определений. Все держится исключительно на уверенности в собственной правоте.
В математике, как и в статистике, так не делается.
> Камрад, понятно ли тебе, что результаты на участках с КОИбами сравниваются не с результатами в целом по стране, а с участками тех же ТИК без КОИБов?
Пример про лысых/волосатых читал? Там тоже статистику покупок средства от облысения можно сравнивать не с данными по всем городам, где средство не продается, а исключительно с данными по магазинам, где средство продается. Получится тот же самый результат: те, кто покупают средство от облысения, лысеет сильнее.
> Чёткое ощущение, что ты принял расказ Шукшина "Срезал" как руководство к действию.
Ну еще бы. Я тебе привожу примеры ошибок в твоих рассуждениях именно с точки зрения математики. Ты не можешь это математически опровергнуть, но все время намекаешь на какое тайное знание, основанное на глубоком убеждении. Может быть. У Фоменко с его хроноложеством примерно такой же подход.
Ну, может быть, ты объяснишь? ты не стесняйся, раз ты так умеешь рассказывать, что всё ерунда и болтология, что в математике все не так - ты, наверное, знаешь, как надо? Примени, например, критерий Колмогорова и расскажи нам, отчего так выходит.
> Я тебе привожу примеры ошибок в твоих рассуждениях именно с точки зрения математики.
Ты не приводишь примеры ошибок, ты говоришь: все сделано те так! вы безграмотные уроды!
> Пример про лысых/волосатых читал?
Он не имеет никакого отношения к обсуждаемому. Объясни мне, дорогой друг, как так вышло, что 3,2 млн избирателей на участках с КОИБами отдали ЕР на 17% меньше голосов, чем 13 млн на соседних участках без КОИБов. "Выборка нерепрезентативна" - это не объяснение. Почему (см. ссылку в #131) на участказ без КОИБов возникает второй горб явки в 20:00, а с КОИБами не возникает?
Да элементарно. Если данные обрабатывать достаточно неправильно, можно получить неограниченное (вернее, ограниченное только терпением исполнителя) множество неправильных графиков. Теоретически, среди такого множества можно случайным образом получить правильное решение, но это не только маловероятно, случайно полученное правильное решение трудно отличить от неправильных.
> Ну, может быть, ты объяснишь? ты не стесняйся, раз ты так умеешь рассказывать, что всё ерунда и болтология, что в математике все не так - ты, наверное, знаешь, как надо?
Вот кто-то придумал объяснение почему не все треугольники одинаковые. Объяснение красивое, даже поэтическое, но не математическое. Когда ему про это говорят, он обижается. Мол, сами никакого объяснения придумать не можете, а мое красивое ругаете. Вот пока другого не придумаете, мое будет правильным. И, действительно, как объяснить почему все треугольники разные? Математик не справится, поэт нужен.
По делу могу сказать, что если некоторое распределение имеет неизвестную функцию, то нельзя объяснить почему полученная выборка ему не соответствует. Вообще нельзя понять соответствует ли заданная выборка этому неизвестному распределению. Действительно нужно объяснять почему?
> Ты не приводишь примеры ошибок, ты говоришь: все сделано те так! вы безграмотные уроды!
>
Про уродов, положим, я не говорил. Разве что, про безграмотных. Про ошибки я начал с самого начала. Даже нумеровать их пытался, потом сбился. Прочитай внимательно еще раз.
> "Выборка нерепрезентативна" - это не объяснение.
Ты не поверишь, но это единственное объяснение, допустимое, с точки зрения статистики. Более того, если в твоих результатах, в выборках обнаружена зависимость, то либо нужно доказать, что зависимость не влияет на результаты (не зависима от них), либо выкинуть все результаты, как бы красивы они не были. Ибо правильным подбором выборки можно "доказать", что угодно, но лучше не принимать эти "доказательства" всерьез.
Правильный анализ я приводил. Там ничего подобного нет. А подгонять результаты - занятие простое.
> Ты, камрад, пиши без стеснения: сам нихера не знаю и ничего объяснить не могу, но у них все неправильно, неправильно!!!
Математика - это очень тонкая штука. Там ценность утверждений очень высока. В ней, вместо 100 неправильных объяснений, следует 1 раз сказать "я не знаю". В одной этой фразе будет ценность, а в 100 неправильных объяснениях - нет. Не все люди это понимают, конечно, но и не все идут в математики. У политиков, например, совсем другие принципы.
> Не написано. Процитируй конкретный анализ и дай на него ссылку - где именно подменена производная. Ты понимаешь смысл слова "конкретный"?
Прям как в анекдоте, где ребенку объясняли что такое море.
Смотри что там написано:
Можно построить плотность распределения участков по посещаемости - это даст вероятность получить посещение выше определенного, можно построить плотность распределение по голосам за ЕР - это даст соответствующую вероятность. Но строить распределение по голосам, используя в качества носителя посещаемость - несколько бессмысленное занятие.
Почему бессмысленное? Гистограмма позволяет оценить плотность, которая является производной от функции распределения. Значит, функция распределения была оценена верно, если производная взята правильно, как минимум, по соответствующему аргументу. Когда ты (или не ты) строишь график плотности распределения голосов относительно посещаемости, ты по сути берешь производную не по тому аргументу (см. правила построения диаграмм). В результате, или у тебя плотность правильная, но от какой-то другой функции распределения (смысл которой не известен), или функция распределения для искомой величины (вероятности получения заданного количества голосов) получена неправильно, так как изначально неправильно построена гистограмма для этой величины.
Пример. Есть хорошо известные гистограммы распределения населению по росту и доходу. Одна построена для функции, которая говорит какова вероятность вырасти не выше определенной высоты, другая для функции, которая говорит какова вероятность зарабатывать не больше определенных денег. Теперь кто-то построил гистограмму, роста по доходу. Это выглядит либо как распределение ростов для людей с определенным доходом, либо он складывал значения роста и показывает какой суммарный рост всех жителей с некоторым доходом.
Все это выглядит и смешно и глупо, и ловится сразу, потому что рост от дохода вряд ли зависят. В нашем случае посещаемость и кол-во голосов за партию вполне могут как-то коррелировать. Соответственно, графики выглядят многозначительно, но попытка выдать их за общее распределение остается такой же ошибочной. Примерно как распределение сумм значений роста выдавать за распределение по росту.
Я уж не знаю куда подробнее-то.
> Правильный анализ я приводил. Там ничего подобного нет. А подгонять результаты - занятие простое.
В общем понятно, есть только один правильный график - твой, а все остальное - неправильное просто потому, что не совпадает с твоим графиком, и, следовательно, это подгон результатов.
> строишь график плотности распределения голосов относительно посещаемости, ты по сути берешь производную не по тому аргументу
Да нет конечно.
> Все это выглядит и смешно и глупо, и ловится сразу, потому что рост от дохода вряд ли зависят.
А доход от роста может и зависеть. Корреляция может быть, да.
> Теперь кто-то построил гистограмму, роста по доходу
И кто же это там строил гистограмму результатов ЕР от явки? Именно гистограмму? Где?
> Тут интересно то, что на избирательных участках тех же ТИК (то есть соседних), но без КОИБ, процент ЕР на 20 процентных пунктов выше в среднем - 54%.
> меньше, ты хотел сказать? То есть сознательно ставили КОИБ на те участки, где ЕР возьмёт меньше? Проведя работу по предварительному исследованию по участкам? Удалось из 17 млн проголосовавших на этих тик найти участков на 3,2 млн, где электоральные предпочтения так сильно различаются? Даже если это делалось специально (хотя зачем бы) - абсолютно невероятно.
Вполне вероятно. Хотя, я тоже сначала над таким явным палевом смеялся. Но потом пришли воспоминания из детства.
В Москве на улице Маршала Захарова есть несколько корпусов домов 10 и 12 - 5 или 6 17тиэтажных зданий всего. Построены и заселялись примерно в 83-85 годах. Все дома по одному проекту, практически близнецы. Я с самого начала не мог понять, как, ну вот КАК могут так сильно отличаться места общего пользования в двух стоящих рядом домах: в одном - всё нормально, в соседнем какой-то хэл - оторванная ручка двери подъезда, изрисованные, исписанные стены, выбитые стёкла подъезда, выломанные почтовые ящики, непереходящий запах ссанья, сожженные клавиши в лифте, алюминий и пластик в лифте искорёжены,свет не горит. Естественно, обслуживались дома одним и тем же ДЭЗом, и этот ДЭЗ латал периодически всё это в "плохом" доме, но хватало этого ненадолго - разруха была перманентной.
Объяснение для себя я нашёл лет через 10: два дома были "кооперативными", а остальные - "городскими" и "заводскими". Люди за 40 поймут, к какой группе относились засранные дома.
А теперь представим, что эти дома попали в разные УИКи. Тогда меня не удивит разница в результатах за ЕР даже в 2 раза между ними.
А теперь представим, что место голосования организовано прямо в жилых домах. ТИК решает, куда поставить КОИБы. Меня не удивит, если он поставит их в "благополучный" дом. И тогда мы получаем очень даже разные результаты на участках с КОИБами и без в рамках одного ТИКа. И ТИКу даже не надо было проводить никакие "предварительные исследования по предпочтениям ЕР".
> В общем понятно, есть только один правильный график - твой, а все остальное - неправильное просто потому, что не совпадает с твоим графиком, и, следовательно, это подгон результатов.
Обрати внимание, я не просто картинку выложил, а файлы, в которых подробно виден весь расчет. Найди ошибки там.
> Да нет конечно.
Что нет? Не строишь? Не берешь? Вообще в этом не разбираешься?
> А доход от роста может и зависеть. Корреляция может быть, да.
Может, может, не вопрос. Это к тому, что бессмысленность подобного графика будет легко видна из жизненного опыта. Бессмысленность графиков приведенных "разоблачителями" уже не так видна, хотя по сути они те же самые.
> И кто же это там строил гистограмму результатов ЕР от явки? Именно гистограмму? Где?
Если они строят не гистограммы, то это еще хуже. Тогда придется найти, как минимум, математическое определение того, что они делают. Только после этого можно привлекать статистику (как науку).
>"Суть наномитинга заключается в том, что его основными участниками выступают игрушки: например, пластмассовые фигурки из "Киндер-сюрпризов" и конструктора "Лего". Именно они держат плакаты соответствующего размера, сделанные из зубочисток и бумаги.
"
Между цитатой и своей репликой надо оставлять пустую строку, иначе неудобно читать. Две пустых строки оставлять не надо, три пустых строки также не нужны.