vit_r: default (Default)
[personal profile] vit_r
RU_el_magic_numbers_test_2018-03-21

Выборы прошли, началась математика.

Мы знаем, что где-то подсчитали, что получили. Где-то пригнали бюджетников. Где-то вбросили "на глазок". Где-то посчитали на калькуляторе и тупо записали число. Где-то прикинули на глазок и сочинили.

Примерное количество посчитанного на калькуляторе ловится статистикой. (Пила Чурова.)

Подброшенное тоже даёт статистические аномалии в некоторых признаках (если это не повсеместно, а рядом есть участки с наблюдателями).

Мне интересно как ловить свободно нарисованное. Человек думает "Вот, выдумаю-ка я число чуть больше этого, но чтоб не очень нагло"...

А фиг, психологию не обманешь.

Набор данных с последних выборов для меня просто абстрактные модельные числа, и нужно в шуме научиться ловить сигнал.

Картинка сверху в самом грубом приближении ищет ситуацию вытягивания на "чуть больше сотни" и "чуть больше тысячи". Это не статистика, а просто прикидки.

Чистая проверка достаточно сложна.



Чтобы получить статистически значимые результаты, надо делать достаточно сложные модели с "плохими" и "хорошими" числами, а потом вычитать из них случайное распределение и нарисованное по процентам из калькулятора.

При этом, нужно несколько конкурирующих моделей, потому что плохо считающие могут рисовать цифры, оканчивающиеся на 0 и 5, а хорошо считающие будут их избегать. (Дураков, конечно, больше, но мы верим в людей.)

Ещё одна проблема с "хорошими числами" в том, что числа не свободно выбираются, а идут в контексте протокола. В конце длинного числа могут повторяться цифры из его начала.

Частота цифр и сочетаний цифр в соседних нарисованных числах будет не случайной, но вряд ли будет зависеть от тех, которые оставили без изменений, тем более, если туда скинули остаток.

Дальше надо искать рифмы.

А ещё есть визуалы, которые цифры не читают, а складывают.

Ниже таблицы любимых чисел с произношением и количеством УИК

Великий ПУ

Четырёхзначные

1005Тысча - пять 68
1014тысча - четырнадцать67
1019десять - девятнадцать67
1028десять - двадцать восемь67
1031десять - тридцать один67


Трёхзначные

100сто185
152сто - пятьдесят два169
120сто - двацать168
117сто - семьнадцать165
131один - тридцать один161
103один - ноль три159
130один - тридцать157


Кстати

666да-да-да72


Двузначные

91девять - один175
85восемь - пять166
73семьдесят три164
74семьдесят - четыре161
80восемь - десят161
93девять - три160
98девять - восемь160


Явка

Черырёхзначные

1204двенадцать - ноль - четыре71
1050десять - пятьдесят67
1066десять - шестдесят шесть67
1069десять - шестдесят девять66
1074десять - семьдесят четыре66
1256двенадцать - пятьдесят шесть66
1071десять - семьдесят один65


Трёхзначные

109сто - девять143
125один - двацать пять143
100сто141
144один - сорок четыре136
147один -сорок семь136
105сто - пять134
111один - один - один132

Date: 2018-03-22 09:25 am (UTC)
deniok: (Рыжий)
From: [personal profile] deniok
Вообще-то при анализе первых цифр в разных данных надо помнить о законе Бенфорда. Он не для всех типов распределений один и тот же, но тем не менее для многих дает вклад. Вот, например, список всех стран, упорядоченных по населению: https://ru.wikipedia.org/wiki/%D0%A1%D0%BF%D0%B8%D1%81%D0%BE%D0%BA_%D1%81%D1%82%D1%80%D0%B0%D0%BD_%D0%BF%D0%BE_%D0%BD%D0%B0%D1%81%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8E. Сколько из них имеет население, начинающееся с цифры 1? Наивный ответ: 1/9. Фактический: 1/3.

Date: 2018-03-22 01:53 pm (UTC)
deniok: (Default)
From: [personal profile] deniok
Да, так и должно быть по Бенфорду, он дает поправки и во вторую и третью значащие цифры тоже. Второй ноль в два раза более вероятен, например, чем вторая девятка при ведущей единице.
Я не к тому, что фальсификаций не было, были. Но по ведущим цифрам нужен более аккуратный анализ.

Profile

vit_r: default (Default)
vit_r

February 2026

S M T W T F S
12 34 567
8 91011121314
15161718192021
22232425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 10th, 2026 05:07 am
Powered by Dreamwidth Studios