Теория вероятностей позволяет также вычислить, насколько велика должна быть выборка из N человек, чтобы полученная из нее частота M/N достаточно мало отличалась от искомой вероятности p. Предположим, что вероятность голосования за A в самом деле известна: например, пусть выборы уже прошли, так что можно принять за p долю всех избирателей, проголосовавших за A. Посмотрим, что можно сказать о возможных результатах выборов по выборке из N избирателей. Число M членов этой выборки, высказавшихся за кандидата A, может быть от 0 до N, и для каждого значения M существует вероятность того, что ровно M человек выскажется за A; обозначим эту вероятность через p(M). Если известна вероятность голосования за кандидата A (равная p), то вероятность M положительных ответов при нашей выборке из N человек, как можно показать, равна
где – так называемые биномиальные коэффициенты, равные
здесь N! – произведение всех целых чисел от 1 до N, именуемое факториалом числа N, и аналогично M! = 1 x 2 x 3 x ... x M, (N-M)! = 1 x 2 x 2 x...x(N-M) . Например, если в группе 50 человек (N = 50), то при p = 2/3 вероятность того, что за A выскажутся 30 человек, равна
Доказательство формулы для p(M) мы не приводим: его можно найти в любом учебнике теории вероятностей. Заметим, что прямое вычисление биномиальных коэффициентов при больших значениях M и N довольно трудно и обычно заменяется методами высшей математики. Но нас интересует здесь только общий характер зависимости p(M). Эта зависимость изображена на рисунке 1, для случая N = 50, p = 2/3. Вдоль оси абсцисс отмечены точки M = 0, 1, 2,..., 49, 50, а значение изображенной функции – очень точно приближающей p(M) – равно ординате графика с абсциссой M.
Рис.1
Колоколообразная кривая рисунка 1 называется гауссовой кривой и имеет важное значение в естествознании и статистике. Наибольшее значение p(M) – около 0,12 – получается при M = 33, то есть при ближайшем целом к 2/3 x N; это значит, что вероятнее всего исход опроса, при котором за A выскажется pN членов выборочной группы. Из рисунка 1 видно, что, например, при M<25 общая вероятность того, что за A выскажется не больше половины группы, равная
p(0) + p(1) + p(2) + ... + p(25),
оказывается ничтожно малой. Точный расчет показывает, что эта сумма меньше 0,005, т.е. вероятность такого результата меньше 0,5%.
Таковы должны быть вероятности p(M), если в самом деле вероятность p = 2/3, то есть если 2/3 всех избирателей в самом деле проголосовали за кандидата A. Но, предположим, в результате опроса членов выборки из 50 человек обнаружилось, что среди них числа сторонников и противников A примерно равны: пусть, например, оказалось, что M = 24. Вероятность такого результата в предположении, что p = 2/3, ничтожно мала – меньше 0,5%. Этот результат опроса 50 человек даст основание поставить под сомнение опубликованные данные выборов, по которым A избран большинством в 2/3 голосов.
Конечно, если в результате выборов голоса "за" и "против" разделились почти поровну, то обнаружить неправильность выборов было бы не так легко. В этом случае гауссова кривая имела бы максимум вблизи точки 25, и значение M = 24 попало бы в область, где p(M) достаточно велико, так что противоречие с утверждением избирательной комиссии не получилось бы. Дальше мы покажем, что делать в таких случаях, довольно частых в политической практике. Если вероятное отклонение от истинного значения из-за подделки в ходе голосования составляет значительно бо'льшую величину, чем вероятное отклонение из-за малой величины выборки, то данным математического контроля можно доверять больше, чем официальным данным, даже если выборка состоит всего из нескольких десятков человек. Такой контроль нетрудно устроить, и он обходится недорого.
В России в специальных работах оценивалась доля подделанных бюллетеней: она нередко составляла проценты, и даже десятки процентов от числа поданных бюллетеней. Характерным примером было голосование по принятию Конституции 1993 года, когда в официальных данных была на несколько процентов завышена явка избирателей. Хотя в действительности явное большинство высказавшихся по этому поводу избирателей было "за" новую Конституцию – то есть хотя и нет содержательных оснований считать, что народ отверг эту Конституцию – согласно ранее принятому решению требовалось, чтобы на референдум по Конституции явилось не менее пятидесяти процентов избирателей; между тем, в действительности явилось около сорока девяти процентов. По закону следует считать, что референдум о Конституции не состоялся, и что мы, следовательно, живем по Конституции , не принятой в установленном законом порядке. Закон должен выполняться точно и формально, без всяких "полезных" для власти толкований, потому что привычка к таким толкованиям – и тем самым поощрение фальсификаций – возвратит нас ко временам произвола.