Рассмотрим, на каких основах может быть проверена представительность и действительность ансамбля. Так, если мы обследуем величину роста людей, на который влияют много случайных117 факторов, и построим график частоты относительного количества людей, имеющих заданный рост, то на хвостах кривой будут люди относительно малого и большого роста, которых сравнительно немного. Средняя часть соответствует пику—среднему росту, т. е. получается кривая нормального распределения Гаусса. Поясним, как ставить эксперимент репрезентативно. В США в 1936 году при выборе президента было опрошено большое количество избирателей, более двух миллионов. Бюллетени были разосланы подписчикам журналов, людям, чьи фамилии и адреса были взяты из телефонных книг, а также владельцам автомобилей. Опрос показал, что вероятность избрания президентом Ф. Рузвельта мала. В результате же выборов был избран Ф. Рузвельт. В чем же дело? В выборке было слишком мало обеспеченных людей, то есть эксперимент проводился с одной группой при наличии двух групп.
В то же время социологи Д. Гэман и Э. Роупер правильно предсказали победу Ф. Рузвельта, основываясь только на четырех тысячах анкет.
Следующий пример не корректного опроса. Известна задача о длине носа китайского императора, которого никто не видел. Для решения задачи предлагается опросить всех жителей страны и узнать, что они думают о длине носа императора, после чего вывести среднее арифметическое. Ответ должен быть «точным», так как опрос массовый. Но это неправильно, ибо мнения незаинтересованных и невнимательных людей не улучшают понимания процесса. «De non apparentibus et non existentibus eadem est-ratio» (Де нон аппарентибус ет нон ексистентибус еадем ест ратио)
«О том, чего не видно, и о том, что не существует, судят одинаково, т. е. то, чего не видно, равносильно тому, чего нет».
И другой не менее курьезный случай. Пусть речь идет о разделении групп, факультетов по результатам сессии для оценки качества обучения. Для этого выводится средняя оценка. Спрашивается, сколько знаков после запятой корректно учитывать при сравнении? Для количества студентов 30—40 корректно вычислять оценки с точностью до 0,1, а в случае 2500 студентов можно учитывать и сотые знаки. Приходится же нам иногда слышать и читать, что успеваемость повысилась с 3,62 до 3,69 при количестве студентов 500 человек (имеется в виду факультет), и это интерпретируется как «повышение» качества или наоборот.
Числа, указанные с большой точностью, например процент успевающих, связываются с представлением о точности измерения и, как справедливо отмечают М. Голдстейн и И. Ф. Голдстейн, вызывают доверие у непосвященных.
Изложим некоторые соображения этих авторов. Например, утверждение, что процент успевающих может соответствовать реальности. Если число студентов 21, а успевающих 13, то 61,9 создает должное впечатление о точности.
Если бы из 21 студента еще один успевал, то итоговая цифра составила бы 66,7%, а еще один неуспевающий снизил бы ее до 57,1%. Утверждение, что процент успевающих 57 и 66% было бы менее впечатляющим и не таким частным, чем если бы было, скажем, число студентов 21.
Итак, чтобы получить ложное представление, не обязательно нужно столкнуться с явной ложью.
Встречаются случаи обмана статистических данных. При этом надо иметь в виду, кто заинтересован в той или иной величине данного показателя опроса.
Примером преднамеренного искажения могут служить производственные показатели в национализированных отраслях экономики, в которых перед управляющими ею людьми были поставлены определенные производственные задачи, данные об уровне смертности от холеры и оспы в отсталых странах, получающих большую долю дохода от туризма.
В газете «Ставропольская правда» (1983. 1, 2 апр.) был опубликован Указ о награждении матерей, родивших и воспитавших от
5 до 9 детей, орденом «Материнской славы» I степени — 8 человек, среди них 5 домохозяек, т. е. 62%, «Материнской славы» II степени — 12 человек (домохозяек 11, т. е. 91%), «Материнской славы» III степени — 24 человека (домохозяек 17, т. е, 70%). Медалью «Материнской славы» I степени награждены 27 человек (домохозяек 17, т. е. 60%), II степени — 65 человек (домохозяек 36, т. е. 55%).
117
Случай есть продолжение закономерности. Французская пословица: «один случай — случай, два — тенденция, а три уже закономерность».