Возвращаясь к доске Гальтона мы можем сказать, что при десяти случайных встречах с препятствиями число шариков, которые попадут в крайние пробирки (все встречи привели к одним лишь левым или к одним лишь правым отклонениям), будет в среднем в 252 раза меньше числа шариков, попавших в средний приёмник.
С гауссовой кривой приходится сталкиваться во всех областях знания. Универсальность её объясняется очень просто: на неё укладываются вероятности отклонений от среднего во всех случаях, если только отклонения «вправо» и «влево» равновероятны. Если же отклонения от среднего невелики, как это бывает очень часто, то подобное требование осуществляется всегда. Сейчас мы продолжим знакомство с этой замечательной кривой, лежащей в основе любой статистики.
Случайные отклонения
Вкусы у людей, как известно, чрезвычайно разные. Одни сникают при взгляде на длинные колонки цифр, на графики с ниспадающими и вздымающимися вверх ломаными и плавными кривыми, на масштабные столбики, высота которых описывает все, что угодно, – урожаи, рост, потребление водки или посещаемость театров. У других же, и их немало, глаза загораются при взгляде на это богатство информации. Жадно рыщут они взглядом вдоль цифровых столбцов, просматривают графики и приходят к интересным и важным выводам в области экономики страны, понимания человеческого характера или ещё в чем-нибудь. Люди эти – статистики, – нужное и важное племя работников, значительный отряд министерств и ведомств.
Задачи статистики (так называются не только люди, но и область деятельности) разнообразны и обширны. На десятках тысяч библиографических карточек приведены данные о промышленном производстве, о народном образовании, о смертности населения, о функционировании поликлиник и больниц, об автомобильных катастрофах, о посещаемости кинофильмов и бог весть ещё о чём. Статистиков интересуют самые разные вещи: динамика роста тех или иных показателей, сопоставление данных по значению какого-либо параметра в разные времена года, или в разные часы дня, или среди мужчин и женщин, или среди лиц разного возраста.
Особое место занимают в статистике измерения средних значений и отклонений от средних. Весьма распространены измерения роста и веса. Вес цыплят, которыми торгует птицеферма, интересен потому, что характеризует её работу; рост людей интересен для швейной промышленности, выпускающей одежду ог 46-го до 56-го размеров, и т.д. Так как все это известно читателю из газет и радиопередач, приводящих всевозможные числа, то перейдём к нашей теме, а именно, к проявлению во всей этой массе чисел законов случая.
Один из скучных рисунков, фигурирующих в сочинениях по статистике, нам придётся привести. Мы с художником долго ломали голову над тем, как сделать это масштабное построение более приемлемым в книге серии «Эврика». Результат творчества изображён на странице 71 [ссылка]. Рисунок показывает диаграмму и кривую, которая носит название кривой статистического распределения.
Чтобы рисунок лучше рассмотреть, поверните, пожалуйста, книжку на 90 градусов. Правда, новобранцы очутились в лежачем положении. Но, ей-богу, ничего более толкового не придумаешь. Теперь (в повёрнутом положении) высота кривой показывает число будущих солдат определённого роста. Величины роста нанесены на уровне носа. Выбран конкретный пример измерения роста 1375 ребят. Столбики – это результат измерения, а плавная линия – наиболее близкая к опыту – гауссова кривая.
Статистикам известна следующая замечательная вещь: чем больше привлечённый для построения графика материал (в данном случае чем больше ребят), тем плавнее и ближе к теории кривая, соединяющая вершины масштабных столбиков.
Самым замечательным обстоятельством является то, что кривая, получающаяся при измерении любых объектов, имеет форму той же самой кривой Гаусса, на которую, как мы видели, ложатся числа комбинаций «красного» и «чёрного»!
Теперь рассмотрим вид кривой нормального распределения в деталях. Нормальная кривая примерно похожа на колокол; она спадает одинаково в обе стороны сначала медленно, а потом быстро. Чтобы построить её, математику достаточно знать три параметра: высоту её максимума, среднее значение изучаемой величины (то есть то место на горизонтальной оси, которое соответствует среднему значению) и ширину кривой. Вершине колокола как раз и соответствует то, что мы называем средней величиной. (Как получить среднее, известно даже тем, кто враждует с арифметикой: надо сложить все измерения и разделить на число измерений.) Откуда же видно, что максимум кривой Гаусса придётся на среднюю величину? Доказательство лёгкое: нужно проинтегрировать гауссову кривую. Но так как это занятие здесь неуместно, то просим поверить на слово, что теорема доказывается совсем просто.
Итак, остаётся пояснить, что такое ширина нормальной кривой. Условно меряют ширину на полувысоте колокола. Очевидно, что ширина показывает, насколько часто или редко мы встречаемся с отклонениями от среднего. Чем уже колокол, тем реже значительные отклонения от среднего.
Нормальная кривая распределения роста, которая была нарисована на предыдущей странице, описывается такими словами: «Высота кривой 200 человек», то есть двести человек имеют средний рост (первый параметр кривой).
Заметим тут же, что иметь строго средний рост невозможно, можно иметь средний рост с точностью 1, 2, 5 сантиметров и т.д. На нашем графике каждая точка представляет группу ребят, рост которых лежит в пределах 2,5 сантиметра. Средняя высота новобранцев, как мы видим по диаграмме, равна 158 сантиметрам – это второй параметр.
Третьим параметром является ширина колокола, равная в этом случае 15 сантиметрам. Знание ширины кривой позволяет сразу же оценить, с какими отклонениями от среднего мы можем встретиться.
Нормальная кривая универсальна и относится к любым событиям, поэтому, смотря все на тот же рисунок, мы можем делать общие заключения, справедливые для любых нормальных кривых. Скажем, отклонения больше трех полуширин практически не встречаются. Так обстоит дело всегда, вне зависимости от того, о чём идёт речь.
Для характеристики вероятности отклонения от среднего значения в технике и статистике существуют ещё среднее отклонение по абсолютной величине, среднее квадратичное отклонение, вероятное отклонение, мера точности. Все эти величины связаны между собой и с полушириной гауссовой кривой числовыми множителями, близкими к единице.
Вообще говоря, каких-либо доводов в пользу того, чтобы те или иные статистические сведения ложились на гауссову кривую, нет. Правда, кое-что мы чуть позже увидим. Сейчас же надо подчеркнуть, что точные представления о нормальном распределении случайных событий показывает кривая числа комбинаций «красного» и «чёрного». И к идеалу, с точки зрения математической, эта кривая приближается тем лучше, чем большее число испытаний проводится. Если число событий, которые мы обрабатываем статистически, исчисляется десятками, то ординаты кривой будут отличаться от идеальных на десятые доли процента; при сотнях испытаний разница уменьшится до сотых долей процента. Во всяком случае, на рисунке размером в страницу мы не отличим кривую распределения, построенную для тридцати событий, от гауссовой кривой идеальной.
Без преувеличения можно сказать, что закон Гаусса является важнейшим оружием в технике, в физике, в медицине – в любой науке.
Знание среднего значения случайной величины и ширины кривой нормального распределения позволяет уверенно судить о возможном и невозможном.
В технике беспорядочные колебания случайной величины около её среднего значения называют шумом. Такой шум вы слышите, когда снимаете телефонную трубку. Шумом называют обыкновенный белый свет. Шумит молния, излучая весь спектр электромагнитных колебаний. Если шум изображать на телевизионном экране (осциллографе), то будет видна беспорядочная зигзагообразная кривая.
Шум нетрудно ограничить двумя горизонтальными линиями; так сказать, вписать его между нулём и некоторым максимумом. Что можно сказать об этом максимуме, о верхнем пределе шума?