Вместо того, чтобы бросать точки на единичный отрезок, будем бросать их на окружность единичной длины. При этом вместо трех точек используем четыре, причем четвертую точку обозначим через z (рис. 15).
Рис. 15. Четыре точки на единичной окружности.
Таким образом, точки x, y и w, как и раньше, размещены на единичном интервале, у которого, однако, случайные концы. В силу равноправности всех четырех точек длины дуг (z, x), (x, y), (y, w) и (w, z) имеют одно и то же распределение. Если процесс бросания производится несколько раз, и при каждом бросании вычисляется длина дуги от точки z до следующей против часовой стрелки, от этой — так же до следующей и т. д., то имеет смысл говорить о распределении длин этих дуг, причем для всех дуг это распределение одинаково.
Разрывая окружность в точке z и разворачивая ее в отрезок, видим, что бросание четырех течек на окружность, одна из которых используется как начало отсчета, эквивалентна бросанию трех точек на единичный интервал.
Мы не дадим здесь строгого доказательства, хотя читатель, быть может, и не вполне убежден предыдущими рассуждениями. Верен общий принцип симметрии:
Принцип симметрии. При бросании n точек наудачу на отрезок, распределение длин n + 1 получающихся при этом отрезков одинаково.
39. Решение задачи о неуклюжем химике
В предположении того, что трубка разбивается случайно, из принципа симметрии выводим, что распределение длины каждой части с красной меткой, средней и с синей меткой одинаково и, значит, равны и их математические ожидания. Так как сумма этих величин постоянна и равна 9 см, то средняя длина куска трубки с красной меткой равна 3 см.
40. Решение задачи о первом тузе
Естественно считать, что принцип симметрии сохраняется и для дискретных распределений. Четыре туза делят колоду на 5 частей, каждая из которых содержит от 0 до 48 карт. Если два туза лежат подряд, то будем говорить, что длина соответствующего куска колоды равна нулю. Аналогично нулевую длину имеют части колоды, которые находятся до первого туза, если он лежит сверху, и за четвертым тузом, если он является последней картой в колоде. Согласно принципу симметрии средняя длина каждой части равна 48/5 = 9.6. Последующей картой должен быть туз, который является, таким образом, в среднем 10.6 картой.
41. Обсуждение задачи о поездах
Хотя на поставленные вопросы вряд ли можно дать «правильный» ответ, все же возможно разумное объяснение этих задач. Например, согласно принципу симметрии, если на отрезок бросается одна точка, то в среднем два полученных отрезка имеют одинаковую длину, так что в пункте (а) ответ равен 119, так как длина левого промежутка равна 59, 2·59 = 118 и 118 + 1 = 119.
Аналогично в пункте (б) можно предположить, что пять наблюденных номеров разбивают весь отрезок на шесть равных частей. Так как 60 − 5 = 55, то средняя длина первых пяти отрезков равна 11, и общее число номеров может быть оценено как 60 + 11 = 71 (рис. 16). Конечно, оценка не может быть абсолютно точной при многократном употреблении.
Рис. 16.
Указанный метод заставляет думать, однако, что в среднем при многократном использовании такие оценки мало отличаются от истинного значения N при большом числе наблюдений. Если неизвестное число N подлежит оценке во многих задачах, то, следуя каждый раз приведенному методу (извлечь выборку, построить оценку), мы в среднем будем близки к истинному значению при достаточно больших объемах выборок.
С другой стороны, может быть и так, что вас не интересует приближение в среднем или недоступно большое число наблюдений, но вы хотите угадать значение N, несмотря на то, что это маловероятно. Тогда разумно оценить N как наблюденный максимум из номеров. Если вы, например, знаете номера двух локомотивов, то вероятность того, что один из двух номеров — максимально возможный, равна или 2/N.
Иногда пользуются методом доверительного оценивания, при котором в качестве оценки предлагается некоторый интервал для неизвестного параметра. Ограничимся случаем одного наблюдения. Если наудачу извлечь один из номеров 1, 2, ..., N, то вероятность появления каждого номера равна 1/N. Поэтому вероятность того, что наш номер принадлежит некоторому множеству, равна числу элементов этого множества, деленному на N. Так, если, скажем, n — это случайный номер, а N — четное число, то P(n > N/2) = 1/2, для нечетных значений N эта вероятность несколько больше. Таким образом, если n случайно, то вероятность события n > N/2 не меньше 1/2. Если мы наблюдаем значение n, а N не известно, то в качестве верхней границы для N мы можем предложить 2n. В каждом отдельном случае утверждение 2n > N верно или нет, однако, оно справедливо более, чем в половине случаев. Если желать увеличения процента правильных высказываний, то надо изменить доверительный предел.