Я видел только одну книгу по метрологии (и то это была не книга, а пособие по лабораторным работам), где была ясно сказана известная каждому практически работающему инженеру и физику вещь — большинство измерений делается один раз.
Это легко понять, даже если вы в жизни не держали в руках тестера: подавляющее большинство измерений в современной технике — это автоматический контроль процессов, измерения онлайн. А они все однократны.
При наличии серии измерений (одной и той же величины — мы почему-то считаем, что она не изменяется) можно произвести обработку полученных данных и получить оценку параметров реального распределения, в частности, истинного (действительного) значения измеряемой величины. Выражаясь метрологично, желательно, чтобы оценка (то есть от способ ее получения) была «состоятельна», «несмещенна» и «эффективна».
Состоятельность оценки означает, что при увеличении числа опытов она приближается к истинному значению. Например, если распределение результатов измерений нормально и максимум совпадает с истинным значением, то среднее значение неограниченно приближается к истинному по мере увеличения количества измерений. Оценка не будет состоятельна, если распределение несимметрично, например близко к нормальному, но с ограничением с одной стороны (например, нулем — недвижимости по ценам). Впрочем, это распределение не только не нормально, но и даже ненормально.
В принципе возможно симметричное распределение, при котором средняя величина не приближается к истинному значению, хотя такое распределение не имеет ничего общего с нормальным и вряд ли может встретиться на практике. Заметим, что при симметричном бимодальном распределении оценка средним состоятельна. При нормальном распределении состоятельна также и оценка дисперсии.
Несмещенность означает отсутствие систематических отклонений оценки от параметра при любом конечном, в том числе и малом, объеме выборки. Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам, поскольку реальная выборка всегда конечна. При нормальном распределении оценка истинного значения средним является несмещенным, а оценка дисперсии по обычной формуле (сумма квадратов отклонений от среднего, деленная на число измерений) нет: при одном измерении она дает очевидную глупость — ноль. Поэтому формула корректируется, деление на число измерений заменяется на деление на число измерений минус один.
Эффективность оценки означает, что если извлекать из генеральной совокупности разные серии наблюдений, то полученные из них оценки какого-то параметра будут иметь минимальную дисперсию по сравнению с другими методами оценки.
В обычной ситуации часто имеет место распределение, близкое к нормальному. Иногда рассматривают другие распределения — равномерное, арксинусное, треугольное и другие, которые разумно сочетают соответствие реальности и удобство вычислений. Отклонения от нормального распределения, хоть большие, хоть вовсе неунимодальность, воспринимаются физиком как «Пионерская зорька» — то есть как указание на действие какого-то механизма, который можно попытаться определить. В частности неунимодальность может быть следствием неустойчивости, а может быть результатом смешения двух распределений.
Функция распределения определяется тем точнее, чем большим количеством измерений мы располагаем. Но чем больше измерений — тем дороже процедура и вообще, длительные измерения это не очень хорошо — сам объект может измениться (хотя растет шанс это заметить!), да и потребность в результате обычно связана с временем получения оного. Поэтому «все прогрессивное человечество» день и ночь размышляет, как по небольшому количеству измерений определить функцию распределения. Существует несколько способов оценить, удовлетворяет ли полученный набор данных той или иной функции распределения, есть несколько так называемых «критериев согласия»: хи-квадрат (Пирсона), Колмогорова, моментов. Само наличие нескольких критериев согласия говорит о гуманитарности всех таких оценок. Практическое же применение в значительной степени опирается на опыт, практику в конкретной области, «чутье».
Любой прибор имеет диапазон измерений, и на практику случаются (чаще в социологии) ситуации, когда диапазон охватывает только основную область измерений. В социологии крайние выборы на шкале бывают сформулированы не в виде диапазона, а в виде одностороннего ограничения. Например, «ваш доход за прошлый месяц — до 100, 101–300, 301-1000, 1001–3000, более 3001». В этом-то случае количества выбравших тот или иной ответ — это просто интегралы по соответствующим диапазонам, но вот более сложный случай. Пусть мы проводим экзамен и вот количества решивших то или иное количество задач: 0 задач — 10, 1, 2, 6 и 7 задачи — по 1, 3 и 5 задач — по 3, 4 задачи — 10, 8 задач — 0. Означает ли это, что у нас бимодальное распределение с медианами 0 и 5? Нет, это означает, что трудности задач были таковы, что именно эти количества респондентов рашали именно эти количества задач. Определение набора оптимальных по трудности задач, исходя из априорной (скорее всего — нормальной) функции распределения и конкретных требованиях по отбору (обычно — разбиение на группы, часто на две) — нерешенная задача. Скорее всего, решить ее в такой постановке и невозможно, ибо понятие трудности задачи не универсально: задача описывается не одним параметром.
В реальной ситуации могут встретиться и неунимодальное распределение, поскольку как в медицине, так и в технике случаются фиксированные «поломки», формирующие свою функцию распределения, скорее всего — нормальную, но с другим средним значением.
При проведении измерений иногда случаются грубые ошибки, вызванные неправильными действиями оператора, так называемые «промахи». Например, отсчет азимута с ошибкой 180° при топографической съемке в спелеологии, отсчет с «не той» шкалы в многопредельных приборах. При проведении практических измерений такие ошибки обычно замечаются сразу — на основе предшествующих измерений или исходной информации — и сразу же и отбрасываются. Цивилизованная же процедура исключения промахов такова: сначала вычисляется среднеквадратичное отклонение ц (в предположении, что распределение нормальное!), а потом отбрасываются все измерения, отклоняющиеся от среднего больше, чем на 3ц. Оснований для таких действий два: «промахи» относительно слабо влияют на среднее и дисперсию и, скажем при 20-и измерениях для нормального распределения выход результата за указанные границы происходит с вероятностью 0,01.
Когда после обработки результатов измерений мы указываем для искомой величины одно значение, это называется «точечная оценка». Часто этим нельзя ограничиться, а нужно еще указать и вероятность, с которой искомая величина находится в тех или иных пределах, так называемые «доверительную вероятность» и «доверительный интервал». Если наше распределение нормально, то при доверительной вероятности 0,8–0,9-0,95-0,99-0,999 доверительный интервал составляет 1,3–1,6-2,0–2,6-3,3 ц.
На практике часто искомая величина вычисляется по результатам измерения нескольких величин, то есть осуществляются косвенные измерения. В этом случае, согласно школьному курсу физики, если величины складываются или вычитаются, то абсолютные погрешности складываются, а если перемножаются или делятся, то складываются относительные погрешности. Если же производятся прямые многократные измерения одной и той же величины, то появляется возможность уменьшения относительной погрешности. А именно, относительная погрешность убывает пропорционально корню из количества измерений, то есть усреднение скажем 10 измерений уменьшает случайную погрешность в 3 раза. При наличии серий измерений, имеющих разную точность, измерения, имеющие меньшую дисперсию, следует учитывать с большими весами. Хотя на практике скорее попытаются увеличить количество измерений, выполненных с меньшей дисперсией.
Существенная часть измерений выполняет в цивилизации функцию контроля. Это означает, что результат обработки данных такого измерения должен быть бинарен: годен — или нет, свой — или чужой, любит — или не любит. В этом случае полная схема возможных ситуаций это четыре варианта: принятие годного, отклонение негодного, пропуск негодного — «пропуск атаки» и отклонение годного — «ложная тревога». Обычно в системе есть управляемый параметр, чувствительность, от которого и зависит ее поведение. При малой чувствительности нет ложных тревог, но есть пропуски атаки. При высокой чувствительности все наоборот, и пьяная ворона легко канает за МБР, а стая — даже за разделяющиеся головные части. Оптимальная чувствительность зависит от цены той и другой ошибки, реальной ситуации — частоты ложных тревог и от нашей гипотезы относительно частоты атак. Как мы видим, и здесь играет роль исходная гипотеза.