Люди часто делают ошибочные выводы, проведя всего лишь один опыт , совпадение в котором между предположением и экспериментом может оказаться случайным. Например, полно таких случаев, когда кто-то о чём-то помолился и вдруг это получил – не нужно на одном этом случайном совпадении делать религиозные выводы, ибо это некорректно с точки зрения теории вероятностей.
Важное качество верной теории – повторяемость, воспроизводимость результата.
Для того, чтобы исключить влияние фактора случайности, случайное совпадение, необходимо провести хотя бы несколько сотен аналогичных экспериментов. Только так можно обнаружить закономерность и исключить случайность. Именно поэтому никакая научная теория не может основываться на одном единственном опыте – нужны сотни аналогичных опытов, чтобы накопить статистически значимое количество данных. Например, можно провести 10 или 100 опытов для проверки высказывания "железо растворяется в соляной кислоте" и в 100 % случаев мы подтвердим его.
В любой области науки – в физике, химии, экономике и пр. – везде используется статистическая погрешность. Если мы хотим проверить закон Ома, то можно провести несколько сотен измерений разной силы тока и разного напряжения при разных сопротивлениях, чтобы убедиться в истинности закона Ома в проверенном диапазоне величин напряжения, сопротивления и силы тока. Или, например, при проведении маркетинговых исследований с опросом потребителей ни в коем случае нельзя строить маркетинговую стратегию компании на мнении одного или даже десяти потребителей. Потому что вероятность статистической ошибки будет очень высока. При проведении маркетинговых исследований лучше опросить, скажем, 1000 или более потребителей. После такого опроса отдел маркетинга компании получит более-менее объективные данные о потребности потребителей в данном товаре на данном сегменте рынка. И чем больше выборка – тем менее вероятна статистическая ошибка. Поэтому крупные компании тратят очень большие деньги на точные маркетинговые исследования с детальным опросом очень большого количества потребителей, чтобы тем самым сократить риски бизнеса и чтобы точно знать, что данный товар по данной цене купит такое-то количество потребителей на данном сегменте рынка, и следовательно, можно получить такую-то научно прогнозируемую прибыль. Следуя научному подходу – пониманию теории вероятностей и математической статистики – умный бизнес может прогнозировать свою прибыль, заранее расчитывать расходы на рекламу, которые точно окупятся и значительно снизить (практически ликвидировать) рыночные риски бизнеса.
Но статистическая ошибка будет всегда. Поэтому в точных науках результат даётся с погрешностью, например: х = (34 ± 2), CL = 95 %. Это означает, что на уровне достоверности 95 % величина х лежит в интервале от 32 до 36. И еще есть вероятность 5 % того, что величина х находится вне этого интервала. CL – confidence level – уровень достоверности (англ.).
Все случайные величины подчиняются распределению Гаусса в пределе при количестве элементов выборки, стремящемуся к бесконечности. Согласно распределению Гаусса, наиболее вероятная величина – среднее арифметическое бесконечно большой выборки. Однако реальные выборки отнюдь не бесконечно большие, а 100 или 1000 или любое иное число элементов. Причем, среднее арифметическое реальной выборки далеко не всегда равно среднему арифметическому бесконечно большой выборки.
Например, в некоем ресторане обычно около 1000 посетителей в месяц, а средняя сумма чека – 300 рублей. Но однажды там ещё 10 человек отметили свадьбу с суммой чека 120 000 рублей. Если мы подсчитаем среднее арифметическое за данный месяц, то у нас получится (300*1000 + 120 000)/1010 = 416 руб. Можно ли говорить, что "бизнес растёт"? Разумеется, нет. Потому что среднее арифметическое данной выборки за данный месяц – 416 руб. – сильно отличается от среднего арифметического более крупной выборки – за год, где оно равно 300 руб. Но что делать, если в данном конкретном случае у нас нет физической возможности увеличения объёма выборки для приближения её к распределению Гаусса?
Для решения этой задачи были введены другие мерила для нахождения средне-статистической величины, позволяющие в таких случаях подойти ближе к среднему арифметическому кривой распределения Гаусса – мода и медиана.
Мода – это наиболее часто встречающееся значение переменной. Мода позволяет выбирать в качестве среднего наиболее вероятное значение. В данном случае мода будет равна 300 руб.