Пусть (сказали Лаплас и Гаусс) в n опытах измеряются n величин, истинные значения которых a1, a2, ..., an. Поскольку ни одно измерение не обходится без ошибок, мы получили результаты измерений x1, x2, ..., xn, где xi = ai +δi, причем δi — это ошибка i-го измерения. Поскольку ошибка измерения определяется каким-то сочетанием случайных факторов (случайных в смысле древнего архетипического представления о случайности) будем смотреть на ошибки δi как на значения случайных величин. Итак, модель результатов измерения имеет вид
| xi = ai + δi, | (3.1) |
где δi — случайные величины.
Пока что сказано нечто тривиальное, а первая нетривиальная мысль состоит в том, что во многих случаях точные значения a1, a2, ... , an могут быть связаны уравнениями, вытекающими из известных законов природы (мы воспроизводим рассуждения рубежа 18-го и 19-го веков, когда науки уже развиты и законов природы известно немало). Если в эти уравнения подставить вместо a1, a2, ..., an результаты их измерений x1, x2, ..., xn, содержащие ошибки, то, разумеется, уравнения не будут соблюдаться точно. Нельзя ли как-то использовать получающиеся «невязки» с законами природы для уточнения результатов измерений и вообще для извлечения какой-то полезной информации? Оказывается — можно, и для этого предназначен метод наименьших квадратов Гаусса. Для наших целей этот метод в его общем виде не нужен: мы ограничимся простейшим частным случаем, когда из законов природы вытекает уравнение
| a1 = a2 = an = a, |
т. е. во всех опытах определяется одна и та же величина a. Модель (3.1) принимает вид
| xi = a + δi, | (3.2) |
Если в моделях (3.1) и (3.2) под δ1, δ2, ..., δn понимать просто какие-нибудь случайные величины, то эти модели тривиальным образом верны, но не ведут ни к какой обработке наблюдений. Обработка становится возможной, если что-то предположить дополнительно о величинах δ1, δ2, ..., δn. Важнейшим из таких предположений является предположение об одинаковом распределении случайных величин δ1, δ2, ..., δn. Это означает, например, что вероятности P{δi < z}, где z — любое вещественное число, одинаковы для всех i = 1, ..., n. (Данное предположение может быть несколько ослаблено, но незначительно.)
На языке здравого смысла это предположение означает следующее. Случайная величина — это результат некоторого случайного эксперимента. Например, можно представить себе, что некий демон держит в руках мешок, в котором находится очень большое число бумажных билетиков, на которых написаны числа. Мы не вдаемся в детальный процесс образования ошибок измерений, а моделируем его следующим образом. При каждом измерении демон наудачу достает билетик из мешка, а написанное на нем число и есть ошибка данного измерения. Потом билетик кладется обратно, а при следующем измерении все повторяется. В таком случае предположение об одинаковом распределении всех ошибок измерений сводится к тому, что демон не имеет права менять мешок: мешок не зависит от номера измерения. Понятно, что это очень сильное предположение о стабильности (во времени) источника ошибок эксперимента.
Это основное предположение статистической однородности ошибок измерений в классической теории дополняется еще двумя. Во-первых, предполагается, что отсутствует систематическая ошибка, т. е. Eδi = 0, где знак E обозначает математическое ожидание. Классики аргументировали в пользу этого предположения примерно следующим образом: раз ученый, делающий измерения, является честным человеком, то он не будет систематически завышать или занижать результаты своих измерений, а в таком случае для него одинаково вероятно ошибиться на (+ε) и на (–ε), что приводит к тому, что Eδi = 0. Конечно, подобная аргументация нам представляется наивной, поскольку ошибки измерений зависят не только от субъективной честности измерителя, но и от свойств приборов, которыми он пользуется. Однако, если мы уже приняли гипотезу об одинаковом распределении ошибок, то в таком случае их математические ожидания тоже одинаковы: Eδi = α, т. е. фактически вместо величины a в (3.2) мы измеряем a + α. Такая ситуация должна, вообще говоря, скоро обнаружиться. Например, если наши измерения геодезические, то как только мы измерим углы какого-то (пусть, для простоты, плоского) треугольника, то сразу и найдем, что их сумма отличается от теоретических 180°. Другое дело, если систематическая ошибка α не остается всё время постоянной, а может зависеть скажем, от истинного значения a измеряемой величины (в разных участках шкалы прибора разные систематические ошибки). Такие систематические ошибки вылавливать сложнее (и наиболее правильно считать, что классическое предположение Eδi = 0 является просто исходным пунктом, отправляясь от которого, начинается ловля систематических ошибок).
Вторым предположением является предположение о статистической независимости ошибок различных измерений. В эпоху Лапласа и Гаусса (около двухсот лет назад) различные случайные величины обычно считались независимыми. Вероятностные модели с зависимыми случайными величинами начинают появляться примерно на век позже. Однако и в настоящее время мы с крайней неохотой будем пользоваться моделями с зависимыми ошибками, если наша задача — обработать какие-то конкретные наблюдения. Другое дело, что такие модели могут употребляться для критики классических концепций (см. об этом книгу П. Е. Элиасберга [82], о которой несколько слов будет сказано ниже).
Наконец, можно вводить или не вводить предположение, состоящее в том, что отдельные ошибки измерений δ1, δ2, ... ,δn имеют нормальное распределение. Если это предположение ввести (классики склоняются к нему), то для дальнейшего не требуется центральная предельная теорема. Если этого предположения не вводить, то нормальность распределения среднего значения
= (1/n)Σxi следует обосновывать ссылкой на центральную предельную теорему.
Какие же блага вытекают из всех этих предположений? Действительно доставляется некая важная опора для знаний, основанных на наблюдениях. В самом деле, каждая домашняя хозяйка знает, что за оценку истинных значений a нужно взять
, но насколько это
может отличаться от истинного a? Ответ: E
= a, дисперсия Dx = σ2/n, где σ2 = Dδi — дисперсия отдельного наблюдения. Следовательно, используя таблицы нормального закона, находим, например, что
| P{| | (3.3) |
Беря грубо вместо 1,96 число 2, получаем, что лишь в одном случае из 20 отклонение
– a может превосходить по (абсолютной величине) число 2σ/√n. Вопрос состоит лишь в том, как найти σ. Если бы ошибки δi = xi – a были наблюдаемы, мы взяли бы за приближенное значение σ2 = Dδi = Eδi2 среднее значение (1/n)Σδi2. Но раз мы самих ошибок δi не знаем, возьмем кажущиеся ошибки xi –
и составим выражение
| S2 = (1/n)Σ(xi – | (3.4) |
Классики рекомендовали принять приближенно σ2 ≈ S2, иными словами заменить в (3.3) неизвестное σ на легко вычисляемое по формуле (3.4) значение S. Последовавший затем длительный математический анализ вполне подтверждал рекомендацию классиков (в рамках их модели) при числе наблюдений n порядка одного-двух десятков и более. Небольшая разница состоит в том, что теперь вместо (3.4) обычно берут чуть отличающееся выражение
| s2 = (1/(n-1)) Σ(xi – |
но при n порядка десятков (и более) разница между S и s несущественна.
Изложенная рекомендация в наше время широко известна (хотя всё-таки не каждой домашней хозяйке), но двести лет назад речь шла о настоящем чуде. В самом деле, пределы для возможной ошибки среднего из n наблюдений (по отношению к абсолютно истинному значению a) устанавливается без каких-либо сведений о том, что именно измеряется и каким методом, а лишь исходя из «невязок» наблюдений, т. е. разностей xi –
. Посмотрим, какой пример этого чуда дается в магистерской диссертации Чебышева.
На последней странице диссертации приводятся n = 29 наблюдений Кэвендиша по определению постоянной всемирного тяготения. Значение этой постоянной Кэвендиш пересчитывал в значение средней плотности Земли. Таким образом, приводятся значения плотности Земли (в г/см3), которые колеблются от 5,07 до 5,88. Истинное значение, разумеется, лежит где-то в середине, и отклонения от него достигают примерно 0,40, т. е. около 10% от измеряемой величины. Спрашивается, каков порядок точности среднего значения
?
Всего лишь нужно вычислить
и S2 по формуле (3.4). Чебышев это и делает, но он сделал уже массу формульных и численных вычислений в своей диссертации. (В частности, комментатор к изданию критикует лишь последний — седьмой — знак таблицы нормального закона, составленной Чебышевым.) К концу работы он, видимо, устал и простые вычисления производит с потрясающей арифметической безграмотностью. Имеет место алгебраическое тождество
| S2 = (1/n)Σ(xi – |
и Чебышев производит вычисления по его правой части. В этом случае (как понятно каждому гимназисту) нужно от всех чисел xi отбросить целую часть, равную 5, и вычислять с дробями. Но Чебышев этого не делает. Он принимает округленно
= 5,48. Оба числа (1/n)Σxi2 и (
)2 оказываются близкими к 30, а первая отличная от нуля цифра их разности — знак сотых. Если учесть, что более точно
=5,482, то получается, что ошибка 0,002 в значении
влияет на знак сотых в значении (
)2, и тем самым на первую значащую цифру в значении S2. К счастью, при вычислении Σxi2 Чебышев тоже каким-то образом ошибся, обе ошибки компенсировались и получился достаточно точный результат. Он эквивалентен тому, что S/√n ≈ 0,04. Итак, ожидаемый порядок ошибки значения
составляет что-то около 1% от измеряемой величины (Чебышев заключает, что истинное значение плотности с близкой к 1 вероятностью лежит в пределах 5,48 ± 0,1). Теперь, через полтора века после Чебышева, мы можем сказать, что чудо, в самом деле, произошло: в настоящее время принято значение плотности Земли 5,52, и разница 5,52 – 5,48 составляет как раз 0,04. Видимо, объективный мировой Разум так бережет выдающихся ученых ранга Кэвендиша и Чебышева, что дает им возможность совершить научное чудо на удивление потомкам, несмотря даже на арифметические ошибки.