Идеология теории ошибок представляет взору самые типичные черты колодки мышления. Предлагается модель той части мира, с которой мы собираемся работать (именно ошибок измерений) в виде независимых одинаково распределенных случайных величин. Да, ошибки измерения действительно могли бы быть устроены таким способом, особенно для тех измерений, которые прежде всего имели в виду Лаплас и Гаусс — астрономических и геодезических. Речь идет в обоих случаях об измерении углов между направлениями на два предмета. Сначала мы наводим визир оптического прибора на один предмет, но, так как изображение дрожит, то абсолютно точная наводка невозможна и направление определяется с некоторой случайной ошибкой. То же повторяется со вторым предметом. Почему бы не быть справедливой модели Лапласа и Гаусса? Модель, кстати, содержит подгоночный параметр σ2 (дисперсию единичного наблюдения), и за счет выбора этого параметра можно объяснить почти любые полученные на опыте результаты измерения. Вообще, отвергнуть ту или иную вероятностную модель на основании ограниченного экспериментального материала бывает трудно.
Но в исторической перспективе все обстоит по-другому. Указывая доверительный интервал для той или иной физической константы, исследователь, в сущности, заключает пари с теми, кто будет измерять эту константу в будущем. Ждать решения вопроса, вообще говоря, придется довольно долго, потому что для полной ясности необходимо существенное усовершенствование методов измерения. Как часто такое бывает? Если мы скажем, что существенное методическое усовершенствование появится через 20–30 лет, то это будет уже следующее поколение ученых. Подобное пари со следующими поколениями ученых заключил Лаплас (речь шла об отношении массы Юпитера к массе Солнца). Проиграл Лаплас свое пари: современное для нас значение этой константы выходит за пределы указанного им интервала.
Определенные надежды на доверительные интервалы сохранились еще в первой половине 20-го века. Когда в 1913 г. Милликен определил заряд электрона, он дал и доверительный интервал. В этом случае величина 2S/√n составляла примерно 0,001 от измеряемой величины, и довольно долго считалось, что определение Милликена имеет такую точность. Но в конце концов выяснилось, что точность значительно хуже — около 0,006 от измеряемой величины. Правда, в данном случае дело объясняется тем, что Милликен использовал недостаточно точное значение вязкости воздуха (входившей в пересчет результатов измерений), в силу чего возникла систематическая ошибка. В такой ошибке не виновата вероятностная теория.
Сомнения насчет доверительного интервала возникали и в классической области геодезии. Было обнаружено явление горизонтальной рефракции: в зависимости от погодных условий, показатель преломления воздуха может быть переменным не только по вертикали, но и по горизонтали. В этом случае возникает искривление лучей света в горизонтальном направлении, которое заметно влияет на измерение углов. В геодезии были разработаны нормы на то, сколь хорошо должны сходиться между собой результаты последовательных (во времени) триангуляций. Оказалось, что результаты зимних и летних триангуляций не сходятся так хорошо, как положено по нормам (по-видимому, из-за различий в горизонтальной рефракции зимой и летом).
Пока в различных областях науки накапливались сведения о ненадежности результатов статистической обработки измерительных данных, теоретики продолжали верить в мечту Лапласа и Гаусса. Такой осмотрительный и осторожный автор, как А. Н. Колмогоров, в своей работе 1946 г. о методе наименьших квадратов ([35], стр. 267-283) озабочен лишь тем, как лучше объяснить студенту метод Гаусса (но не тем, что этот метод дает реально). Однако во второй половине 20-го века наступил перелом.
Дело в том, что был введен в широкую практику принципиально новый метод измерения расстояний — радиолокация. С появлением искусственных спутников, естественно, стали проводиться радиолокационные измерения их траекторий. Оказалось, что если обрабатывать их методом наименьших квадратов, то получается совсем скверно: этот метод предсказывает столь высокую точность параметров орбиты, что два разных участка одной и той же орбиты не хотят стыковаться друг с другом. Вопрос, конечно, в том, что такое число измерений. Радиолокационные измерения можно проводить очень часто, почти в режиме непрерывного времени, и если ошибки отдельных измерений считать статистически независимыми (по Лапласу и Гауссу), то число независимых наблюдений делается очень большим. Отсюда и высокая теоретическая точность определения параметров траектории (а тогда ее различные участки приносят слишком разные параметры). Здесь уместно вспомнить второе свойство российской ментальности по А. де Кюстину — острую, доходящую до злобности критичность (первое свойство, напомним, — неспособность создать ничего оригинального). Действительно, столь критичного отношения к статистической обработке наблюдений, какое выражено, например, в книге П. Е. Эльясберга [82], нам не приходилось видеть в западной литературе. Выпущена эта книга в ту пору, когда существовал Главлит, так что на почве русской ментальности и Главлит мог пропустить весьма критичную книгу.
В частности, в этой книге написано, что закон больших чисел — это предрассудок 19-го века. Имеется в виду следующее. Если x1, x2, ..., xn — независимые случайные величины, σ2 — их (допустим, одинаковые) дисперсии, то дисперсия среднего арифметического
равна σ2/n и стремится к нулю при n→∞ (один из вариантов закона больших чисел). Если же допустить, что все величины коррелированы между собой (хотя бы с небольшим коэффициентом корреляции r = 0,1), то дисперсия
отнюдь не стремится к нулю при n→∞ (закон больших чисел не действует). В то же время на практике трудно отличить случай r=0,1 от случая r=0 (в этом Эльясберг тоже прав). Стало быть, нечего особенно надеяться на закон больших чисел.
На этом простейшем примере понятно, что мало что остается от статистической обработки наблюдений, если колодку мышления с независимыми ошибками дезавуировать (заменив ошибки на зависимые). Казалось бы — подрыв основ науки, но, видимо, никто из специалистов по теории вероятностей на этот подрыв не обиделся (и гонений на автора, насколько нам известно, не было). Однако в развитие тезиса о критичности российской ментальности заметим, что книга [82] имеет свои недостатки.
Из подобной книги хотелось бы узнать, как на самом деле устроены ошибки радиолокационных измерений. Нужны ли здесь вообще какие-то вероятностные модели? Принципиально радиолокатор — это часы, а погрешность измерения часами промежутка времени может зависеть от длины измеряемого промежутка. Достаточно ли такой систематической ошибки, которая зависит от измеряемой величины, чтобы объяснить, в основном, ошибки радиолокатора? Если же подобные ошибки настолько нестабильны, что их хочется считать случайными, то должны быть какие-то фактические исследования стабильности их статистических свойств. В противном случае модели с корреляциями не имеют отношения к радиолокации. Иными словами, из книги [82] не следует почти ничего положительного.
По совокупности изложенных фактов можно сделать следующие выводы, которые на самом деле касаются не только теории ошибок, но и других приложений вероятностных методов.
Конечно, Лаплас и Гаусс задумывали теорию ошибок как некую физическую теорию для оценки влияния ошибок наблюдений на конечный результат обработки — физическую в том смысле, что ее выводы должны подтверждаться на уровне физической парадигмы. Например, доверительные интервалы для значений физических величин должны, как правило, подтверждаться по мере развития методов измерения. Однако подобные подтверждения столь редки, что скорее должны рассматриваться как чудо. (Чудо бывает, когда добиваются желаемого результата явно недостаточными средствами.) Спорить с тем, что в очень многих случаях вероятностная модель теории ошибок не адекватна (на физическом уровне строгости) реальным ошибкам, нет никакой возможности.
Правда, одним из бесспорных чудес, связанных с этой моделью, является то, что при дальнейшем развитии науки она оказалась адекватной (на том самом физическом уровне) моделью для других явлений. Стоит заменить слова «δi — ошибка i-го наблюдения» на слова «δi — проекция на ось абсцисс скорости i-ой молекулы», как мы получим модель газа Максвелла. При этом верно, что Eδi = 0, что Dδi одинаковы и что δi — статистически независимы и распределены по нормальному закону. Мы принимаем такую модель газа в качестве простой, но в физическом смысле полноправной модели. Как видно, мировой Разум позаботился также о Лапласе и Гауссе, чтобы их способ думать на что-нибудь пригодился. Но что касается обработки результатов измерений, то тут, кажется, есть всего три возможности:
1) не заниматься обработкой совсем (кроме элементарного представления результатов в удобочитаемом, в частности, графическом, виде);
2) разрабатывать новые, более сложные модели, надеясь на их адекватность;
3) обрабатывать результаты с помощью метода наименьших квадратов и его более современных аналогов, смягчив, однако, ту философию, которая определяет, какой радости мы ожидаем от этой обработки.
Первый выход — скверный, так как в этом случае отдельные наблюдения детально вообще не анализируются и мы рискуем упустить что-то важное (что на самом деле имеется в фактическом материале, но мы не обращаем на него внимания).
Второй выход — мало реальный, так как усложнение моделей (например, введение корреляций между ошибками наблюдений) обычно не делает их более адекватными.
Мы склоняемся к третьему выходу, который имеет хотя бы то преимущество, что естественно вырос из классики и потому обеспечен компьютерными программами обработки. Конечно, держать пари с последующими поколениями ученых относительно точности определения физических величин вряд ли стоит. Но сопоставление реальных данных с какой-то колодкой мышления (пусть даже ее неадекватность заведомо допускается) обычно позволяет заметить какие-то новые особенности данных, которые не были бы замечены без обработки. Философия сводится, таким образом, к надежде более полно проявить какую-то дополнительную часть информации, содержащейся в данных, причем недорогой ценой — используя существующие программы обработки. Конкретный пример подобного более полного понимания результатов эксперимента, к которому в конце концов привело последовательное применение метода наименьших квадратов, можно найти в [71].