3.3.3. Колодки статистической обработки измерений

Пусть (сказали Лаплас и Гаусс) в n опытах измеряются n величин, истинные значения которых a1a2, ..., an. Поскольку ни одно измерение не обходится без ошибок, мы получили результаты измерений x1, x2, ..., xn, где xi = ai +δi, причем δi — это ошибка i-го измерения. Поскольку ошибка измерения определяется каким-то сочетанием случайных факторов (случайных в смысле древнего архетипического представления о случайности) будем смотреть на ошибки δi как на значения случайных величин. Итак, модель результатов измерения имеет вид

 xi = ai + δi, (3.1)

где δi — случайные величины.

Пока что сказано нечто тривиальное, а первая нетривиальная мысль состоит в том, что во многих случаях точные значения a1, a2, ... , an могут быть связаны уравнениями, вытекающими из известных законов природы (мы воспроизводим рассуждения рубежа 18-го и 19-го веков, когда науки уже развиты и законов природы известно немало). Если в эти уравнения подставить вместо a1a2, ..., an результаты их измерений x1, x2, ..., xn, содержащие ошибки, то, разумеется, уравнения не будут соблюдаться точно. Нельзя ли как-то использовать получающиеся «невязки» с законами природы для уточнения результатов измерений и вообще для извлечения какой-то полезной информации? Оказывается — можно, и для этого предназначен метод наименьших квадратов Гаусса. Для наших целей этот метод в его общем виде не нужен: мы ограничимся простейшим частным случаем, когда из законов природы вытекает уравнение

 a1 = a2 = an = a,

т. е. во всех опытах определяется одна и та же величина a. Модель (3.1) принимает вид

 xi = a + δi, (3.2)

Если в моделях (3.1) и (3.2) под δ1, δ2, ..., δn понимать просто какие-нибудь случайные величины, то эти модели тривиальным образом верны, но не ведут ни к какой обработке наблюдений. Обработка становится возможной, если что-то предположить дополнительно о величинах δ1, δ2, ..., δn. Важнейшим из таких предположений является предположение об одинаковом распределении случайных величин δ1, δ2, ..., δn. Это означает, например, что вероятности P{δi < z}, где z — любое вещественное число, одинаковы для всех i = 1, ..., n. (Данное предположение может быть несколько ослаблено, но незначительно.)

На языке здравого смысла это предположение означает следующее. Случайная величина — это результат некоторого случайного эксперимента. Например, можно представить себе, что некий демон держит в руках мешок, в котором находится очень большое число бумажных билетиков, на которых написаны числа. Мы не вдаемся в детальный процесс образования ошибок измерений, а моделируем его следующим образом. При каждом измерении демон наудачу достает билетик из мешка, а написанное на нем число и есть ошибка данного измерения. Потом билетик кладется обратно, а при следующем измерении все повторяется. В таком случае предположение об одинаковом распределении всех ошибок измерений сводится к тому, что демон не имеет права менять мешок: мешок не зависит от номера измерения. Понятно, что это очень сильное предположение о стабильности (во времени) источника ошибок эксперимента.

Это основное предположение статистической однородности ошибок измерений в классической теории дополняется еще двумя. Во-первых, предполагается, что отсутствует систематическая ошибка, т. е. Eδi = 0, где знак E обозначает математическое ожидание. Классики аргументировали в пользу этого предположения примерно следующим образом: раз ученый, делающий измерения, является честным человеком, то он не будет систематически завышать или занижать результаты своих измерений, а в таком случае для него одинаково вероятно ошибиться на (+ε) и на (–ε), что приводит к тому, что Eδi = 0. Конечно, подобная аргументация нам представляется наивной, поскольку ошибки измерений зависят не только от субъективной честности измерителя, но и от свойств приборов, которыми он пользуется. Однако, если мы уже приняли гипотезу об одинаковом распределении ошибок, то в таком случае их математические ожидания тоже одинаковы: Eδi = α, т. е. фактически вместо величины a в (3.2) мы измеряем a + α. Такая ситуация должна, вообще говоря, скоро обнаружиться. Например, если наши измерения геодезические, то как только мы измерим углы какого-то (пусть, для простоты, плоского) треугольника, то сразу и найдем, что их сумма отличается от теоретических 180°. Другое дело, если систематическая ошибка α не остается всё время постоянной, а может зависеть скажем, от истинного значения a измеряемой величины (в разных участках шкалы прибора разные систематические ошибки). Такие систематические ошибки вылавливать сложнее (и наиболее правильно считать, что классическое предположение Eδi = 0 является просто исходным пунктом, отправляясь от которого, начинается ловля систематических ошибок).

Вторым предположением является предположение о статистической независимости ошибок различных измерений. В эпоху Лапласа и Гаусса (около двухсот лет назад) различные случайные величины обычно считались независимыми. Вероятностные модели с зависимыми случайными величинами начинают появляться примерно на век позже. Однако и в настоящее время мы с крайней неохотой будем пользоваться моделями с зависимыми ошибками, если наша задача — обработать какие-то конкретные наблюдения. Другое дело, что такие модели могут употребляться для критики классических концепций (см. об этом книгу П. Е. Элиасберга [82], о которой несколько слов будет сказано ниже).

Наконец, можно вводить или не вводить предположение, состоящее в том, что отдельные ошибки измерений δ1, δ2, ... ,δn имеют нормальное распределение. Если это предположение ввести (классики склоняются к нему), то для дальнейшего не требуется центральная предельная теорема. Если этого предположения не вводить, то нормальность распределения среднего значения х с чертой = (1/n)Σxi следует обосновывать ссылкой на центральную предельную теорему.

Какие же блага вытекают из всех этих предположений? Действительно доставляется некая важная опора для знаний, основанных на наблюдениях. В самом деле, каждая домашняя хозяйка знает, что за оценку истинных значений a нужно взять х с чертой, но насколько это х с чертой может отличаться от истинного a? Ответ: Eх с чертой = a, дисперсия Dx = σ2/n, где σ2 = Dδi — дисперсия отдельного наблюдения. Следовательно, используя таблицы нормального закона, находим, например, что

 P{|х с чертой – a| ≤ 1,96σ/√n} = 0,95 (3.3)

Беря грубо вместо 1,96 число 2, получаем, что лишь в одном случае из 20 отклонение х с чертой – a может превосходить по (абсолютной величине) число 2σ/√n. Вопрос состоит лишь в том, как найти σ. Если бы ошибки δi = xi – a были наблюдаемы, мы взяли бы за приближенное значение σ2 = Dδi = Eδi2 среднее значение (1/n)Σδi2. Но раз мы самих ошибок δi не знаем, возьмем кажущиеся ошибки xi – х с чертой и составим выражение

 S2 = (1/n)Σ(xi – х с чертой)2 (3.4)

Классики рекомендовали принять приближенно σ2 ≈ S2, иными словами заменить в (3.3) неизвестное σ на легко вычисляемое по формуле (3.4) значение S. Последовавший затем длительный математический анализ вполне подтверждал рекомендацию классиков (в рамках их модели) при числе наблюдений n порядка одного-двух десятков и более. Небольшая разница состоит в том, что теперь вместо (3.4) обычно берут чуть отличающееся выражение

 s2 = (1/(n-1)) Σ(xi – х с чертой)2,

но при n порядка десятков (и более) разница между S и s несущественна.

Изложенная рекомендация в наше время широко известна (хотя всё-таки не каждой домашней хозяйке), но двести лет назад речь шла о настоящем чуде. В самом деле, пределы для возможной ошибки среднего из n наблюдений (по отношению к абсолютно истинному значению a) устанавливается без каких-либо сведений о том, что именно измеряется и каким методом, а лишь исходя из «невязок» наблюдений, т. е. разностей xi – х с чертой. Посмотрим, какой пример этого чуда дается в магистерской диссертации Чебышева.

На последней странице диссертации приводятся n = 29 наблюдений Кэвендиша по определению постоянной всемирного тяготения. Значение этой постоянной Кэвендиш пересчитывал в значение средней плотности Земли. Таким образом, приводятся значения плотности Земли (в г/см3), которые колеблются от 5,07 до 5,88. Истинное значение, разумеется, лежит где-то в середине, и отклонения от него достигают примерно 0,40, т. е. около 10% от измеряемой величины. Спрашивается, каков порядок точности среднего значения х с чертой?

Всего лишь нужно вычислить х с чертой и S2 по формуле (3.4). Чебышев это и делает, но он сделал уже массу формульных и численных вычислений в своей диссертации. (В частности, комментатор к изданию критикует лишь последний — седьмой — знак таблицы нормального закона, составленной Чебышевым.) К концу работы он, видимо, устал и простые вычисления производит с потрясающей арифметической безграмотностью. Имеет место алгебраическое тождество

 S2 = (1/n)Σ(xi – х с чертой)2 = (1/n)Σxi2 – (х с чертой)2,

и Чебышев производит вычисления по его правой части. В этом случае (как понятно каждому гимназисту) нужно от всех чисел xi отбросить целую часть, равную 5, и вычислять с дробями. Но Чебышев этого не делает. Он принимает округленно х с чертой = 5,48. Оба числа (1/n)Σxi2 и (х с чертой)2 оказываются близкими к 30, а первая отличная от нуля цифра их разности — знак сотых. Если учесть, что более точно х с чертой =5,482, то получается, что ошибка 0,002 в значении х с чертой влияет на знак сотых в значении (х с чертой)2, и тем самым на первую значащую цифру в значении S2. К счастью, при вычислении Σxi2 Чебышев тоже каким-то образом ошибся, обе ошибки компенсировались и получился достаточно точный результат. Он эквивалентен тому, что S/√n ≈ 0,04. Итак, ожидаемый порядок ошибки значения х с чертой составляет что-то около 1% от измеряемой величины (Чебышев заключает, что истинное значение плотности с близкой к 1 вероятностью лежит в пределах 5,48 ± 0,1). Теперь, через полтора века после Чебышева, мы можем сказать, что чудо, в самом деле, произошло: в настоящее время принято значение плотности Земли 5,52, и разница 5,52 – 5,48 составляет как раз 0,04. Видимо, объективный мировой Разум так бережет выдающихся ученых ранга Кэвендиша и Чебышева, что дает им возможность совершить научное чудо на удивление потомкам, несмотря даже на арифметические ошибки.


14
Показать комментарии (14)
Свернуть комментарии (14)

  • nikolay  | 29.07.2006 | 13:01 Ответить
    Хотелось бы обсудить с В.Н. Тутубалиным завтрашний день
    в планировании и обработке результатов экспериметов!!!

    Заранее благодарен

    Николай
    Ответить
  • BBR  | 10.01.2007 | 19:18 Ответить
    6.3 (http://elementy.ru/lib/430230/430262): "Возможности биологической экспериментальной техники выросли не столь существенно, в частности, подсчет численностей видов принципиально остается таким же, как и во времена Гаузе"

    Вопрос: а почему бы не подсчитывать число особей программным путем? Взять каплю между стекол, сфотографировать с нужным разрешением и обработать изображение? Мне кажется что достаточно алгоритмов распознавания образов, которые можно адаптировать под эту задачу.
    Ответить
  • Александр Орлов  | 17.01.2007 | 11:30 Ответить
    О публикациях первого из авторов:
    http://forum.orlovs.pp.ru/viewtopic.php?t=390
    http://forum.orlovs.pp.ru/viewtopic.php?t=391
    Ответить
  • Igor_k  | 18.05.2007 | 00:47 Ответить
    Книга оставляет двойственное впечатление. С одной стороны,
    рассказанные истории весьма поучительны. С другой стороны,
    роль мистики в науке сильно преувеличена, а к выводам автора
    стоит относиться с разумной осторожностью. Все же ядерные реакторы
    работают куда надежнее, чем модели экосистем, и даже прогнозы
    погоды не всегда плохи. Проблемы в аксиоматической теории поля
    не останавливают развития физики высоких энергий.
    И метод наименьших квадратов здорово работает, если помнить
    известное правило: garbage in - garbage out.
    Конечно, мы не знаем,
    как происходят творческие прорывы при решении задачи, но
    вместо того чтобы называть их научной мистикой, можно их
    исследовать и учиться их достигать. Конечно, пока не умеем,
    но пробовать можно, есть общеизвестная литература, книги Пойа например.
    Так что, уважаемый читатель, бди !
    Ответить
    • NS > Igor_k | 31.05.2007 | 14:48 Ответить
      "Все же ядерные реакторы работают куда надежнее, чем модели экосистем"

      Мне кажется, вы сравниваете совершенно разные вещи. В процессе изучения многомерных (многофакторных/систем с многими степенями свободы) систем, которые можно выделить в общей картине мироздания, всегда происходит некоторый откат к простым моделям. Так наука переходит в технологию.

      С этой точки зрения, ядерные реакторы - это технологическая отрыжка науки, а экосистемы - ее объект изучения. И естественно, что искуственно упрощенная научная модель работает надежнее, чем реальная природная система, до понимания реальных закономерностей которой нам, как до Луны пешком.
      Ответить
      • Igor_k > NS | 31.05.2007 | 18:47 Ответить
        Согласен, технические системы куда проще биологических, потому
        и изучены лучше и работают надежнее. Но автор, как я понял,
        утверждает, что они изучены одинаково плохо? С этим я и не согласен.
        Я думаю, это автор так читателя подначивает.

        Непознанные (не описываемые опытом специалистов) области
        есть даже в такой модели, как шахматы.
        Доказательство - то, что компутер Каспарова
        обыгрывает. В компьютере некие части модели есть, а в разуме
        эксперта, чемпиона мира, их нет, и ситуация необратима. Вот
        вам и пределы человеческого разума. Но мы же не будем говорить,
        что шахматы изучены так же плохо, как экологические системы?
        Ответить
        • NS > Igor_k | 01.06.2007 | 14:20 Ответить
          Тут мы с вами коснулись очень интересной темы.

          Дело в том, что известный нам мир можно определить, как сумму внешних проявлений систем со сравнимыми уровнями сложности. Ну, и все нижележащие системы, конечно включены сюда же.

          Так вот, наука, хоть и не изучила досконально даже шахматы, но в принципе может это сделать. А вот системы, сложность которых превосходит наши возможности на порядки, мы не может ни изучить, ни даже представить. По одной простой причине - они не принадлежат нашему миру (не в метафизическом смысле, а в чисто практическом).

          С этой точки зрения ваше сравнение шахмат с экосистемами не совсем правомерно. Это все-таки системы разного качества. И различие между ними не сводится к количественным параметрам, так же как различие между живым и неживым мозгом не сводится только к биохимии или электрохимии.

          А что они изучены одинаково плохо - с этим и я не согласен. Не верю, что авторы настолько примитивны :)
          Ответить
    • lav > Igor_k | 17.06.2008 | 19:16 Ответить
      Профессор Тутубалин давно известен оригинальнымим высказываниями. Еще в своем учебнике матстатистики лет 30 назад он писал, что эта самая статистика занимается вещами сугубо идеальными, не имеющими никакого отношения к грубому материальному миру, обработке экспериментальных данных и т.п. Мне кажется, это такое интеллектуальное кокетство. Сам-то он прекрасно знает, что если бы никакого применения матстатистики к практике не было, то ни ему, не другим статистикам зарплату никто бы платить не стал... Хотя всякое бывает. Поминаемого тут Налимова к старости-то эвон как заколбасило, когда он в какю-то секту вступил..
      Ответить
  • alexpo  | 12.04.2008 | 13:38 Ответить
    Цитата: "...теология, и атомная энергетика, и экология (и прочие науки)...".
    Я просто в восторге от приравнивания теологии и атомной энергетики. Грош-цена такой философии.
    Правда, мне очень интересно было бы что-нибудь услышать о математизации теологии, или о математическом моделировании в ней :).
    Математизация технических наук не меньше чем теоретических. Просто при создании технических трудов математика сводится к простым инструкциям (формулам), понятным исполнителям, не имеющих научной и теоретической подготовки. Но если окунуться в историю вопроса... Например, инструкцию по построению атомного реактора можно написать вообще не касаясь ядерной физики.
    Ответить
    • lav > alexpo | 17.06.2008 | 23:29 Ответить
      Да, как говориться, глубокая философия на мелких местах. Прежде чем разводить философию, неплохо бы авторам подучить историю. Например, на Льва Толстого с его рассказом "Как в городе Париже починили дом" наехали совершенно зря. Это реальный факт, связанный с ремонтом Дома инвалидов в Париже. Толстой информацию почерпнул из газетной заметки и пересказал для детей. А тут сразу "нелепо по технической сути"... бла-бла-бла
      Ответить
  • saabmount  | 28.10.2011 | 23:54 Ответить
    "Авторы книги исследуют это убеждение примерно так же, как Сократ исследовал мудрость своих сограждан, и со сходными результатами"

    Напомним читателям, что результатом многолетних изысканий Сократа (по-видимому и Тутубалина) стала пропозиция: "Я знаю, что я ничего не знаю".

    RIP, академик Тутубалин...
    Ответить
  • Лайма2001  | 05.03.2013 | 18:37 Ответить
    Читая эту книгу, вернулась назад в 75-95 годы, когда с друзьями (физики, математики, биологи с университетским образованием, прекрасными способностями и широким кругозором) ходили в байдарочные, велосипедные и прочие походы, а вечерами у костра занимались трепом на околонаучные темы. Все это и представлено в данной книге. Тема обсуждения не важна сама по себе. Главное- привлечь внимание, описать парадоксальную ситуацию, иногда просто поделиться прочитанным, не отказав себе в удовольствии позлословить. Интересно, что из такого трепа выводы делались, причем также в духе выводов, сделанных в конце глав этой книги. выводы получаются в общем-то достаточно общие и тривиальные. А за возвращение в молодость - спасибо!
    Ответить
  • guryan  | 20.10.2014 | 11:48 Ответить
    Строго говоря, математика вовсе не является наукой, а всего лишь кратким и довольно примитивным языком, которым описать даже простую окружность можно только очень приблизительно.
    А почти религиозный, благоговейный трепет научного сообщества, перед математическими символами, оказал науке медвежью услугу, превратив её в некое подобие астрологии и хиромантии, со своими шаманами, прорицателями и толкователями.
    Стремление вывести из манипуляций абстрактными математическими символами и формулами некие физические истины, привело к изобретению понятий, не совместимых с законами природы. Математикой, как кратким языком, можно описать какое-либо явление, но объяснить его она не в состоянии и создаёт только иллюзию понимания.
    В отличии от математики, в природе не существует ничего отрицательного или мнимого, поэтому в ней нет и не может быть никакой антиматерии. Положительный и отрицательный заряды – это просто противоположные свойства материи, аналогичные, например, прозрачности и непрозрачности веществ.
    И при объединении материальных объектов с противоположными свойствами, эти свойства просто объединяются, либо компенсируя, либо усиливая друг друга. В противном случае, любые взаимодействия веществ с противоположными свойствами приводили бы к полной аннигиляции, как их фи-зическому исчезновению, что противоречит второму началу термодинамики.
    В природе нет ни интегралов, ни квадратных корней, ни синусов. Потому что все это – даже не какие-то физические величины, а всего лишь отношения этих величин. И уже лет через сто потомки будут покатываться со смеху над такими "научными" перлами, как бозоны Хиггса, черные дыры, ручки Уиллера, коты Шредингера, гравитационные коллапсы и прочие порождения примитивного сознания.
    Как сказал однажды Эйнштейн, математика – это единственный способ провести самого себя за нос. И сам же по уши в это вляпался… Гравитационный коллапс и аккреция, как поднятие самого себя за волосы. Большой взрыв, как творение материи из ничего.
    Молекулярно-кинетическая теория и теория струн, как образчики вечного двигателя и множество других абсурдных и бессмысленных гипотез, выведенных из математических преобразований, мало чем отличающихся от библейских сказок и сочинений фантастов, со временем навсегда исчезнут из науки.
    Ведь неудивительно, что теория большого взрыва, как божественное творение материи из ничего, с большой охотой была признана религиозными мракобесами Ватикана.
    Нельзя отрицать того, что математически можно посчитать насколько увеличится длина железной линейки при миллионе градусов, но обсуждать при этом её свойства могут разве что умалишённые, потому что ни при такой температуре она просто не существует.
    Однако, несмотря на это, псевдоучёные на полном серьёзе описывают, например, черные дыры, как будто уже пощупали их собственными руками, говорят об аккреции, как падении материи самой на себя, как будто видели это где-то воочию.
    Описания различных парадоксов, необъяснимых эффектов и явлений, якобы существующих в природе лавиной льётся с экранов большинства телеканалов и уже превратилось в доходный бизнес на невежестве обывателей и так не сильно обременённых способностью к мышлению. И самое страшное, что даже в среде учёных невежество уже достигло такой сте-пени, что многие из них верят в бога, а некоторые даже и не скрывают этого.
    Более того, в некоторых учебных заведениях уже дела-ются поползновения учредить кафедры богословия. И я не удивлюсь, что в скором времени дойдёт очередь и до возрож-дения святейшей инквизиции. Учёные и сами уже давно пре-вратились в толкователей результатов математических преоб-разований, подобно астрологам, предсказывающим людские судьбы по рисунку расположения звёзд на небе, совершенно не понимая, что эти явления несопоставимы и подчинены со-вершенно разным законам.
    Умение фантастически наукообразно трактовать ре-зультаты манипуляций математическими формулами, считает-ся признаком неординарного ума и нестандартного мышле-ния, недоступного простому смертному. Создав себе божка по имени "математика", учёные уже несколько столетий водят себя за нос, даже не подозревая этого.
    Зная, что дважды два – четыре и нагромождая друг на друга массу многоэтажных формул, легко написать вполне научную статью о каком-либо физическом явлении, даже не понимая его физического смысла и, тем не менее, создав в гла-зах обывателя иллюзию высокой научности.
    И эту иллюзию легко подкрепить простой проверкой математических выкладок обратным действием – разделив че-тыре на два. Потому что любые математические доказатель-ства представляют собой тавтологии, укладывающиеся в про-стую формулу: "дважды два равно четырём, потому что четы-ре, делённое на два, равно двум". И вот на подобных тавтоло-гиях выстроены практически все, так называемые научные теории.
    Публикуясь в своих рецензируемых научных изданиях, куда закрыт доступ свежей мысли и бесконечно подсчитывая, кто кого перецитирует, научное сообщество превратилась в секту посредственностей, состоящую в основном из людей, умеющих лишь виртуозно манипулировать цифрами, особо
    Ответить
  • Keller  | 07.01.2025 | 20:39 Ответить
    del
    Ответить
Написать комментарий
Элементы

© 2005–2025 «Элементы»