В последнее десятилетие в физике элементарных частиц всё более четко вырисовывается желание ученых не только получать новые данные по элементарным частицам, но и обеспечить их сохранность в будущем. Это может очень пригодиться, если физики когда-нибудь захотят перепроверить старые данные в свете каких-нибудь новых неожиданных фактов. А это, во-первых, означает что данные должны быть защищены от потери вследствие технических поломок, а во-вторых, нужно убедиться, что будущие поколения исследователей смогут в этих данных разобраться.
Оба требования можно удовлетворить, если объективные данные, полученные на LHC, будут выложены в открытый доступ. В идеале, все желающие, обладающие достаточной компетенцией, должны быть способны провести свой собственный анализ полученных на коллайдере данных. Конечно, прямо сейчас все поступающие данные выкладывать не стоит в силу ряда причин, но усиливается движение за то, чтобы постепенно их открывать в ближайшем будущем. Такой шаг будет очень полезен и с педагогический точки зрения. При наличии программ обработки и помощи экспертов, студенты и даже школьники смогли бы сами попробовать свои силы в обработке реальных данных и тем самым почувствовать, каково это — искать новые частицы и явления.
Тут следует пояснить, что существует четыре уровня данных LHC. Во-первых, это результаты, которые вошли в научные публикации экспериментальных групп. В соответствии с политикой ЦЕРНа, все такие статьи находятся в свободном доступе для всех желающих — и совершенно не важно, в каком журнале статья была опубликована.
Во-вторых, уже несколько лет ЦЕРН создает специальную подборку небольшого числа наиболее интересных событий, которые тоже уже находятся в открытом доступе. Эти события можно просматривать и анализировать онлайн прямо на сайте ЦЕРНа (см., например, подборку открытых данных с детектора CMS). Эти события уже давно используются в образовательных проектах для студентов и школьников во многих странах.
Далее, данные третьего уровня — это вся совокупность «распознанных данных», которые, собственно, и изучают ученые. Под «распознанными» подразумеваются данные, прошедшие предварительную низкоуровневую обработку и записанные в терминах физических объктов (например, вылетело три электрона, два мюона и 15 адронов с такими-то энергиями и под такими-то углами). Вот эти данные и начнут постепенно открывать в ближайшем будущем. На сайте CMS сообщается, что во второй половине 2014 года ожидается первый «релиз» — будут обнародованы данные, накопленные в 2010 году.
Наконец, существуют и данные четвертого уровня — сырые данные детекторов. Они состоят из записей вида «ячейка номер такой-то в такой-то момент времени почувствовала такое-то энерговыделение». В этих данных нет никакой физической информации, это чистый отклик «железа» на столкновения частиц, который, может быть, и связан с пролетом частицы, но может быть просто шумом или вызван сбоем ячейки. Эти данные открывать не собираются. Однако для честной обработки данных посторонними людьми, не посвященными в инструментальные тонкости самого детектора, они и не требуются; вся осмысленная информация, за которую сотрудники детектора «отвечают», находится в данных третьего уровня.
Небольшая подборка результатов столкновений на LHC уже сейчас доступна всем желающим для просмотра и анализа. В ближайшем будущем ЦЕРН начнет постепенно открывать и остальные данные