Даже если вы не знакомы с физикой элементарных частиц, но любите программировать и умеете разрабатывать алгоритмы интеллектуальной обработки больших массивов данных — у вас есть реальный шанс помочь ЦЕРНу в изучении бозона Хиггса! Несколько дней назад под эгидой ЦЕРНа и нескольких других организаций стартовало открытое онлайн-соревнование Higgs Boson Machine Learning Challenge. Его задача — придумать наиболее прозорливый алгоритм, позволяющий компьютеру отличить событие рождения и распада бозона Хиггса от фоновых (то есть нехиггсовских) событий, которые в изобилии регистрируются на Большом адронном коллайдере.
Для этого участнику сначала выдается порция «тренировочных» событий — массив из 250 тысяч векторов, содержащих по 30 кинематических параметров каждый. Про каждое событие известно, является ли оно «хиггсовским» или нет. Участник должен придумать и реализовать такой алгоритм, который обнаружил бы в массиве кинематических параметров закономерности и на их основании стал бы надежно классифицировать события как «хиггсовские» или «фоновые».
После того как алгоритм натренируется на тестовых данных, пользователю выдается массив из 550 тысяч контрольных событий. Его задача — «натравить» разработанный им алгоритм на эти данные и обнаружить в них хиггсовский бозон с как можно большей статистической значимостью. Менять свой алгоритм, пытаясь подогнать его под данные, на этом этапе уже нельзя — такова философия слепого анализа данных, общепринятая сейчас в физике элементарных частиц. Чем больше статистическая значимость обнаружения хиггсовского бозона в этих данных — тем выше положение участника в итоговой таблице. Некоторые впечатления об этом соревновании см. в блоге Томмасо Дориго.
В настоящее время в соревновании принимают участие уже свыше 400 команд, но к нему в любой момент может присоединиться каждый желающий. Участник не слишком ограничен в количестве попыток (не более пяти в день), поэтому есть широкий простор для поиска и настройки новых алгоритмов. Времени еще предостаточно — соревнование продлится до 15 сентября. Тройка победителей получит денежные призы вплоть до 7 тысяч долларов. Ну а если алгоритм будет признан по-настоящему удачным, физики возьмут его на вооружение при обработке новой порции экспериментальных данных, которая будет набрана в следующем году.