Статья опубликована в рамках: L Международной научно-практической конференции «Наука вчера, сегодня, завтра» (Россия, г. Новосибирск, 15 мая 2017 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
ТЕКУЩЕЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ ДОБРОВОЛЬНЫХ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛЕНИЙ
CURRENT STATUS AND PROSPECTS OF THE DEVELOPMENT OF VOLUNTARY DISTRIBUTED CALCULATIONS
Victor Kazorin
senior Lecturer of the Information Security Systems and Technologies department, The University of Service, Tourism and Design (branch of NCFU) in Pyatigorsk,
Russia, Pyatigorsk
Oleg Antonov
student of training course 09.03.02 “Information systems and technologies”, The University of Service, Tourism and Design (branch of NCFU) in Pyatigorsk,
Russia, Pyatigorsk
Nikolay Eliseev
student of training course 09.03.02 “Information systems and technologies”, The University of Service, Tourism and Design (branch of NCFU) in Pyatigorsk,
Russia, Pyatigorsk
АННОТАЦИЯ
Требования к вычислительным ресурсам компьютеров постоянно растёт, в связи с этим на крупных проектах используются суперкомпьютеры, обладающие большой вычислительной мощностью. В случаях, когда организаторы проекта не могут себе позволить установку суперкомпьютера, единственным способом получить аналогичную мощность для них остаются распределённые вычисления. Широкое распространение получили платформы добровольного распределённого вычисления, в которых у пользователей есть возможность предоставить неиспользованный вычислительный ресурс для решения глобальных задач.
ABSTRACT
Requirements for computational resources of computers are constantly growing, in connection with this, large-scale projects use supercomputers that have a large computing power. In cases where the project organizers can not afford to install a supercomputer, the only way to get the same power for them remains distributed computing. Voluntary distributed computing platforms, in which users have the opportunity to provide an unused computing resource for solving global problems, have become widespread.
Ключевые слова: высокопроизводительные вычисления; распределённые системы; добровольные распределённые вычисления.
Keywords: high-performance computing; distributed systems; voluntary distributed computing.
Одним из способов решения трудоёмких задач, требующих больших затрат процессорного времени, является создание распределённых систем вычислений.
Системы распределённых вычислений предполагают использование нескольких компьютеров, объединённых в единую сеть для синхронизации поставленных и решённых задач. Большим преимуществом распределённых систем вычислений по отношению к суперкомпьютерам является их высокая масштабируемость, позволяющая привлекать к проекту новые ресурсы не останавливая выполнение текущих задач.
Первой распределённой вычислительной системой является программа, разработанная в калифорнийском научно-исследовательском центре Xerox PARC Джоном Шох и Джоном Хапп в 1973 году. В основу данной программы был заложен запуск всех компьютеров, подключённых к сети для выполнения вычислений ночью, когда компьютеры находились в простое.
Наиболее продуктивными являются распределённые вычисления на добровольной основе, позволяющие всем пользователям мобильных и стационарных устройств принять участие в вычислительном процессе.
К основным направлениям подобных проектов являются:
● прогнозирование поведения биологических, химических и физических объектов, разработка лекарств;
● исследования в области математики;
● прогнозирование сейсмической активности Земли;
● подбор исходных данных для результатов односторонних функций;
● определение вероятности существования внеземных форм жизни на основе узкополосных радиосигналов из космоса;
● анализ и прогноз климатических условий Земли;
● исследования в области криптографии;
● исследования социальных явлений и процессов;
● мониторинг web-ресурсов и выявление закономерности отказа в обслуживании.
Мотивирующим фактором для участников является публичная рейтинговая система и выделенные форумы и чаты, где обсуждаются поставленные задачи и ожидаемые результаты.
В большинстве проектов участники объединяются в команды и проводят соревнования между собой в достижении поставленных задач.
Также некоторые платформы добровольных распределённых вычислений предусматривают материальную поддержку для команд и отдельных пользователей, устройства которых нашли ключевой ответ для одной из поставленных задач проекта.
Одним из существенных недостатков добровольных распределённых вычислений является отсутствие гарантии использования предоставленных участниками вычислительных ресурсов в указанных в проекте целях. Большинство проектов не предоставляет исходный код в открытый доступ и пользователи не могут точно определить предназначение программы. Так, недобросовестные организаторы таких проектов могут использовать предоставленные им ресурсы процессорного времени для перебора паролей и проведения распределённых атак на отдельные компьютеры или web-ресурсы.
Одной из платформ для организации добровольных вычислений является «BOINC», представляющая собой открытую некоммерческую программную платформу, разработанную в университете Беркли с целью проведения вычислений на виртуальном суперкомпьютере, представляющем собой совокупность компьютеров, объединённых в одну сеть[3].
Данный проект предполагает использование на различных платформах, в том числе: Microsoft Windows, GNU/Linux, Mac OS X, Android и др.
Ещё одно преимущество заключается в том, что открытая распределённая система потенциально может быть образована из разнородного аппаратного и программного обеспечения (опять-таки, возможно, от разных производителей). При этом добавление новых компонентов или замена существующих может осуществляться относительно легко, не затрагивая других компонентов. На аппаратном уровне это выражается в способности простого подключения к системе дополнительных компьютеров или замены существующих на более мощные [2].
Серверная часть большинства подобных систем состоит из следующих компонентов:
● Web-сайт проекта, где участники проходят процедуру регистрации и взаимодействуют между собой с помощью чата и форумов.
● База данных, в большинстве случаев реализованная с помощью MySQL, предназначенная для хранения данных для авторизации пользователей, учёта текущих заданий и результатов.
● Генератор заданий, который в зависимости от целей текущего проекта разбивает поставленные задачи на независимые на данном этапе вычислений блоки.
● Планировщик, целью которого является назначение и передача подготовленных генератором блоков данных конечным устройствам, на которых будут производиться вычисления. Каждому блоку данных назначается временной промежуток, в течении которого должен быть получен результат.
● Валидатор - проверяет полученные результаты корректность и в случае успешной проверке данные передаются в ассимилятор.
● Ассимилятор полученных результатов - собирает полученные от клиентов результаты в рамках текущего проекта и сопоставляет их с уже имеющимися.
Клиентская часть в большинстве случаев не имеет пользовательского интерфейса и после конфигурирования работает в фоне, получая и отправляя данные на сервер через сеть Интернет. В некоторые крупные системы распределённых вычислений интегрирован графический интерфейс, позволяющий пользователям производить настройку в интерактивном режиме, даже не зная консольных команд. Часто имеется возможность наблюдать за производимыми расчётами. Это актуально для проектов, подразумевающих симуляцию различных природных и социальных явлений.
В настоящее время платформа «BOINC» насчитывается 99 активных проектов и более 4 миллионов зарегистрированных пользователей и более 17 тысяч команд [4]. Наиболее популярным проектом, благодаря которому платформа получила широкое распространение, является «SETI@HOME», деятельность которого направлена на поиск внеземных цивилизаций, на основе данных, полученных с радиотелескопов.
Также следует выделить следующие наиболее крупные проекты:
● Rosseta@HOME, проект направлен на вычисление третичной структуры белка;
● Einstein@Home, проект направлен на подтверждение существования гравитационных волн;
● World Community Grid, проект направлен на разработку лекарств;
● ClimatePrediction.net, прогнозирование изменения климата на Земле в ближайшем будущем.
На сегодня в мире эксплуатируется большое количество суперкомпьютеров, но они дороги в разработке и обслуживании, а также у ученых имеются проблемы с доступом к их вычислительным мощностям. Добровольные распределённые вычисления лишены многих недостатков суперкомпьютеров, благодаря этому они имеют широкие перспективы развития и являются мощным инструментом при прогнозировании разного рода физических и социальных процессов [1].
Список литературы:
- Васильков А. Распределённые вычисления: как собрать с миру по гигафлопсу на развитие науки [Электронный ресурс]. – Режим доступа: http://www.computerra.ru/46780/raspredelyonnyie-vyichisleniya-kak-sobra/ (дата обращения: 08.05.17)
- Косяков М.С. Введение в распределённые вычисления. – СПб: НИУ ИТМО, 2014. – 155 с.
- Коровски Ю. Как помочь учёным, ничего не делая [Электронный ресурс]. – Режим доступа: http://22century.ru/popular-science-publications/boinc (дата обращения: 17.04.17)
- BOINC STATS [Электронный ресурс]. – Режим доступа: https://boincstats.com/en/stats/projectStatsInfo (дата обращения: 08.05.17)
дипломов
Оставить комментарий