И вширь, и ввысь
28.10.2011
Источник: Поиск,
Надежда Волчкова
О сегодняшнем дне и перспективах развития информационно-коммуникационных технологий в НИЦ «Курчатовский институт» - заместитель директора Национального исследовательского центра Василий ВЕЛИХОВ
Сегодня практически все исследовательские структуры имеют в своем составе информационно-компьютерные центры, отвечающие за создание и развитие единой информсистемы организации, разработку необходимого программного обеспечения, настройку внутренних сетей, установление телекоммуникационной связи с внешним миром. Понятно, что уровень ИТ-сопровождения напрямую зависит от масштабов деятельности организации и задач, которые перед ней стоят.
В Национальном исследовательском центре «Курчатовский институт», который ведет междисциплинарные фундаментальные и прикладные исследования, имеет в своей структуре мегаустановки мирового класса, участвует в крупных международных проектах, информационный комплекс - это и своеобразный «обруч», объединяющий все направления, и самостоятельный блок обширной программы развития центра. Поскольку Курчатовский институт диктует тренды не только в науке, но и в компьютинге, многим наверняка будет интересно узнать, куда направлен вектор этого движения.
О сегодняшнем дне и перспективах развития информационно-коммуникационных технологий в НИЦ «Курчатовский институт» рассказывает заместитель директора Национального исследовательского центра Василий ВЕЛИХОВ.
- Василий Евгеньевич, какое место занимает информационный блок в структуре института, и как он устроен?
- Научный информационный блок является подразделением Курчатовского Центра конвергентных нано-, био-, инфо-, когнитивных наук и технологий. Основная задача НБИК-центра - создание природоподобных технических систем с использованием атомно-молекулярного конструирования на основе самоорганизации частиц. Это возможно только при условии конвергенции наук и технологий. И здесь информационные технологии играют особую роль, поскольку они по сути своей являются междисциплинарными, интегрирующими. Без них созданная с использованием самых совершенных нано-, био-, когнитивных составляющих структура не сможет работать эффективно. Ведь, как известно, в живом организме процессы преобразования энергии и информации неразделимы.
В соответствии с таким пониманием значения инфокоммуникационных технологий для решения поставленных перед НБИК-центром задач сформирована структура нашего научного информационного блока. Он состоит из двух научно-технических комплексов - технологического вычислительного и информационного научно-технического. Первый занимается сопровождением и развитием научной информационно-коммуникационной инфраструктуры, включая инженерную. Второй работает над проектами в области предсказательного моделирования и проектирования для научных и технологических направлений, развиваемых в НБИК-центре. Он, в частности, занимается обработкой и анализом больших массивов данных, созданием проблемно-ориентированных сред, адаптацией облачных технологий для обеспечения удаленного доступа ученых к уникальному оборудованию, имеющемуся в Курчатовском институте и у наших партнеров. Оба эти подразделения тесно взаимодействуют со всеми научно-техническими блоками института.
Хочу отметить, что в НБИК- Центре созданы беспрецедентные исследовательские и технологические возможности. Основой его развития стал модернизированный Курчатовский источник синхротронного излучения, затем был создан центр обработки и хранения данных на основе Курчатовского суперкомпьютера. Сегодня у нас действует также медико-биологический комплекс, включающий в себя белковую фабрику, генно-инженерное и иммунологическое подразделения, лаборатории иммунологии и стволовых клеток. Междисциплинарный характер центра позволяет осуществить синергетическую интеграцию четырех прорывных технологий - в нано-, био-, инфо- и когнитивной областях. Приведу только один пример, позволяющий понять, как работает эта система. На белковой фабрике можно выделить практически любое биоорганическое вещество, превратить его в кристалл, чтобы с помощью синхротрона расшифровать структуру белка, рассчитать ее на суперкомпьютере и использовать для создания гибридных материалов, а затем и для воспроизведения процессов, проходящих в живой природе.
- Какими информационно-вычислительными ресурсами обладает Курчатовский институт?
- На территории нашего института находятся два центра обработки данных. Один дата-центр, в котором работает кластер мощностью 35 терафлопс, мы модернизировали в 2007 году. Второй размещен в только что реконструированных корпусах. Такие характеристики его инженерной инфраструктуры, как обеспеченность энергетикой, надежность, доступность, позволяют нам создавать на его базе самые современные суперкомпьютерные и грид-системы, а также сверхбольшие хранилища данных. Здесь эксплуатируется кластер производительностью 120 терафлопс.
Информационные технологии в Курчатовском институте развиваются в двух основных направлениях. Первое из них – высокопроизводительные вычисления. Они в основном обеспечивают решение задач, связанных с моделированием и инженерными расчетами. Работы всех подразделений поддерживаются единой платформой, которая объединяет технологическую базу нашего центра. Поскольку речь идет о конструировании и моделировании систем наноуровня, плотность получаемой учеными информации колоссальна. Для ее хранения и обработки используются суперкомпьютеры, представляющие собой сильно связанные кластеры, которые объединены системной сетью InfiniBand.
Второе важное направление нашей работы - вычисления с высокой пропускной способностью на базе грид- технологий, нацеленные на обработку и анализ данных с мегаустановок. В настоящее время к нам поступают огромные массивы информации (петабайты в год) по экспериментам, выполняющимся на Большом адронном коллайдере (БАК). В дальнейшем планируется вести обработку данных других международных экспериментов - XFEL, FAIR, ITER. Для решения этих задач мы используем слабо связанные кластеры, петабайтные массивы хранения данных и программное обеспечение промежуточного уровня грид.
- Наверняка вы намечаете какие-то горизонты в развитии каждого из указанных направлений. Расскажите о программах по совершенствованию инфраструктуры информационного блока института.
- К 2013 году в рамках ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России» на 2007-2013 годы мы совместно с Объединенным институтом ядерных исследованием в Дубне должны создать специализированные дата-центры для первичного хранения и обработки данных, получаемых на БАК. Это будут первые российские центры уровня Tier-1, входящие в грид-систему ЦЕРН.
Расширяем мы и свои суперкомпьютерные возможности: добавляем вычислительные комплексы на базе графических ускорителей, системы с большой оперативной памятью, увязываем их с петабайтным параллельным хранилищем данных, устанавливаем новые пакеты программного обеспечения.
- Что ваша команда делает лучше других в информационной сфере?
- Главная наша задача не выигрывать некие «спортивные» соревнования, а обеспечивать высокий уровень ИТ-сопровождения работы своих научных и инженерных коллективов. Их деятельность связана с анализом больших массивов данных, сложными расчетами, моделированием и визуализацией. Поэтому мы постоянно наращиваем скорости обмена информацией между различными системами. В глобальных инфокоммуникационных инфраструктурах чрезвычайно сложной проблемой является обеспечение информационной безопасности. И здесь нашим специалистам есть чем гордиться. (Об успешном отражении экспертами по безопасности Курчатовского института модельной вирусной атаки на грид-систему БАК рассказано в материале «Не на тех напали». – Прим. ред.).
Для нас важнейшей метрикой является не пиковая производительность комплекса на тестовых примерах, а то время, за которое можно от начала до конца запрограммировать и просчитать научную или инженерную задачу и проанализировать полученные результаты. Так что к экзабайтам и петабитам мы придем значительно раньше, чем к экзафлопам.
- Но и к экзафлопам вы тоже последовательно движетесь. Насколько мне известно, один из суперкомпьютеров Курчатовского института входит в тройку самых мощных в СНГ и первую сотню мирового рейтинга…
- К концу года суммарная мощность компьютеров НИЦ составит 300 терафлопс. Но мы не боремся за место в списке Тор500. Модернизируем свои кластеры не «в высоту», а в «ширину». Дело в том, что для решения большинства наших задач одновременно могут эффективно использоваться не более 10 тысяч ядер. Поэтому гнаться за рекордами в области быстродействия нам на нынешнем этапе нет смысла. Более эффективным представляется совершенствование программного обеспечения, в частности распараллеливание алгоритмов. И мы достаточно успешно работаем в этом направлении в составе большой международной команды, в которую входят ведущие Европейские суперкомпьютерные центры и промышленные фирмы, например крупнейшая нефтяная компания TOTAL. Целью нашего совместного проекта APOS-EU (Application Performance Optimisation and Scalability-Europe) является более продуктивное использование суперкомпьютеров нового поколения в науке и промышленности. Этот проект финансируется в рамках 7-й Рамочной программы Евросоюза и осуществляется параллельно с партнерским российским проектом APOS-RU, который поддерживает Минобрнауки РФ. Участники создаваемых коллабораций занимаются разработкой и совершенствованием программного обеспечения для таких стратегически важных областей, как сейсмическое моделирование, расчет залежей нефти и газа, вычислительная гидродинамика, термоядерная энергетика и молекулярная динамика.
- Как строится взаимодействие информационного комплекса с другими подразделениями Курчатовского института?
- Мы стараемся выстроить ИT- инфраструктуру, которая максимально полно удовлетворяла бы потребности ученых. Поэтому она достаточно гетерогенна - состоит из большого числа разнообразных комплексов. Включаясь в очередной проект, стремимся изначально учесть и даже где-то предугадать, куда он будет развиваться, чтобы переделок в дальнейшем было как можно меньше. Дело в том, что модернизация программного обеспечения – процесс длительный и трудоемкий. Чем сложнее программный код, чем дольше он разрабатывался, тем труднее переносить его на новые технологические платформы.
- Какие крупные совместные проекты вы сегодня реализуете?
- В этом году мы в кооперации с НИИ ядерной физики им. Д.В.Скобельцына МГУ, Петербургским институтом ядерных исследований и Объединенным институтом ядерных исследований закончили разработку промежуточного программного обеспечения для распределенных суперкомпьютерных вычислений в наноиндустрии с использованием грид-технологий. Сейчас занимаемся адаптацией к этому программному комплексу пакетов, связанных с инженерными расчетами и проектированием, а также вычислительным материаловедением.
Скоро приступим к созданию аналогичного комплекса для геолого-геофизического моделирования и анализа данных. Основная задача здесь – разработать проблемно-ориентированные среды, которые были бы удобны для пользователей. Они должны включать пакеты программ и необходимые сервисы, позволяющие организовывать коллективную работу, управлять рабочими потоками, вести обработку первичных данных, анализ и визуализацию результатов, хранить информацию.
- При формировании Национального исследовательского центра «Курчатовский институт» в него влились Институт теоретической и экспериментальной физики, Петербургский институт ядерной физики, Институт физики высоких энергий. Объединены ли информационные ресурсы этих организаций?
- В перечисленных институтах есть свои группы, занимающиеся высокопроизводительными вычислениями и грид-технологиями, и мы активно взаимодействуем. Задолго до создания НИЦ мы вместе работали, например, в проекте EGEE (Enabling Grids for E-sciencE), направленном на построение грид-инфраструктуры, которая используется для научных исследований в Европе. Все наши организации включены в единую грид-систему, созданную для анализа и моделирования данных экспериментов, проводимых на БАК.
Надо сказать, что мы вообще работаем распределенными командами. Только собственными силами сегодня не обойдешься. Для решения конкретных задач кооперируемся с российскими и зарубежными партнерами.
- Сложно работать в коллективе, который разбросан по всему миру?
- Может, это и не самый удобный вариант, но по-другому не бывает: в наше время большие научные проекты почти всегда делаются в таком формате. Активно используем возможности видеоконференций.
- Много ли в вашем информационном комплексе работает молодых специалистов? Как вы удерживаете молодежь? Наверняка, повысив свой уровень, востребованные во всех сферах «айтишники» начинают глядеть на сторону…
- Во всем мире специалистам в области ИT приходится делать выбор между работой в академическом и коммерческом секторах, зарплаты в которых сильно разнятся. Так что наши проблемы не уникальны. Но Курчатовский институт не может пожаловаться на недостаток молодежи, поскольку активно занимается привлечением талантливых ребят. Наш директор Михаил Валентинович Ковальчук - декан НБИК-факультета в МФТИ. Научно-образовательные центры и базовые кафедры Курчатовского института действуют в МГУ, МИФИ, МГТУ им. Н.Э.Баумана. Подготовить специалистов, способных работать на необходимом нам уровне, непросто: с ребятами приходится плотно заниматься несколько лет. Чтобы удержать молодежь, стараемся обеспечить ей достойную зарплату за счет участия в контрактах. Очень важно и то, что наши сотрудники приобретают такую высокую квалификацию, что отечественный бизнес не в состоянии востребовать все их возможности. А в Курчатовском институте они могут в полной мере реализовать свой потенциал…
- Значит, кадровая проблема не является для вас острой? А что сильно мешает развиваться?
- В информационно-коммуникационной сфере основные сложности связаны с тем, что у инженерных, программных и научных разработок разное время жизни и не всегда удается максимально эффективно их состыковывать. Например, когда наш информационный блок в полной мере подключится к работе по международным мегапроектам, для каждого из них будет необходимо сформировать отдельный вычислительный комплекс. Потребуются огромные компьютерные мощности и, соответственно, большие площади.
К счастью, уже сегодня видно, что развитие информационных технологий будет идти не только по пути наращивания числа процессоров. Международные команды реализуют серьезные проекты по экзафлопным вычислениям, в рамках которых создаются основы принципиально новой компьютерной архитектуры.
Мы ожидаем революционных изменений и со стороны нейроинформатики. Глобально речь идет о новых системах обработки информации и принятия решений, которые были бы адекватны продолжающейся миниатюризации объектов исследования. Существующие информационные технологии пока такого соответствия не обеспечивают. Добиться желаемого эффекта можно, только идя «снизу», с уровня атомов, складывая из них, как из кубиков, материалы и системы с заданными свойствами. Движение по этому пути, переход к нанотехнологиям, атомарному конструированию в сочетании с достижениями молекулярной биологии, биоинженерии, генной инженерии дают важнейший результат - резкое качественное уменьшение энерго- и ресурсоемкости систем.
Понятно, что для информационного обеспечения бионических комплексов необходимы нестандартные ИТ-решения. Разработка информационного сопровождения такого уровня - фундаментальная исследовательская задача, требующая привлечения когнитивных технологий, замены алгоритмической базы. Вообще говоря, на этот путь ученые вступили, как только стало ясно, что одним наращиванием мощности компьютеров всех проблем не решить. Начались исследования, связанные с многоядерными процессорами и параллельными вычислениями. Применяемые при разработке этих направлений подходы, по сути, являются прямым копированием процессов, происходящих в человеческом мозге, который способен мгновенно решать мультифакторные задачи и генерировать принципиально новые идеи.
Возможно, компьютеры и сети, основанные на тех же принципах, что и нейронная система человека, а значит, близкие к ней по размеру, энергоэффективности и вычислительной мощности, появятся уже при нашей жизни. По крайней мере, ученые Курчатовского института активно и успешно работают в этом направлении.