КАРТА ПРАВДУ ГОВОРИТ? БАЗА ДАННЫХ РОССИЙСКОЙ НАУКИ ВСЕ БЛИЖЕ К РЕАЛЬНОСТИ.
06.03.2015
Источник: Поиск,
Андрей Субботин
Государственная публичная научно-техническая библиотека России (ГПНТБ) вместе с Министерством образования и науки РФ провела семинар, на котором были представлены современные системы поддержки научной и образовательной деятельности. Значительное внимание было уделено информационно-аналитической системе “Карта российской науки”. Операторами этого проекта являются ФГАНУ “Центр информационных технологий и систем органов исполнительной власти” (ЦИТиС) и ГПНТБ.
Проект “Карта российской науки” стартовал в декабре 2012 года, спустя полгода после того, как новый министр образования и науки Дмитрий Ливанов заявил о намерении его ведомства провести всесторонний аудит сектора исследований и разработок, включая институты РАН, государственные научные организации и высшие учебные заведения.
Победу в конкурсе на исполнение госзаказа одержала частная консалтинговая и аудиторская компания “РriсеwатеrноusеСоореrs Russiа В.V.”, заявившая о намерении выполнить проект в течение 90 дней за 90 млн рублей. Решение выбрать PwC в качестве исполнителя объяснялось желанием заказчика в лице Минобрнауки провести “аудит российской науки” силами внешней организации, никак не связанной с научной средой. Для реализации проекта PwC потратила 40 млн рублей на покупку данных базы Web of Science (WoS) у Thomson Reuters и 15 млн рублей - на развертывание технической инфраструктуры.
ИАС “Карта российской науки” замышлялась как “основа для принятия информированных управленческих решений в сфере научно-исследовательской деятельности ученых и организаций”. Проект ставил своей целью “инвентаризацию” текущего состояния российской науки, получение быстрого доступа к отражающим его корректным показателям и создание аналитического инструментария для принятия обоснованных управленческих решений. Он также должен выявить наиболее авторитетных экспертов и научные коллективы для их адресной поддержки государством и способствовать сравнению уровня развития науки в России с другими странами и выявлению точек роста.
Однако выборочное тестирование системы представителями разных научных дисциплин (математика, физика, химия, география, языкознание, психология) показало, что в существующем виде разработанная информационная система не только не дает представления о положении дел в российской науке, но вводит пользователя в заблуждение и выглядит как продукт, произведенный людьми, некомпетентными в этой области. И сегодня при открытии страницы КРН мы видим баннер “Внимание! Система находится в опытной эксплуатации”.
База данных “Карта российской науки”, созданная под эгидой Минобрнауки, никак не будет использоваться для оценки и мониторинга научных организаций, заявлял в декабре 2013 года глава Департамента науки и технологий Минобрнауки Сергей Салихов. А замминистра Людмила Огородова подчеркнула, что “Карта” еще не готова к использованию. “Это макет, это даже не пилотный проект”, - сказала она.
Открывая семинар, первый заместитель генерального директора по научной работе и информатизации ГПНТБ Борис Маршак (на снимке) напомнил, что на начало декабря 2014 года в проекте было зарегистрировано 337 научных организаций, 10 536 ученых. В ИАС “Карта российской науки” собрано 2 702 998 записей научных публикаций, патентов, материалов конференций, монографий российских ученых.
Советник гендиректора по участию ГПНТБ в государственных федеральных целевых программах Василий Мукасьян подробно описал структуру КРН, которая представляет собой сводный каталог результатов научной деятельности российских ученых и содержит в себе все возможные артефакты, порождаемые отечественной наукой. Мукасьян представил основные источники данных для проекта.
Данные в ИАС поступают из Web of Science: статьи, патенты, материалы конференций (теперь в базе 224 771 статья WoS), от базы данных “Российский индекс научного цитирования”, которая содержит в себе большинство статей из российских изданий (2 486 930 записей за период 2007-2013 годов), от Книжной палаты и ГПНТБ, ¬ЦИТиС - данные каталога НИОКР (58 509 записей за период 2007-2012 годов), ФИПС - патенты (206 383 записи за период 2007-2013 годов). В марте должны добавиться данные Scopus.
По утверждению Василия Мукасьяна, в связи с претензиями отечественных ученых проверена база данных и проведена ручная выверка организаций Web of Science, продолжается загрузка данных Scopus за 2007-2014 годы, сейчас идет выверка организаций (загружено 47 285 уникальных названий организаций), дорабатываются механизмы слияния данных ученых и статей. Василий Александрович особо подчеркнул, что “Карта российской науки” - транзакционная система, она сохраняет всю последовательность изменений, вносимых в базу данных как операторами, так и пользователями.
Ирина Михайленко, заведующая отделом поддержки и развития проекта “Карта российской науки” ГПНТБ, посвятила свое выступление практическому инструментарию управления исследователями собственной научной деятельностью. Она рассказала о регистрации пользователей в системе КРН. Так, в период с января 2014 года по февраль 2015-го в системе зарегистрировались 31 683 пользователя, из них 10 215 - пользователи-ученые. Интересно, что 68 процентов пользователей - представители образования, бизнеса, СМИ и властных органов, отметила она.
Ирина Владимировна рассказала о практике объединения списка научных публикаций в информационно-аналитической системе, поступающих из различных источников. КРН открыта для доступа онлайн любым категориям пользователей. Там можно самому подтвердить свое авторство, причем допустима бесплатная корректировка сведений о публикациях (в рамках лицензированных возможностей ГПНТБ). Запросы на корректировку данных в системе КРН в основном связаны с подтверждением или опровержением принадлежности публикаций, это также жалобы на отсутствие в системе публикаций, которые присутствуют в РИНЦ или Web of Science, по поводу смешения понятий аффилиации и места работы, состава данных о НИОКР.
В перерыве между заседаниями семинара корреспондент “Поиска” побеседовал с Ириной Михайленко и Василием Мукасьяном.
- Ирина Владимировна, кого вы позвали на семинар?
- В первую очередь, это - представители учреждений образования и науки Москвы и Московской области, организаций, зарегистрированных в “Карте российской науки”. Сегодня на семинаре присутствуют представители Института молекулярной биологии им. В.А.Энгельгардта РАН, Российского национального исследовательского медицинского университета им. Н.И.Пирогова, Института физики Земли им. О.Ю.Шмидта РАН, Финансового университета при Правительстве РФ, многих других научных и учебных заведений. Мы планируем большую пресс-конференция в Новосибирске и Томске, и этот семинар для нас - своего рода анонс той информации, которую мы там представим.
- Василий Александрович, сохранение всех транзакций в БД требует большого объема хранения информации?
- Объем изменений не столь значителен. Сейчас суммарный объем базы данных составляет около терабайта. Это не проблема для нас. Вот, готовимся загружать Scopus, а это - 80 миллионов записей! Естественно, вся информация где-то хранится: у нас по договору с Минобрнауки есть data-центр в ЦИТиС, который предоставляет мощности и услуги по защите информации, администрирует, проводит сертификации системы.
- Сегодня база данных КРН начинается с 2008 года. Пойдете назад в прошлое?
- Нет. Вернее так, мы можем это сделать по Scopus, поскольку в этом случае у нас такая информация есть. По остальным источникам, думаю, нет желания у Минобрнауки. Министерству интересно исключительно текущее состояние дел. Фактически эта система показывает, что творится здесь и сейчас. Если ученый сегодня ничего не пишет и не делает, имей он хоть тысячи заслуг и публикаций в прошлые годы, сегодня для науки он не интересен.
Основная задача - показать текущее состояние с научными публикациями российских ученых. Для этого в системе создана “Тепловая карта”, которая показывает актуальную публикационную активность: в каких регионах и областях России на данный момент появляется больше всего статей, кому идут гранты и по каким направлениям. Карта также дает возможность сопоставить наши показатели с мировыми.
- Напряженная политическая ситуация в мире может повлиять на “Карту российской науки”?
- У нас прекрасные отношения со всеми текущими контрагентами. Если вы имеете в виду замену источников информации, то тогда придется переделать половину государственной машины, поскольку в том же Минобрнауки половина показателей по половине программ завязана на службу Web of Science.
- Какие перспективы КРН?
- Хорошие. Сегодня КРН имеет порядка 1200 уникальных (с разных IP-адресов) посетителей в день. Интерфейс системы постоянно обновляется в соответствии с необходимостью и пожеланиями пользователей. В марте 2015 года он снова будет обновлен.