Академик РАН Владимир Бетелин: «Именно экономика должна определять, стоит ли развивать ту или иную технологию»

29.07.2024



 

Так ли всемогущ искусственный интеллект, каким кажется? Что общего между поисковиком Google, цифровым гроссмейстером и известным чат-ботом ChatGPT? Какие важнейшие вопросы необходимо решить в области разработок ИИ в России? Почему заимствование зарубежных программ мешает внедрению нейросетей в промышленность?

О первоочередных задачах в сфере отечественных технологий искусственного интеллекта рассказывает научный руководитель Научно-исследовательского института системных исследований РАН академик Владимир Борисович Бетелин, посвятивший этой теме доклад «Научные проблемы обеспечения суверенитета в области технологий искусственного интеллекта» на заседании президиума РАН 12 марта 2024 года.

1-2 (jpg, 406 Kб)

Владимир Борисович Бетелин — научный руководитель Научно-исследовательского института системных исследований РАН, заведующий кафедрой высокопроизводительных вычислений Московского государственного университета им. М.В. Ломоносова, доктор физико-математических наук, академик. Выдающийся специалист в области информационных технологий и систем автоматизации. Кавалер ордена Александра Невского, ордена Почёта и ордена Дружбы, лауреат государственной премии РФ и премии Правительства РФ в области науки и техники.

— С какими основными проблемами сталкивается разработка собственных технологий искусственного интеллекта в России?

— Я бы хотел начать именно с темы моего доклада. Она звучит так: «Научные проблемы обеспечения суверенитета в области технологий искусственного интеллекта». Итак, рассмотрим, в чём заключаются основные проблемы в этой сфере.

Во-первых, что такое технологии искусственного интеллекта? Это компьютер, а также программа и коммуникационные каналы, но тем не менее в первую очередь — это компьютер. Компьютер конечен. Иными словами, он может обладать очень большим быстродействием и обрабатывать огромное количество битов и байтов информации, но оно на самом деле конечно. Этот момент очень важен. При этом человек в отличие от компьютера может оперировать бесконечными объектами.

Приведу простой пример. Будучи школьником, я выписывал журнал «Юный техник». Когда я был в шестом или седьмом классе, в этом журнале вышла статья, картинку из которой до сих пор помню. На ней было изображено подобие бесконечных счётов: представьте себе бесконечное количество спиц, каждая из которых в обе стороны уходит в бесконечность. А на этих спицах — колесики, и на каждом колесике — весь алфавит от «А» до «Я». И далее — утверждение, согласно которому на этом бесконечном поле есть все произведения, которые написаны до настоящего момента и которые будут когда-либо написаны человечеством. При этом, что важно, если мы ограничим это поле любой большой площадью, то всё исчезнет: задуманного эффекта уже не будет. Эта иллюстрация — пример того, что помещение в компьютер конечной части бесконечного объёма данных приводит к потере сути, смысла этих данных. И сейчас это основная проблема — то, что, когда мы пытаемся решать с помощью конечного компьютера задачи, которые, как говорят математики, бесконечномерны, возникают сложности. О них мы и будем говорить.

Если задачи конечномерные, то есть в некотором смысле конечные, с ними действительно могут более-менее нормально справиться и технологии искусственного интеллекта — и то при определённых условиях. Например, возьмём самый успешный проект в этой области — шахматы, цифровой гроссмейстер. Давайте посмотрим, как он устроен. На самом деле это просто сосредоточенное в компьютере огромное количество партий, которые, что существенно, были сыграны людьми — реальными гроссмейстерами, а не цифровыми. Каждая партия — это упорядоченное множество. Другими словами, в шахматной игре, как говорят у нас в математике, есть некий порядок: доска восемь на восемь клеток, 32 фигуры, а также определённые правила, по которым развивается партия. И далее, что очень важно, на основе множества этих партий просто-напросто создан аналог поисковика Google, только с единственной добавкой, тоже придуманной человеком, — оценкой близости партии к выигрышной. Всё это в целом сейчас и называется успехом искусственного интеллекта в области шахмат. Подчеркну еще раз: за всем этим стоит человек — это партии, сыгранные людьми, а также, говоря математическим языком, метрика, то есть ближайшее расстояние до выигрышной партии. Все это придумали люди. И это конечное множество, которое в компьютер, разумеется, помещается.

Теперь касательно того, что искусственный интеллект обыграл в шахматы всех живых соперников. Сам я шахматист никудышный, но я знаю историю сеанса шахматиста А.А. Алехина, когда тот играл с немецким офицером. Когда партия была для Алехина уже выигрышной, он предложил оппоненту поменяться сторонами, перевернул доску — и снова начал выигрывать. И повторил это несколько раз. Поэтому я сомневаюсь, что искусственный интеллект уже превзошёл людей в игре в шахматы. Понимаете, просто Алехина нет, вот и все — и ничего более. (Улыбается.)

Возвращаясь к принципу работы цифрового гроссмейстера: здесь мы имеем дело именно с конечным, упорядоченным набором данных. Здесь действует математическая теорема Тихонова, которая обосновывает, что в этом случае всё должно быть в порядке.

2-2 (jpg, 332 Kб)

Аналогичным образом действует и ChatGPT, то есть нейросеть GPT устроена примерно по тому же принципу. Она работает с большим количеством текстов, картинок и других данных. Оно огромное, но конечное. И, так же как в случае с цифровым гроссмейстером, кто-то придумал для программы метрику близости ответа нейросети к тому, что спрашивает пользователь. Таким образом, GPT ищет наиболее правильный ответ на запрос, используя эту метрику. То есть, по сути дела, это поисковик. Фактически, все подобные нейросети — это поисковики, в них нет ничего особенного.

Сейчас бывает, что GPT сбивается, когда дает ответы на вопросы. Почему это происходит? Дело в том, что стало много разных тематик. То есть, видимо, для каждой тематики на самом деле нужно иметь свою метрику. Разработчики пытаются сэкономить ресурсы и «накрыть» все запросы одной метрикой — не получается. Эта технология сложнее, чем цифровой гроссмейстер, — в шахматной игре в этом смысле всё однообразно.

Важно отметить: из того, что в одной области использования ИИ были достигнуты успехи, не следует, что, если мы применим эту же технологию к другим объектам (например, к изображениям), здесь будет то же самое. На самом деле, когда американцы делали первую программу по шахматам, они, насколько я знаю, рассчитывали, что потом эту разработку можно будет использовать в медицине и многих других сферах. Но потом оказалось, что это не вполне возможно. Почему? Дело в том, что объект изображения — это бесконечномерный объект. Это не шахматная партия, и вышеупомянутая метрика близости при работе с изображением может, грубо говоря, ошибаться. Иными словами, что вы делаете? Вы неким образом отображаете в компьютер бесконечномерное множество. И из-за конечности компьютера вы на самом деле проецируете не все изображение, а какую-то его часть и при этом что-то теряете. То есть любой конечномерный объект обрабатывается целиком, а бесконечномерный отображается только частично, и человек сам определяет, что при этом возникает в результате, строит пресловутую метрику и пытается решать поставленные задачи.

В своём докладе я упоминал, что в России разработали медицинскую программу AIDA (экспериментальный диагностический ассистент на основе ИИ, призванный помогать терапевтам и врачам общей практики ставить диагноз на основании данных электронной медицинской карты пациента. — прим. авт.). Она обучалась на 30 млн историй болезней, набранных за два года, и в дальнейшем при тестировании дала 87% правильных результатов. Но вы понимаете, что 87% верных диагнозов — это в то же время и 13% неверных. И если мы, например, возьмем 15 млн пациентов в год, 13% от этого числа — это почти 2 млн человек, то есть, на самом деле, немало — при том что, по данным Минздрава, в стране ежегодно совершается около 70 тыс. врачебных ошибок. Таким образом, AIDA ещё надо развиваться и развиваться.

Кроме того — и это важно — в основе AIDA лежит зарубежная архитектура нейросети Transformer. Конечно, она не имеет математического обоснования. И это ещё одна из основных проблем, возникающих при работе с искусственным интеллектом. Математическое обоснование выбора нейросети, правильности её работы, как говорят, устойчивости — это гарантия, что если вы чуть-чуть изменили исходные данные, то у вас будет небольшое изменение и в результате. Если возникает существенное изменение, это и называется ошибкой. Почему у нас этой проблемой занимаются неактивно? Дело в том, что это очень дорогое удовольствие. Написать математическое отображение бесконечномерного пространства в конечномерное со всеми доказательствами устойчивости и сходимости — это очень сложно и очень дорого. Помимо этого, я думаю, что сейчас уже осталось не так много людей, умеющих это делать. Поэтому, естественно, дешевле взять то, что есть. За рубежом уже понаделано очень много нейросетей, их заимствуют и используют. Но при этом, естественно, остаётся некая неопределенность, так как заведомо известно, что правильность работы искусственного интеллекта не подтверждена математически. Тогда и возник тезис о том, что мы не знаем, как работает нейросеть. На самом деле имеется в виду немного другое: нам известно, как она работает, но мы не знаем, когда она ошибётся. В этом заключается одна из ключевых проблем и причин, по которым надо уделять особое внимание математическому обоснованию правильности работы нейросети. Особую остроту вопросу придаёт и то, что, например, та же AIDA уже фактически планируется к внедрению в массовое использование.

В первую очередь, конечно, необходимо провести очень строгое математическое исследование работы искусственного интеллекта. Это дорого, долго и действительно потребует очень больших усилий. Но это необходимо. И, конечно, второе — технологии искусственного интеллекта надо создавать самостоятельно, потому что никакой Transformer здесь не поможет.

Примечательно, что в оценке работы ИИ есть такое понятие, как приемлемые потери. В СССР во времена нашей молодости подобного не было — были, допустим, шесть девяток, восемь девяток надёжности (99,9999% и 99,999999% надёжности. — прим. авт.). В сфере искусственного интеллекта понятие приемлемых потерь существует — вероятно, это связано с возможностями коммерческого использования нейросетей.

Сейчас перед разработчиками поставлена задача по созданию беспилотных автомобилей. На заседании президиума РАН я приводил пример из аналитического доклада В.Н. Княгинина: в 2016 г. Business Insider прогнозировал, что к 2020 г. на планете будут 10 млн беспилотных автомобилей, в 2019 г. Илон Маск тоже прогнозировал, что к 2020 г. будут действовать около 1 млн беспилотных такси. А в реальности мы пока ничего не наблюдаем. Есть, конечно, экспериментальные программы — например, в России существует проект использования беспилотных фур на трассе М11 «Нева» (Москва — Санкт-Петербург). Но беспилотные автомобили — это ещё более сложная технология, чем просто работа с изображением, потому что она требует от программы анализа дороги, окружающего пространства. Я как раз писал статью на эту тему в январе 2021 г., где спрогнозировал, что закончится все очень просто: будет создан центр управления, из которого беспилотные автомобили будут вести по выделенным маршрутам. Может быть, иногда в рекламных целях беспилотники будут где-то ездить свободно, но это только при условии, что будет хорошая погода, не будет дождя и т.д. Таким образом, создание беспилотных автомобилей — это пока задача запредельной сложности для современных разработчиков, потому что эта технология включает не только работу с изображением, но и много других непростых деталей.

Кроме того, я приводил в своем сообщении данные из доклада минпромторговского института, занимающегося прикладным искусственным интеллектом, согласно которым промышленность тоже не очень активно использует нейросети. Отмечается, что в этой сфере ожидания от ИИ завышены в сравнении с его реальными возможностями. Но мне представляется, что наиболее важный момент заключается именно в том, что нейросети ненадёжны. В промышленном производстве подобное невозможно. Я это понимаю, потому что много лет сотрудничал с ЗИЛом и знаю, что такое серийное производство. В этой области ненадёжная технология сразу отметается. Таким образом, ИИ не получается успешно внедрять в промышленность именно потому, что применяются импортные нейросети, в которых вопросы надёжности не решаются. Поэтому, если мы действительно хотим, чтобы эти технологии использовались в производстве — а они вполне могут использоваться, у них есть для этого потенциал — нужно создавать собственные разработки в области искусственного интеллекта. Именно это и есть центральный вопрос, который я поднимал в докладе. Сейчас необходимо выстроить собственные программы работ в этой сфере. Во-первых, нужно озаботиться математическим обеспечением. Во-вторых, нужно заниматься не ИИ вообще, а выделить для разработчиков перечень конкретных задач — например, под руководством федеральных органов исполнительной власти. Допустим, для промышленных отраслей определить конкретные задачи ИИ в области производства, и уже под них разрабатывать нейросети. Таким образом, универсальных решений здесь не будет.

Что при этом важно и чего сейчас пока нет — должно быть экономическое обоснование применения искусственного интеллекта. Если мы заменяем человека на ИИ, мы должны понимать, какую это даст экономию. И в уже упомянутом мной отчете минпромторговского института как раз говорится, что именно экономический эффект от использования ИИ очень трудно посчитать — по крайней мере на данный момент. Но тогда, естественно, возникает вопрос: зачем же разрабатывать эти технологии, если мы не можем понять, какую они принесут выгоду? Поэтому нужны постановка конкретных задач, а также чёткое понимание и экономическое обоснование того, что если мы применим ИИ в какой-либо сфере, то действительно получим определённую экономию. Далее, соответственно, потребуется составить план работ по решению поставленной задачи — созданию необходимой системы.

— В своем докладе вы подчеркнули, что пока в разработке искусственного интеллекта в стране заинтересованы только небольшие компании. Почему к созданию «умных» программ не проявляют большой интерес крупные и государственные компании? С вашей точки зрения, можно ли как-то изменить эту ситуацию?

— В некотором смысле это «лакмусовая бумажка», по которой можно определить, что эти технологии ещё не готовы для того, чтобы ими заинтересовались крупные компании. Почти 40 лет назад, когда мы на ЗИЛе начали заниматься созданием систем автоматизации проектирования автомобиля, потребовалось определённое время, чтобы корпус технологов и конструкторов осознал, что это новшество действительно необходимо и даёт им новые возможности. Полагаю, что именно этого сейчас не хватает, то есть нет реальных примеров, которые бы безоговорочно подтверждали, что если крупная промышленная компания начнет работать с искусственным интеллектом, то это даст ей ту или иную выгоду. Помимо этого, сейчас основная проблема и основной критерий для акционерных компаний — прибыль. Так вот, представьте, насколько должна увеличиться прибыль, чтобы предприятиям было выгодно взяться за технологии искусственного интеллекта?

Сейчас действительно принято решение о том, что к разработке ИИ надо привлекать крупные корпорации. Ресурсы и задачи у них в сравнении с мелкими компаниями совершенно другие. И эти крупные компании тогда должны определить, решение каких значимых для них задач на основе технологий ИИ даст желаемый экономический эффект. Именно это важно.

У малых компаний в этом смысле другие критерии: они могут что-то сделать, но их возможности ограничены. Дело в том, что существуют определённые соотношения количества произведённой продукции. Условно говоря, в рамках НИР (научно-исследовательской работы) изготавливается экспериментальный образец в единичных экземплярах по экспериментальной технологии, в ходе ОКР (опытно-конструкторской работы) создаются установочная партия и технология создания опытных образцов, и затем на этой основе создается серийная технология производства серийных изделий. При этом соотношение затрат на создание экспериментального, опытного и серийного образцов и технологий их производства составляет 1 : 10 : 100. Таким образом, возрастают затраты на то, чтобы сделать надёжный и сочетающий все необходимые качества образец, который может быть использован всеми заинтересованными лицами. Соответствующее производство требует больших вложений. Малые компании точно не смогут это сделать, на такое способны только крупные предприятия, обладающие подобным опытом.

Говоря о стратегии государства: как мне представляется, сейчас уже нужно заниматься не только отдельными технологиями, но и решением с их помощью конкретных экономически эффективных задач. Это главный вопрос. И тогда уже сложно или не сложно, дорого или не дорого, будет определяться именно вкладом проекта в достижение глобальной экономической задачи страны. Потому что на самом деле именно экономика должна определять, стоит ли развивать ту или иную технологию. Научные исследования, конечно, надо вести, но вести именно так, чтобы потом их результаты можно было использовать в практических задачах.

Известный математик академик Пафнутий Львович Чебышёв говорил следующее: «Сближение теории с практикой дает самые благотворные результаты…» Все основные результаты его работы были связаны с решением практических задач. Поэтому надо следовать традициям нашей русской науки и инженерии. И в этом смысле в первую очередь следует говорить не об отдельных разрозненных задачах, а о проблемах, которые нужно решать с помощью технологий искусственного интеллекта. И в основании должно быть только одно — экономика.

Текст: Анастасия Жукова.
Источник: «Научная Россия».

 

©РАН 2024