【Финансовый анализ】DeepSeek преодолевает осаду Вычислительная мощность искусственного интеллекта: наступление "точки перегиба" для банковской отрасли?

Недавно состоялся салон под названием «Как DeepSeek меняет правила игры в области искусственного интеллекта? Высокий порог AGI исчезает?», организованный совместно новым интернет-банком и Университетом юго-западной экономики и управления. Заместитель председателя нового интернет-банка Ли Сюшэн, директор отделения вычислительной финансовой науки Университета юго-западной экономики и управления Ван Цзунь и ответственный за научные исследования по риску нового интернет-банка Вэй Хао обсудили техническую тайну DeepSeek и перспективы его применения в банковской отрасли.

Как развиваются открытый и закрытый исходный код?

Когда сотрудничество между OpenAI и Microsoft вызвало споры о "экологическом монополизме", а Nvidia столкнулась с самым строгим в истории США контролем над экспортом чипов искусственного интеллекта, стратегия открытого исходного кода DeepSeek неожиданно открыла другую дверь. DeepSeek, в отличие от традиционных закрытых моделей искусственного интеллекта, позволяет компаниям использовать более продвинутые крупномасштабные модели по более низкой стоимости, что повышает способности интеллектуальных помощников в различных сценариях.

В программной индустрии существуют две модели: открытая и закрытая, обе имеют успешные примеры. На примере Linux и Android Ли Сюшэн показывает, что эти два являются представителями открытого программного обеспечения и значительно способствуют развитию операционных систем. Он также отмечает, что Apple, как образец закрытой модели, всегда занимает лидирующее положение в области приложений для высококлассных смартфонов. Несмотря на различия в подходе, обе компании достигли значительных успехов.

“С точки зрения привлечения вкладов со всего мира, лично я больше склоняюсь к открытой модели, потому что она способствует объединению мудрости и усилий большего числа людей для совместного продвижения технологического прогресса и инноваций. В будущем открытая и закрытая модели могут продолжать параллельное развитие, но потенциал открытого исходного кода заслуживает ожидания”, - так выразился Li Xiusheng.

Ван Цзунцзэ считает, что открытый и закрытый исходный код взаимодополняющие и конкурирующие друг с другом. Открытые технологии общедоступны, что способствует привлечению большого числа разработчиков и стимулирует быструю технологическую итерацию, но их прибыльность и коммерческая модель неопределены. Закрытый исходный код, напротив, уделяет внимание созданию собственных барьеров и порогов, требует больших инвестиций, обладает уникальной, но менее разнообразной коммерческой моделью. У каждого из них есть свои преимущества и недостатки, поэтому на практике возможно взаимное взаимодействие, слияние и формирование конкурентной ситуации в некоторых областях.

С точки зрения субъектов рынка, DeepSeek, как открытая, недорогая и эффективная крупная модель, оказывает значительное воздействие на ведущие технологические компании на рынке. «Для таких компаний, как OpenAI, занимающихся закрытыми крупными моделями, ценовая стратегия DeepSeek вынуждает их пересмотреть бизнес-модель и направление оптимизации технологий. А для компаний-производителей чипов, таких как NVIDIA, выпуск DeepSeek доказывает, что для проведения высококлассного рассуждения не обязательно полагаться только на высокопроизводительные графические процессоры, что заставляет такие компании задуматься, как следует изменить логику инвестирования в AI-инфраструктуру и модель развития». - признался Ван Цзунь.

Однако стоит отметить, что универсальные модели искусственного интеллекта сталкиваются с вызовами в решении проблем цифрового управления рисками. Вэй Хао отметил, что "хотя у больших моделей есть широкие возможности, такие как понимание проблем, выполнение математических операций и генерация кода и т. д., в области управления рисками их производительность оставляет желать лучшего". Причина заключается в том, что обучение больших моделей в основном зависит от общедоступных данных и кода в Интернете, отсутствует специальный корпус данных для обучения в области управления рисками, поэтому их логика может не полностью соответствовать фактическим потребностям в области управления рисками.

Небольшие банки выходят на передний план благодаря DeepSeek?

По данным исследования, проведенного Чжэшан Цзиньцзюань, весь процесс обучения DeepSeek-V3 занял менее 2800000 часов GPU (графический процессор), в то время как время обучения Llama3-405B, выпущенного Meta (компания-гигант интернета в США), составило 30800000 часов GPU. Стоимость обучения DeepSeek-V3 составила около 5576000 долларов США, в то время как стоимость обучения языковой модели GPT-4 для чат-бота ChatGPT, выпущенной OpenAI (центр исследований по искусственному интеллекту в США), достигла нескольких миллионов долларов США.

По сравнению с традиционными крупными моделями, требующими инвестиции в размере десятков миллионов или даже миллиардов, затраты на локализацию и развертывание DeepSeek могут быть менее миллиона юаней. По последним данным Министерства промышленности и информационных технологий, три базовых телекоммуникационных предприятия уже полностью подключились к открытым крупным моделям DeepSeek. В настоящее время в финансовой сфере многие учреждения, начиная от банков, фондов и заканчивая ценными бумагами, активно разворачивают DeepSeek. С мая 2024 года новый интернет-банк уже применяет крупные модели DeepSeek в сценариях разработки систем, создав устройства для вопросов и ответов на основе исследований и помощников по продолжению кода, сократив время, затраченное сотрудниками первой линии на поиск технической информации в процессе разработки.

Ли Сюшэн считает, что появление DeepSeek в области искусственного интеллекта привело к двум основным изменениям в концепциях. Во-первых, появление DeepSeek разрушило убеждение в том, что 'большая мощность порождает чудеса', то есть больше не следует слепо стремиться к экстремальной вычислительной мощности. Раньше люди часто считали, что только накопление огромной вычислительной мощности может привести к прорыву, но DeepSeek доказал, что можно добиться высокой производительности при более низкой вычислительной мощности путем оптимизации алгоритмов и моделей. Во-вторых, DeepSeek дополнительно усугубил спор между открытым и закрытым исходным кодом. OpenAI популяризировала концепцию больших моделей с помощью ChatGPT, но ее стратегия закрытого исходного кода ограничивает распространение технологии. В то время как появление открытых моделей, таких как DeepSeek, снизило порог технического вхождения, позволяя более широкому кругу организаций применять большие модели. Эти изменения оказали глубокое воздействие на отрасль банковского дела и другие финансовые учреждения.

"Для будущего, по мере продвижения технологий и дальнейшего снижения затрат, крупные модели больше не будут роскошью только крупных банков, а смогут широко применяться в малых и средних финансовых учреждениях. Это приведет к важным технологическим тенденциям в коммерческих банках, стимулируя их развитие более интеллектуальным и эффективным образом". сказал Ли Сюшэн.

В области цифрового управления рисками в банковской сфере широкие перспективы применения имеют технологии крупных моделей, такие как DeepSeek. По словам Вэй Хао, выпуск DeepSeek вызвал огромный энтузиазм среди специалистов в области технологий, поскольку он способен конкурировать с передовыми моделями рассуждения OpenAI, при этом веса открыты, лицензии гибкие, и его можно использовать локально и контролировать.

Вэй Хао поделился своими впечатлениями от практического использования: «При работе с неструктурированными данными модели большого масштаба, такие как DeepSeek, могут улучшить понимание семантики и обработку текста, позволяя нам извлекать информацию из более широкого круга данных. Кроме того, технологии общих интеллектуальных моделей также могут быть использованы моделями управления рисками для повышения точности оценки клиентов и принятия лучших решений».

Вэй Хао отметил, что DeepSeek R1 обладает способностью глубокого мышления, которая может улучшить способность понимания намерений и семантики через обучение по цепочке мышления. Эта способность не ограничивается только китайским языком и также проявляет себя великолепно при работе с длинным контекстом и сложными намерениями.

Банковская отрасль, как отрасль с высоким уровнем информатизации, неоднократно претерпевала крупные изменения в компьютерных системах. От замены ручных операций на компьютерные системы до появления мобильного интернета, банки постоянно трансформируют свои бизнес-процессы. Сегодня, с быстрым развитием искусственного интеллекта, банки сталкиваются с вызовами и возможностями четвертой волны эволюции информационных систем. В эпоху больших моделей как банки должны строить свою способность к использованию интеллектуальных технологий, соответствующих их потребностям?

Ли Сюшэн считает, что наступление эпохи больших моделей требует, чтобы банки, с точки зрения полного использования искусственного интеллекта, размышляли о том, как перестроить управление и процессы банка. Сначала банки должны обдумать, как построить приложения, затем подумать организации данных, улучшении качества данных, разметке и использовании внешних данных. В целом коммерческим банкам нужно думать стратегически, учитывая множество факторов, таких как вычислительная мощность, данные, алгоритмы и приложения.

По его словам, с момента своего основания новый интернет-банк полностью использовал технологии искусственного интеллекта в области противодействия мошенничеству и управления кредитными рисками, что позволило обеспечить эффективную и масштабную обработку кредитования. Однако с появлением больших моделей банк начал рассматривать возможность исследования и испытаний в более широких областях. В настоящее время новый интернет-банк уже применяет большие модели в сфере обслуживания клиентов, успешно заменяя часть ручного обслуживания, а также проводит испытания применения больших моделей в области маркетинга и управления после выдачи кредита.

Помимо банковской сферы, Ван Цзунь прогнозирует значительное улучшение в различных областях, связанных с применением больших моделей искусственного интеллекта, таких как производство, прогнозирование климатических рисков, информационные технологии, образование, медиа и развлечения. Ван Цзунь отмечает, что "в сфере производства большие модели могут отслеживать надежность деталей или аккумуляторов, предсказывать их срок службы; в области прогнозирования климатических рисков алгоритмы искусственного интеллекта могут интерпретировать погодные условия в будущем, предоставляя предупреждения и оптимизацию маршрутов для автомагистралей; в области информационных технологий большие модели могут помочь в автодополнении кода, его понимании и разработке; в образовательной сфере на основе учебных привычек и поведения студентов можно создавать персонализированные большие модели для помощи в учебе; в области медиа и развлечений большие модели могут использоваться для генерации контента, создания моделей и сценариев, таких как создание анимации, разработка игр и производство коротких видеороликов, а также синтеза цифровых персонажей для рекомендаций в электронной коммерции и т. д."

Какие AI-специалисты нужны будущим банкам?

Согласно "Отчету о развитии банковской отрасли Китая на 2024 год", опубликованному Китайской ассоциацией банковской отрасли, финансовому сектору и искусственному интеллекту есть естественные точки соприкосновения. Технология больших моделей искусственного интеллекта способна полностью раскрыть огромные объемы данных банковской отрасли, а банковская отрасль обладает множеством сценариев, подходящих для применения технологии больших моделей искусственного интеллекта. В настоящее время большие модели искусственного интеллекта активно продвигаются в области услуг, маркетинга и продуктов банковской отрасли в Китае, стимулируя ускоренное приближение "банка будущего".

С увеличением использования крупномасштабных моделей банковскими учреждениями также возросли требования к квалификации технических специалистов. Ли Сюшэн считает, что в сфере интернет-приложений интернет-мышление способствовало успеху интернет-гигантов. С наступлением эпохи искусственного интеллекта потребность в кадрах превратилась в потребность в финансовых и технических специалистах с мышлением искусственного интеллекта.

Недавно новый интернет-банк акцентировал внимание на интернет-мышлении и в будущем будет уделять внимание мышлению искусственного интеллекта. При проектировании бизнес-продуктов, клиентском маркетинге, повседневных операциях и создании общей системы управления бизнесом внедряется мышление искусственного интеллекта. Поэтому банк будет оценивать, обладают ли сотрудники этими способностями, основами или потенциалом, чтобы вырастить кадры, необходимые для будущего развития банка.

"Постоянное развитие технологий искусственного интеллекта представляет вызов для банковских работников, но также открывает новые возможности. Сталкиваясь с изменениями, работники должны сохранять спокойствие, постоянно обучаться, следовать за изменениями времени и найти свое место в обществе и бизнесе", - подбадривал Ли Сюшэн. "Технические специалисты должны адаптироваться и использовать технологии искусственного интеллекта для улучшения своих навыков. В то же время бизнес-специалистам не стоит слишком беспокоиться о замене, поскольку порог вхождения в область искусственного интеллекта снизился, и даже те, кто не разбирается в компьютерах, могут использовать инструменты искусственного интеллекта для создания процессов и приложений, проявляя свою ценность. Таким образом, благодаря готовности к обучению и следованию за технологическими изменениями банковские работники не будут устаревать, а, наоборот, смогут лучше приспособиться к прогрессу в сфере технологий".

С точки зрения управления рисками Вэй Хао указывает, что практическая работа является ключом к освоению искусственного интеллекта. В области управления рисками применение технологий искусственного интеллекта требует более высоких требований к квалификации сотрудников, которые должны не только иметь глубокое понимание технологических принципов, но и полностью осознавать преимущества, возможности и риски моделей, чтобы обеспечить правильное применение технологии. Поэтому специалисты по управлению рисками должны обладать глубокими техническими знаниями и широким кругозором.

Ван Цзюнь также сказал, что колледжи и университеты также стремятся взращивать сложные таланты в области искусственного интеллекта + экспертизы. «Мы оптимизировали учебную программу, включив в нее такие курсы, как анализ данных, интеллектуальный анализ данных, машинное обучение, глубокое обучение и мультимодальные данные, чтобы студенты могли познакомиться с искусственным интеллектом на уровне бакалавриата. Были добавлены практические учебные проекты и экспериментальные курсы, а студентам предлагается участвовать в конкурсах, таких как соревнования по финансовым технологиям, чтобы превратить знания в практические навыки. Кроме того, мы надеемся укрепить сотрудничество между промышленностью, университетами и исследованиями с промышленностью и предоставить студентам более глубокое понимание потребностей и бизнеса отрасли с помощью совместных лабораторий и лекций экспертов, чтобы стимулировать их мотивацию к обучению и развивать таланты, отвечающие потребностям отрасли. ”

Говоря о следующем этапе развития применения технологий искусственного интеллекта в банковской сфере, Ли Сюшэн выразил мнение, что с развитием технологий искусственного интеллекта и больших моделей коммерческие банки столкнулись с новым этапом реструктуризации. Это затрагивает не только модернизацию системы, но и глубоко изменит бизнес-процессы банков, форму продуктов, механизм принятия решений, команду сотрудников и структуру должностей. «Хотя сущность финансового риск-менеджмента не изменится, способы обслуживания, форма продуктов и механизмы функционирования претерпят огромные изменения. Этот процесс может быть постепенным, и ожидается, что через три - пять лет лицо коммерческих банков изменится до неузнаваемости.

(Источник: Xinhua Finance)

Источник: Восточная Финансовая Сеть

Автор: Синьхуа Финанс

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить