“百模大战”路线分化机构走向多类模型竞争_展示用品

“百模大战”路线分化机构走向多类模型竞争

时间：2024-07-06 作者: 展示用品

ChatGPT掀起的大模型浪潮持续汹涌，机构之间的“百模大战”也开始走向多种模态。

《中国经营报》记者发现，近期腾讯主导的IEEE（电气与电子工程师协会）金融风控大模型标准启动。据悉，该标准是全世界内首个金融风险控制领域的大模型国际标准，旨在为金融机构风控建模环节中应用AI大模型技术提供参考和指引。

腾讯云天御首席科学家、IEEE 金融风控大模型标准工作组主席李超在接受记者正常采访时透露，上述金融大模型主要解决的问题并不是偏文本分析的场景，而是关于金融风控的欺诈识别大模型，本身是机器学习模型而不是大语言模型。

“大模型的概念认定变化非常快，相对统一的标准是AI大规模预训练，这样的一个过程中会根据不一样的行业、不同场景呈现出千姿百态的大模型，参数可能不是唯一的评价指标。”他向记者表示。

此前，大语言模型一直被认为在金融核心风控业务领域的价值有限，机器学习大模型的发展则能更具针对性地解决风控领域问题。不过记者在采访时发现，对大模型的分类和标准，市场上目前还存在多种看法。也有机构的人表示，大语言模型和机器学习大模型不应该混为一谈。

腾讯安全近期联合发布的《2023年商业银行风控趋势调研报告》指出，在客群变化加快、黑产利用AI加速等新形势下，正在面临通用型风控策略失效、单点防御失效、用过去预测未来的价值大幅度降低等问题，以往“静态模型+动态策略”的风控策略改变迫在眉睫。

李超在回答记者正常采访时表示，金融风控大模型的“大”，主要指的是大规模的预训练。金融风控大模型主要解决的问题并不是偏文本分析的场景，而是关于金融风控的欺诈识别大模型。

“我们最早做定制化服务的时候，并没有通过大模型，主要是基于基础模型（Foundation Model）+迁移学习的机制，客户（如）会根据其自身的客户（如银行的客户）所收集的样本去构建垂直场景的风控模型。虽然可以在一定程度上完成定制化的欺诈模式识别，但发现通常客户自身积累的样本能力和速度很局限，单纯用传统的机器学习方式给客户做风控模型构建，很难做到既精准又稳定。”李超透露。

以汽车金融场景为例，很多汽车金融风控建模的痛点基本是小样本或者零样本，不具备银行机构长年累月积累的历史金融数据和风控能力。“某个客户建模只有1万样本量，但通常5万左右样本是基本要求，通过风控大模型积累的风控知识很好地弥补不足。在实践中，反欺诈效果相对传统方案提升了20%左右。”他表示。

据了解，在国际舞台中，数字风控反欺诈领域的“中国经验”相对突出。在丰富的数据资产和丰富的实战经验下，国内机构也相应沉淀了较为扎实的风控能力。

值得注意的是，此次腾讯牵头在风控大模型领域“立标准”，也折射了“百模大战”之下，机构在模型路线的分化进一步加剧。而与此相对，当前行业尚缺乏一套较为全面、系统、权威的对大模型的评估标准甚至定义。

根据《自然·机器智能》杂志定义，大模型是网络参数规模达到亿级以上的“预训练深度学习算法”。而根据中国计算机学会官方微信的一篇文章，大模型，狭义上指大语言模型，广义上则指包含语言、视觉、声音、时空数据等的多模态大模型，通常是指参数规模巨大的深度神经网络模型。

一位金融科技机构内部人士就向记者直言，这一轮大模型通常特指生成式AI范畴的大语言模型，机器学习大模型严格意义上不属于这一轮大模型的概念。该人士也向记者透露，该公司尝试过用生成式AI做金融风控，但尚没看到突破。

机器学习、自然语义处理和计算机视觉并称为人工智能的三大核心技术。由ChatGPT引发的大模型热，在市场上多指归属自然语义处理分支的大型语言模型（Large Language Models，LLMS）。

在今年9月的外滩大会上，复旦大学教授、上海市数据科学重点实验室主任肖仰华就公开表示，生成式大模型是整个新底座，能够理解为海量参数化数据的知识容器。但它在可控、编辑、隐私防护、可解释等很多方面存在着较大瓶颈。特别是在如金融这样的专业领域中，非常需要符号化的知识图谱能力去互补。

也有科技公司人士向记者表示，在国内众多行业大模型推出后，“大模型”已经不单单是“大语言模型”的简称了。大模型的种类变得更多元，比如CV（计算机视觉）、NLP（自然语义处理）、多模态、语音以及智能决策。其中，风控大模型就是智能决策类型。

记者注意到，中山大学在对国内大模型的一个种类分析中认为，大模型是一个统称，不仅仅指代大语言模型。中国信通院的一位专业技术人员也持类似观点，“我们一般把10亿参数以上的叫大模型，不管什么模态。”

据记者了解，如果是大语言模型，相对于别的类别模型，要遵守的标准、范式、伦理都会更为复杂。

李超在进一步向记者阐释风控大模型逻辑时表示，新一代基于大模型的模型对抗范式，其主要特征就是能够根据过往积累的黑灰产样式和模型，把其中有用的知识通过知识蒸馏的方式提取出来，通过技术方法形成基础模型（Foundation Model）。这个基础模型不同于通用模型，不需要直接去服务具体场景，而是一个知识库。在这个知识库基础上，客户基于一些样本提示，能够灵活地生成适配各个场景和不同金融机构的风控模型。

他也认为，大语言模型、机器学习大模型等不同模态大模型在处理一些金融业务上会处于并存状态。

光大信托数据中心总经理祝世虎近期也在一场闭门会上就针对大语言模型在金融领域的实践指出，大模型相对传统模型具有一定的技术优势，以客户画像领域为例，传统模型是一系列的不同算法的小模型，例如以网络图谱计算客户关系、以树模型计算客户偏好，其数据结果均为固定化的评级评分等。但是大模型则是通用算法来感知描述上述画像，还可以进一步感知风险浓度、欺诈态势等。

在他看来，大模型与传统模型的未来趋势将会由共存到超越。受制于计算复杂度高、可解释性差等问题，大模型会与传统模型共存——大模型为中控驱动可解释性的传统模型；未来随着大模型复杂度降低、可解释性增强，大模型可能逐步替代传统模型。

上一篇:智能坐便器产品质量状况及关键指标解读
下一篇:西方发动机绝密技术竟被农村小伙成功攻克国家奖他800万元！

“百模大战”路线分化 机构走向多类模型竞争

“百模大战”路线分化机构走向多类模型竞争