有了行业大模型 腾讯为何还要推出通用大模型?

时间:2024-05-15 作者: 展示用品

  9月7日,腾讯通用大模型“混元”在2023腾讯全球数字生态大会上正式对外亮相。现场,腾讯

  生态大会期间,腾讯集团副总裁蒋杰也接受了南方+记者的采访,就腾讯通用大模型的发展策略、商业路径等来了解答。

  南方+:6月时腾讯云发布了行业大模型;混元大模型不仅在B端,还有很多C端应用场景。腾讯在整个大模型生态中的定位是怎样的?

  蒋杰:腾讯在6月份先发布行业大模型,如今通用大模型正式对外亮相。其实在6月时,行业和客户就有很多关于大模型的需求,而通用大模型,除了能够支持行业已有的发布的几个行业以外,还会支持更多领域,也将作为腾讯云MaaS服务的底座,进一步服务客户。

  在这几个月以来,我们从始至终在和腾讯内部的应用做磨炼,把腾讯重要的、丰富的业务场景当成“磨刀石”,再出来服务更多企业。比如在会议、文档的应用中,都是在一个复杂的环境下,通过内部充分打磨,让我们对自己有信心,这是最关键的。我们大家都希望能够让腾讯混元大模型成为“倍增器”。

  蒋杰:腾讯会议、腾讯文档、腾讯广告等已经接入混元大模型,都有很大的用户量,并得到了深度应用。首先,我们做这个模型,一定是服务企业本身,再通过腾讯云对外服务客户和生态合作伙伴。对一个通用大模型来说,它的逻辑思维、推理能力是最重要的。不光要具备复杂的推理能力,甚至对复杂推理能力过程中的安全问题也要有更好判断。我们大家都希望大语言模型真正能够给我们生活带来便利、工作带来高效。

  南方+:大模型的训练和存储过程中涉及到大量的个人数据和敏感数据,腾讯是如何保证这一些数据的安全和隐私,避免数据的泄露和滥用?

  蒋杰:这是一个隐私保护的问题,其实和大模型本身没有直接联系。无论有没有大模型,腾讯都严格遵循法律要求,不光是我们做小模型、大模型甚至大语言模型,都不会使用个人隐私数据。此外,腾讯的内容产品,也为腾讯混元大模型提供了大规模、高质量、多样化的语料库,能够学习到各类应用场景中丰富的语言知识和语境理解能力。

  蒋杰:大模型面向TO B短期会产生很好的商业收入,我认为这还有待探索,因为大模型的成熟度和应对复杂任务的解决能力还不够,它还有很多严肃场景、专业场景,还不能解锁的时候,其实它的应用场景依旧很有限,要求我们企业甚至业界各个团队甚至学术界一起完善。腾讯的混元大模型体系,一开始就是根据腾讯企业自身的应用去做的研发,再和大模型更深度结合应用,才能够去抵消整个大模型高昂的设备、训练、人员的成本。

  蒋杰:我觉得首先是做好技术本身,回归技术本质,至于商业化,我们会把混元大模型所有能力开放给腾讯所有业务,内部都是公开,都在腾讯的机器学习平台上使用并迭代应用。比如和腾讯文档、腾讯会议合作,都是和各个业务做深度结合来做对外发布,混元大模型还要做更多的数据标注、更多的框架、训练更多的数据。在我们内部,其实可以把混元看作一个在内部开源的模型,每一个公司的内部业务都能够正常的看到混元的能力,他们基于这个能力做应用;面向TO B端则会通过腾讯云API对外开放。未来,如果每个行业需要做深度定制,腾讯云也会为大家提供服务。

  蒋杰:为何需要做全链路自研?其实也有很多的开源模型,借助很多开源模型就可以在上面做一些叠加,但是,如果不从头做自研,其实也不会对技术完全掌握,比如说这个模型别人训练好了,但是有一些违法有害信息存在的时候,回答是错误的,你也没法在其中做更多的修改,同时,迭代、研发能更快,还有更适合未来腾讯的技术栈的融入。

  腾讯从高速网络、最底层的服务器到网卡、高速组网,以及平台、模型、算法都是自研的,这种自研其实给我们后续的迭代,是可以加快的。同时,还和别的业务深度结合也会加快。能这么说,腾讯有一个海量高并发的业务,开源的很多架构是不适应腾讯的业务体量,所以我们肯定要走出一套基于自主体系的研发道路,才能应对海量高并发的业务冲击式。

  蒋杰:现在大模型的成本其实还是腾讯自己来扛掉,所以成本一定是高昂的,但是我们大家都希望不断降成本,从训练的效率和框架上降成本,在服务用户的推理阶段中降成本,未来我们也会做一些定制化方式来让客户的成本降到最低。

  蒋杰:其实从2021年开始研发,今天我们所看到的结果不是一下子就有的。首先,它要做底层训练的框架,否则也装不下千亿级参数、2万亿tokens的能力。整个体系在平台架构、模型、算法都是自研的。我们最早不是一个稠密的大模型,而是基于稀疏的大模型,广告业务做到了一个稀疏大模型来支撑广告业务。这样的一个过程中腾讯一直在不断加大投入这些技术能力。最近的研发也在做一些更有深度的能力演进,不但在工业界,也会在学术界提升应用实践能力。

上一篇:【48812】新三板立异层公司瑞虹股份新增专利信息授权:“一种成型焊点冲压支架组合模具”
下一篇:震裕科技获得一种电机铁芯单片搜集组织专利完成了高效的电机铁芯单片搜集。