智谱AI总裁王绍兰:大模型技术进步的陡峭曲线没有放缓迹象
每经记者 周逸斐 每经编辑 陈 旭
2024中关村论坛年会近日举行。本届论坛以“创新:建设更加美好的世界”为主题,上百位顶尖专家、上千名演讲嘉宾围绕科技创新引领社会进步、民生改善、可持续发展等议题,共话开放创新,共谋发展机遇,为建设更加美好的世界贡献智慧和力量。
在清华大学主办的平行论坛“2024世界数字健康论坛”上,智谱AI总裁王绍兰发表了题为“大模型时代的探索和思考”的主旨演讲。《每日经济新闻》记者从论坛现场获悉,智谱AI为本次中关村论坛年会提供了大模型技术支持,打造了“2024中关村论坛年会”会务智能体,为参会者提供全面实时的会议信息、日程查询、议题概览等服务。
围绕大模型领域相关话题,王绍兰在论坛期间接受了《每日经济新闻》记者(以下简称NBD)的专访。
仅有强大基座模型不够
NBD:2024中关村论坛年会上,清华大学联合生数科技发布了首个长时长、高一致性、高动态性视频大模型Vidu,外界评价其为国产版Sora(美国人工智能研究公司OpenAI发布的人工智能文生视频大模型),您觉得国内已经进入Sora阶段了吗?
王绍兰:在大模型研发的历程中,我们越来越意识到实现通用人工智能(AGI)的道路很长,踽踽独行不如齐力同行。
生数科技在文生视频模型方面有比较突出的能力,是智谱已经投资的十多家AI大模型产业相关创业公司之一。目前许多企业都拥有行业领先的技术实力,这是一种鲜明的技术导向。
我们也发起了智谱Z计划,专门支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等各方面。
我们觉得,仅仅有强大的基座模型还不够,只有打通大模型产业生态圈上下游,与客户、不同生态位的合作伙伴一起,才能推动中国人工智能产业全面发展。
NBD:您在论坛现场提到,我国大模型发展比国外晚了一年,当前外界有人认为中国大模型研究在沿袭国外的技术,您认为该如何缩小与国外先进水平的差距?
王绍兰:我认为,中国要建立起具有独立自主知识产权、安全可控自研的国产大模型。大模型是AI技术设施的关键底座,大模型竞争是国家科技战略竞争,中国一定要有自主创新的大模型产品。
我们目前有国产全自研的核心技术,从底层算法、预训练框架、团队搭建,甚至到国产化硬件的适配,智谱的全链路技术都由我们团队自主研发,完全自主可控。
坦白地说,智谱跟世界顶级水平仍然存在差距。承认这一差距,是要认清方向并去追赶。我们与世界顶级水平之间的差距虽然在缩小,但仍然存在,对此团队还是有压力的,但同时也非常有动力。我们希望认清这个差距,并且靠自身努力追上差距。当然,除了国产、自研,我们同样注重技术的高效迭代和创新。
大模型商业化方兴未艾
NBD:上一个AI繁荣周期涌现的“AI四小龙”前期融资能力是比较强的,但后期普遍遭遇了商业化的艰难探索。您认为中国的大模型在商业化过程中该怎样避免类似的情况?
王绍兰:生成式AI不再强烈地依赖标注,不再依赖具体的任务和场景,它的泛化能力更强。由于能力本身的泛化性和通用性,我们合作的伙伴遍布各行各业,聚焦不同的领域。
如果只是把大模型当作一个技术浪潮,那么它总有巅峰和低谷。但如果你把大模型看作一场技术革命,那么一切的视角、想象空间都变了。大模型催生了前所未有的新空间、新市场,它的革命性不仅在于改造旧的世界,还将开辟一个前所未有的新世界。
我认为,大模型技术进步的陡峭曲线还没有放缓的迹象,大模型商业化之路方兴未艾。2024年将是AGI元年,人工智能的革命性潜力将进一步释放,不仅体现在技术领域,也将给商业世界带来颠覆性影响。这不是将来时,而是进行时。
NBD:当前,从AI到大模型,从大模型到大模型商业化落地,有人认为最大的拦路虎是技术问题,还有人认为是商业化模式问题。从现状来看,您支持哪种观点?
王绍兰:技术能力跃升和商业化并不矛盾,坚持技术和商业化两条路线,共同的方向就是推动中国大模型产业的全面发展。
在技术方面,我们从底层算法、预训练框架、团队搭建,甚至到国产化硬件的适配,全链路技术都由团队自主研发,完全自主可控。在商业化方面,针对不同的用户需求,我们总结出了三种主要商业模式:API(应用程序编程接口)、云端私有化、本地私有化。从生产、营销、综合投放、销售,到转化、服务、用户体验、售后等,每个环节我们都已经积累了许多落地案例。
最近我们刚刚公布了一批大模型商业化案例,覆盖智能汽车、金融、咨询、数字营销等诸多领域。
算力困境是客观存在的
NBD:当前国产大模型在商业化上有没有出现一些共性问题?智谱AI如何规避这些可能的挑战?
王绍兰:算力的困境是客观存在的,我们在国产算力适配方面有了很多进展。
第一,从GLM(通用语言模型)预训练框架搭建之初,我们就非常注意算力的利用率问题,在这方面做了大量的工作,目前还在进行。第二,智谱一开始就在国产算力适配方面,进行了投入。第三,在国产算力适配情况方面,2022年以来,GLM系列模型支持在�N腾、神威超算、海光DCU架构上进行大规模预训练和推理,当前已支持�N腾、神威超算、海光DCU等十余种国产硬件生态。
NBD:国内不少生成式AI企业都在布局出海,智谱AI在国际化方面有何布局?
王绍兰:我认为国际化方面的布局需要一步步来,智谱目前在技术上的努力已经获得国际认可。
比如,近日,大模型权威评测组织LMSYS(由几所高校共同建立的AI研究组织)推出了基准测试――Arena-Hard,智谱研发的ChatGLM3和新一代基座大模型GLM- 4排名仅次于GPT- 4Turbo(ChatGPT发布的语言模型)和Claude 3 Opus。
另外,在今年ICLR(国际表征学习大会)和WWW(国际万维网大会)上,我们都有幸获邀作大会主旨报告,这也是国内第一次有大模型相关的主旨发言出现在国际顶级会议上。
我认为,对于智谱来说,目前最关键的还是把核心技术突破和商业化落地两个方面做好,我们也希望推动更大范围的共建与探索。
(责任编辑:董萍萍 )