昆仑万维CEO方汉:代码开源可助力中国版ChatGPT弯道超车
ChatGPT不再是大公司的独角戏。
2月9日,昆仑万维(300418.SZ)在其官方微信公众号上宣布与奇点智源合作,将在今年内发布中国版类ChatGPT代码开源。
据了解,ChatGPT是由美国人工智能公司OpenAI 研发的聊天机器人 ,于2022年11月发布,仅花了60天,就达到了月活过亿,成为史上用户增长最快的互联网应用。一时间,微软、谷歌等互联网巨头纷纷响应。
作为AI前沿探索应用的ChatPGT,有望引领下一轮科技革命。在该领域,互联网巨头投入与技术积累有着先天的垄断优势。拥有全球数量众多互联网企业的中国,如何追赶上ChatGPT潮流?这是一个既现实又残酷的问题。
Linux打败了Windows Sever,MySQL打败了Oracle的案例,似乎为中国AI赶超美国AI提供了一个“1+1>2”的思考。
“让全世界所有技术工程师通过天工开源项目联合起来,打败M(微软),打败G(谷歌)。”这正是昆仑万维基于国内互联网业现状,为抓住ChatGPT技术前沿而发出的倡议。
代码开源有望让众多中国本土互联网企业,在追赶ChatGPT的技术潮流中,发挥好自己独有的优势,共同完善中国版ChatGPT。
开源是中国AIGC弯道超车的机会
不断利用人工智能技术赋能现有业务发展,或许是昆仑万维在中国AIGC领域弯道超车的一种探索。
“不可否认,中国的IT技术整体落后于欧美,但近二十年来迅速拉近差距的?个重要因素是因为有开源软件的存在,让广大的中国开发者和初创企业存在弯道超车的机会。”昆仑万维CEO方汉在接受专访时表示,在AI领域,开源也同样会极大刺激中小开发团队的增多。
在方汉看来,只有开源才能满足各种长尾需求,真正做到百花齐放,而不会出现由大型互联网公司独霸AI基础设施的局面。
举一个例子,OpenAI之前发布的文生图产品Dall-e2,运用的是一款代码闭源的产品,发布半年后才推出基于开源的产品Stable-Diffusion,在数量级上随即秒掉了前者。目前,在世界上最大的代码托管平台Github上,基于Dall-e2的项目只有202个,而基于Stable-Diffusion的项目亦高达2758个,前者不到后者的十分之一。
“因为开源的强大生命力,大量开发者可以基于开源的Stable-Diffusion制作适合自己的模型和应用。”方汉认为,“这就是在AI研发中开源打败闭源的又一案例。”
同样,在AI研发的底层平台中,开源的Pytorch已经击败闭源的所有竞争对手,成为使用人数最多的底层平台。
“我认为,没有开源就没有移动互联网时代的蓬勃发展,没有开源也没有AIGC这个领域的蓬勃发展,我们坚信开源是AIGC生态发展的土壤和重要的推动力量。”方汉指出,通过众创,可以加速迭代各种功能开发,积极促进技术民主化,降低行业门槛。
上述一系列的数据和事实,坚定了昆仑万维从倡议开源到通过开源促进行业生态,从而使得中国的AIGC具备弯道超车的可能。
昆仑万维从2020年开始布局AIGC领域,组建了近百人的研发团队。去年12月15日,昆仑万维正式发布「昆仑天工」,AI生成能力目前已覆盖图像、音乐、文本、编程等内容模态,昆仑万维已是目前国内AIGC领域布局最为全面、首个全身心投入AIGC开源社区的公司。
“昆仑天工”这一名称的由来,是明朝科学家宋应星所著《天工开物》,一本古老的技术百科全书。这一名称寄托着昆仑万维集团对技术的原始信仰:不仅致力于在AIGC技术创新,还要通过开源来推动中文AIGC生态的健康发展。
“我们致力于推进开源AIGC算法和模型社区的发展壮大,降低AIGC技术在各行各业的使用和学习门槛。”方汉表示。
自去年12月份昆仑天工开源项目发布以来,获得了大量好评,成为AI开源领域成长最快的项目之一,目前已经有中国移动咪咕等企业测试使用。
2月8日,昆仑万维宣布旗下的Opera浏览器计划接入ChatGPT功能,成为全球除微软Bing必应搜索引擎、Edge浏览器之外,又一家集成ChatGPT功能的浏览器。结合最前沿的技术ChatGPT,Opera将为全球用户带去领先的体验。
同时,昆仑万维在全球的平均月活跃用户有4亿,具有丰富的行业经验,将助力AIGC应用的持续落地。
方汉表示,希望通过开源,吸引更多创业者和商业公司加入到AIGC事业之中。
――或许,中国AI领域的弯道超车机会就在眼下。
ChatGPT是AI领域里程碑
ChatGPT的出现具有划时代的意义,它证明了一个技术方向的成立,也就是机器能根据人的反馈进行强化学习(RLHF)。
“它与之前常见的语言模型 (Bert/ Bart/ T5) 的区别,几乎是导弹与弓箭的区别,一定要引起最高程度的重视。”方汉表示,“我在2019年底看到GPT3的发布之后,就敏锐地意识到,一场改革即将来临。”与GPT-3等大模型相比,ChatGPT回答更全面,可以在大范围、细节问题上给出较合理准确的答案,相较以往的大模型知识被挖掘得更充分。
与ChatGPT的一通嗨聊后,方汉对ChatGPT打出了7-8分的高分,“因为它在智商测试里考了85分,这是有史以来最高的。”方汉介绍说,它是用RLHF的回馈机制,强训 GPT-3.5后得出来的产品,效果的确非常惊艳,意义是非常大的。
比现有模型的超越性,体现在它可以给出更近似正确的回答,极大地提高了大语言模型的输出结果,让AI的效果得到了一个质的提升。
从技术演进路径上看,初代 GPT-3 模型通过预训练获得生成能力、世界知识和情景学习( in-context learning)。通过情景学习的模型分支获得了遵循指令,和能泛化到没有见过的任务的能力。再经过代码训练的分支模型,则获得了代码理解的能力,作为代码训练的副产品,模型同时潜在地获得了复杂推理的能力。结合这两个分支,code-davinci-002(代码达芬奇-002),似乎是具有所有能力的最强 GPT-3.5 模型。
“接下来通过有监督的 instruction tuning 和 RLHF 通过牺牲模型能力换取与人类对齐,即对齐税。”方汉介绍说,RLHF使模型能够生成更翔实和公正的答案,同时拒绝其知识范围之外的问题。
但是,现阶段的ChatGPT最大问题是,它仍然是在模仿人类的回答。
“你在问它一个问题的时候,它并不是理解了这个问题,而是按照历史经验给你一个他认为你觉得正确的答案。它了解人性,给到的未必是真正正确的答案。”方汉表示,“简而言之,ChatGPT现在可以替代20%~30%的底层工作,但仍然不是真正意义上的人工智能。”
在方汉看来,真要实现我们想象中的那种人工智能可能还有很多步要走,跟GPT-3一样不是不可逾越的。
展望后续的GPT-4模型,“目前已有多个业界传言称,可以全面通过图灵测试。”方汉表示,该测试是评价机器是否具备人类智能的方法,这无疑会是AI史上又一个伟大的里程碑。
构建AI生态圈
事实上,再好的AI技术,也需要通过应用落地,构建其专属的生态。
在2008年成立之初,昆仑万维便切入海外市场,“航海”经验丰富。在出海过程中,又通过收购、内部孵化等方式不断丰富业务矩阵。目前,昆仑万维从一个以移动游戏为核心的公司,发展为聚焦互联网主赛道、多元布局的出海企业,业务遍及全球100多个国家和地区。
昆仑万维旗下业务包括海外信息分发及元宇宙平台Opera、海外社交娱乐平台StarX、全球移动游戏平台Ark Games和休闲娱乐平台闲徕互娱。四大业务板块服务着累计月活跃近4亿的用户,这一庞大的用户群体,又是昆仑天工面向B端、C端构建AI生态的底气。
方汉分析说,“目前的AI革新主要是在技术层面,我们更愿意把AI技术落地到C端产品应用层面,促进技术的产品化,让用户更方便地去创作内容。”
昆仑万维一直在通过完善昆仑天工模型,使之能够辅助人类更快的生成内容,而不是只生产素材就完事了。
在方汉看来,不能说只画个图或生成个视频就足够了,要想一下什么样的图用户才愿意看、什么样的视频用户还愿意看,这里面还有很多的工作要做。
方汉介绍,接下来,昆仑万维对昆仑天工的优化将从两个方向进行:第一个方向,紧跟业内先进水平,训练自己的ChatGPT;第二个方向,让文本生图、文本生代码、以及文本生文本,向实际应用上靠近。
“我们在扎扎实实的搞研发。像OpenAI这类的公司不太屑于做应用,但我们自己会做应用,然后用应用上的需求,去反推和增强我们的模型训练,这是我们跟OpenAI的区别。”方汉如是说。
方汉感慨道,随着AI投入研发的工作做得越多,越能感受到市场很大,技术创新的可能性越多。
以AIGC为例,对现有行业的影响,主要是降本增效。它不是百分比级别的,而是十倍、百倍级的降本增效。
通俗点讲,就是能给B端省钱,给C端省事。“这样会极大的提高内容生产的效率,解放生产力。”方汉认为,所有的内容行业,包括游戏行业和影视行业,都有非常强的市场需求。
“我们是一家全球性的互联网公司,涉足浏览器、社交和游戏三个领域,这三个领域其实都是跟内容比较相关,我们属于一个内容互联网企业。我们认为AIGC是对内容产业的一个巨大契机,我们也愿意全身心投入,来寻找我们的第二曲线。”方汉表示。
在很多长尾行业中,AIGC不仅极大提高内容生产效率,甚至还重塑行业赛道,衍生出更多的产业机会。期待未来更多中国本土企业都能在由开源形成的AI生态中,找到自己重塑行业赛道的机会。(思维财经出品)