衔远科技周伯文:大模型需要与应用场景相结合,中美GPT追赶是个动态过程

2023-07-01 26862阅读

  衔远科技创始人、清华大学惠妍讲席教授、电子工程系长聘教授 周伯文

  “现在像ChatGPT这样的大模型进展很快,但问题在于它可能一本正经的‘胡说八道’,尤其在专业领域,外行看它像内行,内行看它像外行;内容的原作者视其剽窃,但普通用户则视其在创造,实际它尚不具备原创性的思想。”5月28日2023中关村(行情000931,诊股)论坛期间,人工智能(AI)技术公司衔远科技创始人周伯文对钛媒体App表示。

衔远科技周伯文:大模型需要与应用场景相结合,中美GPT追赶是个动态过程

  周伯文强调,大模型需要与应用场景相结合,衔远科技从一开始就把底层的 AI 技术跟解决实际问题紧密结合在一起,通过ProductGPT的生成式AI、多轮对话人机协同,以软件即服务的方式帮助企业与消费者实现 AI 时代的产品创新以及对数智化的正确认知。

  据悉,衔远科技成立于2021年底,是全球领先的致力于链接消费者与商品的 AI 公司。以前沿的 AI 技术帮助企业数实融合,自主研发并建立领衔CIP平台,实现从需求洞察到产品创新全过程数智化。

  建立衔远科技之前,周伯文是京东集团技术委员会主席,更早之前则是美国 IBM 人工智能基础研究院院长,目前任职清华大学惠妍讲席教授、电子工程系长聘教授,以及协同交互智能研究中心主任。

  周伯文提出的“自注意力融合多头机制”的自然语言表征机理,成为ChatGPT背后所使用的Transformer架构的核心思想之一,他还曾与图灵奖得主Yoshua Bengio在NLP方向合作发表论文,至今已被引用超2000次,其论文总引数已近15000次。

  随着ChatGPT引发微软、谷歌、阿里等科技巨头竞逐大模型,作为深耕 AI 领域二十年的产学研老兵,周伯文也不例外。今年3月,衔远科技宣布完成数亿元天使轮融资,由启明创投领投、经纬创投跟投。同时,周伯文发布了一则 AI 英雄帖,誓言要打造中国版ChatGPT。

  周伯文表示,中国的ChatGPT需要探索一条新的道路,即垂直整合从自有基础大模型到应用、到终端用户的全场景闭环,以实现生成式 AI 技术与商业价值“双落地”。目前,衔远科技基于 AI 的多模态理解、推理与生成能力,通过ProductGPT支持多轮对话,与专业人员深度交互与协同,帮助企业高效打造爆款创新产品并实现业务增长价值。

  在2023中关村论坛 AI 大模型发展论坛上,周伯文提到这轮GPT热潮和之前 AI 技术的不同:一是深层次 AI 是通用人工智能(AGI)的必经之路,以前是理解做 AI,判断出的结果是模糊的,如今是倒逼通过生成式 AI 来清晰的解决问题;二是之前的 AI 是通过击败人类来获得广泛的注意力,而本轮 AI 技术的成功是人与 AI 协同交互的结果,即人与机器共同创造了GPT大模型的成功,并带来新的技术突破。

  周伯文告诉钛媒体App,衔远科技研发的大模型可能是历史上第一次用统一的大模型,在五个阶段帮助企业去做全周期数字化升级,总结有四点:

  • 衔远科技在做的是一个具备通用能力的大模型,能够解决不同用户的实际问题。
  • 在专业领域内,衔远大模型不仅能够做阅读理解、做数学推理,还可以帮助企业更好、更高效地连接消费者,共同完成从创新到交付、再到营销的全流程任务,让 AI 大模型切实促进当前及未来经济发展与数智化变革。
  • 衔远把整个大模型商业交付分为五个D阶段:洞察(Discovery,发现和洞察市场上的消费趋势)、定义(Define,根据企业能力去定义产品)、设计(design,产品外观、供给侧营销策略设计)、开发(Develop,驱动整个研发流程,将设计变为产品),以及交付分发(Distribute,通过营销使消费者更高效地找到产品)。
  • 衔远大模型ProductGPT尤其在商品和消费者连接的领域具备专长和优势,它有37项大模型评测指标,其中三分之二是推理能力、计算能力等通用能力,剩下三分之一则是围绕上述5个D来做,专门应用于产品和消费者的连接。

  周伯文表示,衔远科技从一开始就将底层 AI 技术和实际问题紧密结合在一起,同时把核心能力和应用场景相结合,所以我们从技术、产品到市场的整个商业化路径非常清晰。

  “现在一方面,是帮助企业端去提升产品全周期创新效率。另一方面我希望衔远科技走出一条有自己坚持和判断的路径。同时,在商业模式上持续迭代底层能力,做与别人不一样的事情。”周伯文对钛媒体App表示。

  他认为,大模型的创业和之前互联网时代“小步快跑、快速迭代”的产品逻辑完全不同。举个简单的例子,之前大模型圈子有两个技术路线,一个是Attention注意力机制,另一个是self-attention自注意力机制,如果那时的技术团队没有选择去走后者即GPT的路径,那么即使小步快跑一样会输掉,再靠快速迭代也已来不及了。

  “互联网竞争时期资金效率更高,商业模式更成立。而现在,由于大模型技术的不断迭代,技术本身已不具备最终的确定性。”周伯文表示。

  对于中美大模型差距与追赶话题,周伯文对钛媒体App表示,这是一个动态的过程,如果是纯粹从追赶角度来说,两个国家的 AI 产业发展速度都很快。

  “我不是一个对追赶这件事愿意发表预测的人,因为我觉得还是要找到自己的(大模型)路线。”周伯文强调。(本文首发钛媒体App,作者|林志佳)