衔远科技周伯文：大模型需要与应用场景相结合，中美GPT追赶是个动态过程

2023-07-01 26959阅读

　　衔远科技创始人、清华大学惠妍讲席教授、电子工程系长聘教授周伯文

　　“现在像ChatGPT这样的大模型进展很快，但问题在于它可能一本正经的‘胡说八道’，尤其在专业领域，外行看它像内行，内行看它像外行；内容的原作者视其剽窃，但普通用户则视其在创造，实际它尚不具备原创性的思想。”5月28日2023中关村(行情000931,诊股)论坛期间，人工智能（AI）技术公司衔远科技创始人周伯文对钛媒体App表示。

　　周伯文强调，大模型需要与应用场景相结合，衔远科技从一开始就把底层的 AI 技术跟解决实际问题紧密结合在一起，通过ProductGPT的生成式AI、多轮对话人机协同，以软件即服务的方式帮助企业与消费者实现 AI 时代的产品创新以及对数智化的正确认知。

　　据悉，衔远科技成立于2021年底，是全球领先的致力于链接消费者与商品的 AI 公司。以前沿的 AI 技术帮助企业数实融合，自主研发并建立领衔CIP平台，实现从需求洞察到产品创新全过程数智化。

　　建立衔远科技之前，周伯文是京东集团技术委员会主席，更早之前则是美国 IBM 人工智能基础研究院院长，目前任职清华大学惠妍讲席教授、电子工程系长聘教授，以及协同交互智能研究中心主任。

　　周伯文提出的“自注意力融合多头机制”的自然语言表征机理，成为ChatGPT背后所使用的Transformer架构的核心思想之一，他还曾与图灵奖得主Yoshua Bengio在NLP方向合作发表论文，至今已被引用超2000次，其论文总引数已近15000次。

　　随着ChatGPT引发微软、谷歌、阿里等科技巨头竞逐大模型，作为深耕 AI 领域二十年的产学研老兵，周伯文也不例外。今年3月，衔远科技宣布完成数亿元天使轮融资，由启明创投领投、经纬创投跟投。同时，周伯文发布了一则 AI 英雄帖，誓言要打造中国版ChatGPT。

　　周伯文表示，中国的ChatGPT需要探索一条新的道路，即垂直整合从自有基础大模型到应用、到终端用户的全场景闭环，以实现生成式 AI 技术与商业价值“双落地”。目前，衔远科技基于 AI 的多模态理解、推理与生成能力，通过ProductGPT支持多轮对话，与专业人员深度交互与协同，帮助企业高效打造爆款创新产品并实现业务增长价值。

　　在2023中关村论坛 AI 大模型发展论坛上，周伯文提到这轮GPT热潮和之前 AI 技术的不同：一是深层次 AI 是通用人工智能（AGI）的必经之路，以前是理解做 AI，判断出的结果是模糊的，如今是倒逼通过生成式 AI 来清晰的解决问题；二是之前的 AI 是通过击败人类来获得广泛的注意力，而本轮 AI 技术的成功是人与 AI 协同交互的结果，即人与机器共同创造了GPT大模型的成功，并带来新的技术突破。

　　周伯文告诉钛媒体App，衔远科技研发的大模型可能是历史上第一次用统一的大模型，在五个阶段帮助企业去做全周期数字化升级，总结有四点：

衔远科技在做的是一个具备通用能力的大模型，能够解决不同用户的实际问题。
在专业领域内，衔远大模型不仅能够做阅读理解、做数学推理，还可以帮助企业更好、更高效地连接消费者，共同完成从创新到交付、再到营销的全流程任务，让 AI 大模型切实促进当前及未来经济发展与数智化变革。
衔远把整个大模型商业交付分为五个D阶段：洞察（Discovery，发现和洞察市场上的消费趋势）、定义（Define，根据企业能力去定义产品）、设计（design，产品外观、供给侧营销策略设计）、开发（Develop，驱动整个研发流程，将设计变为产品），以及交付分发（Distribute，通过营销使消费者更高效地找到产品）。
衔远大模型ProductGPT尤其在商品和消费者连接的领域具备专长和优势，它有37项大模型评测指标，其中三分之二是推理能力、计算能力等通用能力，剩下三分之一则是围绕上述5个D来做，专门应用于产品和消费者的连接。

　　周伯文表示，衔远科技从一开始就将底层 AI 技术和实际问题紧密结合在一起，同时把核心能力和应用场景相结合，所以我们从技术、产品到市场的整个商业化路径非常清晰。

　　“现在一方面，是帮助企业端去提升产品全周期创新效率。另一方面我希望衔远科技走出一条有自己坚持和判断的路径。同时，在商业模式上持续迭代底层能力，做与别人不一样的事情。”周伯文对钛媒体App表示。

　　他认为，大模型的创业和之前互联网时代“小步快跑、快速迭代”的产品逻辑完全不同。举个简单的例子，之前大模型圈子有两个技术路线，一个是Attention注意力机制，另一个是self-attention自注意力机制，如果那时的技术团队没有选择去走后者即GPT的路径，那么即使小步快跑一样会输掉，再靠快速迭代也已来不及了。

　　“互联网竞争时期资金效率更高，商业模式更成立。而现在，由于大模型技术的不断迭代，技术本身已不具备最终的确定性。”周伯文表示。

　　对于中美大模型差距与追赶话题，周伯文对钛媒体App表示，这是一个动态的过程，如果是纯粹从追赶角度来说，两个国家的 AI 产业发展速度都很快。

　　“我不是一个对追赶这件事愿意发表预测的人，因为我觉得还是要找到自己的（大模型）路线。”周伯文强调。（本文首发钛媒体App，作者｜林志佳）

衔远科技周伯文：大模型需要与应用场景相结合，中美GPT追赶是个动态过程

相关阅读

异动快报：益民集团（600824）4月14日13点54分触及涨停板

退货时赠品用掉了要赔偿？法院判了！

震后125小时生命救援奇迹是如何发生的?

巴布亚新几内亚附近海域发生7.0级地震

相关阅读

异动快报：益民集团（600824）4月14日13点54分触及涨停板

退货时赠品用掉了要赔偿？法院判了！

震后125小时生命救援 奇迹是如何发生的?

巴布亚新几内亚附近海域发生7.0级地震

震后125小时生命救援奇迹是如何发生的?