生成式AI加速向自主AI演变投资机构的攻与守丨G进化论

 天生赢家 一触即发2022年末,OpenAI推出ChatGPT惊艳众人至今,大模型技术还在不断演进。与此同时,大模型的应用下沉正成为今年一大主要命题。随着基础大模型能力走到一定平台期,生成式AI的发展阶段以及相应投资机会都正有所演变。  近日,Gartner发布2024年新型技术成熟度曲线显示,生成式AI已经处在“期望膨胀期”的末端,常规来说,不久之后将进入“泡沫破裂低谷期”。Gartner杰

  天生赢家 一触即发2022年末,OpenAI推出ChatGPT惊艳众人至今,大模型技术还在不断演进。与此同时,大模型的应用下沉正成为今年一大主要命题。随着基础大模型能力走到一定平台期,生成式AI的发展阶段以及相应投资机会都正有所演变。

  近日,Gartner发布2024年新型技术成熟度曲线显示,生成式AI已经处在“期望膨胀期”的末端,常规来说,不久之后将进入“泡沫破裂低谷期”。Gartner杰出研究副总裁Arun Chandrasekaran表示:“虽然目前的AI模型缺乏自主行动能力,但各AI研究实验室正在快速推出智能体,借助智能体与环境之间的动态交互来实现目标,不过这将是一个循序渐进的过程。”

  对此,一村淞灵投资总经理张晨接受21世纪经济报道记者采访时表示,“在深入学习了解多种AI大模型的底层算法后,我们认为,如果要让AI技术加速渗透到生活中应用,可以分为三个AI发展周期:感知周期、模型周期、行动周期。目前阶段会重点布局前两个周期。关于近期大热的具身智能赛道,随着下游应用场景的丰富,可能会在2025年形成生态位,但具身智能最合适的形态可能未必是人形,要结合具体场景而定。”

  当前大模型浪潮是由Transformer架构支撑发展的产物,但至今业界依然有观点认为,Transformer未必会是大模型发展的终极路线。

  近期再度受到关注的Mamba架构,就是一种非Transformer路线。这是因为Transformer架构的一大关键要素在于自注意力(Self-attention)机制,其可以更好处理上下文理解问题,但也有缺点。这也是后续如MoE等新技术在持续推出以优化该架构,同时市场依然在探索大模型技术路线年新兴技术成熟度曲线,图源:Gartner)

  “自注意力机制的不足,在于面临低成本推理、可扩展能力、并行计算这‘不可能三角’,三者无法同时满足。”张晨对记者分析,“我们研究认为,AI强大的点在于,从多个层面会颠覆人的知识体系。以前的一些发展路径不是不好,只是人类认知不理解而已。例如Transformer架构的前身是生成对抗网络(GAN),当时很多人觉得其最终实现效果不好,但可能只是人类无法理解而已,并不是这条路线本身的不足。”

  下一步要推动技术进一步升级,业界可能需要探索如何解决前述“不可能三角”问题。

  天风证券近期发布的报告也提到,2024年模型架构的变化将成为最重要的变化,模型架构变化有望带来的能力进步,将直接打开大模型应用的更广阔空间。

  “要延续投资,就需要对市场和技术有敬畏心。”张晨对记者表示,“通识大模型的核心是比拼算力资源,但根据我们所在投资机构的资金属性,我们更愿意谦逊地先跟国内AGI头部公司虚心学习交流,掌握他们的最新动向和底层逻辑后,等我们有相当规模的资金时,可能会考虑投资一家基础大模型公司。但那时就不是根据估值逻辑投资,而是依照投资周期的角度入手。”

  所谓自主AI,即AI的快速演进正在催生出自主AI系统。自主AI系统可以在几乎没有人为监督的情况下运行、不断自我完善并在复杂环境中作出有效决策。此类技术包括多智能体系统、大型行动模型、机器客户、人形工作机器人、自主智能体和强化学习。

  这也是当前不少投资机构对外释放的消息:在模型应用阶段将出现诸多投资机会。

  脑机接口也是近些年间国内外都在积极探索的领域,只是选择落线有所不同。其中国际头部公司Nuerlink被视为相对激进选择了侵入式脑机接口路线,国内公司则多数选择半侵入式或非侵入式路线。

  在今年热度高涨的具身智能方面,海外市场的波士顿动力公司多年来都被业界视为工程化方面走在领先位置。

  波斯顿动力最新发布的机器人采用了电驱路线,这与目前汽车行业的发展趋势十分接近。

  虽然今年以来“人形机器人”掀起了一轮又一轮关注,但同时也伴随质疑和疑惑,例如,即便发布商用的机器人已经来到10万元左右,但用户真的会买单吗?

  “当前阶段的确会有一波‘to VC’的应用出现。”张晨对记者表示,“对我们来说逻辑一以贯之:最终能推动一个任务完成,在过程中能实现如降本或增效、挖掘新价值等能力,就值得坚定投资。”

  实际上产品都是需要通过持续迭代-淘汰-迭代的循环演进发展。“所以抛开‘to VC’的部分,目前大模型主要集中为语言类大模型,在很多场景的模型还没出现,例如还没有视觉类大模型。那么未来,大模型就是一种基础设施,中国市场未来一定需要有自己属性的大模型。底层能力有了后,在数据安全和隐私、代码编写等方向我们已经看到很多机会。”他续称。

  相关新闻热文排行1广州市政协原主席陈开枝:发展预制菜是推动乡村产业振兴的重要抓手