OpenAI的发展路径解析
OpenAI成立于2015年,致力于研究通用人工智能(AGI)发展。在近8年的时间内,OpenAI从一家非营利研究机构转型为市场估值超300亿美元的营利组织,不仅先后发布GPT-3、ChatGPT、GPT-4等众多高影响力的技术成果,成为业界领先的AI研发机构,还成功实现技术落地与自我造血,旗下ChatGPT将与微软全线产品整合。根据路透社消息,2024年OpenAI有望实现10亿美元的收入。作为AI初创企业中关键且稀缺的“幸运儿”,OpenAI的发展路径值得进一步研究。
为深入分析OpenAI的发展路径,本文认为可从三大阶段、三大维度来看OpenAI的运作特征。
第一阶段为2015年至2019年, 从OpenAI成立到Sam Altman担任CEO。此阶段OpenAI的定位为非营利性组织,以“实现安全的通用人工智能(AGI),使其有益于人类”为核心宗旨,开展大量宽泛的研究,发布OpenAI Gym、Universe、Dota AI OpenAI Five、GPT-1和GPT-2等诸多产品。
第二阶段为2019年至2022年,从OpenAI LP的成立到ChatGPT的“爆火”。此阶段的OpenAI从非营利模式转向“有限营利”模式,设立利润上限,并与微软达成战略合作,研发重心向更具商业价值的LLM方向倾斜,旗下 GPT-3、ChatGPT成为引爆行业的热门模型。
第三阶段以2023年为始,OpenAI的商业化发展属性越发凸显,研发重心与运行模式向产品与商业驱动发展。当前,OpenAI与微软的战略合作持续深化,旗下ChatGPT与微软产品逐步整合并发布低价API抢占市场;同时转变开源战略,以竞争和安全的担忧为由,不再开源新发布的GPT-4模型。
图1 OpenAI的三阶段发展历程
回顾OpenAI的发展路径,丰厚的创始资金、伟大的愿景引领、及时的商业化转型、富有远见和定力的创新理念是其成功的关键因素。
丰厚资金支持,让团队早日摆脱募资与商业化压力
OpenAI在获取创始资金方面较为幸运,在组建团队前已获得丰厚的资金支持。该企业起源于2015年的一顿晚宴,在基于“构建安全的人工智能以造福人类”的愿景下,一众富豪企业家决定共同集资10亿美元,创建一个非营利性机构。拥有丰厚资金且几乎从零开始建设项目团队,让OpenAI可以避开初创企业普遍存在的团队成员“人情债”负担,直接精准寻找最适合目标愿景的顶尖人才,从而让早期团队成员在使命、攻关方向等方面达成更强的共识。
注重愿景引领,以伟大的愿景吸引伟大的人才
OpenAI的愿景具有非常浓厚的理想主义色彩,其成立初衷源于对人类安全的担忧,即若超级人工智能成为现实,可能给世界带来威胁;因为历史进程不可逆,与其担心害怕,不如公开一切信息。因此 OpenAI 成立之初便作出与世界分享科研成果的开源承诺。OpenAI的理想主义,在众多科技巨头争相以高薪抢夺AI研发人才、垄断技术的背景下,吸引了众多优秀科技人才,而优秀人才的社交关系网络进一步帮助OpenAI集聚行业精英。根据对OpenAI联合创始人、早期人才队伍组建者Greg Brockman的访谈,OpenAI早期团队的汇聚,很大程度上受益于伟大的愿景和 AI 领域顶尖人才的社交关系网络。可以说,OpenAI成立之初的人才基础显著优于一般性的研究和创新组织,为其前沿科技研发奠定坚实的基础。
及时增强商业化探索,布局生态并获得研发资源
一是牵手微软,解决研发资源投入与商业化问题。自成立以来,大幅增长的模型训练成本和高额的人力成本使得OpenAI一直处于亏损状态。《财富》的数据显示,OpenAI在2022年净亏损5.445亿美元。为解决研发可持续性问题,OpenAI及时于2019年启动重组,发起设立OpenAI LP(具有100倍“利润上限”的公司)。重组后的OpenAI获得微软10亿美元的投资,大部分以Azure云资源兑现,为OpenAI减少了上亿美元级的云计算费用。根据媒体数据,OpenAI未与微软合作前,其模型训练在谷歌云上进行,2019年至2020年期间共计花费1.2亿美元的云计算费用;迁移至Azure后,2020年同期在云计算上的支出已经下降到5.2万美元,2021年、2022年连续两年云计算费用支出都没有超过10万美元。2023年,OpenAI再次与微软签署合作协议,旗下ChatGPT将与微软全线产品整合,并建立了创新的股权和利润分配模式(如表1所示),成功解决了研发资源支持、产业应用渠道、人力与销售支持的多重问题。二是以投资方式借力生态资源,快速整合生成式AI的系统布局。自2021年起,OpenAI创业基金投资了至少16家公司,后续成立加速器Converge,投资10家公司;投资领域覆盖音视频编辑应用开发、AI笔记应用开发、芯片等众多领域,这些投资项目与OpenAI的产品互相借力,共同强化OpenAI在生成式AI领域的产业地位。
表1 2023年OpenAI股权分配的四个阶段
秉持创新理念,赢得技术应用先机
一是坚持实用为上,充分借鉴业界领先的基础技术,以工程化创新实现技术突破。回顾OpenAI与Google在语言大模型(LLM)领域的布局(如图2所示),可以看出,OpenAI的GPT系列模型借鉴了谷歌Transformer、Instruction Tuning、RLHF和“思维链”的技术基础。图灵奖得主LeCun也表示“OpenAI的ChatGPT不是什么革命性的东西,只是组合得很好”。
图2 OpenAI与Google在语言大模型领域的发展对比(信息来源:智源社区、公开信息整理)
二是坚定技术路线,长期发展解码器路线(Decoder-Only),避免中途摇摆所造成的时间损耗。OpenAI从GPT-1开始就一直坚持解码器路线,尽管谷歌推出具有划时代意义的BERT模型(编码器路线Encoder Only),OpenAI也没有改变技术路线,彰显出其在技术选择层面的远见与魄力。三是更关注用户交互,致力于在用户交互中实现AGI。OpenAI在GPT系列模型的研发中非常注重与用户的真实交互,其首席技术官Murati表示“不可能只在实验室里工作来构建出通用人工智能(AGI),交付产品是发现人们想要如何使用和滥用技术的唯一途径”。此次ChatGPT性能提高的一大关键是通过用户标注中的反馈学习(RLHF)促成了模型“涌现能力”。反观谷歌,尽管多年来一直是前沿理论技术的奠基者,但在技术路线的摇摆和风险、道德、既有商业利益等因素的限制,致使其众多研发成果滞后发布、错失先机。
OpenAI引发的行业变化及启示
OpenAI引发Google、Microsoft两大企业的竞争,并搅动AI市场格局变化,立足三家企业发展脉络及市场表现,总结出以下四项发展启示。
OpenAI:复合型组织更有希望在科技竞争中胜出
OpenAI的成功,体现出集顶级科技人才、科技叙事能力、复杂工程创新能力于一体的组织更有希望成为科技竞争的新赢家。一是顶级科技人才是引导行业科技发展趋势的核心。信息科技领域人才竞争的关键不在多寡而在层次。不足300人的OpenAI以ChatGPT成功超越科技巨头Google成为LLM领域的新领导者,其唯一的核心优势就在于顶级科技人才。二是宏大科技叙事能力是吸引顶级科技人才的利器。科技叙事能力通常代表着对未来科技发展的想象,能够清晰阐述未来科技应用对人类生产生活所带来的改变与价值的能力。OpenAI成立初期,没有可与科技巨头比肩的行业影响力和高额薪酬,其对于人才的吸引很大程度得益于科技叙事能力。OpenAI选择实现难度非常高的AGI方向、基于全人类发展安全的角度制定企业发展愿景并提出AGI实现路线与原则,给予了科技人员更加崇高、生动、清晰的科技想象与希望。三是融合多技术领域的复杂工程研发能力越发成为科技企业创新的关键。ChatGPT 是深度学习领域十余年来技术积累的产物,其融合众多前沿技术理念与成果,在基础理论及技术与竞争对手趋同的情况下,实现令人惊艳的技术性能,是较为典型的复杂工程创新的产物。
Google:犹豫不决可能导致失败
Google的“惜败”,展示出技术选择“举棋不定”、技术应用“坐而论道”是大型科技企业应当重视的两大警钟。Google和OpenAI的对比,体现出大企业通常是技术理论的奠基者却不一定是技术或产品的首发者。大企业的技术路线选择更加多元化,更有可能因长时间的“举棋不定”而延长研发周期。此外,大企业的产品规模、社会影响力庞大,迫于市场投资者的压力,在产品研发与投放层面更加谨慎,不会轻易向公众开放新技术或新产品,产品层面容易进入“坐而论道”状态,容易错过产品投放的市场先机,陷入挑战者的被动迎战局面。
微软:数据渐成关键投资资源
微软的投资,显示出算力与数据可以成为关键投资资源,或预示着一种新的股权治理模式。一方面,以芯片、云等计算资源、数据资源作价入股,有望成为信息科技领域的新投资方式。高额的算力投入、优质的数据资源将逐渐成为前沿科技研发的刚需。据公开信息,微软正在构建人工智能超级计算集群,其对OpenAI追加的投资可能以人工智能超级计算集群等计算资源的形式进行交付。另一方面,非固定股权结构可能成为科技领域投资的新模式。OpenAI与Microsoft的股权结构并非完全固定,而是以营利情况决定股权分配,类似于将OpenAI“租给”Microsoft,租期取决于OpenAI的营利速度。这样的股权结构既能保障投资者优先获得收益,也可使科技公司保持一定的独立性。
市场:科技巨头仍是市场赢家
市场的反应,凸显出尽管科技的关键突破创新多出现在初创企业,但市场赢家仍为科技巨头。从AlphaGo到ChatGPT,近十年AI领域中轰动全球的突破性创新,发生在Deepmind、OpenAI两家初创型人工智能公司,而这两家公司随后被Google、Microsoft以收购或投资的方式转变为“技术供应库”,并未改变市场的格局。这主要由于在一项新技术从诞生到走向市场的过程中,初创企业与科技巨头是互为支撑的。投资者与公众对初创企业的容忍度更高,初创企业更有机会从事高额投入却成效不明显的科技研发;但初创企业将技术突破转化为产品应用的能力并不完善,往往需要依靠科技巨头的产品设计、市场与营销将技术转化为大规模应用。面向未来,初创企业实现创新、科技巨头攫取市场空间的趋势可能进一步强化。
面向科技企业的策略建议
加紧筹建顶级科技人才队伍
一是注重愿景引领,提升科技叙事能力,以价值观吸引科技人才。加快培育兼顾公益与利益的创新文化,加强面向未来科技发展的想象与路径规划,以更高的科技发展站位与更普惠的发展原则吸引顶级科技人才。二是拓宽面向顶级人才的国际化合作渠道。联合国内学术机构构建国际科研的合作交流平台与渠道,加强与国际主流科研组织、科研人才的联系与合作。
加快推进科技创新体系优化
一是强化复杂工程研发能力。以“人员、技术、工具”为核心抓手,持续扩大研发人员规模,通过技能培训和文化建设提高现有研发人员的技术素养,打造功能强大、操作简易的技术开发平台及工具。二是完善重大技术路线的评估和执行流程。及时跟进国内外领军科技企业的技术路线选择与变更,加强在技术、法务、产业维度的沟通协调,同步精简内部冗余流程,进一步提升决策效率。三是探索产品研发的创新模式。借助开源社区或生态平台,研究开放式的应用 / 产品创新模式,面向前沿性的创新产品,适当地加快开放产品应用入口,在用户交互中逐步完善产品,避免错失产品投放先机。
深化面向前沿科技的投资布局
一是投资方向方面,适当加大面向“网云数智物”领域基础前沿科技的投资力度。关注高校、科研机构、初创企业的前沿科技创新项目,以投资方式入局,避免陷入被动应战局面。二是投资筛选方面,注重强化以科技人才为核心的决策导向,更多关注具备学术或产业领军人物的初创企业。三是投资方式方面,加快探索以算力和数据资源为支付形式的投资模式,减轻基础科技投资压力,同步带动算网业务增长。四是探索以投资形式组建全新、独立的小型科研机构,以新机构开展新领域研发。通过建设更具市场化特征的机构来吸引更高水平的英才,提高技术路线选择、人员任免决策等方面的自由度,打破企业过往的薪酬束缚,给予英才更优厚的待遇。