OpenAI:重塑技术、商业与社会的公司
2015 年 12 月,当 Elon Musk、Sam Altman 和其他硅谷大佬以十亿美元承诺启动 OpenAI 时,那个愿景几乎是诗意的:安全地构建通用人工智能,并确保其惠及所有人。近十年后,OpenAI 的估值超过 800 亿美元,雇员超过 1500 人,其产品被全球数亿人使用。诗意已经让位于更复杂、也更重大的现实。
起源故事
OpenAI 最初是一个非营利研究实验室,定位为对抗谷歌在 AI 领域日益增长的主导地位。创始团队包括 Ilya Sutskever、Greg Brockman、Trevor Blackwell 等人,他们相信 AGI 即将到来,应该以开放的方式开发,安全是首要而非次要考虑。
早期阶段以真正的研究突破为标志。OpenAI 团队发表了关于强化学习、无监督学习和生成模型的论文。2018 年击败 Dota 2 职业选手的机器人展示了规模化强化学习可以解决复杂的实时策略问题。
但组织核心从一开始就存在张力。前沿 AI 研究需要巨大的计算资源——价值数十亿美元的 GPU 集群。非营利资金模式无法支撑。2019 年,OpenAI 创建了"有限利润"实体 OpenAI LP。微软同年进行了 10 亿美元的初始投资。
GPT 发展轨迹
GPT-1(2018) 是概念验证——1.17 亿参数。GPT-2(2019) 首次引起公众关注——15 亿参数。OpenAI 最初延迟了完整发布,担心被滥用来制造假新闻。GPT-3(2020) 是质的飞跃——1750 亿参数,展示了"少样本学习"能力。GPT-4(2023) 增加了多模态能力,在推理和准确性方面大幅改进,通过了律师资格考试第 90 百分位。GPT-4o(2024) 引入了文本、语音和视觉的原生多模态理解。
ChatGPT:改变一切的产品
ChatGPT 于 2022 年 11 月 30 日推出,两个月内达到 1 亿用户——历史上最快被采用的消费产品。后续更新增加了 GPT-4 访问、网页浏览、DALL-E 图像生成、代码解释器、自定义 GPT 和记忆功能。Plus 订阅 $20/月,企业采用在 2024 年加速。
DALL-E 和 Whisper
DALL-E 3(2023)改善了提示词遵从度和文字渲染。Whisper 开源后成为开发者社区的转录标准,支持 99 种语言。
商业模式转型
OpenAI 通过三个主要渠道产生收入:API 访问、消费者订阅和微软授权协议。年化收入在 2024 年中据报超过 34 亿美元。但成本惊人——训练前沿模型每次花费数亿美元,推理成本估计每年超过 40 亿美元。OpenAI 尚未盈利,预计至少到 2029 年才会盈利。
微软总投资超过 130 亿美元,OpenAI 的模型为 Azure AI 服务、Microsoft 365 Copilot 和 Bing 搜索 AI 提供支持。
争议
利润结构争论——批评者认为有限利润模式是障眼法。2023 年 11 月董事会危机——董事会解雇了 CEO Sam Altman,随后五天混乱后 Altman 复职。员工离职——联合创始人 Ilya Sutskever 于 2024 年 5 月离职。版权诉讼——纽约时报于 2023 年 12 月起诉 OpenAI。数据隐私问题——关于训练数据和用户输入处理的质疑持续存在。
竞争格局
Anthropic(Claude)由前 OpenAI 研究人员创立。Google DeepMind 有 Gemini。Meta 走开源路线推出 Llama。Mistral、Cohere 等在企业和开发者细分市场竞争。
OpenAI 的护城河是品牌知名度、先发优势、微软合作伙伴关系,以及前沿模型能力的领先。但这个领先以月计,而非年计。
未来方向
代理和自主性——向 AI 代理迈进。硬件——探索定制芯片设计。搜索——SearchGPT 原型直接挑战谷歌核心业务。监管和治理——随着 AI 能力增强,监管审查加剧。
更大的图景
OpenAI 的重要性超越其产品,因为它迫使所有其他科技公司加速 AI 努力。ChatGPT 之前,AI 是研究重点。ChatGPT 之后,AI 成为谷歌、Meta、苹果和每家企业软件公司的存在性必要条件。
OpenAI 是否最终会实现其开发安全 AGI 惠及所有人的原始使命,仍是一个开放的问题。不可否认的是,它已经永久改变了人类与技术的关系。现在的问題不是 AI 是否会改变每个行业,而是这种变革是否以负责任的方式发生,以及谁来定义"负责任"的含义。