OpenRouter重磅推出基于100万亿Token数据的AI现状分析报告

作者:互联网

2026-03-29

⼤语⾔模型脚本

人工智能正在重塑全球数字化进程,大型语言模型的实际应用状况成为业界焦点。OpenRouter与a16z联合发布的研究报告,通过分析100万亿Token的真实交互数据,为理解LLM发展趋势提供了重要参考。

背景与研究意义

这项由OpenRouter和a16z共同开展的深度调查,揭示了AI领域正在发生的重大变革。研究人员基于OpenRouter平台收集的100万亿Token用户交互元数据展开分析,时间跨度从2023年底持续至2025年11月,重点关注最近一年的发展趋势。这项研究覆盖了全球300多个模型和60多家服务提供商,是目前规模最大的LLM实证研究项目。不同于以往依赖学术基准测试或用户数量宣称的研究方法,OpenRouter首次通过真实算力消耗数据,准确展现了开发者和企业实际使用AI的方式。

开源模型的崛起

开源与闭源模型的对比

  1. 闭源模型:在高价值应用场景仍占据主导地位,约占总Token使用量的70%。特别是在企业级应用和受监管领域,如金融合规、医疗咨询等,用户更倾向于选择OpenAI、Anthropic、Google等公司的专有模型。
  2. 开源模型:到2025年底,其市场份额稳定在30%,显示出持续的增长态势。这种增长并非短期实验性使用,而是深度融入生产环境的体现。

中国开源模型的爆发

  1. 数据变化:中国模型的市场份额从2024年底的1.2%,到2025年下半年某些周次已接近所有模型流量的30%。
  2. 竞争优势
    1. 快速迭代:如DeepSeek、Qwen等模型通过高频更新快速适应不同场景需求。
    2. 场景适配:在中文处理、角色扮演、代码生成等领域展现出接近甚至超越开源模型的性能。

模型规模偏好:"中型模型"成新主流

  1. 小型模型:市场份额持续下滑,虽然Google等公司推出新品,但由于能力限制,用户粘性较低。
  2. 中型模型:在2025年迅速崛起,成为开发者的首选方案。
  3. 大型模型:需求呈现多元化特征,主要用于处理复杂任务。

使用场景"两极分化",编程与角色扮演统治流量

开源模型:角色扮演占半壁江山

  1. 数据表现:开源模型中52%的Token用于角色扮演场景。
  2. 应用细节:包括游戏NPC对话、同人小说创作等,用户需求集中在灵活性、情感细腻度和低内容限制方面。

全平台:编程成"第一大场景"

  1. 增长趋势:编程任务Token占比从2025年初的11%飙升至年底的50%以上。
  2. 竞争格局
    1. Anthropic:长期占据编程场景60%以上的份额。
    2. 追赶者:包括OpenAI、Google以及中国开源模型等新势力。

Agentic推理成新范式,AI从"生成器"变"分析引擎"

推理模型:半年内占比超50%

  1. 技术变革:LLM从单通道文本生成转向多步内部推理。
  2. 领先模型:xAI的Grok Code Fast 1异军突起,超越Google和OpenAI的同类产品。

工具调用与长上下文

  1. 工具调用常态化:2025年工具调用请求占比稳步上升。
  2. 上下文长度增长
    1. 平均prompt长度增长4倍
    2. completion长度增长3倍

LLM被用来做了什么?

编程成第一大核心任务

  1. 市场表现:编程类请求Token占比从11%飙升至50%以上。
  2. 竞争态势
    1. Anthropic Claude系列长期占据主导
    2. 其他厂商正在快速追赶

十二大常见任务的内部结构

  1. 角色扮演:占开源模型Token使用量的52%。
  2. 编程细分:需求呈现专业化趋势。
  3. 长尾领域特征
    1. 科学领域聚焦AI相关主题
    2. 健康领域需求复杂分散

LLM的使用在不同地区有何差异

区域使用分布

  1. 北美:仍是最大市场但份额下降。
  2. 亚洲:成为增长最快的消费市场。

语言分布

  1. 英语:占据绝对主导地位。
  2. 其他语言:需求正在逐步提升。

用户留存规律:"灰姑娘水晶鞋效应"决定长期粘性

核心现象

  1. 多数模型用户留存率呈现高流失特征。
  2. "灰姑娘水晶鞋效应"决定用户长期粘性。

典型留存模式

  1. 先发优势型:早期用户形成稳定匹配。
  2. 不匹配型:难以建立稳定用户群。

成本与使用动态,市场分层显著

开源与闭源模型对比

  1. 闭源模型:集中在高成本、高使用量象限。
  2. 开源模型:主要位于低成本、高使用量区域。

成本-使用量四象限分布

  1. 高级工作负载:用户愿为复杂推理支付溢价。
  2. 大众市场驱动:开源模型凭借成本优势占据主导。

讨论与启示

核心洞见

  1. 多模型生态:成为主流发展趋势。
  2. 应用场景:已超越传统生产力范畴。

局限性:数据覆盖范围存在一定限制。

未来趋势:LLM将深度融入全球计算基础设施。

报告地址

  1. 相关标签:

    Grok