Sapient 的 HRM-Text:以 1500 美元训练 10 亿参数模型
新加坡 AI 初创公司 Sapient Intelligence 发布了开源语言模型 HRM-Text。该模型参数量为 11.5 亿(1.15B),使用 16 张 GPU 训练,耗时 1.9 天,总成本约 1,000–1,500 美元。HRM-Text 已在 GitHub 和 Hugging Face 完整开源,开发者可查看、修改并部署。
Sapient 表示,HRM-Text 的训练数据量显著少于典型基础模型:约 400 亿(40B)结构化 tokens,而不是“万亿级”数据。尽管数据规模更小,HRM-Text 仍取得了有竞争力的基准成绩。在 MATH 基准上得分 56.2;在需要离散推理的 DROP 基准上得分 82.2,并与更大且训练资源更多的模型(如 Meta Llama 3.2 3B、阿里 Qwen 3.5 2B)进行对比。
模型背后的公司成立于 2024 年,由 Guan Wang 和 William Chen 创立。公司在 2025 年 6 月的论文中首次展示 HRM 架构,当时用的是 2,700 万参数模型。HRM-Text 相比之下将参数规模约放大 40 倍,同时将算力成本控制在行业相对较低水平。
对加密领域与去中心化 AI 来说,最关键的是推理成本。链上或去中心化 GPU 网络(如 Akash、Render、io.net)要运行多十亿参数模型,成本和时延都较高。Sapient 的 HRM-Text 可能让具备推理能力的模型更适合在去中心化基础设施上部署,从而降低对 OpenAI 或 Anthropic 等封闭 API 的依赖。
看涨
这对“去中心化算力”相关资产的市场情绪略偏利好。HRM-Text 的核心并非代币发布,而是可行性/成本的叙事变化:一个 10 亿参数级、具备推理能力的模型,训练成本约 1,000–1,500 美元,并被定位为可通过开源代码部署。这可能提升市场对“去中心化 GPU 在更低边际成本下运行更有吸引力的工作负载”的预期。
从交易角度看,投资者往往会对“推理可落地”的基础设施进展进行重新定价。类似历史上,当扩容方案或吞吐能力降低应用运行成本时,市场关注度往往会跟随转移。此次故事中,潜在受益者主要是依赖更低成本模型执行的去中心化算力网络。
短期来看,若市场把 HRM-Text 解读为降低使用门槛,可能引发对去中心化 GPU/算力代币的投机性买盘。即便没有直接的协议升级,这类新闻也可能通过情绪与流动性放大价格波动。
长期取决于生态能否真正采用(或衍生)HRM-Text 这类架构用于生产推理,并落到 Akash/Render/io.net 等网络的真实算力消耗上。若带来更多使用、收入与可验证需求,情绪可能逐步巩固并形成正反馈。但若采用不足,影响可能很快回落。因此,交易者更应关注后续信号:网络使用量增长、实际部署、持续成交与活跃度,而不仅仅是基准测试新闻。