Sapient 的 HRM-Text：以 1500 美元训练 10 亿参数模型

发布于: 2026-06-10 22:09:56 |

新加坡 AI 初创公司 Sapient Intelligence 发布了开源语言模型 HRM-Text。该模型参数量为 11.5 亿（1.15B），使用 16 张 GPU 训练，耗时 1.9 天，总成本约 1,000–1,500 美元。HRM-Text 已在 GitHub 和 Hugging Face 完整开源，开发者可查看、修改并部署。 Sapient 表示，HRM-Text 的训练数据量显著少于典型基础模型：约 400 亿（40B）结构化 tokens，而不是“万亿级”数据。尽管数据规模更小，HRM-Text 仍取得了有竞争力的基准成绩。在 MATH 基准上得分 56.2；在需要离散推理的 DROP 基准上得分 82.2，并与更大且训练资源更多的模型（如 Meta Llama 3.2 3B、阿里 Qwen 3.5 2B）进行对比。模型背后的公司成立于 2024 年，由 Guan Wang 和 William Chen 创立。公司在 2025 年 6 月的论文中首次展示 HRM 架构，当时用的是 2,700 万参数模型。HRM-Text 相比之下将参数规模约放大 40 倍，同时将算力成本控制在行业相对较低水平。对加密领域与去中心化 AI 来说，最关键的是推理成本。链上或去中心化 GPU 网络（如 Akash、Render、io.net）要运行多十亿参数模型，成本和时延都较高。Sapient 的 HRM-Text 可能让具备推理能力的模型更适合在去中心化基础设施上部署，从而降低对 OpenAI 或 Anthropic 等封闭 API 的依赖。

看涨

这对“去中心化算力”相关资产的市场情绪略偏利好。HRM-Text 的核心并非代币发布，而是可行性/成本的叙事变化：一个 10 亿参数级、具备推理能力的模型，训练成本约 1,000–1,500 美元，并被定位为可通过开源代码部署。这可能提升市场对“去中心化 GPU 在更低边际成本下运行更有吸引力的工作负载”的预期。从交易角度看，投资者往往会对“推理可落地”的基础设施进展进行重新定价。类似历史上，当扩容方案或吞吐能力降低应用运行成本时，市场关注度往往会跟随转移。此次故事中，潜在受益者主要是依赖更低成本模型执行的去中心化算力网络。短期来看，若市场把 HRM-Text 解读为降低使用门槛，可能引发对去中心化 GPU/算力代币的投机性买盘。即便没有直接的协议升级，这类新闻也可能通过情绪与流动性放大价格波动。长期取决于生态能否真正采用（或衍生）HRM-Text 这类架构用于生产推理，并落到 Akash/Render/io.net 等网络的真实算力消耗上。若带来更多使用、收入与可验证需求，情绪可能逐步巩固并形成正反馈。但若采用不足，影响可能很快回落。因此，交易者更应关注后续信号：网络使用量增长、实际部署、持续成交与活跃度，而不仅仅是基准测试新闻。