
IT 之家 1 月 21 日音书开云体育,阶跃星辰昨日上线了 Step-2 系列讲话模子的两款新品 —— 参数目小、性价比更高的 Step-2 mini,以及挑升针对履行创作范畴推出的模子 Step 文豪版。

IT 之家从官方先容获悉,Step-2 mini 和万亿参数大模子 Step-2 比拟,以 3% 独揽的参数目保有了其 80% 以上的模子性能。
与此同期,Step-2 mini 领有更快的生成速率和极高的性价比。在输入 4000 tokens 的情况下,Step-2 mini 的平均首字时延仅 0.17 秒。当今,全球依然不错在阶跃星辰灵通平台调用 Step-2 mini 的 API 接口。输入 1 元 / 百万 token;输出 2 元 / 百万 token。

▲ 网页截图
Step-2 mini 继承了阶跃星辰自主研发的新式谛视力机制架构 —— MFA(Multi-matrix Factorization Attention,多矩阵主见谛视力)非常变体 MFA-Key-Reuse,比拟于常用的 MHA(Multi-Head Attention,多头谛视力)架构,从简了近 94% 的 KV 缓存支拨,领有更快的推理速率并大幅裁减了推理资本。
据官方先容,Step-2 文豪版是一款专为翰墨履行创作研发的模子开云体育,复古了 Step-2 的常识储备、对翰墨雄伟的细节把控智商,特质在于具有愈加雄伟的履行创作智商。Step-2 文豪版勉力处置市面上讲话模子过度对皆导致的履行"假大空",短缺新意和真情实感的问题。