文|周鑫雨制服丝袜 在线
剪辑|苏建勋
"零一万物毫不烧毁预查验。"
2024 年 10 月 16 日,AI 独角兽零一万物独创东谈主兼 CEO 李开复,公开立了军令状。也在吞并天,零一万物发布了最新的 MoE(羼杂众人)架构的旗舰大模子:Yi-Lightning。
这亦然时隔 5 个月后,零一万物再次更新模子的新动态。
李开复示意,Yi-Lightning 的查验只用了 2000 张 GPU,查验周期仅一个半月,老本只消 300 多万好意思元,是埃隆 · 马斯克的 xAI 老本的 1%、2%。
查验老本天然低,但 Yi-Lightning 的性能并莫得打扣头。在加州大学伯克利分校 LMSYS 团队的 Chatbot Arena(聊天机器东谈主竞技场)总榜单上,Yi-Lightning 的性能与 xAI 的 Grok-2-08-13 模子比肩第 6,况且卓绝了 OpenAI 的 GPT-4o-2024-05-13。
LMSYS 团队的 Chatbot Arena(聊天机器东谈主竞技场)大讲话模子概述智力总榜单。图源:零一万物
值得注主见是,在汉文智力上,Yi-Lightning 与 OpenAI 的最新模子 o1-mini 版块比肩获取了第二;在数学智力上,Yi-Lightning 和 Gemini-1.5-Pro-002 比肩第 3,仅次于在数学、逻辑推理见长的 o1。
在订价上,Yi-Lightning 也创了零一万物模子的最低订价:0.99 元 / 百万 Token。
牛奶姐姐 足交零一万物模子订价。图源:零一万物官网
天然,榜单名次并不虞味着模子在职务场景下的智力。在发布会上,零一万物预防在实用性上,让 Yi-Lightining 秀了一把肌肉。
比如,Yi-Lightining 比较 2024 年 5 月发布的 Yi-Large,首包时间(从接受到任务央求到系统开动输出反映后果之间的时间)数落了一半,最高生成速率赞成了近四倍。
具体到翻译场景,Yi-Lightining 比豆包、DeepSeek、通义千问最新旗舰模子的翻译速率更快,且翻译后果愈加信达雅。
四个模子在商酌翻译任务上的阐明。图源:零一万物
发布会上,李开复也揭秘了 Yi-Lightning 的查验计策:
专有的羼杂注观念机制(Hybrid Attention):在处分长序列数据的流程中,不祥提高性能的同期,还能数落推理老本;
动态 Top-P 路由机制:凭证任务难度自动遴选最安妥的众人汇注组合;
多阶段查验(Multi-stage Training):让模子在不同阶段汲取不同的学问,浮浅 mixing 团队进行数据配比的调试责任,并能保证不同阶段的查验速率和雄厚性。
在 2024 年 5 月份的发布会上,零一万物在国内发布了 C 端的坐蓐力居品"万知"。时隔五个月,零一万物的 B 端买卖化领土也有了新的进展——聚焦零卖和电商等场景的 AI 2.0 数字东谈主。
AI 2.0 数字东谈主的背后,是电商话术大模子、变装大模子、直播声息大模子的多模态协同查验。当今,AI 2.0 数字东谈主还接入了 Yi-Lightning。用户只需要输入出售的商品、声息的性别和语调,就能生成相应的数字东谈主。
零一万物 AI 2.0 数字东谈主接入 Yi-Lightning 前后对比。图源:零一万物
如今,大模子发展也来到了技巧探索的深水区。即便立下了"毫不烧毁预查验"的军令状,李开复也承认:"但不是每家公司王人不错作念这件事情,作念这件事情的老本也比较高,以后有可能会越来越少的大模子公司查验作念预查验。"
不外,对如今六家大模子独角兽,李开复也曾抱有乐不雅的气派:
"据我所知,这六家公司融资额度王人是够的,咱们作念预查验的 production run,查验一次三四百万好意思金,这个钱亦然头部公司王人付得起,我以为中国的六家大模子公司只消有够好的东谈主才,思作念预查验的决心,融资额跟芯片王人不会是问题的。"
迎接交流!制服丝袜 在线