475 目标世界第一。_刷抖音爆奖励，开局一辆法拉利

关灯

护眼

字体：

大

中

小

475 目标世界第一。

保存书签

书架管理

返回列表

很快，陈凯就来到了魔都，和苏阳会面。 “苏总，我昨天看了你的招聘视频。”陈凯放下包，开门见山，“一亿年薪，世界第一。我想知道你凭什么说能做到。” 苏阳没有立刻回答。他起身走到办公桌旁，拿起一个银色的U盘，回到沙发边，把U盘放在茶几上，推到陈凯面前。 “这里面是盘古大模型的技术架构概要。不是PPT，不是概念，是可落地的工程方案。你先看。看完再决定要不要聊下去。” 陈凯看着那个小小的U盘，犹豫了一秒，然后拿起它，插进了自己的笔记本电脑。文件打开。第一页：模型架构——混合专家模型，总参数量两万亿，激活参数量三千亿，上下文长度一百万字。他的手指顿住了。两万亿参数。目前公开的全球最大模型，参数量也不过一万亿出头。而盘古直接翻倍。更关键的是那个“激活参数量”——这意味着模型虽然庞大，但每次推理只调用部分参数，既保证能力，又控制成本。他的目光往下扫。推理速度：比现有主流模型快十倍。训练成本：行业平均水平的二十分之一。陈凯的呼吸开始变得急促。第二页：核心技术——独创的稀疏注意力机制，长文本处理效率提升两个数量级；自研分布式训练框架，万卡集群线性加速；知识截止日期为最新，支持持续更新。陈凯摘下眼镜，揉了揉眼睛，又重新戴上。这些东西，有些是他和团队在千问尝试过但没做成的，有些是他只在学术论文里见过、从未在工程上实现的，有些甚至是他想都没想过的。第三页：应用场景。第四页：商业模式。第五页：…… 陈凯一页一页地翻，翻到最后一页时，他的手在微微发抖。他抬起头，看着苏阳。苏阳正端着茶杯，不紧不慢地喝着，像在看一场已经知道结局的电影。 “苏总，这些技术方案……是谁做的？”陈凯的声音有些发涩。苏阳放下茶杯，语气平静：“你不用管谁做的。你只需要回答我——你能不能把它做出来？” 陈凯沉默了很久。他想起在千问的那些日子，每次提出新的技术方案，都要被产品部门质疑“这能赚钱吗”，被管理层质问“竞争对手有没有做”，被财务部门驳回“预算超了”。技术理想在资本面前，一次次退让，一次次妥协。而眼前这个人，给他看了一份足以颠覆整个行业的技术方案，然后问他——你能不能把它做出来。没有问成本，没有问周期，没有问ROI。只问能不能。 “能。”陈凯说。声音不大，但很坚定。苏阳点了点头，站起身，走到窗边。阳光透过玻璃照在他的侧脸上，勾勒出一个清晰的轮廓。 “陈博士，我不是做技术的。我不懂算法，不懂模型，不懂训练框架。但我知道一件事——在这个行业里，华夏一直被美国压着。GPT出的时候，我们追；Gemini出的时候，我们追；每次都是追。我不想追了。” 他转过身，看着陈凯：“盘古要做，就做世界第一。不是国内第一，是世界第一。你做得到，我给你一切资源。你做不到，我换人做。” 陈凯站起身来，伸出手：“苏总，我做得到。” 苏阳握住他的手，力度不大，但很稳：“那就这么定了。盘古大模型的技术负责人，是你。年薪一亿。团队你来搭，预算你来批。我不干涉你的技术决策。” 陈凯深吸一口气，点了点头。很快，两人就签订了合同，由陈凯担任盘古大模型的开发负责人。签约之后的下午，陈凯立马开始忙碌起来。他去魔都软件园，立马签订了办公场地。然后开始招兵买马，招聘人才。他在这行干了快二十年，脑子里装着一份华夏AI领域最顶尖人才的图谱——谁在算法上有真功夫，谁只会搭积木吹牛；谁的工程能力强，谁只会写论文发顶会；谁在训练框架上有独门绝技，谁只是调参熟练工。这些人，他要么带过，要么合作过，要么竞争过。每一个人的技术底细、性格特点、当前薪资、离职意愿，他都能说出个八九不离十。第一个电话打给赵宇。千问AI的资深算法工程师，陈凯在千问时期带出来的徒弟，国内少数几个真正懂MOE架构的人。电话响了三声就接了。 “赵宇，我是陈凯。” “老师？您真的去苏总那边了？”赵宇的声音压得很低，像是在办公室偷偷接电话。 “来了。现在我这边缺人，你来不来？薪资翻倍。你负责盘古的算法架构。” 电话那头沉默了两秒。赵宇咬了咬牙：“老师，我跟你干。什么时候报到？” “明天。” 挂了电话，陈凯在名单上划掉了赵宇的名字，写下“算法组负责人”。第二个电话打给林晓，百川的推理引擎专家。他在稀疏注意力方面的研究业内公认一流，但百川给他的资源不够，他的技术方案一直被搁置。陈凯知道，林晓等这个机会等了很久。 “林晓，我是陈凯。盘古需要你来做推理加速。条件你开。” 林晓没有犹豫：“陈老师，我今晚就把简历发给你。” 第三个电话打给陈默，智谱的训练框架负责人。他是分布式训练领域的老将，曾经在智谱主导过千卡集群的训练框架搭建。陈凯和他有过几次技术交流，互相欣赏。 “陈默，苏总这边要搭万卡集群，你来带训练框架组。” “万卡？”陈默的声音明显提高了，“苏总真舍得？” “真舍得。你来不来？” “来。” 一个下午，陈凯打了二十多个电话。名单上的人，有的当场答应，有的说需要考虑，有的委婉拒绝。他不在乎。答应的人，他记下来；需要考虑的，他给三天时间；拒绝的，他划掉，换上备选。很快，陈凯带着赵宇、林晓、陈默三个人，坐在幻神AI的会议室里。四个人，一台投影仪，一杯咖啡。陈凯站在白板前，画了一张架构图——底层是算力集群，中间是训练框架，上层是模型架构，旁边是数据pipeline和评测体系。 “盘古的目标，十二个月内上线。第一版模型，一万亿参数，一百万上下文，多模态。”他没有回头看，笔在白板上刷刷地写，“算力方面，苏总已经批了预算，第一期采购一万张H800。训练框架，陈默你负责。算法架构，赵宇你负责。推理引擎，林晓你负责。数据团队，我亲自带。” 赵宇举手问了一个问题：“老师，一万张H800，国内能调动的算力不超过五万张。苏总一次性拿一万张，其他厂商会不会有意见？” 陈凯转过身，看了他一眼，语气平淡：“这不是我们需要考虑的问题。苏总会搞定。” 会议室里安静了一秒。然后陈默笑了：“也是。” 消息传得比他们预想的快。科技媒体就开始报道：“幻神AI组建盘古大模型团队，陈凯出任技术负责人，已从千问、百川、智谱等公司挖走核心算法和工程人才。”紧接着，又有媒体跟进：“据知情人士透露，幻神AI已采购一万张H800GPU，用于盘古大模型的训练，总投入超过二十亿元。” 热搜上，一个新词条冲了上来——“盘古大模型”。抖音上，科技博主们开始分析盘古的技术架构和商业前景。知乎上，问题“如何评价幻神AI的盘古大模型”浏览量突破百万。有人说苏阳是在烧钱，有人说陈凯是被高估了，有人说华夏AI终于有了真正的挑战者。但不管怎么说，所有人都在讨论盘古。