返回

刷抖音爆奖励,开局一辆法拉利

首页
关灯
护眼
字体:
475 目标世界第一。
保存书签 书架管理 返回列表
很快,陈凯就来到了魔都,和苏阳会面。 “苏总,我昨天看了你的招聘视频。”陈凯放下包,开门见山,“一亿年薪,世界第一。我想知道你凭什么说能做到。” 苏阳没有立刻回答。他起身走到办公桌旁,拿起一个银色的U盘,回到沙发边,把U盘放在茶几上,推到陈凯面前。 “这里面是盘古大模型的技术架构概要。不是PPT,不是概念,是可落地的工程方案。你先看。看完再决定要不要聊下去。” 陈凯看着那个小小的U盘,犹豫了一秒,然后拿起它,插进了自己的笔记本电脑。 文件打开。第一页:模型架构——混合专家模型,总参数量两万亿,激活参数量三千亿,上下文长度一百万字。 他的手指顿住了。两万亿参数。目前公开的全球最大模型,参数量也不过一万亿出头。而盘古直接翻倍。更关键的是那个“激活参数量”——这意味着模型虽然庞大,但每次推理只调用部分参数,既保证能力,又控制成本。 他的目光往下扫。推理速度:比现有主流模型快十倍。训练成本:行业平均水平的二十分之一。陈凯的呼吸开始变得急促。 第二页:核心技术——独创的稀疏注意力机制,长文本处理效率提升两个数量级;自研分布式训练框架,万卡集群线性加速;知识截止日期为最新,支持持续更新。 陈凯摘下眼镜,揉了揉眼睛,又重新戴上。这些东西,有些是他和团队在千问尝试过但没做成的,有些是他只在学术论文里见过、从未在工程上实现的,有些甚至是他想都没想过的。 第三页:应用场景。第四页:商业模式。第五页:…… 陈凯一页一页地翻,翻到最后一页时,他的手在微微发抖。他抬起头,看着苏阳。苏阳正端着茶杯,不紧不慢地喝着,像在看一场已经知道结局的电影。 “苏总,这些技术方案……是谁做的?”陈凯的声音有些发涩。 苏阳放下茶杯,语气平静:“你不用管谁做的。你只需要回答我——你能不能把它做出来?” 陈凯沉默了很久。他想起在千问的那些日子,每次提出新的技术方案,都要被产品部门质疑“这能赚钱吗”,被管理层质问“竞争对手有没有做”,被财务部门驳回“预算超了”。技术理想在资本面前,一次次退让,一次次妥协。而眼前这个人,给他看了一份足以颠覆整个行业的技术方案,然后问他——你能不能把它做出来。 没有问成本,没有问周期,没有问ROI。只问能不能。 “能。”陈凯说。 声音不大,但很坚定。 苏阳点了点头,站起身,走到窗边。阳光透过玻璃照在他的侧脸上,勾勒出一个清晰的轮廓。 “陈博士,我不是做技术的。我不懂算法,不懂模型,不懂训练框架。但我知道一件事——在这个行业里,华夏一直被美国压着。GPT出的时候,我们追;Gemini出的时候,我们追;每次都是追。我不想追了。” 他转过身,看着陈凯:“盘古要做,就做世界第一。不是国内第一,是世界第一。你做得到,我给你一切资源。你做不到,我换人做。” 陈凯站起身来,伸出手:“苏总,我做得到。” 苏阳握住他的手,力度不大,但很稳:“那就这么定了。盘古大模型的技术负责人,是你。年薪一亿。团队你来搭,预算你来批。我不干涉你的技术决策。” 陈凯深吸一口气,点了点头。 很快,两人就签订了合同,由陈凯担任盘古大模型的开发负责人。 签约之后的下午,陈凯立马开始忙碌起来。 他去魔都软件园,立马签订了办公场地。 然后开始招兵买马,招聘人才。 他在这行干了快二十年,脑子里装着一份华夏AI领域最顶尖人才的图谱——谁在算法上有真功夫,谁只会搭积木吹牛;谁的工程能力强,谁只会写论文发顶会;谁在训练框架上有独门绝技,谁只是调参熟练工。这些人,他要么带过,要么合作过,要么竞争过。每一个人的技术底细、性格特点、当前薪资、离职意愿,他都能说出个八九不离十。 第一个电话打给赵宇。千问AI的资深算法工程师,陈凯在千问时期带出来的徒弟,国内少数几个真正懂MOE架构的人。电话响了三声就接了。 “赵宇,我是陈凯。” “老师?您真的去苏总那边了?”赵宇的声音压得很低,像是在办公室偷偷接电话。 “来了。现在我这边缺人,你来不来?薪资翻倍。你负责盘古的算法架构。” 电话那头沉默了两秒。赵宇咬了咬牙:“老师,我跟你干。什么时候报到?” “明天。” 挂了电话,陈凯在名单上划掉了赵宇的名字,写下“算法组负责人”。第二个电话打给林晓,百川的推理引擎专家。他在稀疏注意力方面的研究业内公认一流,但百川给他的资源不够,他的技术方案一直被搁置。陈凯知道,林晓等这个机会等了很久。 “林晓,我是陈凯。盘古需要你来做推理加速。条件你开。” 林晓没有犹豫:“陈老师,我今晚就把简历发给你。” 第三个电话打给陈默,智谱的训练框架负责人。他是分布式训练领域的老将,曾经在智谱主导过千卡集群的训练框架搭建。陈凯和他有过几次技术交流,互相欣赏。 “陈默,苏总这边要搭万卡集群,你来带训练框架组。” “万卡?”陈默的声音明显提高了,“苏总真舍得?” “真舍得。你来不来?” “来。” 一个下午,陈凯打了二十多个电话。名单上的人,有的当场答应,有的说需要考虑,有的委婉拒绝。他不在乎。答应的人,他记下来;需要考虑的,他给三天时间;拒绝的,他划掉,换上备选。 很快,陈凯带着赵宇、林晓、陈默三个人,坐在幻神AI的会议室里。四个人,一台投影仪,一杯咖啡。陈凯站在白板前,画了一张架构图——底层是算力集群,中间是训练框架,上层是模型架构,旁边是数据pipeline和评测体系。 “盘古的目标,十二个月内上线。第一版模型,一万亿参数,一百万上下文,多模态。”他没有回头看,笔在白板上刷刷地写,“算力方面,苏总已经批了预算,第一期采购一万张H800。训练框架,陈默你负责。算法架构,赵宇你负责。推理引擎,林晓你负责。数据团队,我亲自带。” 赵宇举手问了一个问题:“老师,一万张H800,国内能调动的算力不超过五万张。苏总一次性拿一万张,其他厂商会不会有意见?” 陈凯转过身,看了他一眼,语气平淡:“这不是我们需要考虑的问题。苏总会搞定。” 会议室里安静了一秒。然后陈默笑了:“也是。” 消息传得比他们预想的快。 科技媒体就开始报道:“幻神AI组建盘古大模型团队,陈凯出任技术负责人,已从千问、百川、智谱等公司挖走核心算法和工程人才。”紧接着,又有媒体跟进:“据知情人士透露,幻神AI已采购一万张H800GPU,用于盘古大模型的训练,总投入超过二十亿元。” 热搜上,一个新词条冲了上来——“盘古大模型”。抖音上,科技博主们开始分析盘古的技术架构和商业前景。知乎上,问题“如何评价幻神AI的盘古大模型”浏览量突破百万。有人说苏阳是在烧钱,有人说陈凯是被高估了,有人说华夏AI终于有了真正的挑战者。但不管怎么说,所有人都在讨论盘古。
上一章 目录 下一章