7 月 27 日消息,2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)正在举行。
本届 WAIC 以"智能时代 同球共济"为主题,来自 30 余个国家和地区的 1200 余位嘉宾齐聚沪上,其中包括 12 位图灵奖、诺贝尔奖得主,80 多位中外院士,以及多个国际顶尖实验室代表;展厅方面,展览面积首次突破 7 万平方米,吸引 800 多家企业参展,集中发布 3000 余项前沿展品,包括 40 余款大模型、50 余款 AI 终端产品、60 余款智能机器人及 100 余款"全球首发"或"中国首秀"新品。
WAIC 大会期间,国内端边大模型 AI 芯片公司后摩智能发布了全新端边大模型 AI 芯片——后摩漫界 M50,同步推出力擎系列 M.2 卡、力谋系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。
这是国内首颗面向端边大模型的存算一体 AI 芯片。M50 芯片实现了 160TOPS(INT8)、100TFLOPS(bFP16)的物理算力,搭配最大 48GB 内存与 153.6 GB/s 的超高带宽,典型功耗仅 10W,相当于手机快充的功率,就能让 PC、智能语音设备、机器人等智能移动终端高效运行 1.5B 到 70B(700 亿)参数的本地大模型。和传统架构相比,M50 的能效提升 5-10 倍,真正实现"高算力、低功耗、即插即用"。
会后媒体交流时,后摩智能 CEO 吴强表示,目前公司研发的端边推理加速卡可以适配从 7B 到 70B 的 DeepSeek 模型,芯片上限大约在 100B(1000 亿)参数规模,并且在与中国移动一起研发一体机产品。他认为,具身智能机器人更像是十年前的智能驾驶,这一赛道发展才刚刚开始,这是一个很大的新兴垂直赛道,格局还未定,大家依然有机会,一旦具身智能机器人发展起来,肯定比智能驾驶要大很多。"具身智能是我们的机会之一。"
据悉,后摩智能成立于 2020 年,致力于利用先进存储器件等技术做存算一体大算力智驾芯片,提供高能效比、低成本芯片及解决方案。公司创始人吴强毕业于美国普林斯顿大学,早前曾在 AMD、Facebook 公司任职,此前是地平线公司 CTO,团队硕博占比达 70% 以上。
实际上,所谓存算一体(Computing in Memory)指的是在存储器中嵌入计算能力,以新的运算架构进行二维和三维矩阵乘法 / 加法运算。与以往的冯诺依曼架构相比,其打破了由于计算单元与存储单元过于独立而导致的"存储墙",解决算力发展速度远超存储、存储带宽限制计算系统的速度等问题,成为后摩尔时代下新的技术发展路径。
公开数据显示,预计到 2030 年,中国存算一体芯片市场规模将超过 1100 亿元。
成立至今,后摩智能已完成四轮融资,投资方包括红杉资本中国基金、启明创投、经纬创投、联想创投、和玉资本、金浦投资等机构。最近一轮是在 2024 年 7 月,后摩智能宣布完成数亿元人民币的战略融资,由中国移动旗下北京中移数字新经济产业基金、上海中移数字转型产业基金共同对公司进行投资。
鸿途 H30 发布两年之后,后摩智能全面转型和聚焦端边大模型 AI 算力赛道,其研发的端边 AI 芯片,将广泛应用于 Pad、PC、智能语音设备、机器人等多种终端,以及一体机、计算盒子、工作站等智能边缘设备上,落地于消费终端、智能办公、智能工业等领域场景。
吴强坦言,这个转型过程非常痛苦,主要是认为存算一体和大模型有很多契合点。
"其实很多人问我为什么要转变,而从 2023 年下半年开始,我觉得智能驾驶这个赛道有可能走不通,当时整个自动驾驶赛道非常卷,格局逐渐稳定,给新入局的机会越来越少。为了体现存算一体的优势,所以一代芯片算力做得很大,但忽略了当时的市场需求,算力大就意味着成本高,而 2023 年行业都在讲价格、讲低成本,我们那个算力太超前、太冗余了,今天大家还会讲几百 T 和高阶,那个阶段不相信 L3,很多业内人士说 L3 永远不会到来,都在拼算力成本,当时芯片和市场需求有很大 Gap(差距)。所以,如果我们做一个新的芯片挤入智能驾驶,市场窗口就又错过了,当时新入局的机会越来越少,我在想要不要转变,当时非常痛苦。
研发非常痛苦,大家不愿意,而对我来讲也很痛苦,大家会质疑你为何没有坚持到底,但又明显知道自动驾驶芯片赛道走不通。最后,还是生存的压力大于面子,我们选择转型,我认为端边大模型有很大的新兴机会,并没有什么巨头在里面。2024 年初,我们快速把第一代芯片调整了一版推出 M30,后来中国移动对我们帮助很大,用 M30 运行 600 亿参数大模型,给了我们更多信心,认为存算一体和大模型有契合,最后转到这个方向并开始规划,用时不到两年的时间。"吴强称。
谈到新的产品,吴强表示,力谋 LM5050 加速卡与力谋 LM5070 加速卡分别集成 2 颗、4 颗 M50 芯片,为单机及超大模型推理提供高密度算力,最高可达 640TOPS。此外,M50 芯片的存算一体技术从 SRAM-CIM,到 DRAM-PIM,一直在探索 DRAM-PIM 的产品化。
展望未来,吴强强调,后摩智能已启动下一代 DRAM-PIM 技术的 AI 芯片研发,通过将计算单元直接嵌入 DRAM 阵列,使计算与存储的协同更加紧密高效,而且能效较现有水平再提升三倍,推动百亿参数大模型在终端设备实现普及,让更强大的 AI 算力能够融入 PC、平板等日常设备。该芯片预计最快于 2026 年对外发布。
" M50 的发布只是一个开始,我们的目标是让大模型算力像电力一样随处可得、随取随用,真正走进每一条产线、每一台设备、每一个人的指尖。"吴强称。
(本文首发于钛媒体 App,作者|林志佳,编辑|盖虹达)
线上配资公司提示:文章来自网络,不代表本站观点。