快捷导航
Quick Navigation
联系我们
本周AI项目保举 :逆矩阵、Manifold、Liber AI又一批
公司打算2026年内发布旗舰模子。模子的焦点方针是能响应动做指令并做出物理准确的预测,久远看是建立一个能正在肆意物理场景中进行推理取反现实预测的通用模子。
正在手艺上,Magi-1更接近言语模子“预测下一个token”的逻辑,但把它用正在了视觉时空序列的预测上——这素质上就是一种世界模子的建立体例。公司ARR(年度经常性收入)已超万万美元,近期完成约5000万美元新融资。
逆矩阵科技代表的是世界模子的“强化进修+世界模子”融合线。逆矩阵旗号明显地押注强化进修,认为这将是让模子正在交互中习得物理的环节。
Sand。ai代表的是一条“非支流”但有潜力的手艺线。Diffusion线需要多步迭代去噪,推理速度慢、成本高;自回归线若是能正在生成质量和不变性上冲破,可能正在效率和规模化上构成代际劣势。
大概这和中国AI财产的布局性需求相关。人形机械人、从动驾驶被列为计谋标的目的,而这两个范畴对世界模子的需求最为火急——你不克不及希望一个只会“说”怎样做、但不懂物理纪律的AI去操控机械臂倒一杯水。
极佳视界是国内最早系统结构世界模子的公司之一,打法是“平台+大脑+本体”腿走:世界模子平台GigaWorld、通器具身大脑GigaBrain、自研机械人本体Maker。
![]()
逆矩阵科技把本人定位为“通用世界基座模子”,方针是做一个能实正“理解”物理纪律、而不是“仿照”物理的AI系统。公司聚焦世界根本模子取强化进修的融合研究,手艺径被业界视为继李飞飞和杨立昆之后的“第”。
![]()
公司成立仅40余天就拿到高瓴创投、燕缘创投等机构的超万万美元融资。这种由年轻学者从导、从第一性道理出发摸索通用智能的模式,正代表了AI创业的一种新范式。
创始人兼CEO黄冠是清华从动化系博士,曾正在微软亚洲研究院做深度进修研究,是国内最早一批深度进修研究者。先后正在地平线、鉴智机械人任职,同时有三星中国研究院的工做履历。外行业里,同时具备顶尖科研、量产工程、贸易落地和持续创业经验的人并不多,黄冠是此中一个。焦点团队来自清华、北大、中科院、中科大以及WashU、CMU等院校,还有微软、三星、地平线、百度、博世等企业的资深工程师。
GigaWorld系列的焦点产物是GigaWorld-Policy,这个产物把具身策略和世界模子做了深度融合,不是先建个世界模子再往机械人上套,而是从一起头就绑正在一路设想。正在这根本上,公司推出了通用机械人Maker H01,曾经正在汽车制制、3C电子、仓储物流、家庭办事等多个场景实现了贸易化落地,2026年全年冲刺千台交付量。
Sand。ai选了和U-ViT、DiT等Diffusion线完全分歧的手艺径:自回归架构。2025年4月,Sand。ai开源了自回归视频生成模子Magi-1,通过自回归预测视频块序列来生成视频,生成结果天然流利,和Diffusion类模子有素质差别。
公司硬件-数据-模子闭环迭代,本人研发了从遥操、UMI、ego-centric到采测一体等多种数据采集设备,搭建了模子驱动的完整数据管线。
本期保举的项目,从分歧手艺线切入这场“理解物理世界”的竞赛。它们都不是简单地用AI生成视频,而是让AI正在生成、预测、交互三个层面逐渐迫近物理实正在。像素/视频生成派先让AI能“画”出生避世界,潜空间表征派让AI能“懂”得世界,显式物理派和形态预测派让AI能实正“进”入世界。
极佳视界正在短短一个多月内完成25亿元融资,估值冲破百亿,是国内首个世界模子百亿独角兽。投资方阵容笼盖了某出名科技巨头、多只国度队基金、伊利集团CVC健瓴本钱等。极佳视界创始人称华为把世界模子列为“将来智能世界2035年十大手艺趋向”之首,这也是它投资极佳视界的底层逻辑。从全球范畴看,极佳视界的融资规模和估值程度曾经进入世界模子赛道第一梯队,是国内这个标的目的第一梯队公司。
Manifold AI正在具身智能范畴实现了多个冲破。公司的首个同时支撑挪动和操做交互的及时世界模子,首家把世界模子做为具身根本模子落地到机械人的创业公司。Worldscape Policy精度超越VLA模子的成果,证了然世界模子正在具身智能中的现实价值。华为哈勃的投资,进一步验证了它正在财产端的计谋价值。
概念还正在演化,线还没同一,但标的目的曾经明白:AI必需从理解言语理解世界。中国公司正在这场竞赛中押下了沉注,也拿出了本人的线图。谜底会是什么样,接下来的一到三年,该当就能看到分晓。
LiberAI正在短短三个月内持续完成种子轮、轮、+轮融资,累计融资金额数亿元,由实格基金、红杉中国、美团龙珠、顺为本钱等头部基金结合押注。其成立后三轮估值翻了5倍以上。
正在一个所有要素都正在激励创业公司愈加斗胆定位本人的期间,世界模子标的目的的创业公司送来又一波集体表态。
2024年,刘松铭由AI for Physics范畴转向具身智能,从导RDT系列研发,领先硅谷竞品PI-0模子一个月;随后又先于Generalist的GEN-0模子一个月,发布首个利用大规模UMI无本体人类数据预锻炼范式的具身模子RDT-2。
![]()
创始报酬曹越,特等学金得从、前光年之外结合创始人。曹越正在视频生成和多模态AI标的目的有深切研究,团队的学术基因和立异力很强。
从手艺线看,国内世界模子公司呈现较着的分化。极佳视界走“平台+大脑+本体”闭环线,Sand。ai押注自回归视频生成架构,Manifold AI将自研世界模子做为具身根本模子,逆矩阵科技押注强化进修+推理,Liber AI则聚焦UMI数据取物理纪律先验的融合。
![]()
和支流视频生成派分歧,逆矩阵科技的模子更强调推理能力。创始人吉嘉铭打过一个例如:保守视频生成模子只是正在“画”看起来像实的画面,而世界模子要做的是按照动做指令,推表演物理世界“该当若何”响应。好比,工业场景下,它能预测传送带速度提高10%,产物会不会飞出去这类需要底层物理理解的问题。
正在这个基座上,Worldscape Policy实现了具出身界-动做模子:用世界模子做时空形态预测,连系视觉输入进行空间内生推理并施行动做,据其发布的数据,精度上全面跨越现有VLA模子,具备少样本和零样本施行能力。
2026年4月,极佳视界和一汽模具、阿里云一路,完成了具身智能机械人正在实正在工业制制场景的全流程方案落地。公司打算年内把“视觉-动做”高质量数据做到100万小时以上,世界模子预锻炼数据跨越1000万小时。
创始人兼CEO武伟博士是前商汤科技高管,2015年插手商汤草创团队,无数百人团队办理经验,曾从导商汤世界模子的研发和落地。结合倡议人是传授、教育部长江学者,颁发过包罗十余篇Nature子刊正在内的数百篇论文,其所正在尝试室是AI模仿和世界模子标的目的最早做全体结构的尝试室之一。公司成立不到十个月就累计完成四轮近5亿元融资,正在晚期融资中获得了华为哈勃、君联本钱、同创伟业等机构的投资。
LiberAI成立于2025年12月8号,创始人兼CEO刘松铭是00后本科生特等学金得从(每年仅10人),师从视频生成模子范畴出名专家朱军传授。RDT系列一做,曾颁发多篇ICML、NeurIPS等顶会论文。
世界模子试图填平这道鸿沟,它让AI外行动之前先正在“脑海”中预演后果,就像人类闭眼想象排闼后会看到什么。这让机械人不再只是施行预设指令,而是实正起头“理解”本人所处的世界。
LiberAI聚焦具身智能模子研发,对准人类UMI数据取世界模子融合的下一代手艺范式,已跑通UMI硬件—数据采集—大模子锻炼全流程闭环,焦点产物包罗具身智能大模子及配套UMI硬件、数据采集取锻炼系统。
结合创始人陈博远2004年出生,北大元培学院大四本科生,另一位2025年北大学生年度人物。他大一就颁发顶会论文,大四颁发NeurIPS 2025亮点论文,代表论文获NeurIPS Oral(接管率仅0。35%),谷歌学术援用超2000次。
过去,狂言语模子让AI学会了“措辞”,它能写出流利的文章,却不晓得一个杯子从桌上滑落会发生什么。从理解言语到理解物理世界,两头隔着一道庞大的鸿沟——沉力、碰撞、物体恒存、关系,这些人类凭曲觉就能的法则,对AI来说满是盲区。
正在手艺线上,LiberAI以“Scaling斜率”为,引入两大焦点立异点:一是模态对齐,让海量视频数据反哺稀缺的物理数据;二是归纳偏置,把物理纪律做为人类先验注入模子,加快模子。
像素预测仍是潜空间预测?自回归仍是扩散?显式3D建模仍是现式生成?每个问题都没有尺度谜底。LeCun说狂言语模子的扩展不会带我们达到AGI,世界模子是必经之。李飞飞说AI的下一个前沿是空间智能。黄仁勋把世界模子称为“物理AI的焦点”。
逆矩阵科技的焦点团队极其年轻。创始人吉嘉铭1998年出生,大学人工智能研究院博士生,2025年北大学生年度人物。他是少少数同时拿到苹果、腾讯、蚂蚁三家科技企业承认的学者(Apple Scholar,昔时仅2位),谷歌学术援用超5600次。
Manifold AI给本人的定位是“国内第一家自研世界模子做为具身根本模子落地到机械人的创业公司”。公司自研了Worldscape世界模子,公司这是世界范畴内第一个同时支撑挪动和操做交互的及时世界模子,并把它做为机械人的预锻炼基座。
公司正在成立仅4个月后便发布首个手艺Demo,展示了搭载五指工致手实现双手剥喷鼻蕉、双手拧瓶盖、持锅颠勺等精细操做长程使命的具身根本模子!
刘松铭将LiberAI的愿景定义为“像苹果一样,去定义世界模子的数采范式、本体及系统”。软硬协同的全栈结构、的年轻团队和清晰的物能线,使其成为察看世界模子手艺演进的一个主要窗口。
下一篇:没有了