So ra公布后,七火山很快紧随其后,发布了自身号称 国产版“Sora” 的文生视频大模型——Etna。并宣称其以“4K” 、“60帧”、“15秒”等硬性指标,打破了国内文生视频AI的各种纪录。
来自伊利诺伊大学香槟分校(UIUC)的研究者们就针对这个问题,进行了一次深入的探索。他们发现的结论可能会让你大吃一惊:是的,这些模型不仅自发地学会了3D理解,而且其 3D感知能力在某些方面甚至超越了那些专门用3D数据训练出来的“专家模型” !这篇论文为我们揭示了通过大规模2D数据学习3D知识的巨大潜力。
中国大模型领域的两家头部企业智谱与MiniMax,近期先后向港股市场递交招股书,引发资本市场对“全球大模型第一股”的激烈讨论。这场竞争背后,折射出AI产业两种截然不同的发展路径:一方深耕底层技术,试图成为AI时代的“水电煤”;另一方聚焦应用创新,不断推出吸睛的消费级产品。两种模式在资本市场的碰撞,实质是AI产业价值归属的深度较量。
AI会不会替代我?当大众媒体焦虑这个问题时,我们发现硅谷实习生们却拿下天价薪酬。OpenAI 的驻研实习项目,月薪 1.83万 美元,折合人民币 13 万。Anthropic 的 AI 安全研究金计划,每周津贴 3850 美元,外加每月 1.5万 ...
至顶头条 on MSN
我们希望AI有多智能?世界模型可能比我们更懂世界
近年来,AI学会了写作、生成图像、创建视频甚至编写代码。随着这些能力成为主流,研究重点转向更深层问题:机器能否真正理解世界运作方式?世界模型应运而生,从1950年代概念到2024年OpenAI的Sora、2025年英伟达Cosmos等突破性应用。与语言模型基于文本预测不同,世界模型专注预测环境变化,通过学习因果关系实现推理规划。在机器人、自动驾驶等物理AI领域前景广阔,但面临计算资源需求高、数据收 ...
随着 AI 技术的进步,那边在 OpenAI 大杀四方、用 Sora 彻底革了视频的命之际,这边的微软悄然对传统用户界面“出招”,最新带来一款用于构建用户界面(UI)交互智能体的 Agent 框架——UFO,能够快速理解和执行用户的自然语言请求,它的发布也向外界展示了未来与 Windows 交互是多么的容易。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果