ZAKER科技 on MSN
4个月,估值21亿!00后广州少女惊艳硅谷
资本的热情也很快被点燃。Axiom Math成立仅4个月,就完成6400万美元(约合人民币4.6亿元)种子轮融资,由B Capital领投,Greycroft、Madrona等知名机构跟投,投后估值直奔3亿美元(约合人民币21.39亿元)。B ...
她放弃 斯坦福 双博士在读资格,公司还没推出任何产品,估值就飙升到21亿元人民币,更让人意外的是,57岁的传奇数学家竟主动放弃终身教职,甘愿投靠她麾下效力。
DeepSeek的这篇论文针对这些问题提出了改进框架mHC架构。这一架构类似于给超连接的信息通道加了一套“交通规则”,在保留性能优势的同时,恢复了信息原样传递的特性,使模型训练更稳定且更容易扩展,从而推动大模型底层架构的工业化落地。
1月1日消息,DeepSeek赶在新年前发送了“贺礼”,在新论文中提出了名为mHC(流形约束超连接)的新网络架构,旨在解决传统架构在大规模模型训练中的不稳定性问题,这一研究或将为下一代基础架构的演进指明新方向。
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!2025年的最后一天,DeepSeek发了篇梁文锋署名的重磅论文。论文提出的mHC( ...
初创公司 Axiom Math 由 24 岁的 Carina Hong 创立,致力于开发能够自主验证逻辑正确性的“AI 数学家”。该公司在 2025 年获得 6400 万美元融资,核心团队汇聚了来自 Meta 和 Google 的顶尖人才以及知名数学家。与主流大模型不同,其系统通过 Lean 编程语言确保推理过程的每一步都可追溯、可检查,解决了 AI 产出结果难以验收的信任难题。通过在 ...
I lead a mobile incubation team in the Content Services organization, building engaging consumer facing experiences leveraging large-scale data, natural language and computer vision models. Earlier, I ...
它是一套真正的数学大考卷,不是那种简单的公式代入、算算微积分的小测验,而是 专家级的原创难题 ,覆盖数论、实分析、代数几何、范畴论等,甚至是科研级别、要花 数小时甚至数天 才能解开的难题。
人工智能领域迎来一项突破性进展,DeepSeek团队在最新发表的论文中提出了名为mHC(流形约束超连接)的创新网络架构。这项研究聚焦于解决大规模模型训练中的核心痛点,通过重构神经网络连接机制,为提升模型训练稳定性与可扩展性提供了全新思路。 传统深度学习架构依赖残差连接构建信息通道,近年来兴起的超连接技术通过拓宽通道数量显著提升了模型性能。但这种设计在应对超大规模训练时暴露出三大瓶颈:训练过程易出现 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果