近日,定位比肩数学四大顶刊的新兴数学顶级期刊 《Forum of Mathematics, Pi 》更新上线了2026年的首篇文章,令人可喜的是本篇文章国内机构便是“主力”,而且我们之前便提到过该项研究,下面我们来简单了解一下: ...
目前,GRPO 主要被用于优化单一目标的奖励,通常聚焦于准确率。然而,随着模型能力的持续提升,近期研究越来越倾向于同时优化多个奖励 —— ...
韩国数学家 Baek Jin-eon 解决了有近 60 年历史的移动沙发问题。该问题由 Leo Moser 在 1966 年提出,源于现实生活中推沙发过走廊的情景,由于人人都可以理解而广为人知。它描述了宽度为 1 米的 L ...
由于训练数据样本长度高度异质,这种样本打包极大地提高了SFT的效率。作者选择了8192作为目标序列长度,以匹配Llama 3.1的原生训练上下文窗口,并且整体打包效率达到96%,这意味着只有4%的token是填充token。
当你听说某个AI模型在数学考试中得了满分时,可能会觉得人工智能的数学能力已经超越人类了。然而真实情况远比这复杂。最近这项来自腾讯和中国人民大学的研究揭示了一个令人深思的现象:当我们用真正的前沿数学研究来测试这些AI时,即便是最先进的模型也会暴露出巨大 ...
编辑|泽南、陈陈人们获取医疗信息的方式,正在逐渐被 AI 改变。2026 刚一开年,OpenAI 发布了一份有关普通人与 AI 医疗的报告。报告给出的信息令人惊讶:目前全球 ChatGPT 对话中有超过 5% 是与医疗健康有关的,每天有 4000 ...
人工智能正被应用到各行各业的工作场景中。它不太可能让我们失业,但我们需要知道怎样才能更有效地和人工智能合作。人类和人工智能分别有更适合自己的任务。然而,若能与人工智能协同共生,我们将能够进一步放大人类的独特优势,从而更高效地完成特定任务。本文浅谈人工 ...
2025 年 9 月,DeepSeek-R1 论文以封面文章的形式登上 Nature 杂志,成为全球首个通过顶级期刊独立同行评审的主流大语言模型。从 2 月 14 日投稿到 9 月 17 日正式发表,8 位外部专家历时 5 ...
1月9日,越南海警第四区司令部党委书记、政委阮文勇少将一行在安江省富国特区海警第401海队港口看望慰问即将执行春节专项任务的“KN-373”号海警舰艇全体官兵,并交付了具体工作任务。
微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。 最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、Gemini Pro 1.5 ...
在岘港市,市公安力量作为骨干单位,直接新建、修缮住房271套,占全市受损住房总量的53%以上,并为群众提供了必要的生活物资。
近日在上海举行的第十届世界华人数学家大会(简称ICCM)上,纽约大学教授、法国高等科学研究所终身教授王虹,芝加哥大学教授邓煜以及北京大学北京国际数学研究中心教授袁新意获颁有“华人菲尔兹奖”之称的ICCM数学奖金奖。