10月10日,早期科技投资机构云启资本(下称“云启”)宣布发起年轻 AI 创业者专项支持计划—— Y Transformers 。该计划将联合中关村科学城、上海交大工研院、MiniMax、火山引擎、亚马逊云科技、小宿科技、十字路口、WaytoAGI、S创、Wteam等10余家行业生态伙伴 ...
Diffusion Transformers在生成高质量图像方面展现出强大的能力。然而,随着模型规模的增大,其不断增长的内存占用和推理延迟给实际部署带来了重大挑战。近期在大语言模型(LLMs)领域的研究表明,基于旋转技术能够平滑异常值并实现4比特量化,但这类方法通常会产生显著的额外开销,且难以处理Diffusion Transformers中的行方向异常值。 为应对上述挑战,清华大学联合华为提出一 ...
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected] ...
2025年12月18日,海口讯 ——在近日落幕的海口市琼山区第二届小学生英语口语才艺评比活动中,海口市琼山第十二小学学生李梓桐凭借英语口语实践作品《Smart ...
这篇文章有何恺明和杨立昆两位大佬坐镇,不由得让人重视。核心发现是:Transformer可以在不使用任何归一化层的情况下,通过简单的Dynamic Tanh(DyT)操作实现同等甚至更好的性能。 训练深度神经网络时,每一层的输入的分布都在发生变化,这种现象被称为「 ...