Language Model - 搜索 News

8 小时

微信炼出扩散语言模型，vLLM部署AR模型3倍加速，低熵场景超10倍

腾讯微信 AI 团队提出 WeDLM（WeChat Diffusion Language Model），通过在标准因果注意力下实现扩散式解码，在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速，低熵场景更可达 10 ...

1 天

微信AI团队推出WeDLM，扩散语言模型实现推理加速10倍

在人工智能快速发展的今天，腾讯微信AI团队带来了令人振奋的消息——他们推出的WeDLM（WeChat Diffusion Language Model）成功实现了扩散语言模型在推理速度上的大幅提升。通过在标准因果注意力机制下实现扩散式解码，WeDLM在数学推理等任务上，相较于现有的自回归（AR）模型，如vLLM，推理速度提升超过3倍，甚至在低熵场景下可达10倍以上，同时保持甚至提升了生成质量。

7 天

展望2026：科研智能体即将崛起？

在 21 世纪的前四分之一的时间，人工智能（AI）以前所未有的深度和广度渗透到科研的各个领域，催生了一场新的科研范式革命。尤其是在过去两年，人工智能开始展现出思考、规划、执行、反馈、迭代甚至提出新假设的“智能体”特征。

星岛头条

大语言模型（Large Language Model，以下简称「大模型」），顾名思义，是人工智能（AI）依赖大量的语言素材进行分析，再整合出来的计算模型。目前全球最先进的大模型，例如ChatGPT或DeepSeek，已经可以像人一样生成自然语言，并和我们进行日常交谈，给予我们意见，甚至是情绪支持。但这是否代表这些大模型已如同人一样，拥有认知能力与社会价值观？科学界对此仍存有争议。首先，大模型本身 ...

IT之家

谷歌最强生图 AI 模型加持：Mixboard 可视化你的创意，开放画布 + 自然 ...

IT之家9 月 24 日消息，科技媒体 NeoWin 昨日（9 月 23 日）发布博文，报道称谷歌推出实验性 AI 工具 Mixboard，主打“开放画布”与生成式 AI 创意，可从文本提示或预制板开始，生成包括家居装饰、产品设计等多场景情绪板，为用户提供一种可视化创意的新方式。

GitHub

BELLE: Be Everyone's Large Language model Engine

本项目的目标是促进中文对话大模型开源社区的发展，愿景是成为能够帮到每一个人的LLM Engine。相比如何做好大语言模型的预训练，BELLE更关注如何在开源预训练大语言模型的基础上，帮助每一个人都能够得到一个属于自己的、效果尽可能好的具有指令表现能力 ...

China Internet Information Center

第十九届中国超级模特大赛总决赛落幕

7月26日，参赛选手在第十九届中国超级模特大赛总决赛中进行时装表演。7月26日晚，第十九届中国超级模特大赛总决赛在上海国际时尚中心举行。本届大赛选手选拔历时6个多月，共有144所院校及机构参与，60名选手从近万名参赛选手中脱颖而出进入总决赛。

中国日报网

每日一词|多模态地理科学大模型 geographic sciences multi-modal Large Language ...

我国研发的全球首个多模态地理科学大模型“坤元”近日在京发布。“坤元”由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。 A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was ...

51CTO

到底什么是视觉语言模型？(分类/训练/评估)

5月27日，Meta发布了Vision Language Model行业研究的综述论文《An Introduction to Vision-Language Modeling》。全文干货满满，但篇幅过长，所以笔者把每一章节放到独立的文章中，方便对VLM领域感兴趣的同学们一边读一边翻译一边消化，觉得有用就一键三连吧~ *本文只摘译 ...

中国日报网

Language, lingo, tongue 三个表 “语言” 的名词之间的区别

听众 Burger 想知道 “language、lingo” 和 “tongue” 之间的区别。这三个词都与我们的交流方式有关，但它们并不完全相同。它们指的是交流的文化工具，还是我们说话的风格呢？它们三个中，哪个词的用法较口语化？哪个词更文学？本期节目为你一一解答。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果