腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
在人工智能快速发展的今天,腾讯微信AI团队带来了令人振奋的消息——他们推出的WeDLM(WeChat Diffusion Language Model)成功实现了扩散语言模型在推理速度上的大幅提升。通过在标准因果注意力机制下实现扩散式解码,WeDLM在数学推理等任务上,相较于现有的自回归(AR)模型,如vLLM,推理速度提升超过3倍,甚至在低熵场景下可达10倍以上,同时保持甚至提升了生成质量。
在 21 世纪的前四分之一的时间,人工智能(AI)以前所未有的深度和广度渗透到科研的各个领域,催生了一场新的科研范式革命。尤其是在过去两年,人工智能开始展现出思考、规划、执行、反馈、迭代甚至提出新假设的“智能体”特征。
大语言模型(Large Language Model,以下简称「大模型」),顾名思义,是人工智能(AI)依赖大量的语言素材进行分析,再整合出来的计算模型。目前全球最先进的大模型,例如ChatGPT或DeepSeek,已经可以像人一样生成自然语言,并和我们进行日常交谈,给予我们意见,甚至是情绪支持。但这是否代表这些大模型已如同人一样,拥有认知能力与社会价值观?科学界对此仍存有争议。 首先,大模型本身 ...
IT之家9 月 24 日消息,科技媒体 NeoWin 昨日(9 月 23 日)发布博文,报道称谷歌推出实验性 AI 工具 Mixboard,主打“开放画布”与生成式 AI 创意,可从文本提示或预制板开始,生成包括家居装饰、产品设计等多场景情绪板,为用户提供一种可视化创意的新方式。
本项目的目标是促进中文对话大模型开源社区的发展,愿景是成为能够帮到每一个人的LLM Engine。 相比如何做好大语言模型的预训练,BELLE更关注如何在开源预训练大语言模型的基础上,帮助每一个人都能够得到一个属于自己的、效果尽可能好的具有指令表现能力 ...
7月26日,参赛选手在第十九届中国超级模特大赛总决赛中进行时装表演。7月26日晚,第十九届中国超级模特大赛总决赛在上海国际时尚中心举行。本届大赛选手选拔历时6个多月,共有144所院校及机构参与,60名选手从近万名参赛选手中脱颖而出进入总决赛。
我国研发的全球首个多模态地理科学大模型“坤元”近日在京发布。“坤元”由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。 A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was ...
5月27日,Meta发布了Vision Language Model行业研究的综述论文《An Introduction to Vision-Language Modeling》。全文干货满满,但篇幅过长,所以笔者把每一章节放到独立的文章中,方便对VLM领域感兴趣的同学们一边读一边翻译一边消化,觉得有用就一键三连吧~ *本文只摘译 ...
听众 Burger 想知道 “language、lingo” 和 “tongue” 之间的区别。这三个词都与我们的交流方式有关,但它们并不完全相同。它们指的是交流的文化工具,还是我们说话的风格呢?它们三个中,哪个词的用法较口语化?哪个词更文学?本期节目为你一一解答。