分类
平台
排序
阿里推出新一代 Qwen3-TTS:49 种音色,满足多场景配音
阿里通义千问上线新一代语音合成模型 Qwen3-TTS,现已通过 Qwen API 面向全球开发者免费开放。它内置 49 种角色音色,覆盖 10 门常用语言和 10 种中国方言。官方称,在 MiniMax TTS multilingua...
时代杂志:2025 年年度人物为“人工智能的建筑师”
时代杂志宣布,“人工智能的建筑师”当选 2025 年年度人物。这是历史上第二次把这一荣誉授予一个科技领域,而非单独个人。此举体现出人工智能在全球产业与公共生活中迅速走强的影响力。本次《时...
告别键盘:Genspark 推出 Workspace 2.0,语音办公时代来临
AI 搜索领域的新秀 Genspark 近日发布 AI Workspace2.0,把人机互动的核心从“文字提示”转向“语音驱动”。这次重要升级旨在改变知识工作者的办公方式,让复杂的自动化流程用自然语言就能轻松...
字节跳动推出 Seedance 1.5 Pro:AI 音视频创作迈入 100% 视听同步新阶段!
12月16日,字节跳动在北京发布了新一代音视频创作模型 Seedance 1.5 Pro。这款工具在音视频生成上实现了显著突破,也让用户获得更丰富、更沉浸的视听体验。Seedance 1.5 Pro 可进行音视频联合生...
三星提速拥抱Gemini!2026年采用谷歌AI的移动设备产量将翻倍
AI终端竞争正如火如荼,三星正在明显加码与谷歌的深度协作。根据最新供应链消息,三星计划到 2026 年把搭载谷歌 Gemini 大模型技术的移动设备产量提升至两倍,覆盖旗舰智能手机、平板与可穿戴产...
腾讯元宝上线新玩法:一句话或一张图就能做视频
腾讯元宝正式推出一项全新功能,用户只需一句话或一张图片,就能快速生成精彩视频。此功能由腾讯混元团队最新开源的 HunyuanVideo1.5 模型提供支持,目标是让大家的内容创作更简单、更高效。Hun...
NeurIPS 2025 最佳论文出炉:阿里通义千问凭借“门控注意力”摘得中国唯一获奖席位
全球 AI 顶会 NeurIPS 2025 今晚公布奖项名单,阿里巴巴通义千问团队凭《Attention Gating Makes Better Foundation Models》斩获最佳论文荣誉,成为 4 篇入选作品中唯一来自中国的团队。本届大...
“十五五”新赛道:太空光伏与建筑AI加速迈入快车道
随着“人工智能+”被正式写入国家“十五五”规划,AI 正在以超乎以往的速度进入各类传统行业。国泰海通证券近日发布的研报指出,除备受关注的太空光伏外,AI 在建筑工程、交通治理与低空经济等...
谷歌深夜上新“Disco”浏览器:一键把标签页做成App,Gemini 3 下场写代码
12月11日,谷歌通过官方博客发布AI实验项目“Disco”。首发能力GenTabs可把用户当前打开的一组标签页,实时生成一个定制化的Web应用;首批仅支持macOS,需通过Google Labs候补名单申请体验。Gen...
全国首个规划资源大模型“云宇星空”上线!6000亿参数加持,让城市规划“问不倒、调图快、识图准”
城市治理正迈入“AI原生”新阶段。12 月 24 日,上海市规划和自然资源局携手商汤科技“大装置”正式推出全国规划资源领域首个基础大模型——“云宇星空大模型(专业版)”。该模型以 6000 亿参...
Google 发布 Generative UI:AI 可实时生成可交互界面
Google Research 推出了全新的技术——Generative UI(生成式界面),迅速引发关注。与此前的 Gemini 3 发布相比,这项突破让 AI 的能力更进一步。Generative UI 的核心想法是:AI 不只会写文字...
Meta 发布 DreamGym 框架:让 AI 代理训练更高效、更安全
Meta 与芝加哥大学、加州大学伯克利分校的研究人员联合打造了全新框架——DreamGym,专门应对用强化学习(RL)训练大型语言模型(LLM)代理时的高成本、复杂工程和反馈不稳定等痛点。DreamGym ...












