分类
平台
排序
无法直接改写:稿件含未证实指控,请选择安全改写方案
抱歉,原稿中包含针对真实个人与公司的严重指控与负面评价,且未提供可核实来源。为避免传播可能不实或有害的信息,我无法按原样进行伪原创。可选安全改写方案:1)虚构化改写:把人物与公司全...
需求激增!OpenAI与谷歌对 Sora 与 Nano Banana Pro 启动限额措施
GPU 几乎“烧红”,两大巨头同步出招:OpenAI 将 Sora 免费层收紧到每天最多 6 段视频,谷歌把 Nano Banana Pro 免费出图降到每天 2 张,并且都保留“随时再收紧”的空间。- Sora:6段视频成硬性...
B站/小红书视频秒变手绘分镜!开源工具ClipSketch AI,短视频创作者的省时好帮手
最近,一款名为ClipSketch AI的开源工具在内容创作者圈迅速走红。它面向视频二创和短视频运营者,能把长视频快速转换为手绘风格的故事板,还能自动生成适配社交平台的热门文案,显著提升内容生...
最新多模态大模型榜单发布!Gemini-3-Pro断层领跑,豆包与商汤领跑国产阵营,Qwen3-VL成首个高分开源模型
全球多模态大模型的竞争版图再次更新。近日,权威评测平台SuperCLUE-VLM发布2025年12月多模态视觉语言模型综合榜单,谷歌Gemini-3-Pro以83.64分实现断层领先,展现其在视觉理解与推理上的强势实...
输入分镜脚本,秒级生成1分钟连贯叙事!字节开源StoryMem,让AI视频角色不再“变脸”
近期,字节跳动携手南洋理工大学发布的开源框架StoryMem在AI视频生成领域引起热议。该框架以“视觉记忆”为核心,将只会做单镜头的扩散模型改造成多镜头长视频的叙事引擎,能在几秒内自动生成时...
微软开源VibeVoice‑Realtime‑0.5B:300ms开口,90分钟连读不掉速
微软低调放出一款“黑马级”的实时语音模型:VibeVoice-Realtime-0.5B。它或许是当下开源TTS里延迟最低、声音最贴近真人的模型之一,话还没打完,声音就已经先到了。 极致实时:300ms就能...
阿里推出新一代 Qwen3-TTS:49 种音色,满足多场景配音
阿里通义千问上线新一代语音合成模型 Qwen3-TTS,现已通过 Qwen API 面向全球开发者免费开放。它内置 49 种角色音色,覆盖 10 门常用语言和 10 种中国方言。官方称,在 MiniMax TTS multilingua...
微软调整 Microsoft365Copilot:默认不再显示 AI 内容不准确提示
微软近日宣布对 Microsoft365Copilot 做出关键调整:将默认隐藏“AI 内容可能不准确”的提示语。该变更主要回应企业客户的意见,认为这类提示会打断注意力。此前在使用 Copilot 聊天功能时,底...
Vercel 推出 Agent Skills:面向 AI 编程智能体的“技能包管理器”
在 AI 编程工具快速迭代的当下,如何让 AI 更好理解复杂框架规范成了开发者的新难题。AIbase 获悉,知名云开发平台Vercel正式发布开源项目Agent Skills。它不仅是一个指令集合,更像为 AI 智能...
小米开源跨域具身大模型 MiMo-Embodied:29 项基准创纪录,一套权重覆盖自驾与家用
2025 年 11 月 21 日,小米宣布推出并开源业内首个同时贯通自动驾驶与具身智能的跨域基础模型 MiMo-Embodied,模型与权重已在 Hugging Face 与 arXiv 同步上架。技术亮点 1. 跨域能...
高德打车上新“AI服务卫士”!分钟级异常响应,京沪杭蓉率先覆盖专车/豪车订单
为进一步提升高端用车的安全与服务体验,高德打车近日对“行程保镖”系统进行全面升级,并联动合作网约车平台正式推出“AI服务卫士”。该能力依托分钟级的智能异常识别和全流程自动化干预机制,...
全球首款 AI 字体生成器 Dr Fonts© 发布 V1.0,免费体验已开启
近日,Dr Fonts© 发布 V1.0,号称全球首款 AI 字体生成器,官网已开放免费体验。该工具主打从图片生成专属字体,并支持调色板自定义,为设计师与字体爱好者提供更高效的创作方式。使用流程很简...












