分类
平台
排序
千问 App 深度接入高德地图,AI 让出行规划更“顺路”
AI 正在进一步打通出行与生活服务的界限。近日,阿里旗下通义千问(千问 App)宣布与高德地图实现全面对接,把高德扎实的地理位置数据与 AI 的复杂任务处理能力深度融合,为用户带来“问答即服...
Meta发布SAM Audio:首个可“点一下就分离声音”的多模态模型,一键抽取吉他、人声或狗叫
Meta推出音频处理领域的一项重量级新作——SAM Audio,这是一款统一的多模态音频分离模型。它让用户仿佛“用眼睛听声音”,能从混合的音视频里,一键提取目标声源:点一下视频里的吉他手,立刻...
Gemini 3 Flash发布:免费又快,实测超越Pro,谷歌AI迈入“几乎零等待”时代
谷歌又一次把大模型的性能与成本边界推得更远。今天,正式推出全新轻量级模型 Gemini3Flash——在保持极低延迟的同时,响应速度达到前代的3倍,几乎“无等待”;并且在多项硬核基准上反超同代旗...
ChatGPT面向第三方开放应用生态:开发者可提交上架,用户一键买菜、做PPT、找房等智能服务
OpenAI正把ChatGPT从“对话助手”推进为“智能操作平台”。公司近日宣布,**ChatGPT应用(App Directory)已面向开发者开放上架入口**。即日起,开发者可按官方提交指南,打造并提交具备特定功...
马斯克:xAI 争取三年称冠,AGI 时代最快明年启幕
近日,埃隆·马斯克在其人工智能公司xAI旧金山总部举行的全员大会上,向员工描绘了雄心勃勃的蓝图。他表示,只要把握未来两到三年的关键窗口期稳步推进,xAI 有望赶超所有现有竞争者,成为全球...
竞品压顶,亚马逊 AGI 线换帅:Nova 之父普拉萨德将离任
亚马逊内部近期出现重要人事变动。据 IT之家转引 Business Insider 报道,负责亚马逊前沿 AI 模型研发的关键人物——资深副总裁兼首席科学家罗希特・普拉萨德(Rohit Prasad)确认将在年末卸任...
AI 开发新风向:谷歌上架 Gems 可视化编辑器,几句话就能做 App
据 AIbase 报道,谷歌于周三宣布将其“氛围编程”(Vibe-coding)工具 Opal 正式并入 Gemini 平台,意味着 AI 应用开发正迈向“零代码”阶段。此次打通后,用户可在 Gemini 网页版的 Gems 管理...
Adobe 卷入 AI 版权风波,作家起诉其以 Books3 非法训练 SlimLM
据 AIbase 报道,继 Meta、苹果与 Anthropic 等巨头之后,软件厂商 Adobe 也陷入人工智能版权争议。日前,来自俄勒冈州的作家伊丽莎白·里昂(Elizabeth Lyon)提起集体诉讼,指称 Adobe 在开发...
苹果开源 SHARP 模型:1 秒把平面照变 3D,告别漫长等待
在3D 内容创作圈,苹果近期抛出重磅消息。据科技媒体9to5Mac 报道,苹果已将一款名为SHARP的全新 AI 模型正式开源。它最亮眼的一点,是把传统动辄数小时的3D 重建流程,压缩到约1 秒内:只需一...
Google把“氛围编程”Opal融入Gemini:零代码即可打造你的专属AI助手Gems
Google正在把Gemini从通用聊天窗口升级为人人可用的AI应用制作平台。近期,公司已把“氛围编程”(vibe-coding)工具 Opal 深度接入Gemini网页应用(gemini.google.com),用户只需在浏览器里用自...
Meta推SAM Audio:全球首款支持“点选分离”的多模态音频模型,一键抽取吉他、人声或犬吠
Meta 发布面向音频处理的重磅新品——SAM Audio,这是一套统一的多模态音频分离模型。它让你像“用眼睛去听”一样,从混合的视频或音频中,一键抽出任意目标声源:点中画面里的吉他手,马上得到...
对标 OpenAI:谷歌 Gemini2.5 实时音频表现登顶,函数调用准确率达 71.5%
据 AIbase 报道,谷歌本周为其原生音频模型 Gemini2.5Flash Native Audio 推出重要升级,目标是把 AI 互动从普通的“文本转语音”推进到更接近真人的实时交流。升级的关键在于“原生”处理。不...













