分类
平台
排序
微软 Azure ND GB300 速率再破纪录:推理每秒达 110 万 token
微软最新披露,其 Azure ND GB300v6 虚拟机在 Meta 的 Llama2 70B 模型上跑出每秒 110 万 token 的推理速度,刷新行业纪录。微软 CEO 萨提亚·纳德拉在社交平台称:“这一成果得益于我们与英伟...
美团“全能猫”重磅亮相!LongCat-Flash-Omni多模态大模型开源即封神,实时互动快到惊人
当圈内还在讨论多模态AI是否真能落地,美团已悄悄祭出一张杀手锏——全新开源大模型 LongCat-Flash-Omni 正式发布,并在多项评测中压过多款闭源产品,做到“开源即SOTA”(State-of-the-Art)的...
谷歌Gemini 3 Pro预览版曝光于Vertex AI:上下文窗口可达百万Token
谷歌Gemini系列又有新动向:最新预览模型“gemini-3-pro-preview-11-2025”已在Vertex AI上露面。虽然暂时不能调用,但这意味着它很可能在本月上线,并带来最高100万token的超大上下文窗口。技...
抢赶OpenAI Sora!Meta AI短视频平台Vibes在欧洲全面上线,内容生成飙升十倍
【AIbase 报道】 科技巨头Meta于周四表示,其AI生成短视频平台Vibes已在欧洲的Meta AI应用内上线。Vibes的玩法与TikTok或Instagram Reels类似,但最大的不同在于:平台上看到和创作的每一条视频...
OpenAI CEO回应马斯克:我只想在宇宙留下痕迹
OpenAI 的首席执行官萨姆・奥特曼近日在社交平台 X 发出长文,回应外界对 OpenAI 可能上市的质疑。尤其是他与老对手埃隆・马斯克之间的交锋,再度引发广泛关注。有媒体称,OpenAI 正在评估最早...
Moonshot AI推出 Kimi Linear:线性注意力架构提速6倍,KDA 内核同步开源
国内大模型团队 Moonshot AI 今日于 Hugging Face 正式发布技术报告 《Kimi Linear Tech Report》(报告链接),同步推出全新架构 Kimi Linear —— 这是一种可直接替换完全注意力(Full Attent...
最新评估:大模型驱动的扫地机器人多任务表现欠佳,成功率仅 40%
近期,AI 实验室 Andon Labs 的一项测评引发关注。结果显示,搭载顶尖大模型的扫地机器人在执行基础家务任务时,成功率只有 40%,明显低于人类水平。此次测试要求机器人按“把黄油递给人”的多...
掘金AI底层基建!Lambda与微软签订数十亿美元GPU部署合作
云计算服务商 Lambda 周一宣布与科技巨头 微软(Microsoft) 达成一项价值数十亿美元的人工智能基础设施合作,双方将进一步深化协作,共同打造大规模 AI 超级计算能力。数万块英伟达GPU上阵,八...
英伟达携德国电信投建10亿欧元数据中心,德国AI算力拟提升50%
近期,英伟达与德国电信共同宣布,将斥资10亿欧元在德国建设一座大型数据中心,计划于2026年第一季度投入使用。该项目旨在加强欧洲承载复杂人工智能系统的基础设施,为与美国和中国的技术发展更...
Anthropic 发布基于 MCP 的全新“代码执行模式”,大幅提升 AI Agent 效率
近期,Anthropic 在其最新发布中推出了基于 Model Context Protocol(MCP)的新实践——“代码执行模式”。这一思路旨在让 AI Agent 更高效地调用外部工具与数据服务,缓解传统做法在对接海量工...
美团LongCat发布UNO-Bench全新评测基准,系统强化多模态大模型评估
近日,美团 LongCat 团队推出全新评测基准 UNO-Bench,旨在以系统化方式检验模型在不同模态下的理解与表现。该基准覆盖44类任务与5种模态组合,力求全面反映模型的单模态与全模态能力。UNO-Benc...
Google 上线 Gemini API 文件搜索工具:简化私有 RAG 接入,开发者免自建向量数据库
Google 今日宣布在 Gemini API 中上线“文件搜索工具”(File Search Tool),这是一套完全托管的 RAG 方案。该工具可将私有文件直接转为 Gemini 的知识库,开发者不必操心数据切分、嵌入生成或...
















