分类
平台
排序
Nano Banana 2重磅发布!精准呈现“11:15的满杯红酒”,AI绘图迈入设计师级阶段
当市面上的其他AI还在为“时钟能否准确停在11:15”“红酒是否真的满至杯沿”而一再出错时,Nano Banana2已经完成了对细节的精准跃迁。这一全新升级的图像模型,不仅攻克了长期困扰行业的复杂细...
PhysX-Anything一图生成可仿真3D资产:关节与物理参数显式保留,现已开源
南洋理工大学与上海人工智能实验室联合推出开源框架 PhysX-Anything,只需一张 RGB 图片即可生成包含几何、关节和物理属性的完整 3D 资产,可直接导入 MuJoCo、Isaac Sim,用于机器人策略训练。...
开物之芯发布「专其利AI专利辅助撰写平台」:30秒命名,10分钟产出五书
设想一下:一位高校科研人员刚拿下技术突破,就能迅速完成专利保护布局;一位初创开发者不懂法条也能写出规范的专利文件;一项前沿成果,从创意到申请材料,10分钟就能跑通……在AI重构创新服务...
元宝AI上线“任务提醒”:一句话设定定时,覆盖工作与生活多场景
2025年12月29日,广东地区用户首批尝鲜元宝 AI 新推出的“任务提醒”功能。该功能支持用户用一句话创建循环定时任务,覆盖生活琐事、习惯养成、职场办公等多种场景,到点自动发出提醒,部分场景...
Google 上线 Gemini API 文件搜索工具:简化私有 RAG 接入,开发者免自建向量数据库
Google 今日宣布在 Gemini API 中上线“文件搜索工具”(File Search Tool),这是一套完全托管的 RAG 方案。该工具可将私有文件直接转为 Gemini 的知识库,开发者不必操心数据切分、嵌入生成或...
无法直接改写:稿件含未证实指控,请选择安全改写方案
抱歉,原稿中包含针对真实个人与公司的严重指控与负面评价,且未提供可核实来源。为避免传播可能不实或有害的信息,我无法按原样进行伪原创。可选安全改写方案:1)虚构化改写:把人物与公司全...
腾讯元宝PC版新增“录音笔”:多端协同,长音频转写更高效
腾讯旗下AI大模型应用“元宝”近日对PC端进行了重要升级,正式推出“录音笔”功能。这一更新进一步强化了元宝在办公场景中的生产力定位,实现了从移动端到桌面端的协同闭环。此前,元宝的音频处...
LTX-2 重磅亮相:下一代 AI 视频模型一键生成完整叙事4K高清视频
在 AI 技术加速演进的大背景下,Lightricks 公司近日推出其最新一代 AI 视频生成模型——LTX-2。该模型可一键生成最长20秒的原生 4K 叙事视频,并自带声音与口型对齐,为视频创作带来突破性变化...
字节跳动 TRAE 中国版上线 SOLO 模式,全面免费开放,推动端到端高效开发
近日,字节跳动旗下的 AI 编程工具 TRAE宣布,其核心创新能力 SOLO 模式正式登陆中国版平台,即日起面向全部用户开放,且可免费使用。这一升级意味着 TRAE 正式从以“代码生成”为主迈向“软件...
通义千问发布 Qwen-Image-Layered:让静态图片实现“图层级编辑”的新突破
通义千问团队今日宣布上线全新图像生成模型 Qwen-Image-Layered。它基于自研的创新架构,突破传统 AI 修图的限制,用“图层拆分”能力让静态图也能被自由编辑,把“想改哪里就改哪里”的精准编...
字节发布 InfinityStar 框架:5秒720p视频生成仅需58秒
近日,字节跳动发布全新 InfinityStar 框架,大幅提升视频生成效率:制作一段5秒720p视频现在最快约58秒即可完成。该方案不仅加速生成,还以统一架构覆盖多种视觉生成任务,如图像生成、文生视...
ElevenLabs重磅升级:图像、视频、音乐全能一站式生成
多模态AI领军者ElevenLabs正式发布全新「Image & Video 平台」!这套方案不再只是做语音,而是把图像生成、视频创作、语音合成、音乐制作、音效设计统统集成在一起的超级AI内容工厂。由此,...














