分类
平台
排序
HeyGen重磅AI视频翻译上线!外国人张口就是中文,唇形对齐精确到毫秒
在视频为王的当下,语言几乎成了AI要跨越的最后一道关卡。今天,全球AI视频生成平台HeyGen推出全新一代视频翻译引擎,凭借三项核心技术升级,把跨语种视频本地化推到“真假难辨”的新高度——让...
昆仑万维上线 Skywork Design Agent:面向小白的 AI 设计神器,轻松跨越专业门槛
昆仑万维近期上线一款叫做Skywork Design Agent的 AI 设计工具。不同于很多只服务专业设计师的复杂软件,这款产品从研发起就面向“非专业用户”,希望借助智能技术,帮大家轻松高效做出专业水准...
Nano Banana 2重磅发布!精准呈现“11:15的满杯红酒”,AI绘图迈入设计师级阶段
当市面上的其他AI还在为“时钟能否准确停在11:15”“红酒是否真的满至杯沿”而一再出错时,Nano Banana2已经完成了对细节的精准跃迁。这一全新升级的图像模型,不仅攻克了长期困扰行业的复杂细...
阿里云析言 XiYan-SQL 夺冠登顶,拿下全球 SQL 诊断评测第一!
近日,阿里云飞天实验室自研的数据分析智能体“析言 XiYan-SQL”,在全球权威的 SQL 诊断基准 BIRD-CRITIC(亦称 SWE-SQL)上发挥亮眼,一举登顶全部开放榜,力压多家海内外顶尖团队,改写 SQL ...
不再靠命令行!Claude Code可视化工作流编辑器火了:拖拽节点即可打造AI自动化利器
2025年末,Anthropic 旗下 Claude Code 迎来社区生态的重大进展:一款名为“Claude Code Workflow Studio”的 VSCode 扩展迅速走红。它通过直观的拖拽式画布,让用户不必写复杂提示或在终端里敲...
Meta重塑语音技术版图!Omnilingual ASR覆盖1600种语言,小语种也能被AI“听见”
全球7000多种语言中,超过95%长期被AI语音技术忽视——直到现在。Meta最新发布的Omnilingual ASR(自动语音识别)系统,打破语言技术的“大语种优先”局面,首次把高精度识别扩展到1600种语言,...
X平台火速收紧Grok图像权限:彻底禁改真人照,露骨内容生成全面受控
在连续数周的舆论质疑与监管施压后,X平台(原Twitter)于今日凌晨通过其官方安全账号@Safety发布公告,宣布对旗下AI模型Grok的图片生成与编辑功能推出迄今为止最严的新规。此次调整直面近期关...
阿里巴巴1688上线跨境AI助手“遨虾”:一站式打通从选品到工厂的数字化供应链
阿里巴巴旗下的源头厂货平台1688,近日正式推出跨境电商AI助手“遨虾”(海外品牌名:AlphaShop),主打“AI+供应链”核心能力,面向全球跨境卖家,提供一站式智能数字供应链服务。“遨虾”结合...
前字节AI高管廖谦离职“下海”当乙方:半月拿下数百万美元,要把营销Agent做成“007式接单”
前字节跳动AI产品副总裁廖谦已于 8 月底离职,创立“极致上下文”(Apex Context),主打“营销场景多模态Agent”。公司成立后仅两周,就拿到硅谷 HT Investment、百度风投等合计数百万美元的天...
LTX-2 重磅亮相:下一代 AI 视频模型一键生成完整叙事4K高清视频
在 AI 技术加速演进的大背景下,Lightricks 公司近日推出其最新一代 AI 视频生成模型——LTX-2。该模型可一键生成最长20秒的原生 4K 叙事视频,并自带声音与口型对齐,为视频创作带来突破性变化...
杭州瞳行科技推出国内首款AI助盲眼镜,3000元内达成300毫秒路况播报
瞳行科技推出国内首款 AI 助盲眼镜,内置阿里通义千问大模型,面向约1700万视障人群提供实时出行指引。整机由眼镜本体、手机、遥控指环和盲杖四端协同,121度超广角双摄可实现约300毫秒超低延迟...
微软开源VibeVoice‑Realtime‑0.5B:300ms开口,90分钟连读不掉速
微软低调放出一款“黑马级”的实时语音模型:VibeVoice-Realtime-0.5B。它或许是当下开源TTS里延迟最低、声音最贴近真人的模型之一,话还没打完,声音就已经先到了。 极致实时:300ms就能...














