在青岛虚拟智能体产业大会上,官方发布了国内首个支持全模态、实时互动的视觉语言大模型 VisualGPT,并同步开放智能体训练平台,面向全国开发者提供多模态数据与算力资源,宣告AI交互从“文字聊天”迈入“视觉界面即时互动”的新阶段。
模型亮点
– 全模态实时交互:用户把图片或视频上传后,可直接在画面中圈选、标注或用语音提问,模型能在秒级给出结构化答案、可运行代码或3D场景,无需切换到文字输入。
– 所见即所得:通过将视觉编码器与流式解码器深度耦合,VisualGPT实现端到端小于300ms的延迟,支持1080p60fps的实时画面分析与多轮对话。
– 多域应用:官方已面向教育、医疗、金融三大场景开放SDK;老师可在课件上圈出公式即时生成动画讲解,医生可在阅片过程中询问病灶指标,金融分析师能对K线图直接提问并获得策略回测。
平台配套
青岛智能体训练平台提供1000张A100/H100混合算力与10PB多模态数据,面向企业、高校及个人开发者免费开放申请;计划于2026年扩容至5000张H100,打造北方最大AI训练集群。大会同时发布“百企百景”对接清单,首批征集超过200个视觉交互需求,预计到2025年底完成100个标杆案例落地。
产业意义
VisualGPT的发布让青岛在虚拟智能体赛道率先布局。市工信局表示,未来三年将依托该模型建设“青岛AI创新谷”,吸引上下游企业超过300家,形成千亿级的全模态交互产业链。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?