盲人也能“看街景”?Google新AI原型让虚拟漫游无障碍,科技向善再迈一步

近日,Google推出一款名为StreetReaderAI的全新原型系统,目标是让盲人和低视力用户也能无障碍“走进”Google街景——不再只是被动接收信息,而是通过自然语言与虚拟环境实时互动,真正拥有自主探索城市空间的自由。

多模态AI加持,带来可对话的街景体验

StreetReaderAI并非普通的语音播报工具,而是把计算机视觉、地理信息系统(GIS)和大语言模型深度融合的多模态AI系统。它可以实时理解街景图像,并结合精准的位置数据,生成结构化、贴合情境的语音讲解。当用户“身处”某条街道时,系统会主动描述周边环境:“您正对一栋红砖楼,左边是咖啡馆,右边有公交站,前方50米是十字路口。”

image.png

更重要的是,这套系统支持自然对话式交互。用户不必记指令,说出想问的问题即可:“前面那栋楼是什么?”“附近有银行吗?”“这条路通向哪里?”AI会结合当前视角与地图信息,给出准确、连贯的回答,让虚拟探索更直观、更顺畅。

无障碍操作,让用户真正掌控

为适配视障用户的使用需求,StreetReaderAI采用极简交互。用户可用语音指令或标准键盘按键,自由完成视角旋转、前进后退、切换街景点位,全程无需依赖屏幕或触控。这种“语音+键盘”的双输入方式,兼顾不同习惯,实现“问啥就听到啥,想怎么走就怎么走”。

科技向善:从工具到权利的转变

一直以来,数字地图和街景服务极大便利了大众出行,但因高度依赖视觉界面,也让视障群体难以受益。StreetReaderAI的出现,意味着无障碍技术正从“辅助功能”走向“平等体验”——它不仅传递信息,更把探索、理解和决策的主动权还给用户。

尽管这套系统仍在原型阶段,尚未进入Google Maps正式产品,但其技术路线已展现出明确的落地前景。AIbase分析认为,随着多模态大模型与空间计算不断成熟,未来这类无障碍AI不只用于街景,还可延伸到室内导航、公共交通指引、远程导览等场景,真正打造一个“人人可感知、可参与”的数字世界。

科技的价值,不只在于突破边界,更在于弥合差距。StreetReaderAI或许只是第一步,但它照亮的方向,值得全行业跟进。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享