谷歌宣布为NotebookLM加入图像数据源功能。用户把黑板板书、教材扫描页或街拍到的表格上传后,系统会自动进行OCR与语义理解,随后可用自然语言直接检索图片里的信息。该功能已在各平台免费开放。谷歌还表示,未来几周将提供本地处理选项,尽量减少将敏感资料上传到云端的需求。

新版NotebookLM基于多模态模型,能区分手写与印刷内容、恢复表格结构,并与已有的文本、音频、视频笔记自动关联。官方演示的案例包括:拍摄课堂板书后询问“左下角公式如何推导”,系统可迅速定位并给出分步说明;扫描教材第127页的表格后,能直接查询某个单元格的数值;上传街边咖啡店菜单,也能提取拿铁的价格。
据谷歌介绍,功能上线后48小时内,教育账号上传的图像页数突破50万页,环比增长340%。公司计划明年为NotebookLM接入AR眼镜的实时拍摄接口,实现“所见即可发问”。目前图像处理仍沿用现有免费配额,尚未透露是否会推出付费加速通道。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?