谷歌ProjectMariner智能浏览助手可自动处理表格及完成网购

作者:互联网

2026-03-25

⼤语⾔模型脚本

谷歌DeepMind推出的Project Mariner是一款革命性浏览器助手,通过Gemini 2.0技术实现智能网页操作。这款Chrome扩展程序能像人类一样理解并执行各类网页任务。

Project Mariner是什么

基于先进的多模态技术,这款浏览器助手可以解析屏幕上的像素和网页元素,通过扩展程序实现自动化操作。它不仅支持基础的浏览操作如点击和滚动,还能在WebVoyager测试中获得83.5%的高分表现。值得注意的是,系统在执行敏感操作前会主动要求用户确认,确保使用安全。

Project Mariner的主要功能

  1. 多模态理解:全面解析浏览器界面中的各类数据,包括视觉元素和文本内容。
  2. 浏览器交互:实现网站导航与操作自动化,同时保持用户控制权限。
  3. 自动化任务:智能完成数据整理和网页表单填写等重复性工作。
  4. 复杂指令处理:将用户需求拆解为可执行步骤并逐一完成。
  5. 关系理解:准确识别网页元素间的功能关联。
  6. 视觉反馈:实时展示任务执行进度和状态。
  7. 安全性:涉及交易等敏感操作时强制要求二次确认。

如何使用Project Mariner

目前该产品处于限量测试阶段,用户可通过官网申请加入等候名单。

Project Mariner的应用场景

  1. 数据整理与复制:从网页抓取数据并自动整理至电子表格。
  2. 在线购物:根据购物清单智能完成商品搜索和加购。
  3. 旅行规划:自动比价并筛选最优的航班酒店组合。
  4. 日常购物:代劳日用品网购的全流程操作。
  5. 食谱查找:按需求自动检索匹配的烹饪方案。

Project Mariner展现了AI辅助浏览的无限可能,其智能化的操作方式将大幅提升网络使用效率。

相关标签:

Gemini