花了一下午,我给AI装了个“浏览器”

张开发
2026/5/11 8:04:33 15 分钟阅读
花了一下午,我给AI装了个“浏览器”
事情是这样的。上周我想查一个冷门产品的用户评价。那个论坛需要登录才能看而且页面结构极其混乱——广告、推荐、无关楼层混在一起。我一边手动翻一边想要是AI能替我看这些破网页就好了。后来我找到了一个叫Web Access的东西。折腾了一下午给它配好环境让AI真正打开了一个网页、滚动、截图、甚至点了一下“加载更多”按钮。那一刻的感受是AI终于不再是“听说”而是自己亲眼去看了。什么是 Web Accessimage.pngimage.png简单说Web Access 是一项让AI能够主动访问指定网页、读取内容、提取信息的技能。它不是让AI凭空“知道”什么而是像一个真正的人类用户一样——打开浏览器输入网址阅读页面上的文字、数据、甚至图片里的文本然后把这些信息整理出来给你。更底层一点说它是一个可以让你手里的AI模型——不管是Claude、GPT还是本地跑的开源模型——真正去操控一个浏览器的工具。它给AI配了一个看不见的浏览器窗口让它可以打开任何一个网址读取页面上的文字、表格、图片里的文本滚动页面、点击按钮、填写表单截屏、执行JavaScript、等待页面加载完成甚至抓取那些“滚动才加载”的动态内容你给它一个任务比如“去这个电商网站找到商品描述里的尺寸表截图给我”。它就会自己打开浏览器找到那个表格截图然后回来告诉你。它能干什么几个真实的例子查最新资讯不再“过时”问AI“今天有什么大新闻”过去它只能抱歉。现在它可以帮你打开几个主流新闻网站把头条标题、关键内容摘出来甚至按你的兴趣分类整理。无论是科技圈的新品发布还是体育赛事的实时比分它都能搞定。看研究报告提取核心数据你甩给它一个几十页的行业分析报告链接它不会晕。Web Access 会把整个网页里的文字读下来然后帮你总结出核心观点、关键数据、图表里的结论。省去了你自己一页页翻的时间。比价、查参数、做调研想买一个东西不确定哪个平台价格最低让AI同时打开几个电商平台的商品页面把价格、评价、规格整理成一张表给你。想对比两款手机的参数它也能去官网或者评测网站把信息扒下来。追踪动态数据股票行情、加密货币价格、天气、航班状态……这些实时变化的信息Web Access 都能帮你盯住。你甚至可以设置让它每隔一段时间去刷新一次页面把变化告诉你。并行调研最香的功能这是 Web Access 的王牌能力。它可以开多个子 Agent同时在不同平台操作多个标签页并行抓取几分钟搞定别人大半天的调研量。举个例子你可以这样下指令帮我用 web-access 开 5 个子 Agent分别调研小红书、微博、知乎、B站、GitHub每个子 Agent 搜索Claude Code提取最热的前 10 条内容总结观点最后汇总给我实测下来信息采集和调研这块提升最明显。AI 会同时打开多个标签页各自执行任务最后给你一份综合报告。你泡杯咖啡的功夫它就把活干完了。安装方法两种方式都很简单image.pngWeb Access 原为 Claude Code 设计目前 GitHub 上已经斩获近 2000 星标。装它不需要你折腾一堆命令行。前置准备开启 Chrome 远程调试在 Chrome 地址栏输入chrome://inspect/#remote-debugging勾选 **Allow remote debugging for this browser instance**然后重启浏览器。这一步让 Web Access 能够直接连接到你日常使用的 Chrome而不是另外启动一个无头浏览器。所以你 Chrome 里存着的所有登录态——Google、GitHub、小红书——AI 都能直接用不需要重新登录。方法一让 AI 自己装推荐最简单的方式。在 Claude Code 里直接说一句话帮我安装这个 skillhttps://github.com/eze-is/web-accessAgent 会自动下载配置搞定环境依赖你什么都不用管。方法二手动安装如果自动安装出了状况也可以手动克隆git clone https://github.com/eze-is/web-access ~/.claude/skills/web-access装完之后运行检查脚本确认环境就绪~/.claude/skills/web-access/scripts/check-deps.sh脚本会自动检查 Node.js 版本需要 22、Chrome 端口连通性如果 CDP Proxy 没启动还会自动拉起来。实际用起来感受如何我搭好环境之后试了三个场景。场景一抓取一个懒加载的新闻列表有个科技博客文章列表是滚动到底部才自动加载新的。普通爬虫拿到的是半截页面但 Web Access 会让浏览器真的滚动——就像你用手指在屏幕上划一样。滚动三次所有文章标题都出来了。AI 把标题和链接整理成了一张表。场景二登录之后再看内容我给了 AI 一个需要登录的论坛网址以及一个测试账号。它自己找到了用户名和密码输入框填进去点击登录按钮然后去抓登录后才显示的用户私信列表。全程大概20秒。场景三对比两个页面的价格一个商品在A网站卖899B网站卖929。我让 AI 同时打开两个页面分别找到“价格”这个元素它通过CSS选择器定位的然后比较大小。它很机械但很准确地告诉我“A网站更便宜差价30元。”说实话这些事人类自己也能做。但区别在于AI 做这些不需要你盯着屏幕、不需要你一个一个点、不需要你复制粘贴。你只需要说一句话。工作原理它是怎么做到的image.png很多 AI 联网工具看起来能用但一碰到动态网页、需要登录的平台、或者多个任务并行处理就抓瞎。Web Access 的设计思路是让 AI像人一样思考和工作。它不是只给 AI 一堆工具而是给了它一套完整的操作策略和经验积累机制。第一层智能工具选择Web Access 内置了多种网页获取方案会根据任务场景自动判断用哪个静态页面优先用 Jina 或 WebFetch省 token、速度快动态内容切到 CDP 模式直接操控浏览器特定场景调用专有工具。它知道什么时候该用什么工具什么时候该放弃换思路。第二层CDP 直连浏览器image.pngCDP 是 Chrome DevTools Protocol 的缩写可以把它理解成 Chrome 的一个“后门”——通过这个协议外部程序可以完全控制浏览器的行为打开页面、执行 JS、点击元素、截图、上传文件。Web Access 通过 CDP 直接连接你日常使用的 Chrome 浏览器天然带登录态能操作任何需要交互的页面。小红书、微信公众号、需要登录的后台管理系统统统不在话下。它支持的操作非常丰富新建标签页、关闭标签页、切换标签页执行 JavaScript 获取页面数据模拟点击和真实鼠标事件上传文件页面截图滚动页面触发懒加载第三层并行分治image.png当需要同时处理多个目标网站时Web Access 可以创建多个子 Agent 并行执行。这些子 Agent 共享同一个 CDP Proxy但在标签页级别完全隔离。实际应用中可以让 AI 同时调研 5 个竞品官网并生成对比分析系统会自动创建 5 个并行子任务最后汇总结果。而且所有操作都在后台标签页进行不抢你鼠标焦点你该干嘛干嘛。第四层站点经验积累Web Access 按域名存储操作经验URL 结构规律、页面加载特性比如需要滚动才能加载完整内容的陷阱、站点特有的交互逻辑等。这些经验可以跨会话复用避免重复踩坑。踩过一次坑下次 AI 就知道怎么绕过去了。有一点要注意Web Access 虽然强大但它不是搜索引擎。它不会自动去全网搜索答案那是搜索技能的工作。它的专长是你给它一个网址它帮你读懂这个网址里的内容。如果你想让它“搜一下最近关于AI的新闻”那需要配合搜索功能一起用——先搜索得到一批链接再用 Web Access 逐个打开阅读。另外它读取的内容质量取决于网页本身。如果一个网页排版混乱、内容错误百出那AI提炼出来的东西自然也不靠谱。所以建议优先使用权威、结构清晰的网站。它也不解决反爬问题。如果网站有 Cloudflare、验证码、IP封禁Web Access 和你手动打开浏览器遇到的情况是一样的。它不会帮你自动过验证码除非你接第三方的打码服务。它能做的只是像真人一样操作浏览器但网站不让你看它也没辙。谁最适合用这个东西学生/研究者快速从论文页面、统计网站、学术数据库里摘取引用资料。金融从业者实时跟踪财报、公告、行情数据。内容创作者搜集选题素材、查找案例、验证事实。做信息聚合的人每天看好几个竞品官网的价格变动让 AI 早上9点自动去访问一遍。偶尔需要扒点东西但懒得写爬虫的人一年就那么两三次专门写个爬虫太麻烦手动复制又太累。这时候让 AI 跑一趟 Web Access不香吗最后说几句我折腾完那个下午之后让 AI 自己去论坛上把我所有的私信扒了下来整理成一个文本文件。整个过程我没点一下鼠标。那一刻我突然觉得AI 以前像是一个博学的瞎子——读过无数本书但没亲眼看过这个世界的一行字。Web Access 不是什么炫酷的技术但它给了 AI 一双眼睛。哪怕这双眼睛还比较笨需要你告诉它“点这个按钮”“看那个表格”但它至少真的在“看”了。如果你经常需要 AI 帮你上网调研、扒数据非常值得一试。毕竟用 AI 帮你并行开几十个网页找资料这种体验用过一次就回不去了。项目地址放这儿感兴趣的自取https://github.com/eze-is/web-access

更多文章