Web Scraper：使用 r.jina.ai 绕过 Cloudflare

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

Web Scraper：使用 r.jina.ai 绕过 Cloudflare - Openclaw Skills

作者：互联网

2026-03-30

AI教程

什么是 Web Scraper (r.jina.ai)？

Web Scraper 技能旨在简化从受 Cloudflare、Turnstile 和其他现代机器人检测系统保护的网站中提取数据的过程。通过利用 r.jina.ai API，此技能允许用户将复杂的网页结构转换为简洁的、适用于大语言模型（LLM）的 Markdown。它是开发者构建需要可靠访问高安全性域名内容的 Openclaw Skills 的必备工具。

该工具在受保护的网页内容与您的 AI 代理之间提供了无缝桥梁。无论您是处理社交媒体平台还是新闻网站，此技能都能确保您的 Openclaw Skills 在不被常见防火墙技术拦截的情况下获取所需数据。

下载入口:https://github.com/openclaw/skills/tree/main/skills/itonlyforfun-ai/web-scraper-jina

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install web-scraper-jina

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级：工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 web-scraper-jina。如果尚未安装 Clawhub，请先安装（npm i -g clawhub）。

Web Scraper (r.jina.ai) 应用场景

从 Truth Social、Gab 和 Gettr 等社交媒体平台提取内容。
绕过新闻和商业网站上的 Cloudflare 和 Turnstile 保护。
将复杂的 HTML 网页转换为简洁的 Markdown，供 LLM 使用。
作为更广泛的 Openclaw Skills 套件的一部分，监控竞争对手网站和金融平台。

Web Scraper (r.jina.ai) 工作原理

确定受保护或需要提取内容的方目标 URL。
在目标地址前加上 r.jina.ai 代理 URL。
通过代理服务提交 GET 请求。
接收处理后的页面内容（简洁的 Markdown 字符串），以便在您的 Openclaw Skills 工作流中使用。

Web Scraper (r.jina.ai) 配置指南

在 Openclaw Skills 环境中使用此技能无需复杂的本地依赖，因为它利用了 r.jina.ai 网络服务。

# 使用 CURL 抓取受保护网站的示例
curl -s "https://r.jina.ai/https://truthsocial.com/@realDonaldTrump"

# Python 中的示例实现
import requests

def scrape_site(url):
    response = requests.get(f"https://r.jina.ai/{url}")
    return response.text

Web Scraper (r.jina.ai) 数据架构与分类体系

该技能遵循简单的请求-响应模式，可轻松集成到任何 Openclaw Skills 架构中。

组件	类型	描述
输入 URL	字符串	要抓取的完整目标 URL
输出格式	字符串	格式整洁的 Markdown 文本
API 提供商	服务	r.jina.ai（兼容免费层级）

name: Web Scraper (r.jina.ai)
description: Bypass Cloudflare and scrape any website using r.jina.ai API. Works on sites with strong protection like Truth Social, Cloudflare Turnstile, etc.
version: "1.0.0"
author: Liuge
tags:
  - web
  - scraper
  - cloudflare
  - bypass
  - jina

Web Scraper using r.jina.ai

Bypass Cloudflare and scrape any website using free r.jina.ai API.

Features

Bypass Cloudflare, Turnstile, and other protections
Works on Truth Social, Bitget, and other protected sites
Returns clean Markdown content
Free to use

Usage

Simply prepend https://r.jina.ai/ to any URL:

https://r.jina.ai/https://truthsocial.com/@realDonaldTrump
https://r.jina.ai/https://bitget.com/events/poolx

Examples

curl -s "https://r.jina.ai/https://truthsocial.com/@realDonaldTrump"

Get any protected page:

curl -s "https://r.jina.ai/https://example.com"

In Code

import requests

def scrape(url):
    return requests.get(f"https://r.jina.ai/{url}").text

Use Cases

Scrape Truth Social, Gab, Gettr
Bypass Cloudflare protected sites
Extract content from news articles
Monitor competitors

上一篇：智能体团队管理：编排多智能体工作流 - Openclaw Skills 下一篇：Context-Viz: 监控 Openclaw Skills 的 Token 使用情况

相关推荐

技能收益追踪器：监控 Openclaw 技能并实现变现什么是技能收益追踪器？技能收益追踪器是一款专业级实用工具，旨在弥合 AI 开发与经济可持续性之间的鸿沟。随着开发者开始将作品变现，该工具提供了必要的基础设施，用于监控 ClawHub、EvoMap 和

2026-03-30

立即查看

信号管道：自动化营销情报工具 - Openclaw Skills 什么是信号管道？信号管道是一个复杂的数据采集和内容合成工具，旨在将碎片化的数字噪音转化为结构化的营销情报。作为 Openclaw Skills 的多功能组件，该系统坚控高价值来源，包括 RSS 订阅、X

2026-03-30

立即查看

AI 合规准备就绪度：评估与治理工具 - Openclaw Skills 什么是 AI 合规准备就绪度？此技能为组织提供了一个全面的框架，用于从八个关键维度评估其 AI 合规态势。它通过分析风险分类、偏差缓解和数据来源，弥合了技术 AI 部署与复杂监管要求之间的差距。利用这些 O

2026-03-30

立即查看

FOSMVVM ServerRequest 测试生成器：自动化 API 测试 - Openclaw Skills 什么是 FOSMVVM ServerRequest 测试生成器？ FOSMVVM ServerRequest 测试生成器是 Openclaw Skills 生态系统中的专用工具，旨在简化服务端 Swift 单元

2026-03-30

立即查看

专题

#Grok

Grok脚本资源网站，提供G

+ 收藏

#Sora2

Sora2脚本资源网站，提供S

+ 收藏

#通义万相

通义万相脚本资源网站，提供通

+ 收藏

#海螺AI

海螺AI脚本资源网站，提供海

+ 收藏

#可灵AI

可灵AI脚本资源网站，提供可

+ 收藏

#Kling3.0

Kling3.0脚本资源网站，提

+ 收藏

最新数据

历史政治斗争分析：中国与西欧 - Openclaw Skills 什么是中西方z治斗争分析？

自我反思技能：深度 AI 演进与系统审计 - Openclaw Skills

智能体团队管理：编排多智能体工作流 - Openclaw Skills

icloud同步登录AppleID直达入口-icloud登录照片云存储一键直达

OpenJobs: 自主AI智能体市场 - Openclaw技能

VibeVoice: 本地西班牙语文本转语音 - Openclaw Skills

Nextcloud：文件管理与 WebDAV 自动化 - Openclaw Skills

Qdrant 高级版：向量数据库操作与搜索 - Openclaw Skills

FarmOS 天气：精准农艺与田间预报 - Openclaw Skills

信号管道：自动化营销情报工具 - Openclaw Skills

03/30

技能收益追踪器：监控 Openclaw 技能并实现变现

03/30

AI 合规准备就绪度：评估与治理工具 - Openclaw Skills

03/30

FOSMVVM ServerRequest 测试生成器：自动化 API 测试 - Openclaw Skills

03/30

酒店搜索器：AI 赋能的住宿与位置情报 - Openclaw Skills

03/30

Dub 链接 API：程序化链接管理 - Openclaw Skills

03/30

IntercomSwap：P2P BTC 与 USDT 跨链兑换 - Openclaw Skills

03/30

spotplay：macOS 原生 Spotify 播放控制 - Openclaw Skills

03/30

DeepSeek OCR：AI驱动的图像文本识别 - Openclaw Skills

03/30

Web Navigator：自动化网页研究与浏览 - Openclaw Skills

03/30

AI精选

MCP 协议深度解析：构建 A

OpenClaw 真正的效率开

精选

Anthropic 的 Harness 启示：当 AI Agent 开始「长跑」，架构才是真正的天花板

精选

AI Agent 智能体 - Multi-Agent 架构入门

精选

RAG 不一定非得靠向量库：一套更偏工程落地的“结构化推理检索”方案

精选

一文搞懂深度学习中的池化！

精选

一文搞懂卷积神经网络经典架构-LeNet

精选

告别 Vibe Coding：用 SDD 让 AI 编程提效 50%，三工具实战对比

精选

Agent 语音交互如何更稳、更快？一次高并发消息链路优化实践

精选

# AI 终于能"干活"了——Function Calling 完全指南

脚本推荐

SeeDance 2.0 Video Creator专区

OpenClaw AI专区

cowork专区

claude code skills专区

Web Scraper：使用 r.jina.ai 绕过 Cloudflare - Openclaw Skills

什么是 Web Scraper (r.jina.ai)？

安装与下载

1. ClawHub CLI

2. 手动安装

3. 提示词安装

Web Scraper (r.jina.ai) 应用场景

Web Scraper (r.jina.ai) 配置指南

Web Scraper (r.jina.ai) 数据架构与分类体系

Web Scraper using r.jina.ai

Features

Usage

Examples

Get Trump Truth Social posts:

Get any protected page:

In Code

Use Cases