韩国政府项目:自动收集拨款与研发数据 - Openclaw Skills

作者:互联网

2026-03-30

AI教程

什么是 韩国正府项目?

韩国正府项目是一款强大的数据提取工具,旨在汇总各种韩国正府支持倡议,包括 TIPS、小微企业援助和各种研发拨款。通过利用 Openclaw Skills,该工具将来自 BizInfo 和 NIA 等官方门户网站的碎片化网页数据转换为结构化的、机器可读的 JSONL 数据集。对于需要维护最新财务机会数据库而无需手动浏览的开发人员和研究人员来说,它特别有价值。

该技能通过其增量收集机制强调可靠性,确保在后续运行中仅添加新项目。Openclaw Skills 的这种集成允许创建包含正府资金、信息化项目和技术创业支持等重要信息的本地数据湖,同时保持尊重的抓取率以确保长期稳定性。

下载入口:https://github.com/openclaw/skills/tree/main/skills/lifeissea/korean-gov-programs

安装与下载

1. ClawHub CLI

从源直接安装技能的最快方式。

npx clawhub@latest install korean-gov-programs

2. 手动安装

将技能文件夹复制到以下位置之一

全局模式 ~/.openclaw/skills/ 工作区 /skills/

优先级:工作区 > 本地 > 内置

3. 提示词安装

将此提示词复制到 OpenClaw 即可自动安装。

请帮我使用 Clawhub 安装 korean-gov-programs。如果尚未安装 Clawhub,请先安装(npm i -g clawhub)。

韩国正府项目 应用场景

  • 自动追踪针对技术初创企业的最新研发拨款公告。
  • 为小微企业支持项目建立集中式数据库。
  • 实时坚控 TIPS 和信息化项目的截止日期。
  • 汇总财政援助数据,用于市场研究和金融科技应用。
韩国正府项目 工作原理
  1. 通过 CLI 触发收集脚本,指定数据文件的输出目录。
  2. 扫描定义的来源(如 BizInfo 和 NIA),寻找最新的正府项目列表。
  3. 系统解析 HTML 结构和 onclick 模式,提取资金金额和截止日期等元数据。
  4. 重复预防逻辑根据项目标题检查现有记录,以确保数据的唯一性。
  5. 结构化记录被附加到分类的 JSONL 文件中,同时进度保存在检查点文件中。

韩国正府项目 配置指南

要开始使用此技能收集数据,请遵循以下安装和执行步骤:

# 进入技能目录
cd korean-gov-programs

# 运行收集脚本将数据汇总到 ./data 文件夹中
python3 scripts/collect.py --output ./data

# 使用自定义输出目录
python3 scripts/collect.py --output /your/custom/path

# 验证收集状态并查看统计信息
bash scripts/stats.sh ./data

韩国正府项目 数据架构与分类体系

收集的数据被组织到 soho_programs.jsonl(小微企业)和 gov_programs.jsonl(研发与技术)中。每个条目遵循以下架构:

描述 示例
title 项目的官方名称 TIPS 创业支持
category 项目分类 研发
source 提供支持的机构 BizInfo
url 原始公告链接 https://...
amount 资助或支持金额 5 亿韩元
deadline 申请截止日期 ~2026-03-31
collected_at 收集时间戳 2026-02-19T08:53:00
name: Korean Gov Programs
description: Collect Korean government support programs (TIPS, Small Business, R&D grants) into structured JSONL files. Supports incremental collection with checkpoints.
version: 1.0.8
author: raon

korean-gov-programs

?? ??????(TIPS, ????, R&D)? ???? JSONL ??? ???? ??. ????? ?? ?? ???? ?? ?? ???? ??.


?? ??

?? ???? ?? ??
????(BizInfo) ???? ?? HTML ? ??
NIA ??????????? ????? onclick ?? ? ??
???? ???? ?? ????/R&D ?? HTML ? ??
??????????(SEMAS) ???? JS ??? ?? ?? ??
???????(MSS) ???? JS ??? ?? ?? ??
K-Startup ???? JS ??? ?? ?? ??
??????????(Innopolis) R&D JS ??? ?? ?? ??
?????(KISED) ?? eGovFrame ?? ?? ??

JS ??? ?? ???? Selenium/Playwright ???? ?? ?? ??.


???

# ?? ?? (./data ????? ??)
python3 scripts/collect.py --output ./data

# ??? ?? ????
python3 scripts/collect.py --output /path/to/output

# ?? ?? ??
bash scripts/stats.sh ./data

JSONL ???

{
  "title": "???",
  "category": "???? | ???? | ????? | R&D",
  "source": "?? ?? ???",
  "url": "?? ??? URL",
  "amount": "?? ?? (?? ??)",
  "deadline": "??? (?: ~2026-03-31)",
  "description": "?? ??",
  "collected_at": "2026-02-19T08:53:00.000000"
}

????? & ?? ??

  • APPEND ??: ?? ?? ???? ?? ??
  • ?? ??: title ?? ?? ?? ??
  • ?????: .checkpoint.json? ?? ?? ?? → ??? ? ??? ??
  • ???: ?? ? 0.8? ?? (?? ?? ??)

?? ??

data/
├── soho_programs.jsonl         # ???? ????
├── gov_programs.jsonl          # ?? R&D / ???? ????
└── .checkpoint.json            # ????? (?? ??)

?? ??

korean-gov-programs/
├── SKILL.md                    # ? ??
└── scripts/
    ├── collect.py              # ?? ?? ????
    └── stats.sh                # ?? ?? ??