{"id":"180ce62b-284a-4e14-aa69-cb00fc5b14a3","shortId":"7jCgYW","kind":"skill","title":"academic-experiments","tagline":"Audit, run, or verify experimental evidence for CS/AI/ML papers. Produces Evidence Inventory with evidence_type annotations (newly_run/preexisting_artifact/user_claim) and Protocol Risk assessments. Use when: checking if experiment results are reproducible, auditing existing expe","description":"# Academic Experiments\n\n将此 skill 视为\"实验取证代理\"，目标是建立最短且可信的证据链，而不是尽量多跑实验。\n\n## Red Lines（绝对禁止）\n\n1. 禁止编造实验结果、图表、命令或运行日志\n2. 禁止把 user_claim（用户口述）当作最终结果写入正文\n3. 禁止把\"领域里常见的预处理/协议默认值\"写成当前项目已确认事实\n4. 禁止把内部验证包装成外部泛化或 SOTA 结论\n5. 禁止因运行受阻就把旧草稿中的数字重新包装成已验证结果\n6. 禁止在不知道图表数据来源的情况下将图表结论写进论文\n\n## 非协商规则\n\n1. 区分三类证据：`newly_run`（本轮执行）、`preexisting_artifact`（已有产物）、`user_claim`（用户口述）。只把前两类当作可直接引用的证据。\n2. 正文中的定量结果优先来自 `newly_run`。若无法重跑，可用 `preexisting_artifact` 但必须标注来源与限制。\n3. 不能运行则明确报告阻塞点、已尝试命令和缺失条件，不得伪装成\"已验证\"。\n4. 先验证环境 → 再跑最小可复核命令（如评估已有 checkpoint） → 只有在确有必要时才重训。不得一上来就 full training。\n5. 写结果时先交代 split 和 aggregation level，再给数字。不得跳过协议直接报指标。\n\n## 任务模式\n\n1. **experiment-evidence-pass** — 完整实验审计：盘点 + 运行 + 记录 + 风险分析\n2. **evidence-inventory-only** — 仅盘点已有实验产物，不执行运行\n3. **minimal-reproducible-run** — 执行最小可复核命令（如评估已有 checkpoint）\n\n## 工作流\n\n### Step 1: 证据盘点\n\n在跑命令前，先盘点（详见 `references/evidence-inventory.md`）：\n\n- 配置文件（config.*）\n- 入口脚本（main.* / train.* / eval.*）\n- 环境文件（requirements.txt / environment.yml）\n- Checkpoint 文件\n- 日志与输出（logs/ / outputs/ / results/）\n- 图表与 CSV 指标文件\n\n回答四个问题：\n1. 能否只评估已有 checkpoint，而无需重训？\n2. 已有结果是窗口级、样本级还是受试者级？\n3. 当前 split 协议是否可靠？\n4. 哪些结果可以在合理时间内复核？\n\n### Step 2: 运行策略\n\n按优先级顺序执行（详见 `references/run-strategy.md`）：\n\n1. 验证环境是否可用（Python/CUDA 版本、依赖）\n2. 定位最小可复核命令（评估已有 checkpoint）\n3. 运行评估或解释脚本\n4. 只有在确有必要时才重训\n\n### Step 3: 记录运行结果（强制标注证据类型）\n\n详见 `references/run-strategy.md`。对每个进入论文正文的实验结果，**必须标注证据类型**（`newly_run` / `preexisting_artifact` / `user_claim`），并至少记录：\n\n```md\n## Experiment Evidence\n- Status: newly_run / preexisting_artifact / blocked\n- Evidence Type: newly_run / preexisting_artifact\n- Command: （实际执行的命令）\n- Workdir: （工作目录）\n- Environment: （Python/CUDA版本、关键依赖）\n- Inputs: （输入数据、checkpoint路径）\n- Key Config: （关键超参数）\n- Output Artifacts: （输出文件路径）\n- Metrics Used In Draft: （正文中引用的指标值）\n- Protocol Risks: （见 Step 4）\n```\n\n**证据类型标注规则**：\n- `newly_run`：本轮 session 中实际运行产生的证据。优先使用，标注运行时间戳。\n- `preexisting_artifact`：仓库中已有但非本轮运行的证据。必须标注来源路径、产生时间（或版本）、已知限制。\n- 正文中的每个数值结果必须在括号内或脚注中标注证据类型，例如：\"准确率 86.58%（newly_run，2026-05-10）\"或\"AUC 0.9314（preexisting_artifact，见 experiments/run_logs/exp001.log）\"。\n\n### Step 4: 协议风险评估\n\n主动记录以下风险（详见 `references/protocol-risks.md`）：\n\n| 风险类型 | 检查点 |\n|---------|--------|\n| 数据泄漏 | 训练/测试划分是否规范 |\n| 验证集调参 | 是否用验证集选阈值后报告测试性能 |\n| baseline 缺失 | 是否缺少关键对比方法 |\n| 无独立测试集 | 是否只有交叉验证或内部划分 |\n| 单次运行 | 是否有方差估计 |\n| 指标定义模糊 | 指标计算方式是否与标准定义一致 |\n| 图表溯源不明 | 图表是否可追溯到对应脚本和 checkpoint |\n\n若某项协议风险足以削弱正文主张的证据强度（如无独立测试集、缺少关键 baseline、仅单次运行却写成强结论），后续 Step 6.5 应保持对应 claim 的 `evidence_debt = open`，直到该主张被降级、风险被显式写出，或该 claim 被冻结/阻塞。\n\n### Step 5: 输出\n\n输出按 `references/schemas/evidence-inventory.md` 中的 Evidence Inventory Schema 组织数据。以下是 Schema 数据的人可读呈现形式：\n\n```md\n## Experiment Evidence\n- Status: newly_run / preexisting_artifact / blocked\n- Command: （实际执行的命令）\n- Workdir: （工作目录）\n- Environment: （Python/CUDA版本、关键依赖）\n- Inputs: （输入数据、checkpoint路径）\n- Key Config: （关键超参数）\n- Output Artifacts: （输出文件路径）\n- Metrics Used In Draft: （正文中引用的指标值）\n- Protocol Risks: （见 Step 4）\n```\n\n完整输出包含：\n\n```md\n## Experiment Evidence\n（按 Step 3 格式逐条记录）\n\n## Protocol Risks\n（按 Step 4 逐项列出）\n\n## Results / Setup Draft\n（可用实验事实写成的草稿段落，缺证据处用占位符）\n\n## Remaining Blockers\n（无法运行的实验、缺失的数据/环境/依赖）\n```\n\n## Agent 资源\n\n本 Skill 目录下的 `agents/` 文件夹包含以下辅助文件：\n\n| 文件 | 用途 |\n|------|------|\n| `agents/experiment_agent.md` | 实验盘点与运行规范 |\n\n**使用方式**：由 `academic-paper-writer` 核心编排器在 Step 4 委托时，按 `academic-paper-writer/references/orchestration-workflow.md` 中的 dispatch 模板创建工具型子代理执行。**此 agent 可运行实验但绝对不得修改项目源代码或数据文件，也不得独立撰写论文正文**。\n\n## 独立使用\n\n当本 Skill 被独立加载（不通过 `academic-paper-writer` 编排器）时：\n\n### 典型请求\n- \"帮我看看这个仓库的实验靠不靠谱\"\n- \"盘点一下已有的实验结果和 checkpoint\"\n- \"跑一下最小可复核实验来验证结果\"\n- \"检查一下实验设计有没有协议风险\"\n\n### 入口分流\n\n| 用户输入特征 | 匹配模式 | 优先级 | 行为 |\n|------------|---------|--------|------|\n| 指定 `repo_path` + 未指定运行模式 | experiment-evidence-pass | 2（路径触发） | 完整审计：盘点 → 环境验证 → 最小运行 → 协议风险 |\n| 指定 `repo_path` + \"只看不动\" | evidence-inventory-only | 1（用户显式指定） | 仅盘点，不执行任何命令 |\n| 指定 `repo_path` + 具体运行命令 | minimal-reproducible-run | 1（用户显式指定） | 验证环境 → 执行命令 → 记录结果 |\n| 未提供 `repo_path` | — | 3（无输入） | 询问路径，或在当前目录自动检测入口文件 |\n\n### 执行约束\n- 开始前必须确认：repo_path（默认检测当前目录）、运行模式（minimal/full/skip_run）、超时限制（默认 30min）\n- **禁止在无用户明确许可下**：修改项目文件、安装依赖包、执行 full training\n- 输出格式与编排器调度一致：Evidence Inventory + Protocol Risks + Remaining Blockers\n- 运行受阻时如实报告，不得伪装结果。降级路径见\"失败处理\"节\n\n### 组合使用指引\n| 场景 | 推荐方式 |\n|------|---------|\n| 只需盘点/复核实验证据 | 本 Skill（独立） |\n| 需将实验结果写入正文并起草 | academic-paper-writer 编排器 |\n| 已有草稿中的结果需验证 | 本 Skill 复核 → academic-reviser 审查 |\n\n## 何时读取 references/\n\n| Reference 文件 | 打开条件 |\n|---------------|---------|\n| `references/evidence-inventory.md` | 执行证据盘点时（Step 1） |\n| `references/run-strategy.md` | 规划运行策略和记录结果时（Step 2-3） |\n| `references/protocol-risks.md` | 评估协议风险时（Step 4） |\n\n## 输出数据格式\n\n实验结果应按 `references/schemas/evidence-inventory.md` 中定义的 Evidence Inventory Schema 组织输出。\n\n## 不适用场景\n\n本 Skill 不适用于：\n- 非 CS/AI/ML 领域的实验（如湿实验、临床实验）\n- 纯理论论文（无实验产物需要复核）\n- 用户明确只需要文献综述的场景\n\n## 失败处理\n\n### 运行失败降级路径\n\n```\n运行失败\n├─ 环境问题（CUDA/Python/依赖版本）\n│  ├─ 报告具体环境检查结果\n│  ├─ 提供安装命令建议\n│  └─ 用户确认安装 → 重试；拒绝安装 → 降级\n├─ 代码不可执行（语法错误/缺失文件）\n│  ├─ 检查是否有可用 checkpoint / 日志 / 结果文件\n│  ├─ 有可用 artifact → 降级为 preexisting_artifact 评估模式\n│  │  └─ 仅执行 Step 1（证据盘点）+ Step 4（协议风险）\n│  └─ 无可用 artifact → 降级为 inventory_only\n│     └─ 输出 known_facts + missing_blocking，全部结果用 [RESULT_NEEDED]\n├─ 运行成本过高（预计 > 30min 或超过用户预期）\n│  ├─ 建议执行\"有限集评估\"（仅评估已有 checkpoint 的最小子集）\n│  ├─ 用户确认 → 执行最小化版本\n│  └─ 用户拒绝 → 降级为 preexisting_artifact 模式\n└─ 任意路径下：\n   - 记录已尝试命令\n   - 标出缺失环境、缺失数据、缺失依赖\n   - 不得因运行受阻而将旧草稿数字重新包装为已验证结果\n```\n\n## Anti-Patterns\n\n| 模式 | 问题 | 正确做法 |\n|------|------|---------|\n| 先跑再想 | 一上来就 full training，不先盘点已有产物 | 先验证环境 → 跑最小可复核命令 → 确有必要才重训 |\n| 协议后置 | 跑完才想用什么评估协议 | 写结果前先交代 split 和 aggregation level |\n| 证据混淆 | 把 user_claim 和 newly_run 混在一起 | 严格区分三类证据，只有前两类可引用 |\n| 伪装运行 | 运行受阻就把旧数字重包为已验证 | 如实报告阻塞点，不得伪造运行结果 |","tags":["academic","experiments","paper","writer","joshua-zyy","academic-writing","agent-skills","anthropic-skills","paper-writing","skills"],"capabilities":["skill","source-joshua-zyy","skill-academic-experiments","topic-academic-writing","topic-agent-skills","topic-anthropic-skills","topic-paper-writing","topic-skills"],"categories":["academic-paper-writer"],"synonyms":[],"warnings":[],"endpointUrl":"https://skills.sh/joshua-zyy/academic-paper-writer/academic-experiments","protocol":"skill","transport":"skills-sh","auth":{"type":"none","details":{"cli":"npx skills add joshua-zyy/academic-paper-writer","source_repo":"https://github.com/joshua-zyy/academic-paper-writer","install_from":"skills.sh"}},"qualityScore":"0.453","qualityRationale":"deterministic score 0.45 from registry signals: · indexed on github topic:agent-skills · 7 github stars · SKILL.md body (5,719 chars)","verified":false,"liveness":"unknown","lastLivenessCheck":null,"agentReviews":{"count":0,"score_avg":null,"cost_usd_avg":null,"success_rate":null,"latency_p50_ms":null,"narrative_summary":null,"summary_updated_at":null},"enrichmentModel":"deterministic:skill-github:v1","enrichmentVersion":1,"enrichedAt":"2026-05-18T19:14:18.464Z","embedding":null,"createdAt":"2026-05-18T13:21:57.193Z","updatedAt":"2026-05-18T19:14:18.464Z","lastSeenAt":"2026-05-18T19:14:18.464Z","tsv":"'-05':279 '-10':280 '-3':573 '/references/orchestration-workflow.md':433 '0.9314':283 '1':48,72,116,143,168,187,486,498,568,625 '2':52,84,126,172,182,192,471,572 '2026':278 '3':58,93,133,175,196,201,388,506 '30min':519,645 '4':63,98,179,198,256,289,381,394,426,577,628 '5':67,107,334 '6':69 '6.5':320 '86.58':275 'academ':2,37,421,430,447,548,557 'academic-experi':1 'academic-paper-writ':420,429,446,547 'academic-revis':556 'agent':407,412,438 'agents/experiment_agent.md':416 'aggreg':111,684 'annot':19 'anti':666 'anti-pattern':665 'artifact':78,91,211,222,229,245,266,285,353,370,618,621,631,657 'assess':25 'auc':282 'audit':4,34 'baselin':301,316 'block':223,354,639 'blocker':402,532 'check':28 'checkpoint':102,140,158,170,195,312,455,614,650 'checkpoint路径':240,365 'claim':55,81,213,322,330,689 'command':230,355 'config':150,242,367 'cs/ai/ml':11,591 'csv':165 'cuda/python':602 'debt':325 'dispatch':435 'draft':250,375,398 'environ':234,359 'environment.yml':157 'eval':154 'evid':9,14,17,119,128,217,224,324,339,348,385,469,483,527,582 'evidence-inventory-on':127,482 'exist':35 'exp':36 'experi':3,30,38,118,216,347,384,468 'experiment':8 'experiment-evidence-pass':117,467 'experiments/run_logs/exp001.log':287 'fact':637 'full':105,524,673 'input':238,363 'inventori':15,129,340,484,528,583,633 'key':241,366 'known':636 'level':112,685 'line':46 'log':161 'main':152 'md':215,346,383 'metric':247,372 'minim':135,495 'minimal-reproducible-run':134,494 'minimal/full/skip_run':516 'miss':638 'need':642 'newli':20,74,86,208,219,226,258,276,350,691 'open':326 'output':162,244,369 'paper':12,422,431,448,549 'pass':120,470 'path':465,480,492,505,513 'pattern':667 'preexist':77,90,210,221,228,265,284,352,620,656 'produc':13 'protocol':23,252,377,390,529 'python/cuda':189,235,360 'red':45 'refer':561,562 'references/evidence-inventory.md':148,565 'references/protocol-risks.md':293,574 'references/run-strategy.md':186,205,569 'references/schemas/evidence-inventory.md':337,580 'remain':401,531 'repo':464,479,491,504,512 'reproduc':33,136,496 'requirements.txt':156 'result':31,163,396,641 'revis':558 'risk':24,253,378,391,530 'run':5,75,87,137,209,220,227,259,277,351,497,692 'run/preexisting_artifact/user_claim':21 'schema':341,344,584 'session':261 'setup':397 'skill':40,410,443,544,554,588 'skill-academic-experiments' 'sota':65 'source-joshua-zyy' 'split':109,177,682 'status':218,349 'step':142,181,200,255,288,319,333,380,387,393,425,567,571,576,624,627 'topic-academic-writing' 'topic-agent-skills' 'topic-anthropic-skills' 'topic-paper-writing' 'topic-skills' 'train':106,153,525,674 'type':18,225 'use':26,248,373 'user':54,80,212,688 'verifi':7 'workdir':232,357 'writer':423,432,449,550 '一上来就':672 '不先盘点已有产物':675 '不得一上来就':104 '不得伪装成':96 '不得伪装结果':534 '不得伪造运行结果':699 '不得因运行受阻而将旧草稿数字重新包装为已验证结果':664 '不得跳过协议直接报指标':114 '不执行任何命令':489 '不执行运行':132 '不能运行则明确报告阻塞点':94 '不适用于':589 '不适用场景':586 '不通过':445 '严格区分三类证据':694 '中定义的':581 '中实际运行产生的证据':262 '中的':338,434 '临床实验':594 '主动记录以下风险':291 '也不得独立撰写论文正文':440 '产生时间':269 '仅单次运行却写成强结论':317 '仅执行':623 '仅盘点':488 '仅盘点已有实验产物':131 '仅评估已有':649 '仓库中已有但非本轮运行的证据':267 '代码不可执行':610 '以下是':343 '任务模式':115 '任意路径下':659 '优先使用':263 '优先级':461 '伪装运行':696 '但必须标注来源与限制':92 '何时读取':560 '使用方式':418 '例如':273 '依赖':191,406 '依赖版本':603 '修改项目文件':521 '先盘点':146 '先跑再想':671 '先验证环境':99,676 '入口分流':458 '入口脚本':151 '全部结果用':640 '关键依赖':237,362 '关键超参数':243,368 '具体运行命令':493 '典型请求':452 '再给数字':113 '再跑最小可复核命令':100 '写成当前项目已确认事实':62 '写结果前先交代':681 '写结果时先交代':108 '准确率':274 '匹配模式':460 '区分三类证据':73 '协议后置':679 '协议是否可靠':178 '协议风险':477,629 '协议风险评估':290 '协议默认值':61 '单次运行':306 '只把前两类当作可直接引用的证据':83 '只有前两类可引用':695 '只有在确有必要时才重训':103,199 '只看不动':481 '只需盘点':541 '可用':89 '可用实验事实写成的草稿段落':399 '可运行实验但绝对不得修改项目源代码或数据文件':439 '后续':318 '命令或运行日志':51 '和':110,683,690 '哪些结果可以在合理时间内复核':180 '回答四个问题':167 '图表':50 '图表与':164 '图表是否可追溯到对应脚本和':311 '图表溯源不明':310 '在跑命令前':145 '场景':539 '复核':555 '复核实验证据':542 '失败处理':536,598 '如实报告阻塞点':698 '如无独立测试集':314 '如湿实验':593 '如评估已有':101,139 '委托时':427 '安装依赖包':522 '完整实验审计':121 '完整审计':473 '完整输出包含':382 '定位最小可复核命令':193 '实际执行的命令':231,356 '实验取证代理':42 '实验盘点与运行规范':417 '实验结果应按':579 '审查':559 '对每个进入论文正文的实验结果':206 '将此':39 '工作流':141 '工作目录':233,358 '已尝试命令和缺失条件':95 '已有产物':79 '已有结果是窗口级':173 '已有草稿中的结果需验证':552 '已知限制':271 '已验证':97 '帮我看看这个仓库的实验靠不靠谱':453 '并至少记录':214 '应保持对应':321 '建议执行':647 '开始前必须确认':511 '强制标注证据类型':203 '当作最终结果写入正文':57 '当前':176 '当本':442 '必须标注来源路径':268 '必须标注证据类型':207 '或':281 '或在当前目录自动检测入口文件':509 '或版本':270 '或该':329 '或超过用户预期':646 '打开条件':564 '执行':523 '执行命令':501 '执行最小化版本':653 '执行最小可复核命令':138 '执行约束':510 '执行证据盘点时':566 '把':687 '报告具体环境检查结果':604 '拒绝安装':608 '指定':463,478,490 '指标定义模糊':308 '指标文件':166 '指标计算方式是否与标准定义一致':309 '按':386,392,428 '按优先级顺序执行':184 '推荐方式':540 '提供安装命令建议':605 '数据泄漏':296 '数据的人可读呈现形式':345 '文件':159,414,563 '文件夹包含以下辅助文件':413 '无可用':630 '无实验产物需要复核':596 '无法运行的实验':403 '无独立测试集':304 '无输入':507 '日志':615 '日志与输出':160 '时':451 '是否只有交叉验证或内部划分':305 '是否有方差估计':307 '是否用验证集选阈值后报告测试性能':300 '是否缺少关键对比方法':303 '最小运行':476 '有可用':617 '有限集评估':648 '未指定运行模式':466 '未提供':503 '本':409,543,553,587 '本轮':260 '本轮执行':76 '标出缺失环境':661 '标注运行时间戳':264 '样本级还是受试者级':174 '核心编排器在':424 '格式逐条记录':389 '检查一下实验设计有没有协议风险':457 '检查是否有可用':613 '检查点':295 '模式':658,668 '模板创建工具型子代理执行':436 '正文中引用的指标值':251,376 '正文中的定量结果优先来自':85 '正文中的每个数值结果必须在括号内或脚注中标注证据类型':272 '正确做法':670 '此':437 '测试划分是否规范':298 '混在一起':693 '版本':190,236,361 '独立':545 '独立使用':441 '环境':405 '环境文件':155 '环境问题':601 '环境验证':475 '用户口述':56,82 '用户拒绝':654 '用户明确只需要文献综述的场景':597 '用户显式指定':487,499 '用户确认':652 '用户确认安装':606 '用户输入特征':459 '用途':415 '由':419 '的':323 '的最小子集':651 '盘点':122,474 '盘点一下已有的实验结果和':454 '目录下的':411 '目标是建立最短且可信的证据链':43 '直到该主张被降级':327 '确有必要才重训':678 '禁止因运行受阻就把旧草稿中的数字重新包装成已验证结果':68 '禁止在不知道图表数据来源的情况下将图表结论写进论文':70 '禁止在无用户明确许可下':520 '禁止把':53,59 '禁止把内部验证包装成外部泛化或':64 '禁止编造实验结果':49 '纯理论论文':595 '组合使用指引':538 '组织数据':342 '组织输出':585 '结果文件':616 '结论':66 '绝对禁止':47 '编排器':450,551 '缺失':302 '缺失依赖':663 '缺失数据':662 '缺失文件':612 '缺失的数据':404 '缺少关键':315 '缺证据处用占位符':400 '而不是尽量多跑实验':44 '而无需重训':171 '能否只评估已有':169 '节':537 '若无法重跑':88 '若某项协议风险足以削弱正文主张的证据强度':313 '行为':462 '被冻结':331 '被独立加载':444 '见':254,286,379 '规划运行策略和记录结果时':570 '视为':41 '训练':297 '记录':124 '记录已尝试命令':660 '记录结果':502 '记录运行结果':202 '证据混淆':686 '证据盘点':144,626 '证据类型标注规则':257 '评估协议风险时':575 '评估已有':194 '评估模式':622 '询问路径':508 '详见':147,185,204,292 '语法错误':611 '资源':408 '超时限制':517 '跑一下最小可复核实验来验证结果':456 '跑完才想用什么评估协议':680 '跑最小可复核命令':677 '路径触发':472 '输入数据':239,364 '输出':335,635 '输出按':336 '输出数据格式':578 '输出文件路径':246,371 '输出格式与编排器调度一致':526 '运行':123 '运行受阻就把旧数字重包为已验证':697 '运行受阻时如实报告':533 '运行失败':600 '运行失败降级路径':599 '运行成本过高':643 '运行模式':515 '运行策略':183 '运行评估或解释脚本':197 '逐项列出':395 '配置文件':149 '重试':607 '问题':669 '阻塞':332 '降级':609 '降级为':619,632,655 '降级路径见':535 '需将实验结果写入正文并起草':546 '非':590 '非协商规则':71 '预计':644 '领域的实验':592 '领域里常见的预处理':60 '风险分析':125 '风险类型':294 '风险被显式写出':328 '验证环境':500 '验证环境是否可用':188 '验证集调参':299 '默认':518 '默认检测当前目录':514","prices":[{"id":"70fa32bc-d2f1-418f-93d4-5cb5d0a239d5","listingId":"180ce62b-284a-4e14-aa69-cb00fc5b14a3","amountUsd":"0","unit":"free","nativeCurrency":null,"nativeAmount":null,"chain":null,"payTo":null,"paymentMethod":"skill-free","isPrimary":true,"details":{"org":"joshua-zyy","category":"academic-paper-writer","install_from":"skills.sh"},"createdAt":"2026-05-18T13:21:57.193Z"}],"sources":[{"listingId":"180ce62b-284a-4e14-aa69-cb00fc5b14a3","source":"github","sourceId":"joshua-zyy/academic-paper-writer/academic-experiments","sourceUrl":"https://github.com/joshua-zyy/academic-paper-writer/tree/main/skills/academic-experiments","isPrimary":false,"firstSeenAt":"2026-05-18T13:21:57.193Z","lastSeenAt":"2026-05-18T19:14:18.464Z"}],"details":{"listingId":"180ce62b-284a-4e14-aa69-cb00fc5b14a3","quickStartSnippet":null,"exampleRequest":null,"exampleResponse":null,"schema":null,"openapiUrl":null,"agentsTxtUrl":null,"citations":[],"useCases":[],"bestFor":[],"notFor":[],"kindDetails":{"org":"joshua-zyy","slug":"academic-experiments","github":{"repo":"joshua-zyy/academic-paper-writer","stars":7,"topics":["academic-writing","agent-skills","anthropic-skills","paper-writing","skills"],"license":"mit","html_url":"https://github.com/joshua-zyy/academic-paper-writer","pushed_at":"2026-05-18T03:40:09Z","description":"面向 CS / AI / ML 领域的证据驱动、分节推进的论文写作 Agent Skill。","skill_md_sha":"75b4f76f364cc9ee71362dd37850b569604d6342","skill_md_path":"skills/academic-experiments/SKILL.md","default_branch":"main","skill_tree_url":"https://github.com/joshua-zyy/academic-paper-writer/tree/main/skills/academic-experiments"},"layout":"multi","source":"github","category":"academic-paper-writer","frontmatter":{"name":"academic-experiments","description":"Audit, run, or verify experimental evidence for CS/AI/ML papers. Produces Evidence Inventory with evidence_type annotations (newly_run/preexisting_artifact/user_claim) and Protocol Risk assessments. Use when: checking if experiment results are reproducible, auditing existing experiment artifacts, running minimal reproducible commands, evaluating checkpoints without full retraining, documenting protocol risks like data leakage or missing baselines. Triggers on: 复核实验, run experiments, 实验结果, experiment evidence, verify results, 实验验证, evidence inventory, protocol risk, 跑实验, check results, reproduce experiments, 实验审计."},"skills_sh_url":"https://skills.sh/joshua-zyy/academic-paper-writer/academic-experiments"},"updatedAt":"2026-05-18T19:14:18.464Z"}}