暂无描述
查找文件
仓库文件(优先显示最新提交)
文件名 最新提交消息 最新提交日期
2026-06-18 19:07:32 +08:00
.agents/skills Initial scientific computation skill pack 2026-06-18 19:07:32 +08:00
audits Initial scientific computation skill pack 2026-06-18 19:07:32 +08:00
tests Initial scientific computation skill pack 2026-06-18 19:07:32 +08:00
.gitattributes Initial scientific computation skill pack 2026-06-18 19:07:32 +08:00
.gitignore Initial scientific computation skill pack 2026-06-18 19:07:32 +08:00
AGENTS.md Initial scientific computation skill pack 2026-06-18 19:07:32 +08:00
README.md Initial scientific computation skill pack 2026-06-18 19:07:32 +08:00

科研计算安全 Skill Pack v0.2

本仓库包含一个 repo-scoped Codex skill pack,路径为 .agents/skills。它用于让 AI 辅助科研计算更可审计:要求 invariants、有边界实验循环、确定性证据、独立交叉检查、结果溯源、任务树、文稿一致性检查和合规审计。

这是安全工作流,不是正确性保证。

Skills 列表

Skill 用途
invariant-contract 在信任科学计算前定义 invariants、保证位置、直接测试、容差和失败条件。
bounded-experiment-loop 用假设、预算、ledger 和停止规则约束重复实验、仿真、参数搜索和长耗时命令。
deterministic-verification 在声称正确性、等价、精确、守恒、标度或数值结论前,要求工具支持证据。
skill-compliance-audit 审计 required artifacts、scripts、ledgers、logs 和停止条件处理是否存在。
independent-crosscheck 对关键结论要求结构独立的交叉检查。
result-provenance-audit 在接受最终图表前审计结果、数据、图和表格溯源。
research-task-tree 将长研究任务组织为可恢复的编号任务树、依赖和 summaries。
manuscript-consistency-audit 审计论文和笔记的符号一致性、claim-source 链接、过时段落和无来源 claims。

脚本列表和用法

所有脚本只使用 Python 标准库。

python .agents/skills/invariant-contract/scripts/validate_invariant_contract.py checks/invariant-contract.md
python .agents/skills/bounded-experiment-loop/scripts/validate_run_ledger.py runs/run-ledger.csv --max-runs 3
python .agents/skills/deterministic-verification/scripts/scan_dangerous_claims.py . --out audits/dangerous-claims-report.md --include-ext .md,.py,.tex,.ipynb --exclude-dir .git,node_modules,target,dist,build
python .agents/skills/result-provenance-audit/scripts/check_plot_provenance.py figures/figure-provenance.md
python .agents/skills/manuscript-consistency-audit/scripts/scan_manuscript_claims.py draft.tex

或:

python .agents/skills/manuscript-consistency-audit/scripts/scan_manuscript_claims.py notes/

典型 workflow

  1. 长项目先使用 research-task-tree
  2. 实现或信任结果前使用 invariant-contract
  3. 重复运行或调参时使用 bounded-experiment-loop
  4. 提出正确性或数值 claim 前使用 deterministic-verification
  5. 关键结论定稿前使用 independent-crosscheck
  6. 图表和表格定稿前使用 result-provenance-audit
  7. 写论文或研究笔记时使用 manuscript-consistency-audit
  8. 最后使用 skill-compliance-audit

真实科研任务调用示例

使用 research-task-tree skill,为复现这个 solver paper 制定任务树,然后再改代码。
使用 invariant-contract skill,在实现这个有限体积更新前列出 invariants 和测试。
使用 bounded-experiment-loop skill。最多运行 3 次仿真,每次只测试一个参数变化。
使用 deterministic-verification skill,在声称两个格式等价前扫描危险 prose-only claims 并提供命令输出。
使用 independent-crosscheck skill,把这个结果和一个小系统 brute-force baseline 比较。
使用 result-provenance-audit skill,在接受最终图前检查 raw data、processed data、脚本、命令和 hash。
使用 manuscript-consistency-audit skill 审计 draft.tex,并建立 claim-source ledger。
使用 skill-compliance-audit skill,审计这个任务是否留下了 required evidence。

自检流程

运行轻量 smoke tests:

python tests/run_script_smoke_tests.py

然后审计 skill pack:

使用 skill-compliance-audit skill,把当前仓库作为 skill-pack installation 审计,而不是已完成科研任务审计。

安全边界

  • 不要把“程序能跑”当作证据。
  • 不要把“图看起来对”当作证据。
  • 不要把流畅文字当作证据。
  • 没有命令输出、测试日志、CAS 输出、ledger rows、provenance 或 cross-check evidence 时,不要声称已验证。
  • 不要创建假的 checks/runs/figures/drafts/tasks/ 证据来改善审计结果。
  • 证据缺失时写 Insufficient evidence
  • invariant 失败或 independent cross-check 不一致时,必须停止依赖工作。