暂无描述
- Python 100%
| 文件名 | 最新提交消息 | 最新提交日期 |
|---|---|---|
| .agents/skills | ||
| audits | ||
| tests | ||
| .gitattributes | ||
| .gitignore | ||
| AGENTS.md | ||
| README.md | ||
科研计算安全 Skill Pack v0.2
本仓库包含一个 repo-scoped Codex skill pack,路径为 .agents/skills。它用于让 AI 辅助科研计算更可审计:要求 invariants、有边界实验循环、确定性证据、独立交叉检查、结果溯源、任务树、文稿一致性检查和合规审计。
这是安全工作流,不是正确性保证。
Skills 列表
| Skill | 用途 |
|---|---|
invariant-contract |
在信任科学计算前定义 invariants、保证位置、直接测试、容差和失败条件。 |
bounded-experiment-loop |
用假设、预算、ledger 和停止规则约束重复实验、仿真、参数搜索和长耗时命令。 |
deterministic-verification |
在声称正确性、等价、精确、守恒、标度或数值结论前,要求工具支持证据。 |
skill-compliance-audit |
审计 required artifacts、scripts、ledgers、logs 和停止条件处理是否存在。 |
independent-crosscheck |
对关键结论要求结构独立的交叉检查。 |
result-provenance-audit |
在接受最终图表前审计结果、数据、图和表格溯源。 |
research-task-tree |
将长研究任务组织为可恢复的编号任务树、依赖和 summaries。 |
manuscript-consistency-audit |
审计论文和笔记的符号一致性、claim-source 链接、过时段落和无来源 claims。 |
脚本列表和用法
所有脚本只使用 Python 标准库。
python .agents/skills/invariant-contract/scripts/validate_invariant_contract.py checks/invariant-contract.md
python .agents/skills/bounded-experiment-loop/scripts/validate_run_ledger.py runs/run-ledger.csv --max-runs 3
python .agents/skills/deterministic-verification/scripts/scan_dangerous_claims.py . --out audits/dangerous-claims-report.md --include-ext .md,.py,.tex,.ipynb --exclude-dir .git,node_modules,target,dist,build
python .agents/skills/result-provenance-audit/scripts/check_plot_provenance.py figures/figure-provenance.md
python .agents/skills/manuscript-consistency-audit/scripts/scan_manuscript_claims.py draft.tex
或:
python .agents/skills/manuscript-consistency-audit/scripts/scan_manuscript_claims.py notes/
典型 workflow
- 长项目先使用
research-task-tree。 - 实现或信任结果前使用
invariant-contract。 - 重复运行或调参时使用
bounded-experiment-loop。 - 提出正确性或数值 claim 前使用
deterministic-verification。 - 关键结论定稿前使用
independent-crosscheck。 - 图表和表格定稿前使用
result-provenance-audit。 - 写论文或研究笔记时使用
manuscript-consistency-audit。 - 最后使用
skill-compliance-audit。
真实科研任务调用示例
使用 research-task-tree skill,为复现这个 solver paper 制定任务树,然后再改代码。
使用 invariant-contract skill,在实现这个有限体积更新前列出 invariants 和测试。
使用 bounded-experiment-loop skill。最多运行 3 次仿真,每次只测试一个参数变化。
使用 deterministic-verification skill,在声称两个格式等价前扫描危险 prose-only claims 并提供命令输出。
使用 independent-crosscheck skill,把这个结果和一个小系统 brute-force baseline 比较。
使用 result-provenance-audit skill,在接受最终图前检查 raw data、processed data、脚本、命令和 hash。
使用 manuscript-consistency-audit skill 审计 draft.tex,并建立 claim-source ledger。
使用 skill-compliance-audit skill,审计这个任务是否留下了 required evidence。
自检流程
运行轻量 smoke tests:
python tests/run_script_smoke_tests.py
然后审计 skill pack:
使用 skill-compliance-audit skill,把当前仓库作为 skill-pack installation 审计,而不是已完成科研任务审计。
安全边界
- 不要把“程序能跑”当作证据。
- 不要把“图看起来对”当作证据。
- 不要把流畅文字当作证据。
- 没有命令输出、测试日志、CAS 输出、ledger rows、provenance 或 cross-check evidence 时,不要声称已验证。
- 不要创建假的
checks/、runs/、figures/、drafts/或tasks/证据来改善审计结果。 - 证据缺失时写
Insufficient evidence。 - invariant 失败或 independent cross-check 不一致时,必须停止依赖工作。