CounterAttack/rigorous-scientific-research

暂无描述

Python 100%

查找文件

仓库文件（优先显示最新提交）
文件名	最新提交消息	最新提交日期
CASTAR dc9a373daa Initial scientific computation skill pack		2026-06-18 19:07:32 +08:00
.agents/skills	Initial scientific computation skill pack	2026-06-18 19:07:32 +08:00
audits	Initial scientific computation skill pack	2026-06-18 19:07:32 +08:00
tests	Initial scientific computation skill pack	2026-06-18 19:07:32 +08:00
.gitattributes	Initial scientific computation skill pack	2026-06-18 19:07:32 +08:00
.gitignore	Initial scientific computation skill pack	2026-06-18 19:07:32 +08:00
AGENTS.md	Initial scientific computation skill pack	2026-06-18 19:07:32 +08:00
README.md	Initial scientific computation skill pack	2026-06-18 19:07:32 +08:00

README.md

科研计算安全 Skill Pack v0.2

本仓库包含一个 repo-scoped Codex skill pack，路径为 .agents/skills。它用于让 AI 辅助科研计算更可审计：要求 invariants、有边界实验循环、确定性证据、独立交叉检查、结果溯源、任务树、文稿一致性检查和合规审计。

这是安全工作流，不是正确性保证。

Skills 列表

Skill	用途
`invariant-contract`	在信任科学计算前定义 invariants、保证位置、直接测试、容差和失败条件。
`bounded-experiment-loop`	用假设、预算、ledger 和停止规则约束重复实验、仿真、参数搜索和长耗时命令。
`deterministic-verification`	在声称正确性、等价、精确、守恒、标度或数值结论前，要求工具支持证据。
`skill-compliance-audit`	审计 required artifacts、scripts、ledgers、logs 和停止条件处理是否存在。
`independent-crosscheck`	对关键结论要求结构独立的交叉检查。
`result-provenance-audit`	在接受最终图表前审计结果、数据、图和表格溯源。
`research-task-tree`	将长研究任务组织为可恢复的编号任务树、依赖和 summaries。
`manuscript-consistency-audit`	审计论文和笔记的符号一致性、claim-source 链接、过时段落和无来源 claims。

脚本列表和用法

所有脚本只使用 Python 标准库。

python .agents/skills/invariant-contract/scripts/validate_invariant_contract.py checks/invariant-contract.md

python .agents/skills/bounded-experiment-loop/scripts/validate_run_ledger.py runs/run-ledger.csv --max-runs 3

python .agents/skills/deterministic-verification/scripts/scan_dangerous_claims.py . --out audits/dangerous-claims-report.md --include-ext .md,.py,.tex,.ipynb --exclude-dir .git,node_modules,target,dist,build

python .agents/skills/result-provenance-audit/scripts/check_plot_provenance.py figures/figure-provenance.md

python .agents/skills/manuscript-consistency-audit/scripts/scan_manuscript_claims.py draft.tex

或：

python .agents/skills/manuscript-consistency-audit/scripts/scan_manuscript_claims.py notes/

典型 workflow

长项目先使用 research-task-tree。
实现或信任结果前使用 invariant-contract。
重复运行或调参时使用 bounded-experiment-loop。
提出正确性或数值 claim 前使用 deterministic-verification。
关键结论定稿前使用 independent-crosscheck。
图表和表格定稿前使用 result-provenance-audit。
写论文或研究笔记时使用 manuscript-consistency-audit。
最后使用 skill-compliance-audit。

真实科研任务调用示例

使用 research-task-tree skill，为复现这个 solver paper 制定任务树，然后再改代码。

使用 invariant-contract skill，在实现这个有限体积更新前列出 invariants 和测试。

使用 bounded-experiment-loop skill。最多运行 3 次仿真，每次只测试一个参数变化。

使用 deterministic-verification skill，在声称两个格式等价前扫描危险 prose-only claims 并提供命令输出。

使用 independent-crosscheck skill，把这个结果和一个小系统 brute-force baseline 比较。

使用 result-provenance-audit skill，在接受最终图前检查 raw data、processed data、脚本、命令和 hash。

使用 manuscript-consistency-audit skill 审计 draft.tex，并建立 claim-source ledger。

使用 skill-compliance-audit skill，审计这个任务是否留下了 required evidence。

自检流程

运行轻量 smoke tests：

python tests/run_script_smoke_tests.py

然后审计 skill pack：

使用 skill-compliance-audit skill，把当前仓库作为 skill-pack installation 审计，而不是已完成科研任务审计。

安全边界

不要把“程序能跑”当作证据。
不要把“图看起来对”当作证据。
不要把流畅文字当作证据。
没有命令输出、测试日志、CAS 输出、ledger rows、provenance 或 cross-check evidence 时，不要声称已验证。
不要创建假的 checks/、runs/、figures/、drafts/ 或 tasks/ 证据来改善审计结果。
证据缺失时写 Insufficient evidence。
invariant 失败或 independent cross-check 不一致时，必须停止依赖工作。