背景
最近跟医院合作了一些与多组学的医学研究方面的项目,在数据拿到手之后维度特别多 (转录组,微生物宏基因组+50+细胞因子+多维度临床信息),借助claude code +glm快速对数据进行探索性分析,结果可用程度很高,分享一下经验。
主要流程
主要借助 brainstorming技能规划项目结构和分析内容。 先写一个readme.md,解释清楚数据维度和研究背景,然后claude 中启用头脑风暴,在4~5轮对话确定好技术分析框架后即可实施
实施步骤会自动调试python /R代码。
体感python 调试起来很快,出错也容易修复, R的话需要尽量避免写一个几千行 大几十个chunk的Rmarkdown, 否则每次调试都得从头编译, 推荐还是拆分为单独的小模块逐个调试,最后再汇总为一个Rmarkdown/quarto报告。
手动分析一样还是个反复调试的过程,只是AI大大加速了迭代调试的速度。把它当成一个月百来块的大学生用就行了!
经验:
- Claude 的上下文窗口会随着对话增长而填满,性能会下降(有时候 python 缩进,括号都对不齐)。
- 使用
/compact 主动压缩对话
- 将进度写入文件 (
progress.md)
- 使用
/clear 在任务之间清理上下文
- 采用 5-10 轮的短会话而非长会话