我们公司部门内部有个 GPT 讨论群,我已经跟不上他们讨论的进度了,直接贴一些他们的答案吧。
辅助编码的最佳组合是 vscode + roo code + openrouter api/deepseek api
另外,我在做 RAG 项目的过程中也有一些结论。其一,确实如 yihui 所言,具体的问题得到具体的答案,模糊的问题得到模糊的答案;其二,我们用的 API 是阿里云的,可以调用通义以及 deepseek 的模型,在固定流程编排以后,用 RAGAS 框架分别对 QWEN-MAX 、 deepseek V3、deepseek R1 评估效果,温度参数设定一致的情况下,在已经往知识库传了标准问答对以后,三个家伙回答标准问题也有些差异,我们推测这三个模型本身的温度参数不一样,导致各自的幻觉程度有所不同,按我之前测试的结果是,DEEPSEEK-V3 温度参数最低,QWEN-MAX 次之,DEEPSEEK-R1 最高。