AI 工具使用感受

yihui · 13 天前

Liechi 想说给他发点花生糖，但好像过于反客为主了：）

对，英文世界里花生糖由查理芒格来发，中文世界里只能由我发，不好意思这个坑我占定了。

Liechi 紫色背后的故事

泪点低的慎点：

yihui · 13 天前

tctcab 老婆产检

哇，恭喜恭喜！

Liechi · 13 天前

yihui

yihui 中文世界里只能由我发

有商机。屯点花生糖去。

yihui 泪点低的慎点：

泪点不算低，但还是慎一下吧。

liang-qijie · 13 天前

Liechi 新年前的一两个星期用的 deepseek，可以说是国内 AI 里最好的一个（单方面观点），R 代码上的问题我一般都是用的 deepseek，是真的觉得 deepseek 给的内容能帮我解决我的问题。

Jiena · 13 天前

前天还把老婆产检结果拍个照让deepseek逐一解析

太好啦，恭喜恭喜。
我的感受是 AI 工具让我更快的学习一个新的领域，特别是职场妈妈。有段时间很想学 D3.js 但是文档太多，太琐碎。于是用 chatGPT 生成最小化的例子，学起来非常快，体验非常好。

yuanfan · 9 天前

我们公司部门内部有个 GPT 讨论群，我已经跟不上他们讨论的进度了，直接贴一些他们的答案吧。

辅助编码的最佳组合是 vscode + roo code + openrouter api/deepseek api

另外，我在做 RAG 项目的过程中也有一些结论。其一，确实如 yihui 所言，具体的问题得到具体的答案，模糊的问题得到模糊的答案；其二，我们用的 API 是阿里云的，可以调用通义以及 deepseek 的模型，在固定流程编排以后，用 RAGAS 框架分别对 QWEN-MAX 、 deepseek V3、deepseek R1 评估效果，温度参数设定一致的情况下，在已经往知识库传了标准问答对以后，三个家伙回答标准问题也有些差异，我们推测这三个模型本身的温度参数不一样，导致各自的幻觉程度有所不同，按我之前测试的结果是，DEEPSEEK-V3 温度参数最低，QWEN-MAX 次之，DEEPSEEK-R1 最高。

yuanfan · 9 天前

还有一点，可能是因为推理模型内化了推理步骤加上幻觉程度更高，虽然问题确实都能回答对，但是不是很听话，提示词里写了不让它干撒它也偏偏要干。在这一点上，通用模型就相对比较听话了。

yuanfan · 9 天前

vickkk
我也是觉得和 grok3 聊天的感觉是最舒服的。

再有就是 notebooklm 可以帮忙整理读书笔记，但是用了以后确实就懒得自己写了。我是觉得 AI 的知识广度大，但是论及深度可能暂时还是人类更佳（PS我是觉得三水 @yufree 的答案对我来说比 AI 给的更管用）。

yuanfan · 9 天前

又又又，俺现在感觉对各种 AI 工具麻木了。

比如 AI 搜索，chrome 浏览器的插件。
比如 AI 个人知识库，腾讯出的 ima.copilot。
又比如 AI 数字人，小说转漫画，漫画转视频等等。

本来这些工具应该是用来把互联网信息瀑布的知识浓缩一下，让人类更快接受的，结果又更快生成更大量的内容，本意是用工具拓宽思路，摆脱一下信息茧房，结果追赶新工具还是让人感觉莫名其妙地，不仅追不上，而且还更加累了。同事们安利的好多 AI 工具我都没来得及尝试，对于新鲜事物的好奇心在 AI 这块迅速被耗尽。一个工具还没用好，结果更多新需求就被创造出来了。

yuanfan · 9 天前

又又又又，感觉 AI 工具好像打破了哪堵墙似的，感觉生活中碰到的“新概念”越来越多了（也许有的是我未接触过的领域的，有些是人类新造的）。我问同事鼓捣个人知识库来做什么？一个同事答：学习，复习，艾宾浩斯。另一个同事答：我现在是不想大脑啥都记住了，我只想大脑当个索引，外挂个人知识库软件当完整数据库，自己浏览过的有价值东西能在大脑里有印象，提到什么想找具体的时候搜个人知识库就好了。

lovebluesky · 7 天前

yihui 果然是一个悲伤的故事