yihui

yihui 中文世界里只能由我发

有商机。屯点花生糖去。

yihui 泪点低的慎点:

泪点不算低,但还是慎一下吧。

Liechi 新年前的一两个星期用的 deepseek,可以说是国内 AI 里最好的一个(单方面观点),R 代码上的问题我一般都是用的 deepseek,是真的觉得 deepseek 给的内容能帮我解决我的问题。

前天还把老婆产检结果拍个照让deepseek逐一解析

太好啦,恭喜恭喜。
我的感受是 AI 工具让我更快的学习一个新的领域,特别是职场妈妈。有段时间很想学 D3.js 但是文档太多,太琐碎。于是用 chatGPT 生成最小化的例子,学起来非常快,体验非常好。

我们公司部门内部有个 GPT 讨论群,我已经跟不上他们讨论的进度了,直接贴一些他们的答案吧。

辅助编码的最佳组合是 vscode + roo code + openrouter api/deepseek api

另外,我在做 RAG 项目的过程中也有一些结论。其一,确实如 yihui 所言,具体的问题得到具体的答案,模糊的问题得到模糊的答案;其二,我们用的 API 是阿里云的,可以调用通义以及 deepseek 的模型,在固定流程编排以后,用 RAGAS 框架分别对 QWEN-MAX 、 deepseek V3、deepseek R1 评估效果,温度参数设定一致的情况下,在已经往知识库传了标准问答对以后,三个家伙回答标准问题也有些差异,我们推测这三个模型本身的温度参数不一样,导致各自的幻觉程度有所不同,按我之前测试的结果是,DEEPSEEK-V3 温度参数最低,QWEN-MAX 次之,DEEPSEEK-R1 最高。

还有一点,可能是因为推理模型内化了推理步骤加上幻觉程度更高,虽然问题确实都能回答对,但是不是很听话,提示词里写了不让它干撒它也偏偏要干。在这一点上,通用模型就相对比较听话了。

vickkk
我也是觉得和 grok3 聊天的感觉是最舒服的。

再有就是 notebooklm 可以帮忙整理读书笔记,但是用了以后确实就懒得自己写了。我是觉得 AI 的知识广度大,但是论及深度可能暂时还是人类更佳(PS我是觉得三水 @yufree 的答案对我来说比 AI 给的更管用)。

又又又,俺现在感觉对各种 AI 工具麻木了。

比如 AI 搜索,chrome 浏览器的插件。
比如 AI 个人知识库,腾讯出的 ima.copilot。
又比如 AI 数字人,小说转漫画,漫画转视频等等。

本来这些工具应该是用来把互联网信息瀑布的知识浓缩一下,让人类更快接受的,结果又更快生成更大量的内容,本意是用工具拓宽思路,摆脱一下信息茧房,结果追赶新工具还是让人感觉莫名其妙地,不仅追不上,而且还更加累了。同事们安利的好多 AI 工具我都没来得及尝试,对于新鲜事物的好奇心在 AI 这块迅速被耗尽。一个工具还没用好,结果更多新需求就被创造出来了。

又又又又,感觉 AI 工具好像打破了哪堵墙似的,感觉生活中碰到的“新概念”越来越多了(也许有的是我未接触过的领域的,有些是人类新造的)。我问同事鼓捣个人知识库来做什么?一个同事答:学习,复习,艾宾浩斯。另一个同事答:我现在是不想大脑啥都记住了,我只想大脑当个索引,外挂个人知识库软件当完整数据库, 自己浏览过的有价值东西能在大脑里有印象,提到什么想找具体的时候搜个人知识库就好了。