最近各种AI工具冒得比雨后的笋子还快。我之前用 open ai 较多,主要是用来润润英文,写个代码。最近的 deepseek 也试了,感觉跟 o1 差不多。也试了下 deep research,惊艳和一言难尽同时存在。昨天又尝试了秘塔的浅度研究和知识库,对知识库很满意。感觉 ai 真的开始改变工作和生活了。只是新品出得这么快,个人估计很难都去试。所以发个帖子,大家可以分享下用到的趁手 ai 工具,以及一些使用心得。

    确实太多了,优胜劣汰需要一个过程。如果把 AI 比作一个聪明的老师,真的就是遇强则强,所以学生的水平是关键,不会提问题的学生就不是一个好学生,而我就是那个不会提问题的学生,清华北大的 DeepSeek 课件我都大概看了,除了学习一些提问题的技巧,我觉得自身的知识积累和结构才是更重要的制约因素,我愈发的感觉到我有点浮躁了,需要静下心来多看看书。

    作为码农,我的感受是这些工具让我如鼠添翼,它们确实让我可以更精准地找到我想要的答案,而不是在大篇大篇的文档中皓首穷经。然而这有个重要的前提,就是首先要有能力把问题讲清楚。这个听起来容易,但我觉得是对能力的一个重大考验。AI 工具的答案通常不是照抄就行,我们得读得懂并且知道答案里对与错或合适不合适的部分,并继续提问让它把不符合预期的那部分修正或改进。

    举个例子,去年我曾说我写了一段 JS 代码用来对 HTML 页面分页,某种程度上它像是一个粗劣的 LaTeX 实现(高德纳大神忍不了排版而写了 TeX,而我既忍不了排版但也忍不了 LaTeX 却独钟 HTML,于是乎我也造起了我三角形的轮子……),后来我陆陆续续精修它,这个过程中 Github Copilot、ChatGPT、DeepSeek 我都不断问,在它们的指引下跌跌撞撞走了不少弯路,我想要是没有这些弯路的指引,我可能要多花好几个星期时间才能实现我的想法,比如我以前完全不知道 JavaScript操纵页面有个 Range API,我从 AI 嘴里知道这玩意儿后顿时想出了一个绝妙的办法解决困扰我很久的一个难言之痛点(就是我的代码可以切割列表、代码块、表格,但无法做到切割段落),这下我终于觉得我这粗劣的实现踮起脚能够得到 LaTeX 的膝盖了,嘿,排出来的页面还像那么回事,妈妈再也不用担心我在 LaTeX 的反斜杠反人类世界中迷失自我了。

    总之,问题越具体,答案就越容易找到;人类的脑子越模糊,AI 就越模糊。所以我觉得要想用好 AI 工具,对人类大脑还是有很高的要求的。人类应该是更擅长一些艺术性的、架构性的东西,那些具体的事情可以拜托 AI 去辅助实现。说到艺术性的东西,这正是我非常喜欢捣鼓的。比如 litedown 文档每一章开头我放了一段引言,框框里放了一朵花,花的颜色我用的是 rebeccapurple,我觉得这是没有感情的 AI 工具难以想到的(这紫色背后有个悲伤的故事)。

    引言

    类似的带着我个人情感与特质的小动作在我的代码和文档中还有很多。AI 可以辅佐我糙汉加硬汉的角色,但脑洞大开、天马行空、喜怒哀乐、腹诽毒舌和无厘头的角色可能朕亲自来扮演比较好(不信看 litedown 文档所有章的引言,半夜睡不着的时候一定可以从中看出“劝退”两个字,一股浓浓的丧味,哈哈)。

      各个工具会员价格加起来也不便宜,我现在只充了ChatGPT的会员,用来改代码,在涉及一些比较新的分析工具时,帮助就会很小,还有一个原因就是手机能直接对话,学语言用起来很方便。
      有尝试用AI来帮我解决一些实际问题,比如团战分析,但是这些AI的数据信息比较陈旧了,PA飞镖还带沉默,上古时代的信息了,一些更新我自己很难加进去。
      另外作为摸鱼时候的闲聊对象,grok3给我的感觉是最好的,deepseek时间久了就会趋向于使用同一种回复模式,用一种套路回复你的任何信息,并且一些元素会莫名其妙一直保留在回复中,chatgpt比这两个都会弱一点,claude我觉得体验最不好。

        vickkk

        这位刀友 有没有试过更新文档喂给ai再问

        我的感受确实是变化挺大,带联网带推理的模型可以大大加速有用信息的获取速度,针对一个特定专业问题可以十几秒获取相关文献,整理总结成条理性的回答,

        前天还把老婆产检结果拍个照让deepseek逐一解析,还根据给出了检查结果的生理学解释, 功能着实强大,工作和生活都帮助巨大。

          yihui 这位先生说的,撇开没看懂的部分(比如紫色背后的故事),我基本都认同。想说给他发点花生糖,但好像过于反客为主了:)

          最近用一些ai工具帮忙总结一些领域的研究进展---能很快拿到结果,但也有一眼能发现的错误或疏漏。即使是比较强的deep research,写的东西也不能让我满意。这种不满意里可能还有点小傲娇,毕竟人还是要强点。但考虑到这一切才刚刚开始,很期待以后。或许有些生产力会被进一步解放,而有些会被完全取代。

          总体上,ai给我的一个感觉是,“八岁”就这样(这tm八岁?),长大了有多强都不敢想;另一个感觉是,利用跟依赖在一线之间,在强大的ai面前保持人的独立自主可能会是个越来越有挑战的事情。

            yihui

            yihui 中文世界里只能由我发

            有商机。屯点花生糖去。

            yihui 泪点低的慎点:

            泪点不算低,但还是慎一下吧。

            Liechi 新年前的一两个星期用的 deepseek,可以说是国内 AI 里最好的一个(单方面观点),R 代码上的问题我一般都是用的 deepseek,是真的觉得 deepseek 给的内容能帮我解决我的问题。

            前天还把老婆产检结果拍个照让deepseek逐一解析

            太好啦,恭喜恭喜。
            我的感受是 AI 工具让我更快的学习一个新的领域,特别是职场妈妈。有段时间很想学 D3.js 但是文档太多,太琐碎。于是用 chatGPT 生成最小化的例子,学起来非常快,体验非常好。

            我们公司部门内部有个 GPT 讨论群,我已经跟不上他们讨论的进度了,直接贴一些他们的答案吧。

            辅助编码的最佳组合是 vscode + roo code + openrouter api/deepseek api

            另外,我在做 RAG 项目的过程中也有一些结论。其一,确实如 yihui 所言,具体的问题得到具体的答案,模糊的问题得到模糊的答案;其二,我们用的 API 是阿里云的,可以调用通义以及 deepseek 的模型,在固定流程编排以后,用 RAGAS 框架分别对 QWEN-MAX 、 deepseek V3、deepseek R1 评估效果,温度参数设定一致的情况下,在已经往知识库传了标准问答对以后,三个家伙回答标准问题也有些差异,我们推测这三个模型本身的温度参数不一样,导致各自的幻觉程度有所不同,按我之前测试的结果是,DEEPSEEK-V3 温度参数最低,QWEN-MAX 次之,DEEPSEEK-R1 最高。

            还有一点,可能是因为推理模型内化了推理步骤加上幻觉程度更高,虽然问题确实都能回答对,但是不是很听话,提示词里写了不让它干撒它也偏偏要干。在这一点上,通用模型就相对比较听话了。

            vickkk
            我也是觉得和 grok3 聊天的感觉是最舒服的。

            再有就是 notebooklm 可以帮忙整理读书笔记,但是用了以后确实就懒得自己写了。我是觉得 AI 的知识广度大,但是论及深度可能暂时还是人类更佳(PS我是觉得三水 @yufree 的答案对我来说比 AI 给的更管用)。

            又又又,俺现在感觉对各种 AI 工具麻木了。

            比如 AI 搜索,chrome 浏览器的插件。
            比如 AI 个人知识库,腾讯出的 ima.copilot。
            又比如 AI 数字人,小说转漫画,漫画转视频等等。

            本来这些工具应该是用来把互联网信息瀑布的知识浓缩一下,让人类更快接受的,结果又更快生成更大量的内容,本意是用工具拓宽思路,摆脱一下信息茧房,结果追赶新工具还是让人感觉莫名其妙地,不仅追不上,而且还更加累了。同事们安利的好多 AI 工具我都没来得及尝试,对于新鲜事物的好奇心在 AI 这块迅速被耗尽。一个工具还没用好,结果更多新需求就被创造出来了。

            又又又又,感觉 AI 工具好像打破了哪堵墙似的,感觉生活中碰到的“新概念”越来越多了(也许有的是我未接触过的领域的,有些是人类新造的)。我问同事鼓捣个人知识库来做什么?一个同事答:学习,复习,艾宾浩斯。另一个同事答:我现在是不想大脑啥都记住了,我只想大脑当个索引,外挂个人知识库软件当完整数据库, 自己浏览过的有价值东西能在大脑里有印象,提到什么想找具体的时候搜个人知识库就好了。