AI 工具使用感受
我的感受确实是变化挺大,带联网带推理的模型可以大大加速有用信息的获取速度,针对一个特定专业问题可以十几秒获取相关文献,整理总结成条理性的回答,
前天还把老婆产检结果拍个照让deepseek逐一解析,还根据给出了检查结果的生理学解释, 功能着实强大,工作和生活都帮助巨大。
- 已编辑
yihui 这位先生说的,撇开没看懂的部分(比如紫色背后的故事),我基本都认同。想说给他发点花生糖,但好像过于反客为主了:)
最近用一些ai工具帮忙总结一些领域的研究进展---能很快拿到结果,但也有一眼能发现的错误或疏漏。即使是比较强的deep research,写的东西也不能让我满意。这种不满意里可能还有点小傲娇,毕竟人还是要强点。但考虑到这一切才刚刚开始,很期待以后。或许有些生产力会被进一步解放,而有些会被完全取代。
总体上,ai给我的一个感觉是,“八岁”就这样(这tm八岁?),长大了有多强都不敢想;另一个感觉是,利用跟依赖在一线之间,在强大的ai面前保持人的独立自主可能会是个越来越有挑战的事情。
Liechi 新年前的一两个星期用的 deepseek,可以说是国内 AI 里最好的一个(单方面观点),R 代码上的问题我一般都是用的 deepseek,是真的觉得 deepseek 给的内容能帮我解决我的问题。
前天还把老婆产检结果拍个照让deepseek逐一解析
太好啦,恭喜恭喜。
我的感受是 AI 工具让我更快的学习一个新的领域,特别是职场妈妈。有段时间很想学 D3.js
但是文档太多,太琐碎。于是用 chatGPT 生成最小化的例子,学起来非常快,体验非常好。
我们公司部门内部有个 GPT 讨论群,我已经跟不上他们讨论的进度了,直接贴一些他们的答案吧。
辅助编码的最佳组合是 vscode + roo code + openrouter api/deepseek api
另外,我在做 RAG 项目的过程中也有一些结论。其一,确实如 yihui 所言,具体的问题得到具体的答案,模糊的问题得到模糊的答案;其二,我们用的 API 是阿里云的,可以调用通义以及 deepseek 的模型,在固定流程编排以后,用 RAGAS 框架分别对 QWEN-MAX 、 deepseek V3、deepseek R1 评估效果,温度参数设定一致的情况下,在已经往知识库传了标准问答对以后,三个家伙回答标准问题也有些差异,我们推测这三个模型本身的温度参数不一样,导致各自的幻觉程度有所不同,按我之前测试的结果是,DEEPSEEK-V3 温度参数最低,QWEN-MAX 次之,DEEPSEEK-R1 最高。
还有一点,可能是因为推理模型内化了推理步骤加上幻觉程度更高,虽然问题确实都能回答对,但是不是很听话,提示词里写了不让它干撒它也偏偏要干。在这一点上,通用模型就相对比较听话了。
又又又,俺现在感觉对各种 AI 工具麻木了。
比如 AI 搜索,chrome 浏览器的插件。
比如 AI 个人知识库,腾讯出的 ima.copilot。
又比如 AI 数字人,小说转漫画,漫画转视频等等。
本来这些工具应该是用来把互联网信息瀑布的知识浓缩一下,让人类更快接受的,结果又更快生成更大量的内容,本意是用工具拓宽思路,摆脱一下信息茧房,结果追赶新工具还是让人感觉莫名其妙地,不仅追不上,而且还更加累了。同事们安利的好多 AI 工具我都没来得及尝试,对于新鲜事物的好奇心在 AI 这块迅速被耗尽。一个工具还没用好,结果更多新需求就被创造出来了。
- 已编辑
又又又又,感觉 AI 工具好像打破了哪堵墙似的,感觉生活中碰到的“新概念”越来越多了(也许有的是我未接触过的领域的,有些是人类新造的)。我问同事鼓捣个人知识库来做什么?一个同事答:学习,复习,艾宾浩斯。另一个同事答:我现在是不想大脑啥都记住了,我只想大脑当个索引,外挂个人知识库软件当完整数据库, 自己浏览过的有价值东西能在大脑里有印象,提到什么想找具体的时候搜个人知识库就好了。
yihui 果然是一个悲伤的故事