Cloud2016 同意,即使是 GPT-4,推断能力以及 conciseness 都还需要加强,以及大家最常吐槽的 hallucination。这些弱点在你问一个写 grant proposal 这样的需要强事实的创意写作问题时就集中暴露了,上来就编出一堆不存在的论文 + 强行迎合设定进行文本套娃。
即使如此,目前 GPT-4 的水平比其他所有开源模型以及 GPT-3.5 还是强不少。个人猜测,可能领先 Google 的进度两到三年。如果相关数据在训练文本中不是太稀有,给定一个靠谱的框架和上下文,目前定位写作助手还是可以的。当然,我是降临派,表示期待 GPT-5 的表现。
对于你的问题,我的感觉是 GPT 基本可以保证知识的覆盖度(只要你关注的问题不是太偏门),所以我有时也会利用它验证想法,因为很多研究类问题需要输入较多上下文,而这类问题使用 Google 并没有办法很好地搜索到答案。