引发我的一些思考
前两天观看了一个知识型的直播,其中一个人自信地提问:“大家有多久没用搜索引擎了?现在是不是遇到问题都直接问AI?” 这句话听起来轻松,却让我心头一紧。这真的对吗?AI给出的答案就一定可靠吗?随着像 ChatGPT 这样的工具日益普及,是否应该完全拥抱AI,反而成了一个需要我们审慎思考的问题。
不可否认,AI也在一定程度上抑制和简化了我们的主动思考。
最近读到一篇长达两百多页(正文约150页)的研究,它用海量脑电数据揭示了一个核心事实:过度依赖AI写作,会让我们大脑中负责深度思考、批判整合的关键“肌肉”萎缩。 研究人员将这种潜在的负面影响称为“认知债务”。
但这引出了一个现实的困境:如果别人都用AI写得又快又好,而我不用,岂不像别人开车我跑步?AI确实能帮我们处理大量繁琐细节,解放认知资源。理论上,从细节中脱身后,我们本应有机会去培养更重要的新能力,比如快速学习一个领域、从全局看问题、提出精准的提问,以及在更广阔的知识背景下进行创造性联想。
然而,省下来的时间和精力,我们真的用来思考更重要的问题了吗?还是不知不觉在刷手机中消耗掉了?这本质上是对个人元认知能力的终极考验——你是否能清醒地决定“被解放后,该往何处去”?
在享受AI带来效率提升的同时,我自身也感觉到一些微妙的变化。例如在编辑过程中,我发觉使用AI后,反而不容易进入那种浑然忘我的“心流”状态了。 原因可能是多方面的:与AI对话会频繁打断原有的思路脉络;为了理解或纠正它给出的代码,注意力很容易被带偏;而且在等待它生成结果时(尤其是早期反应较慢),注意力更容易涣散。
这感觉颇为矛盾:自己埋头苦写,在时间和效果上或许并非最优解;但总依赖AI,又能清晰感觉到一些原本熟练的能力和感觉在慢慢退化。或许,我们的下一代从一开始就没机会发展这些能力了。
这让我联想到更深层次的学习问题。我们过去是不是过于看重“答案对不对”、“考试排第几”了?小球怎么从斜坡上滚下来,这个具体问题或许没那么重要,物理知识本身也可能不是核心,真正重要的是锻炼 “如何学习、如何思考、如何解决问题” 的底层能力。为了快速出成绩,我们可能找了太多“捷径”——比如题海战术、让老师把知识嚼碎了喂给我们,由外部力量控制学习节奏。如今,AI在一定程度上替代了传统辅导班的功能,但也在做着同样的事,结果恰恰让我们错过了 “自己选择、自律、分配时间、定位问题、计划、消化、内化方法” 这个最重要的成长环节。
AI普及之后,未来的趋势可能是:具体“怎么做”的执行技巧不再那么值钱,因为机器更擅长。但一个人知道自己想往哪儿去、能管住自己、会主动学习和提问,这种“自主性”将变得前所未有的重要。工具越来越聪明,我们更需要想清楚,如何当好它的主人,而不是在无形中被它塑造和异化。
摘要
- 目标:探究学生在论文写作任务中,长期使用大型语言模型(LLM)作为辅助工具所可能付出的认知成本,特别是对其大脑认知参与度、学习过程和成果的影响。
- 方法:采用分组与交叉对照实验设计,将54名参与者分为三组(LLM辅助组、搜索引擎组、纯大脑组),并在4个月中进行多次写作;运用多种测量手段,包括脑电图(EEG)记录神经活动、自然语言处理分析文本,并结合人类与AI评分及访谈,全面评估不同工具使用策略下的差异。
- 结果:研究发现,外部工具支持程度与大脑神经连接强度呈负相关(纯大脑组最强,LLM组最弱);在后续行为上,长期使用LLM的参与者表现出记忆回忆更差、对文章的“所有权”感更低;这些差异在工具互换后并未完全逆转,提示可能存在因长期依赖而积累的 “认知债务” 风险。
Once men turned their thinking over to machines in the hope that this would set them free. But that only permitted other men with machines to enslave them.
Frank Herbert, Dune, 1965
真正的自由,源于保持独立思考和批判的能力。 放弃思考的主动权,就等于交出了自由的第一道,也是最重要的一道防线。因此,技术工具应该是思维的延伸,而非替代。
前置知识
脑波
| 脑电波类型 |
频率范围 (Hz) |
主导状态与功能 |
在论文中的关键发现 |
| Delta (δ) 波 |
0.5 - 4 Hz |
深度睡眠、无意识。身体修复与生长。 |
不作为分析重点,因其与清醒认知任务关联较弱。 |
| Theta (θ) 波 |
4 - 8 Hz |
浅睡、冥想、创造性灵感、记忆提取。与潜意识、边缘系统相关。 |
论文未将其作为核心指标。研究中更关注与主动思考直接相关的脑波。 |
| Alpha (α) 波 |
8 - 13 Hz |
放松、闭眼、大脑待机。反映皮层静息或抑制状态。 |
关键指标之一。研究发现LLM组α波活动可能增强或同步性更高,提示大脑处于更“放松”、投入度较低的状态。 |
| Beta (β) 波 |
13 - 30 Hz |
清醒、专注、积极思考、逻辑推理、解决问题。与额叶执行功能强相关。 |
最核心的指标。 研究发现LLM组β波的功率和神经连接性显著降低,这被解释为高阶认知参与度下降的直接生理证据。 |
| Gamma (γ) 波 |
30–100 Hz |
高阶认知、信息整合、专注峰值。与不同脑区信息绑定有关。 |
核心指标。研究发现LLM组γ波活动也减弱,进一步支持了跨脑区信息整合与深度处理不足的结论。 |
- 同时发生:四种波永远共存,只是比例随状态变化。比如专注时β波主导,但仍有α/θ/δ波作为背景。
- 脑区差异:不同脑区有各自的“优势波”。例如,枕叶的α波最强,前额叶的β波最活跃。
论文中又将各波段进行细分检测,定义如下:Delta带范围为0.1-4Hz,并进一步细分为低Delta(0.2-0.83Hz),中Delta(0.83-2.66Hz)和高Delta(2.66-4Hz)子带。Theta活动包括4-8Hz。Alpha带覆盖8-12Hz,低Alpha定义为8-10Hz,高Alpha为10-12Hz。Beta带从12-30Hz延伸,细分为低Beta(12-15Hz),中Beta(15-18Hz)和高Beta(18-30Hz)。
dDTF
dDTF:directed Dynamic Transfer Function,用来分析:哪个脑区在“驱动”另一个脑区,以及方向和强度。dDTF是从DTF衍生的方法,专注于多变量自回归(MVAR)模型的动态拟合,以找到EEG频域中最有效的连接。计算得出的数据并不是对称的(意味着A→B不等于B→A)。文中对所有电极对计算了dDTF,总共 32 × 31 = 992。
心流状态
心流状态是米哈里·契克森米哈赖在《心流:最优体验心理学》中提出的概念。指人们在做某些事情时表现出的全神贯注、投入忘我的状态。这种状态下,人们甚至感觉不到时间的存在,并且在当前事情完成后产生一种充满能量并且非常满足的感受。
目前的神经科学研究普遍认为,心流是 Theta波与Alpha波,有时伴随Beta波,在特定脑区产生特定比例协同增强 的结果。
论文研究
实验设计
实验共纳入54名参与者(18–39岁,M=22.9,SD=1.69),来自大波士顿地区五所高校。按年龄与性别均衡随机分组为三组:
- LLM组:仅允许使用ChatGPT;
- 搜索引擎组:可使用搜索引擎与网站,明确禁止任何LLM;
- 仅大脑组(Brain-only):禁止使用任何在线或离线外部资料。
实验分四个阶段(Session 1–4),核心任务均为限时20分钟论文写作 + 全程EEG记录 + 事后访谈。
- Session 1–3(主实验):
- 参与者固定在同一工具条件下(LLM / 搜索 / 仅大脑)。
- 每一场提供3个SAT风格议论文题目,参与者任选其一;三场共9个不同题目。
- Session 4(交叉验证 / 反转条件):
- 参与者被重新分配到与原组相反的条件(如LLM → Brain-only)。
- 不再提供新题目,而是为每位参与者提供一个个性化题目集合:仅包含其在Session 1–3中自己写过的3个主题,从中任选一个再次写作。
- 参与者事先不知晓分组反转与题目个性化设计。
脑电分析
以下分析了在不同组中脑电的统计特征。
Alpha(α)波段
79 vs. 42 条显著连接,Brain-only组表现出显著更强的前额–顶叶与颞叶语义网络连接,典型于内部注意与语义检索。LLM组α连接明显减弱,暗示部分语义生成与联想被外包给工具,内部“头脑风暴”负担下降。
Beta(β)波段
在低β段,Brain-only组整体连接略强,反映持续的专注与执行/运动规划参与;高β段两组更接近,但并未出现LLM组明显占优。整体看,无辅助写作需要更持续的认知与动作控制。
Delta(δ)波段
78 vs. 31 条连接,Brain-only组在低频大尺度整合上占优,前额叶(AF3)成为汇聚枢纽,显示更强的执行监控与跨区域整合。LLM组δ连接较弱,可能因思路被外部提示打断或引导,内部沉浸式整合减少。
Theta(θ)波段
65 vs. 29 条连接,差异最为显著:Brain-only组前额中线驱动的θ连接大幅增强,典型于高工作记忆负荷与执行控制。LLM组θ网络显著减弱,说明外部支架降低了内部信息维持与协调需求。
总结
二者的差异还表现在信息流向的改变:纯脑组显示出更多从后部(如颞叶、顶叶)指向前额叶的“自下而上”信息流,这反映了内在生成想法的过程。而LLM组则表现出更多从前额叶指向后部的“自上而下”信息流,这可能反映了大脑在评估和整合外部AI建议时的主导作用。
总体来看,无辅助写作激活了更强、更广泛的脑网络协同,尤其在θ与α波段,体现高认知负荷、强执行控制与深度内部语义/创造加工;而LLM辅助写作显著降低了这些连接强度,将部分计划、生成与维持的认知成本外包给工具。结果暗示一种权衡:LLM让任务更“轻松”,但也可能减少大脑深度参与的创造性与整合性加工。
四次实验对比


上方的两张表格,揭示了不同组在四次写作过程中,大脑连接模式是如何动态变化的。表格展示了大脑的“连接强度”在哪次写作中最强/最弱。“Most Frequent Sessions Pattern” 一列(如 4 > 2 > 1 > 3)基本表明,在第4次(Session 4,即工具反转后)连接最强,第3次时最弱。也就是说,当参与者不使用LLM(或在反转后被迫回归纯大脑模式)的那一次,大脑的神经活动更为活跃。“Count” 列记录的是遵循该排序模式的显著功能连接的数量。“Significance” 列标记了统计显著性(通常 * 表示 p<0.05,** p<0.01,*** p<0.001)。
在仅脑组中,激活和连接性最为显著,该组在α、θ和δ波段中始终表现出最高的总dDTF连接性,尤其是在颞顶和前额执行区域。其次是搜索引擎组,该组在整个大脑的总连接性上显示出约34-48%的降低,具体取决于频率带,尤其是在低频范围内。LLM组显示出最少的连接性,在低频语义和监控网络中,与仅脑组相比,整体dDTF幅度减少了多达55%。
笔记摘抄
核心发现:AI如何重塑认知过程与大脑活动
- 认知过程被重组:使用AI不仅改变了任务表现,还重组了底层的认知结构。纯大脑组利用广泛的神经网络处理自我生成的内容,而LLM组则优化了对AI生成建议的程序性整合。搜索组偏向α/θ(记忆提取、视觉–执行整合);LLM组偏向β/δ(规划与程序整合)。
- 大脑连接性系统性减弱:大脑的神经连接强度随着外部支持的增加而系统性减少。具体表现为:纯大脑组最强最广,搜索引擎组中等,LLM组最弱。
- 关键认知环节的缺失:研究指出,LLM使用者α和β波网络的参与不足,这可能意味着他们跳过了自主构思和组织策略的关键过程。
- 记忆与知识内化不足:
- LLM组在正确引用自己刚写的内容上表现极差,表明记忆编码浅显,语义内容未被充分内化。
- 这类似于学生依赖计算器却未内化解题过程,一旦失去工具就会遇到困难。
AI的双面性:效率提升与潜在风险
- 优势:强大的认知辅助工具
- 显著降低认知负荷:相较于传统方法(如网络搜索),LLM能降低所有类型的认知负荷,在研究中使用户生产力提高了60%。
- 促进深入学习和动机:AI可以根据反馈定制响应,实现动态澄清和更深入的主题探讨。融合游戏化元素的AI工具(如Duolingo)能有效保持学习者的参与动机。
- 改变任务焦点:用户可以将精力从信息检索中解放出来,更专注于验证或修改AI生成的回应。
- 风险:可能付出的认知与伦理成本
- 抑制深度与批判性思维:LLM提供的“合成单一回应”可能无意中抑制横向思维和独立判断,而传统搜索引擎鼓励的主动评估则有助于培养批判性思维。
- 加剧“回音室”效应:LLM为优化输出,可能倾向于提供一致信息,强化用户现有偏见,过滤掉矛盾证据。
- 削弱创作归属感与满意度:AI辅助撰写的文章对用户而言重要性较低、拥有感较弱,且“纯大脑”组参与者报告了更高的满意度。
个体差异:不同的人如何使用AI
- 自我效能的关键影响:自我效能较低的学生在学术压力下更倾向于全面依赖AI,可能阻碍认知技能发展;而自我效能较高的学生则更有选择性,将AI用作重新审视和综合信息的工具,在减轻负担的同时保持深度参与。
- 工具引发的不同策略:
- 使用搜索引擎需要手动扫描和评估结果,这一过程鼓励批判性思维和主动参与。
- 使用大型语言模型(LLM)则简化了检索,用户角色转向评估与整合外部建议。
教育启示:如何负责任地整合AI
- 核心原则:先建立基础,再引入辅助
- 研究支持一种推迟AI整合的教育模型,即让学习者先投入足够的自主认知努力,以建立坚实的神经和认知基础。
- 分阶段应用策略
- 早期学习阶段:全面的、无辅助的神经参与对于发展强大的认知网络至关重要。
- 后期熟练阶段:有选择地使用AI支持来处理常规部分,可以提高效率而不削弱已建立的网络。
- 倡导“混合策略”
- 理想的模式是:让AI处理写作中常规的、程序性的部分,而确保核心的认知过程、创意生成、组织结构和关键修订由用户主导。
这项研究为我们敲响了警钟:技术是一把双刃剑。在享受AI带来的便捷时,我们必须有意识地平衡“外包”与“内化”,警惕“认知债务”的悄然累积。如何与智能工具共处,保持我们作为思考者的主体性,将是每个人都需要面对的长期课题。对这类人机交互与认知科学的前沿话题感兴趣?欢迎来云栈社区一起交流探讨。