2026/4/4 6:33:33
网站建设
项目流程
网站建设负责传资料不,北京搜索引擎推广系统,html5中文网站欣赏,专门做本子的网站本推文介绍了AAAI 2025收录的一篇论文《Agent4Edu: Generating Learner Response Data by Generative Agents for Intelligent Education Systems》。Agent4Edu是一种基于大语言模型的个性化学习模拟器#xff0c;旨在解决智能教育系统中高质量学习者响应数据稀缺、传统模拟方…本推文介绍了AAAI 2025收录的一篇论文《Agent4Edu: Generating Learner Response Data by Generative Agents for Intelligent Education Systems》。Agent4Edu是一种基于大语言模型的个性化学习模拟器旨在解决智能教育系统中高质量学习者响应数据稀缺、传统模拟方法简化且依赖真实数据的痛点。Agent4Edu由生成式智能体和个性化学习环境构成。智能体集成学习者档案、记忆、动作三大模块可模拟学习者完整解题流程支持零样本模拟学习环境可接入个性化算法实现智能体与算法的交互。论文开展了全面的实验结果显示该模拟器在响应预测准确率、知识理解等指标上优于传统方法还能有效评估并优化计算机自适应测试等个性化学习算法为智能教育研究提供了新范式。论文链接https://arxiv.org/pdf/2501.10332项目链接https://github.com/bigdata-ustc/Agent4Edu本文作者为王一鸣审校为龚裕涛、黄忠祥一、研究背景与主要贡献1.1研究背景在智慧教育领域个性化学习是提升学习者学习效率的关键策略。Coursera、LeetCode等智能教育平台可以记录学习者的练习响应数据如答题正确率并提供习题推荐、知识追踪、计算机化自适应测试Computerized Adaptive Testing CAT等个性化服务。然而高质量响应数据的短缺以及线下指标与线上实际表现的差异严重阻碍了个性化学习算法的研发与落地。现有学习者响应数据模拟方法存在两大局限一是模拟过程过于简化仅预测答题对错未考虑学习者理解、分析、解题的完整过程导致模拟结果缺乏可靠性和可解释性二是过度依赖真实数据无法在真实数据集不足的场景下如零样本模拟实现有效泛化。近年来大语言模型Large Language Models, LLMs在自主交互、决策及上下文学习方面展现出卓越能力其驱动的生成式智能体为解决上述问题提供了新的可能。1.2主要贡献该研究的主要贡献体现在如下几方面。1开发了Agent4Edu个性化学习模拟器该模拟器基于LLM驱动的生成式智能体可精准模拟学习者的响应数据及完整实践过程并能与个性化学习环境交互为智能辅导算法的评估与优化提供支撑。2设计了专为教育场景定制的生成式智能体包含学习者档案、记忆和行动三大核心模块不仅能生成响应数据还可模拟学习者的习题选择、理解、分析及解题等详细行为性能优于现有模拟方法。3从两个维度开展了全面实验一方面验证生成式智能体与人类学习者的行为一致性另一方面基于模拟数据评估并优化了计算机化自适应测试等个性化学习算法充分证明了Agent4Edu的有效性。二、研究方法Agent4Edu能够准确模拟学习者的响应数据其中包含两大核心组件LLM驱动的生成式智能体和个性化学习环境。图1是Agent4Edu的整体框架接下来将具体介绍各部分结构。图1 Agent4Edu的整体框架2.1 LLM驱动的智能体Agent4Edu中的生成式智能体以LLM为基础架构通过三个专为个性化学习场景设计的专用模块增强功能学习者档案、记忆和行动模块。1学习者档案模块学习者档案模块代表人类学习者的一些整体学习特征包括显式实践风格和隐式认知因素。实践风格是从每位学习者的实践记录提取的统计特征包括学习活跃度、实践多样性、成功率和偏好。认知因素是心理学领域研究的隐式特征对学习者的实践表现有显著影响。论文选择问题解决能力和知识熟练度作为研究对象。为获取隐式能力论文使用IRT模型从响应数据中推断每位学习者的隐式能力。若进行零样本模拟且无用户数据可用则需随机生成档案。2记忆模块记忆模块能够模拟学习者逐步观察和总结过往实践的过程。本文遵循人类学习机制为每个智能体设计了三种类型的记忆事实记忆、短期记忆和长期记忆。事实记忆在本文模拟中事实记忆被定义为学习者真实的过往响应记录。受人类学习机制启发若智能体反复练习相似题目或知识其记忆会得到强化。因此本文为事实记忆中的每条记录引入一个额外计数器用于追踪其被强化的次数。需强调的是智能体仅能将响应记录保存至事实记忆无法直接检索事实记忆。短期记忆人类短期记忆指能够在较短时间内保留和回忆的近期临时信息。因此本文模拟中采用短期记忆保留智能体最近观测到的记录的细节。长期记忆长期记忆通过重复实践和自我反思对记忆进行强化形成能够保留很久以前观测到的信息并生成高层级见解。本文设计的长期记忆包含多种信息每次更新长期记忆时智能体强化次数超过阈值的事实记忆转化为长期记忆利用智能体中嵌入的LLM总结并反思智能体的学习状态即实践过程的语言描述和智能体自身的新见解使用DNeuralCDM在每一步实践后获取学习者特定知识概念的动态熟练度演变情况。此外长期记忆中的每条事实记录会遵循人类遗忘曲线理论记忆衰减初期较快随后逐渐放缓进行遗忘。3行动模块为使智能体能够基于当前观测展现类人的解题行为和响应论文设计了专为个性化学习定制的行动模块包含三大类行动认知驱动行动个性化学习算法每步会向智能体推荐一道习题智能体阅读习题内容后基于当前认知因素决定是否进行练习。若习题相对于智能体的评估能力和知识熟练度过难智能体可选择拒绝该推荐习题。习题阅读与理解每次练习时首先要求智能体识别并描述当前习题所考查的知识概念。若智能体正确匹配习题的知识概念则表明其与人类学习者一样理解了习题情境若未能匹配则触发修正反思引导智能体走向正确的知识概念。习题分析与解答论文通过思维链Chain of ThoughtCoT的方法要求智能体给出解题过程。首先智能体结合自身档案和记忆为习题制定初步解题思路然后基于解题思路写出习题的最终答案最后智能体预测自己的答案是否正确。若预测响应与真实学习者的响应不一致则触发修正反思。若习题提供标准答案可设计评分程序直接评估智能体答案的正确性。2.2个性化学习场景学习环境被设计为独立模块集成了一系列个性化算法这些算法可基于智能体的过往实践数据推荐习题。例如本文实验中采用计算机化自适应测试CAT策略进行个性化学习。三、实验结果3.1数据集与实验设置数据集论文使用的数据集是由科大讯飞股份有限公司提供的EduData。该数据集包含500名中国高中生的18,045条时序响应记录涵盖数学和物理学科共有1,032道习题和458个知识概念每道习题考查一个知识概念。实验设置论文通过OpenAI的API服务使用GPT-3.5-turbo和GPT-4构建实验智能体。出于成本考虑GPT-4配置下仅模拟100名学习者的任务记录。GPT的温度参数设为0以避免随机性。3.2学习者模拟评估表1为学习者模拟评估实验结果。结果中可以看出Agent4EduGPT-3.5-turbo与有监督基线模型相比具有较强竞争力这表明基于LLM的智能体能生成与真实数据集高度相似的学习者响应数据。表1学习者模拟性能的评估分数此外本文评估了智能体实践成功率的模拟分布与学习者数据实际分布的一致性结果如图2所示。真实值与智能体结果的对比表明模拟数据有效捕捉了学习者与成功率相关的实践模式。图2真实响应数据与智能体模拟响应数据的成功率分布对比3.3习题相关知识理解表2知识预测的准确率为评估智能体是否理解特定习题实验要求智能体生成该习题所考查的知识概念。表2所示实验结果表明所有智能体均能正确识别大多数实践习题所考查的知识体现了LLM强大的类人能力和丰富的知识储备能够理解习题。3.4零样本模拟图3 使用LLM作为评判者识别智能体模拟记录是否来自真实人类实验使用GPT-3.5-turbo模型作为标注者评估零样本条件下Agent4Edu生成的每条模拟记录包括习题答案和实践总结是否由真实人类撰写认为是人类撰写的记录标记为“Agent4Edu获胜”非人类撰写的标记为“Agent4Edu失败”模糊记录标记为“平局”。图3所示结果表明智能体在总结任务中的表现与真实人类响应高度一致难以区分但相比总结任务智能体在习题答题任务中存在一定局限性这主要是由于解题所需的推理过程更为复杂。3.5消融实验图4消融实验结果论文进行了消融实验其结果如图4所示。该图展示了Agent4EDU在无档案模块w/o prof、无记忆模块w/o mem、无记忆强化w/o enh、无记忆遗忘w/o fgt和无反思w/o ref模块下的性能对比。这些结果证实了每个组件在提升智能体学习者响应数据预测性能方面的有效性。3.6多维度评估实验表3 CAT策略的多维度评估结果人类学习者对不同个性化学习服务的评估具有多维度性。若生成式智能体能够准确模拟真实学习者的行为那么其对个性化算法的评估应与人类评估一致。Agent4Edu对不同CAT策略的多维度评估表格如表3所示。其中评估指标包括满意度satisfaction、难度适宜性AoD和是否有收获gain。该结果与人类对这些策略的评价高度相似。3.7个性化学习算法改进表4 CAT服务的性能改进该实验探究Agent4Edu生成的模拟数据是否能提升个性化学习算法的性能。实验首先使用Agent4Edu生成模拟学习者数据将其与原始EduData的数据合并形成增强数据集EduData。分别使用原始EduData和EduData评估每种CAT策略的性能。实验结果如表4所示。在Agent4Edu的辅助下CAT策略可得到有效提升这意味着Agent4Edu能够生成高质量的学习者响应数据。四、总结本推文介绍了Agent4Edu一种创新性的个性化学习模拟器其利用LLM驱动的生成式智能体模拟学习者的响应数据及详细解题行为。该生成式智能体配备了专为个性化学习场景设计的档案、记忆和行动模块能够展现类人的习题选择、理解、分析和解答行为准确预测学习者的未来响应。此外生成式智能体可与个性化学习环境交互实现对智能服务的评估与优化。