2026/1/23 4:58:09
网站建设
项目流程
做网站选哪家,环球军事网最新军事新闻最新消息,信息中心加强网站建设,图片设计与制作软件下载项目地址
资源#xff1a;Tesla v100 32GBx8
测试原模型效果
python eval_llm.py --load_from ./MiniMind2
1. 预训练
预训练数据集 pretrain_hq.jsonl
{“text”: “|im_start|鉴别一组中文文章的风格和特点#xff0c;例如官方、口语、文言等。需要提供样例…项目地址资源Tesla v100 32GBx8测试原模型效果python eval_llm.py --load_from ./MiniMind21. 预训练预训练数据集pretrain_hq.jsonl{“text”: “|im_start|鉴别一组中文文章的风格和特点例如官方、口语、文言等。需要提供样例文章才能准确鉴别不同的风格和特点。|im_end| |im_start|好的现在帮我查一下今天的天气怎么样?今天的天气依据地区而异。请问你需要我帮你查询哪个地区的天气呢|im_end| |im_start|打开闹钟功能定一个明天早上七点的闹钟。好的我已经帮您打开闹钟功能闹钟将在明天早上七点准时响起。|im_end| |im_start|为以下场景写一句话描述一个孤独的老人坐在公园长椅上看着远处。一位孤独的老人坐在公园长椅上凝视远方。|im_end| |im_start|非常感谢你的回答。请告诉我这些数据是关于什么主题的这些数据是关于不同年龄段的男女人口比例分布的。|im_end| |im_start|帮我想一个有趣的标题。这个挺有趣的“如何成为一名成功的魔术师” 调皮的标题往往会吸引读者的注意力。|im_end| |im_start|回答一个问题地球的半径是多少地球的平均半径约为6371公里这是地球自赤道到两极的距离的平均值。|im_end| |im_start|识别文本中的语气并将其分类为喜悦、悲伤、惊异等。\n文本“今天是我的生日”这个文本的语气是喜悦。|im_end|”}进行预训练torchrun --nproc_per_node 8 train_pretrain.py测试预训练的效果python eval_llm.py --weight pretrain2、SFTSFT数据集sft_mini_512.jsonl{“conversations”: [{“role”: “user”, “content”: “请告诉我在中国古代的“四大发明”是什么”}, {“role”: “assistant”, “content”: “中国古代的“四大发明”是指造纸术、印刷术、火药和指南针。这四项发明对世界文明的发展产生了深远的影响\n\n1.造纸术据史书记载东汉时期的蔡伦改进了造纸工艺使得纸张的生产更加便捷、成本更低质量也更加优良。这一发明极大地促进了文化的传播和保存。\n\n2.印刷术中国古代的印刷术最早可以追溯到唐代的雕版印刷到了宋代发展出了活字印刷技术。印刷术的发明极大地促进了知识的传播降低了书籍的成本对教育和文化的发展起到了重要的推动作用。\n\n3.火药火药最初是在唐代被发现的最初可能用于医疗或炼金术。到了宋代人们开始将火药用于军事目的发明了各种火器。火药的发明改变了战争的面貌对世界军事技术的发展产生了重大影响。\n\n4.指南针指南针最初在中国被用于风水测量后来逐渐发展成为航海导航的重要工具。这一发明极大地促进了海上航行技术的发展对于新航路的开辟和世界地理大发现起到了关键作用。\n\n这四项发明不仅在中国历史上占有重要地位而且对全世界的科技进步和文明发展都产生了深远的影响。”}]}进行SFTtorchrun --nproc_per_node 8 train_full_sft.py测试SFT 的效果python eval_llm.py --weight full_sft3、PPOPPO数据集rlaif-mini.jsonl{“conversations”: [{“role”: “user”, “content”: “列出五个基本的人格理论并分别以一句话概括。”}, {“role”: “assistant”, “content”: “空”}]}# 进行PPO训练torchrun --nproc_per_node 8 train_ppo.py