大模型训练

熊磊光

熊磊光 中国农业大学计算机硕士,研究员高级工程师,华为云AI专家组成员,西安电子科技大学企业导师,浙江大学人工智能中心研究员,阿里云AI训练师认证教材和题库系统专家,主要研究方向为大语言模型、人工智能、自然语言处理、CV视觉模型、汽车智能驾驶。从早期的智能搜索引擎,到华为盘古大模型云引擎研发,到阿里云百炼智能平台应用开发,再到扣子平台智能体应用开发,一直深耕于自然语言处理处理、AI大模型领域。华为

石油行业大模型训练数据集构建案例实操

课程背景随着大模型技术的快速发展,模型性能的瓶颈逐渐从规模转向数据质量。低质量、重复、有偏或标注噪声的数据会显著限制模型的效果与泛化能力。在实际应用中,许多团队虽拥有海量数据,却因缺乏系统性的数据优化方法,导致训练效率低下、资源浪费,甚至引发模型偏见与输出不可靠等问题。本课程立足于产业实践中的常见数据挑战,通过案例驱动的方式,帮助学员掌握从评估、清洗、标注到筛选与增强的全流程数据优化技能,提升数据