职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
工作职责
1. 负责大模型的训练和迭代,包括数据清洗、微调、测试;
2. 结合业务场景微调大模型,提高模型在特定任务上的效果;
3. 负责多模态基座大模型的训练和迭代,包括数据清洗、微调、测试;
4. 长期跟踪显示领域的具体场景与多模态大模型结合的业务场景;
任职资格
教育程度:硕士
工作经历:
1.工作经验2年以上,具有自然语言处理、语音交互、计算机视觉或者深度学习相关专业硕士以上学历;
2.具备扎实的LLM/MLLM相关理论知识,熟悉大模型的微调、增量预训练、对齐以及部署加速等相关知识,具备实操能力;
3.熟悉BERT/llama/qwen/qwen-vl/intern-vl等主流大模型,等熟悉Pytorch,DeepSpeed、Megatron主流的深度学习训练框架,熟悉常用的大模型加速推理框架(vLLM,TensorRT-LLM);
4.有基于大模型的RAG/ChatBI/代码生成落地应用项目开发经验者加分,有多模态大模型训练经验者加分;
5.了解基于大模型的多任务学习,跨领域任务学习经验者加优先。
所需专业:自然语言处理、语音交互、计算机视觉或者深度学习相关专业
其他要求:具有一定的抗压能力;每季度出差次数不大于1次
语言要求:编程语言 python、C
1. 负责大模型的训练和迭代,包括数据清洗、微调、测试;
2. 结合业务场景微调大模型,提高模型在特定任务上的效果;
3. 负责多模态基座大模型的训练和迭代,包括数据清洗、微调、测试;
4. 长期跟踪显示领域的具体场景与多模态大模型结合的业务场景;
任职资格
教育程度:硕士
工作经历:
1.工作经验2年以上,具有自然语言处理、语音交互、计算机视觉或者深度学习相关专业硕士以上学历;
2.具备扎实的LLM/MLLM相关理论知识,熟悉大模型的微调、增量预训练、对齐以及部署加速等相关知识,具备实操能力;
3.熟悉BERT/llama/qwen/qwen-vl/intern-vl等主流大模型,等熟悉Pytorch,DeepSpeed、Megatron主流的深度学习训练框架,熟悉常用的大模型加速推理框架(vLLM,TensorRT-LLM);
4.有基于大模型的RAG/ChatBI/代码生成落地应用项目开发经验者加分,有多模态大模型训练经验者加分;
5.了解基于大模型的多任务学习,跨领域任务学习经验者加优先。
所需专业:自然语言处理、语音交互、计算机视觉或者深度学习相关专业
其他要求:具有一定的抗压能力;每季度出差次数不大于1次
语言要求:编程语言 python、C
工作地点
地址:北京大兴区京东方技术创新中心


职位发布者
呼女士HR
京东方科技集团股份有限公司

-
电子技术·半导体·集成电路
-
500-999人
-
股份制企业
-
北京市朝阳区酒仙桥路10号
相似职位
-
腾讯云政企行业高级商业分析经理 30000-50000元海淀区 应届毕业生 本科深圳市腾讯计算机系统有限公司
-
经营分析师 20000-40000元海淀区 应届毕业生 本科百度在线网络技术(北京)有限公司
-
移动生态评估分析部_大数据开发工程师(用户画像) 60000-70000元海淀区 应届毕业生 硕士百度在线网络技术(北京)有限公司
-
商业分析师(j66084) 25000-50000元海淀区 应届毕业生 本科百度在线网络技术(北京)有限公司
-
企业文化经理 25000-45000元海淀区 应届毕业生 本科百度在线网络技术(北京)有限公司
-
外包及专业服务采购 11000-15000元海淀区 应届毕业生 本科百度在线网络技术(北京)有限公司