一、工作职责
1、参与构建领域大模型,包括数据建设、预训练、指令微调、偏好对齐等模型优化工作;
2、参与领域大模型的技术验证、模型训练、效果调优和性能测试
3、定期关注人工智能领域的*新研究动态,包括但不限于深度学习、自然语言处理、大模型等,持续跟进前沿技术的发展;
4、基于公司业务需求,尝试将开源模型整合应用到实际场景中;
5、配合完成相关项目文档编写,与团队成员紧密合作,共同解决在模型开发过程中遇到的技术问题。
二、任职资格
1、专业背景:计算机科学或相关领域NLP/对话方向的本科及以上学历,有大模型微调经验者优先;
2、扎实的代码编写能力,熟悉python、Pytorch/Tensorflow等框架;
3、熟悉transformer based主流模型,了解大模型训练、微调相关技术;
4、良好的论文阅读和新技术追踪能力,了解LLM*新学术和社区发展动态。