长安科技-大模型端侧部署工程师(J24303)
面议

{{hasFav===true?'已收藏':'收藏'}}
请用微信扫一扫
分享
海报
职位来源于招聘企业官网,本招聘网站仅为帮助求职者更好的了解企业和职位,如有侵权,请联系我们删除。
职牛AI助手
https://bullsjob.com/upload/jobsanalysis/pages/20250807/7c0515ed9c1d8488fff259338688c4eb.html
岗位职责:
工作职责 1.针对不同硬件平台(Nvidia,MTK,Qualcomm等),进行模型转换、量化、剪枝等工作。 2.分析模型结构,将LLM、VLM,CV、NLP、KWS等模型部署到对应平台,并提升模型的推理速度与精度表现。 3.负责开发维护高效统一的模型量化压缩评估工具及模型推理框架,构建模型轻量化部署能力。 4.跟进新技术动态,优化现有模型,部署方案,优化资源占用,降低推理时延和精度损失,提升模型效果。 5.协助团队完成项目相关技术文档的编写和整理。 6.与算法、硬件、软件等相关团队密切配合,共同推进项目进度。 任职资格 1.学历要求:硕士及以上学历。 2.专业要求:计算机、人工智能等相关专业。 3.工作经历:两年以上相关工作经验。 4.专业技能: 4.1熟悉深度学习基本原理,掌握至少一种深度学习框架(如PyTorch、TensorFlow); 4.2熟悉C/C++、Python等编程语言,具备良好的编程基础; 4.3熟悉NPU、GPU等SOC的编程,模型网络结构优化以及内存等优化; 4.4熟悉模型部署相关流程,如有TensorRT、NeuroPilot/SNPE等工具链使用经验; 4.5有大语言模型和多模态大模型工程化部署、模型优化的经验;在人工智能等顶级期刊/会议发表过相关论文者优先。 5.综合素质: 5.1具备较强的学习能力和动手能力,具有良好的沟通和团队协作能力与抗压能力; 5.2自我驱动力强,优秀的分析问题和解决问题的能力,对新技术感兴趣; 立即投递 收藏

重庆长安汽车股份有限公司
重庆市,北京市,上海市

阿里控股-共享运营管理-质控管理专家 2025-06-24
面议 上城 本科 5-10年
最近登录时间:2025/08/07 01:12:17
最近登录IP: []
企业营业执照已通过 平台认证
以上资料仅供参考,请求职者 规避求职风险

本地招聘求职群
分享平台最新优质高薪职位,欢迎入群。
职位信息秒传手机