平头哥-AI计算加速软件专家-上海/杭州
面议

{{hasFav===true?'已收藏':'收藏'}}
请用微信扫一扫
分享
海报
职位来源于招聘企业官网,本招聘网站仅为帮助求职者更好的了解企业和职位,如有侵权,请联系我们删除。
职牛AI助手
岗位职责:
基础信息 所属部门: 阿里集团 学历: 硕士 工作年限: 5 年 职位描述 1. 设计开发高性能计算加速算法,包括但不限于MoE、Attention、卷积、矩阵乘及相关的融合和量化。 2. 基于硬件特性进行极致性能分析和优化,制定通用性能调优策略,适配和调优各种主流框架和开源代码。 3. 深度分析各种实际应用,如生成式AI/大语言模型推理和训练等场景,发明和改进能发挥硬件优势的加速算法。 4. 和其他团队紧密合作,参与并影响芯片架构、编程模型和软件平台的设计和路线演进。 职位要求 1. 计算机/电子/数学相关专业硕士及以上学历,3年或以上相关从业经验。 2. 精通 C/C++,具备出色的程序开发、设计、调试和调优能力。 3. 精通各种基本算法,对操作系统、计算机体系结构有深入的理解。 4. 良好的沟通和解决问题能力、时间管理能力、自我驱动能力、英文读写能力。 5. 满足以下一种或多种条件者从优: ꔷ 具备大模型推理或训练相关开源模块的开发经验,如 cutlass、Flash-Attention、FlashInfer、MoE、DeepGemm 等; ꔷ 熟悉主流框架,如 Pytorch、Tensorflow、vllm、sglang、TRT-LLM 等;熟悉大语言模型算法,如 LLaMa/Qwen/DeepSeek 等; ꔷ 具备坚实的并行编程基础:有 CUDA/OpenCL 相关项目经历; ꔷ 参与卷积、矩阵乘、矩阵分解、Normalize 等 AI 相关算子开发调优经验; ꔷ 深入参与软件架构设计和优化、性能分析和调优的项目经验; ꔷ 对可编程芯片(如 GPU/NPU/TPU/CPU)架构有深入理解,或有对应研发经历; ꔷ 对数值计算、线性代数相关算法有深刻的理解;

平头哥(上海)半导体技术有限公司
杭州/上海

制冷技术研发总监 2025-09-23
面议 南区 博士 经验不限
算法工程师 2025-09-23
面议 静安 硕士 经验不限
软件工程师 2025-09-22
面议 越秀 本科 应届生
股票投资分析师 2025-09-22
面议 思明 学历不限 应届生
Senior Manager 2025-08-18
面议 越秀 学历不限 3年
Clerk / Office Assistant 2025-08-20
面议 库尔勒 学历不限 3年
硬件工程师 2025-08-16
面议 长宁 学历不限 3年
应用工程师-AMD Mobile CPU 2025-08-30
面议 福田 学历不限 3年
数据分析实习生 2025-08-18
面议 越秀 学历不限 经验不限


最近登录时间:2025/08/07 01:37:37
最近登录IP: []
企业营业执照已通过 平台认证
以上资料仅供参考,请求职者 规避求职风险

本地招聘求职群
分享平台最新优质高薪职位,欢迎入群。
职位信息秒传手机