岗位职责
1.负责客户AI工作负载/SOTA算法模型在寒武纪人工智能芯片(MLU)上的量化分析、移植、实现、端到端性能优化和精度调优;
2.针对公开的或私有的AI Benchmark(如MLPerf等)进行端到端的优化,并密切跟踪评估各AI平台厂商的优化技术实践,*大化MLU在这些benchmark上的表现。同时,及时总结可泛化的实践,输出形成解决方案或架构改进建议;
3.负责寒武纪model zoo的开发和维护,在寒武纪人工智能芯片上进行SOTA算法复现,测试并进行性能优化分析和精度调优。
任职资格:
1.EECS或相关专业本科或硕士以上学历;
2.有GPU性能优化分析和精度调优经验, 熟练掌握nvprof, nvvp, nsight和valgrind等性能分析工具;
3.熟悉掌握一种或以上主流框架(TensorFlow/ PyTorch/TVM等);
4.对计算机视觉、语音识别、搜索广告推荐、自然语言处理、AI HPC中的某一个场景具有浓厚的兴趣和一定的积累和见解;
5.熟练操作Linux系统,熟练掌握C/C++/Python/Shell,有扎实的编程基础和调试经验;
6.勤于思考,乐于解决问题,对问题有好奇心;
7.有can-do的精神,有协作精神。
加分项(满足一项即可):
1.对一种或以上主流框架(TensorFlow/PyTorch等)有开发者视角的理解,对框架设计或者调优有一定的见解和经验;
2.对AI Compilation技术(MLIR/TVM/XLA等)有hands-on的经验,有自己的见解;
3.熟悉并喜欢高性能优化,对CUDA/OpenCL/BANG/C/OpenMP等并行计算模型有一定的开发经验;
4.对MPI/CCL等底层高性能分布式方案,以及数据/模型/管道并行等高层分布式方案有一定的见解和经验;