工作职责:
1、负责主流机器学习框架(如PyTorch、PaddlePaddle等)与公司产品的适配优化,最优化支持模型训练、推理和部署;
2、负责基于公司产品的分布式计算技术的研究与实现,如各种并行与异构计算技术的设计、开发以及与性能优化;
3、参与公司产品架构协同设计,实现软硬件匹配的极致性能,跟踪AI领域的最新研究成果和发展趋势,对未来的软硬件产品提出建议和方向;
4、参与公司产品配套的通信库、算法等方面的开发、优化等工作;
5、编写深度学习框架的技术文档,包括设计文档、使用手册、API文档等,并进行维护和更新,确保文档的准确性和完整性,为其他开发人员提供参考。
任职资格:
1、计算机、电子信息等相关专业本科以上学历,5年以上AI软件栈相关的开发经验;
2、深入理解AI算法(如大模型算法、CV和NLP模型等),具有主流深度框架(如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等)开发或优化经验;
3、有深度学习编译器(如XLA、TVM、MLIR)等软件栈的开发经验;
4、精通分布式训练技术,有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑;
5、精通并行计算通信库(如MPI)、有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑;
6、熟悉GPU集群Scale Up、Scale Out网络架构、通信机制及光通信相关技术者可优先考虑;
7、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力。
工作内容:
1、负责公司片间光互连计算系统通信库的设计及优化,提升系统的整体性能及效率。
2、基于公司产品的系统架构,对大模型算法进行建模或实测,分析并解决性能瓶颈问题,设计最优的通信方式。持续优化集合通信算法,以提高其在新架构下的运行效率和稳定性。
3、评估光通信技术对计算架构及通信方式等方面的潜在影响,并提出公司技术方案的优化建议。
任职要求:
1、本科3年以上相关工作经验,计算机科学、电子信息工程、应用数学等相关专业,具备扎实的数理统计基础和良好的技术素养。
2、具备扎实的算力系统架构知识,了解不同通信模式和硬件结构对算法速度的影响。
3、对NCCL、NVLink、UALink、UEC等技术有一定的理解,能够根据不同的拓扑结构和互联协议设计、开发相应的通信软件;
4、具备优秀的逻辑思维能力和问题解决能力,能够在复杂技术场景中快速找到解决方案。
5、具备良好的团队协作精神和沟通能力,能够高效推动项目进展。
加分项:
了解光通信技术及其在计算架构中的应用,能够量化其对系统效率的影响,对光互连技术的发展趋势和实际应用有深入研究;有成功设计光互连计算系统或优化大模型算法的实际经验。
岗位职责:
1、研究并设计适用于高性能计算环境下的多种国产GPU间光通信架构;评估不同光学组件(如芯片、收发器、协议栈等)对模型训练、推理性能的影响,并据此选择最优架构和配置;实现从概念验证到产品级部署的全链条技术支持,确保方案的高效性、稳定性和可扩展性。
2、分析现有或新引入的硬件平台特性,包括但不限于GPU性能、显存大小和带宽、组网架构带宽等因素。根据分析结果调整深度学习/机器学习模型的设计,使之能够充分利用硬件资源。通过实验测试验证调整后的模型表现,持续迭代直至达到最佳状态。
3、结合服务器集群、网络交换设备以及GPU之间光互连技术,规划并构建高效的人工智能模型训练推理超节点结构。根据实际业务查找算力网络瓶颈,持续提升算力使用效率。
4、不断探索新技术的应用潜力,定期审视当前架构存在的局限性,并提出改进建议。与其他团队紧密合作,确保设计方案符合整体项目需求,并支持跨部门协作完成相关任务。
任职要求:
1、拥有计算机科学、电子工程或其他相关领域的本科及以上学历。
2、至少3年以上的相关工作经验,熟悉GPU架构及其编程模型者优先考虑。
3、对光电技术有深入了解,特别是关于光纤通信的知识。
4、具备良好的问题解决能力及创新能力,能够独立开展研究工作。
5、优秀的沟通技巧和团队合作精神。
6、英语听说读写流利,能够阅读专业文献和技术文档。
加分项:
1、有成功实施过大规模数据中心网络建设项目经验者。
2、在顶级学术期刊或会议上发表过相关领域论文。
3、熟悉主流深度学习框架(如TensorFlow, PyTorch等)和神经网络架构(CNN、RNN等)及其实现细节。
岗位职责:
1、负责GPU模组、服务器、交换机等AI算力相关硬件产品设计与开发。
2、负责单板方案设计,器件选型,成本评估、详细设计,原理图设计,指导layout人员完成PCB设计。
3、负责关键物料采购跟踪,单板及整机的BOM输出,加工跟踪,回板调试验证,硬件测试计划/报告审核及问题定位等加工验证工作。
4、负责单板逻辑开发、调试、自验证和发布归档工作。
5、负责硬件文件归档,单板软件对外发布,试制环境和试制物料齐套性跟踪。
6、开发成果保护,专利发掘与申请。
任职要求:
1、电子信息、计算机、自动化等本科以上专业。
2、3年以上工作经验。
3、熟悉硬件开发流程,掌握高速电路基础知识,有服务器、交换机等工作经验优先。
4、具备硬件电路设计经验,熟悉Candence开发软件。
5、熟悉PCB设计,对高速信号的SI设计有深刻了解。
6、有CPLD/FPGA相关开发调试经验者优先。
岗位职责:
1、负责服务器/交换机等产品系统内部结构布局、结构件设计及走线设计。
2、负责相关产品的结构升级与维护。
3、负责项目概要设计与详细设计工作,结构件BOM整理。
4、负责项目推进、评审、样品加工跟进、样机组装。
5、负责产品设计验证,结构优化,Bug分板与解决。
6、负责产品开发过程中相关的技术图档与文件输出。
7、开发成果保护,专利发掘与申请。
任职要求:
1、统招本科以上学历,机械设计制造及其自动化等相关专业优先。
2、3年以上机械设计工作经验,有机架式服务器/交换机产品设计经验优先。
3、熟练运用Autocad、pro-E等机械辅助设计软件。
4、熟悉塑料/五金模具结构以及其加工工艺知识,对模具及产品单价有充分了解。
5、较强的工作责任心、良好的团队沟通、协助精神。
6、有较强的学习能力和独立解决问题的能力,能适应灵活多变的开发需求。
7、熟悉产品生产流程及设计开发流程。