← 全部職位
智算后端研發工程師
北京
職位描述
1、開發云原生場景下異構算力調度框架。
2、優化大模型推理能力,快速的部署推理服務,提升推理速度和吞吐。
職位要求
1、熟練掌握Linux/Unix平臺上的編程,熟練使用Golang/Python語言進行開發,熟練使用數據結構和常用算法。
2、具有深度學習推理加速和優化的經驗,熟悉至少一種推理引擎,如 vLLM、SGLang、Llama.cpp
3、熟悉常見的模型量化技術,并能夠進行模型的量化優化。
4、熟悉常見的機器學習算法及框架,如 神經網絡、transformer架構、PyTorch框架。
5、熟練掌握 Kubernetes 和 docker 技術。
6、具備良好的溝通和團隊合作能力,能夠與跨功能團隊密切合作,解決問題并實現共同目標。