職位描述
崗位職責:1、負責芯片異構計算大模型相關算子、框架的開發(fā)與優(yōu)化;2、負責分析定位系統(tǒng)性能瓶頸,針對特定AI芯片做高性能計算加速和優(yōu)化;3、針對特定GPU架構,開展調(diào)優(yōu)工作,確保產(chǎn)品在性能和功耗上的優(yōu)勢;4、負責優(yōu)化大模型推理效率和性能提升;崗位要求:1、碩士以上學歷,計算機、自動化、通信等相關專業(yè);2、熟悉系統(tǒng)性能調(diào)優(yōu)的方法,熟練掌握CUDA語言,具備GPU算子開發(fā)能力;3、熟悉GPU、NPU等算子底層細節(jié)、具備大模型算子優(yōu)化經(jīng)驗(矩陣計算庫、Attention算子、訪存瓶頸算子、融合算子)等;4、有常用大模型推理框架的設計與實現(xiàn)經(jīng)驗,例如:vllm、SGLang、TensorRT-llm等;
企業(yè)介紹
中國電信人工智能研究院(TeleAI)由人工智能科學家、中國電信集團CTO及首席科學家李學龍教授牽頭組建,面向國家戰(zhàn)略需求和人工智能發(fā)展趨勢,結合中國電信在算力、數(shù)據(jù)、應用場景及5G/6G通信等多方面的優(yōu)勢,圍繞大模型、具身智能、AIGC、AI平臺設施等方向開展基礎研究、技術攻關和應用落地。