大模型推理加速算法專家
70000-90000元
杭州
應(yīng)屆畢業(yè)生
碩士



- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
職位描述
該職位還未進(jìn)行加V認(rèn)證,請(qǐng)仔細(xì)了解后再進(jìn)行投遞!
崗位職責(zé):1.深入前沿推理加速技術(shù)研究,突破大語言模型解碼速度瓶頸和多模態(tài)融合計(jì)算挑戰(zhàn);
2.設(shè)計(jì)創(chuàng)新的注意力機(jī)制優(yōu)化算法,加速大語言模型長(zhǎng)文本理解和多輪對(duì)話能力;
3.研發(fā)高效視覺-語言模型推理架構(gòu),解決圖像特征提取與文本生成的計(jì)算協(xié)同問題;
4.開發(fā)面向不同語言任務(wù)和多模態(tài)場(chǎng)景的自適應(yīng)推理技術(shù),實(shí)現(xiàn)動(dòng)態(tài)計(jì)算資源分配;
5.主導(dǎo)大規(guī)模模型服務(wù)體系設(shè)計(jì),解決百億/千億參數(shù)模型的低成本部署挑戰(zhàn)。
任職要求:1.人工智能、計(jì)算機(jī)或相關(guān)領(lǐng)域博士學(xué)位(優(yōu)秀碩士需3年以上強(qiáng)相關(guān)經(jīng)驗(yàn)),在大語言模型、多模態(tài)理解及生成模型優(yōu)化領(lǐng)域有深厚研究積累;
2.精通Transformer計(jì)算優(yōu)化,深入理解Flash Attention、Speculative Decoding、MQA/GQA等前沿技術(shù);
3.掌握模型壓縮技術(shù)棧,包括GPTQ/AWQ量化、SparseGPT稀疏化、知識(shí)蒸餾等方法;
4.熟悉vLLM、DeepSpeed-Inference、TGI等大模型推理框架,能進(jìn)行系統(tǒng)級(jí)優(yōu)化;
5.具備VLM(如CLIP、LLaVA、MiniGPT-4)推理加速經(jīng)驗(yàn),了解多GPU推理和Continuous Batching技術(shù);
6.在相關(guān)領(lǐng)域會(huì)議發(fā)表高水平論文,或主導(dǎo)過業(yè)界重要語言/多模態(tài)模型優(yōu)化項(xiàng)目。
工作地點(diǎn)
地址:杭州濱江區(qū)杭州-濱江區(qū)火炬創(chuàng)新中心6棟杭州濱江區(qū)杭州高新區(qū)火炬創(chuàng)新中心6樓


職位發(fā)布者
HR
聚好看科技股份有限公司

-
家電業(yè)
-
200-499人
-
股份制企業(yè)
-
嶗山區(qū)松嶺路339號(hào)海信研發(fā)中心
相似職位
-
信息管理工程師 9000元以上蕭山區(qū) 應(yīng)屆畢業(yè)生 不限浙江藍(lán)天鶴舞控股有限公司
-
業(yè)務(wù)經(jīng)理 10元以上蕭山區(qū) 應(yīng)屆畢業(yè)生 不限浙江藍(lán)天鶴舞控股有限公司
-
商務(wù)助理 面議濱江區(qū) 應(yīng)屆畢業(yè)生 不限北京北信源軟件股份有限公司
-
項(xiàng)目總經(jīng)理 40000-45000元余杭區(qū) 應(yīng)屆畢業(yè)生 大專匯通達(dá)網(wǎng)絡(luò)股份有限公司
-
有機(jī)硅研發(fā)經(jīng)理 10000-15000元濱江區(qū) 應(yīng)屆畢業(yè)生 碩士江西新嘉懿新材料有限公司
-
有機(jī)硅研發(fā)高級(jí)應(yīng)用工程師 15000-30000元濱江區(qū) 應(yīng)屆畢業(yè)生 本科江西新嘉懿新材料有限公司