職位描述
該職位還未進(jìn)行加V認(rèn)證,請仔細(xì)了解后再進(jìn)行投遞!
崗位職責(zé):1.深入前沿推理加速技術(shù)研究,突破大語言模型解碼速度瓶頸和多模態(tài)融合計算挑戰(zhàn);
2.設(shè)計創(chuàng)新的注意力機(jī)制優(yōu)化算法,加速大語言模型長文本理解和多輪對話能力;
3.研發(fā)高效視覺-語言模型推理架構(gòu),解決圖像特征提取與文本生成的計算協(xié)同問題;
4.開發(fā)面向不同語言任務(wù)和多模態(tài)場景的自適應(yīng)推理技術(shù),實現(xiàn)動態(tài)計算資源分配;
5.主導(dǎo)大規(guī)模模型服務(wù)體系設(shè)計,解決百億/千億參數(shù)模型的低成本部署挑戰(zhàn)。
任職要求:1.人工智能、計算機(jī)或相關(guān)領(lǐng)域博士學(xué)位(優(yōu)秀碩士需3年以上強(qiáng)相關(guān)經(jīng)驗),在大語言模型、多模態(tài)理解及生成模型優(yōu)化領(lǐng)域有深厚研究積累;
2.精通Transformer計算優(yōu)化,深入理解Flash Attention、Speculative Decoding、MQA/GQA等前沿技術(shù);
3.掌握模型壓縮技術(shù)棧,包括GPTQ/AWQ量化、SparseGPT稀疏化、知識蒸餾等方法;
4.熟悉vLLM、DeepSpeed-Inference、TGI等大模型推理框架,能進(jìn)行系統(tǒng)級優(yōu)化;
5.具備VLM(如CLIP、LLaVA、MiniGPT-4)推理加速經(jīng)驗,了解多GPU推理和Continuous Batching技術(shù);
6.在相關(guān)領(lǐng)域會議發(fā)表高水平論文,或主導(dǎo)過業(yè)界重要語言/多模態(tài)模型優(yōu)化項目。
工作地點(diǎn)
地址:杭州濱江區(qū)杭州-濱江區(qū)火炬創(chuàng)新中心6棟杭州濱江區(qū)杭州高新區(qū)火炬創(chuàng)新中心6樓
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
職位發(fā)布者
HR
聚好看科技股份有限公司
-
家電業(yè)
-
200-499人
-
股份制企業(yè)
-
嶗山區(qū)松嶺路339號海信研發(fā)中心
相似職位
-
餓了么-用戶產(chǎn)品經(jīng)理-會員方向 10000-20000元余杭區(qū) 應(yīng)屆畢業(yè)生 本科阿里巴巴(中國)有限公司
-
信息科科長(高級JAVA) 面議余杭區(qū) 應(yīng)屆畢業(yè)生 本科杭州錢江制冷集團(tuán)有限公司
-
制造助理工程師-2026屆(001797) 6000-10000元蕭山區(qū) 應(yīng)屆畢業(yè)生 本科浙江恒逸集團(tuán)有限公司
-
海豚購超市分揀/6000 面議錢塘區(qū) 應(yīng)屆畢業(yè)生 不限超信外包服務(wù)有限公司
-
聚酯工藝技術(shù)儲備-2026屆(001811) 7000-12000元蕭山區(qū) 應(yīng)屆畢業(yè)生 本科浙江恒逸集團(tuán)有限公司
-
人力資源專員(新疆煤化工項目)(001833) 6000-10000元蕭山區(qū) 應(yīng)屆畢業(yè)生 本科浙江恒逸集團(tuán)有限公司
應(yīng)屆畢業(yè)生
碩士
最近更新
725人關(guān)注
注:聯(lián)系我時,請說是在杭州人才網(wǎng)上看到的。
