久久精品国产亚洲av成人,久久久久久久蜜桃

亞馬遜云科技Inf2實(shí)例每瓦性能提高了50%

時(shí)間：2023-05-16 10:32 來源：搜狐責(zé)任編輯：青青

　　原標(biāo)題：亞馬遜云科技Inf2實(shí)例每瓦性能提高了50%

　　在2019年的亞馬遜云科技re:Invent上，亞馬遜云科技發(fā)布了Inferentia芯片和Inf1實(shí)例這兩個(gè)基礎(chǔ)設(shè)施。Inferentia是一種高性能機(jī)器學(xué)習(xí)推理芯片，由亞馬遜云科技定制設(shè)計(jì)，其目的是提供具有成本效益的大規(guī)模低延遲預(yù)測。時(shí)隔四年，2023年4月亞馬遜云科技發(fā)布了Inferentia2芯片和Inf2實(shí)例，旨在為大型模型推理提供技術(shù)保障。

　　Inf2實(shí)例的應(yīng)用場景

　　使用亞馬遜云科技Inf2實(shí)例運(yùn)行流行的應(yīng)用程序，例如文本摘要、代碼生成、視頻和圖像生成、語音識別、個(gè)性化等。Inf2實(shí)例是Amazon EC2中的第一個(gè)推理優(yōu)化實(shí)例，引入了由NeuronLink(一種高速、非阻塞互連)支持的橫向擴(kuò)展分布式推理�，F(xiàn)在可以在Inf2實(shí)例上跨多個(gè)加速器高效部署具有數(shù)千億個(gè)參數(shù)的模型。Inf2實(shí)例的吞吐量比其他類似的Amazon EC2實(shí)例高出三倍，延遲低八倍，性價(jià)比高出40%。為了實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo)，與其他類似的Amazon EC2實(shí)例相比，Inf2實(shí)例的每瓦性能提高了50%。

　　使用Inf2實(shí)例運(yùn)行GPT-J-6B模型

　　GPT-J-6B是由一組名為EleutherAI的研究人員創(chuàng)建的開源自回歸語言模型。它是OpenAI的GPT-3最先進(jìn)的替代方案之一，在聊天、摘要和問答等廣泛的自然語言任務(wù)中表現(xiàn)良好。

　　該模型由28層組成，模型維度為4096，前饋維度為16384。模型維度分為16個(gè)頭，每個(gè)頭的維度為256。旋轉(zhuǎn)位置嵌入(RoPE)應(yīng)用于每個(gè)頭的64個(gè)維度。使用與GPT-2/GPT-3相同的一組BPE，使用50257的標(biāo)記化詞匯訓(xùn)練模型。

　　GPT-J-6B基礎(chǔ)設(shè)施有60億個(gè)參數(shù)，非常適合大語言模型(LLM)學(xué)習(xí)的入門版本，進(jìn)行文本生成測試。在部署過程中，用到了Neuron SDK和transformers-neuronx。transformers-neuronx是由AWS Neuron團(tuán)隊(duì)構(gòu)建的開源庫，可幫助使用AWS Neuron SDK運(yùn)行轉(zhuǎn)換器解碼器推理工作流程。目前，它提供了GPT2、GPT-J和OPT模型類型的演示腳本，它們的前向函數(shù)在編譯過程中重新實(shí)現(xiàn)，以進(jìn)行代碼分析和優(yōu)化，并且可以基于同一個(gè)庫實(shí)現(xiàn)其他模型架構(gòu)。AWS Neuron優(yōu)化的轉(zhuǎn)換器解碼器類已使用稱為PyHLO的語法在XLA HLO(高級操作)中重新實(shí)現(xiàn)。該庫還實(shí)現(xiàn)了張量并行(Tensor Parallelism)，以跨多個(gè)NeuronCore對模型權(quán)重進(jìn)行分片。

投稿郵箱：chuanbeiol@163.com 詳情請?jiān)L問川北在線：http://sanmuled.cn/

>>相關(guān)文章

石頭科技董事長套現(xiàn)9億后反勸投資者“耐心一點(diǎn)”

AI智能打印技術(shù)加持，聯(lián)想至像科技推動(dòng)打印領(lǐng)域智能化進(jìn)程

AGA Group：引領(lǐng)AI科技，開創(chuàng)智慧未來

智慧、高效、未來：AGA Group以AI科技塑造新世界

科技引領(lǐng)家庭娛樂新風(fēng)尚：愛普生投影儀CH-QL3000系列打造高端家庭影院

世優(yōu)科技成都開放日順利舉辦 AI數(shù)字人交互體驗(yàn)成活動(dòng)焦點(diǎn)

世優(yōu)科技成都開放日順利舉辦，AI數(shù)字人交互體驗(yàn)成活動(dòng)焦點(diǎn)

佳格多力食用油用科技創(chuàng)新守護(hù)億萬家庭的餐桌健康

成都物朗科技：精準(zhǔn)賦能智慧生活，科技引領(lǐng)未來之路

川北在線-川北全搜索版權(quán)與免責(zé)聲明

①凡注明"來源：XXX(非在線)"的作品，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)，本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
②本站所載之信息僅為網(wǎng)民提供參考之用，不構(gòu)成任何投資建議，文章觀點(diǎn)不代表本站立場，其真實(shí)性由作者或稿源方負(fù)責(zé)，本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的，本站不原創(chuàng)、不存儲視頻，所有視頻均分享自其他視頻分享網(wǎng)站，如涉及到您的版權(quán)問題，請與本網(wǎng)聯(lián)系，我站將及時(shí)進(jìn)行刪除處理。

娛樂百科

360GAME

探索發(fā)現(xiàn)

愛美·BEAUTY

知識百科

精彩看點(diǎn)

濕敷和敷面膜有什么區(qū)別
化妝品過敏方法
玫瑰花瓣面膜怎么用
高筒靴怎么搭配
夏天連衣裙領(lǐng)口太低怎么辦
化妝后為什么會(huì)脫妝

樂活	愛美
育兒	養(yǎng)生
探索	百科
游戲	硬件

娛樂	財(cái)經(jīng)
體育	房產(chǎn)
文化	交通
文苑	教育

科技	IT
百度	游戲
奇虎	讀報(bào)
搜狗	觀點(diǎn)

美女	社會(huì)
熱點(diǎn)	衛(wèi)生
搞笑	食品
綠植	美通社