(资料图片仅供参考)
编程客栈() 8月11日消息:AMD GPU 通过 MLC(MAChine learning compilation)项目在编译和部署大模型方面取得了进展,实现了与英伟达 GPU 相当的性能。MLC-LLM 方案在 AMD RX 7900 XTX 上的性能达到了英伟达 GeForce RTX 4090 的 80%,而价格只有 RTX 4090 的 60%。
MLCTGqdUq-LLM 可以编译 LLM 并将其部署在使用具有竞争性能的 ROCm 的 AMD GPU 上。更具体地说,对于phpLlama2-7B/13B,AMD Radeon™ RX 7900 XTX 的速度是 NVIDIA GeForce RTX™ 4090 的 80%,是 NVIDIA GeForce R编程客栈TX™ 3090Ti 的 94%。除了 ROCm 之外,Vulkan 支持还允许我们将 LLM 部署推广到其他 AMD 设备,例如具有 AMD APU 的 SteamDeck。
机器学习编译(MLC)是一种新兴技术,用于编译和自动优化机器学习工作负载。与为每个独立的后端(如 ROCm 或 CUDA)编写特定的内核不同,MLC 解决方案会js自动生成适用于不同后端的代码。利用基于 ML 编译的解决方案 MLC-LLM,为 LLMs 提供高性能的通用部署。MLC-LLM 建立在 Apache TVM Unity 之上,它是一种机器学习编译栈,提供了基于 python 的开发和通用部署。MLC-LLM 为各种后端编程(包括 CUDA、Metal、ROCm、Vulkan 和 OpenCL)提供了最先进的性能,涵盖了服务器级 GPU 到移动设备(iPhone 和 android)。
在较高的层次上,该框架允许用户采用基于 Python 的工作流程,包括转换计算图的 API,优化 GPU 内核的布局和调度,并将其在感兴趣的平台上进行本地部署。
标签:
编程客栈()8月11日消息:AMDGPU通过MLC(MAChinelearningcompilation)
艺术漆是现代家居装饰中不可或缺的一部分,能够为房间增添独特的氛围和
中国7月货币供应量M2同比增长10 7%,预估为11 0%,前值为11 3%。
华为回应:网上传闻与事实不符,华为没有与重庆国资委洽谈车BU相关事宜
8月14日, CosmosAI 将在数年深耕人工智能底层基础设施与数字化商
1、PorscheAG,通常缩写为Porsche,是一家德国汽车制造商,专门生产高
逆势投资拿下银桥、来思尔乳业,君乐宝上市再引猜想,蒙牛,宋亮,上市,君
以下是盛弘股份在北京时间8月11日14:45分盘口异动快照:8月11日,盛弘
夜里9点半地处大别山腹地的安徽省岳西县天悦湾体育馆灯火通明数千名来
甲醇是高效液相色谱比较常用的流动相,还是有名的脱脂剂之一。是基础的
记者闫韫明傍晚时分,马达加斯加西南部图利亚拉市的街道繁忙起来。此时
据恒大地产集团有限公司财报数据显示,公司总负债18,338 19亿元,总资
今日南财市场情绪指数为55 4,市场投资热度处于中立水平,股市,vix,上证
8月10日,华东新华能源投资有限公司副总经理,新华博乐电力投资有限公
近段时间以来,伴随资金持续流入,多只港股相关ETF份额持续增长,其中
长沙子阳健身拖欠薪资投诉直通车是湖南日报、华声在线、新湖南主办的投
以下是华人健康在北京时间8月11日09:50分盘口异动快照:8月11日,华人
1、51采花盗意外现真身,虎外甥作媒为报恩三个月前,无双无意中救了一
国家安全机关是反间谍工作的主管机关,依法打击间谍犯罪。任何危害国家
事件:7月CPI同比-0 3%,预期-0 5%,前值-0 3%;PPI同比-4 4%,预期-4
案例素材来源:周口中院基本案情2022年09月01日11时许李某驾驶货车与袁
路通到哪里、保险就要到哪里!监管带队、北京保险全行业投入救灾,北京,
夏天,果然是属于碎花裙的,高领,礼服,蕾丝,裙子,纯色,碎花裙,泡泡袖
导读1、我认为,世界只可毁灭,不可拯救,当然现在我想这一观点似乎是
立秋后的陇东大地,正午的阳光虽依然炽烈,荫凉处拂过的微风已令人颇感
沪深两市多家上市公司8月10日晚间发布公司公告,以下为重要公告汇总:
欧普康视披露半年报。公司2023年上半年实现营业收入780,200,959 59元,
他的感情生活却一直很低调,直到今年6月,他才向大家公开了他的未婚妻
8月9日,360集团与中国联通河南省分公司举办战略签约,双方将发挥各自
三秦都市报-三秦网讯(记者李海涛)随着出行需求的逐步释放,今年暑运