主题:模型满天飞
正序浏览
主题图片汇总
主题内检索
老坛泡菜
泡网分: 63.879
主题: 1165
帖子: 34412
注册: 2003年6月
内容贡献勋章
年内主力装备
★ iPhone 15 Pro Max
★ Canon PowerShot SX60 HS
咋不说满地爬呢~

就是爬了很久就飞了嘛,不能总爬是不。

AMD开源30亿小参数模型,媲美Qwen-2.5


专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!
AMD在官网开源了最新小参数模型Instella-3B。比较特别的是,这是一个基AMD Instinct™ MI300X GPU从头训练的模型。
根据测试数据显示,Instella-3B的性能超过了Llama-3.2-3B、Gemma-2-2B,可以媲美阿里开源的Qwen-2.5-3B,这也证明了AMD的GPU也能训练出高性能的大模型。
开山鼻祖 编辑于 2025-03-19 19:41
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
浏览:1691 回帖:4
第 1 页 / 共 1 页
游客没有回帖权限
老坛泡菜
泡网分: 63.879
主题: 1165
帖子: 34412
注册: 2003年6月
内容贡献勋章
年内主力装备
★ iPhone 15 Pro Max
★ Canon PowerShot SX60 HS
amd/gaia: Run LLM Agents on Ryzen AI PCs in Minutes

AMD近期宣布了一项重大创新,推出了名为GAIA的应用程序,专为大语言模型(LLM)的本地化运行而设计。这款应用已经在GitHub上开源,但目前仅限于Windows平台使用。
GAIA是一款基于生成式AI技术的应用程序,它允许用户在Windows PC上本地、私密地运行大语言模型。这款应用针对AMD锐龙AI 300系列处理器进行了优化,展现了AMD在边缘计算领域的进一步布局。
通过在NPU上运行GAIA,用户可以显著提升AI特定任务的性能。从Ryzen AI软件版本1.3开始,AMD引入了混合支持功能,允许同时使用NPU和核显来部署量化的大语言模型。

不合规外链图片,不直接显示,谨慎点击

AMD发布GAIA开源AI项目,专为Windows打造本地化大语言模型运行方案

GAIA的核心组件基于ONNX TurnkeyML的Lemonade SDK开发,并采用了检索增强生成(RAG)技术框架。通过本地向量索引,用户可以实时检索和分析※※※※※※※、GitHub等外部数据。
系统的工作流程包括三大模块:LLM连接器、LlamaIndex RAG管道和代理Web服务器。GAIA支持Llama、Phi等主流的大语言模型,并提供了四大功能模块:
Chaty:一款支持※※对话的聊天机器人。Clip:专注于※※※※※※※视频搜索与问答的专家。Joker:一个具有幽默风格的笑话生成器。Simple Prompt:用于直接与模型交互的测试工具。

不合规外链图片,不直接显示,谨慎点击

AMD发布GAIA开源AI项目,专为Windows打造本地化大语言模型运行方案

在硬件方面,AMD提供了普通版和混合版两种安装方案。普通安装包兼容所有Windows PC,包括非AMD硬件设备,通过Ollama后端实现跨平台支持。混合安装包则专为配备锐龙AI 300系列处理器的设备设计,能够智能分配NPU与集成显卡的计算负载。
GAIA在隐私和性能方面表现突出。本地化处理确保了医疗、金融等敏感行业的数据不会跨境传输。同时,响应延迟降低至毫秒级,相比云端方案缩短了40-60%。NPU专用架构实现了每瓦性能的提升,并支持离线环境运行。
AMD鼓励开发者为GAIA贡献自定义代理模块,目前已有多个行业定制化代理正在开发中。GAIA项目采用了MIT开源协议,代码库已在GitHub上开放。
尽管目前GAIA暂不支持Linux和macOS系统,但AMD的官方文档透露,未来可能会扩展至多平台支持。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
泡菜
泡网分: 9.671
主题: 0
帖子: 653
注册: 2007年4月
闲聊状态 发表于 2025-03-19 19:45
其实AMD不用证明啥 它的ROCM本来就能训练模型
大家不用它的不是因为它理论上不能,而是支持太拉跨,根本是徒增烦恼...

AMD还能比Intel更拉垮
发布自 iOS客户端
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
北京
老坛泡菜
泡网分: 63.879
主题: 1165
帖子: 34412
注册: 2003年6月
内容贡献勋章
年内主力装备
★ iPhone 15 Pro Max
★ Canon PowerShot SX60 HS
昨日,LG旗下的人工智能研究中心“LG AI Research”宣布推出韩国首个开源AI推理模型——EXAONE Deep,其团队宣传其擅长数学和代码编程。值得一提是,EXAONE Deep“满血版”的体积十分小巧,仅有320亿参数(32B),而DeepSeek-R1“满血版”则拥有6710亿参数(671B),此外EXAONE Deep还拥有两个轻量化模型,分别为EXAONE Deep-7.8B、EXAONE Deep-2.4B。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
泡菜
泡网分: 18.224
主题: 11
帖子: 15116
注册: 2012年6月
其实AMD不用证明啥 它的ROCM本来就能训练模型

大家不用它的不是因为它理论上不能,而是支持太拉跨,根本是徒增烦恼
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
山东省
回复主题: 模型满天飞
功能受限
游客无回复权限,请登录后再试