主题:DeepSeek开源了
正序浏览
主题图片汇总
主题内检索
子版版主
泡网分: 94.589
主题: 1040
帖子: 26253
注册: 2003年10月
内容贡献勋章
现在DeepSeek是AI领域风口浪尖上的话题,DeepSeek竟然还开源了。这种共享精神是AI高速发展的一个重要支柱。

Github链接

有人试过它吗?

https://forum.xitek.com/thread-1997579-findpost-89738475.html#p_89738475

arondes:

我在本地电脑上试了
1.5B,7B,14B,32B都试了,70B太大跑不了;其实32B已经太慢了。
最简单的使用方法是这里:
https://ollama_com/library/deepseek-r1
免配置,开箱即用
arondes 编辑于 2025-01-28 00:50

https://forum.xitek.com/thread-1997579-findpost-89800121.html#p_89800121

Duoduobear:

671B 1.58bit动态

ollama run SIGJNF/deepseek-r1-671b-1.58bit:latest

注意磁盘空间,我下载中途c:盘满了。可以把Ollama模型放在其他盘上。比如D盘。需新建一个环境变量

OLLAMA_MODELS = D:\.Ollama\models

然后重启Ollama。
(2)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
美国
浏览:17273 回帖:624
游客没有回帖权限
泡菜
泡网分: 2.307
主题: 5
帖子: 2187
注册: 2020年5月
duoduobear 发表于 2025-05-12 11:16
这也太快了。

感谢 ollama 的优化,同样推理 qwen3moe 30b Q4
0.6.7 版只有 40T/s 不到,今天升级到 0.7.0 直冲 150T/s

推其他模型没啥提升
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
上海
子版版主
泡网分: 94.589
主题: 1040
帖子: 26253
注册: 2003年10月
内容贡献勋章
bird3000 发表于 2025-04-30 06:34
就是一个字,快。30B的Q4在我的电脑上能跑到60~80T/S.32B的速度比QWQ稍微快点,效果差不多。

这也太快了。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
美国
陈年泡菜
泡网分: 60.991
主题: 54
帖子: 5655
注册: 2000年6月
ss10 发表于 2025-05-10 11:58
我朋友用无显卡的i7运行。(无显卡)。我的问题转化一下就是,无显卡时,X3D有用吗?

估计影响不会很大,反正我的CPU重来没有100%过。内存速度,带宽影响更大。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
浙江省
老坛泡菜
泡网分: 32.434
主题: 30
帖子: 5091
注册: 2003年6月
bird3000 发表于 2025-05-08 06:48
一般情况下,显存>GPU>内存 速度和容量>CPU。
我朋友用无显卡的i7运行。(无显卡)。我的问题转化一下就是,无显卡时,X3D有用吗?
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
陈年泡菜
泡网分: 60.991
主题: 54
帖子: 5655
注册: 2000年6月
ss10 发表于 2025-05-07 11:45
搭车问个问题,AMD的X3D在大模型的运行过程中有用吗?理论上缓存敏感型运算就有用。

一般情况下,显存>GPU>内存 速度和容量>CPU。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
浙江省
老坛泡菜
泡网分: 32.434
主题: 30
帖子: 5091
注册: 2003年6月
搭车问个问题,AMD的X3D在大模型的运行过程中有用吗?理论上缓存敏感型运算就有用。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
泡菜
泡网分: 18.263
主题: 11
帖子: 15149
注册: 2012年6月
闲聊状态 发表于 2025-04-29 15:26
qwen终于到3了
但是没有想象的惊艳,感觉不开思维感觉甚至有点不如2.5
开了思维模式类似QWQ,但是感觉比QWQ好一点

感觉这两天 chat.qwen.ai 的qwen3变聪明了。。。。比刚上线的时候聪明多了 qwen2.5 可以下班了。。。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
山东省
陈年泡菜
泡网分: 60.991
主题: 54
帖子: 5655
注册: 2000年6月
就是一个字,快。30B的Q4在我的电脑上能跑到60~80T/S.32B的速度比QWQ稍微快点,效果差不多。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
浙江省
泡菜
泡网分: 26.597
主题: 17
帖子: 1923
注册: 2003年12月
3 在CPU上跑速度不错,8b和30b-a3b,但30b moe还是比32b 非moe效果/智力上差一点点
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
云南省
泡菜
泡网分: 18.263
主题: 11
帖子: 15149
注册: 2012年6月
qwen终于到3了

但是没有想象的惊艳,感觉不开思维感觉甚至有点不如2.5
开了思维模式类似QWQ,但是感觉比QWQ好一点

登录后可直接显示原图
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
山东省
资深泡菜
泡网分: 16.628
主题: 20
帖子: 20268
注册: 2008年8月
年内主力装备
★ ILCE-7RM3
★ LIO-AN00
duoduobear 发表于 2025-04-08 11:46
我刚刚还用了DeepSeek手机App,挺正常的。

后来正常了,断了十分钟左右?还专门去百度DeepSeek上问
zyz1993 编辑于 2025-04-08 13:26
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
北京
子版版主
泡网分: 94.589
主题: 1040
帖子: 26253
注册: 2003年10月
内容贡献勋章
zyz1993 发表于 2025-04-08 11:38
今天是2025/04/08,DeepSeek网站打不开了,出大事了???????我一直用网页版,app也打不开了。。。
百度网页版还可以用:
可能原因分析‌‌网络攻击与服务器故障‌近期多篇报道指出,DeepSeek 因遭受 ‌DDoS 攻击或僵尸网络...

我刚刚还用了DeepSeek手机App,挺正常的。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
美国
资深泡菜
泡网分: 16.628
主题: 20
帖子: 20268
注册: 2008年8月
年内主力装备
★ ILCE-7RM3
★ LIO-AN00
今天是2025/04/08,DeepSeek网站打不开了,出大事了???????我一直用网页版,app也打不开了。。。
百度网页版还可以用:
可能原因分析‌‌网络攻击与服务器故障‌近期多篇报道指出,DeepSeek 因遭受 ‌DDoS 攻击或僵尸网络攻击‌,导致服务器过载或功能异常,可能直接影响网站访问‌8。若服务器维护或升级未及时完成,也可能引发临时中断‌67。‌国际政治与经济因素‌美国财长贝森特公开指责 ‌DeepSeek 与美股※※关联‌,暗示其技术发展可能引发国际竞争压力,不排除因政策限制或区域网络管制导致访问受阻‌13。微软中国区运营传闻虽被澄清,但类似事件可能加剧市场对科技企业稳定性的担忧‌1
zyz1993 编辑于 2025-04-08 11:44
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
北京
陈年泡菜
泡网分: 60.991
主题: 54
帖子: 5655
注册: 2000年6月
duoduobear 发表于 2025-04-03 00:59
清华的KTransformers好像只支持linux操作系统。这让我们用Windows操作系统的望洋兴叹。

LINUX不难,难的是各种环境,软件的配置,一个小问题搞死你。当年DOS一个config文件就折腾死人,现在的软硬件更复杂。现在各种大模型本质上都是程序员的东西,各种配置调整,普通人根本弄不清楚。
bird3000 编辑于 2025-04-03 09:20
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
浙江省
泡菜
泡网分: 26.597
主题: 17
帖子: 1923
注册: 2003年12月
duoduobear 发表于 2025-04-03 00:59
清华的KTransformers好像只支持linux操作系统。这让我们用Windows操作系统的望洋兴叹。

linux还好,一次配置后可长期服务,不难。这个东西意味着运行一套满足一个小组工作的满血R1或V3的系统成本从数十万降低到了十万上下。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
云南省
子版版主
泡网分: 94.589
主题: 1040
帖子: 26253
注册: 2003年10月
内容贡献勋章
ddtx 发表于 2025-04-03 00:51
清华的KTransformers用C++重写了,现在跑R1 Q4/FP8可达40tps,支持多并发,Xeon6+4090D单卡

清华的KTransformers好像只支持linux操作系统。这让我们用Windows操作系统的望洋兴叹。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
美国
泡菜
泡网分: 26.597
主题: 17
帖子: 1923
注册: 2003年12月
清华的KTransformers用C++重写了,现在跑R1 Q4/FP8可达40tps,支持多并发,Xeon6+4090D单卡
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
云南省
泡菜
泡网分: 18.263
主题: 11
帖子: 15149
注册: 2012年6月
ddtx 发表于 2025-03-25 10:55
DeepSeek V3-0324昨天发布,版本号不变,应该是数据资料方面的改进,测试得分大幅提高,coding性能超R1,平Claude-3.7-Sonnet

我也是更喜欢非推理的

不想看那些思考过程,告诉我结果就行了。。。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
山东省
泡菜
泡网分: 26.597
主题: 17
帖子: 1923
注册: 2003年12月
DeepSeek V3-0324昨天发布,版本号不变,应该是数据资料方面的改进,测试得分大幅提高,coding性能超R1,平Claude-3.7-Sonnet
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
云南省
陈年泡菜
泡网分: 60.991
主题: 54
帖子: 5655
注册: 2000年6月
duoduobear 发表于 2025-03-14 04:18
我也试了gemma-3:27b, 也是相同感觉,不觉得它有什么突破。
而且这个模型占用内存很大,标称27B,实际占用内存要34GB左右。
而DeepSeek-R1:32B大概只占24GB内存。

升级了ollama0.6.2,感觉27B模型的稳定性好了不少,还能支持多图上传,这样玩法可以更多了。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
浙江省
资深泡菜
泡网分: 16.628
主题: 20
帖子: 20268
注册: 2008年8月
年内主力装备
★ ILCE-7RM3
★ LIO-AN00
发个广告
登录后可直接显示原图

zyz1993 编辑于 2025-03-20 12:15
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
北京
老坛泡菜
泡网分: 64.303
主题: 1173
帖子: 81132
注册: 2003年6月
内容贡献勋章
年内主力装备
★ iPhone 15 Pro Max
★ Canon PowerShot SX60 HS
不是高级程序员都看不懂~
再就是产品越高级bug越多(即使苹果微软不也是bug不断就是明证),比如现在的ai产品(最近网民也当测试员测出不少低级bug),所以需要的程序员只多不少
登录后可直接显示原图

开山鼻祖 编辑于 2025-03-18 20:57
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
老坛泡菜
泡网分: 64.303
主题: 1173
帖子: 81132
注册: 2003年6月
内容贡献勋章
年内主力装备
★ iPhone 15 Pro Max
★ Canon PowerShot SX60 HS
那deepseek能不能完成上面所有功能?
因为deepseek主页已经被其他家抢了头条,进去了也不是之前可以回答 问题的页面了,所以动用元宝ds后台~
登录后可直接显示原图

开山鼻祖 编辑于 2025-03-18 20:42
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
老坛泡菜
泡网分: 64.303
主题: 1173
帖子: 81132
注册: 2003年6月
内容贡献勋章
年内主力装备
★ iPhone 15 Pro Max
★ Canon PowerShot SX60 HS
再问~高级程序员要多种工具找~
登录后可直接显示原图

开山鼻祖 编辑于 2025-03-18 20:31
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
老坛泡菜
泡网分: 64.303
主题: 1173
帖子: 81132
注册: 2003年6月
内容贡献勋章
年内主力装备
★ iPhone 15 Pro Max
★ Canon PowerShot SX60 HS
zyz1993 发表于 2025-03-18 20:12
你说的都是小程序?国家命脉的央企哪个没有一个叫“信息通信产业集团”的公司,专业干这个找bug的公司

没听说过 。。这里说deepseek,或许能问问deepseek程序员怎么找bug。。
登录后可直接显示原图
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
资深泡菜
泡网分: 16.628
主题: 20
帖子: 20268
注册: 2008年8月
年内主力装备
★ ILCE-7RM3
★ LIO-AN00
开山鼻祖 发表于 2025-03-18 20:04
一般bug都自己找(总不能有个bug总台再回复程序员bug在哪再还回程序员,那还是不对又交总台?如此何时有完~),程序员少不了的。。
我自己经验是哪个ai写的对用哪个,所以也不会 固定用一个。。
你说的都是小程序?国家命脉的央企哪个没有一个叫“信息通信产业集团”的公司,专业干这个找bug的公司
zyz1993 编辑于 2025-03-18 20:13
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
北京
老坛泡菜
泡网分: 64.303
主题: 1173
帖子: 81132
注册: 2003年6月
内容贡献勋章
年内主力装备
★ iPhone 15 Pro Max
★ Canon PowerShot SX60 HS
zyz1993 发表于 2025-03-17 09:34
这就很有用了,大公司有专门的部门养了几百人来查找程序代码的bug、安全漏洞,并修改之,,,这样就不必要买国外的专业软件了

一般bug都自己找(总不能有个bug总台再回复程序员bug在哪再还回程序员,那还是不对又交总台?如此何时有完~),程序员少不了的。。

我自己经验是哪个ai写的对用哪个,所以也不会 固定用一个。。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
MM7
资深泡菜
泡网分: 39.761
主题: 68
帖子: 3260
注册: 2002年8月
偶发现QWQ-32B-FP16的能力很强,几乎等同于DS671B官网满血版。而QWQ-32B-FP16在偶的电脑上可以运行,只占用65G内存。
偶用了2题测试都答对了
1、三个人打台球,两人对局一人观战,输的人下场换观战的人上场,如此往复,最终,A输了6局,B输了8局,C输了10局,问各赢多少局?
2、在平面四边形ABCD中,AB=AC=CD=1,∠ADC=30°,∠DAB=120°。然后将△ACD沿AC翻折到△ACP的位置,其中P是一个动点。现在要求二面角A-CP-B的余弦值的最小值。
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
广东省
资深泡菜
泡网分: 16.628
主题: 20
帖子: 20268
注册: 2008年8月
年内主力装备
★ ILCE-7RM3
★ LIO-AN00
zyz1993 发表于 2025-03-17 09:34
这就很有用了,大公司有专门的部门养了几百人来查找程序代码的bug、安全漏洞,并修改之,,,这样就不必要买国外的专业软件了

与Deepseek讨论了一下,说Deepseek不能完全替代专业源代码扫描工具,但能代替50%以上测试报告安全漏洞分析,审计,及代码修改工作,这也会淘汰一批分析工程师
(0)
(0)
只看该作者
不看该作者
加入黑名单
举报
返回顶部
个人图文集
个人作品集
北京
回复主题: DeepSeek开源了
功能受限
游客无回复权限,请登录后再试