财讯网

主页 > 要闻 > 正文

世界新资讯：在家也能自制！人手一个ChatGPT的时代要来了？

2023-04-15 07:11:53 | 来源:上海证券报 | 编辑: |

人手一个ChatGPT的时代或许就要来了！

(相关资料图)

当地时间4月12日，微软宣布开源大语言模型训练工具Deep Speed Chat，这意味着继OpenAI开放GPT的API方便各大厂商直接接入后，更为底层的工具也开放给所有用户使用。

开源底层训练工具

人工智能行业又迎来重磅消息。

当地时间4月12日，微软宣布开源了Deep Speed Chat，帮助用户轻松训练类ChatGPT等大语言模型。

据了解，这一工具是基于微软Deep Speed深度学习优化库开发而成，具备训练、强化推理等功能，还使用了RLHF（人工反馈机制的强化学习）技术，可将训练速度提升15倍以上，成本却大幅度降低。

简单来说，这种接近“所见即所得”反馈的训练工具，可以帮助没有太多人工智能模型训练基础的用户，在短时间内迅速训练出定制化的ChatGPT大语言模型，堪称“傻瓜式服务”。

据微软披露，目前使用该工具训练一个130亿参数的类ChatGPT模型，只需1.25小时。而训练一个1750亿参数的模型，Deep Speed Chat也只需不到一天的时间，而这一参数规模相当于ChatGPT-3.5。

据介绍，Deep Speed Chat拥有强化推理、RLHF模块、RLHF系统三大核心功能。

具体来看，首先是这一工具的强化推理能力对于用户使用更为友好，只需一个脚本即可实现多个训练步骤。

“传统模型训练需要诸多流程，包括调用预训练模型，实施训练标注等等。”一位业内工程师告诉记者，从目前微软介绍的情况来看，Deep Speed Chat可以大幅优化这一过程的繁琐度。此外，该工具还提供一个易于使用的推理API，用于在模型训练后测试对话性能。

而RLHF模块、RLHF系统则确保模型训练过程中的精细度，同时实现模型训练与推理能力的无缝切换。

从目前披露的情况来看，多位业内人士认为，相关的大模型训练门槛的资金投入、专业性要求都将大幅下降。

有业内人士戏称，如果说GPT引发了诸多行业的“工作危机”，那么如今Deep Speed Chat则可能将这场危机引入人工智能行业本身。

商业化领域迎重大变革

这无疑将引发整个人工智能领域商业化的变革。

“现在训练大模型要依托超大的算力，背后是大量GPU集群，这些价格是一般小型企业乃至科研机构无法承担的。”一位从事人工智能研究的工程师告诉记者，类GPT模型训练此前存在的最大障碍是硬件设备。

事实上，在过去几个月伴随ChatGPT的走红，类似Deep Speed Chat的训练开发工具也纷纷面世。但总体而言，由于缺乏支持端到端的基于RLHF的规模化系统，要想训练ChatGPT模型整体效率依然不高。

有媒体此前调查发现，现有的开源系统的训练效率通常还不到，这些机器所能达到的最大效率的5%。

而微软的Deep Speed Chat面世，或许意味着这一情况从商业的角度来看将大幅改善。

记者注意到，目前在Azure云上训练一个OPT-13B模型（一种类似于GPT系列的大型语言模型）只需要9小时，而OPT-30B模型也只需18个小时，这两种训练分别花费不到300美元和600美元。

即使是当前开源领域，参数最大的OPT-175B，训练时长也仅需20个小时，其训练价格也在5000美元左右。要知道此前千亿参数领域的模型训练，其成本均在百万级美元。

对于此次微软下场推出的这款重磅服务，有业内人士将之比喻为几十年前家庭电脑的普及。

“现在我们每个人拥有一台自己的电脑是稀松平常的事情，”一位业内人士认为，正是这种基础建设的普及，推动了整个互联网时代的到来，“而如今，一场新的基础建设已将拉开大幕。”

（来源：上海证券报）

关键词：

上一篇：　　下一篇：

1
国药现代(600420)：国药集团参与定增产业...

国药现代(600420)：国药集团参与定增产业平...
2
焦点简讯:收盘综述：三大指数齐上涨能源金...

收盘综述：三大指数齐上涨能源金属涨幅居前...
3
博汇科技(688004)：传媒监测监管领军拥抱A...

博汇科技(688004)：传媒监测监管领军拥抱AI...
4
国盛智科(688558)：产品结构呈大型化趋势 ...

国盛智科(688558)：产品结构呈大型化趋势利...
5
绝味食品(603517)：预告符合预期费用开始...

绝味食品(603517)：预告符合预期费用开始收缩...
6
ETF基金周报：本周中证红利指数领涨资源能...

ETF基金周报：本周中证红利指数领涨资源能...
7
焦点热议:金山办公(688111)公司分析报告：积...

金山办公(688111)公司分析报告：积极拥抱AI...
8
环球今日讯！新能源汽车景气度跟踪：M4W1订...

新能源汽车景气度跟踪：M4W1订单趋缓进入新...
9
环球热议:派能科技(688063)：户储量利齐升 ...

派能科技(688063)：户储量利齐升开拓工商业...
10
国联研究一周重点报告回顾播报

国联研究一周重点报告回顾...

1
公园警示牌标语_警示牌标语

1、非游览区禁止攀爬爱护绿化,人人有责除了...
2
世界速讯：es100b36max5_es10

1、ES10是手机上使用的发光二极管。以上就...
3
紫陶适合泡红茶吗_紫陶可以泡红茶吗_播报

解答：1、紫陶可以做红茶；紫砂透气性好，...
4
激励运动员的话10字_需要怎么鼓励每日快报

欢迎观看本篇文章，小升来为大家解答以上问...
5
老调重弹和老生常谈_老生常谈的意思

1、【英译】：cutanddried,cliché　　【解...
6
林生斌潼臻一生公司已注销！网友：吸血吸够...

林生斌潼臻一生公司已注销！网友：吸血吸够...
7
去亲家拜访送什么礼物世界独家

我个人觉得送东西最好了，因为我的一些东西...
8
全球快看：七旬老人脑出血后失语到交通...

今年70岁的彭婆婆前段时间突发脑出血，经过...
9
科德宝去年大中华区销售破百亿元回应现金...

“科德宝中国占全球收入的比例约11%，中国...
10
小学生手指被卡昌平区消防救援支队紧急帮...

4月13日14时34分，昌平区消防救援支队北七...