财讯网

主页 > 要闻 > 正文

全球今日报丨全面进化！万众瞩目的ChatGPT-4真的来了

2023-03-15 14:31:44 | 来源:上海证券报 | 编辑: |

万众瞩目的ChatGPT-4，真的来了。

北京时间3月15日凌晨，OpenAI发布了最新版本的GPT-4，瞬间引发全球市场的关注。

【资料图】

从目前官方解读以及大量机构的评测来看，“超出预期”依然是这一版GPT给人带来的最大体验，具体而言，多模态的引入以及推理能力的大幅提升，让GPT在“智能”层面有明显跃迁。

目前，ChatGPT的Plus订阅用户已经可以使用GPT-4，其他用户需要排队申请内测。在应用方面，微软表示，新必应搜索引擎正在运行GPT-4。OpenAI还在官网展示了给摩根士丹利、多邻国、By My Eyes等应用GPT-4的案例。

多模态“更上一层楼”

美东时间3月14日，OpenAI宣布推出大型的多模态模型GPT-4。“GPT-4比以往任何版本更具创造性和协作性”，并且“有更广泛的常识和解决问题的能力，可以更准确地解决难题”。OpenAI的CEO Sam Altman说：“这是我们迄今为止功能最强大的模型。”

“我们创建了GPT-4，这是OpenAI努力扩展深度学习的最新里程碑。GPT-4是一个大型多模态模型（接受图像和文本输入，提供文本输出），虽然在许多现实世界场景中的能力不如人类，但在各种专业和学术基准上表现出人类水平。”OpenAI介绍道。

GPT-4比上一个版本强在哪？OpenAI称，虽然这两个版本在随意的谈话中看起来很相似，但“当任务的复杂性达到足够的阈值时，差异就会出现”，GPT-4更可靠、更有创意，并且能够处理更细微的指令。

多模态的引入，让此次发布的GPT相较上一代综合体感明显“更上一层楼”。

OpenAI称，GPT-4比以往任何时候都更具创造性和协作性。它可以在创意和技术写作任务上与用户一起生成、编辑和迭代，比如创作歌曲、编写剧本或学习用户的写作风格。

GPT-4可接受图像作为输入，并生成字幕、分类和分析。以上图为例，输入牛奶、鸡蛋、面粉等食材的图片，GPT-4可以识别图片元素并输出食材用途参考。

图片笑点在哪里？GPT-4可以按顺序描述出每一格的内容，并总结出笑点。

此外，在文本内容长度上，GPT-4能够处理超过25000个单词的文本，支持长篇内容创作、延续对话以及文档搜索和分析等应用场景。

“篇幅的拓展让GPT的应用场景进一步扩大。”一位互联网行业人士表示，这意味着GPT在To B端的能力进一步加强。

此外，上周，微软德国公司的首席技术官安德烈亚斯·布劳恩（Andreas Braun）在GPT-4的预告中强调了其多模态特征，包括视频方面的可能性。但这一点尚未在已知信息中体现。

强推理实现能力跃迁

除了引入的多模态技术外，另一个颇引人瞩目的升级，便是此次GPT-4所展现出的强大推理能力。

尽管在体感上，GPT-4在与人闲谈上感觉与上一代差异不大。

但在其发布会上，OpenAI将之引入各类考试的测试中，结果却颇为令人惊讶。

实验表明，GPT-4在各种专业测试和学术基准上的表现与人类水平相当。

例如，GPT-4通过了模拟律师考试，且分数在应试者的前10%左右；相比之下，上一代GPT的得分在倒数10%左右。

英伟达AI科学家Jim Fan点评称，GPT-4最强的其实就是推理能力。它在GRE、SAT、法学院考试上的得分，几乎和人类考生没有区别。也就是说，GPT-4可以全靠自己考进斯坦福了。

而这种强大的推理能力最惊艳的亮相，或许就是在生成代码上。

在此次发布会上，OpenAI总裁Greg Brockman在现场演示了GPT-4在这方面的能力。他直接在纸上画了一个潦草的示意图，拍照发给GPT，并要求其按照这个布局写网页代码。

几乎只需要数秒钟的时间，相应的代码就完成了生成。

此外，发布会还展示了一个GPT-4的使用场景，那就是把程序运行出错的信息甚至错误信息截图提交给GPT-4，仅凭这部分图片信息，GPT-4都能自动查出错误。

“这对于整个编程行业来说是具有颠覆性意义的。”前述互联网人士表示，未来大量基础性的编程都将由人工智能接手。据他透露，目前国内许多的互联网公司已经引入GPT，辅助编写程序，“以后这种替代的比例会进一步提高。”

也正因如此，此次发布会上，OpenAI也明确表示，将在ChatGPT Plus上提供GPT-4，并将其作为API提供给开发人员构建应用程序和服务。

安全性再受关注

人工智能性能的大幅提升，在令人欣喜的同时，也不免引发大众的担忧。

在一片关于GPT-4性能的热议中，也有人担心，如此智能要是被用在非法的地方，将会带来怎样的后果。

GPT-4相较于ChatGPT推理能力显著提升

已经火遍全球的ChatGPT最显著的局限性之一就是“一本正经地胡说八道”。也就是说，ChatGPT回答语言连贯自然、逻辑通顺，但它的回答内容不基于事实，而是基于语言模型。这使得人们惊艳于其对话水平的同时，无法信赖其提供的内容。

在此次发布上，OpenAI称，他们花了6个月的时间使用对抗性测试程序和ChatGPT的经验教训对GPT-4进行迭代调整，从而在真实性、可控性等方面取得了有史以来最好的结果。

在OpenAI的内部评估中，与上一代GPT相比，GPT-4响应不允许的内容的可能性降低了82%，生成事实回复的可能性提高了40%。

并且OpenAI加入了更多人类反馈，包括ChatGPT用户提交的反馈，以改进GPT-4的行为。OpenAI还与包括AI安全和安全性在内的50多个领域的专家合作，进行早期反馈。

此外，基础设施方面，OpenAI表示GPT-4是在Microsoft Azure AI超级计算机上训练的。Azure的AI优化基础设施也使OpenAI能够将GPT-4交付给全球用户。

OpenAI也坦承，GPT-4仍然有许多已知的局限性，OpenAI正在努力解决这些问题，例如社会偏见等。

在GPT-4发布之后，“ChatGPT之父”Sam Altman表示：“它仍然是有缺陷的，仍然是有限的，在你花了更多的时间第一次使用它时，它似乎比实际情况更令人印象深刻。”

（来源：上海证券报）

关键词：

上一篇：世界热点！卡莱特盘中大幅下探！一度跌超15% 　　下一篇：郭广昌大动作百亿“清仓”这家A股公司！

1
问政播报 | 苏州市民反映商场开在学校旁边隐患多

问政播报|苏州市民反映商场开在学校旁边隐...
2
观速讯丨新华访谈 | 水稻院士推荐：这里的...

出生在农村，从小在农村长大的谢华安院士从...
3
每日热点:供应扰动再发酵碳酸锂尾盘涨停！...

经历了一次急速回调后，碳酸锂期货又杀了一...
4
皇马欧战主场对法国球队连续14场不败，18次...

皇马欧战主场对法国球队连续14场不败，18次...
5
复盘10年走势，春节银行绝对、超额收益胜率...

复盘10年走势，春节银行绝对、超额收益胜率...
6
打通从枝头到网点“最初一公里” 智慧物流...

丰富的市场离不开发达的物流。在桂林，金黄...
7
1月20日生意社沥青基准价为3110.00元/吨

1月20日，生意社沥青基准价为3110 00元 ...
8
新 MacBook Pro 的 OLED 屏研发在本月...

新MacBookPro的OLED屏研发在本月取得了又一...
9
中金：预计太古地产(01972)去年纯利升21% ...

智通财经APP获悉，中金发布研报称，预测太...
10
焦点快报!中国版OpenRouter！七牛智能MaaS平...

中国版OpenRouter！七牛智能MaaS平台“AI大...

1
汕尾陆河铭晨贸易有限公司成立注册资本5万...

天眼查App显示，近日，汕尾陆河铭晨贸易有...
2
爱婴室为全资子公司上海力涌提供1亿元贷款担保

上海爱婴室商务服务股份有限公司于1月21日...
3
船员昏迷，各方火速响应！梧州这场水上救援...

1月19日下午，梧州市水上搜救中心高效处置...
4
蓝丰生化：股东海南闻勤拟减持不超3%股份

【蓝丰生化：股东海南闻勤拟减持不超3%股份...
5
北京首钢四大主力缺席京沪战，曾凡博伤复发...

北京首钢四大主力缺席京沪战，曾凡博伤复发...
6
当前热点筠连县修元商贸有限公司成立注册...

天眼查App显示，近日，筠连县修元商贸有限...
7
京泉华：截至1月9日最新股东户数5.41万户，...

京泉华最新披露数据显示，截至1月9日公司股...
8
彻夜坚守护通途，洪山城管全力筑牢融雪防冻...

湖北日报讯（通讯员朱仙红、谢卓维）1月19...
9
热门看点：ST京机于2026年1月20日复牌

ST京机于今日复牌，此前停牌原因为公司股票...
10
飞机也需要“洗刷刷”！雪后，首都机场共对1...

...