GPT-4是一个多模态大模型,其新能力和性能上的提升备受市场关注,微软也确认最新版必应将升级使用GPT-4大模型。
图像处理是亮点,对比前代性能大提升
OpenAI公司的ChatGPT近段时间不断火出圈,资本市场也是各种热炒。如今ChatGPT热度还未散去,OpenAI又发布了更强大的GPT-4大模型,堪称“王炸”产品,ChatGPT的智能程度将更加强大。
与此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外还能够处理图像内容,一起来看看。
当地时间3月14日,OpenAI发布多模态预训练大模型GPT-4,增加了识别和理解图像的能力,同时文本处理能力提升至2.5万字,且回答准确性进一步提高,还拥有编歌曲、写剧本等更创造性的写作能力。
不过,目前GPT-4没有免费版本,仅向ChatGPTPlus的付费订阅用户及企业和开发者开放。
同时,微软也确认BingChat聊天机器人(新版必应)已升级使用OpenAI的GPT-4技术。此前,微软还宣布,已可以在基于Azure智能云平台上的OpenAI服务中使用ChatGPT。
GPT-4有多强大呢?
在官方演示中,GPT-4几乎就只花了1-2秒的时间,识别了手绘网站图片,并根据要求实时生成了网页代码制作出了几乎与手绘版一样的网站。
除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。
换句话讲,现在的人工智能,已经不仅仅停留在文字处理上了,还能处理简单的图像,这样的人工智能已经越来越接近科幻片里人们想象中的模样。
那么对比此前ChatGPT使用的GPT-3.5版本来看,新版的GPT-4性能提升了多少?
OpenAI称,在公司内部的对抗性真实性评估中,新版GPT-4的得分比ChatGPT此前使用的GPT-3.5模型高40%,相应的“不允许内容请求的倾向”降低了82%,根据规则响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。
OpenAI称,在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5,其中GPT-4的中文(普通话)能够达到80.1%的准确性。
众所周知,中文在计算机识别上比英文的难度更大,语义更加复杂,GPT-4目前对于中文的准确性已经很让人惊艳。
而在专业学术方面,新版GPT-4性能提升幅度也是巨大的。
据OpenAI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。
除了律师考试,GPT-4还在美国大学入学测试SAT中考到710分,虽然分数不高,但已经够上美国大学录取水平。更重要的是,GPT-4能在大学的基础微积分课程中获得4的成绩(5分为满分),这证明了该模型已经掌握了高等数学大部分的概念。