GPT-4是什么?GPT-4模型是第四代大型语言模型(LLM),Braun将LLM称为“游戏规则改变者”,它们教会机器理解自然语言,意味着人类将不再独享这项技能。
这一模型是通过GPT技术实现的。
GPT全称为GenerativePre-trainedTransformer,是一种使用人工神经网络的深度学习技术,能够使机器像人一样聊天交流并进行创作。
而说到GPT-4,就不得不提到它的姐姐GPT-3.5,由该模型开发的聊天机器人ChatGPT一经面世,便引爆AI界的竞赛,也让多年来屈居老二的微软必应获得了赶超谷歌搜索引擎的机会。
因此GPT-4将推进基于GPT-3.5的ChatGPT所使用的技术。
多模态或成最大亮点
3月9日,微软德国CTOAndreasBraun在一场名为“AIinFocus-DigitalKickoff”的活动中表示,GPT-4将在下周发布,将提供多模态模型。自3月初发布Kosmos-1以来,微软正在与OpenAI微调多模态这一事实应该不再是一个秘密。
“我们将在下周推出GPT-4,我们将有多模态模型,提供完全不同的可能性——如视频,”Braun说。这位首席技术官称大型语言模型是“游戏规则的改变者”,因为它们教机器理解自然语言,然后以统计学方式理解以前只能由人类阅读和理解的内容。同时,该技术已经发展到了基本上“适用于所有语言”的程度。“你可以用德语问一个问题,得到意大利语的回答。通过多模态,微软/OpenAI将“使模型变得全面”。
此次GPT4转向多模态,未来的输入输出将出现图像、视频等形态,或将在业内产生更具颠覆性的影响。OpenAI此前推出的DALL-E2和CLIP便是一次很好的尝试。
Braun表示,借助多模态,微软(和OpenAI)将使模型变得全面”。这意味着多模态可能成为GPT-4模型的最大亮点。
在活动上,微软AI技术专家HolgerKenn和ClemensSieber对多模态AI的相关功能进行了介绍。
根据Kenn的说法,多模态AI不仅可以将文本转化成相应的图像、音乐甚至是视频。在微软宣布前,机器学习专家EmilWallner就在推特上预估,称GPT-4可能具备这种能力。
Sieber则介绍了一些多模态AI产业化的潜在案例,例如多模态AI能够将电话呼叫的语音直接记录成文本。根据估算,该功能能为微软位于荷兰的一家大客户节省500个工作小时/天。
微软会把GPT-4集成到必应里吗?
作为OpenAI的主要投资者之一,微软已经将ChatGPT的技术集成到旗下应用产品中。
其中,ChatGPT版必应仅发布一个月,其日活用户就突破了1亿,为历史上首次。借助ChatGPT版必应,微软正以惊人的速度赶超搜索引擎一哥谷歌。
因此多数分析认为,已经尝到不少甜头的微软将继续把GPT-4集成到必应之中。