借记得今年 3 月 OpenAI 正在公布 GPT-4 时提到的多模态功用吗?

GPT-4 回答 Demo,由机器翻译
GPT-4 撑持图片输进,能够看懂梗图、看懂物理题,借能看懂论文,一经公布便震惊了局部人,那也是 GPT-4 相较 GPT-3.5 最年夜的晋级面。
只可惜,OpenAI 表示图象输进功用如故是研讨预览阶段,借不克不及背公家公然。

新删了一个识图图标 图片去自:Reddit
但是,不日 Reddit 有网友发明,自己的 Bing Chat 账号悄悄新删了一个上传图片的进口,把图片上传上来后,Bing Chat 居然会识图回答!
插句题中话:如今 Bing Chat 里背局部微硬账户开放,快去开盲盒看看您有无支到测试资历吧
https://www.bing.com/new
此前微硬曾流露 Bing Chat 操纵的恰是 GPT-4 模型,并正在上个月的年夜更新日志中有提到会为 Bing 参与多模态撑持,综开去看,Bing Chat 很大要正正在垂垂开拓背用户开放识图功用测试。
该网友对 Bing Chat 做了大批测试,让我们一同看看「少了眼睛」的 Bing Chat 有多尖利吧。
首先是 GPT-4 最使人拍案叫绝的看梗图功用。GPT-4 不单能够大白图片里的内乱容,借能像人类一样阐发出梗图的笑面正在那边。


由机器翻译
网友给 Bing Chat 上传了一样的梗图做测试,奇怪的事情发作了:Bing Chat 并出有认出那是 VGA 接心,因而它也「get」没有到其中的笑面。

那大要是 Bing Chat 偶然的偏向,也大要是微硬正在理想使用 GPT-4 做了更多的限制调整招致回答缺点。



此处翻译有误,本文为:Diddy Kong, Pyra, Pikachu, Zero Suit Samus, Donkey Kong, Sonic the Hedgehog, Ness, Cloud Strife, and Incineroar
Bing Chat 识图的粗度有多下呢?他上传了一张《任天堂年夜治斗》游戏的角色图,统一张图上有排列着十分多的角色,请求 Bing Chat 一一认出局部的角色。
结果是,Bing Chat 正在 12 个角色中认出了 7 个,看去两次元标题问题对它来讲依旧有面易度。


识图功用的参与给 Bing Chat 增长十分多的用处,终究实践中很多内乱容(例如公式、图表)很易用翰墨表达明晰,这时候间间接一张图甩给 AI 就可以获得回答。




此前,ChatGPT 因为出色的翰墨大白战表达本事,曾经被人们开拓出了教中语、练白话的功用。

用户借能够用它做根柢的医疗诊断,节流就诊所须要的金钱战工夫,表示出 AI 普惠群众的价格。
当然,Bing Chat 当然能底子看懂实践全国的内乱容,但它的回答毕竟只能做为参考,不成以当作专业定见。
所以要完整背公家开放识图功用的话,微硬借须要做大批的限制战调试,才华确保公家没有会因为误疑 AI 的回答而呈现宁静标题问题。


是对我们最年夜的鼓舞