OPENAI邀请部分用户测试GPT

在 3 月份 OPENAI 发布 GPT-4 的邀请用户时候,在其博客中就提到了 Visual Inputs 视觉输入功能,部分GPT-4 模型不仅支持文本内容,测试实际上也是邀请用户支持图像识别的,只不过到现在该功能都没有公开发布。部分
目前已经有部分用户收到 OPENAI 发送的测试邀请,可以在 ChatGPT 中测试 GPT-4 with Vision (Alpha),邀请用户这个功能能实现的部分场景其实很多,识别图像中的测试物体只是最基础的应用。
在 OPENAI 自己提供的邀请用户示例中,是部分将 Sketch 转换为代码,也就是测试给定一个设计文件,GPT-4 识别设计文件并帮你编写代码,邀请用户这对前端工作者来说或许有不小的部分帮助。
还有使用场景就是测试类似于 OCR 识别了,例如对打印的 Excel 表格进行拍照,然后将其转换为电子簿,这类功能在很多应用里已经支持,现在 GPT-4 也支持类似功能了,不过不知道 GPT-4 是不是也用的 OCR 类技术。
在实际使用方面,用户可以批量输入内容,而不是单次输入一张图片去识别,例如可以将文本和图片穿插发送给 GPT-4,这样也可以识别并且可能还会有助于用户理解。
例如在很多论文中就有大量配图,GPT-4 (暂时不考虑输入上限问题) 可以识别论文内容搭配图片进行理解,可以增强思维链,帮助 GPT-4 给出更好的回答。
由此还能衍生出一个使用场景,那就是可以利用此功能来帮助视力障碍用户,可惜 GPT-4 的联网模式没了,不然视力障碍用户可以直接把链接发给 GPT-4,让 GPT-4 识别链接内容的同时,也可以解释网页里的配图。
OPENAI 称图像输入功能目前属于研究测试阶段,不公开提供,所以除非用户收到邀请,否则暂时无法使用此功能。
相关文章
- 暗黑血统3是系列最新游戏,最近国区即将上架,steam也及时公布了游戏页面及价格,标准版198元售价相对最近上线的大作来说还是非常有优势的,下面介绍及视频大家可以看看。IGN发布了《暗黑血统3》的独家2025-05-05
- 导读:在群雄逐鹿的人工智能时代,智能音箱不过是人工智能落地的其中一环,也是验证技术成熟度和战略方向判断的前沿阵地。在这场博弈中,最终能在商业化层面抓住什么才是关键,这决定着下一个十年的命数。智能音箱彻2025-05-05
- 来日诰日8月24日),游戏开辟商Smilegate为免费射击游戏《脱越前圆X》带去了据称是“最大年夜范围”的内容更新——巴比伦。本次更新为游戏新删减了两张舆图、多个新删兵器、载具及炮塔,并且晋降了婚配2025-05-05
- 【2022年08月24日】万代北梦宫文娱于本日公开,估计于2023年出售,PlayStation®5/Xbox Series X|S/STEAM®版主题乐土运营摹拟游戏《狂念乐土》的最新饱吹影片。《狂2025-05-05
《圣剑传说 Visions of Mana》现已开启免费试玩
《圣剑传说 Visions of Mana》现已开启免费试玩2024-07-31 09:39:15编辑:柒柒 官方表示:在2025-05-05- 【2022年08月25日】万代北梦宫文娱颁布收表,《乌相散》系列第一季终究章,PlayStation®5/PlayStation®4/Xbox Series X|S/Xbox One/STEAM®版《2025-05-05
最新评论