ChatGPT-4 Vision 催生万亿产业

chatgpt中文网2024-07-07412

chatgpt 欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:

(做了多年视觉分析,谨以忐忑的心情写下本文)

2023年9月25日,微软发布ChatGPT-Vision的研究报告(文章末尾有下载地址),同日openai发布重要更新:听,说,看。

2023年10月3日,openai发布Dall-E3.0。距离ChatGPT获得全部人类技能,还差触觉,嗅觉和味觉。

听,说基于文本,Dall-E有Midjounery大家已经熟悉了。今天重点说下Vision,视觉。大家可能低估了这个更新带来的飓风。

vision是识别图片,将图片化为数据(1和0)。基于大模型,可以理解图片中的内容,再结合ChatGPT自身的数据集(所有互联网上的人类知识)。能完成人类做得到和做不到的事。可以输出文本,语音和修改后的图(Dall-E)。

这段时间,国外网友脑洞大开,尝试了无数场景,结合微软的报告。给大家举例,看看我是不是标题党。

1、教学

网友Peteryang 使用ChatGPT Vison给学生演示人体结构,从大脑到心脏都逐一讲解。只需要一句话提问:“我现在一年级。给我解释一下。” 

2、停车

在国外停车牌,有时候异常复杂。需要停下来看清楚,才知道自己停去哪里。同样是Peteryang,拿出手机拍照,一句话解决「请一句话告诉我:现在周三下午4点, 我能在这停车吗?」

3、饮食健康

网友Mckay Wrigley拍照,要求分析食物中的热量,蛋白,脂肪等等。再结合食谱建议,就可以管理起来自己的健康。Mckay Wrigley还要求输出Json数据,可以用来编程。

4、故事脚本分析

网友Mckay Wrigley,还让Vison分析《盗梦空间》的设计图标,ChatGPT对图表的结构和流程,有深入的理解,可以连贯的拼凑在一起。

5、图片对照

网友Andrew Morgan,用Vision做图片对比,也就是【找不同】的玩法。

6、学术研究

教授Ethon Mollick 让Vision识别手稿,识别率 很高,并且还进行了文本推理。

7、室内设计

网友Pietro Schirano拍照,要求Vision 给出设计上的建议。发现其从颜色到触感都非常出色。

8、摄影建议

还是Pietro,要求Vision对一张照片,给出建议。回复看来很专业,还给出参数建议。

9、看照片说位置

将测试照片的GPS信息去掉,让VIsion凭一张照片找出位置。



10、医疗-看X片


还有很多其他的案例。充分的展示了ChatGPT Vision的能力。我们回答上面的问题,Vision能价值万亿吗?随意展开2个例子把。

1、监控

所有装有监控的地方,都有识别的需求。传统的方式是,先训练,再识别。标注了的能识别,未标注的识别不了。现在完全不同了。人类能识别的,都能识别。还能推理。

比如,公安系统。小偷进去时候空手,出来多了个包。在人群里找出来,就是一句话的事情了。

或者一张照片找出嫌犯的位置,就可以不用麻烦水哥了。

交通系统,更具现有人流,车流预测堵车。识别安全头盔等等。做过相关项目的公司,就明白这里面带来的冲击。

2、医疗

人眼有时候,受视力和光线的影响,看不清微小的细节。同时,知识储备无法和AI相比。用vision看x片,给出所有的细节和建议。可能是未来所有医生每天都要做的事。

另外,会诊,医疗事故判定,医学科研,药物研究都是不可或缺的。

其他的比如,设计,教学,编程,导游。无法想象它到底可以颠覆多少行业。

本质上,ChatGPT Vision和这么多年来的视觉分析有本质的不同。他不需要预先标注训练。其次,他有海量的知识背景。这让他无比强大。仿佛上帝视角。

我们拭目以待把。技术背后的价值,投资人应该更加清楚,万亿是夸张,但谁也无法否定。因为不可估量。

微软测评报告下载地址:https://arxiv.org/pdf/2309.17421.pdf


本文链接:http://xiaogongchang.cn/chatgpt/947.html

ChatGPT-4 Vision

相关文章

  • gpt4可以输入图表吗

    gpt4可以输入图表吗

    深入理解 GPT-4:聊天、图表输入与交互的未来随着人工智能技术的飞速发展,自然语言处理(NLP)领域迎来了革命性的进步,GPT-4,作为OpenAI公司推出的最新大型语言模型,以其强大的文本理解和生...

  • gpt4画画兰州拉面

    gpt4画画兰州拉面

    探索GPT-4:如何利用AI技术创作兰州拉面的艺术画作在人工智能技术的飞速发展中,GPT-4作为一款先进的自然语言处理模型,不仅在文本生成方面表现出色,还能通过创造性思维将语言描述转化为视觉艺术作品,...

  • gpt4图片分析数学

    gpt4图片分析数学

    深度探索:使用GPT-4进行图片分析与数学问题的解决在这个数字化时代,人工智能(AI)已经成为我们日常生活的一部分,尤其是在处理复杂任务时,GPT-4作为最新的语言模型之一,已经以其强大的文本生成能力...

  • 宇宙最强gpt4

    宇宙最强gpt4

    在人工智能领域,自然语言处理(NLP)技术的发展日新月异,CHATGPT作为这一领域的佼佼者,其最新版本GPT-4以其卓越的性能和广泛的应用场景被誉为“宇宙最强”,本文旨在为读者提供一个全面而深入的指...

  • gpt4计划

    gpt4计划

    深入了解GPT-4计划:ChatGPT软件的进化与未来在人工智能领域,自然语言处理(NLP)技术的发展日新月异,OpenAI推出的ChatGPT系列软件以其卓越的语言理解和生成能力,成为了NLP技术的...