如何用ChatGPT帮你自动对excel数据进行分析和挖掘!

先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi

前面我们介绍过很多chatgpt的插件,有兴趣的同学可以翻一翻我们的历史文章。我们会员群里面也详细整理了45篇干货。今天我们来介绍一款神器,利用它可以分分钟帮你分析excel的数据,并且进行可视化的展示和数据挖掘。你只要会点鼠标即可!

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

1. 安装插件
chatgpt4 插件市场里面找到一个叫nodeable的插件,直接在插件市场安装即可。

如果是内行的同学或者玩数据分析的同学一看这个插件的介绍就知道,它其实底层的原理是用jupyter notebook利用python对数据分析处理并可视化展示,以前月薪1-2万的数据分析师就是干这个事情。

2.然后点击安装之后,需要同步你的google 账号,或者是github账号

3.然后关联好了账号之后,登入这个Noteable网站
大家很好奇,我用gpt4分析数据,为啥好登入这个网站呢?因为gpt4不能上传文件,不能上传数据集。以前有一个code interprepter 是可以上传文件的,现在已经下架了!所以现在只能用Noteable插件了!
我们这边用最最最普通的泰坦尼克的数据集来进行演示分析,我们需要把这个数据集上传到这个网站。泰坦尼克的数据集,如果是玩数据挖掘,机器学习的同学都非常熟悉,算是入门级的helloworld。
大概长这样:

下面是字段的具体含义:

  • PassengerId:用户id

  • survival:是否生还,0-否,1-是

  • pclass:舱位,1-头等舱,2-二等,3-三等

  • name:姓名

  • sex:性别

  • Age:年龄

  • sibsp:在船上的兄弟/配偶数

  • parch:在船上父母/孩子数

  • ticket:票号

  • fare:票价

  • cabin:Cabin number;客舱号

  • embarked:登船地点

一般来说我们需要探索这10来个因子的关系,挖掘出这些变量的相关性,以及对数据进行统计分析,这放在3-5年属于门槛很高的活,现在有了gpt4小白都能搞定,只要你会打字会点鼠标会问问题。

上传数据集到这个网站:

点击upload上传你的数据集,上传完毕之后就会看到你的数据了。下面图中的这个网址非常重要,因为一会在gpt4 分析全部靠它了。

4.回到gpt4 开始准备分析数据
打开你已经安装好的Noteable,然后把你的数据集的网址黏贴过了,然后开始分析。比如输入:
帮我分析一下这个数据集 https://app.noteable.io/p/3ee93768-238a-4138-xxx-daadf5e7d318/My-First-Project

然后gpt4开始进行初步的分析,它会告诉你的数据集的一个大概的情况,然后显示前5行,并告诉你数据集的一些基本统计信息,比如缺失值啊,维度啊等等。


5.开始挖掘数据
分析时间,最难的就是要挖掘数据,找到各个维度的相关性,比如两个变量,3个变量之间的关系,这个需要一定的统计学的知识,现在有了gpt4 完全可以当老板,指挥它干活。
接下来,我将创建一些图形来更好地理解数据。我将开始创建以下图表:
  • 年龄分布图
  • 性别分布图
  • 年龄与票价的关系图
  • 年龄与生存率的关系图


比如用直方图生成年龄的关系,都是分分钟的事情

然后分析年龄和票价的关系,这个是散点图

或者来点难度的,分析3个变量的关系,帮我用图表分析 幸存者和舱位,以及票价的关系

限于篇幅,我就不一一展开了,其实底层的原理,你打开这个插件就窥探的清清楚楚。

懂Python的同学一眼就看出来,这个就是用pandas库+matplot进行数据分析的,只是现在全自动的AI做了。难怪前段时间看到国外年薪50万的数据分析师被20美金的GPT4代替,真的成本相差太大太了!机器的成本是人工的千分之一,这个对老板来说诱惑太大了。

也许真的印证那句话,未来代替你的不是AI,而是懂AI工具的人,有兴趣的同学可以学起来,希望今天的分享能帮到你。我们会在会员群继续分享有用的工具!

代充值gpt4.0

本文链接:http://xiaogongchang.cn/chatgpt/758.html

相关文章