没有 ChatGPT Plus,你该如何使用 Code Interpreter 功能?
如果你有数据分析需求,但是不会编程(Pandas, Scikit-learn 等),也没购买 ChatGPT Plus ,那试试这个工具吧。
需求
我从 5 月份开始获得 Code Interpreter 模式的权限。深入使用后,我感觉这功能很棒,立即做了视频和教程文章讲解介绍,很受观众与读者欢迎。
从那时起,就不时有读者和观众问我,自己明明已经付费成为 ChatGPT Plus 用户,但是却没有 Code Interpreter 权限,怎么办?
于是我专门写了一篇《没有 Code Interpreter 模式权限,你该如何用 ChatGPT 分析数据?》。很多小伙伴用过后表示解了燃眉之急。
后来 Code Interpreter 对所有 Plus 用户开放,不少小伙伴儿试用后立即惊呼 —— 这东西用处太大了。
不过还有一些用户,目前因为种种原因,并没有订阅 ChatGPT Plus 。从留言来看,他们一直想知道是否还有其他方式使用 Code Interpreter 的功能。
咱们之前介绍过,现在支持在对话中上传文件的大语言模型,可不只是 GPT-4(包括 Code Interpreter 模式与 部分插件)了。 Bard 和 Claude 2 都支持上传文件。那咱们直接用其他大语言模型来做数据分析不就好了?
限制
我立即开始了尝试。
先说结论吧 —— 是至少目前,这些大语言模型还无法替代 Code Interpreter 的功能。
先看 Bard ,你会发现允许上传的文件类型有限制,只有以下这几种(JPEG, PNG 和 WebP)支持。
这三种数据类型,都是图片。这意味着尽管 Bard 支持多模态(参考这篇文章),目前却无法针对数据文件(例如 csv 与 JSON)进行分析。
下面咱们看看 Claude 2 的表现。
Claude 2 确实是支持用户上传 csv 格式的,我于是很愉快上传 iris.csv
了。
这是 Claude 2 立即对数据给出的描述。并且说明它要做一个散点图。
然后还有分析用的代码。
代码输出以后,Claude 还非常贴心做了相应的解释。
这段解释翻译过来就是:
这显示出 3 个明显的簇,对应着 3 种鸢尾花的品种。山鸢尾花有相对较短、较窄的花瓣。变色鸢尾有更长、更宽的花瓣。维吉尼亚鸢尾平均拥有最长、最宽的花瓣。基于这个可视化结果,花瓣大小似乎是区分不同鸢尾品种的一个好方法。如果您希望我以其他方式分析或可视化数据,请告诉我!
不过,这里 Claude 2 口口声声说「可视化结果」,可是…… 图在哪儿啊?
我怕错怪 Claude 2,于是明确要求它输出图形:
Claude 2 的答复,(用 ChatGPT )翻译过来是这样的:
很不幸,我无法在此聊天环境中访问 matplotlib 或直接绘制图像。但是,我可以描述一下这个图表:
散点图的 x 轴表示花瓣长度,y 轴表示花瓣宽度。每个数据点根据鸢尾花的物种着色:
红色圆点代表山鸢尾花 (Setosa)。它们在图表左侧形成一个集群,其花瓣长度约为 1-2 厘米,宽度约为 0.5 厘米。
绿色圆点代表变色鸢尾花 (Versicolor)。它们在中间形成一个集群,其花瓣长度约为 3-5 厘米,宽度约为 1-2 厘米。
蓝色圆点代表维吉尼亚鸢尾花 (Virginica)。它们在右侧形成一个集群,其花瓣长度约为 5-7 厘米,宽度约为 2-3 厘米。
这些集群相当明显分离开来,尤其是左边的山鸢尾集群。变色和维吉尼亚之间有一些重叠区域,但总体上基于可视化结果看来,花瓣大小能够很好地区分物种。
如果这有助于描述图表的关键方面,请告诉我!我很乐意提供任何其他细节。
我看了之后气乐了 —— Claude 2 啊,你说你连绘图都做不了,那你是怎么凭空想象出图像的情况呢?就算你能利用数据简单计算和分析出不同种类的花瓣长宽,那「红绿蓝」三色从哪里来的?只有一种可能,之前你见过别人对绘图的描述,把答案生生背了下来。
作为一名教师,我对这种行为不鼓励哦。
这样看来,目前直接用其他大模型处理 csv 等数据的分析与可视化,不大现实。
怎么办呢?
好在,我前几天发现了这个 Github Repo ,可以让你不订阅 Plus ,也能使用 Code Interpreter 的数据分析与可视化功能。而且比起官方的 Code Interpreter,它还有一些特色。
下面我给你详细介绍。
Keep reading with a 7-day free trial
Subscribe to Shuyi’s Newsletter to keep reading this post and get 7 days of free access to the full post archives.