ChatGPTに機械学習でECの売り上げ予測させてみた

Python

ChatGPTとは

OpenAIが提供する会話形式で対話することができる文章生成AI。
こちらの指示に従って、文学、政治、科学、コーディングについて自然に見える回答をするだけでなく、補足の質問も返すとして今世界中で話題になっている。
米国MBAの試験をパスするレベルであることは証明された。
Microsoftが約1.3兆円の出資を検討している。
Openai.com

高い精度のコード生成

コーディングの生成が得意で、文章で指示したとおりにコーディングを提案してくれる。そのためコーディングのアシスタントとして非常に優秀とのこと。

検索機能はNG

一方で不得意な分野では誤った情報を提供することも確認されている。
試しに聞いてみたところ、間違った情報をドヤ顔で教えてくれた。
嘘を嘘であると見抜ける能力がないとChatGPTを使ってはいけない。

ChatGPTのコーディングをECの売り上げデータセットを使って検証

ChatGPTを使って生成した機械学習のコードで、何かしらを予測できるのか検証してみた。
Kaggleに転がっているECサイトの商品に関するデータセットを使ってChatGPTの生成したコードを試してみる。
今回はKaggleの E-Commerce Summer Product Ratings and Sales のデータセットを使った。

データセットを読み込む

KaggleのデータをURLを渡してChatGPTに読み込ませることはできないようだ。
ChatGPTが生成した読み込みコードを修正して読み込んだ。

適宜修正して読み込んだ。

df の内容を教える

どのデータを読み込んだのをChatGPTに共有。カラムを教えると次の提案として、特長量とターゲットにデータを分けてくれる。

特長量とターゲットを学習用とテスト用に分ける

使い方が分かってきた。
回答に合わせて逐次指示を出し、コードを生成してもらう。

モデルを構築する

特にモデルを指定していなかったので、線形回帰モデルで構築したようだ。
訓練データを使って学習したモデルを評価している。

評価した結果スコアは0.78でまずまずの正答率といったところ。ほぼノーコードでこれはすごい。

更に過学習の可能性を指摘し、交差検証を提案してくれている。
交差検証が何かわからなくても「交差検証を使ってモデルを評価して」といえば、そのコードも生成してくれそうだ。

線形回帰以外のモデルの使用も提案してくれている。
次回ChatGPTをアシスタントにして、他のアルゴリズムでの精度を比較検証したいと思う。

まとめ

ChatGPTが生成するコードをコピペするだけで、ほぼ自分でコーディングすることなく機械学習によるECの売り上げ予測ができた。
うまく使うとコーディングの強力なアシスタントになりそうだ。
もう自分でコード書かなくて良いな。

最後に、今回ChatGPTのアシスタントで作成したコードがこちら。

タイトルとURLをコピーしました