話題のChatGPTについて
ChatGPTが話題になっています。
ChatGPTは「チャットボット」と言われる人口知能(AI)で、人間が入力した質問や要望に対し、文章を生成して答えてくれるものです。これまでのAIでは考えられなかったほど自然で的確な回答をすることが話題になり、昨年11月に発表されて以来、たった2ヶ月で1億人のユーザーを獲得したとのことです。
「AIもついにここまで来たか」という称賛の声が上がる一方で、早くも大学のレポートでコピペが使われたりして、その使用法を危惧する声も上がっているようです。

ユーザー登録をすれば誰でも使えるし、日本語もOKなので自分もさっそく試してみたところ、たしかに「これ本当にAIが作った文章?」と思うほどの答えが返ってきました。どれほどすごいのかは実際に読んでもらうのが一番ですので、ChatGPTに「日本経済の問題点は?」と尋ねたときの回答を以下に掲載しておきます。

ーーーーーーーーーーーーーーーーーーーーーーー 引用開始
日本経済の問題点には以下のようなものがあります。

人口減少:日本の人口は減少傾向にあり、これは経済成長にとって深刻な問題です。減少に伴い、消費や投資が減り、労働力不足も生じます。
高齢化:高齢化が進み、年金や医療費の増加などの社会保障費が増加しています。これによって国の財政問題が深刻化しています。
デフレーション:長期にわたるデフレーションが続いており、消費者の購買意欲を抑えています。これにより企業の投資意欲も低下し、経済成長が鈍化しています。
格差:所得格差が拡大しており、貧困層が増加しています。これによって消費が減少し、社会の安定性が損なわれる可能性があります。
労働環境:労働環境の改善が求められています。長時間労働や過剰な労働負担が問題視されており、働き方改革が進められています。
国際競争力:日本の国際競争力の低下が指摘されています。グローバル化に対応できる人材の育成や、海外展開の強化が求められています。

これらの問題を解決するためには、人口問題に対する取り組みや、経済成長の促進、社会保障費の見直しなど、多岐にわたる政策が必要です。
ーーーーーーーーーーーーーーーーーーーーーーーー 引用終わり

ほんの10秒ほどでこの答えが返ってきました。
さらに、ChatGPTとのやり取りは対話形式で行えるので、この回答に対しさらに「日本の人口減少の原因は?」とか「デフレーションを克服すための施策は?」などと質問してみると、これに対しても驚くほど的確な答えが返ってきました。

またChatGPTが対象とする分野も広大で、詩やエッセイのような文学作品も作れるし、プログラムのコードなどもきちんと書き出します。

どんな質問をしても「そつのない回答」が返ってくるので、印象としてはものすごく広い知識を持った「親切な物知り」が身近にいる感じです。
細かく見れば間違いもあるとのことなので注意が必要ですが、使いこなせばとても便利なツールになると感じました。

ではいったいどんな仕組みでChatGPTは文章を作っているのでしょうか?
実際に作られた文章を読むと相当高い「知性」が思考しているように感じてしまいますが、実はやっている事自体はけっこう単純なようです。

ChatGPTがやっていることは突き詰めて言えば「言語を実際にそれが使われているように使う」ということにすぎません。これは以前にも一度お話ししたことがありますが、哲学者ウィトゲンシュタインの「言語ゲーム論」の考えに近いものを感じます。
言葉を実際に使われているように使えば、その文章に違和感がないのは当然でしょう。
もう少し具体的に言うと膨大な言語のデータを基にして、例えばある単語の列があった場合、その次に来る確率が高い単語をリストアップして使っているのです。確率をもとに実際に使われいる可能性が高い言葉を選んでいるわけです。

ただ問題は「どうやって確率の高い単語をリストアップするのか」ということです。単語の列が与えられたとき、その都度すべてのデータを調べ上げて確率を計算すれば当然リストアップは可能ですが、それはさすがに計算量が膨大すぎ、最速のコンピューターでもとんでもない時間がかかってしまいます。
ではどうしているのかというと、ニューラルネットワークというシステムを使って言語のモデルを作り、それを使って確率の高い単語をリストアップしているようです。
ニューラルネットワークについては聞き慣れない方もおられると思うので、話の流れで必要になる範囲に絞って簡単に説明しておきます。
ニューラルネットワークというのは脳の神経細胞であるニューロンのつながりを模した数理モデルで、ニューロンが複雑につながっているように、それぞれが入出力を持つ多数のユニットが何層にもわたって繋がっているものです。右の図は3層からなる単純なニューラルネットワークのイメージです。左が入力層で、ここに入力されたデータが矢印に沿って伝わっていき右の出力層に出力されるのです。先ほどの話で言えば、ある単語の列を入力すると次に来る確率の高い単語のリストが出力されることになります。
重要なことはネットワーク中の個々の矢印は全て均等ではなく重要度によって「重み」が設定されており、その「重み」が変わると出力される結果が変わってくるということです。
そしてニューラルネットワークの最大の特徴はこの「重み」を人間がいちいち設定しなくても、与えられたデータに適合するようにネットワークが自分で変更できることです。つまりニューラルネットワークはデータから学習できるのです。
どんなデータを与えるかは人間が選択する必要がありますが、そこから先はネットワークが勝手に「学習」してどんどん「賢く」なっていくわけです。
このことの意味はものすごく大きく、近年のAIの進歩の根底にはこの「学習」ということがあると思います。

そして、それゆえにどんなデータで学習させるかも極めて重要になってきます。
偏りのあるデータで学習したAIにはとうぜん偏りが生じます。実際、以前発表されたチャットボットの一つはネット上のヘイトスピーチを学んでしまい、差別的な発言をするようなってしまいました。これは明示的な例ですが、一見したところ気づきにくい偏りにも注意が必要になると思います。それが例えば自動運転のような人命に関わるAIであれば、僅かな偏りが取り返しのつかない結果を生む可能性もあるからです。

ChatGPTではGoogleが開発したTransformerという言語モデルのためのニューラルネットワークが使われており、これには先ほど説明した「重み」が1750億個もあるそうです。
この巨大なネットワークをベースに、より自然な文章を出力するための数々の工夫が加えられたシステムに、様々な手法で学習させることでChatGPTは現在の水準にたどり着いたようです。
そして、出力されてくる文章を読む限り与えられたデータもバランスが取れているように思われます。そのままコピペすることはないにしても、文章を書く上でChatGPTの出力した文章を参考にすることは大いに有り得るのではないでしょうか。これから先、たぶん手放せないツールになっていく気がします。

ただ一方でChatGPTには「弱み」もあると思っています。
先述したようにChatGPTは言葉を「使われているように使っている」ので、びっくりしたり、ハッとするような新鮮な表現は本質的に苦手なのです。
実際に詩を書かせてみたところ、いかにもありそうな陳腐な詩しか出力されませんでした。本来、芸術的な作品とは「なるほどそういう表現もあるのか」と驚かせるようなものあり、それは感覚を持った人間にしか生み出せないのではないでしょうか。
このあたりが今後AIが一般化した後に人間に残される領域のように思います。

なお本文のChatGPTの仕組みについての説明は数理科学者のStephen Wolfram氏の解説文「What is ChatGPT doing ... and why dose it work?」を参考にさせていただきました。
お問い合わせ
資料請求
見学受付