AIの学習源

2023.06.12 08:00

 ネット上で情報を登録する時、本人であると証明するために風景や文字の写真を見せられ、「バスが写っている写真を選べ」と問われたり、画像で表された文字や数字を入力させられたりした経験を誰もが持っていることだろう。あれは人間がAIに教えてあげている行為の場合がある。

 例えば古い書物をスキャンしてデータ化する時、どうしてもAIが読みづらく判断に迷う文字があった場合、その文字画像を混ぜているそうだ。5文字分の入力を要求された場合、4文字は目的通り本人確認に利用し、残りの1文字に判読不能文字を混ぜておいたとする。多くの人間がその1文字を入力することでAIは文字を学び、その成果として古い書物が猛スピードでデータ化される仕組みらしい。

 人間は本人確認サービスを利用するついでに「これは自転車に似ているが違うものだよ」「これはⅬではなくてIだと思う」とAIにその知識を提供しているのだ。これを「人間がAIに使われている」と言い換えれば急にSF的な怖さが生じるが、あながち間違いでない。

 このコラムを読む人の中にも名刺管理アプリを活用する人は多いだろう。とても便利なアプリであるのに無料である理由が分かるだろうか。無料提供とすることで利用者を増やし、名刺読み取りの総数を増やすための仕組みなのだろう。日本中の会社名や役職を網羅し、データベースを構築できるし、名刺のサンプル数を増やすことで読み取り精度を上げることにもつながる。

 その成果として、同じ企業がより高機能な有償サービスを販売したり、データや読み取りノウハウを他の企業に販売したり活用したりすることが可能になる。無料ユーザーはメリットを得る代わり、企業が育てているAIを教育するために自分の時間を無償提供するというギブアンドテイクが成り立っている。さまざまなサービスにおいて同様の事例はいくらでも見つかるはずだ。

 このパターンは自然な会話ができるAIチャットサービスとしていま話題のチャットGPTにも当てはまる。現在は無料サービス版と有料版ではバージョンが異なり、主に無料版を使う人からは「内容が全く事実でない」「人間にはまだまだ追い付けない」などと非難を受けることが多くあるが、その酷評こそがサービスを育てる栄養素となっている。

 チャットGPTが日本で話題になればなるほど日本語のサンプル数が増え、有償版の精度が加速度的に上がるという構図だ。「チャットGPTがこんなとんちんかんな回答をした」とおもしろがってさまざまなパターンを入力して楽しんでいる人は、ばかにした相手をせっせと進んで育てていることになる。

 人間はその良しあしや好き嫌いにかかわらず、とっくにAIを利用する代償として、AIに使役されるという相補関係を築いているのだ。それを怖がり、情報流出に過敏になってしまう人が多いことも理解できるが、そもそもスマホに打ち込んだ文字や、スマホを持って歩いた行程などの多くはAIの学習源になっているのだからもはや気にしても仕方ない状況だ。

 スマホを持たず外出しても、街中に設置されたカメラに写った私の目線や歩いた経路、使った交通機関や電子マネーもすべてAIの研究対象になり得る。「人間とロボットどっちが賢い」などと議論する段階はとっくに終わっている。AIの進化のためにしっかり奉仕することが結果的に人間の幸福につながるはずだが、ディストピアをテーマにしたSF映画のような落とし穴がないことを祈るばかりだ。

永山久徳●下電ホテルグループ代表。岡山県倉敷市出身。筑波大学大学院修了。SNSを介した業界情報の発信に注力する。日本旅館協会副会長、岡山県旅館ホテル生活衛生同業組合理事長を務める。元全国旅館ホテル生活衛生同業組合連合会青年部長。

関連キーワード

キーワード#永山久徳#新着記事