10月18日に開催された「市場変化に取り残されない!DX戦略と成功事例」に
当社取締役副社長の浜崎が登壇しました。
【サマリー】
- 当社のAI技術の事例紹介
- なぜ生成AIが注目を集めているのか。ChatGPTや画像生成AIが言語とビジュアルの両面で新たなコンテンツ生成を可能に
- 「情報爆発」が起きている。2000年以降の1年間で得られる情報量は、人類が歴史上それまでに蓄積した情報量の約半分に到達する
- 日本企業の多くがデジタル変革の初期段階に。ワークフローの再設計とクラウドの活用が必要
- 2020年以降の緊急事態宣言によりデジタル化が加速。しかし、これはDXの初歩であり、本格的なワークフローの再設計が求められる
- AIに代替されうる仕事と人が継続すべき仕事の区別。事例から、人間の仕事を再考する必要性が浮かび上がる
- システムかで得られるデータを活用し、人間は付加価値の高い仕事に集中すべき
以下、登壇内容です。
--
(浜崎)本日はよろしくお願いします。私たちはIT会社として、AIなどの技術で様々なお客様の支援をしております。
その中で、AIの活用や昨今よく耳にするようになったDXについて、みなさんと一緒に考える時間にできればと思っています。
当社のAI事業の歴史は、2017年に事業を開始したところから始まります。実はその頃から様々な研究開発を行っておりました。
おそらく当時はAIという技術はあまり世の中に浸透していなかったように思います。
また2012年ごろから、AWSのパートナーとして企業の支援をしてきました。
私たちは、技術の移り変わりの速さを感じていたので、何か一つの技術に特化するという形態ではなく、都度新しい技術を取り入れ、
その技術を顧客に展開し、時代の流れに合わせて、ある意味それまでの技術を手放して新たな技術に挑戦してきました。
今回はいくつかの事例を紹介していきたいと思います。
AIの事例をお話ししますと、2020年にサッカーチームと共同開発した、試合の映像をAIで解析する技術があります。
スタンドから撮影した試合の動画を上空から撮影したように画像を変換し、ポジションの位置どりを正確に把握するシステムを開発しました。
もうひとつは、衛星データを活用した事例があります。
衛星データで圃場の観測を行い、農作物の収穫時期や価格予測をします。
これに合わせてテレビで調味料の広告をタイミングよく出し、農作物や関連商品の購買を促進、
それにより、食品ロスなどの社会問題を解決できるといったプロジェクトです。
そして、最近では、AIにおける音声技術です。
主に3つありまして、一つは「ASR(Automatic Speech Recognition)」と呼ばれるものでいわゆる音声から文字起こしする技術です。
二つ目は、「VC(Voice Conversion)と呼ばれるもので、例えば今私が話している内容を別の人物の声に変換する技術です。当社では、存在しない人物の声を生成することに取り組んでいます。
三つ目は、「TTS(Text To Speech)」で、ASRとは逆に、テキストを読み上げる技術です。
では音声技術の事例をお話しします。
3名の音声を用いたもので、一人は女性の声、もう一人はネイティブな英語を話す声、3人目が私です。
この女性の声は当社の社員で、約400語の言葉を読み、それをAIが学習します。
2人目、私もそれぞれ、適切な語数を読み、AIに学習してもらいます。
<音声が流れる>
音声AIの開発ですから、当たり前ですがこれはAIが話しています。
テキストを音声に変える技術は多く展開されていますが、多くはカタコトのようになりがちです。
私たちが開発しているのは、正しいアクセントを学習させているため非常に滑らかに生成することが可能です。
日本語を英語に翻訳したものをTTSで読み上げさせ、さらにVCを加えることも可能です。
元々登場したものは、一つのテキストと3名の声を学習した音声AIのみで、こういったバリエーションをもたせることができます。
今では外国人観光客も多く来日するようになり、言語の変換は活用性が高いです。
定型的なものでなく、臨機応変に対応するために最適な技術ですよね。
対話音声をパーソナライズすることによる付加価値の創出という観点で、注力していきたいと思っています。
Transformerという革新的な技術を発表したところから出てきました。
Transformerというのは、事故注意機構(Self-attention)といって、文章中に含まれる様々な単語の関係性を理解し、
それに基づいて次の単語を予測することで、これがChatGPTの原理となっています。
人間のように考えて文章を作っているわけではなく、膨大な文章データを学習することで、その中から確からしい文章を数珠つなぎしているというわけなんですね。
今ChatGPTがどれだけの文章データを学習しているかというと、2023年3月の時点で約1兆といわれています。
そしてこれから1年間で、インターネットで取得可能な世界中のすべての文章を学習し終えるとしているそうです。
みなさんは「情報爆発」という言葉を聞いたことがありますか?初めて聞かれる方も多いかもしれません。
これについて少し説明したいと思います。
印刷技術が進歩し、書いたものをコピーできたり送付できるようになったり、あるいは電話を発明して情報の伝達ができるようになりました。
また、テレビが発明されたりもしましたよね。
そのようにして様々なデータを蓄積した期間だったんですね。
しかし2000年以降、たった1年で6.2EBのデータを蓄積しているんです。
これは、B.C.4万年前から2000年にかけて蓄積したデータの約半分の量になります。
その後もそれを凌駕するようなデータ量が、私たちの身の回りに蓄積しているんですよね。
この変化を、私たちはきちんと認識していく必要があります。
これまでは、砂漠の中からダイヤモンドを探すように情報を探索していく必要がありました。
しかしこれから私たちに求められるスキルは、宝の山のような情報の中から、いかに自分にとって有益な情報を選択していくか、ということなんです。
9割の企業がなにをするべきかというと、クラウドを活用することだとしています。
いきなりシステムを刷新するのではなく、クラウドを活用して拡張性のある基盤を整えるというのがレベル1で言われているものです。
では、レベル2にいくためになにをするのか、というと、ワークフローの再設計、つまり働き方を再設計するということです。
それをベースにして、システムの構築を行うんですね。
ハンコの文化が電子契約に切り替わり、QRコードでの決済が広まりました。
コロナの影響で奇しくも機械化が進んだわけです。
しかし、わたしはこれがレベル1からレベル2にいく話ではないと思っています。
お店を出るタイミングで決済が完了しているんですよね。
これは2017年、シアトルでスタートしました。少し実店舗は減っていますが、現時点で全米で27店舗展開しています。
しかし、DX化とは、人が行うことを前提に設計された作業の流れを、コンピューターが自動的に行うように再設計されたもので、
人は必要に応じて対応するものだと思います。
例えば、セルフレジが普及してわたしもよく利用しますが、消費者がお金を払いお店が受け取るという商習慣は変わっていないんですよね。
今の我々は、部分部分でのIT化というところにとどまっているんだと思います。
システムを導入するということの前に、仕事の仕方を変える、ワークフローを見直すことが今後重要になってくると思います。
つまり先ほどお話ししたワークフローを見直し、私たち人間がどの仕事をしていくのかを考えていくべきなんです。
このワークフローを見直すにはコンピューター前提ですが、
もう一つ大事な視点は、ビジネスにおいて人対人であるものに関しては、あえてそこをコンピューター化する必要はないと、わたしは思っています。
私はこの光景を見て、これはまずい!と思ったんですよね。
なぜなら、巫女さんたちが参拝に来た観光客に神社の案内をすることは、参拝客の体験価値を上げることにつながると思うんです。
本来、コンピューターに任せられる仕事を、人の手で行っているという実態がありました。
まさしく、人がやるべきことが何かを考える事例だと思います。
まずはワークフローを見直し、働き方を考え、人がどこに関わるかを考えることです。
その上でシステム化できるところを進めていけば、データが蓄積されます。
そのデータを活用し、より付加価値の高いことをしていく、これが重要になると思っています。