東大発のスタートアップ企業 “国内最大規模 国産生成AI完成”

東京大学発のスタートアップ企業が国内最大規模の国産の生成AIを開発し、完成したと発表しました。アメリカの企業が先行するなか、日本語に特化する戦略で対抗するねらいです。

発表したのは、東京大学発のスタートアップ企業「イライザ」で、12日に記者会見を開き、その概要を明らかにしました。

この生成AIは、基盤となる大規模言語モデルの学習量を示す「パラメータ数」が700億で、これまで各社が手がけた国産の生成AIとしては最大規模の処理能力となります。

オープンソースと呼ばれる公開技術をベースに、産業技術総合研究所が運営するデータセンター「ABCI」などを活用し、去年12月から短期間で開発を実現しました。

会社側によりますと、先行するアメリカの企業の生成AIと同等の日本語の処理能力があるとしています。

チャット形式の生成AIを今後、一般に公開するほか、企業や自治体など向けに順次、提供を始める予定だということです。

イライザの曽根岡侑也社長は「昨年末時点ではオープンAIやグーグルなどのグローバルモデルと比べて日本のAIモデルは及ばない状態だった。今回ようやくスタートラインに立つことができ、日本が存在感を示せるようにしたい」と話していました。

生成AI開発競争 激しさ増す背景

生成AIの開発競争が激しさを増す背景には、業務やサービスに導入する顧客企業をいかに増やすかという“囲い込み競争”があります。

開発で先行するアメリカのオープンAIと協業するマイクロソフトや、グーグルが日本の国内市場にも攻勢を強めるなか、国産の生成AIを開発する日本企業は、コストを抑えながら日本語や特定の分野に特化する戦略を進めています。

このうちNTTやNECは、今月からそれぞれ企業向けのサービスを開始します。

生成AIの基盤となる大規模言語モデルは、パラメータ数と呼ばれる数値が高いほど処理能力も高くなる一方、大規模なデータセンターが必要となり、コストも大幅に増えるという特徴があります。

パラメータ数は、オープンAIが4年前に公開した「GPTー3」が1750億で、最新モデルの「GPTー4」では1兆を超えるとみられています。

また、先週新しいモデルが投入されたグーグルの「Gemini」も同じ規模のパラメータ数とみられています。

これに対して、NTTは6億と70億、NECは130億で、顧客企業の導入や運用のコストを抑えることができるとしています。

一方、イライザが開発した生成AIは、パラメータ数が700億で、日本語に特化しながらも、処理能力の高い汎用的(はんようてき)なモデルとして大規模化に焦点をあてた戦略を打ち出した形です。

生成AIの囲い込み競争は、導入した顧客企業が自社の業務やサービスで効率化や収益化を実現できるかが求められ、そのニーズに応えることができるかも競争の行方に大きく影響しそうです。