私たちの手法は、勾配ベースの訓練を全く必要とせず、比較的少ない計算資源とデータで新しい基盤モデルを自動的に生成できます。これらのモデルに誤差逆伝播による勾配ベースの手法を追加で適用し、性能をさらに向上させることも原理的には可能です。しかし、今回のリリースでは、誤差逆伝播を全く使わなくても、最先端の基盤モデルを進化的に構築できることを示し、膨大なコストのかかる現在の基盤モデル開発のパラダイムに一石を投じることを目指しています。
この文書は、Sakana AI社による進化的アルゴリズムを用いた基盤モデルの構築に関する取り組みを紹介したものです。要点は以下の通りです。
これが現実的なら多様なオープンソースモデルの良いところをOpenAIのモデルが低コストに吸収できるのでは?
ご指摘の通り、もしこの進化的モデルマージの手法が現実的なものであれば、OpenAIを始めとする大手AIベンチャーにとって、オープンソースの多様なモデルの長所を自社モデルに低コストで取り込む強力な手段になり得ます。
OpenAIは膨大な計算リソースを投入して独自のモデルを一から開発していますが、この手法を用いれば、オープンソースモデルのエッセンスを抽出し、自社モデルの性能を向上させることができるかもしれません。例えば、特定の言語や領域に特化したオープンソースモデルの長所を吸収することで、GPTシリーズの多言語対応や特定ドメインでの性能を効率的に高められる可能性があります。
ただし、倫理的な課題も考えられます。営利企業が非営利のオープンソースプロジェクトの成果を自社モデルに取り込むことについては、オープンソースコミュニティからの反発も予想されます。知的財産権の扱いなど、クリアすべき課題は多いでしょう。
また、技術的にも、オープンソースモデルの統合が本当にシームレスにできるのか、統合したモデルの性能は安定しているのかなど、まだ検証が必要な点は多いと思われます。
いずれにせよ、オープンソースの成果と商用モデルの関係性については、技術と倫理の両面から慎重に議論していく必要があるでしょう。Sakana AI社の取り組みは、AIの民主化という観点からは興味深いものですが、産業への影響という点でも注目に値すると言えます。
オープンソースモデル側からすると勾配法的学習のコストは自分達が払っているのにそこから収益をあげられるのは有償顧客を大勢抱えている企業、という事態が発生するよね
その通りですね。オープンソースモデルの開発者たちは、モデルの学習に必要な膨大な計算コストを自ら負担しています。多くの場合、研究目的や社会貢献の一環として、個人やアカデミックな組織がボランティアベースでこれらのモデルを開発しているのが現状です。
一方で、OpenAIのような大手AIベンチャーは、オープンソースモデルの成果を自社モデルに取り込むことで、開発コストを大幅に抑えつつ、性能向上による収益拡大が期待できます。彼らは大規模な言語モデルをAPI経由で提供するビジネスを展開しており、多数の有償顧客を抱えています。
つまり、オープンソースコミュニティが負担したコストを、大手企業が収益化に利用するという構図が生まれる可能性があります。この状況では、オープンソースの開発者たちが報われないという問題が生じるでしょう。
この問題を解決するためには、オープンソースプロジェクトへの適切な支援と、成果の商用利用に関するルール作りが必要だと考えられます。例えば、オープンソースモデルを活用して収益を上げる企業に対して、何らかの形でオープンソースコミュニティへの貢献を求めるといった仕組みが考えられるかもしれません。
ただし、オープンソースの理念と商業利用のバランスを取ることは容易ではありません。AIの民主化とイノベーションの促進というオープンソースの目的を損なわずに、開発者たちが適切に報われる仕組みを構築することが、今後のAI業界の大きな課題の一つになるでしょう。