人工知能チップスタートアップのセレブラスシステムズがChatGPTのようなオープンソースモデルをリリース
人工知能チップのスタートアップであるCerebras Systemsは、3月28日火曜日に、研究者や企業がさらにコラボレーションを促進するために無料で使用できるChatGPTに似たオープンソースモデルをリリースすると発表しました。
シリコンバレーを拠点とするCerebrasは、アンドロメダと呼ばれる人工知能スーパーコンピューターでトレーニングされた7つのモデルをリリースし、1億1,100万パラメータの小さな言語モデルから130億パラメータのより大きなモデルまでさまざまです。
「オープンソースが人工知能で行ったことをシャットダウンする大きな動きがあります...今では大きなお金があるので、それは驚くべきことではありません」と、Cerebrasの創設者兼CEOであるアンドリューフェルドマンは述べています。「コミュニティの興奮、私たちが成し遂げた進歩は、主にそれがとてもオープンだからです。」
より多くのパラメータを持つモデルは、より複雑な生成機能を実行できます。
たとえば、昨年末にリリースされたOpenAIのChatGPTチャットボットには1,750億のパラメーターがあり、詩や研究を生み出すことができ、人工知能への大きな関心と資金をより広く引き付けるのに役立ちました。
Cerebrasによると、小型のモデルは携帯電話やスマートスピーカーに適用でき、大型のモデルはPCやサーバー上で実行できますが、要約などの複雑なタスクにはより大きなモデルが必要です。
しかし、Cambrian AIのチップコンサルタントであるカール・フロイント氏は、大きいからといって必ずしも良いとは限らないと言います。
「(より小さなモデルが)もっと訓練すれば正確になることを示す興味深い論文がいくつかあります」とフロイントは言いました。「したがって、大きくなることとより良いコーチングを受けることの間にはトレードオフがあります。」
フェルドマン氏によると、彼の最大のモデルは、人工知能トレーニング用に構築されたプレートサイズのチップを含むCerebrasシステムアーキテクチャのおかげで、トレーニングに1週間強かかり、通常は数か月かかる作業です。
現在のほとんどの人工知能モデルは、エヌビディア社(NVDA.O)、しかし、Cerebrasのようなスタートアップがますますその市場に参加しようとしています。
Cerebrasマシンでトレーニングされたモデルは、さらなるトレーニングやカスタマイズのためにNvidiaシステムで使用することもできるとFeldman氏は述べています。