Alibaba Cloud が AI ベースの画像プロデューサーである Tongyi Wanxiang を起動

ジャカルタ-アリババグループのデジタルテクノロジーとインテリジェンスのバックボーンであるアリババクラウドは、2023年の世界人工知能会議で最新の人工知能(AI)ベースの画像生成モデルのトンギワンシアン(何万枚もの画像を意味するワンシアン)を発表しました。

このAIジェネレーティブモデルの最新バージョンは、限定的なベータテストのために中国の企業が利用できるようになりました。

さらに、クラウドのパイオニアは、ModelScopeのさまざまなAIモデルを活用することで、言語、ビジョン、会話に至るまでの分野で、ユーザーが複雑で特定のAI機能を完了するのに役立つように設計された多目的フレームワークであるModelScopeGPTの立ち上げを発表しました。

ModelScopeは、昨年Alibaba Cloudによって導入されたオープンソースのサービスとしてのモデル(MaaS)プラットフォームであり、900を超えるAIモデルが搭載されています。

「Tongyi Wanxiangのリリースにより、ジェネレーティブAIの高品質の画像イラストがよりアクセスしやすくなり、イノベーティブなAIアートの発展に貢献し、eコマース、ゲーム、デザイン、広告など、さまざまな分野の企業にとって創造的な表現をします」と、Alibaba Cloud IntelligenceのCTOであるZhou Jingrenは、7月8日土曜日にANTARAから引用しました。

Tongyi Wanxiangはイメージジェネレーションとして紹介されました。このAIジェネレータモデルは、中国語と英語のテキストコマンドに応答して、エアペイント、オイルペイント、絵画からアニメーション、スケッチ、フラットイラストレーション、3D漫画まで、さまざまなスタイルで詳細な画像を生成するなど、さまざまな機能を実行するのに優れていると言われています。

さらに、このモデルは、画像を同様のスタイルの新しい画像に変換し、他の画像のビジュアルスタイルを適用しながら元の画像素材を保持することにより、スタイル移行プロセスを通じて画像を配置することができます。

Alibaba Cloud の洞察管理、ビジュアル AI、自然言語処理 (NLP) の革新的なテクノロジーに支えられたこのモデルは、さまざまな言語素材を活用してトライアルを強化しています。

このモデルは有能な感覚理解機能を備えているため、より正確でコンテキストに応じた関連性の高い画像を生成します。

さらに、信号からノイズへの比率に基づいて高解像度の組み合わせプロセスを最適化することにより、このモデルは組成の精度と詳細なすっきりさのバランスをとることができますが、それでもその性能を向上させて、クリーンな背景で対照的で視覚的に見事な画像を生成します。

Tongyi Wanxiangは、画像合成の品質と創造性を維持しながら、空間レイアウトやパレットなどの画像の最終結果を制御する柔軟性を提供することにより、Alibaba Cloudに属する大規模モデルであるComposerを使用して開発されました。

さらに、Alibaba Cloud は、プラットフォームで利用可能な長距離言語モデル (LLM) のパワーを活用するように設計されたフレームワークである ModelScopeGPT も立ち上げました。

ModelScopeGPTは、LLMをコントローラーとして使用し、オープンソースのモデルスコープコミュニティの特定の分野の専門知識にモデルを接続します。

より完全なモデルアスサービスエコシステムで開発されたModelScopeGPT は、Alibaba Cloud が所有する幅広い AI 機能を最大化します。

企業や開発者は、ModelScopeGPTを無料で活用して、多言語ビデオの開発など、ユーザーのニーズに応じて複雑なAIタスクを実行するための最も適切なモデルにアクセスして実行できます。

Alibaba Cloud は 4 月に Tongyi Qianwen と呼ばれる LLM を立ち上げ、将来のユーザー エクスペリエンスの質を向上させるために、LLM と Alibaba のさまざまなビジネスと統合する予定です。

同社の顧客と開発者もこれらのモデルにアクセスして、費用対効果の高い方法で変更されたAI機能を作成できます。

このモデルの発売以来、フィンテック、エレクトロニクス、輸送、ファッション、乳製品など、さまざまな分野の企業から30万件以上の限定的なベータテストリクエストが受け取られています。

Tongyi Qianwenはまた、Alibaba CloudのインテリジェントアシスタントであるTingwuに統合されたと言われており、アシスタントはマルチメディアコンテンツを高い精度と効率で理解および分析できるようにします。360,000人以上のユーザーが、発売以来、このAIパワーアシスタントにアクセスしています。