Bitget App
スマートな取引を実現
暗号資産を購入市場取引先物Bitget EarnWeb3広場もっと見る
取引
現物
暗号資産の売買
マージン
資本を増幅し、資金効率を最大化
Onchain
手間なく簡単にオンチェーン取引
交換とブロック取引
ワンクリックで手数料無料で暗号資産を交換
探索
Launchhub
チャンスを先取りし、スタートラインで優位に立つ
コピー
エリートトレーダーをワンクリックでコピー
Bots
シンプルで高速、そして信頼性の高いAI取引ボット
取引
USDT-M 先物
USDTで決済される先物
USDC-M 先物
USDCで決済される先物
Coin-M 先物
暗号資産で決済される先物
探索
先物ガイド
初心者から上級者までを対象とした先物取引のガイドブック
先物キャンペーン
豪華な報酬が待っている
商品一覧
資産を増やすための多彩な商品
シンプルEarn
好きなタイミングで入出金&リスクゼロで柔軟なリターンを獲得
On-chain Earn
元本をリスクにさらさずに、毎日利益を得る
仕組商品
市場の変動を乗り越えるための強力な金融イノベーション
VIP & ウェルスマネジメント
スマートなウェルスマネジメントのためのプレミアムサービス
借入
高い資金安全性を備えた柔軟な借入
アリババ、高度な画像・テキスト編集のための20Bオープンソースモデル「Qwen-Image-Edit」をリリース

アリババ、高度な画像・テキスト編集のための20Bオープンソースモデル「Qwen-Image-Edit」をリリース

MPOSTMPOST2025/08/20 10:00
著者:MPOST

簡単に言えば Alibaba Cloud の Qwen チームは、セマンティック編集と外観編集を正確なバイリンガルテキスト修正と組み合わせた最先端の画像編集モデルである Qwen-Image-Edit をリリースし、創造的かつ実用的なアプリケーションのための高度な機能を提供します。

アリババクラウドの クウェン チームは、20B Qwen-Imageフレームワークから派生した高度な画像編集モデルであるQwen-Image-Editを発表しました。この新システムは、Qwen-Imageの独自のテキストレンダリング機能を画像編集に適用することで拡張し、特にテキスト修正の精度に重点を置いています。Qwen-Image-Editは、視覚的な意味制御を管理するQwen2.5-VLと、視覚的な外観を制御するVAEエンコーダというXNUMXつの並列コンポーネントを介して入力画像を処理します。この二重のアプローチにより、意味レベルと外観レベルの両方の編集タスクを効果的に処理できます。このツールは、Qwen Chatの「画像編集」機能からアクセスできます。

Qwen-Image-Editは、複数の編集次元にわたって動作するように設計されています。画像の他の領域はそのままに、視覚要素の追加、削除、変更といった外観レベルの調整と、知的財産の作成、オブジェクトの回転、スタイルの転送といった意味レベルの編集の両方をサポートします。これらの編集では、より広範なピクセル変更が許可されますが、意味的な整合性は維持されます。また、中国語と英語の両方で洗練されたテキスト編集機能も提供しており、フォント、サイズ、スタイルの一貫性を維持しながら、画像内のテキストを追加、削除、調整できます。広く認知されている複数のデータセットを対象としたベンチマークテストの結果、Qwen-Image-Editは画像編集において最先端のパフォーマンスを達成しており、この分野における将来のアプリケーションの強力な基盤モデルとして位置付けられています。

🚀 Qwen-Image-Edit をご紹介できることに興奮しています!
20B Qwen-Image をベースに構築されており、スタイルを維持しながら正確なバイリンガル テキスト編集 (中国語と英語) を実現し、意味レベルと外観レベルの両方の編集をサポートします。

✨ 主な特徴
✅ バイリンガルサポートによる正確なテキスト編集
✅… pic.twitter.com/p21KUXoC50

— クウェン (@Alibaba_Qwen) 2025 年 8 月 18 日

Qwen-Image-Edit によるクリエイティブかつ実用的なアプリケーションのためのセマンティックおよび外観編集

一つ defiQwen-Image-Editの優れた点は、セマンティック編集と外観編集の両方における高度な機能です。セマンティック編集とは、画像の視覚的な意味を損なうことなく、画像の内容を変更することです。この機能を分かりやすく説明するために、開発チームは次のような例を挙げてその使用方法を示しています。 クウェン の公式マスコットであるカピバラを実例として挙げます。

観察してみると、修正後の画像の大部分のピクセルが左の元の入力画像と異なっているにもかかわらず、カピバラのキャラクター全体の一貫性は完全に維持されていることがわかります。これは、Qwen-Image-Editの強力なセマンティック編集機能を示しており、これにより、柔軟かつ多様な独自の知的財産コンテンツの開発がサポートされます。さらに、Qwen Chatでは、16のMBTI性格タイプに基づいた専用の編集プロンプトセットが作成されました。これらのプロンプトを使用することで、カピバラのマスコットをフィーチャーしたMBTIテーマの絵文字パックの完全なコレクションを作成することに成功し、キャラクターの表現と視認性を効果的に拡張しました。

さらに、斬新なビュー合成は、セマンティック編集におけるもう一つの重要なユースケースです。Qwen-Image-Editは、オブジェクトを90度回転、あるいは180度回転させることが可能で、オブジェクトの背面を直接視覚化できます。セマンティック編集のもう一つの例は、スタイル変換です。例えば、標準的な肖像画を、スタジオジブリを彷彿とさせるスタイルを含む、複数の芸術的美学へと再解釈することができます。

意味編集と並んで、外観編集は画像修正において頻繁に必要とされる機能です。このアプローチは、画像の特定の領域を全く変更せずに、指定された要素を追加、削除、または変更することに重点を置いています。看板がシーンにシームレスに組み込まれている例からもわかるように、外観編集は人物の背景調整や服装の修正など、幅広い用途に適しています。 defiQwen-Image-Edit の最大の特徴は、テキスト編集の精度です。これは、Qwen-Image のテキスト レンダリング テクノロジーに関する高度な専門知識から生まれた機能です。

0

免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。

PoolX: 資産をロックして新しいトークンをゲット
最大12%のAPR!エアドロップを継続的に獲得しましょう!
今すぐロック