مدل‌های تبدیل متن به تصویر - Axoomi

مقایسه مدل های هوش مصنوعی تصویر ساز

مجموعه کاملی از مدل‌های هوش مصنوعی تبدیل نوشته به عکس در این قسمت با هم قیاس شده اند و نتایج جالب این مقایسه رو براتون بصورت تصویری قرار دادیم

google nano-banana-pro
google nano-banana-pro

مدل نانو بنانا پرو به خوبی نور و محیط رو درک کرد و محصول رو به درستی بدون مشکل در صحنه جدید قرار داد. با اینکه سایز تصویر رو به ابعاد مربعی تغییر دادیم، محصول رو با سایز مناسبی در صحنه قرار داد. پرامپت: Place the first image in a design similar to the second image.

 flux-2-max
flux-2-max

مدل flux-2-max مانند نانو بنانا به خوبی تصویر رو درک کرد و با وجود قیمت مناسب تر نسبت به نانو بنانا، تصویر رو به درستی ایجاد کرد. قطراتی بر روی محصول قرار داد که نمیشه گفت اشتباهه یا درسته، از این بابت که این قطرات خواسته نشده بود شاید امتیاز کمتری بدیم. هر چند که تصویر زیبا و درستی رو ایجاد کرده. پرامپت: Place the first image in a design similar to the second image.

gpt-image-1.5
gpt-image-1.5

در این تصویر از gpt-image-1.5 ورژن medium استفاده شده. همانند مدل های قبلی به خوبی عمل کرده و شاید با یک پرامپت که تصویر کمی دورتر قرار بگیرد میتوانست نتیجه بهتری هم بدهد. نسخه low از چت جی پی تی، کمی افکت عبور نور از جسم داشت که طبیعی بودن تصویر رو کمتر میکرد. در مجموع مدل به خوبی همه چیز رو درک کرده و عملکرد مناسبی داشته است. پرامپت: Place the first image in a design similar to the second image.

google_nano-banana
google_nano-banana

نسخه قدیمی تر نانو بنانا، که عملکرد پایین تری داشت. از لحاظ زاویه تصویر و طبیعی بودن نور پردازی به ظاهر به درستی عمل نکرده و تصویر کمی از حالت واقعی خارج شده. پرامپت: Place the first image in a design similar to the second image.

qwen-2511
qwen-2511

مدل qwen همان طور که می بینید عملکرد بهتری نسبت به نسخه قبلی از خود نشان داد. ولی کمی حس استرچ به خاطر تغییر ابعاد ورودی و خروجی در تصویر حس می شود. پرامپت: Place the first image in a design similar to the second image.

prunaai
prunaai

مدل prunaai متاسفانه تصویر رفرنس رو به خوبی تشخیص نداد و خروجی قابل قبولی هم ارائه نکرد، در جایگزینی محصول خوب عمل کرد ولی تصویر رفرنس رو صرفا از نظر رنگی رعایت کرد. پرامپت: Place the first image in a design similar to the second image.

bytedance seedream-4.5
bytedance seedream-4.5

مدل bytedance seedream-4.5 نمیشه گفت بد عمل کرد، ولی خروجی کاملا غیر قابل استفاده بود چون محصول که مهمترین قسمت کار ما بود رو به درستی شناسایی نکرد و شکل اون رو تغییر داد. مسلما با پرامپت حرفه ای تر میشه به نتایج خوب رسید. پرامپت: Place the first image in a design similar to the second image.