مقایسه مدل های هوش مصنوعی تصویر ساز
مجموعه کاملی از مدلهای هوش مصنوعی تبدیل نوشته به عکس در این قسمت با هم قیاس شده اند و نتایج جالب این مقایسه رو براتون بصورت تصویری قرار دادیم
recraft_v3
در این قیاس مدل های هوش مصنوعی شخصا متحیر شدم و انتظار داشتم مدل های دیگه تو این آزمون قوی تر ظاهر شن، ولی این مدل خروجی فوق العاده ای رو نشون داد. از نظر کیفیت و طبیع بودن بسیار خوب عمل کرد، هر چند مدل های هوش مصنوعی دیگه قطرات آب رو بصورت قطره روی بارونی و برگ درختان نشون دادند ولی در اینجا شاهدش نبودیم. ولی امتیاز ما از نظر واقعی بودن به این مدل هوش مصنوعی بالاتر از بقیه است.
nano-banana-pro
این نسخه از نانو بانانا خودش رو از مدل های قبلی یه سرو گردن بالا آورد. میشه گفت جز کمی بالاتر نشون دادن سن، سایر موارد مثل بافت صورت، زیبایی شناسی، قطرات آب و ... همگی بی نقص و طبیعی بودند و باعث میشه این مدل در بین مدل های صدر نشین قرار بگیره
reve
مدل هوش مصنوعی کمتر شناخته شده که به نظر خیلی خوب عمل کرد. شاید فرم ایستادن زن جالب نباشه و شونه ها به نظر کمی عقب رفته، ولی کیفیت تصویر از نظر طبیعی بودن خیلی عالی بود. نوشته رو مانند اکثر مدل های دیگه به خوبی شناخت.
prunaai
به خاطر علاقه به مدل آیدوگرام، میخواستم سومین امتیاز رو به اون بدم، ولی انصافا این مدل خوب عمل کرده و بسیار طبیعی بود و فاصله زیادی با رقیبای خودش نداره. تصویر، بافت پوست، نور و قطرات باران همگی به خوبی تصور شده اند.
flux-2-pro
نسخه جدید تر flux که خودش رو بسیار قوی تر کرده و فاصله زیادی از مدل پیشین خودش گرفته. نتیجه خیلی خوب و مناسب باعث میشه این مدل رو هم در بین مدل های خوب برای نشون دادن بافت پوست و پرتره انسان قرار بدیم. این نسخه، قیمت کمتری نسبت به نسخه قبلی خودش داره و این افزایش سرعت، کاهش قیمت و بهبود کیفیت برای این مدل بسیار خوشحال کننده هست.
ideogram_quality
مدل مورد علاقه من که میشه گفت در این آزمون شکست خورد نسبت به سه رقیب برتر. مصنوعی بودن از روی تصویر مشخص هست. هر چند جزییات صورت و موها و بافت و قطرات به خوبی نمایش داده شده. همچنان نسبت به خیلی از مدل های رقیب قوی تر ظاهر شده.
ideogram_balanced
همچنان به خوبی مدل حرفه ای تر هوش مصنوعی آیدوگرام عمل کرد. این مدل ارزون تر و سریعتر هست و در مقایسه با مدل حرفه ای تر خودش نمیشه گفت زیاد اختلاف داشته. همچنان از مدل های نسبتا خوب برای تصویر سازی رئال خصوصا چهره به شمار میره.
qwen
مدل هوش مصنوعی معروف که قبل از نانو بانانا حرف زیاد برای گفتن داشت و همچنان جزو مدل های خوب هوش مصنوعی هست. تصویر کمی از واقعی بودن فاصله گرفته ولی جزییاتی مثل قطرات باران و خود باران در حال بارش به خوبی نمایش داده شده. نوشته به خوبی تشخیص داده شده ولی شاید یکدست و بدون سایه روشن و کمی فتوشاپی به نظر میرسه.
ideogram_turbo
مدل سریع و ارزان آیدوگرام که همچنان کیفیت تصویر رو حفظ کرده و نسبتا به خوبی تصویر رو ایجاد کرده.
bytedance_pro
کمی در لکه های روی صورت زن میانسال که در پرامپت هم در اون اشاره کردیم اغراق شده وگر نه تصویر نسبتا رئال و خروجی زیبا و حرفه ای به ما داده. شاید در کشیدن قطرات باران از نظر اندازه هم کمی اغراق کرده باشد.
nano banana
خوب مدل معروف و شناخته شده نانو بانانا، هر چند در این آزمایش چندان موفق نبود و جایی بین مدل های خوب و مدل های ضعیف قرار گرفت. هر چند این مدل هوش مصنوعی و مدل جمنای در تصویر سازی برگ درختان در پس زمینه به نظر خیلی خوب عمل کردند.
google fast
مدل هوش مصنوعی گوگل فست که تصویر چهره رو به کیفیت نسبتا مناسبی ایجاد کرده و نمیتونیم اون رو جزو مدل های ضعیف بدونیم، شاید به خاطر نورپردازی یا موراد دیگر، کمی از حالت طبیعی بودن خارج باشه ولی با دقت که نگاه میکنیم جزییات مناسب هستند.
gemini-2.5
این مدل هم در رده بین خوب تا ضعیف قرار میگیره، هر چند جزییات مناسب هستند ولی شاید عالی نیستند. با نگاه دقیق تر متوجه شدم مدل های حد میانی، به پرامپت حساس تر هستند و سعی می کنند به جزییات پرامپت با دقت بیشتری برسند ( مانند لک های صورت) و شاید این تبعیت باعث خروج اون ها از طبیعی بودن میشه. در مجموع این مدل همچنان در رده خوب های این مجموعه قرار می گیره. از اینکه مثل سایر مدل ها نوشته رو بزرگ قرار نداد و در گوشه بارونی قرار داد، هوشمندانه تر از بقیه عمل کرد.
flux-pro
از این قسمت تقریبا مدل های هوش مصنوعی به وضوح ساختگی تر هستند. ولی در بین مدل هایی که ضعیف عمل کردند، بهتر از بقیه بود.
leonardo_Ultra
اگر به زیبایی شناسی نورپردازی نمره بدیم، نمره کمی میگیره، ولی چون مقیاس طبیعی بودن تصویره، نمره متوسط به پایین رو میتونیم براش منظور کنیم
google4
من این مدل رو جزو مدل های خوب هوش مصنوعی میشناختم، ولی در این آزمایش خوب عمل نکرد، تا حدودی چهره غیر طبیعی و قطرات معلق در آسمان که حس بارون رو منتقل نمیکنن. برای نوشته یه کادر ایجاد کرد که جالب بود. هر چند روی زیپ غیر منطقی.
nvidia
هر چقدر ضعیف ولی محبوب. این مدل علیرغم قیمت کمش، خیلی قابل رقابت هست. به نظر اطلاعاتش رو از جای دیگه خونده و همیشه تفاوت های اساسی تو تصویر سازی داره. هر چند به خاطر قیمت کم و سرعتش، نمیشه ازش انتظار بالا داشت ولی برای تست گزینه خوبیه.
Midjourney_7
واقعا نتیجه منو تعجب زده کرد. مدل محبوب و خلاق و قدرتمند میدجرنی نسخه 7 میشه گفت عملکرد بسیار بدی داشت. جالب اینه که من 8 تا خروجی گرفتم که این بهترین نتیجه بود. پس میشه گفت رو میدجرنی رو تصاویر واقع گرایانه بین مدل های هوش مصنوعی نمیشه حساب باز کرد.
luma
ساده و خوب ولی تقریبا حس رطوبت یا دیتیل صورت و سایر جزییات چندان رعایت نشده و نمیشه جزو مدل های هوش مصنوعی خوب برای تولید تصویر واقع گرایانه روش حساب باز کرد.
bytedance_fast
تقریبا پرامپت رو رعایت نکرده. زن نسبتا جوان هست در حالی که زن میان سال نوشته شده بود. نسبت ابعاد بدن کمی عجیب و خارج از انتظار است. به همین دلیل از نظر ما نمره کمتری بین مدل های هوش مصنوعی میشه بهش داد.
flux-schnell
این نسخه از برنامه حذف شد و نسخه جدید ترش جایگزین شد. اختلافش با نسخه پرو خودش زیاده. شاید یکم صورت زیادی صاف و نقاشی گونه هست و همین اون رو از واقعی بودن کمی دور کرده.
leonardoai_standard
نتیجه چندان قابل قبولی نبود. تصویر کمی تیره و نقاشی گونه هست. قطرات باران روی برگ ها چندان دقیق نیست و نتیجه کلی مطلوب نبود.