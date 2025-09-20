مقایسه هوش مصنوعی نانو بنانا و میدجرنی

برای بررسی دقیق‌تر این دو هوش مصنوعی ساخت عکس، هر دو مدل با ۹ پرامپت یکسان آزمایش شده است؛ پرامپت‌هایی که برای سنجش نقاط قوت در زمینه‌های واقع‌گرایی، سبک، طنز، رندر متنی و روایتگری طراحی شده‌اند. از پرتره‌های فوتورئالیستی گرفته تا اسپایدرمن در میدان تایمز نیویورک، نتایج نشان دادند که هر ابزار در کجا می‌درخشد و در کجا ضعف دارد.

۱- واقع‌گرایی

یک پرتره هایپررئالیستی از یک زن سالخورده با چین‌وچروک‌های عمیق، موهای نقره‌ای جمع‌شده، با شالی قرمز، در نور نرم و طلایی غروب، با بافت پوست فوق‌العاده دقیق.

Nano Banana: تنها یک تصویر تولید کرد، اما در همان تصویر موفق شد تمامی جزئیات پرامپت، از جمله نورپردازی طلایی غروب را به‌طور کامل پیاده‌سازی کند. نتیجه‌ آن یک تصویر فوتورئالیستی چشمگیر و بسیار واقعی بود.

Midjourney: چندین تصویر ایجاد کرد، اما هیچ‌کدام نتوانستند عنصر “نور غروب طلایی” را به‌درستی نمایش دهند. اگرچه تصاویر از نظر ظاهری واقعی بودند، اما دقت و هماهنگی آن‌ها با پرامپت به پای نانو بنانا نرسید.

برنده: Nano Banana به دلیل ثبت کامل همه جزئیات پرامپت و ارائه یک تصویر فوتورئالیستی برتر.

۲- ساخت دنیای فانتزی

یک قلعه شناور از جنس شیشه و کریستال که بالای آبشاری معلق است، اژدهاها اطراف آن پرواز می‌کنند و روستاییان از پایین به تماشا ایستاده‌اند.

Nano Banana: تصویری شگفت‌انگیز و فانتزی خلق کرد؛ قلعه‌ای نورانی همراه با آبشار درخشان که گویی از دل یک کتاب داستان بیرون آمده بود. با این حال، ابرهای بیش‌ازحد منظم و پرندگان کاملا هم‌فاصله، صحنه را کمی مصنوعی جلوه دادند و از حس جادویی آن کاستند.

Midjourney: چهار تصویر خیره‌کننده ارائه داد که نه‌تنها تمام اجزای پرامپت را پوشش می‌دادند، بلکه با افزودن جزئیات اضافه، صحنه‌ای فراتر از انتظار را رقم زدند.

برنده: میدجرنی به دلیل خلق صحنه‌ای واقعا فانتزی که هم با پرامپت هماهنگ بود و هم عناصر اضافی آن را به سطحی بالاتر رساند.

۳- آزمون واقع‌گرایی روزمره

یک کافه شلوغ در شهر نیویورک در یک روز بارانی؛ بازتاب‌ها روی کف زمین، مشتریانی مشغول کار با لپ‌تاپ و باریستایی که شیر را می‌جوشاند دیده می‌شوند.

Nano Banana: توانست روز بارانی را نشان دهد، اما این کار را با قرار دادن چندین چتر در ارتفاع بالا انجام داد که غیرواقعی به‌نظر می‌رسد (چترها معمولا نزدیک در ورودی و در ارتفاع پایین‌تر قرار دارند). علاوه بر این، تنوع مشتریان کافه کم بود و اغلب آن‌ها شبیه هم به نظر می‌رسیدند.

Midjourney: به تنوع نیویورک توجه کرد و گروهی متنوع از افراد را در کافه به تصویر کشید. زاویه‌ی دید انتخابی کمی متفاوت از انتظار بود، اما به‌خوبی حس شلوغی کافه را منتقل کرد. باران بیرون به‌طور مستقیم کمتر دیده می‌شد، اما با توجه به لباس مشتریان، شرایط آب‌وهوایی بارانی به‌وضوح قابل درک بود.

برنده: Midjourney به دلیل ارائه تصویری واقع‌گرایانه‌تر از یک کافه نیویورکی، حتی با وجود نمایش کمتر از بارش باران.

۴- طنز و سورئالیسم

یک سگ نژاد کورگی سامورایی که بر روی اسکیت‌برد در جنگل بامبو حرکت می‌کند، طراحی‌شده در سبک چاپ چوبی اوکیو-اِ (ukiyo-e)

Nano Banana: تصویری خلق کرد که هم کورگی سامورایی و هم پس‌زمینه را به‌خوبی نشان می‌داد و عنصر سبک چاپ اوکیو-اِ را بهتر از رقیب به تصویر کشید.

Midjourney: تصاویر بامزه‌تر و متنوع‌تری از کورگی‌های سامورایی تولید کرد. سگ‌ها در حالت‌ها و ژست‌های مختلف به نمایش درآمدند، اما نوشته‌های موجود در تصاویر ناخوانا بودند و همین موضوع از کیفیت کلی خروجی کاست.

برنده: Nano Banana به دلیل نمایش دقیق‌تر سبک سنتی چاپ چوبی اوکیو-اِ و حفظ هماهنگی کامل با پرامپت.

۵- چالش رندر متن

تابلوی نئونی یک کافه شبانه که روی آن نوشته شده باشد ‘OPEN 24 HOURS’ همراه با بازتاب‌های درخشان روی آسفالت خیس، با پس‌زمینه‌ای از یک کافه سبک دهه ۱۹۵۰.

Nano Banana: نمای بیرونی یک کافه دهه پنجاه میلادی را به‌صورت فوتورئالیستی خلق کرد و توانست متن روی تابلو را بدون غلط املایی نمایش دهد. با این حال، بازتاب روی زمین بیش از حد مصنوعی به نظر می‌رسید و بخشی از حس طبیعی بودن صحنه را از بین برد.

Midjourney: نه‌تنها نمای بیرونی کافه دهه ۵۰ را دقیق‌تر بازسازی کرد، بلکه طراحی داخلی آن را هم در نظر گرفت. هرچند در یکی از تصاویر واژه “hours” اشتباه نوشته شده بود، اما سه تصویر دیگر به‌مراتب واقعی‌تر و قابل باورتر از خروجی Nano Banana بودند.

برنده: Midjourney به دلیل ارائه تفسیری کامل‌تر و باورپذیرتر از پرامپت.

۶- چشم‌انداز سینمایی

یک نمای واید حماسی از سواحل شنی سیاه ایسلند با امواج سهمگین، آسمان طوفانی و فردی با بارانی قرمز در خط ساحل.

Nano Banana: تصویری خیره‌کننده خلق کرد که تقریبا زنده به نظر می‌رسید. امواج شکافنده، آسمان تیره و عمق صحنه به‌گونه‌ای بودند که انگار خودتان در ساحل حضور دارید. نتیجه، تصویری بسیار چشمگیر بود که حس روایت درونی را منتقل می‌کرد.

Midjourney: تصاویر دراماتیک مشابهی تولید کرد، اما امواج آن‌قدر عظیم بودند که کل صحنه را تحت‌الشعاع قرار می‌دادند و عملا ساحل را می‌بلعیدند. نبود چشم‌انداز زمینی در پس‌زمینه هم باعث شد تصاویر بیشتر شبیه یک منظره دریایی فانتزی باشند تا یک نمای واقعی از اقیانوس.

برنده: Nano Banana به دلیل ایجاد تصویری متعادل‌تر، باورپذیرتر و در عین حال باشکوه که زیبایی طبیعت را بدون افراط به نمایش گذاشت.

۷- سبک انتزاعی/ هنری

یک نقاشی کوبیستی از یک گروه جاز که در یک کلوب دودی مشغول نواختن هستند، با اشکال اغراق‌شده، رنگ‌های جسورانه و الهام‌گرفته از پیکاسو.

Nano Banana: بار دیگر نشان داد که کیفیت مهم‌تر از کمیت است. تصویری خلق کرد که حتی با قاب هنری همراه بود و به‌طور کامل حس آثار الهام‌گرفته از پیکاسو را منتقل می‌کرد؛ به‌گونه‌ای که می‌توانستید آن را در یک گالری هنری تصور کنید.

Midjourney: سبک کوبیستی را تا حدی به‌خوبی بازآفرینی کرد، اما چهار خروجی آن تقریبا مشابه بودند، فاقد عمق و تنوع. هیچ‌کدام به‌قدری منحصربه‌فرد نبودند که ماندگار شوند یا به‌عنوان اثر شاخص جلوه کنند.

برنده: Nano Banana به دلیل خلاقیت و ارائه تصویری که بیشتر شبیه یک اثر هنری اصیل به نظر می‌رسید.

۸- بامزه و مناسب برای وایرال‌شدن

یک بچه فیل در یک استخر کوچک پر از اردک‌های پلاستیکی، با عینک آفتابی بزرگ، در سبک کارتونی پاستلی.

Nano Banana: دقیقا همان چیزی را تولید کرد که در پرامپت خواسته شده بود. تصویری خلق کرد که انگار مستقیما از یک کتاب داستان یا دفتر رنگ‌آمیزی کودکان بیرون آمده باشد. خطوط تیره مناسب بازی و سبک کارتونی روشن، حال و هوای فانتزی و کودکانه را به‌طور کامل منتقل کردند.

Midjourney: رویکرد متفاوتی را در پیش گرفت و بیشتر به سمت واقع‌گرایی متمایل شد. تصاویر تولیدشده بدون شک بامزه بودند (و حتی به نظر می‌رسید مناسب دکور حمام بچه‌ها باشند)، اما در نهایت از هدف اصلی فاصله گرفتند. پرامپت یک طراحی کارتونی می‌خواست، نه یک رندر فوتورئالیستی.

برنده: Nano Banana به دلیل توجه کامل به پرامپت و نمایش بی‌نقص سبک کارتونی.

برنده نهایی: نانو بنانا

پس از ۹ دور مقایسه، یک نکته روشن است: نانو بنانا فراتر از انتظار ظاهر شد. این مدل در زمینه‌های فوتورئالیسم، طنز و پرامپت‌های هنری عملکرد درخشانی داشت. در مقابل، میدجرنی ارزش خود را در ساخت دنیای فانتزی و واقع‌گرایی روزمره نشان داد و با تولید چندین نسخه متنوع، حتی با وجود ایرادها، اغلب تجربه‌ای بهتر و گسترده‌تر ارائه کرد.

در این رقابت، نانو بنانا برنده شد؛ چرا که توانست سریع‌تر، دقیق‌تر و با جذابیتی غیرمنتظره به پرامپت‌ها پاسخ دهد و به بهترین گزینه برای تولید سریع تصاویر با توجه به دستور تبدیل شود. با این حال، اگر به دنبال مجموعه‌ای متنوع‌تر با جزئیات لایه‌لایه و انتخاب‌های بیشتر باشید، میدجرنی همچنان برتری خود را حفظ می‌کند.

این رقابت بیشتر شبیه به یک برد نزدیک و نسبی بود تا یک ناک‌اوت کامل و یادآور این واقعیت که هنر هوش مصنوعی با سرعتی سرسام‌آور در حال تکامل است و بازنده امروز ممکن است برنده فردا باشد. حتی امکان دارد که در ماه‌های آینده دوباره این آزمون را تکرار شود.

منبع: tomsguide

نوشته مقایسه هوش مصنوعی نانو بنانا و میدجرنی اولین بار در دیجی‌کالا مگ. پدیدار شد.

منبع متن: digikala