نانوبنانا در ارایه تصاویر واقع گرایانه بهتر از چت جی پی تی است به گزارش رمز من، یک مقاله جدید، قابلیت تولید تصویر دو مدل هوش مصنوعی «چت جی پی تی» و «نانوبنانا» را برای ایجاد تصاویر آرشیوی با یکدیگر مقایسه کرده و برتری نانوبنانا را در عرضه تصاویر واقع گرایانه، دارای ثبات و قابلیت استفاده برای متخصصان برجسته کرده است. به گزارش رمز من به نقل از ایسنا، در حوزه هوش مصنوعی که به سرعت تکامل می یابد و فناوری های مولد تصویر، صنایع خلاق را متحول می کنند، رقابت شدیدی بین قابلیت های تولید تصویر «چت جی پی تی»(ChatGPT) شرکت «اوپن ای آی»(OpenAI) و «نانوبنانا پرو»(Nano Banana Pro) شرکت «گوگل» پدید آمده است. به گزارش وب پرو نیوز، این رقابت تنها در رابطه با تولید تصاویر زیبا نیست، بلکه در رابطه با تولید انتخابهای کاربردی و باکیفیت بالاست که متخصصان بازاریابی، طراحی و رسانه می توانند بدون نیاز به باردیگر کاری گسترده از آنها استفاده نمایند. پیشرفت های اخیر، نحوه مدیریت این پلت فرم ها را در ایجاد تصاویر آرشیوی برجسته کرده است. در این جایگاه، واقع گرایی، قابلیت استفاده و پایبندی به دستورالعمل ها برنده را تعیین می کند. این بررسی عمیق با استفاده از مقایسه های عملی و تحلیل های تخصصی بررسی می کند که چرا یک فناوری در عرضه تصاویر آرشیوی مناسب پیشی می گیرد؛ در صورتیکه دیگری با ناسازگاری هایی دست وپنجه نرم می کند که پتانسیل آنرا تضعیف می کنند. هسته اصلی این رویارویی، تفاوت های اساسی در نحوه پردازش ورودی های کاربر و عرضه خروجی ها توسط هر سیستم است. چت جی پی تی که توسط تازه ترین مدلهای اوپن ای آی پشتیبانی می شود، قدمهای بلندی را در ادغام مستقیم تولید تصویر در رابط مکالمه ای خود برداشته است و به کاربران امکان می دهد تا بوسیله زبان طبیعی، تصاویر را تکرار کنند. با این وجود، آزمایش ها نشان می دهند که باآنکه چت جی پی تی در خلاقیت عالی است، اما اغلب در تولید تصاویر آماده استفاده که آرشیوهای عکس به آن نیاز دارند، گرفتار مشکل می شود. در مقابل، نانوبنانا پرو از الگوریتم های پیشرفته برای اولویت بندی «واقع گرایی عکس وار» یا «فوتورئالیسم»(Photorealism) و حفظ جزییات بهره می گیرد و این ویژگی، آنرا به گزینه ای مناسب برای متخصصانی تبدیل میکند که به فناوری های تقلیدکننده از عکاسی سنتی نیاز دارند. ناظران صنعت خاطرنشان می کنند که سعی برای عرضه فناوری های مولد تصویر بهتر، حاصل تقاضای گسترده تر برای هوش مصنوعی است تا خلاقیت انسان را بدون جایگزینی کامل آن تقویت کند. در قلب چت جی پی تی، یک مدل ارتقاءیافته وجود دارد که زمان تولید سریع تر -تا چهار برابر سریع تر از مدلهای پیشین- و بهبود وفاداری به دستورالعمل های کاربر را نوید می دهد. برپایه اطلاعات انتشار یافته در پلت فرم های اجتماعی مانند ایکس و خبرهای اوپن ای آی از بهبودهایی با تأکید بر عناصر سازگار مانند نورپردازی و ظاهر سوژه در ویرایش ها، چت جی پی تی با هدف یکپارچه سازی گردش های کاری طراحی شده است. با این وجود، وقتی وظیفه پردازش تصاویر آماده مانند یک صحنه شلوغ اداری یا یک منظره آرام طبیعت بر عهده چت جی پی تی قرار می گیرد، اغلب مصنوعات یا خصوصیت های سبکی را نشان میدهد که به پردازش بعدی نیاز دارند. از طرف دیگر، نانوبنانا پرو برپایه چارچوب هوش مصنوعی «جمینای»(Gemini) گوگل ساخته شده و قابلیت های چندوجهی را در خود جای داده است که درک متن را با تولید بصری ترکیب می کنند. بررسی ها بر مهارت آن در انجام دادن ویرایش های پیچیده بدون ایجاد اختلال در یکپارچگی کلی تصویر تاکید دارند. این خصوصیت برای ایجاد تصاویر آرشیوی که در آنها دقت کلید اصلی محسوب می شود، بسیار باارزش است. کاربران گزارش داده اند که نانوبنانا می تواند صحنه های فوق العاده واقع گرایانه ای مانند یک محصول در پس زمینه خنثی را با حداقل خطاهای اخطار بوجود آورد. مقایسه ها در رابطه با سرعت و دسترسی هم انجام شده اند. در صورتیکه چت جی پی تی فناوری های تصویری را در رابط چت خود ادغام می کند و آنرا برای تازه کارها کاربرپسند می سازد، نانوبنانا یک ویرایشگر اختصاصی را عرضه می کند که برای حرفه ای ها مناسب می باشد. یک بررسی شامل تطبیق های سریع مستقیم نشان داد نانوبنانا در سناریوهایی که به کیفیت سینمایی نیاز دارند، مانند شخصیتی در یک محیط پویا، عملکرد بهتری دارد و این امر بر قابلیت اطمینان آن برای عرضه خروجی های حرفه ای تاکید می کند. عکاسی آرشیوی به چیزی بالاتر از زیبایی شناسی نیاز دارد. این کار مستلزم تطبیق پذیری، حساسیت فرهنگی و پایبندی به استانداردهای تجاری است. آزمایش هایی با درخواست های یکسان، نتایج شگفت انگیزی را نشان دادند. نانوبنانا بطور مداوم تصاویری را تولید می کرد که نه فقط واقع گرایانه تر بودند، بلکه از نظر بازنمایی هم متنوع تر بودند و از تعصباتی که گاهی اوقات در خروجی های چت جی پی تی رخنه می کنند، دوری می کردند. بعنوان مثال، وقتی از نانوبنانا خواسته شد تصاویری را از متخصصان مختلف در یک اتاق هیأت مدیره بوجود آورد، در نمایش حالت ها و لباس های طبیعی عالی عمل کرد و صحنه ها را باورپذیر و فراگیر ساخت. برپایه آزمایش های عملی گزارش شده در وبلاگ های مختلف فناوری، باآنکه چت جی پی تی توانمند بود، اما گاهی اوقات ناهنجاری هایی را مانند نورپردازی نامناسب یا ژست های غیرطبیعی نشان می داد. این امر، نانوبنانا را برای آژانس هایی که به خروجی سریع و بدون تعصب نیاز دارند، در اولویت قرار می دهد. علاوه بر این، گردش کار ویرایش بطور قابل توجهی متفاوت می باشد. چت جی پی تی امکان تغییرات تکراری را بوسیله گفت و گو فراهم می آورد که نوآورانه است، اما اگر مدل دستورالعمل ها را اشتباه تفسیر کند، می تواند به بروز خطا منجر شود. رابط کاربری نانوبنانا از اصلاحات دقیق پشتیبانی می کند و جزییات را در نسخه های مختلف حفظ می نماید. این توانایی برای تکرار تصاویری که در آنها ثبات بسیار مهم می باشد، یک مزیت بشمار می رود. عرصه رقابت درحال داغ شدن است و محصولات اوپن ای آی مستقیماً تسلط گوگل را به چالش می کشند. باآنکه گزارش شده که مدل جدید چت جی پی تی سریع تر است، اما سرعت به تنهایی تضمین کننده برتری در کیفیت عکس نیست. بروزرسانی های «جمینای ۳» گوگل نشان دهنده پیشرفت های گسترده تری هستند که می توانند برتری نانوبنانا را بیشتر تثبیت کنند. با گسترش فناوری های هوش مصنوعی، ملاحظات اخلاقی اهمیت پیدا می کنند. تولید تصاویر آرشیوی باید مسایل در ارتباط با حق چاپ و اصالت را درنظر بگیرد؛ یعنی حوزه هایی که هر دو پلت فرم درحال پیشبرد محافظت از آنها هستند. با این وجود، واقع گرایی برتر نانوبنانا نیاز به مداخله انسانی را می کاهد و امکان دارد آژانس های سنتی آرشیو عکس را مختل کند. پست های اوپن ای آی در پلت فرم ایکس، بهبودهایی را در پایبندی به نیت آن نشان می دهند، اما بازخورد جامعه نشان می دهند که نانوبنانا در چالش های بیش از اندازه واقع گرایانه پیروز است. ادغام این فناوری ها در اکوسیستم های گسترده تر هم اهمیت دارد. رویکرد مبتنی بر گفت و گو چت جی پی تی برای طوفان فکری مناسب است؛ در صورتیکه ویرایشگر مستقل نانوبنانا برای کاربران تخصصی جذابیت دارد. برای تصاویر آرشیوی، دقت ویرایشگر دومی برنده است. اخبار جدید حاکی از آنست که همکاری ها و بروزرسانی ها می توانند پویایی را تغییر دهند. با این وجود، تا حالا که به اواخر سال ۲۰۲۵ رسیده ایم، نانوبنانا تاج و تخت را در عرصه تولید تصاویر کاربردی در اختیار دارد. سرانجام، این رقابت به نفع کاربران است و نوآوری هایی را پیش می برد که نقش هوش مصنوعی را در زمینه های خلاقانه اصلاح می کنند. متخصصان باید هر دو را آزمایش نمایند اما هم اکنون نانوبنانا در عرضه تصاویر آماده که بطور یکپارچه با کوشش های تجاری ترکیب می شوند، پیشتاز است.این بررسی عمیق با بهره گیری از مقایسه های عملی و تحلیل های تخصصی بررسی می کند که چرا یک تکنولوژی در عرضه تصاویر آرشیوی مناسب پیشی می گیرد؛ در صورتی که دیگری با ناسازگاری هایی دست وپنجه نرم می کند که پتانسیل آن را تضعیف می کنند. این خصوصیت برای ایجاد تصاویر آرشیوی که در آنها دقت کلید اصلی شمرده می شود، بسیار باارزش است. این قابلیت برای تکرار تصاویری که در آنها ثبات بسیار مهم می باشد، یک مزیت به حساب می آید. منبع: رمز من 1404/10/07 10:11:39 5.0 / 5 5 تگهای خبر: اطلاعات , بروزرسانی , تكنولوژی , تولید اگر مطلب را پسندیدید لایک کنید (1) (0) تازه ترین مطالب مرتبط لزوم استفاده از بیسیم در مشاغل مختلف پایش سیلاب های جنوب کشور با تصاویر ماهواره ای یک کلیک تا فاجعه اخطار پلیس درباره ی زامبی های فضای مجازی چهار سناریوی آینده فناوری تا سال 2030 نظرات بینندگان در مورد این مطلب نظر شما در مورد این مطلب نام: ایمیل: نظر: سوال: = ۶ بعلاوه ۱