ویدئوی جمینای (Gemini)، واقعیه یا…؟
عباس وزیری
همانطور که در مقاله قبل اشاره کردیم، جمینای محصول جدید کمپانی گوگل است که اخیرا سروصدای زیادی در دنیای دیجیتال و هوش مصنوعی برپا کرده. علاوه بر تواناییهای خارق العاده و شگفت انگیز آن که نظر همگان را به خود جلب کرد، ویدئو ساخته شده توسط خود گوگل نیز باعث حرف و حدیثهای زیادی درباره واقعی بودن آن شد. البته آغاز کننده این طیف از شک و تردید خود گوگل بود که زیر ویدئو منتشر شده اعلام کرد:
برای خلاصه کردن این ویدئو که عملکرد نسخه آزمایشی را نشان میدهد ما قسمتهای مکث سیستم را حذف کرده و جوابهای جمینای برای اختصار کوتاه شده است.
شاید بپرسید چرا گوگل باید چنین ابهامی درباره محصول جدید خود ایجاد کند و اعتبار خود را زیر سوال ببرد؟ جواب ساده است همین که ما در حال نوشتن یک پست در این زمینه هستیم و شما مشغول مطالعه و تحقیق در این زمینه هستید یعنی گوگل توانسته با این کار سر و صدای بیشتری ایجاد کند تا توجه مخاطبان را چه موافق و چه مخالف به سمت خود جلب کند که این یکی از روشهای بازاریابی معکوس به شمار میرود. همانطور که میدانید این ویدئو توانسته در کمتر از یک هفته بیش از ۲ ملیون بازدید کسب کند پس گوگل به هدف خود رسیده. در این پست قصد داریم به تحلیل و بررسی واقعی یا جعلی بودن این ویدئو بپردازیم. با ما همراه باشید.
اگر هنوز نمیدونید که جمینای چیه و چه کارهایی ازش بر میاد، حتما مقاله زیر رو بخونید:
اگر ویدئوی جمینای را ندیده اید از باکس زیر آنرا تماشا کنید:
بعضی از ایرادات
اینجا تنها چند مورد از ایرادات وارد شده بر این ویدئو را با هم بررسی میکنیم:
سنگ کاغذ قیچی
بخشی که مورد تردید قرار گرفته بازی سنگ کاغذ قیچی با جمینای است. در دقیقه 2:45 ویدئو، دستی نشان داده می شود که بدون هیچ حرف و پرامپتی که در اختیار جمینای قرار دهد، یک سری حرکات را انجام می دهد. جمینای به سرعت پاسخ میدهد: من میدانم که شما چیکار میکنید! شما در حال بازی سنگ، کاغذ، قیچی هستید.
با کمی دقت میفهمیم این قسمت از ویدئو تقطیع شده و چند کات دارد، پس ممکن است که چند بار به جمینای این حرکات را نشان داده باشند و حتی به صورت پرامپت از او پرسیده باشند این چه بازی هست؟ همچنین ممکن است که جمینای این قابلیت را داشته باشد که اطلاعات موجود در ویدئو را با قدرت زیادی تحلیل کند و همین برایش کافی باشد. چراکه سازندگان بر مالتی مودال بودن آن تاکید کردهاند.
در مقاله قبل راجع به مالتی مودال بودن جمینای توضیح دادیم، وقت داشتین بهش سر بزنین.
خورشید، زمین و زحل
در قسمتی از ویدئو کاربر سه کاغذ را جلوی تصویر قرار میدهد و از جمینای میٰپرسد که آیا این ترتیب درست است؟ و جمینای در جواب میگوید: "نه، ترتیب درست خورشید، زمین، زحل است".
مسئلهای که وجود دارد این است که آیا جمینای فقط با همین دادههای محدود توانسته به جواب برسد درست فهمیده یا اینکه در تقطیعهایی که در ویدئو صورت گرفته سوال و جوابهای بیشتری رد و بدل شده که از ویدئو حذف شدهاند؟ به عنوان مثال به نظر میرسد چنین پرامپتی به جمینای داده شده باشد، "آیا این ترتیب درست است؟ فاصله از خورشید را در نظر بگیر و جواب بده". چرا که باید مبدا را مشخص کرده باشیم تا سیستم بتواند براساس تحلیل فاصلهها، ترتیب درست را تشخیص دهد و به جواب برسد ولی بدون این پرامپت بعید است که خود سیستم توانسته باشد مبدا را تشخیص دهد.
حدس زدن کشور
در این قسمت کاربر به جمینای میگوید "بر اساس آنچه که میبینی یک بازی بساز و از ایموجی استفاده کن"
به گفته بی بی سی نیوز در وبلاگ گوگل اعلام شده هوش مصنوعی اصلا این بازی را اختراع نکرده است.
در عوض، دستورالعملهای زیر به هوش مصنوعی داده شد:
"بیا با هم بازی کنیم. به یک کشور فکر کن و به من یک سرنخ بده. سرنخ باید به اندازه کافی مشخص باشد که فقط یک کشور صحیح وجود داشته باشد. من سعی میکنم به کشور روی نقشه اشاره کنم. " همه این پرامپتها به صورت صوتی خوانده میشوند. سپس کاربر نمونههایی از پاسخ صحیح و غلط را به هوش مصنوعی ارائه میکند. پس از این مرحله، Gemini توانست سرنخهایی را تولید کند و تشخیص دهد که آیا کاربر به کشور صحیح اشاره میکند یا نه.
این یک کار حیرت انگیز از جمینای بود، اما این ادعا که هوش مصنوعی بازی را اختراع کرده درست نیست بلکه همه اتفاقات از قبل برای او تعریف شده.
این موارد تنها برخی از ایرادات وارده بر این ویدئو بود، برای اطلاعات بیشتر و بررسی موارد بیشتر میتوانید بلاگ خود گوگل در این باره را بخوانید تا قضاوت بهتری داشته باشید:
نتیجه
در پایان باید بگوییم که به طور قطع نمیتوان حکم به جعلی و فیک بودن این ویدئو داد بلکه همانطور که خود گوگل هم اشاره کرده این ویدئو نمونه ای ایدهآل از تواناییهای جمینای است که سازندگان قصد دارند با بهبود و تسریع عملکردهای آن در نسخههای نهایی به آن دست پیدا کنند، و بیشتر نمونهای از آرزوهای خود را به تصویر کشیدهاند نه حقیقت محض.
در کل آن چیزی که بر اساس اخبار و گفتهها قطعا دستگیر ما میشود این است که پرامپتهایی که در ویدئو وجود دارد و نمایش داده میشوند، همه پرامپتهایی نیست که در اختیار جمینای قرار داده شده و به طور قطع اطلاعات بیشتری نیاز دارد تا به این نتیجهگیریها برسد. ولی از انصاف نگذریم، همین حد از تواناییها هم چشمگیر است گرچه که مطابق با ادعای گوگل نبوده باشد. همانطور که گفتیم حرکت زیرکانه گوگل در تبلیغات باعث شد نظر موافقان برای بهرهمندی از این ویژگیها و مخالفین برای تست آن هر چه بیشتر به جمینای جلب شود و این قدرت گوگل را نشان میدهد نه ضعف آن را.
اگر به دنیای هوش مصنوعی علاقهمند هستید، بقیه مقالات ما را از دست ندهید: