ما از ایده تا بهره برداری در کنار شما هستیم👋

آیا ویدئوی جمینای واقعی هست یا فیک؟
آیا ویدئوی جمینای واقعی هست یا فیک؟

همانطور که در مقاله قبل اشاره کردیم، جمینای محصول جدید کمپانی گوگل است که اخیرا سروصدای زیادی در دنیای دیجیتال و هوش مصنوعی برپا کرده. علاوه بر توانایی‌های خارق العاده و شگفت انگیز آن که نظر همگان را به خود جلب کرد، ویدئو ساخته شده توسط خود گوگل نیز باعث حرف و حدیث‌های زیادی درباره واقعی بودن آن شد. البته آغاز کننده این طیف از شک و تردید خود گوگل بود که زیر ویدئو منتشر شده اعلام کرد:

برای خلاصه کردن این ویدئو که عملکرد نسخه آزمایشی را نشان می‌دهد ما قسمت‌های مکث سیستم را حذف کرده و جواب‌های جمینای برای اختصار کوتاه شده است.

شاید بپرسید چرا گوگل باید چنین ابهامی درباره محصول جدید خود ایجاد کند و اعتبار خود را زیر سوال ببرد؟ جواب ساده است همین که ما در حال نوشتن یک پست در این زمینه هستیم و شما مشغول مطالعه و تحقیق در این زمینه هستید یعنی گوگل توانسته با این کار سر و صدای بیشتری ایجاد کند تا توجه مخاطبان را چه موافق و چه مخالف به سمت خود جلب کند که این یکی از روش‌های بازاریابی معکوس به شمار میرود. همانطور که میدانید این ویدئو توانسته در کمتر از یک هفته بیش از ۲ ملیون بازدید کسب کند پس گوگل به هدف خود رسیده. در این پست قصد داریم به تحلیل و بررسی واقعی یا جعلی بودن این ویدئو بپردازیم. با ما همراه باشید.

اگر هنوز نمیدونید که جمینای چیه و چه کارهایی ازش بر میاد، حتما مقاله زیر رو بخونید:

جمینای (Gemini)، بزرگ‌ترین مدل زبانی هوش مصنوعی گوگل
شبیه‌ترین هوش مصنوعی به توانایی درک انسان، رونمایی شد. برای بررسی محصول جدید گوگل با ما همراه باشید.

اگر ویدئوی جمینای را ندیده اید از باکس زیر آنرا تماشا کنید:

بعضی از ایرادات

اینجا تنها چند مورد از ایرادات وارد شده بر این ویدئو را با هم بررسی میکنیم:

سنگ کاغذ قیچی

قسمتی از مقاله گوگل
قسمتی از مقاله گوگل

بخشی که مورد تردید قرار گرفته بازی سنگ کاغذ قیچی با جمینای است. در دقیقه 2:45 ویدئو، دستی نشان داده می شود که بدون هیچ حرف و پرامپتی که در اختیار جمینای قرار دهد، یک سری حرکات را انجام می دهد. جمینای به سرعت پاسخ می‌دهد: من می‌دانم که شما چیکار می‌کنید! شما در حال بازی سنگ، کاغذ، قیچی هستید.

با کمی دقت می‌فهمیم این قسمت از ویدئو تقطیع شده و چند کات دارد، پس ممکن است که چند بار به جمینای این حرکات را نشان داده باشند و حتی به صورت پرامپت از او پرسیده باشند این چه بازی هست؟ همچنین ممکن است که جمینای این قابلیت را داشته باشد که اطلاعات موجود در ویدئو را با قدرت زیادی تحلیل کند و همین برایش کافی باشد. چراکه سازندگان بر مالتی مودال بودن آن تاکید کرده‌اند.

در مقاله قبل راجع به مالتی مودال بودن جمینای توضیح دادیم، وقت داشتین بهش سر بزنین.

خورشید، زمین و زحل

قسمتی از مقاله گوگل
قسمتی از مقاله گوگل

در قسمتی از ویدئو کاربر سه کاغذ را جلوی تصویر قرار می‌دهد و از جمینای می‌ٰپرسد که آیا این ترتیب درست است؟ و جمینای در جواب میگوید: "نه، ترتیب درست خورشید، زمین، زحل است".

مسئله‌ای که وجود دارد این است که آیا جمینای فقط با همین داده‌های محدود توانسته به جواب برسد درست فهمیده یا اینکه در تقطیع‌هایی که در ویدئو صورت گرفته سوال و جواب‌های بیشتری رد و بدل شده که از ویدئو حذف شده‌اند؟ به عنوان مثال به نظر می‌رسد چنین پرامپتی به جمینای داده شده باشد، "آیا این ترتیب درست است؟ فاصله از خورشید را در نظر بگیر و جواب بده". چرا که باید مبدا را مشخص کرده باشیم تا سیستم بتواند براساس تحلیل فاصله‌ها، ترتیب درست را تشخیص دهد و به جواب برسد ولی بدون این پرامپت بعید است که خود سیستم توانسته باشد مبدا را تشخیص دهد.

حدس زدن کشور

همین نقشه بود که به جمینای نشان داده شد.
همین نقشه بود که به جمینای نشان داده شد.

در این قسمت کاربر به جمینای می‌گوید "بر اساس آنچه که می‌بینی یک بازی بساز و از ایموجی استفاده کن"

به گفته بی بی سی نیوز در وبلاگ گوگل اعلام شده هوش مصنوعی اصلا این بازی را اختراع نکرده است.

در عوض، دستورالعمل‌های زیر به هوش مصنوعی داده شد:

"بیا با هم بازی کنیم. به یک کشور فکر کن و به من یک سرنخ بده. سرنخ باید به اندازه کافی مشخص باشد که فقط یک کشور صحیح وجود داشته باشد. من سعی میکنم به کشور روی نقشه اشاره کنم. " همه این پرامپت‌ها به صورت صوتی خوانده می‌شوند. سپس کاربر نمونه‌هایی از پاسخ صحیح و غلط را به هوش مصنوعی ارائه می‌کند. پس از این مرحله، Gemini توانست سرنخ‌هایی را تولید کند و تشخیص دهد که آیا کاربر به کشور صحیح اشاره می‌کند یا نه.

این یک کار حیرت انگیز از جمینای بود، اما این ادعا که هوش مصنوعی بازی را اختراع کرده درست نیست بلکه همه اتفاقات از قبل برای او تعریف شده.

این موارد تنها برخی از ایرادات وارده بر این ویدئو بود، برای اطلاعات بیشتر و بررسی موارد بیشتر می‌توانید بلاگ خود گوگل در این باره را بخوانید تا قضاوت بهتری داشته باشید:

How it’s Made: Interacting with Gemini through multimodal prompting
Explore the capabilities of our AI model Gemini with this hands-on guide to multimodal prompting.

نتیجه

در پایان باید بگوییم که به طور قطع نمی‌توان حکم به جعلی و فیک بودن این ویدئو داد بلکه همانطور که خود گوگل هم اشاره کرده این ویدئو نمونه ای ایده‌آل از توانایی‌های جمینای است که سازندگان قصد دارند با بهبود و تسریع عملکرد‌های آن در نسخه‌های نهایی به آن دست پیدا کنند، و بیشتر نمونه‌ای از آرزو‌های خود را به تصویر کشیده‌اند نه حقیقت محض.

در کل آن چیزی که بر اساس اخبار و گفته‌ها قطعا دستگیر ما می‌شود این است که پرامپت‌هایی که در ویدئو وجود دارد و نمایش داده می‌شوند، همه پرامپت‌هایی نیست که در اختیار جمینای قرار داده شده و به طور قطع اطلاعات بیشتری نیاز دارد تا به این نتیجه‌گیری‌ها برسد. ولی از انصاف نگذریم، همین حد از توانایی‌ها هم چشم‌گیر است گرچه که مطابق با ادعای گوگل نبوده باشد. همانطور که گفتیم حرکت زیرکانه گوگل در تبلیغات باعث شد نظر موافقان برای بهره‌مندی از این ویژگی‌ها و مخالفین برای تست آن هر چه بیشتر به جمینای جلب شود و این قدرت گوگل را نشان می‌دهد نه ضعف آن را.

اگر به دنیای‌ هوش مصنوعی علاقه‌مند هستید، بقیه مقالات ما را از دست ندهید:

وبلاگ
همه چیز درباره تکنولوژِی، دانش روز و آموزش های کاربردی را اینجا بخوانید.