1%
  • 0/10

جمینای هوشمندتر شد؛ هر سوالی بپرسید Gemini Live پاسخ می‌دهد

قابلیت ویدئویی AI چقدر است؟

جمینای هوشمندتر شد؛ هر سوالی بپرسید Gemini Live پاسخ می‌دهد ۰ ۱۱ خرداد ۱۴۰۴ اخبار فناوری کپی لینک
گوگل جمینای لایو

گوگل جمینای لایو با قابلیت دسترسی به دوربین و صفحه‌نمایش، ویژگی هوشمند شگفت‌انگیزی دارد که می‌تواند دنیای اطراف شما را ببیند و در زمان واقعی به پرسش‌ها پاسخ دهد.

قابلیت جدید گوگل جمینای لایو برای اولین بار اوایل آوریل به کاربران دارای گوشی پیکسل ۹ یا گلکسی اس ۲۵ و همچنین مشترکان جمینای ادونسد عرضه شد. تنها یک هفته بعد، پیش از آنکه بسیاری از کاربران حتی فرصت کشف این ویژگی را داشته باشند، گوگل آن را برای تمام کاربران اندرویدی با دستگاه‌های سازگار منتشر کرد. این عرضه گسترده نشان‌دهنده سطح بالایی از اطمینان گوگل به محصول است و باید گفت که این اطمینان کاملا موجه است.

برخی از متخصصان حوزه هوش مصنوعی زمان زیادی را صرف بررسی محصولات هوش مصنوعی مولد کرده‌اند. در میان دیگر آزمایش‌ها، جمینای در مقایسه با ChatGPT و عملکرد آن با نسخه مشتق‌شده مایکروسافت، Copilot، مورد آزمایش قرار گرفت. در بیشتر موارد، تلاش برای یافتن کاربرد واقعی این محصولات، تجربه‌ای سرشار از ناامیدی و بیهودگی بود. اما پس از حدود یک هفته استفاده روزمره از جمینای لایو با ویدئو، عملکرد آن شگفت‌انگیز بود. این همان دستیار هوشمند پیشرفته‌ای است که از زمان معرفی سیری توسط اپل بیش از ۱۳ سال پیش، بسیاری رویای آن را داشتند.

البته این به‌معنای بی‌نقص بودن آن نیست. بسیاری از مشکلات رایج هوش مصنوعی، از جمله توهمات AI (AI hallucinations) و سندرم دروغگو (confident liar syndrome)، همچنان پابرجا هستند. بنابراین، اجازه دهید دقیقا بررسی کنیم که جمینای لایو با ویدئو در چه مواردی عملکرد خوبی دارد، در چه زمینه‌هایی ضعف نشان می‌دهد، و چرا با وجود تجربه مثبت، هنوز تردیدهایی در مورد استفاده از آن وجود دارد.

اشتراک‌گذاری دوربین جمینای لایو یک تحول انقلابی است

ابتدا به نقاط قوت این ویژگی می‌پردازیم که کم هم نیستند. پس از فعال شدن این قابلیت روی گوشی گلکسی اس ۲۵ اولترا، از آن خواستیم تا اشیاء موجود در حمام را شناسایی کند، که عملکردی نسبتا قابل قبول، البته نه بی‌نقص داشت.

هنگامی که درخواست کردیم آیکون‌های ویندوز ۱۱ را در تسک‌بار وسط‌چین کند، نتایج ترکیبی بود. جمینای ما را به بخش تنظیمات تسک‌بار هدایت کرد و مراحل وسط‌چین کردن آیکون‌ها را نشان داد، اما همچنین پیشنهاد داد که قابلیت مخفی شدن خودکار را فعال کند.

در یک کتابفروشی بارنز اند نوبل، دوربین گوگل جمینای لایو را به سمت کتاب‌هایی که به آنها علاقه‌مند بودیم گرفتیم و از آن خواستیم اطلاعاتی درباره آنها ارائه دهد. جمینای خلاصه‌های کوتاهی از کتاب‌ها به همراه نقل‌قول مستقیم نقدهای منتقدان سرشناسی از نیویورک تایمز و گاردین ارائه کرد. البته ذکر این نکته ضروری است که بعید است این منتقدان به گوگل اجازه داده باشند که از آثارشان برای آموزش هوش مصنوعی استفاده کند.

در حین بازی، دوربین را به سمت صفحه نمایش گرفتیم و از جمینای کمک خواستیم تا یک مرحله را کامل کنیم. پاسخ‌های دقیق و درستی ارائه کرد که به ما در انتخاب‌های صحیح کمک کرد. باز هم تأکید می‌کنیم که به‌نظر می‌رسید جمینای پاسخ‌های خود را از راهنمای بازی‌هایی استخراج کرده که توسط نویسندگانی معمولی تهیه شده‌اند. 

در یک آزمایش دیگر، با اشتراک‌گذاری صفحه نمایش، عکس‌های قدیمی خانوادگی از پدربزرگ و مادربزرگ را که در حال آماده شدن برای فرار از آلمان نازی بودند، به جمینای نشان دادیم. این ابزار جزئیاتی درباره مکان عکس‌ها، لباس افراد و موارد دیگر ارائه کرد. این تجربه‌ای معنادار بود که درک ما از تاریخ خانوادگی‌ را عمیق‌تر کرد.

قابلیت‌های ویدئویی جمینای هنوز نقاط ضعفی دارد

در طول آزمایش، چندین بار گوگل جمینای لایو با ویدئو نتوانست انتظارات ما را برآورده کند. اولین مشکل، افتادن در حلقه‌های تکرار بود، به‌طوری که تنها اطلاعات محدودی ارائه می‌کرد.

با‌این‌حال، با وجود کاستی‌ها، نمی‌توان از میزان تأثیرگذاری گوگل جمینای لایو با ویدئو چشم‌پوشی کرد. در‌حالی‌که اپل با مشکلات متعددی در توسعه وعده‌های هوش مصنوعی خود دست‌وپنجه نرم می‌کند، گوگل در یک روز کاری عادی، قابلیت‌های انقلابی عرضه می‌کند. البته استفاده از آن برای امور حساس مانند مشاوره حقوقی یا پزشکی توصیه نمی‌شود.

همچنین ریسک‌های حریم خصوصی وجود دارد که باید قبل از نشان دادن اطلاعات حساس به دوربین جمینای در نظر بگیرید. با‌این‌حال، برای اکثر کارهای روزمره و کم‌خطر، این قابلیت فوق‌العاده‌ای به هوشمندی گوشی‌های اندرویدی اضافه کرده است.




نظرات

دیدگاه خود را اشتراک گذارید
guest

0 دیدگاه
جدیدترین
قدیمی‌ترین بیشترین رای
Inline Feedbacks
View all comments