جمینای هوشمندتر شد؛ هر سوالی بپرسید Gemini Live پاسخ میدهد
قابلیت ویدئویی AI چقدر است؟

گوگل جمینای لایو با قابلیت دسترسی به دوربین و صفحهنمایش، ویژگی هوشمند شگفتانگیزی دارد که میتواند دنیای اطراف شما را ببیند و در زمان واقعی به پرسشها پاسخ دهد.
قابلیت جدید گوگل جمینای لایو برای اولین بار اوایل آوریل به کاربران دارای گوشی پیکسل ۹ یا گلکسی اس ۲۵ و همچنین مشترکان جمینای ادونسد عرضه شد. تنها یک هفته بعد، پیش از آنکه بسیاری از کاربران حتی فرصت کشف این ویژگی را داشته باشند، گوگل آن را برای تمام کاربران اندرویدی با دستگاههای سازگار منتشر کرد. این عرضه گسترده نشاندهنده سطح بالایی از اطمینان گوگل به محصول است و باید گفت که این اطمینان کاملا موجه است.
برخی از متخصصان حوزه هوش مصنوعی زمان زیادی را صرف بررسی محصولات هوش مصنوعی مولد کردهاند. در میان دیگر آزمایشها، جمینای در مقایسه با ChatGPT و عملکرد آن با نسخه مشتقشده مایکروسافت، Copilot، مورد آزمایش قرار گرفت. در بیشتر موارد، تلاش برای یافتن کاربرد واقعی این محصولات، تجربهای سرشار از ناامیدی و بیهودگی بود. اما پس از حدود یک هفته استفاده روزمره از جمینای لایو با ویدئو، عملکرد آن شگفتانگیز بود. این همان دستیار هوشمند پیشرفتهای است که از زمان معرفی سیری توسط اپل بیش از ۱۳ سال پیش، بسیاری رویای آن را داشتند.
البته این بهمعنای بینقص بودن آن نیست. بسیاری از مشکلات رایج هوش مصنوعی، از جمله توهمات AI (AI hallucinations) و سندرم دروغگو (confident liar syndrome)، همچنان پابرجا هستند. بنابراین، اجازه دهید دقیقا بررسی کنیم که جمینای لایو با ویدئو در چه مواردی عملکرد خوبی دارد، در چه زمینههایی ضعف نشان میدهد، و چرا با وجود تجربه مثبت، هنوز تردیدهایی در مورد استفاده از آن وجود دارد.
اشتراکگذاری دوربین جمینای لایو یک تحول انقلابی است
ابتدا به نقاط قوت این ویژگی میپردازیم که کم هم نیستند. پس از فعال شدن این قابلیت روی گوشی گلکسی اس ۲۵ اولترا، از آن خواستیم تا اشیاء موجود در حمام را شناسایی کند، که عملکردی نسبتا قابل قبول، البته نه بینقص داشت.
هنگامی که درخواست کردیم آیکونهای ویندوز ۱۱ را در تسکبار وسطچین کند، نتایج ترکیبی بود. جمینای ما را به بخش تنظیمات تسکبار هدایت کرد و مراحل وسطچین کردن آیکونها را نشان داد، اما همچنین پیشنهاد داد که قابلیت مخفی شدن خودکار را فعال کند.
در یک کتابفروشی بارنز اند نوبل، دوربین گوگل جمینای لایو را به سمت کتابهایی که به آنها علاقهمند بودیم گرفتیم و از آن خواستیم اطلاعاتی درباره آنها ارائه دهد. جمینای خلاصههای کوتاهی از کتابها به همراه نقلقول مستقیم نقدهای منتقدان سرشناسی از نیویورک تایمز و گاردین ارائه کرد. البته ذکر این نکته ضروری است که بعید است این منتقدان به گوگل اجازه داده باشند که از آثارشان برای آموزش هوش مصنوعی استفاده کند.
در حین بازی، دوربین را به سمت صفحه نمایش گرفتیم و از جمینای کمک خواستیم تا یک مرحله را کامل کنیم. پاسخهای دقیق و درستی ارائه کرد که به ما در انتخابهای صحیح کمک کرد. باز هم تأکید میکنیم که بهنظر میرسید جمینای پاسخهای خود را از راهنمای بازیهایی استخراج کرده که توسط نویسندگانی معمولی تهیه شدهاند.
در یک آزمایش دیگر، با اشتراکگذاری صفحه نمایش، عکسهای قدیمی خانوادگی از پدربزرگ و مادربزرگ را که در حال آماده شدن برای فرار از آلمان نازی بودند، به جمینای نشان دادیم. این ابزار جزئیاتی درباره مکان عکسها، لباس افراد و موارد دیگر ارائه کرد. این تجربهای معنادار بود که درک ما از تاریخ خانوادگی را عمیقتر کرد.
قابلیتهای ویدئویی جمینای هنوز نقاط ضعفی دارد
در طول آزمایش، چندین بار گوگل جمینای لایو با ویدئو نتوانست انتظارات ما را برآورده کند. اولین مشکل، افتادن در حلقههای تکرار بود، بهطوری که تنها اطلاعات محدودی ارائه میکرد.
بااینحال، با وجود کاستیها، نمیتوان از میزان تأثیرگذاری گوگل جمینای لایو با ویدئو چشمپوشی کرد. درحالیکه اپل با مشکلات متعددی در توسعه وعدههای هوش مصنوعی خود دستوپنجه نرم میکند، گوگل در یک روز کاری عادی، قابلیتهای انقلابی عرضه میکند. البته استفاده از آن برای امور حساس مانند مشاوره حقوقی یا پزشکی توصیه نمیشود.
همچنین ریسکهای حریم خصوصی وجود دارد که باید قبل از نشان دادن اطلاعات حساس به دوربین جمینای در نظر بگیرید. بااینحال، برای اکثر کارهای روزمره و کمخطر، این قابلیت فوقالعادهای به هوشمندی گوشیهای اندرویدی اضافه کرده است.
نظرات
دیدگاه خود را اشتراک گذارید