مؤتمران لشركتي OpenAI وجوجل عُقدا للكشف عن التحديثات الجديدة وخططهم لدمج الذكاء الإصطناعي في المهام اليومية للمستخدم، والشركتين لم تخيبا توقعات المشاهدين بل تجاوزتها وقدمت ما كان يعتبر خيالا علميا يوما ما، OpenAI حولت فيلم Her لواقع حقيقي في تحديثها الجديد، بينما أعلنت جوجل عن نظام ذكاء اصطناعي قادر على ايجاد خصائصك المفقودة او حتى توليد فيديوهات كاملة من الصفر. لنتعرف سويا على اهم ما جاءت به تحديثات OpenAI و جوجل هذا الأسبوع.
اخذ تحديث GPT 4o الحصة الاكبر من حدث OpenAI لما يحمله من قدرات وتحديثات مفاجئة عن ما اعتدناه من نموذج ذكاء اصطناعي مجاني، فضلا عن السرعة والذكاء العالي، GPT 4o سيدعم معالجة الصور، الفيديوهات والمستندات لمساعدتك على انجاز مهامك بسرعة.
لكن الفقرة التي فاجأت المشاهدين كانت التفاعل مع النموذج بالصوت والتكلم معه بدلا من المحادثة النصية، تم تطوير الميزة ليصبح المتكلم قادر على مقاطعة النموذج عند الكلام بدلا من الإنتظار حتى ينتهي، كما يمكنه الأن التكلم بنبرات مختلفة ليلمس المستخدم أحاسيس في صوت النموذج وتكون المحادثة أكثر واقعية وحقيقية، الحدث شهد مجموعة من التجارب والعروض لطريقة رد النموذج على أسئلة المستخدم والتفاعل معه ومع سطه الخارجي… تم طلب تأليف قصة قصيرة قبل النوم بصوت درامي وكانت النتيجة مبهرة.
يمكن للمستخدم تحديد نبرة الكلام وطريقة سرد القصة وكأن المتكلم راوي قصص حقيقي، لم ينتهي التشويق هنا، تم اختبار كذلك قدرة النموذج على التفاعل في الوقت الفعلي مع الوسط الخارجي والتحدث في نفس الوقت، كتب المتحدث معادلة على الورقة ووجهها نحو الكاميرا وطلب من النموذج مساعدته في حل المعادلة بدون اعطاء النتيجة النهائية مباشرة، في استعراض أخر فتح المتحدث الكاميرا الأمامية وطلب قراءة ووصف مزاجه فقط من تعابير الوجه،… كل هذه الإختبارات نجحت في ابراز مدى ذكاء وقابلية النموذج على التعامل وكأنه مساعد صوتي قادر على ايصال مشاعر واحاسيس مختلفة وليس صوت مبرمج جاف.
المبهر ان كل هذا سيكون متاح مجانا للمستخدمين لكن مع عدد محدود من الرسائل في اليوم، المنخرطين في اشتراك بلس المدفوع سيحصلون على خمس أضعاف المساحة المجانية… التحديث بدأ بالتوفر بالفعل مباشرة بعد المؤتمر ويمكن لأي شخص الأن استخدامه وتجربة كل الخصائص المذكورة.
اما جوجل فقد عملت أكثر على إدراج نموذجها Gemini في خدماتها الأكثر استعمالا لدى المستخدمين، ميزة Circle to search مثلا أصبحت تدعم البحث عن حلول للمعادلات الرياضية والواجبات المنزلية دون الحاجة للخروج من النافذة المطلوبة، كما أصبحت تدعم حل مسائل معقدة أكثر، وأشارت جوجل نيتها لدعم هذه الميزة لأكثر من 200 مليون جهاز قبل نهاية السنة الجارية، بدل ان تبقى محصورة فقط في هواتف جوجل بيكسل و جالكسي اس 24.
أعلنت الشركة كذلك عن Ask this video و Ask this PDF، مميزات مدمجة بخدمة Gemini لسؤال أي شيء تحتاج معرفته بخصوص فيديو او مستند قدمته، على نفس الطريقة Ask Photo تسهل عليك البحث عن اي صورة في جهازك عبر وصفها في محرك البحث، يمكنك البحث مثلا عن اسم شخص معين في المسبح، في هذه الحالة ستكون قد حددث أسماء الوجوه التي تعرف عليها التطبيق، المحرك سيعمل على بحث معمق ويقدم لك جميع الصور التي توافق ما كتبته، جوجل كذلك دمجت Gemini بمحرك بحثها ليدعم الأن ايجاد ايجابات ونتائج لأسئلة طويلة معقدة.
كما كشفت الستار عن محرك ذكي جديد يدعى Astra ينافس تحديث GPT 4o فيما يخص التفاعل مع الوسط الخارجي، حيث يمكنك فتح الكاميرا وطلب منه الإجابة عن اسئلة متعلقة بما هو محاط بك مثل مساعدتك على ايجاد أشياء مفقودة، وقدمت كذلك خدمة Veo لتوليد فيديوهات Full HD فقط من خلال الصور، النصوص والفيديوهات مع القدرة على تمديد او قص مدة الفيديو بنقرة زر… Gemini Live هي محاولة من جوجل لتحسين المحادثة مع النظام وجعلها طبيعية اكثر وواقعية.
تفاصيل أكثر في حلقة نشرة تك
في ظل هذا الصراع بين جوجل و OpenAI، ما هو المشروع الأقرب للخيال العلمي من وجهة نظرك؟