جوجل تكشف عن Gemini Omni: ثورة جديدة في صناعة الفيديو بالذكاء الاصطناعي
نموذج Gemini Omni: مستقبل إنتاج المحتوى البصري باستخدام الذكاء الاصطناعي متعدد الوسائط
كشفت شركة جوجل خلال فعاليات 2026 Google I/O عن نموذجها الجديد للذكاء الاصطناعي Gemini Omni، في خطوة تهدف إلى إعادة تعريف أدوات إنتاج الفيديو عبر تقنيات تعتمد على فهم متعدد لأنواع المدخلات، بدءًا من النصوص وحتى مقاطع الفيديو الكاملة.
ويأتي النموذج الجديد باعتباره نقلة في منظومة Gemini، مع تركيز واضح على تمكين المستخدمين من إنشاء محتوى بصري أكثر تعقيدًا ومرونة من خلال التفاعل الحواري.
Gemini Omni Flash يبدأ الانتشار على المنصات
أوضحت جوجل أن الإصدار الأول من النموذج، Gemini Omni Flash, بدأ طرحه فعليًا للمستخدمين عبر تطبيق Gemini، إضافة إلى منصة جوجل فلو، وكذلك خدمة فيديوهات يوتيوب القصيرة، ضمن خطة تدريجية لإتاحة أدوات إنتاج الفيديو المدعومة بالذكاء الاصطناعي.
ويستهدف هذا التوسع دعم صناع المحتوى عبر أدوات أكثر سهولة وذكاء في إنشاء وتعديل الفيديوهات مباشرة من داخل التطبيقات.
مزايا Gemini Omni: قدرات متعددة الوسائط تتجاوز النماذج التقليدية
يمتاز Gemini Omni بقدرته على دمج ومعالجة أنواع مختلفة من المدخلات في وقت واحد، مثل النصوص والصور والصوت ومقاطع الفيديو، ثم تحويلها إلى محتوى مرئي عالي الجودة يعتمد على فهم سياقي متقدم.
ويُعد النموذج تطويرًا لما وصفته جوجل بالنماذج السابقة مثل Veo 3.1، لكنه يتميز بمرونة أكبر في التعامل مع المحتوى وإعادة تشكيله بشكل تفاعلي.
من أبرز مزايا Gemini Omni إمكانية تعديل الفيديوهات باستخدام أوامر نصية طبيعية، حيث يمكن للمستخدم تغيير عناصر المشهد، إضافة شخصيات، أو إعادة تصميم البيئة البصرية بالكامل دون الحاجة إلى أدوات تحرير تقليدية.
كما يسمح النظام بأن يكون الفيديو نقطة بداية قابلة للتطوير المستمر، مع الحفاظ على اتساق العناصر البصرية والشخصيات خلال عمليات التعديل المتتالية.
فهم أعمق للواقع والفيزياء داخل المشاهد
تؤكد جوجل أن النموذج الجديد يتمتع بقدرة محسّنة على فهم القوانين الفيزيائية مثل الجاذبية وديناميكا السوائل والطاقة الحركية، ما ينعكس على واقعية الحركة داخل الفيديوهات المنتجة.
إضافة إلى ذلك، يدمج Gemini Omni معرفة موسعة في مجالات التاريخ والعلوم والثقافة، ما يمنحه قدرة على إنتاج محتوى بصري يحمل طابعًا تعليميًا وسرديًا في الوقت نفسه.
يوفر النموذج أيضًا إمكانيات لإنشاء شخصيات رقمية باستخدام صوت المستخدم وصورته، بما يسمح بإنتاج مقاطع فيديو يظهر فيها المستخدم بشكل افتراضي داخل المحتوى.
وفي المقابل، شددت جوجل على أنها تعتمد أنظمة حماية وسياسات صارمة للحد من الاستخدام غير الآمن، إلى جانب استخدام تقنية العلامة المائية غير المرئية SynthID لتحديد المحتوى المُنتج بالذكاء الاصطناعي.
التوفر والتحديات التقنية
بدأ طرح Gemini Omni Flash لمشتركي خطط الذكاء الاصطناعي من Google AI Plus وPro وUltra، مع وصوله تدريجيًا إلى منصات المحتوى مثل YouTube Shorts وتطبيق YouTube Create.
ورغم الإمكانات المتقدمة، لا تزال تقنيات توليد الفيديو تواجه تحديات تتعلق بالدقة البصرية وواقعية الحركة، وهي نقاط تعمل جوجل على تحسينها مع توسع الإطلاق.
ويمثل Gemini Omni خطوة استراتيجية جديدة من جوجل نحو دمج الذكاء الاصطناعي في صناعة الفيديو، مع التركيز على التفاعل الطبيعي وتحرير المحتوى عبر الأوامر النصية، في وقت تتسارع فيه المنافسة بين شركات التقنية لتطوير أدوات إنتاج فيديو أكثر ذكاءً ومرونة.