خلال مؤتمر Google I/O 2026 كشفت Google عن واحدة من أكثر تقنيات الذكاء الاصطناعي إثارة للاهتمام، وهي Gemini Omni أو ما يعرف بين المستخدمين باسم Google Omni.
هذا النموذج الجديد لا يهدف فقط إلى إنشاء الصور أو الفيديوهات، بل يمثل خطوة كبيرة نحو بناء أنظمة ذكاء اصطناعي قادرة على إنشاء أي نوع من المحتوى انطلاقًا من أي نوع من المدخلات. (blog.google)
ولهذا السبب اعتبر الكثير من الخبراء أن Google Omni قد يكون بداية جيل جديد بالكامل من أدوات الإنتاج الإبداعي وصناعة المحتوى. (blog.google)
ويرى أحمد الشامي أن Google Omni يمثل واحدة من أهم القفزات التقنية التي شهدها مجال الذكاء الاصطناعي الإبداعي خلال السنوات الأخيرة.
ما هو Google Omni؟
Google Omni هو نموذج ذكاء اصطناعي متعدد الوسائط تم تطويره بواسطة Google DeepMind.
يعتمد على دمج قدرات Gemini في الفهم والاستدلال مع تقنيات إنشاء الفيديو والصوت والصور داخل نموذج واحد. (Google DeepMind)
بمعنى آخر:
يمكن للمستخدم إدخال:
- نص.
- صورة.
- فيديو.
- صوت.
ثم يقوم النموذج بتحويل هذه المدخلات إلى محتوى جديد بجودة عالية. (blog.google)
لماذا يعتبر Google Omni مختلفًا؟
معظم أدوات الذكاء الاصطناعي الحالية تعمل بطريقة منفصلة.
أداة للصور.
وأداة للفيديو.
وأداة للصوت.
أما Google Omni فيحاول توحيد كل هذه العمليات داخل نظام واحد قادر على فهم جميع أنواع المحتوى والتعامل معها بشكل مترابط. (Google DeepMind)
ولهذا تصفه Google بأنه نموذج “Create Anything From Any Input”. (blog.google)
كيف يعمل Google Omni؟
يعتمد النموذج على فهم السياق الكامل للمحتوى.
على سبيل المثال:
يمكنك إرسال:
- صورة لشخص.
- تسجيل صوتي.
- وصف نصي للمشهد.
ثم يدمج النظام كل هذه العناصر لإنشاء فيديو متكامل يحافظ على التفاصيل والهوية البصرية للمشهد. (Google DeepMind)
كما يمكن تعديل الفيديو لاحقًا من خلال المحادثة الطبيعية دون الحاجة إلى إعادة إنشائه بالكامل. (Google DeepMind)
أبرز مميزات Google Omni
إنشاء فيديو من أي مدخل
يمكن للنموذج إنشاء فيديوهات اعتمادًا على:
- النصوص.
- الصور.
- الفيديوهات.
- الملفات الصوتية.
تعديل الفيديو بالمحادثة
يمكن تعديل:
- الإضاءة.
- الحركة.
- الملابس.
- الخلفيات.
- أسلوب التصوير.
من خلال أوامر نصية بسيطة. (Google DeepMind)
فهم العالم الحقيقي
أحد أهم نقاط القوة في Google Omni هو اعتماده على معرفة Gemini بالعالم الحقيقي، مما يساعده على إنتاج مشاهد أكثر واقعية ومنطقية. (Google DeepMind)
الحفاظ على استمرارية المشاهد
يمكن للنموذج الحفاظ على الشخصيات والعناصر بين عدة مشاهد مختلفة بشكل أكثر احترافية مقارنة بالأدوات السابقة. (Google DeepMind)
Google Omni وGoogle Flow
أعلنت Google عن دمج Gemini Omni داخل Google Flow، المنصة المخصصة لصناعة المحتوى والفيديوهات السينمائية بالذكاء الاصطناعي. (blog.google)
وهذا يعني أن صناع المحتوى أصبح بإمكانهم:
- إنشاء المشاهد.
- تعديلها.
- تطوير القصة.
- التحكم في الإخراج البصري.
داخل بيئة عمل واحدة.
كيف يمكن للمسوقين الاستفادة من Google Omni؟
يمثل Google Omni فرصة ضخمة لوكالات التسويق وصناع المحتوى.
يمكن استخدامه في:
- الإعلانات التجارية.
- حملات السوشيال ميديا.
- فيديوهات المنتجات.
- المحتوى التعليمي.
- البراندنج.
- التجارة الإلكترونية.
ويؤكد أحمد الشامي أن أدوات مثل Google Omni ستمنح العلامات التجارية قدرة أكبر على إنتاج محتوى احترافي بسرعة وتكلفة أقل من الطرق التقليدية.
هل ينافس Google Omni أدوات مثل Veo وSora؟
نعم.
في الواقع يعتبر Gemini Omni خطوة تتجاوز مفهوم إنشاء الفيديو التقليدي.
فبينما تركز بعض الأدوات على تحويل النص إلى فيديو، يسعى Omni إلى إنشاء محتوى متعدد الوسائط يعتمد على أي نوع من المدخلات. (blog.google)
ولهذا يراه البعض بداية مرحلة جديدة من الذكاء الاصطناعي الإبداعي.
مستقبل Google Omni
تؤكد Google أن Omni هو مجرد بداية لعائلة جديدة من النماذج القادرة على إنشاء أنواع مختلفة من المحتوى من أي مدخلات ممكنة. (blog.google)
ومع استمرار التطوير، من المتوقع أن نشهد قدرات أكبر في:
- صناعة الأفلام.
- الألعاب.
- التسويق.
- التعليم.
- الواقع الافتراضي.
- التجارة الإلكترونية.
الخاتمة
يمثل Google Omni واحدة من أكثر تقنيات الذكاء الاصطناعي طموحًا حتى الآن، حيث يجمع بين الفهم العميق للعالم والقدرة على إنشاء الفيديو والصوت والصور داخل نموذج واحد. ومع دمجه داخل Google Flow ومنظومة Gemini، يبدو أن Google تسير نحو مستقبل تصبح فيه صناعة المحتوى أكثر سرعة وإبداعًا واعتمادًا على الذكاء الاصطناعي من أي وقت مضى. ويمكن متابعة المزيد من التحليلات والمقالات التقنية عبر الموقع الرسمي لـ أحمد الشامي المتخصص في التسويق الرقمي والذكاء الاصطناعي والتقنيات ا