Google تعلن اطلاق نموذج Gemini Omni لتعزيز خدمات الذكاء الإصطناعي

تاريخ النشر: 24 مايو، 2026

أعلنت Google عن إطلاق نموذج الذكاء الاصطناعي الجديد «Gemini Omni»، في خطوة تستهدف توسيع قدرات منصة Gemini من مجرد فهم وتحليل المحتوى إلى إنتاج فيديوهات متكاملة بالاعتماد على مختلف أنواع المدخلات، بما يشمل النصوص والصور والصوت والفيديو. ويمثل النموذج الجديد مرحلة متقدمة في سباق الذكاء الاصطناعي التوليدي، حيث يتيح للمستخدمين إنشاء وتعديل الفيديوهات من خلال…

شركة Google تعلن اطلاق نموذج Gemini Omni بهدف توسيع قدرات Gemini
يساعد النموذج الجديد المستخدمين في إنتاج فيديوهات متكاملة بالاعتماد على مختلف أنواع المدخلات، بما يشمل النصوص والصور والصوت والفيديو
يرتكز «Gemini Omni» على دمج قدرات Gemini المعرفية مع التوليد البصري، بحيث لا يقتصر الأمر على إنتاج مشاهد واقعية بصريًا فقط

ويمثل النموذج الجديد مرحلة متقدمة في سباق الذكاء الاصطناعي التوليدي، حيث يتيح للمستخدمين إنشاء وتعديل الفيديوهات من خلال المحادثة الطبيعية، دون الحاجة إلى أدوات مونتاج تقليدية، مع قدرة على الحفاظ على اتساق الشخصيات والمشاهد والحركة داخل الفيديو.

ويأتي «Gemini Omni» امتدادًا لتطورات Google السابقة في مجال المحتوى التوليدي، بعد نموذج «Nano Banana» المتخصص في إنشاء الصور، إلا أن الشركة توسع الآن نطاق الاستخدام ليشمل إنتاج الفيديو وتحريره عبر أوامر لغوية تفاعلية، مع دمج فهم أعمق للحركة والفيزياء والسياق الواقعي.

وتقول Google إن المستخدمين سيتمكنون من تعديل الفيديوهات تدريجيًا من خلال الحوار المباشر مع النموذج، إذ يتذكر النظام التعديلات السابقة ويعيد بناء المشاهد مع الحفاظ على التفاصيل البصرية والبيئية، ما يحول عملية إنتاج الفيديو إلى تجربة تفاعلية مستمرة.

كما يتيح النموذج تحويل الفيديوهات الأصلية إلى مشاهد جديدة بالكامل، عبر إضافة شخصيات ومؤثرات بصرية أو تغيير زوايا التصوير والحركة، بما يعزز مفهوم “الفيديو القابل لإعادة الإنتاج” بدلًا من المحتوى الثابت.

ويرتكز «Gemini Omni» على دمج قدرات Gemini المعرفية مع التوليد البصري، بحيث لا يقتصر الأمر على إنتاج مشاهد واقعية بصريًا فقط، بل يمتد لفهم عناصر مثل الجاذبية والحركة والطاقة والسياقات الثقافية والعلمية، بهدف تطوير محتوى أكثر ترابطًا ومنطقية، خاصة في المجالات التعليمية والإبداعية.

ويدعم النموذج إنشاء الفيديوهات عبر أي مزيج من المدخلات، بما يشمل النصوص والصور والمقاطع الصوتية والمرئية، إلى جانب خطط مستقبلية لدعم أنواع صوتية أكثر تطورًا.

كما كشفت Google عن ميزة «Avatars»، التي تتيح للمستخدمين إنشاء نسخ رقمية تحاكي مظهرهم وأصواتهم لإنتاج فيديوهات تعتمد على الهوية الرقمية الشخصية.

وبدأت الشركة بالفعل طرح أول إصدار من السلسلة الجديدة تحت اسم «Gemini Omni Flash» عبر تطبيق Gemini ومنصة YouTube Shorts، في وقت تتصاعد فيه المنافسة العالمية بين شركات الذكاء الاصطناعي على تطوير أدوات إنتاج الفيديو التوليدي، خاصة مع التوسع المتسارع لاستخدام هذه التقنيات في الإعلام والإعلان وصناعة المحتوى والترفيه والتعليم.

ويعكس إطلاق «Gemini Omni» تحولًا أوسع في صناعة الذكاء الاصطناعي، حيث تنتقل النماذج تدريجيًا من دور “المساعد الذكي” إلى منصات إنتاج متكاملة قادرة على إنشاء محتوى مرئي متقدم بالكامل عبر المحادثة فقط.

لقراءة المقالة باللغة الإنجليزية اضغط هنا الإنجليزية