حوّل الصور إلى أفلام: Midjourney تكشف عن سحر الفيديو بالذكاء الاصطناعي

أعلنت شركة Midjourney -الرائدة في توليد الصور بالذكاء الاصطناعي- عن إطلاق أول نموذج لها لإنشاء مقاطع فيديو قصيرة، وهو ما كنت أنتظره كثيرًا، نموذج Midjourney V1 يتيح تحريك الصور الثابتة وتحويلها إلى مقاطع فيديو تصل مُدّتها إلى 20 ثانية، عبر موقع المنصة الإلكتروني، مع إمكانية التوجيه الحركّي باستخدام نصوص مكتوبة.
هذا التطوُّر يُشكل بداية جديدة للشركة التي تحظى بأكثر من 20 مليون مُستخدم، ويدفعها إلى مُنافسة قوية في سوق يشهد تنافسًا شديدًا بين شركات التقنية الكبرى والناشئة. في الوقت نفسه، تواجه Midjourney تحديات قانونية كبيرة، خصوصًا بعد رفع دعاوى قضائية من قبل شركات عملاقة في مجال الترفيه مثل ديزني ويونيفرسال، تتهم فيها المنصة بانتهاك حقوق الملكية الفكرية.
Midjourney V1: خيارات حركة متنوعة
النموذج الجديد مبني مُباشرةً على تقنية توليد الصور المعروفة الخاصة بـ Midjourney، وبالتحديد الإصدار السابع منها "V7" ، حيث يُمكنك توليد صورة عبر المنصة أو رفع صورة من جهازك، ثم الضغط على زر تحريك "Animate" لتحويلها إلى فيديو.
تتوفر طريقتان رئيسيتان: إمّا الاعتماد على تحريك تلقائي، أو كتابة تعليمات نصية تُحدّد كيفية حركة العناصر داخل المشهد.
توفّر الأداة نمطين للحركة: الأول مُنخفض الحركة وهو مثالي للحركات البسيطة مثل رمشة عين أو نسيم خفيف، والثاني عالي الحركة ويُتيح حركات أكثر ديناميكية للكاميرا والعناصر، لكنه -للأسف- قد يؤدّي أحيانًا إلى تشوهات بصرية بسيطة.
كل عملية توليد تنتج 4 مقاطع فيديو مُختلفة، يمكن للمُستخدم الاختيار منها، مع إمكانية تمديد كل مقطع حتى 20 ثانية كحد أقصى.
تسعير مُنخفض مُقارنةً بالمُنافسين
تقدّم Midjourney هذه الميزة ضمن خطط الاشتراك الحالية، والتي تبدأ من 10 دولارات شهريًا، تكلفة إنشاء فيديو تعادل تقريبًا 8 أضعاف تكلفة إنشاء صورة واحدة، إلا أنّ تكلفة الثانية الواحدة من الفيديو تظل مُقاربة من تكلفة صورة واحدة، وهو ما يجعل السعر مُنافسًا بالنسبة لمُنتجي الفيديو القصير.
أيضًا، تختبر الشركة وضعًا جديدًا للمُشتركين يُتيح توليد الفيديوهات في وضع الاسترخاء "video relax mode"، أي بتكلفة أقل مُقابل وقت انتظار أطول.
بالمُقارنة مع المُنافسين، تُعد تكلفة Midjourney V1 مُنخفضة نسبيًا. على سبيل المثال، اشتراك Luma AI يبدأ من 9.99 دولارات شهريًا، بينما Runway يبدأ من 15 دولارًا.
غياب الصوت وبعض الخصائص المُتقدمّة
رغم الحماس الكبير، يفتقر Midjourney V1 إلى بعض الوظائف التي أصبحت شائعة في أدوات الفيديو بالذكاء الاصطناعي، مثل توليد الصوت أو المؤثرات الموسيقية المُدمجة، كما لا توفر المنصة حاليًا أدوات تحرير (تعديل) زمنية، مثل دمج المقاطع أو الانتقال بين المشاهد أو بناء سرد متسلسل.
في المُقابل، تقدم شركات مثل Luma Labs وRunway وجوجل نماذج أكثر تقدمًا تدعم الصوت وتمنح المستخدم تحكمًا أكبر في الشكل النهائي للمُحتوى، وتُخطط Midjourney لتوسيع قدراتها تدريجيًا، مع التركيز حاليًا على البساطة وسهولة الاستخدام.
مواجهة قانونية مع عمالقة الترفيه
قبل أيام فقط من الإطلاق، وجدّت Midjourney نفسها في قلب دعوى قضائية كبيرة رفعتها شركتا ديزني ويونيفرسال، تتهمان فيها المنصة بتوليد مُحتوى مُستوحى من شخصيات محمية بحقوق الملكية الفكرية مثل سبايدرمان وإلسا وشريك وغيرها، من دون الحصول على تراخيص.
وتشير الدعوى إلى أن المنصة استخدمت أدوات لجمع صور من الإنترنت لتدريب نماذجها، والذي يُعد انتهاكًا صريحًا للقانون بحسب المدّعين.
الدعوى تُسلّط الضوء على الخطر القانوني الذي قد يُهدّد مُستقبل المنصة، خصوصًا في ما يتعلق باستخدامها في الأعمال التجارية، حيث قد يتعرض المستخدمون أيضًا للمُساءلة القانونية في حال استخدام مُحتوى من إنتاج Midjourney يحتوي على عناصر محمية.
العالم التفاعلي هو الهدف
رغم التحديات، فإن إطلاق نموذج الفيديو Midjourney V1 ما هو إلا خطوة أولى نحو مشروع أوسع تسعى الشركة من خلاله لبناء "World Model"، وهو نظام يُمكّن المستخدم من التنقل داخل بيئة افتراضية يولّدها الذكاء الاصطناعي في الزمن الحقيقي.
في هذا النموذج، سيتمكّن المُستخدم من طلب إنشاء مشاهد ديناميكية مثل "السير في سوق مغربي عند الغروب"، والتفاعل مع عناصر المشهد كما لو كان داخل لعبة ثلاثية الأبعاد 3D.
تسير شركات أخرى في نفس الاتجاه، مثل Odyssey التي تطوّر نظامًا للفيديو التفاعلي مع قدرات كاميرا 3D، وRunway التي أدخلت خصائص تحكم بالكاميرا لمُحاكاة الواقع داخل الفيديوهات.
تُعد هذه النماذج المتقدمة من بين أكثر تقنيات الذكاء الاصطناعي تطورًا، حيث لا تقتصر على توليد الصورة، بل تتنبأ أيضًا بكيفية تفاعل العناصر داخل المشهد، ما يُقرّب الذكاء الاصطناعي من مُحاكاة الواقع.
قفزة جريئة في طريق طويل ومُعقّد
إطلاق Midjourney للفيديو يُمثّل نقلة نوعية لها، ويمنح المُبدعين أداة جديدة لتحريك صورهم بسلاسة وتكلفة معقولة. لكنها تدخل بذلك ساحة شديدة التنافُّس، وتواجه تحديات فنية وقانونية يجب التعامل معها بحذر.
بالنسبة للمؤسسات والشركات، توفّر المنصة خيارًا سريعًا وميسورًا لكنه لا يخلو من المخاطر، خصوصًا فيما يتعلق بانتهاك الحقوق الفكرية.
ما إذا كانت Midjourney ستنجح في الحفاظ على تقدمها واللحاق بالمُنافسين أو تضطر لإعادة هيكلة خدماتها، هو ما ستكشفه الأشهر القادمة في عالم الذكاء الاصطناعي سريع التحوُّل.

هاشتاغز

ترفيه

جرب ميزات الذكاء الاصطناعي لدينا

اكتشف ما يمكن أن يفعله Daily8 AI من أجلك:

أخبار ذات صلة

تحذيرات من أساليب احتيال جديدة تستخدم فيها أجهزة آبل!

صقر الجديان

منذ 2 أيام

صقر الجديان

تحذيرات من أساليب احتيال جديدة تستخدم فيها أجهزة آبل!

وأشارت تقارير صادرة عن الوزارة إلى رصد هجمات إلكترونية يقوم فيها المحتالون باستغلال خدمة iCloud الموجودة في هواتف آيفون وحواسب آيباد للاحتيال على مستخدمي هذه الأجهزة. ووفقا للتقارير يختار المحتالون ضحاياهم عبر منصات التعارف، أو في منصات الألعاب على مواقع التواصل الاجتماعي، أو عبر مواقع البحث عن عمل، ويبذل المحتالون جهدا كبيرا لكسب ثقة الضحايا، متظاهرين بأنهم شركاء محتملون، أو أصحاب عمل، أو حتى أشخاص بحاجة للمساعدة. وبعد هذه المرحلة تأتي النقطة الحاسمة عندما يطلب المحتال 'خدمة صغيرة' من الضحية، وهي تسجيل الدخول إلى حسابه على 'iCloud' باستخدام جهاز الضحية، وتتنوع الذرائع المقدمة، مثل طباعة تذاكر الطيران، أو تنزيل تطبيق محظور في روسيا، أو استرجاع بيانات من هاتف زعموا أنه معطّل، أو تثبيت برنامج للعمل، بمجرد حصولهم على حق الوصول إلى الجهاز، يُفعّل المحتالون على الفور ميزة 'البحث عن جهازي' أوما يعرف بـ (Find My iPhone) ويقومون بتشغيل 'قفل التنشيط' (Activation Lock)، وهي أدوات مصممة أصلا من قبل شركة آبل لحماية الأجهزة من السرقة، وتتحول هذه الأدوات إلى أداة للابتزاز، إذ يقوم المحتال بقفل الجهاز عن بُعد، ويظهر على شاشة الضحية رسالة تطلب فدية مالية مقابل فك قفل الجهاز. وتشير المعلومات المتوفرة إلى أن المحتالين يطالبون ضحاياهم عادة بدفع 10 آلاف روبل (ما يعادل تقريبا 110 دولارات أمريكية) مقابل فك قفل الجهاز، ويهددون صاحب الجهاز الذكي بتعطيل الجهاز نهائيا عن العمل أو حذف بياناته في حال عدم الدفع. كما تحذر تقارير وزارة الداخلية الروسية من إمكانية وصول المحتالين إلى الصور وجهات الاتصال والمراسلات والمعلومات الشخصية الأخرى المخزنة على أجهزة ضحاياهم.

جوجل تبدأ إطلاق نموذج 'Imagen 4' لتوليد الصور

البوابة العربية للأخبار التقنية

منذ 3 أيام

البوابة العربية للأخبار التقنية

جوجل تبدأ إطلاق نموذج 'Imagen 4' لتوليد الصور

أعلنت شركة جوجل إطلاق 'Imagen 4'، وهو أحدث إصدار من نماذج الذكاء الاصطناعي للشركة لتوليد الصور استنادًا إلى الأوامر النصية. وتطلق الشركة نموذجها مع وعد 'بتحسن كبير في عرض النصوص داخل الصور' مقارنةً بالإصدار السابق Imagen 3. وإلى جانب ذلك، قدمت الشركة إصدارًا جديدًا أكثر تطورًا يُدعى Imagen 4 Ultra، وهو يستهدف المستخدمين الذين يحتاجون إلى نتائج دقيقة تتبع التعليمات النصية بنحو صارم، مقابل تكلفة إضافية. وتتيح جوجل النموذجين للتجربة الأولية مقابل رسوم عبر واجهة برمجة التطبيقات Gemini API، مع اختبار محدود مجاني عبر منصة Google AI Studio. وتصف جوجل الإصدار الأساسي من Imagen 4 بأنه 'الخيار المناسب لمعظم المهام'، وتحدد تكلفة إنتاج الصورة الواحدة بـ 0.04 دولار. وأما إصدار Imagen 4 Ultra، فتبلغ تكلفة الصورة الواحدة فيه 0.06 دولار، أي أعلى بنسبة قدرها 50%. واستعرضت الشركة مجموعة من الصور التي أنشأها النموذج، منها قصة مصورة ثلاثية المشاهد تظهر مركبة فضائية صغيرة تتعرض لهجوم من كائن فضائي أزرق عملاق. وقد طابقت الصورة التعليمات النصية بدقة، وإن بدت وكأنها مستخرجة من تطبيق رسوم ثلاثية الأبعاد، ويمكن الإطلاع على عينات مُختارة من إنتاج نموذج جوجل الجديد عبر مدونة جوجل الرسمية. ومع أن Imagen 4 يُظهر تحسنًا طفيفًا مقارنةً بالنسخ السابقة، فإن الانطباع العام يشير إلى أن نماذج جوجل ما زالت خلف النماذج المنافسة، مثل DALL-E 3 من OpenAI و Midjourney 7، في مجال توليد الصور، وإن أظهر نموذجها الجديد Veo 3 تقدمًا كبيرًا في مجال توليد الفيديو.

عرب هاردوير

منذ 3 أيام

عرب هاردوير

حوّل الصور إلى أفلام: Midjourney تكشف عن سحر الفيديو بالذكاء الاصطناعي

أعلنت شركة Midjourney -الرائدة في توليد الصور بالذكاء الاصطناعي- عن إطلاق أول نموذج لها لإنشاء مقاطع فيديو قصيرة، وهو ما كنت أنتظره كثيرًا، نموذج Midjourney V1 يتيح تحريك الصور الثابتة وتحويلها إلى مقاطع فيديو تصل مُدّتها إلى 20 ثانية، عبر موقع المنصة الإلكتروني، مع إمكانية التوجيه الحركّي باستخدام نصوص مكتوبة. هذا التطوُّر يُشكل بداية جديدة للشركة التي تحظى بأكثر من 20 مليون مُستخدم، ويدفعها إلى مُنافسة قوية في سوق يشهد تنافسًا شديدًا بين شركات التقنية الكبرى والناشئة. في الوقت نفسه، تواجه Midjourney تحديات قانونية كبيرة، خصوصًا بعد رفع دعاوى قضائية من قبل شركات عملاقة في مجال الترفيه مثل ديزني ويونيفرسال، تتهم فيها المنصة بانتهاك حقوق الملكية الفكرية. Midjourney V1: خيارات حركة متنوعة النموذج الجديد مبني مُباشرةً على تقنية توليد الصور المعروفة الخاصة بـ Midjourney، وبالتحديد الإصدار السابع منها "V7" ، حيث يُمكنك توليد صورة عبر المنصة أو رفع صورة من جهازك، ثم الضغط على زر تحريك "Animate" لتحويلها إلى فيديو. تتوفر طريقتان رئيسيتان: إمّا الاعتماد على تحريك تلقائي، أو كتابة تعليمات نصية تُحدّد كيفية حركة العناصر داخل المشهد. توفّر الأداة نمطين للحركة: الأول مُنخفض الحركة وهو مثالي للحركات البسيطة مثل رمشة عين أو نسيم خفيف، والثاني عالي الحركة ويُتيح حركات أكثر ديناميكية للكاميرا والعناصر، لكنه -للأسف- قد يؤدّي أحيانًا إلى تشوهات بصرية بسيطة. كل عملية توليد تنتج 4 مقاطع فيديو مُختلفة، يمكن للمُستخدم الاختيار منها، مع إمكانية تمديد كل مقطع حتى 20 ثانية كحد أقصى. تسعير مُنخفض مُقارنةً بالمُنافسين تقدّم Midjourney هذه الميزة ضمن خطط الاشتراك الحالية، والتي تبدأ من 10 دولارات شهريًا، تكلفة إنشاء فيديو تعادل تقريبًا 8 أضعاف تكلفة إنشاء صورة واحدة، إلا أنّ تكلفة الثانية الواحدة من الفيديو تظل مُقاربة من تكلفة صورة واحدة، وهو ما يجعل السعر مُنافسًا بالنسبة لمُنتجي الفيديو القصير. أيضًا، تختبر الشركة وضعًا جديدًا للمُشتركين يُتيح توليد الفيديوهات في وضع الاسترخاء "video relax mode"، أي بتكلفة أقل مُقابل وقت انتظار أطول. بالمُقارنة مع المُنافسين، تُعد تكلفة Midjourney V1 مُنخفضة نسبيًا. على سبيل المثال، اشتراك Luma AI يبدأ من 9.99 دولارات شهريًا، بينما Runway يبدأ من 15 دولارًا. غياب الصوت وبعض الخصائص المُتقدمّة رغم الحماس الكبير، يفتقر Midjourney V1 إلى بعض الوظائف التي أصبحت شائعة في أدوات الفيديو بالذكاء الاصطناعي، مثل توليد الصوت أو المؤثرات الموسيقية المُدمجة، كما لا توفر المنصة حاليًا أدوات تحرير (تعديل) زمنية، مثل دمج المقاطع أو الانتقال بين المشاهد أو بناء سرد متسلسل. في المُقابل، تقدم شركات مثل Luma Labs وRunway وجوجل نماذج أكثر تقدمًا تدعم الصوت وتمنح المستخدم تحكمًا أكبر في الشكل النهائي للمُحتوى، وتُخطط Midjourney لتوسيع قدراتها تدريجيًا، مع التركيز حاليًا على البساطة وسهولة الاستخدام. مواجهة قانونية مع عمالقة الترفيه قبل أيام فقط من الإطلاق، وجدّت Midjourney نفسها في قلب دعوى قضائية كبيرة رفعتها شركتا ديزني ويونيفرسال، تتهمان فيها المنصة بتوليد مُحتوى مُستوحى من شخصيات محمية بحقوق الملكية الفكرية مثل سبايدرمان وإلسا وشريك وغيرها، من دون الحصول على تراخيص. وتشير الدعوى إلى أن المنصة استخدمت أدوات لجمع صور من الإنترنت لتدريب نماذجها، والذي يُعد انتهاكًا صريحًا للقانون بحسب المدّعين. الدعوى تُسلّط الضوء على الخطر القانوني الذي قد يُهدّد مُستقبل المنصة، خصوصًا في ما يتعلق باستخدامها في الأعمال التجارية، حيث قد يتعرض المستخدمون أيضًا للمُساءلة القانونية في حال استخدام مُحتوى من إنتاج Midjourney يحتوي على عناصر محمية. العالم التفاعلي هو الهدف رغم التحديات، فإن إطلاق نموذج الفيديو Midjourney V1 ما هو إلا خطوة أولى نحو مشروع أوسع تسعى الشركة من خلاله لبناء "World Model"، وهو نظام يُمكّن المستخدم من التنقل داخل بيئة افتراضية يولّدها الذكاء الاصطناعي في الزمن الحقيقي. في هذا النموذج، سيتمكّن المُستخدم من طلب إنشاء مشاهد ديناميكية مثل "السير في سوق مغربي عند الغروب"، والتفاعل مع عناصر المشهد كما لو كان داخل لعبة ثلاثية الأبعاد 3D. تسير شركات أخرى في نفس الاتجاه، مثل Odyssey التي تطوّر نظامًا للفيديو التفاعلي مع قدرات كاميرا 3D، وRunway التي أدخلت خصائص تحكم بالكاميرا لمُحاكاة الواقع داخل الفيديوهات. تُعد هذه النماذج المتقدمة من بين أكثر تقنيات الذكاء الاصطناعي تطورًا، حيث لا تقتصر على توليد الصورة، بل تتنبأ أيضًا بكيفية تفاعل العناصر داخل المشهد، ما يُقرّب الذكاء الاصطناعي من مُحاكاة الواقع. قفزة جريئة في طريق طويل ومُعقّد إطلاق Midjourney للفيديو يُمثّل نقلة نوعية لها، ويمنح المُبدعين أداة جديدة لتحريك صورهم بسلاسة وتكلفة معقولة. لكنها تدخل بذلك ساحة شديدة التنافُّس، وتواجه تحديات فنية وقانونية يجب التعامل معها بحذر. بالنسبة للمؤسسات والشركات، توفّر المنصة خيارًا سريعًا وميسورًا لكنه لا يخلو من المخاطر، خصوصًا فيما يتعلق بانتهاك الحقوق الفكرية. ما إذا كانت Midjourney ستنجح في الحفاظ على تقدمها واللحاق بالمُنافسين أو تضطر لإعادة هيكلة خدماتها، هو ما ستكشفه الأشهر القادمة في عالم الذكاء الاصطناعي سريع التحوُّل.

حوّل الصور إلى أفلام: Midjourney تكشف عن سحر الفيديو بالذكاء الاصطناعي

هاشتاغز

جرب ميزات الذكاء الاصطناعي لدينا

التعليقات

أخبار ذات صلة

تحذيرات من أساليب احتيال جديدة تستخدم فيها أجهزة آبل!

جوجل تبدأ إطلاق نموذج 'Imagen 4' لتوليد الصور

حوّل الصور إلى أفلام: Midjourney تكشف عن سحر الفيديو بالذكاء الاصطناعي

حمّل التطبيق الآن وابدأ باستخدامه الآن