أداة ذكاء اصطناعي تحول صورة ومقطعا صوتيا لـ"وجه ناطق" بتوقيع مايكروسوفت

20 أبريل 2024 - 12:23

أكد عملاق التكنولوجيا مايكروسوفت أن "الغرض من الأداة ليس إنشاء محتوى بقصد التضليل أو الخداع".

طوّر باحثو مايكروسوفت أداة ذكاء اصطناعي (AI) يمكنها تحويل صور الوجه والمقاطع الصوتية إلى مقاطع فيديو "وجه ناطق" واقعية للغاية، حسبما جاء في وثيقة أصدرتها شركة مايكروسوفت العملاقة للتكنولوجيا هذا الأسبوع.

وقالت الشركة إن "الغرض من هذه الأداة ليس إنشاء محتوى بقصد التضليل أو الخداع"، مضيفةً أن "هذه الأداة، مثلها مثل تقنيات إنشاء المحتوى الأخرى، يمكن استخدامها لأغراض إساءة الاستخدام أو انتحال شخصية شخص ما".

يمكن إنشاء أنواع مختلفة من المحتوى (نص، صور، صور، صوت...) ) يمكن إنشاؤها بسهولة وبجودة عالية جدًا، إلا أن التطور السريع للذكاء الاصطناعي التوليدي يثير عددًا من المخاوف، لا سيما فيما يتعلق بإساءة استخدامه لأغراض الاحتيال والتضليل.

وأضاف أن "مايكروسوفت تعارض أي عمل يهدف إلى إنشاء محتوى مضلل أو ضار".

لا تنوي شركة التكنولوجيا، وهي مبتكر ChatGPT ومستثمر رئيسي في OpenAI، إصدار أدوات جديدة أو تقديم معلومات تقنية "ما لم تكن متأكدة من أن الأدوات ستُستخدم بشكل مسؤول وفقًا للقانون المعمول به".

يأخذ البرنامج، المسمى VASA-1، صورة وجه بسيطة ويسجل مقطعاً صوتياً ويحولها إلى فيديو.

وتعمل شركات أخرى، مثل شركة Runway، المتخصصة في الذكاء الاصطناعي التوليدي للفيديو، على هذه التقنية. وقد أنشأ باحثو جوجل برنامج ذكاء اصطناعي يسمى Flogger، والذي يمكنه إنشاء مقاطع فيديو لوجوه ناطقة واقعية.

ووفقًا لمايكروسوفت، فإن فوائد إنشاء هذه الأداة تشمل "تعزيز المساواة في التعليم، ومساعدة الأشخاص الذين يعانون من صعوبات في التواصل وتقديم الدعم العلاجي للمحتاجين"، وهو ما يبرر العمل.