الذكاء الاصطناعي للحفاظ على 4000 لغة
تشرين:
تسعى شركة “ميتا” الأمريكية مستقبلاً لدعم المزيد من اللغات في نماذجها اللغوية المعتمدة على الذكاء الاصطناعي وذلك منعاً لانقراضها.
وأعلنت الشركة عن نماذج ذكاء اصطناعي جديدة مفتوح المصدر، قادرة على التعرّف على ما يزيد على 4000 لغة منطوقة حول العالم، بزيادة تُقدر بأربعين ضعفاً مقارنةً بالتقنيات المتوافرة سابقاً.
وتطلق “ميتا” على تلك النماذج “نماذج الكلام الضخمة المتعددة اللغات Massively Multilingual Speech”، أو اختصاراً (MMS)، وتزعم أنها قادرة على تحويل النص إلى كلام والعكس بأكثر من 1100 لغة، بزيادة عشرة أضعاف على ما كان موجوداً في وقت سابق.
وتقول الشركة الأمريكية: إن أحد أهدافها من وراء تطوير تلك النماذج هو الحفاظ على اللغات من خطر الانقراض، حيث صرحت الشركة من خلال بيان نشرته عبر موقعها الرسمي، قائلةً: تتعرض العديد من لغات العالم لخطر الاختفاء، ولن تؤدي القيود المفروضة على تقنية تعرف الكلام وتوليده حالياً إلا إلى تسريع هذا الاتجاه.
وقد جعلت ميتا نماذجها الجديدة مفتوحة المصدر، حتى يتمكن الباحثون من الوصول إليها والمساهمة في تطويرها، من أجل المساعدة في الحفاظ على لغات العالم.
وهناك العديد من المجالات التي قد تُستخدم فيها تقنيات الكلام المستندة إلى الذكاء الاصطناعي وفقاً لشركة “ميتا”، مثل خدمات المراسلة وتقنيات الواقع الافتراضي والواقع المعزز، إذ ستفهم كل الأصوات، وتخدم المستخدم بلغته المفضلة.
وتتطلب نماذج تعرّف الكلام وتحويل النص إلى كلام تدريباً على آلاف الساعات من التسجيلات الصوتية مع النصوص المفرّغة المصاحبة لها، وهذا أمر ضروري للغاية، حتى تفهم الخوارزمياتُ النصوصَ وتصنفها بشكل صحيح.
وواجهت “ميتا” صعوبات في جمع تسجيلات صوتية للّغات غير المستخدمة على نطاق واسع، إذ إن البيانات المتوافرة حالياً تغطي فقط اللغات المئة الأكثر انتشاراً حول العالم، كما لجأت إلى استخدام طرق غير تقليدية من أجل التغلب على تلك الصعوبات، حيث قامت بجمع التسجيلات الصوتية للنصوص الدينية المترجمة إلى مختلف اللغات، وأرفقت تلك التسجيلات مع الترجمات المعتمدة، الأمر الذي سمح لميتا بالحصول على 32 ساعة من البيانات – في المتوسط – للغات الأقل انتشاراً، وزيادة إجمالي اللغات في النماذج إلى أكثر من 4000 لغة.
وتسعى ميتا مستقبلاً إلى دعم المزيد من اللغات في نماذجها اللغوية المعتمدة على الذكاء الاصطناعي، إضافة إلى جعلها قادرة على التعامل مع اللهجات المختلفة لكل لغة، الأمر الذي لا يزال يشكل تحدياً حتى الآن.