الجلسات العامة للمؤتمر السنوي الدولي التاسع للترجمة
تقييم الترجمة الآلية: محرك جوجل ترانسليت في مقابل ياندكس ترانسليت – الترجمة من اللغة القيرغيزية إلى اللغة الإنجليزية مثالاً
يحيى بولات
جامعة آلا-تو الدولية
رغم قدم وثراء اللغة القيرغيزية، التي بها كتبت ملحمة مناص الخالدة، إلا أنها لم تجد لها تمثيلاً جيدًا في مجال الترجمة الآلية بعد، إذ أنها ما تزال تحقق تقدمًا بطيئًا نسبيًا فيما يتعلق بخدمات الترجمة المقدمة من موقعي جوجل وياندكس. وتبحث هذه الدراسة في مدى دقة الترجمة الآلية المتاحة من اللغة القيرغيزية إلى الإنجليزية من الناحية المعجمية والدلالية والنحوية. وتستند هذه الدراسة إلى نموذج جروفيز وموندت (2015) في تصنيف الأخطاء في مقارنتها للترجمات من القيرغيزية إلى الإنجليزية والتي تم معالجتها من قبل جوجل ترانسلايت وياندكس ترانسلايت. وقد اخترنا مائة نص يمثلون أربعة مجالات، هي مجالات القانون والأدب والطب والإعلام، بواقع 25 نصًا من كل مجالٍ. وقد جرت ترجمة النصوص المختارة من خلال جوجل ترانسلايت وياندكس ترانسلايت، فضلاً عن المترجمين التقليدين من البشر، ومن ثَمَّ تقييمها فيما يتعلق بالدقة المعجمية والدلالية والنحوية. وتتألف المواد من أربع مجموعات، هي، (أ) جمل اسمية قصيرة للغاية مكونة من كلمتين فقط؛ (ب) جمل اسمية قصيرة مكونة من كلمتين إلى خمس كلمات؛ (ج) جمل طويلة مكونة من 10 إلى 13 كلمةً؛ (د) جمل يتراوح طولها بين 18 و23 كلمةً. في هذه الدراسة، أجرينا تحليلاً وصفيًا مقارن للترجمات، بناءً على نموذج جروفز وموند (2015) كمعيار للتقييم ومنح الدرجات للترجمات التي قام بها المترجمون من البشر والتطبيقات الحاسوبية. ويرجع اعتمادنا هذا النموذج إلى أنه يسمح بتحليلٍ مفصلٍ للمواد المترجمة ومنحها الدرجات المناسبة. كما استفدنا من الدراسات التي قام بها كل من سجادي محمدي سفاري (2017) وهاشميان جاسمي (2015) باعتبارها نماذج عملية. تلخيصًا للنتائج المستنبطة، يمكننا القول بأن جوجل ترانسلايت كان أكثر دقةً من ياندكس ترانسلايت على الصُعُد المعجمية والدلالية والنحوية فيما يتعلق بترجمة العبارات والجمل من القيرغيزية إلى الإنجليزية بالنسبة لمختلف المجالات الأربعة قيد الدراسة. وكشف تحليل الأخطاء في الشق النحوي أن الاستخدام الخاطئ للأفعال والأزمنة والفواصل والأخطاء الإملائية كان الأكثر تكرارًا بين نظامي الترجمة الآلية.
هل يفضي الجمع بين برمجية التعرف على الكلام والترجمة الآلية إلى ترجمة فورية آلية كاملة؟
ستيفان فوجل
معهد قطر لبحوث الحوسبة، جامعة حمد بن خليفة
لقد أضحت الترجمة الآلية حقيقة مسلم بها، فإن كمية المواد التي تترجم آليًا بالكامل - معظمها صفحات إلكترونية، وآراء عملاء التجارة الإلكترونية، ومشاركات منشورة عبر منصات التواصل الاجتماعي - تقدر بمائة مرة أكثر من المحتوى الذي يجري ترجمته من قبل المترجمين. وبالمثل، تستخدم تقنيات تمييز الكلام في العديد من التطبيقات - تتراوح من مراكز الاتصال، وإملاء التقارير الطبية، إلى تقديم خدمات المساعدة الشخصية، مثل تطبيقي كورتانا وسيري اللذان يعملان على الهاتف الخلوي. وسوف نناقش في هذه الورقة البحثية نظام لترجمة الكلام يجمع بين تمييز الكلام وتقنية الترجمة الآلية بغية إنشاء نظام ترجمة فورية للمؤتمرات آلي بالكامل بين اللغتين العربية والإنجليزية. وسوف نسلط الضوء على التحديات التي تواجه هذه التكنولوجيا الحديثة، إلى جانب استعراض التكنولوجيات الكامنة، بمعنى تسليط الضوء على التطورات الجديدة باستخدام ما يعرف بالتعلم العميق، مع تقديم شرح حي للإمكانات التي يتيحها النظام. جرى إنشاء النموذج الآلي لنظام تمييز الكلام باللغة العربية من خلال استخدام أكثر من 1000 ساعة من الحديث المدون باللغة العربية، وينتمي معظمها إلى اللهجة العربية القياسية الحديثة في قطاع بث الأخبار. وعلى النقيض من ذلك، فإن نظام تمييز الكلام باللغة الإنجليزية يقوم على تسجيلات ونسخ مدونة لحوالي 150 ساعة من محادثات منشورة على موقع TED. كما يستخدم كلا النظامان كميات أكبر بكثير من البيانات النصيَّة للتعرف على النماذج اللغوية. وبالنسبة للترجمة الآلية، تم استكشاف عدة تقنيات مختلفة: فمن جانب، قمنا بإنشاء ما يسمى بنظم الترجمة الآلية الإحصائية القائمة على العبارة، ومن الجانب الآخر، استكشفنا التطورات الجديدة في مجال التعلم العميق بهدف بناء نظم الترجمة الآلية العصبية. وقد واجهنا مشكلة واحدة في بناء مثل هذه الأنظمة تتمثل في محدودية المفردات المتاحة. فمهما بلغ قدر بيانات التدريب المستخدمة، هناك دائمًا كلمات وتراكيب لفظية لم يتم إدراجها ضمن هذه البيانات. وقد قمنا بمحاولة واحدة للتغلب على هذه المشكلة - تحديدًا تلك المتعلقة بمكون الترجمة الآلية - وهي استخدام وحدات الكلمات الفرعية كتمثيل داخلي. وهناك مشكلة أخرى - بالنسبة للبشر والآلات على حدٍ سواء - وهي أنه لا يمكن إنتاج ترجمة جيدة إلا عند توفير سياقٍ كافٍ. وعلى الجانب الآخر، تتطلب الترجمة الفورية أن تجرى مخرجات عملية الترجمة بطريقة مستمرة ودون حدوث الكثير من التأخير. وقد لاحظنا أن متوسط معدل التأخير في الترجمة الفورية البشرية يصل إلى بضع ثوانٍ فقط. ويتطلب الأمر للحصول على معدل التأخير ذاته بالنسبة للترجمة الفورية الآلية أن يقوم كل من شق التعرف على الكلام وشق الترجمة الآلية بعملية فك شفرة التدفق الوارد. وسوف تطرح هذه الورقة البحثية الحل الذي توصلنا إليه، وتقديم نتائج تتعلق بالمفاضلة بين طول مدة التأخير وجودة المنتج النهائي. ومن خلال تحليل النصوص المدونة لترجمات فورية خاصة بخطابات جرت في عدة مؤتمرات (مثل قمة وايز، وقمة ويش، ومؤتمر مؤسسة قطر السنوي للبحوث)، يمكننا أن نقدم مقارنة بين الترجمة الفورية التي يقوم على تنفيذها البشر والأخرى التي تنفذ آليًا بالكامل، وهكذا نسلط الضوء على جوانب القوة والضعف في الترجمة الفورية الآلية. ونحن نهتم على وجه الخصوص بدراسة جودة الترجمة الفورية الآلية، والمحتوى المفقود، ومعدل التأخير.
قياس قابلية استخدام صيغة التحرير اللاحق للنص
شيلا كاستيلو
جامعة مدينة دبلن
أدى الاستخدام المتزايد للترجمة الآلية في السنوات الأخيرة إلى التركيز القوي على تقييم هذا النوع من الترجمة. ومن المفترض أن نوعية أنظمة الترجمة الآلية الحالية تتطلب تدخلاً من البشر في مرحلة التحرير اللاحق، وهو ما يؤدي إلى تحسين جودة النتائج النهائية إلى حد كبير. وتعني الجودة العالية أن يكون المحتوى المترجم آليًا مقبولاً وقابلاً للاستخدام وحائزًا على رضا المستخدم النهائي. وبينما تصبح الترجمة الآلية المؤتمتة أكثر انتشارًا من أي وقت مضى، لا يعرف إلا القليل عن كيفية تفاعل المستخدمين النهائيين مع النص الأصلي المترجم آليًا.
تقدم هذه الورقة البحثية تقارير عن نتائج هذه التجارب لقياس قابلية استخدام المحتوى المترجم آليًا من قبل المستخدمين النهائيين، ومقارنة المحتوى الذي تم تعديله بشكل طفيف في مقابل ناتج الترجمة الآلية غير المعدل للغات الألمانية والصينية المبسطة واليابانية، وكذلك بالنسبة للغة المصدر - اللغة الإنجليزية. ويمكن تعريف القابلية للاستخدام على أنها "مدى استخدام المنتج من قبل مستخدمين محددين لتحقيق أهداف محددة بفعالية وكفاءة ورضا في محتوى محدد من الاستخدام" (آيزو 2002)، ثم يتم قياس الفعالية وفق معيار إنجاز الهدف، وتقاس الكفاءة بزمن المهمة عن النظر إلى المهام الناجحة فقط. ويعرف الرضا بأنه "تصورات المستخدم ومشاعره وآرائه حول المنتج، وعادة ما يتم رصد الرضا من خلال الاستفسارات المكتوبة والشفوية" (روبين، تشيسنيل، 2011)، كما يعرف كذلك على أنه "عدم وجود أية صعوبات وتبني مواقف إيجابية تجاه استخدام المنتج" (آيزو 1998).
من أجل قياس قابلية الاستخدام، تم إنشاء ثماني مهام من محتوى "المساعدة عبر الإنترنت" لتطبيق جدول بيانات بالتعاون مع شريك في مجال الترجمة. وجرت مهام الترجمة من الإنجليزية إلى الألمانية والصينية المبسطة واليابانية من خلال نظام الترجمة الآلية الذي تستخدمه الشركة، وبعدها تمت عملية التحرير اللاحق المُبسط للنص المترجم من قبل مقدمي خدمة الترجمة لصالح الشركة. وجرت عملية التحرير اللاحق للنص فقط في حالة وجود أخطاء في المصطلحات أو القواعد النحوية. تم تقسيم أربعة عشر شخصًا من الناطقين الأصليين باللغة الألمانية، وواحد وعشرين من الناطقين باللغة الصينية المبسطة وثمانية وعشرين من الناطقين باليابانية إلى مجموعتين؛ حيث استخدمت إحداهما تعليمات التحرير اللاحق المُبسط، في حين استخدمت الأخرى تعليمات النص الأصلي المترجم آليًا دون التعديل. كما شكل المشاركون بالإنجليزية الذين استخدموا نصوص المصدر جزءًا من مجموعة واحدة. وقد طُلب من المشاركين اتباع التعليمات وتنفيذ المهام في جدول بيانات المستخدم. بعد الانتهاء من هذه المهام، طُلب من المشاركين الإجابة على استبيان مدى الرضا عن المهمة من أجل البناء على رأيهم حول مدى فائدة التعليمات.
وتم أيضًا إجراء دراسة استقصائية على شبكة الإنترنت من أجل الوصول إلى مؤشر عام حول مدى ارتياح المستخدمين للبرنامج على نطاق واسع. وقد جرى نشر الدراسة الاستقصائية على الموقع الإلكتروني الخاص بشريك المشروع بحيث شمل 140 مقالة (باللغات الإنجليزية والألمانية والصينية المبسطة واليابانية)، كما تم جمع معلومات عن "مدى فائدة" المحتوى بالنسبة للمستخدم النهائي. وتضمنت الدراسة الاستقصائية سؤالاً واحدًا يتألف من عدة خيارات: "هل كانت المعلومات مفيدة؟" (نعم / لا).
وتمثلت الأهداف الرئيسية للتجارب في: (1) التحقق من مدى تأثير التحرير البشري المُبسط اللاحق للنصوص المترجمة آليًا فيما يتعلق بمدى مقبولية المحتوى التعليمي؛ (2) مقارنة مستوى القبول بين اللغات الألمانية والصينية المبسطة واليابانية. وقد أظهرت النتائج أن تنفيذ التحرير اللاحق المُبسط يؤثر بشكل مباشر على مدى مقبولية النص في اللغات الألمانية والصينية المبسطة، أكثر من اللغة اليابانية؛ كما أن نتائج هذا البحث تبين أن اللغات المختلفة تتباين فيما بينها من حيث حدود قياس جودة الترجمة.
استراتيجيات التحرير اللاحق لمخرجات الترجمة الآلية للمحتوى المنتَج من جانب المستخدم
ميجل إنخل كانديل-مورا
جامعة فالينسيا للفنون التطبيقية
مع ظهور تقنية Web 2.0 والمشاركة الفعالة من المستخدمين، أصبحت آراء المستهلكين المتاحة عبر الانترنت مرجعًا واضحًا في اتخاذ القرار فيما يتعلق بعمليات الشراء. وقد تمت دراسة هذه الآراء إلى حد كبير من وجهة نظر التسويق والأعمال والسياحة وتكنولوجيا المعلومات (ششمان، 2011)، وفي مجالات مثل التأثير على صنع القرار (ريتشي، ويتسما، 2006) أو سمات هذا النوع من النصوص (فاسكيز، 2014) من أجل توطيد هذا النوع الذي يتسم ببعض الميزات الخاصة وكذلك لتحسين منصات استعراض الآراء المتاحة عبر الإنترنت.
ومن السمات المشتركة لمعظم منصات استعراض الآراء استخدام نظم الترجمة الآلية لجعل هذا الاستعراض متاحًا لأكبر عدد ممكن من المستخدمين بلغات مختلفة. وهكذا، فإن السؤال البحثي الذي يحفز هذا العمل هو أنه في حالة استعراض الآراء التي ينشئها المستخدمون في مجال السياحة، فإن الرسالة لا تنتقل فقط من خلال الموارد اللغوية، ولكن هناك عناصر أخرى أو أشكال نصية ينبغي أن تؤخذ بعين الاعتبار عند تطبيق استراتيجية التحرير اللاحق للنصوص، بالإضافة إلى القواعد اللغوية والتحرير اللاحق للمبادئ التوجيهية الأسلوبية ذات الصلة (بابيش، 2014؛ فيلار وآخرون، 2006). وبعبارة أخرى، لا يتم نقل الآراء فقط من خلال اللغة، إذ أن ثمة بعض الخصائص المحددة للنوع مثل التناص أو الرجوع إلى آراء أخرى أو البيانات الشخصية لأصحاب الآراء أو العناصر اللغوية التي تساهم في مصداقية آراء المستهلك.
وقد أكدت عدة دراسات بالفعل أنه لا توجد مبادئ توجيهية عالمية للتحرير اللاحق (ألين، 2003، توس، 2010)، وأن كل نوع يتطلب معايير محددة لتقييم الجودة. وهكذا، يسلط هذا العمل الضوء على الحاجة إلى إيلاء اهتمام خاص بالاصطلاحات النصية أثناء تطبيق أية استراتيجية للتحرير اللاحق للنصوص، بالإضافة إلى تحديد أنماط الأخطاء اللغوية المشتركة بين معظم المبادئ التوجيهية الخاصة بالتحرير اللاحق للنصوص. وبشكل أكثر تحديدًا، يهدف هذا العمل البحثي لمقارنة الخصائص النصية لآراء المستخدم المكتوبة أصلاً باللغة الإنجليزية والإسبانية من البيانات المستمدة من تحليل النهج القائم على المتون الذي يسهم بدوره في تصميم المبادئ التوجيهية القياسية لمهمات التحرير اللاحق لمخرجات الترجمة الآلية.