التدريب | التطوير | الاختبار | |
---|---|---|---|
المداخل المعجمية | 45200 | 6400 | 6410 |
المعجم الثنائي الدلالة | 2843 | 299 | 1213 |
{
"id":"ar.45",
"word":"عين",
"gloss":"عضو الإبصار في ...",
"pos":"n",
"electra":[0.4, 0.3, …],
"sgns":[0.2, 0.5, …],
"enId": "en.150"
}
ويوضح فيه المعرّف "id" التسلسل الخاص بالمدخل المعجمي داخل المعجم مع اللغة التي ينتمي لها
المعجم. وترتبط قيمة هذا المعرِّف بالمفتاح "gloss". ويشير إلى التعريف الخاص بالكلمة بحسب ما هو
وارد في المعجم العربي المستعمل مصدرا لمسار المعجم العربي العكسي.
أما قيمة "enId" فتشير إلى
المعرف المقابل في المعجم الإنجليزي.
أما المفتاحان ("sgns", "electra) عبارة عن مصفوفات من
الأرقام العشرية تعرف بالتضمينات embeddings وتمثل مكونات المدخل المعجمي: الكلمة أو معناها.
{
"id":"ar.45",
"arword":"عين",
"argloss":"عضو الإبصار في ...",
"arpos":"n",
"electra":[0.4, 0.3, …],
"sgns":[0.2, 0.5, …],
"enId":"en.150",
"word":"eye",
"gloss":"One of the two ...",
"pos":"n",
}
وتشير القيمة "id" إلى المعرف الخاص بكل مدخل معجمي في المعجم العربي. ويرتبط بها المفتاحان
"argloss" و"gloss" الخاصان بالتعريفين العربي والإنجليزي للمدخل المعجمي على التوالي كما هما في
المعجم الثنائي اللغة المطابق دلاليا (عربي- إنجليزي) المستعمل مصدرا للمهمة الخاصة بالمعجم
العكسي. أما المفتاحان ("sgns", "electra) عبارة عن مصفوفات من الأرقام العشرية تعرف بالتضمينات
embeddings وتمثل مكونات المدخل المعجمي: الكلمة أو معناها.
{
"id":"en.150",
"word":"eye",
"gloss":"One of the two ...",
"pos":"n",
"electra":[0.7, 0.1, …],
"sgns":[0.2, 0.8, …]
}
ويلاحظ أن المعجم الإنجليزي له نفس المفاتيح الخاصة بالمعجم العربي، ويمكن استعماله في المهمة
الثانية.
Dev | Test | ||||||
---|---|---|---|---|---|---|---|
عدد دورات التدريب epochs | تشابه جيب التمام | الخطأ التربيعي المتوسط | المقياس الترتيبي | تشابه جيب التمام | الخطأ التربيعي المتوسط | المقياس الترتيبي | |
المهمة 1 (Sgns) | 200 | 35.61 | 5.03 | 38.52 | 40.58 | 4.49 | 36.28 |
المهمة 1 (Electra) | 200 | 48.84 | 24.94 | 31.27 | 50.79 | 23.04 | 31.87 |
المهمة 2 (Sgns) | 300 | 26.22 | 4.92 | 50.16 | 25.21 | 4.85 | 49.95 |
المهمة 2 (Electra) | 300 | 54.09 | 22.10 | 36.22 | 51.66 | 23.81 | 40.72 |