1 / 31

بسم الله الرحمـن الرحيم

بسم الله الرحمـن الرحيم. 428 عال (تعريب الحاسبات) عنوان البحث ( تحويل النصوص العربية إلى صوت ) أ سماء المجموعة: منصور العثمان ياسر النخلي ماجد الشمري. مقدمة. ما هو برنامج تحويل النص إلى صوت؟

betsy
Download Presentation

بسم الله الرحمـن الرحيم

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. بسم الله الرحمـن الرحيم 428 عال (تعريب الحاسبات) عنوان البحث ( تحويل النصوص العربية إلى صوت ) أسماء المجموعة: • منصور العثمان • ياسر النخلي • ماجد الشمري

  2. مقدمة • ما هو برنامج تحويل النص إلى صوت؟ "تحويل النص إلى صوت Text-To-Speech ويمكن اختصارها إلى TTS هو برنامج حاسوبي يقوم بقراءة النص و من ثم نطق النص بصوت مرتفع ، سواء تم إدخال النص من المستخدم مباشرةً أو عن طريق تمرير ملف نصي سبق كتابته باستخدام برامج الكتابة النصية المختلفة."

  3. تاريخ برامج التحويل TTS 1- Apple: كانت أول النظم التي تدعم TTS و ذلك في سنة 1984م باستخدام برنامج MacInTalk و تم تطويرها بإضافة عينات صوتية أكثر جودة و حالياً تم الاعتماد على برنامج VoiceOver في أنظمة تشغيل Mac OS X. 2- Microsoft: كانت بدايتها عن طريق برامج الطرف الثالث (Add-On) و كان ذلك لنظام التشغيل Win 95 و Win 98 و من إصدار Win2000 أصبح الـTTS جزء من النظام.

  4. من يستخدم برامج TTS ؟ • من يعاني من مشكلة القراءة: 1) المكفوفين. 2) الذين يعانون من ضعف النظر. 3) من يعاني من اضطراب القراءة (Dyslexia). 4) الأميين. • من يستخدمها للتسهيل في العمل: 1) سماع الملف أثناء الانشغال بأمور أخرى مثل:(القيادة , العمل اليدوي .... الخ). 2) للذين ترهقهم القراءة لفترة طويلة.

  5. من يستخدم برامج TTS ؟ • من يستخدمونها تجارياً: 1) بعض الشركات تستخدم هذه البرامج للرد الآلي (هاتف خدمة العملاء). 2) استخدام بعض الشركات لهذه البرامج لتطوير أجهزتها (جهاز Kindle من شركة Amazon).

  6. أبرز المشاكل و الصعوبات التي ظهرت لدى TTS • حروف تنطق ولا تكتب و حروف تكتب ولا تنطق. • علامات الضبط بالشكل. • قراءة الأرقام. • الاختصارات. • النطق الصحيح للكلمة Pronunciation.

  7. المراحل التي تمر بها عملية تحويل النصوص إلى صوت والأدوات المستخدمة. • المرحلة الأولى : تحليل النص • المرحلة الثانية: توليد الكلام

  8. المرحلة الأولى: تحليل النص 1- تطبيع النص Text Normalization: • تقسيم الجملة إلى عدة كلمات مع مراعاة الفارق الزمني. • تفسير الأرقام أو الرموز. • عزل الكلمات ضمن النص. • معالجة علامات الترقيم. • مراعاة ما إذا كان هناك لام شمسية أو شدة أو مد ... إلخ.

  9. المرحلة الأولى: تحليل النص • 2 - إزالة الغموض الكتابي Homograph Disambiguation : • إعراب الكلمة بشكل صحيح. 3- نطق الكلمة Word Pronunciation: • انتاج سلسلة من المقاطع الصوتية (الترميزات الصوتية phonemes ).

  10. المرحلة الأولى: تحليل النص • 4 - العروض Prosody : • " العروض هو عبارة عن تحديد حدة وسرعة وحجم الصوت الذي يستخدم لنطق المقاطع الصوتية والكلمات والجمل" • البحث عن علامات الترقيم . • تركيب وترتيب هذه المعلومات مع بعضها. • توليد النص الكلي. • الناتج النهائي: قائمة من الترميزات الصوتية مع الحدة والسرعة والحجم لكل مقطع.

  11. المرحلة الثانية: توليد الكلام • 1 - تشغيل الصوت play Audio : • طريقة تسجيل الترميزات الصوتية: المشكلة: حدة وسرعة الصوت عند نهاية الكلمة تختلف عنها في حال ورود الفونيم في بداية الكلمة. الحل: التقليل من الخلل عن طريق دمج حواف المقطعين.

  12. المرحلة الثانية: توليد الكلام • المشكلة: • الصوت المنطوق لكل فونيم (ترميز صوتي) يتأثر بشكل واضح بالترميزات الصوتية المحيطة به. • الحل: • تسجيل جميع المقاطع الصوتية الممكنة لكل ترميز

  13. المرحلة الثانية: توليد الكلام • 2 - توليد الصوت Generating the Voice: • قراءة مقاطع نصية تحتوي على جميع الاحتمالات الممكنة للفونيمات. • تمرير النص الناتج إلى برنامج يتعرف على الصوت. • تخزين المقاطع الصوتية في قاعدة البيانات.

  14. المرحلة الثانية: توليد الكلام • 3 - تحضير التسجيلات الصوتية Preparing of the Record: أ - تسجيل جميع المقاطع الممكنة في اللغة العربية. من عيوبها: تحتاج إلى تسجيل ما يفوق على 2000 مقطع صوتي لتغطية اللغة • من مميزاتها أنها ذات نتائج دقيقة. ب - تسجيل الحرف والحركة بشكل منفصل • تسجيل 31 ملف صوتي • فصل الحركات عن الأحرف • من عيوبها: أنها تفتقرإلى الدقة

  15. المرحلة الثانية: توليد الكلام • ج – تسجيل كل حرف مع جميع الحركات الممكنة. • تسجيل 115 ملف صوتي.

  16. المرحلة الثانية: توليد الكلام 4 - توليد الترميز الصوتي للنص المنطوق Generating graphemes: • الجدول التالي يوضح الطريقة التي تستخدم في الترميز

  17. المرحلة الثانية: توليد الكلام مثال: • أ + َ • *الالف تمثل ب 1 • *الفتحه تمثل بالرقم 1 • *تصبح النتيجة 1_1 الفتحة بـ 1 والضمة بـ 2 والكسرة بـ 3 والسكون بـ 4

  18. قواعد النطق في اللغة العربية 1-اللام القمرية واللام الشمسية : 1.1-اللام القمرية: اذا تليت بأحد الحروف الاربعة عشر المجموعه في (ابلغ حجك وخف عقيمه). 2.2-اللام الشمسية: اذا تليت بأحد الحروف الاربعة عشر وهي (ط، ث، ص، ر، ت، ض، ذ، ن، د، س، ظ، ز، ش، ل(.

  19. قواعد النطق في اللغة العربية 2-التنوين: في حالة ورود التنوين على أحد الحروف غير المعتله يمكن تقسيمها كالتالي: • تنوين الضم : يستبدل التنوين بضمة يليها نون ساكنة.(بيتٌ كبير) تصبح (بيتُنْ كبير ). • تنوين الفتح: يستبدل التنوين بفتحة يليها نون ساكنة. • تنوين الكسر : يستبدل التنوين بكسر يليها نون ساكنة. ملاحظة: في حال ورود التنوين على الالف نقوم بحذف الألف والنون ونستبدلهما بنون ساكنة مثل (سالماً) تصبح (سالمنْ)

  20. قواعد النطق في اللغة العربية 3-حروف المد : يمكن حذف حرف المد اذا تلاه في الكلمة التالية حرف ساكن عند الوقف عليه مثل (في البيت ) تصبح (فلبيت). أيضا يمكن حذف المد اذا تلاه في الكلمة تنوين ساكن مثل (فتىً ) لتصبح (فتَنْ). 4-تاء التأنيث: تقرأ هاء إذا تم الوقف عليها عند النطق . وتنطق تاء اذا تم وصلها في النطق.

  21. قواعد النطق في اللغة العربية 5-فك المد والتضعيف : 5.1- الشدة في اللغة الغربية توضح بأنه يجب لفظ الحرف مرتين .فيتم استبدال الشدة بحرف ساكن من نفس الحرف ويحافظ الحرف الذي عليه حركت الشده على حركتة. مثل ” السَّلام ” تصبح ” السْسَلام“. 5.2- المد يفك الى عناصره المفردة أي همزة مع ألف مدية . مثل ” آمين ” تصبح ”أامين“

  22. استحصال الرموز Tokenization خطوات استحصال الرموز: 1-مسح كامل النص وتحديد الكلمات. 2-وضع فواصل بين الكلمات وتحديد حركة كل حرف . 3-يوضع سكون للحرف الذي لايملك حركة. يمكن تطبيق القواعد السابقه رقم 2 و 5 على هذه الطريقة.

  23. توليد الترميز الصوتي Grapheme • تحديد مواضع احرف المد عن طريق مسح مخرجات الخطوة الاولى . • تطبيق القواعد 1 و3 و 4 . • يتم تعيين مواضع الوقف بين الكلمات ليتم توليد الترميز الصوتي ( أسماء الملفات الصوتية ) لكل حرف سيتم نطقه.

  24. أهم أشهر البرامج في مجال تحويل الصوت. • البرنامج العربي: للأسف الشديد لايوجد برنامج عربي كامل للتحويل ولكن يوجد هناك طرق يمكن اتباعها لكي نطوع البرامج الاجنبية لتلبي احتياجاتنا . ويمكن استخدام البرامج التاليه لكي تساعدنا في عملية التحويل وهي Euler + MBROLA وخطوات تشغيل اللغة العربيه في هذا البرنامج هي كالتالي: 1-تحميل المكتبة الصوتية الخاصه في اللغة العربيه من خلال الرابط التالي http://tcts.fpms.ac.be/synthesis/mbrola/dba/ar1/ar1-981103.zip

  25. أهم وأشهر برنامج تحويل النص الى صوت بالاضافة الى تحميل المكتبة الاخرى من الرابط التالي http://tcts.fpms.ac.be/synthesis/mbrola/dba/ar2/ar2-001015.zip بعد ذلك يجب تحميل برنامج MBROLA Tools من الرابط التالي http://tcts.fpms.ac.be/synthesis/mbrola/mbrolatools.html بعد التثبيت يتم اضافة قواعد البيانات للمكتبتين الصوتيتين من خلال الضغط على اضافة قاعدة الموجود في MBOROLA

  26. أهم وأشهر برنامج تحويل النص الى صوت بعد الانتهاء من تثبيت المكتبتين يمكن الان فتح البرنامج Euler v2.0 ومن ثم كتابة النص الذي تريده والصوره التاليه توضح الشكل العام للبرنامج بعد تثبيت المكتبات. هنا يمكن كتابة النص الذي تريد هنا يمكن اختيار المكتبة الصوتية من هنا يمكن قراءة النص

  27. أهم أشهر البرامج في مجال تحويل الصوت. البرنامج الانجليزي: برنامج Text Speaker لتحويل النص الانجليزي إلى صوت الإصدار الثالثة ويمكن تحميل نسخه منه عن طريق http://www.brothersoft.com/text-speaker-173158.html واجهة البرنامج :

  28. أهم أشهر البرامج في مجال تحويل الصوت.

  29. أهم أشهر البرامج في مجال تحويل الصوت. أهم مايميز البرنامج : • -استخدامه سهل و بسيط. • -يمكن تغيير الصوت من بين الجنسين و تعديل سرعة القراءة و قوة الصوت و حدته. • -بإمكان البرنامج فتح ملفات بصيغ (.pdf , .txt , .doc , .docx , .html) و القراءة منها مباشرتاً. • -يمكن حفظ الصوت إما بصيغة MP3 أو WAV

  30. الخلاصة • من خلال هذا البحث يتضح لنا بعض الأمور الجديدة التي قد تساعد المستخدمين بشكل عام و المبرمجين بشكل خاص على كيفية عمل برامج التحويل النص إلى صوت و يمكن أيضاً الاستفادة من هذه المعلومات لعمل برنامج يقوم بتحويل الصوت إلى نص (عملية عكسية تقريباً). و من خلال التطور المستمر لهذه البرامج يمكن أن نرى في المستقبل برامج تقارب الواقع إلى حد كبير في نطق و قراءة النص بدون المشاكل التي ذكرناها سابقاً. • وللأسف لم نجد برامج تدعم اللغة العربية ذات جودة عالية يمكن استخدامها للأعمال اليومية بمستوى البرامج التي تدعم اللغة الانجليزية و نتمنى من الشركات العربية تطوير مثل هذه البرامج للحفاظ على الطابع العربي في مجال الحاسب و التطور التقني.

More Related