رد: التمثيل الرقمي
اقتباس:
المشاركة الأصلية كتبت بواسطة داؤد بغدادي
|
الجزء الثاني
ماعلاقة الشرح السابق بالتسجيلات الصوتية ؟
الصوت أو الاشارات الصوتية هي مثل الصور تحوي على معلومات كثيرة وعند محاولة تسجيلها فانها قد تفقد بعض تلك المعلومات سواء كانت طريقة الخزن تماثلية (اشرطة الكاسيت او البكرات أو الأشرطة الفيديوية) أو طريقة الخزن الرقمية (الكومبيوتر أو أجهزة التسجيل الرقمي)
بالنسبة للتسجيل التماثلي فان نوعية الصوت تعتمد كثيرا على نوعية الأجهزة من مايكروفونات ومقويات الصوت وأجهزة التسجيل (أو الخزن) ومادة الخزن (انواع الأشرطة) وكلما كانت تلك الأجهزة ذات جودة عالية سيكون التسجيل عالي الجودة ولكن بالرغم من كل ذلك فان الصوت المسجل ليس هو نفسه الصوت الاصلي بسبب التغيرات التي تطراء عليه في تلك المراحل كذلك يدخل التشويش في التسجيل وهو شي لايمكن التخلص منه ابدا ولكن يمكن تقليله
وان اي عملية نقل او استنساخ لذلك التسجيل ستغيره (التسجيل الجديد أو المستنسخ) وتضيف اليه تشويش جديد
كذلك التسجيل الأصلي يفقد خواصه ويضعف بمرور الوقت وبالاستعمال المتكرر او ربما ميكانيكيا (كما نقول ينعلس الشريط)
بالنسبة للتسجيل الرقمي فالعملية أبسط وأفضل لاننا نحتاج فقط للمايكرفون و مقويات الصوت وبعدها يحول الصوت الى العالم الرقمي وتنتهي مرحلة التشويش (مؤقتا ـ سنشرح هذا لاحقا) والمعلومات المخزنة يمكن نسخها واستعمالها ألاف المرات من دون ان تتغير
كيف تتم عملية التسجيل الرقمي ؟
التسجيل الرقمي يشبه تماما التقاط الصور الرقمية حيث اننا نحتاج الى تسجيل نقاط (تسمى العينات) وقيمة كل عينة (مثل اللون في الصورة) (كما في الشكل رقم 5) وهي النقاط الحمراء الصغيرة والتي تقع على اشارة الصوت (الخضراء)
(الشكل رقم 5)

النقاط (أو العينات) تاخذ بابعاد زمنية ثابتة وعدد هذه النقاط في الثانية الواحدة يسمى بالـ (Sampling Rate) والذي نلاحظه في التسجيلات ونقراء عنه في المناقشات وهو ذات قيم ثابتة (تقريبا) والأكثر شهرة مثلا 16000 و 22050 و 32000 و 44100 و 48000 و 96000
وكلما زادت العينات (الـ Sampling Rate) ازدادت دقة وجودة التسجيل واصبح التسجيل أقرب للأصل وهي تشبه بالضبط موضوع الميكا بيكسل بالنسبة للكاميرات (لاحظ الشكل رقم 3 اعلاه)
والسؤال المهم هنا هو أي تلك القيم أفضل أو أي القيم يفضل استخدامها؟
طبعا أفضل القيم هو الأعلى بالتأكيد ولكن يجب ان نعلم لماذا هناك هذا العدد الكبير من القيم اذن؟
ولتوضيح الفكرة ساعود لموضوع الصور فلو كانت لدينا صورة مكونة من مجموعة من الأشكال البسيطة (مما يعني ان الصورة تحتوي على معلومات قليلة ـ لاتوجد تفاصيل كثيرة) وقمنا بالتقاط صورتين واحدة بدقة عالية (الصورة اليسرى) واخرى منخفضة الدقة (الصورة اليمنى) لوجدنا ان الصورة منخفضة الدقة لاتزال مقبولة وهي لا تختلف كثيرا عند مقارنتها بالاخرى (كما في الشكل رقم 6)
(الشكل رقم 6)
ونفس الفكرة تنطبق على الصوت فلو كان لدينا تسجيل صوتي (مقابلة مثلا) يحوي معلومات صوتية قليلة لكونه كلام عادي (بدون غناء - أي لايحوي طبقات صوتية عالية) عندها نستطيع استخدام قيمة منخفضة للـ (Sampling Rate) وسيكون هنالك بالطبع خسارة في بعض صفات الصوت ولكن الكلام سيبقى مفهوما وواضحا
ولكن أي القيم السابقة ؟
ان القيمة المناسبة للـ (Sampling Rate) تحسب بطريقة علمية وهي تساوي (على الأقل) ضعف التردد الأعلى للاشارة الصوتية (وينصح أن تكون 2.5 من التردد الأعلى) وهذا يعني التالي:
من المتفق عليه ان الاشارة الصوتية لكلام الانسان تترواح في المنطقة (300-3400Hz) وخطوط التلفون عادة ما تحدد هذا الرقم بـ 4400Hz وهذا يعني ان علينا استخدام Sampling Rate بمقدار
2.5x4400=11000Hz
والسبب في هذا الرقم الثابت (2.5) هو مايسمى بمشكلة الـ (Aliasing) ولا اريد ازعاجكم بهذا الموضوع ولكن للراغبين بقراءة المزيد عن الموضوع الدخول الى موقع الويكيبيديا على الرابط (http://en.wikipedia.org/wiki/Aliasing)
بالطبع لو استعملنا Sampling Rate أعلى لتسجيل المثال السابق لحصلنا بالتأكيد على تسجيل أفضل ولكن سيكون لدينا ملف صوت أضخم يتناسب مع قيمة الـ Sampling Rate
بالنسبة للملفات الموسيقية ذات الوضوح العالي (نوعية السي دي) فلابد لها من تغطية المجال الصوتي للسماع عند الانسان والذي تتراوح قيمته العليا بين 18-20kHz وعليه يتم تحديد الـ Sampling Rate بالشكل التالي
18000x2.5=45000
وبهذا يتم استعمال القيمة 44100Hz وهناك حاليا ديفيديات صوتية (Audio DVD) يتم الخزن فيها بنوعيات أعلى و بعدد قنوات أكبر (خمس او ست قنوات بدل اثنين - ستيريو)
لقد ذكرنا سابقا في شرح موضوع الصور ان من الخواص المهمة للصورة هو عدد الألوان وهنا في التسجيلات الصوتية الرقمية ينطبق نفس المثال السابق حيث ان كل عينة (نقطة) من العينات يتم تسجيل قيمتها باستخدام 16bit وهذا أيضا أصبح من الثوابت حيث ان جميع كارتات الصوت للكومبيوترات الحالية يمكنها التسجيل بدقة 16bit وبرامج التسجيل والمعالجة الصوتية يمكنها التعامل مع هذه الدقة وعند خفص هذه القيمة يمكن ان نفقد الكثير من خصائص التسجيل الصوتي كما حصل في موضوع الصورة في الشكل رقم 4 أعلاه عند خفض عدد الألوان
كما توجد أجهزة تسجيل أو كارتات صوت يمكنها التعامل مع 24bit أو 32bit
والشكل التالي يوضح هذه المصطلحات (كما في الشكل رقم 7)
(الشكل رقم 7)

حيث ان الزمن الفاصل بين عينتين هو زمن العينة (كما موضح باللون الأخضر)
قوة الأشارة مقسمة الى 65536 تدرج
الأشارة الصوتية تتمثل باللون الأحمر
الأشارة الرقمية تتمثل باللون الأزرق
ونستطيع أن نستنتج من الشكل ان التسجيل الرقمي لا يتطابق 100% مع الاشارة الأصلية و الطريقة الوحيدة لتقليل ذلك الفرق هو بزيادة عدد العينات (Sampling Rate) وزيادة دقة الاشارة 24bit أو 32bit بدلا من 16bit ولكن هذا يعني في نفس الوقت زيادة حجم الملف الصوتي بصورة كبيرة
وكمثال عن الحجم المطلوب للتسجيل هو الأقراص الصوتية (السي دي) تستخدم 44100 عينة بالثانية وبدقة 16bit للعينة وقناتان للصوت (ستيريو) وبذلك يمكن بسهولة حساب سعة السي دي بالشكل التالي
حجم السي دي هو
700Mega byte=700x1024x1024=734003200 byte
ثانية واحدة من التسجيل تستهلك
44100x 2(16bit=2byte) x 2(Stereo) =176400 byte
دقيقة واحدة من التسجيل تستهلك
60x 176400 = 10584000 byte
وبتقسيم النتيجتين الأولى والثالثة نحصل على حوالي 70 دقيقة
734003200/10584000 = 69.3
بالطبع هذا هو حال الملفات الصوتية الغير مضغوطة مثل الـ (.wav) لذا نرى ان هذا النوع من الملفات لايستخدم كثيرا لانه يستهلك مساحة كبيرة حيث لاحظنا من المثال السابق ان 700 ميكا تساوي تقريبا 70 دقيقة أي 10 ميكا للدقيقة الواحدة (على افتراض ان التسجيل 44100 وبدقة 16bit وستيريو)
ولذلك كان لابد من ظهور صيغ خزن جديدة (بدل الـwav ) لتجاوز مشكلة الحجم وخصوصا مع تزايد انتشار وتوسع عالم الانترنت والحاجة الى صيغ أصغر حجما في كثير من التطبيقات كما في محطات البث الراديوي على الانترنت فكان ظهور صيغ الريل بلاير و الويندوز ميديا وغيرها الكثير
... يتبع ...
التعديل الأخير تم بواسطة : داؤد بغدادي بتاريخ 13/12/2010 الساعة 07h17
|