com.jkelany

البحث عن أفضل بروتكول لنقل الصوت والصورة

1 مشاركة في هذا الموضوع

بسم الله لنبدأ،

4- البحث عن أفضل بروتكول لنقل الصوت والصورة

الفيديو أمر معقد لأنك ستحتاج لإجراء تزامن ما بين الصوره و الصوت و كذلك الـ encoding لكلاهما معا لذا اقترح تأجيله فى هذا الإصدار

لأنه بمجرد الإنتهاء من الصوت سيصبح الأمر سهل لتضمين الفيديو، نفس الكلام ينطبق على الـ voice conference حيث لن أتحدث عنه الأن.

كل ابتكار يبدأ بسؤال بسيط و هو ما/ماذا و يتطور السؤال ليصبح كيف،

فى حالتنا هذه يصبح السؤال ما هو الصوت و بعد معرفته يتطور السؤال ليكون كيف يتم التعامل معه؟

ما هو الصوت؟

الصوت هو ترددات تتحرك فى شكل دائرى بدءا من منبعها و فى كل اتجاه،

هذه الترددات تمثل بنية الصوت و تقاس بـ هرتز و تكتب Hz و هي تمثل عدد الترددات فى الثانيه الواحده.

يتحرك الصوت داخل الأوساط الماديه تقريبا بسرعة 340 متر\ثانيه.

الأذن البشريه تستطيع تمييز الأصوات فى مدى من 20 هرتز إلي 20 كيلو هرتز،

الترددات الصوتيه متسلسله بمعني إن كانت منابع الصوت عديده

فإنه يتم دمج هذه الحزم الصوتيه معا عندما تصل للهدف الذى يستقبلها،

و مع العلم انك تسمع اكثر من شخص فى نفس الوقت

إلا ان الصوت نفسه داخل أذنك تم دمجه ليصبح حزمه صوتيه واحده.

شدة الصوت هو مدى ارتفاع تردد الصوت و تقاس بالـ ديسيبل و تكتب dB

و هي درجة الصوت ما بين اقل تردد و اعلي تردد بمعني عندما يكون أقل التردد 20 هرتز تكون شدة الصوت صفر ديسيبل

و عندما يكون أعلى تردد 20 كيلو هرتز تكون شدة الصوت 100 ديسيبل، لاحظ اني هنا استخدمت نسبه مئويه لحساب ديسيبل فى المدى من 0 إلى 100.

يوجد مصطلح أخر خاص بالصوت و هو Pitch - لا اعرف معناها بالعربيه،

هذا المصطلح يتشابه فى العديد من الخصائص مع التردد

و لكنه يختلف عنه فى انه يمثل التردد او الترددات التى تقابل نغمه معينه،

هذه النغمات هى التى تستخدم فى عالم الموسيقي.

كيف يتم التعامل مع الصوت؟

الصوت داخل الكمبيوتر لا يختلف عما هو خارجه إلا فى شئ واحد و هو ان الصوت

الذى لديك فى الأغلب يكون فى المدى المسموع سواء كان شدة الصوت عاليه بشده

لدرجة انك لا تستطيع تميزيها او منخفضه بشده لدرجة انك لا تستطيع سماعها.

عملية خفض الصوت العالي أو رفع شدة الصوت المنخفض لمنطقه يمكن سماع الصوت

بها بشكل واضح تسمي normalization او جعله طبيعي فمثلا عندما تسجعل من المايك

تستطيع قياس شدة الصوت و من خلالها تستطيع تحديد هل الصوت المدخل مرتفع او منخفض

و بناءا عليه تستطيع حفض او رفع درجة صوت التسحيل - مثلما يحدث فى برنامج skype.

أبسط صوره يتم تمثيل الصوت بها داخل الكمبيوتر تكون على شكل PCM اى سلسلة من Pitch

و تتيح لك هذه الطريقه معالجة الصوت كما تريد، أحد الانواع التى تحتفظ ببيانات الصوت بهذا الشكل هو wav،

و لكن عملية الإحتفاظ بالصوت على هذه الهيئه مكلف بشده لأنه يجعل من حجم البيانات كبير جدا

لذا نحتاج لضغط هذه البيانات مع الإحتفاظ بهذه الجوده، الطرق التى تضغط الصوت

و تبقى على جودته تسمي بـ Lossless Audio compression methdos و من امثلتها FLAC

و الأنواع التى تضيع معها جودة الصوت عند الضغط تسمي بـ Lossy Audio compression و من امثلتها mp3.

المقصود بـ Lossless هو امكانية حفظ الصوت داخل أقل مساحه ممكنه دون

الإخلال بأى من محتواه، المقصود بالـ Lossy هو امكانية حفظ الصوت داخل اقل

مساحه مع إمكانية حفض مستوى الصوت فى بعض المراحل.

تركيزنا سيكون على الـ Lossy compression حيث هو المستخدم مع VoIP

وبرامج الشات و كبدايه يمكنك القراءه عن G.711 و إليك مثال تطبيقي بالـ #C

الجزء الخاص بالبروتوكول سأكتب لك تفاصيله لاحقا.

و الله ولي التوفيق

شكرا جزيلا للاخ العزيز محمد علاء الدين

1

شارك هذا الرد


رابط المشاركة

من فضلك سجل دخول لتتمكن من التعليق

ستتمكن من اضافه تعليقات بعد التسجيل



سجل دخولك الان
  • يستعرض القسم حالياً   0 members

    لا يوجد أعضاء مسجلين يشاهدون هذه الصفحة .