แนวทางการออกแบบระบบโทรศัพท์ผ่านไอพี
บทความนี้เป็นคำแนะนำที่ครอบคลุมประเด็นต่าง ๆ ซึ่งเกี่ยวข้องกับการออกแบบระบบโทรศัพท์ผ่านไอพี
ซึ่งจะครอบคลุมถึงการออกแบบ VoIP (Voice over Internet Protocol) ซึ่งเป็นเทคโนโลยีที่ทำให้ข้อมูล
เสียงสามารถเดินทางผ่านเครือข่ายแลนหรือแวน (Data) มาตรฐานได้ อย่างไรก็แล้วแต่นับเป็นสิ่งสำคัญที่ควร
จะต้องทำความเข้าใจกับเทคโนโลยีที่ใช้ เพื่อให้การออกแบบระบบโทรศัพท์แบบนี้มีประสิทธิภาพมากที่สุด ถึง
แม้ว่าจะประสบความสำเร็จในการติดตั้งระบบโทรศัพท์ผ่านไอพีในแลนแล้ว แต่ก็ไม่ได้รับประกันว่า การติดตั้ง
และใช้งานกับเครือข่ายแวนจะไม่มีปัญหาเกิดขึ้น บทความจึงมีรายละเอียดทั้งที่เกี่ยวข้องกับการออกแบบและ
ติดตั้งระบบโทรศัพท์ผ่านไอพีกับระบบแลนและแวน เพื่อให้สามารถใช้ประโยชน์จากเทคโนโลยีนี้ได้อย่างเต็มที่
ความต้องการแบนด์วิดธ์ของการสื่อสารด้วยเสียง (Voice Bandwidth Requirements)
ปกติในการสื่อสารด้วยเสียงนั้น สายเช่า T1 สามารถรองรับการสนทนาผ่านโทรศัพท์ 24 คู่สาย โดยการ
เชื่อมต่อบนสายเช่านี้จะถูกใช้งานจาก Public Switched Telephone Network (PSTN) ซึ่งสายเช่า T1
เป็นการเชื่อมต่อแบบจุดต่อจุดพร้อมด้วยความสามารถในการบีบอัดข้อมูลเสียงให้มีขนาดเล็กลงได้ถึง 8
กิโลบิตต่อวินาที (แต่คุณภาพของเสียงก็จะแย่ลงตามไปด้วย) โดยปกติแล้ว ในระบบโทรศัพท์จะมีรูปแบบการ
มอดูเลตข้อมูลซึ่งนิยมใช้ในการเข้ารหัสข้อมูลเสียงอยู่ 3 แบบคือ
- 64 กิโลบิตต่อวินาที (PCM) / 1.544 เมกะบิตต่อวินาที รองรับ 24 คู่สายบนสายเช่า T1
- 32 กิโลบิตต่อวินาที (ADPCM) / 1.544 เมกะบิตต่อวินาที รองรับ 48 คู่สายบนสายเช่า T1
- 8 กิโลบิตต่อวินาที (CELP) / 1.544 เมกะบิตต่อวินาที รองรับ 120 คู่สายบนสายเช่า T1
สิ่งที่จะต้องให้ความสำคัญก็คือ แบนด์วิดธ์ที่ต้องใช้ในการสื่อสารผ่านระบบเครือข่ายแวนเนื่องจาก
แบนด์วิดธ์ของจุดเชื่อมต่อต่าง ๆ ที่มีอยู่จำกัด จึงต้องมีการประเมินความต้องการใช้งานสำหรับการสื่อสารด้วย
เสียงให้เพียงพอด้วย
ความต้องการแบนด์วิดธ์ของ VoIP (Voice over IP Bandwidth Requirements)
จากข้อมูลแบนด์วิดธ์ที่ต้องการในการสื่อสารด้วยเสียงนั้นจะเห็นได้ว่าแบนด์วิดธ์ที่ต้องการบนดาต้า
เน็ตเวิร์กอย่างเครือข่ายแลน นับว่าค่อนข้างน้อยถ้าเทียบกับแอพพลิเคชันที่มีอยู่ การที่โทรศัพท์หนึ่งสายจะใช้
แบนด์วิดธ์ 64 กิโลบิตต่อวินาที หรือคิดเป็น 0.0625 เปอร์เซ็นต์ ของแบนด์วิดธ์ที่เครือข่ายแลนแบบ Full
Duplex 100 เมกะบิตต่อวินาทีมีเท่านั้น
เมื่อคำนวณอย่างละเอียดแล้ว บนเครือข่ายอีเทอร์เน็ตความเร็ว 100 เมกกะบิตต่อวินาทีนั้น โทรศัพท์หนึ่ง
สายจะใช้แบนด์วิดธ์ประมาณ 85.6 กิโลบิตต่อวินาที (64 กิโลบิตต่อวินาที+ไอพีเฮดเดอร์+อีเทอร์เน็ต
เฮดเดอร์) ถ้าเป็นการสื่อสารทางเดียวจะรองรับโทรศัพท์ได้ทั้งหมด 1,160 สายพร้อม ๆ กันบนเครือข่ายแบบ
Full Duplex แต่ถ้าใช้แบ็กโบนในระดับเป็นกิกะบิตอีเทอร์เน็ตด้วยแล้ว ก็จะรองรับโทรศัพท์ได้ถึง11,600
สายเลยทีเดียว
อย่างไรก็ตามถ้าแบนด์วิดธ์เป็นปัจจัยเพียงอย่างเดียว เทคโนโลยีของระบบโทรศัพท์ผ่านไอพี คงจะได้รับ
ความนิยมมาเป็นเวลานานแล้ว แต่ปัญหาที่แท้จริงนั้นอยู่เวลาในการตอบสนอง (Respons Time) เพราะใน
ระบบเครือข่ายจะต้องให้บริการแอพพลิเคชันทางธุรกิจ ที่ต้องใช้แบนด์วิดธ์จำนวนมาก ซึ่งก่อให้เกิดปัญหา
ความล่าช้า (Delay) ในการส่งข้อมูล โดยเฉพาะการสื่อสารด้วยเสียงที่ข้อมูลต้องได้รับการถ่ายโอนโดยใช้เวลา
ให้น้อยที่สุดได้อย่างเพียงพอ ดังนั้นเทคโนโลยีที่ถูกนำมาใช้เพื่อแก้ปัญหานี้ก็คือ QoS ที่มี Bandwidth
Manager หรือ Complex Queuieng Scheme คอยทำหน้าที่จัดลำดับความสำคัญให้กับข้อมูลบนเครือ
ข่ายแลนและแวน
คุณภาพของเสียง (Voice Quality)
ถ้าพูดกันตามตรงแล้ว คุณภาพของเสียงจะดีหรือแย่นั้นขึ้นอยู่กับผู้ใช้ (หรือที่เรียกว่า Subjective เพราะ
คนสองคนอาจจะบอกว่าคุณภาพของเสียงดีไม่เท่ากัน ถึงแม้ว่าจะฟังจากคู่สายเดียวกันก็ตาม) หลายปีที่ผ่านมา
มีงานวิจัยที่พยายามอธิบายพฤติกรรมของมนุษย์ต่อคุณภาพเสียงที่ได้ยิน ซึ่งข้อมูลเหล่านี้ถูกใช้เป็นพื้นฐานใน
การวัดข้อหนึ่งก็คือ Mean Opinion Score (MOS) ซึ่งได้รับการกำหนดอยู่ใน Recommendation P.800
โดย International Telecommunications Union (ITU) ด้วยการแมประหว่างคุณลักษณะของเครือข่าย
กับคุณภาพของเสียงที่วัดได้ ทำให้องค์กรสามารถวางแผนและปรับแต่งระบบเครือข่ายได้อย่างมีประสิทธิภาพ
คะแนน MOS นั้นแบ่งเป็นช่วงตั้งแต่ 1 (ไม่แนะนำให้ใช้) ถึง 5 (พึงพอใจมาก) อย่างไรก็ตาม ตัวเข้า/ถอด
รหัสเสียง (Voice Codec) ที่ใช้งานกันอยู่นั้น ก็มีคะแนนเบนซ์มาร์กที่เกิดจากปัจจัยหลาย ๆ อย่างประกอบกัน
เช่น ค่าหน่วงเวลา (Delay) ของแพ็กเก็ตไปจนถึงคุณภาพที่เสียไปอันเนื่องจากการแปลงสัญญาณเสียงจาก
อะนาล็อกเป็นข้อมูลดิจิตอล โดยคะแนน MOS สูงสุดของตัวเข้า/ถอดรหัสนั้นอยู่ที่ 4.5 สำหรับตัวเข้า/ถอด
รหัสแต่ละตัวนั้นจะมีค่า MOS ไม่เท่ากันขึ้นอยู่กับคุณสมบัติหลาย ๆ อย่างได้แก่ ความเร็วในการแปลงสัญญาณ
เสียงพูดและข้อมูลที่สูญเสียไปในระหว่างการรับส่งข้อมูล โดยในตารางได้แสดงรายการของตัวเข้า/ถอดรหัส
พื้นฐานที่มีใช้งานอยู่ใน VoIP รวมทั้งค่า MOS สูงสุดตามทฤษฏีด้วย
สำหรับเครือข่ายแต่ละแบบย่อมมีค่า MOS ที่แตกต่างกัน ขึ้นอยู่กับ QoS, ค่าหน่วงเวลาในการส่งข้อมูล
รวมทั้งชนิดของตัวเข้า/ถอดรหัสที่ใช้ โดยเมื่อติดตั้งระบบโทรศัพท์ผ่านไอพีลงไปแล้วระบบเครือข่ายก็ควรที่
จะให้ค่า MOS สูงสุดสำหรับคุณภาพเสียงที่ดีที่สุดตามทฤษฏีด้วย โดยปกติแล้วค่า MOS ที่สูงกว่า 4.0 นั้นถือ
ว่ามีคุณภาพเสียงที่ดีเทียบเท่ากับการสื่อสารผ่านโทรศัพท์มาตรฐานแล้ว
การแปลงเสียงเป็นแพ็กเก็ตข้อมูล (Converting Voice into Data Packets)
Digital Signal Processors (DSP) เป็นเอ็นจิ้นในการเข้ารหัสเสียง ถูกนำมาใช้ในระบบโทรศัพท์ผ่าน
ไอพี สำหรับ DSP นั้นเป็นโพรเซสเซอร์ชนิดพิเศษซึ่งถูกใช้มานานแล้วในแอพพลิเคชันที่เกี่ยวข้องกับโทรศัพท์
อย่างเช่น โทรศัพท์เคลื่อนที่ เป็นต้น DSP ต้องทำงานได้เร็ว เพื่อตอบสนองความต้องการของกิจกรรมในการ
สนทนาผ่านโทรศัพท์ ซึ่งต้องใช้การคำนวณจำนวนมาก อย่างไรก็ตาม ฟังก์ชันหลักของ DSP คือ ทำหน้าที่
แปลงเสียงที่อยู่ในรูปของสัญญาณอะนาล็อกให้กลายเป็นแพ็กเก็ตข้อมูล ทั้งนี้เพื่อจะได้สามารถส่งไปบนเครือ
ข่ายไอพีได้นั่นเอง
อย่างไรก็ตาม DSP นั้นยังทำหน้าที่ในการเข้ารหัส (หรือบีบอัดให้มีขนาดเล็กลง) ข้อมูลที่ได้รับการแปลง
สัญญาณจากอะนาล็อก ให้เป็นไปตามมาตรฐานซึ่งได้กำหนดไว้ ที่สำคัญ DSP ยังทำหน้าที่ลดสัญญาณรบกวน
ที่ไม่ใช่เสียงของมนุษย์ให้น้อยลง จนอยู่ในระดับที่จะไม่ก่อให้เกิดปัญหาต่อการสื่อสารอีกด้วย
ตามปกติแล้วอัลกอริทึมในการเข้ารหัสเสียง ที่ใช้ในระบบโทรศัพท์ผ่านไอพีบนเครือข่ายแลนนั้น จะเป็น
G.711 โดยมีการแบ่งข้อมูลเสียงออกเป็นแพ็กเก็ตที่ต้องส่งด้วยความเร็ว 64 กิโลบิตต่อวินาที (เทียบเท่ากับ
คุณภาพเสียงในโทรศัพท์ปกติ) อย่างไรก็ตามยังมีอัลกอริทึม และรูปแบบการบีบอัดข้อมูลอื่น ๆ อย่าง
G.729a และ G.723 ซึ่งเป็นที่นิยมในการสื่อสารผ่านระบบแวน แต่มีแบนด์วิดธ์จำกัด รวมทั้งต้องการรูปแบบ
การบีบอัดข้อมูลที่มีประสิทธิภาพสูง อย่างไรก็ตามระบบโทรศัพท์ผ่านไอพีมักใช้ตัวเข้า/ถอดรหัส G.729a
เนื่องจากให้คุณภาพที่ดีกว่า G.723 ซึ่งในขณะนี้ก็นับว่าเป็นมาตรฐานสำหรับการเชื่อมต่อระบบโทรศัพท์ผ่าน
ไอพีผ่านแวนอยู่แล้ว
บัฟเฟอร์และการตรวจสอบความผิดพลาด (Buffering and Error Checking)
เนื่องจากแอพพลิเคชันทางธุรกิจ จำเป็นต้องใช้แบนด์วิดธ์จำนวนมากในเวลาการส่งข้อมูลที่น้อย (Bursty)
ทำให้เครือข่ายต้องได้รับการออกแบบให้มีบัฟเฟอร์ขนาดใหญ่ เพื่อให้บริการข้อมูลเหล่านั้นได้อย่างเพียงพอ
แต่การมีบัฟเฟอร์ขนาดใหญ่ กลับส่งผลเสียต่อการสื่อสารด้วยเสียง เพราะยิ่งบัฟเฟอร์ใหญ่เท่าใดก็ทำให้ข้อมูล
ค้างอยู่ในบัฟเฟอร์นานมากขึ้นเท่านั้น โดยเฉพาะอย่างยิ่งกับการสื่อสารด้วยเสียง ซึ่งเวลาที่แพ็กเก็ตข้อมูลค้าง
อยู่ จะหมายถึงคุณภาพของเสียงที่น้อยลง กล่าวคือ แพ็กเก็ตข้อมูลของเสียงนั้นมีคุณสมบัติที่เหมือนกับ
ทราฟฟิกแบบ Constant Bit Rate (CBR) ซึ่งต้องการทรูพุตที่มีเสถียรภาพและคาดเดาได้
อย่างไรก็ตาม โพรโตคอลที่ใช้สำหรับถ่ายโอนข้อมูลส่วนใหญ่ในระบบแลนนั้น มักจะมีกลไกของการตรวจ
สอบความผิดพลาดอยู่แล้ว ซึ่งหมายความว่า ถ้ามีแพ็กเก็ตใดสูญหายหรือเกิดข้อผิดพลาด เครื่องต้นทางก็จะ
ต้องส่งแพ็กเก็ตข้อมูลนั้นมาใหม่ โดยในกรณีนี้เครื่องต้นทางจะรองแพ็กเก็ต Acknowledge จากเครื่องปลาย
ทางเพื่อยืนยันว่าได้รับข้อมูลถูกต้องแล้ว จึงจะส่งข้อมูลชุดต่อไปกลไกรองรับความผิดพลาดของการสื่อสาร
นี้ ฮาร์ดแวร์หรือระบบปฏิบัติการจะเป็นผู้จัดการเอง โดยผู้ใช้จะไม่ทราบเลยว่าข้อมูลที่ได้รับถูกส่งซ้ำมากี่รอบ
เช่นเดียวกันที่การส่งข้อมูลซ้ำนี้ ก่อให้เกิดการหน่วงเวลาขี้น สำหรับการสื่อสารด้วยเสียงแล้ว แอพพลิเคชันจะ
ยอมให้บางแพ็กเก็ตสูญหายหรือผิดพลาดได้ เพื่อแลกกับเวลาในการส่งข้อมูลที่สั้นลง
เนื่องจากการสื่อสารด้วยเสียงยอมให้มีข้อมูลที่ผิดพลาดได้ ทำให้ตัวเข้า/ถอดรหัสเสียงจำเป็นต้องสนับสนุน
และรองรับข้อมูลที่สูญหายหรือผิดพลาดเช่นกัน แต่อย่างไรก็ตาม คุณภาพของเสียงก็จะต้องลดลงด้วย
ถึงแม้ผู้ผลิตอุปกรณ์บางราย จะมีความพยายามใช้เทคโนโลยีพิเศษเพื่อชดเชยข้อมูลที่ผิดพลาด โดยอาศัยข้อมูล
รอบข้าง ซึ่งก็ช่วยลดระดับของคุณภาพเสียงที่ด้อยลงได้ ซึ่งกลไกการทำงานเหล่านี้ นับเป็นสิ่งที่ผู้ติดตั้ง
ระบบจำเป็นต้องทราบและเข้าใจ ทั้งนี้เพื่อที่จะทำให้การปรับแต่ง หรือแก้ไขดาต้าเน็ตเวิร์กในการรองรับการสื่อสาร
ด้วยเสียงที่มี QoS ทำได้อย่างเหมาะสมและมีประสิทธิภาพ
<<< กลับไป หน้า 4 ถัดไป หน้า 6 >>>