首頁>>>技術>>>VoIP

P2P VoIP應用的性能評測

楊永銘 王喆 2008/09/24

  摘要:基于IP技術的語音分組傳輸(VoIP)電話目前被廣泛使用,Skype與GTalk是VoIP應用的兩個典型代表。在可控網絡環(huán)境下,通過調整信道容量、時延、丟包、抖動等網絡參數,利用PESQ MOS方法評測了Skype與GTalk的語音質量,并且討論了在可變網絡環(huán)境下的動態(tài)適應性策略。

1、引言

  VoIP是將模擬語音信號通過壓縮編碼處理變成語音數據流,然后按TCP/IP標準打包,再通過IP網絡傳輸,在接收端通過解壓縮編碼還原成模擬語音信號,完成整個通話過程[1]。由于IP網絡無業(yè)務質量保障,會帶來一定的語音包時延和丟失,影響語音質量,語音質量問題是影響VoIP發(fā)展的重要因素。

2、P2P VoIP的應用

  Skype與GTalk使用的是UDP/TCP傳輸協議,使用相同的編解碼器。Skype與GTalk繼承了P2P網絡的一些特性,如各節(jié)點間合作且共享網絡資源。Skype采用全球搜索目錄(GI)技術,GI是一種可擴展網絡技術,它使用多層的網絡結構,利用超節(jié)點來實現網絡中的每個節(jié)點可以獲取所有其他可利用節(jié)點的資源,并將這些節(jié)點資源動態(tài)組合,來參與流量分配、路徑選擇、處理需要較大帶寬的任務等,并保證最小的時延。GTalk采用IETF制定的XMPP協議,可提供與其他VoIP應用的免費連接,GTalk網絡可以與其他VoIP網絡協同工作。

  有關VoIP應用的研究工作現在正在不斷取得進展。參考文獻[2]中評估了在GPRS網絡中VoIP的性能及業(yè)務質量。Furuya評測了VoIP的服務質量與網絡參數(容量與時延)的關系[3]。Baset S A和Schulzrinne H是Skype最早的研究者并初步分析了Skype的一些相關的技術[4],后來Guha等通過具體的實驗重點研究了Skype中的超節(jié)點,為研究VoIP的流量模型奠定了基礎[5]。

3、評測方法

  本文的工作是分析和比較Skype與GTalk在網絡環(huán)境狀況發(fā)生變化時,它們的語音質量及其服務質量,這里所說的服務質量是指對于網絡狀況發(fā)生變化的適應能力。本文通過兩種方法來進行研究。一是通過分析網絡傳送數據包的有效負載,以及所使用的編解碼規(guī)則和相關的參數信息,基于這些信息可以推斷它們的語音質量和服務質量[3]。另一種方法是通過一個評測模型來評估音質量的優(yōu)劣,如E-model,它可以客觀地評價語音質量但是需要利用各種網絡參數來評定語音質情況。需要注意的是Skype使用專有的協議,并且采用了加密機制,這就阻止了對網絡傳送的數據包的分析,也就不能準確地分析出它的語音質量和服務質量。基于以上研究可以把VoIP網絡看作是一個黑盒子,在兩端對網絡參數進行測試,來評估Skype與GTalk語音質量。

  3.1 實驗環(huán)境

  本文所建立的實驗系統(tǒng)如圖1所示。主機S與主機R分別是發(fā)送端與接收端,負責語音信號的發(fā)送與接收。音頻記錄軟件使用Audacity。NAT-R與NAT-S是兩個NAT-Boxes,主機S和R通過它們與外界網絡進行連接。Network Emulator(網絡仿真器)使用的是NIST.Net,完成各種網絡情景的再現,CD播放器重復地產生一個長達1 h的采樣音頻,這些音頻數據通過網絡仿真器傳到R。

圖1 實驗系統(tǒng)框架

  3.2 網絡的度量衡量標準

  實驗中需要評測的性能參數有:語音質量和從S到R的數據傳輸率(它是Skype與GTalk適應性能的直接表現)。對于傳輸數據流的分析工具是tcpstat。

  語音質量的測評方法有幾種:一種是MOS(平均主觀值法)[6],這是由ITU-T制定的一個較為主觀的評價方法,由直接參與到語音通信中的人來評定語音的質量,語音質量最終被評為1~5分,分數越高語音質量越好。與MOS相比,E-model[7]是一種較為客觀的評估語音質量的方法,關注影響語音質量的全面的網絡損傷因素(如時延、抖動、回音、編解碼等)。由于不能獲得有關Skype與GTalk編解碼器的信息,所以就無法采用此方法來評測語音質量。實驗中所采用的是PESQ(感知評估通話質量測評)[8],此方法實際上是通過復雜信號處理,用PESQ算法對發(fā)送信號和接收信號進行校準,然后評估這兩個信號間的差異,最終評測結果對應于MOS。

  3.3 實驗描述

  在一個可控的網絡狀態(tài)下,對Skype和GTalk進行評測。本文建立了4個具體的實驗,在這些實驗中以下幾個參數分別出現:信道容量、時延、丟包率和抖動,這些參數值的選取是針對Skype與GTalk來具體確定[9]。
  
  實驗過程中,網絡參數會被定義為幾個不同的值,在語音傳輸過程中,這些值是動態(tài)變化的,在變化的每個階段,發(fā)送端會發(fā)送1 h的語音信號,接收端收到的是60個1 min的語音信號。實驗對Skype與GTalk是在相同狀況下重復進行,Skype的版本為2.0.0.81,GTalk的版本為1.0.0.92。

4、性能評測

  4.1 信道容量影響

  在此實驗中,設定時延25 ms且沒有明顯的丟包和抖動。要研究的是當信道容量逐漸變化(50 kbit/s、40 kbit/s、30 kbit/s、20 kbit/s、15 kbit/s)時,Skype與GTalk相應的變化。通過觀察傳輸率(見圖2)和PESQ MOS(見圖3),發(fā)現在信道容量為50 kbit/s時GTalk利用了更多的帶寬,傳輸速率比Skype更高。當信道容量變?yōu)?0 kbit/s時,GTalk發(fā)生了很明顯的變化,傳輸速率降低到了35 kbit/s。這個變化使得其PESQ MOS分數與Skype相比有所提高,而Skype的傳輸速率則接近信道容量。當信道容量變?yōu)?0 kbit/s時,兩者間差異不大。當信道容量為20 kbit/s時,Skype首次優(yōu)于Gtalk,當信道容量為15 kbit/s時,Skype的PESQ MOS分數比GTalk高5.5%。通過觀察知道,在容量為20 kbit/s時兩者的傳輸率相同,但PESQ MOS分數卻不一致,合理的解釋就是GTalk出現了很嚴重的網絡抖動情況(如圖4所示)。

圖2 吞吐量隨信道容量變化狀況

圖3 PESQ MOS隨信道容量變化狀況

圖4 平均抖動隨信道容量變化狀況

  4.2 時延影響

  網絡參數設置為信道容量50 kbit/s且沒有丟包和抖動發(fā)生。確定幾個等級范圍,其中時延為1 ms、10 ms、100 ms時通話是可以接受的,時延為500 ms、1 000 ms時語音質量就變得不可接受。對于Skype,時延對其服務質量的影響更為明顯,如圖5所示,傳輸率從37.5 kbit/s降為19.36 kbit/s。然而,對于GTalk其傳輸率則沒有明顯變化。由圖6可知,在時延為1 ms、10 ms、100 ms時Skype的PESQ MOS高于GTalk,在時延為500 ms、1 000 ms時GTalk則略優(yōu)于Skype。

圖5 不同時延下吞吐量的變化狀況

圖6 PESQ MOS隨時延的變化狀況

  4.3 丟包影響

  設置信道容量為50 kbit/s,時延為25 ms,沒有抖動,丟包率分別定為0、1%、5%、10%、30%、40%。如圖7所示,GTalk對于丟包發(fā)生,沒有適應性機制。可以設想Skype對數據流增加了冗余信息來減少丟包對語音質量的影響,這就解釋了在丟包率為1%、5%、10%時傳輸率的增長。然而,Skype的這些適應機制并沒有使得PESQ MOS分數比GTalk高,如圖8所示。在丟包率為5%時,Skype添加了過多的冗余,消耗了過多的網絡帶寬,而PESQ MOS并沒有期待中的提高。

圖7 不同丟包率下的吞吐量的變化狀況

圖8 不同丟包率下的PESQ MOS變化狀況

  4.4 抖動影響

  設置信道容量為50 kbit/s,沒有丟包,時延為100 ms,抖動為0 ms、20 ms、40 ms、60 ms、80 ms。但是測量數據沒有顯示出任何適應性的跡象。在本實驗中抖動只是改變了接收端的緩沖區(qū)大小,對數據流傳送沒有任何影響,并且實驗結果也顯示PESQ MOS或者說語音質量與抖動沒直接關系,具體的實驗圖示不再贅述。

  4.5 實驗分析

  雖然實驗比較了VoIP的兩個應用GTalk與Skype,但目的不是要分出它們的優(yōu)劣,而是要找出普遍存在問題,給VoIP的應用開發(fā)商提出建議。

  采用不同的編解碼方式,其對應的業(yè)務質量可能不同。即使是使用相同的編解碼方式,也可能會表現出不同的語音質量。對于VoIP的應用來說,具有高效的適應機制來適應復雜可變的網絡環(huán)境相當重要,適應性好的應用會更有優(yōu)勢,例如,當帶寬有限時,GTalk始終保持一個較高的傳輸率,從而產生了嚴重的抖動和PESQ MOS分數的下降。另一方面,Skype在有較高時,傳輸率有明顯的下降,導致業(yè)務質量更糟。

  數據流中添加冗余信息可能會產生好的效果,如圖7、8所示,當丟包率小于10%時,Skype可以使PESQ MOS的分數保持在3分之上,GTalk沒有采用適應性機制,從而其語音質量隨著丟包率而線性下降。但是,也需要對添加冗余信息的量度有一個把握,否則會產生不好的效果,因此還需要進一步地提出更有效的冗余設計方案來適應可變網絡。

5、結束語

  本實驗比較了P2P VoIP的兩個應用Skype和Gtalk,討論了它們在網絡狀況變化時的動態(tài)適應策略,并且通過PESQ MOS方法評估了它們語音質量的優(yōu)劣。通過實驗可知:在理想的網絡狀況下,Skype表現得更好一些(兩者PESQ MOS的分數差別為0.1),總體而言它們的語音質量還是較為接近。在網絡有較長的時延時,Skype有不必要的適應性。當丟包情況發(fā)生時,GTalk沒有實施任何機制來提高其性能,與此同時,Skype使用數據冗余機制來對抗丟包以提高其語音質量。在抖動情況發(fā)生時,兩者都沒有很好的機制來提高其適應性。當有較長的時延時,PESQ MOS并不是最佳的評估語音質量的方法。所以,盡管實驗中包含有時延對語音質量的影響結果,但這可能不是十分準確,有待于進一步研究。另外,以上的實驗是Skype與GTalk分別進行,之間沒有相互影響,若是VoIP的具體應用需要競爭相同的網絡資源時,它們的表現情況如何研究者需要進一步的研究。

參考文獻

  1 朱海毅,周春楠.VoIP基本原理.信息技術.2003,5(5)

  2 Shen Q.Performance of VoIP over GPRS.In:17th International Conference.on Advanced Information Networking and Applications(AINA’03),2003

  3 Furuya H,Nomoto S,Yamada H.Experimental investigation of the relationship between IP network performances and speech quality of VoIP.In:10th International Conference on Telecommunications(ICT 2003),March 2003

  4 Salman A B,Henning S.An analysis of the peer-to-peer Internet telephony protocol.In:IEEE INFOCOM 2006,April 2006

  5 Guha S,Daswani N,Jain R.An experimental study of the skype peer-to-peer VoIP system.In:5th Workshop on Peer-to-Peer Systems(IPTPS),February 2006

  6 International Telecommunications Union.Methods for subjective determination of transmission quality. Recommendation P.800,August 1996

  7 International Telecommunications Union.The E-model,a computational model for use in transmission planning. Recommendation G.107,1998

  8 吳耀文,王平.VoIP語音評價方法綜述.艦船電子工程,2006(1)

  9 Miras D.A survey on network QoS needs of advanced Internet applications. Internet QoS Working Group,2002

電信科學



相關鏈接:
企業(yè)Skype暴露內網隱私 2008-09-24
創(chuàng)造性地滿足本地客戶的需求─訪Avaya中國區(qū)總經理 2008-09-23
Spirent辛小秋:VOIP方面的測試方法和經驗 2008-09-19
大唐高鴻張新中:構建安全高效融合通信系統(tǒng) 2008-09-19
高清 會議 網絡增值成IP電話突破口 2008-09-18

分類信息:        
临澧县| 惠州市| 永川市| 拉萨市| 临朐县| 延安市| 德安县| 修水县| 泸定县| 邓州市| 永胜县| 长治县| 长治市| 扬州市| 陇川县| 共和县| 德清县| 临清市| 楚雄市| 临泽县| 平邑县| 枣阳市| 枣庄市| 宜丰县| 大庆市| 朔州市| 英德市| 临邑县| 大丰市| 抚顺市| 道真| 当雄县| 大丰市| 确山县| 吴江市| 徐州市| 阿图什市| 芷江| 石台县| 古交市| 东海县|