2023年6月12日 12:00
スマホから聞こえる相手の声が「なんか違う?」 ドコモが語る、からくりに「噂じゃなかった」「すごい仕組み」
※写真はイメージ
なぜそのまま声を届けないのかというと、「音声を音声波形の情報のまま送ろうとすると、情報量が非常に大きくなってしまうから」とのこと。
元の声をそのまま届けるとなると、情報量が大きくなりすぎてしまい、1つのエリア内で通話をできるユーザの数が少なくなってしまいます。
上記のような処理を行うことで、音声の情報量を小さく圧縮でき、1つのエリアで通話できるユーザ数を十分に確保できるとのことです。
膨大な情報から似た音声を生成
生成された音声とはいえ、注意して聞いてみても相手の声そのままのように感じますよね。
では、どうやって似た音声にしているのでしょうか。また、音声はどのくらいのパターンがあるのでしょうか。
NTTドコモに聞いたところ、下記のような回答がありました。
何パターンという具体的な数字でいうのは難しいです。
4Gの音声通話では、20ミリ秒ごとに253ビット、理論的には2の253乗個のパターンの情報を表すことができます。『2の253』乗は0が76個付くぐらいの数字。ちなみに1兆は0が12個です。
これだけの膨大な情報を20ミリ秒ごとに送信し、音声を生成しているので、どんな人の音声でも非常に近い音声として聞くことができます。