DXが各分野で進むなか、バーチャルヒューマンやアバターでのオンライン接客が進んでいます。
オンライン接客の会話の口の動きの実証実験
バーチャルヒューマンは制作できアニメーションも制作できるようになったのですが、ChatGPTやデジタルツインオペレートでの口の動きをシンクロさせようと実験を始めました。
すでにアプリなどでも売っていますが、自分で開発しようと始めたら音というものをデジタル信号に取得したあとに壁がありました💦
オンライン接客の音声周波数シンクロ方法研究のポイント
音声は、振動の幅の強さの周波数Hzでデジタル化されグラフになります、その周波数のどの範囲を取得するかで大きく変わってしまうのです。
取得するサンプリングデーターが多ければ広範囲にいい音が取得できますが、データー量が大きくなります。 一般的には15~22kHzあれば十分と言われ、人の声の最大周波数は4000Hzくらいといわれています。
ただ男女の差や個人差があり重低音、中音域、高音などあるので、どうやって対応するのか研究中です 🤔
・TOP
・人物写真
・静物写真
・建築写真