声帯の振動の乱れによるガラガラ声、専門家の耳だけでは評価にばらつきがあった
大阪大学は7月1日、ガラガラした声の評価に使える新しい音響モデル「ARI(アコースティック・ラフネス・インデックス)」を開発したと発表した。この研究は、同大学院医学系研究科の北山一樹氏(博士課程)、細川清人講師、猪原秀典教授(耳鼻咽喉科・頭頸部外科学)の研究グループによるもの。研究成果は、「npj Digital Medicine」オンライン版に掲載されている。

画像はリリースより
(詳細は▼関連リンクからご確認ください)
ガラガラ声は、声帯の振動が乱れることで生じる。これまでは「GRBASスケール」などの方法を用いて、専門家が耳で聞いて判断する方法が中心であり、主観的でばらつきがあった。
従来の音響データと組み合わせて、声のざらつきを0~10のスコアで表す
これまでガラガラ声の原因となるサブハーモニクスという音の成分を正確に見つけて評価する方法はなかったが、今回の研究では、これまで同研究グループで開発したSFEEDS(Spectral-Based Fundamental frequency Estimator Emphasized by Domination and Sequence)という声の波形の基本周波数(声の中で最も低い周期的な成分の周波数)を正確に見つける仕組みを使い、サブハーモニクスの音の種類と量を自動で判定するプログラムを作った。その情報と、従来からある声の特徴を表す数値を組み合わせて、ガラガラ声の度合いを数値で表すモデル・ARIを作成。サブハーモニクスの成分を自動で検出し、声のざらつきを0~10のスコアで評価する。約450人分の声のデータで検証を重ね、開発に成功した。
ARIは、文章を読む声と「あー」と声を出すデータを組み合わせて声の質を評価する。ARIのスコアは専門家の耳での判断とよく一致し、スコアが2.09以上だとざらつきがある声、2.09未満だと滑らかな声と高い確率で見分けることができた。
プログラムはインターネットで公開、医療現場で活用可能
ARIはこれまで人の耳に頼っていた評価を客観的に行うツールであり、声の病気の診断や治療前後での比較、研究などに活用できる。また、プログラムはインターネットで公開しており、医療現場や研究機関などでの活用が期待される。「今後は、日本語以外の言語や感情がこもった声、歌などにも応用し、診療やリモートでの声のチェックにも使えるようにしていきたい」と、研究グループは述べている。
▼関連リンク
・大阪大学 ResOU


