BLOG

音声活用ブログ

LVAテクノロジー(その2)

2020.08.06

テクノロジー

テーマ:

2 LVAテクノロジー2

WRITER

都筑 一雄

都筑 一雄

ESジャパン株式会社
エグゼクティブアドバイザー

慶応義塾大学及び東北大学大学院で物理学専攻。修士課程修了後、日本電気(NEC)に36年間勤務。製品開発、システム構築、事業部運営、欧州合弁会社立上げ等、役割は変化したが一貫して音声関連の通信事業に関与。NEC退職後は滋賀県彦根市役所の行政情報化担当特別顧問を5年間務め、退任後、ESジャパン株式会社の設立発起人として創業に関与し現在に至る。

Nemesysco社の基盤技術であるLVAテクノロジーについて処理内容を説明します

 前回紹介したLVAテクノロジーについて少し詳しく説明します。LVAはその名の示す通り、入力された音声データを次の13個の処理層を順次実行する事により
解析します。

 

 1)セグメンテーション処理層
   音声を分析する為に適している部分を、適切に取り出す過程

 

 2)次スクリーニング処理層
   取り出した音声部分の正規化

 

 3)時間領域分析層
   主要な感情識別子を特定する過程で通常の音声会話パターンからずれている微小な非可聴検体シーケンスを特定

 

 4)周波数領域分析層
   高速フーリエ変換を用いて音声の周波数分析を行い、各種の感情識別子の存在を検出

 

 5)較正段階層
   感情に無関係な状態のベースラインを計算

 

 6)主分析層
   全ての音声パラメーターをベースラインと比較し、感情レベルを出力

 

 7)リスク計算層
   リスク計算式を用いて、主分析層で得られた指標の信頼ベースラインからの隔たりを計算

 

 8)嘘確率層   10年以上の研究で得られた統計データと比較して嘘確率を計算

 

 

 9)だましパターン検出層
   さまざまな予め定義されただましタイプ確率を示す感情構造と今までに得られた感情構造全体とを比較し騙しの確率を計算

 

10)感情検出層
   特定のアプリ向けに(例えばコールセンター用に)怒り、幸福、悲しみ、集中、興奮、困惑、躊躇、などいろいろな感情を出力

 

11)学習的決定エンジンテクノロジー層
   学習的決定エンジンにより種々の感情状態を出力(例えばコールセンターで「購買意欲あり」、「キャンセル」など)

 

12)最終分析層
   最終的な感情評語を出力

 

13)総合分析層
   最後に全ての感情活動を要約した数字で表現されたベクトルを出力

 

 

 これらの処理を順次行うことによりつぎのように分類された感情パラメーターを出力します。

 

 

   分類                                       パラメーター例    

Emotional(情動的)                興奮、幸福感・悲しみ分析、怒り

Logical(論理的)                               混乱、メンタル努力、想像と躊躇の分析

Energy(エネルギー)                       エネルギー指標

Stress Related(ストレス関連)     ストレス(戦うか・逃げるか)の分析

Stability(安定性)                             集中、当惑、期待

Special Indicator(特殊指標)        その他の指標

 

 これらのパラメーターを組みわせることにより、解析目的に沿った
感情要素の多寡を数値で出力します。
 当社のESASでは日本の環境にあった数値に補正して出力しています。

      
               エグゼクティブアドバイザー 都筑一雄