音声認識・音声対話・多言語翻訳のフュートレックは、人々のコミュニケーションをより快適にする様々な技術を提供します。

製品ラインナップ

vGate ASR音声認識システム

利用環境や用途に応じて、最適な音声認識システムを構成できるようにvGate ASRでは、次のような音声認識システムを提供します。

サーバー型音声認識システム

端末機器とネットワーク接続されたバックエンドサーバーにて音声認識処理を実行することにより、大量の語彙を認識することができる高性能な音声認識システムです。

ローカル型音声認識システム

機器内に搭載可能な音声認識システムです。CPU能力に応じた語彙数のモデルを搭載して認識することができます。一般的にサーバー型音声認識システムより少ない語彙となりますが、通信環境の無いところでも認識可能なこと、ネットワーク遅延がない分レスポンスが早いなどの特徴があります。

サーバー型音声認識システムについて

システム構成


音声認識ミドルウェア  ・・・ 音声認識機能の制御を行うミドルウェア
音声認識エンジン  ・・・ 発話辞書・音響モデル・言語モデルをサーバーに持つ

特長

大量の語彙・モデルをサーバーに持つことが出来、文章の入力など高性能な認識が可能
認識させる語彙の追加などメンテナンスが容易

基本仕様

  
音声認識ミドルウエア
対応OS Android(4.0以上)、iOS(7以上)、Windows(Windows7, 8)、Linux
対応CPU x86(Windows/Linux)、ARM(Android/iOS) Cortex-A9以降
必要メモリ RAM:3MB、ROM:3MB
処理量 85MHz(ARM Cortex-A9時)
  
音声認識エンジン
対応OS Linux(64bit)
対応CPU 1GHz(IntelXeon)、2GHz(AMD Opteron)(50万語彙の場合)
必要メモリ 4〜7GB(50〜100万語彙言語モデルの場合)
対応言語 日本語、英語、中国語(北京語)、韓国語、タイ語、インドネシア語

ローカル型音声認識システムについて

ソフトウェア構成

特長

通信不要で、利用場所の通信環境に依存せず認識が可能
機器内データなど数十〜数万程度の語彙・モデルによる定型文・単語・コマンド入力に最適

基本仕様

  
音声認識ミドルウエア
対応OS Android(4.0以上)、iOS(7以上)、Windows(Windows7, 8)、Linux
対応CPU x86(Windows/Linux)、ARM(Android/iOS) Cortex-A9以降
必要メモリ RAM:15MB+α※1、ROM:3MB
※1 利用する言語モデルや動作モードによってRAM容量は変動
処理量 150〜200MHz (ARM Cortex-A9時)
製品に関するお問い合わせはこちら