タイトルコード |
1000100421901 |
書誌種別 |
図書 |
書名 |
音声認識システム |
書名ヨミ |
オンセイ ニンシキ システム |
叢書名 |
IT Text
|
版表示 |
改訂2版 |
言語区分 |
日本語 |
著者名 |
河原 達也/編著
|
著者名ヨミ |
カワハラ タツヤ |
出版地 |
東京 |
出版者 |
オーム社
|
出版年月 |
2016.9 |
本体価格 |
¥3500 |
ISBN |
978-4-274-21936-8 |
ISBN |
4-274-21936-8 |
数量 |
13,196p |
大きさ |
21cm |
分類記号 |
007.13
|
件名 |
音声認識
|
注記 |
文献:p183〜192 |
内容紹介 |
音声認識手法の最新技術について基礎から解説するテキスト。入力音声から言語情報を抽出し、文字列に変換する処理について学べる。音声認識システムの実現例も収録。演習問題つき。 |
著者紹介 |
京都大学大学院工学研究科修士課程修了。博士(工学)。 |
目次タイトル |
第1章 音声認識の概要 |
|
1.1 音声認識システムの現状 1.2 音声認識のアプリケーション 1.3 音声認識の原理とシステムの構成 1.4 音声認識のための学習データ 演習問題 |
|
第2章 音声特徴量の抽出 |
|
2.1 音声の生成 2.2 音声信号のスペクトル分析 2.3 音声特徴抽出の実際 演習問題 |
|
第3章 HMMによる音響モデル |
|
3.1 隠れマルコフモデル(HMM) 3.2 HMMの学習 3.3 混合正規分布による生成モデル(GMM-HMM) 3.4 音素文脈依存モデル 3.5 GMM-HMMの適応 3.6 GMM-HMMの識別学習 演習問題 |
|
第4章 ディープニューラルネットワーク(DNN)によるモデル |
|
4.1 DNN-HMMの基本構成 4.2 DNN-HMMの学習法 4.3 DNNの適応 4.4 ほかのニューラルネットワーク 4.5 DAEを用いた雑音・残響抑圧 演習問題 |
|
第5章 単語音声認識と記述文法に基づく音声認識 |
|
5.1 音素HMMを用いた単語認識 5.2 記述文法に基づく連続音声認識 演習問題 |
|
第6章 統計的言語モデル |
|
6.1 Nグラムによる生成モデル 6.2 Nグラムの確率の算出 6.3 語彙とカットオフ 6.4 Nグラムモデルの発展 6.5 言語モデルの評価 6.6 ニューラルネットワークによる言語モデル 6.7 言語モデルの作成 演習問題 |
|
第7章 大語彙連続音声認識アルゴリズム |
|
7.1 問題とアプローチ 7.2 探索アルゴリズム 7.3 各モデルの実装と適用 7.4 マルチパス探索 7.5 重み付き有限状態トランスデューサ(WFST) 演習問題 |
|
第8章 音声コーパス |
|
8.1 音声/言語コーパスとは 8.2 音声/言語コーパスの構成 8.3 音声コーパスの現状 8.4 日本の代表的な音声コーパス 演習問題 |
|
第9章 音声認識システムの実現例 |
|
9.1 Juliusディクテーションキット 9.2 Kaldi CSJレシピ 9.3 国会審議の音声認識システム |
|
付録A CMU-Cambridge統計的言語モデルツールキット |
|
A.1 ファイル形式 A.2 言語モデルの作成と評価 |
|
付録B 大語彙連続音声認識エンジンJulius |
|
B.1 外部仕様 B.2 内部仕様(アルゴリズム) B.3 動作環境 B.4 動作設定と起動 B.5 応用例 |