ボーカロイド技術論~歌声合成の基礎とその仕組み~ ヤマハミュージックメディア

ヤマハミュージックメディアから「ボーカロイド技術論~歌声合成の基礎とその仕組み~」が発売になりました。

ボーカロイド技術論~歌声合成の基礎とその仕組み~ ヤマハミュージックメディア 販売価格3024円
http://www.chuya-online.com/products/91843/index.html

ヤマハミュージックメディア
ボーカロイド技術論~歌声合成の基礎とその仕組み~【楽譜】

歌う技術の基本が丸ごとつまった一冊。
ボーカロイドの開発動機から技術の概要、今後の動向まで、技術と業界を網羅。
ボーカロイドや音声認識技術を勉強する人、そしてソフト開発を行う人たちにとっての教科書となる一冊。

■歌声合成について書かれた唯一の本!
■ボーカロイドの生みの親が初めて、その全貌を解説!
■音声合成や音声認識技術との違いがわかる!

[目次]
■Chapter1 VOCALOID前夜
1961年、コンピュータが世界で初めて歌った「Daisy Bell」
1000年の歴史を持つしゃべる技術と歌声合成への転換
XG音源のオプションとして搭載されたフォルマントシンギング音源、PLG100-SG
[コラム]フォルマントシンギング音源の音声合成方式
[コラム]有声音と無声音
VOCALOID以前に登場したヤマハ以外の歌声合成技術
合弁会社への出向がVOCALOID開発のきっかけに
Daisyプロジェクトのスタート
共同研究のパートナー、スペインのポンペウ・ファブラ大学

■Chapter2 VOCALOID1の開発
音素片を組み合わせて歌わせるという方法論
初めて歌った「朝」
[コラム]なぜ、VOCALOIDには入力禁止区域があるのか?
開発スタートから1年で、ついに歌った1フレーズ
歌声ライブラリ、合成エンジン、エディタから構成されるシステムが確立
最初にプレゼンに行った会社、クリプトン・フューチャー・メディア
2003年2月26日のプレスリリース
[コラム]VOCALOIDのネーミング
研究所で製品開発をする珍しいケース
賛否両論の展示会場と、反応が薄かった国内
[コラム]なぜ歌声合成が必要なのか?

■Chapter3 VOCALOID1で培われたVOCALOIDの基本技術
子音と母音を組み合わせる
素片結合をどのようにして滑らかにするのか
声質の特徴を表すスペクトル包絡
歌声合成の流れと母音に含まれる微妙なピッチの揺らぎ
表記に用いた発音記号、IPAとX-SAMPA
[コラム]西洋人にとって発音が難しい日本語の「う」
[コラム]1516年のなぞなぞ「母には二たびあいたれども父には一度もあわず」
VOCALOID 1.0から1.1への改良でより滑らかな発音に
[コラム]滑らかになったことへの不満も飛び出した
音声合成と歌声合成は似て非なる技術
歌声合成と音声合成の違い

■Chapter4 VOCALOID2の開発とテクノロジー
5年後の目標は「商業音楽の半分をVOCALOIDにすること」
エンジンの作り直しでハスキーな声を可能に
イギリス人デザイナーによってUIは大きく変更
苦労したリアルタイム発音機能
2007年1月のNAMM Showで発表したVOCALOID2
VOCALOID2だからこそできた初音ミクの歌声
[コラム]世の中のあまりにも大きな反応は自分のこととは思えなかった
[コラム]サポートの困難さから断念したVOCALOID2でのMac対応

■Chapter5 VOCALOID3の開発と機能
VOCALOID2での課題は伴奏機能
[コラム]ReWireを非サポートにした理由
「VOCALOID Cubase」開発の経緯
「Triphone機能」の搭載
「ピッチ間モーフィング機能」の実装
[コラム]サンプラーとVOCALOIDのアプローチの違い

■Chapter6 VOCALOID3に搭載された新技術
オプション的扱いだった「Triphone」
基本となっているのは「Diphone」
滑らかな発音を実現するTriphone
[コラム]学術的には真ん中の音素だけをTriphoneと呼ぶ!?
Triphoneでもっともはっきり違いが現れる[a-h-o]
Triphoneがサポートするのは、真ん中が子音となるケース
[コラム]日本語の子音は大きく6つに分類できる
子音の長さをコントロールするVELOCITY
子音を伸ばすことを実現したホワイトノイズの活用
[コラム]VOCALOID1でのVELOCITYは音の強さだった
無声化のための隠しコマンド「_0」
[コラム]VOCALOID2の隠しコマンド[h\\]

■Chapter7 歌声ライブラリの制作方法
歌声ライブラリの制作工程
レコーディングに向けての準備
レコーディングのスケジュール立て
レコーディング時の台本
[コラム]レコーディングは無意味語で行う!?
演者やライブラリの特徴で変わる音階数
[コラム]VOCALOIDのレコーディングに使ったスタジオ
切り出し処理で音素片を収集
歌声のトリートメント処理
ファイルを読みこんだあとは調整の繰り返し
[コラム]言語で大きく異なる音素の組み合わせ数

■Chapter8 VOCALOID Editor for Cubaseとは
10年前からの構想がようやく実現
スタインバーグへの交渉からスタート
UIと信号処理の2本立ての構造
[コラム]VSTインストゥルメントとは
[コラム]MIDIとMIDIコントロールチェンジとは
ノートエクスプレッションを活用したデータのやりとり
歌詞の入力にはVOCALOIDエディタが必要
Elments、AI、LEにもVOCALOID専用接続口を設定
VOCALOID Editor for Cubaseを構成するモジュール群
Mac対応を前提として1からの作り直し
マルチスレッドでの動作に対応
[コラム]Job Pluginもハイブリッドに対応

■Chapter9 iOSを用いたiVOCALOID
高まってきたモバイル機器の存在感
単純移植では重くて動作せず
[コラム]移植しやすかったのはAndoridよりもiOS
課題はGUIの開発とデータのスリム化
バージョンアップで、iPhoneやRetinaに対応
[コラム]VocaloWitterも共通のエンジンを使用
iVOCALOIDに隠されていたVSTi機能
iVOCALOIDはVOCALOID first、ボカロネットへと採用
ソフトウェア開発キット

■Chapter10 VOCALOIDの今後と可能性
時間軸方向の処理で歌わせるeVocaloid
VOCALOIDとeVocaloidの違い
VOCALOIDをクラウドとシームレスにつなぐボカロネット
ボカロネットの目玉機能として打ち出したボカロデューサー
VOCALOIDの今後の可能性


■著者について
剣持秀紀(けんもち・ひでき)
1967年生まれ。1993年京都大学大学院工学研究科修士課程修了。在学中は京都大学交響楽団に所属し、数々の演奏会に出演。1993年ヤマハ株式会社入社。音響関係の研究開発に従事した後、1996年L&Hジャパン株式会社(ベルギーのL&H社とヤマハの合弁会社)に出向。テキスト音声合成技術の開発に従事。この時にベルギービールに目覚め、その研究成果もまとめられている(http://www.kenmochi.com/beer/)。1999年復職。以降VOCALOIDを含む音楽・音声信号処理技術の開発に従事。現在、ヤマハ株式会社事業開発部yamaha+推進室VOCALOIDプロジェクトリーダー。 趣味はヴァイオリン・ヴィオラの演奏とアナログレコードの鑑賞。ターンテーブルはヤマハの銘器GT-2000、カートリッジはDL-103。プリアンプはヤマハC-2x。パワーアンプはもちろん真空管(C.E.C Tube53)。

藤本健(ふじもと・けん)
1965年生まれ、1989年横浜国立大学工学部電子情報工学科卒業。リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。高校時代からシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったきた経験がある。リクルート在籍時代から社外でDTM、オーディオ、レコーディング関連の記事を中心に執筆しており、これまでも多数の関連書籍がある。現在はブログ型ニュースサイトDTMステーションを運営するほか、AV Watchの連載記事「藤本健のDigital Audio Laboratory」などを執筆している

仕様
A5判縦/212ページ
商品構成
書籍
JANコード49-47817-243199
ISBNコード978-4-636-89996-2 C3004

コメント