歌声合成ソフトウェア開発キット
概要
人間のように滑らかな歌声を合成することができる歌声合成エンジンを、お客様のアプリケーションに組み込んでご利用いただけます。
特徴
多様な歌唱スタイルを表現可能
従来の波形接続型音声合成手法ではなく、最新の統計的パラメトリック音声合成手法を用いているため、歌唱者の癖、テクニックや裏声まで再現された、まるで人間が歌っているような自然な歌声を合成できます。また、適切なパラメータ変換により「歌唱スタイル補間技術」を利用することができます。
高速・軽量なシステム
高速に動作するため、楽譜を入力してから歌声が合成されるまでの遅延がほとんどなく、並列に動かすことで、複数パートの歌声を同時に合成することも可能です。スマートフォンや組み込み向けプロセッサでも動作確認しており、高性能なコンピュータでなくてもご利用いただけます。
また、統計モデルに基づく音声合成手法であるため、データサイズが非常に小さく、ハードディスク容量を気にせずご利用いただけます。メモリ使用量も小さいため、常時起動させておいても負担が小さいという特徴もあります。
容易なアプリケーション開発
アプリケーションの効率的な開発のため、音符/休符を入力して歌声を出力するシンプルでわかりやすいAPIをご提供します。
また、声の高さや大きさ、発生のタイミンングなどを細かく調整するためのAPIもご用意しています。
多様な出力形式
パソコンやスマートフォンのスピーカーで合成音声を再生できるだけでなく、メモリ上での合成音声データの受け渡しやファイルへの保存などに対応しています。
多言語対応
日本語(かな)、英語、中国語(ピンイン)、台湾中国語(注音)に対応しています。その他の言語に関してもご相談ください。
柔軟なカスタマイズ性
基本的にはC++言語用の静的ライブラリの形で歌声合成エンジンをご提供しますが、その他の開発言語への対応もご相談ください。また、Windows以外のOSでもご利用いただけます。
実装例
テクノスピーチの歌声合成モジュールを組み込んだアプリケーションの例です。ピアノロール上に配置された音符情報を歌声合成モジュールに渡すだけで、自然な歌声を合成します。部分再生や、音高・ボリュームの細かな調整にも対応できます。
Windows 向け
活用例
パソコン用ソフトウェア
歌声合成モジュールをパソコン用ソフトウェアに組み込んでご利用いただけます。音の高さやボリューム、発声のタイミングを細かく調整するためのAPIもご用意していますので、曲全体の合成だけでなく一部のみの合成も可能です。そのため、ユーザによるコンテンツ生成のためのソフトウェアに最適です。
スマートフォン用アプリケーション
歌声合成モジュールはOS依存性が低く、高速・軽量であるため、iPhoneやAndroidスマートフォンのアプリケーションに組み込むことが可能です。
サーバサイドアプリケーション
多数のエンドユーザから頻繁に合成処理が呼ばれるようなサーバサイドアプリケーションに歌声合成モジュールを組み込むことが可能です。歌声合成モジュールはLinux OS上でも動作し、マルチスレッドで同時に複数の合成処理が行われるような状況にも対応しています。
組み込み向けソフトウェア
歌声合成エンジンは高速・軽量であるため、ロボット等の組み込み向けソフトウェアに歌声合成機能を搭載することが可能です。(実際にJOYSOUNDのカラオケ機器にも搭載されています。)
構成
音符/休符を基に歌声を合成する歌声合成モジュールを、通常は静的ライブラリの形でご提供します。
お客様のアプリケーションに歌声合成機能を簡単に組み込むことができます。
<内容物一覧>
-
ヘッダファイル
-
歌声合成用エンジンの静的ライブラリ
-
歌声合成用ボイスのサンプル
-
歌声合成用の発音辞書
-
マニュアル一式
-
サンプルアプリケーションのソースコード
スペック
一般的なパソコンで利用可能なセッティングの一例です。スマートフォン向けのセッティングなどもご相談ください。