現在、最先端のアルゴリズムと音声合成技術を駆使すれば、収集した音声データを活用し、元の声との区別がほとんどつかないほどの精度で人の声のデジタル複製を作成できます。忙しい日々の中で時間を節約したい、声の負担を軽減したい、あるいは独自のプロジェクトに声を付け加えたいとお考えでしたら、ぜひこのような便利な音声クローニングサービスをおすすめしたいです。

しかし、専門知識を持っていない場合、自分の声を合成する技術ハードルはとても高いと心配しているでしょう?こういう疑問を抱えている方に向けて、本記事では、初心者でも手軽に使えるボイスクローニングサービスをまとめて紹介します。

ボイスクローニング

Part 1.ボイスクローニングとは何ですか?

ボイスクローニングとは、音声合成技術の一種で、特定の人物や話者の声を録音し、その声の特徴やニュアンスを学習し、それを元にその人物の声に似せた音声を生成する技術です。通常、音声クローニングは機械学習やディープラーニングのアルゴリズムを使用して行われます。

ボイスクローニングの応用範囲は広く、例えば声優や俳優の代役、アニメーションやゲームのキャラクターの声、オーディオブックのナレーション、音声アシスタントやロボットの声など、様々な分野で活用されています。

ただし、この技術には倫理的な懸念事項も存在します。他人の声を無断で使用したり、声を偽装して詐欺行為に利用するなど、悪用される可能性もあります。そのため、適切な法的手続きや倫理的なガイドラインに基づいて利用されるべきです

Part 2.ボイスクローニングサービスを比較

以下の一覧表で、筆者の実際に使ってみた評価をまとめています!参考にして、気になるサービス名をクリックしてさらに詳細を確認しましょう。


VoxBox MagicMic TopMediAi PlayHT ElevenLabs
互換性 Windows、Mac
iOS、Android
Windows、Mac ブラウザ ブラウザ ブラウザ
日本語対応 インタフェース:〇
音声クローン作成:〇
インタフェース:〇
音声クローン作成:〇
インタフェース:✕
音声クローン作成:〇
インタフェース:✕
音声クローン作成:✕
インタフェース:✕
音声クローン作成:〇
クローン作成時間 10秒内 5秒内 15秒内 数時間 数分
料金 月額¥3,280
ボイス3個
月額¥1,480
数制限なし
月額$14.99
ボイス5個
月額$39
ボイス10個
月額$5
ボイス10個
おすすめ度

Part 3.ボイスクローニングサービス5選

以下で、各音声クローニングサービスの機能や使い方をそれぞれ説明していきます。

1VoxBox

一番目おすすめする「iMyFone VoxBox」は、日本語を含む29種類の言語のクローニングに対応する音声合成アプリです。ボイスをクローンするには、音声ファイルのアップロードとサンプルテキストの読みという2つの方法があります。クローン音声の作成速度は速くて、わずか10秒で完結します。さらに、作成したクローン音声は再編集可能です。また、作成した音声はネイティブ発音だけでなく、外国語訛りの表現もできる点は抜群です。

この動画マニュアルでVoxBoxのボイスクローニング機能と使い方を確認⇩

自分の声 合成音声

▼ VoxBoxを使ったボイスクローニングの方法

ステップ 1.上記のボタンをクリックしてソフトをダウンロードして起動します。

ステップ 2.「音声クローン」タブに切り替えて、1つの作成方法を選択します。

VoxBox 音声クローン 作成方法

ステップ 3.ファイルのアップロードを選択する場合、クリックしてファイルをインポートします。または、動画URLのリンクを入力して音声を抽出してインポートします。すると、「クローン作成を開始」をクリックします。

VoxBox 音声クローン ファイルをアップロード

テキスト読みを選択する場合、画面で表示される文章を読んで録音して、「クローン作成を開始」をクリックします。

VoxBox 音声クローン 録音

ステップ 4.しばらく待ってから3つのクローンした声が作成されて表示されます。テキストを変更して読み上げることを試して、気に入るボイスを保存します。

VoxBox 音声クローン 生成

「使用」をクリックすれば、それを使って入力したテキストを読み上げることができます。

VoxBox 音声クローン 使用

2MagicMic-リアルタイムに声再現

「MagicMic」はマイクから拾ったボイスを数多くのキャラクター声にリアルタイムに変換できるボイスチェンジャーです。再現したい人の音声が入ったファイルをインポートしてから、数秒内にそのAIクローニングボイスモデルが作成され、マイクで入力した声をそれとそっくりに変えて出力できます。この機能を活用すれば、ライブ配信で自分の声の負担を軽減しながら、一貫性を維持できますね。

その他、ずんだもん初音ミクのようなアニメとゲームキャラクター、有名人など200+プリセットした声も提供します。さらに、同ソフトでは800+効果音のワンクリック再生機能も搭載されます。

MagicMic インタフェース

▼ MagicMicを使ったボイスクローニングの方法

ステップ 1.まずは上記のボタンでソフトをダウンロードして起動したら、音声入力と出力デバイスを選択します。

MagicMic マイクとヘッドホンを選択

ステップ 2.「カスタマイズ」>「声のインポート」をクリックして、事前に用意されたクローンしたい音声のサンプルファイルを導入します。

MagicMic 声のインポート

ステップ 3.しばらく待ってから音声モデルが生成されます。それを選定してマイクに向かって話すと、リアルタイムに目的ボイスになれます。

3TopMediAi Voice Cloning

次に紹介するボイスクローニングサービスは「TopMediAi Voice Cloning」です。これはビデオクリエーター向けに、時間と労力を節約するシンプルで効率的なAIツールを提供するサイトで、音声クローニングはその機能の1つです。「VoxBox」と同様にマルチ言語に対応し、作成したクローン音声の感情調整も可能です。使い方もファイルのアップロードとサンプルテキストの読みという2つです。クローン音声は高品質かつ超リアルなので、入力したテキストを読み上げた音声ファイルを保存したらすぐに使用できます。

TopMediAi Voice Cloning 公式ページ画面

▼ TopMediAiを使ったボイスクローニングの方法

ステップ 1.お使いのブラウザで上記のTopMediAi公式サイトを開き、「Try It Now」をクリックします。

ステップ 2.ファイルのアップロードか、サンプルの読みか、使用したい方法を選定します。

TopMediAi Voice Cloning ボイスクローニング方法を選定

ステップ 3.画面指示に従って音声データをインポートしたら、「Start Cloning」をクリックします。

TopMediAi Voice Cloning ボイスクローニングを開始

ステップ 4.「Use」をクリックしてテキスト読み上げへ進みます。作成した音声は自分のみ使用できるので、プライバシーについて心配しないでください。

4PlayHT-英語専用

もう1つのボイスクローニングができるサイトは「PlayHT」です。高品質な音声クローンを作成するためのAI技術を利用していて、有名人や自分の声に近いクローンを生成することができます。音声クローンを作成するためには、2〜3時間の音声録音をアップロードし、数時間待つ必要があります。英語のみ対応する点は少し残念ですが、外国語コンテンツの制作必要がある方にふさわしいですね。公式ページでは、エロン・マスクやザ・ロックなどさまざまな声のサンプルが掲載されるので、気になる場合はまずご確認ください。

PlayHT 公式ページ画面

▼ PlayHTを使ったボイスクローニングの方法

ステップ 1.公式サイトにアクセスして、無料アカウント登録したら、「Voice Cloning」タブに切り替えます。

ステップ 2.「Create a New Clone」をクリックして、音声サンプルファイルをアップロードします。

ステップ 3.作成するクローン音声の名前と性別を設定したら、「Create Clone」をクリックします。

PlayHT ボイスクローニングを作成

ステップ 4.クローン作成プロセスが完了するまでに数時間かかる場合があります。準備ができたら、「Use」でテキスト読み上げへ進めます。

PlayHT ボイスクローニングを使用

5ElevenLabs-英語表記

最後に紹介する「ElevenLabs」は最先端の生成AI技術を用いて音声合成サービスを提供している企業で、公式サイトでわずか数分の音声データから自分自身のAI音声クローンを作成することができます。ボイスクローニング機能は29の言語と50以上のアクセントで非常に高い精度を実現していて、クローニングの結果はほぼ本物と区別がつかないほどの高いリアリティを持っています。Starter以上の有料プランを購入すると、生成した音声は商用可能です。でも、このサービスの操作画面は英語のみ対応するので、使用する時には少し不便だと感じるかもしれません。

ElevenLabs ボイスクローニング 公式ページ画面

▼ ElevenLabsを使ったボイスクローニングの方法

ステップ 1.公式サイトにアクセスして、「Clone your voice」をクリックしてアカウント登録します。

ステップ 2.すると、音声クローニングの操作画面に切り替えます。ダッシュボードの「Voices」> 「Add Generative or Cloned Voide」を選択して、メニューから「Instant Voice Cloning」を選びます。

ElevenLabs ボイスクローニングを選択

ステップ 3.音声ファイルのアップロードまたは録音で、音声クローンを作成するための音声データを登録していきます。

ステップ 4.終わったら音声の名前や説明を入力し、「Add Voices」ボタンを押すと音声クローンの生成が開始されます。

ElevenLabs ボイスクローニングを生成

ステップ 5.生成が完了すると、クローンした音声がリストで表示されます。それを編集したり使用したりできます。


最後に

以上で簡単に使えるボイスクローニングサービスについて詳しく紹介して比較しました。必要な場面やコンテンツに合わせて自在に活用すれば、時間と労力を節約できて、音声制作の柔軟性と効率性も向上しますね。

特に、ご紹介した中でも「iMyFone VoxBox」は、音声クローニングの生成速度は速くて、クオリティーも高いです。さらに、PCとスマホの両方でも利用できるので、興味がある方はぜひ下で入手して試してみてください!