VocalRemover (VocalRemover Vocal Remover) ユーザーガイド
ボーカルと伴奏(インスト)を分離したいと考えているユーザーにとって、VocalRemover は、ローカル環境の構築を必要としない効率的なソリューションを提供します。
複雑なソフトウェアのダウンロードや環境設定、高性能なグラフィックボードは一切不要です。ブラウザで VocalRemover を開くだけで、数分以内にスタジオ品質の分離結果を得ることができます。
この記事では、「シーン」ベースのモードを使用してオーディオを簡単に処理する方法を解説し、すぐに使い始められるようガイドします。
I. VocalRemover とは?
VocalRemover は、オープンソースコミュニティで強力な実績を持つ modern AI separation stack アーキテクチャをベースに構築されたオンラインサービスです。
これまで、高品質なインストルメンタルを取得したり、クリーンなボーカルを抽出したりするには、高いハードルがありました:
- 数 GB に及ぶソフトウェアやモデルパッケージのダウンロード。
- 高性能な NVIDIA GPU(グラフィックボード)の所有。
- 複雑なモデルパラメータの調整に費やす膨大な時間。
VocalRemover はこれらの問題を解決することを目指しています。私たちはクラウド上にトップクラスの AI モデル(特に最新の BS-Roformer および Mel-Band Roformer シリーズ)を配備しています。**「instant workflow(インスタントラボ)」というインターフェースを通じて、ユーザーは「どのパラメータを使うか」ではなく、「どのような結果が欲しいか」**だけに集中できます。
II. VocalRemover の使い方
プロセスは非常にシンプルで、**「アップロード -> シーン選択 -> 品質選択 -> ダウンロード」**という直感的なフローに従います。
ステップ 1:ファイルをアップロード
オーディオファイル(mp3, wav, flac, m4a など対応)をホームコンソールのアップロードエリアに直接ドラッグ&ドロップします。
🛡️ プライバシー:すべてのファイルはクラウドオブジェクトストレージに安全に保存され、処理完了後に自動的に完全削除されます。お客様のオーディオデータを保存することはありません。
ステップ 2:「シーン」を選択 — 重要なステップ!
これが VocalRemover と従来のツールとの最大の違いです。ユーザーは難解なモデル名を選ぶ必要はありません。処理の目的を選ぶだけです。
一般的なシーンは以下の通りです:
| シーン名 | 目的 | 結果 |
|---|---|---|
| ボーカル除去 (Remove Vocals) | カラオケ作成、歌ってみた練習 | インストルメンタル(伴奏) |
| ボーカル抽出 (Extract Vocals) | リミックス、MAD素材作成 | ボーカル(アカペラ) |
| 2ステム分離 (Split) | ボーカルと伴奏の両方が必要 | ボーカル + インストルメンタル |
| 4ステム分離 (Split) | 耳コピ、楽器練習 | ボーカル + ドラム + ベース + その他 |
| ノイズ除去 (Denoise) | ノイズの多い録音の修復 | クリーンなオーディオ |
| リバーブ除去 (Dereverb) | 部屋の反響音(エコー)を除去 | ドライなオーディオ(リバーブなし) |
ステップ 3:「品質 (Quality)」を選択
各シーンタイプに対して、異なる計算強度をプリセットしています:
- ⚡ Fast (高速):速度優先。プレビューやカジュアルな用途に適しています。
- 🎵 Studio:デフォルト推奨。速度と品質のバランスが最も良く、ほとんどのクリエイティブなニーズに適しています。
- 💎 HiFi:トップクラスの SOTA モデル(BS-Roformer など)を使用します。膨大な計算量を要するため時間はかかりますが、業界最高レベルの分離純度を提供します。
ステップ 4:開始とダウンロード
「分離を開始 (Start Separation)」をクリックして、タスクをクラウドキューに追加します。
- 通常、数分で完了します(ファイルの長さや品質設定によります)。
- 完了したら、オンラインで試聴するか、ロスレスの
.wavファイルをダウンロードできます。
III. 応用:シーンの詳細
多様なプロフェッショナルニーズに応えるため、instant workflow は豊富なシーンシステムを提供しています:
1. 音楽制作 & カバー(歌ってみた)
- ボーカル除去 / ボーカル抽出:基本機能です。究極のインストルメンタル品質を求める場合は、HiFi モードを選択してください。
BS-Roformer-ViperXなどのトップモデルを呼び出し、ボーカルの残留を劇的に低減します。 - カラオケモード (Karaoke Mode):カラオケ用に特化して最適化された抽出モデルで、バックコーラス(ハモリ)を一部残すことで、インストルメンタルをより豊かに響かせます。
2. 楽器練習 & アレンジ(ステム分離)
- 4ステム分離:曲を ボーカル、ドラム、ベース、その他楽器 の4つに分割します。HiFi モードでは、現在のステム分離における最高峰モデル
bs-roformer-musdb18-4stemを使用します。 - 6ステム分離:さらに ギター と ピアノ を分離します(Studio モードでは HTDemucs4 を使用)。これは、ギターやキーボードの耳コピをする方にとって素晴らしいツールです。
3. オーディオ修復 (Audio Restoration)
- ノイズ除去 (Denoise):インタビュー録音やポッドキャストの背景ノイズを除去するのに最適です。
- リバーブ除去 (Dereverb):録音環境が空虚で反響していた場合、これを適用すると声が「ドライ」になり、耳元で話しているように聞こえます。
- ライブ音源クリーニング (Live Cleanup):ライブ録音から観客の歓声やノイズを除去するために特化されています。
🚀 技術ハイライト:修復系シーンには、最新の Mel-Band Roformer シリーズモデルが採用されています。ボーカルのディテールを保持しつつ、特定のノイズ(エコーや群衆ノイズなど)を抑制する能力が、従来のモデルに比べて大幅に向上しています。
IV. 機能ハイライト
優れた音質だけでなく、VocalRemover は通常のツールにはないプロフェッショナルな機能を備えています:
- 🎧 5.1 / 7.1 サラウンドサウンド対応:映画のサウンドトラックやコンサートの
mkv/wavマルチチャンネルファイルをアップロードした場合、システムは空間情報を保持し、ステレオに強制ダウンミックスすることなく各チャンネルを個別に処理します。 - 📂 全フォーマット完全互換:
mp3,flac,wav,m4a,ogg,opus,aiffなど、すべての主流オーディオフォーマットを完全にサポートしています。 - ⚡ 超高速クラウド処理:クラスター並列処理を活用することで、100MB のロスレスオーディオファイルでも短時間で推論を完了できます。
V. よくある質問 (FAQ)
Q:なぜグラフィックボードなしで使えるのですか? A:計算は当社のクラウドクラスター上で実行されるため、すべての負荷はサーバー側で処理されるからです。
Q:オンライン版とローカル版 VocalRemover の違いは何ですか? A:ローカル版は通常、複雑な環境設定やハードウェアが必要です。VocalRemover は、最高のパフォーマンスを発揮する AI モデルの組み合わせを選定し、「シーン」を通じてカプセル化しています。これにより、ユーザーは基盤技術を理解せずとも、同等またはそれ以上の結果を得ることができます(サーバー側のモデル構成は継続的に更新しています)。
Q:なぜ HiFi モードは遅いのですか? A:HiFi モードでは、Transformer ベースの大型モデル(Roformer シリーズなど)を使用しているためです。従来の CNN モデルに比べて計算の複雑さが数倍になりますが、極めて複雑な周波数スペクトルの絡み合いを処理できるため、最高の音質を求める場合の選択肢となります。
VI. よくあるトラブルシューティング
アップロードや処理中に問題が発生した場合は、以下の一般的な原因を確認してください:
1. ファイル形式の確認
- 暗号化された形式は非対応:音楽プラットフォーム独自の暗号化ファイル(例:
.ncm,.qmc,.kgm, 暗号化された.ogg)は処理できません。- 解決策:標準的な非暗号化ファイル(
.mp3,.flac,.wavなど)をアップロードしてください。
- 解決策:標準的な非暗号化ファイル(
- ファイルの整合性:ファイルが破損しておらず、ローカルのプレーヤーで正常に再生できることを確認してください。
2. 時間とサイズの制限
- 時間制限:処理の安定性を確保するため、オーディオまたはビデオの長さは 15分 以内を推奨しています。
- 解決策:非常に長いオーディオの場合は、複数のセグメントに分割してバッチ処理することをお勧めします。
- サイズ制限:ネットワークの変動によるアップロード中断を防ぐため、単一ファイルは 300 MB を超えないように推奨しています。
3. ネットワークとブラウザ
- 一部の古いブラウザでは互換性の問題が発生する可能性があります。最新バージョンの Chrome または Edge の使用を強く推奨します。
- アップロード中は安定したネットワーク接続を維持し、現在のタブを閉じないでください。
VII. まとめ
VocalRemover は、あなたのポケットの中にある AI オーディオ処理ラボ になることを目指しています。
カバー作品を作りたい場合でも、ノイズの多いインタビュー録音をきれいにする必要がある場合でも、ブラウザを開いて対応する 「シーン」 を選ぶだけで、複雑な計算はすべて私たちにお任せください。
💌 フィードバックをお待ちしています
私たちは、すべての人に役立つオンラインオーディオツールを提供することに尽力しています。 問題が発生した場合、機能のリクエストがある場合、または より専門的なモデルが必要な場合 は、右下の フィードバックアイコン 💬 からお気軽にメッセージをお送りください。
皆様からのフィードバックは私たちにとって非常に重要です。ご連絡をお待ちしております!
