7時間半の音源を処理する話
こんなこと初めてやったが様々な意味で未知の領域であり悪戦苦闘した。今さっき編集が終わったが書き出しとエンコードにやたら時間がかかるのでその間に記録をつけておく。
まず1ファイルの mp3 で7時間あるので編集前に wav にデコードする必要があるのだが、デコードが失敗する。具体的には、Wavを展開すると波形が2時間分ほどしか認識されない。192kbps の mp3 を展開して 4.6GB ほどなのでファイルサイズ的にはデコードが完了しているように見える。Lame, foobar2000, 果てはいにしえの SCMPX まで引っ張り出して試したが現象が再現するのでデコーダのバグではないようだし、wav を読み込ませる側のソフトを変えても再現する。原因分からず。
こうなると mp3 のままソフトで読み込んで編集することになるのだが、それは相当選択肢が限られてくる。mp3 を読み込めるソフト自体そう多くない上に、mp3 対応のソフトに読み込ませてもファイルサイズ的に無理なのか軒並みエラーを返してくる。だいたい、mp3 を読み込めると言ってもそれは編集前に wav でオートデコードする機能があるというだけで mp3 を直接編集できるわけではない。デコードで詰まれば結局同じことだ。Live などは mp3 を読み込ませるとデコードデータをキャッシュ容量限界まで保持してキャッシュサイズが限界を超えて初めてエラーを返すという実にいやな挙動をする。
これはもうファイル自体を読み込まずファイルサイズか何かでで無理矢理切断するしかないのか、などと考えつつ駄目もとで Cubase にドロップしてみたら、おお、読み込んだよ。Converting だの 5m 10s だのと表示される。Lame で30分近くかかったデコードが5分やそこらで完了するわけはないのだが、一体何に変換しているのだろう。謎の変換作業が終わると波形イメージ作成が開始、1分ほどで表示された。フェーダーの書き込みも wav と同じようにできる。すごいぞ Cubase。これからは長時間ファイルの編集もこいつで決まりだ。それにしても、どういう動作をしているのか気になる。
もっとも、ここでも未確認現象は発現した。まず、2,3回再生をしたあたりでスナップが効かなくなった。スナップの状態に関わらずグリッドにスナップできない。また、サイクルマーカーが打てなくなった。分割書き出しが目的なのでこれは打撃。通常のマーカーで代用したがやり辛かった。小節数が15,000を超えていたので、さすがに多少何かあっても仕方がない。ほぼ通常通り編集ができるだけでも僥倖というものだ。
音の話
少しだけ書いておく。まず長時間の音源レベルを均一にするには通常のピーク検出型ノーマライズでは意味がない。時間経過によってその時々の PA マスターは上下していくためダイナミックレンジは相当な起伏になるし当然ピークは 0dB/FS に達しているため。だからといって平均値検出ノーマライズツールではアルゴリズムにもよるのだがクリップは避けられないので実用は厳しい。結局は DAW に起こして目測で dBメーターを確認しながらダイナミクス系のオートメーションで対応することになる。
やってみて気づいたが、Cubase のフェーダーメーターには dB 値が振られていない。マスターフェーダーにもないし拡大フェーダーにもない。内部32bit 浮動小数点で動作している Cubase 上では音量レヴェルは相対的なものであり内部の音声処理でクリップは起こらず、ただマスターアウトからオーディオ IF での D/A 部でのみデジタクリップが発生する。そのため普段はメーターの振れ幅を厳密に数値で意識することがなかった。一応メーターの色分けで dB 値の数域予測はできるのだが、dB が対数の性質を持つ以上、-6dB より下の確認には精度的な問題を残す。
そこで今回は Solid State Logic の VST メーター X-ISM を使って対応した。サイズが小さいのが瑕釁なのだが精度的にはこれ以上ないレヴェルの代物である。"X-ISM → ダイナミクス系 → X-ISM" というインサートチェインでメーターを2台並べてインプットゲインとアウトプットゲインをモニターしながらオートメーションを行い均一な音量を確保する。こういった工夫ができるのは DAW ならではである。やはりただの作曲ツールにとどまらないのがワークステーションの名たる所以だと再確認した。
esPstで独自メニューを作成する(キーコマンド・フロントエンド)
何に使ったものか長いことさっぱりわからなかったポチエスだったが、esPst をランチャにして使うとは、何と言うか、ようやく身の丈に合った使い道を発見した思いだ。というのも、「あのホットキーなんだったけかな」は Cubase を使っているとしょっちゅう起きる。Cubase に用意された膨大なコマンドはそれこそ全通りの修飾キー組み合わせを駆使してなお足りるか、というところであり、主要なアルファベットキーなどは需要逼迫、おかげで Alt & Shift & U などと変態的なアサインに手を伸ばす羽目になる。もちろんこんな割り振りをしていたのではキーコマンドなどあっという間に脳みそからこぼれ去る。
esPst はテキスト貼り付けソフトなのだが変数や仮想キーを扱えるので、要は文字に起こせさえすれば大概何でも送れる。そこで、あらかじめソフト側でホットキーを設定しておき、esPst のメニューから仮想キーを送信して実行、というのが esPst ランチャの流れなのだが、これはつまり esPst を Cubase のキーコマンド専用フロントエンドとして扱えるに等しい。多少手間だが使いそうなコマンドをキーバインドと共に esPst に記入しておけば、コマンドランチャ兼忘備録のようになる。インクリメンタルサーチも行えるので、例えばフェードに関するコマンドを探したければ、"Fade" と入力することで候補をピックアップできる。
仮想キーの記述法が多少ややこしいがなんとかキーコマンドを移植して、さらに Cubase 本来の機能では実現できないマクロやロジカルエディタのメニュー化を果たす。おまけに AutoHotkey の自作コマンドもまとめておく。完成図。およそ使うことのないコマンドまで詰めておくと設定の保守性が下がるのでほどほどにしておく。
ピッチ補正ソフト比較
そろそろ専用のヴォーカル編集ツールを導入したくなってきたのでリサーチ。
ソフト | Tune | Auto-Tune5 | Melodyne Plugin | Pitch Fix |
---|---|---|---|---|
メーカー | Waves | Antaress | Celemony | Yamaha |
SoundHouse価格 | \72,800 (Native) | \44,800 (VST) | \35,800 | \20,200 |
トライアル | Link | Link | Link | Link |
Waves Tune はさすがに高いが Yamaha Pitch Fix はちょっとお話にならないレヴェル。Sonar 使いであれば VP-9000 ゆずりのバリフレーズ・テクノロジ V-Vocal の恩恵にあやかれたのだが。というわけで Auto-Tune5 か Melodyne Plugin なのだが、触ってみた感じでは圧倒的に Melodyne のほうが直感的で使いやすい。
Melodyne はピッチやフォルマントのみならず音量・タイミングまで含めてトータルに納得いくまで柔軟なフレーズ編集を繰り返すことができる。初期状態で自動補正を行わないので、極力音源を改変せずピンポイントでマニュアル編集したい自分にはこの方が合っている。
Auto-Tune はいかに自動的に自然な補正を行うかというソフトのように思える。マニュアル補正よりもどちらかというとあらかじめ設定を練りこんでおいて、ライヴヴォーカルなどの生音源に差し込んで*1補正編集はするような用途向き。Melodyne は一度音源をキャプチャ→アナライズした後編集するので、生ヴォーカルへのリアルタイム補正は Auto-Tune でないとできないし、"Daft Punk - One More Time" のようなロボットボイスエフェクトとしても使えない*2。スタジオワークなら断然 Melodyne かな。
ところで、いまだにピッチ補正ソフトは邪道であるという論調はあるのだろうか。僕の考えとしては、あらゆるパートが完全平均律で構成された現代音楽にヴォーカルを乗せると、ほんのわずかなズレもつぶさに観察できてしまい、よりシビアな編集が求められるため、これに対応するには専用のツールを使っての補正という形でないと現実的に厳しいものがある。また、パーフェクトと言える出来の主旋律に対して完璧なカウンターやコーラスを録れたとしても、それぞれがセント単位のピッチの世界で相互にうまく交じり合うかどうかは別問題になってくるため、この補正も必要になる。敢えて気をつけるならば、レコーディング中に、この程度なら後で補正すれば間に合う、といった妥協を生むことで緊張感を失わないよう心がけることだろうか。
少なくとも僕は手抜きのためにこの手のツールを使うつもりはないし、より良い音楽を作るために最大限の努力を払い、そのための手段を選びはしない。表情がわずかに足りないが正しいピッチで歌えているテイクとピッチがわずかにフラットだが輝くような表情を持つテイク、どちらを採用したいかなんて考えるまでもない。そのための手助けをするだけだ。
*1:Antaress AVP-1 という Auto-Tune のハードラック版が存在する。音痴矯正機として歌唱力の残念なアイドルのコンサートに常備されている。製品化を前提にしたスタジオレコーディングでの作品はともかく、生声を聴かせないライヴとは一体何なのだろう。客を無礼ている。
*2:一度キャプチャしてから編集するためリアルタイムエフェクトとしては使えないが似たような音自体は出せる。ちなみに Daft Punk が One More Time で使ったヴォイスエフェクタは Auto-Tune ではなく Digitech Talker である。このように、ピッチコレクタはヴォコーダーでもトーキングモジュレータ(フォルマントフィルタ)でもない第三のエフェクトとしても使用されている。
ディレイタイム計算 - fenrir編
fenrir はインデックス検索型コマンドラインランチャであり、デスクトップを検索してファイルを実行できる。また、引数を渡してツールやURLを実行できるので、fenrir を通して様々な応用ができる。階層型のオンライン辞書や CGI にクエリを渡して実行する類のスクリプトなどは fenrir から操作している。
fenrir を通すとGoogle電卓を大変便利に使えるようになる。こいつは複雑な計算のみならず様々な単位も扱えるので、fenrir からインスタンドコマンドで単位変換コマンドを作っておくと便利。
すばやく定形計算が行えるので、ディレイタイム計算はこれで一本化してしまう。逐一ソフトを立ち上げるより fenrir を通した方が格段に速い。実用性というよりは興味の産物ではあるが。
; whole note dly="http://www.google.com/search?q=(60/%A)*(4/1)*1000" ; 2nd dly2="http://www.google.com/search?q=(60/%A)*(4/2)*1000" ; 4th dly4="http://www.google.com/search?q=(60/%A)*(4/4)*1000" ; 8th dly8="http://www.google.com/search?q=(60/%A)*(4/8)*1000" ; 16th dly16="http://www.google.com/search?q=(60/%A)*(4/16)*1000" ; 32th dly32="http://www.google.com/search?q=(60/%A)*(4/32)*1000" ; 64th dly64="http://www.google.com/search?q=(60/%A)*(4/64)*1000" ; dotted dly2.="http://www.google.com/search?q=(60/%A)*(6/2)*1000" dly4.="http://www.google.com/search?q=(60/%A)*(6/4)*1000" dly8.="http://www.google.com/search?q=(60/%A)*(6/8)*1000" dly16.="http://www.google.com/search?q=(60/%A)*(6/16)*1000" dly32.="http://www.google.com/search?q=(60/%A)*(6/32)*1000" dly64.="http://www.google.com/search?q=(60/%A)*(6/64)*1000" ; tripple dly23="http://www.google.com/search?q=(60/%A)*(4/3)*1000" dly43="http://www.google.com/search?q=(60/%A)*(4/6)*1000" dly83="http://www.google.com/search?q=(60/%A)*(4/12)*1000" dly163="http://www.google.com/search?q=(60/%A)*(4/24)*1000" dly323="http://www.google.com/search?q=(60/%A)*(4/48)*1000" dly643="http://www.google.com/search?q=(60/%A)*(4/96)*1000" ; quintuple dly25="http://www.google.com/search?q=(60/%A)*(4/5)*1000" dly45="http://www.google.com/search?q=(60/%A)*(4/10)*1000" dly85="http://www.google.com/search?q=(60/%A)*(4/20)*1000" dly165="http://www.google.com/search?q=(60/%A)*(4/40)*1000" dly325="http://www.google.com/search?q=(60/%A)*(4/80)*1000" dly645="http://www.google.com/search?q=(60/%A)*(4/160)*1000" ; septuple dly27="http://www.google.com/search?q=(60/%A)*(4/7)*1000" dly47="http://www.google.com/search?q=(60/%A)*(4/14)*1000" dly87="http://www.google.com/search?q=(60/%A)*(4/28)*1000" dly167="http://www.google.com/search?q=(60/%A)*(4/56)*1000" dly327="http://www.google.com/search?q=(60/%A)*(4/112)*1000" dly647="http://www.google.com/search?q=(60/%A)*(4/224)*1000" ; nonuple dly29="http://www.google.com/search?q=(60/%A)*(4/9)*1000" dly49="http://www.google.com/search?q=(60/%A)*(4/18)*1000" dly89="http://www.google.com/search?q=(60/%A)*(4/36)*1000" dly169="http://www.google.com/search?q=(60/%A)*(4/72)*1000" dly329="http://www.google.com/search?q=(60/%A)*(4/144)*1000" dly649="http://www.google.com/search?q=(60/%A)*(4/288)*1000"
"コマンド BPM" で計算。
実はディレイタイム計算など大して使う機会はない。今時のディレイはすべからく BPM Sync が搭載されている。しかしディレイタイム計算に慣れておくと、そのうち BPM を見ただけで漠然とディレイタイムがわかるようになってくる。これが感覚的に理解できるようになると、あえて正確でないディレイタイムを使ったステレオディレイを作ったり、音速と距離から現場の一時反響音遅延と音価の関係性を想定したりと「数値化された時間」に対する応用力が高まるので、身につけておくのも一興である。
関連 : オーディオサンプル数の計算
Oatmeal バグ修正
Fuzzpilz Oatmeal ユーザーに朗報。以前書いたマルチコア環境で複数台同時に再生すると再生音が滅茶苦茶になるバグが、最新版の ver37-6c で修正されている……かどうか知らないが、うちでは発現しなくなった。あ、あと3ヶ月早く直してくれていれば……ともかく、これで心おきなくまた Oatmeal を使えるようになった。
興奮の Winter NAMM 2008
米アナハイムで開催される世界最大の電子楽器展覧会 NAMM ショウ。今冬の新製品は特に意欲的なものが多く、次世代 DTM の到来をひしひしと感じさせてくれる。中でも特に興味深く感じている製品をいくつか紹介する。情報源は毎度おなじみ Rock on の NAMM レポートから。
Access - Virus TI Snow
http://www.access-music.de/snow/
Access から Virus TI シリーズの新モデルが登場。ポリフォニー/パート数を落とした他は先行のモデルと同様のスペックを備えている。必要最小限のインターフェイスを備えつつ携行性に長けるミニボディが魅力的。何よりその名前。僕のためにあるシンセとしか思えない……。このサイズならライヴに持っていくのも手軽だし、Desktop との入れ替えを検討したい。価格は $1.350, 4月リリース予定。
Waldorf - Blofeld
http://www.waldorfmusic.de/en/products/blofeld/blofeld_overview
Waldorf からもミニサイズの VA が登場。小さなボディと裏腹に "Q" の全オシレータ、Microwave シリーズの全 Wavetable を搭載しており、しっかり名機の魂を継承している。USB 端子は用意されているものの VST に関する記述はなく、DAW との連携性が不明なのは残念。ミニサイズシンセの欠点は本体でのエディット性に欠ける点にあるため、最低でもソフトウェアエディターは欲しい。国内実売8万円台、2月リリース予定。
Lexicon - PCM96
http://www.lexiconpro.com/AES_Events.aspx
リヴァーブの老舗 Lexicon から PCM シリーズの最新モデルが登場。アウトボードリヴァーブでありながら、PC と FireWire 接続によりプラグインリヴァーブとしても動作するという驚異のハイブリッドマシン。これには度肝を抜かれた。ハードエフェクターとしても使えるアウトボード DSP ユニットといったところ。ありそうでなかった発想。今後こういった真の意味でハード/ソフトの融合が加速していくものと思われる。
Dave Smith Instruments - LinnDrum II
http://www.davesmithinstruments.com/products/linndrum2/index.php
DSI から、なんと LinnDrum が蘇る。さらにマニアックなことに、本製品には音源方式でアナログモデルとデジタルモデルの2モデルで提供される。僕が思うにデジタルテクノロジーの次世代の課題は「デジタルでアナログを制御する」ことなので、この LinnDrum II アナログ版なんかはその一歩と言える。アナログ版は DSI, デジタル版は本家 Roger Linn から発売。それにしても、DSI のシンセデザインの流麗さはただごとではないね。
Spectrasonics - Omnisphere
http://www.minet.jp/spectrasonics/?cat=7
Spectrasonics から Atmosphere の後継機が登場。サウンドエンジンを Stylus RMX ライクな STEAM エンジンに移植し、8パートマルチとなっているほか、最適化前で 40GB のパッチ、数々のハイブリッドシンセシスを搭載、Stylus RMX との連携機能もある模様。価格はおよそ $500, 9月リリース予定とのこと。これ、購入決定です。今から待ち遠しい。
Rock On のレポートムーヴィーで音源の収録風景が見られる。ピアノを燃やしてレコーディングする様にはエリック・パーシングの狂気を感じる。
SkyLife - SampleRobot 3
http://www.samplerobot.com/index_b.php
ドイツの SkyLife SoundDesign 社が開発、韓国の ESI が流通を行っている国内未発売品。ハードシンセのサンプリングを自動実行しライブラリ構築を行うソフト。VSTi サンプリング・サンプラーである DiscoDSP - HighLife のハードシンセ版のようなものらしい。詳しいことはわからないが、ハードシンセを簡易ソフト化できるという認識でいいのかな。もし実用的なレヴェルであればかなり魅力的である。国内未発売ということで情報に乏しいが、幸いデモヴァージョンが公開されているので、後で検証してみたい。
総評
今回の新製品にはテクノロジー面で魅力的なものが多かった。ソフト/ハードのハイブリッド、アナログ/デジタルのハイブリッド、といったテクノロジーの有機的結合がいよいよ台頭してきたことを感じさせられる。PC ベースで作曲している自分には願ったり叶ったりの状況であり、どんどん進化していって欲しい。
逆に残念だったのは国内メーカーの惨状だ。やけくそ気味にハードシンセを乱発している KORG はしかし DJ ギアでかなり魅力的な名機を輩出しているのでまだ救いがあるが、Roland にはがっかりだ。未だに Fantom シリーズやら SP シリーズの最新作を発表、なんてやっている。呆れた。ソフトシンセと違いバージョンアップの効かないハードシンセにおいてこうも同系の新製品を続々リリースしていては客離れを起こすだけにしか思えない。YAMAHA にはもはや DTM 市場にアピールする気概すら感じられない。ソフトウェアベースに流れる時代だからこそハードウェア開発力のある国内メーカーができることが必ずあるはずだ。頑張って欲しいと思う。
音と音楽の違い
音 : 無音は音ではない
音楽 : 無音も音楽である