一人でもマルチカムした〜い

何回か収録を経験すると、次第に「1カメだと変化に乏しい」という思いがふつふつ沸いてくるかもしれません。1カメの良さはなんといっても手軽に編集出来るという点ですが、音楽ライブや演劇のように、引きと寄り両方撮りたいときにズームインしたりアウトしたりするとなかなか落ち着かない絵になってしまいます。撮影スタッフも複数人いるわけもなく(そんなお金があるのなら最初から業者さんにお願いすればいいし)、うーん、、、困った。

でも、最近は機器もお手頃になってきたので、機器の問題はなんとかなりそう。じゃあ一人でもやれることをやってみよう☆ ということを書いてみたいと思います。

YouTubeを見ていても、1家族の動画だったら1カメが多いですが、友達同士でわいわいやってる系だとだいたいマルチカムですよね。ただしたいてい撮影者も複数いると思いますが、ここでは撮影者も1人という前提になります。余談ですが、元祖1人でマルチカムって大人向けビデオでしょうね。民生用のカメラを使うだろうし、コンテンツの特性上、複数人で関わるというのがしにくいですし(する場合もあるでしょうが)。

さて、なにを撮るか、どこで撮るかなどいろいろあって一概には言えないですが、はっきり言えるのは、一人で3カメ回すときは、1つのカメラのところにずっといて、残りの2カメは放置になります。3つのカメラを場面に応じてあっち行ったりこっち行ったりというのは無理。となると、放置している側のカメラは広角で広めにとって、広くいろんな絵を拾えるようにするのが基本です。

放置系カメラで、特に自分と遠いところに置く場合、邪魔にならないようにとか、お客様が触れて倒してしまわないようにするというのが重要です(壊れてしまったり、最悪盗まれても財布を直撃しないとか)。なので必然的に、小型、安めで、隅っこに設置することになります。

私がそんな広角用放置カメラとして用いるのは「アクションカム」。アクションカムは小型だし、画角は広いし、放置系にはもってこいです。ソニーFDR-X3000の画角MAX状態で電源を入れ、あとは放置。バッテリーは1時間程度しかもたないので、モバイルバッテリーでUSB給電しながら撮影します。最近は中華系のGoProぽいアクションカムが激安で売ってますが、それでも意外とそこそこの絵が撮れます(音に関しては後述)。

舞台等であれば、客席の一番後ろから固定でステージを狙う放置カメラと、その脇で自分で操作して主にアップを狙うカメラを使います。

こちらは、とある小規模の舞台で1人マルチカムを行ったときの配置です。1カメがステージ全体を狙う固定カメラ(SONY PXW-X70)、2カメが自分で操作する移動カメラで時々ステージの袖近くに行ったりします(SONY FDR-AX700)、3カメが上で紹介したアクションカム(SONY FDR-X3000)をステージの隅にお客様側に向けて設置、4カメとしてお客様の様子を撮るように設置(SONY HDR-CX560V)しましたが、4カメ素材は結局ほとんど利用しなかったです。それぞれの絵はこんな感じ(著作権やプライバシーの関係で、あえて画質は落としています)。


マルチカムの時にもう一つ考慮が必要なのが、音をどこから取るかということです。大きくは、

  1. カメラに合わせて音声を切り替える
  2. カメラが変わっても同じ音声を使い続ける

というもので、私はいつも2です。サーキット映像や逃走中のように、カメラによって明らかに場面が異なる絵の場合は1のほうが雰囲気が出ますが、1人でマルチカムやる範囲だとそんな絵はそもそも撮れないので、、、逆にいつも同じ音が流れていた方が安定します。

上の場合だと1カメの音声になります。可能な場合は、音声はホールからもらって1カメに入れるか、PCMレコーダーに別取りし、1カメの音声と良い感じな割合でミックスします。1カメとのミックスは必ずしも必須ではありませんが、ホールからの音がドライすぎる場合は良い感じでウエットになります。逆にもともと良い感じでウエットであれば、1カメ音声と混ぜる必要はありません(ドライ?ウエット? というのは、ドライが演者さんの声だけ入っていて生々しすぎのことで、ウエットがホールの響きも含んでいる音のことです。通常我々が聞く音って大小あるけどほとんどウエットなので、ドライ過ぎると不自然に聞こえます)。

で、いよいよ編集作業。

(編集の様子)

編集作業でまず行うのは、それぞれの絵、音の同期を取ること。業務用機材だと同期信号(タイムコード)が入っているのでそれをもとに行いますが、そんな高級な機材はないので、、、各カメラの音声をもとに同期を取ります。要するに各カメラの音を聞き比べて、「このへん!」というポイントを見つけて、それを基準に合わせていきます。波形の形を見たり、特徴のある音を見つけて合わせます。

このとき絵と音の同期は外しておいて、絵と音がばらばらに移動できるようにしておきます。通常動画編集ツールでは、マウスで絵の部分をクリックして移動しても音が一緒に付いてきます(反対もしかり)。しかしこのモードだと微調整がフレーム単位でしか行えず、最小単位が16.666ms(=1/60ms 60pの場合)となりますが、もっと細かい単位で調整したいことが多いです。そのため絵と音をそれぞれ別に扱うモードに変更することで、絵はフレーム単位ですが、音はもっと細かい単位で移動できるようになります。

ツールによっては各カメラの音声信号から同期ポイントを見つけてくれる機能もあったりするので、それを使ってもいいでしょう。Vegasにもこの機能があるのですが、これを使ってまともに合ったためしがなくてw(処理中のまま固まってしまう)、たいてい自分の耳で聞いて合わせます。

余談ですが、各カメラのデータは当然デジタルなので、一度合わせればばっちり合うはずですが、、、長い動画だと次第にズレが生じる場合があります。どうも各機材の時刻の進み方って僅かにズレがあるようで、例えば2時間尺ものとかの1分目と1時間59分目で数十msずれたりする場合がありますので、あまりにズレが気になるようなら一度動画を切って、同期し直しするというのもありです(1時間0分で切って同期し直し)。

「いや、どうしてもバッチリ合わせたいんだ!」という向けに、タスカムのDR-701Dというレコーダーでは、HDMI信号を介してカメラの基準にレコーダーを合わせるという機能があります。これだとかなり正確にあうでしょう(5万円くらいしますが)。

同期が終われば、これもたいていの編集ツールに付いていますが「マルチカム編集モード」みたいなのを使って、このタイミングではこのカメラの絵を使う、というのをポチポチ選んでいきます。最初にざっくり選んで、後ほど細かく追い込むというのがいいでしょう。

色味も各カメラでおおまかに合わせます。もちろん厳密に合わせるほうがいいに越したことはないですが、地上波番組でも多少ズレているものが流れるので、それほど神経質にならなくてもいいかなと思います。ただしホワイトバランスは各カメラ「固定」で。固定しておけば編集時になんとかなりますが、固定していないと場面に応じてカメラ側にて勝手に調整が入ってしまうので、編集時にもうどうしようもなくなります。また出来る場合は、各マルチカムのメーカーを統一しておくと、割と色味が揃いやすいです。

で、最後にレンダリングして終わり。

以上のとおり、作業工程はそれほど複雑じゃないです。個人的にマルチカム時に一番時間が取られるのが、どのタイミングでこのカメラの絵を使おうかというための素材チェック時間ですね。大雑把に言って4カメの場合は1カメの4倍くらいかかります。正直手間ですが、1カメでは得られない数ランク上の絵が得られると思いますよ☆

よくやるのは、4カメを1画面に収まるように入れて1つのmp4としてレンダリングして、それを通勤途中に見てます。で、良い感じの場面とタイムをメモして、家に帰って作業、という流れ。

最近はカメラに限らず、三脚、メモリカード、HDDなどすべて安く入手出来るようになったので、よりやりやすい環境が揃っています。今後はAIがもっと一般化してくれば、マルチカム編集作業って劇的に楽になるんだろうなあ。その次は撮影もAIがやってくれるようになるかな?? 楽だなーそうなると。でも人間は何するんだっけ?