日本テレビ、参院選特番での「AI顔認識システム」活用実験実施について【vol.1】
編集部
放送とAIの関係性が模索されるなか、日本テレビでは番組制作の現場レベルでAI活用が積極的に試みられている。
2019年7月21日、参議院選挙にともない同局系列で放送された選挙特番の制作現場において同社開発の「AI顔認識システム」が導入され、映像に映っている顔から人物を自動検出する実験が行われた。
今回は前後編に分け、日本テレビ放送網株式会社 技術統括局 技術戦略統括部 主任の加藤大樹氏にインタビュー。その舞台裏や、今後の展望などについて伺った。
── 今回の実験の概要を教えて下さい。
2019年7月21日に地上波で放送した選挙特番『NNN参院選特番ZERO選挙』ならびにCS放送『日テレNEWS24』にて放送した『日テレNEWS24×参議院選挙2019』の制作現場において、取材映像に映った人物を自動判定・認識する「AI顔認識技術」を使用し、情報の正確性向上と番組制作作業の効率化を実験しました。
── 「AI顔認識技術」は制作現場のどんな工程で活用されたのでしょうか。
「『オンエア素材の被写体確認』『収録素材の被写体確認・メタデータ入力』『報道サブへ入力された映像素材の被写体確認』の3工程で活用しました。
『オンエア素材の被写体確認』では、生放送番組用に映像素材の収録・編集・送出を行う『CV(Compact Video)センター』において、映像に映った人物を確認する作業に使用しました。通常この作業ではベテランの報道スタッフと編集スタッフがダブルチェックを行っていますが、今回はこれに加えて『AI顔認識システム』による確認を行いました。システムの運用中に誤りは一度も見られず、オンエアにおける誤報の防止に大きく貢献しました。
『収録素材の被写体確認・メタデータ入力』では、専用回線などを通じてCVセンターに送られてきた各地の大量な取材映像の被写体確認に使用しました。こちらも通常は専属のスタッフによるチェックが行われていますが、今回は『AI顔認識システム』がその役割を代替しました。ほぼ100%の精度を持つ当システムのリアルタイム処理によって大幅に作業効率が向上し、これまで生じていた「確認待ち」の時間を減少させたことで、迅速な素材利用を行えました。
『報道サブへ入力された映像素材の被写体確認』では、『N2サブ』と呼ばれる当社のニュース専用サブへ入力された中継映像の人物確認に『AI顔認識システム』を使用しました。この作業ではディレクターが紙資料を用いて確認を行っていましたが、当システムによって作業負担が大幅に軽減され、確認速度が向上しました」
── 「AI顔認識システム」開発の経緯を教えて下さい。
「私はかつてCVセンターで生放送用素材の編集マンを担当していたのですが、そのときに感じた『困りごと』が開発の契機でした。
編集マンは実際の取材を担当しないため、『この映像に映っているのは確かに◯◯さんである』と判断できず、取材担当記者にその都度確認する必要がありました。場合によっては確認が間に合わず、せっかく収録した素材がオンエアできなかった……というケースもありました。
その後新たな部署に移動して新技術のリサーチをしていたところ、AIによる顔認識技術に出会い、『私が苦しんできた人物判定に活用できる』と感じてプロジェクトをスタートしました。
AI顔認識技術を持つベンダー10社以上に声をかけて数ヶ月にわたる性能調査を行い、総合的にもっとも優れていると判断した東芝をパートナーに選定し、開発を始めました」
── パートナー選定の決め手はどんな点だったのでしょうか。
「精度の高さとカスタマイズ性の高さが決め手となりました。
東芝のシステムはあらかじめ豊富なデータセットによって学習されたAIが使用されていていたため、様々な状態の顔を判別することができました。
『AI顔認識システム』は1枚の写真からも角度の違いや光の違いをシミュレーションすることができ、学習データとなる顔画像が少なくとも十分な精度で判別することができます。こうした機能を実現できたのも、あらかじめ訓練されたAIを使用できたという点が大きく影響しています。
加えて実際の現場でストレスなく利用するためには、アプリケーション側の細かなカスタマイズが不可欠でした。アプリケーション込みで製品化された顔認識システムは多数あったのですが、処理が重くてリアルタイム運用が難しかったり、判定結果や処理履歴の文字が視認性に乏しいものが少なくありませんでした。こうした点を自由にカスタマイズし、改善できる仕組みであったという点も導入の大きな決め手となりました」
── 選挙特番への導入は当初から想定されていたのでしょうか。
「具体的な活用場所として、情報の正確性が求められる報道番組が有効なのではないかという考えがありました。そのなかでも選挙特番は特に正確性が求められる番組であり、『ここ(選挙特番)で実験が成功したら、他の現場でも応用できるだろう』と考え、導入に踏み切りました」
── 顔認識用の学習データはどのように調達したのでしょうか。
「選挙特番に際してはもともと報道サイドで候補者の顔写真が用意されることを把握しており、このデータを利用して学習を行おうと考えました。
今回の実験には、報道サイドが番組用に用意した約2,000枚の写真素材を使用しました。AIが利用できるようにデータを整形する工程は大変でしたが、既存の素材を流用できたことでコストを極力かけずにデータセットを用意できたことは大きかったです」
── これまで人間の手で担保されてきた工程をAIに置き換えることについて、現場から異論などは上がりませんでしたか?
「当初は『本当にAIは現場で活躍できるのか?』と疑問視する声を社内で耳にしましたが、私としては絶対にニーズがある、活躍できるという確信を持っていました。実際に活躍するところを目にすればきっと納得してくれるだろう、という思いで今回の実証実験にこぎつけました」
── 実際の放送現場ではほぼ100%の精度で顔認識できたということでしたが、現場からの反響はいかがでしたか?
「まず、精度の高さに対する反響が大きかったです。『一度もAI顔認識の間違いを見つけられなかった』という声をはじめ、『政治部記者によるチェック、編集マンによるチェックとあわせて3重のチェックができ、情報の正確性が非常に高まった』という声が聞かれました。
前回の選挙特番では当選した候補者による、いわゆる『バンザイ映像』のVTRが83本作成されたのですが、チェックが間に合ってオンエアにこぎつけられたのはそのうち約30本のみでした。今回『AI顔認識システム』を導入した結果、作成した54本のVTRのうち34本と、前回に比べ約2倍もの高確率でオンエアすることができ、『デメリットが何もないくらい便利だ』との言葉までもらうことができました」
被写体の確認作業という、非常に煩雑ながらも絶対に欠かすことのできない工程をAIによって効率化することに成功した日本テレビの『AI顔認識システム』。後編では今後の展開方針をはじめ、「AI登場後の人間の働き方」に切り込んでインタビューする。
【加藤大樹(かとう・ひろき)氏プロフィール】
2003年 日本テレビ放送網株式会社入社
2004年 同社「CV(Compact Video)センター」に配属。報道など生放送番組素材の編集業務やシステムの導入・運用設計を担当
2015年 同社人事部に異動。新卒採用、社員研修などを担当
2017年 同社技術開発部に異動。「AI顔認識システム」「AI原稿自動要約システム」などのAI系開発プロジェクトを立ち上げ
2019年 部署統合により、同社技術開発部が「技術戦略統括部」に名称変更