Go to contents

フォトショップの顔補正はAIにまかせて

フォトショップの顔補正はAIにまかせて

Posted December. 13, 2019 08:46,   

Updated December. 13, 2019 08:46

한국어

人はモノの形や特性を直感的に判断するが、人工知能(AI)は複雑な学習プロセスを経てこそ、本来の機能を発揮できる。AIが映像の中のイメージから特徴を見つけて、コア情報を抽出し、これを分析して正解を出すためには、数多いデータを繰り返して学習しなければならない。このようなAI技術は、静止しているものや動く物体の行動を迅速に追跡して判断しなければならない自律走行車などに適用されるが、そのほとんどを外国技術に頼っている。

韓国電子通信研究院(ETRI)は、人工知能研究所視覚知能研究室の研究チームが視覚AI技術のコアアルゴリズムを開発したと、12日明らかにした。視覚AIを学習させるために必要な都心環境のモノ560種を対象に、モノの認識学習データ20万枚も一緒に公開する。ETRIが公開したアルゴリズムと学習データを活用すれば、必要なサービスや新しい革新的機能を具現できるので、国内AI産業に心強いインフラになるとみられる。

今回開発した視覚AIアルゴリズムは、写真の中の物体の特徴を見つけ出して情報を抽出して分析するAI技術で、「バックボーンネットワーク(VoV Net)」を通じて公開される。AIアルゴリズムを開発者たちと簡単に共有できるウェブサイト「ギットハブ(Github)」に、コードと取扱説明書を掲載する方法で共有する。研究チームは、視覚AIの学習に必要な高品質の写真データも一緒に公開した。データには、都心の防犯カメラに映る電柱、信号機、自動車などが含まれた。

パク・ジョンヨルETRI視覚知能研究室長は、「バックボーンネットワークを活用すれば、モノの検出、客体部分別の分割認識、顔認識など、さまざまな機能を具現できる」とし、「公開した学習データも、単に任意のモノで構成されたデータより、視覚AIの具現と学習により効果的だろう」と語った。

研究チームは、フォトショップのようなイメージ専門編集プログラムを使わなくても、人の顔写真を簡単かつ自然編集できるAI技術も公開した。写真の中の人物がつけていないアクセサリーを追加したり、髪の形や表情までも簡単な作業でAIが自動的に編集する技術だ。顔写真に特化した様々な編集が可能なアルゴリズムといえる。

この技術には、ディープラーニングの一種である「ガン(GAN)」技術が活用された。この技術は、本物のような偽物のデータを作り出すのに効果的だが、ユーザーの狙いや条件を完璧に反映していないという欠点があった。研究チームはこの技術を補完して、ユーザーが希望する最適の結果を出せるようにした。

この技術を活用するためには、人物写真とユーザーが希望する入力値のみアルゴリズムに入れればいい。ユーザーが希望する条件に適しながらも、その写真の中の周辺環境に自然に似合うイメージを作ることができる。パク室長は、「国内の視覚AI技術が急速に成長しているが、外国への依存度が高いのが現状だ」とし、「今回関連技術を公開して、国内の産学研が視覚AI基盤の様々な産業生態系を造成できるように積極的に支援したい」と明らかにした。


キム・ミンス記者 reborn@donga.com