[HOME]

通産省の助成金に「画像のオブジェクト化」を応募します。

先月末に、与謝野通産大臣が言っていたベンチャー向けの助成金の公募が始まったと思っていたのですが、違っていたようです。未踏ソフトウェアなんとかいうので、まだ予算が確保されていないものだったようです。

なんとなく、IPAのは個人では参加しづらい感じがあったのですが、通産大臣の談話だと、高校生でもOKみたいな部分もあったし、悪い企画を選んだ評価委員は落とすとか、過度の合議制はやめるとかあったので、それが始まったらまた応募する予定です。

しかし、以前、IPAの高度情報化〜に応募したときには、ヒアリングに残ったものの開発体制にチェックが入って落選しました。ということで例によって、参加者募集中です。助成金当落状況

しかし、通産省の予算がまだ付いていない助成制度も怪しい所はあると思います。経営を、ベンチャーキャピタルに任せるというあたりです。ソフトピアのセミナーで、何度かベンチャーキャピタルの人が来ましたが、結局、忙しそうに土日も働いている企業に投資するとか、社長の人柄を見て投資するみたいな意見しか言っていないわけで、技術についての理解力は無いと公言するものばかりでした。日本のベンチャーキャピタルというのは、もともとスタートアップ時に関わっているのはなくて、株式公開直前の企業に取り入って、公開の利益のおこぼれにあずかるのがメインという風になっているので、そんなところと無理矢理手を組まされることになったら、えらい迷惑だと思います。

理解できない技術を操る創業者の首をできるだけ早く切るのがベンチャーキャピタルの仕事だと思っているに違いないわけですし、残業してでも締め切りに間に合わせるのが第一という風な考えをするマネージャーがいると、優秀な社員から順に辞めていくと言われている業界で、そういう経営をすれば、衰退するのは目に見えています。ビルゲイツの悪名に惑わされて、汚い手口を使えばソフトハウスは成功するとでも勘違いしているのではないでしょうか? 他方で、瀕死のアップルが、ジョブズが戻ってきただけで蘇るみたいな現実があるわけで、技術に対する理解力の大切さを見落としている気がします。

通産省

MITI (http://www.miti.go.jp/)

基礎になる技術

僕が画像のオブジェクト化と言っている技術は、狭い意味では、単に領域分割のこともあって、まぎらわしいのですが、それだけでは、虎の縞模様の黄色と花の黄色さえ区別することができません。用途によってはすべてが必要なわけではないにしろ、実際には、画質評価、減色から始まって、グラデーション近似、ベクトル化、ベクトル量子化圧縮、テクスチャー抽出、学習エンジンなどからなる技術の組み合わせの総体です。従来の技術との差は、エッジを検出してそれを辿って、形のデータを抽出するという方法ではないということです。

これまでは、アイデアが不完全で、画像によってうまくいかない場合に気づいて練り直すという様な繰り返しでした。三日月型を一気に2つの楕円弧の組み合わせに変換しようとして困ったり、ビルの窓とビルの壁のどちらが前景になるべきか混乱したりだったのですが、今回は自然画像をイラストのように単純化する(パラメータによって複雑さはコントロールできる)所までのアイデアに関しては出尽くしたと思っています。画像圧縮から画像理解までのいろいろな問題にほぼ共通の方法で対応できると思います。IPA応募より前に出願しないとなりません。出願しておかないとヒアリングで秘密が漏れるのを恐れてちゃんと説明できないのです。

製品の仕様

予算枠が大きいので、人さえ集まれば、これまでに助成金に応募したすべてのテーマを含むものが実現できると思っています。ただし、例によって期限が厳しいので、参加者がなければ厳しいでしょう。どのアイデアも、既存のものを高速化することによって可能になる新しい局面という感じなので、あまり画期的という風には見えないかも知れません。

画像理解ベースの超解像ソフト
MPEG4に対応した自動レイヤー化ソフト 
部分一致画像も検索できる検索エンジン
高速で高自由度のデータマイニングソフト 
究極の圧縮を含む3Dアニメーションソフト
登場人物の変更ができる映像編集ソフト 

画像理解ベースの超解像ソフト

通常の超解像ではなくて、オブジェクト化してオブジェクト毎に行うことでよりよい物が出来ると思います。例えば、TVの信号はインターレースですが、それを、ノンインターレースにしたり、秒間のコマ数を増やしたりという様な処理も、ミクロなフィルター処理より、オブジェクト化した後に行った方が高画質になります。MUSE方式で送られてきたハイビジョン映像も。4フィールドで1枚の絵になるわけで、間引かれている部分を補うのに、オブジェクト化が有効です。似た画像を探す処理が必要になるので、画像検索エンジンもこれに必要になります。映像を扱うので、MPEG-4対応というのも関連してくるでしょう。ビデオ編集ソフトにタイトルロゴが必要なのは自然で、それを最も前面にかぶせるのではなく、主人公の後ろにタイトルがあっても良いと思います。作業用に、オブジェクト化した状態を独自フォーマットで保存しておく必要もあるでしょう。

MPEG4に対応した自動レイヤー化ソフト 

ニューススタジオの映像を配信するときに、ニュースキャスターと、背後のセットを別のオブジェクトとして圧縮すれば、圧縮率が上がるという様な話です。MPEG-4は複数レイヤに対応してるものの、既存の画像を複数レイヤに分割するソフトはまだ存在していません。

部分一致画像も検索できる検索エンジン

インターネット上にある画像をロボットが巡回し、ピカチュウのキャラクターが不正に使用されていないか監視する様な場合に、必要になる技術でもあります。画像全体ではなく、一部分に何かが含まれているかどうかを検索可能なインターネット検索エンジンも存在していません。ただし、オブジェクト化して画像検索を行うソフトは、NTTが開発中みたいです。以前にも、NTTと競合してしまうと思ったことはあるのですが。ベクトル量子化圧縮をやっているときにTwinVQが出てきた時だったでしょうか。「bit」99/10に画像検索関連の記事がありました。NTTのは、エッジ検出から始まるものみたいです。階層構造を持った状態でオブジェクト化されるという特徴でもNTTのと差別化できると思います。もちろん速度でも。でも企画書で速度の差を説得するためだけに、他のアルゴリズムを実装してみるのも大変です。

高速で高自由度のデータマイニングソフト 

これは、すでにマイクロソフトが規格を策定しようとしていたりする分野で、出遅れという気もするのですが、一見無意味なデータから法則性を探し出すというのは、MilkyWayAstrologyの時からやっていたことで、pag1シリーズも、オブジェクト化もその延長にすぎません。最近の「数理科学」の計算幾何学特集で出てきた例よりは、より柔軟に新しいルールを見つけられると思うし、高速という点で利点があると思います。ただ、おもしろい問題を探すのが難しいのと、インタフェイスをどうするのか、例えば、遺伝子情報処理の分野の人が使おうとした場合に、マイクロソフトの規格に沿うだけで良いのか? という様なことはあると思います。うう。「bit99/10」にはタンパク質の立体構造の予測にデータマイニングの技術を使うというのも出てきました。どうも、応用のテーマはこれも陳腐化しているようです。

究極の圧縮を含む3Dアニメーションソフト 

Flashの3D版みたいなものをイメージしています。回転する3次元文字のロゴなんかはそういうプラグインがあれば、転送するデータは、100バイトもいらないでしょう。ビデオ画像の中に動き回るCGキャラクターを混ぜ込む程度のことであれば、2Dto3Dの問題はあまり生じないので良いかとも思うのですが、存在しなかったソフトの場合、使われ方のイメージを生き生きと描くというのが難しいかも。

登場人物の変更ができる映像編集ソフト

これは、1年とかでは無理なのですが、方向としては、映像を3次元データに変換し、さらにまた、絵コンテレベルまでに抽象化して、それを別の映像素材を利用して再編成する様なソフトが作ってみたいと思っています。与える素材に応じて、シュワルツェネガーの代わりに、マッスル北村が出演していたり、ヨーロッパの町並みの代わりに、日本の町並みが、液晶のコンソールの代わりにアナログメーターが並んでいるパロディー映画の様な物を自動生成するわけです。実写をアニメに変換したり、アニメを実写に変換したりも有益だと思います。

04/01/26更新

Google
Web www.PAG1U.net

seo
Tibet Support Network Japan(TSNJ)チベット・サポート・ネットワーク・ジャパン チベットの今日は、明日の台湾、あさっての日本ということで心配なので、リンクだけ貼っておきます。

[HOME]  (C) MATSUOKA , Hajime