2011/05/24

『Kinectセンサープログラミング』買ってきた

【同時上映: ユーザー検出でバグってみた】

今日は、世界で初めて Kinect プログラミングを解説した技術書の発売日である。

ぼくはこれがすごく気になり、予約開始とともに Amazon に注文をして発売日を今か今かと待ちわびていたほどだった。

しかし突如として Amazon は予約を一方的にキャンセル。さらに「この本はお取り扱いできません」状態が今なお続いている。


仕方なくジュンク堂書店に行ってみたところ、出来たての『Kinect センサープログラミング』が折よく品出し用のワゴンに載っていたので早速ゲットして意気揚々と帰途についた。

『Kinect センサープログラミング』 ¥3,200 (税別)

さてさて。

 Kinect に関しては、このブログでもちょこちょこ言及してきたけれど、いかんせんぼくの調べ方が適当すぎて細かい誤解がいっぱいあった。

その中でも今回は、特に致命的だった事柄について述べたいと思う。



今までは、奥行き情報から 3 次元再構成を行う話をしてきたので、そろそろ心機一転モーションキャプチャ的な事もやりたいなぁと思い、『3.2.7 ユーザーの検出をする(p.117)』を試してみる事にした。

これは、カメラに写った人間を識別し、色分けして表示するというものである。

余談だが、これを画像処理のみで実現しようとすると、一般物体認識手法というなかなかに高度なテクを駆使しなければならない。 Kinect は、赤外線センサーという画期的アプローチによって、この問題を易々とクリアしてしまった。

閑話休題。

本に載っていたサンプルコードを忠実に入力し、ビルド。

処理系がなんか警告を発しているが、そこはまぁ本質ではないので気にしない。

問題は、プログラム起動直後に例外が catch されて即死するという事である。
KinectTest.exe0x76a6fbae で初回の例外が発生しました: Microsoft C++ の例外: std::runtime_error (メモリの場所 0x0029f8a0)。
スレッド 'Win32 スレッド' (0x1ad8) はコード 0 (0x0) で終了しました。
スレッド 'Win32 スレッド' (0x1abc) はコード 0 (0x0) で終了しました。
プログラム '[2224] KinectTest.exe: ネイティブ' はコード 0 (0x0) で終了しました。
こんなエラーメッセージだけを見たところで分かるわけなどないので、適当なところにブレークポイントを設定し、てきとうにデバッガで調べる事に。

その結果、どうやらバグの原因は
// ユーザーの作成
xn::UserGenerator user;
rc = context.FindExistingNode(XN_NODE_TYPE_USER, user);
if(rc != XN_STATUS_OK) {
    throw std::runtime_error(xnGetStatusString(rc));
}
らしい事が判った。

上記コード中に出てくる変数 context は、SamplesConfig.xml という XML ファイルによって初期化されている。

心当たりがあるとすれば、OpenNI を導入する際に参考にした 『OpenNI: WindowsでKinectを使う(※2011年5月24日現在閲覧不可)』 というページに、

4. 設定ファイルの書き変え

・OpenNIの設定ファイル 
[avin2-SensorKinect-*******]/OpenNI/Dataの中身をコピーし、
C:/Program Files/OpenNI/Dataにペーストしてください。
という記述があり、それをそのまま信じてしまった覚えがある。

これ以外に考えられない。



というわけで、SamplesConfig.xml をテキストエディタで開いてみたら、こんなカオスな感じになってしまっていて愕然とした。

<OpenNI>
    <Licenses>
        <!-- Add licenses here 
        <License vendor="vendor" key="key"/>
        -->
    </Licenses>
    <Log writeToConsole="true" writeToFile="false">
        <!-- 0 - Verbose, 1 - Info, 2 - Warning, 3 - Error (default) -->
        <LogLevel value="3"/>
        <Masks>
            <Mask name="ALL" on="false"/>
        </Masks>
        <Dumps>
        </Dumps>
    </Log>
    <ProductionNodes>   
        <!-- Normal Image -->
        <Node type="Image" name="Image1">
            <Configuration>
                <MapOutputMode xRes="640" yRes="480" FPS="30"/>
                <Mirror on="true"/>
            </Configuration>
        </Node> 
    
        <!-- HighRes Image -->
        <!--
        <Node type="Image" name="Image1">
            <Configuration>
                <MapOutputMode xRes="1280" yRes="1024" FPS="15"/>
                <Mirror on="true"/>
            </Configuration>
        </Node>
        -->
        
        <!-- Normal IR -->
        <!--
        <Node type="IR" name="IR1">
            <Configuration>
                <MapOutputMode xRes="640" yRes="480" FPS="30"/>
                <Mirror on="true"/>
            </Configuration>
        </Node>
        -->
        
        <!-- HighRes IR -->
        <!--
        <Node type="IR" name="IR1">
            <Configuration>
                <MapOutputMode xRes="1280" yRes="1024" FPS="15"/>
                <Mirror on="true"/>
            </Configuration>
        </Node>     
        -->
        
        <Node type="Depth" name="Depth1">
            <Configuration>
                <MapOutputMode xRes="640" yRes="480" FPS="30"/>
                <Mirror on="true"/>
            </Configuration>
        </Node>
        <!--
        <Node type="Audio" name="Audio1">
        </Node>
        -->
    </ProductionNodes>
</OpenNI>

どう見ても User ノードなんて存在しないわけで、そりゃエラーになるわけだ。

そこで、ひとまず SamplesConfig.xml を以下の内容に差し替えた。

<OpenNI>
    <Licenses>
        <License vendor="PrimeSense" key="0KOIk2JeIBYClPWVnMoRKn5cdY4=" />
    </Licenses>
    <Log writeToConsole="false" writeToFile="false">
        <!-- 0 - Verbose, 1 - Info, 2 - Warning, 3 - Error (default) -->
        <LogLevel value="1"/>
        <Masks>
            <Mask name="ALL" on="false"/>
        </Masks>
        <Dumps>
        </Dumps>
    </Log>
    <ProductionNodes>
        <Node type="Image" name="Image1">
            <Configuration>
                <MapOutputMode xRes="640" yRes="480" FPS="30"/>
            </Configuration>
        </Node>
        <Node type="Depth" name="Depth1">
            <Configuration>
                <MapOutputMode xRes="640" yRes="480" FPS="30"/>
            </Configuration>
        </Node>
        <Node type="Scene"/>
        <Node type="User"/>
        <Node type="Gesture"/>
        <Node type="Hands"/>
    </ProductionNodes>
</OpenNI>



再チャレンジ!

今度はうまくいった。


パーカーを着たたーせるが検出されて、きもちわるい緑色に着色されている。

おっと、そこに先生(青)もやってきた。


2人とも、かなり精度よく検出されている。

やったね!



【肝心の中身をてきとうにレビューするコーナー】

ざっと目を通してみて、ぼくは OpenNI と NITE の API リファレンスとサンプルコード集みたいだなぁという印象を受けた。

ぼくにとってこの2つは得体の知れないライブラリであり、ぶっちゃけ今までわけがわからないまま使っていた。だから、詳細を日本語で確認できる貴重な情報源として非常に価値の高い一冊だと思う。

こんなに買ってよかったと思えた本に出会えたのは久しぶりである。

ちなみにこの本では、『Kinect から取ってきたデータを OpenCV でレンダリングする』というのが基本方針なのだけど、あくまで解説の焦点は OpenNI と NITE なので、前提知識として OpenCV の初歩的な理解がないと厳しいだろうなぁと感じた。

また、対象読者を中級者向けに設定しているという事もあり、少なくともコールバックとか関数ポインタとかそういった概念を理解していないような人は迂闊に手を出すべきではない。あと C++ の基本的な文法も。

表紙と帯がけっこうポップなので、どちらかというとゲーマー寄りのプログラミング初心者が、『これさえ読めばすぐに光学迷彩を作れるようになる』と勘違いして衝動買いしてしまわないかと余計な心配をしてしまう。

とはいえ。

それまで日本語の情報が慢性的に欠乏していた Kinect プログラミングだけど、この本の登場によって開発の敷居がぐっと下がるだろうと予想している。

Amazon は早く予約を再開すればいいと思うよ。



21時37分追記: キャンセル扱いにされたはずの Amazon から、まさかのご注文発送メールが届いた。

もう既にジュンク堂で同じものを買ってしまったので、Amazon からの荷物は受け取り次第そのまま返品させて頂く事にした。

0 件のコメント:

コメントを投稿

ひとことどうぞφ(・ω・,,)