熟達技能の特徴づけ

Bernstein (1947) は「問題解決の手段としての運動制御」を身体技能と呼びます.身体という高自由度系を制御する本質はその自由度をいい具合にすることだと思われます.とくに,課題の成績に関して「ここは外せない」という要所では,熟達した人ほど運動のブレを抑えると予想されます.この予想をデータから示すべく,本研究では,被験者のボール投げ動作を分析しました.利き手(熟達)と逆の手(未熟)で比較したところ,ボールをリリースする時点で自由度が低くなる,つまり,課題の要所でブレを抑える制御をしている可能性を示しました.

20170928_research_preview_p01

身体模倣のための力学系同定

身体模倣では,観測した他者の運動データからそのデータを生成した制御規則を推定する問題を含みます.この問題は,身体運動系を力学系とみなすとき,運動の生成規則である力学系の方程式やパラメータを同定する問題といえます.力学系はその不変量「次元」により特徴づけできます.滑らかな力学系の場合,アトラクタ再構成法により,不変量「次元」は一部の観測変数から特定できることが示されています.本研究ではその運動データを「次元」により特徴づけることで,連続時間力学系のひとつ Rossler 系のパラメータを同定可能だと数値的に示しました.この結果は,模倣だけでなく,人の運動データに対しても,その制御(技能)の推定に応用できると考えています.

20170928_research_preview_p03

倒立振子を用いた意図推定

動作の裏に隠れた意図を推定する能力は模倣の基礎と考えられます.子供は大人の失敗した動作からでも隠れた真の意図を推定できることが経験的に示されています.この心理実験に着想をえて,伝統的な制御課題,倒立振子課題を用いた意図推定の数値実験を行いました.ここでは,「意図」を運動の計画すなわち制御とします.この数値実験では,可動域制限あり/なし2種類の振り子を用い,成功条件(学習時あり → 実演時あり)と失敗条件(学習時なし → 実演時あり),これら2つのよく似た実演動作の裏にある意図(制御)の違いを分類できるかを検討しました.その結果,力学系の「次元」を分類器の特徴とした場合には,振り子の知識をほとんど使わないにもかかわらず,振り子の知識を十分に使う力学的エネルギーを特徴とした場合に匹敵する分類成績を達成できました.この結果は,子供が大人の意図を読み取る実験結果のように,観察対象に関して少ない知識しかもたない場合でも,その動作データから動作に隠れた意図(制御)の違いを分類できることを示唆します.

20170928_research_preview_p04

金融市場シミュレーションの並列分散実行ソフトウェア

交通渋滞や金融バブルなど,多くの人々が同じ行動を集中的に選ぶことで生じる社会現象は深刻な社会問題のひとつです.こうした社会現象ではその複雑さから,問題の根本原因を特定したり,問題を解決・回避する政策を立案することが難しいとされます.この現状に対し,計算機上で社会シミュレーションを行い,仮想的にさまざまな条件を試し,その帰結を比較する方法が使われてきました.近年では,要素数などのスケール(規模)に対する社会システムの頑健性が問われています.大スケールの社会シミュレーションには ① 各試行の実行時間の増大,② パラメータ条件の組み合わせ数の増大 という大きな2つの問題があります.

本プロジェクトチームでは,① 金融市場シミュレーションの並列分散実行ソフトウェア Plham(ぷらむ)他多数,② シミュレーション実行管理ソフトウェア OACIS(おあしす)を開発しています.Plham は和泉研(東京大学)& 鎌田研(神戸大学)[鳥居・鎌田・和泉],OACIS は理研計算科学研究機構 離散事象シミュレーション研究チーム[村瀬・内種・伊藤]の開発です.Plham と OACIS の連携により,大規模シミュレーションを効率的に実行し,膨大なパラメータ空間を効率的に探索し,社会制度設計の指針となる知見を迅速に引き出す手助けを行います.

20170928_research_preview_p06

Plham(ぷらむ)関連リンク

高頻度裁定取引による金融ショック伝搬

2010 年,アメリカの金融市場で,数秒の間に市場指数が急落し復帰する現象が観察されました(FlashCrash).アメリカ証券取引委員会はこれを調査し,複数市場間の高頻度裁定取引が価格急落の引き金だと報告しました.利益を上げる取引原則は「安く買って高く売る」です.裁定取引とは複数の商品を同時に売買し,「安い商品を買って高い商品を売る」ことで,合計としてプラス利益を目指す方法です.近年ではコンピュータによる自動取引が普及し,高速化・高頻度化しています.先の報告ではこの高頻度裁定取引が市場全体を波及的に不安定にすると推測しました.

この波及的効果のメカニズムに迫るべく,本研究ではエージェントシミュレーションを使い,高頻度裁定取引の価格への影響を調べました.高頻度裁定取引トレーダは指数商品とそれに紐づいた原商品を天秤にかけて売買します.個別商品を扱う低頻度トレーダはその取引の性質から適正な価格に向けて現在の価格を動かします(図では修復力).分析の結果,指数商品と原商品1の修復力のバランスが崩れるほど裁定機会が増加し,その結果,高頻度裁定取引の副作用として金融ショック伝搬(現商品2の価格変化)が強く生じることを示しました.

20170928_research_preview_p07

学習主体の協調行動

社会は経験から学習し行動を適応させる個人の集まりです.個人間の利害対立はよくあることです.利害対立の状況では,個人的利益の追求は集団的利益の追求と矛盾します.利益相反のリスクを考えると,個人的利益の追求は悪い戦略とは言えません.古くから,個人的利益を追求する人々の集団は望ましくない社会状態に至る,という有名な理論的予想がありました.そこで,この予想に反して,なぜ人々は協力するのかが問われてきました.ここで協力とは個人的利益よりも集団的利益を優先することをいいます.多くの既存の説明は「あらかじめ協力的な気質をもつ」と述べてきました.

本研究では,ゲーム理論という枠組みで,学習能力をもつ個人的利益追求型の主体を分析しました.この学習主体は,不確実性の高い限定された情報だけから,強化学習(条件づけ)という心理学でもよく知られた学習を行います.分析の結果,学習主体が両方とも十分に高い学習能力をもつとき,ほとんど 100% 協力できることを示しました.この結果は,個人的利益追求型の人々でも,長期的な経験から学習することで,集団的に望ましい社会状態を高い確率で実現できることを示唆します.

20170928_research_preview_p05