Notebook

確率のお勉強ノート。
ついでにmarkdownとかLatexの練習も。
基本的に参考にしたスライドの中身を書きならべたものです。
Monte calro localizationを理解したいだけなら教材その2から。

教材その1

確率ロボティクス入門第1回

確率の表記の基本[P14]

離散的な場合

数学的表記 意味
$P($条件$)$ ある条件が満たされる確率
$P(\hat x=x^*)$ ある変数$x$について、推定値$\hat x$が真値$x^*$と一致している確率
$P(x^* \in X)$ 真値$x^*$がある集合$X$に含まれる確率
$P(x)$ 変数$x$に関する確率分布

連続的な場合

値ごとの確率を関数にした、確率密度関数(probability density function, pdf)を用いる。
正規分布曲線とかよく見ると思う。

  • 連続ということは無限に値を持つことになるため、推定値$\hat x$と真値$x^*$がピタリと一致する確率は0になる。
$$ \\P(\hat x=x^*) = 0 $$
  • 真値$x^*$が、領域$X$の中にある確率は、面積で考えることができる。
$$ \\P(x^* \in X) = \int_{x \in X} p(x)dx $$
  • $x$における全ての領域のどこかに真値$x^*$がある確率は1になる。
$$ P(x^* \in x) = \int p(x) dx = 1 $$

条件付き確率

Bが観測されたとき、それがAである確率。
109が見えたら渋谷である確率とか。

$P(A | B)$ : 条件付き確率
$p(A | B)$ : 条件付き確率密度関数

移動モデル[P20]


$p(x_t | x_{t-1} , a_t)$ : 時刻$t-1$の時、行動$a_t$を実行すると、状態が$x_{t-1}$から$x_t$に変化する確率

例えば0m地点から1歩進むと、0.5m地点にいる確率みたいな。
出発地点、1歩の幅、到着地点はそれぞれ分布や偏りを持っているので、確率密度関数で表現ができる。
なので次のようなステップをふむ。

$p_{t-1}(x)$ → $p(x_t | x_{t-1} , a_t)$ → $p_t(x)$
  • このステップの数式を、マルコフ連鎖の式という。
  • 空間$\chi$はロボットが取りうる状態$x$の集合
$$ \\p_t(x) = \int_{x' \in \chi } p(x|x',a_t)p_{t-1}(x')dx' $$
  • 離散の場合
$$ P_t(X) = \sum_{ X' \in \chi }P(X | X', a_t)P_{t-1}(X') $$

観測モデル[P25]


$p(z|x)$ : ロボットの状態$x$の時、$z$が観測される確率密度関数

例えば、1.5m地点にある目印との距離が1mだったので、0.5m地点にいる確率みたいな。
移動モデル同様に距離の計測や現在地の信念も分布や偏りを持っているので確率密度関数で表現。

$p(x)$ → $p(z|x)$ → $p(x|z)$
  • ベイズの定理を用いて、信念の更新を数式で表現する。
$$ p(x|z) = \frac {p(z|x)p(x)}{\int_{x' \in \chi }p(z|x')p(x')dx'} = \eta p(z|x)p(x) $$
  • 離散の場合
$$ P(x|z) = \eta P(z|x)P(x) $$

教材その2

確率ロボティクス入門第2回

Monte Carlo localization[P8]

  • MCLが有効な場面
    • センサデータからロボットの状態を一意に定められない場合。
    • ロボットが取りうる全ての状態においてシミュレーションすることが大変なとき。

  • MCLの手順
    • 有限個の位置姿勢を適当に導き、実際のロボットのセンサデータと照らし合わせて判断する。
    • つまりパーティクル$\xi$を配置し、パーティクルごとに重みを計算する。
      • $\xi^{(i)}_{t-1} = ($位置姿勢$,$重み$) = (x^{(i)}_{t-1},w^{(i)}_{t})$

    • 今回のセンサから得られるデータは、ロボットから見えるランドマークの距離と方向。
      • $z = ($距離$,$方向$) = (d,\varphi)$

    • パーティクルから得られると予測されるセンサデータ$z'{}$と、実際に得られたセンサデータ$z$を比較し、尤度$p(z|x_t)$を計算する。
$$ p(z|x_t) \propto \frac {\exp (- \frac {1}{2\sigma_d}(d-d')^2)}{\sigma_d \sqrt{2 \pi}} \frac {\exp (- \frac {1}{2\sigma_\varphi}(\varphi-\varphi')^2)}{\sigma_\varphi \sqrt{2 \pi}} $$
  • 上記の式からわかるように、$z$と$z'$の差が小さいほど尤度は大きくなる。

In [ ]: