楽しく学ぶ…解析力学

一般化座標と一般化力ラグランジュ形式

変分原理を用いる場合は, 座標は原点からの距離である必要はない。

一般化座標 ラグランジュが「解析力学」(1788年)で初めて用いた。
デカルト座標で点\(~A(x,y)~\)というとき, \(x,y~\)は原点からの距離である。一方極座標\(~A(r,\theta)~\)では\(~r~\)は原点からの距離であるが, \(\theta~\)は無次元の数である。同じ「座標」という用語を使う理由は何だろうか？一般化座標の概念について考えてみよう。 \[\begin{align} U&=\frac{1}{4}K(x^2+y^2)^2-\frac{1}{2}k(x^2+y^2)\\ U&=\frac{1}{4}kr^4-\frac{1}{2}kr^2 \end{align} \] というポテンシャルを考える。デカルト座標と極座標で併記してある。ポテンシャルの最小点(正しくは停留点と呼ぶ)は \[\begin{align} &\dd{U}{x}=\frac{1}{4}K\{2(x^2+y^2)\cdot 2x-kx\}=x\{K(x^2+y^2)-k\}=0 \\ &\dd{U}{r}=Kr^3-kr=r(Kr^2-k)=0 \end{align} \] より同じ\(~\displaystyle x^2+y^2=r^2=\frac{k}{K}~\)である。\(\partial U/\partial\theta~\)は常にゼロ(\(~\theta~\)は循環座標という言い方をする)であるので, 最小値を求める条件にはならない。

ある座標系\(~Qi~\)(今の場合は\(~(r,\theta)~\)座標)を別の座標系\(~q_i~\)(今の場合は\(~(x,y)~\)座標)で表すと, \[\begin{align} r&=\sqrt{x^2+y^2} \to Q_1=Q_1(q_1,q_2)\\ \theta&=tan^{-1}\frac{y}{x} \to Q_2=Q_2(q_1,q_2) \end{align} \] である。まとめて書けば \[Q_i=Q_i(q_i)\quad(i=1,2) \] 旧座標\(~q_i~\)で表したポテンシャルと新座標\(~Qi~\)で表したポテンシャルは同じ(スカラー)であるから, \[U(q_i)=U(Q_i(q_i))\] である。最小点を求めたいので\(~q_i~\)で微分すると \[\dd{U(q_i)}{q_i}=\sum_j \dd{U(Qi)}{Q_j}\dd{Q_j}{q_i} \] となる。同じスカラーの最小点であるから,\(~\displaystyle \dd{U}{q_i}=0~\)が成り立つ全ての\(~q_i~\)に対しては\(~\displaystyle \dd{U}{Q_i}=0~\)でなければならない。逆も同じである。このことはどのような座標変換に対しても成り立つ。
数式で示したが, ここは言葉の方が分かりやすい。ポテンシャル最小の点は, どのような座標を用いても同じ場所にある。どのような座標でも, その点の極く近くで, 少し動かし, その最小点を見つける。見つけ方も同じで, 同じ形の方程式が得られる(共変)。
極座標における\(~\theta~\)は長さの次元を持たず, 距離ではない。しかし, あるパラメーターが微小変化する周りでポテンシャルが最小値をとるならば, そのパラメータ(数字)を次元に関係なく座標としようというのが一般化座標である。
「静止」を力の釣合いとする場合は「座標＝原点からの距離」が最も都合が良いが,「静止」を「ポテンシャルの最小点」とする場合は, 一般化座標という概念を用いた方が, 都合の良い座標を選べる。
一般化座標を用いた変分原理による方法は座標変換の影響を受けないという共変形式の基礎となっている。

一般化力 一般化座標\(~q_i~\)に共役な力。これも「解析力学」(1788年)で初めて用いられた。
平面極座標における運動方程式
デカルト座標での運動方程式は \[\frac{d}{dt}p_x=F_x,\quad \frac{d}{dt}p_y=F_y \tag{1} \] と表せる。プリンピキアの記述も\(~ma=F~\)ではなく(1)式の形である。\(p_x,p_y~\)は運動エネルギー\(~\displaystyle T=\frac{1}{2}m(\dot{x}^2+\dot{y}^2)~\)を用いて, \[p_x=\dd{T}{\dot{x}},\quad p_y=\dd{T}{\dot{y}} \tag{2} \] と表せるから, 上記運動方程式は, \[\frac{d}{dt}\left(\dd{T}{\dot{x}}\right)=F_x,\quad \frac{d}{dt}\left(\dd{T}{\dot{y}}\right)=F_y \] と書ける。これが平面極座標\(~(r,\theta)~\)ではどうなるか調べてみよう。
運動エネルギーは以前の記事から \[T=\frac{1}{2}m(\dot{r}^2+r^2\dot{\theta})^2 \tag{3}\] であるから, (2)式に対応した量として \[\dd{T}{\dot{r}}=m\dot{r},\quad \dd{T}{\dot{\theta}}=mr^2\dot{\theta} \] が得られる。これも以前の記事の \(~m(\ddot{r}-r\dot{\theta}^2)=F_r,\; m(2\dot{r}\dot{\theta}+r\ddot{\theta})=F_{\theta}~\)を使って, \[\begin{align} \frac{d}{dt}\left(\dd{T}{\dot{r}}\right)&=F_r+mr\dot{\theta}^2 \tag{4} \\ \frac{d}{dt}\left(\dd{T}{\dot{\theta}}\right)&=rF_{\theta} \tag{5} \end{align} \] と書ける。ここで注意すべきは(4)式右辺は力の次元を持っているが, (5)式右辺は力×距離であり, 力では無い。
(4)式左辺は運動量の時間微分であるが, (5)式左辺は\(~\theta~\)が無次元数で\(~\partial T/\partial\dot{\theta}~\)が運動量にならないからである。
ここから少し形式を整えてみよう。まず(4)式の右辺\(~mr\dot{\theta}^2~\)は遠心力であるが, (3)式運動エネルギーを\(~r~\)で微分した \[\dd{T}{r}=mr\dot{\theta}^2 \] を用いると, (4)式は次の(6)のように書ける。 \[\begin{align} \frac{d}{dt}\left(\dd{T}{\dot{r}}\right)-\dd{T}{r}&=F_r \tag{6} \\ \frac{d}{dt}\left(\dd{T}{\dot{\theta}}\right)-\dd{T}{\theta}&=rF_\theta \tag{7} \end{align} \] (7)式は\(~\partial T/\partial \theta=0~\)なので形を揃える意味で並べて書いた。
(6),(7)式の右辺を一般化力と呼ぶのであるが, 唐突で違和感があるので次の例を見てみよう。

仕事の観点から見た場合
微少変位\(~d\bm{r}~\)を行ったときに力\(~\Vec F~\)のする仕事 \[\Vec F\cdot d\bm{r}=F_xdx+F_ydy\] を平面極座標で書くと, \[\begin{align} \Vec F\cdot d\bm{r}&=F_r (d\bm{r})_r + F_{\theta}(d\bm{r})_{\theta} \\ &=F_rdr+F_{\theta}rd\theta \\ \end{align} \] となる。これを改めて \[\Vec F\cdot d\bm{r}=Q_rdr+Q_{\theta}d\theta \] と書いて, \(Q_r=F_r,Q_{\theta}=rF_{\theta}~\)を座標\(~r,\theta~\)に対する一般化力と呼ぶ。(6),(7)式も改めて書いて, \[\begin{align} \frac{d}{dt}\left(\dd{T}{\dot{r}}\right)-\dd{T}{r}&=Q_r \\ \frac{d}{dt}\left(\dd{T}{\dot{\theta}}\right)-\dd{T}{\theta}&=Q_{\theta} \end{align} \] となる。これが教科書に書いてある一般化力である。
導出方法は異なるが, ラグランジュはさらに\(~Q_i=-\partial U/\partial q_i~\)を用いて, ラグランジュの運動方程式 \[\frac{d}{dt}\left(\dd{T}{\dot{q_i}}\right)-\dd{T}{q_i}=-\dd{U}{q_i},\qquad(i=1,2,\dots,n) \tag{8} \] を得た。\(Q_i=-\partial U/\partial q_i~\)の, 力はポテンシャルの微分であるという「力の関数」を導入したのもラグランジュが最初である。
ここで\(~L=T-U~\)とすれば文字が一つ減って更に簡単になることは前に書いた通りである。
ダ・ランベールの原理によるラグランジュの運動方程式の導出は, 例えば原島鮮「力学」p.289～p.291参照。

参考：ハミルトンの原理 ラグラジアンの時間積分に停留値を取らせるのが何故「ハミルトンの原理」か？
ハミルトンの原理, 或いはハミルトンの最小作用の原理とは,\(~L=T-U~\)の時間積分 \[\delta I=\int_{t_A}^{t_F} Ldt=0 \] が実現する軌跡を示す。というものである。ラグラジアンを使っているのに何故ラグランジュの原理と呼ばないのか？
教科書にはオイラー・ラグランジュ方程式の導出も, ハミルトンの原理の説明も「\(\delta~\)を使って部分積分を適用し\(\cdots\)」と同じことが書いてある。
筆者は長らく混乱していた。実はラグランジュの最小作用の原理は \[\delta \int_{r_A}^{r_F} \sum m_iv_ids_i=0\tag{9} \] であり, 運動量の距離積分である。もっとも\(~v=ds/dt~\)であるので\(~\sum m_iv_ids_i=\sum m_iv^2dt\)となりエネルギーの時間積分ではあるが。
また, 実際のラグランジュによる導出は部分積分を使ってはいるが, かなりぎこちないものである。
(8)式偏微分方程式, (9)式作用積分を合わせてラグランジュ形式と呼ぶ。
余談：ラグランジュの時代には\(~L=T-U~\)はまだ登場していない。ハミルトンが導入した痕跡も見当たらない。ヤコビかな？教科書, サイト記事にも見当たらない。筆者のように混乱する読者もいるだろうから注意しておく。

一般化座標と一般化力 ラグランジュ形式

[コーヒーブレイク/閑話］…お疲れさまでした！

一般化座標と一般化力ラグランジュ形式