作者按:因各类需要,目前正在使用《朗道理论物理学教程》的《力学》重新学习理论力学,因此撰写该学习笔记,记录学习所得,以备不时之需。因个人理念原因,该学习笔记将不完全按照《力学》中的顺序撰写,而是首先介绍最小作用量原理,并导出拉格朗日方程和正则方程,得到守恒律,然后进入哈密顿力学,介绍一些重要的原理和定理,并分析在不同情形下的运动。

一.最小作用量原理

最小作用量原理可谓是物理学的核心。在物理学,特别是理论物理,的各个领域,绝大多数本质性的规律都可以从最小作用量原理导出。那么最小作用量原理是什么呢?简单地说,对任意物理系统,表征系统沿某路径演化的量——即作用量——必须取最小值(更严格地说,必须取极值)。为了得到最小作用量原理的数学形式,我们首先需要用哪些量描述系统的状态。

首先,我们看常见的运动,如多个无相互作用粒子在重力场中的运动。可以看到,为了描述这个粒子的状态,最直观的,我们需要知道粒子的位置(位矢)\boldsymbol{\vec{r}}_i和速度\boldsymbol{\vec{v}}_i=\mathrm{d}\boldsymbol{\vec{r}}_i/\mathrm{d}t。一般而言,对于一个粒子,我们需要3个实数(坐标)才能完全表征它的位置,对于N个粒子,自然需要3N个实数。所用于表征系统位置所需坐标的数目称系统的自由度。另外,为了准确计算和预测粒子过去和未来的运动,我们还需要知道时间t。因此,我们看到,描述这个粒子状态所需的参量有位置\boldsymbol{\vec{r}}、速度\boldsymbol{\vec{v}}和时间t。推而广之,我们就有广义坐标和广义速度:

1.广义坐标、广义速度

如前所言,从对系统状态的直观描述中,我们可抽象出广义坐标和广义速度。广义坐标,是用于描述系统位置的量。对于s个自由度的系统,其广义坐标的数目为s。请注意,上面所说的位矢是广义坐标的一类,而广义坐标又不仅包含位矢,如角度、相对距离等,只要能完全描述系统位置,都可以作为广义坐标。广义坐标一般用q表示。

与速度对应,广义速度被定义为广义坐标对时间的导数:\dot{q}=\mathrm{d}q/\mathrm{d}t。我们看到,广义坐标与广义速度一起,共同决定了系统的运动。为什么?试看如下例子。假定我们知道了某粒子在三维空间中的运动轨迹,那么显然,我们仅需要1个广义坐标——如粒子距轨迹上某点的线长——就能完全描述粒子的位置。但是,粒子在什么时候抵达轨迹上的某点?粒子又在什么时候抵达轨迹上的另一点?仅借助广义坐标(更明确的说,知道轨迹上某点的广义坐标)并不能告诉我们答案。然而,结合广义速度(知道轨迹上某点的广义速度),我们就能知道上述信息。

但是,且慢,加速度的问题呢?在普通物理中,往往需要从受力方程和加速度出发,才能知晓系统如何运动。但是,仅从运动学的角度看,加速度的概念并不是特别必要,例如,在上述的自然坐标系(即采用线长为广义坐标)中,仅通过广义坐标和广义速度就能计算出加速度。

事实上,这在数学上对应于,通过轨迹上相同的点为中介自然导出了广义坐标和广义速度的关系,而这一关系可写为一个一阶微分方程,结合初始条件就可以得到广义坐标随时间的变化。因此我们看到,在这里,仅用广义坐标和广义速度(作为时间的函数)就能完全描述系统的状态。

2.拉格朗日方程

我们看到,通过广义坐标和广义速度就能完全描述系统的状态。但是,我们注意到,作用量是表征系统演化路径的量,通过作用量,我们希望得出关于系统如何演化的信息。因此,作用量S应当是系统演化路径的函数。更清楚的说,应当是某个函数L沿系统演化路径的积分。这个函数应当是系统状态的函数,即:

(1)   \begin{equation*} S=\int_{t_1}^{t_2} L(q,\dot{q},t)\mathrm{d}t \end{equation*}

其中t_1为系统初始时刻,t_2为系统末时刻。依照最小作用量原理,S应当取极值,即:

(2)   \begin{equation*} \delta S=0 \end{equation*}

由此,我们看到,最小作用量原理的实质是作用量 S 的变分为0.于是,对 q 变分,我们有:

(3)   \begin{equation*} \int_{t_2}^{t_1}(\frac{\partial L}{\partial q}\delta q+\frac{\partial L}{\partial\dot{q}}\delta \dot{q})\mathrm{d}t=0 \end{equation*}

由于 \delta \dot{q}=\mathrm{d}\delta q/\mathrm{d}t,因此对第二项分部积分,就得到:

(4)   \begin{equation*} \frac{\partial L}{\partial \dot{q}}\delta q\vert^{t_2}_{t_1}+\int^{t_2}_{t_1}(\frac{\partial L}{\partial q}-\frac{\mathrm{d}}{\mahtrm{d}t}\frac{\partial L}{\partial \dot{q}})\delta q\mathrm{d}t=0 \end{equation*}

考虑到无论如何进行变化,系统的初末位置都不应该变化,即 \delta q(t_1)=\delta q(t_2)=0 ,因此,上式的第一项为0.于是,若要 \delta S=0,而 \delta q是任意的,因此只有:

(5)   \begin{equation*} \frac{\mathrm{d}}{\mathrm{d}t}\frac{\partial L}{\partial \dot{q}}-\frac{\partial L}{\partial q}=0 \end{equation*}

这就是著名的、在理论力学中起核心作用的拉格朗日方程。可是,或许会问,对于多个自由度的系统呢?很显然,在以上的推导中我们只考虑了一个自由度,而对于多个自由度的情况,只需要对每个自由度独立进行变分,就能得到:

(6)   \begin{equation*} \frac{\mathrm{d}}{\mathrm{d}t}\frac{\partial L}{\partial \dot{q_i}}-\frac{\partial L}{\partial q_i}=0 \end{equation*}

其中i=1,...,s。可以看到,这 s 个方程是q_i(t)的二阶微分方程。通过这些方程,就能确定q_i(t),从而确定系统的运动。唯一的问题是,这个解包含了 2s 个未知常数,不过问题不大,通过系统的初始条件,如初始位置和速度,恰好可以确定这些常数。

那么,拉格朗日方程具有什么性质?拉格朗日函数 L 应当取什么形式?我们下一节继续讲。