在本节中采用四维实坐标。设有两个惯性系S和S′,同一事件P在其中的坐标分别用(x0,x1,x2,x3)和(x0′,x1′,x2′,x3′)表示。规定第0坐标是时间分量,即
x0=ct0,x0′=ct0′
规定希腊字母 μ,ν,⋯∈{0,1,2,3},拉了字母 i,j,⋯∈{1,2,3},并采用爱因斯坦求和约定。
狭义相对论基本原理
狭义相对论原理之一是一切惯性系均等效。这就是说,变换不改变惯性运动的性质,在S系中以速度ui做匀速直线运动的粒子,在S′中观测必定是速度为ui′的匀速直线运动,即匀速直线运动形式不变。
{xi=xi0+ui(t−t0)xi′=xi0′+ui′(t′−t0′)(1)
原理之二是真空中光速恒为 c
{uiui=c2ui′ui′=c2(2)
引入中间变量
⎩⎪⎪⎨⎪⎪⎧βμ=β0cuμS=β0c(t−t0)(u0=c)(3)
则条件(1)式变为
{xμ=ξμ+βμSxμ′=ξμ′+βμ′S′(4)
当μ=0时为恒等式,其中ξμ,ξμ′是xμ,xμ′的初始值。
ξμ=(ct0,xi0),ξμ′=(ct0′,xi0′)
故 xμ,ξμ;xμ′,ξμ′是相互独立无关的,条件(2)式变为
{ημνβμβν=0ημν′βμ′βν′=0(5)
其中ημν是由A式定义的闵可夫斯基度规。
我们假设所求惯性系的变换是
xμ′=fμ(x0,x1,x2,x3)(6)
fμ是待求的函数,它要符合条件(1)(2)或(4)(5)的要求。下面分四步求解。
考虑惯性系条件对变换的限制
由惯性系的等价性可知变换(6)的逆变换应当唯一确定,其充要条件是雅可比行列成不等于零
det(∂xμ∂fν)=0(7)
由(4)式的等一式得
dSdfμ=dSdxν∂xν∂fμ=βν∂xν∂fμ(8)
由(4)式的等二式得
dfμ=dxμ′=βμ′dS′=β0′βμ′df0df0dfμ=β0′βμ′=cuμ′=const
利用(8)式将上式变形为
β0′βμ′=df0/dSdfμ/dS=βσ∂xσ∂f0βν∂xν∂fμ=const(9)
求对数后再求导得
dSd[ln(βν∂xν∂fμ)−ln(βσ∂xσ∂f0)]=0
最会得到
βν∂xν∂fμβνβσ∂xν∂xσ∂2fμ=βν∂xν∂f0βνβσ∂xν∂xσ∂2f0(10)
(10)式共有4个等式,它们对独立变量xν,βν而言为恒等式,所以应当是βν的有理分式,由(7)式知,联立方程组
βν∂xν∂fμ=0(μ=0,1,2,3)
对于βν而言仅有零解,但是由于β0>0,所以βν不能全为0,亦即(10)式的4个分母βν∂xν∂fμ不能同时为0,假如某分母为零,由(10)式知此分式仍然有限,所以该分子必然同时为零,这仅当分母是分子的因式时才成立。
总之,(10)式中4个分式实际上是βν的有理整式,令此有理考式等于2βνψν,其中 ψν=ψν(x0,x1,x2,x3),则(10)式化为
βνβσ∂xν∂xσ∂2fμ=2βν∂xν∂fμβσψσ
上式对βνβσ而言是恒等式,故对某一对(ν,σ)有
βνβσ∂xν∂xσ∂2fμ=βν∂xν∂fμβσψσ+βσ∂xσ∂fμβνψν=βνβσ(∂xν∂fμψσ+∂xσ∂fμψν)
式中重复指标不求和,最后得到
∂xν∂xσ∂2fμ=∂xν∂fμψσ+∂xσ∂fμψν(11)
上式说明,若匀速直线运动在变换下保持不变,则函数fμ应当满足此偏微分方程,但不一定是线性变换。
考虑光速不变性对变换的限制
利用(9)式可把(5)式的第二式化为
ημνβμ′βν′=ημνβσβλ∂xσ∂fμ∂xλ∂fν=0
由(5)式的第一式,可知上式也应当等于
ησλβσβλ=0
故上两式中βνβσ的二次式系数应成正比,令其为某一函数 λ(x0,x1,x2,x3) ,则得
ημν∂xα∂fμ∂xβ∂fν=ληαβ(12)
(12)式对xρ微分并令∂xρ∂λ=2λφρ,则有
ημν(∂xρ∂xα∂2fμ∂xβ∂fν+∂xρ∂xβ∂2fμ∂xα∂fν)=2ληαβφρ
以(11)式取代上式中的二阶导数,再利用(12)式得
2ηαβψρ+ηραψβ+ηρβψα=2ηαβφρ
上式对任意α,β,ρ均恒等,令ρ=α,ρ=β(ηρα=ηρβ=0)得
ψρ=φρ(ρ=0,1,2,3)
再令ρ=α=β,得 ψρ=φρ,联立上式可知
ψρ=φρ=0(ρ=0,1,2,3)
以及
∂xρ∂λ=2λφρ=0,λ=const
于是 (11) 式化为
∂xα∂xβ∂2fμ=0(13)
此即变换函数所应满足的条件,即线性条件。
所以,上而两式证明了惯性系之间满足狭义相对的原理(1)(2)要求的时空坐标变换一定是线性变换。
确定线性变换的形式
由(12)式知道,fμ中应含有因子λ,令线性变换为
xμ′=fμ=λ(aμ+ηννaμνxν)(14)
这里及以下的ηνν只是一个符号,即
η00=1,η11=η22=η33=−1
引入该符号可以使得表述简洁,将(14)式代入(12)式得
{ημνaμαaνβ=ηαβημνaαμaβν=ηαβ(15)
此即aμν应满足的正交条件。
利用正交条件由(14)式解出
xμ=ηννaνμ(λxν′−aν)(16)
从S系看S′系中的固定点 dxi′=0以速度vi运动,由 (16) 式得
dxi=λ1a0idx0′,dx0=λ1a00dx0′
所以
cvi=dx0dxi=a00a0i
上式表明示惯性系S和S′之间的相对速度λ无关。如令vi=0 ,即S和S′重合而无运动。但是利用正交条件(15)式,由(14)式可得
ημνdxμ′dxν′=ληαβdxαdxβ(17)
令 dxi′=0,则有
dx0′2=λdx02(1−c2v2)
当 v=0 时,应该 dx0′=dx0′ ,故系数 λ=1。于是 (17) 式表示为 dxμ 得二次齐式
ds2=ημνdxμdxν=ηαβdxα′dxβ′(18)
这就是时空间隔不变性,正好是闵可夫斯基空间时空度规的显示式。将λ=1代入(14)和(16)式,就成为
{xμ′=aμ+ηννaμνxνxμ=ηννaνμ(xν′−aν)(19)
(19) 式就是惯性系间的一般洛伦兹变换。
至此我们严格证明了:惯性系之间所容许的时空坐标变换为一般洛伦兹变换;采用实数时间生标时,闵可夫斯基空间的度规为伪欧几里得空间度规。
根据正交归一化条件确定变换系数
先令 t=0 时 t′=0,则原点 O 与 O′ 重合,则 aμ=0 (如果是坐标微分变换 dxμ→dxμ′,这一条件可取消),于是 (19)式化为
{xμ′=ηννaμνxνxμ=ηννaνμxν′(20)
再设 S′ 系相对于S系以速度vi做惯性运动,则从S系观测,S′系的固定点(dxi′=0)的速度为 vi;又在S′系观测,S系的固定点(dxi′=0)以速度vi′运动,故从上式得
{a00vi=a0ica00vi′=ai0c(21)
另外,根据实践我们引入单向顺时性条件,此条件要求洛伦兹变换不改变时间进程的方句,即
a00=∂t∂t′>0(22)
根据上面两式和正交规一化条件(15)式即可确定变换系数。
在(15)式中令 α=β=0 得
{a002−(a102+a202+a302)=1a002−(a012+a022+a032)=1(23)
将(21)式代入(23)式可得
vi′vi′=vivi=v2(24)
尽管两坐标系相对速度的分量不同,但速度的大小是相等的,这一点和直观相符合,考虑到条件(22)式,由(21)和(23)两式可以解出变换系数为
⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎧a00=1−c2v21=γa0i=γcviai0=γcvi′(25)
当(15)式中的α,β 一个为0时,利用(25)式中的 a0i,ai0 推导出
{a00vi′=aikvka00vi=akivk′(26)
当(15)式中的α,β 均不为0时,又得
akiakj=−ηij+a0ia0j=δij+γ2c2vivj(27)
定义
dik=−aik+a00+1ai0a0k=−aik+(γ−1)v2vi′vk(28)
根据上面三式得到
⎩⎪⎨⎪⎧dikvk=−vi′dikvi′=−vkdkidkj=δij(29)
故所定义的 dik 乃是三维空间的正交变换矩阵,如果坐标系对应平行,则 dij=δij,(29)式的第一式和第二式成为
δikvk=vi=−vi′,δikvi′=vk′=−vk
综合(25)(26)(28)式,我们终于求得一般固有洛伦兹变换的系数为
⎩⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎧a00=γa0i=γcviai0=−γcdijviaik=−dik−(γ−1)v2dijvjvk(30)
固有洛伦兹变换
讨论如下:
(1) 如果 S 和 S′ 系的坐标轴对应平行,即不存在空间转动或反射,这时的正交变换矩阵为单位矩阵 ( dij=δij),再设坐标系的相对速度沿 x1(x1′) 轴方向,即 v1=v,v2=v3=0,对变换系数简化为(记作aˉ)
⎩⎪⎪⎨⎪⎪⎧aˉ00=−aˉ11=γaˉ01=−aˉ10=γcvaˉ22=aˉ33=−1(31)
其余变换系数为0。带入 (20) 式即得到特殊洛伦兹变换式。
(2) 如果 S 和 S′ 系的坐标轴对应平行( dij=δij),但坐标系的相对速度沿任意方向,则变换系数简化为(记作aˉ)
⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧aˉ00=γaˉ0i=−aˉi0=γcviaik=−δik−(γ−1)v2vivk(32)
带入 (20) 式即得无空间转动的固有洛伦兹变换式。
⎩⎪⎨⎪⎧xˉk=xk+vk[(γ−1)v2vixi−γt]tˉ=γ(t−c2vixi)(33)
(3) 如果 S 和 S′ 系的坐标轴不是对应平行,可对上式的空间坐标再作一次三维空间转动或反射变换 dij
xi′=dikxˉk=dikxk+dikvk[(γ−1)v2vixi−γt]=dikxk+vi′[(γ−1)v2vixi−γt](34)
其中利用了(29)式,事实上,因为
xi′=dikxˉk=dik(ηννaˉkνxν)=ηννaiνxν
其中 aˉkν 由(32)式给出,aiν=dikaˉkν即为(30)式。这个过程相当于分两步进行
S(xμ)→Sˉ(xˉμ)→S′(xμ′)
S→Sˉ代表空间坐标轴无转动且无反射的洛伦兹变换;Sˉ→S′代表纯空间轴的转动或反射变换,令 D 代表正交变换矩阵 dik,则一般固有洛伦兹变换为
⎩⎪⎨⎪⎧x=Dx−v′[(γ−1)v2v⋅x−γt]t′=γ(t−c2v⋅x)(34)
附录
(1) 欧几里得空间的任意一点 A(x1,x2,x3) 相对于原点的失径为
x=x1e1+x2e2+x3e3=xiei
式中 (e1,e2,e3) 是沿坐标轴的单位矢量,称作基矢。对上式两边微分(注意在笛卡尔坐标系中 dei=0 ),可知
dx=∂xi∂xdxi=dxiei
所以基矢实际上就是矢径对坐标的偏导
ei=∂xi∂x(i=1,2,3)
根据偏导的几何意义,可知笛卡尔基矢的内积满足
ei⋅ej=δij={10(i=j)(i=j)
δij 是克罗内克符号,它的9个分量构成 3×3 单位矩阵
δij=⎝⎛100010001⎠⎞
设 A(xi) 和 B(xi+dxi) 是三维欧几里得空间中的作意两个相邻的点,两个矢径xA,xB的矢量差
dx=dx1e1+dx2e2+dx3e3=dxiei∣dx∣2=dx⋅dx=(ei⋅ej)dxidxj
当 dxi→0 时,两点的弧长 dl 与矢量差的大小 ∣dx∣ 相等,故有
dl2=δijdxidxj=dxidxi
这就是欧几里得线元,即无穷小弧长,而 δij 又称作欧几里得度规。
(2) 将时时间坐标取为 x0=ct,四维闵可夫斯基时空坐标统一记作
(x0,x1,x2,x3)=(ct,x)
根据时空间隔不变性,任意两个邻近的时空点P(xμ) 和 Q(xμ+dxμ) 的时空间隔为
ds2=dx02−dx12−dx22−dx32=ημνdxμdxν
式中
ημν=⎝⎜⎜⎛10000−10000−10000−1⎠⎟⎟⎞(μ,ν=0,1,2,3)
时空间隔ds 叫做闵可夫斯基线元,ημν 叫做闵可夫斯基度规。
(3) 狭义相对论中还采取另外一种复欧几里得坐标,即把时间坐标取成复数 x4=ict,并将空间和时间坐标统一记作
(x1,x2,x3,x4)=(x,ict)
由此构成的时空连续域 {xμ∣μ=1,2,3,4}称作(复)闵可夫斯基时空。在闵可夫斯基时空坐标下 (xμ),时空间隔式成为
ds2=−δμνdxμdxν=−dxμdxμ
其中的二阶张量
δμν=⎝⎜⎜⎛1000010000100001⎠⎟⎟⎞(μ,ν=1,2,3,4)
就是四维欧几里得度规。