Текст
                    n.P. fEYNMAH, I.g.I[I[HION, M.SAHDS
Feynmana
wykłady z fizyki
Elektrodynamika
Fizyka ośrodków ciągłych


irewziCH Konferencja Teorie relatywistyczne i grawitacja, Warszawa 1962
I.P.FEYNN1N, R.B.LEISHTON, M.SUNOS Feynmana wykłady z fizyki TOM 2.2 Elektrodynamika Fizyka ośrodków ciągłych Wydanie trzecie Warszawa 2001 Wydawnictwo Naukowe PWN
Dane oryginału • Itichard P. Feynman, Robert B. Leighton, Matthew Sands The Feynman Lectures on Physics, vol.2 Copyright © 1964, Califomia Institute of Technology Ali rights reserved Commemorative issue published by arrangement with the original publisher, Addison Wesley Longman, a Pearson Education Company Przekład z języka angielskiego Andrzej Lenda (rozdziały 22-41) Stanisław Bażański (rozdział 42) Zofia Białynicka-Birula (zadania) Redakcja naukowa Stanisław Bażański Projekt okładki i stron tytułowych Joanna Sobierąj Copyright © for the Polish edition By Państwowe Wydawnictwo Naukowe Warszawa 1968 Copyright © for the Polish edition by Wydawnictwo Naukowe PWN SA Warszawa 2001 Wydawnictwo Naukowe PWN SA ul. Miodowa 10,00-251 Warszawa tek: 69 54 321, e-mail: pwn@pwn.com.pl www.pwn.com.pl ISBN 83-01-13484-4 t.1-3 ISBN 83-01-13488-7 t.2.2
spis rzeczy Rozdział 22. Obwody prądu zmiennego............................................ 9 22-1. Oporności pozorne................................................ 9 22-2. Generatory...................................................... 15 22-3. Sieć elementów doskonałych; prawa Kirchhoffa.................... 19 22-4. Obwody zastępcze................................................ 25 22-5. Energia......................................................... 26 22-6. Obwód łańcuchowy................................................ 28 22-7. Filtry.......................................................... 31 22-8. Inne elementy obwodu............................................ 36 Rozdział 23. Rezonatory wnękowe............................................... 40 23-1. Rzeczywiste elementy obwodu..................................... 40 23-2. Kondensator przy wielkich częstościach.......................... 42 23-3. Wnęka rezonansowa............................................... 48 23-4. Typy drgań w rezonatorach wnękowych............................. 53 23-5. Wnęki a obwody rezonansowe...................................... 56 Rozdział 24. Falowody ........................................................ 59 24-1. Linia przesyłowa................................................ 59 24-2. Falowód prostokątny............................................. 63 24-3. Częstość graniczna.............................................. 67 24-4. Prędkość fal prowadzonych....................................... 68 1 24-5. Obserwacja fal prowadzonych....................................... 69 24-6. Montaż falowodów................................................ 71 24-7. Typy drgań w falowodzie......................................... 73 24-8. Inny sposób patrzenia na fale prowadzone........................ 74
6 SPIS RZECZY Rozdział 25. Elektrodynamika w zapisie relatywistycznym.......................... 79 25-1. Czterowektory..................................................... 79 25-2. Iloczyn skalamy................................................... 82 25-3. Gradient czterowymiarowy.......................................... 86 25-4. Elektrodynamika w zapisie czterowymiarowym........................ 90 25-5. Czteropotencjał poruszającego się ładunku......................... 91 25-6. Niezmienniczość równań elektrodynamiki............................ 92 Rozdział 26. Lorentzowskie transformacje pól..................................... 95 26-1. Czteropotencjał poruszającego się ładunku......................... 95 26-2. Pola ładunku punktowego poruszającego się ze stałą prędkością . 98 26-3. Relatywistyczna transformacja pól................................ 102 26-4. Równania ruchu w zapisie relatywistycznym........................ 110 Rozdział 27. Energia i pęd pola................................................. 115 27-1. Lokalna zasada zachowania........................................ 115 27-2. Zasada zachowania energii i elektromagnetyzm.................... 117 27-3. Gęstość energii i strumień energii w polu elektromagnetycznym . . 119 27-4. Niejednoznaczność w energii pola................................ 122 27-5. Przykłady strumienia energii..................................... 123 27-6. Pęd pola......................................................... 127 Rozdzia ł 28. Masa elektromagnetyczna........................................... 132 28-1, Energia pola dla ładunku punktowego.............................. 132 28-2. Pęd pola poruszającego się ładunku............................... 134 28-3. Masa elektromagnetyczna.......................................... 135 t 28-4. Siła, z jaką elektron działa sam na siebie.............................. 137 , 28-5. Próby zmodyfikowania teorii Maxwella.............................. 140 28-6. Pole sił jądrowych............................................... 148 RopAriał 29. Ruch ładunków w polach elektrycznych i magnetycznych............... 151 29-1. Ruch w jednorodnym polu elektrycznym lub w jednorodnym polu ma- gnetycznym ....................................................... 151 29-2. Analiza pędu.................................................... 152 29-3. Soczewka elektrostatyczna........................................ 154 • 29-4. Soczewka magnetyczna.............................................. 155 29-5. Mikroskop elektronowy............................................ 156 29-6. Pola prowadzące w akceleratorze.................................. 157 , 29-7. Ogniskowanie metodą zmiennego gradientu........................... 160 29-8. Ruch w skrzyżowanych polach elektrycznych i magnetycznych . . 163 Rozdział 30. Wewnętrzna geometria kryształów.................................... 164 30-1. Wewnętrzna geometria kryształów................................... 164 30-2. Wiązania chemiczne w kryształach.................................. 167 30-3. Wzrost kryształów................................................. 168 304. Sieci krystaliczne................................................. 168 30-5. Symetria w dwóch wymiarach........................................ 170 30-6. Symetrie w trzech wymiarach....................................... 174 30-7. Wytrzymałość metali............................................... 176 30-8. Dyslokacje i wzrost kryształów.................................... 178 30-9. Model kryształu Bragga i Nye’a.................................... 179
SPIS RZECZY 1 Rozdział 31. Tensory.................................................... 186 31-1. Tensor polaryzowalności dielektrycznej....................... 186. 31-2. Przekształcanie składowych tensora.......................... 189 31-3. Elipsoida energii........................................... 190 31-4. Inne przykłady tensorów; tensor bezwładności................ 194 31-5. Iloczyn wektorowy........................................... 196 31-6. Tensor naprężeń............................................. 197 31-7. Tensory wyższego rzędu...................................... 202 31-8. Czterotensor pędu elektromagnetycznego...................... 203 Rozdział 32. Współczynnik załamania substancji gęstych.................... 206 32-1. Polaryzacja metali.......................................... 206 32-2. Równania Maxwella dla dielektryka........................... 209 32-3. Fale w dielektryku.......................................... 212 32-4. Zespolony współczynnik załamania............................ 216 32-5. Współczynnik załamania mieszaniny........................... 217 32-6. Fale w metalach............................................. 219 32-7. Przybliżenia małej i wielkiej częstości; głębokość naskórkowa i częstość plazmowa........................................................ 221 Rozdział 33. Odbicie od powierzchni ......................................... 226 33-1. Odbicie i załamanie światła ................................ 226 33-2. Fale w substancjach gęstych ................................ 227 33-3. Warunki graniczne .......................................... 231 33-4. Fale odbite ' załamane ..................................... 236 33-5. Odbicie od metali.............................................. 241 33-6. Całkowite odbicie wewnętrzne .................................. 242 Rozdział 34. Magnetyzm materii............................................... 246 34-1. Diamagnetyzm i paramagnetyzm .................................. 246 34-2. Momenty magnetyczne i moment pędu ............................. 249 34-3. Precesja atomowych momentów magnetycznych ..................... 251 34-4. Diamagnetyzm .................................................. 252 34-5. Twierdzenie Larmora .......................................... 254 34-6. Fizyka klasyczna nie daje ani diamagnetyzmu, ani paramagnetyzmu 256 34-7. Moment pędu w mechanice kwantowej ............................. 258 34-8. Energia magnetyczna atomów .................................... 261 Rozdział 35. Paramagnetyzm i rezonans magnetyczny ............ 264 35-1. Skwantowane stany magnetyczne ................................. 264 35-2. Doświadczenie Sterna-Gerlacha.................................. 266 35-3. Metoda wiązek molekularnych Rabiego ........................... 268 35-4. Paramagnetyzm elementu objętości substancji ................... 272 35-5. Oziębienie przez rozmagnesowanie adiabatyczne ................. 277 35-6. Magnetyczny rezonans jądrowy................................... 278 Rozdział 36. Ferromagnetyzm ................................................. 282 36-1. Prądy namagnesowania .......................................... 282 36-2. Pole H......................................................... 289 36-3. Krzywa namagnesowania.......................................... 291 36-4. Ihdukcyjność cewki z rdzeniem żelaznym ........................ 294 36-5. Elektromagnesy ................................................ 296 36-6. Namagnesowanie spontaniczne ................................... 299
8 SPIS RZECZY Roadriał 37. Substancje magnetyczne ............................................ 306 37-1. Istota ferromagnetyzmu ........................................... 306 37-2. Własności termodynamiczne ........................................ 312 37-3. Krzywa histerezy ................................................. 314 37-4. Materiały ferromagnetyczne ....................................... 321 37-5. Nadzwyczajne materiały magnetyczne ............................... 324 Rozdział 38. Sprężystość ....................................................... 328 38-1. Prawo Hooke’a .................................................... 328 38-2. Odkształcenia jednorodne ......................................... 331 38-3. Skracanie pręta; fale ścinania.................................... 336 38-4. Ugięcie belki .................................................... 340 38-5. Wyboczenie........................................................ 344 Rozdział 39. Ośrodki sprężyste................................................ 347 39-1. Tensor odkształceń ............................................. 347 39-2. Tensoj sprężystości ............................................ 351 39-3. Ruchy w ciele sprężystym....................................... 354 39-4. Zachowanie się niespręźyste ...................................... 359 39-5. Obliczanie stałych sprężystości .................................. 362 Rozdział 40. Przepływ „suchej wody"............................................. 368 40-1. Hydrostatyka ................................................... 368 40-2. Równania ruchu ................................................... 370 . r 40-3. Przepływ ustalony — twierdzenie Bemoulliego .......................... 375 404. Krążenie .......................................................... 381 40-5. Linie wiru ..................................................... 383 Rozdział 41. Przepływ „mokrej wody" .......................................... 387 41-1. Lepkość .......................................................... 387 41-2. Przepływ lepki ................................................... 391 41-3. Liczba Reynoldsa.................................................. 393 41-4. Opływ walca kołowego.............................................. 396 41-5. Granica lepkości zerowej.......................................... 400 41-6. „Przepływ wstęgowy” .............................................. 401 42. Przestrzenie zakrzywione . . .................................... 405 42-1. Przykłady dwuwymiarowych przestrzeni zakrzywionych ............... 405 42-2. Krzywizna w przestrzeni trójwymiarowej ........................... 413 42-3. Nasza przestrzeń jest zakrzywiona ................................ 415 42-4. Geometria czasoprzestrzeni........................................ 417 42-5. Grawitacja i zasada równoważności................................. 418 42-6. Rytm zegarów w polu grawitacyjnym................................. 419 42-7. Krzywizna czasoprzestrzeni........................................ 424 42-8. Ruch w czasoprzestrzeni zakrzywionej.............................. 425 42-9. Einsteinowska teoria ciążenia..................................... 428 Zadania ........................................................................ 431 Skorowidz ................................................................... 448
Z obwody prqdu zmiennego - i «<• ,< 22-1. Oporności pozorne** Większość naszych wysiłków w tym cyklu wykładów zmierzała do otrzymania pełnych równań Maxwella. W dwóch poprzednich rozdziałach*** rozważaliśmy konsekwencje wynikające z tych równań. Przekonaliśmy się, że równania te opisują zarówno wszystkie zjawiska statyczne, o których mówiliśmy wcześniej, jak i zjawiska związane z falami elek- tromagnetycznymi i światłem, którymi to zjawiskami dość szczegółowo zajmowaliśmy się w tomie I. Równania Maxwella opisują bądź jeden, bądź drugi rodzaj zjawisk, w za- leżności od tego czy obliczamy pola w pobliżu ładunków i prądów, czy też od nich da- leko. Niewiele interesującego można powiedzieć o obszarze pośrednim; żadne specjalne zjawiska tam nie występują. W elektromagnetyzmie pozostaje jednakże do rozważenia jeszcze kilka zagadnień, którymi chcemy się zająć. Chcemy rozważyć zagadnienie: teoria względności a równania Maxwella — co się stanie, gdy spojrzeć na równania Maxwella w odniesieniu do poru- szających się układów współrzędnych. Jest także problem zasady zachowania energii dla układów elektromagnetycznych. Następnie pozostaje do rozważenia obszerne zagad- nienie elektromagnetycznych właściwości materii; dotąd — z wyjątkiem badania właści- wości dielektryków — zajmowaliśmy się tylko polem elektromagnetycznym w pustej Przestrzeni (próżni). A chociaż w tomie I (cz. 2) omówiliśmy dość szczegółowo zagadnie- nia związane z promieniowaniem świetlnym, pozostaje kilka spraw, do których chcie- libyśmy jeszcze raz powrócić z punktu widzenia równań pola. W szczególności chcemy jeszcze raz zająć się zagadnieniem współczynnika załamania, ——.------_ *’Poróvvnaj t. I, cz. 1, rozdz. 22 (Algebra), rozdz. 23 (Rezonans) i rozdz. 25 (Układy liniowe', przegląd). **’ Chodzi o rozdz. 20 i 21, które w przekładzie polskim znalazły się w 1 cz. tomu II (Przyp. red. wyd. polskiego).
10 22. OBWODY PRĄDU ZMIENNEGO zwłaszcza dla substancji gęstych. Pozostają jeszcze wreszcie do rozpatrzenia zjawiska do- tyczące fal zamkniętych w ograniczonym obszarze przestrzeni. O zjawiskach tych wspo- mnieliśmy już pokrótce, gdy omawialiśmy fale dźwiękowe. Równania Maxwella także prowadzą, między innymi, do rozwiązań, które odpowiadają ograniczonym falom pola elektrycznego i pola magnetycznego. Zagadnienie to ma ważne aspekty techniczne i zaj- miemy się nim w następnych rozdziałach. Aby dojść do niego, zaczniemy od omówienia właściwości obwodów elektrycznych dla małych częstości. Pozwoli nam to potem porów- nać sytuacje, do których mają zastosowanie prawie statyczne przybliżenia równań Max- wella, z sytuacjami, w których dominują efekty wielkich częstości. Tak więc zstępujemy z niebotycznych i dostępnych tylko dla wtajemniczonych wyżyn problemów przedstawionych w kilku poprzednich rozdziałach i zabieramy się do rozwa- żenia stosunkowo dość banalnego zagadnienia obwodów elektrycznych. Zobaczymy jednak, że nawet tak przyziemne zagadnienie, rozpatrywane z dostateczną wnikliwością, może kryć w sobie sporo skomplikowanych problemów. Pewne właściwości obwodów elektrycznych omówiliśmy już w rodź. 23 i 25 tomu I (cz. 1). Teraz zajmiemy się niektórymi z nich ponownie, ale już bardziej szczegółowo. Tak jak i poprzednio, będziemy rozważali tylko układy liniowe oraz napięcia i prądy, które zmieniają się sinusoidalnie; można więc przedstawić wszystkie napięcia i prądy za pomocą liczb zespolonych, używając zapisu w postaci funkcji wykładniczej, przedsta- wionego w rozdz. 22 tomu I (cz. 1). Tak więc zmienne w czasie napięcie R(t) można za- pisać jako V(t) = Veim,> (22.1) gdzie V jest liczbą zespoloną, niezależną od t. Rozumie się tu oczywiście, że faktyczne, zmienne w czasie napięcie K(t) dane jest przez rzeczywistą część funkcji zespolonej, wy- stępującej po prawej stronie tego równania. Podobnie zakładamy, że wszystkie nasze zależne od czasu wielkości będą się zmieniać sinusoidalnie z tą samą częstością co. Piszemy więc / = 7e'“’' (prąd), • S —Seimt (siła elektromotoryczna), E — ~Ec'a,t (pole elektryczne), (22.2) i tak dalej. W większości wypadków będziemy podawać równania na V, I, ć>,... (a nie na V, I,S,...), pamiętając jednak, że wielkości te zależą od czasu, tak jak to podano we wzorach (22.2). W naszych poprzednich rozważaniach o obwodach zakładaliśmy, że są nam znane takie pojęcia jak: indukcyjność, pojemność i oporność. Teraz chcemy się zastanowić nieco dokładniej nad tym, co należy rozumieć przez te idealne elementy obwodu. Zacznie- my od indukcyjności*1. ł) Zarówno w języku polskim, jak i w angielskim istnieją w tym przypadku pewne niekonsekwencje w używanej terminologii. I tak, wydawałoby się, że poprawnie należy stosować takie terminy, jak „indukcyj-
22-1. OPORNOŚCI POZORNE 11 Indukcyjność powstaje przez nawinięcie wielu zwo- jów drutu w kształcie cewki i wyprowadzenie obu końców drutu do zacisków znajdujących się w pew- nej odległości od cewki, tak jak pokazano to na rys. 22.1. Zakładamy, że pole magnetyczne wytwo- rzone przez prądy w cewce znajduje się praktycznie tylko w jej bezpośrednim sąsiedztwie i nie oddziaływa z innymi elementami obwodu. Zwykłe uzyskuje się to nadając cewce kształt torusa lub ograniczając pole magnetyczne przez nawinięcie cewki na odpowied- nim rdzeniu żelaznym albo też przez umieszczenie cewki w odpowiedniej osłonie metalowej, jak to po- kazano schematycznie na rys. 22.1. W każdym razie za- kładamy, że pole magnetyczne w obszarze zewnętrznym, 22.1. Cewka indukcyjna w pobliżu zacisków a i b, można pominąć. Założymy także, że możemy pominąć opór drutu i ładunek elektryczny pojawiający się na powierzchni drutu w związku z pow- stawaniem pól elektrycznych. Jeśli spełnione zostaną wszystkie założenia, otrzymamy to, co nazywamy „indukcyj- nością” doskonałą. (Później powrócimy jeszcze do opisu indukcyjności rzeczywistej.) Twierdzimy, że w przypadku indukcyjności doskonałej napięcie pomiędzy zaciskami jest równe L(dljdt). Zobaczmy, dlaczego tak jest. Gdy przez indukcyjność płynie prąd, wewnątrz cewki (indukcyjności) powstaje pole magnetyczne o natężeniu proporcjonal- nym do tego prądu. Jeżeli prąd będzie się zmieniać w czasie, pole magnetyczne również będzie się zmieniać. Mówiąc ogólnie, rotacja z pola E równa jest — d^idt, czyli — ina- czej — całka krzywoliniowa z pola E wzdłuż dowolnej krzywej zamkniętej równa jest strumieniowi wektora B przez powierzchnię ograniczoną tą krzywą. Przypuśćmy teraz, że nasza krzywa wygląda następująco: zaczyna się przy zacisku a i biegnie wzdłuż zwo- jów (pozostając zawsze wewnątrz drutu) do zacisku b; następnie powraca od zacisku b do zacisku a poprzez pustą przestrzeń na zewnątrz cewki. Całkę krzywoliniową z pola E wzdłuż takiej krzywej zamkniętej można zapisać jako sumę dwóch całek: b a |E-ds= J E • ds + f E-ds. (22.3) a b przez cewkę na zewnątrz Jak się przekonaliśmy poprzednio, wewnątrz przewodnika doskonałego nie mogą istnieć pola elektryczne. (Najmniejsze nawet pola prowadziłyby do powstania nieskończenie wielkich prądów.) Wynika stąd, że całka wzdłuż drogi od a do b poprzez cewkę równa n°sć”, „pojemność” do określania pojęć (własności obiektów), a terminy „cewka indukcyjna”, „konden- sator” — do „nazywania” tych właśnie obiektów (elementów obwodu). Sam jednak autor twierdzi, że w tym przypadku lepiej używać terminów, które mimo że stosowane nie zawsze poprawnie, zdobyły sobie Pełne prawo obywatelstwa. Dlatego mówimy „indukcyjność”, rozumiejąc pod tym zarówno cewkę induk- cyjną, jak i jej oporność indukcyjną L. Z drugiej strony, nikt nie używa terminu „oporność pojemnościowa”, Pozostając przy zwykłej „pojemności”. (Przyp. tłum.)
12 22. OBWODY PRĄDU ZMIENNEGO jest zeru. Całkowity wkład do całki z pola E pochodzi od krzywej łączącej zaciski a i b na zewnątrz cewki. Ponieważ założyliśmy, że na zewnątrz osłony nie ma pola magnetycz- nego, ta część całki nie zależy od wyboru drogi całkowania i możemy określić potencjały obu zacisków. Różnica ich stanowi to, co nazywamy „różnicą potencjałów” albo po prostu — napięciem V. Mamy więc a V= - jE-ds = -fE-ds. b Całka krzywoliniową wzdłuż krzywej zamkniętej określa to, co poprzednio nazwa- liśmy siłą elektromotoryczną, i jest oczywiście równa szybkości zmian strumienia magne- tycznego w cewce. Poprzednio przekonaliśmy się, że ta siła elektromotoryczna równa jest szybkości zmian prądu, wziętej ze znakiem minus. Mamy więc gdzie L jest indukcyjnością cewki. Ponieważ dljdt = icol, mamy V = icoLI. (22.4) Sposób, w jaki opisaliśmy indukcyjność doskonałą, ilustruje ogólną metodę podejścia do zagadnienia doskonałych elementów obwodu, nazywanych zwykle elementami „sku- pionymi”. Własności elementu są w pełni opisane przez wartości prądów i napięć, któ- re pojawiają się na zaciskach. Przez poczynienie odpowiednich założeń upraszczających możliwe jest pominięcie złożonej natury pól powstających wewnątrz danego obiektu. To, co się dzieje wewnątrz obiektu, jest całkowicie oddzielone od tego, co się dzieje na zewnątrz. Dla każdego elementu obwodu możemy znaleźć związek typu (22.4), w którym na- pięcie jest proporcjonalne do prądu, przy czym stała proporcjonalności jest na ogół liczbą zespoloną. Ten zespolony współczynnik proporcjonalności nazywamy opornością pozorną i oznaczamy zwykle symbolem Z. Jest on przeważnie funkcją częstości co. Tak więc dla dowolnego elementu skupionego może- my napisać V V ~ = j = Z. (22.5) Dla indukcyjności mamy Z (indukcyjna) = ZL — icoL. (22.6) Jako następny doskonały element obwodu roz- patrzmy teraz kondensator. Kondensator składa się z pary przewodzących płytek, z których wypro- wadzono dwa druty w postaci końcówek. Płytki mogą mieć zupełnie dowolny kształt i często prze- dziela się je jakimś dielektrykiem. Schemat takiego kondensatora widzimy na rys. 22.2. I w tym wy-
22-l. OPORNOŚCI POZORNE 13 padku poczynimy kilka założeń upraszczających. Zakładamy, że płytki i druty są prze- wodnikami doskonałymi. Zakładamy też, że izolator pomiędzy płytkami jest doskonały, tak że ładunek elektryczny nie może przepłynąć przez niego z jednej płytki na drugą. Następnie zakładamy, że płytki są blisko siebie, ale daleko od innych przewodników, tak że wszystkie linie sił pola, wychodzące z jednej płytki, kończą się na drugiej. Wówczas ładunki na obu płytkach są zawsze równe i mają przeciwny znak, przy czym ładunki na płytkach są znacznie większe od ładunków na powierzchni przewodów doprowadzają- cych. Załóżmy jeszcze, że w pobliżu kondensatora nie ma żadnych pól magnetycznych. Rozważmy teraz całkę krzywoliniową z pola E wzdłuż krzywej zamkniętej, która zaczyna się przy zacisku a, biegnie wzdłuż drutu do górnej płytki kondensatora, prze- skakuje odstęp pomiędzy płytkami, przebiega od dolnej płytki wzdłuż drutu do zacisku b i powraca do zacisku a poprzez przestrzeń na zewnątrz kondensatora. Ponieważ nie ma pola magnetycznego, całka krzywoliniowa z pola E wdłuż takiej krzywej zamkniętej jest równa zeru. Całkę tę możemy rozbić na sumę trzech całek: jE-Js = f E-ds+ f E-ds+ f E-ds. (22.7) wzdłuż pomiędzy na drutów płytkami zewnątrz Całka z pola E wzdłuż drutów jest równa zeru, ponieważ wewnątrz przewodników do- skonałych nie ma pól elektrycznych. Całka z pola E od zacisku b do a na zewnątrz kon- densatora jest równa różnicy potencjałów na zaciskach, wziętej ze znakiem minus. Po- nieważ założyliśmy, że obie płytki są w jakiś sposób izolowane od otoczenia, całkowity ładunek na nich musi być równy zeru; jeśli na górnej płytce jest ładunek Q, to na dolnej jest równy mu co do wielkości, ale o przeciwnym znaku ładunek — Q. Przekonaliśmy się uprzednio, że jeżeli dwa przewodniki mają równe, ale o przeciwnym znaku ładunki Q i —Q, różnica potencjałów pomiędzy nimi wynosi Q/C, gdzie C nazywamy pojemnością obu przewodników. Z równania (22.7) wynika, że różnica potencjałów pomiędzy za- ciskami a i b jest równa różnicy potencjałów pomiędzy płytkami. Mamy więc TZ f » y = —, C Prąd elektryczny I, dopływający do kondensatora przez zacisk a (i opuszczający go przez zacisk b), równy jest szybkości zmian ładunku elektrycznego na płytkach: dQjdt. Pod- stawiając dV[dt jako iw V możemy wyrazić zależność pomiędzy prądem a napięciem dla kondensatora w następujący sposób: I ia>V = —, C czyli r=——. (22.8) iwC Oporność pozorna Z kondensatora jest więc równa Z (pojemnościowa) = Zc = ——. (22.9) > ia>C
14 22. OBWODY PRĄDU ZMIENNEGO 22.4. Dosfcomto cfanenty sfcnpicme obwodu (bierne) . ,f . . , - a) b) c) d) Trzecim elementem obwodu, którym chce- my się zająć, jest opór omowy. Jednakże ponieważ nie rozważaliśmy dotąd elektrycz- nych właściwości materiałów rzeczywistych, nie jesteśmy jeszcze przygotowani do dysku- sji nad tym, co się dzieje wewnątrz rzeczy- wistego przewodnika. Będziemy musieli po prostu zgodnie z doświadczeniem przyjąć, że w materiałach rzeczywistych mogą istnieć pola elektryczne, że te pola elektryczne po- wodują przepływ ładunku elektrycznego, to znaczy pojawienie się prądu, i że prąd ten jest proporcjonalny do całki z pola elektrycz- nego, wziętej od jednego końca przewodnika do drugiego. Możemy wówczas wyobrazić sobie idealny opornik, zbudowany tak jak pokazuje rys. 22.3. Dwa druty, o których zakładamy, że są przewodnikami doskonały- mi, łączą zaciski a i b z dwoma końcami szta- bki z materiału oporowego. Przeprowadza- jąc rozumowanie analogiczne jak w przypad- ku cewki i kondensatora przekonujemy się, że różnica potencjałów pomiędzy zaciskami a i b jest równa całce krzywoliniowej z ze- wnętrznego pola elektrycznego, co z kolei jest równe całce krzywoliniowej z pola elek- trycznego, przenikającego przez naszą sztab- kę. Wynika stąd, że prąd I przepływający przez opornik jest proporcjonalny do napię- cia na zaciskach V: V 1=—, R gdzie R nazywamy oporem. Zobaczymy później, że zależność pomiędzy prądem a napię- ciem dla materiałów rzeczywistych jest tylko w przybliżeniu liniowa. Przekonamy się także, że ta przybliżona proporcjonalność okaże się niezależna od częstości zmian prą- du i napięcia tylko w przypadku częstości niezbyt wielkich. Tak więc dla prądów zmien- nych napięcie na końcach opornika jest zgodne w fazie z prądem, co oznacza, że oporność pozorna jest liczbą rzeczywistą. Z (oporowa) — ZR = R. (22.10) Wyniki naszych rozważań dotyczące trzech skupionych elementów obwodu przed- ttawia rys. 22.4. Na tym rysunku, jak i na rysunkach poprzednich, zaznaczyliśmy napię-
22-1- OPORNOŚCI POZORNE 15 cie za pomocą strzałki skierowanej od jednego zacisku do drugiego. Jeżeli napięcie jest dodatnie”, to znaczy jeżeli zacisk a ma wyższy potencjał niż zacisk b, strzałka wskazu- je kierunek dodatniego „spadku napięcia”. Chociaż mówimy o prądach zmiennych, możemy oczywiście uwzględnić specjalny przypadek obwodów prądu stałego, przechodząc w naszych wzorach do granicy czę- stości a> dążącej do zera. Dla częstości równej zeru, tzn. dla prądu stałego, oporność po- zorna indukcyjności dąży do zera; pomiędzy końcówkami następuje zwarcie. Dla prądu stałego oporność pozorna kondensatora dąży do nieskończoności; kondensator staje się przerwą w obwodzie. Ponieważ oporność omowa nie zależy od częstości, jedynym elementem obwodu prądu stałego jest opór omowy. W opisywanych dotychczas elementach obwodu napięcie i prąd były nawzajem pro- porcjonalne. Jeżeli znikało jedno, to znikało i drugie. Zwykle rozumujemy tak: przyło- żone napięcie jest „odpowiedzialne” za prąd lub prąd „powoduje” powstanie napięcia na zaciskach; tak więc w pewnym sensie elementy „reagują” na „przyłożone” warunki zewnętrzne. Z tego powodu te elementy nazywamy elementami biernymi. Można im przeciwstawić elementy czynne, takie jak generatory, będące źródłami zmiennych prądów lub napięć w obwodzie. Elementami tymi zajmiemy się w paragrafie następnym. u ’ 1 22-2. Generatory ' * 1 ’ * ’' I ' < ' V i Chcemy teraz pomówić o czynnym elemencie obwodu — takim, który jest źródłem prądów i napięć w obwodzie — mianowicie o generatorze. Przypuśćmy, że podobnie jak w wypadku indukcyjności mamy cewkę, ale o bardzo małej liczbie zwojów, tak że możemy pominąć pole magnetyczne płynącego przez nią prądu. Jednakże cewka ta jest umieszczona w zmiennym polu magnetycznym, na przy- kład takim, jakie można wytworzyć za pomo- cą obracającego się magnesu, jak to pokazano schematycznie na rys. 22.5. (Przekonaliśmy się wcześniej, że takie zmienne pole magnetyczne można wytworzyć również przez odpowiedni układ cewek z prądami zmiennymi.) Znowu musimy dokonać kilku upraszczających zało- żeń. Będą to takie same założenia, jakie zro- biliśmy, gdy była mowa o indukcyjności. W szczególności zakładamy, że zmienne pole magnetyczne jest ograniczone do skończonego obszaru w pobliżu cewki i że nie ma go na zewnątrz generatora, w przestrzeni pomiędzy zaciskami. Przeprowadzając analogiczne rozumowanie Jak w wypadku indukcyjności, rozważamy całkę krzywoliniową z pola E wzdłuż zamknię- 22.5. Generator składający się z zamoco- wanej cewki i obracającego się pola magnetycznego
16 22. OBWODY PRĄDU ZMIENNEGO tej pętli, która zaczyna się przy zacisku a, przebiega przez cewkę do zacisku b i powraca do punktu początkowego poprzez przestrzeń dzielącą oba zaciski. I tym razem dochodzi- my do wniosku, że różnica potencjałów pomiędzy zaciskami jest równa całce krzywo- liniowej wzdłuż pętli: r=-jE-rfs. Ta całka krzywoliniowa jest równa sile elektromotorycznej w obwodzie, tak więc różni- ca potencjałów pomiędzy zaciskami generatora jest równa szybkości zmian strumienia magnetycznego przenikającego cewkę: d V = —fi (strumienia). (22.11) W przypadku generatora doskonałego zakładamy, że strumień magnetyczny przenika- jący cewkę jest określony przez warunki zewnętrzne, takie jak prędkość kątowa obrotu pola magnetycznego, i że nie wpływają nań prądy przepływające przez generator. Tak więc generator — a przynajmniej rozważany przez nas generator doskonały — nie jest opornością. Róż- nica potencjałów pomiędzy zaciskami jest okrę- cę ślona poprzez dowolnie zadaną siłę elektromo- toryczną &(t). Taki doskonały generator przed- , | h | V stawiamy za pomocą symbolu pokazanego na ki J 1 rys. 22.6. Mała strzałka pokazuje kierunek siły .,< > 1 / elektromotorycznej, w wypadku kiedy jest ona , b O , dodatnia. Dodatnia siła elektromotoryczna w gene- ratorze z rys. 22.6 wytwarza napięcie V — S, przy 22.6. Symbol oznaczający generator czym potencjał zacisku a jest wyższy niż potencjał doskonały zacisku b. 22.7. Generator składający się z cewki obracającej się w stałym polu magnetycznym
22-2. GENERATORY 17 Można zbudować generator w inny sposób. Generator taki będzie się różnił od ge- neratora opisanego powyżej, jeżeli chodzi o konstrukcję wewnętrzną, ale będzie iden- tyczny z punktu widzenia tego, co się dzieje na zewnątrz, poza zaciskami. Przypuśćmy, że mamy cewkę z drutu, która obraca się w stałym polu magnetycznym, tak jak pokazano to na rys. 22.7. Istnienie pola magnetycznego zaznaczono schematycznie na rysunku przez umieszczenie sztabki magnesu; można by ją oczywiście zastąpić innym źródłem stałego pola magnetycznego, np. dodatkową cewką z prądem stałym. Jak pokazano na rysunku, połączenia cewki z otoczeniem zrealizowano za pomocą kontaktów ślizgowych. I tym razem interesuje nas różnica potencjałów pojawiająca się pomiędzy zaciskami a i b, która jest oczywiście równa całce z pola elektrycznego, od zacisku a do zacisku b, wzdłuż drogi leżącej na zewnątrz generatora. Tym razem w układzie z rys. 22.7 nie ma zmiennych pól magnetycznych; na pozór mogłoby się więc wydawać dziwne, w jaki sposób na zaciskach generatora w ogóle może się pojawić napięcie. Istotnie, wewnątrz generatora nie ma żadnych pól elektrycznych. Jak zwykle, w przypadku naszych elementów doskonałych zakładamy, że przewody wewnątrz generatora są zrobione z materiału doskonale przewodzącego, a jak mówi- liśmy już wiele razy, pole elektryczne wewnątrz doskonałego przewodnika jest równe zeru. Ale okazuje się, że to twierdzenie jest fałszywe w przypadku, gdy przewodnik po- rusza się w polu magnetycznym. Prawdziwe jest natomiast twierdzenie, że całkowita siła działająca na każdy ładunek wewnątrz przewodnika doskonałego musi być równa zeru. W przeciwnym bowiem wypadku następowałby nieskończenie wielki przepływ ła- dunków swobodnych. Tak więc jest zawsze prawdą, że suma pola elektrycznego E i ilo- czynu wektorowego prędkości przewodnika przez pole magnetyczne B, która jest całko- witą siłą działającą na ładunek, musi być wewnątrz przewodnika równa zeru: F = E+VXB = 0 (wewnątrz Przewodnika^ \ doskonałego ) ’ v ' gdzie v jest prędkością przewodnika. Nasze poprzednie twierdzenie, mówiące, że wewnątrz przewodnika doskonałego nie istnieje pole elektryczne, pozostaje prawdziwe, jeżeli pręd- kość przewodnika, v, jest równa zeru; w innych wypadkach poprawne twierdzenie jest dane w postaci równania (22.12). Powracając do naszego generatora (rys. 22.7) widzimy teraz, że całka krzywoliniowa z pola elektrycznego E, od zacisku a do zacisku b, wzięta wzdłuż drogi „prowadzącej” wewnątrz generatora, musi być równa (ze znakiem minus) całce krzywoliniowej z vxB wziętej wzdłuż tej samej drogi: J E-u's=— J (vxB)-Js. (22.13) a a wewnątrz wewnątrz r ... przewodnika przewodnika Nadal pozostaje jednak prawdą, że całka krzywoliniowa z pola E wzdłuż pętli zamknię- tej, której część stanowi powrót z b do a na zewnątrz generatora, musi być równa zeru, Ponieważ nie ma zmiennych pól magnetycznych. Tak więc nasza pierwsza całka w równa- 2 Wykia<jy z fizyki
18 22 OBWODY PRĄDU ZMIENNEGO niu (22.13) jest także równa V, napięciu pomię- dzy zaciskami. Okazuje się, że całka po prawej stronie równania (22.13) określa po prostu szyb- kość zmian strumienia przenikającego cewkę. Szyb- kość ta, jak wynika z reguły strumienia, równa jest sile elektromotorycznej w cewce. A więc zno- wu różnica potencjałów pomiędzy zaciskami jest równa sile elektromotorycznej w obwodzie, zgod- nie z równaniem (22.11). Tak więc, czy mamy gene- rator, w którym pole magnetyczne zmienia się wo- kół nieruchomej cewki, czy też generator, w któ- rym cewka porusza się w stałym polu magnetycz- nym, ich „efektywne” właściwości są takie same. Pomiędzy zaciskami powstaje napięcie V, które nie zależy od prądu w obwodzie, a zależy jedynie od dowolnie określonych warunków wewnątrz generatora. Ponieważ staramy się zro- zumieć działanie generatorów z punktu widzenia równań Maxwella, możemy się również zainteresować zwykłym ogniwem chemicznym, takim np. jak bateryjka latarki. Jest to również generator, tzn. źródło napięcia, chociaż występuje jedynie w obwodach prądu stałego. Najprostszy schemat ogniwa pokazano na rys. 22.8. Widzimy tu dwie metalowe płytki zanurzone w roztworze jakiejś substancji chemicznej. Przypuśćmy, że roztwór ten zawiera jony dodatnie i ujemne oraz że jedne z nich, powiedzmy jony uje- mne, są o wiele cięższe od jonów naładowanych przeciwnie, tak że prędkość ich ruchu w roztworze, zachodzącego wskutek dyfuzji, jest dużo mniejsza od prędkości jonów dodatnich. Przypuśćmy dalej, że udało się nam w jakiś sposób uzyskać różne stężenie roztworu w poszczególnych partiach cieczy, tak że liczba jonów obu znaków jest dużo większa w pobliżu np. dolnej płytki niż w okolicach płytki górnej. Z powodu swej znacz- nej ruchliwości jony dodatnie będą przechodzić szybciej do obszarów o niższym stężeniu, tak że na górnej płytce wytworzy się nadwyżka ładunku dodatniego. Płytka górna będzie więc naładowana dodatnio, a dolna uzyska pewien wypadkowy ładunek ujemny. W wyniku dyfuzji coraz to nowych jonów w kierunku górnej płytki potencjał jej bę- dzie wzrastać do momentu, w którym siła działająca na jony ze strony wytworzonego pomiędzy płytkami pola elektrycznego dokładnie skompensuje różnicę ich ruchliwości. Tak więc po krótkim czasie pomiędzy płytkami ogniwa wytworzy się różnica potencja- łów, charakterystyczna dla parametrów wewnętrznych danego ogniwa. Przeprowadzając rozumowanie identyczne, jakie przeprowadziliśmy w przypadku kondensatora, przekonamy się, że różnica potencjałów pomiędzy zaciskami a i b jest równa całce krzywoliniowej z pola elektrycznego, istniejącego pomiędzy płytkami w sy- tuacji, gdy nie ma już wypadkowej dyfuzji jonów. Oczywiście, pomiędzy takim ogniwem chemicznym a kondensatorem istnieje zasadnicza różnica. Jeśli zewrzemy na chwilę zaciski kondensatora, ulegnie on rozładowaniu, po czym nie wystąpi już różnica napięć pomiędzy zaciskami, W wypadku ogniwa chemicznego możemy pobierać z jego zacisków
22-2 generatory 19 prąd w sposób ciągły, co nie powoduje zmiany siły elektromotorycznej, dopóki oczy- wiście składniki chemiczne ogniwa nie zostaną zużyte. Okazuje się, że w rzeczywistym ogniwie napięcie pomiędzy końcówkami maleje ze wzrostem pobieranego prądu. Pozo- stając jednak w kręgu naszych abstrakcyjnych rozważań możemy sobie wyobrazić ogni- wo doskonałe, w którym napięcie pomiędzy zaciskami jest niezależne od prądu. Rze- czywiste ogniwo można wówczas rozpatrywać jak ogniwo doskonałe, połączone szere- gowo z pewną opornością. '*'1 J “ < / J * V ł 22-3. Sieć elementów doskonałych; prawa Kirchhoffa Z poprzedniego paragrafu przekonaliśmy się, że opis doskonałego elementu obwodu, oparty na analizie zjawisk zachodzących na zewnątrz elementu, jest całkiem prosty. Po- między prądem a napięciem istnieje zależność liniowa. Ale to, co dzieje się wewnątrz ele- mentu, jest wielce skomplikowane, a dokładny opis tych zjawisk w świetle równań Maxwella napotyka poważne trudności. Wyobraźmy sobie próbę dokładnego opisu pól elektrycz- nych i magnetycznych wewnątrz radioodbiornika, który zawiera setki oporników, kon- densatorów i cewek indukcyjnych. Analiza takiego układu przy pomocy równań Maxwella jest zadaniem ponad siły. Ale poczyniwszy wiele upraszczających założeń opisanych w §22-2 i wyrażając podstawowe cechy rzeczywistych elementów obwodu w języku ide- alizacji będziemy mogli dokonać analizy obwodu elektrycznego w stosunkowo prosty sposób. Pokażemy teraz, jak to można zrobić. Przypuśćmy, że mamy obwód zawierający ge- nerator i kilka połączonych oporności pozornych, jak na rys. 22.9. Zgodnie z naszymi upraszczają- cymi założeniami w otoczeniu poszczególnych ele- mentów obwodu nie ma pola magnetycznego. Stąd całka krzywoliniowa z pola E wzdłuż krzywej, która nie przechodzi przez żaden z elementów, równa jest zeru. Rozważmy więc krzywą JT, ozna- czoną na rys. 22.9 linią przerywaną, łączącą po- szczególne punkty obwodu. Całka krzywoliniowa z pola E, wzięta wzdłuż tej krzywej, składa się z kilku całek; każda z nich jest całką krzywoli- niową wzdłuż krzywej łączącej zaciski danego dementu obwodu. Taką całkę krzywoliniową określiliśmy jako spadek napięcia na elemencie obwodu. A więc pełna całka krzywoliniowa jest r°wna po prostu sumie spadków napięć na wszy- stkich elementach obwodu: jE-t/s = Vvn. 22.9. Suma spadków napięć wzdłuż każdego zamkniętego obwodu jest równa zeru e
20 22. OBWODY PRĄDU ZMIENNEGO Ponieważ całka krzywoliniowa jest równa zeru, wynika stąd, że suma różnic potencjałów jest równa zeru wzdłuż każdej pełnej pętli sieci: 2* F„ = 0. (22.14) . . i wzdłuż każdej pętli Rezultat ten wynika z jednego z równań Maxwella, mówiącego, że w obszarze, gdzie nie ma pól magnetycznych, całka krzywoliniowa z pola E wzdłuż każdej zamkniętej pętli jest równa zeru. Przypuśćmy, że rozważamy teraz obwód taki jak na rys. 22.10. Linia pozioma łącząca zaciski a, b, c i d wskazuje, że wszystkie te zaciski są złączone razem lub też połączone drutami o oporze możliwym do pominięcia. W każdym razie oznacza to, że zaciski a, b, ci d mają wszystkie ten sam potencjał, podobnie jak i zaciski e,f, g, h mają jeden wspól- ny potencjał. Wówczas spadek napięcia, V, na każdym z czterech elementów jest taki sam. Jedno z naszych upraszczających założeń mówiło, że ładunki elektryczne zbierające się na wyjściu oporności pozornych można pominąć. Z kolei zakładamy, że ładunki elektryczne na przewodach łączących oporności pozorne można również pominąć. Wów- czas z zasady zachowania ładunku wynika, że każdy ładunek opuszczający jeden element obwodu musi natychmiast dopływać do innego elementu obwodu lub, co na to samo wy- chodzi, żądamy, aby algebraiczna suma prądów dopływających do danego rozgałęzienia była równa zeru. Przez rozgałęzienie rozumiemy dowolny układ zacisków, takich jak a, b, c i d, które są połączone. Taki układ połączonych zacisków zwykle nazywamy „wę- złem”. Z zasady zachowania ładunku wynika wówczas; że dla obwodu takiego jak na rys. 22.10 Zi-Z2-Z3-Z4 = 0. ' (22.15) Suma prądów dopływających do węzła złożonego z czterech zacisków e,/, g i h musi być także równa zeru: —Zi+Zj-j-Zj+Zł = 0. (22.16) Jest to oczywiście takie samo równanie, jak równanie (22.15). Te dwa równania są zależne. Ogólne prawo mówi, że suma prądów w każdym węźle musi być rów- na zeru: w węźle Nasz poprzedni wniosek mówiący, że suma spadków napięć jest równa zeru wokół każdej zamkniętej pętli, musi mieć zastosowanie do każdej pętli, jaką możemy wyodrębnić z danej sieci. Również nasz wniosek, że suma prądów w węźle jest rów- na zeru, musi być prawdziwy dla każdego węda. Te dwa równania są znane jako prawa Kirchhoffa. Przy pomocy tych dwóch praw można znaleźć prądy i napięcia w dowo- lnej sieci.
22-3. SIEĆ ELEMENTÓW DOSKONAŁYCH; PRAWA KIRCHHOFFA 21 przypuśćmy, że rozważamy bardziej złożony obwód (rys. 22.11). Jak znaleźć prądy i napięta w tym obwodzie? Możemy to zrobić w taki oto bezpośredni sposób. Rozważa- my oddzielnie każdą z czterech pomocniczych zamkniętych pętli znajdujących się w obwo- dzie. (Jedna taka pętla zaczyna się na przykład przy zacisku a, przechodzi poprzez za- ciski b i e do zacisku d i stamtąd powraca do zacisku a.) Dla każdej z tych pętli wypisu- jemy równanie pierwszego prawa Kirchhoffa mówiące, że suma napięć wokół każdej pętli jest równa zeru. Musimy pamiętać, że spadek napięcia liczymy jako dodatni, gdy posuwamy się zgodnie z kierunkiem prądu, a jako ujemny, jeżeli posuwamy się wzdłuż elementu w kierunku przeciwnym niż prąd; musimy też pamiętać, że spadek napięcia na generatorze, jeżeli posuwamy się zgodnie z kierunkiem jego siły elektromotorycznej, jest równy tej SEM ze znakiem ujemnym. Tak więc rozważając małą pętlę zaczynającą się i kończącą przy zacisku a otrzymujemy =0. Stosując to samo prawo do pozostałych pętli otrzymamy jeszcze trzy dalsze równania tego sa- mego typu. Następnie musimy napisać równanie prądu dla każdego węzła obwodu. Sumując na przy- kład prądy w węźle przy zacisku b otrzymamy równanie: Z1-Z3-/2 = 0. Podobnie dla węzła e otrzymamy równanie prądu: Ą—Zł+Ą Z5 = 0, Dla rozpatrywanego obwodu otrzymamy pięć ta- kich równań prądu. Okazuje się jednak, że dowo- lne z tych równań można wyprowadzić z pozosta- łych czterech, tak że są tylko cztery niezależne równania prądu. Mamy zatem układ ośmiu nie- zależnych równań liniowych: cztery równania na napięcie i cztery równania na prąd. Rozwiązu- jąc te osiem równań otrzymamy osiem szukanych Prądów. Jeżeli już znamy prądy, to nasz obwód Jest całkowicie określony. Spadek napięcia na każ- dym elemencie określa iloczyn prądu przez dany element i jego oporności pozornej (lub w wypadku gdy element jest źródłem napięcia, spadek napięcia na nim jest już znany). 22.10. Suma prądów w każdym węźle jest równa zeru 22.11. Opis obwodu przy pomocy praw Kirchhoffa
22 22. OBWODY PRĄDU ZMIENNEGO 22.12. Obwód, który można opisać przy pomocy metody połączeń szeregowych i równoległych Widzieliśmy, że wypisując równania prądu otrzymaliśmy jedno równanie, które jest zależne od pozostałych. Ogólnie biorąc, może się zdą- żyć, że wypiszemy również zbyt wiele równań napięcia. Tak na przykład w obwodzie z rys. 22.11 oprócz rozważanych przez nas czterech małych pętli istnieje spora liczba innych pętli, dla których moglibyśmy napisać równanie dla napięć. A więc dla pętli abcfeda lub dla innej pętli — abcfehgda. Widać, że jest wiele takich pętli. Analizując ob- wód złożony bardzo łatwo można otrzymać zbyt dużo równań. Istnieją reguły, które określają procedurę prowadzącą do otrzymania najmniej- szej liczby równań, ale zwykle przy odrobinie zastanowienia się możemy dostrzec, jak otrzy- mać właściwą liczbę równań o najprostszej po- staci. Poza tym wypisanie jednego lub dwóch dodatkowych równań nie przynosi żadnej szko- dy. Nie doprowadzą one do niewłaściwych wy- ników, a najwyżej narażą nas na trochę nie- potrzebnych rachunków. Dobrą ilustracją tej metody są poniższe dwa elementarne przykłady. Przypuśćmy, że mamy obwód składający się z dwóch elementów mają- cych oporności pozorne ZŁ i Z2. Łączymy je szeregowo (rys. 22.12a) i przykładamy napięcie 8. Co się stanie? Otóż jeśli Z jest prądem płynącym przez oporność Z2, to spadek napięcia na ZŁ wyniesie Kx = IZV, a spadek napięcia na Z2 będzie równy V2 — IZ2 Mamy tu tylko jedną pętlę. Stosując do niej prawo Kirchhoffa (22.14) widzimy, że K2 + P2-<? = 0, czyli <r= rx+r2 = (z1+z2)z. . Oznacza to, że napięcie przyłożone do całego obwodu można zapisać jako S = IZS, gdzie Zs jest opornością zastępczą całego obwodu, równą sumie oporności pozornych obu jego elementów: z, - Zx+Z2. (22.18)
22-3. SIEĆ ELEMENTÓW DOSKONAŁYCH; PRAWA KIRCHHOFFA 23 Często spotyka się również inne połączenie dwóch elementów o opornościach pozornych 2 i Z2, zwane połączeniem równoległym (rys. 22.12b). W obwodzie tym występują dwa węzły (/ i 2) i trzy pętle F2: &-Z2- I\.ZX-Z2-Z^). Z prawa Kirchhoffa (22.14) otrzymujemy dwa niezależne równania dla spadków napięć: pętla I\: V\ — 2 = 0; pętla r2: V2— 2 = 0; ' - a z prawa Kirchhoffa (22.17) jedno równanie dla prądów: węzeł 1: /-Ą—/2=0. Podstawiając do pierwszych dwóch równań V\ = ItZr i V2 = I2Z2 eliminujemy z po- wyższych trzech równań prądy Ą i I2 i otrzymujemy (1/Z1)+(1/Z2) ’ Związek ten oznacza, że napięcie na zaciskach ogniwa 2 można wyrazić w postaci 2 = = IZR za pomocą prądu I płynącego przez ogniwo i zastępczej oporności pozornej 1 ZtZ2 z„ -----------= —(22.19) R (1/Z1)+(1/Z2) Z,+Z2 V Bardziej skomplikowany obwód można często analizować stosując kolejno powyższe wzory dla połączeń równoległych i szeregowych kilku oporności pozornych. W ten spo- sób można na przykład analizować obwód z rys. 22.12c. Najpierw można zastąpić rów- nolegle połączone oporności pozorne Z4 i Z5 ich pozorną opornością zastępczą, podobnie jak i oporności pozorne Z6 i Z7. Następnie możemy dodać do siebie oporność pozorną Z2 i pozorną oporność wypadkową równolegle połączonych oporności pozornych Z6 i Z7, korzystając z reguły dodawania oporności połączonych szeregowo. Postępując w ten sposób można zredukować cały obwód do generatora połączonego szeregowo z jedną opornością pozorną Z. Prąd płynący przez generator jest wówczas równy po prostu ó/Z. Następnie powtarzając wstecz całą operację można znaleźć prądy w każdej z opor- ności pozornych. 22.13. Obwód, którego nie można opisać przy pomocy metody połączeń szeregowych i równoległych
24 22. OBWODY PRĄDU ZMIENNEGO Istnieją jednakże całkiem nieskomplikowane obwody, do których ta metoda opisu nie ma zastosowania, jak na przykład obwód z rys. 22.13. Aby zanalizować taki obwód, musimy wypisać równania prądu i napięcia, wynikające z praw Kirchhoffa. Zróbmy to. Mamy tylko jedno rów- nanie prądu: Ą-HĄ-Hs — 0, z którego natychmiast wynika, że 22.14. Mostek ~ (A+Zz)- Aby uprościć nasze rachunki, skorzystajmy od razu z powyższego wyniku wypisując równania napięć. Dla tego obwodu są dwa niezależne równania napięć; mianowicie — & — 0 oraz ^2— —ĄZ2 = 0. Mamy więc dwa równania i dwa szukane prądy. Obliczając z tych równań Ą i I2 otrzymujemy 22.15. Każdy dwuzaciskowy obwód złożony z elementów biernych jest równoważny zastępczej oporności po- zornej (22.20) (22.21) b) Z2S2—(Z2-irZ2)^1 1 = Zt(Z2+Z3)+Z2Z3 oraz r ZtS2-\-Z2Sx i. r- t ~ « Z1(Z2+Z3)+Z2Z3 Suma tych dwóch prądów określa nam prąd I3. Inny przykład obwodu, którego nie można za- nalizować przy pomocy reguł na szeregowe i rów- noległe łączenie oporności pozornych, pokazano na rys. 22.14. Taki obwód nazywamy „mostkiem”; występuje on często w przyrządach służących do pomiaru oporności pozornych. W wypadku takiego układu interesuje nas zwykle odpowiedź na nastę- pujące pytanie: Jakie zależności muszą panować pomiędzy poszczególnymi opornościami pozorny- mi, aby przez oporność pozorną Z3 nie płynął prąd? Znalezienie odpowiedzi na to pytanie pozo- stawiamy czytelnikowi.
22-4. OBWODY ZASTĘPCZE 25 22-4. Obwody zastępcze przypuśćmy, że do obwodu zawierającego skomplikowane połączenia oporności po- zornych podłączymy generator o sile elektromotorycznej S, jak pokazano schematycz- nie na rys. 22.15a. Wszystkie równania, które otrzymujemy z praw Kirchhoffa, są liniowe, tak że gdy obliczymy z nich prąd / przepływający przez generator, przekonamy się, iż prąd ten jest proporcjonalny do siły elektromotorycznej S. Możemy to zapisać w posta- ci zależności S Z* gdzie Zef jest teraz pewną liczbą zespoloną, funkcją algebraiczną wszystkich elementów obwodu. (Jeżeli poza wspomnianym generatorem obwód nie zawiera innych generato- rów, to w powyższym wzorze nie ma dodatkowego członu, niezależnego od siły elektromo- torycznej.) Ale równanie to jest identyczne z równaniem, jakie napisalibyśmy dla obwodu z rys. 22.15b. Dopóki interesujemy się tylko tym, co dzieje się po lewej stronie dwóch zacisków a i b, oba obwody z rys. 22.15 są równoważne. Możemy więc wypowiedzieć ogólne twierdzenie, że dowolną sieć o dwóch zaciskach, skła- dającą się z elementów biernych, można zastąpić pojedynczą opornością pozorną Zef, co nie zmieni prądów i napięć w pozostałej części obwodu. Twierdzenie to jest oczywiście dalszym wnioskiem wypływającym z praw Kirchhoffa, a przede wszystkim z liniowości równań Maxwella. Powyższą metodę można uogólnić dla obwodu, który prócz oporności pozornych zawiera również generatory. Przypuśćmy, że rozpatrujemy taki obwód „z punktu widze- nia” jednej z oporności pozornych, którą oznaczamy Zn, jak na rys. 22.16. Jeżeli rozwiązalibyśmy równanie dla ca- łego obwodu, okazałoby się, że napięcie Vn pomiędzy za- ciskami a i b jest liniową funkcją I, co możemy za- pisać jako V. = (22.22) gdzie wielkości A i B zależą od generatorów i od oporności Pozornych w części obwodu na lewo od zacisków. Tak na Przykład dla obwodu z rys. 22.13 znajdujemy = ItZi. Można to zapisać [korzystając z równania (22.20)] w Postaci zależności -Z2Z3 It. (22.23) Z2+Z3 V Pełne rozwiązanie otrzymamy zestawiając teraz to równa- 22.16. Każdy dwuzaciskowy obwód można zastąpić ge- neratorem połączonym sze- regowo z opornością pozor- ną a) b)
26 22. OBWODY PRĄDU ZMIENNEGO nie z równaniem dla oporności pozornej Z1; a mianowicie z V\ = I1Z1 lub w wypadku ogólnym — zestawiając równanie (22.22) z równaniem V =J7 Jeżeli teraz rozważymy przypadek, w którym oporność pozorna Zn jest przyłączona do prostego obwodu, składającego się z połączonych szeregowo generatora i oporności, jak na rys. 22.15b, to równaniem będącym odpowiednikiem równania (22.22) jest rów- nanie Vn = ^ef-4Zef, które jest identyczne z równaniem (22.22), jeżeli podstawimy Se! — A i Zef = B. Tak więc, jeżeli interesuje nas tylko to, co dzieje się na prawo od zacisków a i b, dowolny obwód z rys. 22.16 można zawsze zastąpić równoważnym mu szeregowym połączeniem genera- tora z opornością pozorną. 22-5. Energia • . । 1., Widzieliśmy, że aby przez oporność indukcyjną przepływał prąd I, musi zostać do- starczona z obwodu zewnętrznego energia U = %LI2. Kiedy prąd opada z powrotem do zera, energia ta zostaje zwrócona obwodowi zewnętrznemu. W wypadku doskonałej oporności indukcyjnej nie zachodzi więc zjawisko straty energii. Gdy przez oporność indukcyjną przepływa prąd zmienny, energia jest ciągle wymieniana pomiędzy tą opor- nością a resztą obwodu, ale średnia szybkość, z jaką energia jest dostarczana obwodowi, równa jest zeru. Mówimy, że oporność indukcyjna jest elementem nie rozpraszającym; energia elektryczna nie jest rozpraszana, czyli — innymi słowy — nie jest „tracona” w takim elemencie obwodu. Podobnie, energia kondensatora U = \CV2 zostaje w czasie jego rozładowywania zwrócona do obwodu zewnętrznego. Kiedy kondensator znajduje się w obwodzie prądu zmiennego, energia do niego dopływa i od niego odpływa, ale wypadkowy strumień ener- gii w każdym okresie jest równy zeru. Doskonały kondensator jest więc także elementem nie rozpraszającym. Wiemy, że siła elektromotoryczna jest źródłem energii. Gdy prąd I płynie zgodnie z kierunkiem siły elektromotorycznej, energia jest dostarczana do obwodu zewnętrznego z szybkością dUjdt = SI. Jeżeli zaś prąd — pochodzący od innego generatora w obwo- dzie — będzie przepływać w kierunku przeciwnym do kierunku siły elektromotorycznej, SEM będzie pochłaniać energię też z szybkością SI; teraz jednak ponieważ I jest ujemne, dUjdt będzie również ujemne. Jeżeli generator połączony jest z opornikiem R, prąd przepływający przez opornik jest równy I = S/R. Energia dostarczana przez generator z szybkością I jest zatem przez opornik pochłaniania. Ta część energii elektrycznej obwodu zmienia się w opor- niku w energię cieplną i jest z obwodu tracona. Mówimy wtedy, że energia elektryczna jest w oporniku rozpraszana. Przy tym jest ona tam rozpraszana z szybkością równą dU/dt = RI2.
22-5. ENERGIA 27 Średnia strata energii w obwodzie prądu zmiennego na oporniku jest równa średniej z RI2 dla jednego okresu, ponieważ I = Źe'“' — co w rzeczywistości oznacza, że I zmienia się jak coscot — średnia z I2 dla jednego okresu jest równa |Z|2/2, maksymalny bowiem prąd jest równy |Z|, średnia z cos2wt wynosi |. Co możemy powiedzieć o stratach energii w wypadku, gdy generator jest połączony z dowolną opornością pozorną 2? (Przez „stratę” rozumiemy oczywiście przemianę energii elektrycznej w energię cieplną.) Dowolną oporność pozorną Z można zapisać w postaci sumy jej części rzeczywistej i części urojonej, tzn. Z = R+iX, 22.17. Każda oporność po- zorna jest równoważna po- łączeniu szeregowemu czy- stego oporu i czystej opor- ności urojonej (22.24) gdzie R i X są liczbami rzeczywistymi. Z punktu widzenia obwodów zastępczych można powiedzieć, że każda oporność po- zorna jest równoważna szeregowemu połączeniu oporu i czysto urojonej oporności po- zornej*1, jak to pokazano na rys. 22.17. Przekonaliśmy się poprzednio, że oporność pozorna obwodu zawierającego tylko elementy L i C jest liczbą czysto urojoną. Ponieważ średnia strata energii w każdym z ele- mentów L i C jest równa zeru, dla czystej oporności urojonej składającej się z elementów L i C nie mamy straty energii. Powyższy wniosek, jak łatwo stwierdzić, musi być ogólnie słuszny, tzn. dla dowolnej oporności urojonej. Jeżeli generator o sile elektromotorycznej jest połączony z opornością pozorną z rys. 22.17, siła elektromotoryczna musi być związana z prądem płynącym z generatora równaniem: = I(R+iX). (22.25) Aby znaleźć średnią szybkość, z jaką energia jest dostarczana, potrzebna nam jest średnia z iloczynu SI. Musimy teraz być ostrożni. W wypadku takich iloczynów istotnymi dla nas wielkościami są wielkości rzeczywiste S(f) i I(i). (Części rzeczywiste funkcji zespo- lonych mogą służyć do opisu wielkości fizycznych tylko w wypadku, gdy odpowiednie równania będą równaniami liniowymi; tymczasem teraz rozważamy iloczyny, które z pew- nością nie są liniowymi). Przypuśćmy, że wybraliśmy tak początek liczenia czasu t, że amplituda I jest liczbą rzeczywistą, równą powiedzmy Zo; wówczas faktyczna zmiana prądu I w czasie będzie równa Z=Z0coscor, *1 W literaturze, zwłaszcza technicznej, opór rzeczywisty często nazywa się rezystancją, a oporność dojoną — reaktancją. (Przyp. tłum.)
28 22. OBWODY PRĄDU ZMIENNEGO a SEM z równania (22.25) będzie częścią rzeczywistą wielkości Ioe,‘“‘(R+iX), czyli = I0R cos tor—I0X sin tor. (22.26) Te dwa człony w równaniu (22.26) odpowiadają spadkom napięcia na elementach R i X (rys. 22.17). Widzimy, że spadek napięcia na oporze jest zgodny w fazie z prądem, podczas gdy spadek napięcia na czysto urojonej części oporności jest z prądem w fazie przeciwny. Średnia strata energii z generatora, (Py^, jest całką z iloczynu SI po jednym okre- sie zmian, podzieloną przez okres T; innymi słowy 1 T T T (Pyic = — J* Sldt =~ J" I%R cos2 (ot dt—— J" IqX coscot sincot dt. 0 0 o Pierwsza całka po prawej stronie równania równa jest \IqR, a druga całka — zeru. Tak więc średnia strata energii na oporności pozornej Z = RĄ-iX zależy tylko od rzeczy- wistej części Z i równa jest loRfl, co jest zgodne z naszym poprzednim wynikiem doty- czącym strat energii na oporniku. Na urojonej części nie ma zaś żadnych strat energii. 22-6. Obwód łańcuchowy f Chcielibyśmy teraz rozważyć interesujący obwód, który można opisać posługując się metodami połączeń szeregowych i równoległych. Przypuśćmy, że zaczniemy od obwo- du z rys. 22.18a. Widać natychmiast, że oporność pozorna pomiędzy zaciskami a i b jest po prostu równa Zj-J-Zj. Weźmy teraz nieco bardziej skomplikowany obwód, taki jak na rys. 22.18b. Moglibyśmy przeprowadzić jego analizę za pomocą praw Kirchhoffa, ale możemy to uczynić równie łatwo posługując się metodą połączeń szeregowych i równo- 22.18. Zastępcza oporność pozorna obwodu łańcuchowego
22-6. OBWÓD ŁAŃCUCHOWY 29 a) 22 19. Zastępcza oporność pozorna nieskończonego obwodu łańcuchowego 1 ległych. Dwie oporności pozorne w części prawej obwodu możemy zastąpić jedną opor- nością pozorną Z3 = Zt+Z2, tak jak to pokazano na części c) rysunku. Następnie po- łączone równolegle oporności pozorne Z2 i Z3 można zastąpić równoważną im opornością pozorną Z4 — jak pokazano na części d) rysunku. W końcu oporności pozorne Zr i Z4 są równoważne jednej oporności pozornej Z5 — część e) rysunku. Moglibyśmy teraz zadać sobie zabawne pytanie: Co się stanie, jeśli do obwodu z rys. 22.18b będziemy dodawać bez końca podobne mu ogniwa, co zaznaczono na rys. 22.19a linią przerywaną? Czy możemy rozwiązać taki nieskończony układ? No cóż, nie jest to takie trudne. Przede wszystkim, zauważmy, że taki nieskończony układ się nie zmieni, jeśli na jego „przedzie” dodamy jeszcze jedno ogniwo. No tak, jeżeli do nieskończonego obwodu dodamy jeszcze jedno ogniwo, to otrzymamy taki sam nieskończony obwód. Oznaczamy oporność pozorną pomiędzy zaciskami a i b nieskończonego obwodu przez Zo; wówczas oporność pozorna całej reszty, na prawo od zacisków c i d jest także równa Zo. Stąd zaś wynika, że dopóki interesuje nas tylko to, co się dzieje na samym przedzie, możemy wyobrazić sobie obwód taki, jak na rys. 22.19b. Składając równolegle oporności Z2 i Zo i dodając ich oporność zastępczą do Zt — zgodnie z regułą dodawania połączeń szeregowych — możemy bezpośrednio określić oporność pozorną całej takiej kombi- nacji: Ale oporność ta jest także równa Zo, mamy więc równanie Z2Z0 Z0 = Zt+— Z2+Zo Obliczając z niego Zo otrzymujemy Z _______________ Zo= ^-+l/(Z?/4)+Z1Z2. . (22.27) Znaleźliśmy więc oporność pozorną nieskończonego łańcucha złożonego z powtarzają- cych się szeregowych i równoległych połączeń oporności pozornych. Oporność pozorną o nazywamy charaktet ystyczną opornością pozorną takiego nieskończonego obwodu.
30 22. OBWODY PRĄDU ZMIENNEGO Rozważmy teraz specjalny przypadek, w którym elementami połączonymi szeregowo są indukcyjności L, a elementami bocznikującymi — pojemności C, jak pokazano to na rys. 22.20a. Oporność pozorną takiego nieskończonego obwodu znajdziemy podstawia- jąc Z = ia>L i Z2 = 1/koC. Zauważmy, że pierwszy człon, Zt/2, w równaniu (22.27) jest równy połowie oporności pozornej pierwszego elementu. Będzie więc rzeczą bardziej naturalną, a przynajmniej trochę prostszą, jeżeli narysujemy nasz nieskończony obwód tak, jak na rys. 22.20b. Rozważając ten nieskończony obwód w punkcie a' przekonamy się, że charakterystyczna oporność pozorna Zo = V'(L/C)-(«>2L2/4). (22.28) Istnieją teraz dwa interesujące przypadki w zależności od częstości co. Jeżeli co2 jest mniejsze od ĄfLC, to drugi człon pod pierwiastkiem będzie mniejszy od pierwszego i opor- ność pozorna Zo będzie liczbą rzeczywistą. Przeciwnie, jeżeli co2 jest większe od ^jLC, oporność Zo będzie liczbą czysto urojoną, co możemy zapisać w postaci Zo = i7(c»2L2/4)-(£/C). Powiedzieliśmy poprzednio, że obwód zawierający tylko urojone oporności pozorne, takie jak indukcyjność i pojemność, będzie miał czysto urojoną zastępczą oporność po- zorną. W jaki więc sposób dla obwodu, który obecnie rozważamy, a który zawiera tylko elementy L i C, oporność pozorna może być czystym oporem dla częstości mniejszych od ^4/LC. Dla większych zaś częstości oporność pozorna jest czysto urojona, zgodnie z naszym poprzednim twierdzeniem. Dla częstości mniejszych oporność jest więc czy- stym oporem i będzie wobec tego pochłaniać energię. Ale w jaki sposób obwód składają- cy się tylko z indukcyjności i pojemności może w sposób ciągły pobierać energię, tak jak to się dzieje w wypadku oporu? Odpowiedź-. Ponieważ mamy nieskończoną liczbę pozor- nych oporności indukcyjnych i pojemnościowych, podłączone do obwodu źródło energii będzie najpierw dostarczało energii do pierwszej indukcyjności i pojemności, potem ko- lejno do drugiej, do trzeciej i do następnej. W obwodzie tego typu energia będzie z gene- ratora pobierana w sposób ciągły i ze stałą szybkością i będzie ciągle przepływać do obwo- du, gdzie zostaje zmagazynowana w ko- lejnych opornościach indukcyjnych i poje- mnościowych. Powyższe rozważania nasuwają cieka- wą myśl o sytuacji panującej w obwodzie. Moglibyśmy się spodziewać, że jeśli pod- łączymy źródło do przedniej części obwo- du, to efekty źródła będą się przemie- szczać w głąb obwodu, aż do jego krań- ca w nieskończoności. Przenoszenie fal wzdłuż obwodu jest zjawiskiem bardzo podobnym do promieniowania anteny, która pobiera energię ze źródła zasilania; możemy tu jednak oczekiwać wystą- 22.20. Łańcuch L-C narysowany dwoma równoważnymi sposobami a L L Ł —nnop— a) = = C = =c = =C Ltd. b dLń '2\ b)b ’ = c = = C 5 =C ifd.
22.6 OBWÓD ŁAŃCUCHOWY 31 pienia takiej propagacji tylko w wypadku, gdy oporność pozorna będzie rzeczywista, co zachodzi dla częstości co mniejszych od ^4/LC. Natomiast w wypadku, gdy oporność pozorna jest czysto urojona, co zachodzi dla częstości co większych od ^4/LC, wystą- pienia propagacji tego typu oczekiwać nie możemy. 22-7. Filtry Z poprzedniego paragrafu dowiedzieliśmy się, że nieskończony obwód łańcuchowy (rys. 22.20) pochłania energię w sposób ciągły, jeżeli jest „sterowany” częstością mniejszą od pewnej krytycznej częstości ^4/LC, którą nazwiemy częstością graniczną co0. Posta- wiliśmy hipotezę, że efekt ten można wytłumaczyć ciągłym transportem energii w głąb obwodu. Z drugiej strony, dla wielkich częstości pochłanianie energii w sposób ciągły nie zachodzi. Powinniśmy się więc wtedy spodziewać, że prądy nie „przenikną” daleko w głąb obwodu. Zobaczmy, czy nasze hipotezy są słuszne. Przypuśćmy, że początek obwodu łańcuchowego połączyliśmy z jakimś generatorem prądu zmiennego i pytamy, jakie jest napięcie, powiedzmy, w 754-tym ogniwie łańcucha. Ponieważ obwód jest nieskończony, zmiana napięcia pomiędzy jednym jego ogniwem, a następnym jest taka sama. Rozpatrzmy więc, co się dzieje, gdy przechodzimy 'od pew- nego ogniwa, np. n-tego, do następnego. Zdefiniujemy prądy In i napięcia Vn, tak jak to pokazano na rys. 22.2la. Zależność napięcia Vn+1 od napięcia V„ znajdziemy pamiętając, że zawsze możemy zastąpić resztę łańcucha po n-tym ogniwie jego charakterystyczną opornością pozorną Zo; wówczas pozostaje nam tylko do zanalizowania taki obwód, jak na rys. 22.2Ib. Zauważ- my po pierwsze, że dowolne napięcie V„, jako spadek napięcia na oporności Zo, musi być równe InZ0. Po drugie, różnica pomiędzy napięciami Vn i Kn+l jest po prostu równa Z, ' . , . z.o 22.21. Szukanie stałej przenoszenia dla obwodu łańcuchowego
32 22. OBWODY PRĄDU ZMIENNEGO Otrzymujemy więc stownek * *'* Ki+l __ | 21 _ Zq~~'Z1 ’ ' ! Stosunek ten nazywamy współczynnikiem przenoszenia dla jednego ogniwa obwodu łań- cuchowego; oznaczymy go symbolem a. Jest on oczywiście dla wszystkich ogniw taki sam: Napięcie na kpńcach j*-tego ogniwa wynosi więc Vn = d'S. , (22.30) Możemy więc teraz znaleźć napięcie na końcach 754-go ogniwa; jest ono po prostu równe 754-tej potędze a, pomnożonej przez 8. Przypuśćmy, że szukamy a dla obwodu łańcuchowego L-C z rys. 22.20a. Podstawia- jąc Zo z równania (22.27) i Zt = ia>L otrzymujemy , a = - 7 . (22.31) ' V(L[C)—((o2L2/4)+i(coLI2) Jeżeli częstość sterująca jest mniejsza od częstości granicznej co0 = ^4ILC, pierwiastek w tym wzorze jest liczbą rzeczywistą, a wartości bezwzględne liczb zespolonych w liczniku - i mianowniku są sobie równe. Tak więc wartość bezwzględna a jest równa jedności; możemy to zapisać w postaci a = co oznacza, że wartość bezwzględna napięcia jest taka sama w każdym ogniwie; jedynie jego faza się zmienia. Zmiana fazy <5 jest w rzeczywistości liczbą ujemną i przedstawia „opóźnienie” napięcia w trakcie jego przenoszenia się wzdłuż obwodu. Dla częstości większych od częstości granicznej coo wygodniej jest podzielić licznik i mianownik wyrażenia po prawej stronie równania (22.31) przez i, a następnie równanie to przepisać w postaci a = — .....-................ (22.32) /(w2L2/4)-(L/Q-|-(wL/2) Współczynnik przenoszenia a jest w tym wypadku liczbą rzeczy wistą, mniejszą od jedności. Oznacza to, że napięcie w każdym ogniwie jest zawsze mniejsze od napięcia w ogniwie poprzednim, przy czym stosunek tych napięć wynosi a. Dla wszystkich częstości większych od co0 napięcie gwałtownie opada, w miarę jak posuwamy się w głąb obwodu. Wykres bezwzględnej wartości a w funkcji częstości wygląda jak na rys. 22.22. Widzimy, że zachowanie się a, tak dla częstości powyżej, jak i poniżej a)0, pozostaje w zgodzie z naszą poprzednią interpretacją, z której wynikało, że obwód przenosi energię dla a><a>0, a zatrzymuje ją dla co>co0- Mówimy, że obwód „przepuszcza” małe, a „od-
22-7. filtry 33 rzuca” lub „filtruje” wielkie częstości. Każdy obwód skonstruowany tak, aby je- go właściwości zmieniały się w znany sposób z częstością, nazywamy „filtrem”. Opisaliśmy tu „filtr dolnoprzepustowy”. Można by się dziwić, po co te całe rozważania o nieskończonym obwodzie, który w rzeczywistości nigdy przecież nie występuje. Rzecz w tym, że te same wła- ściwości co obwód nieskończony ma ob- wód skończony, jeżeli zakończymy go opornością pozorną, równą charakterys- tycznej oporności pozornej Zo. W prakty- ce me da się jednak dokładnie odtworzyć charakterystycznej oporności pozornej za pomocą kilku prostych elementów, jak elementy R, L i C. Ale da się to często zro- bić z niezłym przybliżeniem dla danego zakresu częstości. W ten sposób można zbudować skończony obwód filtrujący, którego własności są bardzo zbliżone do własności obwodów nieskończonych. Tak na przykład łańcuch L-C zachowuje' się w sposób całkiem zbliżony do opisa- nego powyżej, jeżeli jest zakończony czystym oporem R = ^L/C. Jeżeli w naszym obwodzie łańcucho- wym L-C zamienimy miejscami elementy L i C, otrzymamy obwód taki jak na rys. 22.23a. Obwód ten jest filtrem prze- puszczającym wielkie, a odrzucającym ma- łe częstości. Można łatwo stwierdzić, co S|? z takim obwodem dzieje, korzystając z naszych poprzednich wyników. Zauwa- żmy, że jeżeli zamieniamy element L na i odwrotnie, to zmieniamy jednocześnie każde ico na 1/zco. Tak więc to, co się Przedtem „działo” dla co, będzie się teraz ndziało” dla 1/co. W szczególności otrzy- mamy nową zależność a od częstości, korzystając z rys. 22.22 i zastępując zmie- nną osi odciętych przez 1/co, tak jak zro- biono to na rys. 22.23b. 3 — Wykłady z fizyki 22.22. Stała przenoszenia dla jednego ogniwa łańcucha L-C 22.23. a. Filtr górnoprzepustowy. b. Stałą prze- noszenia tego filtru jako funkcja l/o>
34 22. OBWODY PRĄDU ZMIENNEGO v(t)n 2124. na wyjściu prostownika dwukierunkowego i. Opisane przez nas filtry dolno- i górnoprzepustowe mają szerokie zastosowanie tech- niczne. Dolnoprzepustowy filtr L-C jest często używany jako filtr „wygładzający” w za- silaczu prądu stałego. Jeżeli chcemy przetworzyć prąd zmienny na prąd stały, musimy zacząć od prostownika, który pozwala prądowi płynąć tylko w jednym kierunku. Z pro- stownika otrzymujemy ciąg impulsów, wyglądający jak wykres funkcji V(t) z rys. 22.24. Kiepski to jednak prąd stały, ponieważ jego napięcie ciągle się zmienia. Przypuśćmy, że chcielibyśmy dostać „czyściutki” prąd stały, taki jak z akumulatora. Możemy to osiągnąć z dużą dokładnością, wstawiając filtr dolnoprzepustowy pomiędzy prostownik a obcią- żenie. Z rozdziału 50 tomu I (cz. 2) dowiedzieliśmy się, że funkcję czasu taką, jakiej wykres widzimy na rys. 22.24, można przedstawić w postaci superpozycji stałego napięcia i fal sinusoidalnych o coraz to większych częstościach, czyli w postaci szeregu Fouriera. Jeżeli nasz filtr jest liniowy (co nastąpi, gdy jak założyliśmy, elementy £ i C nie będą się zmie- niać z napięciami i prądami), to wówczas na jego wyjściu pojawia się superpozycja napięć wyjściowych dla każdej ze składowych, które mieliśmy na wejściu. Jeżeli tak dobierzemy częstość graniczną ct>o naszego filtru, że będzie ona dużo mniejsza od najmniejszej z częstości występujących w funkcji K(t), to prąd stały (dla którego u> = 0) przejdzie przez filtr gładko, ale amplituda pierwszej harmonicznej będzie już wyraźnie zmniejszona, a ampli- tudy wyższych harmonicznych będą zmniejszone w jeszcze większym stopniu. Możemy więc otrzymać na wyjściu napięcie tak gładkie, jak sobie tego życzymy, w zależności jedynie od liczby użytych przez nas ogniw filtru. Filtru gómoprzepustowego używamy, gdy chcemy się pozbyć pewnych małych czę- stości. Tak na przykład we wzmacniaczu adapteru filtru gómoprzepustowego można użyć do „oczyszczenia” muzyki z niskich tonów pochodzących od obrotu talerza adap- teru. Można również wykonać filtry „pasmowe”, które odrzucają częstości poniżej pewnej częstości co1 oraz powyżej innej częstości u>2 (większej od roj), a przepuszczają częstości leżące w przedziale pomiędzy i u>2 Można to zrobić prosto przez złożenie filtru górno- przepustowego z filtrem dolnoprzepustowym, ale częściej używa się do tego celu obwo- du łańcuchowego, w którym oporności Zj i Z2 są bardziej złożone — każda z nich jest kombinacją elementów £ i C. Taki filtr pasmowy może mieć taką stałą przenoszenia, jak na przykład ta, którą widzimy na rys. 22.25a. Znajduje on zastosowania na przykład w rozdzielaniu sygnałów zajmujących tylko pewien przedział częstości, takich jak kanały
22-7. FILTRY 35 22.25. a. Filtr pasmowy, b. Prosty filtr rezonan- sowy głosonośne telefonicznego kabla wielkiej częstości lub takich jak modulowane fale nośne w radiotechnice. W rozdziale 25 tomu I (cz. 1) widzie- liśmy, że tego typu rozdzielenie można również uzyskać korzystając z własności selektywnych zwykłej krzywej rezonansu, którą dla porównania pokazujemy na rys. 22.25b. Filtr rezonansowy nie jest jednak dla pewnych celów tak dobry jak filtr pasmowy. Pamiętamy (tom I, cz. 2, rozdz. 48), że gdy nośnik częstości wc jest modulowany częstością „sygnału” a>s, to pełny sygnał zawiera nie tylko częstość no- śną, ale składa się również z pasm bocz- nych częstości a>c+a>s i cdc—o)s. W wypad- ku filtru rezonansowego te pasma boczne będą zawsze nieco osłabione, przy czym jak widać z rysunku, osłabienie jest tym większe, im wyższa jest częstość sygnału. Mamy więc do czynienia z kiepską „charakterystyką częstości”. Przez taki filtr nie będą więc prze- chodzić wyższe tony muzyczne. Ale jeżeli użyjemy filtru pasmowego tak skonstruowane- go, aby szerokość co2~ była co najmniej dwa razy większa od najwyższej częstości sy- gnału, to charakterystyka częstości będzie „płaska” dla wszystkich potrzebnych nam syg- nałów. Chcielibyśmy jeszcze zrobić jedną uwagę dotyczącą filtru łańcuchowego; obwód łań- cuchowy L-C, taki jak na rys. 22.20, stanowi także przybliżenie linii przesyłowej. Jeżeli mamy długi przewodnik przebiegający równolegle względem drugiego przewodnika — tak jak drut w kablu koncentrycznym lub drut zawieszony nad ziemią — to pomiędzy oboma przewodnikami istnieje pewna pojemność, a także pewna indukcyjność pochodzą- ca od istniejącego pomiędzy przewodnikami pola magnetycznego. Jeżeli wyobrazimy sobie, że linia jest podzielona na małe odcinki J/, to każdy taki odcinek jest odpowied- nikiem ogniwa łańcucha L-C, z szeregową pozorną opornością indukcyjną zl£ i bocz- nikującą pozorną opornością pojemnościową JC. Możemy więc zastosować w przypad- ku linii nasze wyniki dla filtru łańcuchowego. Jeżeli bowiem przejdziemy do granicy, Przy dążącym do zera, otrzymamy dobry opis linii przesyłowej. Zauważmy, że dla co- raz to mniejszych J/ zarówno J£, jak i JC maleją, ale w tym samym stosunku, tak że 'loraz Zf£/Jc pozostaje stały. Tak więc, przy przejściu do granicy w równaniu (22.28) dla J£ i AC dążących do zera pozorna oporność charakterystyczna Zo jest czystym oporem, którego wartość wynosi V AL/AC. Możemy również zapisać fioraz AL/AC jako Lo/Co, gdzie £0 i Co są pozorną opornością indukcyjną i pojemnością dla jednostki długości linii; mamy wówczas o — (22.33)
22. OBWODY PRĄDU ZMIENNEGO 36 Zauważmy także, że dla AL i AC dążących do zera częstość graniczna co0 = Ą[LC dąży do nieskończoności. Tak więc w wypadku doskonałej linii przesyłowej częstość graniczna nie istnieje. 22-8. Inne elementy obwodu Zdefiniowaliśmy dotąd tylko doskonałe oporności pozorne obwodu — indukcyj- ność, pojemność i opór — a także doskonały generator napięcia. Chcemy teraz pokazać, że inne elementy obwodu, takie jak indukcyjności wzajemne, tranzystory, czy też lampy elektronowe, można opisać przy pomocy tylko tych właśnie elementów podstawowych. Przypuśćmy, że mamy dwie cewki i że część strumienia jednej z nich, celowo lub też nie, przenika drugą cewkę, jak to pokazano na rys. 22.26a. Wówczas obie cewki będą miały pewną indukcyjność wzajemną M, taką że zmiana prądu w jednej z cewek powoduje powstanie napięcia w drugiej cewce. Czy możemy rozważyć taki efekt posługując się na- szymi obwodami zastępczymi? Owszem, możemy to zrobić następująco. Wiemy, że siła elektromotoryczna indukowana w każdej z dwóch oddziaływających cewek może być zapisana jako suma dwóch sił elektromotorycznych: dh dt „ dt2 dlr dl2 (22.34) Pierwszy człon po prawej stronie tych równań pochodzi od samoindukcji cewki, a drugi — od jej indukcyjności wzajemnej względem drugiej cewki. Znak drugiego członu może być plus lub minus, w zależności od sposobu, w jaki strumień jednej cewki przenika dru- gą. Robiąc te same założenia upraszczające, których użyliśmy opisując indukcyjność doskonałą, możemy powiedzieć, że różnica potencjałów na zaciskach każdej z cewek 22.26. Układ zastępczy indukcyjności wzajemnej b)
22-8. INNE ELEMENTY OBWODU 37 jest równa sile elektromotorycznej w cewce. Wówczas oba równania (22.34) są iden- tyczne z równaniami, jakie otrzymalibyśmy dla obwodu z rys. 22.26b, pod warunkiem że siła elektromotoryczna w każdym z obu pokazanych obwodów zależy od prądu w prze- ciwległym obwodzie, zgodnie ze związkami: $ i — $2 = (22.35) Tak więc nasze postępowanie w tym wypadku będzie polegać na przedstawieniu w nor- malny sposób efektu samoindukcji oraz na zastąpieniu efektu indukcyjności wzajemnej pomocniczym doskonałym generatorem napięcia. Oprócz tego musimy mieć oczywiście równanie, które wiąże tę siłę elektromotoryczną z prądem w innych częściach obwodu; ale dopóki równanie to jest liniowe, to dodajemy tylko do naszych równań obwodu kil- ka równań liniowych, a wszystkie nasze poprzednie wnioski dotyczące obwodów zastęp- czych pozostają w dalszym ciągu słuszne. Oprócz indukcyjności wzajemnej mogą istnieć również pojemności wzajemne. Dotąd mówiąc o kondensatorach wyobrażaliśmy sobie zawsze, że mamy do czynienia tylko z dwoma.elektrodami. Ale w wielu sytuacjach, jak na przykład w lampie elektronowej, takich elektrod, jedna obok drugiej, może być wiele. Jeżeli na jedną z takich elektrod wprowadzimy ładunek elektryczny, jego pole elektryczne wytworzy ładunki indukcyjne na pozostałych i będzie oddziaływało na potencjał elektrody pierwotnej. Jako przykład rozważmy układ czterech płytek na rys. 22.27a. Przypuśćmy, że płytki te połączono z zew- nętrznymi obwodami za pomocą drutów A, B, C i D. Dopóki interesują nas tylko efekty elektrostatyczne, obwód zastępczy takiego układu elektrod wygląda jak na części b) rysunku. Elektrostatyczne oddziaływanie każdej elektrody z pozostałymi jest równoważ- ne istnieniu pewnej pojemności pomiędzy każdą parą elektrod. Pomyślmy na koniec, jak powinniśmy przedstawić w obwodzie prądu zmiennego tak skomplikowane urządzenia, jak tranzystory i lampy radiowe. Zaznaczmy od razu, że tego typu urządzenia często pracują w taki sposób, że zależność pomiędzy prądami a na- pięciami nie jest wcale liniowa. W takich wypadkach te nasze twierdzenia, które były uwarunkowane liniowością równań, przestają być oczywiście prawdziwe. Z drugiej stro- 22.27. Układ zastępczy pojemności wzajemnej
38 22. OBWODY PRĄDU ZMIENNEGO 22.28. Układ aMWczy triody dla małych częstości ny, w wielu zastosowaniach charakterystyki pracy są na tyle liniowe, że możemy uważać tranzystory i lampy za urządzenia liniowe. Oznacza to, że prądy zmienne, dajmy na to w anodzie lampy elektronowej, są liniowo zależne od napięć pojawiających się na innych elektrodach, np. na siatce i katodzie. Gdy mamy tego rodzaju zależności liniowe, możemy rozpatrywać dane urządzenie używając naszej metody obwodów równoważnych. Nasz opis, tak jak w przypadku indukcyjności wzajemnej, będzie musiał zawierać pomocnicze generatory napięcia, które opisują wpływ napięć i prądów w jednej części urządzenia na napięcia i prądy w innej części. Tak na przykład obwód anodowy triody można zwykle przedstawić jako szeregowe połączenie oporu z doskonałym generatorem napięcia, którego aktywność jest wprost proporcjonalna do napięcia siatki. Układ za- stępczy, jaki otrzymamy, wygląda tak jak na rys. 22.28 Podobnie obwód kolektora w tranzystorze wygodnie jest przedstawić jako opór połączony szeregowo z doskonałym generatorem napięcia, którego aktywność jest wprost proporcjonalna do prądu płyną- cego z emitera do bazy. Układ zastępczy wygląda wówczas jak na rys. 22.29. Dopóki równania, które opisują działanie przyrządu, są liniowe, możemy używać tego typu przed- stawień dla lamp lub tranzystorów. Także wówczas, gdy są one włączone w obwód zło- 22.29. Układ zastępczy tranzystora dla małych częstości *’ Pokazany układ zastępczy ma zastosowanie tylko dla małych częstości. Dla wielkich częstości układ zastępczy staje się o wiele bardziej skomplikowany i zawiera różne „pasożytnicze” pojemności i indukcyjności.
j2-8. INNE ELEMENTY OBWODU 39 żony, nasze ogólne wnioski, dotyczące równoważnych przedstawień dowolnych połączeń elementów, pozostaną słuszne. Obwody zawierające tranzystory i lampy elektronowe mają jedną zadziwiającą cechę, różniącą je od obwodów złożonych tylko z samych oporności pozornych: część rzeczy- wista zastępczej oporności pozornej Zef obwodu może stać się ujemna. Wiemy, że część rzeczywista Zef odpowiada za straty energii. Zasadniczą więc cechą tranzystorów czy lamp jest zdolność dostarczania energii do obwodu. (Oczywiście, nie „robią” one energii z niczego; pobierają energię z obwodów prądu stałego zasilacza i zamieniają ją na ener- gię prądu zmiennego.) Możemy więc mieć obwód z oporem ujemnym. Jeżeli teraz taki obwód połączyć z opornością pozorną, której część rzeczywista, a więc opór, jest dodat- nia, i tak ustalić warunki, aby suma tych dwóch części rzeczywistych była równa zeru, to w powstałym obwodzie nie ma rozproszeń energii. Jeżeli więc nie ma strat energii, to dowolne napięcie zmienne raz dostarczone obwodowi pozostanie w nim na zawsze. Jest to podstawowa zasada działania oscylatora lub generatora sygnałów, który może być użyty jako źródło napięcia zmiennego o dowolnie żądanej częstości.
rezonatory wnękowe 13-1. Rzeczywiste elementy obwodu Każdy dowolny obwód składający się z doskonałych oporności pozornych i genera- torów jest, jeżeli rozpatrywać go przy dowolnej parze zacisków, równoważny przy danej częstości szeregowemu połączeniu generatora z pewną opornością pozorną Z. Wynika to z faktu, że jeżeli przykładamy do zacisków napięcie V i rozwiązujemy wszystkie równania, aby znaleźć prąd I, to musimy otrzymać pomiędzy prądem a napię- ciem zależność liniową. Ponieważ wszystkie równania są liniowe, to równanie określa- jące prąd I musi zależeć od napięcia V również tylko liniowo. Najogólniejszą zaś zależ- ność liniową można wyrazić następująco: /==1(K-^). (23.1) W ogólnym przypadku zarówno oporność Z, jak i siła elektromotoryczna S, mogą za- leżeć w jakiś skomplikowany sposób od częstości co. Równanie (23.1) jest jednak związ- kiem, jaki otrzymaliśmy w wypadku, gdy poza zaciskami był tylko generator o sile elektro- motorycznej połączony szeregowo z opornością pozorną Z(co). Istnieje także problem odwrotny: Jeżeli mamy dowolne urządzenie elektromagnetycz- ne o dwóch zaciskach i dokonujemy pomiaru zależności pomiędzy prądem I i napię- ciem V, aby określić siłę elektromotoryczną £ i oporność pozorną Z jako funkcje częs- tości, to czy można znaleźć taki układ naszych doskonałych elementów, który jest równo- ważny wewnętrznej oporności pozornej Z? Okazuje się, że dla każdej mającej sens fizyczny funkcji Z (co) można z dowolną dokładnością przybliżać sytuację obwodem zawie- rającym skończony zbiór elementów doskonałych. Nie chcemy rozważać teraz zagadnie- nia ogólnego, ale rozpatrzyć kilka szczególnych przypadków, posługując się argumenta- mi czysto fizycznymi.
23-1. RZECZYWISTE ELEMENTY OBWODU 41 Jeżeli rozważamy opornik rzeczywisty, to wiemy, że płynący przez niego prąd wytwarza pole magnety- czne. Tak więc każdy rzeczywisty opornik powinien jjjieć także pewną pozorną oporność indukcyjną. Oprócz tego, gdy na końcach opornika istnieje róż- nica potencjałów, muszą znajdować się tam ładunki, aby wytworzyć niezbędne pola elektryczne. Ze zmianą napięcia będzie następowała, proporcjonalna doń, zmiana ładunków, a więc opornik będzie miał pewną pozorną oporność pojemnościową. Można oczekiwać, że układ zastępczy rzeczywistego opornika będzie wy- glądał tak, jak na rys. 23.1. W prawidłowo skonst- ruowanym oporniku tzw. „pasożytnicze” elementy i c są małe, tak że dla danego przedziału często- ści a>L jest znacznie mniejsze od R, a 1/coC jest zna- cznie większe od R i dlatego też można je pominąć. Jednak ze wzrostem częstości stają się one w końcu istotne i opornik zaczyna wyglądać jak obwód rezonansowy. Rzeczywista indukcyjność nie jest także równa wyidealizowanej indukcyjności, której oporność po- 23.1. Obwód zastępczy rzeczywi- stego opornika 23.2. Obwód zastępczy rzeczywi- stej cewki indukcyjnej przy ma- łych częstościach zorna wynosi i<oL. Prawdziwy zwój drutu będzie mieć pewien opór, a więc przy małych częstościach cewka ।-----------------o j------------» jest w rzeczywistości równoważna szeregowemu po- J . E łączeniu indukcyjności i pewnego oporu, jak to poka- \ - zano na rys. 23.2a. Ale przecież w prawdziwej cewce f nie można rozdzielić oporu i indukcyjności — opór j E jest rozłożony wzdłuż całego drutu, a więc jest „zmie- J < , szany” z indukcyjnością. Powinno się w takim razie j użyć raczej obwodu takiego, jak na rys. 23.2b, e który to obwód składa się z połączonych szeregowo \ S elementów o małych R i L. Ale całkowita L____________________________o c____________<> oporność pozorna takiego obwodu jest równa a) , bj co jest równoważne prostszemu sche- matowi z części a) rysunku. Ze wzrostem częstości pogarsza się przybliżenie rzeczywistej cewki sumą indukcyj- uosci i oporu. Ładunki, które muszą pojawić się na drutach, aby wytworzyć napięcia, będą odgrywać ważną rolę. Wygląda to tak, jakby pomiędzy zwojami cewki były małe kondensatory, jak to naszkicowano na rys. 23.3a. Można by próbować zastąpić rzeczy- *1$tą cewkę obwodem takim, jak na rys. 23.3b. Dla małych częstości można go z powo- eniem zastąpić prostszym obwodem z części c) rysunku (jest to znowu ten sam obwód rez°nansowy, który był modelem opornika przy wielkich częstościach). Jednak dla W1?kszych częstości lepszy jest bardziej złożony obwód z rys. 23.3b. W istocie, im dokład-
42 23. REZONATORY WNĘKOWE a) b) c) 23.3. Obwód zastępczy rzeczywistej cewki indukcyjnej przy większych czę- stościach niej chcemy przedstawić faktyczną oporność po- zorną rzeczywistej, fizycznej cewki, tym więcej do- skonałych elementów musi zawierać jej sztuczny model. Przypatrzmy się nieco dokładniej temu, co się dzieje w cewce rzeczywistej. Oporność pozorna in- dukcyjności zmienia się jak co£, a więc dla ma- łych częstości staje się równa zeru i indukcyjność staje się wtedy „zwarciem”; pozostaje tylko opór drutu. Gdy zwiększamy częstość, wielkość a>L wkrótce staje się znacznie większa od wielkości R i cewka zachowuje się bardzo podobnie do do- skonałej indukcyjności. Jeżeli jednak w dalszym ciągu zwiększać częstość, ważną rolę zaczną odgry- wać pojemności. Ich oporność pozorna jest pro- porcjonalna do l/(oC, a więc jest duża dla ma- łych w. Dla dostatecznie małych częstości kon- densator stanowi „przerwę” w obwodzie i w wy- padku, gdy równolegle do niego jest podłączony inny obwód, nie przewodzi prądu. Przy wielkich natomiast częstościach prąd woli wpływać do poje- mności pomiędzy zwojami niż do indukcyjności. Tak więc prąd w cewce przeskakuje z jednego zwoju do drugiego, a nie zadaje sobie trudu, aby kręcić się w kółko i tracić SEM. Chociaż więc moglibyśmy sobie życzyć, aby prąd przepływał wzdłuż pętli, wybierze on łatwiejszą drogę — drogę o najmniejszej oporności pozornej. Gdyby zagadnienie to było przedmiotem powszechnego zainteresowania, to opisane powyżej zjawisko nazwałoby się „barierą wielkich częstości” lub jakoś podobnie. Zja- wiska tego typu zachodzą w różnych odległych nieraz dziedzinach. W aerodynamice, na przykład, obiekty skonstruowane dla mniejszych prędkości nie działałyby, gdybyśmy spróbowali nadać im prędkość większą od prędkości dźwięku. Nie oznacza to, że napo- tykają one „barierę” nie do przebycia, lecz po prostu oznacza, że taki obiekt wymaga innej konstrukcji. Tak więc cewka zaprojektowana przez nas jako „indukcyjność”, nie będzie przy wielkich częstościach działać jak dobra indukcyjność, ale jak coś innego. Dla wielkich częstości musimy skonstruować inną cewkę. 23-2. Kondensator przy wielkich częstościach Chcemy teraz dokładnie omówić zachowanie się kondensatora — doskonałego, je* żeli chodzi o jego geometrię — podczas wzrostu częstości i dokonać obserwacji tow»' rzyszących temu zmian jego własności. (Wolimy rozważać kondensator niż cewkę in' dukcyjną, ponieważ geometria pary płytek jest znacznie prostsza od geometrii cewki )
23-2. KONDENSATOR PRZY WIELKICH CZĘSTOŚCIACH 43 Rozważmy kondensator pokazany na rys. 23.4a, składający się z dwóch równoległych kolistych płytek, połączonych parą drutów z zewnętrznym generatorem. Jeżeli ładujemy kondensator prądem stałym, to na jednej płytce będzie się zbierać ładunek dodatni, a na drugiej — ładunek ujemny; pomiędzy płytkami wytworzy się natomiast jednorodne pole elektryczne. Przypuśćmy teraz, że zamiast prądu stałego przyłożymy do płytek prąd zmienny o ma- łej częstości. (Później będziemy w stanie dokładniej określić, co to jest „mała”, a co „wiel- ka” częstość). Powiedzmy, że połączymy kondensator z generatorem małych częstości. Gdy napięcie zmienia znak, z górnej płytki znika ładunek dodatni, a pojawia się na niej ładunek ujemny. Podczas gdy to się dzieje, pole elektryczne znika, a następnie pojawia się ze zwrotem przeciwnym. Zmiany pola elektrycznego podążają za przeskokami ła- dunku tam i z powrotem. W każdej chwili pole elektryczne jest jednorodne, jak pokazano na rys. 23.4b, jedynie na krawędziach płytek zachodzą od tego pewne odstępstwa, które pominiemy. Wartość pola elektrycznego możemy zapisać jako E = Eoemt, (23.2) gdzie Eo jest pewną stałą. Czy opis ten pozostanie słuszny przy wzroście częstości? Nie, ponieważ na skutek ciągłych zmian kierunku pola przez każdą pętlę, taką jak na przykład I\ z rys. 23.4a, przepływa strumień pola elektrycznego. A jak wiemy, zmienne pole elektryczne powo- duje powstanie pola magnetycznego. Jedno z równań Maxwella mówi, że gdy istnieje, tak jak w tym przypadku, zmienne pole elektryczne, to musi istnieć całka krzywolinio- wa z pola magnetycznego. Ta całka z pola magnetycznego wzdłuż krzywej zamkniętej, pomnożona przez c2, jest równa szybkości zmian w czasie strumienia elektrycznego po- przez powierzchnię rozpiętą na tej krzywej (jeżeli nie ma żadnych prądów): c2^*B-4Zs = — J E-ntfa. (23.3) r wewnątrz V 23.4. Pole elektryczne i magnetyczne pomiędzy płytkami kondensatora a) b)
44 23. REZONATORY WNĘKOWE Jakież jest więc natężenie tego pola magnetycznego? Nietrudno to obliczyć. Przypuśćmy, że weźmiemy pętlę , która jest okręgiem o promieniu r. Z symetrii widać, że pole magne- tyczne jest stałe wzdłuż takiego okręgu, tak jak to pokazano na rysunku. Wówczas całka krzywoliniowa z pola B jest równa 2nrB. A ponieważ pole elektryczne jest jednorodne, strumień pola elektrycznego jest po prostu równy E, pomnożonemu przez rrr2, czyli przez powierzchnię koła: d c2B-2nr = —E-~r2. (23.4) Pochodna E względem czasu jest dla naszego zmiennego pola równa po prostu i<oEtfiimt. Znajdujemy więc, że w naszym kondensatorze wystąpi pole magnetyczne IOJT B=—Eoem'. > (23.5) 2c Innymi słowy, pole magnetyczne także oscyluje, a jego natężenie jest proporcjonalne do r. Jakież są tego konsekwencje? Gdy istnieje zmienne pole magnetyczne, będą także indukowane pola elektryczne i kondensator zacznie działać podobnie nieco do cewki indukcyjnej. Ze wzrostem częstości rośnie natężenie pola magnetycznego; jest ono pro- porcjonalne do szybkości zmian pola E, a więc do częstości w. Oporność pozorna konden- satora nie będzie już po prostu równa Zwiększajmy w dalszym ciągu częstość i rozpatrzmy dokładniej, co się wówczas bę- dzie działo. Mamy pole magnetyczne o zmiennym natężeniu. Ale wtedy pole elektryczne nie może być jednorodne, tak jak to zakładaliśmy! Gdy istnieje zmienne pole magnetycz- ne, musi — zgodnie z prawem Faradaya — istnieć także całka krzywoliniowa z pola elektrycznego. Jeżeli więc istnieje znaczne pole magnetyczne, jak to się zaczyna dziać przy wielkich częstościach, pole elektryczne nie może być takie samo w różnych odle- głościach od środka. Pole elektryczne musi zmieniać się z r, tak aby całka krzywolinio- wa z pola elektrycznego była równa zmiennemu strumieniowi pola magnetycznego. Zobaczymy, czy potrafimy obliczyć poprawne pole elektryczne. Można to zrobić, obliczając „poprawkę” do jednorodnego pola, którego istnienie pierwotnie założyliśmy w przypadku małych częstości. Oznaczmy to jednorodne pole przez £) i przyjmijmy, że jest ono w dalszym ciągu równe Eoeml; poprawne pole możemy wtedy zapisać jako £' = £'1+£'2, gdzie E2 jest poprawką pochodzącą od zmiennego pola magnetycznego. Pole na osi kondensatora zapiszemy dla każdego w jako Eoe““‘ (określając w ten sposób Eo), a więc na osj nie będziemy mieć poprawki; E2 = 0 dla r = 0. Aby znaleźć pole E2, możemy skorzystać z całkowej postaci równania Faradaya: f d $Eds =--------(strumienia B). J dt r Całki te będą łatwe do obliczenia, jeżeli weźmiemy je wzdłuż pokazanej na ryg. 23.4b
2j-2. KONDENSATOR PRZY WIELKICH CZĘSTOŚCIACH 45 krzywej r2, która przebiega w górę wzdłuż osi, następnie wzdłuż promienia górnej płytki na odległość r od osi, opada pionowo do dolnej płytki i powraca do osi. Całka krzywo- liniowa z pola £] wzdłuż tej krzywej jest oczywiście równa zeru; a więc jedyny przyczynek do całki pochodzi od pola E2 i jest równy — E2(r)-h, gdzie h jest odległością pomiędzy płytkami. (E przyjmiemy za dodatnie, jeżeli ma zwrot ku górze.) Całka ta jest równa szybkości zmian strumienia B, który znajdujemy obliczając całkę po zakreślonej po- wierzchni S wewnątrz pętli r2 na rys. 23.4b. Strumień przez pionowy pasek o szerokości dr jest równy B(r)hdr, a więc całkowity strumień jest równy hjB(r)dr. Przyrównując — d/dt strumienia do całki krzywoliniowej z pola E2 mamy 3 r E2(f) = - \ B(r)dr. (23.6) Ot J Zauważmy, że h znikło; pola nie zależą od odstępu pomiędzy płytkami. Podstawiając B(r) z równania (23.5) otrzymamy d iwr2 . ot 4c2 Pochodna względem czasu „dprzuca” jeszcze jeden czynik im; otrzymujemy a>2r2 E2(r) = -~—Eoeml. (23.7) 4c Tak jak mogliśmy się tego spodziewać, indukowane pole działa w kierunku zmniejszenia pierwotnego pola eletrycznego na większych odległościach od osi. Poprawione pole E = = £'I+£2 jest zatem równe „ /I (o2r2 \ E = El+E2 = l-__- )Eoe . \ 4 c2 / (23.8) Pole elektryczne w kondensatorze przestaje już być jednorodne; ma ono kształt paraboliczny, jak to pokazuje linia przerywana na rys. 23.5. Widzimy, te nasz prosty kondensator staje się nieco skomplikowany. Moglibyśmy teraz korzystając z na- szych wyników obliczyć oporność pozor- n4 kondensatora przy wielkich często- ściach. Znając pole elektryczne mogli- byśmy obliczyć ładunki na płytkach 1 zbadać, w jaki sposób prąd płynący 23.5. Pole elektryczne pomiędzy płytkami kon- densatora przy wielkiej częstofci (pominięto efek- ty krawędziowe)
46 23. REZONATORY WNĘKOWE przez kondensator zależy od częstości w. Ale w tej chwili ten problem nas nie interesuje. Bardziej interesuje nas to, co się dzieje, jeśli w dalszym ciągu zwiększamy częstość — co się dzieje dla jeszcze większych częstości. A więc nie skończyliśmy jeszcze naszych rachunków? Nie, ponieważ „poprawiliśmy” pole elektryczne, co oznacza, że obliczone przez nas pole magnetyczne przestaje być poprawne. Pole magnetyczne z równania (23.5) jest w przy- bliżeniu poprawne, ale to jest tylko pierwsze przybliżenie; oznaczmy je więc przez jB i. Powinniśmy wobec tego przepisać równanie (23.5) w postaci icor B^—^E^1. (23.9) 2c Pamiętajmy, że to pole magnetyczne było wytworzone przez zmiany pola elektrycznego Et. W takim razie poprawne pole magnetyczne będzie wytworzone przez pełne pole elek- tryczne Et -f-E2. Jeżeli zapiszemy pole magnetyczne w postaci B — -f-B2, to drugi człon będzie właśnie dodatkowym polem, wytworzonym przez strumień E2. Aby znaleźć pole B2, możemy powtórzyć to samo rozumowanie, którego użyliśmy do znalezienia pola Bi; całka krzywoliniowa z pola B2 wzdłuż krzywej fi jest równa szybkości zmian strumienia E2 poprzez obszar ograniczony krzywą Pi. Otrzymamy więc znowu równanie (23.4), w którym pole magnetyczne B zostało zastąpione polem B2, a pole elektryczne E polem E2: d c2B2-2nr = — (strumienia E2 poprzez wnętrze Pi). ot Ponieważ pole E2 zmienia się z promieniem, aby otrzymać jego strumień, należy całko- wać po kolistej powierzchni wewnątrz krzywej Pi. Przyjmując 2r.r dr za element powierzch- ni, otrzymujemy całkę J E2(r)'2r.rdr. o Tak więc znajdujemy B2(r): 1 d f B2(r) = — — £2(r) r dr. (23.10) rc2 ot J Podstawiając E2 z równania (23.7) dostajemy do obliczenia całkę z r2dr, która oczywiście jest równa r4/4. Nasza poprawka do pola magnetycznego ma więc postać: B2(r) = --—-E^. (23.11) 16c4 Ale to wciąż jeszcze nie koniec! Jeżeli pole magnetyczne B nie jest takie, jak począt- kowo sądziliśmy, to pole elektryczne E2 też jest obliczone błędnie. Musimy dodać na- stępną poprawkę do pola E, pochodzącą od dodatkowego pola magnetycznego B2; oznacz- my tę dodatkową poprawkę do pola elektrycznego przez E3. Jest ona związana z po* lem magnetycznym w ten sam sposób, jak pole elektryczne E2 było związane z polem magnetycznym B3. Możemy znowu skorzystać z równania (23.6) zmieniając tylko ii
23-2 KONDENSATOR PRZY WIELKICH CZĘSTOŚCIACH 47 wskaźniki: S C E3(r) = -~ B2(r)dr. (23.12) ot J po podstawieniu naszego wyniku dla B2 [równanie (23.11)] nasza nowa poprawka do pola wyniesie <w4r4 £3(r) = +^rT^oe'“'. (23.13) 64 c4 Zapisując nasze dwukrotnie poprawiane pole elektryczne jako E = E1+E1-ł-E3 otrzy- mujemy [1 / cor \2 1 / a>r \4"| l-4(— +—— — . . (23.14) 22\c / 22-42 \ c / J v Wykres przedstawiający zmiany pola elektrycznego jako funkcję promienia przestaje być już zwykłą parabolą z rys. 23.5; dla dużych jednak promieni leży on tylko nieco po- wyżej krzywej (.Ei+fJ. To jeszcze wciąż nie koniec. Nowe pole elektryczne wytwarza nową poprawkę do pola magnetycznego, a to „świeżo” poprawione pole magnetyczne wytworzy dalszą poprawkę do pola elektrycznego i tak bez końca. Mamy jednak wszystkie już potrzebne nam wzory. Aby znaleźć pole B3, wystarczy skorzystać z równania (23.10), zmieniając wskaźniki z 2 na 3. Następną poprawką do pola elektrycznego jest Ograniczając się do czterech wyrazów otrzymujemy następujące wyrażenie na pełne pole elektryczne: gdzie współczynniki liczbowe zapisaliśmy w taki sposób, że widać jasno, jak należy kon- tynuować ten szereg. Jako ostateczny wynik otrzymujemy, że pole elektryczne pomiędzy płytkami konden- satora, dla dowolnej częstości, jest dane przez £oe'“' razy nieskończony szereg, który zawiera tylko zmienną corje. Dla określenia nieskończonego szeregu pojawiającego się w nawiasach równania (23.15) można zdefiniować specjalną funkcję, którą oznaczymy 7o(x): _ . . . 1 lx\2 1 / x\4 1 I x\6 J0(x) = 1------I — I 4-----| — I-------1—I + ... (23.16) (1 !)2 \2/ ' (2 !)2 \ 2/ (3!)2\2/ ^asze rozwiązanie można wówczas zapisać jako Eoela>‘ razy ta funkcja, dla x = wrjc. E = E^jA^\. (23.17)
48 23 REZONATORY WNĘKOWE Naszą specjalną funkcję oznaczyliśmy symbolem Jq. Oczywiście, nie byliśmy pierw- szymi, którzy zajęli się zagadnieniem drgań w walcu. Funkcja ta jest znana już od dawna i zwykle ją się oznacza Jo. Spotyka się ją zawsze przy rozwiązywaniu zagadnień dotyczą- cych fal o symetrii cylindrycznej. Funkcja Jo jest dla fal cylindrycznych tym, czym jest funkcja cosinus dla fal rozchodzących się w jednym wymiarze. Jest to więc ważna funkcja, wymyślona wiele lat temu. Później poczęto kojarzyć tę funkcję z matematykiem o nazwi- sku Bessel. Wskaźnik zero oznacza, że Bessel wymyślił całe mnóstwo różnych funkcji tego rodzaju, a ta jest właśnie pierwszą z nich. Inne funkcje Bessela — , J2 itd. — mają związek z falami cylindrycznymi, których natężenie zależy od kąta pomiędzy kierunkiem fali, a osią walca. Całkowicie poprawione pole elektryczne pomiędzy płytkami naszego kolistego kon- densatora, określone równaniem (23.17), jest przedstawione na wykresie rys. 23.5 linią ciągłą. Dla niezbyt wielkich częstości nasze drugie przybliżenie okazuje się już całkiem dobre. Trzecie przybliżenie jest jeszcze lepsze; w istocie jest ono tak dobre, że gdyby go wykreślić, to nie moglibyśmy dostrzec żadnej różnicy pomiędzy takim wykresem, a wy- kresem przedstawionym na rys. 23.5 linią ciągłą. W następnym jednak paragrafie zoba- czymy, że dla otrzymania ścisłego opisu dla dużych promieni lub wielkich częstości po- trzebny jest pełny szereg. 23-3. Wnęka rezonansowa*’ Chcemy teraz zobaczyć, co nam daje nasze rozwiązanie dla pola elektrycznego po- między płytkami kondensatora, gdy przechodzimy ku coraz to większym częstościom. Dla dużych a> parametr x = a>r/c także staje się duży i pierwsze kilka wyrazów szeregu J0(x) gwałtownie wzrośnie. Oznacza to, że parabola, którą przedstawia rys. 23.5, opada przy większych częstościach gwałtowniej w dół. Wygląda to właściwie tak, jakby pole spadało do zera przy pewnej wielkiej częstości, może na przykład wtedy, gdy c/co jest w przybliżeniu równe połowie a. Zobaczmy, czy funkcja J0(x) rzeczywiście przechodzi przez zero i ozy zmienia znak. Zacznijmy od podstawienia x = 2: Jo(2) = 1-1 + 4-^ = 0,22. Funkcja ciągle jeszcze jest różna od zera; podstawmy więc większą wartość .r; powiedz- my x = 2,5. Po obliczeniach JO(2,5) = 1-1,56+0,61-0,09 = -0,04. Funkcja Jo już „poprzednio” przeszła przez zero. Porównując wyniki dla x = 2 i x = = 2,5 widzimy, że funkcja Jo przechodzi przez zero dla x oddalonego od 2,5 o jedną pią- tą przedziału (2;2,5). Pozwala to przypuszczać, że miejscem zerowym będzie x równe w przybliżeniu 2,4. Zobaczmy, co nam ta wartość x daje: J0(2,4) = 1-1,44+0,52-0,08 = 0,00. *’ Porównaj: Tom I, cz. 1, rozdz. 23 (Rezonans).
23.j. WNĘKA REZONANSOWA 49 Otrzymujemy więc zero, z dokładnością do dwóch miejsc po przecinku. Gdyby rachu- nek przeprowadzić dokładniej (albo, ponieważ Jo jest dobrze znaną funkcją, gdyby zaj- rzeć do odpowiedniej książki), okazałoby się, że Jo przechodzi przez zero dla x = 2,405. Wykonaliśmy jednak te rachunki sami, aby pokazać, że można to zrobić samemu, a nie szukać wyniku w książkach. Gdy już jednak zajrzymy do tablic funkcji Jo, warto się zainteresować przebiegiem tej funkcji dla większych wartości x; przebieg ten ilustruje wykres z rys. 23.6. Ze wzro- stem x funkcja J0(x) oscyluje pomiędzy wartościami dodatnimi i ujemnymi, przy czym amplituda tych oscylacji maleje. Otrzymaliśmy więc następujący interesujący wynik: jeżeli przejdziemy do dostatecz- nie wielkich częstości, wzrost pola elektrycznego w środku naszego kondensatora bę- dzie przeciwny niż zwrot pola elektrycznego w pobliżu krawędzi. Przypuśćmy na przy- kład, że bierzemy częstość co na tyle wielką, że x — wr/c jest równe 4 na zewnętrznej krawędzi kondensatora; wówczas krawędź kondensatora odpowiada współrzędnej osi odciętych, x = 4, na rys. 23.6. Oznacza to, że nasz kondensator pracuje przy częstości co = 4c/a. Na krawędziach płytek pole elektryczne będzie miało stosunkowo dużą war- tość bezwzględną, ale zwrot jego będzie przeciwny do tego, którego można by się spo- dziewać. To jest właśnie ta groźna sytuacja, w jakiej może się znaleźć kondensator przy wielkich częstościach. Przy przejściu do bardzo wielkich częstości pole elektryczne oscy- luje tam i z powrotem wiele razy, gdy posuwamy się od środka kondensatora ku jego kra- wędziom. Pojawią się także, związane z tymi polami elektrycznymi, pola magnetyczne. Nie należy się więc dziwić, że przy wielkich częstościach nasz kondensator nie zachowuje się, jak przystało na pojemność doskonałą. Raczej należałoby się zastanowić, czy jest on bardziej podobny do kondensatora, czy też do cewki indukcyjnej. Zaznaczmy, że na krawędziach kondensatora zachodzą jeszcze bardziej złożone zjawiska, które pominę- liśmy. Występuje tam na przykład promieniowanie fal na zewnątrz, poza krawędzie, tak że naprawdę pola są jeszcze bardziej skomplikowane niż te, które obliczyliśmy, ale na razie te zjawiska nie będą nas interesować. 23.6. Funkcja Bessela J0(x) ' ' . . Wykłady z fizyki
50 23. REZONATORY WNĘKOWE Moglibyśmy spróbować wymyślić układ zastępczy dla kondensatora, ale być może będzie lepiej, jeśli po prostu przyznamy, że kondensator zaprojektowany przez nas dla małych częstości nie będzie pracował należycie przy zbyt wielkich częstościach. Chcąc omówić działanie takiego obiektu dla wielkich częstości powinniśmy porzucić to przy- bliżenie równań Maxwella, na którym opierały się nasze metody opisu obwodów, i po- wrócić do pełnego układu równań, które w pełni opisują pola w przestrzeni. Zamiast zajmować się wyidealizowanymi elementami obwodu musimy zająć się przewodnikami rzeczywistymi, takimi jakie one są, biorąc po uwagę wszystkie pola istniejące w przestrze- ni pomiędzy tymi przewodnikami. Nie będziemy więc już próbowali konstruować na przykład obwodu rezonansowego dla wielkich częstości używając do tego celu cewki i kon- densatora płaskiego. Wspomnieliśmy już, że opisywany przez nas kondensator płaski ma pewne właściwo- ści zarówno kondensatora, jak i cewki indukcyjnej. Istnienie pola elektrycznego pociąga za sobą istnienie ładunków na powierzchniach płytek, a pola magnetyczne wywołują indukowaną siłę elektromotoryczną. Czyżbyśmy więc mieli już obwód rezonansowy? Okazuje się, że tak! Przypuśćmy, że dobieramy częstość, przy której pole elektryczne spada do zera dla pewnego promienia leżącego wewnątrz kolistej płytki, tzn. a>a/c jest większe od 2,405. Pole elektryczne będzie wtedy równe zeru na pobocznicy walca, któ- 23.7. Pole elektryczne i magnetyczne w zam- kniętej, cylindrycznej puszce rego oś pokrywa się z osią kondensatora. Przypuśćmy teraz, że bierzemy cienką folię metalową i wycinamy z niej pasek o szero- kości równej odległości płytek. Następnie wy- ginamy ten pasek, nadając mu kształt obrę- czy o promieniu równym promieniowi, dla którego pole elektryczne jest równe zeru. Jeże- li teraz umieścimy tę przewodzącą obręcz po- między płytkami, to ponieważ nie ma tam pól elektrycznych, nie popłyną przez nią żadne prądy i nie nastąpią żadne zmiany w polach elektrycznych i magnetycznych. Można więc zewrzeć kondensator i nic się nie zmieni. Po- patrzmy na to, co otrzymaliśmy: zamkniętą cylindryczną puszkę, a wewnątrz niej pola ele- ktryczne i magnetyczne, bez żadnych połączeń z otoczeniem. Pola w środku nie zmienią się, nawet gdy odrzucimy brzegi płytek wystające z naszej puszki i przewody kondensatora. To, co nam zostaje, to zamknięta puszka z polami elektrycznymi i magnetycznymi w środku, jak to pokazano na rys. 23.7a. Pola elektryczne oscylują tam i z powrotem z częstością a>, która - nie zapomnijmy - określiła średnicę puszki. Amplituda oscylującego pola E zmienia się
23_j WNĘKA REZONANSOWA 51 — z odległością od osi puszki, tak jak pokazano to na wykresie rys. 23.7b. Krzywa ta jest po prostu pierwszym „lukiem” funkcji Bessela, rzędu zero. Linie sił poła magnetycznego naszej puszki są okręgami o środkach leżących na osi puszki. Pole to oscyluje w czasie, przesunięte w fazie względem pola elektrycznego o 90°. Można także wypisać odpowiedni szereg dla pola magnetycznego i podać jego wy- jcres, tak jak to zrobiono na rys. 23.7c. Jak się to dzieje, że wewnątrz puszki pozbawionej połączeń z otoczeniem może istnieć pole elektryczne i magnetyczne? Jest to dlatego możliwe, że pola elektryczne i magnetycz- ne wzajemnie się podtrzymują; zmienne pole E wytwarza pole B, a zmienne pole B wy- twarza pole E — tak jak wynika to z równań Maxwella. Pole magnetyczne ma charakter indukcyjny, a elektryczne — pojemnościowy; wspólnie tworzą one coś w rodzaju obwo- du rezonansowego. Zauważmy, że opisana powyżej sytuacja powstanie tylko w wypadku, gdy promień puszki będzie dokładnie równy 2,405 c/co. Dla puszki o takim promieniu pola elektryczne i magnetyczne będą się wzajemnie podtrzymywać — w opisany powy- żej sposób — tylko dla szczególnej częstości. A więc cylindryczna puszka o promieniu r jest rezonatorem dla częstości (o0 = 2,405 —. r (23.18) Powiedzieliśmy, że po całkowitym zamknięciu puszki pola będą w dalszym ciągu tak samo jak przedtem oscylować. Nie jest to jednak całkiem prawdziwe. Byłoby to możliwe jedynie wtedy, gdyby ścianki puszki były przewodnikami doskonałymi. Jednakże w wy- padku rzeczywistej puszki zmienne prądy, które istnieją na wewnętrznych ściankach, tracą energię na skutek oporu materiału. Oscylacje pól będą więc stopniowo zanikać. Z rysunku 23.7 widać, że polom elektrycznym i magnetycznym wewnątrz wnęki muszą towarzyszyć silne prądy. Ponieważ pionowe pole elektryczne urywa się gwałtownie na dolnej i górnej ściance puszki, dywergencja pola w tych rejonach jest duża; na we- wnętrznych powierzchniach puszki muszą się więc gromadzić dodatnie i ujemne ładunki elektryczne, jak to pokazano na rys. 23.7a. Gdy pole elektryczne zmienia zwrot, ładunki te muszą zmienić znak, co powoduje powstanie zmiennego prądu pomiędzy górną i dol- ną ścianką puszki. Ładunki te będą przepływać w bocznych ściankach puszki, tak jak to pokazano na rysunku. To, żew bocznych ściankach muszą płynąć prądy, można także zrozumieć, jeżeli rozpatrzyć zachowanie się pola magnetycznego. Z wykresu na rys. 23.7c widać, że pole magnetyczne spada gwałtownie do zera na krawędzi puszki. Taka nagła zmiana pola może zajść tylko w wypadku, gdy w ściance przepływa prąd. Ten to właśnie prąd dostarcza górnej i dolnej ściance puszki ładunków elektrycznych o zmien- nych znakach. To odkrycie prądów w pionowych ściankach puszki jest dla nas pewną niespodzian- ką- Cóż w takim razie z naszym poprzednim twierdzeniem, które mówiło, że wstawienie tej prostopadłej ścianki w obszar, gdzie pole elektryczne było równe zeru, nie prowadzi do żadnych zmian. Pamiętajmy jednak, że gdy przyprawiliśmy puszce boczną ściankę, to płytki, górna i dolna, wystawały początkowo poza pobocznicę puszki, tak że również na zewnątrz naszej puszki istniały pola magnetyczne. Dopiero gdy odrzuciliśmy wysta- I
52 23. REZONATORY WNĘKOWE jące poza krawędź puszki części płytek kondensatora, musiały na zewnętrznych powierzch- niach pionowych ścianek pojawić się prądy wypadkowe. Chociaż pola elektryczne i magnetyczne w całkowicie zamkniętej puszce będą stop- niowo zanikać na skutek strat energii, możemy zatrzymać ten proces, jeżeli w puszce zrobimy mały otwór i wprowadzimy przez niego trochę energii elektrycznej, która by wyrównała straty. Weźmy kawałek drutu, przesuńmy go przez otwór w ściance puszki i przymocujmy do wewnętrznej ścianki, tak aby powstała mała pętla, jak to pokazano na rys. 23.8. Jeżeli połączymy teraz ten drut ze źródłem prądu zmiennego wielkiej częstości, to prąd ten dostarczy energii polom elektrycznym i magnetycznym we wnęce i podtrzyma ich oscylacje. Zajdzie to oczywiście tylko w tym wypadku, gdy częstość źródła zasilają- cego będzie równa rezonansowej częstości puszki. Jeżeli częstość źródła będzie nieodpo- wiednia, rezonans nie wystąpi i pola w puszce będą bardzo słabe. Możemy łatwo zaobserwować rezonansowe właściwości naszej puszki, jeśli zrobimy w niej drugi mały otwór i zamocujemy w nim drugą pętlę sprzęgającą, tak jak pokazuje to rys. 23.8. Zmienne pole magnetyczne, przechodzące przez tę pętlę, wywoła w niej in- dukowaną siłę elektromotoryczną. Jeżeli teraz połączymy tę pętlę z jakimś zewnętrznym układem pomiarowym, to prądy w tym układzie będą proporcjonalne do natężeń pól we wnęce. Przypuśćmy, że podłączymy teraz wejściową pętlę naszej wnęki do generatora : sygnałów wielkiej częstości, jak to pokazano na rys. 23.9. Generator sygnałów jest źró- I dłem prądu zmiennego, którego częstość można zmieniać przez obrót gałki umieszczo- 23.9. Układ do obserwacji rezonansu wnękowego wnęka
23-3. WNĘKA REZONANSOWA nej na przedniej ściance generatora. Następ- nie pęt!? wyjściową wnęki łączymy z „detek- torem”, który jest urządzeniem mierzącym prąd w pętli wyjściowej, przy czym wskazania miernika są proporcjonalne do natężenia tego prądu. Jeżeli teraz przeprowadzimy pomiar prądu wyjściowego w zależności od częstości generatora sygnałów, otrzymamy funkcję, której wykresem będzie taka krzywa, jak na rys. 23.10. Prąd wyjściowy będzie tu mały 'o •go <^0 częstość 23.10. Krzywa rezonansu wnęki rezonansowej dla wszystkich częstości, z wyjątkiem tych, które leżą bardzo blisko co0, częstości wnęki rezonansowej. Ta krzywa rezonansu przypomina w dużym stopniu krzywe, które opi- saliśmy w rozdz. 23 tomu I (cz. 1). Szerokość rezonansu jest w tym wypadku jednak dużo mniejsza niż w wypadku obwodów rezonansowych, utworzonych z cewek induk- cyjnych i kondensatorów; znaczy to, że dobroć Q wnęki jest bardzo duża. Jeżeli wewnętrz- ne ścianki są zrobione z jakiegoś materiału o bardzo dobrej przewodności (np. ze srebra), to dobroć Q rzędu 100000 wcale nie jest czymś niezwykłym. 23-4. Typy drgań w rezonatorach wnękowych*’ Przypuśćmy, że chcemy sprawdzić teraz naszą teorię, dokonując w tym celu pomia- rów dla jakiejś rzeczywistej puszki. Bierzemy puszkę o średnicy 7,6 cm i o wysokości około 6,25 cm. Puszka ta ma pętlę wejściową i wyjściową, tak jak to pokazano na rys. 23.8. Jeżeli obliczymy oczekiwaną częstość rezenonansową tej puszki z równania (23.18), to otrzymamy, że /0 = Wo/2rt = 3010 MHz. Gdy nastawimy częstość naszego generato- ra sygnałów w pobliżu 3000 MHz i będziemy ją powoli zmieniać aż do momentu, w któ- rym zaobserwujemy rezonans, przekonamy się, że maksymalny prąd na wyjściu odpo- wiada częstości 3050 MHz, która jest wprawdzie całkiem zbliżona do przepowiedzianej częstości rezonansu, ale nie identyczna. Istnieje kilka możliwych powodów tej rozbież- ności. Być może, otwory, które wycięliśmy w ściankach w celu wprowadzenia pętli sprzę- gających, zmieniają nieco częstość rezonansu. Ale ten powód odpada, bo jak wynika z prostych rozważań, takie otwory powinny częstość rezonansu zmniejszyć tylko trochę. Może więc skala częstości naszego generatora obarczona jest pewnym małym błędem albo może nasz pomiar średnicy puszki nie był dostatecznie dokładny. W każdym razie zgodność jest zupełnie dobra. O wiele bardziej istotne jest zjawisko, które zachodzi, jeśli częstość generatora syg- nałów zwiększać dalej — powyżej 3000 MHz. Gdy się to zrobi, otrzyma się wyniki po- kazane na rys. 23.11. Okazuje się więc, że oprócz oczekiwanego przez nas rezonansu w okolicy 3000 MHz istnieje także rezonans w pobliżu 3300 MHz i jeszcze jeden rezo- Porównaj: tom I, cz. 2 rozdz. 49 (Fale stojące)
54 23. REZONATORY WNĘKOWE □ •in § a 3050 3300 3820 3000 3500 , MHz 4000 23.11. Obserwowane częstości rezonansowe wnęki cylindrycznej nans w pobliżu 3820 MHz. Co te dodatkowe rezonanse oznaczają? Może rys. 23.6 do- starczy nam wskazówki do rozwiązania zagadki? Chociaż zakładaliśmy, że na krawędzi puszki przypada pierwsze zero funkcji Bessela, to może się też tak zdarzyć, że krawędzi puszki odpowiadałoby drugie zero funkcji Bessela, tak że posuwając się od środka puszki 23.12. Typ drgań o wielkich częstościach do jej krawędzi zaobserwowaliśmy jedną pełną oscylację pola elektrycznego, tak jak pokazano to na rys. 23.12. Jest to inny możliwy typ drgań oscylujących pól. Możemy się więc słusznie spo- dziewać, że puszka będzie również rezonować przy takim typie drgań. Ale zauważmy, że dru- gie zero funkcji Bessela przypada dla x = 5,52, a więc dla x przeszło dwa razy większego od pierwszego miejsca zerowego. Częstość rezo- nansowa tego typu drgań powinna być więc większa niż 6000 MHz. Bez wątpienia moglibyś- my znaleźć tam rezonans, ale to wszystko nie wyjaśnia istnienia rezonansu dla 3300 MHz. Powodem naszych kłopotów jest fakt, że w naszym opisie zachowania się wnęki rezonanso- wej uwzględniliśmy tylko jedną możliwą konfi- gurację geometryczną pól elektrycznych i magne- tycznych. Założyliśmy, że linie sił pól elektry- cznych są pionowe, a linie sil pól magnetycznych są okręgami leżącymi w płaszczyźnie poziomej. Ale możliwe są i inne pola — wystarczy jedynie, że spełnią one równania Maxwella i że pole ele- ktryczne styka się ze ściankami pod kątem pro- stym. Rozważaliśmy przypadek, w którym górna
23-4. TYPY DRGAŃ W REZONATORACH WNĘKOWYCH i dolna ścianka puszki były płaskie, ale niewiele by się zmie- niło, gdyby te ścianki były wygięte. W istocie, skąd puszka może „wiedzieć”, które ścianki są jej ściankami górną i dolną, a które są jej ściankami bocznymi? Można rzeczy- wiście pokazać, że istnieje typ oscylacji pól, dla którego linie sił pola elektrycznego pokrywają się, w większym lub w mniejszym stopniu, ze średnicą puszki (rys. 23.13). Nietrudno zrozumieć, dlaczego częstość własna tego typu drgań jest zbliżona do częstości własnej typu drgań rozwa- żanego przez nas na początku. Przypuśćmy, że zamiast naszej wnęki cylindrycznej wzięlibyśmy wnękę, która ma kształt sześcianu o krawędzi 7,6 cm. Wnęka ta będzie oczy- wiście mieć trzy typy drgań ale wszystkie o tej samej częs- tości. Drgania, podczas których pole elektryczne przyjmuje kierunek „góra-dół”, będą zachodzić z tą samą częstością co drgania, dla których pole elektryczne przyjmuje kieru- nek „lewy-prawy”. Gdy teraz nasz sześcian poddamy defor- macji tak, aby powstał z niego walec, to częstości się nieco zmienią. Jeżeli jednak zachowamy wymiary wnęki mniej więcej takie same jak poprzednio, możemy oczekiwać, że częstości zbytnio się nie zmienią. Tak więc częstość drgań typu przedstawionego na rys. 23.13 nie powinna się wiele różnić od częstości drgań typu z rys. 23.8. Moglibyśmy, choć nie będziemy tego teraz robić, dokładnie obliczyć czę- stość własną dla typu drgań pokazanego na rys. 23.13. Gdyby wykonać te obliczenia, okazałoby się, że dla przyję- tych przez nas wymiarów wnęki częstość rezonansowa prawie dokładnie odpowiada obserwowanemu przez nas rezonan- sowi przy 3300 MHz. 23.13. Drgania poprzeczne we wnęce cylindrycznej 23.14. Jeszcze inny typ drgań we wnęce cylindrycznej Przy pomocy podobnych obliczeń można wykazać, że powinien istnieć jeszcze inny typ drgań z częstością rezonansową bliską znalezionej przez nas częstości 3800 MHz. Dla tego rodzaju drgań pola elektryczne i magnetyczne wyglądają jak na rys. 23.14. Linie sił pola elektrycznego nie zadają sobie trudu i nie przebiegają wzdłuż wnęki, a jedynie °d ścianek bocznych do podstaw walca, jak to pokazano na rysunku. Możemy już teraz uwierzyć w to, że przechodząc ku coraz to większym częstościom Powinniśmy oczekiwać wystąpienia coraz to nowych rezonansów. Istnieje wiele ty- pów drgań, każdy z nich o innej częstości rezonansowej, w zależności od pewnej szcze- gólnej, skomplikowanej konfiguracji pól elektrycznych i magnetycznych. Każdą z tych konfiguracji pól nazywamy rezonansowym typem drgań. Częstość rezonansową każdego typu drgań można obliczyć rozwiązując równania Maxwella dla pól elektrycznych i magne- tycznych we wnęce. Gdy mamy rezonans przy pewnej szczególnej częstości, to jak możemy się przekonać, J aki typ drgań został wzbudzony? Jeden ze sposobów polega na wstawieniu do wnęki
56 23. REZONATORY WNĘKOWE b) 23.15. Krótki metalowy drut wprowadzony do wnęki zakłóci rezonans o wiele bardziej, gdy będzie równoległy do linii sił pola E, niż gdy będzie do nich prostopadły przez mały otwór kawałka drutu. Jeżeli pole elektryczne przebiega wzdłuż drutu, jak na rys. 23.15a, to w drucie będą stosunkowo duże prądy „porywające” energię z pól i rezo- nans będzie mniej wyraźny. Jeżeli zaś pole elektryczne wygląda jak na rys. 23.15b, wsta- wienie drutu wywoła o wiele mniejszy efekt. W tym wypadku kierunek pola można zna- leźć zginając drut, tak jak to pokazano na rys. 23.15c. Następnie obracając drut zaobser- wujemy wyraźny efekt, gdy koniec drutu będzie równoległy do pola E, a najmniejszy efekt, gdy koniec drutu będzie tworzyć z polem E kąt 90°. 23-5. Wnęki a obwody rezonansowe Chociaż wydaje się, że opisywana przez nas wnęka rezonansowa różni się całkiem od zwykłego obwodu rezonansowego, złożonego z cewki indukcyjnej i kondensatora, te dwa układy rezonansowe są oczywiście ściśle spokrewnione. Oba te układy są członkami jednej rodziny; są to po prostu dwa skrajne przypadki rezonatorów elektromagnetycz- nych, a pomiędzy tymi dwoma przypadkami skrajnymi istnieje wiele przypadków pośred- nich. Przypuśćmy, że zaczynamy rozważania od obwodu rezonansowego złożonego z po- łączonych szeregowo kondensatora i cewki, tak jak to pokazano na rys. 23.16a. Obwód ten będzie rezonować dla częstości coo = Jeżeli chcemy zwiększyć częstość re- zonansu, możemy to uzyskać zmniejszając indukcyjność L. Jednym ze sposobów na zmniej- szenie indukcyjności jest zmniejszenie liczby zwojów cewki. Jednakże nasze możliwości są w tym przypadku ograniczone. W końcu pozostanie nam jeden ostatni zwój i będzie- my wówczas mieli po prostu kawałek drutu, łączący górną płytkę kondensatora z płytką dolną. Moglibyśmy jeszcze zwiększyć częstość rezonansu zmniejszając pojemność kon- densatora; ale możemy także w dalszym ciągu zmniejszać indukcyjności, łącząc równo- legle kilka elementów obwodu. Połączenie równolegle dwóch jednozwojowych cewek induk-
23-5. WNĘKI A OBWODY REZONANSOWE 57 23.16. Rezonatory mające coraz to większe częstości rezonansowe cyjnych ma indukcyjność równą połowie indukcyjności każdego ze zwojów. Tak więc gdy nasza cewka została zredukowana do jednego zwoju, możemy w dalszym ciągu zwięk- szać częstość rezonansową dodając inne pętle łączące górną i dolną płytkę kondensato- ra. Tak na przykład na rys. 23.16b pokazano płytki kondensatora połączone sześcioma takimi ,,jednozwojowymi cewkami”. Jeżeli będziemy dodawać coraz to więcej takich kawałków drutu, to w przypadku granicznym otrzymamy całkowicie zamknięty układ rezonansowy o symetrii cylindrycznej, którego przekrój poprzeczny widzimy na rys. 23.16c. Nasza cewka indukcyjna jest teraz pustą puszką w kształcie walca, przymocowaną do krawędzi płytek kondensatora. Pola elektryczne i magne- tyczne wyglądają tak, jak to pokazano na rysunku. Taki układ jest oczywiście wnęką rezonansową i nazywa się go wnęką „obciążoną”. Ale można go dalej uważać za obwód L-C, którego część pojemnościowa odpowiada obszarowi, w którym znajduje się większość pola elektrycznego, a część indukcyjna odpowiada obszarowi, w którym znajduje się większość pola magnetycznego. Jeżeli chcemy jeszcze zwiększyć częstość rezonatora z rys. 23.16c, możemy to uzyskać przez dalsze zmniejszanie in- dukcyjności L. Aby to zrobić, musimy zmniejszyć geome- tryczne rozmiary części indukcyjnej przez, na przykład, zmniejszenie wysokości h (patrz rysunek). Ze zmniejsze- niem wysokości h częstość rezonansu będzie wzrastać. W końcu otrzymamy oczywiście sytuację, w której wyso- kość h będzie akurat równa odstępowi płytek kondensato- ra. Będziemy mieć wówczas po prostu puszkę w kształcie walca; nasz obwód rezonansowy stanie się rezonatorem Wnękowym, takim jak na rys. 23.7. 23.17. Jeszcze jedna wnęka rezonansowa
58 23. REZONATORY WNĘKOWE Zauważmy, że w naszym pierwotnym obwodzie rezonansowym L-C z rys. 23.16a pola magnetyczne i elektryczne były całkowicie rozdzielone. Gdy stopniowo zmienia- liśmy układ rezonansowy, aby otrzymać coraz to większe częstości, pole magnetyczne przybliżało się coraz bardziej ku polu elektrycznemu, aż w przypadku rezonatora wnę- kowego oba te pola zupełnie się „wymieszały”. Chociaż wszystkie omawiane przez nas w tym rozdziale rezonatory wnękowe były puszkami cylindrycznymi, nie ma w tym kształcie nic magicznego. Puszka dowolnego kształtu będzie miała częstości rezonansowe odpowiadające różnym możliwym typom oscylacji pól elektrycznych i magnetycznych. Tak na przykład „wnęka” pokazana na rys. 23.17 będzie miała swój własny zbiór częstości rezonansowych, chociaż obliczenie ich byłoby raczej trudne.
! i 24 falowody 24-1. Linia przesyłowa W poprzednim rozdziale rozważaliśmy, co się działo ze skupionymi elementami obwo- du w przypadku wielkich częstości, i przekonaliśmy się, że obwód rezonansowy mógł być zastąpiony wnęką, w której drgania pól były w rezonansie. Innym interesującym pro- blemem technicznym jest takie połączenie dwóch różnych obiektów, które umożliwiło- by przesyłanie między nimi energii elektromagnetycznej. W obwodach malej częstości połączenie to jest realizowane za pomocą drutów, ale metoda ta zawodzi dla wielkich częstości, gdyż obwody będą wtedy promieniować energię w całą otaczającą je przestrzeń i transport energii będzie się wymykać spod naszej kontroli. W przestrzeni na zewnątrz przewodów pojawią się pola i wówczas prądy oraz napięcia nie będą przez druty bardzo dobrze „prowadzone”. W bieżącym rozdziale chcemy rozpatrzyć sposoby łączenia ele- mentów przy wielkich częstościach; problem ten będzie stanowić przynajmniej jeden z aspektów naszego zagadnienia. Zagadnienie nasze ma bowiem inny aspekt. Dotąd rozważaliśmy zachowanie się fal w pustej przestrzeni. Teraz nadszedł czas, aby zobaczyć, co się dzieje, gdy oscylujące Pola są ograniczone w jednym lub więcej wymiarach (tzn. pozbawione jednego lub wię- ceJ stopni swobody). Odkryjemy nowe ciekawe zjawisko: gdy pola są ograniczone tylko w dwóch wymiarach, a mogą się poruszać swobodnie w trzecim, przemieszczają się one w postaci fal. Są to „fale prowadzone”; zajmiemy się nimi w tym rozdziale. Zaczniemy od sformułowania ogólnej teorii linii przesyłowej. Zwykła linia przesy- łowa, przebiegająca od słupa do słupa poprzez pola, wypromieniowuje część swojej ener- ale częstości sieciowe (50-60 Hz) są tak małe, że strata ta nie jest istotna. Można by Promieniowanie to zlikwidować, otaczając linię rurą metalową, ale taka metoda nie ma Praktycznego zastosowania dla linii elektroenergetycznych, ponieważ używane napięcia
60 24. FALOWODY i prądy wymagałyby użycia dużych, drogich i ciężkich rur. Dlatego też używa się prostych „linii napowietrznych”. Dla nieco większych częstości — powiedzmy kilku kiloherców — promieniowanie może już być znaczne. Można je jednakże zmniejszyć, używając „dwuprzewodowej ple- cionej” linii przesyłowej, tak jak się to robi w wypadku lokalnych połączeń telefonicz- nych. Jednak przy większych częstościach promieniowanie staje się wkrótce niepożądane, zarówno ze względu na straty energii, jak i ze względu na pojawienie się energii w innych obwodach, mimo że wcale nie chcieliśmy jej tam mieć. Dla częstości od kilku kiloherców do setek megaherców sygnały elektromagnetyczne i energia są zwykle przesyłane kabla- mi koncentrycznymi, składającymi się z drutu wewnątrz cylindrycznego „przewodu ze- wnętrznego” lub „osłony”. Chociaż przedstawiony poniżej formalizm będzie miał za- stosowanie także do linii przesyłowej złożonej z dwóch równoległych przewodników do- wolnego kształtu, przedstawimy go w odniesieniu do linii koncentrycznej. Weźmy najprostszą linię koncentryczną, mającą przewód wewnętrzny, o którym za- kładamy, że jest cienkim wydrążonym walcem, i przewód zewnętrzny, który też jest cien- kim walcem o tej samej osi co przewód wewnętrzny (rys. 24.1). Zaczniemy od przybli- żonego opisu zachowania się linii przy małych częstościach. Zachowanie się linii przy małych częstościach częściowo opisaliśmy już poprzednio, kiedy to powiedzieliśmy, że dwa takie przewody mają pewną indukcyjność na jednostkę długości lub pewną pojem- ność na jednostkę długości. W istocie można opisać zachowanie się dowolnej linii prze- 24.1. Koncentryczna linia przesyłowa 34.2. Prądy i napięcia w linii przesyłowej drut 1 l(x) I(x+Ax) V(x) [ — —— 'V(x+4x) drut 2 - x+dx X syłowej przy małych częstościach przez poda- nie jej indukcyjności na jednostkę długości (Lo) i pojemności na jednostkę długości (Co). Wówczas można rozpatrywać linię jako gra- niczny przypadek filtru L-C, tak jak to przedstawiono w § 22-7. Taki filtr, będący obrazem linii przesyłowej, można zrobić łącząc szeregowo małe elementy Lo zfx i bocz- nikując je małymi elementami Co Ax, gdzie Ax jest elementem długości linii. Korzystając z naszych wyników dla nieskończonego filtru widzimy, że wzdłuż linii następuje przemie- szczanie się sygnałów elektrycznych. Zamiast jednak rozpatrywać linię przesyłową jako taki nieskończony filtr rozpatrzmy ją raczej z punktu widzenia równania różniczkowego. Przypuśćmy, że obserwujemy, co się dzie- je w dwóch sąsiednich punktach leżących na linii, powiedzmy w odległościach x i x+ od początku linii. Oznaczmy różnicę poten- qałów pomiędzy przewodnikami przez V(x), a prąd płynący wzdłuż przewodnika „go- rącego” przez I(x) (patrz rys. 24.2). Jeżeli
24-l. LIN!*- PRZESYŁOWA 61 prąd w linii się zmienia, to na skutek indukcji powstanie na małym odcinku linii od x xĄ-Ax spadek napięcia dl AV — V(x~ł-Ax')— V(x) = — L0Ax— . dt przechodząc do granicy dla dx->0, otrzymujemy dV _ dl dx 0 dt (24.1) Zmienny prąd powoduje powstanie gradientu napięcia. Powracając do rysunku widzimy, że skoro w punkcie x zmienia się napięcie, to do pojemności istniejącej w tym obszarze musi zostać dostarczony pewien ładunek. Jeżeli więc weźmiemy mały odcinek linii pomiędzy x a x+Ax, to wystąpi na nim ładunek równy q = Co Ark. Szybkość zmian ładunku w czasie wynosi C0AxdV/dt, ale jego zmiana na- stąpi tylko w tym wypadku, gdy prąd I(x) dopływający do tego odcinka będzie różny od prądu Z(x+Zlx) zeń wypływającego. Oznaczając tę różnicę przez Al mamy , dv Al = — C0Ax—-. dt Przechodząc do granicy dla Ax-*0 otrzymujemy dl dV dx dt (24.2) Tak więc zasada zachowania ładunku wymaga, aby gradient prądu był proporcjonalny do szybkości zmian napięcia w czasie. Równania (24.1) i (24.2) są więc podstawowymi równaniami linii przesyłowej. Mogli- byśmy ewentualnie równania te zmodyfikować, tak aby uwzględniały one także efekty związane z oporem drutu lub z upływem ładunku poprzez izolację pomiędzy przewodni- kami, ale na razie pozostaniemy przy naszym prostym przykładzie. Te dwa równania linii przesyłowej można połączyć razem różniczkując jedno z nich względem t, a drugie względem x i eliminując z nich albo I, albo też V. Mamy wówczas bądź d2 V _ d2 V bądź też d2I d2I dx2 dt2 Spotykamy się więc raz jeszcze z równaniem falowym względem zmiennej x. W przy- padku jednorodnej linii przesyłowej napięcie (i prąd) przemieszcza się wzdłuż linii w po- staci fali. Napięcie wzdłuż linii musi mieć postać V(x, t) = f(x—vi) lub V(x, f) = g(x+vt), albo też musi być sumą obu tych rozwiązań. A co będzie z prędkością v tej fali? Wiemy,
62 24. FALOWODY że współczynnikiem przy wyrazie 82/dt2 jest po prostu 1/r2, a więc __ 1 Vl0Cq (24.5) Pozostawiamy Czytelnikowi do wykazania, że napięcie dla każdej fali w linii jest pro- porcjonalne do prądu tej fali i że współczynnik proporcjonalności jest po prostu pozorną opornością charakterystyczną Zo. Oznaczając przez V+ i I+ napięcie i prąd dla fali prze- mieszczającej się w dodatnim kierunku osi x, powinno się otrzymać r+ = Zo/+. (24.6) Podobny związek dla fali biegnącej w ujemnym kierunku osi x ma postać = -Z0Z_. Pozorna oporność charakterystyczna — jak wynika to z naszych równań filtru — jest dana przez o (24.7) jest więc czystym oporem. Aby znaleźć prędkość przenoszenia v i pozorną oporność charakterystyczną Z9 linii przesyłowej, musimy znać indukcyjność i pojemność przypadające na jednostkę długości. Dla kabla koncentrycznego można je łatwo obliczyć; zobaczmy więc, jak się to robi. Dla indukcyjności przeprowadzamy podobne rozumowanie jak w § 17-8; podstawiamy $LI2 równe energii magnetycznej, którą otrzymamy całkując eoc2B2/2 po objętości. Przy- puśćmy, że przez środkowy przewód przepływa prąd I; wtedy jego pole B = I/2itEoc2r, gdzie r jest odległością od osi. Biorąc za element objętości cylindryczną warstwę o gru- bości dr i długości l, otrzymujemy następujące wyrażenie na energię magnetyczną: eoc2 cl I \2 ... (J =——• -------—\l2irrdr, ' , 2 J \27teoc r] , gdzie a i b są odpowiednio promieniami przewodu wewnętrznego i Zewnętrznego. Wy- konując całkowanie otrzymujemy I2l b , U = ------- -In — . (24.8) 47t£0C Przyrównując tę energię do |ZJ2 znajdujemy l . b ------In— 2k e0 c2 a (24.9) Jest ona, tak jak powinno być, proporcjonalna do długości l linii i indukcyjność na jed- nostkę długości Lo jest zatem równa ln(ó/O) i ° 27t£0C2 (24.10)
244. linia przesyłowa 65 Obliczyliśmy poprzednio ładunek na kondensatorze cylindrycznym (patrz § 12-2). •jeraz dzieląc ten ładunek przez różnicę potencjałów otrzymujemy ln(b/a) pojemność na jednostkę długości (Co) jest równa C/l. Zestawiając ten wynik z równaniem (24.10) widzimy, że iloczyn L0C0 jest po prostu równy 1/c2, a v = 1//£0C0 jest tym sa- mym równe c. Fala przebiega wzdłuż linii z prędkością światła. Zaznaczmy, że wynik ten zależy od naszych założeń: a) że w przestrzeni między przewodami nie ma dielek- tryków lub materiałów magnetycznych i b) że prądy przypływają tylko na powierzchniach przewodników (tak jak działoby się to w wypadku przewodników doskonałych). Zo- baczymy później, że dla dobrych przewodników przy wielkich częstościach wszystkie prądy znajdują się na powierzchniach, tak jak w wypadku przewodników doskonałych, czyli założenie to jest wtedy słuszne. Interesujący jest tu fakt, że dopóki założenia a) i b) są słuszne, iloczyn £0C0 jest równy 1 je2 dla dowolnej równoległej pary przewodników — nawet, powiedzmy, dla przewod- nika wewnętrznego o przekroju będącym sześciokątem, znajdującego się w eliptycznym przewodzie zewnętrznym. Dopóki przekrój przewodu jest stały i w przestrzeni pomiędzy przewodnikami nie ma żadnych materiałów, fale są przenoszone z prędkością światła. Nie można wypowiedzieć takiego ogólnego twierdzenia o pozornej oporności cha- rakterystycznej. Dla linii koncentrycznej jest ona równa _ ln(ó/a) 0 2k£0 c Współczynnik l/eoc ma wymiar oporu i jest równy 120k omów. Czynnik geometryczny ln(ó/n) zależy w niewielkim stopniu od rozmiarów linii (logarytm!), tak więc dla linii koncentrycznej — i dla większej liczby linii przesyłowych — typowe wartości pozornej oporności charakterystycznej wahają się od około 50 do kilku setek omów. (24.11) 24-2, Falowód prostokątny To, o czym chcemy teraz mówić, wydaje się na pierwszy rzut oka zjawiskiem zadzi- wiającym: jeżeli z linii koncentrycznej usunąć środkowy przewodnik, będzie ona mogła w dalszym ciągu przenosić energię elektromagnetyczną. Innymi słowy, przy dostatecznie wielkich częstościach pusta w środku rura będzie działała równie dobrze jak rura, wewnątrz której są druty. Związane to jest z innym „tajemniczym” zjawiskiem, które już znamy — obwód rezonansowy złożony z kondensatora i cewki indukcyjnej można przy wielkich cz?stościach zastąpić po prostu puszką. Chociaż może to się wydawać rzeczą niezwykłą dla kogoś, kto myśli o linii przesy- łowej jako o zbiorze elementów mających pewną indukcyjność i pojemność, to każdy z nas wie, że fale elektromagnetyczne mogą przebiegać wewnątrz pustej rury metalowej. Jeżeli taka rura jest prosta, to można przecież przez nią patrzeć! Z pewnością więc fale
64 24. FALOWODY elektromagnetyczne przechodzą przez rurę. Ale wiemy także, że taką pustą rurą metalową nie można przesyłać fal małej częstości (mocy czy też sygnałów telefonicznych). Stąd wynika, że fale elektromagnetyczne będą przechodzić wewnątrz rury tylko wtedy, gdy ich długość będzie dostatecznie mała. Chcemy więc rozważyć graniczny przypadek największej długości fali (lub najmniejszej częstości), która może przejść przez rurę o danych wy- miarach. Ponieważ taka rura służy wówczas do przenoszenia fal, nazywamy ją falowodem. Zaczniemy nasze rozważania od rury o przekroju prostokątnym, ponieważ jest to naj- prostszy przypadek do opisania. Podamy najpierw formalizm matematyczny, a później powrócimy do opisu tego zagadnienia w sposób o wiele bardziej elementarny. Jednakże to bardziej elementarne podejście można prosto zastosować tylko w przypadku falowodu prostokątnego. Podstawowe zjawiska są natomiast takie same dla każdego falowodu o dowolnym kształcie, co sprawia, że matematyczne rozważania będą zasadniczo bardziej przekonywające. Chcemy więc znaleźć, jakiego rodzaju fale mogą istnieć wewnątrz rury o prostokątnym przekroju. Wybierzmy od razu jakiś dogodny układ współrzędnych; oś z weźmy wzdłuż rury, a osie x i y równolegle do jej dwóch bocznych ścianek, tak jak to pokazano na rys. 24.3. Wiemy, że fale świetlne przebiegające wzdłuż rury mają poprzeczne pole elektryczne; spróbujmy więc najpierw poszukać rozwiązań, w których pole E będzie prostopadłe do osi z i będzie miało na przykład tylko składową w kierunku osi y, równą Ey. To pole elektryczne będzie miało różne wartości dla różnych punktów przekroju falowodu; w isto- cie musi ono na ściankach równoległych do osi y spadać do zera, ponieważ prądy i ładunki w przewodniku ustalają się zawsze tak, aby składowa styczna pola elektrycznego była równa zeru na powierzchni przewodnika. Tak więc wykres przebiegu funkcji Ey w zależ- ności od x będzie jakąś krzywą, tak jak to pokaza- no na rys. 24.4. Może jest to ta funkcja Bessela, którą znaleźliśmy dla wnęki? Nie, funkcje Bessela wiążą się bowiem z symetrią cylindryczną. Dla prostokątnej geometrii fale są zwykle prostymi funkcjami trygonometrycznymi, tak że powinniśmy szukać zależności typu sinkxx. Ponieważ szukamy fal, które przemieszczają się wzdłuż falowodu, spodziewamy się, że pole elektryczne będzie oscylowało pomiędzy warto- ściami dodatnimi i ujemnymi, w miarę jak będzie- my się przesuwać wzdłuż osi z, jak to przedstawia rys. 24.5 i że oscylacje te będzie przemieszczać się wzdłuż falowodu z pewną prędkością v. Jeśli ma- my do czynienia z oscylacjami o pewnej określo- nej częstości co, możemy przypuszczać, że zmiana fali w zależności od z będzie typu cos(cot—k^z) lub, używając dogodniejszej postaci matematycz- 24.3. Układ współrzędnych obrany do opisu falowodu prostokątnego
24-2. FALOWÓD PROSTOKĄTNY 65 nej, typu exP I' TeS° typu zależ- ność od z reprezentuje falę przemieszcza- jącą się z prędkością v = w/kz (patrz rozdz. 29, tom I, cz. 2). Tak więc możemy przypuszczać, że fali w falowodzie będzie odpowiadała taka oto postać matematyczna: g = Eo sinkxx exp [i(wt—k^z)]. (24.12) Zobaczmy, czy to przypuszczenie bę- dzie spełniać równania pola. Po pierwsze, pole elektryczne nie powinno mieć składo- wych stycznych na powierzchni przewod- ników. Nasze pole spełnia ten postulat; jest ono prostopadłe do górnej i do dolnej ścianki, a na ściankach bocznych jest równe zeru. Ściślej mówiąc, będzie ono równe zeru, jeżeli kx wybierzemy tak, aby połowa okresu funkcji sinkxx była dokład- nie równa szerokości falowodu, czyli jeżeli = k. (24.13) Istnieją też inne możliwości, jak kxa = 2k , 3t:,..., czyli ogólnie, kxa = mz, (24.14) gdzie n jest dowolną liczbą całkowitą. Reprezentują one różne skomplikowane konfiguracje pola, ale ograniczmy się teraz do najprostszej, gdzie kx = n/a, przy czym a jest szerokością wnętrza falowodu. Po drugie, dywergencja wektora E musi być równa zeru w pustej przestrzeni we- wnątrz falowodu, ponieważ nie ma tam żadnych ładunków. Nasze pole ma tylko składową w kierunku osi y; składowa ta n’e zmienia się z y, tak więc V-E = 0. Na koniec, nasze pole elektryczne mu- Sl spełniać pozostałe równania Maxwełła w pustej przestrzeni wewnątrz falowodu, kst to równoznaczne z żądaniem, aby nasze pole spełniało równanie falowe: ££ ćpe, i <pe, _ flyl c2 fl[2 (24.15) ~~ Wykłady z fizyki 24.4. Pole elektryczne w falowodzie dla pewnej wartości z 24.5. Zależność pofa elektrycznego w falowo- dzie od z y o o
66 24. FALOWODY Musimy sprawdzić, czy nasza hipoteza, sformułowana w równaniu (24.12), spełnia powyż- sze równanie. Druga pochodna Ey względem x jest równa po prostu — k^Ey. Druga zaś pochodna względem y jest równa zeru, ponieważ nic w naszym zagadnieniu od y nie za- leży. Druga pochodna względem z jest natomiast równa —!<?zEy, a druga pochodna wzglę. dem t jest równa — (n2Ey. Równanie (24.15) mówi więc, że co2 Ł J ’ • ' ^y+k^Ey--------TEy = Q- c Jeżeli Ey nie jest równe wszędzie zeru (co nie jest zbyt interesującym przypadkiem), to rów- nanie to będzie słuszne, gdy _ , (a2 . - • i > k2+k2- — = Q. (24.16) Ustaliliśmy już wartość kx, a więc równanie to mówi nam, że fale oczekiwanego przez nas typu będą mogły istnieć wtedy, gdy k2 będzie związane z częstością przez równanie (24.16) — innymi słowy, jeżeli k, = V(ai2lc2)-(it2/a2). (24.17) Opisane przez nas fale przemieszczają się w kierunku osi z i mają tę właśnie wartość kz. Liczba falowa k2 z równania (24.17) określa nam, dla danej częstości co, prędkość, z jaką węzły fali przemieszczają się wzdłuż falowodu. Prędkość fazowa jest równa aj v = — k7 (24.18) Pamiętamy, że 2, długość fali bieg- nącej, dana jest przez 2 = 2ki;/co, tak więc kz jest także równe 2rr2g, gdzie 2g jest długością fali oscylacji zachodzą- cych wzdłuż osi z — „długością fali falowodu”. Długość fali w falowodzie jest oczywiście różna od długości fali fal elektromagnetycznych o tej samej częstości, rozchodzących się w pustej przestrzeni. Jeżeli oznaczymy długość fali w pustej przestrzeni przez 20, przy czym 20 = Inclai, możemy równanie (24.17) zapisać w postaci (2410 rnw Oprócz pól elektrycznych istniej^
j4-2 FALOWÓD PROSTOKĄTNY 67 rzernieszczać się z falą. Nie będziemy się jednak kłopotać teraz znalezieniem wyrażeń opi- $ująCyeh te pola. Ponieważ c2 V x B = dE/dt, linie sił pola B będą okrążały obszar, w którym -g/dt będzie największe, to znaczy w połowie drogi pomiędzy maksimum i minimum E. Te pętle B będą leżały w płaszczyznach równoległych do płaszczyzny xz, pomiędzy „doli- nami” i „szczytami” pola E, jak pokazano to na rys. 24.6. 24-3. Częstość graniczna Równanie określające wielkość kz [równanie (24.16)] ma w rzeczywistości dwa pier- wiastki — jeden dodatni, a drugi ujemny. Powinniśmy to zapisać w postaci kz = ± /(co2/c2)-(rc2/a2). (24.20) Dwa znaki przed pierwiastkiem oznaczają po prostu, że oprócz fal, które przemieszczają się w falowodzie w kierunku dodatnim, mogą również istnieć fale, które przemieszczają się z ujemną prędkością fazową (w kierunku —z). Oczywiście, fale mogą się rozchodzić w każdym z dwóch kierunków. Ponieważ oba typy fal mogą być obecne w tej samej chwili, to istnieje również możliwość rozwiązania w postaci fali stojącej. Z naszego równania na kz wynika także, że większym częstościom odpowiadają większe wartości kz, czyli mniejsze długości fali, aż w granicy dla dużych <o k staje się równe co/c, a więc wartości, której spodziewaliśmy się dla fal w pustej przestrzeni. Światło oglądane przez rurę biegnie przez nią nadal z prędkością c. Zauważmy natomiast, że gdy przejdziemy ku małym częstościom, zacznie się dziać coś dziwnego. Początkowo długość fali będzie coraz bardziej rosła, ale gdy co stanie się zbyt małe, to wielkość pod pierwiastkiem w rów- naniu (24.20) nagle stanie się ujemna. Będzie tak wtedy, gdy tylko co stanie się mniejsze od inc/a lub gdy 20 stanie się większe od 2a. Innymi słowy, dla częstości mniejszej od pew- nej częstości krytycznej liczba falowa kz (a także 2?) staje się urojona i wówczas nie mamy już rozwiązania. A może jednak mamy? Kto powiedział, że kz musi być rzeczywiste? Co z tego, że otrzymujemy kz urojone — równania pola pozostają przecież w dalszym ciągu spełnione. Może więc i urojone kz reprezentuje jakąś falę? Przypuśćmy, że co jest mniejsze od coc; można wówczas zapisać kz = ±ik', (24.21) gdzie k’ jest dodatnią liczbą rzeczywistą: > k' = I/(K2/a2)-(co2/c2). (24.22) Jeżeli teraz wrócimy do naszego wyrażenia na Ey [równanie (24.12)], otrzymamy Ey = EosinM e,(“'T‘Vz), (24.23) Co możemy zapisać w następującej postaci: Ey = Eo sin kxx . (24.24) Wyrażenie to określa nam pole E, które oscyluje w czasie jak e'"', ale które zmienia
68 24 FALOWODY 24.7. Zależność Ey od z dla <u <C a>e widzimy, że dla częstości nieco mniejszych się w zależności od zmiennej z jak e±fc z. Jako funkcja wykładnicza zmiennej rzeczywistej 2 wyrażenie to stale maleje (lub też stale roś- nie). Przy wyprowadzaniu naszych wzorów nie zatroszczyliśmy się o źródła, które generują fale, ale oczywiście gdzieś w falowodzie musi być także źródło. Znak k' musi być tak wy- brany, aby pole malało wraz ze wzrostem odległości od źródła fal. Tak więc dla częstości poniżej mc ~ izcja fale nie przemieszczają się wzdłuż falowodu; oscylujące pola przenikają w głąb falowodu tylko na odległość rzędu 1/k'. Z tego powodu częstość coc nazywamy „częstością graniczną” falowodu. Przyglądając się równaniu (24.22) od coc, liczba falowa k' jest mała i pola mogą przenikać w głąb falowodu na duże odległości. Ale gdy a> jest znacznie mniejsze od coc, współczynnik k' w wykładniku jest równy ~/a i pole znika bardzo gwałtownie, tak jak pokazano to na rys. 24.7. Na odległości a/n, czyli równej mniej więcej | szerokości falowodu, pole maleje w stosunku 1 /e. Pola przenikają wtedy na bardzo małe odległości od źródła. Chcemy podkreślić interesujący wynik w naszym opisie fal prowadzonych — poja- wienie się urojonej liczby falowej kz. Zwykle gdy rozwiązujemy równanie fizyki i otrzy- mujemy liczbę urojoną, rozwiązanie to nie ma sensu fizycznego. Jednakże dla fal urojona liczba falowa ma pewne określone znaczenie. Równanie falowe pozostaje w dalszym ciągu spełnione; oznacza to jedynie, że jako rozwiązanie otrzymujemy wykładniczo ma- lejące pola zamiast przemieszczających się fal. Tak więc, jeżeli w jakimś problemie fa- lowym liczba k staje się dla pewnej częstości urojona, oznacza to, że postać fali ulega zmianie — fala sinusoidalna zmienia się w falę wykładniczą. 24-4. Prędkość fal prowadzonych Prędkość fali, która występowała w powyższych rozważaniach, jest prędkością fazową, będącą szybkością przemieszczania się węzłów fali; jest ona funkcją częstości. Możemy ji zapisać, posługując się równaniami (24.17) i (24.18), jako c faZ /l—(coc/co)2 (24.25) Dla częstości większych od częstości granicznej, dla których istnieją przemieszczające się fale, jest mniejsze od jedności i prędkość fazowa jest rzeczywista i większa niż prędkość światła. Już w rozdz. 48 tomu I (cz. 2) przekonaliśmy się, że są możliwe prędkości fazo*'e większe od prędkości światła, ponieważ to tylko węzły fal poruszają się z takimi pręd- kościami, a nie energia czy też informacja. Aby dowiedzieć się, jak szybko będą przebiegać
24-4. PRĘDKOŚĆ FAL PROWADZONYCH 69 sygnały, musimy obliczyć prędkość impulsów lub modulacji powstałych w wyniku in- terferencji fali o pewnej częstości z jedną lub z kilkoma falami o częstościach nieco od niej różnych (patrz rozdz. 48 tomu I, cz. 2). Prędkość obwiedni takiej grupy fal nazwaliśmy prędkością grupową; nie jest ona równa co/k tylko dw!dk: da> ”gruP = (24.26) Różniczkując równanie (24.17) względem co i przekształcając wynik, aby otrzymać dwjdk, znajdujemy, że __________ pgrUp = cł/l-(co»2, (24.27) a więc jest mniejsza od prędkości światła. Średnia geometryczna rfaz i fgrup jest równa właśnie c, prędkości światła: Wgrup = C2. * (24.28) To ciekawe — z podobnym związkiem spotkaliśmy się w mechanice kwantowej. Dla cząstki o dowolnej prędkości — nawet relatywistycznej — pęd p i energia U są związane zależ- nością : U2 = p2c2+m2c*. (24.29) Ale w mechanice kwantowej energia jest równa Tioy a pęd K/%, co z kolei równe jest Kk; tak więc równanie (24.29) można zapisać w postaci czyli k = V(a)2/c2)—(m2c2/K2), (24.31) która to postać bardzo przypomina postać równania (24.17)... Interesujące! Prędkość grupowa fal jest także prędkością, z jaką przesyłana jest energia wzdłuż falowodu. Chcąc znaleźć przepływ energii wzdłuż falowodu, należy pomnożyć gęstość energii przez prędkość grupową. Jeżeli pierwiastek ze średniej kwadratu pola elektrycznego wynosi Eo, to średnia gęstość energii elektrycznej wynosi e0E^/2. Istnieje też pewna energia związana z polem magnetycznym. Nie będziemy tego tutaj dowodzić, ale w każdej wnęce czy też w falowodzie energia elektryczna i magnetyczna są sobie równe, tak że cał- kowita gęstość energii elektromagnetycznej wynosi e0E^. Moc dUjdt przesyłana przez falowód jest więc równa — = e0E2abv^. (24.32) (Później poznamy inny, ogólniejszy sposób obliczania przepływu energii.) ^4-5. Obserwacja fal prowadzonych Energię można wprowadzać do falowodu za pomocą jakiejś „anteny”. Może to być na Przykład mały pionowy drut lub „dipol”. Obecność fal prowadzonych można obser-
70 24. FALOWODY Falowód z dipolem zasilającym i sondą zbiorczą wować pobierając pewną część energii elektromagnetycznej za pomocą małej „anteny” odbiorczej, którą także może być mały kawałek drutu lub mała pętla. Rysunek 24.8 przed- stawia falowód, w którego ściankach wycięto otwory, aby pokazać zasilający dipol i „son- dę”. Zasilający dipol można połączyć z generatorem sygnałów kablem koncentrycznym, a sondę można połączyć podobnym kablem z detektorem. Zwykle wygodnie jest wpro- wadzać sondę przez długą, wąską szczelinę w falowodzie, tak jak to pokazano na rys. 24.8. Następnie przesuwając sondę wzdłuż falowodu tam i z powrotem można badać pola w różnych punktach. Jeżeli częstość generatora sygnałów nastawić tak, aby była ona większa od częstości granicznej a>c, to pojawią się fale przemieszczające się od dipola zasilającego w głąb fa- lowodu. Są to jedyne fale, jakie mogą się pojawić w wypadku, gdy falowód jest nieskoń- czenie długi, co można efektywnie osiągnąć przez zakończenie falowodu odpowiednio dobraną ścianką pochłaniającą, tak aby na końcu nie było odbić. Wówczas ponieważ detektor mierzy średnią czasową z pól w pobliżu sond, sonda pobierze sygnał, który jest niezależny od odległości od początku falowodu; wskazania na wyjściu będą proporcjo- nalne do przesyłanej falowodem mocy. Jeżeli teraz koniec falowodu zamkniemy w taki sposób, że spowoduje to powstanie fali odbitej — jako skrajny przykład przyjmiemy, że zamykamy go płytką metalową — to oprócz istniejącej pierwotnie fali padającej pojawi się fala odbita. Te dwie fale będą interferować i wytworzą w falowodzie falę stojącą, podobną do fal stojących w strunie, które opisywaliśmy w rozdz. 49 tomu I (cz. 2). Wówczas przesuwając sondę wzdłuż falo- wodu zobaczymy, że wskazania detektora ulegają okresowym zmianom — detektor wykazuje maksimum pól w każdej strzałce, a minimum w każdym węźle fali stojącej. ' Odległość pomiędzy dwoma kolejnymi węzłami (lub strzałkami) równa jest po prostu 2g/2- Daje to dogodny sposób pomiaru długości fali w falowodzie. Jeżeli teraz częstość jest bliska a>c, to odległość pomiędzy węzłami zwiększa się, co odpowiada wzrostowi długości fali w falowodzie, zgodnie z równaniem (24.19). Przypuśćmy teraz, że częstość generatora sygnałów obieramy tak, aby była odrobin? mniejsza od coc. Wówczas w miarę jak będziemy przesuwać sondę w głąb falowodu, wyjściowa detektora będzie stopniowo maleć. Jeżeli częstość byłaby jeszcze mniejsza, tf natężenie pola gwałtownie by spadło, zgodnie z krzywą z rys. 24.7, wskazując na zanik propagacji fal.
24-6. MONTAŻ FALOWODÓW 71 j44». Montaż falowodów Z ważnym praktycznym zastosowaniem falowodów spotykamy się przy przesyłaniu energii o wielkiej częstości, gdy na przykład łączymy oscylator wielkich częstości lub wyjście wzmacniacza aparatury radarowej z anteną. W istocie sama antena zwykle składa się i parabolicznego reflektora zasilanego w swoim ognisku przez falowód, rozszerzony na końcu na kształt „tuby”, która wypromieniowuje fale przebiegające wzdłuż falowodu. Chociaż sygnały wielkiej częstości można przesyłać kablem koncentrycznym, to jednak jeżeli przesyła się dużą moc, lepszy jest falowód. Po pierwsze, maksymalna moc, jaką można przesłać linią przesyłową, jest ograniczona możliwością przebicia izolatora (ciała stałego czy też gazu) pomiędzy przewodnikami. Dla danej mocy natężenia pól w falowodzie są zwykle mniejsze od natężeń pól w kablu koncentrycznym, tak więc falo- wodem można przesyłać większą moc, zanim nastąpi przebicie. Po drugie, w kablu kon- centrycznym są zwykle większe straty mocy niż w falowodzie. W kablu koncentrycznym centralny przewód musi być otoczony jakimś materiałem izolacyjnym, a w takim izola- torze zachodzą straty energii — szczególnie przy wielkich częstościach. Poza tym gęstości prądu w centralnym przewodzie są stosunkowo duże, a ponieważ straty rosną z kwadra- tem gęstości prądu, to mniejsze prądy, które pojawiają się na ściankach falowodu, będą powodować mniejsze straty energii. Aby redukować straty do minimum, wewnętrzne ścianki falowodu pokrywa się często materiałem o dobrej przewodności właściwej, takim jak srebro. Zagadnienie łączenia „obwodu” za pomocą falowodów różni się zupełnie od zagad- nienia tego typu przy małych częstościach i zwykle się je nazywa „hydrauliką mikrofalową”. Zagadnieniu temu, od strony technicznej, poświęcono już wiele prac. Tak na przykład dwa człony falowodu zwykle łączy się razem za pomocą „kołnierzy”, co można zobaczyć na rys. 24.9. Takie połączenia mogą jednakże powodować poważne straty energii, ponieważ prądy powierzchniowe muszą przepływać przez złącze, które może mieć stosunkowo duży 24.9. Łączenie falowodów za pomocą kołnierzy 24.10. Połączenie o niskich stratach pomiędzy dwoma członami falowodu kołnierz falowód /i wnęka rezonansowa falowód
72 24. FALOWODY 24.11. Falowód „T”. Na kołnierze są nało- żone plastykowe kapturki, mające na celu utrzymanie wnętrza falowodu „T” w czystości, w czasie gdy me jest on używany 24.12. Pola elektryczne w falowodzie „T” dla dwóch możliwych orientacji pól opór. Jednym ze sposobów zabezpieczenia się przed takimi stratami jest robienie koł- nierzy, jak to pokazano w przekroju na rys. 24.10. Pomiędzy sąsiednimi członami falo- wodu pozostawia się mały odstęp, a na ze- wnętrznej ściance kołnierza wycina się rowek, tak aby powstała mała wnęka, podobna do wnęki z rys. 23.16c. Rozmiary rowka tak się dobiera, aby powstała wnęka była dla prze- syłanej częstości wnęką rezonansową. Taka wnęka rezonansowa stanowi dla prądów du- żą „oporność pozorną” i poprzez metalowe złącza (w punkcie a na rys. 24.10) przepływa stosunkowo mały prąd. Duże prądy płynące przez falowód będą po prostu ładowały i roz- ładowywały „pojemność” przerwy pomiędzy członami falowodu (punkt b na rysunku), gdzie rozproszenie energii jest małe. Przypuśćmy, że chcemy tak zakończyć fa- lowód, aby nie powstawały fale odbite. Mu- simy więc dołączyć do końca falowodu coś, co imituje nieskończoną długość falowodu. Potrzebna nam jest „końcówka”, która dla falowodu spełnia podobną rolę jak pozorna oporność charakterystyczna dla linii przesy- łowej — coś, co pochłania fale przychodzące, nie wywołując odbić. Wówczas falowód bę- dzie tak działał, jakby się ciągnął bez końca. Takie końcówki realizujemy umieszczając we- wnątrz falowodu kliny z materiału o od- powiednio dobranym oporze, aby pochłaniał energię fali, a nie wytwarzał prawie wcale fal odbitych. Jeżeli chcemy połączyć razem trzy ele- menty — na przykład jedno źródło z dwiema różnymi antenami — wówczas możemy p0' służyć się falowodem w kształcie litery „T , jaki widzimy na rys. 24.11. Energia dostar- czana środkowym kanałem rozdziela się dwie części i wychodzi dwoma ramionanU (mogą przy tym powstać także fale odbite)- Rysunek 24.12 daje „jakościowy” obraz pó’ w falowodzie „T”; dochodząc do konc3
73 24-6. MONTAŻ FALOWODÓW ^nalu wejściowego pola rozprzestrzeniają się i wytwarzają pola elektryczne, które z kolei powodują powstanie fal rozchodzących się w obu ramionach. W zależności od tego, czy pola w kanale wejściowym są równoległe, czy też prostopadłe do ramion falowodu ,,T”, pola w rozgałęzieniu będą wyglądać z grubsza tak, jak na części a) lub części b) rys. 24.12. Na zakończenie chcielibyśmy opisać urzą- dzenie nazywane „łącznikiem jednokierun- 24.13. Łącznik jednokierunkowy kowym”, które jest bardzo użyteczne do określenia sytuacji powstałej po połączeniu skom- plikowanego układu falowodów. Przypuśćmy, że chcemy wiedzieć, w jakim kierunku przebiegają fale w pewnym określonym członie falowodu — mogłoby nas na przykład interesować czy powstała tam (czy też nie) fala odbita o dużym natężeniu. Łącznik jedno- kierunkowy jest zdolny pobrać niewielką część energii w falowodzie, jeżeli fala przebiega w jednym kierunku, a nie pobiera żadnej energii, jeżeli fale przenoszą się w kierunku przeciwnym. Łącząc wyjście łącznika z detektorem możemy mierzyć „jednokierunkową” moc w falowodzie. Rysunek 24.13 przedstawia nam taki łącznik jednokierunkowy; dwa człony falo- wodu AB i CD przylutowano do siebie ściankami. Falowód CD jest wygięty tak, aby koł- nierze obu falowodów miały się gdzie podziać. Przed zlutowaniem w każdym z falowodów wierci się dwa lub więcej otworów (pasujących do siebie), tak że część pola w głównym falowodzie może zostać przesłana do pomocniczego falowodu CD. Każdy z tych otworów działa jak mała antena i wytwarza pole w falowodzie pomocniczym. Gdyby był tylko jeden otwór, fale byłyby przesyłane w obu kierunkach i byłyby takie same, niezależnie od kierunku rozprzestrzeniania się fali w głównym falowodzie. Ale jeżeli są dwa otwory, odległe od siebie o czwartą część długości fali w falowodzie, to będą one odgrywały rolę dwóch źródeł przesuniętych względem siebie w fazie o 90°. Przypomnijmy sobie jak w rozdz. 29 tomu I (cz. 2) rozważaliśmy interferencję fal z dwóch anten odległych od siebie o ź/4 i tak kolejno wzbudzanych, że były przesunięte w fazie o 90°. Przekonaliśmy się, że fale odejmują się w jednym kierunku, a dodają w kierunku przeciwnym. To samo będzie się działo tutaj. Fala wytworzona w falowodzie CD będzie posuwać się w tym samym kierunku co fala w falowodzie AB. Jeżeli fala w falowodzie głównym przebiega od A do B, na wyjściu D pomocniczego falowodu także pojawi się fala. Jeżeli fala w głównym falowodzie przechodzi od B do A, w falowodzie pomocniczym powstanie fala przebiegająca w kierunku końca C. Koniec *en jest wy posażony w przesłonę, która pochłania falę padającą i wówczas na wyjściu stznika nie pojawia się żadna fala. ^7. Typy drgań w falowodzie Fala, którą opisaliśmy, stanowi jedno z wielu możliwych rozwiązań równań pola. a*de takie rozwiązanie nazywamy „typem drgań” falowodu. Tak na przykład zależ-
74 24. FALOWODY 24.14. Inna możliwa zależność Ey od x ność naszego pola od zmiennej x była dana przez połowę cyklu fali sinusoidalnej. Istnieje równie dobre rozwiązanie, dla którego zależ- ność pola Ey od x jest dana przez pełny cyk] fali sinusoidalnej, tak jak pokazano to na rys. 24.14. Liczba falowa kx dla takiego typu drgań jest dwa razy większa, a więc i częstość graniczna jest znacznie większa. W rozważanej przez nas fali pole E miało tylko składową E ale istnieje wiele innych typów drgań, dla których pola elektryczne są o wiele bardziej skomplikowane. Jeżeli pole elektryczne ma tylko składowe w kierunkach x i y, tak że wy. padkowe pole elektryczne jest zawsze prosto- padłe do kierunku z, to taki typ drgań na- zywamy „elektrycznie poprzecznym” (trans- wersalnym) i oznaczamy go TE. Pole ma- gnetyczne dla takich typów drgań ma zawsze składową w kierunku osi z. Przeciwnie, gdy pole E ma zawsze składową z-ową (wzdłuż kierunku przemieszczania się fali), to pole magnetyczne ma wówczas tylko składowe poprzeczne. Takie pola nazywamy „magne- tycznie poprzecznymi” typami drgań (TM)*’. W falowodzie prostokątnym wszystkie inne typy drgań mają częstość graniczną większą niż prosty typ drgań TE, który opisa- liśmy. Można więc — i zwykle się tak robi — używać falowodu przy częstości nieco więk- szej od częstości granicznej dla najprostszego typu drgań, ale mniejszej od częstości granicz- nych dla wszystkich innych typów drgań, tak że przesyłany jest tylko ten jeden typ drgań. W przeciwnym wypadku sytuacja panująca w falowodzie mocno się komplikuje i wymyka się spod naszej kontroli. 24-8. Inny sposób patrzenia na fale prowadzone Chcemy teraz przedstawić inny sposób wytłumaczenia, dlaczego to falowód gwałtow- nie „tłumi” pola dla częstości mniejszych od częstości granicznej a>c. Pozwoli to nam mieć bardziej „fizyczny” pogląd na krańcowe zmiany zachowania się falowodu przy przejściu od częstości małych do dużych. Dla falowodu prostokątnego sposób ten sprowadza się do opisu pól za pomocą metod odbić lub obrazów względem ścian falowodu. Podejście to jednakże ma zastosowanie tylko do falowodów prostokątnych; dlatego też zaczęliśmy od opisu matematycznego, który w zasadzie ma zastosowanie do falowodów o dowolny10 kształcie. •i W języku polskim używa się najczęściej dla typu drgań TE określenia: „fala H” (ponieważ kieru®^ wektora pola magnetycznego pokrywa się z kierunkiem propagacji), a dla typu drgań TM — fala E. (PrZ^‘ thim.)
24-8. INNY SPOSÓB PATRZENIA NA FALE PROWADZONE 75 Dla opisanego przez nas typu drgań wymiary pionowe falowodu (y) nie odgrywały żadnej roli, tak że możemy odrzucić górną i dolną ściankę falowodu i wyobrazić sobie, 2e w kierunku pionowym falowód rozciąga się w nieskończoność. Wyobrażamy sobie więc, że falowód składa się tylko z dwóch pionowych płyt odległych od siebie o a. Załóżmy, że źródłem pól jest umieszczony w środku falowodu pionowy drucik, przez który przepływa prąd zmienny o częstości co. Gdyby nie było ścianek falowodu, drucik taki promieniowałby fale cylindryczne. Przyjmijmy, że ścianki falowodu są przewodnikami doskonałymi. Wówczas, tak jak w elektrostatyce, warunki na powierzchni ścianek będą spełnione, jeżeli do pola wytworzo- nego przez nasze źródło dodamy pole wytworzone przez jeden lub więcej odpowiednio skonstruowanych obrazów źródła. Metoda obrazów ma zastosowanie w elektrodynamice równie dobrze jak i w elektrostatyce, oczywiście pod warunkiem, że uwzględniamy opóź- nienia pól. Wiemy, że to prawda, bo przecież często widzieliśmy obraz źródła światła w zwierciadle, a zwierciadło jest dla fal elektromagnetycznych o częstościach optycznych takim właśnie „doskonałym” przewodnikiem. Na rysunku 24.15 pokazano przekrój poziomy falowodu, przy czym W\ i W2 są ścian- kami falowodu, a So jest drucikiem, stanowiącym źródło fal. Za kierunek dodatni obie- ramy kierunek przepływu prądu w druciku. Gdyby teraz była tylko jedna ściana, np. Wi, moglibyśmy ją usunąć, jeśli byśmy obraz źródła (o przeciwnym znaku) umieścili w punkcie oznaczonym Si. Ale w obecności obu ścianek powstanie także obraz So względem ścian- ki W2, który na rysunku oznaczono S2. To źródło z kolei będzie także miało obraz wzglę- dem W,, oznaczony przez S3. Następnie zarówno Si, jak i S3 będą miały obrazy wzglę- dem W2 w punktach oznaczonych i S6 i tak dalej. Pola pomiędzy naszymi dwiema prze- wodzącymi płaszczyznami będą takie same jak pola wytworzone przez nieskończony ciąg źródeł umieszczonych w odległości a je- dno od drugiego. (Jest to w istocie dokładnie to samo, co zobaczyliśmy patrząc na dru- cik umieszczony w połowie odległości po- między dwoma równoległymi zwierciadła- mi.) Aby pola znikały na ściankach, znaki prądów w obrazach muszą zmieniać się przy Przejściu od jednego obrazu do następnego. Innymi słowy, prądy te oscylują przesunięte w fazie o 180°. Pole w falowodzie jest zatem P° prostu superpozycją pól pochodzących takiego nieskończonego zbioru źródeł liniowych. Wiemy, że pole w pobliżu źródła jest ardzo podobne do pól statycznych. W § 7-5 • H> cz. 1) rozważaliśmy pole statyczne po- °uzące od „siatki” źródeł liniowych i prze- 24.15. Źródło liniowe So pomiędzy dwoma przewodzącymi płaszczyznami i W2. Płaszczyzny te można zastąpić nieskończo- nym ciągiem obrazów źródeł. S5«- Si •- -W, źródło liniowe falowód W2 S2 S4 .+ obrazy źródeł
76 24. FALOWODY konaliśmy się, że jest ono podobne do pola naładowanej płytki, z wyjątkiem wyrazów, które maleją wykładniczo ze wzrostem odległości od siatki. W naszym przypadku średnie natężenie źródła jest równe zeru, ponieważ każde dwa sąsiadujące z sobą źródła mają znaki przeciwne. Wszystkie istniejące pola powinny więc maleć wykładniczo z odległością. W pobliżu źródła mamy pole pochodzące głównie od tego najbliższego źródła; na więk- szych odległościach przyczynki do pola pochodzą od wielu źródeł i ich średnia jest równa zeru. Widzimy więc teraz, dlaczego falowód poniżej częstości granicznej daje pole male- jące wykładniczo. Przybliżenie statystyczne jest, szczególnie dla małych częstości, zado- walające i wynika z niego gwałtowne malenie pól z odległością. Musimy teraz rozwiązać odwrotny problem: Dlaczego fale są w ogóle przenoszone? To dopiero zagadka! Okazuje się, że przy wielkich częstościach opóźnienia pól mogą spowodować dodatkowe zmiany w fazie, co powoduje, że pola pochodzące od przesu- niętych w fazie źródeł dodają się, zamiast wzajemnie się unicestwiać. Istotnie, w rozdz. 29 tomu I (cz. 2) rozważaliśmy już analogiczne zagadnienie pól wytworzonych przez zespół anten lub przez siatkę dyfrakcyjną. Przekonaliśmy się wówczas, że kilka odpowiednio ustawionych anten radiowych może dać obraz interferencyjny o silnym sygnale w jednym kierunku, a bez żadnych sygnałów w innych kierunkach. Powróćmy do rys. 24.15 i przyjrzyjmy się polom, jakie pojawiają się w dużej odle- głości od układu obrazów źródeł. Natężenia tych pól są duże tylko w pewnych kierun- kach, które zależą od częstości — tylko w tych mianowicie kierunkach, dla których pola od wszystkich źródeł dodają się zgodnie w fazie. W odpowiednio dużej odległości od źró- deł pole przemieszcza się w tych specjalnych kierunkach w postaci fal płaskich. Na ry- sunku 24.16 pokazano taką falę, przy czym linie ciągłe odpowiadają grzebietom, a linie przerywane — dolinom fali. Fala będzie się rozchodzić w takim kierunku, dla którego różnica w opóźnieniu dwóch sąsiednich źródeł względem grzebietu fali będzić odpowiadała połowie okresu drgania. Innymi słowy, różnica pomiędzy r2 a r0 na rysunku równa jest połowie długości fali w próżni: r2-r0 = —• Kąt 9 jest więc dany przez j sin0 = —. (24.33) 2a Istnieje oczywiście drugi ciąg fal, których kierunek tworzy z linią źródeł kąt (90°—$) Całkowite pole w falowodzie (nie za blisko źródła) jest superpozycją tych dwóch ciągów fal, tak jak to pokazano na rys. 24.17. Oczywiście, pola takie istnieją w rzeczywistości tylko pomiędzy ściankami falowodu. W punktach takich jak A i C spotykają się grzbiety obu ciągów fal i wartość pola przyj' muje maksimum; natomiast w punktach takich jak B fale mają swoje „szczytowe” wartości ujemne i pole osiąga minimalną (największą ujemną) swoją wartość. W miarę upływu czasu pole w falowodzie przebiega wzdłuż falowodu jako fala o długości która jest
24-8- 1NNY SPOSOB PATRZENIA NA FALE PROWADZONE 77 równa odległości od A do C. Odległość ta jest związana z 6 wzorem 2 COS 6 = —. (24.34) Korzystając z równania (24.33) na B otrzy- mujemy źo 2 = — = -=. g cos 6 )/l-(2o/2a)2 (24.35) Wynik jest identyczny z tym, jaki otrzyma- liśmy z równania (24.19). Widzimy teraz, dlaczego przemieszczanie się fal zachodzi tylko powyżej granicznej częstości o0. Jeżeli długość fali w próżni jest większa od la, nie istnieje kąt, pod którym rozchodzą się fale na rys. 24.16. Interferencja niezbędna do wytworzenia się fal pojaw;a się raptownie, gdy 20 spada poniżej 2a lub gdy m staje się większe od w0 = ~c]a. Jeżeli częstość jest dostatecznie wielka, to mogą istnieć dwa (lub więcej) możliwe kierunki, w których fale mogą się rozcho- dzić. Dla naszego przypadku zachodzi to dla ż0 < ja. Jednakże w ogólności może to tak- że zajść, gdy ź0 < a. Te dodatkowe fale od- powiadają typom drgań w falowodzie o wię- kszej częstości, o których już wspomnieli- śmy (§ 24-7). Z naszego opisu wynika również jasno, dlaczego prędkość fazowa fal prowadzonych jest większa od c i dlaczego zależy ona od co. zmianą co zmienia się kąt pomiędzy kie- ^nkiem fal swobodnych, a linią źródeł na ^s. 24.16 i dlatego też się zmienia prędkość rozchodzenia się fal wzdłuż falowodu. Chociaż opisywaliśmy falę prowadzoną J^ko superpozycję pól pochodzących od nie- mczonego układu źródeł liniowych, moż- na się przekonać, że doszlibyśmy do tych sa- 24.16. Jeden zbiór fal spójnych, pochodzą- cych od ciągu źródeł liniowych 24.17. Pole w falowodzie można rozpatry- wać jako superpozycję dwóch ciągów fal płaskich
li 24. FALOWODY mych wyników rozważając dwa ciągi fal rozchodzących się w próżni i ulegających ko- lejnym wielokrotnym odbiciom pomiędzy dwoma doskonałymi zwierciadłami — pa- miętając, że odbiciu towarzyszy zmiana fazy o 180°. Te dwa ciągi fal odbitych będą się wzajemnie wygaszać, z wyjątkiem przypadku, gdy będą się one rozchodzić pod kątem 0, określonym równaniem (24.33). Każdą rzecz możemy więc rozpatrywać na wiele różnych sposobów.
f 25 elektrodynamika w zapisie relatywistycznym w tym rozdziale c = 1 25-1. Cztero wektory*’ Omówimy teraz zastosowanie postulatów szczególnej teorii względności w elektro- dynamice. Ponieważ omawialiśmy już szczególną teorię względności w rozdz. 15-17 tomu I (cz. 1), przypomnijmy teraz tylko w skrócie jej podstawowe pojęcia. Stwierdzono doświadczalnie, że prawa fizyki nie zmieniają się, jeśli się poruszamy ze stałą prędkością. Jeżeli znajdowalibyśmy się w pojeździe kosmicznym, poruszającym się ze stałą prędkością po linii prostej, to fakt ten moglibyśmy stwierdzić dopiero wyglądając „na zewnątrz” z naszego pojazdu albo przynajmniej przeprowadzając jakąś obserwację związaną z jego otoczeniem. Jeżeli więc zapisujemy jakieś prawdziwe prawo fizyki, musi ono być tak skonstruowane, aby zawierało w sobie tę istotną cechę zjawisk przyrody. Związek pomiędzy czasem i przestrzenią w dwóch układach współrzędnych, z których jeden, S', porusza się ruchem jednostajnym wzdłuż osi x z prędkością v względem drugiego układu, S, określa przekształcenie Lorentza: t—vx (25.1) x—vt , Z - Z. 4 /l-t>2 Prawa fizyki muszą mieć taką postać, która nie zmienia się po przekształceniu Lo- rentza. Jest to analogiczne do zasady, która nam mówi, że prawa fizyki nie zależą od orien- . 1 Porównaj: Toml.cz. 1, rozdz. 15 (Szczególna teoria względności), rozdz. 16 (Relatywistyczna energia rozdz. 17 (Czasoprzestrzeń).
80 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM tacji naszego układu współrzędnych. W rozdziale 11 tomu I (cz. 1) widzieliśmy, że mate- matyczny sposób wyrażenia niezmienniczości praw fizyki względem obrotów polegał na zapisaniu naszych równań w języku wektorów. Jeżeli mamy na przykład dwa wektory A = (Ax, Aj,, A-,~) oraz B = (Bx, By, Bz), to jak się przekonaliśmy, wyrażenie A-B = AxBx-j-Aj,Bj,-j-AzBz nie zmienia się przy przejściu do obróconego układu współrzędnych. Wiemy więc, że je- żeli po obu stronach jakiegoś równania mamy iloczyn skalarny, taki jak A-B, to równanie takie będzie miało dokładnie tę samą postać we wszystkich układach współrzędnych, otrzymanych w wyniku transformacji obrotu. Znaleźliśmy także operator (patrz rozdz. 2 tomu II, cz. 1) \ dx dy S z taki że po podziałaniu nim na funkcję skalarną otrzymamy trzy wielkości, które prze- kształcają się jak współrzędne wektora. Za pomocą tego operatora zdefiniowaliśmy gra- dient, a łącząc odpowiednio ów operator z innymi wektorami określiliśmy dywergencję i laplasjan. Wreszcie przekonaliśmy się, że dodając w odpowiedni sposób iloczyny po- wstałe z pomnożenia składowych jednego wektora przez odpowiednie składowe drugiego wektora, otrzymujemy trzy nowe wielkości, które się zachowują jak nowy wektor. Ope- rację tę nazwaliśmy iloczynem wektorowym dwóch wektorów. Posługując się iloczynem wektorowym i naszym operatorem V zdefiniowaliśmy następnie rotację wektora. Ponieważ będziemy się jeszcze powoływać na nasze wiadomości z analizy wektoro- wej, zamieszczamy w tab. 25.1 podstawowe operacje na wektorach w trójwymiarowej przestrzeni, którymi się poprzednio posługiwaliśmy. Sedno sprawy tkwi w tym, że musi być możliwe zapisanie równań fizyki tak, aby obie strony przy obrotach przekształcały się jednakowo. Jeżeli po jednej stronie równania mamy wektor, to druga strona również musi być wektorem, a obie strony będą się zmieniać w identyczny sposób przy obrocie Tabela 25.1. Ważne wielkości i operacje anali- zy wektorowej w trzech wymiarach definicja wektora iloczyn skalamy wektorowy operator różniczkowy gradient dywergencja laplasjan iloczyn wektorowy rotacja A = (Ax, Ay, AA AB V VA V-V = v2 AxB VxA naszego układu współrzędnych. Podo- bnie, jeżeli jedna strona równania jest skalarem, druga strona musi być też ska- larem, tak aby żadna ze stron nie zmie- niała się przy obrocie współrzędnych i tak dalej. W szczególnej teorii względności czas i przestrzeń są nierozerwalnie z sobą zwią- zane, musimy więc teraz dokonać ana- logicznych operacji w przestrzeni cztc- rowymiarowej. Chcemy, aby nasze r°w' nania nie tylko pozostawały takie saine przy obrotach, ale żeby były takie sa-
25-l. czterowektory 81 me w każdym układzie inercjalnym. Oznacza to, że nasze równania powinny być niezmiennicze względem przekształcenia Lorentza, określonego równaniami (25.1). Rozważania zawarte w tym rozdziale mają na celu pokazanie, jak to można zrobić. Za- njm jednak zaczniemy, zróbmy coś, co wielce ułatwi naszą pracę (i uprości nasz zapis). Obierzmy mianowicie tak nasze jednostki długości i czasu, aby prędkość światła c była równa 1. Będzie to równoznaczne z obraniem za jednostkę czasu takiego czasu, jaki zu~ iywa światło na przebycie jednego metra (około 3-10“9 s). Możemy nawet tę jednostkę czasu nazwać „jednym metrem”. Dzięki jej wprowadzeniu wszystkie nasze równania będą wyraźniej wykazywać symetrię czasoprzestrzenną. Z naszych równań relatywistycz- nych znikną także wszystkie współczynniki c. (Jeżeli sprawiłoby to komuś trudność, to może zawsze wstawić z powrotem c do każdego równania, zastępując każde t przez ct lub, w ogólnym przypadku, pakując wszędzie c, tak aby otrzymać poprawne wymiary wielkości występujących w równaniach.) Po tych przygotowaniach możemy rozpocząć. Nasze zadanie polega na zrealizowaniu w czterech wymiarach czasoprzestrzeni tego wszyst- kiego, co za pomocą wektorów uzyskaliśmy w trzech wymiarach. Jest to w rzeczywistości zabawa całkiem prosta; będziemy po prostu opierać się na analogiach. Jedyną prawdziwą trudnością będzie zapis (symbol wektora wykorzystaliśmy już dla trzech wymiarów) i pewna drobna zmiana dotycząca znaków. Najpierw, przez analogię do wektorów w trzech wymiarach, zdefiniujemy czterowektor jako obiekt scharakteryzowany przez cztery wielkości at, ax, ay i az, które przy przejściu do poruszającego się układu współrzędnych przekształcają się tak, jak t, x, y i z. Istnieje kilka różnych metod zapisu cztero wektorów; będziemy tu używali symbolu a^, przez który będziemy rozumieć zbiór czterech liczb (a„ ax, ay, aj); wskaźnik p może — innymi słowy — przyjmować cztery „wartości”: t, x, y, z. Niekiedy będzie też wygodnie ozna- czyć trzy przestrzenne składowe przez trój wektor i pisać: a^ = (at, a). Spotkaliśmy się już z jednym czterowektorem, który się składa z energii i pędu cząstki (rozdz. 17 tomu I, cz. 1). W naszym nowym zapisie ^ = (^P). (25.2) co oznacza, że czterowektor powstaje z energii E i z trzech składowych trójwektora P cząstki. Wygląda na to, że nasze zadanie jest rzeczywiście bardzo proste — dla każdego wek- tora reprezentującego wielkość fizyczną powinniśmy tylko znaleźć brakującą składową 1 już będziemy mieli czterowektor. Aby się jednak przekonać, że rzecz nie na*tym polega, rozpatrzmy wektor prędkości o składowych dx dy dz Vx = ~dt’ Vy== ~dt’ Vz = ~dt' Powstaje pytanie: Jaka jest odpowiednia składowa czasowa? Właściwą odpowiedź po- Wlnna nam dać nasza intuicja. Ponieważ czterowektory mają postać podobną do t, x, y’ z, moglibyśmy przypuszczać, że składową czasową jest dt . 6 ~ Wyklady z fiżyki
82 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM Tymczasem to jest błędne'. Występujący w każdym mianowniku czas t nie jest niezmien- niczy względem przekształcenia Lorentza. Wielkości w licznikach zachowują się jak przy- stało na składowe czterowektora, ale całą sprawę psują różniczki dt w mianowniku; różniczki te są różne w dwóch różnych układach i powodują asymetrię w zachowaniu się liczników i mianowników przy przekształceniu układu współrzędnych. Okazuje się jednak, że wypisane przez nas cztery składowe „prędkości” staną się składowymi czterowektora, jeżeli podzielimy je tylko przez 1 — v2. Możemy się prze- konać, że jest to prawda, biorąc pod uwagę czterowektor pędu = (£, P) = m0 mov V\-v2 9 1/1—r2 (25.3) i dzieląc go przez masę spoczynkową m0, która w przestrzeni czterowymiarowej jest ska- larem, a więc niezmiennikiem; otrzymujemy wówczas wielkość 1 v /l-t>2 ’ 1/1—u2 (25.4) mQ która w dalszym ciągu musi być czterowektorem. (Podzielenie przez skalar nie zmienia własności transformacyjnych.) Możemy więc zdefiniować „czterowektor prędkości” jako 1 v Uy~7r^9 l . (25.5) i - _ U y- . . _ U* , • 1/1—U2 1/1- V2 Ś J i Czterowektor prędkości jest wielkością użyteczną; możemy na przykład zapisać P» = (25.6) Jest to typowa postać, jaką powinno mieć równanie „poprawne” relatywistycznie. (Pra- wa strona jest tu iloczynem niezmiennika i czterowektora, a więc jest w dalszym ciągu czterowektorem.) 25-2. Iloczyn skalarny Możemy uznać za fakt wzięty z życia, że przy obrotach osi współrzędnych odległość punktu od początku układu się nie zmienia. Matematycznie oznacza to, że r2 = x2+ +y2+z2 jest niezmiennikiem. Innymi słowy, po obrocie r'2 = r2, czyli x'2+y'2+z'2 = x2+y2+z2. Wyłania się teraz pytanie: Czy istnieje podobna wielkość, która jest niezmiennicza wzglę* dem przekształcenia Lorentza? Owszem, istnieje. Z równania (25.1) widać, że * t'2—x'2 = t2—x2.
25-2. ILOCZYN SKALARNY 83 Wygląda to całkiem ładnie, tylko że wielkość ta zależy od konkretnego wyboru kierunku oSi x. Możemy to poprawić odejmując od obu stron równania y2 i z2. Wówczas każde przekształcenie Lorentza plus obrót pozostawiają tę wielkość niezmienioną. Tak więc wielkością analogiczną do r2 w trzech wymiarach w przestrzeni czterowymiarowej jest t2—x2—y2—z2. jest to niezmiennik tzw. „właściwej grupy Lorentza”, co w języku transformacji oznacza niezmienniczość względem ruchów ze stałą prędkością oraz obrotów. Ponieważ niezmienniczość ta jest kwestią czysto algebraiczną, zależną tylko od praw transformacji określonej równaniem (25.1) i od praw transformacji obrotów, będzie ona słuszna dla dowolnego czterowektora (z definicji bowiem wszystkie czterowektory transformują się tak samo). Tak więc dla dowolnego czterowektora a,; a'2—a2—a'2—az2 = a,2—a2—a2—a2. Wielkość tę nazwiemy „długością” czterowektora a^. (Są tacy, którzy zmieniają znaki wszystkich wyrazów i nazywają długością wyrażenie a2+a2+a2—a2; korzystając z li- teratury musimy więc mieć się na baczności.) Jeżeli teraz mamy dwa wektory a^ i b^, odpowiednie ich składowe transformują się tak samo i wyrażenie ®A axbx ayby azbz jest także wielkością niezmienniczą (skalarem). (Wykazaliśmy to zresztą już w rozdz. 17 tomu I, cz. 1.) Wyrażenie to jest oczywiście zupełnie podobne do iloczynu skalarnego wektorów. Będziemy je nawet nazywać iloczynem skalarnym dwóch czterowektorów. Zapis a^-bp wydawałby się zapisem logicznym — wówczas wyglądałoby to jak iloczyn ska- larny. Niestety, tak się jednak nie robi; zwykle używa się zapisu bez kropki. Pozostaniemy w zgodzie z tą umową i będziemy zapisywać iloczyn skalarny po prostu jako a^b^. Tak więc z definicji, aĄ, = alb-axbx-aypy-azbz. (25.7) Zawsze, gdy zobaczymy razem dwa identyczne wskaźniki (czasem zamiast /z będziemy używać v lub innych liter), będzie to oznaczać, że mamy wziąć cztery iloczyny i dodać je, pamiętając o ujemnych znakach iloczynów składowych przestrzennych. Korzystając z tej umowy, niezmienniczość iloczynu skalarnego względem przekształcenia Lorentza można zapisać jako a^b^ (ipbff Ponieważ trzy ostatnie wyrazy po prawej stronie wzoru (25.7) odpowiadają iloczy- nowi wektorowemu w przestrzeni trójwymiarowej, często wygodniej jest pisać a^b? = a^—a-b. Jest również oczywiste, że opisywana poprzednio czterowymiarowa długość może być ^Pisana jako a^: alza/i = a2—a2—ay—a2 = aj—a-a. , (25.8)
84 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM Czasem będzie też wygodnie zapisywać tę wielkość jako a*: Ą = a^. Podamy teraz przykład ilustrujący użyteczność iloczynów skalarnych czterowektorów. Antyprotony (?) powstają w dużych akceleratorach w wyniku reakcji P+P->P+P+P+P. Oznacza to, że proton o pewnej energii kinetycznej zderza się z protonem będącym w spo- czynku (np. z protonem znajdującym się w tarczy wodorowej na drodze wiązki) i jeżeli padający proton ma wystarczającą energię, wytworzona zostaje oprócz dwóch proto- nów pierwotnych para proton-antyproton*’. Pytanie brzmi: Jaką energię musi mieć padający proton, aby reakcja była energetycznie możliwa? Odpowiedź na pytanie znajdziemy najłatwiej rozpatrując reakcję w układzie środka masy (ŚM) (patrz rys. 25.1). Padający proton oznaczmy przez a, a jego czterowektor pędu przez Podobnie, proton-tarczę oznaczmy przez b, a jego czteropęd przez p*. Gdyby padający proton miał akurat tylko tyle energii, aby wywołać reakcję, to stan koń- cowy — sytuacja po zderzeniu — byłby „zlepkiem” trzech protonów i antyprotonu, spo- czywających w układzie ŚM. Jeżeli zaś energia padającego protonu byłaby nieznacznie większa, to cząstki znajdujące się w stanie końcowym miałyby pewną energię kinetyczną i każda z nich poruszałaby się niezależnie od pozostałych; jeżeliby natomiast energia padającego protonu była nieco mniejsza, to te cztery cząstki nie mogłyby w ogóle pow- stać. Jeżeli przez oznaczymy całkowity czteropęd zlepka cząstek w stanie końcowym, to z zasad zachowania energii i pędu wynika, że pa+p6 = Pc oraz E°+Eb = Ef. Oba te równanią można zastąpić jednym: #+/£=/£. ' ' (25.9) Jest rzeczą istotną, że otrzymaliśmy równanie dla czterowektorów, a więc jest ono prawdziwe w każdym inercjalnym układzie odniesienia. Możemy z tego skorzystać, aby *’ Można by się zapytać: dlaczego nie bierzemy pod uwagę reakcji P+P-*P+P+P lub nawet reakcji P+P—P+P, które oczywiście wymagają mniej energii. Odpowiedź na to pytanie daje zasada nazywana zasadą zacho- wania barionów, która mówi, że różnica pomiędzy „liczbą protonów i liczbą antyprotonów” nie może się zmienić. Różnica ta jest równa 2 po lewej stronie naszej reakcji. Dlatego też, jeżeli chcemy otrzymać po prawej stronie antyproton, musimy otrzymać także trzy protony (lub inne bariony).
25-2. ILOCZYN SKALARNY ' - 85 25.1. Reakcja P+P -» 3P+P, rozpatrywana w układzie ŚM i w układzie laboratoryjnym. Zakłada się, że padający proton ma akurat na tyle energii, aby zapoczątkować reakcję. Pełne kółka oznaczają protony, puste kółka — antyprotony uprościć nasze rachunki. Zaczniemy od obliczenia „długości” wyrażeń znajdujących się po obu stronach równania (25.9); „długości” te są oczywiście także sobie równe. Otrzy- mujemy (25.10) Ponieważ iloczyn jest niezmiennikiem, możemy obliczyć jego wartość w dowolnym układzie współrzędnych. W układzie środka masy składowa czasowa p^ jest równa ener- gii spoczynkowej czterech protonów, mianowicie 4Af, a część przestrzenna, p, jest równa zeru; tak więc p^ — (4Af, 0). Skorzystaliśmy tu z faktu, że masy spoczynkowe protonu i antyprotonu są sobie równe i oznaczyliśmy ich wspólną masę przez M. Tak więc równanie (25.10) przybiera postać = 16M2. (25.11) Obliczenie p^p^ i p^p^ jest bardzo łatwe, ponieważ „długość” czterowektorowa pędu każdej cząstki jest równa po prostu kwadratowi masy cząstki: p^p,, = E2— p2 = M2. Można to wykazać bezpośrednim rachunkiem, ale możemy to zrobić dużo zgrabniej ZauWażając, że dla cząstki znajdującej się w spoczynku p^ = (M, 0), a więc p^p^ = M2. Ale ponieważ p^p^ jest niezmiennikiem, musi ono być równe Af2 w kaidym układzie ^niesienia. Podstawiając te wyniki do równania (25.11) mamy 2^; -w A fi - W. (25.12)
86 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM Teraz możemy obliczyć także w układzie laboratoryjnym. Czterowektor można zapisać jako (Ea, p“), podczas gdy p£ = (M, 0), ponieważ odpowiada ono wekto- rowi w spoczynku. Tak więc p“p* musi być równe ME°; a ponieważ wiemy, że iloczyn skalarny jest niezmiennikiem, wartość liczbowa MEa musi być taka sama, jaką znaleźliśmy we wzorze (25.12). Otrzymujemy więc Ea = IM, co stanowi szukany przez nas wynik. Całkowita energia padającego protonu musi być równa przynajmniej IM (około 6,6 GeV, ponieważ M = 938 MeV), czyli po odjęciu energii spoczynkowej kinetyczna energia protonu-pocisku musi być przynajmniej równa 6M (około 5,6 GeV). Akcelerator Bevatron w Berkeley został tak zaprojektowany, aby energia kinetyczna przyspieszanych protonów wynosiła 6,2 GeV, co umożliwia produkcję antyprotonów. Ponieważ iloczyny skalarne są niezmiennikami, interesują nas zawsze ich wartości liczbowe. Jakaż będzie „długość” czterowektora prędkości u^uj. A więc u? jest aterowektorem jednostkowym. 25-3. Gradient czterowymiarowy Następną wielkością, którą musimy rozważyć, jest czterowymiarowy odpowiednik gradientu. Przypominamy sobie (rozdz. 14 tomu I, cz. 1), że trzy operatory różniczkowe dfdx, d/dy, d/dz transformują się jak wektor i nazywamy je gradientem. Posługując się analogią, moglibyśmy przypuszczać, że czterowymiarowy gradient, powinien mieć po- stać (d/dt, d/8x, 8/dy, 8/8z). Ale to nieprawda! Aby zobaczyć, gdzie tkwi błąd, rozważmy funkcję skalarną <p, która zależy tylko od zmiennych x i t. Jeżeli dokonamy małej zmiany At współrzędnej t, zachowując przy tym stałą wartość zmiennej x, zmiana <p wyniesie A<p = -^At. (25.13) Z drugiej strony, dla poruszającego się obserwatora dm Sm , Am =------Ax'-j-----At'. y Sx dt’ Korzystając z równania (25.1) możemy wyrazić Ax i At' przy pomocy At. Pamiętając, że zmienną x ustaliliśmy, a więc że Ax = 0, piszemy v At Ax' = - ---------Ac, At' = FI-v2 Vl-v2
2S-3. gradient czterowymiarowy 87 stąd porównując ten wynik z równaniem (25.13) przekonujemy się, że dtp 1 / dtp dtp \ dt ^l—v2 \ćh' dx') Podobnie otrzymujemy dtp 1 / dtp d<p\ —• = I —:—V —r I. dx y'l—v2 \bx di ) Możemy teraz zobaczyć, że z nowym gradientem jest coś nie w porządku. Wzorami określającymi x i t przez x' i t' [otrzymanymi z równania (25.1)] są: t' + vx' x' + vt' t = ------- , X = —=-. — v2 VI — v2 W taki właśnie sposób musi się przekształcać czterowektor. Ale w takim razie oba znaki w nawiasach równań (25.14) i (25.15) są złe! Tak więc prawidłowym czterowymiarowym operatorem gradientu nie jest (d/dt, V), lecz operator, który oznaczymy i zdefiniujemy jako Id \ Id d d d\ V =1 —, —VI = I—.-------.----,-----1. A \ dt f \ Qt dx dy dz J (25.16) Przy takiej definicji znikają pojawiające się powyżej niezgodności znaków i tak się zachowuje, jak przystało na czterowektor. (Te ujemne znaki są dość kłopotliwe, ale nic na to nie poradzimy.) Oczywiście, jeżeli mówimy, że V,, „zachowuje się jak czterowektor”, oznacza to po prostu, że czterogradient skalara jest czterowektorem. Jeżeli tp jest rzeczy- wiście niezmienniczym polem skalarnym (lorentzowsko niezmienniczym), to V/p jest polem czterowektorowym. W porządku. Jeśli mamy już wektory, gradient i iloczyn skalarny, to następną wiel- kością, której musimy poszukać, jest niezmiennik analogiczny do dywergencji w trój- wymiarowej analizie wektorowej. Widać jasno, że takim odpowiednikiem dywergencji jest wyrażenie ^b^, gdzie jest polem czterowektorowym, którego składowe są funkcja- mi przestrzeni i czasu. Definiujemy dywergencję czterowektora b^ = (ó,,b) jako iloczyn skalarny V„ i d I b \ I d \ I d \ d b - - — bx- - — k- - — k = —ó,+v-b, (25.17) dt \ dx ] \ dy/ \ dz/ dt gdzie V-b jest zwykłą, trójwymiarową dywergencją wektora b. Zaznaczmy, że i tu trzeba Uważać na znaki. Część znaków ujemnych wzięła się tu z definicji iloczynu skalarnego Równanie (25.7)]; obecność pozostałych wynika z tego, że składowymi przestrzennymi
88 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM są — d/dx, itd. [równanie (25.16)]. Dywergencja określona równaniem (25.17) jest niezmiennikiem i jej wartość jest taka sama we wszystkich układach współrzędnych, po- wiązanych z sobą przekształceniem Lorentza. Rozpatrzmy teraz zagadnienie fizyczne, w którym pojawia się czterodywergencja. Użyjemy jej mianowicie, aby znaleźć pole elektromagnetyczne wokół poruszającego się drutu. Wiemy już (t. II, cz. 1, § 13-7), że gęstość ładunku elektrycznego o i gęstość prądu j tworzą czterowektor = (o, i). Jeżeli przez nienaładowany drut przepływa prąd jx, to w układzie odniesienia poruszającym się wzdłuż osi x z prędkością v ten sam drut będzie miał gęstość ładunku i gęstość prądu [określone przekształceniem Lorentza, równanie (25.1)] odpowiednio równe , _ _ Jx Q /---------- ’ x /--------7 * yi-v2 yi-v2 si । < Są to dokładnie takie same wzory, do jakich doszliśmy w rozdz. 13 (t. II, cz. 1). Pod- stawiając te wielkości do równań Maxwella dla poruszającego się układu współrzędnych możemy określić szukane pole elektromagnetyczne. Zasada zachowania ładunku (t. II, cz. 1, § 13-2) również przybiera prostą postać w zapisie czterowektorowym. Rozważmy czterodywergencję : V^ = -^-+V-j. (25.18) Zasada zachowania ładunku mówi, że wypływ prądu na jednostkę objętości musi być równy szybkości wzrostu gęstości ładunku, wziętej ze znakiem ujemnym. Innymi słowy: Jeśli podstawimy tę zależność do równania (25.18), zasada zachowaniaładunku przy- bierze następującą postać: Vm7; = 0. ' (25.19) Ponieważ wielkość jest niezmiennikiem (skalarem), to skoro jest ona równa zeru w jednym układzie odniesienia, musi być także równa zeru we wszystkich układach od- niesienia. Wynika stąd, że jeżeli ładunek jest zachowany w jednym układzie współrzęd- nych, to jest również zachowany we wszystkich układach współrzędnych poruszających się ze stałą prędkością względem pierwszego układu. Jako ostatni przykład rozważmy iloczyn skalarny operatora gradientu z samym sobą- W przestrzeni trójwymiarowej taki iloczyn daje operator Laplace’a *1 ‘ - Sx2 8y2 dz2' Co otrzymamy watmeh wymiarach? Możemy się o tym łatwo przekonać. Korzystając
Tabela 25.2 Ważne wielkości analizy wektorowej w trzech i w czterech wymiarach Trzy wymiary • Cztery wymiary wektor A = (Ax, Ayi Az) a„ = (at, ax, ay, az) = (a,, a) iloczyn skalarny A’B — AxBx-}~ AyBy-\-AzBz = cif bf—£ixbx—dyby—azbz — £Zzbz—a*b Id d d \ Z d d d d \ 1 d \ operator wektorowy \ dx ’ dy ’ dz 1 > \ dt ’ dx ’ dy’ dz / \ dt ’ / / dtp dtp dip \ I dtp dtp dtp d<p\ Z dtp \ gradient \ dx dy dz / \ dt ’ dx ’ dy ’ dz) \ dt ’V<?) dAx dAy dAz da, dax dav daz da. dywergencja v-A = —^ + —^ + — v a =—!- + —± + -^ + —Ł = _A+v.a dx dy dz • * dt dx dy dz dt d2 d2 d2 d2 d2 d2 d2 d2 2 2 laplasjan i dalambercjan V V ~d^+d^+d? Qt2 dX2 dy* dzl dfl V 1=1
90 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM z naszych definicji gradientu i iloczynu skalarnego otrzymujemy d d I 8\( 8\ I 8\i 8\ / 8\( 8\ _ 52 dt dt \ dx 1 \ dx I \ Syl\ dy/ \ dz / \ dz / dt2 Ten operator, będący odpowiednikiem trójwymiarowego operatora Laplace’a, nazy- wamy operatorem d’Alemberta (dalambercjanem)-, bywa on oznaczany w specjalny sposób*’; d2 □2 = v,v--v2. (25.20) Z definicji tej wynika, że jest to niezmienniczy operator skalarny; jego działanie na pole cztero wektorowe generuje nowe pole czterowektorowe. [Uwaga: niekiedy można się spotkać z inną definicją operatora d’Alemberta, w której znak jest przeciwny do znaku w równaniu (25.20).] Znaleźliśmy więc czterowektorowe odpowiedniki większości wielkości trójwymia- rowych, które zamieściliśmy w tab. 25.1. (Nie mamy jeszcze odpowiedników iloczynu wektorowego i operatora rotacji; znajdziemy je dopiero w następnym rozdziale.) Wy- daje się, że będzie je łatwiej zapamiętać, jeżeli zbierzemy wszystkie ważne definicje i wy- niki w jednym miejscu i dlatego zamieszczamy takie podsumowanie w tab. 25.2. 25-4. Elektrodynamika w zapisie czterowymiarowym Z operatorem d’Alemberta spotkaliśmy się już, nie wiedząc jeszcze, że tak się on właś- nie nazywa, w § 18-6 (t. II, cz. 1); znalezione tam przez nas równania różniczkowe na po- tencjały możemy zapisać w nowych oznaczeniach jako □29’ = —, D2a = —. (25.21) £0 £o Po prawej stronie równań (25.21) występują cztery wielkości: qx, jx, jy, jz — wszystkie podzielone przez stałą uniwersalną e0> która jest taka sama we wszystkich układach współ- rzędnych, pod warunkiem, że we wszystkich tych układach używa się tej samej jednostki ładunku. Tak więc cztery wielkości o/e0, jx/c0> jylEo, Jzl£o również transformują się jak czterowektor. Możemy je zapisać jako jjeo. Operator d’Alemberta nie zmienia się przy zmianie układu współrzędnych, a więc wielkości <p, Ax, Ay, Az muszą się także transfor- mować jak czterowektor, co oznacza, że są one składowymi czterowektora. Jednym sło- wem = (9?, A) jest czterowektorem. Potencjał skalarny i potencjał wektorowy stanowią w rzeczywistości dwa różne aspekty tej samej wielkości fizycznej — są współzależne — i jeżeli wy stępują *’ W polskiej literaturze naukowej operator cfAlemberta oznacza się zwykle symbolem □ (bez kwa- dratu). (Przyp. tłum.) _
elektrodynamika w zapisie czterowymiarowym 91 e razem jako całość, to relatywistyczna niezmienniczość świata fizycznego staje się oczywista. Wielkość A^ nazywamy czteropotencjałem. zapisie czterowektorowym równania (25.21) przybierają prostą postać: □ = —. (25.22) < eo Sens fizyczny tego równania jest dokładnie taki sam jak sens fizyczny równań Maxwella. Ale możność zapisania ich w eleganckiej postaci sprawia zawsze pewną przyjemność. Ta ładna postać ma też głębsze znaczenie; wskazuje ona bezpośrednio na niezmienni- czość elektrodynamiki względem przekształcenia Lorentza. Pamiętamy, że aby wyprowadzić równania (25.21) z równań Maxwella musieliśmy skorzystać z warunku cechowania: dtp +V-A = 0, (25.23) ot czyli po prostu z V ^A^ = 0; warunek cechowania mówi nam, że dywergencja cztero wek- tora A^ jest równa zeru. Warunek ten nazywamy warunkiem Lorentza. Dużą zaletą tego warunku jest niezmienniczość, dzięki czemu równania Maxwella mają postać (25.22) we wszystkich układach odniesienia. 25-5. Czteropotencjał poruszającego się ładunku*1 Wypiszemy teraz prawa transformacji określające wielkości 99 i A w poruszającym się układzie poprzez <p i A w układzie spoczywającym (właściwie te prawa są pośrednio zawarte w naszych poprzednich rozważaniach). Ponieważ = (99, A) jest czterowekto- rem, równania, które otrzymamy, muszą być zupełnie podobne do równań (25.1), z tą różnicą, że t będzie zastąpione przez <p a x przez A. Tak więc: <p—vAx Ax—v<p X 1/1-u2 ’ Ay = Ay, A = Az. (25.2$ W samej postaci tych równań tkwi założenie, że primowany układ współrzędnych po- rusza się wzdłuż osi x, w kierunku dodatnim, a jego prędkość mierzona w układzie nie- Primowanym wynosi v. Rozważmy przykład ilustrujący użyteczność pojęcia czteropotencjału. Jaki jest po- tencjał skalarny i wektorowy ładunku q poruszającego się z prędkością v wzdłuż osi xl »> Porównaj: Tom II, cz. 1, rozdz. 13 (Magnetostatyka).
92 •' 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNY^ 25.2. Układ odniesienia S' porusza się z prędko- ścią v względem S. Ładunek spoczywający w po- czątku układu S' ma w układzie S współrzędną x — vt. Potencjały w punkcie P można obliczać w którymkolwiek z tych dwóch układów Problem ten jest łatwy do rozwiązania w układzie współrzędnych poruszającym się wraz z ładunkiem, ponieważ w tym układzie ładunek pozostaje w spoczyn- ku. Powiedzmy, że ładunek znajduje się w początku układu S', tak jak to pokaza- no na rys. 25.2. Potencjał skalarny w po- ruszającym się układzie jest równy a <?' = -------r, (25.25) 4izeor gdzie r' jest odległością od ładunku q do punktu pola, mierzoną w układzie poru- szającym się. Potencjał wektorowy A' jest oczywiście równy zeru. Możemy teraz w prosty sposób okre- ślić <p i A, potencjały mierzone w spo- czywającym układzie współrzędnych. Związkami odwrotnymi do (25.24) są _ <p’ + ^x . _ A _ A' A _ A' <P --------— , AX — ---— , Ay Ay, A2 Az. ^l-u2 FI —v2 (25.26) Podstawiając <p' z równania (25.25) i A' = 0, otrzymujemy q 1 g 1 47te0 rVl-p2 47te0 ^l-p2 x'2+y'2+z'2 Wzór ten określa nam potencjał skalarny w układzie S, ale niestety — wyrażony przez współrzędne układu S'. Zależność od t, x, y, z otrzymamy podstawiając f, x', y', z' z równań (25.1). Otrzymujemy wówczas g 1 _ 1 4ire0 1/1—r2 |/ \^x-vi)ly/].-v2}2+y2+z2 (25.27) Postępując analogicznie ze składowymi potencjału wektorowego A, można pokazać, że A — vę>. (25.28) Są to tanaana wzory, które w inny sposób wyprowadziliśmy w rozdz. 21 (t. H, cz. !)• 25-6. Niezmienniczość równań elektrodynamiki Przekonaliśmy się, że potencjały <p i A wzięte razem tworzą czterowektor, który oznaczamy A^, i że równania falowe — zupełny układ równań określających AM poprzez
25-6. NIEZMIENNICZOŚĆ RÓWNAŃ ELEKTRODYNAMIKI 93 __ można zapisać tak jak w równaniu (25.22). Równania te wraz z zasadą zachowania jadunku dają nam fundamentalne prawo pola elektromagnetycznego: □ %, = —Z,, V^ = 0. (25.29) ®o Tu, na tym maleńkim skrawku stronicy, są wszystkie równania Maxwella — piękne i pro- ste. Czy ten sposób zapisu równań nauczył nas czegoś oprócz dowiedzenia piękna i pro- stoty równań? W szczególności, czy jest to coś innego od tego, co mieliśmy poprzednio, kiedy to wypisywaliśmy równania dla wszystkich poszczególnych składowych? Czy mo- żemy wyprowadzić z tych równań jakieś wnioski, których nie można było wyprowadzić z równań falowych określających potencjały przez ładunki i prądy? Odpowiedzią na to pytanie jest wyraźne „nie”. To, co zrobiliśmy, polega jedynie na nadaniu nowych nazw pewnym pojęciom — wprowadzeniu nowej metody zapisu. Wprowadziliśmy symbol D2 dla pochodnych, ale w dalszym ciągu symbol ten oznacza nic innego, jak tylko drugą pochodną względem t, minus druga pochodna względem x, minus druga pochodna wzglę- dem y, minus druga pochodna względem z. A nasze p oznacza, że mamy cztery równania, po jednym dla każdego p = t,x,y lub z. Jakież więc znaczenie ma ten fakt, że równa- nia mogą być zapisane w prostej postaci? Jeżeli oceniać by ten fakt ze względu na jego użyteczność dla wyprowadzenia bezpośrednich wniosków, to nie reprezentuje on żadnych wartości. Możliwe jednak, że ta prosta postać równań oznacza, że i sama natura jest obdarzona pewną prostotą. Pozwól Czytelniku, że pokażemy Ci coś ciekawego, coś, co właśnie odkryliśmy: Wszystkie prawa fizyki mogą być zawarte w jednym równaniu; tym równaniem jest u = 0. (25.30) Jakież to proste równanie! Oczywiście, musimy wiedzieć, co oznacza ten symbol u. Jest to pewna wielkość fizyczna, którą nazwiemy „odstępstwem od rzeczywistości” danej sytuacji. Mamy też wzór określający tę wielkość. Oto, jak będziemy ją obliczać. Bierze- my wszystkie znane prawa fizyki i zapisujemy w specjalnej postaci. Przypuśćmy na przy- kład, że weźmiemy prawo mechaniki F = ma i przepiszemy je w postaci F—ma = 0. Nazwiemy teraz wielkość (F—ma), która oczywiście powinna być równa zeru, „niedo- pasowaniem” mechaniki. Następnie podnosimy do kwadratu to „niedopasowanie” i ozna- czamy przez Ui, która to wielkość może być nazwana „odstępstwem od rzeczywistości zjawisk mechaniki”. Innymi słowy, tworzymy wyrażenie Uj = (F-ma)2. (25.31) Teraz możemy wypisać inne prawo fizyczne, powiedzmy V E = g/e0, i zdefiniować u2: / Q \2 u2 = VE——) , \ Eof które moglibyśmy nazwać „gaussowskim odstępstwem elektryczności”. Następnie wy- pisujemy u3, u4, itd. — po jednym dla każdego istniejącego prawa fizycznego. W końcu, sumę tych wszystkich „odstępstw” u,-, odpowiadających wszystkim zja-
94 25. ELEKTRODYNAMIKA W ZAPISIE RELATYWISTYCZNYM wiskom zachodzącym w naszym świecie fizycznym, nazwijmy „całkowitym odstępstwem świata” u, tzn. u = Wówczas wielkie „prawo Przyrody” mówi: U — 0. | (25.32) To „prawo” oznacza oczywiście, że suma kwadratów wszystkich „niedopasowań” jest równa zeru. Aby zaś suma wielu kwadratów była równa zeru, każdy z jej członów też musi być równy zeru. Tak więc „piękne w swej prostocie” prawo wyrażone równaniem (25.32) jest równo- ważne szeregowi praw, które wypisaliśmy przed chwilą. Widać stąd zupełnie jasno, że prosta postać zapisu, maskująca złożoną naturę praw przy pomocy definicji symbolów, nie ma nic wspólnego z rzeczywistą prostotą — to po prostu pewien fortel. Piękno równa- nia (25.32), wynikające z faktu, że równanie to zawiera w sobie wiele innych równań, jest tylko pewnym chwytem. Jeśli się rozwikła całą tę historię, znajdziemy się z powrotem w punkcie, z którego wyszliśmy. Jednakże prostota praw elektromagnetyzmu ma pewne głębsze znaczenie, tak samo jak i teoria analizy wektorowej ma swoje głębsze znaczenie. Fakt, że równania elektro- magnetyki można zapisać przy użyciu bardzo szczególnej metody zapisu, metody wpro- wadzonej specjalnie dla czterowymiarowej geometrii przekształcenia Lorentza, czyli w po- staci równań wektorowych w czteroprzestrzeni, oznacza, że elektromagnetyzm jest nie- zmienniczy względem przekształcenia Lorentza. Właśnie dlatego, że równania Maxwella są niezmiennicze względem tych transformacji, można je zapisać w tak eleganckiej po- staci. Ta tak bardzo elegancka postać równań elektrodynamiki, równanie (25.29), nie jest dziełem przypadku. Teoria względności narodziła się na skutek stwierdzenia na drodze doświadczalnej, że zjawiska „przepowiedziane” przez równania Maxwella były takie same we wszystkich układach inercjalnych. I Lorentz znalazł swoje przekształcenie właś- nie badając własności transformacyjne równań Maxwella — jako jedyne przekształcenie nie zmieniające postaci tych równań. Istnieje jednak jeszcze jeden powód, aby nasze równania zapisywać w taki sposób. Zostało mianowicie odkryte — zgodnie z hipotezą Einsteina — że wszystkie prawa fi- zyki są niezmiennicze względem przekształcenia Lorentza. To właśnie jest zasada względ- ności. Tak więc jeżeli znajdziemy postać zapisu, z której od razu wynika, czy wypisane prawo jest niezmiennicze, czy też nie, możemy być wówczas pewni, że poszukując nowych teorii będziemy wypisywać tylko takie równania, które są zgodne z zasadą względności- Fakt, że przy tej szczególnej metodzie zapisu równania Maxwella przybierają tak prostą postać, nie jest żadną niespodzianką, bo właśnie te równania były bodźcem do wynalezienia tej metody. Ale interesujące jest to, że każde prawo fizyki — czy to opisu- jące przemieszczanie się fal mezonowych, czy zachowanie się neutrin podczas rozpadu beta itd. — musi być niezmiennicze względem przekształcenia Lorentza. A więc, gdy p°" dróżujemy ze stałą prędkością w pojeździe kosmicznym, wszystkie prawa przyrody trans- formują się wspólnie w taki sposób, że nie występują żadne nowe zjawiska. Właśnie dla- tego, że zasada względności tkwi w naturze rzeczy, równania opisujące nasz świat będ4 miały prostą postać w zapisie czterowektorowym.
26 lorentzowskie transformacje pól w tym rozdziale c = 1 26-1. Czteropotencjał poruszającego się ładunku*1 Stwierdziliśmy w poprzednim rozdziale, że potencjał A? = (ę>, A) jest czterowekto- rem. Jego składową czasową jest potencjał skalarny <p, a trzy składowe przestrzenne two- rzą potencjał wektorowy A. Wyprowadziliśmy także, posługując się przekształceniem Lorentza, wzory na potencjały cząstki poruszającej się wzdłuż linii prostej ze stałą pręd- kością. [Wzory te otrzymaliśmy już za pomocą innej metody w rozdz. 21 (t. II, cz. 1).] Dla ładunku punktowego, którego położenie w chwili t jest dane trójwektorem (vt, 0, 0), potencjały w punkcie (x, y, z) są równe q W ______r (x _ v a 2 47tE0ł/l — V2 —-----y-+y2 + z2 L : 47teol/l-v2 [ Vt +y2+z2 L l—v Ay = A2 = 0. (26.1) Równania (26.1) określają potencjały w punkcie x, y i z w chwili t dla ładunku, któ- reS° „rzeczywiste” położenie (przez które rozumiemy położenie w chwili t) określone Jest Przez x = vt. Zauważmy, że w tych równaniach występują zmienne (x— vt), y 1 Porównaj: Tom II. cz. 1, rozdz. 20 (Rozwiązania równań Maxwella w próżni).
96 26. LORENTZOWSKIE TRANSFORMACJE POL 26.1. Znajdowanie pól w punkcie P, pocho- dzących od ładunku q poruszającego się wzdłuż osi x ze stałą prędkością v. Pole, które jest „teraz” w punkcie (x, y, z), można wyrazić równie dobrze przez położenie „rzeczywiste” P, jak i przez położenie „opóź- nione” P' (yf chwili t' = t—r'/c) 26.2. Ładunek porusza się po jakimś dowolnym torze. Pole w punkcie (x, y, z) w chwili t jest określone przez położenie P' i prędkość / w chwi- li opóźnionej r' = t—r'/c. Pole to można wy- godnie wyrazić poprzez współrzędne względem położenia „pozornego” PpOzor- (Rzeczywistym położeniem w chwili t jest punkt P.) i z, będące współrzędnymi mierzonymi względem bieżącego położenia punktu P poruszającego się ładunku (patrz rys. 26.1). Wiemy, że w rzeczywistości oddziaływanie rozchodzi się z prędkością c, a więc na- prawdę „liczy się” wpływ pochodzący od ładunku znajdującego się w tyle w opó- źnionym położeniu P':*} Punkt P' okre- śla współrzędna x = vt' (gdzie t' = t—rr(c jest czasem opóźnionym). Ale powiedzie- liśmy, że ładunek poruszał się po linii prostej ze stałą prędkością, tak więc od- działywania w położeniu P' i w położeniu bieżącym są ze sobą bezpośrednio zwią- zane. W rzeczywistości, jeżeli zrobimy do- datkowe założenie, że potencjały zależą tylko od położenia i od prędkości w chwili opóźnionej, to równania (26.1) będą sta- nowić wzory w pełni określające poten- cjały ładunku poruszającego się w dowolny sposób. Wygląda to następująco. Przy- puśćmy, że mamy ładunek poruszający się w pewien dowolny sposób, powiedzmy po torze takim, jak na rys. 26.2 i próbu- jemy znaleźć potencjały w punkcie (x, y, z). Najpierw znajdujemy położenie opóź- nione P' i prędkość v' w tym punkcie. Następnie wyobrażamy sobie, że ładunek porusza się w dalszym ciągu z tą prędko- ścią przez chwilę (t' — f), będącą miarą opóźnienia, tak że przyjmie w końcu pewne urojone położenie Ppo2or, które możemy nazwać „położeniem pozornym” i że przy- będzie tam z prędkością v'. (Oczywiście, ładunek niczego takiego nie robi; w chwili t znajduje się on naprawdę w punkcie P-) Wówczas potencjały w punkcie (x, y, są właśnie takie, jakie otrzymalibyśmy z równań (26.1) dla wyimaginowanego 13' dunku znajdującego się w pozornym pol°' ♦’ Nie należy mylić znaków prim użytych tutaj dla oznaczania opóźnionych położeń i chwil ze z°a kami odnoszącymi się do układu odniesienia poddanemu przekształceniu Lorentza w poprzednim rozdziać
26-1. CZTEROPOTENCJAŁ PORUSZAJĄCEGO SIĘ ŁADUNKU 97 źeniu Ppozor. Mówimy po prostu, że ponieważ potencjały zależą tylko od tego, co się dzieje z ładunkiem w chwili opóźnionej, to będą one takie same w wypadku, gdyby ładu- nek poruszał się dalej ze stałą prędkością, jak i w wypadku, gdyby ładunek zmienił swoją prędkość po chwili t', tzn. po tym, kiedy potencjały, które miały się pojawić w chwili t w punkcie (x, y, z) zostały, już określone. Wiemy oczywiście, że w chwili gdy mamy już wzory określające potencjały pochodzą- ce od ładunku poruszającego się w dowolny sposób, to mamy całą elektrodynamikę; możemy znaleźć potencjały pochodzące od dowolnego układu ładunków, biorąc super- pozycję potencjałów każdego z tych ładunków. Możemy więc zebrać wszystkie zjawiska elektrodynamiki albo wypisując równania Maxwella, albo posługując się takim oto zbio- rem twierdzeń. (Zapamiętajmy te twierdzenia na wypadek gdybyśmy mieli się kiedyś znaleźć na bezludnej wyspie. Za ich pomocą można zrekonstruować całą naszą wiedzę. Oczywiście, będziemy musieli znać do tego przekształcenie Lorentza, ale tego nigdy nie zapomnimy ani na bezludnej wyspie, ani też gdziekolwiek indziej.) Twierdzenie pierwsze'. Ap jest czterowektorem. Twierdzenie drugie: potencjał kulom- bowski spoczywającego ładunku jest równy ąAr:eor. Twierdzenie trzecie: potencjały wy- tworzone przez \poruszający się w dowolny sposób ładunek zależą tylko od położenia i prędkości w chwili opóźnionej. Mając te trzy fakty, mamy całą resztę. Opierając się na fakcie, że A^ jest czterowektorem, możemy poddać przekształceniu potencjał Coulomba, który znamy, i otrzymać potencjały dla ładunku poruszającego się ze stałą prędkością. Następnie, dzięki twierdzeniu mówiącemu, że potencjały zależą tylko od prędkości w chwili opóźnionej, możemy znaleźć je posługując się metodą położenia pozornego. Nie jest to specjalnie dogodna droga prowadząca do wyników, ale jest rzeczą interesującą, że prawa fizyki mogą być sformułowane na wiele różnych sposobów. Można się czasem spotkać z nieostrożnym stwierdzeniem, iż całą elektrodynamikę można wyprowadzić jedynie z przekształcenia Lorentza i z prawa Coulomba. Oczywiście, takie twierdzenie jest zupełnie fałszywe. Przede wszystkim, musimy założyć, że potencjał skalarny i potencjał wektorowy tworzą razem czterowektor. To dopiero mówi nam, jak się potencjały transformują. Ale w takim razie, dlaczego tylko się liczy sytuacja w chwili opóźnionej? Co więcej, dlaczego potencjały zależą tylko od położenia i od prędkości, a nie na przykład od przyspieszenia? Pola E i B na pewno zależą od przyspieszenia. Gdy- byśmy spróbowali przeprowadzić takie samo rozumowanie dla tych pól, powiedzieli- byśmy, że zależą one tylko od położenia i od prędkości w chwili opóźnionej. Ale wówczas Pola pochodzące od ładunku poruszającego się ruchem przyspieszonym byłyby takie same, jak pola pochodzące od ładunku znajdującego się w położeniu pozornym, co jest niePrawdą. Pola zależą nie tylko od położenia i prędkości w różnych punktach toru, ale także od przyspieszenia. Tak więc w tym wielkim twierdzeniu, które głosi, że wszystko można wyprowadzić Przekształcenia Lorentza, tkwi wiele dodatkowych, milczących założeń. (Ile razy widzi- my obszerne twierdzenia mówiące, że z bardzo małej liczby założeń można otrzymać ^lele, W'iele wyników, to zawsze można się przekonać, iż nie jest to prawdą. Zwykle takim twierdzeniu zawarte są pośrednio liczne założenia, które wcale nie są takie ^"iste, jeżeli zastanowić się nad nimi dostatecznie wnikliwie.) Okłady z fizyki
98 26. LORENTZOWSKIE TRANSFORMACJE P0L 26-2. Pola ładunku punktowego poruszającego się ze stałą prędkością Teraz, kiedy mamy już potencjały ładunku punktowego poruszającego się ze stałą prędkością, powinniśmy znaleźć pola — będą one potrzebne dla celów praktycznych. Z cząstkami poruszającymi się ruchem jednostajnym mamy do czynienia w wielu wypad- kach — przykładem mogą być promienie kosmiczne przechodzące przez komorę Wil- sona lub nawet wolno poruszające się elektrony w drucie. Zobaczmy więc, choćby w szcze- gólnym przypadku, jak wyglądają w rzeczywistości pola dla dowolnej prędkości — nawet dla prędkości bliskich prędkości światła — zakładając jedynie, że nie występują przy- spieszenia. Problem ten jest całkiem interesujący. Pola otrzymujemy z potencjałów na podstawie zwykłych reguł: ' i 3A E = —--------—-, dt B = VxA. Najpierw obijcaąmy £/. £ = S<f> dAz 2 dz dt ‘ Ale Az jest równe zeru; różniczkując więc w równaniach (26.1) otrzymujemy £ =--------q ---------------f. (26.2) 4»e0j/1-V2 r (x-vt)2 l3'2 ——+y +z2 L 1—« J Podobnie dla Ey: £„*= —- ------------------T-. (26.3) IV21-2] * L v J Obliczenie składowej x-owej wymaga nieco więcej zachodu. Pochodna jest tu bardziej skomplikowana i składowa Ax nie jest równa zeru. Najpierw > dtp q (x—at)/(l—u2) Ąne0]/\-v2 f(x-vt)2 213 —:---~2—Fr+z2 L l—v J Następnie różniczkując Ax względem t znajdujemy dAx q —v2(x—vt)/(l—v2) dt Ąm^i^2 ru-at)2 y +z J i I
26-2. POLA ŁADUNKU PUNKTOWEGO O STAŁEJ PRĘDKOŚCI 99 W końcu, po dodaniu, q x—vt 47tE0ł/l-t>2 F fo-ttp2 [ 2 ! z2~|3/2 1—V2 (26.6) Sensem fizycznym pola E zajmiemy się za chwilę; znajdźmy najpierw pole B. Dla skła- dowej z-owej SAV SA n ____ ____y _____ __ 1 Sx Sy Ponieważ Ay jest równe zeru, musimy znaleźć tylko jedną pochodną. Zauważmy jednak, że Ax to po prostu v<p, a pochodna SfSy z vq> jest po prostu równa —vEy. Tak więc Bz = vEy. (26.7) Podobnie l z SAX SA, S(p / B=— -=+v—- 1 ' y Sz Sx Sz oraz By = -vEz. (26.8) Na koniec, składowa Bx jest równa zeru, gdyż zarówno Ay, jak i A, są równe zeru. Pole magnetyczne możemy zapisać w prostej postaci B = vxE. (26.9) Zobaczmy teraz, jak wyglądają oba pola. Spróbujemy narysować obraz pola w różnych położeniach względem obecnego położenia ładunku. To prawda, że wpływ ładunku po- chodzi, w pewnym sensie, od położenia opó- źnionego; ale ponieważ ruch jest dokładnie określony, położenie opóźnione jest jedno- znacznie podane poprzez położenie obecne. Dla stałych prędkości wygodniej jest związać pola z bieżącym położeniem, ponieważ skła- dowe pola w punkcie (x, y, z) zależą tylko od (v—rt), y i z, które są współrzędnymi wek- tora przesunięcia rP od położenia obecnego do (a, yt z) (patrz rys. 26.3). Rozważmy najpierw punkt, dla którego 2 — 0. Wówczas wektor E ma tylko składowe * kierunkach osi x i y. Z równań (26.3) ’ (26.6) wynika, że stosunek tych składowych Jest po prostu równy stosunkowi składowych A‘'Owej i y-owej wektora przesunięcia. Ozna- Cza to, że pole E ma ten sam kierunek co Wektor rP, tak jak to pokazano na rys. 26.3. 26.3. Dla ładunku poruszającego się ze stałą prędkością pole elektryczne rozchodzi się radialnie od „rzeczywistego” położenia ła- dunku
100 26. LORENTZOWSKIE TRANSFORMACJE PQL 26.4. Pole elektryczne ładunku poruszają- cego się ze stałą prędkością V = 0,9c, część (b), w porównaniu z polem spoczywającego ładunku , część (a) Ponieważ pole Ez jest także proporcjonalne do z, to jasno z tego widać, że ta propor- cjonalność E do r jest słuszna również dla trzech wymiarów. Krótko mówiąc — pole elektryczne ładunku jest radialne i linie sił pola rozchodzą się promieniście od ładunku właśnie tak jak w wypadku ładunku spoczy- wającego. Oczywiście, pole nie jest dokładnie takie samo, jak dla spoczywającego ładunku ze względu na wszystkie dodatkowe czynniki (1—v2). Ale można pokazać coś dość inte- resującego. Różnica pomiędzy tymi polami jest akurat taka, jaką otrzymałoby się rysując pole kulombowskie w specjalnym układzie współrzędnych, w którym skala osi x byłaby „ściśnięta” o czynnik /l — v2. Gdyby zrobić taki rysunek, to okazałoby się, że linie sił pola będą rozpościerać się szeroko przed i za ładunkiem, a po bokach będą ściśnięte ra- zem, tak jak to pokazano na rys. 26.4. Jeżeli zwiążemy, jak to się zwykle robi, natężenie pola E z gęstością linii sił, to zoba- czymy, że pole jest silniejsze po bokach, a sła- bsze przed i za ładunkiem — właśnie tak, jak to wynika z równań. Przede wszystkim przyjrzyjmy się natężeniu*pola prostopadłego do toru ruchu, tzn. dla (x—vf) = 0, i uwzględnijmy, że odległość od ładunku jest w tym kierunku równa y2+z2. W punkcie tym całkowite natężenie pola wynosi j/E2+E2, czyli 9 1 £ =_______r 47Ceoł/l- v2 y2+?2' (26.10) Pole jest odwrotnie proporcjonalne do kwadratu odległości, podobnie jak pole Coulom- ba, z tym że jest ono zwiększone o stały, dodatkowy czynnik 1//1 —v2, który jest zawsze większy od jedności. A więc po bokach poruszającego się ładunku pole jest silniejsze, niż wynikałoby to z prawa Coulomba. W rzeczywistości pole po bokach poruszającego się ładunku jest większe od pola Coulomba w stosunku równym stosunkowi energii cząstki do jej masy spoczynkowej. Przed (i za) ładunkiem, na jego torze, y i z- są równe zeru i E = EX ?(1-^2) 4k£0(^— Vt)2 ' (26.11)
46-2. POLA ŁADUNKU PUNKTOWEGO O STAŁEJ PRĘDKOŚCI 101 pole zmienia się znowu jak odwrotność kwadratu odległości od ładunku, ale jest teraz zmniejszone o czynnik (1— v2), zgodnie z obrazem linii sił pola. Jeżeli v/c jest małe, to vz/c2 jest jeszcze mniejsze i wpływ członu (1—u2) jest bardzo mały; powracamy do prawa Coulomba. Ale jeżeli cząstka porusza się z prędkością bardzo bliską prędkości światła, pole w kierunku ku przodowi jest ogromnie zmniejszone, a pole w kierunku bocznym jest ogromnie zwiększone. Nasze wyniki dla pola ładunku elektrycznego można przedstawić w sposób następu- jący: Przypuśćmy, że narysowaliśmy na kance papieru linie sił pola dla ładunku spoczy- wającego, a następnie wprawiliśmy rysunek w ruch z prędkością v. Wówczas, oczywiście, cały rysunek zostałby „ściśnięty” przez skrócenie lorentzowskie, tzn. że ziarenka grafitu na papierze pojawiłyby się w innych miejscach. Zadziwiające w tym wszystkim jest to, że rysunek, który zobaczylibyśmy na przelatującej kartce, reprezentowałby w dalszym ciągu linie sił pola ładunku punktowego. Skrócenie Lorentza przesuwa te linie bliżej ku sobie po bokach i rozsuwa je w przodzie i w tyle, dokładnie w taki sposób, aby gęstości linii były takie, jakie być powinny. Poprzednio podkreślaliśmy, że linie sił pola nie są czymś rzeczywistym, ale są tylko pewnym sposobem przedstawienia pola. Jednakże w tym wy- padku wydaje się, że są one prawie czymś rzeczywistym. W tym szczególnym przypadku, jeżeli popełnimy nieścisłość wyobrażając sobie, że linie sił pola są rzeczywiście w prze- strzeni i poddamy je transformacji, to otrzymamy poprawne pole. Jednakże to nie czyni linii sił pola ani trochę bardziej rzeczywistymi. Aby pamiętać, że nie są one czymś rzeczy- wistym, wystarczy tylko pomyśleć o polach elektrycznych, wytworzonych przez ładunek i magnes; kiedy magnes się porusza, powstają nowe pola elektryczne i niszczą ten piękny obraz. Tak więc zgrabny pomysł rysunku ulegającego skróceniu nie ma zastosowania w ogólnym przypadku. Jest to jednak wygodny sposób zapamiętania, jak wyglądają pola pochodzące od poruszającego się szybko ładunku. Pole magnetyczne jest równe vxE [z równania (26.9)]. Jeżeli prędkość pomnożyć wektorowo przez radialne pole E, to otrzyma się pole B, które okrąża linię ruchu, tak jak to pokazano na rys. 26.5. Jeżeli wstawić z powrotem wszystkie współczynniki c, to okaże się, że jest to ten sam wynik, jaki mieliśmy dla ładunków o małej prędkości. Dobrym sposobem zobaczenia, gdzie należy wstawić współczynniki c, jest odwołanie się do prawa siły, F = ę(E+vxB). Widać, że prędkość razy pole magnetyczne nta ten sam wymiar co pole elektryczne. A W1?c po prawej stronie równania (26.9) musi się pojawić czynnik 1/c2: B = (vxE)/c2. (26.12) poruszającego się wolno ładunku (v c) H^ożna za pole E przyjąć pole Coulomba; 26.5. Pole magnetyczne w pobliżu poru- szającego się ładunku wynosi vxE (porównaj z rys. 26.4)
102 26. LORENTZOWSKIE TRANSFORMACJE PÓL 71—^ <k wówczas ~ <7 vxr B = ——. (26.13) 47teoc r Wzór ten odpowiada dokładnie tym równa- niom na pole magnetyczne prądu, które zna- leźliśmy w § 14-7 (tom II, cz. 1). Chcielibyśmy przy okazji pokazać coś in- teresującego, nad czym warto się zastanowić. (Później powrócimy jeszcze do omówienia tego problemu.) Wyobraźmy sobie dwa elek- trony, których prędkości są prostopadłe względem siebie, tak że jeden z nich przetnie tor drugiego, ale zanim on jeszcze nadejdzie, tak że elektrony się nie zderzą. W pewnej chwili ich położenie względne będzie takie, jak na rys. 26.6a. Rozpatrzmy siłę, z jaką ła- dunek q2 działa na ładunek qL i odwrotnie. Na ładunek q2 działa tylko siła elektryczna pochodząca od ładunku qt, ponieważ ładunek q2 nie wytwarza pola magnetycznego wzdłuż swej linii ruchu. Na ładunek q2 jednak działa również siła elektryczna, ale w do- datku działa też siła magnetyczna, ponieważ ładunek qt porusza się w polu B wytworzo- nym przez ładunek q2. Siły te wyglądają tak, jak to przedstawiono na rys. 26.6b. Siły elek- tryczne działające na ładunki i q2 są równe i przeciwnie skierowane. Jednakże na ładu- nek qt działa jeszcze siła poprzeczna (magnetyczna), a na ładunek q2 żadna siła poprzeczna nie działa. Czyżby akcja nie była równa reakcji? Troskę o ten problem pozostawiamy czytelnikowi. F, ąfE, ®Bi w2 ^^“Fg v2 pomiędzy dwoma 26.6. Siły działające poruszającymi się ładunkami nie za- wsze są równe i przeciwnie skierowa- ne. Okazuje się, że „akcja” nie jest rów- na „reakcji” 26-3. Relatywistyczna transformacja pól W poprzednim paragrafie wyliczyliśmy z podanych transformacji potencjałów pola elektryczne i magnetyczne. Znajomość pól jest oczywiście ważna, mimo że poprzednio podaliśmy argumenty, że potencjały są realnymi wielkościami o znaczeniu fizycznym. Pola są także czymś rzeczywistym. Przydałby się z wielu względów sposób na obliczanie pól w poruszającym się układzie, jeżeli się zna już pola w układzie „spoczynku”. Znamy prawa transformacji dla wielkości <p i A, ponieważ A? jest czterowektorem. Teraz chcie- libyśmy poznać prawa transformacyjne dla pól E i B. Dane są pola E i B w jednym ukła- dzie odniesienia, a jak wyglądają one w innym, poruszającym się względem niego ukła- dzie? Wygodnie jest mieć taką transformację. Można wprawdzie zawsze dojść do tego drogą okrężną, obliczając najpierw potencjały, a potem pola, ale czasem korzystnie jest móc transformować pola bezpośrednio. Zobaczmy teraz, jak się to robi. W jaki sposób można znaleźć prawa transformacji pól? Znamy prawa transformacji <p i A, wiemy jak wyrazić pole poprzez <p i A — powinno się łatwo znaleźć transformacje
26.j. RELATYWISTYCZNA TRANSFORMACJA PÓL 103 dla pól B i E. (Można by przypuszczać, że z każdego wektora można w jakiś sposób utwo- rzyć czterowektor, tak że dla pola E powinno istnieć coś, co mogłoby być użyte jako czwar- ta składowa. I tak samo dla pola B. Ale tak nie jest. Jest całkiem inaczej, niż można by się spodziewać.) Na początek rozpatrzmy tylko pole magnetyczne B, które jest oczywiście równe V xA. Wiemy teraz, że potencjał wektorowy, ze swoimi składowymi x-ową, y-ową i z-ową, jest tylko częścią czegoś; jest też składowa w kierunku t. Wiemy także, że dla pochodnych takich jak V oprócz części x-owej, y-owej i z-owej istnieje także pochodna względem t. Spróbujmy więc obliczyć, co się stanie, gdy zastąpimy „j>” przez „t” lub „z” przez „t” lub coś w tym rodzaju. Zauważmy, przede wszystkim, jaką mają postać wyrazy V x A, kiedy rozpiszemy VxA na składowe: dAz dAv dAx dAz dA„ dAx ___2_____y q x______z __ __y______x dy dz y dz dx ’ 1 dx dy (26.14) Składowa x-owa równa jest parze wyrazów, zawierających jedynie składowe j-owe i z- -owe. Przypuśćmy, że tę kombinację pochodnych i składowych nazwiemy „tworem zy” i oznaczymy go w skrócie przez Fzy. Będziemy po prostu rozumieć, że dA. F = —- Zy Sy dAy dz (26.15) Podobnie, By jest równe „tworowi” tego samego typu, ale tym razem jest to „twór xz”. A Bz jest oczywiście odpowiednim „tworem yx”. Mamy więc Bx = Fzy, By = Fxz, Bz = Fyx. (26.16) Co się teraz stanie, jeżeli spróbujemy po prostu spreparować też kilka tworów typu „t”, jak Fxl i Flz (przyroda bowiem powinna być piękna i symetryczna względem x, y, z i 0? Tak na przykład, co to jest Flz? Oczywiście, jest to . dAt dAz dz dt Ale pamiętajmy, że At — tak że jest to także dAz • dz dt ^Widzieliśmy to już poprzednio. Jest to z-owa składowa pola. No, prawie, znak bowiem Jest zły. Ale zapomnieliśmy, że w czterowymiarowym gradiencie pochodna względem t Występuje ze znakiem przeciwnym niż pochodne względem x, y, i z. Tak więc powinniśmy bardziej konsekwentnie „dobudować” Flz jako dA. dAz “ (26'17) Wówczas jest to dokładnie równe — Ez. Sprawdzając takżej co to jest JF/Jt i Fty, przeko-
104 26. LORENTZOWSKIE TRANSFORMACJE PÓL Tabela 26.1. Składowe Ff,„ namy się, że te trzy możliwości dają Etx ~ Fty ~ Ey’ Elz — Ez. (26.18) Co się dzieje, gdy oba wskaźniki są tl Albo w przypadku gdy oba są x? Dostajemy takie oto twory: “ 5t 5t oraz _ SAX cAx xx dx dx ’ które nie dają nic innego jak zero. Mamy więc sześć tego rodzaju tworów F. Dalsze sześć można otrzymać przestawiając wskaźniki, ale nie dają one nic naprawdę nowego, ponieważ EXy = Fyx . i i tak dalej. A więc z szesnastu możliwych kombinacji czterech wskaźników branych pa- rami dostajemy tylko sześć różnych obiektów fizycznych; są to właśnie składowe pól B i E. Do oznaczenia ogólnego wyrazu F będziemy używać ogólnych wskaźników p i v, z których każdy może przyjmować wartość 0, 1, 2 lub 3, co oznacza w naszym zwykłym zapisie wektorowym t, x, y, i z. Również wszystko będzie zgodne z naszym zapisem cztero- wektorowym, jeżeli F,„ zdefiniujemy jako F,„ = ^A-^A,, (26.19) pamiętając, że V,, = (d/dt, —clcx, —dfdy, —d/Sz) i że A^ = (<p, Ax, Ay, Az). Przekonaliśmy się, że istnieje sześć wielkości powiązanych z sobą przez przyrodę, które stanowią różne aspekty tego samego. Pole elektryczne i magnetyczne, które w na- szym poruszającym się wolno świecie (gdzie nie obchodzi nas prędkość światła) uważa- liśmy za dwa odrębne wektory, w czteroprzestrzeni nie są wektorami. Są one częściami nowego „tworu”. Nasze fizyczne „pole” jest w rzeczywistości sześcioskładnikowym obiek- tem F^. W taki właśnie sposób musimy nań patrzeć w teorii względności. Podsumowanie naszych wyników zamieszczamy w tab. 26.1. Widzimy, że dokonaliśmy tutaj po prostu uogól- nienia iloczynu wektorowego. Zaczęliśmy od operacji rotacji i od faktu, że własności transformacyjne rota- cji są takie same jak własności transformacyjne dwóch wektorów — zwykłego, trójwymiarowego wektora A i operatora gradientu, który — jak wiemy — także się zachowuje jak wektor. Przypatrzmy się przez chwil? zwykłemu iloczynowi wektorowemu w trzech wymia- rach, np. momentowi pędu cząstki. Z ruchem dowol- nego obiektu w płaszczyźnie jest związana ważna 1 wielkość (xvy—yvx). Dla ruchu w trzech wynua' F^ = -F,n Fp? = 0 Fxy ——Bz Fxt = Ex Fyz = —Bx Fyl = Ey Fzx = —By Fa = Ez
,6.3. RELATYWISTYCZNA transformacja pól 105 rach mamy trzy takie ważne wielkości, które nazywamy składowymi momentu pędu: Lxy = m(xvy-yvx), Lyz = m(yvz-zvy), Lzx = m(zvx-xvz). Następnie (chociaż niektórzy z nas mogli już o tym zapomnieć) odkryliśmy w rozdz. 20 tomu I (cz. 1) zadziwiającą rzecz, że te trzy wielkości można utożsamić ze składowymi wektora. Aby to zrobić, musieliśmy utworzyć sztuczne prawo — regułę prawej ręki. Mieliśmy po prostu szczęście. Mieliśmy szczęście, bo moment (z i i j równymi x, y lub z) był obiektem antysymetrycznym: L, = 0. Z dziewięciu możliwych wielkości Lu tylko trzy są niezależne. I przy zmianie układu współ- rzędnych tak właśnie się dzieje, że trzy obiekty transformują się dokładnie tak samo jak składowe wektora. Podobne powody pozwalają nam przedstawić element powierzchni jako wektor. Ele- ment powierzchni jest scharakteryzowany przez dwa elementy liniowe — powiedzmy przez dx i dy — które można uważać również za składowe wektora rfa, prostopadłego do powierzchni. Ale w czterech wymiarach nie można tego zrobić. Jaka jest bowiem „normalna” do dx dyl Czy ma ona kierunek osi z, czy też leży wzdłuż osi t? W skrócie, dla trzech wymiarów tak się szczęśliwie składa, że po utworzeniu iloczynu dwóch wektorów, takiego jak Ltj, można go w dalszym ciągu przedstawiać przez inny wek- tor, ponieważ istotne są tam tylko trzy składowe, które się dodatkowo transformują akurat tak jak składowe wektora. Ale w czterech wymiarach jest to oczywiście niemożliwe, po- nieważ mamy tu sześć niezależnych wyrazów, a sześciu wielkości nie można przedstawić za pomocą czterech. Nawet w trzech wymiarach mogą istnieć takie iloczyny wektorów, których nie da się przedstawić za pomocą wektorów. Przypuśćmy, że weźmiemy dowolne dwa wektory a = (ax, ay, az) i b = (bx, by, bz) i utworzymy wszystkie możliwe iloczyny składowych, jak np. axbx,axby, itd. Będzie tu dziewięć możliwych wielkości: axbx, axby, axbz, aybx, ayby, aybz, azbx, azby, azbz. Wielkości te można by oznaczyć przez Tv. Jeżeli teraz przejść do obróconego układu współrzędnych (np. obróconego wokół °S1 z), to składowe wektorów a i b się zmienią. W naszym układzie ax, na przykład, zo- stanie zastąpione a' = fircos0+fivsin0, a by ' b'y = bycos6—Z\sin0. 1 P°dobnie dla innych składowych. Wszystkie dziewięć składowych wyprowadzonej przez
106 26. LORENTZOWSKIE TRANSFORMACJE POL nas wielkości „iloczynowej” Ty ulegnie także zmianie. Tak na przykład Txy = axby zmienia się na Txy = axby(cos2&)—axbx(cos9 sin&)+ayby(sinO cos0)—aybx(sin20), czyli T' = T,„cos20—TxxcosO sin0-ł-T „sinfl cosfl—Tv,sin20. ay A- *4 yy y Każda składowa Tyjest kombinacją liniową składowych Ty. Przekonaliśmy się więc, że nie tylko można mieć „iloczyn wektorowy” jak axb, który ma trzy składowe, transformujące się jak wektor, ale można też sztucznie utworzyć innego rodzaju „iloczyn” dwóch wektorów Ty, o dziewięciu składowych, które przy obrocie transformują się według skomplikowanego zbioru reguł tu znalezionych. Taki obiekt, do którego opisu potrzeba dwóch wskaźników zamiast jednego, nazywamy tensorem. Jest to tensor „drugiego rzędu”, ponieważ tę samą operację można przeprowadzić także z trzema wektorami i otrzymać tensor trzeciego rzędu, lub z czterema, aby otrzymać tensor czwartego rzędu, i tak dalej. Wektor jest tensorem pierwszego rzędu. Zasadniczą rzeczą w tym wszystkim jest to, że nasza elektromagnetyczna wielkość jest także tensorem drugiego rzędu, ponieważ ma dwa wskaźniki. Jest to jednakże tensor w czterech wymiarach. Transformuje się on w szczególny sposób, który za chwilę wy- prowadzimy — właśnie w taki sposób, w jaki się transformuje iloczyn wektorów. Przy tym okazuje się, że jeżeli zamienić wskaźniki miejscami, to F^, zmienia znak. Mamy tu szczególny przypadek — jest to tensor antysymetryczny. Mówimy więc: obydwa pola, elek- tryczne i magnetyczne, są częściami antysymetrycznego tensora drugiego rzędu w czte- rech wymiarach. Przeszliśmy długą drogę. Przypomnijmy sobie, jak dawno temu określaliśmy, co to jest prędkość! Teraz mówimy już o „antysymetrycznym tensorze drugiego rzędu w czte- rech wymiarach”. Musimy teraz znaleźć prawa transformacji tensora F^. Nie jest to wcale trudne do zrobienia; jest tylko żmudne — nie wymaga wcale wiele inteligencji, ale wymaga sporo pracy. To, czego szukamy, to przekształcenie Lorentza ^^A^. Ponieważ V/I jest szczególnym przypadkiem wektora, będziemy rozważać ogólną antysymetryczną kombi- nację iloczynów wektorów, którą oznaczymy G^: G^ = a,bu. (26.20) (Dla naszych celów a? zostanie na końcu zastąpione V/1, a potencjałem >4U.) Składowe i b^ transformują się według wzorów Lorentza, a zatem , at—va . b.—vbx . at = ....ht = VI — v2 Vl—v2 , ax—va. . bx—vb. a* = r------bx = l^l—u2 /l — v2 ,, , (26J1) ay ’ by by > b'z = bz.
26-3. RELATYWISTYCZNA TRANSFORMACJA PÓL 107 poddajmy teraz transformacji składowe G^. Zaczynamy od Gtx: Gtx atbx axbt atbx-axbt. Ale to jest po prostu Gtx, tak że otrzymujemy prosty wynik Gtx = Gtx* Uczyńmy to samo dla jeszcze jednej składowej: a-™x , b-vbx _ {a,b-a^-v(axbr-arb^ G'ty = Otrzymujemy zatem , _ Gty—vGxy Crty n-v2 I oczywiście, w ten sam sposób . G,-vGxz GtZ ! ^l-v2 Widać teraz jasno, jak będzie się transformować reszta. Zróbmy tabelkę wszystkich sześciu wyrazów; tylko że teraz można je równie dobrze wypisać dla Fr — F r' _ Fxy-vF,y * tx * tx> *xy ]/l—v2 , F,v~VFrv ty xy ‘y j/l-r2 ’ Fyz = FyZ, , Ftz—vF„ Fzx _ Fzx-vFzt ' }/\-v2 • j/l-r2 (26.22) Oczywiście, w dalszym ciągu Fy, = — F'vtl i F^ = 0. Mamy więc transformację pola elektrycznego i magnetycznego. Pozostaje nam tylko Przyjrzeć się tab. 26.1, aby znaleźć, co nasz wspaniały zapis przy użyciu F^ oznacza dla wektorów E i B. To tylko kwestia podstawienia. Abyśmy więc mogli zobaczyć, jak to wygląda w zwykłych oznaczeniach, przepiszemy naszą transformację składowych pola w tab. 26.2. Równania w tab. 26.2 mówią nam, jak się zmieniają pola E i B, jeżeli przechodzimy °d jednego inercjalnego układu odniesienia do drugiego. Jeżeli mamy dane E i B w jed- nym układzie, możemy znaleźć, czemu one są równe w innym układzie, który się poru- SZa względem pierwszego z prędkością v. Równania te można zapisać w postaci, która jest łatwiejsza do zapamiętania, jeżeli Zauważyć, że ponieważ v ma kierunek osi x, wszystkie wyrazy z u są składowymi iloczy-
108 26* LORENTZOWSK1E TRANSFORMACJE PÓL Tabela 26 2. Przekształcenie Lorentza pola elektryczne- go i magnetycznego (Uwaga: c = 1) F.' = E B' = B * X X F.' Ey—vBz By+vEz B = y M-v2 y V\-v2 E' _ Ez+»By Bz—vEy £$ = - - 1 1—V2 2 y i-o2 Tabela 26 3. Alternatywna postać transformacji pól (Uwaga: c = 1) B' X = Bx (E+vxB)j, B' (B—v x E)y tj—V2 y Fl—v2 (E+vxB)z B' (B—v x E)z )j—v2 Vl—v2 Tabela 26 4 Jeszcze jedna postać przekształcenia Lorentza pól E i B
26J. RELATYWISTYCZNA transformacja pól 109 pów wektorowych vxE i vxB. Można więc przepisać transformację w postaci pokazanej w tab. 26.3. Teraz można łatwiej zapamiętać, gdzie występują poszczególne składowe. W rzeczy- wistości transformację można zapisać jeszcze prościej, jeżeli zdefiniujemy składowe pola wzdłuż osi x jako składowe „równoległe” E, i B, (ponieważ są one równoległe do względ- flej prędkości układów S i S') i zdefiniujemy całkowite składowe poprzeczne — wekto- rowe sumy składowych w kierunkach y i z — jako składowe „prostopadłe” E± i B±. Wów- czas otrzymujemy równania podane w tab. 26.4. (Wstawiliśmy tu z powrotem wszystkie współczynniki c, tak aby w przyszłości było nam wygodniej korzystać z tych wzorów.) Transformacje pól dają nam nowy sposób na rozwiązanie pewnych problemów, któ- re już rozwiązaliśmy poprzednio: pozwalają na przykład znaleźć pola poruszającego się ładunku. Poprzednio wyprowadziliśmy te pola różniczkując potencjały. Teraz natomiast moglibyśmy to zrobić transformując pole Coulomba. Jeżeli w układzie S spoczywa ładu- nek punktowy, to wówczas jest tam tylko proste, radialne pole E. W układzie S' zoba- czymy punktowy ładunek, poruszający się z prędkością w, jeżeli tylko układ S' porusza się względem układu S z prędkością v = — u. Pozostawiamy czytelnikowi do sprawdze- nia, że transformacje z tab. 26.3 i 26.4 dają te same pola elektryczne i magnetyczne, jakie otrzymaliśmy w § 26-2. Transformacja w tab. 26.2 daje nam ciekawą a prostą odpowiedź na pytanie: Co wi- dzimy poruszając się względem dowolnego układu nieruchomych ładunków? Przypuśćmy, na przykład, że chcemy znać pola w naszym układzie S', jeżeli się poruszamy pomiędzy płytkami kondensatora w kierunku do nich równoległym, tak jak to pokazano na rys. 26.7. (Równie dobrze można by powiedzieć, że naładowany kondensator przesuwa się względem nas.) Cóż więc zobaczymy? Transformacja jest w tym przypadku prosta, bo w układzie pierwotnym pole B jest równe zeru. Przypuśćmy najpierw, że nasz ruch od- bywa się w kierunku prostopadłym do E; wówczas stwierdzimy istnienie pola E' = — E/ /l — v2/c2, które w dalszym ciągu jest całkowicie poprzeczne. Oprócz tego zobaczymy pole magnetyczne B' = — vxE'/c2. (W naszym wzorze na pole B' nie występuje 11 — v2, bo B' wyraziliśmy poprzez pole E', a nie poprzez pole E; ale to na jedno wychodzi.) Tak więc, gdy się poruszamy prostopadle do statycznego pola elektrycznego, widzimy zmniejszone pole E i nowe pole poprzeczne B. Jeżeli nasz ruch nie jest prostopadły do E, rozbijamy E na Eh i E, . Część równoległa się nie zmienia, E' = E,, a składowa prosto- padła tak się zmienia, jak to opisaliśmy Powyżej. Rozważmy przypadek przeciwny i wy- obrażmy sobie, że poruszamy się przez czyste statyczne pole magnetyczne. Tym razem zo- aczytny elektryczne pole E', równe vaB' Paleomagnetyczne zmienione o czynnik ' ~~v2/c2 (zakładając, że jest ono poprze- otf e ’^k długo, jak długo v jest dużo mniejsze c> można pomijać zmianę pola magnety- 26.7. Układ współrzędnych S', poruszający się przez statyczne pole elektryczne
1 10 26. LORENTZOWSKIE TRANSFORMACJE PÓL cznego i głównym efektem jest pojawienie się pola elektrycznego. Jako przykład tego faktu rozważmy słynny niegdyś problem wyznaczania prędkości samolotu. Problem ten przestał być już słynny, ponieważ teraz można wyznaczać prędkość w powietrzu z odbić od Ziemi przy pomocy radaru, ale przez wiele lat bardzo trudno było określić prędkość samolotu podczas złej pogody. Nie było widać Ziemi, nie wiedziało się gdzie jest „góra”, a gdzie „dół” i tak dalej. A mimo to ważną rzeczą była znajomość prędkości ruchu względem Ziemi. Jak można to zrobić nie widząc Ziemi? Wielu z tych, którzy znali wzory transfor- macji, myślało o wykorzystaniu faktu, że samolot porusza się w polu magnetycznym Ziemi. Przypuśćmy, że samolot leci w obszarze, gdzie pole magnetyczne jest mniej lub bardziej znane. Weźmy tylko prosty przypadek, w którym pole magnetyczne jest pionowe. Jeżeli przelatywalibyśmy przez nie z poziomą prędkością v, to zgodnie z naszym wzorem powinni- byśmy zobaczyć pole elektryczne, które jest równe vxB, to znaczy jest prostopadłe do kierunku ruchu. Gdy w poprzek samolotu zawiesimy izolowany drut, wówczas to pole elektryczne wyindukuje na końcach drutu ładunki. To nic nowego. Z punktu widzenia kogoś z Ziemi drut porusza się w polu i siła q (y x B) sprawia, że ładunki się przesuwają ku końcom drutu. Równania transformacji wypowiadają tę samą rzecz, tylko w inny sposób. (Fakt, że możemy wypowiedzieć coś więcej niż w jeden sposób, nie oznacza, że jeden z tych sposobów jest lepszy od drugiego. Mamy tak wiele różnych metod i narzędzi, że zwykle możemy otrzymać ten sam wynik na 65 różnych sposobów!) Tak więc, aby zmierzyć prędkość v, wystarczy zmierzyć tylko napięcie pomiędzy koń- cami drutu. Nie można tego zrobić przy użyciu woltomierza, ponieważ te same pola będą działać na druty woltomierza, ale są sposoby mierzenia takich pól. O niektórych z tych sposobów wspomnieliśmy przy omawianiu elektryczności atmosferycznej w rozdz. 9 (tom II, cz. 1). Tak więc prędkość samolotu powinna się tym sposobem dać zmierzyć. Ten ważny problem nie był jednakże nigdy rozwiązany w taki sposób, a to dlatego, że wytworzone pole elektryczne jest rzędu miliwoltów ma metr. Można wprawdzie mie- rzyć takie pola, ale kłopot w tym, że te pola — niestety — wcale się nie różnią od innych pól elektrycznych. Wytworzonego przez ruch w polu magnetycznym pola nie można od- różnić od jakiegoś pola elektrycznego, które istnieje już w powietrzu z innych przyczyn, powiedzmy pochodzącego od elektrycznych ładunków w powietrzu lub na chmurach. W rozdziale 9 (tom II, cz. 2) powiedzieliśmy, że typowe pola elektryczne, które istnieją nad powierzchnią Ziemi, mają natężenie około 100 V/m. Ale są one zupełnie nieregularne, tak że gdy samolot leci przez powietrze, odczuwa on fluktuacje pól elektrycznych. Fluktua- cje te są olbrzymie w porównaniu z maleńkimi polami/ za które odpowiedzialny jest wyraz vxB i okazuje się, że ze względów praktycznych nie da się zmierzyć prędkości samolotu wykorzystując jego ruch w polu magnetycznym Ziemi. i 26-4. Równania ruchu w zapisie relatywistycznym** Niewiele będziemy mieli korzyści ze znalezienia pól elektrycznych i magnetyczny^ z równań Maxwella, jeżeli nie będziemy wiedzieć, jakie jest działanie tych pól, kiedy "T *’ W tym paragrafie będziemy z powrotem uwzględniać wszystkie współczynniki c.
RÓWNANIA RUCHU W ZAPISIE RELATYWISTYCZNYM 111 stąpią. Pamiętamy zapewne, że pola te są potrzebne do znalezienia sił działających na ła- dunki oraz że siły te określają ruch ładunku. Tak więc częścią teorii elektrodynamiki jest oczywiście zależność pomiędzy ruchem ładunków a siłami. Siła działająca w polach E i B na pojedynczy ładunek jest równa F = ę(E4-vxB). (26.23) Siła ta jest dla małych prędkości równa masie razy przyspieszenie, a poprawnym pra- wem dla dowolnej prędkości będzie stwierdzenie, że siła jest równa cbpjdt. Zapisując p= =ffjQv/l'l~u2/c2 znajdujemy, że poprawnym relatywistycznym równaniem ruchu jest 4 I-7=^=4 = F = <7(E+v XB). (26.24) \/l-v2/c2/ Chcielibyśmy teraz omówić to równanie z punktu widzenia teorii względności. Po- nieważ nadaliśmy naszym równaniom Maxwella postać relatywistyczną, rzeczą intere- sującą powinny być równania ruchu w postaci relatywistycznej. Zobaczmy, czy potrafimy przepisać to równanie w zapisie czterowektorowym. Wiemy, że pęd jest częścią czterowektora p^, którego składową czasową jest energia iMo/yl— v2jc2. Można by więc spróbować zastąpić lewą stronę równania (26.24) przez dpjdt. Wówczas trzeba tylko znaleźć czwartą składową, która towarzyszy sile F. Ta czwarta składowa musi być równa szybkości zmian energii, czyli szybkości wykonywania pracy, a więc Fv. Chcielibyśmy zatem zapisać prawą stronę równania (26.24) w postaci cztero- wektora (F-v, Fx, Fy, Fz). Nie jest to jednak czterowektor. Pochodna czasowa czterowektora nie jest już czterowektorem, ponieważ d[dt wymaga wyboru pewnego specjalnego układu odniesienia dla zmierzenia t. Na tę samą trudność natknęliśmy się poprzednio, kiedy to próbowaliśmy „przerobić” prędkość v na cztero- wektor. Naszą pierwszą hipotezą było, że składową czasową będzie c dtjdt — c. Ale wiel- kości \ dt dt dt} 1 v nie są składowymi czterowektora. Przekonaliśmy się już, że można je „przerobić” na czterowektor, mnożąc każdą ze składowych przez czynnik 1/j/l—v2/c2. „Czteroprędkość” / 1 v I , =' ’ , ...... \F1— v2[c2 V1 — v2/c2 Jest natomiast czterowektorem. Okazuje się więc, że jeżeli się chce, aby pochodne tworzyły czterowektor, cały dowcip P°iega na przemnożeniu djdt przez 1//1—r2/c2. Naszą kolejną hipotezą będzie, że Vl— v2}c2 dt (26.27) P°winno być czterowektorem. Ale co to jest v? Jest to prędkość cząstki, a nie układu współ-
112 26 LORENTZOWSKIE TRANSFORMACJE PÓL rzędnych! AtwtCtm wielkość zdefiniowana przez i ' , 1 T X / Fv F \ ~ 4 = —' (26.28) \ 1/1 — v2/c2 /l — v2/c2 / stanowi rozszerzenie pojęcia siły na cztery wymiary — można ją nazwać „czterosiłą”. Jest to oczywiście czterowektor, a jego składowe przestrzenne nie są składowymi F, ale składowymi F/j/1—v2lc2. Pytanie brzmi: dlaczego 4 jest czterowektorem? Dobrze byłoby zrozumieć trochę rolę tego czynnikal/j/1 — v2/c2. Ponieważ pojawił się on teraz dwa razy, czas już zrozumieć, dlaczego djdt można zawsze „uzdrowić” tym samym czynnikiem. Odpowiedź jest nastę- pująca: Gdy bierzemy pochodną czasową jakiejś funkcji x, to obliczamy przyrost Ax dla małego przedziału At zmiennej t. Ale w innym układzie odniesienia przedział At mógłby odpowiadać zmianom zarówno i', jak i x', a zatem jeżeli zmienić tylko i', to zmiana x będzie inna. Musi się więc znaleźć taką zmienną naszego różniczkowania, która będzie miarą „przedziału” czasoprzestrzeni i to miarą, która będzie taka sama we wszyst- kich układach odniesienia. Gdy cząstka „porusza się” w czteroprzestrzeni, jej współrzędne doznają zmiany: At, Ax, Ay, Az. Czy z tych wielkości da się utworzyć niezmienniczy przedział? No cóż, są to składowe czterowektora xtt = (et, x, y, z), tak że jeżeli zdefiniu- jemy wielkość As: • ' (As)2 = — Ax Ax„ =—~ (c2At2—Ax2—Ay2—Az2), (26.29) c2 c2 która jest czterowymiarowym iloczynem skalarnym, to otrzymamy wówczas dobry cztero- wektor, którego długość można użyć za miarę czterowymiarowego przedziału. Z As — lub z jej granicy ds — możemy określić parametr s = Jds. A pochodna względem s jest przy- jemną operacją czterowymiarową, ponieważ jest ona niezmiennikiem przekształcenia Lorentza. Łatwo można związać ds z dt dla poruszającej się cząstki. Dla cząstki punktowej, będącej w ruchu, dx = vxdt, dy = vydt, dz = v.dt (26.30) oraz , , ds — V(dt2/c2)(c2—v2—v2—v2) = dt^\—v2lc2. (26.31) A zatem pperator 1 d j/f-u2/? dt jest operatorem niezmienniczym. Jeżeli podziałamy nim na jakiś czterowektor, to otrzy- mamy inny czterowektor. Tak na przykład, jeżeli podziałamy nim na (ct, x, y, t), to dosta- niemy czteroprędkość u^: dx -~- = ua. ds Widać teraz jasno „uzdrawiąjąc<" rolę czynnika 1//1—v2/c2. \
2^4. RÓWNANIA RUCHU W ZAPISIE RELATYWISTYCZNYM 113 Niezmiennicza zmienna s jest pożyteczną wielkością fizyczną. Nazywa się ją „czasem własnym” wzdłuż toru cząstki, ponieważ ds jest zawsze przedziałem czasu w układzie od- niesienia, który się porusza w każdej poszczególnej chwili wraz z cząstką. (Wówczas = zly = zlz = 0 a = Jt.) Jeżeli potrafilibyśmy sobie wyobrazić „zegar”, którego chód nie zależy od przyspieszenia, to taki zegar, przenoszony wraz z cząstką, pokazywałby czas s. Możemy się teraz cofnąć i wypisać' prawa Newtona (tak jak je poprawił Einstein) w zgrabnej postaci: . > (26.32) as gdzie jest określone równaniem (26.28). Również pęd można zapisać jato dx p=mou=mo—^-, (26.33) as gdzie współrzędne x/t = (cl, x, y, z) opisują teraz tor cząstki. Wreszcie, zapis cztero- wymiarowy pozwala nam zapisać równanie ruchu w takiej oto bardzo prostej postaci: = (26.34) ds2 która przypomina postać F = ma. Należy jednak zauważyć, że równanie (26.34) nie jest) takie samo jak równanie F = ma, ponieważ czterowymiarowa postać równania (26.34) zawiera w sobie prawa mechaniki relatywistycznej, które różnią się od prawa Newtona dla wielkich prędkości. Mamy tu odmienną sytuację niż w przypadku równań Maxwella, gdzie mogliśmy przepisać równania w postaci relatywistycznej, nie zmieniając ich zna- czenia, gdyż była to tylko zmiana metody zapisu. Powróćmy teraz do równania (26.24) i zobaczmy, jak można zapisać prawą stronę w zapisie czterowektorowym. Trzy składowe — po podzieleniu przez j/1—v2/c2 — są składowymi f?, tak że . f = ?(E+*xB)x = /l— v2/c2 (26.35) Musimy teraz wszystkie wielkości wyrazić w ich zapisie relatywistycznym. Przede wszyst- kim 1/j/l—v2/c2, vy/y/l— v2/c2 i vz/j/l— v2/c2 są składowymi w kierunkach t,y i z cztero- Prędkości u^. Z tabeli 26.1 można wziąć składowe F^, odpowiadające składowym Ex, & z i By-, wtedy fx Q^Ft^xt MyFxy UzFxz)> O " Wykłady z fizyki
114 26. LORENTZOWSKIE TRANSFORMACIE PÓL co zaczyna wyglądać interesująco. Każdy wyraz ma wskaźnik x, co wyglada sensownie, bo szukamy składowej x-owej. Następnie, wszystkie pozostałe wskaźniki występują parami tt,yy,zz — nie ma tylko pary xx. No, to dopiszemy po prostu ten brakujący wyraz: fx = q{UtPX-^XFXX-^yFXy-‘ UzFxz) (26.36) Postępując tak niczego nie zmieniliśmy, bo tensor jest antysymetryczny i Fxx = 0. To wstawienie wyrazu xx pozwala nam zapisać równanie w „stenograficznej” postaci 4 = (26.37) Równanie to jest takie samo jak równanie (26.36), jeżeli przyjąć regułę, że zawsze, gdy jakiś wskaźnik pojawia się dwa razy (tak jak wskaźnik v tutaj), to automatycznie wykonu- jemy po nim sumowanie, tak samo jak w przypadku iloczynu skalarnego, korzystając z tej samej umowy dla znaków. Łatwo można uwierzyć, że równanie (26.37) określa równie dobrze dla [i = y lub p, ~ z, ale co będzie dla p = t? Zobaczmy, ot dla zabawy, co nam daje równanie (26.37): ft tłfytFtt tixFtx uyFty u2Ftj). Musimy teraz z powrotem „przetłumaczyć” to wyrażenie na oznaczenia Ł i B. Otrzy- mujemy: f, = q 0+ Ex+ -—L= Ą+ \ F7!—v2/c2 F7! — v2/c2 F7! —v2/c2 czyli r = ?V'E Jl /1=^72 ‘ Ale z równania (26.28) wynika, że ft powinno być równe (26.38) F-v __ ę(E+vxB)-v F7!- v2/c2 ]/l—v2/c2 A to jest to samo, co równanie (26.38), gdyż (vxB)-v jest równe zeru. A więc wszystko się zgadza. Podsumowując, nasze równanie ruchu można zapisać w eleganckiej postaci: w0 , 2 tfUfFp, as (26.39) Chociaż to miło zobaczyć, że da się zapisać równania w ten sposób, to taka postać nie jest zbyt pożyteczna. Zwykle wygodniej jest rozwiązywać ruchy cząstki korzystając z piet* wotnych równań (26.24) i tak właśnie będziemy zwykle czynić.
27 energia i pęd pola 27-1. Lokalna zasada zachowania Zdajemy sobie jasno sprawę z tego, że energia obiektów materialnych nie jest zachowy- wana. Kiedy jakiś obiekt promieniuje światło, traci energię. Jednakże istnieje możliwość, że tę stratę energii można przedstawić jako jakąś inną postać energii, na przykład jako światło. Dlatego też teoria zachowania energii nie jest pełna, jeżeli nie wziąć pod uwagę energii związanej ze światłem lub ogólnie — z polem elektromagnetycznym. Zajmiemy się teraz zasadą zachowania energii oraz zasadą zachowania pędu dla pól. Z pewnością nie można rozważać obu tych zasad oddzielnie, bo w teorii względności pęd i energia stanowią dwa różne aspekty tego samego czterowektora. Na początku tomu I omawialiśmy zasadę zachowania energii; powiedzieliśmy wtedy zaledwie, że całkowita energia w świecie jest stała. Chcemy teraz dokonać pewnego istot- nego uogólnienia zasady zachowania energii — uogólnienia, które powie nam szczegó- łowo o tym, jak energia jest zachowywana. Ta nowa zasada będzie mówić, że jeżeli energia zanika w jakimś obszarze, to zachodzi to dlatego, że energia wypływa poprzez granice tego obszaru. Jest to nieco mocniejsza zasada niż zasada zachowania energii bez tego zastrzeżenia. Aby zobaczyć, co oznacza to uogólnienie, przypatrzmy się, jak działa zasada zachowa- na ładunku. Zasadę zachowania ładunku opisaliśmy mówiąc, że istnieje gęstość prądu j 1 gęstość ładunku q i kiedy ładunek maleje w jakimś miejscu, to z tego miejsca musi na- stąpić wypływ ładunku. Nazywamy to zasadą zachowania ładunku. Matematyczną posta- Ci4 tej zasady zachowania jest równanie (27.1)
116 27. ENERGIA I PĘD POLA 27.1. Dwa „sposoby” na zachowanie ła- dunku: a) Qi+Q2 jest stałe; b) dQ-Jdt = = / j-n da = —dQ2!dt wamy „lokalną” zasadą zachowania, po to Na skutek tej zasady całkowity ładunek w świecie jest zawsze stały — nigdy nie ma wy- padkowego przyrostu lub straty ładunku. Je- dnakże całkowity ładunek w świecie mógłby pozostać stały w inny sposób. Przypuśćmy, że w pobliżu jakiegoś punktu (1) znajduje się pewien ładunek Qr, podczas gdy w pobliżu jakiegoś punktu (2), znajdującego się w pewnej odległości od punktu (1), nie ma ładunku (rys. 27.1). Przypuśćmy teraz, że w miarę upływu czasu ładunek 2i będzie stopniowo zanikał i że równocześnie z maleniem będzie się pojawiał pewien ładunek Q2 w pobliżu pun- ktu (2) w taki sposób, że w każdej chwili suma ładunków Qi i Q2 będzie stała. Innymi słowy, w każdym stanie pośrednim ilość ładunku stracona przez Qi będzie dodana do Q2. Wówczas całkowity ładunek w świecie byłby zachowany. To jest zasada zachowania na skalę „światową”, a nie zasada, którą nazy- bowiem, aby ładunek dostał się z punktu (1) do (2) nie musi się on pojawić nigdzie w przestrzeni pomiędzy punktami (1) i (2). Lokal- nie ładunek został po prostu „stracony”. W teorii względności z taką „światową” zasadą zachowania jest związana pewna trudność. Pojęcie „chwil równoczesnych” w odległych od siebie punktach nie jest w róż- nych układach równoważne. Dwa zdarzenia, które są równoczesne w jednym układzie, nie są równoczesne w innym układzie, poruszającym się względem pierwszego. Dla „świa- towego” zachowania typu powyżej opisanego, konieczne jest, aby ładunek stracony z Q\ pojawił się równocześnie w Q2. W przeciwnym wypadku byłyby pewne chwile, w których ładunek nie byłby zachowany. Wydaje się, że nie ma sposobu, aby uczynić zasadę zacho- wania ładunku relatywistycznie niezmienniczą bez nadania tej zasadzie charakteru „lokalnej” zasady zachowania. Prawdę mówiąc, żądanie lorentzowskiej niezmienniczości relatywistycznej wydaje się ograniczać w zdumiewający sposób dopuszczalne prawa przy- rody. W nowoczesnej kwantowej teorii pola, na przykład, chciano często zmodyfikować teorię przez dopuszczenie tego, co się nazywa oddziaływaniem „nielokalnym” — kiedy coś, co znajduje się tutaj, oddziaływa bezpośrednio na coś znajdującego się tam — ale popadano w kłopoty związane z zasadą względności. „Lokalna” zasada zachowania polega na czymś innym. Mówi ona, że ładunek może się dostać z jednego miejsca do drugiego tylko w tym przypadku, jeżeli w przestrzeni pomiędzy tymi miejscami coś się dzieje. Dla opisu tej zasady potrzebna jest nie tylko gęstość ładunku q, ale również inny typ wielkości, a mianowicie wektor j, określający szyb- kość przepływu ładunku przez powierzchnię. Ten przepływ jest następnie związany z szyb' kością zmiany gęstości ładunku równaniem (27.1). Jest to bardziej skrajny typ zasady za-
27,1. LOKALNA ZASADA ZACHOWANIA 117 chowania. Mówi ona, że ładunek jest zachowany w pewien szczególny sposób — zacho- wany „lokalnie”. Okazuje się, że zachowanie energii jest także procesem lokalnym. W danym obszarze przestrzeni dana jest nie tylko gęstość energii, ale także i wektor, który ma przedstawić szybkość wypływu energii przez powierzchnię. Tak na przykład w przypadku, gdy źródło świetlne promieniuje, można znaleźć energię świetlną wysyłaną przez to źródło. Jeżeli wyobrazić sobie pewną powierzchnię matematyczną, otaczającą źródło światła, to energia stracona w obszarze ograniczonym tą powierzchnią jest równa energii, która przez tę powierzchnię wypływa na zewnątrz. 27-2. Zasada zachowania energii i elektromagnetyzm Chcemy teraz opisać jakościowo zasadę zachowania energii w przypadku elektro- magnetyzmu. Aby to zrobić, musimy określić, ile energii znajduje się w dowolnym elemen- cie objętości przestrzeni oraz znaleźć szybkość przepływu energii. Przypuśćmy, że najpierw zajmiemy się tylko energią pola elektromagnetycznego. Niech u określa gęstość energii pola (tzn. ilość energii na jednostkową objętość w przestrzeni), a wektor S niech określa strumień energii pola (tzn. energię przepływającą w jednostce czasu przez jednostkową powierzchnię, prostopadłą do kierunku przepływu). Wówczas na zasadzie ścisłej analogii z zasadą zachowania ładunku [równanie (27.1)] można napisać „lokalną” zasadę zacho- wania energii w polu: — = -VS. dt (27.2) Oczywiście, zasada ta nie jest w ogólnym przypadku prawdziwa; nie jest bowiem prawdą, że energia samego tylko pola jest zachowana. Przypuśćmy, że znajdujemy się w ciemnym pokoju i że w pewnej chwili przekręcamy kontakt lampy. Nagle pokój jesl Pełen światła, a więc w polu jest energia, chociaż poprzednio wcale jej nie było. Rów- nanie (27.2) nie jest pełną zasadą zachowania, ponieważ nie jest zachowana sama energia P°la, a zacnowana jest jedynie całkowita energia światła — a więc ponadto jeszcze energia obiektów materialnych. Energia pola będzie się zmieniać, jeżeli materia będzie wykonywać Pewną pracę na polu albo też jeżeli pole wykona pewną pracę na materii. Jeżeli jednak w interesującym nas obszarze przestrzennym występuje materia, to wiemy, *]e ona ma energii. Każda cząstka ma energię moc2//!—v2/c2. Całkowita energia materii Jest więc po prostu sumą wszystkich energii cząstek, a przepływ tej energii przez powierzch- jest równy po prostu sumie energii niesionych przez każdą cząstkę, która przechodzi ^2ez Powierzchnię. Teraz chcemy mówić tylko o energii pola elektromagnetycznego. s«ny zatem napisać równanie, które będzie stwierdzeniem, że całkowita energia pola sku^111 °^szarze maleje <tlbo na skutek wypływu energii pola z tego obszaru, albo na ^go, że pole traci swoją energię na rzecz materii (lub zyskuje energię, co odpowiada
\ S-n da + (praca wykonana na materii wewnątrz K). (27.3) 118 27. ENERGIA I PĘD POŁĄ ujemnej stracie). W obszarze V jest energia pola równa \“dV- V a szybkość jej malenia jest równa pochodnej czasowej z tej całki wziętej ze znakiem minus. Wypływ energii pola na zewnątrz z obszaru V jest równy całce ze składowej normalnej S po powierzchni 27 otaczającej V, J S b da. Tak więc udV = s Widzieliśmy poprzednio, że pole wykonuje w jednostce czasu pracę na każdej jednostce objętości materii równą E-j. [Siłą działającą na cząstkę jest F = ę(E+vxB), a praca wykonana w jednostce czasu jest równa F-v = ęE-v. Jeżeli w jednostce objętości jest N cząstek, to praca wykonana w jednostce czasu i w jednostce objętości jest równa AfyE-v, ale Nqy — j.] Zatem wartość iloczynu E-j musi być równa energii straconej w jednostce czasu i w jednostce objętości przez pole. Równanie (27.3) przybiera teraz postać — y fudV= fs-oda+ fE-jdK (27.4) To jest nasza zasada zachowania energii w polu. Można przekształcić ją na równanie różniczkowe typu równania (27.2), jeżeli zamienić drugi wyraz na całkę objętościową. Można to zrobić łatwo posługując się twierdzeniem Gaussa. Całka powierzchniowa ze składowej normalnej S jest równa całce z dywergencji wektora S po obszarze ograniczo- nym powierzchnią £. Tak więc równanie (27.3) jest równoważne równaniu V-SdV+f E-jdV, V ’ V V gdzie pochodną czasową pierwszego wyrazu wprowadziliśmy pod znak całki. Ponieważ równanie to jest prawdziwe dla dowolnego obszaru V, znaki całek można usunąć i rów- nanie energii dla pola elektromagnetycznego przybierze postać = V-S+E-j. (27.5) dt Równanie to nie daje nam jednak żadnych korzyści, jeżeli nie wiemy, czym są wiel- kości u i S. Być może, powinniśmy po prostu powiedzieć, jak się one wyrażają poprzez pola E i B, gdyż w rzeczywistości zależy nam tylko na ostatecznym wyniku. WolW jednak pokazać, jakim rozumowaniem posłużył się Poynting w r. 1884 dla otrzymam8 wzorów na m i S i zobaczyć skąd się one biorą. (Znajomość tego wyprowadzenia nie będzie jednak potrzebna do zrozumienia dalszej części tych wykładów.)
7.3. gęstość energii i strumień energii 119 27-3. Gęstość energii i strumień energii w polu elektromagnetycznym Pomysł sprowadza się do założenia, że istnieje gęstość energii pola u i strumień energii S, które zależą tylko od pól E i B. (Wiemy na przykład, że w elektrostatyce gęstość energii można zapisać jako |eoE-E). Oczywiście, u i S mogłyby zależeć od potencjałów lub czegoś innego, ale zobaczmy, do czego potrafimy dojść. Można spróbować przepisać wiel- kość E-j w taki sposób, aby się stała sumą dwóch wyrazów: jednego, który jest pochodną czasową pewnej wielkości, i drugiego, który jest dywergencją, pewnej innej wielkości. Tą pierwszą wielkością będzie u, a drugą S (z odpowiednimi znakami). Obie wielkości należy wyrazić tylko poprzez pola; to znaczy, że chcemy zapisać naszą równość jako Su _ E-j = - — -VS. . (27.6) Lewą stronę tej równości należy wyrazić tylko poprzez pola. Jak to można zrobić? Oczywiście, korzystając z równań Maxwella. Z równania Maxwella dla rotacji pola B , SE j = eoc2V XB—e0—• dt Podstawiając tę wartość do równości (27.6) otrzymujemy wyrażenie, w którym występują tylko wielkości E i B: SE Ej = £oc2E-(V xB)—e0E = —-. (27.7) ot Częściowo już skończyliśmy. Ostatni wyraz jest pochodną czasową — jest to (S/St) x X(|e0E-E). A więc |eoE-E stanowi przynajmniej jedną część u. Teraz pozostało nam tylko przekształcić drugi wyraz w dywergencję pewnego pola wektorowego. Na pierwszy rzut oka moglibyśmy sądzić, że pierwszy wyraz po prawej stronie rów- nania (27.7) jest z dokładnością do współczynnika e0c2 równy (VxB)-E. (27.8) A jak wiemy z algebry wektorów, iloczyn (axb)-c można zastąpić iloczynem a-(bxc), tak że nasz wyraz powinien także być równy V-(BxE), (27.9) czyli dywergencji „pewnej wielkości”, tak jak chcielibyśmy. Tylko że to jest źle! Ostrze- galiśmy poprzednio, że operator V jest „podobny” do wektora, ale nie „dokładnie” 2 nim identyczny. Powodem tej „różnicy” jest dodatkowa konwencja rachunku różnicz- kowego: kiedy operator różniczkowy stoi przed iloczynem, to działa on na wszystko, c° się znajduje po jego prawej stronie. W równaniach (27.7) operator V działa tylko na P°le B, a nie na pole E. Ale w postaci (27.9) ze zwykłej umowy wynikałoby, że V działa Zarówno na B, jak i na E. A to nie jest to samo. Istotnie, gdybyśmy wypisali składowe
120 27. ENERGIA I PĘD POŁĄ wyrażenia V-(BxE), stwierdzilibyśmy, że jest ono równe E-(VxB) plus kilka dodatko- wych wyrazów. Sytuacja jest podobna do tego, co się dzieje, gdy obliczamy w rachunku różniczkowym pochodną z iloczynu. Tak na przykład d df dg ~r (fg) = ~rg+f-r- dx dx dx Zamiast wypisywać wszystkie składowe wyrażenia V-(BxE) wolimy raczej zastosować pewien fortel, który jest bardzo użyteczny w problemach tego typu. Fortel ten pozwala na używanie wszystkich reguł algebry wektorowej wobec wyrażeń zawierających operator V, bez popadania w kłopoty. Polega on na odrzuceniu — przynajmniej na chwilę — reguły zapisu rachunku różniczkowego, mówiącej, na co działa operator różniczkowy. Otóż kolejność wyrazów jest zwykle wykorzystywana dla dwóch odrębnych celów. Jeden z nich dotyczy rachunku różniczkowego: f(djdx)g to nie jest to samo co g(d!dx')f-, a drugi do- tyczy wektorów: axb jest różne od bxa. Można, jeżeli się chce, zrezygnować chwilowo z reguły rachunku różniczkowego. Zamiast mówić, że pochodna działa na wszystkie wyrażenia występujące po jej prawej stronie, utwórzmy nową regułę, w której nie ważna jest kolejność, w jakiej wypisujemy wyrazy. Wówczas będziemy mogli żonglować wyraza- mi, o nic się nie martwiąc. Oto nasza umowa: przy pomocy wskaźnika będziemy zaznaczać, na co działa opera- tor; kolejność wyrazów nie ma żadnego znaczenia. Przyjmijmy na przykład, że operator D zastępuje dfdx. Wówczas Df oznacza, że się bierze tylko pochodną z wielkości f. A więc df Dff=—. dx A jeżeli mamy Dffg, to .n - z df\ * Ale zauważmy teraz, że zgodnie z naszą nową regułą, fDjg aa&cza. to samo! Tę samą rzecz można zapisać w dowolny sposób: Dffg = gDff = fDfg =fgDf. Widać, że Df może występować nawet jako ostatni czynnik „iloczynu”. (Zdumiewające, że taki wygodny sposób zapisu nie bywa nigdy wykładany w książkach matematycznych czy też fizycznych.) Można by zadać pytanie: Co będzie, gdy zechcę napisać pochodną iloczynu /g? Chcę mieć pochodną obu czynników. To proste — postępujemy właśnie tak, jak mówimy; piszemy £y(/g)+Z)g(/g). A to jest równe g(S//5x)4-/(Sg/5x), co w naszym starym za- pisie oznaczaliśmy przez d(fg)ldx. Zobaczymy, że teraz możemy bardzo łatwo uzyskać nowe wyrażenie dla V-(BxE). Zaczynamy od przejścia do nowego zapisu; piszemy: V-(BxE) = Vb-(BxE)+V£-(BxE). (27.10)
27-3. GĘSTOŚĆ ENERGII I STRUMIEŃ ENERGII 121 Od tej chwili nie musimy już zachowywać kolejności wyrazów. Zawsze wiemy, że działa tylko na E, a działa tylko na B; w tej sytuacji można posługiwać się opera- torem V jak gdyby był on zwykłym wektorem. (Oczywiście, kiedy już skończymy, będzie- my musieli powrócić do „normalnego” zapisu, którego każdy zwykle używa.) Tak więc możemy teraz dokonywać różnych operacji i zmieniać na przykład kolejność czynników w iloczynach skalarnych i wektorowych lub dokonywać innych przestawień zgodnych z algebrą wektorów. Tak na przykład, środkowy wyraz równania (27.10) można prze- pisać jako E-VbxB. (Pamiętamy, że a bxc = b cxa.) A ostatni wyraz jest taki sam, jak iloczyn B'ExV£. Wygląda to dość dziwacznie, ale to nic nie szkodzi. Jeżeli spróbu- jemy teraz powrócić do normalnego zapisu, to musimy dokonać takich przestawień, aby operator V działał tylko na swoją „własną” zmienną. Pierwszy wyraz ma już taką po- stać, tak że wskaźnik w nim można odrzucić. Drugi wyraz wymaga takiego przekształ- cenia, aby operator V występował przed wektorem E. Można to zrobić przez odwrócenie kolejności czynników w iloczynie wektorowym i przez zmianę znaku: B-(ExV£) = -B-(V£xE). Teraz mamy już tradycyjną kolejność i możemy powrócić do zwykłego zapisu. Równa- nie (27.10) jest równoważne równaniu V-(BxE) = E-(VxB)-B-(VxE). (27.11) (W tym szczególnym przypadku szybszą metodą byłoby rozpisanie na składowe, ale warto było poświęcić trochę czasu na pokazanie tego matematycznego fortelu. Prawdo- podobnie nigdzie indziej go nie spotkacie, a jest on bardzo pożyteczny do wyzwolenia algebry wektorowej spod reguł dotyczących kolejności wyrazów przy brańiu pochodnych.) Powracamy teraz do naszych rozważań o zasadzie zachowania energii i wykorzysta- my nasz nowy wynik, równanie (27.11), do przekształcenia wyrazu VxB w równaniu (27.7). To równanie energii przybiera postać E-j = eoc2V-(BxE)+e0c2B-(VxE)— Qe0E-E). ' (27.12) ot Widać teraz, że już prawie skończyliśmy. Ostatni z występujących tu wyrazów jest piękną pochodną względem t i użyjemy go do wyznaczenia u; występuje tu też wyraz, który jest przepiękną dywergencją, a więc pomoże nam określić S. Na nieszczęście pozostaje jeszcze środkowy wyraz, który nie jest ani dywergencją, ani pochodną względem t. Tak więc °d osiągnięcia celu dzieli nas jeszcze jeden krok. Zastanówmy się trochę i przyjrzyjmy S1? z powrotem różniczkowym równaniom Maxwella, a odkryjemy, że VxE jest, na szczęście, równe — dB/dt, co oznacza, że dodatkowy człon można przekształcić w coś, co jest czystą pochodną czasową: B-(VxE) = B- Teraz mamy już dokładnie to, czego chcieliśmy.
122 27. ENERGIA I PĘD POĘą Nasze równanie energii wygląda następująco: d I e0 c2 e0 \ Ej = V-(eoc2BxE)--M— BB+-^EE , (27.13) ot \ 2 2 f ' co będzie identyczne z równaniem (27.6), jeżeli tylko wprowadzimy definicje “ "Z'' « = yE’E+~B-B (27.14) oraz ' - ' S = e0c2ExB. .t / * ’ , (27.15) (Przestawienie kolejności czynników w iloczynie wektorowym powoduje potrzebną zmia- nę znaku.) Nasze wysiłki zakończyły się sukcesem. Otrzymaliśmy wyrażenie na gęstość energii, będące sumą „elektrycznej” gęstości energii i „magnetycznej” gęstości energii, których postacie są takie same jak te, które znaleźliśmy w statyce, kiedy to wyrażaliśmy energię poprzez pola. Znaleźliśmy także wzór na wektor strumienia energii pola elektromagne- tycznego. Ten nowy wektor, S = eoc2ExB nosi imię swego odkrywcy; nazywamy go „wektorem Poyntinga”. Wyraża on szybkość, z jaką energia pola przemieszcza się w prze- strzeni. Energia, która przepływa w ciągu jednej sekundy przez małą powierzchnię da jest równa S-n<źa, gdzie n jest wektorem jednostkowym, prostopadłym do da. (Teraz, gdy już mamy nasze wzory na u i S, Czytelnik może zapomnieć, jeśli sobie tego życzy, w jaki sposób zostały uzyskane.) 27-4. Niejednoznaczność w energii pola Zanim się zajmiemy pewnymi zastosowaniami wzorów Poyntinga (równania (27.14) i (27.15)], chcielibyśmy powiedzieć, że w rzeczywistości wcale tych wzorów nie „udowod- niliśmy”. Znaleźliśmy tylko możliwe „u" i możliwe „S”. Skąd wiemy, że gdy jeszcze tro- chę pożonglujemy wyrazami, to nie potrafimy znaleźć innego wzoru na „w” i innego wzoru na „S”. Te nowe S i nowe u mogłyby być różne od starych, ale spełniałyby w dal- szym ciągu równanie (27.6). To jest możliwe. Można to zrobić, ale znalezione nowe wy- rażenia zawsze zawierać będą różne pochodne pola (i to zawsze w wyrazach drugiego rzędu, jak na przykład drugą pochodną lub kwadrat pierwszej pochodnej). W istocie istnieje nieskończona liczba różnych możliwości dla u i S, a jak dotąd, nikt nie pomyślał o do- świadczalnej metodzie stwierdzenia, która z nich jest słuszna! Domyślono się, że najpros- tsza z tych możliwości jest prawdopodobnie tą poprawną, ale należy powiedzieć, że nie wiemy na pewno, jaka jest rzeczywista lokalizacja w przestrzeni energii pola elektromagne- tycznego. A więc i my wybierzemy najprostsze wyjście i będziemy mówić, że energia pola jest dana równaniem (27.14). Wówczas wektor strumienia energii S musi być określony równaniem (27.15). Ciekawe — wydaje się, że nie ma jednoznacznego sposobu na usunięcie nieokreśloności w lokalizacji energii pola. Czasami się twierdzi, że zagadnienie to można rozwiązać p°* sługując się następującym rozumowaniem na gruncie teorii grawitacji. W teorii grawita-
27-4. niejednoznaczość w energii pola 123 cji każda energia jest źródłem przyciągania grawitacyjnego. Dlatego też, jeżeli mamy wie- dzieć, w jakim kierunku działa siła ciężkości, gęstość energii elektryczności musi być odpowiednio zlokalizowana. Jednak — jak dotąd — nikt nie wykonał tak precyzyjnego doświadczenia, które pozwoliłoby określić dokładną lokalizację efektu grawitacyjnego pól elektromagnetycznych. To, że pole elektromagnetyczne może być samo źródłem siły grawitacyjnej, jest postulatem, bez którego trudno sobie poradzić. Istotnie, zaobserwo- wano, że światło ulega odchyleniu przechodząc w pobliżu Słońca; można by powiedzieć, 2e Słońce przyciąga do siebie światło. Czyż nie wypada uznać, że światło przyciąga z rów- ną siłą Słońce? W każdym razie wszyscy uznają zawsze te proste wyrażenia, które zna- leźliśmy na lokalizację energii elektromagnetycznej i jej strumienia. A chociaż czasami uzyskane przy ich pomocy wyniki wydają się dziwne, to nikt jeszcze nie znalazł, aby coś z tymi wyrażeniami było nie w porządku, tzn. nie znaleziono sprzeczności z doświadcze- niem. Tak więc będziemy naśladować wszystkich, a poza tym wierzymy, że jest to prawdo- podobnie jak najbardziej słuszne. Powinniśmy uczynić jeszcze jedną uwagę dotyczącą wzoru na energię. Przede wszyst- kim, energia przypadająca na jednostkę objętości pola ma bardzo prostą postać: jest to energia elektrostatyczna plus energia magnetyczna, jeżeli energię elektrostatyczną wy- razi się przez E2, a energię magnetyczną przez B2. Podczas rozwiązywania zagadnień elek- trostatycznych znaleźliśmy dwa wyrażenia, które mogły określać energię. Oprócz tego zna- leźliśmy wtedy też kilka innych wzorów na energię w polu elektrostatycznym, takich jak który w przypadku elektrostatycznym był równy całce z E-E. Jednakże dla pola elektrodynamicznego ta równość upadła i nie było jakiegoś oczywistego powodu, dzięki któremu można by było wybrać jedno z tych wyrażeń jako prawdziwe. Podobnie znaleź- liśmy wzór na energię magnetyczną. Jest on słuszny ogólnie. Jedynym poprawnym wzo- rem na gęstość energii pól dynamicznych jest równanie (27.14). 27-5. Przykłady strumienia energii Nasz wzór na wektor strumienia energii S — to całkiem coś nowego. Chcemy teraz zobaczyć, co nam ten wzór daje w kilku szczególnych przypadkach, a także zobaczyć, czy nie sprowadza się on do czegoś, co już znamy.’ Ja- ko pierwszy przykład rozpatrzymy światło. W fali świet- lej wektory E i U są prostopadłe do siebie, a także do kierunku rozchodzenia się fali (patrz rys. 27.2). W fali elektromagnetycznej wartość bezwzględna we- ktora B jest równa 1/c razy wartość bezwzględna wekto- ra E, a ponieważ wektory te tworzą kąt prosty E2 ExB =—. c Stąd dla światła przepływ energii przez jednostkę powie- rzchni w ciągu sekundy jest równy S = e0cE2. (27.16) 27.2. Wektory E, B i S dla fali świetlnej x E v kierunek S
124 27. ENERGIA I PĘD POLA. Dla fali świetlnej, w przypadku której E = Eo cos co (t—x/c), średnia szybkość przeply. wu energii przez jednostkę powierzchni, <S)śr (nazywana „natężeniem” światła) jest równa wartości średniej kwadratu pola elektrycznego razy eoc: natężenie = <S>śr = £0c<£2>śr. (27.17) *. - Wierzcie w to lub nie wierzcie, ale ten sam wzór wyprowadziliśmy już w § 31 - 3 tomu I (cz. 2), kiedy to uczyliśmy się o świetle. Można uwierzyć, że wynik ten jest poprawny, ponieważ sprawdza się on jeszcze z czymś innym. Kiedy mamy wiązkę światła, to w prze- strzeni jest jakaś gęstość energii dana równaniem (27.14). Podstawiając cB = E dla fali świetlnej otrzymujemy E2 Ale pole E zmienia się w przestrzeni, tak że średnia energia jest równa <u>śr = £0<E2>śr. (27.18) No i wszystko się zgadza; jest to takie samo równanie, jak równanie (27.17). Weźmy teraz inny przykład. Jest on chyba dość ciekawy. Przypatrzmy się mianowicie przepływowi energii w kondensatorze, który powoli ładujemy. (Nie chcemy tak wielkich częstości, aby kondensator zaczął się zachowywać jak wnęka rezonansowa, ale nie chce- my też prądu stałego.) Przypuśćmy, że użyjemy zwykłego, kolistego kondensatora pła- skiego, pokazanego na rys. 27.3. Wewnątrz kondensatora jest prawie jednorodne pole elektryczne, które się zmienia w czasie. W każdej chwili całkowita energia elektromagne- tyczna wewnątrz kondensatora jest równa iloczynowi u i objętości kondensatora. Jeżeli promień płytek jest równy a, a ich odstęp wynosi h, to całkowitą energią po- między płytkami będzie U = (27.19) 27.3. W pobliżu ładującego się kondensatora wektor Poyntinga układa się radialnie wokół osi kondensatora (27.20) Energia ta zmienia się wraz ze zmianami pola E. Kiedy kondensator się ładuje, to do obszaru pomiędzy płytkami dopływa energia z szybkością dU ----= e0 hEE. dt Musi więc zachodzić przepływ energii — skądś do obsza- ru wewnątrz kondensatora. Moglibyśmy oczywiści® sądzić, że ten przepływ „przybywa” przewodami, a’e tak nie jest! Nie może on bowiem z tego kierunku wejść do przestrzeni pomiędzy płytkami, ponieważ pole jest prostopadłe do płytek; a ExB musi być do nich równolegle.
27-5. PRZYKŁADY STRUMIENIA ENERGII 125 Pamiętamy oczywiście, że gdy kondensator się ładuje, wokół jego osi powstaje pole magnetyczne o symetrii walcowej. Opisywaliśmy to w rozdz. 23. Korzystając z ostatnie- go równania Maxwella znaleźliśmy, że pole magnetyczne przy krawędzi kondensatora jest dane wzorem 2nac2B = £• na2, czyli ' 1 Jego kierunek jest pokazany na rys. 27.3. Mamy więc strumień energii, proporcjonalny do E xB. Strumień ten dopływa w każdym punkcie wokół krawędzi, tak jak to pokazano na rysunku. Energia w rzeczywistości nie dopływa wzdłuż drutów, ale z przestrzeni ota- czającej kondensator. Sprawdźmy, czy całkowity przepływ energii poprzez całą powierzchnię pomiędzy krawędziami płytek równa się (czy też nie) szybkości zmian energii wewnątrz. Lepiej by było, gdyby się równał. Właściwie całą tę pracę wykonaliśmy już przy wyprowadza- niu równania (27.15), no ale zobaczmy to jeszcze raz. Pole powierzchni pomiędzy kra- wędziami płytek jest równe 2nah, a wielkość S = eqc2ExB jest równa „ / a • eoc2E —-E \2c2 a więc całkowity strumień energii wynosi na2he0EE. To się w pełni zgadza z równaniem (27.20). Przedziwne! Okazuje się, że gdy ładujemy kon- densator, energia nie dopływa wzdłuż drutów; dopływa ona poprzez „pobocznicę” odstępu pomiędzy płytkami. Tak, to właśnie mówi nam ta teoria! Jak to jest możliwe? Nie jest to łatwe py- tanie, ale spróbujmy na nie odpowiedzieć w ta- ki oto sposób. Przypuśćmy, że nad, pod i dale- ko poza kondensatorem są jakieś ładunki. Je- żeli te ładunki są daleko od kondensatora, to otacza go słabe, ale niezmiernie „rozpostarte” Pole elektryczne (patrz rys. 27.4). Następnie, Ze zbliżaniem się ładunków do siebie, pole w pobliżu kondensatora zwiększa się. Tak więc energia pola, która jest początkowo daleko P°za kondensatorem, przesuwa się ku niemu 1 w końcu dociera pomiędzy płytki. Teraz z kolei zapytajmy, co się dzieje w ka- wałku drutu oporowego, kiedy przepływa 27.4. Pola istniejące na zewnątrz kondensa- tora, gdy ten jest ładowany przez sprowa- dzenie dwóch ładunków z dużej odległości
126 27. ENERGIA I PĘD POLA przez niego prąd. Ponieważ drut ma opór, musi w jego wnętrzu istnieć pole elektry- czne, powodujące przepływ prądu. Po- nieważ wzdłuż drutu następuje spadek potencjału, to także tuż na zewnątrz dru- tu musi istnieć pole elektryczne, równo- ległe do jego powierzchni. (patrz rys. 27.5.) Dodatkowo, na skutek przepływu prądu, mamy jeszcze pole magnetyczne, które okrąża drut. Wektory E i B two- rzą kąt prosty; dlatego też wektor Poyn- tinga jest skierowany radialnie do wnę- trza, tak jak to pokazano na rysunku. Do drutu dopływa energia z całego jego otoczenia. Jest ona oczywiście równa energii traconej w drucie w postaci ciep- ła. Tak więc nasza „zwariowana” teoria powiada, że elektrony uzyskują swoją energię, potrzebną do wytworzenia ciep- ła, kosztem energii dopływającej do dru- tu z pól na zewnątrz drutu. Intuicyjnie wydawałoby się, że elektrony uzyskują swoją energię będąc „popychane” wzdłuż drutu, tak że energia powinna dopływać z dołu (lub z góry) wzdłuż drutu. Ale teoria mówi, że elektrony są w rzeczy- wistości popychane przez pole elektryczne, pochodzące od ładunków, które się znaj- dują gdzieś bardzo daleko, i że elektrony uzyskują swoją energię potrzebną do wy- 27.5. Wektor Poyntinga S w pobliżu drutu, przez który przepływa prąd 27.6. Ładunek i magnes wytwarzają wektor Poyntinga, który krąży po zamkniętych pętlach tworzenia ciepła właśnie od tych pól. Ta energia w jakiś sposób przepływa od odległych ła- dunków do rozległego obszaru przestrzeni, a następnie dopływa do wnętrza, do drutu. W końcu, aby się przekonać, że ta teoria jest absolutnie zbzikowana, weźmy jeszcze jeden przykład, w którym rozpatrzymy ładunek elektryczny i magnes, znajdujące się blisko siebie w spoczynku — zupełnie nieruchome. Przypuśćmy, że będziemy rozważać sytuację, w której punktowy ładunek spoczywa w pobliżu środka magnesu sztabkowego, tak jak to pokazano na rys. 27.6. Wszystko się znajduje w spoczynku, a więc i energia w zależ- ności od czasu się nie zmienia. Również i pola E i B są zupełnie statyczne. Ale wektor Poyntinga mówi, że istnieje pewien strumień energii, ponieważ iloczyn E xB jest różny od zera. Jeżeli się przyjrzymy wektorowi strumienia energii, to przekonamy się, że krąży on po prostu bez przerwy dookoła. Nigdzie nie ma żadnej zmiany energii — wszystko, co dopływa do wolnego obszaru przestrzennego, wypływa zaraz z niego na zewnątrz- Przypomina to przypadek nieściśliwej wody, opływającej coś dookoła. A zatem, w tej
27-5. PRZYKŁADY STRUMIENIA ENERGII 127 tak zwanej sytuacji statycznej zachodzi krążenie energii. Jakie to wszystko staje się absur- dalne! Być może, nie będzie to wszystko takie zadziwiające, jeżeli sobie przypomnimy, że to, co nazywamy magnesem „statycznym”, jest w rzeczywistości krążącym prądem stałym. Elektrony wewnątrz trwałego magnesu obracają się bezustannie wokół swych osi. Może więc to krążenie energii na zewnątrz nie jest mimo wszystko takie dziwne. Bez wątpienia zaczynamy odnosić wrażenie, że jeżeli chodzi o lokalizację energii w polu elektromagnetycznym, teoria Poyntinga przeciwstawia się, przynajmniej częścio- wo, naszej intuicji. Można by więc przypuszczać, że należałoby zrewidować naszą intuicję i nauczyć się jeszcze wielu rzeczy. Ale nie wydaje się to rzeczywiście konieczne. Nie należy uważać tego za wielki grzech, jeżeli od czasu do czasu zapomnimy, że energia w drucie dopływa do niego z zewnątrz, a nie wzdłuż drutu. Wydaje się, że rzadko tylko w rozwa- żaniach o zachowaniu energii będzie miało znaczenie dokładne określenie, jaką drogę obiera energia. Krążenie energii wokół magnesu i ładunku wydaje się, w większości wy- padków, zupełnie nieistotne. Nie jest to jakiś zasadniczy szczegół, ale widać zeń jasno, że nasza zwykła intuicja czasami może nas sprowadzić na manowce. 27-6. Pęd pola Chcielibyśmy z kolei pomówić o pędzie w polu elektromagnetycznym. Podobnie jak pole ma energię, tak będzie miało pewien pęd na jednostkę objętości. Tę gęstość pędu oznaczamy przez g. Oczywiście, pęd ma różne możliwe kierunki, tak że g musi być wek- torem. Rozważmy oddzielnie każdą z jego składowych; jako pierwszą bierzemy skła- dową x-ową. Ponieważ każda składowa pędu jest zachowana, powinniśmy móc napisać prawo, które wygląda mniej więcej tak: _ ^ / pęd \ ____ ^Sx , /wypływ! dt (materii/x — + ( pędu /*' Po lewej stronie tego równania mamy coś bardzo prostego: Szybkość zmian pędu ma- terii jest po prostu równa działającej na nią sile. Siłą działającą na cząstkę jest F = = ?(E+v xB); w przypadku układu ładunków siła na jednostkę objętości jest równa feE-f-j xB). Jednakże wyraz „wypływ pędu” jest dziwny. Nie może być on dywergencją wektora, ponieważ nie jest skalarem, jest to raczej _v-owa składowa jakiegoś wektora. Powinno to być, w każdym razie, coś w tym rodzaju: da db dc ——F ——F —, dx dy dz Ponieważ .r-owa składowa pędu mogła przypływać z każdego z trzech kierunków. W każ- dym przypadku, czymkolwiek są a, b i c, wypisana tu suma powinna być równa wypły- wowi składowej x-owej pędu. Należałoby teraz wyrazić gE+jxB tylko poprzez pola E i B — eliminując q i j za
128 27. ENERGIA I PĘD POLą pomocą równań Maxwella — a następnie tak poprzestawiać wyrazy i dokonać takich podstawień, aby oE+jxB przybrało postać . k , dg 8a db dc -----------1-----1----. i dt dx dy dz Następnie, porównując poszczególne wyrazy, otrzymalibyśmy wyrażenia na gx, a, b i c. Wymagałoby to dużo pracy i nie będziemy tego robić. Zamiast tego znajdziemy tylko wyrażenie na gęstość pędu g — i to inną metodą. Istnieje w mechanice takie oto ważne twierdzenie: zawsze gdy mamy przepływ energii w dowolnej postaci (czy to energii pola, czy też energii innego typu), energia przepływa- jąca przez jednostkę powierzchni w jednostce czasu jest równa, po pomnożeniu przez 1/c2, pędowi na jednostkę objętości w przestrzeni. Dla szczególnego przypadku elektro- dynamiki to twierdzenie głosi, że g jest równe 1/c2 razy wektor Poyntinga: •g = -4s. (27.21) , . , c Tak więc wektor Poyntinga nie tylko określa przepływ energii, ale jeżeli podzielić go przez c2, określa także gęstość pędu. Taki sam wynik otrzymalibyśmy posługując się proce- durą wskazaną powyżej, ale bardziej interesujące jest zwrócenie uwagi na ten ogólniej- szy wynik. Podamy teraz kilka ciekawych przykładów i rozważań ilustrujących to ogólne twierdzenie. Przykład pierwszy: Przypuśćmy, że mamy wiele cząstek w pudle — powiedzmy N cząstek na metr sześcienny — poruszających się z pewną prędkością v. Wyobraźmy sobie ponadto płaszczyznę prostopadłą do v. Strumień energii przez jednostkę powierzchni tej płaszczyzny na sekundę jest równy Nv, czyli liczbie cząstek przepływających przez powierzchnię w ciągu sekundy, pomnożonej przez energię unoszoną przez każdą z czą- stek. Energia każdej cząstki jest równa moc2/^l—v2/c2. Tak więc strumień energii w ciągu sekundy równa się m0c2 ................................. Ale pęd każdej cząstki jest równy m0v/l/l—v2/c2, tak źc gętfofcią pędu jest . N mov )/i—v2/c2 co jest akurat równe 1/c2 razy strumień energii — zgodnie z twierdzeniem. Tak więc twier- dzenie to jest prawdziwe dla zbioru cząstek. Jest ono także prawdziwe dla światła. Kiedy uczyliśmy się o świetle w tomie I widzie- liśmy, że pochłanianiu energii z wiązki świetlnej towarzyszy przekazywanie pewneg0 pędu do substancji pochłaniającej. Wykazaliśmy nawet (w rozdz. 36 tomu I, cz. 2), & pęd ten jest równy 1/c razy pochłonięta energia [równanie (36.24) tomu I], Jeżeli Uq będz,e energią przybywającą do jednostki powierzchni w ciągu sekundy, to pęd przybywają#
27-6. PĘD POLA 129 27.7. Energia U przenosi, w ruchu odby- wającym się z prędkością c, pęd p = U/C tej samej powierzchni w ciągu jednej sekun- dy będzie równy U0/c. Ale strumień przemie- szcza się z prędkością c, tak że jego gęstość na powierzchni pochłaniania musi być równa U0lc2. A więc i tym razem twierdzenie to jest prawdziwe. Opiszemy teraz doświadczenie myślowe, któ- rego autorem był Einstein, a które jeszcze raz ilustruje tę samą sprawę. Przypuśćmy, że mamy wagon na kołach (z założenia bez tarcia) o pe- wnej dużej masie M. Na jednym końcu wagonu znajduje się urządzenie, które będzie wyrzucać jakieś cząstki lub wysyłać światło (lub cokol- wiek — nie robi to żadnej różnicy, co to jest), które są następnie zatrzymane na przeciwległej ścianie wagonu. Początkowo w jednym końcu wagonu znajdowała się pewna energia — po- wiedzmy energia U, jak zaznaczono to na rys. 27.la. — która później znajdowała się w prze- ciwległym końcu, tak jak to pokazano na rys. 27.7c. Energia U przebyła więc odległość L, równą długości wagonu. Z tą energią U zwią- zana jest masa U/c2, a więc, jeżeli wagon po- zostałby nieruchomy, to jego środek ciężkości przesunąłby się. Einsteinowi nie podobał się wniosek, że środek ciężkości jakiegoś obiektu może być przesunięty jedynie na skutek jakichś wewnętrznych „rozróbek” i założył, że środka ciężkości nie można przesunąć w wyniku żadnych działań wewnątrz obiektu. Ale w takim razie, jeżeli przesunięto energię U z jednego końca na drugi, to cały wagon musiał ulec od- rzutowi na pewną odległość x, tak jak pokazano na części c) rysunku. Istotnie, widać, że całkowita masa wagonu pomnożona przez x musi być równa masie przesuniętej ener- gii U/c2 razy £ (zakładając, że U/c2 jest dużo mniejsze od M): U Mx = —-L. (27.22) c2 Rozpatrzmy teraz szczególny przypadek, kiedy energia jest unoszona przez błysk s"iatJa. (Rozumowanie to stosuje się równie dobrze dla cząstek, ale poprowadzimy je z§odnie z Einsteinem, który się interesował zagadnieniem światła.) Co powoduje ruch Wagonu? Einstein rozumował następująco: Kiedy światło jest emitowane, musi nastąpić °drzut, pewien nieznany odrzut z pędem p. To właśnie ten odrzut powoduje ruch wagonu 9 Wykłady z fizyki
130 27. ENERGIA I PĘD POLA wstecz. Prędkość odrzutu wagonu będzie ilorazem pędu i masy wagonu: Wagon porusza się z tą prędkością do momentu, kiedy energia świetlna U dotrze do prze- ciwległego końca. Następnie w momencie uderzenia o ściankę energia oddaje z powrotem swój pęd i zatrzymuje wagon. Jeżeli odległość x jest mała, to czas, w którym wagon się porusza, jest prawie równy L/c; mamy więc L p L X = Vt — V-- =------. c Mc Wstawiając tak otrzymane x do równania (27.22) otrzymujemy U p = —. c Znowu mamy związek między energią i pędem dla światła. Dzieląc go przez c, aby dostać gęstość pędu, g — p[c, otrzymujemy raz jeszcze, źe U g = (27.23) c Można by się z powodzeniem zapytać: A czy to twierdzenie o środku ciężkości jest rzeczywiście takie ważne? A może jest ono fałszywe? Może, ale wówczas załamałaby się również zasada zachowania momentu pędu. Przypuśćmy, że nasz wagon porusza się po torze z pewną prędkością v i że „wystrzelamy” pewną energię świetlną z sufitu wagonu w kierunku jego podłogi — pomiędzy punktem A a punktem B na rys. 27.8. Chcemy teraz rozpatrzyć moment pędu układu względem punktu P. Przed opuszczeniem przez energię punktu A ma ona masę m = U2/c i prędkość v, a więc jej moment pędu wynosi mvrA W momencie, gdy energia przybywa do punktu B, ma ona tę samą masę i jeżeli pęd całego wagonu nie ma ulec zmianie, energia musi mieć w dalszym ciągu tę samą prędkość v. Jej moment pędu względem punktu P jest więc rów- ny mvrB. Moment pędu ulegnie zmianie, je' żeli wagonowi w momencie, kiedy światło zostało wyemitowane, nie został przekazany odpowiedni pęd odrzutu — to znaczy, jeżeli światło nie przenosi pędu U/c. Okazuje się, że za- sada zachowania momentu pędu i twierdzenie o środku ciężkości są ze sobą w teorii wzgl?" dności ściśle związane. Tak więc, gdyby twiet' dzenie o środku ciężkości było fałszywe, zała' małaby się i zasada zachowania moment11 pędu. W każdym razie to twierdzenie równik 27.8. Energia U musi przenosić z sobą pęd U/c, jeżeli ma być zachowany moment pędu względem punktu P
27-6. PĘD POLA 131 w przypadku elektrodynamiki okazuje się ogólnie słusznym prawem i możemy posłu- giwać się nim przy określaniu pędu pola. Wspomnimy jeszcze dwa inne przykłady, w których ważną rolę spełnia pojęcie pędu pola elektromagnetycznego. W § 26-2 wykazaliśmy załamanie się prawa akcji i reakcji w przypadku dwóch naładowanych cząstek, które się poruszały po trajektoriach orto- gonalnych. Siły działające na obie te cząstki nie równoważą się, a więc akcja nie jest równa reakcji. Wynika stąd, że wypadkowy pęd cząstek materialnych musi się zmieniać — nie jest więc on zachowany. Ale w takiej sytuacji pęd pola także się zmienia. Gdybyśmy bo- wiem obliczyli pęd określony wektorem Poyntinga, nie byłby on stały. Jednakże zmiana pędów cząstek zostaje „wyrównana” przez tę zmianę pędu pola, tak że całkowity pęd cząstek plus pęd pola jest zachowany. A wreszcie jeszcze jeden przykład: przypadek magnesu i ładunku, pokazany na rys. 27.6. Nie byliśmy zbyt zadowoleni, kiedy się okazało, że energia przepływa dookoła po okręgach, ale teraz ponieważ wiemy, że strumień energii i pęd są proporcjonalne, wiemy także, że istnieje i pęd krążący w przestrzeni. Ale taki krążący pęd oznacza, że występuje tu pewien moment pędu — a więc w polu istnieje moment pędu. Czy pamiętacie paradoks, który opisaliśmy w § 17-4 (t. II, cz. 1), dotyczący solenoidu i tarczy z umieszczonymi na niej ładunkami. Wydawało się, że po wyłączeniu prądu cała tarcza powinna zacząć się obracać. Zagadka brzmiała: Skąd się wziął moment pędu? Otóż stąd, że jeżeli mamy pole magnetyczne i jakieś ładunki, to w polu jest pewien moment pędu. Musiał on zostać tam wprowadzony, kiedy pole się tworzyło. Po wyłączeniu pola ten moment zostaje zwró- cony. A więc tarcza, o której mowa w tym paradoksie, rzeczywiście zacznie się obracać. Ten tajemniczy, krążący strumień energii, który początkowo wydawał się tak śmieszny, jest bezwzględnie konieczny. Rzeczywiście, istnieje tu przepływ pędu. Jest on niezbędny do utrzymania zasady zachowania momentu pędu całego świata.
28 masa elektromagnełyczna 28-1. Energia pola dla ładunku punktowego Łącząc teorię względności z równaniami Maxwella zakończyliśmy zasadniczą część naszej pracy nad teorią elektromagnetyzmu. Pozostało oczywiście do rozważenia kilka szczegółów, które pominęliśmy, oraz jeszcze jedna obszerna dziedzina, którą zajmiemy się w przyszłości, a dotycząca oddziaływania pól elektromagnetycznych z materią. Chce- my się jednak zatrzymać na chwilę, aby pokazać, że ta ogromna budowla, która z takim powodzeniem tłumaczy tak wiele zjawisk, w pewnym momencie wali się w gruzy. Okazu- je się zawsze, gdy zagłębić się zbyt daleko w jakąś dziedzinę fizyki, że tkwią tam jakieś trudności. Tematem naszym będzie teraz poważna trudność — załamanie się klasycznej teorii elektromagnetyzmu. Wiemy, że przyczyną załamia się całej fizyki klasycznej jest istnienie efektów kwantowomechanicznych. Mechanika klasyczna jest teorią konsekwen- tną matematycznie, ale niezgodną z doświadczeniem. Interesującą natomiast jest rzeczą, że klasyczna teoria elektromagnetyzmu jest sama w sobie teorią niezadowalającą. Istnieją pewne trudności, dotyczące pojęć teorii Maxwella, których mechanika kwantowa też nie rozwiązuje i które nie są nawet bezpośrednio z nią związane. Można by rzec: „A może nie warto zaprzątać sobie teraz tymi trudnościami głowy. Przecież wiemy, że mechanika kwantowa ma zmienić prawa elektrodynamiki, czy nie powinniśmy więc poczekać i z°' baczyć, jak te trudności będą się przedstawiały po tych zmianach”. Jednakże trudność1 te pozostaną nawet po połączeniu elektromagnetyzmu z mechaniką kwantową. Nie będz*e więc stratą czasu, gdy je już teraz rozpatrzymy. Mają one także wielkie znaczenie hist<r ryczne. Ponadto powinno nam to chyba sprawić przyjemność, że potrafimy dojść do & mego sedna teorii i zobaczyć wszystko, łącznie z jej słabymi punktami.
28-1 ENERGIA POLA DLA ŁADUNKU PUNKTOWEGO 133 Trudność, o której mówimy, jest związana z pojęciami pędu i energii elektromagne- tycznej, w wypadku gdy pojęcia te stosujemy do elektronu lub dowolnej cząstki nałado- wanej. Pojęcie prostych cząstek naładowanych i pojęcie pola elektromagnetycznego w pewnym sensie się z sobą nie godzą. Aby opisać tę trudność, zaczniemy od rozważe- nia kilku przykładów związanych z pojęciami pędu i energii. Obliczmy najpierw energię cząstki naładowanej. Przyjmijmy prosty model elektronu, w którym cały jego ładunek q jest równomiernie rozmieszczony na powierzchni kuli o promieniu a. Promień ten możemy przyjąć równy zeru dla specjalnego przypadku ładunku punktowego. Obliczmy teraz energię w polu elektromagnetycznym. Jeżeli ładu- nek pozostaje w spoczynku, to jego pole magnetyczne nie istnieje i energia na jednostkę objętości jest proporcjonalna do kwadratu natężenia pola elektrycznego. Bezwzględna wartość tego natężenia wynosi q]Ąite§r2, a gęstość energii jest równa £° 172 q2 u = —E2 =--------------. 2 327r2eof4 Aby otrzymać całkowitą energię, musimy scałkować tę gęstość po całej przestrzeni. Przyj- mując za element objętości 4tc/-2 dr otrzymamy całkowitą energię, którą oznaczymy tfelektr, jako c *72 = J dr' Całkę tę można łatwo obliczyć. Dolna granica całkowania jest tu równa a, a górna oo, czyli Jeżeli za q podstawimy ładunek elektronu qe i q2]4Tzefi oznaczymy symbolem e2, to 1 e2 U^ = -—. (28.2) 2 a Wszystko jest tu w jak najlepszej zgodzie, dopóki promienia a nie przyrównamy do zera dla ładunku punktowego — to właśnie stanowi tę wielką trudność. Gęstość energii pola jest bowiem odwrotnie proporcjonalna do czwartej potęgi odległości od środka i jej całka objętościowa jest nieskończona. W polu otaczającym punktowy ładunek jest nie- skończenie wiele energii. Cóż w tym złego, że energia jest nieskończenie duża? Jeżeli energia ta nie może wy- dostać się „na zewnątrz”, a musi na zawsze pozostać w polu, to czy rzeczywiście istnieje Jakaś trudność związana z nieskończoną energią? Oczywiście, fakt, że wielkość jest nie- skończenie duża, może być przykry, ale w rzeczywistości znaczenie ma tylko to, czy istnie- ją jakieś obserw owalne zjawiska fizyczne. Aby odpowiedzieć na to pytanie, musimy się ZaJ4ć czymś innym oprócz energii. Przypuśćmy, że zapytamy, jak się zmienia energia, gdy poruszamy ładunek. Wówczas, gdy te zmiany będą nieskończenie wielkie, znajdzie- się w kłopocie.
134 28. MASA ELEKTROMAGNETYCZNA ( + ) 28.1. Pola E i B oraz gęstość pędu g dla elektronu dodatniego. Dla elektronu ujem- nego zwrot wektorów E i B jest przeciwny, natomiast zwrot wektora g pozostaje ten sam 28.2. Element objętości 2w2 sin 040 dr użyty w obliczeniach pędu pola 28-2. Pęd pola poruszającego się ładunku Przypuśćmy, że pewien elektron porusza się ze stałą prędkością w przestrzeni i za- łóżmy na chwilę, że prędkość ta jest mała w porównaniu z prędkością światła. Z tym poruszającym się elektronem związany jest pewien pęd — nawet gdyby elektron przed naładowaniem nie miał masy — ze względu na istnienie pędu w polu elektromagnetycz- nym. Pokażemy, że pęd pola ma kierunek prędkości v ładunku i dla małych prędkości jest proporcjonalny do v. W dowolnym pun- kcie P, w odległości r od środka ładunku i pod kątem 9 względem linii ruchu (patrz rys, 28.1), pole elektryczne jest skierowane ra- dialnie, a pole magnetyczne jest, jak wiadomo, równe vxE/c2. Gęstość pędu [równanie (27.21)] jest równa g = 60ExB. Tworzy więc ona pewien kąt z kierunkiem ruchu, tak jak to pokazano na rysunku, a jej wartość bezwzględna wynosi fint? g = — E2sin0. c2 Pola są symetryczne względem kierunku ruchu, obliczając więc całkę przestrzenną z gęstości pędu widzimy, że składowe poprzeczne dadzą w sumie zero i wypadkowy pęd będzie równoległy do v. Składowa g w tym kierunku jest równa gsinS i musimy ją scałkować po całej przestrzeni. Jako nasz element objętości obieramy pierścień, którego płaszczyzna jest prostopadła do v, tak jak to pokazano na rys. 28.2. Jego objętość wynosi 27tr2sin0 d9 dr. Całkowity pęd pola poruszającego się ładunku jest więc równy /£ V —E2sin20 2%r2 sin0 d9 dr. Ponieważ pole E nie zależy od kąta 9 (dla v <§ c,) możemy od razu wykonać całkowani® względem 0; całka ta wynosi r c cos30 I sin30 d9 = — I (1—cos20) J(cosO) = —cos0-j---------.
28-2. PĘD POLA PORUSZAJĄCEGO ŁADUNKU 135 Granicami 0 są 0 i k, tak więc całka względem 0 daje jedynie czynnik | i 8z £0V , p =--------=- | E2r2 dr. 3 c2 J jest to taka sama całka (dla v < c), jaką przed chwilą obliczyliśmy w celu znalezienia energii; jest ona równa ^/lÓT^ejja i 2 q2 v P = V -----------7> 3 4k6q ac czyli 2 e2 ; p = - — v. (28.3) 3 ac2 Pęd w polu — pęd elektromagnetyczny — jest proporcjonalny do prędkości ładunku v. Jest to akurat to, co powinniśmy otrzymać dla cząstki, której masa byłaby równa współ- czynnikowi przy v. Dlatego współczynnik ten można nazwać masą elektromagnetyczną, ^elektromagn * napisaC 2 e2 ^elektromagn j"* (28.4) 3 ac 28-3. Masa elektromagnetyczna Skąd się bierze masa? Mówiąc o prawach mechaniki, zakładaliśmy, że każdy obiekt „niesie” z sobą coś, co nazywamy masą — oznacza to także, że obiekt ten „niesie" pęd proporcjonalny do jego prędkości. Teraz odkrywamy, że jest rzeczą zrozumiałą, iż cząstka naładowana niesie z sobą pęd proporcjonalny do jej prędkości. W istocie jest to możliwe, że masa jest po prostu „skutkiem” elektrodynamiki. Pochodzenie masy pozostawało dotychczas nie wyjaśnione. W elektrodynamice wreszcie mamy świetną okazję, aby zro- zumieć coś, czego nigdy dotąd nie rozumieliśmy. Okazuje się ni stąd, ni z owąd — a właści- wie z teorii Maxwella i Poyntinga — że każda naładowana cząstka będzie mieć pęd pro- porcjonalny do jej prędkości na skutek właśnie oddziaływań elektromagnetycznych. Bądźmy ostrożni i załóżmy na chwilę, że są dwa rodzaje masy, że całkowity pęd ja- kiegoś obiektu mógłby być sumą pędu mechanicznego i pędu elektromagnetycznego. Pęd mechaniczny jest równy masie „mechanicznej”, wmech, razy v. W doświadczeniach, w których mierzymy masę cząstki mierząc jej pęd lub mierząc jak szybko się ona porusza P° jakiejś orbicie, mierzymy masę całkowitą. Mówimy ogólnie, że pęd jest równy iloczy- nowi całkowitej masy (mmech+rnelektromagn) i prędkości. Tak więc obserwowana masa może s>ę składać z dwóch części (lub też z większej ich liczby, jeżeli uwzględnimy inne pola): z części mechanicznej oraz z części elektromagnetycznej. Z pewnością wiemy, że istnieje cz?sć elektromagnetyczna masy i mamy na nią wzór. I istnieje wręcz sensacyjna możli- "°ść, że części mechanicznej masy w ogóle nie ma — że cała masa jest masą elektroma- Snetyczną.
136 28. MASA ELEKTROMAGNETYCZNA Zobaczmy, jakie muszą być rozmiary elektronu, jeżeli nie będzie on miał masy mecha- nicznej. Możemy je znaleźć przyrównując masę elektromagnetyczną z równania (28.4) do masy obserwowanej elektronu me. Wtedy 2 e2 a = T---2 3 mc2 Wielkość e2 'o =------2 mec2 (28.5) (28.6) nazywamy „klasycznym promieniem elektronu”; jej wartość liczbowa wynosi 2,82x X10~13 cm, około jednej stutysięcznej średnicy atomu. Dlaczego r0 nazywamy promieniem elektronu, a nie nasz promień a? Ponieważ rów- nie dobrze moglibyśmy zrobić takie same obliczenia przy założeniu innego rozkładu ładun- ków — ładunek mógłby być równomiernie rozmieszczony w kuli lub mógłby być roz- proszony na jej powierzchni, tak jak pyłki nasionek na purchawce. Dla każdego szcze- gólnego rozkładu czynnik 2 zmieniłby się na inny ułamek. Tak na przykład dla ładunku ^2 4 rozmieszczonego równomiernie w kuli czynnik 5 zostałby zastąpiony czynnikiem j. Zamiast jednak się spierać, który z rozkładów jest poprawny, zdecydowano się zdefi- niować r0 jako „promień symboliczny”. Różne teorie będą więc dodawać do r0 swoje ulubione współczynniki. Spróbujmy rozwijać dalej naszą elektromagnetyczną teorię masy. Dotychczas wy- konywaliśmy obliczenia dla v c, a co się stanie, gdy przejdziemy do dużych prędkości? Początkowe próby wprowadziły trochę zamętu, aż dopiero Lorentz zdał sobie sprawę z tego, że naładowana kula będzie ulegała skróceniu i przy dużych prędkościach stanie się elipsoidą, a pola będą się zmieniać zgodnie z wzorami (26.6) i (26.7) które wyprowadzi- liśmy dla przypadku relatywistycznego w rozdz. 26. Jeśli obliczymy dla tego przypadku całki określające pęd p, otrzymamy, że dla dowolnej prędkości v pęd zmienia się w porów- naniu z wzorem (28.4) o czynnik 1//1—u2/c2: Innymi słowy, masa elektromagnetyczna rośnie z prędkością odwrotnie proporcjonalnie do jĄ—t>2/c2 — odkrycia tego dokonano jeszcze przed stworzeniem teorii względności. We wczesnych doświadczeniach proponowano mierzyć zmiany obserwowanej masy cząstki z prędkością, aby móc określić, ile jest masy mechanicznej, a ile elektrycznej. Wierzono wtedy, że część elektryczna będzie się zmieniać z prędkością, a część mechaniczna zmieniać się nie będzie. Ale gdy przeprowadzono doświadczenia, teoretycy także praco- wali. Rychło sformułowano teorię względności, z której wynikło, że bez względu na to, jakie jest pochodzenie masy, powinna się ona cala zmieniać jak m0/\/l — v2/c2. Równanie (28.7) dało początek poglądowi, że masa zależy od prędkości. Powróćmy do naszych obliczeń energii w polu, które doprowadziły nas do równa*
28-3. MASA ELEKTROMAGNETYCZNA 137 (28.8) nia (28.2). Zgodnie z teorią względności energia U będzie mieć masę Ł7/c2; z równania (28.2) wynika więc, że pole elektronu powinno mieć masę I41ek.r 1 e2 yy> -- ------- - --, --- ‘elektromagn 2 2 &ę2 ’ która nie jest taka sama jak masa elektromagnetyczna, z równania (28.4). Is- totnie, z równania (28.2) i (28.4) wynikałoby, że ^elektr i ^elektromagn • Wzór ten odkryto przed powstaniem teorii względności i gdy Einstein i inni fizycy zaczęli zdawać sobie sprawę, że zawsze musi być U = mc2, zapanowała ogólna konsternacja. 28-4. Siła, z jaką elektron działa sam na siebie Rozbieżność pomiędzy obu wzorami [(28.4) i (28.8)] na masę elektromagnetyczną jest szczególnie przykra. Starannie bowiem udowodniliśmy, że elektrodynamika jest konsy- stentna z zasadą względności. Tymczasem z teorii względności wynika, z całą bez- względnością, że pęd musi być równy iloczynowi energii i v)c2. Tak więc znaleźliśmy się w kłopocie; musieliśmy zrobić jakiś błąd. Nie popełniliśmy jednak błędu rachunkowego, ale musieliśmy coś pominąć w naszych rozważaniach. Przy wyprowadzaniu naszych równań na energię i pęd korzystaliśmy z zasad zacho- wania. Zakładaliśmy, że uwzględniliśmy już wszystkie siły i że wzięliśmy pod uwagę każdą wykonaną pracę i każdy pęd niesiony przez inny „nieelektryczny mechanizm”. Czy jednak naprawdę tak uczyniliśmy? Przecież jeżeli mamy kulę ładunku, to wszystkie siły elek- tryczne są odpychające i elektron będzie dążył do rozlecenia się na kawałki. Ponieważ w układzie występują siły niezrównoważone, możemy otrzymać wszelkie rodzaje błędów w prawach wiążących z sobą energię i pęd. Aby otrzymać konsystentny obraz, musimy sobie wyobrazić, że coś utrzymuje elektron w całości. Ładunki muszą być utrzymywane na kuli za pomocą jakby gumowych obręczy — czegoś, co nie pozwala ładunkom odlecieć. Pierwszy zwrócił uwagę Poincare, że te gumowe obręcze — lub coś, co utrzymuje w całości elektron — muszą być uwzględnione w obliczeniach energii i pędu. Z tego powodu te dodatkowe nieelektryczne siły noszą także bardziej elegancką nazwę „napięć Poincarego”. Jeżeli uwzględnić te dodatkowe siły w obliczeniach, to masy otrzymane dwoma sposobami zmienią się (w sposób, który zależy od szczegółowych założeń). A wyniki będą w zgodzie z teorią względności, tzn. masa otrzymana z obliczenia pędu będzie taka sama jak masa Pochodząca z obliczeń energii. Jednak obie te masy zawierają dwa przyczynki: przyczy- nek elektromagnetyczny i przyczynek pochodzący od napięć Poincarego. Dopiero po dodaniu tych dwóch przyczynków dostajemy konsystentną teorię. Wynika stąd, że nie można przyjąć, jak to mieliśmy nadzieję, że cała masa jest masą elektromagnetyczną. Teoria, w której nie ma nic poza elektrodynamiką, nie jest prawo- mocna. Trzeba do niej coś jeszcze dodać. W przyrodzie muszą istnieć siły, jakkolwiek je ^zwiemy — „obręcze gumowe”, czy też „napięcia Poincarego”, czy też jeszcze inaczej — °re pozwolą teorię tego typu uczynić teorią konsystentną.
138 28. MASA ELEKTROMAGNETYCZNĄ Oczywiście, jeżeli tylko będziemy musieli wprowadzić siły do wnętrza elektronu, piękno całego opisu zacznie zanikać. Wszystko się bardzo skomplikuje. Chciałoby się spytać; Jak silne są te napięcia? W jaki sposób będzie się elektron „trząsł”? Czy będzie on drgał? Jakie są jego wewnętrzne własności? I tak dalej. Jest rzeczą możliwą, że elektron rzeczy, wiście ma pewne skomplikowane własności wewnętrzne. Gdyby pod tym kątem stworzyć teorię elektronu, wynikałyby z niej dziwaczne własności; istniałyby na przykład typy oscylacji, których „pozornie” nie obserwowalibyśmy. Powiedzieliśmy „pozornie”, po- nieważ obserwujemy wiele rzeczy w przyrodzie, z których wciąż nie wynika nic sensownego. Może pewnego dnia okaże się, że coś, czego dzisiaj nie rozumiemy (np. mezon), można w rzeczywistości wytłumaczyć jako oscylację napięć Poincarego. Nie wydaje to się zbyt prawdopodobne, ale nikt tego nie może powiedzieć z całą pewnością. Jest jeszcze tak wiele szczegółów dotyczących cząstek elementarnych, których wciąż jeszcze nie rozumiemy. W każdym razie złożona struktura elektronu, wynikająca z tej teorii, jest niepożądana i próba wytłumaczenia natury całej masy poprzez elektromagnetyzm — przynajmniej w opisany przez nas sposób — zaprowadziła nas w ślepą uliczkę. Chcielibyśmy się zastanowić jeszcze trochę nad tym, dlaczego dopatrujemy się istnie- nia masy, gdy stwierdzamy, że pęd w polu jest proporcjonalny do prędkości. Powoli! Masa jest współczynnikiem pomiędzy pędem a prędkością. Ale możemy inaczej spojrzeć na masę: cząstka na masę, jeżeli musimy wywrzeć pewną siłę, aby nadać jej przyspieszenie. Być może, będzie nam więc łatwiej wszystko zrozumieć, jeżeli dokładniej się zastanowimy, skąd się biorą siły. Skąd wiadomo, że musi być jakaś siła? Otóż stąd, że udowodniliśmy zasadę zachowania pędu dla pól. Jeżeli mamy naładowaną cząstkę i będziemy ją przez chwilę „popychać”, to w polu elektromagnetycznym pojawi się pewien pęd. Pęd ten musiał w jakiś sposób dopłynąć do pola. Dlatego też musiała występować jakaś siła dzia- łająca na elektron, umożliwiająca ten przepływ pędu; oprócz siły potrzebnej ze względu na mechaniczną bezwładność elektronu musi być i siła, której przyczyną jest jego oddziały- wanie elektromagnetyczne. A na „popychadło” musi działać odpowiednia siła, przeciwnie skierowana (do siły działającej na elektron). Ale skąd się ta siła bierze? Wygląda to mniej więcej tak. Elektron można uważać za naładowaną kulę. Kiedy pozostaje ona w spoczynku, każde dwa „kawałki” ładunku odpychają się wzajemnie, zgod- nie z prawem Coulomba, ale wszystkie siły parami się równoważą, a więc nie ma siły wy- padkowej [patrz rys. 28.3a]. Jednakże gdy elektronowi nadać pewne przyspieszenie, siły nie będą się już równoważyć ze względu na to, że na przejście oddziaływań elektromagnetycz- nych od jednego „kawałka” ładunku do drugiego potrzebny jest pewien czas. Tak na przy- kład siła, z jaką „kawałek” a działa na „kawałek” po przeciwnej stronie kuli na rys- 28.3b, zależy od położenia /? w chwili wcześniejszej, tak jak to zaznaczono na rysunku- Zarówno wartość bezwzględna, jak i kierunek siły, zależą od ruchu ładunku. Jeżeli ładunek porusza się z pewnym przyspieszeniem, siły w różnych częściach elektronu wyglądają tak’ jak to pokazano na rys. 28.3c. Gdy doda się do siebie te wszystkie siły, to się okaże, ze one się nie znoszą wzajemnie. Siły te znosiłyby się dla stałej prędkości, mimo że na piet'v' szy rzut oka wydawałoby się, że opóźnienie powinno dać niezrównoważoną siłę nawe* dla prędkości stałej. Ale okazuje się, że wypadkowa siła istnieje tylko w przypadku, g^ elektron porusza się z pewnym przyspieszeniem. Gdyby się przyjrzeć siłom pomięć/
f 28-4. SIŁA, Z JAKĄ ELEKTRON DZIAŁA SAM NA SIEBIE 139 28.3. Siła własna elektronu poruszającego się z pewnym przyspieszeniem jest różna od zera ze względu na opóźnienie. (Przez dF należy rozumieć siłę działającą na element powierzchni da; przez d2F należy rozumieć siłę działającą na element powierzchni daa, pochodzącą od ładunku rozłożonego na elemencie powierzchni dap.') różnymi częściami elektronu, przy istnieniu przyspieszenia, okazałoby się, że akcja nie jest dokładnie równa reakcji i elektron działa pewną siłą sam na siebie, siłą, która próbuje przeciwdziałać przyspieszeniu. Elektron sam wstrzymuje swój ruch tzw. siłą „boot- strapu”*’. Można, choć nie bez trudu, obliczyć tę siłę samooddziaływania; nie będziemy się jednak zagłębiać w tak pracochłonne obliczenia. Podamy tylko wynik, dla specjalnego przypadku stosunkowo nieskomplikowanego ruchu w jednym wymiarze, powiedzmy wzdłuż osi x. Wówczas siłę własną można zapisać w postaci szeregu. Pierwszy wyraz szeregu zależy od przyspieszenia x, następny wyraz jest proporcjonalny do x i tak dalej** ***’. Wynik jest następujący: e2 .. 2 e2 ... e2a .... a—x-- —x+y—x+..., (28.9) ac2 3 cs c* gdzie a i y są liczbowymi współczynnikami rzędu jedności. Współczynnik a przy wyrazie x zależy od tego, jaki przyjęliśmy rozkład ładunku; jeżeli ładunek jest rozmieszczony równo- miernie na kuli, to a = |. Jest to zatem wyraz proporcjonalny do przyspieszenia, który się zmienia odwrotnie proporcjonalnie do promienia elektronu a i dokładnie się zgadza z wartością, jaką otrzymaliśmy w równaniu (28.4) na melektromagn. Gdyby przyjąć inny rozkład ładunku, o zmienionym współczynniku a, to ułamek | w równaniu (28.4) tak samo by się zmienił. Wyraz zawierający x jest niezależny od przyjętego promienia a, a także od przy- jętego rozkładu ładunku; współczynnik przy nim wynosi zawsze |. Kolejny wyraz jest Proporcjonalny do promienia a, a jego współczynnik y zależy od rozkładu ładunku. Za- ważmy, że jeżeliby przyjąć, że promień elektronu a dąży do zera, to ostatni wyraz (a także wszystkie wyrazy wyższego rzędu) będą zmierzać do zera; drugi wyraz pozostaje stały, ** Bootstrap — dosłownie: ucho buta. Bootstrap force — siła, z jaką elektron wstrzymuje swój ruch „łapiąc się za ucha swoich butów”, tłum.). *** Używamy zapisu: x = dx!dt, x — d2x/dt2, x = d2xjdt2, itd.
140 28. MASA ELEKTROMAGNETYCZNA ale pierwszy wyraz — masa elektromagnetyczna — dąży do nieskończoności. Widać, że pojawienie się tej nieskończoności jest spowodowane siłą, jaką jedna część elektronu działa na drugą, dopuściliśmy bowiem, być może niezbyt mądrze, możliwość istnienia „punktowego” elektronu, który działa sam na siebie. 28-5. Próby zmodyfikowania teorii Maxwella Chcielibyśmy się teraz zastanowić, jak można by zmodyfikować elektrodynamikę Maxwella, tak aby pozostawało w niej pojęcie elektronu jako prostego ładunku punkto- wego. Czyniono już wiele takich prób i niektóre z podanych teorii były nawet w stanie tak poprawić sytuację, że cała masa elektronu była według nich masą elektromagnetyczną. Ale wszystkie te teorie upadły. Ciekawe jest jednak rozważenie kilku z proponowanych rozwiązań — aby zdać sobie sprawę z wysiłków umysłu ludzkiego. Naszą teorię elektryczności rozpoczęliśmy od omówienia wzajemnego oddziaływania dwóch ładunków. Następnie zbudowaliśmy teorię tych oddziałujących ładunków i skoń- czyliśmy na teorii pola. W tę teorię wierzymy tak głęboko, że wnioskujemy na jej pod- stawie o istnieniu siły, z jaką jedna część elektronu działa na drugą. Być może, cała trud- ność jest w tym, że elektrony wcale na siebie nie działają; być może, nasza ekstrapolacja — od oddziaływania oddzielnych elektronów do pojęcia elektronu oddziałującego z samym sobą — była zbyt daleko idąca. Dlatego też proponowano pewne teorie, które wykluczały możliwość tego, że elektron działa na siebie. Znikła w nich nieskończoność pochodząca od własnego oddziaływania. Nie było też wtedy żadnej masy elektromagnetycznej związa- nej z cząstką; cała masa była z powrotem masą mechaniczną, ale za to w teoriach tych pojawiły się nowe trudności. Musimy od razu powiedzieć, że teorie takie wymagają modyfikacji pojęcia pola elektro- magnetycznego. Pamiętamy, iż na początku powiedzieliśmy, że siła działająca na cząstkę była w każdym punkcie określona tylko przez dwie wielkości: E i B. Jeżeli odrzucimy „siłę własną”, to powyższe twierdzenie przestaje być prawdziwe, jeśli bowiem w pewnym miejscu mamy elektron, to działająca na niego siła nie jest dana przez całkowite pola E i B, a je- dynie przez te ich części, za które są odpowiedzialne inne ładunki. Musimy więc cały czas śledzić, jaka część pól E i B pochodzi od ładunku, dla którego obliczamy działającą nań siłę, a jaka część pól E i B pochodzi od innych ładunków. Teoria jest przez to o wiele bar- dziej pracochłonna, ale unika się w niej kłopotów z nieskończonością. Można więc, jeśli się chce, powiedzieć, że nie istnieje taki obiekt jak elektron, działający na siebie, i odrzucić cały zbiór sił z równania (28.9). Ale w ten sposób wylewa się dziecko razem z kąpielą! Drugi bowiem wyraz w równaniu (28.9), wyraz z x, jest koniecznie po- trzebny. Ta siła powoduje coś zupełnie określonego. Jeżeli ją odrzucimy, to znajdziemy się znowu w kłopocie. Gdy nadajemy ładunkowi przyspieszenie, promieniuje on falo elektromagnetyczne, a więc traci energię. Dlatego też, aby nadać przyspieszenie ładun- kowi, musi się użyć więcej siły, niż aby przyspieszyć obiekt neutralny o tej samej masie! w przeciwnym wypadku energia nie byłaby zachowana. Praca, jaką wykonujemy w jedno- stce czasu na poruszającym się z pewnym przyspieszeniem ładunku, musi być równa ilość*
28-5. PRÓBY ZMODYFIKOWANIA TEORII MAXWELLA 141 energii straconej w tym samym czasie na skutek promieniowania. O zjawisku tym mówi- liśmy poprzednio*’ — nazywa się je oporem promieniowania. W dalszym ciągu pozostaje problem : Skąd się bierze dodatkowa siła, przeciwko której musimy tę pracę wykonać? Gdy duża antena promieniuje, siły pochodzą od oddziaływania pomiędzy jedną częścią prądu anteny, a drugą. W przypadku pojedynczego elektronu, poruszającego się z pewnym przyspieszeniem i wysyłającego promieniowanie w pustą przestrzeń, wydawałoby się, że siia może pochodzić tylko od oddziaływania pomiędzy poszczególnymi częściami elek- tronu. W rozdziale 32 tomu I (cz. 2) znaleźliśmy, że oscylujący ładunek promieniuje w jedno- stce czasu energię: dW 2 e2(x)2 dt 3 c3 (28.10) Zobaczmy, jaką z równania (28.9) otrzymamy pracę wykonywaną w jednostce czasu przeciwko sile własnej (sile bootstrapu). Praca ta jest równa iloczynowi siły i prędkości, czyli równa Fx: dW e2 ... 2 e2 .... —— = a—-xx———xx+... (28.11) dt ac2 3 c3 Pierwszy wyraz jest proporcjonalny do dx2!dt, a zatem odpowiada po prostu szybkości zmian energii kinetycznej jmu1, związanej z masą elektromagnetyczną. Drugi wyraz po- winien odpowiadać wypromieniowanej mocy, danej równaniem (28.10), ale tak nie jest. Powodem tej rozbieżności jest fakt, że drugi wyraz równania (28.11) jest prawdziwy ogól- nie, podczas gdy równanie (28.10) jest prawdziwe tylko dla oscylującego ładunku. Można pokazać, że te dwa równania są równoważne, jeżeli ruch ładunku jest okresowy. Prze- piszmy mianowicie drugi wyraz równania (28.11) w postaci 2 I e2 d ,... 2 —-37 («)+v c3 dt 3 e2 c2 (*)2, która jest jego prostym przekształceniem algebraicznym. Jeżeli ruch elektronu jest okre- sowy, wielkość xx powraca periodycznie do tej samej wartości i dlatego średnia z jej po- chodnej czasowej jest równa zeru. Natomiast drugi wyraz jest zawsze dodatni (gdyż jest kwadratem), a więc jego średnia jest także dodatnia. Ten wyraz określa wykonaną pracę wypadkową i jest identyczny z równaniem (28.10). Wyraz z x w wyrażeniu na siłę własną jest potrzebny po to, aby mieć zgodność z zasadą zachowania energii dla układów promieniujących i nie można go odrzucić. Prawdę mówiąc, Jednym z triumfów Lorentza było wykazanie, że musi być taka siła i że pochodzi ona od działania elektronu na siebie. Musimy wierzyć w tę koncepcję elektronu działającego na s,ebie i potrzebny nam jest wyraz zawierający x. Cały problem polega na tym, jak otrzymać len wyraz, nie otrzymując jednocześnie pierwszego wyrazu z równania (28.9), który jest sPrawcą całego kłopotu. Nie wiemy, jak to zrobić. No i proszę — klasyczna teoria elek- tr°nu zapędziła nas w ślepy zaułek. *’ W tomie I, cz. 2. (Przyp. red. wyd. polskiego.) » - .
142 28. MASA ELEKTROMAGNETYCZNA Było szereg prób zmodyfikowania praw elektromagnetyzmu usiłujących rozwikłać powyższe problemy. Jeden ze sposobów zaproponowany przez Borna i Infelda polegał na skomplikowanej zmianie równań Maxwella, tak że przestawały one być liniowe. Z rów- nań tych wynika, że energia elektromagnetyczna i pęd są wielkościami skończonymi. Ale prawa sugerowane przez Borna i Infelda przepowiadają istnienie zjawisk, których nigdy nie obserwowano. Ich teoria ma także jeszcze jeden słaby punkt, do którego doj- dziemy później, a który jest wspólny dla wszystkich prób mających na celu usunięcie opisanych przez nas kłopotów. Dirac zaproponował następujące, osobliwe rozwiązanie. Powiedział on: Przyjmijmy, że za oddziaływanie elektronu na siebie odpowiedzialny jest drugi wyraz z równania (28.9)> a nie pierwszy. Następnie wpadł na ciekawy pomysł, żeby pozbyć się pierwszego wyrazu (ale nie obu!). Zauważmy, powiedział, że uczyniliśmy specjalne założenie, biorąc rozwią- zania równań Maxwella w postaci fal opóźnionych', gdybyśmy zamiast tego wzięli fale przyspieszone, otrzymalibyśmy coś innego. Wzór na siłę własną miałby postać: e2 .. 2 e2 ... e2a .... F= a~x+ — —x+y — x. (28.12) ac2 3 c3 c4 Równanie to jest zupełnie podobne do równania (28.9), z wyjątkiem znaku drugiego wyrazu szeregu — i znaków niektórych wyrazów wyższego rzędu. [Przejście od fal opóź- nionych do przyspieszonych polega po prostu na zmianie znaku opóźnienia, co jak nie- trudno zauważyć, jest równoważne zmianie wszędzie znaku t. Powoduje to jedynie zmianę znaków wszystkich nieparzystych pochodnych czasowych w równaniu (28.9)]. Przyj- mijmy więc, powiedział Dirac, nowe prawo, że elektron działa na siebie poprzez połowę różnicy wytworzonych przez siebie pól opóźnionych i przyspieszonych. Różnica równań (28.9) i (28.12), podzielona przed dwa, jest równa 2 e2.. F -----------X + wyrazy wyższego rzędu. 3 c3 We wszystkich wyrazach wyższego rzędu promień a występuje w jakiejś dodatniej potędze w liczniku. Dlatego też, gdy przejdziemy do granicznego przypadku ładunku punktowego, otrzymamy tylko jeden wyraz, taki jaki właśnie był potrzebny. W ten sposób Dirac otrzy- mał siłę oporu promieniowania, a nie otrzymał żadnych sił wewnętrznych. Nie ma masy elektromagnetycznej i teoria klasyczna jest uratowana, ale kosztem arbitralnego założe- nia o sile własnej. Dowolność związana z dodatkowym założeniem Diraca została, do pewnego przynaj- mniej stopnia, usunięta przez Wheelera i Feynmana, którzy zaproponowali jeszcze dziw- niejszą teorię. Sugerują oni, że punktowe ładunki oddziałują tylko z innymi ładunkami, przy czym oddziaływanie zachodzi w połowie przez fale przyspieszone, a w połowie przez fale opóźnione. Okazuje się, ku wielkiemu zdziwieniu, że w większości sytuacji nie obser- wuje się żadnych efektów pochodzących od fal przyspieszonych, ale te właśnie fale p°* wodują powstanie siły oporu promieniowania. Za opór promieniowania nie jest odpowie- dzialny elektron działający sam na siebie, ale następujący osobliwy efekt. Gdy elektro® porusza się z pewnym przyspieszeniem w chwili t, to oddziałuje on na wszystkie inne ła
28-5. PRÓBY ZMODYFIKOWANIA TEORII MAXWELLA 143 dunki w całym świecie, w późniejszej chwili t' — t+r]c (gdzie r jest odległością od innego ładunku) przez fale opóźnione. Ale wówczas te inne ładunki oddziałują wstecz na pier- wotny elektron przez ich fale przyspieszone, które przybędą w chwili t", równej t'— r/c, co oczywiście jest równe akurat t. (Te inne ładunki oddziałują również przez swoje fale opóźnione, ale odpowiada to po prostu normalnym falom „odbitym”). Taka kombinacja fal przyspieszonych i opóźnionych oznacza, że oscylujący ładunek, w chwili gdy jest przyspieszany, odczuwa siłę pochodzącą od wszystkich ładunków, które „przygotowują się” do pochłonięcia przez niego promieniowanych fal. Widzimy, do jakich to gmatwa- nin dochodzą ludzie, próbując otrzymać teorię elektronu! Opiszemy teraz jeszcze teorię innego rodzaju, aby pokazać, czego to już ludzie nie wymyślą, kiedy się bez reszty zaplączą. Jest to inna modyfikacja praw elektrodynamiki, zaproponowana przez Boppa. Zdajemy sobie sprawę, że gdy się już raz zdecydujemy na zmianę równań elektromagnetyzmu, to możemy zacząć od dowolnie wybranego punktu. Można zmieniać prawo określające siłę działającą na elektron albo też zmieniać równania Maxwella (tak jak to widzieliśmy w opisanych powyżej przykładach), albo można zmienić coś innego. Jedną z możliwości jest zmiana wzorów, które określają potencjały poprzez ładunki i prądy. Jeden z naszych wzorów określał potencjały w jakimś punkcie poprzez gęstość prądu (lub ładunku) w każdym innym punkcie w chwili wcześniejszej. W zapisie czterowektorowym t) = f . (28.13) Piękna w swojej prostocie koncepcja Boppa wygląda następująco: Może powodem kło- potu jest czynnik 1/r pod całką. Załóżmy, że jako punkt wyjścia przyjmiemy jedynie, że potencjał w jednym punkcie zależy od gęstości ładunku w każdym innym punkcie po- przez pewną funkcję odległości pomiędzy tymi punktami, powiedzmy f(r i2). Całkowity potencjał w punkcie (1) będzie wówczas określony poprzez całkę po całej przestrzeni z iloczynu i tej funkcji: ^(1) = JjX2)/(r12)^2. To wszystko. Żadnych równań różniczkowych — nic więcej. No, jeszcze jedna rzecz. Będziemy także chcieli, aby wynik był relatywistycznie niezmienniczy. Tak więc za „od- ległość” powinniśmy wziąć niezmienniczą „odległość” pomiędzy dwoma punktami w cza- soprzestrzeni. Ta odległość, podniesiona do kwadratu, jest (z dokładnością do znaku, co nie odgrywa roli), równa 5i2 = c2(J1-t2)2-i\22 = c2(t1—t2)2—(xi—x2)2—(yi—y2)2—(z1—z2)2. (28.14) Tak więc dla niezmienniczej relatywistycznie teorii powinniśmy wziąć jakąś funkcję wiel- kości sl2 lub — co na to samo wychodzi — jakąś funkcję s22. Teoria Boppa mówi więc, że ^(1, *0 = fj\(2, t2)F(s212)d72 dt2. (28.15) (Całkujemy oczywiście po czterowymiarowej objętości dt2dx2dy2dz2j Pozostaje tylko wybrać odpowiednią postać dla funkcji F. O funkcji tej zakładamy tylko
144 28. MASA ELEKTROMAGNETYCZNA 28.4. Funkcja F(s2) użyta w nielokalnej teorii Boppa jedną rzecz — że przyjmuje ona bardzo małe wartości, z wyjątkiem gdy jej argument jest bliski zera, tak że wykresem funkcji F będzie krzywa w rodzaju krzywej z rys. 28.4. Ma ona wąskie maksimum i ogranicza obszar o skończonej powierzchni, symetryczny wzglę- dem prostej s2 = 0, o szerokości, którą przyj- miemy równą z grubsza 2a2. Można nie wnikając w szczegóły powiedzieć, że na war- tość potencjału w punkcie (1) mają istotny wpływ tylko te punkty (2), dla których s22 = c2(r2—Ą)2—r22 należy do przedziału (+<z2, —u2). Można to podkreślić za po- mocą stwierdzenia, że funkcja F przyjmuje istotne wartości tylko dla sł2 = ^(h-hY-rii » ±a2. (28.16) Można by nadać temu bardziej „matematy- czną” postać, ale i tak wiadomo, o co chodzi. Załóżmy teraz, że promień a jest bardzo mały w porównaniu z rozmiarami zwykłych obiektów, takich jak np. silniki czy generato- ry, tak że dla normalnych zagadnień r12 a. W takim przypadku z równania (28.16) wynika, że ładunki dają przyczynki do całki w rów- naniu (28.15) tylko wtedy, gdy t2—t2 należy do małego przedziału: ---- a V r12±a ~r12l/ 1±— • F f12 Ponieważ wartość pierwiastka można przybliżyć przez 1 ±«2/2r22, tak że r12 / a2 \ ri2 a2 ti —12 =----11 ±-yr-) = i 3 • c \ 2/-j2/ c 2r12c Jakie znaczenie ma ten wynik? Wynik ten mówi nam, że jedynymi istotnymi w całce z są takie chwile t2, które różnią się od chwili tt, dla której chcemy znaleźć potencjał, o opóźnienie r12/c plus pewna poprawka, możliwa do pominięcia, jeżeli rl2 > a. Innymi słowy, teoria Boppa jest zbliżona do teorii Maxwella dopóty, dopóki znajdujemy się daleko od poszczególnych ładunków — w tym sensie, że teoria ta prowadzi do efektów fali opóź- nionej. Wartość całki z równania (28.15) możemy oszacować. Jeżeli będziemy najpierw cał- kować względem t2 od — oo do +oo — przy ustalonym r12 — to s22 będzie również prze" biegać od — oo do +oo. Przyczynki do tej całki będą pochodzić od tych chwil t2, które należą do małego przedziału o szerokości At2 = 2-a2/2rl2c i o środku tt—r12jc. Za'
28-5. PRÓBY ZMODYFIKOWANIA TEORII MAXWELLA 145 łóżmy, że funkcja F(s2) przyjmuje dla s2 = 0 wartość K; wówczas całka względem t2 jest w przybliżeniu równa zl/2, czyli inaczej Ka2 j„ c rl2' Wartość jf, powinniśmy oczywiście wziąć dla chwili t2 = więc równanie (28.15) przybiera postać A M ' Ka2 C h-r12/c) ?i)------------I ---------------aK2. c J rl2 Jeżeli wybierzemy K = q2c[4nsoa2, dostaniemy z powrotem rozwiązanie równań Max- wella poprzez potencjał opóźniony, zawierające automatycznie zależność typu 1/r! I to wszystko wynikło z prostej hipotezy, że potencjał w jednym punkcie czasoprzestrzeni zależy od gęstości prądu we wszystkich innych punktach czasoprzestrzeni, przy czym w zależności tej występuje funkcja wagowa będąca pewną „wąską” funkcją czterowymia- rowej odległości pomiędzy dwoma punktami. Teoria ta przypisuje znowu elektronowi skończoną masę elektromagnetyczną, a związek pomiędzy energią i masą jest zgodny z te- orią względności. Musi tak być, ponieważ teoria jest od samego początku relatywistycznie niezmiennicza i wydaje się, że wszystko jest w porządku. Jest jednak jeden zasadniczy zarzut dotyczący tej teorii, a także wszystkich innych teorii przez nas opisanych. Wszystkie znane cząstki stosują się do praw mechaniki kwanto- wej, a więc musi się dokonać kwantowomechanicznej modyfikacji elektrodynamiki. Światło zachowuje się tak jak strumień fotonów, a to nie jest zgodne w 100°/o z teorią Maxwella. A więc teoria elektrodynamiczna musi zostać zmieniona. Wspominaliśmy już, że przed- stawione tu wysiłki nad poprawieniem klasycznej teorii mogą być stratą czasu, bo mogłoby się okazać, że w elektrodynamice kwantowej te trudności znikną lub zostaną rozwiązane w jakiś inny sposób. Ale trudności te nie znikają także w elektrodynamice kwantowej. Jest to jeden z powodów, dla których ludzie zużyli tak wiele czasu próbując usunąć trud- ności na poziomie teorii klasycznej; mieli bowiem nadzieję, że gdyby im się udało usunąć trudności klasyczne, a następnie dokonać kwantowych modyfikacji, pozbyliby się wszyst- kich kłopotów. Tymczasem teoria Maxwella po wprowadzeniu modyfikacji, których żąda mechanika kwantowa, w dalszym ciągu ma te same trudności. Efekty kwantowe prowadzą rzeczywiście do pewnych zmian — wzór na masę jest nieco zmieniony, pojawia się stała Plancka li, ale okazuje się, że wynik w dalszym ciągu jest nieskończony, jeżeli nie „obetniemy” w jakiś sposób przedziału całkowania — właśnie tak Jak musieliśmy „ucinać” całki klasyczne przy r = a. A wyniki zależą od sposobu, w jaki wykonamy „obcinanie”. Nie możemy, niestety, tutaj pokazać, że trudności pozostają w zasadzie takie same, ponieważ zbyt mało wiemy o mechanice kwantowej, a jeszcze mniej 0 kwantowej elektrodynamice. Musimy więc uwierzyć na słowo, że skwantowana teoria etektrodynamiki Maxwella dla punktowego elektronu daje również masę nieskończoną. Okazuje się jednak, że nikomu nigdy nie udało się stworzyć wewnętrznie niesprzecznej te°rii kwantowej z różnych zmodyfikowanych teorii klasycznych. Koncepcje Borna i In- 10 — Wykłady z fizyki
146 28, MASA ELEKTROMAGNETYCZNA felda nigdy nie zostały przekształcone w zadowalającą teorię kwantową. Również teorie z opóźnionymi i przyspieszonymi falami Diraca, czy też Wheelera i Feynmana, nigdy nie zostały przekształcone w zadowalającą teorię kwantową. Tak samo teoria Boppa nigdy nie została przekształcona w zadowalającą teorię kwantową. Nie znamy więc dzisiaj za- dowalającego rozwiązania tego zagadnienia. Nie wiemy, jak utworzyć konsystentną teorię, uwzględniającą mechanikę kwantową, która nie dawałaby nieskończonej energii własnej elektronu lub jakiegokolwiek ładunku punktowego. A jednocześnie nie ma za- dowalającej teorii, która by opisywała ładunek niepunktowy. Jest to zagadnienie nie- rozwiązane. Na wypadek gdyby ktoś zdecydował się zabrać do tworzenia teorii, z której działanie elektronu na samego siebie byłoby całkowicie usunięte, tak że masa elektromagnetyczna przestałaby już mieć znaczenie, a następnie zabrałby się do tworzenia z tego teorii kwan- towej, musimy go ostrzec, że na pewno się znajdzie w kłopocie. Istnieją wyraźne dowody doświadczalne na istnienie bezwładności elektromagnetycznej, czyli istnieją dowody, że pewna część masy naładowanych cząstek ma pochodzenie elektromagnetyczne. W starszych podręcznikach zwykło się mówić, że ponieważ Przyroda bez wątpienia nigdy nie „ofiaruje” nam dwóch cząstek — jednej naładowanej i drugiej neutralnej, ale poza tym takich samych — nigdy nie będziemy w stanie powiedzieć, jaka część masy jest elektromagnetyczna, a jaka mechaniczna. Okazuje się że Przyroda była na tyle upizejma i sprezentowała nam takie właśnie obiekty, tak że porównując obserwowaną masę nałado- wanej cząstki z obserwowaną masą cząstki neutralnej można stwierdzić,-czy istnieje jakaś masa elektromagnetyczna. Istnieją na przykład neutrony i protony. Oddziałują one wza- jemnie olbrzymimi siłami — siłami jądrowymi — których pochodzenia nie znamy. Jednak- że, jak już to opisywaliśmy, siły jądrowe mają jedną zadziwiającą własność. Dopóki roz- ważamy tylko siły jądrowe, neutron i proton są dokładnie takie same. Siły jądrowe po- między neutronem a neutronem, protonem a neutronem i protonem a protonem są iden- tyczne na tyle, na ile jesteśmy to w stanie stwierdzić. Jedyną różnicę stanowią małe siły elektromagnetyczne; z punktu widzenia własności elektrycznych proton i neutron różnią się między sobą, tak jak noc się różni od dnia. Tego właśnie chcieliśmy. Istnieją zatem dwie cząstki, identyczne z punktu widzenia silnych oddziaływań, ale różne z punktu widzenia własności elektrycznych. Pomiędzy zaś ich masami istnieje mała różnica. Różnica mas neutronu i protonu — wyrażona jako różnica w energii spoczynkowej mc2 — wynosi, w jednostkach MeV, około 1,3 MeV, co równe jest w przybliżeniu 2,6 razy masa elektronu. Z klasycznej teorii wynikałoby, że ich promień jest w przybliżeniu równy od i do | kla- sycznego promienia elektronu, czyli około 10“13 cm. Oczywiście, powinniśmy w rzeczy- wistości posłużyć się teorią kwantową, ale w wyniku jakiegoś dziwnego trafu wszystkie stałe — 2n i Jl itd. — znoszą się, tak że teoria kwantowa daje z grubsza taki sam promień, jak teoria klasyczna. Kłopot tylko w tym, że jest tu zły znak\ Neutron jest cięższy od pro- tonu. Przyroda dała nam także szereg innych par — lub trójek — cząstek, które jak się oka- zuje, są dokładnie takie same, z wyjątkiem ładunku elektrycznego. Oddziałują one z pro- tonami i neutronami poprzez tzw. „silne” oddziaływania sił jądrowych. W takich oddzia- ływaniach cząstki danego typu, powiedzmy mezony n, zachowują się pod każdym wzglę-
28-5. PRÓBY ZMODYFIKOWANIA TEORII MAXWELLA 147 Tabela 28.1, Masy cząstek Ładunek Masa Am Cząstka (w jednostkach ładunku elektronu) (MeV) (MeV) n (neutron) 0 939,5 p (proton) + 1 938,2 —1,3 .T (mezon ti) 0 135,0 ±1 139,6 +4,6 0 497,8 K (mezon K) ±1 493,8*’ —3,9 0 1192,3*’ —2,9*’ Z (sigma) +1 —1 1189,4 1197,2*’ +4,9*’ *) Am = (masa cząstki naładowanej) — (masa cząstki neutralnej). [Dane z roku 1965. (Przyp, red. wyd. polskiego)] dem jak jeden i ten sam obiekt, z wyjątkiem ładunku elektrycznego. W tabeli 28.1 podajemy listę takich cząstek wraz z ich zmierzonymi masami. Naładowane mezony n — dodatnie i ujemne — mają masę 139,6 MeV, ale neutralny mezon n jest lżejszy o 4,6 MeV. Wierzy- my, że ta różnica mas jest elektromagnetyczna; odpowiadałoby to cząstce o promieniu 3-4-10“14 cm. Z tabeli widać, że różnice mas dla innych cząstek są tego samego rzędu. Rozmiary tych cząstek można teraz określić posługując się innymi metodami, mierząc na przykład ich średnice w zderzeniach wielkich energii. Tak więc wydaje się, że masa elektromagnetyczna jest ogólnie w zgodzie z teorią elektromagnetyczną, jeżeli przy obli- czeniu masy „obetniemy” nasze całki energii pola na tym samym promieniu, jaki otrzy- mujemy z tych innych metod. Właśnie dlatego wierzymy, że te różnice odpowiadają masie elektromagnetycznej. Niewątpliwie martwią nas różne znaki różnic mas w tabeli. Łatwo zrozumieć, dlaczego naładowane cząstki powinny być cięższe od neutralnych. Ale co z tymi parami, jak neutron i proton, dla których różnica zmierzonych mas jest akurat przeciwna? Otóż okazuje się, że te cząstki są złożone i obliczenie dla nich masy elektromagnety- cznej będzie bardziej pracochłonne. Tak na przykład, chociaż neutron nie ma wypadkowego ładunku, ma on pewien wewnętrzny rozkład ładunku — i tylko jego wypadkowy ładunek jest równy zeru. W istocie, wierzymy, że neutron wygląda — przynajmniej czasami — jak proton otoczony „chmurą” mezonu rr, tak jak to pokazano na rys. 28.5. Chociaż neutron jest „neutra- lny”, bo jego całkowity ładunek jest równy zeru, to i tak ma energię elektromagnetyczną (gdyż ma, na przykład, różny od zera moment magnetyczny) i nie możemy 28.5. Neutron może czasami istnieć jako proton otoczony „chmurą” ujemnego mezonu n proton ujemny mezon 7f
148 28. MASA ELEKTROMAGNETYCZNA łatwo stwierdzić, jaki znak powinna mieć elektromagnetyczna różnica mas, bez szcze- gółowej teorii struktury wewnętrznej nukleonu. Chcielibyśmy tylko podkreślić tu następujące szczegóły: 1. teoria elektromagnetyczna przewiduje istnienie masy elektromagnetycznej, ale jednocześnie jest to powodem, że teoria ta się wali w gruzy, ponieważ nie można stworzyć teorii konsystentnej — sytuacja ta nie zmienia się po wprowadzeniu poprawek kwantowych; 2. istnieją dowody doświadczalne na istnienie masy elektromagnetycznej i 3. wszystkie te masy są z grubsza takie same jak masa elektronu. Powracamy więc do pierwotnej koncepcji Lorentza — być może cała masa elektronu jest czystą masą elektromagnetyczną, być może za to całe 0,511 MeV odpowiada elektrodynamika. Tak, czy nie? Nie mamy teorii, a więc nie możemy na to odpowiedzieć. Należy wspomnieć o jeszcze jednej informacji doświadczalnej, która jest szczególnie irytująca. Istnieje w świecie jeszcze inna cząstka, nazywana mionem lub mezonem p, która na tyle, na ile potrafimy to stwierdzić, nie różni się w żaden sposób od elektronu, z wyjąt- kiem masy. Działa ona pod każdym względem tak jak elektron: oddziałuje z neutrinami i z polem elektromagnetycznym i nie ma sił jądrowych. Nie „robi” nic, co różniłoby się od tego, co „robi” elektron, przynajmniej nie „robi” ona niczego takiego, co nie mogłoby być zrozumiane jako konsekwencja jedynie jej większej masy (206,77 razy masa elektronu). Dlatego też gdyby kiedyś ktoś znalazł wyjaśnienie natury masy elektronu, to pozostanie mu do rozwiązania zagadka: skąd mion bierze swoją masę. Dlaczego? Ponieważ wszystko to, co „robi” elektron, „robi” i mion, a więc powinno się otrzymać dla niego taką samą masę, jak i dla elektronu. Są tacy, którzy wierzą niezłomnie w koncepcję, że mion i elektron są jedną i tą samą cząstką, i że w ostatecznej teorii masy wzór na masę będzie równaniem kwadratowym o dwóch pierwiastkach — po jednym dla każdej cząstki. Są też tacy, którzy twierdzą, że będzie to równanie przestępne, z nieskończoną liczbą pierwiastków. Ci ostatni zajmują się zgadywaniem, jakie muszą być masy innych cząstek tego nieskończonego szeregu oraz zastanawiają się, dlaczego jeszcze tych cząstek nie odkryto. 28-6. Pole sił jądrowych Chcielibyśmy zrobić jeszcze parę uwag dotyczących tej części masy, która nie jest elektromagnetyczna. Skąd bierze się ta duża część masy? Poza elektrodynamiką są jeszcze inne siły, np. siły jądrowe, które mają swoje własne teorie pola, chociaż nikt nie wie, czy te istniejące obecnie teorie są prawdziwe. Teorie te również postulują istnienie energii pola, która daje cząstkom jądra część masy, analogiczną do masy elektromagnetycznej ; można by ją nazwać „masą pola tt-mezon owego”. Jest ona przypuszczalnie bardzo duża, bo i siły tu są wielkie i możliwe jest, że pole mezonowe jest odpowiedzialne za masę cięż- kich cząstek. Ale teorie pola mezonowego są wciąż jeszcze w stadium szczątkowym. Nawet przy dobrze rozwiniętej teorii elektromagnetyzmu nie udało się nam poprawnie wytłuma- czyć natury masy elektronu. Tymczasem wobec elektrodynamiki teoria mezonów jest zaledwie pewną „próbą koncepcji”. Warto poświęcić trochę czasu na przedstawienie w zarysie teorii mezonowej, ze względu
28-6. pole sił jądrowych 149 na jej interesujący związek z elektrodynamiką. W elektrodynamice pole może być opisane przez czteropotencjał, który spełnia równanie □2^„ = źródła. przekonaliśmy się też, że pewne części pola mogą zostać wypromieniowane i będą istnieć odseparowane od źródeł. Są to fotony i są one opisane przez równanie różniczkowe bez źródeł : □ %, = (). Przypuszcza się, że pole sił jądrowych powinno także mieć swoje własne „fotony” — byłyby to przypuszczalnie mezony zr — i że powinny one być opisane przez analogiczne równanie różniczkowe. (Ze względu na niedoskonałość umysłu ludzkiego, nie potrafimy wymyślić nic rzeczywiście nowego; dlatego musimy rozumować poprzez analogię z tym, co już wiemy). Tak więc równanie dla mezonów mogłoby mieć postać □ 2?> = 0, gdzie (p mogłoby być jakimś innym czterowektorem, a może skalarem. Okazuje się, że pion nie ma polaryzacji, a więc <p powinno być skalarem. Przy tym prostym równaniu D2ę> = 0 pole mezonowe zmieniałoby się z odległością od źródła jak 1/r2, identycznie jak się zmienia pole elektryczne. Ale wiadomo, że siły jądrowe mają o wiele krótszy zasięg działania, a więc to proste równanie odpada. Jest jeden sposób, w jaki można zmienić to równanie, nie psując relatywistycznej niezmienniczości: możemy dodać lub odjąć od operatora d’Alem- berta stałą pomnożoną przez ę>. Dlatego też Yukawa zasugerował, że swobodne kwanty pola sił jądrowych mogłyby spełniać równanie □ 2ę>—fjt2<p = 0, (28.17) gdzie jz2 jest stałą, tzn. jakimś niezmienniczym skalarem. (Ponieważ n2 jest skalarnym operatorem różniczkowym w czterech wymiarach, jego niezmienniczość nie ulegnie zmia- nie, jeżeli dodamy doń inny skalar.) Zobaczmy, jaka na podstawie równania (28.17) będzie siła jądrowa, w wypadku gdy sytuacja nie zmienia się z czasem. Szukamy rozwiązania równania V2ęs—(u2ę> = 0; rozwiązanie to ma być sferycznie symetryczne względem jakiegoś punktowego źródła, znajdującego się na przykład w początku układu. Jeżeli <p zależy tylko od r, to wiemy, że 1 d2 V <P =-^r(r<p)- - . r dr Mamy więc równanie 1 c2 , = o> r dr2 czyh a2 — (rtp) = fi2(np).
150 28. MASA ELEKTROMAGNETYCZNĄ 28.6. Potencjał Yukawy e~'"7r, porównany z po- tencjałem Coulomba 1/r Jeżeli przyjmiemy (r<p) za naszą zmień, ną zależną, to otrzymamy równanie, któ. re już wiele razy widzieliśmy. Jego roz- wiązaniem jest r<p = Ke±/2r. Oczywiście, pole <p nie może się stać nie- skończone dla dużych r, a więc odpada znak + w funkcji wykładniczej. Roz- wiązaniem więc jest e"'"’ <p = K——. (28.18) Funkcję tę nazywamy potencjałem Yuka- wy. Dla siły przyciągającej K jest liczbą ujemną, której wartość musi być tak do- brana, aby pasowała do obserwowanych doświadczalnie „natężeń” sił. Potencjał Yukawy sił jądrowych zanika gwałtowniej niż 1/r ze względu na obecność czynnika wykładniczego. Potencjał ten, a więc i siła, spada do zera o wiele gwałtowniej niż 1/r dla odległości większych od l//t, tak jak to pokazano na rys 28.6. „Zasięg sił jądrowych” jest dużo mniejszy od „zasięgu” sił elektrostatycznych. Doświadczalnie stwierdzono, że siły jądrowe nie działają już na odległościach większych od około 10“13 cm, tak że r= 1015 m-1. Na koniec przyjrzyjmy się rozwiązaniu równania (28.17), mającemu postać fali swo- bodnej. Jeżeli podstawimy <p = do równania (28.17), otrzymamy ca2 —- —k2—p2 = 0. c2 M Wiążąc częstość z energią, a liczbę falową z pędem, tak jak robiliśmy to na końcu rozdz. 36 tomu I (cz. 2), otrzymujemy E2 — ~p2 = p2n2, c2 co oznacza, że „foton” Yukawy ma masę równą /z^/c. Korzystając z przybliżonej wa>- tości na p, p ~ 10ls m-1, która odpowiada oberwowanemu zasięgowi sił jądrowych, otrzymujemy masę 3-10-2s g, czyli 170 MeV, co z grubsza odpowiada obserwowanej masie mezonu tt. Tak więc, przez analogię z elektrodynamiką, można by powiedzieć, że mezon n jest „fotonem” pola sił jądrowych. Ale przechodząc od elektrodynamiki d° zagadnienia sił jądrowych wprowadziliśmy pojęcia elektrodynamiki do rejonów, w któ- rych pojęcia te mogą być już niesłuszne.
29 ruch ładunków w polach elektrycznych i magnetycznych 29-1. Ruch w jednorodnym polu elektrycznym lub w jednorodnym polu magnetycznym Chcemy teraz opisać — głównie w sposób jakościowy — ruch ładunków w różnych warunkach. Większość interesujących zjawisk, dotyczących ruchu ładunków w polach, zachodzi dla bardzo złożonych sytuacji, przy wielu, wielu cząstkach wzajemnie z sobą oddziałujących. Tak na przykład, gdy fala elektromagnetyczna przechodzi przez jakiś ośrodek materialny lub przez plazmę, to całe miliardy cząstek oddziałują z falą i między sobą. Takimi zagadnieniami*zajmiemy się później, na razie chcemy tylko omówić znacz- nie prostsze zagadnienie ruchów pojedynczego ładunku w pewnym danym polu. Możemy zatem pominąć działanie wszystkich innych cząstek, z wyjątkiem oczywiście tych ładun- ków i prądów, które się tam gdzieś znajdują i wytwarzają pole, z jakim mamy do czynienia. Jako pierwszy powinniśmy chyba rozpatrzyć ruch cząstki w jednorodnym polu elek- trycznym. Przy małych prędkościach ten ruch nie jest szczególnie interesujący; jest to Po prostu ruch jednostajnie przyspieszony z przyspieszeniem w kierunku pola. Skoro jednak cząstka nabierze na tyle energii, aby się stać cząstką relatywistyczną, wówczas ruch stanie się bardziej złożony. Ale znalezienie rozwiązania dla tego przypadku pozosta- wimy już czytelnikowi. Z kolei rozważmy ruch w jednorodnym polu magnetycznym gdy nie ma pola elektrycz- nego. To zagadnienie już rozwiązaliśmy — jednym z rozwiązań jest ruch cząstki po okrę- SU- Siła magnetyczna ęvxB jest zawsze prostopadła do kierunku ruchu, tak że wektor ^9ldt jest prostopadły do wektora p, a jego wartość bezwzględna wynosi vp[R, gdzie R lest promieniem okręgu: vp F - qvB = —
152 29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH magnetycznym 29.2. Spektrometr pędu z polem jednorodnym, dający ogniskowanie typu „t”; a) różne pędy, b) różne kąty. Kierunek pola magnetycznego jest prostopadły do płaszczyzny rysunku (29.1) ’ Promień orbity kołowej jest więc równy R = — qB To tylko jedno z możliwych rozwią. ; • zań. Jeżeli cząstka ma składową ruchu wzdłuż kierunku pola, to składowej tej odpowiada ruch jednostajny, ponieważ siła magnetyczna nie może mieć różnej od zera składowej w kierunku pola. Wypad- kowy ruch cząstki w jednorodnym polu magnetycznym składa się z ruchu ze stałą prędkością równoległą do pola B i z ruchu po okręgu, w płaszczyźnie prostopadłej do pola B — tor tego ruchu jest spiralą cylindryczną (rys. 29.1). Promień spirali określa równanie (29.1), jeżeli zastąpić w nim p przez , składową pędu pro- stopadłą do pola. 29-2. Analiza pędu Z jednorodnego pola magnetycznego często korzysta się w „analizatorze pędu” lub „spektrometrze pędu” dla naładowa- nych cząstek wielkich energii. Przypuść- my, że naładowane cząstki są „wstrzeli- wane” do jednorodnego pola magnetycz- nego w punkcie A na rys. 29.2a, przy czym to pole magnetyczne jest prosto- padłe do płaszczyzny rysunku. Każda z tych cząstek wejdzie na orbitę, która jest okręgiem o promieniu proporcjonal- nym do pędu cząstki. Jeżeli wszystkie cząstki wchodzą prostopadle do krawędzi pola, to opuszczą one pole w odległości x (od punktu A), proporcjonalnej do ich pędu p. Licznik umieszczony w pewnym punkcie, np. w punkcie C, będzie rejestro- wał tylko te cząstki, których pęd różni się od pędu p = qBx!2 o pewną wielkość zl/>.
^ff-2. ANALIZA PĘDU 153 Oczywiście, cząstki nie muszą dokonywać obiegu aż o 180°, zanim zostaną policzone, ale tzw. „spektrometr tt” ma pewną specjalną własność. Mianowicie, nie jest konieczne, aby cząstki wchodziły pod kątem prostym do krawędzi pola. Na rysunku 29.2b pokazano tory trzech cząstek, wszystkich o tej samej wartości bezwzględnej pędu, ale wchodzących do pola pod różnymi kątami. Widać, że cząstki przebiegają po różnych torach, ale wszyst- kie opuszczają pole bardzo blisko punktu C. Mówimy, że punkt C jest „ogniskiem”. Zaletą takiej własności ogniskowania jest możliwość dopuszczenia w punkcie A większe- go przedziału kątów, chociaż zwykle narzuca się pewne ograniczenie, tak jak to poka- zano na rysunku. Taka większa tolerancja kątowa oznacza zwykle, że w danym czasie rejestruje się więcej cząstek, co skraca czas potrzebny dla danego pomiaru. Zmieniając pole magnetyczne lub przesuwając licznik wzdłuż kierunku x albo pokry- wając zakres zmienności x wieloma licznikami można mierzyć „widmo” pędu w wiązce wejściowej. (Przez „widmo pędu” f(p) rozumie się, że liczba cząstek o pędach pomiędzy p a (p+dp) jest równa j'(p) dp.] Tego typu pomiary były wykonywane na przykład do określenia rozkładu energii w rozpadzie fi różnych jąder. Jest wiele innych typów spektrometrów pędu, ale opiszemy jeszcze tylko jeden, dla którego dopuszczalny kąt bryłowy jest szczególnie duży. Zasada działania tego spektro- metru opiera się na ruchu cząstek po spiralnych orbitach w polu jednorodnym, takim jak na przykład na rys. 29.1. Wyobraźmy sobie układ współrzędnych cylindrycznych — q, 6, z — obrany tak, że oś z pokrywa się z kierunkiem pola. Jeżeli cząstka jest emitowana z początku układu, pod pewnym kątem a względem osi z, to będzie się ona poruszała po spirali o równaniu g = a sinkz, 0 = bz, gdzie a, b i k są parametrami, które można łatwo wyrazić poprzezp, a i pole magnetyczne Jeżeli zrobilibyśmy wykres odległości q od osi jako funkcji z dla jednego pędu, ale dla kilku różnych kątów a, otrzymalibyśmy krzywe narysowane na rys. 29.3 linią ciągłą. (Pamiętajmy, że są to po prostu rzuty torów spiralnych). Gdy kąt pomiędzy osią, a kierun- kiem wstrzelenia cząstki jest większy, to maksymalna wartość q jest duża, ale za to po- dłużna składowa prędkości jest mniejsza, tak że tory dla różnych kątów dążą do „zogni- skowania się” w pobliżu punktu A na rysunku. Jeżeli w punkcie A ustawić wąską szcze- linę, to cząstki o pewnej rozpiętości kątów początkowych mogą przejść przez tę szczelinę i dojść do osi, gdzie są one zliczone przez długi detektor D. Cząstki, które opuszczają źródło w po- czątku układu z większym pędem, ale pod tymi samymi kątami, przebiegają wzdłuż linii prze- rwanej i nie przedostają się przez szczelinę w Punkcie A. Tak więc aparatura wybiera mały Przedział pędów. Zaletą tego spektrometru nad spektrometrem opisanym poprzednio jest to> że szczelinę A — a także szczelinę A' — ^°żna sporządzić w kształcie pierścienia reJestrować cząstki, które opuszczają źródło
154 29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH 29.4. Eliptyczna cewka z takimi samymi prądami w każdym osiowym przedziale <4x wytwarza wewnątrz jednorodne pole magnetyczne w pewnym kącie bryłowym. Można więc wykorzystać dużą część cząstek wycho- dzących ze źródła; jest to cenna zaleta w przypadku słabych źródeł lub bardzo dokładnych pomiarów. Za tę zaletę trzeba zapłacić jednak pewną cenę, ponieważ taka aparatura wymaga jednorodnego pola magnetycz- nego o dużej „objętości”, a to jest zwyk- le opłacalne tylko dla cząstek o małej energii. Pamiętamy, że jeden ze sposobów utworzenia jednorodnego pola polega na nawinięciu cewki na kuli, tak aby gęstość prądu na powierzchni tej kuli była proporcjonalna do sinusa kąta. Można pokazać, że to samo zachodzi dla elipsoidy obrotowej. Dlatego też takie spek- trometry często się robi w ten sposób, że nawija się eliptyczną cewkę na drewnianej (albo aluminiowej) ramie. Wymagane jest tylko, aby prąd w każdym przedziale osi, z1x, był taki sam, tak jak to pokazano na rys. 29.4. 29-3. Soczewka elektrostatyczna Ogniskowanie cząstek ma wiele zastosowań. Tak na przykład, elektrony wylatujące z katody lampy obrazowej w telewizorze są ogniskowane na ekianie, tak aby utworzyły małą plamkę. W tym wypadku chcemy zebrać w małą plamkę elektrony, charakteryzujące się tąką samą energią początkową, ale różnymi kątami początkowymi. Zagadnienie to jest podobne do zagadnienia ogniskowania światła za pomocą soczewek, dlatego też urządze- nia, które spełniają podobne zadanie w stosunku do cząstek, także się nazywają soczew- kami. Wygląd takiej soczewki elektronowej schematycznie przedstawia rys. 29.5. Jest to „soczewka elektrostatyczna”, której działanie zależy od pola elektrycznego pomiędzy dwiema leżącymi obok siebie elektrodami. Jej działanie można zrozumieć, jeżeli zasta- nowić się, co się dzieje z równoległą wiązką elektronów, która wpada do soczewki z lewej strony. Gdy elektrony przybywają do otoczenia punktu a, doznają działania siły o składo- wej „bocznej” i uzyskują pewien impuls, który ugina elektrony w kierunku osi. Można by się spodziewać, że te elektrony uzyskują taki sam co do wielkości, ale przeciwnie skiero- wany impuls w otoczeniu punktu b, ale tak nie jest. Przez ten czas, w którym elektrony docierają do punktu b, uzyskują one pewną energię, a więc pozostają w otoczeniu punktu b krócej. Siły są takie same, ale czas ich działania jest krótszy, a więc impuls jest mniejszy- Elektrony przechodząc przez otoczenie punktów a i b uzyskują pewien wypadkowy impu^s w kierunku osi i zostają ugięte w kierunku pewnego wspólnego punktu. Opuszczają obszar, w którym jest wysokie napięcie, cząstki doznają następnego „prztyczka” w k16*
29-3 SOCZEWKA ELEKTROSTATYCZNA 155 29.5. Soczewka elektrostatyczna. Pokazane linie pola są „liniami sił”, to znaczy liniami ęE runku osi. Siła w otoczeniu punktu c działa „na zewnątrz”, a w okolicy pun- ktu d „do wnętrza”, ale cząstki przeby- wają dłużej w tym drugim obszarze i uzy- skują znowu wypadkowy impuls. Dla niezbyt dużych odległości od osi całko- wity impuls, po przebyciu soczewki, jest proporcjonalny do odległości od osi (czy potraficie wytłumaczyć, dlaczego tak jest?) i to, jest właśnie niezbędny warunek dla ogniskowania za pomocą soczewek. Przeprowadzając takie samo rozu- mowanie, można pokazać, że ogniskowa- nie nastąpi, jeżeli elektroda środkowa będzie dodatnia lub ujemna względem pozostałych dwóch. Tego typu soczewki elektrostatyczne są powszechnie używane w elektronowych lampach katodowych i w niektórych mikroskopach elektronowych. 29-4. Soczewka magnetyczna Innym typem soczewki — często spo- tykanym w mikroskopach elektronowych ~~ jest soczewka magnetyczna, której schemat widzimy na rys. 29.6. Jest to ele- ktromagnes o symetrii walcowej z bardzo Clenkimi, kolistymi nabiegunnikami, które Wytwarzają w małym obszarze nieje- dnorodne pole o dużym natężeniu. Ele- r°ny, które wchodzą do tego obszaru 29.6. Soczewka magnetyczna
156 29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH w kierunku pionowym, są ogniskowane. Działanie takiej soczewki można zrozu- mieć po przyjrzeniu się powiększonemu obrazowi obszaru pomiędzy nabiegunnikamj przedstawionemu na rys. 29.7. Rozważmy dwa elektrony a i b, które opuszczają źródło 5 pod pewnymi kątami względem osi. Gdy elektron a osiąga początek pola, zostaje odchy- lony od nas (w głąb rysunku) przez składową poziomą pola. Ale wówczas elektron będzie miał składową ,,boczną” prędkości, tak że gdy przejdzie on przez silne pole, mające skła- dową pionową, otrzyma impuls w kierunku osi. Jego „boczny” ruch zostaje zatrzymany przez siłę magnetyczną, w momencie gdy elektron opuszcza pole, a więc wypadkowy efekt składa się z impulsu w kierunku osi i z „obrotu” wokół osi. Wszystkie siły, które działają na cząstkę b, są skierowane przeciwnie, a więc zostanie ona również odchylona w kie- runku osi. Z rysunku widać, że rozbieżne elektrony zostają uformowane w wiązkę równo- ległą. Działanie soczewki magnetycznej podobne jest do działania soczewki optycznej, z obiektem ustawionym w jej ognisku. Jeżeli za taką soczewką ustawić drugą, podobną soczewkę magnetyczną, to elektrony zostaną zogniskowane z powrotem w jednym punkcie, dając obraz źródła S. 29-5. Mikroskop elektronowy** 1 Wiemy, że mikroskop elektronowy może „widzieć” obiekty, które są za małe, aby można je było oglądać przez mikroskopy optyczne. W rozdziale 30 tomu I (cz. 2) omó- wiliśmy podstawowe ograniczenia dotyczące każdego układu optycznego, a pochodzące od dyfrakcji na otworze obiektywu. Jeżeli otwór obiektywu wybiera z wiązki wychodzącej ze źródła część o kącie rozwarcia 20 (patrz rys. 29.8), to dwóch sąsiednich punktów w źródle nie będzie można zobaczyć jako oddzielonych obiektów, jeżeli są one zbliżone bardziej niż o 2 gdzie 2 jest długością fali światła. W najlepszych mikroskopach optycznych kąt 6 jest bliski teoretycznej granicy 90°, tak że <5 jest prawie równa długości 2, czyli w przybliżeniu 5000 A. To samo ograniczenie stosuje się do mikroskopu elektronowego, ale w tym wypadku długość fali jest równa — dla elektronów o energii 50 MeV — około 0,05 A. Jeżeliby się udało użyć obiektywu z kątem apertury wejściowej bliskim 30°, można by zobaczyć obiekty od siebie odległe zaledwie o 1 A. Ponieważ atomy w cząsteczkach są zwykle od- ległe od siebie o 1 lub 2 A, moglibyśmy otrzymać fotografię cząsteczek. Jakże ułatwiłoby to życie biologom — mielibyśmy fotografię nawet struktury kwasu dezoksyrybonukleino- wego **'. Jakaż by to była wspaniała rzecz! Większość obecnych badań w biologii mole- kularnej ma na celu znalezienie kształtów złożonych cząstek organicznych. Gdybyśmy tylko mogli je zobaczyć! ’ Porównaj: Tom I, cz. 2, rozdz. 30 (Dyfrakcja). 1 Porównaj: Tom I, cz. 1, str. 55. (Przyp. red. wyd. potakiafo).
nr- 29-5. MIKROSKOP ELEKTRONOWY 157 Niestety, najlepsza zdolność rozdzielcza, ja- ką uzyskano w mikroskopie elektronowym, wy- nosi około 20 A. Powodem tego jest fakt, że ni- komu się jeszcze nie udało skonstruować socze- wki z dużym otworem obiektywu. Wszystkie soczewki mają „aberrację sferyczną”, co oznacza, że promienie tworzące dużę kąty z osią mają inne ogniska niż promienie bliższe osi, tak jak to pokazano na rys. 29.9. Przy użyciu spe- cjalnych metod technicznych można skonstruo- wać soczewki mikroskopów optycznych o aber- racji sferycznej możliwej do pominięcia, ale niko- mu się jeszcze nie udało zrobić soczewki elektro- nowej pozbawionej aberracji sferycznej. Istotnie, można pokazać, że opisane przez nas typy soczewek elektrostatycznych lub mag- netycznych muszą mieć pewną, nie dającą się usunąć, aberrację sferyczną. Ta aberracja — wraz z dyfrakcją — ogranicza zdolność rozdziel- czą mikroskopów elektronowych do jej obec- nej wartości. Wspomniane ograniczenia nie dotyczą pól elektrycznych i magnetycznych, które nie mają symetrii osiowej albo które nie są stałe w czasie. Może pewnego dnia ktoś wymyśli nowy typ soczewki elektronowej, która pozwoli prze- zwyciężyć tę nieodłączną aberrację prostej so- czewki elektronowej. Wówczas będzie można bezpośrednio fotografować atomy. Być może, analiza składników chemicznych będzie polegała kiedyś na obserwacji położeń atomów, a nie na przypatrywaniu się kolorowi jakiegoś osadu! 29.8. Zdolność rozdzielcza mikroskopu jest ograniczona przez kąt, pod jakim widać otwór obiektywu ze źródła 29.9. Aberracja sferyczna soczewki 29-6. Pola prowadzące w akceleratorze Pól magnetycznych używa się także do wytworzenia odpowiednich torów cząstek w akceleratorze cząstek wielkich energii. W urządzeniach takich jak cyklotron i syn- ^hrotron cząstki uzyskują wielkie energie, przechodząc raz po raz przez silne pole elektryczne. Cząstki są utrzymywane w swoich cyklicznych orbitach przez pole ma- gnetyczne. Widzieliśmy, że w jednorodnym polu magnetycznym cząstka porusza się po orbicie dołowej. Jest to jednak prawdą tylko dla pola doskonale jednorodnego. Wyobraźmy s°bie pole B, które jest w przybliżeniu jednorodne na dużym obszarze, ale które w pewnej
158 29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH 29.10. Ruch cząstki w polu lekko nie- jednorodnym części tego obszaru jest nieco silniejsze niż gdzie indziej. Jeżeli do takiego pola wprowa- dzić cząstkę o pędzie p, będzie się ona po- ruszać po orbicie prawie kołowej, o promieniu 2? = pjqB. Promień krzywizny będzie jednak nieco mniejszy w obszarze, gdzie pole magne- tyczne jest silniejsze. Orbita nie będzie okręgiem zamkniętym, ale będzie ona „spacerować” przez pole, tak jak to pokazano na rys. 29.10. Jeżeli się zechce, można uważać, że niewielki „błąd” w polu wytwarza dodatkowy „prztyczek”, który przesuwa cząstkę na nowy tor. Jeżeli cząstki mają dokonać milionów obiegów w akceleratorze, potrzebny jest jakiś rodzaj „radialnego ogniskowania”, które będzie dążyło do utrzymania torów cząstek w pobliżu pewnej określonej orbity. Innym kłopotem, związanym z polem jednorodnym, jest to, że cząstki nie pozostają w jednej płaszczyźnie. Jeżeli startują one odchylone od płaszczyzny o nawet najmniejszy kąt — lub zostają odchylone o niewielki kąt przez jakąś nieregularność w polu — to będą one przebiegały po torze spiralnym, który w końcu zaprowadzi je na biegun magnesu albo na górną ściankę lub na dno zbiornika próżniowego. Należy coś zrobić, aby zapobiec takim pionowym wędrówkom; pole musi dostarczać oprócz ogniskowania radialnego także i „ogniskowanie pionowe”. Można się od razu domyślić, że ogniskowanie radialne powinno się uzyskać stwarzając pole magnetyczne, które rośnie ze wzrostem odległości od środka zaprojektowanej orbity. Jeżeli cząstka przysunie się na orbitę o za dużym promieniu, to znajdzie się w silniejszym polu, które ugnie ją z powrotem w kierunku orbity o właściwym promieniu. Jeżeli cząstka wejdzie na orbitę o małym promieniu, to uginające działanie pola magnetycznego będzie mniejsze i cząstka powróci na zadaną orbitę. Jeżeli cząstka oddali się choć raz od stycznej do idealnego koła, to będzie oscylować wokół idealnej orbity kołowej, tak jak to poka- zano na rys. 29.1 la. Dzięki radialnemu ogniskowaniu cząstki będą się utrzymywać w po- bliżu orbity kołowej. W rzeczywistości ogniskowanie radialne może też zachodzić nawet przy maleniu pola wraz ze wzrostem promieni. Może się to zdarzyć w wypadku, gdy wzrost promienia krzywizny toru nie jest „szybszy” od wzrostu odległości cząstki od środka pola. Orbity cząstek będą wyglądały jak na rys. 29.1 Ib. Jeżeli jednak gradient malejącego pola jest zbyt duży, cząstki nie powracają na orbity o danym z góry promieniu, lecz będą się spi- ralnie zaginały do wewnątrz lub odginały na zewnątrz, tak jak to pokazano na rys. 29.1 lc- Zwykle wzrost pola opisujemy poprzez „względny gradient” lub wskaźnik pola, n: n = dB/B dr/r (29.2) Pole prowadzące daje ogniskowanie radialne, jeżeli jego względny gradient jest większy niż — 1.
29-6. POLA PROWADZĄCE W AKCELERATORZE 159 29.11. Ruch radialny cząstki w polu magnetycznym a) szybko wzrastającym wraz z promieniem r, b) wolno malejącym wraz z promieniem r, c) szybko malejącym wraz z promieniem r Radialny gradient pola będzie także wytwarzał pionowe siły działające na cząstkę. Przypuśćmy, że mamy pole, które jest silniejsze w pobliżu środka orbity, a słabsze na większych odległościach. Przekrój pionowy magnesu płaszczyzną prostopadłą do płasz- czyzny orbity może wyglądać jak na rys. 29.12. (Dla protonów orbity „wychodzą” w kie- runku patrzącego z płaszczyzny rysunku.) Jeżeli pole ma być silniejsze po lewej stronie, a słabsze po prawej, to linie sił pola magnetycznego muszą być zakrzywione, tak jak to pokazano na rysunku. Wynika to z prawa, że rotacja z pola B jest równa zeru w prze- strzeni swobodnej. Jeżeli obrać współrzędne tak, jak to pokazano na rysunku, to wówczas SBX SB, (V xB) = —-±--2. = 0, y Sz Sx czyli SBX Sz Ponieważ zakładamy, że SBJSx jest ujemne, musi istnieć równa mu ujemna wielkość SBJSz. Jeżeli „symboliczna” Płaszczyzna orbit jest płaszczyzną symetrii, dla której Bx = 0, składowa radialna Bx będzie ujemna nad, a dodatnia pod pła- SZczyzną, czyli linie muszą być zakrzy- wione, tak jak to pokazano. 29.12. Pionowe pole prowadzące, widziane w prze- kroju prostopadłym do płaszczyzny orbit
160 29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH I MAGNETYCZNYCH Takie pole będzie miało własności ogniskowania pionowego. Wyobraźmy sobie pro- ton, który przebiega bardziej lub mniej równolegle do płaszczyzny orbity głównej, ale ponad nią. Składowa pozioma pola B wywrze na ten proton siłę, skierowaną w dół. Jeżeli proton się znajduje poniżej głównej orbity, ta siła ma przeciwny zwrot. Istnieje więc efektywna „siła porządkująca” w kierunku głównej orbity. Z naszych rozważań wynika, że ogniskowanie będzie pionowe, jeżeli pionowa składowa pola będzie maleć ze wzrostem promienia; jeżeli natomiast gradient pola będzie dodatni, to pojawi się „pionowe rozognisko- wanie”. Tak więc dla ogniskowania pionowego wskaźnik pola musi być mniejszy od zera. Powyżej znaleźliśmy, że dla ogniskowania radialnego n musi być większe od —1. Oba te warunki dają wspólnie warunek: -1 < n < 0, jeżeli cząstki mają być utrzymane na stałych orbitach. W cyklotronach stosuje się wartości n bardzo bliskie zera, w betatronach i synchrotronach używa się zazwyczaj n — —0,6. 29-7. Ogniskowanie metodą zmiennego gradientu Takie małe wartości n dają raczej „słabe” ogniskowanie. Widać jasno, że o wiele bar- dziej efektywne ogniskowanie radialne otrzymałoby się dla dużego gradientu dodat- niego (n > 1), ale wówczas siły pionowe powodowałyby silne rozogniskowanie. Podobnie, duży ujemny wzrost pola (n < —1) dawałby znaczne siły w kierunku pionowym, ale po- wodowałby rozogniskowanie radialne. Jednakże około 10 lat temu przekonano się, że siła, która powoduje na przemian silne ogniskowanie i silne rozogniskowanie, może dać -wypadkowy efekt ogniskujący. 29.13. Soczewka kwadrupolowa ogniskująca poziomo 29.14. Soczewka kwadrupolowa ogniskująca pionowo
29-7. OGNISKOWANIE METODĄ ZMIENNEGO GRADIENTU 161 29.15- Ogniskowanie poziome i pionowe za pomocą pary soczewek kwadrupolowych Aby wyjaśnić, jak działa metoda ogniskowania zmiennym gradientem, opiszemy naj- pierw działanie soczewki kwadrupolowej, która pracuje na tej samej zasadzie. Wyobraźmy sobie, że do pola z rys. 29.12 dodajemy jednorodne, ujemne pole magnetyczne, którego natężenie jest tak dobrane, aby pole przy orbicie było równe zeru. Wypadkowe poje — dla małych odległości „od neutralnego punktu” — wygląda tak, jak pole na rys. 29.13. Taki czterobiegunowy magnes nazywamy „soczewką kwadrupolową”. Cząstka dodatnia, która wchodzi do soczewki (od strony czytającego) odchylona na prawo lub na lewo od środka, zostaje przesunięta z powrotem w kierunku środka. Jeżeli cząstka wpada powy- żej lub poniżej punktu neutralnego, zostaje odsunięta od środka. To jest soczewka ognis- kująca poziomo. Jeżeli zmienić znak poziomego gradientu — co można zrobić zmieniając znaki wszystkich biegunów — znaki wszystkich sił ulegają zmianie, i otrzymujemy so- czewkę ogniskującą pionowo, tak jak na rys. 29.14. Natężenie pola w takich soczew- kach, a więc i siły ogniskujące, rosną liniowo z odległością soczewki od osi. Wyobraźmy sobie teraz, że ustawimy takie dwie soczewki, jedną za drugą. Jeżeli cząstka wchodzi z pewnym poziomym odchyleniem od osi, tak jak to pokazano na rys. 29.15a, to zostanie ona odchylona w kierunku osi w pierwszej soczewce. Gdy cząstka przybywa od drugiej soczewki, jest już ona bliżej osi, tak że siła działająca na nią na zew- nątrz jest mniejsza, a więc i odchylenie na zewnątrz jest mniejsze. W efekcie cząstka zo- staje ugięta w stronę osi; średni efekt daje ogniskowanie poziome. Z drugiej strony, jeżeli Przyjrzeć się cząstce, która wchodzi odchylona w kierunku pionowym od osi, to jej tor będzie wyglądał tak, jak na rys. 29.15b. Cząstka jest najpierw odchylona od osi, ale wów- czas przybywa do drugiej soczewki z większym przesunięciem, doznaje działania większej S1fy, tak że zostaje ugięta w stronę osi. I tym razem wypadkowy efekt jest ogniskujący. Tak więc para soczewek kwadrupolowych działa zarówno dla ruchu w kierunku pozio- mym, jak i dla ruchu w kierunku pionowym — w sposób bardzo zbliżony do tego, w jaki działa soczewka optyczna. Soczewek kwadrupolowych używa się do formowania 1 kontrolowania wiązek cząstek w bardzo podobny sposób, w jaki soczewki optyczne s4 używane dla wiązek świetlnych. Powinniśmy zaznaczyć, że układ ze zmiennym gradientem nie zawsze daje ognisko- wanie. Jeżeli gradienty są za duże (w stosunku do pędu cząstek lub do odstępu pomiędzy ~~ Wykłady z fizyki
162 29. RUCH ŁADUNKÓW W POLACH ELEKTRYCZNYCH 1 MAGNETYCZNYCH 29.16. Wahadło zamocowane na drga- jącym czopie może mieć położenie równowagi, w którym ciężarek wa- hadła znajduje się ponad czopem 29.17. Przyspieszenie „w dół” czopa powoduje przesunięcie się wahadła w kierunku pionu soczewkami), wypadkowy efekt może być rozogniskujący. Można zobaczyć, jak cos takiego mogłoby się wydarzyć, jeżeli wyobrazimy sobie, że odstęp pomiędzy dwoma so- czewkami z rys. 29.15 zostałby powiększony, np. trzy lub cztery razy. Powróćmy do prowadzącego magnesu synchrotronu. Możemy uważać, że składa się on z przemiennego ciągu „dodatnich” i „ujemnych” soczewek, z nałożonym na nie jedno- rodnym polem magnetycznym. To jednorodne pole ma na celu naginać cząstki do kolistej orbity poziomej (nie wpływając na ruch pionowy), a soczewki o „znakach” prze- miennych działają na wszystkie cząstki, które mogłyby zmylić drogę — spychając je zawsze w kierunku głównej orbity (statystycznie rzecz biorąc). Istnieje ładna analogia mechaniczna, która pokazuje, jak siła, która kolejno się zmie- nia pomiędzy siłą „ogniskującą”, a siłą „rozogniskującą”, może mieć wypadkowy wynik „ogniskujący”. Wyobraźmy sobie wahadło mechaniczne, składające się ze sztywnej sztabki, zakończonej jakimś ciężarkiem. Sztabka ta jest zawieszona na czopie, który może byc gwałtownie poruszany w górę i w dół przez korbę napędzaną silnikiem. Takie wahadło ma dwa położenia równowagi. Oprócz normalnego położenia równowagi, z ciężarkiem zwisającym w dół, wahadło znajduje się także w równowadze „wisząc do góry” — z cię- żarkiem nad czopem! Takie wahadło przedstawia rys. 29.16. Z opisanej powyżej analogii mechanicznej widać, że pionowy ruch czopa jest równo- ważny zmniejszającej się sile ogniskującej. Gdy czop uzyskuje przyspieszenie w dół, cię- żarek dąży do przesunięcia się do wewnątrz, tak jak to zaznaczono na rys. 29.17. Gdy czop uzyskuje przyspieszenie do góry, sytuacja się zmienia na przeciwną. Siła skierowu- jąca ciężarek w stronę osi zmienia się co chwilę, ale wypadkowym efektem jest siła w kie-
rr 29-7. OGNISKOWANIE METODĄ ZMIENNEGO GRADIENTU 163 runku osi. Tak więc wahadło będzie się wahać tam i z powrotem wokół neutralnego po- łożenia, które jest akurat przeciwne do „normalnego” położenia równowagi. Oczywiście, można utrzymać wahadło ciężarkiem ku górze w o wiele łatwiejszy sposób, a mianowicie balansując nim na palcu. Ale niech ktoś spróbuje balansować dwoma nie- zależnymi od siebie laskami na jednym palcu\ Albo jedną laską, ale mając zamknięte oczy! Takie balansowanie wprowadza od razu poprawkę, jeżeli coś idzie nie tak, jak trzeba. Ale jak wprowadzić takie poprawki w przypadku ogólnym, kiedy kilka rzeczy jedno- cześnie „nie idzie” tak jak trzeba? W synchrotronie są miliardy cząstek, biegnących razem dookoła, z których każda może wystartować z różnym „błędem”. Ten rodzaj ogniskowa- nia, który opisaliśmy, działa na każdą z tych cząstek. 29-8. Ruch w skrzyżowanych polach elektrycznych i magnetycznych Dotychczas mówiliśmy o cząstkach znajdujących się albo tylko w polach elektrycz- nych, albo tylko w polach magnetycznych. Jeżeli wystąpią jednocześnie oba rodzaje pól, powstaje kilka interesujących zjawisk. Przypuśćmy, że mamy jednorodne pole magne- tyczne B i prostopadłe doń pole elektryczne E. Cząstki, których prędkości początkowe będą prostopadłe do pola B, będą się poruszać po krzywej przedstawionej na rys. 29.18. (Jest to krzywa plaska, a nie spirala!) Taki ruch potrafimy opisać jakościowo. Cząstka (załóżmy, że dodatnia), poruszająca się w kierunku pola E, zwiększa swoją prędkość i dla- tego też jest mniej odchylana przez pole magnetyczne. Gdy porusza się ona „pod prąd” pola E, traci prędkość i jest coraz bardziej odchylana przez pole magnetyczne. W wypad- kowym efekcie cząstka uzyskuje średni „dryf” w kierunku ExB. Można w istocie pokazać, że ten ruch jest superpozycją jednostajnego ruchu po okręgu i ruchu jednostajnego „w bok” z prędkością vd = EiB — tor na rys. 29.18 jest cykloidą. Wyobraźmy sobie pewnego obserwatora, który się porusza na prawo, ze stałą prędkością. W jego układzie odniesienia nasze pole magnetyczne zostaje przetransportowane na nowe pole magnetyczne plus pewne pole elektryczne, skierowane w dól. Jeżeli obserwator się porusza z odpowiednią prędkością, jego całkowite pole elektryczne będzie równe zeru i obserwator zobaczy elektron poruszający się po okręgu. Tak więc oglądany przez nas ruch jest sumą ruchu po okręgu i translacji z prędkością „dryfu” vd = E/B. Ruch elektro- nów w skrzyżowanych polach elektrycznych 1 magnetycznych stanowi podstawę działania lamp magnetycznych, oscylatorów używanych d° generacji fal ultrakrótkich. Jest wiele innych, interesujących przykła- dów ruchów cząstek w polach elektrycznych 1 magnetycznych — takich jak orbity elektro- nów i protonów uwięzionych w pasach Van Allena — ale niestety, nie mamy czasu, aby S|? tutaj nimi zająć. 29.18. Tor cząstki w skrzyżowanych polach: elektrycznym i magnetycznym
30 wewnętrzna geometria kryształów 30-1. Wewnętrzna geometria kryształów*) Zakończyliśmy omawianie podstawowych praw elektryczności i magnetyzmu i chcemy się teraz zająć elektromagnetycznymi własnościami materii. Zaczynamy od opisu ciał stałych, tzn. kryształów. Gdy ruch atomów materii jest raczej ograniczony, skupiają się one razem i układają się w konfiguracje o możliwie jak najmniejszej energii. Jeżeli atomy w pewnym miejscu znalazły sieć, która zdaje się być siecią o niskiej energii, atomy znaj- dujące się gdzie indziej ułożą się prawdopodobnie w ten sam sposób. Z tych powodów w ciele stałym mamy powtarzającą się sieć atomów. Innymi słowy, warunki w krysztale są następujące: Otoczenie poszczególnego atomu w krysztale ma pewne uporządkowanie i jeżeli się przyjrzeć atomowi tego samego ro- dzaju, znajdującemu się w innym miejscu przesuniętym nieco w przód, to znajdzie się taki atom, którego otoczenie będzie dokładnie takie samo. Jeżeliby wybrać atom przesunięty dalej w przód o taką samą odległość, to jeszcze raz się znajdzie dokładnie takie same warunki. Sieć powtarza się ciągle i ciągle — i oczywiście w trzech wymiarach. Wyobraźmy sobie problem zaprojektowania tapety — czy też materiału lub jakiegoś wzoru geometrycznego na płaszczyźnie — w której powinien występować element wzoru, który się powtarza, powtarza i powtarza, tak że powierzchnię można uczynić tak dużą, jak się chce. Jest to dwuwymiarowy odpowiednik problemu, jaki kryształ „rozwiązuje w trzech wymiarach. Tak na przykład na rys. 30.1a widzimy pospolity typ wzoru tapety- Mamy tu pojedynczy element powtarzający się w sieci, która może się rozciągać bez końca. Własności geometryczne tego wzoru tapety, dotyczące tylko jego własności powta- rzania się, a nie mające nic wspólnego z geometrią samego obiektu lub jego stroną arty- 1 Porównąj C. Kittel, Wstęp do fizyki ciała stałego, PWN, Warszawa 1970. (Przyp. tłum.)
30-1. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW 165 30.1. Model sieci dwuwymiarowej, złożonej z powtarzającego się elementu styczną, pokazano na rys. 30. Ib. Jeżeli zacząć od dowolnego punktu, można znaleźć odpowiadający mu punkt przesuwając się o odległos'ć a w kierunku strzałki 1. Można się również dostać do innego odpowiadającego mu punktu, jeżeli się przesunąć o odległość b w kierunku drugiej strzałki. Oczywiście, jest wiele innych kierunków. Można na przykład przejść od punktu a do punktu fi i osiągnąć położenie odpowiadające, ale taki „krok” można rozpatrywać jako złożenie „kroku” wzdłuż kierunku 1, a następnie „kroku” wzdłuż kierunku 2. Jedną z podstawowych własności sieci można opisać podając dwa najkrótsze kroki do sąsiednich, jednakowych położeń. Przez „jednakowe” położenia rozumiemy takie położenia, że gdyby ktoś stanął w którymkolwiek z nich i rozejrzałby się wokół siebie, to zobaczyłby dokładnie to samo, co widziałby stojąc w innym z tych „położeń jedna- kowych”. Jest to podstawowa własność kryształu. Jedyną różnicą jest to, że kryształ ma uporządkowanie trójwymiarowe, a nie dwuwymiarowe; oczywiście, zamiast kwiatków każdy element siatki stanowi pewien typ uporządkowania atomów — np. sześć atomów wodoru i dwa atomy węgla — w formie pewnego wzoru. Sieć atomów w krysztale można znaleźć doświadczalnie, rozpraszając na nim promienie Róntgena. Poprzednio wspomnie- liśmy pokrótce o tej metodzie i nie powiemy teraz już niczego więcej; dodajmy jedynie, że dokładne uporządkowanie atomów w prze- strzeni zostało znalezione dla większości pro- stych kryształów oraz dla niektórych kry- ształów dość złożonych. Wewnętrzna struktura sieciowa kryszta- łów ujawnia się na wiele sposobów. Po pierw- sze, siły wiązania atomów są zwykle większe w pewnych kierunkach niż w innych. Ozna- cza to, że w krysztale są pewne płaszczyzny, wzdłuż których kryształy można łatwiej przełamać niż wzdłuż innych. Nazywamy je płaszczyznami łupliwości. Jeżeli rozłupać kryształ nożem, to często rozszczepi się on wzdłuż takiej płaszczyzny. Po drugie, struk- tura wewnętrzna często się odzwierciedla w wyglądzie powierzchni kryształu, ze względu na sposób, w jaki kryształ się uformował. Wy- obraźmy sobie kryształ wytrącający się z roz- tworu. W roztworze znajdują się atomy „pływające” w różnych kierunkach. Atomy te w końcu się osadzają, gdy znajdują jakieś Położenie o najmniejszej energii. (To tak jakby taPeta powstawała z kwiatków, poruszają- cych się dopóty w różnych kierunkach, dopóki Jeden z nich nie dotrze przypadkowo do właściwego miejsca i nie zostanie tam
166 30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW 30.2. Kryształy naturalne: a) kwarc, b) chlorek sodu, c) mika t „złapany”; potem jeszcze jeden kwiatek i jeszcze jeden — tak że sieć rośnie stopniowo.) Łatwo się pogodzić z tym, że kryształ rośnie w pewnych kie- runkach z szybkością różną niż w innych kierun- kach, przez co przybiera on pewien kształt geo- metryczny. Ze względu na takie zjawiska zewnę- trzne powierzchnie wielu kryształów wykazują pew- ne cechy wewnętrznego uporządkowania atomów. Tak na przykład na rys. 30.2a pokazano kształt typowego kryształu kwarcu, którego sieć wewnę- trzna jest heksagonalna. Gdybyśmy się przyjrzeli dokładnie takiemu kryształowi, zauważylibyśmy, że jego ścianka zewnętrzna nie jest idealnym sześciokątem, ponieważ nie wszystkie jej boki mają jednakową długość — w rzeczywistości są one często bardzo nierówne. Ale pod jednym wzglę- dem to jest bardzo dobry sześciokąt: kąty po- między ściankami mają dokładnie po 120°. To jasne, wymiary każdej ścianki są kwestią przy- padku, ale kąty są cechą reprezentującą geome- trię wewnętrzną kryształu. Chociaż więc każdy kryształ kwarcu może mieć inny kształt, kąty po- między odpowiednimi ściankami będą zawsze takie same. Wewnętrzna geometria kryształu chlorku sodu jest także widoczna z jego kształtu zewnętrznego. Na rysunku 30.2b pokazano kształt typowego ziarenka soli kamiennej. I tym razem kryształ nie jest idealnym sześcianem, ale poszczególne ścianki są do siebie dokładnie prostopadłe. Kryształem o bardziej skomplikowanej budo- wie jest mika, która ma kształt taki, jaki pokaza- no na rys. 30.2c. Jest to kryształ wysoce anizotro- powy, o czym można się łatwo przekonać doświa- dczalnie, ponieważ kryształ ten bardzo trudno prze- łamać rozciągając go w jednym kierunku (poziom0 na rysunku), a bardzo łatwo — rozciągając w inny01 kierunku (pionowo). Miki używa się zwykle do otrzymywania bardzo twardych, cienkich P*>" tek. Mika i kwarc — to dwa przykłady natU" ralnych minerałów zawierających krzemionkę. Trz°" cim przykładem minerału zawierającego krzem10' nkę jest azbest, który ma ciekawą własnos*-’
30-1. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW 167 można go łatwo rozerwać, rozciągając go w dwóch kierunkach, ale nie w trzecim. Okazuje się, że azbest składa się z bardzo mocnych włókien podłużnych. 30-2. Wiązania chemiczne w kryształach Mechaniczne własności kryształów zależą oczywiście od typu wiązań chemicznych pomiędzy atomami. Uderzająco różna wytrzymałość miki wzdłuż różnych kierunków zale- ży od typu wiązań atomowych w tych kierunkach. Bez wątpienia czytelnik dowiedział się już z chemii o różnych rodzajach wiązań chemicznych. A więc przede wszystkim, są wiązania jonowe, jakie już opisaliśmy dla chlorku sodu. Z grubsza mówiąc, atomy sodu tracą elek- tron i stają się jonami dodatnimi; atomy chloru zyskują elektron i stają się jonami ujem- nymi. Dodatnie i ujemne jony układają się w trójwymiarową szachownicę i utrzymują się razem siłami elektrycznymi. Wiązanie kowalencyjne, w którym elektrony są rozdzielone pomiędzy dwa atomy, spotyka się częściej i jest ono zwykle bardzo mocne. W diamencie na przykład atomy węgla są we wszystkich czterech kierunkach związane ze swoimi najbliższymi sąsiadami wiąza- niami kowalencyjnymi, tak że kryształ jest rzeczywiście bardzo twardy. W krysztale kwarcu występuje także wiązanie kowalencyjne pomiędzy krzemem i tlenem, ale to wiązanie jest w rzeczywistości tylko częściowo kowalencyjne. Ponieważ nie ma całkowitego rozdzie- lenia elektronów, atomy są częściowo naładowane i kryształ jest nieco ,.jonowy”. Natura nie jest taka prosta, jak usiłujemy ją przedstawić; w rzeczywistości możliwe są wszystkie pośrednie stopnie pomiędzy wiązaniem kowalencyjnym, a jonowym. W krysztale cukru występuje jeszcze inny typ wiązania. Kryształ ten składa się z dużych drobin, w których atomy silnie się wzajemnie utrzymują poprzez wiązania kowalencyjne, tak że drobina ma strukturę zwartą. Ale ponieważ te silne wiązania są już całkowicie wy- korzystane, to pomiędzy pojedynczymi, oddzielnymi drobinami, istnieją tylko stosun- kowo słabe siły przyciągające. Można powiedzieć, że w takich kryształach drobinowych drobiny zachowują swoją indywidualność, a uporządkowanie wewnętrzne wygląda tak jak na rys. 30.3. Ponieważ drobiny nie trzymają się razem mocno, to takie kryształy łatwo można rozbić. Są one całkiem różne od czegoś w rodzaju diamentu, który w rzeczywistości jest jedną olbrzymią drobiną, nie dająca się rozbić bez rozerwania mocnych wiązań kowalencyj- nych. Innym przykładem kryształu drobinowego jest parafina. Skrajny przykład kryształu drobinowego wy- st?puje w takich substancjach jak na przykład Ustalony argon. Pomiędzy atomami występują bardzo małe siły przyciągające — każdy atom Jest całkowicie wysyconą drobiną jednoatomo- "'5’ Ale w bardzo niskich temperaturach ruch C'ePlny jest bardzo mały, tak że niewielkie siły •ałające pomiędzy atomami mogą spowodować 30.3. Sieć kryształu drobinowego
168 30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW uporządkowanie atomów w regularny szyk — stos ciasno upakowanych kul. Metale tworzą zupełnie różną klasę substancji. Wiązanie jest tu całkowicie innego typu, W metalach wiązanie nie występuje pomiędzy przyległymi atomami, ale jest własnością całego kryształu. Elektrony walencyjne nie są przyłączone do jednego atomu lub do pary atomów, ale są rozdzielone na cały kryształ. Każdy atom wnosi elektron do wspólnej „puli” elektronów, a dodatnie jony atomowe spoczywają w morzu elektronów ujemnych. To morze elektronów trzyma razem jony, tak jakby to był jakiś „klej”. W metalach nie ma silnej kierunkowości w wiązaniu, ponieważ nie występują tam ja- kieś specjalne wiązania w żadnych szczególnych kierunkach. Metale są jednak w dalszym ciągu tworami krystalicznymi, ponieważ całkowita energia jest najmniejsza w przypadku gdy jony atomów są uporządkowane w jakimś określonym szyku, chociaż energia tego wyróżnionego uporządkowania zwykle nie jest wiele mniejsza od energii innych możli- wych uporządkowań. W pierwszym przybliżeniu atomy wielu metali wyglądają jak małe kule, możliwie jak najciaśniej upakowane. 30-3. Wzrost kryształów Spróbujmy sobie wyobrazić naturalne tworzenie się kryształów w ziemi. W powłoce ziemskiej znajduje się olbrzymia mieszanina wszystkicfi rodzajów atomów. Są one ciągle „wzburzane” przez działalność wulkaniczną, przez wiatr i przez wodę — ciągle pobudzają się we wszystkich kierunkach i mieszają się ze sobą. Mimo tego, przy pomocy jakiejś sztuczki, atomy krzemu stopniowo zaczynają się wzajemnie znajdować i znajdować zara- zem atomy tlenu, tak aby utworzyć krzemionkę. Co chwilę jeden atom dołącza do innych, aby uformować kryształ — mieszanina zostaje uporządkowana. A gdzieś w pobliżu szu- kają się wzajemnie atomy sodu i chloru i budują kryształy soli kamiennej. Jak to się dzieje, że gdy kryształ raz się już rozpocznie formować, to dopuszcza on do udziału w tym procesie tworzenia tylko pewien szczególny typ atomu? Dzieje się tak, po- nieważ cały układ dąży do tego, aby uczynić energię jak najmniejszą. Rosnący kryształ będzie przyjmował nowy atom, jeżeli ten atom zmniejszy energię o tyle, o ile się tylko da. Ale skąd kryształ wie, że atom krzemu — lub tlenu — umieszczony w pewnym szczegól- nym miejscu będzie dawał w wyniku możliwie najmniejszą energię? Kryształ dowiaduje się o tym metodą prób i błędów. W cieczy wszystkie atomy są w nieustannym ruchu. Każdy atom zderza się ze swoimi sąsiadami około 1013 razy na sekundę. Jeżeli taki atom uderza we właściwy „punkt” rosnącego kryształu, to ma on nieco mniejszą szansę wyskoczenia z powrotem, jeżeli energia jest mała. Przez ciągłe próby przez okres milionów lat, z szyb- kością 1013 prób na sekundę, atomy stopniowo skupiają się w takich miejscach, w których ich energia jest najmniejsza. W końcu atomy te urastają w duże kryształy. 30-4. Sieci krystaliczne Uporządkowanie atomów w krysztale — sieć krystaliczna — może przybrać jedn4 z wielu postaci geometrycznych. Chcielibyśmy opisać najpierw najprostsze sieci, ktofe
30-4. SIECI KRYSTALICZNE 169 30.4. Komórka elementarna kryształów regularnych: a) centrowanych przestrzennie, b) centrowanych powierzchniowo występują w większości metali i w gazach szlachetnych znajdujących się w stanie sta- łym. Są to sieci regularne, które mogą występować w dwóch postaciach: sieć regularna scentrowana przestrzennie, pokazana na rys. 30.4a, i sieć regularna scentrowana powierzch- niowo, pokazana na rys. 30.4b. Na rysunkach pokazano oczywiście tylko jeden „sześcian” siatki; należy sobie wyobrazić, że ten wzór powtarza się bez końca w trzech wymiarach. Także, aby uczynić rysunek bardziej przejrzystym, pokazano jedynie „centra” atomów. W rzeczywistym krysztale atomy są bardziej podobne do kul stykających się ze sobą. Ciemne i jasne kółka na rysunku mogą, ogólnie biorąc, reprezentować różne rodzaje ato- mów lub mogą być atomami tego samego typu. Tak na przykład żelazo ma sieć regularną scentrowaną przestrzennie w niskich temperaturach, a scentrowaną powierzchniowo w wyż- szych temperaturach. Fizyczne własności w tych dwóch postaciach krystalicznych są zupełnie różne. Skąd się biorą takie postacie krystaliczne? Wyobraźmy sobie, że mamy za zadanie upakować razem kuliste atomy, tak ciasno jak tylko się da. Jeden ze sposobów polega na rozpoczęciu od ułożenia warstwy w „heksagonalnym ciasno upakowanym uporządko- waniu”, tak jak to pokazano na rys. 30.5a. Następnie można dobudować drugą warstwę, taką jak pierwsza, ale przesuniętą poziomo, jak to pokazano na rys. 30.5b. Z kolei można nałożyć trzecią warstwę. Ale uwaga! Trzecią warstwę można położyć na dwa różne spo- s°by. Jeżeli zacząć układanie tej warstwy od umieszczenia atomu w punkcie A na rys. 30-5b, to każdy atom w trzeciej warstwie będzie leżał akurat nad atomem spodniej war- stwy. z drugiej strony, jeżeli zacząć układanie trzeciej warstwy od położenia atomu w Punkcie B, to centra atomów trzeciej warstwy będą leżały dokładnie w środku trójkąta tworzonego przez trzy atomy spodniej warstwy. Każdy inny punkt, w którym rozpocz- Jleiny układać trzecią warstwę, jest równoważny punktowi A lub B, a więc istnieją tylko a sPosoby ułożenia trzeciej warstwy. Jeżeli trzecia warstwa ma atom w punkcie B, to sieć krystaliczna jest siecią regularną trowaną powierzchniowo, ale widzianą pod pewnym kątem. Wygląda to śmiesznie,
170 30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW 30.6. Co to jest sześciokąt, czy też że zaczynając od sześciokątów można skończyć na sześ- sześcian oglądany „z wierzchołka”? cianie. Ale zauważmy, że sześcian oglądany ,,z wierz- chołka” ma kontur sześciokątny. Tak na przykład rys. 30.6 mógłby przedstawiać płaski sześciokąt lub sześcian oglądany „z wierzchołka”. Jeżeli dodać trzecią warstwę do rys. 30.5b zaczynając od atomu w punkcie A, to nie otrzyma się struktury re- gularnej, a siatka będzie miała zamiast tego tylko syme- trię heksagonalną. Widać jasno, że obie opisane możli- wości zapewniają równie ciasne upakowanie. Niektóre metale, np. miedź i srebro, wybierają pier- wszą możliwość, sieć regularną scentrowaną powierz- chniowo. Inne metale, np. beryl i magnez, wybierają drugą możliwość; tworzą one kryształy heksagonalne- Oczywiście, to, która siatka się pojawia, zależy nie tyl- ko od upakowania małych kulek, ale musi być także częściowo określone przeZ inne czynniki. W szczególności jednym z tych czynników jest niewielka resztkowa zależ- ność kątowa sił międzyatomowych (lub w wypadku metali — energia morza elektrono")- Wiadomości na ten temat można znaleźć w podręcznikach chemii. 30-5. Symetria w dwóch wymiarach . , ich Chcielibyśmy teraz omówić niektóre z własności kryształów z punktu widzenia symetrii wewnętrznych. Główną cechą kryształu jest fakt, że jeżeli przejdziemy od J
30-5. SYMETRIA W DWÓCH WYMIARACH 171 nego atomu do odpowiadającego mu atomu, odległego o jedną jednostkę sieci, to znaj- dziemy się znowu w otoczeniu tego samego rodzaju co na początku. Jest to podstawowe twierdzenie. Ale gdyby ktoś z nas był atomem, przekonałby się, że istnieje inny typ zmian, które mogłyby go zaprowadzić do takiego samego otoczenia, to znaczy istnieje inna dopuszczalna „symetria”. Rysunek 30.7a pokazuje inny możliwy wzór „tapetopodobny” (chociaż takiej tapety prawdopodobnie nikt nigdy nie widział). Porównajmy na przykład otoczenia punktów A i B. Na pierwszy rzut oka zdawałoby się, że są one takie same, ale nie całkiem. Punkty C i D są równoważne punktowi A, ale otoczenie punktu B będzie takie samo, jak otoczenie punktu A tylko w wypadku, jeżeliby jedno z nich poddać odbiciu zwierciadlanemu. W tym „modelu sieci” są inne rodzaje punktów „równoważnych”. Tak na przykład, punkty E i F mają „takie same” otoczenia, z tym że jedno z nich jest obrócone względem drugiego o 90°. Ta sieć ma dość szczególną cechę. Obrót o 90° — lub dowolną wielokrot- ność 90° — wokół takiego bieguna jak punkt A daje znowu tę samą sieć. Kryształ o ta- kiej strukturze będzie miał na zewnątrz „sześcienne" naroża, ale jego budowa wewnętrz- na jest bardziej złożona od budowy prostego sześcianu. Teraz, gdy opisaliśmy kilka szczególnych przykładów, spróbujmy znaleźć wszystkie możliwe symetrie, jakie może mieć kryształ. Na początek rozważmy, co się dzieje na płasz- czyźnie. Sieć płaska może być określona przez dwa tzw. wektory proste, które przebie- gają od jednego punktu sieci do dwóch najbliższych punktów równoważnych. Wektory 1 i 2 są wektorami prostymi sieci na rys. 30.1. Dwa wektory a i b na rys. 30.7a są wekto- rami prostymi pokazanej tam sieci. Oczywiście, moglibyśmy z powodzeniem zastąpić wektor a wektorem —a lub wektor b wektorem —b. Ponieważ wektory a i b są równe co do wartości bezwzględnej i prostopadłe do siebie, obrót o 90° przekształca wektor a w b i b w — a, dając znowu tę samą sieć. Widzimy, że istnieją sieci, które mają symetrię „czterokrotną”. Poprzednio opisaliśmy ciasno upakowane uporządkowanie, bazujące na sześciokącie, który może mieć symetrię sześciokątną. Obrót układu kółek z rys. 30.5a o kąt 60° wokół środka dowolnego z kó- łek przeprowadza sieć z powrotem w siebie. 30.7. Model sieci o wysokiej symetrii
172 30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW Jakie są inne rodzaje symetrii względem obrotów? Czy możemy mieć na przykład pię- cio- lub ośmiokątną symetrię obrotową? Łatwo zobaczyć, że takie symetrie nie są możli- we. Jedyną symetrią o krotności większej od czterech jest symetria sześciokrotna. Pokażmy najpierw, że symetria o krotności większej od sześciu nie jest możliwa. Spróbujmy sobie na przykład wyobrazić sieć o dwóch równych wektorach prostych z kątem zawartym po- między nimi mniejszym od 60°, tak jak na rys. 30.8a. Stawiamy hipotezę, że punkty B i C są równoważne punktowi A i że wektory a i b są dwoma najkrótszymi wektorami od punktu A do jego najbliższych sąsiadów. Ale oczywiście tak nie jest, ponieważ odległość od punktu B do C jest krótsza od odległości każdego z tych punktów do A. W punkcie D musi się znajdować sąsiad równoważny punktowi A, który jest bliżej A niż B lub C. Powinniśmy byli wybrać b' jako jeden z naszych wektorów prostych. A więc kąt pomię- dzy dwoma wektorami prostymi musi mieć 60° lub więcej. Ośmiokątna symetria nie jest możliwa. A co z symetrią pięciokątną? Jeżeli założymy, że wektory proste a i b mają jednakową długość i tworzą kąt 2?r/5 — 72°, tak jak na rys. 30.8a, to powinien tam także być punkt równoważny sieci w D, przesunięty względem C o 72° wokół A. Ale wówczas wektor b', od punktu E do C, jest mniejszy od wektora b, a więc wektor b nie jest wektorem prostym. Nie może być symetrii pięciokrotnej. Jedyne możliwości, które nie doprowadzają nas do opisanych powyżej sprzeczności, to: 6 = 30.8. a. Symetrie obrotowe o krotności więk- szej od sześciu nie są możliwe, b. Symetria obrotowa pięciokrotna nie jest możliwa. 60°, 90° lub 120°. Zero lub 180° są oczywiście także możliwe. Nasz wynik można ująć mó- wiąc, że sieć nie ulega zmianie przy rotacji o jeden pełny obrót (nie ma w ogóle żadnej zmiany), o połowę, o jedną trzecią, o jedną czwartą lub o jedną szóstą pełnego obrotu. Są to wszystkie możliwe symetrie na płaszczyźnie — w sumie jest ich pięć. Jeżeli 6 = 2tv/ n, mówimy o symetrii „n-krotnej”. Mówimy, że sieć z n równym 4 lub 6 ma „wyższą symetrię” niż sieć z n równym 1 lub 2. Powracając do rys. 30.7a widzimy, że ta sieć ma czterokrotną symetrię obrotową. Na rysunku 30.7b narysowano inny „wzór”, który ma te same własności symetrii co część a). Małe, podobne do przecinków figurki są obiektami asymetrycznymi, które służą do określania symetrii sieci w każdym kwa- dracie. Zauważmy, że przecinki w dwóch sąsiednich kwadratach są odwrócone wzgl?' dem siebie, tak więc komórka podstawowa jest większa od jednego z tych kwadracików- Gdyby nie było tych figurek, sieć miałab} w dalszym ciągu czterokrotną symetrię, a'e komórka podstawowa byłaby mniejsza. M0'
30-5. SYMETRIA W DWÓCH WYMIARACH 173 dele sieci z rys. 30.7 mają także i inne własności symetrii. Tak na przykład odbicie wzglę- dem każdej z przerywanych linii R-R odtwarza tę samą sieć. Sieci z rys. 30.7 mają jeszcze inny typ symetrii. Jeżeli odbić sieć względem linii Y-Y i przesunąć ją o jeden kwadrat w prawo (lub w lewo), otrzyma się z powrotem sieć począt- kową. Linię Y-Y nazywa się „linią poślizgu”. Były to wszystkie możliwe symetrie w dwóch wymiarach. Jest jeszcze jedna operacja symetrii przestrzennej, która w dwóch wymiarach jest równoważna obrotowi o 180°, ale która jest zupełnie inną operacją w trzech wymiarach. Jest to inwersja. Polega ona na tym, że każdy punkt odległy od jakiegoś środka [np. od punktu A na rys. 30.9b] o wektor przesunięcia R zostaje przesunięty do punktu odległego od środka o — R. Inwersja sieci a) z rys. 30.9 wytwarza nową sieć, ale inwersja sieci b) odtwarza tę samą sieć. Dla sieci dwuwymiarowej (jak można to zobaczyć z rysunku), inwersja sieci b) względem punktu A jest równoważna obrotowi o 180° wokół tego samego punktu. Przy- puśćmy jednak, że siatkę z rys. 30.9b uczynimy trójwymiarową, wyobrażając sobie, że każda z „szóstek” i „dziewiątek” ma małą strzałkę, wystającą do góry z rysunku. Po in- wersji w trzech wymiarach wszystkie strzałki zostaną odwrócone „do góry nogami”, tak że sieć nie zostanie odtworzona. Jeżeli oznaczyć groty i lotki strzałek odpowiednio przez kropki i krzyżyki, to można utworzyć sieć trójwymiarową, taką jak na rys. 30.9c, która nie jest symetryczna względem inwersji lub można utworzyć sieć pokazaną w części 30.9. Symetria względem inwersji. Model (b) sieci pozostaje bez zmian jeżeli R -> —R, ale model (a) sieci ulega zmianie. W trzech wymiarach model (d) jest symetryczny względem inwersji, natomiast model (c) sieci takim nie jest
174 30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW d) rysunku, która ma taką symetrię. Zauważmy, że nie da się zastąpić trójwymiarowej inwersji przez żadną kombinację obrotów. Jeżeli będziemy charakteryzować „symetrię” jakiegoś wzoru — lub sieci krystalicznej — przez opisane przez nas typy operacji, to się okaże, że w dwóch wymiarach możliwe jest 17 odmiennych sieci. Sieć o najmniejszej możliwej symetrii jest pokazana na rys. 30.1 a sieć o wysokiej symetrii — na rys. 30.7. Czytelnikowi pozostawiamy zabawienie się w odnalezienie wszystkich 17 możliwości. Zadziwiający jest fakt, że z tak niewielu z tych 17 możliwych wzorów korzysta się przy projektowaniu tapet lub tkanin. Spotyka się zawsze te same, trzy lub cztery, podsta- wowe wzory. Czy wynika to z braku wyobraźni u projektantów, czy też wiele z tych możli- wych wzorów nie jest przyjemnych dla oka? 30-6. Symetrie w trzech wymiarach Dotąd mówiliśmy tylko o sieciach w dwóch wymiarach. Jednakże, nas interesują prze- de wszystkim sieci atomów w trzech wymiarach. Po pierwsze, kryształ trójwymiarowy będzie oczywiście miał trzy wektory proste. Jeżeli następnie spytać o możliwe operacje symetrii w trzech wymiarach, to się okaże, że istnieje 230 różnych możliwych symetrii! Dla pewnych celów te 230 rodzajów symetrii można podzielić na siedem klas, które są przedstawione na rys. 30.10. Sieć o najmniejszej symetrii nazywamy trójskośną. Jej ko- mórką elementarną jest równoległościan. Wektory proste mają różne długości i żadne dwa z kątów zawartych pomiędzy nimi nie są sobie równe. Nie może więc istnieć żadna symetria obrotowa lub odbiciowa. Istnieją tu jednak dwie możliwe symetrie — komórka elementarna może zostać lub też nie zmieniona przez inwersję względem punktu. [ Przez inwersję w trzech wymiarach rozumiemy w dalszym ciągu, że przesunięcia przestrzenne R zostają zastąpione przesunięciami — R; innymi słowy, że punkt (x, y, z) przechodzi w punkt (—x, — y, —z).] Tak więc siatka trójskośną ma tylko dwie możliwe symetrie, chyba że pomiędzy wektorami prostymi zachodzą jakieś szczególne zależności. Jeżeli na przykład wszystkie wektory mają jednakową długość i „oddzielone” są od siebie tymi samymi kątami, to mamy sieć trygonalną, której komórkę pokazano na rysunku. Rysunek ten może mieć dodatkową symetrię; może nie ulegać zmianie przy obrocie wokół dłuższej przekątnej przestrzennej. Jeżeli jeden z wektorów prostych, np. c, jest prostopadły do pozostałych, to mamy elementarną komórkę jednoskośną. Możliwa jest tu nowa symetria — obrót o 180° wo- kół c. Komórka heksagonalna jest przypadkiem szczególnym, dla którego wektory a i b są sobie równe i kąt pomiędzy nimi wynosi 60°, tak że obrót o 60° lub 120° lub 180 wokół wektora c odtwarza tę samą sieć (dla pewnych symetrii wewnętrznych). Jeżeli wszystkie wektory proste są wzajemnie prostopadłe, ale mają różne długości, otrzymujemy komórkę rombową. Jest ona symetryczna względem obrotów o 180° wok trzech osi. Symetrie wyższego rzędu są możliwe w komórce tetragonalnej, która ma wszyst kie kąty proste i dwa równe wektory proste. Na koniec jest jeszcze komórka regularna’ która jest najbardziej symetryczna z wszystkich.
30 6 SYMETRIE W TRZECH WYMIARACH 175 trygonalna 30.10. Siedem klas sieci krystalicznej Przyczyną tych wszystkich rozważań na temat symetrii jest to, że wewnętrzne symetrie kryształów znajdują odzwierciedlenie — czasem w bardzo subtelny sposób — w makrosko- powych własnościach fizycznych kryształu. Widzieliśmy na przykład, że w ogólnym wy- padku kryształ ma tensor polaryzowalności elektrycznej. Jeżeli przedstawimy tensor poprzez elipsoidę polaryzacji, to powinniśmy oczekiwać, że niektóre z symetrii kryształu wystąpią także w tej elipsoidzie. Tak na przykład kryształ regularny jest symetryczny względem obrotów o 90° wokół każdego z trzech kierunków ortogonalnych. Rzecz jasna, jedyną elipsoidą o tej własności jest kula. Kryształ regularny musi zatem być dielektrykiem izotropowym. Z drugiej strony, kryształ tetragonalny ma czterokrotną symetrię obrotową. Jego elipsoida musi mieć dwie ze swych osi głównych równe, a trzecia oś musi być równoległa osi kryształu. Podobnie, ponieważ kryształ rombowy ma dwukrotną symetrię obro- tową wokół trzech prostopadłych osi, jego osie muszą się pokrywać z osiami elipsoidy °firotowej. Z tych samych względów jedna z osi kryształu jednoskośnego musi być równo- legła do jednej z osi głównych elipsoidy, chociaż nic nie da się powiedzieć o pozostałych
176 30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW osiach. Ponieważ kryształ trójskośny nie ma symetrii obrotowej, jego elipsoida może mieć zupełnie dowolną orientację. Jak widać, poszukiwanie wszystkich możliwych symetrii i wiązanie ich z różnymi możliwymi tensorami fizycznymi stanowi doskonałą, a zarazem pożyteczną zabawę. Rozważyliśmy tylko tensor polaryzacji, ale dla innych tensorów, na przykład dla tensora sprężystości, sprawy się znacznie komplikują. Istnieje dziedzina matematyki, nazwana „teorią grup”, która się zajmuje takimi właśnie zagadnieniami, ale zwykle można dojść do tego, co jest potrzebne za pomocą zwykłego „pomyślunku”. 30-7. Wytrzymałość metali Powiedzieliśmy, że metale mają zazwyczaj prostą krystaliczną strukturę regularną; chcemy teraz omówić ich własności mechaniczne, które zależą od tej struktury. Metale są, mówiąc ogólnie, bardzo „miękkie”, ponieważ łatwo można przesuwać jedną warstwę kryształu po drugiej. Można by pomyśleć: „To dziwne; wiemy przecież, że metale są twarde.” A jednak tak nie jest; pojedynczy kryształ metalu można bardzo łatwo odkształcić. Przyjrzyjmy się na przykład dwóm warstwom kryształu, poddanym sile ścinającej, tak jak to pokazano schematycznie na rys. 30.11 a. Na pierwszy rzut oka mogłoby się wydawać, że cała warstwa się nie poruszy, dopóki siła nie będzie na tyle duża, aby mogła przesunąć całą warstwę przez „garby”, tak że warstwa zostałaby przesunięta o jedną „bruz- dę” na lewo. Chociaż przesunięcie rzeczywiście występuje wzdłuż pewnej płaszczyzny, to jednak nie dzieje się to w taki właśnie sposób. (Gdyby tak było, można by obliczyć, że metal jest o wiele bardziej wytrzymały niż w rzeczywistości.) Przesuwanie wygląda raczej tak, jak gdyby co chwilę przeskakiwał nowy atom; najpierw przeskakuje atom z lewej strony, potem następny i tak dalej, tak jak to zaznaczono na rys. 30.1 Ib. W wyniku tego procesu między dwoma atomami powstaje wolna przestrzeń, która się szybko przesuwa na prawo i w efekcie cała górna warstwa zostaje przesunięta o jeden odstęp pomiędzy atomami. To „ślizganie się” zachodzi w ten właśnie sposób, ponieważ na przeniesienie co chwilę jednego atomu przez garb potrzeba o wiele mniej energii niż na przeniesienie całego ich rzędu. Skoro tylko siła będzie już dostatecznie duża, aby zapoczątkować ten proces, dalszy jego ciąg nastąpi bardzo szybko. Okazuje się, że w rzeczywistym krysztale przesuwanie występuje sukcesywnie najpierw w jednej płaszczyźnie, następnie ulega tam zahamowaniu i zaczyna się w jakiejś innej 30.11. Poślizg płaszczyzn krystalicznych a) b)
30-7. WYTRZYMAŁOŚĆ METALI 177 płaszczyźnie. Dokładne powody dlaczego aku- rat się tak dzieje, są dość tajemnicze. W rze- czywistości wydaje się zupełnie dziwne, że ko- lejne obszary przesunięcia leżą często w pra- wie jednakowych odstępach od siebie. Na rysunku 30.12 widać fotografię maleńkiego, cienkiego kryształu miedzi, który był rozcią- gany. Można tu zobaczyć różne płaszczyzny, w których nastąpiło przesuwanie. Nagłe przesuwanie się pojedynczych płaszczyzn kryształu można łatwo zaobser- wować, jeżeli się weźmie kawałek cyny, która ma duże kryształy i jeżeli się ją rozciągnie, trzymając ją blisko ucha. Można wtedy usłyszeć serię „tykań”, gdy płaszczyzny, jedna po drugiej, wskakują w swoje nowe położenia. Zagadnienie występowania „brakującego” atomu w jednym rzędzie jest nieco trud- niejsze, niż mogłoby się wydawać z rys. 30.11. Gdy jest więcej warstw, sytuacja wygląda raczej jak na rys. 30.13. Taką niedoskona- łość w krysztale nazywa się dyslokacją. Przy- puszcza się, że dyslokacje powstają albo w procesie formowania się kryształu, albo zo- stają wytworzone w jakimś zagłębieniu lub rysie na powierzchni. Gdy tylko już raz pow- staną, mogą się one poruszać stosunkowo swobodnie po całym krysztale. Totalne od- kształcenia kryształów są wynikiem ruchów wielu takich dyslokacji. Dyslokacje mogą się poruszać swobodnie, to znaczy potrzebują niewiele dodatkowej energii dopóty, dopóki reszta kryształu ma sieć doskonałą. Ale dyslokacje mogą „ugrzęz- nąć”, jeżeli napotkają jakiś inny rodzaj wad w krysztale. Aby wyminąć taką wadę, dys- lokacje potrzebują dużo energii; zostają one w*ęc zatrzymane. To właśnie zjawisko jest odpowiedzialne za wytrzymałość niedosko- nałych kryształów metalu. Kryształy czystego Zelaza są całkiem miękkie, ale mała domie- szka atomów zanieczyszczenia może wytwo- 30.12. Fotografia niaicgu kjryształu miedzi, który był rozciągany 30.13. Dyslokacja w krysztale Wykłady z fizyki 12 -
178 30. WEWNĘTRZNA GEOMETRIA KRYSZTAŁÓW 30-14- Dyslokacja śrubowa 30.15. Wzrost kryształu 30.16. Kryształ parafiny, który wyrósł wokół dyslokacji śrubowej rzyć tyle wad, że skutecznie unieruchamia dyslokację. Jak wiadomo, stal, która jest „z pochodzenia” żelazem, jest bardzo twarda. Aby wyprodukować stal, rozpuszcza się małą ilość węgla w roztopionym żelazie; jeżeli taki stop się gwałtownie oziębi, węgiel wytrąca się w postaci małych ziaren, tworząc wiele mikro- skopijnych zniekształceń w sieci. Dyslokacje nie mogą się już więcej poruszać i metal staje się twardy. Czysta miedź jest bardzo miękka, ale można ją „utwardzić mechanicznie”. Robi się to albo kując miedź, albo zginając ją tam i z powrotem. W tym przypadku wytwarza się wiele nowych dyslokacji różnych typów, które interferując ze sobą redukują swą ruchliwość. Być może, ktoś widział sztuczkę polegającą na tym, że bierze się sztabkę „piekielnie miękkiej” miedzi i deli- katnie się ją zgina wokół czyjegoś nadgarstka w formie bransoletki. W tym procesie miedź zostaje utwardzona i nie można już jej łatwo odgiąć z powrotem! Utwardzony metal, taki jak miedź, można z powrotem zmiękczyć, wy- żarzając go w wysokiej temperaturze. Ruch cieplny atomów „sprasowuje” dyslokacje i znowu tworzy duże pojedyncze kryształy. Opisaliśmy dotąd tylko tak zwaną dyslokację poślizgową. Istnieje wiele innych typów dyslo- kacji, jedną z nich jest dyslokacja śrubowa, po- kazana na rys. 30.14. Dyslokacje te odgrywają ważną rolę we wzroście kryształu. 30-8. Dyslokacje i wzrost kryształów Przez długi czas proces wzrostu kryształu stanowił jedną z wielkich zagadek. Opisaliśmy- jak to się dzieje, że każdy atom, drogą ciągły0^ prób, może się zdecydować, czy lepiej W w krysztale, czy też nie. Ale to oznacza, każdy atom musi znaleźć miejsce o małej enet gii. Jednakże atom umieszczony na nowej P° wierzchni jest związany od spodu tylko Je°
30-8. DYSLOKACJE I WZROST KRYSZTAŁÓW 179 nym lub dwoma wiązaniami i nie ma on takiej samej energii, jaką by miał, gdyby się znajdował w kącie, mając po bokach trzy atomy. Wyobraźmy sobie na przykład rosnący kryształ jako stertę klocków, tak jak to pokazano na rys. 30.15. Jeżeli spró- bować przyłożyć nowy „klocek”, powiedzmy w punkcie A, to będzie on miał tylko jed- nego z sześciu możliwych sąsiadów, których powinien uzyskać w ostatecznym wyniku. Jego energia, przy tylu brakujących wiązaniach, nie będzie bardzo mała. Lepiej byłoby mu już w położeniu B, w którym „klocek” ma już połowę swych wiązań. Kryształy rze- czywiście rosną przez dołączenie nowych „klocków” w miejscach takich jak B. Co się jednak stanie, gdy jeden rząd zostanie skończony? Aby zacząć nowy rząd, atom musi przyjąć stan spoczynku mając przyłączone jedynie dwa boki, a to również nie jest bardzo prawdopodobne. Nawet gdyby tak się stało, to co będzie, gdy warstwa zostanie ukończona? Jedną z odpowiedzi jest wyjaśnienie, że kryształ woli rosnąć wokół jakiejś dyslokacji, na przykład wokół dyslokacji śrubowej, takiej jak na rys. 30.14, a „klocki” dodające się do kryształu mogą zawsze znaleźć miejsce, gdzie są dla nich dostępne trzy wiązania. Dlatego też kryształ woli rosnąć, jeżeli ma w sobie dyslokację. Taką spiralę wzrostu pokazano na rys. 30.16, który jest fotografią pojedynczego kryształu parafiny. 30-9. Model kryształu Bragga i Nye’a Oczywiście, nie jesteśmy w stanie zobaczyć, co się dzieje z poszczególnymi atomami w krysztale. Istnieje także, z czego zdajemy sobie teraz sprawę, wiele złożonych zjawisk, których opis jakościowy jest niełatwy. L. Bragg i J. F. Nye wymyślili sposób sporządzenia modelu kryształu metalicznego. Model ten w zadziwiający sposób pozwala zaobserwo- wać zjawiska, które, jak w to wierzymy, występują w rzeczywistym metalu. Poniżej przed- stawiamy artykuł Bragga i Nye’a, który opisuje ich metodę i pokazuje uzyskane przy jej pomocy wyniki.
Dynamiczny model struktury krystalicznej *’ Sir Lawrance Bragg, F. R. S. i J. F. Nye Streszczenie Strukturę krystaliczną metalu imituje zbiór ba- nieczek o średnicy jednego milimetra lub mniej- szej, unoszących się na powierzchni roztworu mydła. Banieczki wydmuchuje się z cienkiej pipety stałym ciśnieniem powietrza; godny uwagi jest fakt, że wymiary banieczek są jednakowe. Banieczki trzymają się razem siłami napięcia powierzchniowego, w jednej warstwie lub też w trójwymiarowym skupisku. Taki zbiór może zawierać setki tysięcy banieczek i utrzymuje się przez godzinę lub dłużej. Zbiory cząsteczek wykazują struktury, o których przypuszczano, że istnieją w metalach oraz imitują efekty, które były obserwowane, takie jak granice ziaren, dyslokacje i inne typy defektów sieci, poślizg, rekrystalizację, hartowanie i zniekształcenia sieci pochodzące od obcych atomów. 1. Model banieczek W proponowanych od czasu do czasu modelach struktury krystalicznej atomy przedstawiano w postaci małych, pływających lub zawieszonych •’ Artykuł ten pochodzi z „Proceedings of the Royal Society of London”, 190, September 1947, str. 474-481 i prze- drukowany został w Wykładach Ftynmana za zezwoleniem Autorów i Royal Society. (Przyp. red. wyd. polskiego.) swobodnie magnesów, lub w postaci kolistych krążków unoszących się na powierzchni wody i utrzymujących się razem siłami przyciągania kapilarnego. Modele te mają pewne wady; na przykład w wypadku zetknięcia się pływających obiektów siły tarcia hamują ich swobodny ruch względem siebie. Poważniejszą wadą jest ograni- czenie liczby składników modelu, ponieważ aby się zbliżyć do tego, co się dzieje w krysztale rzeczywistym, potrzebna jest duża liczba składni- ków. Niniejsza praca opisuje zachowanie się modelu, w którym atomy są reprezentowane przez małe banieczki o średnicy od 0,1 do 2 mm, unoszące się na powierzchni roztworu mydła. Te małe banieczki są dostatecznie wytrzymałe dla doświadczeń trwających godzinę lub dłużej, ślizgają się one po sobie bez tarcia i można je wytwarzać w dużych ilościach. Niektóre z foto- grafii w tej pracy zostały zrobione dla zbiorów banieczek liczących 100000 lub więcej banie- czek. Ten model odzwierciedla bardzo dobrze własności struktury metalicznej, ponieważ wszyst- kie banieczki są tego samego typu i utrzymują się razem siłą totalnego przyciągania kapilarnego, co odpowiada sile wiążącej elektrony swobodnie w metalu. Krótki opis tego modelu został podany w „Journal od Scientific Instruments” (Bragg- 1942b) ♦>. •> Bragg W. L. 1942b, J. Sci. Inslrum. 19, 148.
pyNAMICZNY ROZWÓJ STRUKTURY KRYSTALICZNEJ 181 2. Metoda wytwarzania banieczek Banieczki są wydmuchiwane z wąskiego otworu, pod powierzchnią roztworu mydła. Najlepsze wyniki otrzymano używając roztworu, którego przepis podał p. Green z Royal Institution. 15,2 cm3 przedestylowanego kwasu olejowego należy dobrze wstrząsnąć z 50 cm3 wody desty- lowanej. Następnie miesza się to z 73 cm3 10%- -ego roztworu trójetyloaminy, dopełnia się miesza- niną do 200 cm3 i dodaje się do niej 164 cm3 czystej gliceryny. Tak otrzymanej mieszaninie poz- dukowanych banieczek. Przykładowo — pipeta grubościenna z otworem o średnicy 49 p., przy ciśnieniu 100 cm słupa wody, wytwarzała banieczki o średnicy 1,2 mm. Cienkościenna pipeta o śred- nicy wylotu 27 p, przy ciśnieniu 180 cm słupa wody, wytwarzała banieczki o średnicy 0,6 mm. Wygodnie jest nazywać banieczki o średnicy od 2,0 do 1,0 mm „dużymi” banieczkami, o średnicy od 0,8 do 0,6 mm — „średnimi” banieczkami i o średnicy od 0,3 do 0,1 mm — „małymi” ba- nieczkami, ponieważ ich zachowanie zmienia się w zależności od ich rozmiarów. 1. Aparatura do wytwarzania warstw banieczek wala się odstać, po czym odciąga się spod spodu klarowny płyn. W niektórych doświadczeniach płyn ten rozcieńczano w trzy razy większej obję- tości wody, aby zmniejszyć lepkość. Otwór dyszy pipety znajdował się około 5 mm pod powierzch- nią. Stałe ciśnienie powietrza od 50 do 200 cm słupa wody dostarczano za pomocą dwóch pomp typu Winchester. Normalnie banieczki mają za- dziwiająco jednakowe rozmiary. Czasami zdarza się otrzymywać nierówne banieczki, ale można temu zapobiec zmieniając pipetę lub ciśnienie. Niepożądane bańki można łatwo usunąć przesu- wając po powierzchni płomień palnika. Rysunek 1 Pokazuje aparaturę. Przekonaliśmy się, że korzyst- nie jest poczernić dno naczynia, ponieważ szcze- 8óły struktury, takie jak granice ziaren i dysloka- ! CJe ukazują się wówczas wyraźniej. '— Na fotografii 2 pokazano część „warstwy”, czyli dwuwymiarowego „kryształu”, zbudowanej * banieczek. Regularność tej warstwa można ostrzec spoglądając na rysunek pod małym ką- . 'n- Rozmiar banieczek zmienia się wraz ze srednicą dyszy pipety, ale nie zauważono, aby ten r°zniiar się zmieniał w jakiś widoczny sposób c*snieniem, czy też z głębokością zanurzenia °tu pipety pod powierzchnią. Wzrost ciśnienia °duje przede wszystkim wzrost liczby pro- Okazalo się, że przy użyciu tej aparatury nie- możliwe jest takie zmniejszenie średnicy pipety, aby móc wytwarzać banieczki o średnicy mniej- szej od 0,6 mm. Ponieważ pożądane było wyko- nywanie doświadczenia z małymi banieczkami, użyliśmy takiego oto sposobu — roztwór mydła umieszczano w obracającym się naczyniu, a do jego ścianki wewnętrznej, możliwie jak najbli- żej, przytykano cienką pipetę, równolegle do linii sił prądu. Banieczki były porywane z otworu pipety w momencie powstawania i, jeżeli utrzy- mywano stałe warunki, były one dość jednakowe. Takie banieczki są produkowane z wydajnością tysiąca lub więcej banieczek w ciągu sekundy, czemu towarzyszy dźwięk o wysokim tonie. Podczas obrotu naczynia roztwór mydła podnosi się ostro w górę wzdłuż obwodu naczynia, ale po ustaniu obrotu roztwór opada, zabierając ze sobą większość banieczek. Za pomocą urządze- nia pokazanego na rys. 3 otrzymano banieczki 3. Aparatura do wytwarzania banieczek o małych rozmiarach o średnicy 0,12 mm. Przykładowo — przy użyciu cienkościennej pipety, z otworem 30 p., przy ciśnieniu 190 cm słupa wody i prędkości cieczy 180 cm/s względem wylotu pipety, otrzymano
182 DYNAMICZNY MODEL STRUKTURY KRYSTALICZNEJ bameczki o średnicy 0,14 mm Użyto przy tym naczynia o średnicy 9,5 cm i prędkości 6 obrotow na sekundę Fotografia 4 jest powiększonym obrazem tych „małych” banieczek i pokazuje stopień ich regularności, model sieci otrzymany przy użyciu obracającego się naczynia nie jest tak doskonały, jak model otrzymany przy użyciu naczynia spoczywającego, rzędy banieczek są trochę nieregularne, co można zobaczyć patrząc na fotografię pod małym kątem Te dwuwymiarowe kryształy wykazują struk- tury, o których przypuszczano, ze istnieją w meta- lach i imitują zjawiska, które były obserwowane, takie jak granice ziaren, dyslokacje i inne typy de- fektów sieci, poślizg, rekrystalizację, hartowanie i zniekształcenia pochodzące od atomów „ob- cych” 3. Granice ziaren Na fotografiach 5a, 5b i 5c pokazano typowe granice ziaren dla banieczek o średnicach od- powiednio 1,87, 0,76 i 0,30 mm Szerokość za- burzonej powierzchni przy granicy, gdzie rozkład banieczek jest nieregularny, jest w Ogólnym przy- padku tym większa, im mniejsze są bameczki Na fotografii 5a, która pokazuje kilka porcji przylegających do siebie ziaien, bameczki znajdu- jące się na granicy pomiędzy dwoma ziarnami należą w „zdecydowany” sposob do jednego uporządkowania krystalicznego lub do drugiego Na fotografii 5c widać wyraźnie „warstwę Beilby’ego” pomiędzy dwoma ziarnami Małe ba- nieczki, jak to będzie można zobaczyć, mają większą sztywność mz duże bameczki i fakt ten powoduje większą meregularnosc przy warstwie granicznej Poszczególne ziarna można dokładnie zoba- czyć, jeżeli fotografie warstw polikrystalicznych, takie jak fot 5a, 5b, i 5c, oglądać ukośnie Przy odpowiednim oświetleniu taka pływająca warstwa banieczek, oglądana ukośnie, imituje w zadzi- wiający sposob wypolerowaną i wytrawioną po- wierzchnię metalu Zdarza się często, ze mektore z „atomow za- nieczyszczenia”, czyli bameczki, które są wyraźnie większe lub mniejsze od przeciętnej, występują w warstwie polikrystalicznej i gdy tak się dzieje, to większość tych „nietypowych ’ banieczek znaj- duje się przy granicach ziaren Nie należy sobie jednak wyobrażać, ze te nietypowe bameczki przesuwają się w kierunku granic, wadą modely jest właśnie to, ze me może zajsc żadna dyfuZja banieczek przez całą „budowlę” — możliwe $ą jedynie lokalne przeszeregowania banieczek są siadujących ze sobą Okazuje się natomiast, Ze to właśnie granice dążą do tej „przebudowy” która polega na tym, ze jeden z kryształów rośnie kosztem drugiego do momentu, az natrafi na atomy „nietypowe” 4. Dyslokacje Gdy pojedynczy kryształ lub warstwę poi,, krystaliczną poddać sciskamu, rozciąganiu lub odkształcaniu jakiegoś innego typu, zachowują się one bardzo podobme do sposobu, w jaki, jak to sobie wyobrażamy, zachowuje się model poddany jakiemuś odkształceniu Do pewnej granicy model zachowuje się sprężyście Powyżej tej granicy model poddaje się — następuje poślizg wzdłuz jednego z trzech jednakowo nachylonych kierun- ków ściśle upakowanych rzędów Poślizgowi ulegają bameczki znajdujące się w jakimś rzędzie Bameczki te przesuwają się nad bameczkami z sąsiedniego rzędu o odległość równą odstępowi pomiędzy sąsiadami Obserwacja tego procesu jest bardzo interesująca Ten ruch me następuje równocześnie w całym rzędzie, ale zaczyna się przy jednym końcu od pojawienia się „dysloka cji”, gdzie mamy lokalnie o jedną bameczkę więcej w rzędzie po jednej strome linii poślizgu niz w rzędzie po drugiej stronie Ta dyslokacja prze- biega następnie wzdłuz linii poślizgu, z jednego końca na drugi, powodując w ostatecznym wy' niku przesunięcie o jedną odległość „międzyato- mową” Możliwość zachodzenia tego procesu została poddana przez Orwana Polanyi’a i Tay lora, po to aby wytłumaczyć małe siły potrzebne do wytworzenia plastycznych „ślizgów” w struk turach metali Teona rozwinięta dalej przez Tay lora (1934)*>, a mająca na celu wytłumaczenie o kształceń plastycznych w kryształach, zajmuje si$ oddziaływaniem wzajemnym oraz stanem rown° wagi takich dyslokacji Bameczki dostarczaj** uderzającego obrazu tego, co spodziewano sie> istnieje w metalu Czasem dyslokacje PrzesU'^ta] się zupełnie powoli — przejście przez kry5 stanowi dla nich kwestię kilku sekund, takie dy^ kacje można tez oglądać w kryształach P° ------------- -g-ł •> Taylor GI 1934, Proc Roy Soc A I45
d^S4MICZNY MODEL STRUKTURY KRYSTALICZNEJ 183 nych odkształceniom niejednorodnym Pojawia- ją się one w postaci czarnych linii i można je ^baczyć na serii fotografii, 12a-12e Gdy war- stwa polikrystaliczna jest ściskana, te czarne linie przesuwają się bezładnie przez cały kryształ Ma fotografiach 6a, 6b i 6c można zobaczyć przykłady dyslokacji Na fotografii 6a, gdzie średnica banieczek wynosi 1,9 mm, dyslokacja jest bardzo „lokalna” i rozciąga się tylko na szesc banieczek Na fotografii 6b (średnica 0,76 mm) dyslokacja się rozciąga na dwanaście banieczek, a na fot 6c (średnica 0,30 mm) wpływ dyslokacji można odnaleźć na obszarze, ktorego długość jest równa około 50-ciu średnicom banieczek Większa sztywność małych banieczek prowadzi do powstawania dłuższych dyslokacji Jednakże, jeśliby prześledzić dowolny zbiór banieczek, to się okaze, ze nie ma jakiejś standardowej długości dyslokacji dla banieczek o danym rozmiarze Długość dyslokacji zalezy od natury odkształce- nia w krysztale Granicę pomiędzy dwoma krysz- tałami, a kątem pomiędzy odpowiednimi osiami równym 30° (największy kąt dopuszczalny), można rozpatrywać jako ciąg dyslokacji w naprzemian- ległych rzędach i w tym przypadku dyslokacje są bardzo krótkie Wraz z maleniem kąta pomiędzy sąsiadującymi z sobą kryształami dyslokacje występują w coraz to większych odstępach i jedno- cześnie się stają coraz dłuzsze, az w końcu otrzy- muje się pojedyncze dyslokacje w dużym obszarze o doskonałej strukturze Fotografia 7 pokazuje trzy dyslokacje równo- ległe Jeżeli za Taylorem wprowadzić pojęcia , dyslokacja dodatnia” i „dyslokacja ujemna”, to od lewej do prawej można zobaczyć dyslokację dodatnią, ujemną i dodatnią „Wstęga” pomiędzy dwoma ostatnimi dyslokacjami zawiera trzy banieczki w nadmiarze, co można dostrzec, Patrząc się na fotografię wzdłuz rzędów pozio- mych Fotografia 8 pokazuje dyslokację wysu- WaJącą się z granicy ziaren — zjawisko dosc ezęsto obserwowane Fotografia 9 pokazuje obszar, w którym dwie n>eczki zajęły miejsce jednej Można to uważać i graniczny przypadek dyslokacji dodatmej ^Jemnej w sąsiednich rzędach, przy czym pod- e ściskaniu ścianki obu dyslokacji lezą tuz do s,e'31e Przypadek przeciwny prowadziłby k^1Ury w strukturze — w miejscu, gdzie spoty- , y się dwie dyslokacje, brakowałoby jednej oanieczki 5. Inne typy defektu sieci Fotografia 10 pokazuje wąski pasek pomiędzy dwoma kryształami, zorientowanymi równolegle Pasek ten przecina pewna liczba linii defektu, czyli miejsce, gdzie banieczki nie są gęsto upako- wane Właśnie w takich miejscach można się spodziewać wystąpienia rekrystalizacji Granice ziaren zbhzają się do siebie i taki pasek zostaje wchłonięty przez kryształ doskonały Fotografie 1 la-lig ilustrują przykłady upo- rządkowań, które się często pojawiają w takich miejscach, gdzie panuje lokalny niedobór banie- czek Podczas gdy dyslokacja wygląda zwykle tak, jak jakiś ciemny pasek, to tego typu uporządko- wanie występuje w kształcie litery V lub w kształ- cie trójkąta Takie typowe uporządkowanie „V” widać na fot lla Gdy model poddać odkształ- ceniu, powstaje uporządkowanie „V”, uformo- wane przez dwie dyslokacje, które się spotykają pod kątem 60°, uporządkowanie to ulega znisz- czeniu, gdy dyslokacje przesuwają się w dalszym ciągu wzdłuz swych torow Fotografia llb po- kazuje mały trojkącik, który także zawiera w so- bie dyslokację, ponieważ, jak można zauwazyc, rząd poniżej trojkącika zawiera o jedną banieczkę więcej od rzędów niższych Jeżeli dostarczyć troszkę „ruchów cieplnych”, zamieszawszy de- likatnie roztwor w jakimś miejscu, to takie defekty znikają, zostając zastąpione przez struktu- rę doskonałą Tu i owdzie w krysztale jest puste miejsce, w którym brakuje banieczki, a które wygląda na fotografii jak ciemna plama Przykłady takich defektów można zobaczyć na fot lig Taka luka nie może zostać wypełniona na drodze lokalnego przeszeregowania się banieczek, ponieważ wy- pełnienie takiej luki powodowałoby powsta- nie następnej Takiego rodzaju dziury pojawia- ją się i znikają podczas „obrobki” kryształu , na zimno” Tego typu struktury w modelu sugerują, ze podobne defekty lokalne mogą istnieć w rzeczy- wistym metalu Mogą one odgrywać pewną rolę w takich procesach jak dyfuzja lub przejście od struktury uporządkowanej do struktury bezład- nej, zmniejszając bariery energetyczne w swoim sąsiedztwie oraz działając jako jądra krystalizacji w przemianie allotropowej
184 DYNAMICZNY MODEL STRUKTURY KRYSTALICZNEJ 6. Rekrystalizacja i hartowanie Fotografia 12a i 12e ukazują tę samą warstwę banieczek w kilku następujących po sobie chwi- lach. Warstwa pokrywająca powierzchnię roz- tworu została dość dokładnie zamieszana pałeczką szklaną, a następnie pozostawiona w spokoju, tak aby się sama „uspokoiła”. Fotografia 12a pokazuje wygląd tej warstwy po upływie 1 s od chwili zaprzestania mieszania. Warstwa ulega rozbiciu na pewną liczbę małych „krystalitów”; w krystalitach tych są duże odkształcenia niejedno- rodne, na co wskazują liczne dyslokacje i inne defekty sieci. Następna fotografia (12b) pokazuje tę samą warstwę w 32 s później. Małe ziarna zrosły -!ę formując większe ziarna, a duża część odkształ- cenia podczas tego procesu znika. Rekrystalizacja następuje etapami; fotografie ostatnich trzech etapów pokazują wygląd warstwy w 2,14 i 25 min po zamieszaniu. Procesu wtórnego uporząd- kowania nie da się śledzić dłużej, ponieważ ba- nieczki stojąc tak długo kurczą się najwyraźniej na skutek dyfuzji powietrza przez ich ścianki oraz stają się cienkie i wykazują tendencję do pękania. Podczas procesu rekrystalizacji model był pozostawiony w całkowitym spokoju, proces ten zachodzi coraz wolniej, przy czym ruch banie- czek w jednej części roztworu powoduje powsta- nie odkształceń, które wzbudzają nowe prze- szeregowania w jakiejś części sąsiedniej, a te z kolei oddziałują na jeszcze inną część warstwy. Podczas tych kilku etapów rekrystalizacji można zaobserwować kilka interesujących zja- wisk. Zauważmy trzy małe ziarna w punktach oznaczonych przez współrzędne AA, BB i CC. Ziarno AA istnieje przez wszystkie etapy, chociaż jego postać się zmienia. BB jest jeszcze obecne po 14 min, ale znika po 25 min, pozostawiając po sobie cztery dyslokacje, których obecność ozna- cza istnienie w ziarnie odkształceń wewnętrznych. Ziarno CC kurczy się i w końcu znika na fot. 12d, pozostawiając po sobie dziurę i uporządkowanie typu „V”, które z kolei znika na fot. 12e. W tym samym czasie słabo zarysowana granica ziarna DD na fot. 12d staje się już dobrze zarysowana na fot. 12e. Można też zauważyć rozprostowanie się \ granicy ziaren w sąsiedztwie EE na fot. 12b-12e. Na fotografiach widać dyslokacje różnych dłu- gości, odpowiadające wszystkim etapom pomiędzy lekkim wypaczeniem struktury, a zdecydowaną granicą ziaren. Dziury, odpowiadające brakują- cym banieczkom, mają postać czarnych kropek. Niektóre z tych dziur powstają i znikają na skutek ruchu dyslokacji, ale inne dziury odpowiadają miejscom, w których jakaś banieczka pękła. Można dostrzec wiele przykładów uporządko- wania typu „V” i trójkącików. Oglądając tę serię fotografii można też dostrzec inne, interesujące zjawiska. Fotografie 13a, 13b i 13c pokazują część warstwy po upływie 4 min po wymieszaniu. Interesujące jest tu pojawienie się dwóch etapów w dążeniu do bardziej doskonałego uporządkowania. Te pizemiany występują wyraźniej, jeżeli oglądać fotografię z ukosa. Na fotografii 13a uporządko- wanie jest bardzo chaotyczne. Na fotografii 13b banieczki zgrupowały się w rzędy, ale zakrzywie- nie tych rzędów wskazuje na wysoki stan napięć wewnętrznych. Na fotografii 13c ten stan napięcia został złagodzony na skutek wytworzenia się nowej granicy A-A; rzędy po obu stronach tej granicy są już proste. Okazuje się, że energia tak odkształconego kryształu jest większa od energii granicy międzykrystalicznej. 7. Efekt atomu zanieczyszczenia Fotografia 14 pokazuje efekt pochodzący od banieczki o „złych” rozmiarach, a rozciągający się na dość duży obszar. Jeżeli porównać ten rysunek z doskonałymi warstwami z fot. 2 i 4, to można zobaczyć, że regularność rzędów na tym całym rysunku zakłócają trzy banieczki — jedna większa, a dwie mniejsze od banieczek „normal- nych”. Jak już o tym Wspomniano, banieczki o „złych” rozmiarach spotyka się zazwyczaj na granicach ziaren, gdzie występują dziury o nie- typowych kształtach, mogące te banieczki po- mieścić w sobie. 8. Własności mechaniczne modelu dwuwymiarowego Własności mechaniczne dwuwymiarowej, do- skonałej warstwy opisano w pracy poświęconej temu zagadnieniu (Bragg, 1942b)łl. Warstwa taka jest rozciągnięta pomiędzy dwoma sprężynami zanurzonymi poziomo na powierzchni roztworu mydła. Odstępy zwojów sprężyn tak się dobiera, aby pasowały one do odległości pomiędzy rzę- dami banieczek, które wówczas mocno przyle- gają do sprężyn. Jedną ze sprężyn można prze- suwać (równolegle do niej samej) za pomocą •JBragg W. L. 1942b, J. Sci. Instrum. 1», 148.
pYNAMICZNY MODEL STRUKTURY KRYSTALICZNEJ 185 śruby mikrometrycznej, podczas gdy druga jest utrzymywana przez dwa poprzeczne włókna szklane. Naprężenie ścinające można zmierzyć mierząc odchylenie włókien szklanych. Warstwa poddana odkształceniu ścinania zachowuje się zgodnie z prawem sprężystości Hooke’a, aż do momentu osiągnięcia granicy sprężystości. Po przekroczeniu tej granicy w warstwie następuje poślizg wzdłuż któregoś z rzędów środkowych o odległość równą szerokości banieczki. To ści- nanie sprężyste i poślizg mogą się powtórzyć kilka razy. Granica sprężystości zostaje osiągnięta, gdy jedna z krawędzi warstwy zostaje przesunięta (na skutek ścinania) względem drugiej o odległość równą szerokości banieczki. Potwierdza to pod- stawowe założenie, przyjęte przez jednego z au- torów przy obliczaniu granicy sprężystej metalu (Bragg', 1942a)*>, które mówi, iż każdy krystalit w metalu obrabianym na zimno przesuwa się pod wpływem siły wtedy, gdy naprężenie wewnątrz niego osiąga taką wartość, że poślizg wyzwala pewną ilość energii. Obliczenia sił działających pomiędzy baniecz- kami wykonał M. M. Nicholson. Z obliczeń tych wypływają dwa interesujące wnioski. Krzywa obrazująca zależność energii potencjalnej od od- ległości pomiędzy środkami banieczek przypo- mina w dużym stopniu podobną krzywą dla atomów. Energia potencjalna przyjmuje minimum dla odległości pomiędzy środkami nieco mniejszej od średnicy swobodnej banieczki. Wraz ze zmniejszaniem się tej odległości energia gwał- townie wzrasta, przy czym wzrost ten jest wyjąt- kowo gwałtowny dla banieczek o średnicy 0,1 mm, a maleje dla banieczek o średnicy 1 mm, co po- twierdza wniosek wypływający z obserwacji modelu, że małe banieczki zachowują się tak, jak gdyby były one o wiele bardziej sztywne od banieczek większych. 9. Skupiska trójwymiarowe Jeżeli pozwolić banieczkom układać się w wielo- krotnych warstwach na powierzchni roztworu, to tworzą one skupisko — trójwymiarowy “kryształ” — przy czym uporządkowanie jest Jednym z tych uporządkowań, które mają naj- gęstsze upakowanie. Fotografia 15 pokazuje *ld°k ukośny takiego skupiska; daje się zauważyć podobieństwo do wypolerowanej i wytra- ’’ Bragg W. L. 1942a, Naturę, 149, 511. wionej powierzchni metalu. Na rysunku 16 widać podobne skupisko, oglądane „z lotu ptaka”. Niektóre części tego skupiska mają bez wątpienia strukturę regularną o najgęstszym upakowaniu,, przy czym powierzchnią zewnętrzną jest tu płaszczyzna [111] lub [100]. Fotografia 17a po- kazuje płaszczyznę [111]. Widać wyraźnie zarysy trzech banieczek, na których spoczywa każda z banieczek wierzchniej warstwy, a następna warstwa tych banieczek jest ledwo, ledwo wi- doczna i przesunięta względem warstwy „naj- wyższej”, co wskazuje na to, że upakowanie płaszczyzn [111] ma dobrze znaną strukturę regularną. Fotografia 17b pokazuje płaszczyznę [100], gdzie każda z banieczek spoczywa na czte- rech innych. Osie komórki regularnej są oczy- wiście nachylone pod kątem 45° do ciasno upako- wanych rzędów warstwy powierzchniowej. Foto- grafia 17c pokazuje strukturę bliźniaczą w sieci regularnej po obu stronach płaszczyzny [111]. Wierzchnimi płaszczyznami są tu płaszczyzny [111] i [100], które — choć nie widać tego wyraźnie na fotografii — są nachylone do siebie pod pew- nym małym kątem (można to dostrzec spoglą- dając na rysunek z ukosa). Na fotografii 17d widać zarówno strukturę regularną, jak i heksa- gonalną ciasno upakowanych płaszczyzn, ale trudno jest sprawdzić, czy po lewej stronie występu- je rzeczywiście struktura heksagonalna o ciasnym upakowaniu, ponieważ nie jest pewne, czy sku- pisko w tym punkcie jest głębsze niż na dnie warstwy. Na fotografii 16 widać przykłady struk- tur bliźniaczych i granic między krystalicznych. Fotografia 18 pokazuje kilka dyslokacji w struk- turze trójwymiarowej poddanej odkształceniu zginania. 10. Demonstracja modelu Przy współpracy z firmą Kodak został wyko- nany 16-milimetrowy film, pokazujący ruchy dyslokacji i granic ziaren podczas przyłożenia na pojedynczy kryształ i na warstwy polikrysta- liczne naprężeń ścinających. Co więcej — jeżeli umieścić roztwór mydła w naczyniu szklanym o płaskim dnie, model można pokazywać w pro- jekcji epidiaskopowej. Ponieważ do wytworzenia banieczek potrzebna jest pewna głębokość roz- tworu, a sam roztwór jest raczej mętny, to pożą- dane jest, aby projekcji dokonywać przez blok szklany, spoczywający na dnie naczynia, ledwo zanurzony pod powierzchnią roztworu.
31 tensory 31-1. Tensor polaryzowałności dielektrycznej*’ Fizycy mają zawsze zwyczaj rozważania najprostszego przykładu jakiegoś zjawiska i nazywania tego „fizyką”, po czym pozostawiają rozważania bardziej skomplikowanych przykładów trosce innych gałęzi nauki, na przykład matematyce stosowanej, elektrotech- nice, chemii czy też krystalografii. Nawet fizykę ciała stałego można zaliczyć tylko w po- łowie do fizyki, ponieważ interesuje się ona zbytnio specjalnymi substancjami. Dlatego też w tych wykładach będziemy pomijać wiele interesujących zagadnień. Tak na przykład jedną z ważnych właściwości kryształów, czyli większości substancji, jest to, że ich pola- ryzowalność dielektryczna jest różna w różnych kierunkach. Jeżeli przyłożyć pole w jakimś kierunku, to ładunki atomowe trochę się przesuną i wytworzą pewien moment dipolowy, ale jego wielkość zależy w dużym stopniu od kierunku pola. Komplikuje to bardzo spra- wę. Ale w fizyce, aby ułatwić sobie życie, zaczyna się zwykle od rozważań szczególnego przypadku, w którym polaryzowalność jest taka sama we wszystkich kierunkach. Roz- ważenie pozostałych przypadków zostawia się innym gałęziom nauki. Dlatego też w dal- szej części tych wykładów wcale nie będziemy korzystać z tego, o czym będziemy mówić w tym rozdziale. Rachunek tensorowy jest szczególnie pożyteczny do opisu własności substancji, które to własności zmieniają się z kierunkiem — chociaż jest to tylko jeden przykład zastosowa- nia tensorów. Ponieważ większość z Was nie ma zamiaru zostać fizykami, ale wybiera się w realny świat, gdzie rzeczy poważnie zależą od kierunku, to wcześniej czy później będziecie musieli korzystać z tensorów. Zgodnie więc z zasadą, aby nicżego nie pomijać, ♦’ Porównaj: Tom I, cz. 1, rozdz. II (Wektory).
31-1. TENSOR POLARYZOWALNOŚCI DIELEKTRYCZNEJ 187 omówimy teraz tensory, chociaż niezbyt szczegółowo. Chcemy mieć to przeświadczenie, że nasze podejście do fizyki jest „kompletne”. Tak więc na przykład nasza elektrodyna- mika jest kompletna — tak kompletna jak każdy kurs elektryczności i magnetyzmu, nawet kurs dla zaawansowanych. Nasza mechanika nie jest natomiast kompletna, po- nieważ uczyliśmy się jej nie osiągnąwszy jeszcze wysokiego poziomu wyrobienia mate- matycznego i nie byliśmy w stanie omówić takich zagadnień jak zasada najmniejszego działania, funkcje Lagrange’a czy Hamiltona, i tak dalej, które są bardziej eleganckimi sposobami opisu mechaniki. Jednak, z wyjątkiem ogólnej teorii względności, mamy już w sposób pełny sformułowane prawa mechaniki. Nasza elektryczność i magnetyzm są sformułowane w sposób kompletny, a także wiele innych teorii podaliśmy w sposób kompletny. Nie uczyniliśmy naturalnie jeszcze tego z mechaniką kwantową, musimy bo- wiem zostawić sobie coś na przyszłość, ale powinniśmy przynajmniej wiedzieć, co to jest tensor. W rozdziale 30 podkreśliliśmy, że własności substancji krystalicznych są różne w róż- nych kierunkach — mówimy, że substancje te są anizotropowe. Zależność indukowanego momentu dipolowego od kierunku przyłożonego pola elektrycznego jest jednym z przy- kładów, z którego właśnie skorzystamy przy wprowadzeniu pojęcia tensora. Przypuśćmy, że dla danego kierunku pola elektrycznego indukowany moment dipolowy na jednostkę objętości, P, jest proporcjonalny do natężenia przyłożonego pola E. (Jest to dobre przy- bliżenie dla wielu substancji, jeżeli pole E nie jest zbyt duże.) Oznaczmy stałą proporcjo- nalności a*’. Chcemy teraz omówić substancje, dla których a zależy od kierunku przy- łożonego pola; tak jest na przykład w kryształach takich jak kalcyt i innych, przez które patrząc widzimy podwójne obrazy. Przypuśćmy, że dla jakiegoś kryształu stwierdzimy, że pole elektryczne Ej w kierunku osi x wytwarza polaryzację ?! w tym kierunku. Następnie zaś stwierdzimy, że pole elek- tryczne E2 w kierunku osi y, o takim samym natężeniu co pole Ej, wytwarza inną polary- zację P2 w kierunku osi y. Co by się stało, gdybyśmy przyłożyli pole elektryczne pod kątem 45°? No cóż, takie pole jest superpozycją dwóch pól: wzdłuż osi x i wzdłuż osi y, tak że polaryzacja P będzie wektorową sumą Px i P2, tak jak to pokazano na rys. 31. la. Polaryzacja nie ma już teraz tego samego kierunku co pole elektryczne. Widać, jak to się mogło stać. W krysztale mogą istnieć ładunki, które mogą się łatwo poruszać w jed- nym kierunku, na przykład w górę i w dół, a które raczej nie są zdolne do wykonywania ruchów bocznych. Gdy przyłożyć siłę kulombowską pod kątem 45°, ładunki przesu- ną się w większym stopniu w górę niż w bok. Przesunięcia nie następują w kie- runku siły zewnętrznej ze względu na obecność asymetrycznych, wewnętrznych sił sprężystych. Oczywiście, nie musi to być akurat kąt 45°. Jest ogólnie słuszne, że polaryzacja indu- kowana kryształu nie ma kierunku pola elektrycznego. W naszym powyższym przykła- dzie udało nam się „szczęśliwie” dobrać osie x i y, dla których wektor polaryzacji P był *’ W rozdziale 10 (t. II, cz. 1) postąpiliśmy zgodnie z ogólnie przyjętą umową i pisaliśmy P = ZfrfE, Wzywając x (chij „podatnością”. Tutaj wygodniej będzie użyć jednego symbolu, tak ze piszemy a ^biiast eQx- Dla dielektryków izotropowych a = (x—1)e0, gdzie x jest stalą dielektryczną (patrz § 10-4).
188 31. tensory 31.1. Dodawanie się wektorów po- laryzacji w krysztale anizotropo- wym równoległy do indukującego go pola elektrycznego Ę dla obu kierunków: x i y. Gdyby obrócić kryształ względem osi współrzędnych, pole elektryczne E w kierunku osi y wytworzyłoby na ogół polaryzację P, mającą zarówno składową y-ową, jak i skła- dową x-ową. Podobnie, polaryzacja pochodząca od pola elektrycznego, w kierunku osi x, miałaby również składową x-ową i składową y-ową. Wektory polaryzacji byłyby wówczas takie jak na rys. 31. Ib a nie jak na rys. 31.la. Sprawy się dość komplikują, ale dla każdego pola E, działającego w ustalonym kierunku, wartość bezwzględna wektora P jest w dal- szym ciągu proporcjonalna do wartości bezwzględnej wektora E. Chcemy teraz rozważyć przypadek ogólny, w któ- rym kryształ jest dowolnie zorientowany względem osi współrzędnych. Pole elektryczne w kierunku osi x wytworzy polaryzację P, o składowych x-owej, y-owej i z-owej; możemy napisać Px = axxEx, Py = ayxEx, Pz = azxEx. (31.1) Powiedzieliśmy tutaj tylko, że jeżeli pole elektry- czne ma kierunek osi x, to polaryzacja nie musi mieć tego samego kierunku, ale może mieć składowe x-ową, y-ową i z-ową, z których każda jest proporcjonalna do składowej Ex. Współ- czynniki proporcjonalności oznaczamy odpowiednio: axx, ayx, a2X (pierwszy wskaźnik mówi nam, z którą składową wektora P mamy do czynienia, a drugi odnosi się do kierunku pola elektrycznego). Podobnie dla pola w kierunku osi y można napisać PX = aXyEy> Py = ayyEy’ Pz = azyEy’ (3L2) a dla pola w kierunku osi z, Px=aX!Ez, Py = ayzEz, Pz = azzEz. (31-3) Za pomocą powyższych wzorów powiedzieliśmy, że polaryzacja zależy liniowo od pól, tak więc jeżeli mamy pole elektryczne E o obu składowych x-owej i y-owej, to wypadko- wa składowa x-owa wektora P będzie sumą obu składowych Px z równań (31.1) i (31-2)- Jeżeli natomiast pole E ma składowe wzdłuż osi x, y i z, to składowe wypadkowe wekto- ra P będą sumą trzech przyczynków z równań (31.1), (31.2) i (31.3). Innymi słowy, wek- tor P będzie teraz dany równaniami Px = axxEx-3raxyEy+axzEz, Py ayXEX~^~ayyEy~^~ayzEz’> Pz <^zXEX~^~azyEy~^'<^zzEz' (31-4)
31. TENSOR polaryzowalności dielektrycznej 189 Dielektryczne własności kryształu są zatem całkowicie opisane za pomocą dziewięciu wielkości(a^, axy, axz, ayz,...), które można przedstawić symbolem a,y. (Każdy ze wskaź- ników i i j przebiega trzy możliwe litery x, y i z.) Każde dowolne pole elektryczne E można rozłożyć na składowe Ex, Ey i Ez\ z tych składowych, przy pomocy a,y, można znaleźć składowe Px, Py i Pz, które wspólnie dają całkowitą polaryzację P. Zbiór dziewięciu współ- czynników au nazywa się tensorem — w tym przypadku tensorem polaryzowalności die- lektrycznej. Tak samo jak się mówi, że trzy liczby (Ex,Ey,Ez) „tworzą wektor E”, tak się też mówi, że dziewięć liczb (a**, axy,...) „tworzy tensor a0”. 31-2. Przekształcanie składowych tensora Wiemy, że po przejściu do nowego Układu współrzędnych x', y' i z' zarówno składo- we wektora Ex., Ey. i Ez., jak i składowe wektora P będą zupełnie inne. Wszystkie więc współczynniki a,y będą różne dla różnych układów współrzędnych. W istocie, można zo- baczyć jak muszą się zmienić ay, zmieniając w odpowiedni sposób składowe wektorów E i P; jeżeli bowiem opisujemy w nowym układzie współrzędnych fizycznie to samo pole elektryczne, to powinniśmy otrzymać tę samą polaryzację. Dla każdego nowego układu współrzędnych składowa Px- jest pewną kombinacją liniową składowych Px, Py i Pz : P^ = aPx+bPy+cPz, i podobnie dla innych składowych. Podstawiając Px, Py i Pz wyrażone poprzez składowe pola E z równania (31.4) otrzymujemy P,. = a(a^Ex+ax;,Ą+a„E'I)+ + ^(a>x-^*+aWĄ- + a^-^z)+ + c{aIXEx+azyEy+azzEz). Wyraźmy teraz składowe Ex, Ey i Ez przez Ex., Ey. i Ez.; np. Ex = a'Ex.+b'Ey.+c'Ez., gdzie współczynniki a', b', c' są związane z współczynnikami a, b, c, ale nie są im równe. W ten sposób mamy składową Px-, wyrażoną przez składowe Ex-, Ey- i Ez-, to znaczy mamy nowe współczynniki a,y. Jest to dość żmudna procedura, ale zupełnie prosta. Mówiąc o zmianie osi zakładamy, że kryształ pozostaje nieruchomy w przestrzeni. Jeżeli kryształ obracałby się wraz z osiami, to współczynniki a,y by się nie zmieniły. Od- wrotnie, gdyby zmienić orientację kryształu względem osi, mielibyśmy nowy zbiór współ- czynników a. Ale jeżeli mamy te współczynniki dla jakiejś jednej orientacji kryształu, to możemy je znaleźć dla każdej innej orientacji za pomocą transformacji opisanej po- wyżej. Innymi słowy, własności dielektryczne kryształu są całkowicie opisane przez po- danie współczynników tensora polaryzowalności a,y w odniesieniu do jakiegoś dowolnie Wybranego układu osi. Podobnie jak z cząstką można związać wektor prędkości v = (**> vy, vz) wiedząc, że te trzy składowe, po zmianie osi współrzędnych, zmienią się
190 31. TENSORY w pewien określony sposób, tak samo z kryształem wiąże się jego tensor polaryzowal- ności ay, którego dziewięć składowych będzie się przy zmianie układu współrzędnych transformować w pewien określony sposób. Zależność pomiędzy wielkościami P i E, daną przez równanie (31.4), można zapisać w bardziej zwartej postaci: P- = Ę (31.5) i przy czym rozumie się, że i reprezentuje albo x, albo y, albo z i że sumę się bierze wzglę- dem j = x, y i z. Dla tensorów wynaleziono wiele specjalnych metod zapisu, ale każda z nich jest wygodna tylko dla jakiejś ograniczonej klasy zagadnień. Jedna z ogólnie przy- jętych umów polega na opuszczeniu znaku sumy (JJP) w równaniu (31.5), przy czym ro- zumie się, że w wypadku gdy ten sam wskaźnik pojawia się dwa razy (tutaj j), to zawsze należy po tym wskaźniku sumować. Ponieważ w tych wykładach będziemy bardzo rzadko posługiwać się tensorami, nie będziemy zawracać sobie głowy przyswajaniem żadnych takich specjalnych metod zapisu lub umów. 31-3. Elipsoida energii Chcemy się teraz oswoić nieco z tensorami. Przypuśćmy, że zadamy sobie interesu- jące pytanie: Jaka energia jest potrzebna do spolaryzowania kryształu (oprócz energii pola elektrycznego, która — jak wiemy — jest równa e0E2j2 na jednostkę objętości)? Rozważmy przez chwilę ładunki atomowe, które ulegają przesunięciu. Praca wykonana przy przesunięciu ładunku o odległość dx jest równa qExdx, a jeżeli w jednostce obję- tości jest N ładunków, to praca wykonana jest równa qExN dx. Ale qNdx jest zmianą dPx w momencie dipolowym na jednostkę objętości. Tak więc energia potrzebna na jed- nostkę objętości jest równa ExdPx. Okazuje się, że praca wykonana przez wszystkie trzy składowe pola jest równa (na jed- nostkę objętości) E-rfP. Ponieważ wartość bezwzględna wektora P jest proporcjonalna do pola E, praca wyko- nana na jednostkę objętości, przy zmianie polaryzacji od 0 do P, jest równa całce z E-^P- Oznaczając tę pracę przez uP*’ zapisujemy uP = |EP = (31-6) l Można teraz wyrazić P poprzez E za pomocą równania (31.5). Otrzymujemy »p = ł2'2'“.£-£<- (31” l J *• *• Nie należy mylić tej pracy, wykonanej przez pole elektryczne przy tworzeniu polaryzacji, z energ1^ potencjalną — p0-E trwałego momentu dipolowego p0.
31-3. ELIPSOIDA ENERGII 191 Gęstość energii uP jest liczbą niezależną od wyboru osi, a więc jest skalarem. Tensor ma więc taką własność, że wysumowany (z wektorem) po jednym wskaźniku daje nowy wek- tor. a wysumowany po obu wskaźnikach (z dwoma wektorami) daje skalar. Tensor afj powinien się w rzeczywistości nazywać ..tensorem drugiego rzędu”, po- nieważ ma on dwa wskaźniki. Wektor — z jednym wskaźnikiem — jest tensorem pierw- szego rzędu, a skalar — bez wskaźnika — jest tensorem zerowego rzędu. Mówimy więc, że pole elektryczne E jest tensorem pierwszego rzędu, a gęstość energii uP jest tensorem zerowego rzędu. Pojęcie tensora można rozszerzyć do trzech lub więcej wskaźników i w ten sposób tworzyć tensory rzędu wyższego niż drugi. Wskaźniki tensora polaryzacji przebiegają trzy możliwe wartości — są to tensory w trzech wymiarach. Matematycy zajmują się tensorami w czterech, pięciu lub więcej wymiarach. Czterowymiarowym tensorem Fpr posłużyliśmy się już w naszym relatywi- stycznym opisie pola elektromagnetycznego (rozdz. 26). Tensor polaryzacji a:J ma interesującą własność. Jest on symetryczny, to znaczy że zachodzi axy = ayx oraz podobne równości dla pozostałych par wskaźników. (Jest to własność fizyczna kryształu rzeczywistego i nie musi ona być spełniona dla wszystkich tensorów.) Czytelnik może sam udowodnić, że to musi być prawda, obliczając zmianę energii kryształu w cyklu składającym się z następujących etapów: (1) włączenia pola w kierunku osi .r; (2) włączenia pola w kierunku osi y; (3) wyłączenia pola w kierunku osi .v; (4) wyłączenia pola w kierunku osi y. Po wykonaniu tego cyklu kryształ powraca do stanu początkowego i wypadkowa praca zużyta na polaryzację musi być równa zeru. Można pokazać, że aby to było prawdą, axy musi być równe ayx. Podobne rozumowanie można oczywiście przeprowadzić dla axx itd. A więc tensor polaryzacji jest symetryczny. Oznacza to także, że tensor polaryzacji można zmierzyć mierząc po prostu energię potrzebną do spolaryzowania kryształu w różnych kierunkach. Przypuśćmy, że przykła- damy pole E, mające tylko składową A-ową i y-ową; wówczas zgodnie z równaniem (31.7) = łkA2+(%+«,X£,+«,/,2]. (3i-8) Mając samo pole Ex można określić współczynnik axx; znając zaś samo Ey można wyzna- czyć a ; przy obecności natomiast obu pól Ex i Ey otrzymujemy dodatkową energię, za którą odpowiedzialny jest wyraz zawierający współczynnik (ax>.+«^)- Ponieważ a = ~ ayx, wyraz ten jest równy 2axyExEy; współczynnik axy można wyznaczyć mierząc tę dodatkową energię. Wyrażenie na energię [równanie (31.8)] ma ładną interpretację geometryczną. Przy- puśćmy, że pytamy, jakie pola Ex i Ey odpowiadają pewnej danej z góry gęstości energii, nP' »o- Sprowadza się to do problemu matematycznego, polegającego na rozwiązaniu równania +2%£xA+%£>2 = 2«o- ^est to równanie kwadratowe, tak że gdy wykreślimy wartości Ex i Ey, będące rozwiąza- Uiami tego równania, to będą one punktami leżącymi na elipsie (rys. 31.2). (Wykresem te8° równania musi być elipsa, a nie parabola lub hiperbola, bo energia dla każdego pola Jest zawsze dodatnia i skończona.) Wektor E o składowych Ex i E będzie wektorem po-
192 31. TENSORY 31.2. Miejsce geometryczne wek- tora E = (Ex, Ey), któremu odpo- wiada stała energia polaryzacji 31.3. Elipsoida energii tensora po- laryzacji prowadzonym ze środka układu do punktu na elipsie. Tak więc taka elipsa energii stanowi ładny sposób „uwidocznienia” tensora polaryzacji. Jeżeli uogólni się nasze rozważania na wszystkie trzy składowe, to koniec wektora elektrycznego E o dowolnym kierunku, potrzebnego do wytworze- nia gęstości energii w0, będzie leżał na powierzchni elipsoidy, tak jak to pokazano na rys. 31.3. Kształt tej elipsoidy stałej energii określa jednoznacznie tensor polaryzowalności. Elipsoida ma tę cenną właściwość, że można ją zawsze w prosty sposób określić przez podanie kierunków trzech „osi głównych” i „średnic” elipsy wzdłuż tych osi. „Osiami głównymi” są kierunki najdłuższej i najkrótszej średnicy oraz kierunek do nich obu prostopadły. Są one zaznaczone jako osie a, b i c na rys. 31.3. W odniesieniu do tych osi eli- psoida ma szczególnie proste równanie: aoaEa+abbEb+accEc = 2tt0. W odniesieniu do tych osi tensor dielektryczny ma więc tylko trzy różne od zera składowe: aaa, abb i acc. Należy zaznaczyć, że bez względu na to, jak bar- dzo skomplikowany jest kryształ, zawsze można wy- brać taki układ osi (niekoniecznie muszą to być osie kryształu), dla którego tensor polaryzacji ma tyl- ko trzy składowe. Dla takiego układu osi równanie (31.4) przybiera prostą postać: Pa = “A Pb = abbEb, (31.9) Pc = accEc. Pole elektryczne skierowane wzdłuż dowolnej osi głównej wytwarza polaryzację mającą też kierunek tej samej osi, ale współczynniki dla każdej z trzech osi mogą być, oczywiście, różne. Często tensor opisuje się podając dziewięć współczynników w tabelce umieszczonej w nawiasach: (31.10) zz _ Dla osi głównych a, b i c różne od zera są tylko wyrazy diagonalne; mówimy wówcz3'
31.3. ELIPSOIDA ENERGII 193 o „tensorze w postaci diagonalnej”. Całkowity tensor jest wówczas równy aM 0 0 , t ‘ 0 ubb 0 (3141) .0 0 acc . f > Ważne jest, że każdy tensor polaryzacji (w rzeczywistości, każdy tensor symetryczny drugiego rzędu w przestrzeni o dowolnej liczbie wymiarów) można sprowadzić do takiej postaci przez wybranie odpowiedniego układu osi współrzędnych. Jeżeli wszystkie trzy elementy tensora polaryzacji w postaci diagonalnej są równe, to znaczy jeżeli a«a = abb = «« = a> (31.12) elipsoida energii staje się kulą i polaryzowalność jest taka sama we wszystkich kierun- kach. Ośrodek materialny jest wtedy izotropowy. W zapisie tensorowym Cttf = ady, (31.13) gdzie dy jest jednostkowym tensorem: ‘ <5« = '10 0' 0 1 0 . . (31.14) Oznacza to oczywiście, Źe 0 0 1 ^=1, jeżeli i = =>; ó,y=0, (31.15) jeżeli i ^j. Tensor nazywamy często „deltą Kroneckera”. Czytelnik może się zabawić wykaza- niem, że tensor (31.14) ma dokładnie taką samą postać, jeżeli przejść z naszego układu do jakiegoś innego układu kartezjańskiego. Tensor polaryzacji z równania (31.13) daje I 00 sprowadza się do naszego poprzedniego wyniku dla dielektryków izotropowych: P = aE. Kształt i orientację w przestrzeni elipsoidy polaryzacji można czasem związać z włas- nościami symetrii kryształu. Powiedzieliśmy w rozdz. 30, że sieć trójwymiarowa może "neć 230 różnych symetrii i że można je, dla wielu celów, dogodnie zgrupować w 7 kla- Sach, z uwagi na kształt komórki elementarnej. Otóż elipsoida polaryzowalności musi podobne geometryczne symetrie wewnętrzne co kryształ. Tak na przykład kryształ lrńjskośny ma niską symetrię — elipsoida polaryzowalności będzie wtedy miała osie Olerówne, a ich kierunki nie będą się na ogół pokrywać z osiami kryształu. Z drugiej str°ny kryształ jednoskośny charakteryzuje się tym, że jego właściwości nie zmieniają się 13 Wykłady z fizyki
194 31. TENSORY przy obrocie kryształu o 180° wokół jednej z osi. Tak więc tensor polaryzacji musi p0 takim obrocie pozostać taki sam. Wynika stąd, że elipsoida polaryzowalności musi przejść po obrocie o 180° w samą siebie. A to może nastąpić tylko wtedy, gdy jedna z osi elipsoidy będzie miała ten sam kierunek, co oś symetrii kryształu. Poza tym na rozmiary i orientację elipsoidy nie nakłada się żadnych ograniczeń. Jednakże dla kryształu rombowego osie elipsoidy muszą odpowiadać osiom kryształu bowiem obrót o 180° względem którejkolwiek z trzech osi odtworzy tę samą sieć. Jeżeli wziąć pod uwagę kryształ tetragonalny, to jego elipsoida musi mieć taką samą symetrię co sam kryształ, a więc musi mieć dwie średnice równe. W końcu, jeśli chodzi o kryształ regularny, to wszystkie trzy średnice elipsoidy muszą być sobie równe; elipsoida prze- chodzi w kulę i polaryzowalność kryształu jest tu taka sama we wszystkich kierunkach. Wyszukiwaniu możliwych rodzajów tensorów dla wszystkich możliwych symetrii kryształu poświęca się sporo czasu i energii. Nazywa się to „opisem na gruncie teorii grup”. Ale dla prostych przypadków tensora polaryzowalności można stosunkowo łatwo zobaczyć, jaką postać powinny mieć te zależności. 31-4. Inne przykłady tensorów; tensor bezwładności W fizyce mamy wiele innych przykładów tensorów. Tak na przykład w metalu lub w innym przewodniku często się okazuje, że gęstość prądu j jest w przybliżeniu propor- cjonalna do pola elektrycznego E; stałą proporcjonalności nazywa się przewodnością a: j = <rE. Dla kryształu jednak zależność pomiędzy j i E jest bardziej złożona; przewodność nie jest taka sama we wszystkich kierunkach. Przewodność jest tensorem, co zapisujemy: 31.4. Moment pędu L bryły sztywnej nie jest na ogół równoległy do prędkości ką- towej bryły u Innym przykładem tensora fizycznego jest moment bezwładności. W rozdziale 18 tomu I (cz. 1) widzieliśmy, że bryła obracająca się wokół ustalonej osi ma moment pędu L, proporcjonalny do prędkości kątowej co. Współczynnik proporcjonalności nazwaliśmy momentem bezwładności, A L = Iw. Dla obiektu o kształcie dowolnym moment bezwładności zależy od orientacji tego obiektu względem osi obrotu. Prostokątny klocek, na przykład, będzie miał różne mo- menty bezwładności dla każdej ze swych trzech prosto- padłych osi. Prędkość kątowa w i moment pędu L są wek- torami. Przy obrotach wokół którejś z osi symetrii, wek- tory L i a> są do siebie równoległe. Ale jeżeli moment bezwładności jest różny dla trzech osi głównych, to wek-
31_4. INNE PRZYKŁADY TENSORÓW; TENSOR BEZWŁADNOŚCI 195 tory w i l nie są, w ogólnym przypadku, jednakowo skierowane (patrz rys. 31.4). Są one związane ze sobą w podobny sposób jak wektory E i P. W ogólnym przypadku mamy: Lx = IxXa,X + IXyOiy + IXzOiz> Ey ^yx^X~^~^yy^y~^~^yz^z^ 4 = łz^+łzy^y+hz^z- (31.16) Dziewięć współczynników Iu nazywamy tensorem bezwładności. Analogicznie jak w przy- padku polaryzacji, energia kinetyczna musi być pewną formą kwadratową składowych ax, my * mz- Ek=i^I9a>t0)j. (31.17) i,J Za pomocą tej formy kwadratowej można zdefiniować elipsoidę bezwładności. Posłu- gując się formą kwadratową energii można też wykazać, że tensor bezwładności jest sy- metryczny — Że ly = Ijj. Tensor bezwładności dla ciała sztywnego można obliczyć, jeżeli znany jest jego kształt. Należy tylko wypisać całkowitą energię kinetyczną wszystkich cząstek w ciele. Cząstka o masie m i o prędkości v ma energię kinetyczną Ąnw2, a całkowita energia kinetyczna jest po prostu sumą po wszystkich cząstkach ciała. Prędkość v każdej cząstki wiąże się z prędkością kątową a> bryły. Załóżmy, że ciało się obraca wokół swojego środka masy, który z założenia znaj- duje się w spoczynku. Jeżeli teraz r jest odległością cząstki od środka masy, to jej prędkość v jest dana przez wxr. Tak więc całkowita energia kinetyczna jest równa Ek = ^im(t,1Xr)2- (31.18) Musimy teraz jeszcze tylko wyrazić wxr przez składowe a>x, <oy, a>2 i x, y, z, a wynik porównać z równaniem (31.17); porównując odpowiednie wyrazy otrzymamy wtedy współczynniki ly. W wyniku obliczeń mamy: (<oxr)2 = (w xr)2+(w xr)2+(o> xr)2 = = (a>yz-a)2y)2+(a)2x-<oxz)2+(t»xy—a)yx)2 = = +o)yz2—2a>ya)2yz+a)2y2 + -}-a)2x2—2a)2a)xxz-}-a)xz2-[- +a>2y2—2a)xa)yyx+a)2x2. Mnożąc to równanie przez m/2, sumując po wszystkich cząstkach i porównując z równa- łem (31.17) widzimy, że np. Ixx jest dane przez 4. = m(y2+z2). ^st to taki sam wzór, jaki mieliśmy poprzednio (rozdz. 19 tomu I, cz. 1) dla momentu
J96 V 31. TENSORY bezwładności ciała obracającego się wokół osi x. Ponieważ r2 = x2+y2+z2, wyraz ten można również zapisać w postaci 4* = £ m(r2—x2). Po znalezieniu wszystkich pozostałych wyrazów tensor bezwładności można zapisać jako — mxz -J?myz u m (r2—x2) mxy myx S m(r2-y2) — V1 mzx ' — mzy m(r2—z2) (31.19) Jeżeli ktoś chce, może to zapisać przy pomocy „zapisu tensorowego” jako 4 = X m^2 óa~r‘r^ (31.20) gdzie rt są składowymi (x, y, z) wektora położenia cząstki, a £ oznacza sumowanie po wszystkich cząstkach. Moment bezwładności jest zatem tensorem drugiego rzędu, któ- rego wyrazy są związane z własnościami ciała oraz wiążą moment pędu L z prędkością kątową w wzorem , (31-21) i Dla ciała o zupełnie dowolnym kształcie można zawsze znaleźć elipsoidę bezwładności, a stąd jej trzy osie główne. Tensor bezwładności będzie w odniesieniu do tych osi diago- nalny, tak że dla każdej bryły sztywnej istnieją zawsze trzy prostopadłe osie, dla których prędkość kątowa i moment pędu są do siebie równoległe. Osie te nazywamy osiami głów- nymi bezwładności. 31-5. Iloczyn wektorowy*’ Możemy teraz powiedzieć, że tensorami drugiego rzędu posługiwaliśmy się już w rozdz. 20 tomu I (cz. 1). Tam to bowiem zdefiniowaliśmy moment siły w dwóch wymiarach, jako = xFy-yFx. Pojęcie to możemy uogólnić do trzech wymiarów, przyjmując TU = riFJ~rJFi- <31,22) Wielkość Tu jest tensorem drugiego rzędu. Można się o tym przekonać „działając” np- tensorem r,y na jakiś wektor, powiedzmy na jednostkowy wektor e, w następujący sposób: i •* Porównaj: Tom 1,’CZ- 1, rozdz. 20 {Obroty w przestrzeni^
31.5. ILOCZYN WEKTOROWY 197 Jeżeli powyższa wielkość jest wektorem, to Ty musi się transformować jak tensor — jest to przyjęta przez nas definicja tensora. Podstawiając za Ty jego postać (31.22) mamy E r»ei = S riF>el ~ S rieJFi = rXF,e)-(r,e)Fr J i J Ponieważ iloczyny skalarne są skalarami, oba wyrazy po prawej stronie równości, a także ich różnica, są wektorami, czyli Ty jest tensorem. Ale ty jest szczególnym rodzajem tensora; jest to tensor antysymetryczny, tzn. a więc ma tylko trzy wyrazy różne od zera: Txy, Ty2 i tzx. W rozdziale 20 tomu I (cz. 1) potrafiliśmy pokazać, że te trzy wyrazy prawie „przypadkowo” transformują się tak, jak trzy składowe wektora i mogliśmy zdefiniować wektor osiowy t = <?x, = (T,z> r«> ^)- Powiedzieliśmy „przypadkowo”, bo zachodzi to tylko w trzech wymiarach. W czterech, na przykład, wymiarach antysymetryczny tensor drugiego rzędu ma sześć wyrazów róż- nych od zera i na pewno nie da się go zastąpić wektorem o czterech składowych. Tak samo jak wektor osiowy t = r xF, tak też każdy iloczyn wektorowy dwóch wek- torów biegunowych jest tensorem — można to pokazać posługując się dokładnie tym sa- mym rozumowaniem. Tensory te mogą jednak, na szczęście, być reprezentowane przez wektory (a dokładniej przez pseudowektory), co pozwala nam znacznie uprościć ich ma- tematykę. Z punktu widzenia matematyki, jeżeli a i b są dowolnymi dwoma wektorami, to dzie- więć wielkości afy tworzy tensor (chociaż może on nie mieć żadnej pożytecznej interpre- tacji fizycznej). Tak więc dla wektora położenia r(, rtrj jest tensorem, a ponieważ dy jest także tensorem, widzimy, że prawa strona równania (31.20) jest rzeczywiście tenso- rem. Podobnie równanie (31.22) przedstawia tensor, ponieważ oba wyrazy po jego pra- wej stronie są tensorami. 31-6. Tensor naprężeń Opisywane przez nas dotychczas tensory symetryczne były po prostu współczynnika- ch wiążącymi jeden wektor z drugim. Chcielibyśmy teraz rozpatrzyć pewien tensor, który ma inne znaczenie fizyczne — tensor naprężeń. Przypuśćmy, że mamy ciało stałe, na które działają różne siły. Mówimy, że wewnątrz powstają różne „naprężenia”, przez co rozumiemy, że pomiędzy dwoma sąsiednimi częściami substancji materialnej istnieją siły wewnętrzne. Powiedzieliśmy już trochę o takich naprężeniach w przypadku dwuwy- miarowym, kiedy rozważaliśmy napięcie powierzchniowe w napiętej membranie w § 12-3 H, cz. 1). Zobaczymy teraz, że siły wewnętrzne wewnątrz trójwymiarowego ciała moż- na opisać posługując się pewnym tensorem. Rozważmy ciało z jakiegoś sprężystego materiału, np. bryłę galaretki. Jeżeli przetnie-
198 31. TENSORY 51.5. Ośrodek materialny po lewej stronie płaszczyzny a wywiera poprzez powierzch- nię dy dz siłę dFt na ośrodek materialny po prawej stronie płaszczyzny my bryłę na dwie części, to, w ogólnym przy- padku, ośrodek materialny po każdej stronie cięcia zostanie przesunięty przez siły wewnę- trzne. Przed przecięciem pomiędzy tymi dwie- ma częściami bryły musiały istnieć siły, które utrzymywały materiał we właściwym miej- scu; naprężenie można zdefiniować poprzez te siły. Wyobraźmy sobie np. płaszczyznę prosto- padłą do osi x, taką jak płaszczyzna a na rys. 31.5, i zastanówmy się, jakie siły działają po- przez mały element powierzchni Ay Az na tej płaszczyźnie. Ośrodek materialny po stronie lewej powierzchni wywiera siłę JFj na ośrodek po stronie prawej, tak jak to pokazano na części b) rysunku. Oczywiście, występuje tu też przeciwnie skierowana siła reakcji — AFlt działająca na ośrodek po lewej stronie powie- rzchni. Jeżeli rozważany element powierzch- ni jest dostatecznie mały, można się spodzie- wać, że JFj jest proporcjonalne do jego powierzchni Ay Az. Znamy już dobrze jeden rodzaj naprężenia — ciśnienie w cieczy statycznej. Tam siła jest 31.6. Siłę działającą poprzez element powierzchni dy dz, prostopadły do osi x, można rozłożyć na trzy składowe: dFxi, dFn i dFti. 31.7. Siła działająca poprzez element po- wierzchni prostopadły do y, rozłożona na trzy prostopadłe składowe
31-6. TENSOR NAPRĘŻEŃ 199 równa ciśnieniu razy powierzchnia i jest prostopadła do elementu powierzchni cie- czy. Dla ciał stałych, a także dla cieczy lepkich w ruchu, siła nie musi być prostopadła do powierzchni; oprócz ciśnień (dodatnich lub ujemnych) występują tam jeszcze siły ści- nania. (Mówiąc „siła ścinania” mamy na myśli składowe siły działające stycznie do po- wierzchni.) Należy oczywiście uwzględnić wszystkie trzy składowe siły. Zauważmy także, że jeżeli wykonalibyśmy inne cięcie, płaszczyzną o jakiejś innej orientacji, to otrzymali- byśmy na nim inne siły. Pełny opis naprężeń wewnętrznych uwzględniający tę zmianę orientacji cięcia wymaga więc użycia tensora. Tensor naprężeń definiujemy w sposób następujący: Najpierw bierzemy pod uwagę fikcyjne cięcie prostopadłe do osi x i rozkładamy siłę A , działającą poprzez powierzch- nię tego cięcia, na jej składowe AFxl, AFyl, AFzl, tak jak na rys. 31.6. Stosunek tych sił do pola powierzchni Ay Az oznaczamy S^, Syx i Szx. Tak na przykład ę - AF>' J yx AyAz' Pierwszy wskaźnik, y, odnosi się do kierunku składowej siły; drugi wskaźnik, x, oznacza kierunek prostopadły do powierzchni. Pole powierzchni Ay Az można też zapisać jako Aax, podkreślając, w ten sposób, że jest to pole elementu powierzchni, prostopadłego do osi x. Wówczas ę - AFyl yx Aax • Następnie wyobraźmy sobie cięcie prostopadłe do osi y. Poprzez małą powierzchnię Ax Az będzie działać siła AF2. Tę siłę rozkładamy znowu na trzy składowe, tak jak to pokazano na rys. 31.7, i definiujemy trzy składowe naprężenia Sxy, Syy, Szy poprzez sto- sunki trzech składowych siły ZfF2 do pola powierzchni Aay. Na koniec, wyobraźmy so- bie cięcie prostopadłe do osi z i zdefiniujmy, podobnie jak poprzednio, składowe Sxz, Syz i Szz. Mamy zatem dziewięć liczb: (31.23) Chcemy teraz pokazać, że znajomość tych dziewięciu liczb wystarcza do zupełnego opisu wewnętrznego stanu naprężenia i że Su jest rzeczywiście tensorem. Przypuśćmy, że chcemy wiedzieć, jaka siła działa poprzez powierzchnię nachyloną pod jakimś dowolnym ^tem. Czy możemy się o tym dowiedzieć znając Sy? Owszem, w sposób następujący: Wyobraźmy sobie małą bryłkę, której ścianka N leży na nowej powierzchni, a pozostałe Sc*anki są równoległe do osi współrzędnych. Jeżeli ścianka N byłaby równoległa do osi z, mielibyśmy prostopadłościan o podstawie trójkątnej, czyli klin pokazany na rys. 31.8. ^est to dość szczególny przypadek, ale ilustruje on wystarczająco dobrze metodę ogólną.) S*fy napięcia działające na cały klin z rys. 31.8 są teraz w równowadze (przynajmniej w granicy nieskończenie małych rozmiarów), tak że całkowita siła działająca na klin musi
200 31. TENSORY 31.8. Siła F„ działająca poprzez ściankę N (o jednostkowej normalnej n), rozłożona na trzy składowe być teraz równa zeru. Siły działające na ścianki równoległe do osi współrzędnych znamy bez- pośrednio z Sy. Ich suma wektorowa musi być równa sile działającej na ściankę N, tak że siłę tę możemy wyrazić przy pomocy Sy- Czyniąc założenie, że siły powierzchniowe działające na nasz klin są w równowadze, po- mijamy inne siły objętościowe, które mogłyby być obecne, takie jak siła ciężkości lub pseudo- siły, występujące w wypadku, jeżeli nasz układ współrzędnych nie jest układem inercjalnym. Zauważmy jednak, że takie siły objętościowe będą proporcjonalne do objętości klina, a więc do Ax Ay Az, podczas gdy wszystkie siły po- wierzchniowe są proporcjonalne do takich powierzchni jak Ax Ay, Ay Az itd. Jeżeli więc weźmiemy mały klin o wystarczająco małych rozmiarach, to siły objętościowe będzie można zawsze pominąć w porównaniu z siłami powierzchniowymi. Dodajmy teraz siły działające na ten mały klin. Weźmiemy najpierw składową x-ową; jest ona sumą pięciu części, z których każda pochodzi od jednej ze ścianek. Jeżeli jednak Az jest dostatecznie małe, siły działające na ścianki trójkątne (prostopadłe do osi ź) będą równe i przeciwnie skierowane, tak że możemy o nich zapomnieć. Składowa x-owa siły działającej na prostokąt podstawy jest równa AFx2 = SxyAx Az. Składową x-ową siły działającej na pionowy prostokąt jest AFxi=S„AyAz. Te dwie składowe muszą być równe składowej x-owej siły działającej na zewnątrz poprzez ściankę N. Oznaczmy przez n jednostkowy wektor normalny ścianki N, a siłę działającą na tę ściankę przez F„; wówczas mamy AF„ = S„Ay Az+SxyAx Az. JCft X* * 1 Xjr Składowa x-owa, Sxn, naprężenia działającego poprzez tę płaszczyznę, równa jest żlA* podzielonemu przez powierzchnię, która jest równa Aztf Ax2+Ay2; czyli Ay Ax Sxn = S„ +Sxy . VAx2+Ay2 ^Ax2+Ay2 Wielkość Ax/VAx2 + Ay2 jest cosinusem kąta 6 pomiędzy wektorem n, a osią y, tak to pokazano na rys. 31.8, a więc można ją zapisać jako ny — składową j-ową wektora »• Podobnie Ay/Y?Ax2+Ay2 równe jest sin 8 = nx. Można więc napisać 5,. = Sxxn +S n,. xn xx x xy y
31-6. TENSOR NAPRĘŻEŃ 201 Jeżeli teraz uogólni się powyższe rozważania dla dowolnego elementu powierzchni, otrzy- ma się lub ogólnie ^xn ‘^xxf^x~^‘^x)’^y~^‘^xz^z J (31.24) Można więc znając SIJ znaleźć siłę działającą poprzez każdy element powierzchni, a za- tem S,j opisuje w pełni stan naprężenia wewnętrznego w ośrodku materialnym. Równanie (31.24) mówi, że tensor StJ wiąźe siłę S„ z wektorem jednostkowym n, tak samo jak tensor atJ wiąże polaryzację P z polem E. Ponieważ n i S„ są wektorami, skła- dowe Sv muszą się transformować przy zmianie osi współrzędnych, tak jak składowe ten- sora. A zatem S:j jest rzeczywiście tensorem. Rozpatrując siły działające na mały sześcian wykonany z jakiejś substancji materialnej można także pokazać, że Sy jest tensorem symetrycznym. Przypuśćmy, że mamy mały sześcian o ściankach równoległych do naszych osi współrzędnych i weźmy pod uwagę jego przekrój, tak jak to pokazano na rys. 31.9. Jeżeli przyjmiemy długość krawędzi sześ- cianu za jednostkę, to składowe x-owa i v-owa sił działających na ścianki prostopadłe do osi x i y będą wyglądać tak, jak to pokazano na rysunku. Jeżeli sześcian jest mały, na- prężenia zmieniają się w sposób nieznaczny przy przejściu od jednej ścianki sześcianu do ścianki przeciwległej, tak że składowe sił są równe i przeciwnie skierowane — tak jak to pokazano. Na sześcian nie może teraz działać żaden moment sił, bo zacząłby się on obracać. Całkowity moment sił względem środka jest równy (Syx—Sxy) (razy jednostkowa krawędź sześcianu), a ponieważ moment ten jest równy zeru, Syx jest równe Sxy, co ozna- cza, że tensor naprężeń jest symetryczny. Ponieważ StJ jest tensorem symetrycznym, można go opisać przy pomocy elipsoidy, która będzie miała trzy osie główne. Dla powierzchni prostopadłych do tych osi naprę- żenia mają szczególnie prostą postać — odpowiadają one ściskaniom lub rozciąganiem prostopadłym do powierzchni. Wzdłuż tych ścianek nie występują siły ścinania. Dla każdego naprężenia można zawsze tak wybrać nasze osie, że składowe ścinania są równe zeru. Jeżeli elipsoida jest kulą, to w każdym kierunku istnieją tylko siły normalne (prosto- padłe do powierzchni). Odpowiada to ciśnieniu hydro- statycznemu (dodatniemu lub ujemnemu). Tak więc dla lśnienia hydrostatycznego tensor naprężeń jest diagonalny 1 wszystkie trzy składowe są sobie równe; są one w istocie P° prostu równe ciśnieniu p. Możemy napisać (31.25) Tensor naprężeń — a także jego elipsoida — będzie się u ogólnym przypadku zmieniał od punktu do punktu 31.9. Składowe x-owe i y-owt sił działających na cztery ścianki małego sześcianu
202 31. TENSORY w bryle materiału; aby opisać całą bryłę, trzeba podać wartość każdej składowej Sy jako funkcji położenia. A więc tensor naprężeń tworzy pole. Mieliśmy już poia skalarne, jak np. temperatura T(x, y, z), dla których każdemu punktowi prze- strzeni przyporządkowuje się jedną liczbę, i pola wektorowe, jak np. pole elektryczne E(x, y, z), które każdemu punktowi przyporządkowują trójkę liczb. Teraz mamy p0]e tensorowe, które przyporządkowuje każdemu punktowi przestrzeni dziewięć liczb (a w rze- czywistości sześć dla tensora symetrycznego Sy). Pełny opis sił wewnętrznych w odkształ- conym w dowolny sposób ciele stałym wymaga znajomości sześciu funkcji x, y i z. V ! 31-7. Tensory wyższego rzędu Tensor naprężeń Sy opisuje siły wewnętrzne w ośrodkach materialnych. Jeżeli mate- riał jest sprężysty, to wygodnie jest opisywać odkształcenie wewnętrzne przy użyciu inne- go tensora Ty — nazywanego tensorem odkształceń. W przypadku tak prostego przed- miotu, jak np. sztabki metalu, wiemy, że zmiana długości, AL, jest w przybliżeniu pro- porcjonalna do siły, co oznacza, że sztabka jest posłuszna prawu Hooke’a AL = yF. Uogólnieniem tego prawa dla sprężystego ciała stałego, mogącego podlegać dowol- nym odkształceniom, jest stwierdzenie, że odkształcenie Ty wiąże się z naprężeniem Stj poprzez układ równań liniowych (31.26) kl Jak wiemy, potencjalna energia struny (lub sztabki) jest równa $FAL = łyF2. Uogólnioną postacią tego prawa jest następujący wzór na gęstość energii sprężystości w ciele stałym: pręż = £ ^iSySkl. (31.27) ykl Pełny opis własności sprężystych kryształu musi być podany za pomocą współczynników yijkI. Poznajemy więc nowy dziwoląg — tensor czwartego rzędu. Ponieważ każdy wskaź- nik może przybrać każdą z trzech wartości x, y lub z, to współczynników tych jest 34 = = 81. Ale w rzeczywistości są one dane tylko przez 21 różnych liczb. Po pierwsze, ponie- waż tensor Sy jest tensorem symetrycznym, ma on tylko 6 różnych wartości i dlatego w równaniu (31.27) występuje co najwyżej 36 różnych współczynników. Ale również Sv można wymienić na Skl nie zmieniając energii, tak że ytjkl musi być symetryczne ze wzgl?' du na zamianę par wskaźników ij i kl. Ogranicza to liczbę różnych współczynników do 21- Tak więc opis sprężystych własności kryształu o najniższej możliwej symetrii wymaga znajomości 21 stałych sprężystych! Liczba ta jest oczywiście mniejsza dla kryształów o wyższej symetrii. Tak na przykład kryształ regularny ma tylko trzy stałe sprężyste, a sub- stancja izotropowa tylko dwie.
jl-7. TENSORY WYŻSZEGO RZĘDU 203 O prawdziwości powyższego twierdzenia można się przekonać z następującego rozu- mowania. Zastanówmy się, jaką postać muszą mieć składowe yiJkl, aby były niezależne od kierunku osi współrzędnych, co musi zachodzić, jeżeli materiał jest izotropowy? Od- powiedź: Mogą one być tylko wtedy niezależne, jeżeli uda się je wyrazić przez tensor $... Istnieją dwa możliwe wyrażenia Wki ’ tikdji+Wjk’ które mają wymaganą syme- trię, tak że yukl musi być ich kombinacją liniową. Stąd dla materiałów sprężystych Yt/ki = ^(dyd^+bCd^+dn^ i dla opisania sprężystych własności materiału potrzebne są dwie stałe: a i b. Czytelniko- wi pozostawiamy dowód, że kryształ regularny potrzebuje tylko trzech stałych. Naszym ostatnim przykładem, tym razem związanym z tensorem trzeciego rzędu, jest zjawisko piezoelektryczne. Kryształ poddany naprężeniu wytwarza pole elektryczne proporcjonalne do naprężenia; ogólną postacią tego prawa jest związek jk gdzie Et jest polem elektrycznym, a Pjjk są współczynnikami piezoelektrycznymi lub ten- sorem piezoelektrycznym. Czytelnik może spróbować wykazać, że jeżeli kryształ ma śro- dek inwersji (jest niezmienniczy względem transformacji x, y, z -> — x, —y, —z), to wszyst- kie współczynniki piezoelektryczne są równe zeru. 31-8. Czterotensor pędu elektromagnetycznego Wszystkie tensory, które rozpatrzyliśmy dotąd w tym rozdziale, odnoszą się do prze- strzeni trójwymiarowej; z ich definicji wynika, że mają one pewne własności transforma- cyjne przy obrotach przestrzennych. W rozdziale 26 mieliśmy okazję posłużyć się ten- sorem w czterowymiarowej relatywistycznej czasoprzestrzeni; był to tensor pola elektro- magnetycznego, F^. Składowe takiego czterotensora transformują się przy przekształ- ceniu Lorentza współrzędnych w pewien szczególny sposób, który został wtedy podany. (Chociaż nie robiliśmy tak tego, mogliśmy rozważać przekształcenie Lorentza jako „obrót” w czterowymiarowej „przestrzeni”, nazwanej przestrzenią Minkowskiego; wówczas można by łatwiej dostrzec analogię z tym, co teraz robimy.) Jako nasz ostatni przykład chcemy rozważyć jeszcze jeden tensor w czterowymiaro- wej czasoprzestrzeni (t, x, y, z) teorii względności. Kiedy wypisywaliśmy tensor naprę- żeń, zdefiniowaliśmy Sy jako składową siły działającej przez jednostkową powierzchnię. Ale siła jest równa zmianie pędu w jednostce czasu. Dlatego też zamiast mówić „S^ jest x-ową składową siły działającej przez jednostkową powierzchnię, prostopadłą do y” moglibyśmy równie dobrze powiedzieć „Sxy jest prędkością przepływu x-owej składowej Pędu poprzez jednostkową powierzchnię, prostopadłą do y". Innymi słowy, każdy z wy- razów Sy przedstawia także przepływ z-tej składowej pędu przez jednostkową powierzch- ni? prostopadłą do j-tego kierunku. Są to składowe czysto przestrzenne, ale są one częś- cią „większego” tensora w czterech wymiarach (fi i v = t, x, y, z), zawierającego do-
204 31. tensory datkowe składowe, takie jak np. Slx, Syl> Slt itd. Spróbujemy znaleźć teraz znaczenie fizyczne tych dodatkowych składowych. Wiemy, że składowe przestrzenne reprezentują przepływ pędu. Dyskusja innego typu „przepływu” — przepływu ładunku elektrycznego — dostarczy nam wskazówki, która pomoże nam określić, co reprezentują te dodatkowe składowe tensora Syv w kierunku czasu. Dla wielkości skalarnej, jaką jest ładunek, przepływ w jednostce czasu (przez jedno- stkową powierzchnię prostopadłą do kierunku przepływu) jest wektorem przestrzennym — wektorem gęstości prądu j. Widzieliśmy, że składowa czasowa tego wektora przepływu jest gęstością całego przepływającego ładunku. Tak na przykład, j można połączyć ze składową czasową jt = q, a więc z gęstością ładunku, tak aby utworzyć czterowektor jtl = (o,Di czyli wskaźnik /i wja przybiera wartości t, x, y, z, co kolejno oznacza: gęstość, przepływ w jednostce czasu w kierunku osi x, przepływ w jednostce czasu w kierunku osi y i takiż przepływ w kierunku z ładunku skalarnego. Moglibyśmy teraz oczekiwać, przez analogię z naszym twierdzeniem o składowej cza- sowej przepływu wielkości skalarnej, że jeżeli Sxx, Sxy i Sxz opisują przepływ x-owej skła- dowej pędu, to powinna istnieć składowa czasowa Sxl, która byłaby gęstością tego „cze- goś” co przepływa; to znaczy Sxl powinno być gęstością x-owego pędu. Możemy więc rozszerzyć „poziomo” nasz tensor, tak aby zawierał składową t. Mamy Sxt = gęstość x-owego pędu, Sxx = x-owy przepływ x-owego pędu, Sxy = j’-owy przepływ x-owego pędu, Sxz = z-owy przepływ x-owego pędu. Podobnie dla j’-owej składowej pędu mamy trzy składowe przepływu, Syx, Syy, Syz, do których powinniśmy dodać czwarty wyraz: Sj,, = gęstość j’-owego pędu. I oczywiście do Szx, S.y, Szz dodamy Szt = gęstość z-owego pędu. ‘ W czterech wymiarach występuje także składowa t pędu, którą jak wiemy jest energia. A więc tensor Sy powinno się rozszerzyć „pionowo”, dodając składowe Stx, Sly i Slz, gdzie Stx = x-owy przepływ energii, Sty = _r-owy przepływ energii, Stz = z-owy przepływ energii; (31.28) to znaczy Slx jest przepływem energii, na jednostkę powierzchni i w jednostce czasu, poprzez powierzchnię prostopadłą do osi x, i tak dalej. Na koniec, potrzebna nam jest jeszcze do kompletu składowa St„ która będzie gęstością energii. Uogólniliśmy więc nasz tensor naprężeń Sy z trzech wymiarów na czterowymiarowy tensor energii i naprężeń Syv. Wskaźnik u może przybierać cztery wartości t, x, y i z oznaczające od po-
205 31-8. CZTEROTENSOR PĘDU ELEKTROMAGNETYCZNEGO wiednio „gęstość”, „przepływ na jednostkę powierzchni w kierunku osi x”, „przepływ na jednostkę powierzchni w kierunku osi y” i „przepływ na jednostkę powierzchni w kie- runku osi z”. W podobny sposób v przybiera cztery wartości t, x, y i z, wyjaśniając nam, co przepływa — a mianowicie „energia”, „pęd w kierunku osi x”, „pęd w kierunku osi y” i „pęd w kierunku osi z”. Dla przykładu rozważmy ten tensor już nie w ośrodku materialnym, a w obszarze przestrzeni swobodnej, w której jest tylko pole elektromagnetyczne. Wiemy, że strumień energii jest dany wektorem Poyntinga S = e0c2ExB. A więc składowe x-owa, y-owa i z-owa wektora S są, z relatywistycznego punktu widzenia, składowymi Slx, Sly i Sl2 naszego czterowymiarowego tensora energii i naprężeń. Symetria tensora StJ przenosi się z powodzeniem na składowe czasowe, tak że czterowymiarowy tensor jest syme- tryczny: = Sril. (31.29) Innymi słowy, składowe Sxl, Syl, Szl, które są gęstościami x-owego, y-owego i z-owego pędu, są także równe x-owej, y-owej i z-owej składowej wektora Poyntinga S, strumienia energii — co wykazaliśmy w jednym z poprzednich rozdziałów przy pomocy rozważań innego typu. Pozostałe składowe elektromagnetycznego tensora naprężeń można także wyra- zić poprzez pola elektryczne i magnetyczne E i B. Oznacza to, że musimy dopuścić istnie- nie naprężeń albo, wyrażając się mniej tajemniczo, przepływu pędu w polu elektromagne- tycznym. Mówiliśmy o tym w rozdz. 27 w związku z równaniem (27.21), ale niezbyt do- kładnie. Ci, którzy chcą poddać próbie swą biegłość w operowaniu tensorami w czterech wy- miarach, chcieliby może zobaczyć wzór, wyrażający tensor przez pola: ~ & /ty FfiaF^a\, ' a aft gdzie znaki sum po a, fi oznaczają sumowanie po t, x, y, z, z tym że (jak zwykle w teorii względności) przypisujemy tu specjalne znaczenie znakowi sumy £ i symbolowi ó. W su- mach należy odejmować wyrazy ze wskaźnikami x, y, z oraz przyjąć, że <5„ = +1, pod- czas gdy <5^ = dyy = ózz = — 1 i = 0 dla /z v (c = 1). Proponujemy, aby Czytel- nik sprawdził: a) że powyższy wzór daje gęstość energii Stt = (e0/2)(E2 +52) i wektor Poyntinga e0ExB; b) że w polu elektrostatycznym, przy B = 0, osie główne naprężeń mają kierunek pola elektrycznego, że w kierunku tym istnieje napięcie (e0/2)E2, a w kie- runkach prostopadłych do kierunku pola istnieje równe mu ciśnienie.
h współczynnik zpłamania substancji gęstych 32-1. Polaryzacja metali Chcemy teraz omówić zjawisko załamania światła — a także związane z nim pochła- nianie światła — przez substancje gęste*’. W rozdziale 31 t.I (cz. 2) omawialiśmy teorię współczynnika załamania, ale nasze ograniczone możliwości matematyczne w owym cza- sie pozwoliły nam na znalezienie współczynnika załamania jedynie dla substancji o małej gęstości, takich jak gazy. Zostały jednak tam wyjaśnione fizyczne przyczyny istnienia współczynnika załamania. Pole elektryczne fali świetlnej polaryzuje cząsteczki gazu, wytwarzając drgające momenty dipolowe. Ponieważ te drgające ładunki mają pew- ne przyspieszenie, promieniują one nowe pole w postaci fal. To nowe pole, inter- ferując ze starym polem, wytwarza pewne pole zmienione, które jest równoważne pewnemu przesunięciu fazowemu w fali pierwotnej. Ponieważ to przesunięcie fazowe jest proporcjonalne do grubości substancji, całe zjawisko jest równoważne zmianie pręd- kości fazowej fali przy jej przechodzeniu przez daną substancję. Kiedy poprzednio roz- patrywaliśmy to zagadnienie, pominęliśmy powikłania związane z takimi zjawiskami, jak zmiana pól w pobliżu drgających dipoli na skutek pojawienia się nowej fali. Zakła- daliśmy, że siły działające na ładunki w atomach pochodziły tylko od fali przybywającej, podczas gdy w rzeczywistości drgania tych ładunków były wymuszone nie tylko przez falę padającą, ale także i przez fale promieniowane przez wszystkie pozostałe atomy. W owym czasie trudno byłoby nam uwzględnić to zjawisko, dlatego też rozważaliśmy tylko gaz rozrzedzony, w którym takie zjawiska można pominąć. Teraz jednak przekonamy się, że zagadnienie to można bardzo łatwo opisać korzy- stając z równań różniczkowych. Ta metoda zaciemnia sens fizycznego pochodzenia współ- czynnika załamania (jako pochodzącego od fal wtórnie promieniowanych, interferują- ♦> W oryginale: dense materials (substances, media etc.). Chodzi tu o ośrodki, w których odleglosC atomowe są niewielkie — rzędu kilku angstremów, tak ze taki ośrodek jest „zbity” lub „gęsty”. (Pr^P- tłum.).
32-1. POLARYZACJA METALI 207 cych z falami pierwotnymi), ale upraszcza w znacznym stopniu teorię dla substancji gę- stych. W tym rozdziale dokonamy połączenia wielu fragmentów naszych dotychczaso- wych wykładów. Praktycznie rzecz biorąc, przerobiliśmy już wszystko, czego będziemy tu potrzebować, dlatego też pozostaje do wprowadzenia stosunkowo niewiele pojęć rzeczywiście nowych. Ponieważ przyda się odświeżyć naszą pamięć i przypomnieć sobie to, co będzie nam potrzebne, w tab. 32.1 podajemy zestaw równań, z których będziemy korzystać, wraz z odnośnikami do miejsc, gdzie można znaleźć każde z tych równań. W większości wypadków nie będziemy tracić czasu na powtarzanie rozważań fizycznych, a skorzystamy po prostu z samych równań. Zaczniemy od przypomnienia mechanizmu odpowiedzialnego za współczynnik za- łamania gazu. Zakładamy, że w jednostce objętości znajduje się N cząstek i że każda z nich zachowuje się tak, jak oscylator harmoniczny. Używamy tu modelu atomu (czą- steczki), w którym na elektron działa siła proporcjonalna do jego przesunięcia (wygląda to tak, jak gdyby elektron był utrzymywany w miejscu za pomocą jakiejś sprężynki). Podkreślaliśmy, że nie był to poprawny model klasyczny atomu, ale w przyszłości po- każemy, że poprawna teoria kwantowomechaniczna daje wyniki, które (dla prostych przypadków) są równoważne wynikom otrzymanym w oparciu o ten model. W naszych poprzednich rozważaniach nie uwzględnialiśmy istnienia siły tłumienia w oscylatorach atomowych, ale teraz to zrobimy. Taka siła odpowiada oporowi przeciwstawiającemu się ruchowi, to znaczy sile proporcjonalnej do prędkości elektronu. Równanie ruchu ma teraz postać F= q^E = m(x+yx+(o^x), (32.1) Tabela 32.1. W bieżącym rozdziale będziemy się opierać na następującym trrlnle, który został już omówiony w poprzednich rozdziałach Zagadnienie Gdzie szukać Równanie oscylacje tłumione Tom I, cz. 1, rozdz. 23 m(x+yx-\-a>2x) — F współczynnik załamania gazów Tom I, cz. 2, rozdz. 31 1 M)2e „ 1 i e 2 e0(a>2—co2) n — n'—in" ruchliwość Tom I, cz. 2, rozdz. 41 mx+fix = F przewodnictwo elektryczne Tom I, cz. 2, rozdz. 43 T ; a — m m Polaryzowalność Tom II, cz. 1, rozdz. 10 J?pol = * P Wewnątrz dielektryka Tom II, cz. 1, rozdz. 11 Elokal = E+ T— P 3e0
208 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH gdzie x jest przesunięciem równoległym do kierunku pola E. (Zakładamy, że mamy oscy- lator izotropowy, w którym siła przyciągająca do centrum jest taka sama dla odchyleń we wszystkich kierunkach. Na chwilę również przyjmujemy, że fala jest spolaryzowana liniowo, tak że pole E nie zmienia kierunku.) Jeżeli działające na atom pole elektryczne zmienia się sinusoidalnie w zależności od czasu, to E = £oe'“'. (32.2) Przesunięcie będzie wówczas „oscylować” z tą samą częstością; można przyjąć icof x = xoe . Podstawiając x = io>x i x = — a>2x do równania (32.1) możemy wyrazić x za pomocą E: (32.3) Znając przesunięcie można obliczyć przyspieszenie x i znaleźć wypromieniowaną falę, będącą fizyczną przyczyną istnienia współczynnika załamania. W taki właśnie sposób obliczyliśmy współczynnik załamania w rozdz. 31 tomu I (cz. 2). Teraz jednak chcemy zastosować inną metodę podejścia do zagadnienia. Indukowa- ny moment dipolowy atomu, p, jest równy qex lub korzystając z równania (32.3) n - q2‘lm E P =------5---------z- Ł. —ct) +zy<w+<w0 (32.4) Ponieważ moment dipolowy p jest proporcjonalny do pola E, więc p = £oa(co)E, (32.5) gdzie a nazywamy polaryzowalnością (zdolnością polaryzacyjni atomową*^. Na podsta- wie tej definicji a =-----,---;------" (32.6) — w +zyco+<Oo Rozwiązanie, jakie się otrzymuje w mechanice kwantowej dla ruchów elektronów w atomach, jest podobne do powyższego wyniku, z tym jednak, że atomy mają tam kilka częstości własnych, z których każda ma swoją własną stałą rozproszenia y. Również i „natężenie” efektywne każdego z typów drgań jest różne, co można zaznaczyć mnożąc polaryzowalność dla każdej częstości przez współczynnik natężenia f, który przypusz- czalnie jest rzędu jedności. Zastępując dla każdego typu drgań trzy parametry co0, y i f przez a>ok, yok i fOk i sumując po różnych typach drgań, przekształcamy równanie (32.6) *’ W całym tym rozdziale będziemy używali tej samej metody zapisu, co w rozdz. 31 tomu I (cz.) 2 i przyjmiemy, że a oznacza polaryzowalność atomową, tak jak ją tu zdefiniowaliśmy. W poprzednim roz- dziale uźy waliśmy a do oznaczania polaryzowalności objętościowej — stosunku P do E. W oznaczeniach bieżącego rozdziału P — Nae0E [patrz równanie (32.8)].
32-1. POLARYZACJA METALI 209 w równanie: —------7 TT.;------------• yJ*--') e0m “T1 +z7*°+°0A Jeżeli N jest liczbą atomów w jednostce objętości substancji, to polaryzacja P jest po prostu równa Np = e0NaE i jest proporcjonalna do E: P = e0M®)E. (32.8) Innymi słowy, jeżeli na jakąś substancję działa sinusoidalne pole elektryczne, to na jed- nostkę objętości przypada indukowany moment dipolowy, proporcjonalny do pola elek- trycznego, przy czym należy podkreślić, że stała proporcjonalności a zależy od częstości Dla bardzo wielkich częstości a jest małe; „reakcja” (substancji na falę świetlną) jest niezbyt duża. Jednak dla małych częstości może nastąpić silna reakcja. Widać też, że sta- ła proporcjonalności jest liczbą zespoloną, co oznacza, że wektor polaryzacji nie pokry- wa się z wektorem pola elektrycznego, ale może być do pewnego stopnia przesunięty względem niego w fazie. W każdym razie istnieje polaryzacja na jednostkę objętości, której wartość jest proporcjonalna do natężenia pola elektrycznego. 32-2. Równania Maxwella dla dielektryka Istnienie polaryzacji w materii oznacza, że wewnątrz substancji znajdują się polary- zacyjne ładunki i prądy, które należy uwzględnić w pełnych równaniach Maxwella, jeżeli się chce znaleźć pola. Tym razem zamierzamy rozwiązać równania Maxwella dla takiej sytuacji, gdy ładunki i prądy nie są równe (tak jak w próżni) zeru, ale są pośrednio okre- ślone przez wektor polaryzacji. Nasz pierwszy krok — to znalezienie dokładnej postaci gęstości ładunku q i gęstości prądu j, uśrednionych po pewnej małej objętości, o takich samych rozmiarach jak ta, którą mieliśmy na myśli definiując polaryzację P. Wówczas potrzebną nam gęstość ładunku n i prądu j można otrzymać z polaryzacji. W rozdziale 10 (t. II, cz. 1) widzieliśmy, że gdy polaryzacja P się zmienia od punktu do punktu, to istnieje pewna gęstość ładunku równa «?PoI = "VP. (32.9) Wprawdzie wtedy mieliśmy do czynienia z polami statycznymi, ale ten sam wzór jest słuszny również i dla pól zmiennych w czasie. Jednakże, gdy polaryzacja P się zmienia w zależności od czasu, to ładunki są w ruchu, a więc istnieje także pewien prąd polaryzacji. Każdy z drgających ładunków daje do prądu przyczynek równy jego ładunkowi qe, po- mnożonemu przez jego prędkość v. Przy N takich ładunkach w jednostce objętości gęstość prądu j jest równa j = NqeN. Ponieważ wiemy, że v = dxjdt, to j = Nqe(dxjdt), co się równa właśnie dPjdt. Dlatego 14 — Wykłady z fizyki
210 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH też gęstość prądu pochodzącego od zmieniającej się w czasie polaryzacji jest równa (32.10) Wiemy teraz dokładnie, co chcemy zrobić i jak możemy to wykonać. Piszemy równa- nia Maxwella z gęstością ładunku i z gęstością prądu, wyrażonymi za pomocą polaryzacji P, korzystając z równań (32.9) i (32.10). (Zakładamy, że w substancji nie ma żadnych in- nych ładunków i prądów.) Następnie wiążemy polaryzację P z polem E przy pomocy rów- nania (32.5) i rozwiązujemy równanie na pola E i B — szukając rozwiązań w postaci fali. Zanim to zrobimy, chcielibyśmy tu dać pewną wzmiankę historyczną. Maxwell po- czątkowo zapisał swoje równania w postaci różniącej się od tej, którą się posługiwaliśmy. Ponieważ równania zapisywano w tej różnej postaci przez wiele lat — i w dalszym ciągu niektórzy je tak zapisują — musimy tę różnicę wyjaśnić. Otóż, początkowo nie zdawano sobie w pełni sprawy z mechanizmu fizycznego stałej dielektrycznej. Nie rozumiano na- tury atomów, ani też tego, że istnieje polaryzacja substancji. Dlatego też nie zdawano sobie sprawy z istnienia przyczynku do gęstości ładunku q, pochodzącego od V-P. My- ślano tylko o ładunkach, które nie były związane w atomach (takich, jak ładunki, które płyną w drutach lub powstają przy potarciu powierzchni materiału). Dzisiaj wolimy przyjąć, że q określa całkowitą gęstość ładunku, zawierającą w sobie część pochodzącą od związanych ładunków atomowych. Jeżeli oznaczyć tę część przez Ppol, t° Q Ppol+ftnne’ gdzie pinne jest gęstością ładunku, którą miał na myśli Maxwell, a która się odnosi do ła- dunków nie związanych z poszczególnymi atomami. Można by więc zapisać: eo Podstawiając pp01 z równania (32.9) otrzymujemy V-E = ——e--------L V P £o £o V-(£oE+P) = pmne. (32.11) W gęstości prądu w równaniach Maxwella na V xB tkwią także w ogólnym przypadku przyczynki pochodzące od prądów związanych w atomach. Dlatego też można przyjąć: j = Jpol+jinne i równanie Maxwella przybierze postać: Ć2V xB = AłSS- + ^21 + . (32.120 £q £q dt
32-2. RÓWNANIA MAXWELLA DLA DIELEKTRYKA 211 Korzystając z równania (32.10) otrzymujemy d £oc2V xB = jinne + — (£oE+P). (32.13) ot Widać teraz, że gdybyśmy zdefiniowali nowy wektor D jako D = e0E+P, (32.14) to oba te równania pola przybrałyby postać VD = ?ime (32.15) oraz 3D e0c2VxB = jinne+—. (32.16) ot Taką właśnie postać miały równania, których Maxwell używał dla dielektryków. Jego dwoma pozostałymi równaniami były równania VxE = dB ~dt' oraz V-B = 0, a więc takie same jak te, których my używamy. Maxwell i inni współcześni mu uczeni mieli także problemy z materiałami magnetycz- nymi (wkrótce się zajmiemy tym zagadnieniem). Ponieważ nie wiedzieli oni o krążących prądach odpowiedzialnych za magnetyzm atomowy, używali gęstości prądu, w której brakowało jednej części. Zamiast równania (32.16) posługiwali się oni w rzeczywistości równaniem VxH=j'+—, ot (32.17) w którym wektor H różni się od e0c2B, ponieważ zawiera on w sobie efekty pochodzące od prądów atomowych. (Wówczas j' odpowiada reszcie z prądów.) A zatem Maxwell miał cztery wektory pola — E, D, B i H — gdzie D i H były zakamuflowanymi sposobami na uniknięcie zwracania uwagi na to, co się działo wewnątrz substancji materialnych. Równania zapisane w ten sposób można znaleźć w wielu podręcznikach fizyki. Aby rozwiązać równania, należy koniecznie związać wektory D i H z innymi polami; zwykle się pisało D = eE oraz B = /zH. (32.18) Te związki są jednak prawdziwe tylko w przybliżeniu dla niektórych substancji i to tylko wtedy, gdy pola się nie zmieniają zbyt gwałtownie w zależności od czasu. (Dla pól sinu- soidalnie zmiennych można często takie równania zapisać, jeżeli e i /z przyjmie się za funkcje zespolone częstości, ale nie można uczynić tego dla pól zmieniających się w czasie w jakiś
212 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH dowolny sposób.) Dlatego też przy rozwiązywaniu tych równań były popełniane przeróż- ne krętactwa. Uważamy, że właściwy sposób polega na zapisywaniu równań przy użyciu wielkości podstawowych, których sens fizyczny obecnie rozumiemy — i tak właśnie postępowaliśmy. 32-3. Fale w dielektryku Chcemy się teraz przekonać, jaki typ fal elektromagnetycznych może istnieć w mate- riale dielektrycznym, w którym nie ma dodatkowych ładunków oprócz tych związanych w atomach. Przyjmujemy więc g = — V-P i j = SPfSt. Równania Maxwella przybierają wówczas postać: a) VE = - VP «o 8 /P b) c2VxB =— I—- +E dt \e0 , (32.19) c) VxE = — 8B ~8t~’ d) V;B = 0. 1 c2 8t2 a2p 1 17 (32.20) Równania te można rozwiązać tak samo, jak to zrobiliśmy poprzednio. Zaczynamy od wzięcia rotacji równania (32.19c): 8 Vx(V xE) = - —V XB. 8t Następnie skorzystamy z tożsamości wektorowej: Vx(VxE) = V(V-E)-V2E, a także podstawimy za VxB z równania (32.19b); otrzymujemy 1 d2P V(V-E)—V2E = — —-- ' > e0c2 8t2 równania (32.19a) dla VE otrzymujemy i , i a2E i VE~^--^r =----------V(V-P)+ c 8t2 e0 A zatem zamiast równania falowego otrzymaliśmy równanie, z którego wynika, że dalam- bercjan E jest równy dwóm wyrazom, zawierającym polaryzację P. Ponieważ jednak polaryzacja P zależy od pola E, równanie (32.20) może nadal mieć rozwiązania w postaci fali. Ograniczmy się teraz do dielektryków izotropowych, dla któ- rych polaryzacja P ma zawsze ten sam kierunek co pole E. Spróbujmy znaleźć rozwiąza- nie dla fali rozchodzącej się w kierunku osi z. Wówczas pole elektryczne mogłoby się zmie- niać jak exp[i(cot—kz)\. Założymy także, że fala jest spolaryzowana w kierunku osi x —
32-1. FALE W DIELEKTRYKU 213 że pole elektryczne ma tylko składową x-ową. Przyjmujemy więc Ex = Eoe'^k!\ (32.21) Wiemy, że każda funkcja argumentu (z—vt) opisuje jakąś falę, która się przemieszcza z prędkością v. Wykładnik w równaniu (32.21) można zapisać jako (co \ z—i, « / a zatem równanie (32.21) opisuje falę o prędkości fazowej rfaz = «/k. Współczynnik załamania n jest zdefiniowany (patrz rozdz. 31 tomu I, cz. 2) przez związek c ^faz ’ n Stąd równanie (32.21) przybiera postać Ex = E0^m‘-nzlc\ Można zatem znaleźć współczynnik załamania n wyznaczając taką wartość k, aby pole (32.21) spełniało właściwe równania pola, a następnie skorzystać z zależności kc n = —. (32.22) co W materiale izotropowym polaryzacja będzie miała tylko składową x-ową; wówczas wektor P nie będzie się zmieniał w zależności od x, czyli V • P = 0, i pozbędziemy się w ten sposób pierwszego wyrazu po prawej stronie równania (32.20). Również, ponieważ zakładamy, że dielektryk jest liniowy, Px będzie się zmieniać jak e‘“' a c2Pxjct2 = —wzPx. Laplasjan w równaniu (32.20) jest po prostu równy d2Ex]8z2 = —k2Ex, a więc otrzy- mujemy co2 co2 -£2£x+ £x =------------Px. (32.23) c2 eoc Załóżmy teraz na chwilę, że jedynie pole E wywołuje polaryzację. Ponieważ pole to zmienia się sinusoidalnie, to można przyjąć, że polaryzacja P jest proporcjonalna do po- la E, tak jak w równaniu (32.5). (Później powrócimy jeszcze do omówienia tego założe- nia.) Przyjmujemy więc Px = e0 NaEx. Wówczas Ex w równaniu (32.23) upraszcza się i Cl)2 k2=—(l+Wa). (32.24) c Znaleźliśmy więc, że fala opisana równaniem (32.21), z liczbą falową k daną przez równa-
214 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH nie (32.24), będzie spełniała równania pola. Po skorzystaniu z równania (32.22) widzimy, że współczynnik załamania n będzie określony przez związek: n2 = l+Mx. (32.25) Porównajmy ten wzór z tym, co otrzymaliśmy w naszej teorii współczynnika załama- nia gazu (rozdz. 31, t. I, cz. 2). Otrzymaliśmy tam równanie (31.29), które miało postać , , 1 Nq2 1 n = 1 + —----------5---z-. 2 me0 —a) +<o0 Jeżeli weźmie się a z równania (32.6), to równanie (32.25) da nam me0 — co +iya)+a>g (32.26) (32.27) Po pierwsze, pojawił się teraz nowy wyraz iya>, związany z uwzględnieniem rozproszenia energii w oscylatorach. Po drugie, po lewej stronie równania mamy n zamiast n2, a po- nadto otrzymaliśmy jeszcze dodatkowy czynnik Zauważmy jednak, że jeżeli N jest dostatecznie małe, tak że współczynnik n jest bliski jedności (tak jak to jest w przypadku gazu), to wówczas równanie (32.27) stwierdza, że n2 jest równe jedności plus pewna mała liczba: n2 = 1+e. Można wtedy napisać, że n = ^1 + e l+e/2 i oba te wyrażenia są sobie równoważne. Tak więc nasza nowa metoda daje w przypadku gazu taki sam wynik, jaki znaleźliśmy poprzednio. Można by teraz przypuszczać, że równanie (32.27) powinno dać współczynnik zała- mania także dla substancji gęstych. Musi ono być jednak nieco zmienione i to z wielu względów. Przede wszystkim, przy wyprowadzaniu tego równania zakładaliśmy, że pole polaryzujące, działające na każdy atom, było polem Ex. To założenie nie jest jednak praw- dziwe, ponieważ w jednorodnych substancjach istnieje także pole wytworzone przez oko- liczne atomy i pole to może być porównywalne z Ex. Z podobnym zagadnieniem mieliśmy do czynienia przy omawianiu pól statycznych w dielektrykach (patrz t. II, cz. 1, rozdz. 11). Wtedy pole działające na pojedynczy atom oszacowaliśmy wyobrażając sobie, że atom ten znajdował się w kulistej wnęce w otaczającym go dielektryku. Pole w takiej wnęce — które nazwaliśmy polem lokalnym — jest większe od średniego pola E o P/3£q. (Pamię- tajmy jednak, że wynik ten jest ściśle słuszny tylko dla materiałów izotropowych, zawie- rających w sobie szczególny przypadek kryształu regularnego.) To samo rozumowanie będzie miało zastosowanie do pola elektrycznego fali, tak dłu- go jak długość fali będzie dużo większa od odległości międzyatomowych. Ograniczając się do takich przypadków mamy (32.28) Elokal — &+ "7------- 3e0 To pole lokalne powinno być właśnie podstawione za pole E w równaniu -(32.3), tzn. równanie (32.8) należy przepisać w postaci P = £oWaĄokal. (32.29)
32-3. FALE W DIELEKTRYKU 215 W' Podstawiając Elokal z równania (32.28) znajdujemy P = e0Na czyli P =-----------e0E. 1—(2Va/3) 0 (32.30) Innymi słowy, dla substancji gęstych polaryzacja P jest w dalszym ciągu proporcjonalna do pola E (dla pól sinusoidalnych). Jednak stałą proporcjonalności nie jest e0Na, tak jak to pisaliśmy w równaniu (32.23), ale powinno nią być e0Na/[l—(Na/3)]. Powinniśmy za- tem poprawić równanie (32.25) tak, aby n2 = 1 + Na (32.31) Wygodniej będzie przepisać to równanie w postaci n2—1 3—---= Na n2+2 (32.32) która jest algebraicznie równoważna postaci równania (32.31). Nazywa się je równaniem Clausiusa-Mosottiego. Dla substancji gęstych występuje jeszcze jedna komplikacja. Sąsiednie atomy są tak blisko siebie, że zachodzą między nimi silne oddziaływania wzajemne. Typy drgań we- wnętrznych są z tego powodu nieco zmienione. Częstości własne drgań atomowych są przez te oddziaływania wzajemne „rozszerzone”, a drgania są zwykle mocno tłumione i stała rozproszenia staje się całkiem duża. Tak więc współczynniki <u0 i y ciał stałych będą się zdecydowanie różnić od analogicznych wielkości dla atomów swobodnych. Przy tych zastrzeżeniach można w dalszym ciągu określać współczynnik a, przynajmniej w przybli- żeniu, za pomocą równania (32.7). Mamy więc = Mle y fk ,n2+2) me0 — co2+iykco+co2k‘ (32.33) Jeszcze jedna, ostatnia komplikacja. Jeżeli omawiane ciało stałe (lub ciecz) jest mie- szaniną kilku składników, to każdy z nich będzie wnosił swój wkład do polaryzacji. Cał- kowite a będzie więc sumą przyczynków, pochodzących od każdego ze składników mie- szaniny [pominąwszy niedokładność przybliżenia pola lokalnego, równanie (32.28), w kryształach uporządkowanych — zjawiska, które opisywaliśmy przy omawianiu ferro- elektryków]. Zapisując liczbę atomów na jednostkę objętości każdego ze składników jako Nj, powinniśmy zastąpić równanie (32.32) równaniem (32.34) A
216 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH gdzie każde a, będzie dane wyrażeniem typu (32.7). Równanie (32.34) uzupełnia naszą teorię współczynnika załamania. Wielkość 3(n2 —l)/(n2+2) jest dana przez pewną funk- cję zespoloną częstości, która jest średnią polaryzowalnością atomową a(co). Dokładne obliczenie polaryzowalności atomowej a(a>) (tzn. znalezienie fk, yk i wot) dla substancji gęstych należy do trudnych zagadnień mechaniki kwantowej. Zostało to zrobione, w za- sadzie, tylko dla kilku szczególnie prostych substancji. 32-4. Zespolony współczynnik załamania Chcemy teraz rozpatrzyć konsekwencje naszego wyniku wyrażonego równaniem (32.33). Przede wszystkim zauważmy, że współczynnik a jest zespolony, a więc i współczynnik załamania n będzie liczbą zespoloną. Co to oznacza? Przypuśćmy, że przedstawimy liczbę n jako sumę części rzeczywistej i urojonej: n ~ nR~inj, (32.35) gdzie nR i n, są rzeczywistymi funkcjami co. Przyjęliśmy tu wyraz in, ze znakiem ujemnym, gdyż wtedy iij będzie wielkością dodatnią dla wszystkich zwykłych materiałów optycz- nych. (Dla zwykłych materiałów optycznie biernych, które same nie są, jak lasery, źród- łami światła, y jest liczbą dodatnią i na skutek tego część urojona n jest liczbą ujem- ną.) Nasza fala płaska z równania (32.21) wyrażona za pomocą współczynnika n, ma postać Ex = 32.1. Wykres cidSdowęj pot* Ex jakiejś chwili t, jfeMl ’ Zapisując liczbę n tak jak w równaniu (32.35) mielibyśmy Ex = Eo ex.p(—a)n/z/c') exp[ia>(t—nRz/ć)]. (32.36) Wyraz exp[i'co(t—nRz/ć)] opisuje falę bieg- nącą z prędkością c/nR, a więc nR odpowiada temu, o czym normalnie myślimy jako o współczynniku załamania. Ale amplitudą tej fali jest £oexp(—coziyz/c), a więc wyrażenie malejące wykładniczo z z- Wykres natężenia pola elektrycznego, w pew- nej chwili, jako funkcji z pokazano na rys- 32.1 dla n, ^ hr!1t.. Część urojona współ- czynnika załamania odpowiada osłabieniu fali na skutek strat energii w oscylatorach
32-4. ZESPOLONY WSPÓŁCZYNNIK ZAŁAMANIA 217 atomowych. Natężenie fali jest proporcjonalne do kwadratu amplitudy, a więc natężenie ~ exp(—2<un/z/c). Często się to zapisuje jako natężenie e-^2, gdzie = lennie nazywamy współczynnikiem pochłaniania. Równanie (32.33) daje nam więc nie tylko teorię współczynnika załamania w ośrodkach optycznych, ale także teorię pochłaniania światła przez te ośrodki. Dla takiego ośrodka, który zwykle się uważa za materiał przezroczysty, wielkość c!o>n, — mająca wymiar długości — jest całkiem duża w porównaniu z grubością mate- riału. 32-5. Współczynnik załamania mieszaniny Nasza teoria współczynnika załamania zawiera jeszcze inną „przepowiednię”, którą można sprawdzić na drodze doświadczalnej. Przypuśćmy, że rozważamy mieszaninę dwóch substancji. Współczynnik załamania mieszaniny nie jest średnią dwóch współczyn- ników, ale powinien być wyrażony zgodnie z równaniem (32.34) przez sumę dwóch po- laryzowalności. Jeżeli na przykład pytamy, jaki jest współczynnik załamania roztworu cukru, to odpowiedź brzmi: całkowita polaryzowalność tego roztworu jest sumą polary- zowalności wody i polaryzowalności cukru. Każdą z tych polaryzowalności należy obli- czyć, przyjmując za N liczbę cząsteczek danego typu na jednostkę objętości. Innymi słowy, jeżeli jakiś dany roztwór ma cząsteczek wody, której polaryzowalność jest równa a1; i N2 cząsteczek cukru trzcinowego (C12H22OU) o polaryzowalności a2, to powinniśmy mieć / n2—1 \ 3 -rrd = “1+N2 . (32.37) \n +2/ Wzorem tym można się posłużyć przy doświadczalnym sprawdzeniu teorii, mierząc współczynnik załamania dla różnych stężeń cukru trzcinowego w wodzie. Robimy tu jednak kilka założeń. Wzór nasz zakłada, że podczas rozpuszczania się cukru nie zacho- dzą żadne procesy chemiczne i że „zakłócenia”, jakie napotykają ruchy oscylatorów ato- mowych, nie różnią się zbytnio dla różnych stężeń. Dlatego nasz wynik jest z pewnością tylko pewnym przybliżeniem — sprawdźmy w każdym razie, jaka jest jego dokładność^ W pierwszych trzech kolumnach tab. 32.2 zamieszczamy dane dotyczące pomiarów Współczynnika załamania, zaczerpnięte z Handbook of Chemistry and Physics. (Wybra- liśmy przykład roztworu cukru, ponieważ cukier jest kryształem drobinowym, który się rozpuszcza nie jonizując roztworu i nie zmieniając w jakiś inny sposób swego stanu che- micznego.) Kolumna A podaje zawartość procentową cukru (w odniesieniu do ciężaru), kolumna B podaje mierzoną gęstość roztworu (g/cm3), a w kolumnie C zamieszczono mierzony współczynnik załamania dla światła, którego długość fali wynosiła 5893 A • ^la czystego cukru wzięto współczynnik załamania mierzony dla kryształów cukru. Te
Tabela 32.2. Współczynnik załamania roztworu cukru trzcinowego oraz porównanie danych doświadczalnych z teorią [równanie (32.37)] A Procentowa zawartość cukru (wagowo) B Gęstość (g/cm3) C n dla 20°C D Mole cukrud na 1 litr n2/n0 E Mole wodye na 1 litr F /n2-l\ 3~s \n2+2l G A^i H JV2a2 J ^0a2 (g/D 0* 0,9982 1,333 0 55,5 0,617 0,617 0 — 30 1,1270 1,3811 0,970 43,8 0,698 0,487 0,211 0,213 50 1,2296 1,4200 1,798 34,15 0,759 0,379 0,380 0,211 85 1,4454 1,5033 3,59 12,02 0,886 0,1335 0,752 0,210 100b 1,588 l,5577c 4,64 0 0,960 0 0,960 0,207 a czysta woda ó ciężar drobinowy cukru trzcinowego “ 342 b kryształy cukru e ciężar drobinowy wody =» 18 c średnia (patrz tekst) 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH
32-5. WSPÓŁCZYNNIK ZAŁAMANIA MIESZANINY 219 kryształy nie są izotropowe, dlatego też mierzony współczynnik załamania jest różny dla różnych kierunków. Handbook of Chemistry and Physics podaje trzy wartości; n, = 1,5376, n2 = 1,5651, n3 = 1,5705, z których wzięliśmy wartość średnią. Można by teraz spróbować obliczyć współczynnik n dla każdego stężenia, ale nie wiemy, jaką wartość przyjąć dla aj lub a2. Sprawdźmy naszą teorię w taki oto sposób: założymy, że polaryzowalność wody (aj jest taka sama dla wszystkich stężeń i obliczy- my polaryzowalność cukru trzcinowego, korzystając w wartości doświadczalnych n i obli- czając a2 z równania (38.27). Jeżeli nasza teoria jest poprawna, to powinniśmy otrzymać takie samo a2 dla wszystkich stężeń. Przede wszystkim musimy znać liczby Nt i N2; wyraźmy je przy pomocy liczby Avo- gadra No. Za naszą objętość jednostkową przyjmijmy jeden litr (1000 cm3). Wówczas Nj/No jest ciężarem na litr, podzielonym przez ciężar gramodrobinowy. A ciężar na litr — to gęstość (pomnożona przez 1000, aby wynik wyrazić w gramych na litr) razy ciężar ułamkowy — wody lub cukru. W ten sposób otrzymujemy N2/No i M/Ao, co zamie- szczono w kolumnach D i E tabeli. W kolumnie F obliczono wielkość 3(n2—l)/(n24-2) z wartości doświadczalnych n z kolumny C. Dla czystej wody 3(n2—l)/(n2+2) = 0,617, co jest z kolei równe Następnie można wypełnić pozostałą część kolumny G, ponieważ dla każdego wiersza tabeli stosunek wartości G/E ma być taki sam, a mianowicie 0,617: 55,5. Odejmując wartości kolumny G od wartości kolumny F dostajemy przyczynek N2 a2, pochodzący od cukru trzcinowego, zamieszczony w kolumnie H. Po podzieleniu tych pozycji przez wartości N2/N0 z kolumny D otrzymujemy wartość Noa2, zamieszczoną w kolumnie J. Zgodnie z naszą teorią powinniśmy oczekiwać, że wszystkie wartości N0a2 będą takie same. Nie są one dokładnie równe, ale są bardzo do siebie zbliżone. Możemy zatem wnioskować, że nasze koncepcje są dość poprawne. Stwierdzamy tu nawet więcej; że nie wydaje się, aby polaryzowalność drobiny cukru zależała w dużym stopniu od otocze- nia drobiny — polaryzowalność ta jest prawie taka sama w rozcieńczonym roztworze jak i w krysztale. 32-6. Fale w metalach Teorię, którą wyprowadziliśmy w tym rozdziale dla ciał stałych, można również za- stosować, po bardzo małych zmianach, do dobrych przewodników, jakimi są metale. W metalach na niektóre elektrony nie dziąłają siły wiązania, utrzymujące je przy poszcze- gólnych atomach; są to te elektrony „swobodne”, które są odpowiedzialne za przewod- nictwo. Są tam jeszcze elektrony związane i do nich to się stosuje wprost teoria opisana Powyżej. Wpływ tych elektronów jest jednak zwykle zatarty przez zjawiska elektronów przewodnictwa. Będziemy teraz rozważać tylko te zjawiska, za które są odpowiedzialne elektrony swobodne. Jeżeli na elektron nie działa siła harmoniczna — ale w dalszym ciągu jego ruch napo-
220 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH 32.2. Ruch elektronu swobodnego tyka pewien opór — to równanie ruchu tego elektronu różni się od równania (32.1) jedynie brakiem wyrazu Wystarczy zatem przyjąć w naszych wzorach = o, a ponadto uwzględnić tam jeszcze jedną różnicę. Poprzednio musieliśmy mianowi- cie rozróżniać pomiędzy polem średnim, a polem lokalnym w dielektryku dlatego, że w izolatorze każdy z dipoli znajdował się w ustalonym położeniu i to jego poło- żenie pozostawało w pewnym określonym związku z położeniami pozostałych elektronów. W metalu natomiast elektrony prze- wodnictwa poruszają się jednakowo we wszystkich kierunkach i działające na nie w średnim efekcie pole jest po prostu średnim polem E. Nie powinniśmy więc teraz dla elektronów przewodnictwa wprowadzać do równania (32.5) poprawki polegają- cej na podstawieniu pola E z równania (32.28). Dlatego też dla metali wzór na współczynnik załamania powinien mieć taką postać, jak równanie (32.27), z tym tylko, że o>0 należy teraz przyjąć równe zeru, czyli Na2 1 i - • n2 = l+_Zf------------. (32.38) ms0 —ar+iym Równanie to podaje tylko przyczynek od elektronów przewodnictwa, który — jak bę- dziemy zakładać — jest w przypadku metali dominujący. Wiemy teraz nawet, jak znaleźć wartość, którą należy przyjąć dla y, ponieważ jest ona związana z przewodnością metalu. W rozdziale 43 tomu I (cz. 2) opisywaliśmy zależ- ność przewodnictwa metali od dyfuzji elektronów swobodnych w krysztale. Elektrony poruszają się po „zygzakowatej” drodze, od jednego rozproszenia do następnego, a po- między rozproszeniami poruszają się one prawie swobodnie, doznając jedynie przyspie- szenia od jakiegoś średniego pola elektrycznego (por. rys. 32.2). W rozdziale 43 tomu I (cz. 2) znaleźliśmy, że średnia prędkość unoszenia jest równa po prostu przyspieszeniu pomnożonemu przez średni czas pomiędzy zderzeniami, t. Przyspieszenie jest równe qeElm, tak że —r. ' ' (32”) m Wzór ten zakładał, że pole E było stałe, a więc i była prędkością stałą. Ponie- waż w średniej nie ma tu przyspieszenia, to siła oporu jest równa sile przyłożonej. Współ- czynnik y zdefiniowaliśmy mówiąc, że ymv jest siłą oporu [patrz równanie (32.1)] równą qeE; dlatego też y = 1. (32.40) T Czasu t nie można łatwo zmierzyć bezpośrednio, można go jednak określić mierząc przewodność metalu. Znaleziono doświadczalnie, że w metalu pole elektryczne E wytwa-
32-6. FALE W METALACH 221 rza prąd, którego gęstość j jest proporcjonalna do pola E (dla materiałów izotropowych): j = <rE. Stałą proporcjonalności a nazywa się przewodnością. Do tej samej zależności prowadzi równanie (32.39), jeżeli się w nim przyjmie 1 ^unoszenia * Wtedy Nqt a =-------z. (32.41) m Zatem t — a stąd i y — można związać z obserwowaną przewodnością elektryczną. Ko- rzystając z równań (32.40) i (32.41) można przepisać nasz wzór na współczynnik załama- nia, (32.38), w postaci: 2 1 , n 2 = 1H---------------, zco(l+icor) gdzie 1 ma T 7 Nq2 ‘ (32.42) (32.43) Jest to wygodna postać wzoru na współczynnik załamania metali. < 32-7. Przybliżenia malej i wielkiej częstości; głębokość naskórkowa i częstość plazmowa Nasz wynik [równanie (32.42)] na współczynnik załamania metali pozwala przewidy- wać, że przy różnych częstościach cechy propagacji fali będą całkiem różne. Zobaczmy najpierw, co się dzieje dla bardzo małych częstości. Jeżeli co jest dostatecznie małe, równa- nie (32.42) można z dobrym przybliżeniem zastąpić przez n2 = (32.44) e0<o Otóż ze związku — 1-' który można sprawdzić podnosząc go stronami do kwadratu*’, dla małych częstości otrzymujemy n = la/2eoco(l— i). (32.45) Części rzeczywista i urojona współczynnika n mają taką samą wartość bezwzględną. •’ Albo podstawiając —i = e inl2; t —i = e ^Z4 = costc/4—i simr/4, co daje ten sam wynik.
222 33. ODBICIE OD POWIERZCHNI 32.3. Amplituda poprzecznej fali elektro- magnetycznej w funkcji odległości, na jaką fala przenika w głąb metalu zywamy głębokością naskórkową. Jest ona Przy n mającym tak dużą część urojoną fala jest gwałtownie osłabiana w metalu. W wy- niku równania (32.36) amplituda fali roz- chodzącej się w kierunku osi z maleje jak exp(—]/o<o/2e0c2z). (32.46) Zapiszmy to jako e~2‘s, (32.47) gdzie ó jest odległością, po której przebyciu amplituda fali maleje o czynnik e~1 = 1/2,72, czyli z grubsza o |. Amplitudę takiej fali jako funkcję z pokazano na rys. 323. Ponie- waż fale elektromagnetyczne będą przenikać w głąb metalu tylko na tę odległość, <5 na- równa ó = ^2e0c2l(J(o. (32.48) Co w powyższych rozważaniach rozumieliśmy przez „małe” częstości? Jeśli się przyj- rzymy równaniu (32.42), to zauważymy, że można je przybliżyć przez równanie (32.44) tylko wtedy, gdy cot jest o wiele mniejsze od jedności oraz gdy <oe0lo też jest dużo mniej- sze od jedności, to znaczy przyjęte przez nas przybliżenie małej częstości stosuje się, gdy oraz (32.49) Zobaczmy, jakim to odpowiada częstościom dla takiego typowego metalu jak miedź. Obliczamy t korzystając z równania (32.43), a o/e0 — korzystając ze zmierzonej prze- wodności. Z tablic bierzemy następujące dane: <r = 5,76-107(O mF1, ciężar atomowy = 63,5 g, gęstość = 8,9 g/cm3, liczba Avogadra = 6,02-102 3 (gramodrobina)-1. Jeżeli założyć, że na jeden atom przypada jeden swobodny elektron, to liczba elektronów na metr sześcienny jest równa ♦ N= 8,5-1028m~3.
r 32-7. PRZYBLIŻENIA MAŁEJ I WIELKIEJ CZĘSTOŚCI 223 Przyjmując otrzymujemy qe = l,6-10-19C, e0 = 8,85-10-12F/m, m = 9,11 • 10~31kg, t = 2,4-10-14s, 1 „ i — = 4,l-1013s-1, T — = 6,5-1018s-1. £o A zatem dla częstości mniejszych od około 1012 Hz miedź będzie wykazywać typowe, opisane przez nas zachowanie przy „małych częstościach” (częstościom tym odpowiada- ją fale, których długość w pustej przestrzeni jest dłuższa niż 0,3 mm, czyli bardzo krótkie fale radiowe!). Dla fal tych głębokość naskórkowa w miedzi jest równa <5 = 0,028m2/s co Dla mikrofal o częstości 10000 MHz (fale o ż = 3 cm) <5 = 6,7-10-4cm. Fala przenika więc na bardzo małą odległość. Widać stąd, dlaczego omawiając wnęki rezonansowe (lub falowody) wystarczyło się troszczyć tylko o pola wewnątrz wnęki, a nie o pola w metalu lub na zewnątrz wnęki. Widać również teraz, dlaczego straty we wnęce są zmniejszone przy wyłożeniu ścianek cienką warstwą srebra lub złota. Te straty pochodzą od prądu, który jest znaczny tylko w cienkiej warstwie o grubości równej głębokości naskórkowej. Przypuśćmy, że interesuje nas teraz współczynnik załamania takiego metalu jak miedź przy wielkich częstościach. Dla bardzo wielkich częstości cot jest dużo większe od jedności i równanie (32.42) można z dobrym przybliżeniem zastąpić przez n2 = 1------a—. (32.50) Dla fal o wielkich częstościach współczynnik załamania metalu staje się rzeczywisty — 1 mniejszy od jedności! Wynika to jasno także i z równania (32.38), jeżeli pominie się w nim wyraz odpowiedzialny za rozproszenie energii, co można zrobić dla bardzo wiel- kich co. z równania (32.38) otrzymujemy wtedy n2 = 1- Nq2e me0(o2 ' (32.51) i
224 32. WSPÓŁCZYNNIK ZAŁAMANIA SUBSTANCJI GĘSTYCH •co jest oczywiście identyczne z równaniem (32.50). Spotkaliśmy już poprzednio wielkość Nq^lmsQ, którą nazwaliśmy częstością plazmową (t. II, cz. 1, § 7-3): równanie (32.50) lob równanie (32.51) można więc zapisać jako n2 = •Częstość plazmowa jest pewnego rodzaju częstością „graniczną”. Dla a><a>p współczynnik załamania metalu ma część urojoną i fale są osłabiane, na- tomiast dla co > (op współczynnik załamania jest rzeczywisty i metal się staje przezro- czysty. Wiemy oczywiście, że metale są dość przezroczyste dla promieni Róntgena. Ale niektóre metale są przezroczyste nawet dla ultrafioletu. W tabeli 32.3 podajemy dla kilku metali zmierzone w doświadczeniu długości fali, poniżej których metale zaczynają się stawać przezroczyste. W drugiej kolumnie podajemy obliczone graniczne długości fali /.p = 2-rtclaip. Uwzględniając, że doświadczalna długość fali nie jest zbyt dobrze okre- ślona, zgodność teorii z doświadczeniem jest zupełnie dobra. Można by się dziwić, dlaczego częstość plazmowa ,cop ma coś wspólnego z rozchodze- niem się fal elektromagnetycznych w metalach. Częstość plazmowa pojawiła się w rozdz. 7 <t. II, cz. l)-jako częstość własna oscylacji gęstości elektronów swobodnych. (Chmura elektronów jest odpychana przez siły elektryczne i bezwładność elektronów prowadzi dc? oscylacji gęstości.) Dlatego też częstość rezonansowa podłużnych fal plazmy jest równa aip. Teraz natomiast mówimy o poprzecznych falach elektromagnetycznych i oka- zuje się, że te fale poprzeczne są pochłaniane właśnie dla częstości niższych niż cop. (Jest to zbieżność interesująca i wcale nie przypadkowa.) Mówiliśmy tu o rozchodzeniu się fal w metalach, natknęliśmy się jednak na przykład, który jest piękną ilustracją uniwersalności zjawisk fizyki. Okazało się bowiem, że nie ma żadnej różnicy, czy owe swobodne elektrony występują w metalu, czy też w plazmie jono- sfery ziemskiej lub w atmosferze gwiazdy. Aby opisać rozchodzenie się fal radiowych w jonosferze, można użyć tych samych wyrażeń — przyjmując oczywiście odpowiednie wartości na N i r. Można teraz zobaczyć, dlaczego długie fale radiowe są pochłaniane lub odbijane przez atmosferę, podczas gdy fale krótkie przechodzą przez nią na wylot. (Dla łączności z sztucznymi satelitami musi się używać fal krótkich.) * Mówiliśmy o skrajnych przypadkach — odpowiadających wielkim i małym częstoś- ciom — rozchodzenia się fal w metalach. Dla częstości pośrednich musi się korzystać z pełnego wzoru (32.42). W ogólnym przypadku współczynnik załamania będzie miał część rzeczywistą i część urojoną; fala jest osłabiana w trakcie przechodzenia przez metal. W przypadku bardzo cienkich warstw metale są w pewnym stopniu przezroczyste nawet dla częstości optycznych. Tak na przykład okulary ochronne dla ludzi pracujących w po- bliżu pieców hutniczych robi się odparowując cienką warstwę złota na szkle. Promienie widzialne przechodzą przez takie okulary zupełnie dobrze — z silnym odcieniem zielo- nym — a promienie podczerwone są silnie pochłaniane.
32-7. PRZYBLIŻENIA MAŁEJ I WIELKIEJ CZĘSTOŚCI 225 Tabela 32.3. Długości Sali, poniżej których metal staje się przezroczysty*! Metal A (doświadczalne) Ap = 27tc/iOp Li 1550 A 1550 A Na 2100 2090 K 3150 2870 Rb 3400 3220 ♦) Na podstawie; C. Kittel, lutroduction to Solid State Physics, John Wiley and Sons, Inc. New York 1956, str. 266 Na koniec, jeszcze jedna uwaga. Nie mogło ujść uwadze czytelnika, że wiele z tych wzorów jest w pewnym stopniu podobnych do wzorów dla stałej dielektrycznej x, oma- wianych w rozdz. 10 tomu II (cz. 1). Stała dielektryczna h jest miarą reakcji substancji na stałe pole, tzn. dla co = 0. Jeżeli się uważnie przyjrzeć definicjom n i x, to się stwierdzi, że x jest po prostu granicą n2 przy co -> 0. Rzeczywiście, przyjmując w równaniach tego rozdziału co = 0 i n2 = x otrzymamy z powrotem równania teorii stałej dielektrycznej z rozdz. 11 tomu II (cz. 1).
33 odbicie od powierzchni 33-1. Odbicie i załamanie światła*) Tematem tego rozdziału jest odbicie i załamanie światła — lub ogólnie biorąc fal elektromagnetycznych — na powierzchniach. Prawa załamania i odbicia omawialiśmy już w rozdz. 35 tomu I (cz. 2). Oto co tam stwierdziliśmy: 1. Kąt odbicia równa się kątowi padania. Dla kątów określonych tak jak na rys. 33.1 AodbMpad- (33-D 2. Iloczyn n sin 0 jest taki sam dla wiązki padającej i załamanej (prawo Snelliusa): 33 1 Odbicie i załamanie fal świetlnych na powierzchni. (Kierunki fal są prostopadłe do grzbietów fali.) «1 Sin 0pad = n2 sin 0zal. (33.2) 3. Natężenie światła odbitego zależy od kąta padania, a także od kierunku polaryzacji- Dla wektora E prostopadłego do płaszczy- zny padania współczynnik odbicia, , Jest równy n ____ /pdb ___ Sin (^pad ^zał) (33.3) 4ad sin2 (0pad+^zał) ' •) Porównaj. Tom I, cz. 2, rozdz. 35 (Pol*1'?' zacja). i
33-1. ODBICIE I ZAŁAMANIE ŚWIATŁA 227 Dla wektora E równoległego do płaszczyzny padania współczynnik odbicia, Ą, jest równy n _ A>db ___ tg (®pad ®zal) .. 1 ~ tg^c^+e^ • (33-4) 4. Dla padania w kierunku normalnej (polaryzacja oczywiście dowolna!) = . (33.5) A>ad \ «2 + «l I Właściwie nasze poprzednie rozważanie tego zagadnienia powinno każdemu wystar- czyć, ale mimo to temat ten chcemy przerobić jeszcze raz, w pewien inny sposób. Dlaczego? Jednym z powodów jest przyjmowane poprzednio założenie, że współczynniki zała- mania są liczbami rzeczywistymi (czyli, że nie ma pochłaniania przez substancje). Ale jest jeszcze inny powód — powinniśmy umieć rozpatrywać to, co się dzieje z falami przy powierzchniach, z punktu widzenia równań Maxwella. Dostaniemy takie same odpowiedzi jak poprzednio, ale tym razem będą one wypływać z bezpośredniego rozwiązania zagad- nienia falowego, a nie z jakichś sprytnie dobranych argumentów. Należy zaznaczyć, że amplituda odbicia od powierzchni nie jest własnością substancji, tak jak współczynnik załamania. Jest to „właściwość powierzchni”, zależy ona bowiem wyraźnie od „obróbki” powierzchni. Cienka warstwa jakiejś substancji obcej na po- wierzchni rozgraniczającej dwa materiały o współczynnikach załamania nt i n2 będzie zwykle miała wpływ na odbicie. (Są tu możliwe wszystkie typy interferencji — tak jak to mamy w kolorowych warstwach oliwy. Odpowiednia grubość tej obcej warstwy może nawet dla danej częstości zredukować odbitą amplitudę do zera; tak właśnie się robi soczewki warstwowe.) Wzory, które wyprowadzimy, są słuszne tylko w wypadku nagłej zmiany współczynnika załamania, jeżeli zachodzi ona na odległości bardzo małej w po- równaniu z długością fali. Dla światła długość fali wynosi około 5000 A, tak że przez „gładką” powierzchnię będziemy rozumieć taką, w której warunki się zmieniają po przej- ściu zaledwie kilku odległości międzyatomowych (kilku angstremów). Nasze równania będą się stosować do światła tylko dla wysoce wypolerowanych powierzchni. W ogólnym przypadku, gdy współczynnik załamania zmienia się stopniowo na odległości równej kilku długościom fali, odbicie jest w ogóle bardzo słabe. 33-2. Fale w substancjach gęstych Najpierw przypomnimy sobie wygodny sposób opisu sinusoidalnej fali płaskiej, którym S1ć Posługiwaliśmy w rozdz. 36 tomu I (cz. 2). Każdą składową pola w fali (np. pole E) ®tożna zapisać w postaci E = £’oeZ(fl"-k-r), (33.6) gdzie E oznacza amplitudę w punkcie r (odległość od początku układu) w chwili t. Wek- tor k jest równoległy do kierunku rozchodzenia się fali i jego wartość bezwzględna jkj =
228 33. ODBICIE OD POWIERZCHNI = k = 2k/2 jest liczbą falową. Prędkość fazowa fali jest równa ty — a)/k; dla fali świetl- nej w substancji o współczynniku załamania n,ty=c/n, tak że <on k = —. c (33.7) Przypuśćmy, że wektor k ma kierunek osi z; wówczas k -r jest równe po prostu kz, tak jak to często pisaliśmy. Dla wektora k mającego jakiś inny kierunek należy zastąpić z przez rk, odległość od początku układu w kierunku k; to znaczy powinno się zastąpić kz przez krk, co jest równe właśnie k-r (patrz rys. 33.2). Równanie (33.6) jest zatem wygodnym sposobem przedstawienia fali rozchodzącej się w dowolnym kierunku. Należy oczywiście pamiętać, że k-r = gdzie kx, ky i kz są składowymi wektora k w kierunku trzech osi układu współrzęd- nych. W zasadzie swego czasu wykazaliśmy, że (co, kx, ky, k2) jest czterowektorem i jego iloczyn skalamy z czterowektorem (t, x,y, z) jest niezmiennikiem. A więc faza fali jest niezmiennikiem i równanie (33.6) można by zapisać w postaci E = Eo eKpęik^f). Ale w tej chwili nie musimy być aż tak eleganccy. Dla sinusoidalnego pola E, takiego jak w równaniu (33.6), 8E/8t jest tym samym co ia>E, a 8E)8x jest równe ikxE-, podobne zależności zachodzą też dla innych składowych. Widać stąd, dlaczego przy posługiwaniu się równaniami różniczkowymi wygodniej posłu- giwać się funkcjami o takiej postaci jak (33.6) — wtedy różniczkowanie jest zastąpione mnożeniem. Dalsza pożyteczna uwaga: operator V = (8/dx, 8[8y, d/dz) zostaje zastąpiony trzema czynnikami (—ikx, —iky, —ik^. Ale te trzy czynniki transformują się jak składowe wektora k, tak że działanie operatora V zo- staje zastąpione po prostu mnożeniem przez —zk; czyli 8 8t -> ICO, V —żk. (33.8) 33.2. Faza fali poruszającej się w kierunku k jest dla danego punktu P równa (cot—k-r) Powyższa zamiana pozostaje prawdziwa dla każdej operacji zawierającej operator V, nie- zależnie, czy interesuje nas gradient, dy- wergencja, czy też rotacja. Tak na przykład składowa z-owa rotacji V xE jest równa 5Ey 8EX 8x dy
33-2. FALE W SUBSTANCJACH GĘSTYCH 229 Jeżeli Ey i Ex są funkcjami zmieniającymi się jak e~'k r, to powyższe wyrażenie jest równe -ikxEy+ikyEx, co jak widać, jest składową z-ową iloczynu —zkxE. Otrzymujemy zatem bardzo pożyteczną ogólną regułę, mówiącą, że zawsze gdy trzeba wziąć gradient jakiegoś wektora, który się zmienia tak jak fala w trzech wymiarach (takie wektory są ważnymi wielkościami fizyki), to tę operację różniczkowania można doko- nać szybko i prawie bezmyślnie, pamiętając, że operator V jest równoważny mnożeniu przez — ik. Tak na przykład, równanie Faradaya VxE = — dt przyjmuje dla fali postać stąd zaś otrzymujemy —ikxE = —zcoB b = ^£ O) (33.9) co odpowiada znalezionemu przez nas poprzednio wynikowi dla fal w próżni — wektor B w fali jest prostopadły do wektora E i do kierunku fali. (W próżni co/k = c.) Znak w rów- naniu (33.9) można zapamiętać, jeśli się wie, że wektor k ma kierunek wektora Poyntinga: S = eoc2EzB. Jeżeli zastosujemy tę samą regułę do pozostałych równań Maxwella, to powtórnie otrzymamy wyniki poprzedniego rozdziału, a w szczególności związek co2n2 . k-k = k2 =——. (33.10) c Ponieważ jednaj już to znamy, nie będziemy tego raz jeszcze powtarzać. Jeżeliby ktoś chciał się zabawić, to może spróbować rozwiązać takie oto zagadnienie, które w roku 1890 było ostatecznym sprawdzianem dla kandydatów do stopnia doktor- skiego, a które uchodziło wówczas za bardzo trudny problem. Polegało ono mianowicie na rozwiązaniu równania Maxwella dla fal płaskich w krysztale anizotropowym, tzn. w przypadku, gdy polaryzacja P jest związana z polem elektrycznym E za pośrednictwem tensora polaryzowalności. Należy oczywiście wybrać osie układu wzdłuż osi głównych tensora, tak aby związki pomiędzy wektorami P i E były jak najprostsze (wówczas Px = = iaEx,Py = abEy i P2 = acE2), ale należy dopuścić, że fale mają dowolny kierunek 1 dowolną polaryzację. Powinno się znaleźć związki pomiędzy polami E i B oraz zależność wektora k od kierunku polaryzacji fali. Wówczas będzie można zrozumieć optykę krysz- tału anizotropowego. Najlepiej jest zacząć od najprostszego przypadku kryształu dwój- tarnnego, np. kalcytu, dla którego dwie z polaryzowalności są sobie równe (powiedzmy ab = ac) i sprawdzić, czy potrafi się zrozumieć, dlaczego patrząc przez taki kryształ widzi si? podwójnie. Jeżeli się potrafi to zrobić, to należy spróbować rozwiązać przypadek naj-
230 33. ODBICIE OD POWIERZCHNI J&3. Wektory falowe k, k', k" dla fali padającej, odbitej i załamanej trudniejszy, dla którego wszystkie trzy współczynniki a są różne. Po zrobieniu tego będzie- cie wiedzieć, czy dorównujecie poziomowi doktoranta z 1890 roku. W tym rozdziale bę- dziemy jednak rozważać tylko substancje izotropowe. Wiemy z doświadczenia, że gdy fala płaska pada na granicę dwóch różnych ośrodków, powiedzmy powietrza i szkła lub wody i oliwy, to powstaje fala odbita i fala załamana. Przypuśćmy, że założyliśmy tylko tyle i zobaczmy, co potrafimy z tego wyprowadzić. Wybieramy nasze osie tak, że osie y i z leżą w płaszczyźnie powierzchni granicznej, a płasz- czyzna xy jest prostopadła do powierzchni falowych padających fal, tak jak pokazano na rys. 33.3. Wektor elektryczny fali padającej można zapisać jako = Eoea”'-kr>. (33.11) Ponieważ wektor k jest prostopadły do osi z, Lr = kzK+kyy. (33.12) Falę odbitą zapisujemy jako E^ = E;e^''-k'r’, '' (33.13) tak że jej częstością jest tt>', liczbą falową k', a jej amplitudą jest EÓ. (Oczywiście, wiemy, że częstość i wartość bezwzględna wektora k' są takie same jak dla fali padającej, ale nie będziemy nawet tego zakładać. Będziemy chcieli, żeby ten fakt wyniknął z naszego aparatu matematycznego.) W końcu, dla fali załamanej możemy przyjąć E2al = E"e'<""'-k"rt (33.14)
33-2. FALE W SUBSTANCJACH GĘSTYCH 231 Wiemy, że jedno z równań Maxwella prowadzi do równania (33.9), tak że dla każdej z fal mamy k x EMd k' x Eodb k" x E„. Bpad =------—> Bodb =----------8^ =----------------(33.15) co a> a> Również, jeżeli współczynniki załamania dwóch ośrodków oznaczyć i n2, to z równania (33.10) wynika, że 1 2 k2 = k2+k2 = (33.16) c2 Ponieważ fala odbita rozchodzi się w tym samym ośrodku, co fala padająca, to <o'2ni k'2 =—z-2-, (33.17) <r podczas gdy dla fali załamanej ’ - :, = (33.18) c2 > . ' 33-3. Warunki graniczne Opisaliśmy już, jak wyglądają wszystkie trzy fale; musimy teraz wyrazić parametry fali odbitej i załamanej przy pomocy parametrów fali padającej. Jak to można zrobić? Opisane przez nas trzy fale spełniają równania Maxwella w ośrodku jednorodnym, ale równania Maxwella muszą być także spełnione na granicy pomiędzy dwoma różnymi ośrodkami. Musimy się zatem przypatrzeć temu, co się dzieje na samej granicy. Przeko- namy się, że to właśnie równania Maxwella żądają, aby te trzy fale były w pewien sposób ze sobą powiązane. Przykładem tego, co mamy na myśli, jest warunek równości składowych y pola elek- trycznego E po obu stronach granicy. Wymaga tego prawo Faradaya: dB VxE=-—, (33.19) dt a można się o tym przekonać w sposób następujący: rozważmy małą, prostokątną pętlę r, obejmującą powierzchnię graniczną, tak jak to pokazano na rys. 33.4. Równanie (33.19) mówi, że całka krzywoliniowa wokół r jest równa szybkości zmian strumienia pola B Przez pętlę: . rE-Js =-------fB-nćZn. / dt 1 Wyobraźmy sobie teraz, że prostokąt ten jest bardzo wąski, tak że pętla zamyka w sobie nieskończenie małą powierzchnię. Jeżeli pole B pozostaje skończone (a nie ma powodu, dla którego B miałoby być nieskończone na granicy!), to strumień przez tę powierzchnię
232 33. ODBICIE OD POWIERZCHNI Varunek graniczny Ey2 = Eyl wynika z f E ds = 0 jest równy zeru. Zatem całka krzywoliniowa z pola E musi być równa zeru. Jeżeli Eyl i Ey2 są składowymi pola po obu stronach granicy i jeżeli długość prostokąta wynosi l, to Eyll-Ey2l = Q, czyli Eyi=Ey2, (33.20) tak jak to twierdziliśmy. Otrzymujemy zatem jeden ze związków pomiędzy polami trzech fal. Procedurę otrzymywania z równań Maxwella związków dotyczących zachowania się pola na granicy dwóch ośrodków nazywamy określaniem warunków granicznych. Zwykle się wyszukuje tyle, ile tylko się da równań, takich jak (33.20), rozważając małe prostokąciki jak na rys. 33.4 lub używając małych powierzchni gaussowskich, obejmujących powierzch- nię graniczną. Chociaż jest to doskonała metoda postępowania, to sprawia ona wrażenie, że zagadnienie warunków granicznych jest odmienne dla różnych zagadnień fizycznych. Tak na przykład w przypadku przepływu ciepła przez powierzchnię odgraniczającą dwa ośrodki mamy do rozpatrzenia problem: jaki jest związek pomiędzy temperaturami po obu stronach tej granicy? No cóż, można by rozumować tak: dopływ ciepła do po- wierzchni granicznej z jednej strony powinien być równy odpływowi ciepła z drugiej strony. Zwykle można, i na ogół jest to bardzo pożyteczne, by określać warunki graniczne posłu- gując się takimi argumentami fizycznymi. Może się jednak czasem zdarzyć, że rozważając jakieś zagadnienie ma się tylko kilka równań i nie widać bezpośrednio, jakich argumentów fizycznych powinno się użyć. Dlatego też, chociaż w tej chwili interesuje nas tylko zagad- nienie elektromagnetyczne, gdzie możemy przeprowadzić rozważania natury fizycznej, chcemy pokazać pewną metodę, która ma zastosowanie do każdego zagadnienia — ogólny sposób polegający na określeniu tego, co się dzieje na powierzchni granicznej, biorąc za punkt wyjścia bezpośrednio równania różniczkowe. Zaczniemy od wypisania równań Maxwella dla dielektryka; będziemy tym razem bardzo drobiazgowi i wypiszemy w sposób jawny wszystkie składowe:
33-3. WARUNKI GRANICZNE 233 V P V E =-------, «o idEx dEv dE \ °\ dx dy dz ) VxE = rB ” ~~dT’ dEz dEy _ dBx dy dz dt ’ dEx dEz dBy dz dx dt ' dEy dEx dBz , V B = dx dy dt 0, dBx dB dBz n ' c2VxB dx dy dz 1 dP dE = . 4* . > e0 dt dt dPx ‘ dPr dP\ —2-4 Ł-| L ; , dx dy dz / (33.21) (33.22a) (33.22b) (33.22c) (33.23) (33.24a) (33.24b) (33.24c) 1 dBz _ 1 dPx , SEX i sy dz / Co dt + ' dt ' ' dBx dBz\ 1 dPy dEy dz dx 1 £O dt 1 dt oBx 1 - ’ dPz dEz 4 dy ) ' C0 dt dt Wszystkie te równania muszą teraz być spełniane w obszarze 1 (na lewo od powierzchni granicznej) i w obszarze 2 (od niej na prawo). Rozwiązania dla obszarów 1 i 2 już wypi- saliśmy. A wreszcie, muszą one być także spełnione na samej powierzchni granicznej, którą nazwiemy obszarem 3. Chociaż zwykle się myśli, że granica jest czymś „ostro” nie- ciągłym, nieskończenie cienką powierzchnią, to w rzeczywistości tak nie jest. Właściwości fizyczne zmieniają się bardzo gwałtownie, ale nie nieskończenie szybko. W każdym razie, można sobie wyobrazić, że pomiędzy obszarami 1 i 2 zachodzi bardzo gwałtowna, ale cią- gła zmiana współczynnika załamania, na małej odległości, którą nazwiemy obszarem 3. Również każda składowa pola, jak Px lub Ey, itd. będzie doznawać tego typu zmian w ob- szarze 3. W dalszym ciągu muszą być dla tego obszaru spełnione równania różniczkowe i właśnie dzięki „śledzeniu” równań różniczkowych dla tego obszaru będziemy mogli otrzymywać potrzebne „warunki graniczne”. Przypuśćmy na przykład, że mamy granicę pomiędzy próżnią (obszar 1) i szkłem (ob- szar 2). W próżni nie ma nic, co by można było spolaryzować, tak że Pt = 0. W szkle zaś występuje pewna polaryzacja P2. Przejście od próżni do powietrza jest „gładkie”, ale szybkie. Gdyby się przyjrzeć którejś ze składowych wektora P, powiedzmy Px, to mo-
234 33. ODBICIE OD POWIERZCHNI głąby ona się zmieniać tak, jak to pokazano na rys. 33.5a. Przypuśćmy, że wezmiemy teraz pierwsze z naszych równań, równanie (33.21). Zawiera ono pochodne składowych wek- tora P względem x, y i z. Pochodne względem y i z nie interesują nas; wzdłuż tych kierun- ków nie dzieje się nic nadzwyczajnego. Ale pochodna względem x składowej Px przyjmuje w obszarze 3 bardzo duże wartości, ze względu na ogromną zmianę składowej Px. p0. chodna dPJdx będzie więc miała ostry wierzchołek na granicy, tak jak to pokazano na rys. 33.5b. Gdyby wyobrazić sobie, że ściśniemy granicę do jeszcze cieńszej warstwy, to wierzchołek ten będzie o wiele wyższy. Jeżeli dla fal, które nas interesują, granica jest rze- czywiście „ostra”, to wielkość dPJdx będzie w obszarze 3 bardzo duża, o wiele większa od jakichś innych przyczynków, które mogłyby pochodzić od zmian polaryzacji P w fali 33.5. Pola w obszarze przejściowym (3) po- między dwoma różnymi ośrodkami [obszary (1) i (2)1 znajdującej się daleko od granicy — dlatego też pomijamy wszystkie przyczynki różne od tych, za które jest odpowiedzialny obszar graniczny. Jak teraz może być spełnione równanie (33.21), jeżeli po jego prawej stronie występuje funkcja mająca tak diabelnie duży wierzcho- łek? No cóż, będzie ono spełnione tylko wtedy, jeżeli taki sam wierzchołek będzie miała funk- cja występująca i po jego drugiej stronie — musi więc pojawić się coś dużego i po lewej stronie równania. Jedyną kandydatką na tego rodzaju wielkość jest 3Ejdx, ponieważ zmiany w kierunkach z i y są związane tylko z tymi możliwymi do pominięcia przyczynkami, o których przed chwilą wspomnieliśmy. A zatem na rys. 33.5c należy wykreślić funk- cję -e0(dEJdx) jako dokładną kopię funkcji oPx[ox. Mamy więc £r\ •' — —-------, ć)x dx Jeżeli to równanie scałkujemy względem x w obszarze 3, to dojdziemy do wniosku, że e0(^2-^i) = -(Px2-Pxl)- (33-25) Innymi słowy, skok e0Ex przy przejściu od obszaru 1 do obszaru 2 musi być równy sko- kowi —Px. Równanie (33.25) można przepisać w p°' staci s0Ex2+Px2 = e0Exl +Pxl, (33-26)
235 33.3. WARUNKI GRANICZNE z której wynika, że wielkość (eoEx+P,) ma te same wartości w obszarze 2, co w obszarze 1. Oznacza to, że wielkość (e0Ex-rPx) jest ciągła na granicy dwóch ośrodków. W ten sposób mamy jeden z naszych warunków granicznych. Chociaż omówiliśmy dla przykładu przypadek, w którym polaryzacja Pi była równa zeru, bo obszarem 1 była próżnia, to widać jasno, że to samo rozumowanie można zasto- sować do dowolnych dwóch ośrodków znajdujących się w tych dwóch obszarach, tak że równanie (33.26) jest prawdziwe ogólnie. Zbadajmy teraz pozostałe równania Maxwella i zobaczymy, jakie wnioski z nich wy- nikają. Najpierw weźmy równanie (33.22a). Nie ma tam pochodnych względem x, a więc to równanie nic nam nie mówi. (Pamiętajmy, że same pola na granicy nie stają się zbyt duże; to tylko pochodne względem x mogą stać się tak olbrzymie, że będą one w równaniu wyrazami dominującymi.) Z kolei rozpatrzmy równanie (33.22b). Aha! Tu jest jakaś pochodna względem x! Po lewej stronie mamy 8EJox. Przypuśćmy, że pochodna ta jest olbrzymia. Ale chwileczkę! Po prawej stronie nie ma niczego, co mogłoby dorównywać tej olbrzymiej pochodnej; dlatego też nie może wystąpić żaden skok składowej Ez przy przejściu od obszaru 1 do obszaru 2. [Gdyby tak było, to po lewej stronie równania (33.22a) funkcja miałaby wierzchołek, a po prawej stronie żaden wierzchołek nie mógłby się po- jawić i równanie byłoby fałszywe.] Mamy zatem nowy warunek: Ą2=£x1. (33.27) To samo rozumowanie w przypadku równania (33.22c) daje <. Ey2 = Eyl. (33.28) Ostatni wynik jest identyczny z tym, jaki otrzymaliśmy z równania (33.20) rozważając całkę krzywoliniową. Przechodzimy do równania (33.23). Jedyny wyraz, który mógłby być bardzo duży, to óBJdx. Ale po prawej stronie nie ma niczego, co mogłoby mu dorównać, tak więc dochodzimy do wniosku, że Bx2=Bxl. (33.29) Przejdźmy wreszcie do ostatnich równań Maxwella! Równanie (33.24a) nie daje nic, bo nie zawiera pochodnych względem x. Równanie (33.24b) ma jedną taką pochodną ~-c2 dBJdx, ale i tym razem nie ma niczego, co mogłoby ją zrównoważyć. Otrzymujemy Więc Ą2=5z1. (33.30) Ostatnie równanie jest zupełnie podobne i daje By2 = Byi. (33.31) Ostatnie trzy równania prowadzą do równań B2 = B2. Należy jednak zaznaczyć, że ten wynik otrzyma się tylko wtedy, gdy po obu stronach granicy są substancje niemagne- tyczne — a raczej wtedy, gdy można w tych ośrodkach pominąć wszystkie zjawiska magne- tyczne. Zwykle można to zrobić dla większości substancji, z wyjątkiem ferromagnetycz- nych. (Własności magnetyczne substancji będziemy omawiać w następnych rozdziałach.)
236 33. ODBICIE OD POWIERZCHNI (EŁ)y = b1=b2 (powierzchnia leży w płaszczyźnie yz) Tabela 33.1. Warunki graniczne na po- . Nasz plan pozwolił ram wyłowić sześć zależ- wierzchni dielektryka ności pomiędzy polami w obszarze 1 i polami w obszarze 2. Zamieszczamy je wszystkie ra- zem w tab. 33.1. Można ich używać do dopa- sowania fal w dwóch obszarach. Chcemy jednak- że podkreślić, że koncepcja, którą się posłuży- liśmy, daje wyniki dla każdej sytuacji fizycznej, w której mamy równania różniczkowe, a chce- ,, my znaleźć rozwiązanie, które przechodzi przez . ostrą granicę pomiędzy dwoma ośrodkami, gdzie następuje zmiana pewnych własności fi- zycznych. Dla naszych obecnych celów mogli- byśmy wyprowadzić bez trudu te same równania, rozważając na granicy strumienie i krążenia. (Czytelnik może spróbować, czy potrafi otrzymać w ten sposób te same wyniki.) Przedstawiliśmy jednak metodę, która daje wyniki nawet w wypadku, jeżeli ktoś się kiedyś zaplącze i nie będzie mógł znaleźć żadnych przystępnych argumentów, dotyczą- cych natury fizycznej tego, co się dzieje na granicy — wystarczy wówczas posłużyć się sa- mymi tylko równaniami. > 33-4. Fale odbite i załamane Jesteśmy teraz gotowi do zastosowania naszych warunków granicznych do fal, które wypisaliśmy w § 33-2. Mieliśmy tam: r- Enad = EoezpIKcnt-k^f-^)], (33.32) Eodb = Eóexpli(ft>'t-k>:-^y)], (33.33) : fj.) Ezai = Eoexpb’(«o"t-k^x-k"y)], (33.34) •>. 1 R . kxEpad (33.35) 1 , R k^E^ ”«” “ »- (33.36) ^'zE^, "zał — „ " • (33.37) Wiemy coś jeszcze: pole E jest prostopadłe do swojego wektora propagacji k dla każdej fali. Wyniki będą zależeć od kierunku wektora E, czyli od „polaryzacji” fali padającej. Nasz opis znacznie się uprości, jeżeli rozważymy oddzielnie przypadek fali padającej z wek- torem E równoległym do „płaszczyzny padania” (tzn. do płaszczyzny xy), a oddzielnie przypadek fali padającej z wektorem E prostopadłym do płaszczyzny padania. Fala o jakiejś
33-4. FALE ODBITE I ZAŁAMANE 237 innej polaryzacji jest po prostu kombinacją li- niową dwóch takich fal. Innymi słowy, natęże- nia fal odbitych i załamanych są różne dla róż- nych polaryzacji i najłatwiej jest wybrać dwa najprostsze przypadki i rozważyć je oddziel- nie. Podamy najpierw pełne rozumowanie dla fa- li padającej spolaryzowanej prostopadle do płasz- czyzny padania, a następnie podamy same tylko wyniki dla fali spolaryzowanej równo- legle. Trochę tu oszukujemy, biorąc przypadek najprostszy, ale zasada jest dla obu rodzajów fal taka sama. Przyjmujemy zatem, że pole Epad ma tylko składową wzdłuż osi z i ponie- waż wszystkie wektory E mają taki sam kieru- nek, to można znaki wektorów opuścić. Dopóty, dopóki obie substancje są izotro- powe, indukowane oscylacje ładunków będą zachodziły także w kierunku osi z i pola E fab załamanej i fali odbitej będą miały tylko 33.6. Polaryzacja fali odbitej i fali załama- nej, w przypadku gdy pole E fali padającej jest prostopadłe do płaszczyzny padania składowe z-owe. Zatem dla wszystkich fal Ex — Ey = Px = Py = 0. Wektory E i B fal będą wyglądać tak, jak to przedstawiono na rys. 33.6. (Postępujemy trochę niekonsekwent- nie w stosunku do naszego pierwotnego planu, według którego mieliśmy otrzymać wszyst- ko z samych równań. Ten sam wynik wypłynąłby z warunków granicznych, ale można zaoszczędzić wielu obliczeń korzystając z argumentów fizycznych. Gdyby ktoś miał trochę wolnego czasu, to niech sprawdzi, czy potrafi otrzymać ten sam wynik z samych tylko równań. Widać jasno, że to, co powiedzieliśmy, zgadza się z równaniami, tyle tyl- ko, iż nie wykazaliśmy, że nie ma żadnych innych możliwości.) Nasze warunki graniczne, równania (33.26)-(33.31), dają zależności pomiędzy skła- dowymi pól E i B w obszarach 1 i 2. W obszarze 2 mamy tylko falę załamaną, ale w obsza- rze 1 mamy dwie fale. Której z nich należy użyć? Pola w obszarze 1 są oczywiście super- pozycjami pól fali padającej i fali odbitej. (Ponieważ każda z nich spełnia równania Max- wella, ich suma też je spełnia.) A zatem gdy wprowadzimy warunki graniczne, musimy przyjąć, że Ej = E E, = E ,, * pad 1 odb* 2 zaP i podobnie dla pól B. Dla rozważanej przez nas polaryzacji równania (33.26) i (33.28) nie dają żadnych no- wych informacji; pożyteczne jest tylko równanie (33.27). Mówi ono, że Ąiad+^odb ~ ^zał »a powierzchni granicznej, to jest dla x = 0. Mamy więc E0exp[i(ft>f-kJ,y)]+£'óexPl,'(<0 = £Ó'exp[f(<o "t~kyy)], (33.38)
238 33. odbicie od powierzchni co musi być prawdą dla każdego y i dla każdego t. Przypuśćmy, że rozpatrzymy najpierw y = 0. Wówczas Eoe'“'+£Óe’“'' = Równanie to głosi, że suma dwu oscylacji jest równa trzeciej oscylacji. Może to się zda- rzyć tylko wtedy, jeżeli wszystkie oscylacje mają tę samą częstość. (Jest niemożliwe, aby trzy takie wyrazy — czy też ich dowolna liczba — o różnych częstościach dawały w sumie zero dla wszystkich t.) A zatem co" = co' = co. , t , (33.39) Jak więc to przez cały czas wiedzieliśmy, częstości fali odbitej i fali załamanej są takie same jak częstość fali padającej. Powinniśmy naprawdę zaoszczędzić sobie trochę pracy i zamieścić ten wynik na sa- mym początku, ale chcieliśmy pokazać, że można go uzyskać z równań. Gdy się ma do czynienia z jakimś prawdziwie nowym problemem, zwykle najlepiej jest wypisać na sa- mym początku wszystko to, co się wie, i zaoszczędzić sobie sporo kłopotu. Z definicji, wartość bezwzględna k jest dana związkiem k2 = n2<o2!c2, tak więc mamy k"2 _ k'2 _ k2 „2 „2 „2 «2 «1 «1 (33.40) Rozpatrzmy teraz równanie (33.38) dla t — 0. Przeprowadzając znowu rozumowanie tego samego typu jak przed chwilą, ale opierając się tym razem na fakcie, że równanie to musi być słuszne dla wszystkich wartości y, otrzymujemy ky=k'y = ky. (33.41) Z równania (33.40), k'2 = k2, a zatem k'2+k'y2=k2+k2y. Zestawiając to z równaniem (33.41) widzimy, że k'2 = k2, czyli że k'x = ±kx. Znak dodatni me ma żadnego sensu; dawałby on bowiem zamiast fali odbitej jakąś inną falę padającą, a powiedzieliśmy na początku, że w naszym zagad- nieniu wystąpi tylko jedna fala padająca, czyli k'x = -kx. (33.42) Te dwa równania [(33.41) i (33.42)] mówią nam, że kąt odbicia jest równy kątowi padania, tak jak tego oczekiwaliśmy (patrz rys. 33.3). Fala odbita ma postać ^odb = E'0enp[i(o>t-kxx+ky y)]. (33.43) Dla fali załamanej mieliśmy już zależność < . ky = ky
33-4. FALE ODBITE I ZAŁAMANE 239 oraz , . . k”2 _ k2 . • ’ ”^2 TT’ , n2 ni możemy więc równania te rozwiązać i znaleźć k'x. Otrzymujemy: n2 kx2 = k"2-k’’2=^k2-k2y. (33.44) (33.45) Przypuśćmy na chwilę, że nr i n2 są liczbami rzeczywistymi (że części urojone obu współczynników załamania są bardzo małe). Wówczas wszystkie k są również liczbami rzeczywistymi, a na podstawie rys. 33.3 możemy stwierdzić, że k k" -r- = sin 0pad, -ttt = sin 0zal. (33.46) » * i , ‘ K' K Z zależności (33.44) otrzymujemy więc, że njsinfl^ = «isin0pad, (33.47) co jest prawem załamania Snelliusa — a więc znowu czymś, co już znamy. Jeżeli współ- czynniki załamania nie są rzeczywiste, to liczby falowe są zespolone i musi się używać równania (33.45). [Moglibyśmy wprawdzie określić kąty 0pad i 0^ jako parametry dane równaniem (33.46) i wówczas prawo Snelliusa, równanie (33.47), byłoby prawdziwe ogól- nie. Ale wówczas „kąty” mogłyby być także liczbami zespolonymi, tracąc w ten sposób swoją prostą interpretację geometryczną. Najlepiej jest więc opisywać zachowanie się fal poprzez ich wartości zespolone kx lub k".] Jednak dotąd nie znaleźliśmy niczego nowego, poza dość naiwnym zadowoleniem z otrzymania kilku oczywistych wyników ze skomplikowanego aparatu matematycznego. Teraz jesteśmy w stanie znaleźć amplitudy fal, których jeszcze nie znaliśmy. Korzystając z naszych wyników dla częstości (co" = co' = co) i liczb falowych (k" = k'y — ky) można podzielić dwie strony równania (33.38) przez czynnik wykładniczy; wtedy otrzymuje się E0+E’0 = E”. (33.48) Ponieważ nie znamy ani E'o, ani £", potrzebny nam jest jeszcze jeden związek. Musimy skorzystać z jakiegoś innego warunku granicznego. Nic nam nie przyjdzie z równań dla Ex i Ey, bo wszystkie występujące tu wektory E mają tylko składową z-ową. Musimy zatem skorzystać z warunków dla wektora B. Spróbujmy posłużyć się równaniem (33.29): ^x2 — Z równań (33.35)-(33.37) otrzymujerhy r — k) ^Pda r — ky^'°ib r pad ’ '°xodb ’ '°x‘zał CO CO ky Agal co" Korzystając z faktu, że co" = co' = co i k'y = ky = ky, dostajemy Eo+E'o =Eo-
240 33. ODBICIE OD POWIERZCHNI Ale przecież jest to znowu równanie (33.48)! Straciliśmy tylko czas, nie otrzymując nic nowego. Moglibyśmy spróbować równania (33.30), Bz2 = Bzl, ale pole B nie ma składowych w kierunku osi z! Zostaje więc tylko jedno równanie: równanie (33.31), Byl = Byl. Dla wszystkich trzech fal n _ _ k* £°db r = _ ^x^'zal (-i-i Ą>pad > "yodb w, > Ązał • (33.49) Podstawiając za £pad, £odh i £zał wyrażenia falowe dla x = 0 (czyli na powierzchni gra- nicznej), otrzymujemy warunek brzegowy k — Eo exp [i (a>t—kvy)] + ~ E'o exp [i (a>'t-k'y)] = ~ E'0’exp [i . co co co Znowu wszystkie k i co są równe, a więc równanie to sprowadza się do równania: kxEo+k'xE'o = kxE”. (33.50) Otrzymaliśmy zatem równanie na pola E, różne od równania (33.48). Przy pomocy tych obu równań można obliczyć E'o i E'o'. Pamiętając, że k'x = —kx, dostajemy , k —k" E'9 = -f—^E0, (33.51) 'Cx'TkX „ ^kX E°-~k^kTE( (33.52) 33.7. Polaryzacja fal, w przypadku gdy pole E fali padającej jest równoległe do płaszczyzny padania Równania te, wraz z równaniem (33.45) lub z równaniem (33.46) na k”, dają nam to, czego szukaliśmy. W następnym paragrafie rozważymy ich konsekwencje. Jeżeliby się zająć falą spolaryzowaną, której wektor E jest równoległy do płaszczyzny pada- nia, to trzeba uwzględnić, że wektor E będzie mieć zarówno składową x-ową, jak i j-ową, tak jak pokazano na rys. 33.7. Rachunki są pro- ste, ale bardziej żmudne. (Można ułatwić sobie pracę, wyrażając w tym przypadku wszystko przez pola magnetyczne, gdyż pola te w obu ośrodkach mają kierunek osi z.) Można się przekonać, że oraz 1^1 = n2 k— k'x 27 -- 1^0 Mjk^+njk.,. (33.53) (33.54)
33-4 FALE ODBITE I ZAŁAMANE 241 Zobaczmy, czy nasze wyniki zgadzają się z wynikami, które otrzymaliśmy poprzednio. Równanie (33.3), które wyprowadziliśmy w rozdz. 35 tomu I (cz. 2) określa stosunek na- tężenia fali odbitej do natężenia fali padającej. Wtedy rozważaliśmy jednak tylko rzeczy- wiste współczynniki załamania. Dla rzeczywistych n (i liczb falowych k) można napisać: kx = £cos0pad = cos0pad, ,, „ a>n2 kx=k cosfl^, =---------cos . c Podstawiając to do równania (33.51) otrzymujemy: E0 = »lC°Sepad-»2COSgzai Eo rtiCO&e^+niCO&e^ ’ , ' ' co nie przypomina równania (33.3). Można jednak stąd otrzymać to równanie, jeżeli skorzystamy z prawa Snelliusa, aby pozbyć się wszystkich współczynników n. Przyjmując = nisinflp^/sin&au oraz mnożąc licznik i mianownik przez sinS^ dostajemy Eo ___ cos 0pad sin0^,-sin 0pad cos0zał £0 cos 0pad sin 0zal+sin 0pad cos 0zal * Licznik i mianownik są po prostu sinusami kątów (0pad—0zat) i (^p^-Mad); otrzymujemy więc E0 _ S^n(^pad~^zal) “ . Eo Ponieważ E'o i Eo są polami w tym samym ośrodku, natężenia są proporcjonalne do kwa- dratów tych pól elektrycznych i w rezultacie dostajemy ten sam wynik co poprzednio. Podobnie można równanie (33.53) sprowadzić do równania (33.4). Dla fal, które padają prostopadle do płaszczyzny granicznej, 0pad = 0 i 0zal = 0. Rów- nanie (33.56) daje wtedy wyrażenie typu 0/0, z czego nie mamy wielkiego pożytku. Można jednak powrócić do równania (33.55), które daje ~ = = • (33-57) 4ad \Eol \nl+n2l Wynik ten stosuje się oczywiście dla fali o dowolnym kierunku polaryzacji, ponieważ w przypadku padania prostopadłego nie ma wyróżnionej „płaszczyzny padania”. 33-5. Odbicie od metali Powyższe wyniki mogą nam pomóc w zrozumieniu interesującego zjawiska — odbicia od metali. Jak to się dzieje, że metale są takie błyszczące? Widzieliśmy w poprzednim roz- dziale, że metale mają współczynnik załamania, który dla pewnych częstości ma dużą 16 — Wykłady z fizyki
242 33. ODBICIE OD POWIERZCHNI 33.8. Substancja silnie pochłaniająca światło przy . częstości co także odbija światło o tej częstości część urojoną. Zobaczmy, jakie jest natę- żenie fali odbitej, gdy światło pada z po- wietrza (z n = 1) na ośrodek materialny o n = —inj. Wówczas równanie (33.55) daje (dla padania w kierunku normalnej) E'o __ 1+ini Eo Aby obliczyć stąd natężenie fali odbitej, potrzebne nam są wartości bezwzględne E'o i Eo, podniesione do kwadratu: czyli /odb ... I^l2 _ UW2 4ad l^ol2 II-™/ 4db _ ...1 4ad l+«/2 (33.58) Tak więc substancja, której współczynnik załamania jest czystą liczbą urojoną, odbija promieniowanie elektromagnetyczne w 100 procentach! Metale nie odbijają promieniowania w 100 procentach, ale wiele z nich bardzo dobrze odbija światło widzialne. Innymi słowy, części urojone ich współczynników załamania są bardzo duże. Ale widzieliśmy, że duża część urojona we współczynniku załamania oznacza silne pochłanianie. Mamy zatem ogólną zasadę, że jeżeli jakaś substancja staje się przy danej częstości bardzo dobrym pochłaniaczem, to fale są od niej wtedy silnie odbijane i tylko niewielka ich część dostaje się do „środka”, gdzie ulega pochłonięciu. Zjawisko to można zaobserwować dla silnych barwników. Czyste kryształy najsilniejszych barwników mają „metaliczny” połysk. Prawdopodobnie zauważyliście, że wysuszony barwnik na brzegu butelki purpurowego atramentu daje złoty, metaliczny połysk lub że wysuszony czerwony atrament daje czasami zielonkawy metaliczny połysk. Czerwony atrament po- chłania z światła przepuszczonego barwę zieloną, tak że jeśli atrament jest bardzo stężony, to daje on silne odbicie powierzchniowe dla światła o częstościach odpowiadających barwie zielonej. Zjawisko to można łatwo zademonstrować pokrywając płytkę szklaną czerwonym atra- mentem i pozwalając mu wyschnąć. Jeżeli skierować wiązkę światła białego na tylną ściankę płytki, tak jak to pokazano na rys. 33.8, to otrzyma się wiązkę przepuszczoną o barwie czerwonej i wiązkę odbitą o barwie zielonej. 33-6. Całkowite odbicie wewnętrzne Jeżeli światło przechodzi z takiego ośrodka, jak na przykład szkło, o rzeczywistym współczynniku załamania większym od 1, do — powiedzmy — powietrza, o współczyn' niku załamania n2 = 1, to z prawa Snelliusa wynika, że sinfl^ = nsinflpad.
33-6. CAŁKOWITE ODBICIE WEWNĘTRZNE 243 Kąt załamania fali 6^ staje się kątem prostym, gdy kąt padania 0pad osiąga „wartość graniczną” 6e, daną przez n sin 9g = 1. (33.59) Co się stanie dla kąta 0pad większego od kąta granicznego? Wiemy, że zachodzi wówczas całkowite odbicie wewnętrzne. Ale jak to się dzieje? Powróćmy do równania (33.45), które daje liczbę falową k" fali załamanej: Ale kr = k sinfip^ i k — ton/c, a więc co2 ' kx2 = — (1—n2sin20pad). C2 Jeżeli n sin ^pad jest większe od 1, to kx2 jest ujemne i k" jest czysto urojone; powiedzmy k" = ±ikz. Wiemy teraz, co to oznacza! Fala „załamana” [równanie (33.34)] będzie mieć postać Ead = -EoexP(±*rO expp(a>t-kzy)]. Amplituda fali albo rośnie, albo maleje wykładniczo ze wzrostem x. Oczywiście, chcemy mieć tutaj znak ujemny. Wówczas amplituda fali po prawej stronie granicy będzie się zmieniać, tak jak to pokazano na rys. 33.9. Zauważmy, że kj jest rzędu co/c — co równe jest Źq, długości fali świetlnej w próżni. Gdy światło jest całkowicie odbite od wnętrza powierzchni szkło-powietrze, to w powietrzu też wystąpią jakieś pola, ale rozciągają się one poza powierzchnię jedynie na odległość rzędu długości fali światła. Widać teraz, jak należy odpowiedzieć na takie oto pytanie. Jeżeli fala świetlna w szkle przybywa do powierzchni pod wystarczająco dużym kątem, to ulega ona wewnętrznemu odbiciu, jeżeli natomiast dostawić do powierzchni jeszcze jeden kawałek szkła (tak że powierzchnia graniczna w efekcie znika), to światło jest całkowicie przepuszczone. Kiedy 33.9. Całkowite odbicie wewnętrzne
244 33. ODBICIE OD POWIERZCHNI 33.10. Jeżeli w ośrodku istnieje mała przerwa — to odbicie wewnętrzne nie jest „całkowite”; poza tą przerwą po- jawia się fala załamana to się właściwie stanie? Na pewno musi być ciągłe przejście od całkowitego wewnętrznego odbicia do zupełnego braku odbicia! Odpowiedź oczywiś- cie brzmi tak: jeżeli odstęp powietrza pomiędzy dwoma kawałkami szkła jest tak mały, że wy- kładniczy „ogon” fali w powietrzu ma jeszcze zna- czne natężenie w drugim kawałku szkła, to fala wzbudzi elektrony w tym drugim kawałku i wy- tworzy tam nową falę, tak jak to pokazano na rys. 33.10. Pewna część światła zostanie przepuszczona. (Oczywiście, nasze rozwiązanie nie jest kompletne; powinniśmy rozwiązać jeszcze raz wszystkie rów- nania dla przypadku cienkiej warstwy powietrza pomiędzy dwoma obszarami ze szkła.) To zjawisko przechodzenia fali przez przer- wę powietrzną można obserwować dla zwykłego światła tylko wtedy, gdy przerwa ta jest bardzo ma- ła (rzędu długości fali świetlnej, 10-5 cm), ale zja- wisko to można łatwo zademonstrować dla fal trzycentymetrowych. Wówczas wykładniczo malejące pole rozciąga się na kilka centy- metrów. Aparaturę mikrofalową potrzebną do demonstracji tego zjawiska pokazano na rys. 33.11. Trzycentymetrowe fale z małego nadajnika padają na równoramienny pryzmat z parafiny, o kącie łamiącym 90°. Współczynnik załamania parafiny jest dla tych częstości 33.11. Demonstracja przenikania fal wewnętrznie odbitych
33-6. CAŁKOWITE ODBICIE WEWNĘTRZNE 245 równy 1,50, tak że kąt graniczny wynosi 41°30'. Fala zostaje zatem całkowicie odbita od nachylonej pod kątem 45° ścianki i dociera do odbiornika A, tak jak zaznaczona na rys. 33.1 la. Jeżeli do pryzmatu przyłożyć drugi pryzmat z parafiny, tak jak to pokazano na części b) rysunku, to fala przechodzi na wprost przez parafinę i dociera do odbiornika B. Jeżeli pomiędzy oboma pryzmatami zostawić odstęp rzędu kilku centymetrów, tak jak na części c) rysunku, to wówczas wystąpią zarówno fala odbita, jak i fala prze- puszczona. Istnienie pola elektrycznego tuż poza podstawą pryzmatu na rys. 33.1 la można także pokazać ustawiając odbiornik B w odległości kilku centymetrów od po- wierzchni podstawy.
34 magnetyzm materii 34-1. Diamagnetyzm i paramagnetyzm W rozdziale tym chcielibyśmy omówić własności magnetyczne substancji materialnych. Taką substancją, która ma najbardziej uderzające własności magnetyczne, jest oczy- wiście żelazo. Podobne własności magnetyczne mają również pierwiastki nikiel, kobalt, oraz — w dostatecznie niskich temperaturach (poniżej 16° C) — gadolin, jak i niektóre szczególne stopy. Ten rodzaj magnetyzmu, nazywany ferromagnetyzmem, jest na tyle godny zainteresowania i na tyle skomplikowany, że omówimy go w oddzielnym rozdziale. Jednakże wszystkie zwykłe substancje wykazują pewne własności magnetyczne, chociaż w nieznacznym na ogół stopniu, typowe dla nich wielkości są bowiem tysiąć do miliona razy mniejsze od odpowiednich wielkości w materiałach magnetycznych. W tym rozdziale chcemy opisać tylko ten zwykły magnetyzm, tzn. magnetyzm substancji, które nie są ferromagnetykami. Istnieją dwa rodzaje tego „nieznacznego magnetyzmu”. Niektóre materiały są przy- ciągane przez pola magnetyczne, a inne są przez nie odpychane. W odróżnieniu od włas- ności materii w polu elektrycznym, które zawsze powoduje przyciąganie dielektryków, zachowanie się materii w polu magnetycznym jest scharakteryzowane przez dwa znaki. Można to łatwo zademonstrować za pomocą silnego elektromagnesu, którego jeden biegun jest zakończony ostro, a drugi płasko — tak jak to pokazano na rys. 34.1. Pole magne- tyczne jest znacznie silniejsze w pobliżu „ostrego” bieguna niż w pobliżu bieguna płaskiego. Jeżeli umocować na nici mały kawałek jakiejś substancji i zawiesić go pomiędzy biegunami, to ogólnie rzecz biorąc będzie nań działać pewna mała siła. Ta mała siła objawia się w nie- wielkim przesunięciu zawieszonej substancji przy włączeniu elektromagnesu. Ostry koniec magnesu przyciąga bardzo silnie kilka wymienionych przed chwilą substancji ferromagne-
34-1. DIAMAGNETYZM I PARAMAGNETYZM 247 tycznych; wszystkie zaś inne substancje doznają działania jakiejś bardzo słabej siły. Nie- które z nich są słabo przyciągane ku ostremu biegunowi, a niektóre są słabo odpychane. Zjawisko to najłatwiej dostrzec w przypadku małego walca z bizmutu, który jest wypychany z obszaru silnego pola. Substancje, które są w taki sposób odpychane, nazy- wamy diamagnetykami. Bizmut jest jedną z najsilniejszych substancji diamagnetycznych, ale nawet dla niego zjawisko diamagnetyzmu objawia się w nieznacznym stopniu. Efekt diamagnetyzmu jest zawsze bardzo słaby. Jeżeli pomiędzy biegunami zawiesić mały ka- wałek aluminium, to będzie nań działać pewna siła, ale w kierunku bieguna ostrego. Takie substancje jak aluminium nazywamy paramagnetykami. (W doświadczeniu tego typu po- jawiają się siły pochodzące od prądów wirowych, powstających przy włączaniu i wyłą- czaniu magnesu. Siły te mogą dać silne impulsy, dlatego też należy być ostrożnym i brać pod uwagę wychylenie wypadkowe, po „uspokojeniu się” wiszącego obiektu.) Chcemy teraz opisać pokrótce mechanizm obu tych zjawisk. Po pierwsze, w wielu substancjach atomy nie mają trwałych momentów magnetycznych, a raczej wszystkie momenty magnetyczne w każdym z atomów się równoważą, tak że wypadkowy moment magnetyczny atomu jest równy zeru. Wszystkie spiny elektronów i ruchy orbitalne dokład- nie się równoważą, tak że żaden atom nie ma średniego momentu magnetycznego. W takiej sytuacji, jeżeli włączy się pole magnetyczne, wewnątrz atomu zostają wytworzone przez indukcję niewielkie dodatkowe prądy. Zgodnie z regułą Lenza prądy tę będą miały taki kierunek, aby przeciwdziałać wzrostowi pola. A zatem wytworzone przez indukcję mo- menty magnetyczne atomów mają kierunek przeciwny do kierunku pola magnetycznego. Na tym właśnie polega mechanizm diamagnetyzmu. Są jednak też takie substancje, których atomy mają trwały moment magnetyczny — w których spiny elektronów i ruchy orbitalne dają pewien, różny od zera wypadkowy prąd. A zatem oprócz zjawiska diamagnetyzmu (które zawsze występuje) istnieje też możliwość, że poszczególne momenty magnetyczne atomów zostaną uporządkowane (tzn. ustawione w jednym kierunku) przez pole magnetyczne. W tym przypadku momenty magnetyczne starają się ustawić zgodnie z kierunkiem pola magnetycznego (podobnie jak trwałe dipole w dielektryku są uporządkowane przez pole elektryczne) i indukowany magnetyzm dąży do powiększenia pola magnetycznego. Jest to właśnie zjawisko paramagnetyzmu. Paramagnetyzm jest ogólnie dość słaby, bo siły porządkujące są stosunkowo małe w porównaniu z siłami pochodzą- cymi od ruchów cieplnych, które starają się to upo- rządkowanie zniszczyć. Wynika stąd również, że paramagnetyzm jest czuły na temperaturę. (Wyją- tek stanowi paramagnetyzm wynikły z obrotu wo- kół osi elektronów, odpowiedzialnych za przewo- dnictwo. Tego jednak zjawiska nie będziemy tutaj omawiać.) Dla zwykłego paramagnetyzmu zjawisko to jest tym silniejsze, im niższa jest temperatura. Uporządkowanie jest większe przy niskich tempe- 34.1. Mały walec z bizmutu jest słabo odpychany przez ostry nabiegunnik; kawałek aluminium jest przyciągany elektromagnesu
248 34. MAGNETYZM MATERII raturach, przy których dezorganizujący wpływ zderzeń jest mniejszy. Natomiast diamag- netyzm jest w mniejszym lub w większym stopniu niezależny od temperatury. W każdej substancji mającej „wbudowane” momenty magnetyczne zachodzi zarówno zjawisko diamagnetyczne, jak paramagnetyczne, ale dominuje zwykle to ostatnie. W rozdziale 11 (t. II, cz. 1) opisywaliśmy substancję ferroelektryczną, w której wszyst- kie dipole elektryczne zostają uporządkowane przez swe własne pola elektryczne. Można także sobie wyobrazić analogię magnetyczną zjawiska ferroelektryczności, w której wszyst- kie momenty magnetyczne atomów zostałyby uporządkowane i unieruchomione. leżeli- byśmy przeprowadzili obliczenia, w jakich warunkach powinno to zajść, przekonalibyśmy się, że ruchy cieplne powinny zniszczyć takie uporządkowanie nawet dla temperatur tak niskich jak temperatury kilku dziesiątych stopnia Kelvina, siły magnetyczne są bo- wiem znacznie słabsze od sił elektrycznych. Wydawałoby się więc rzeczą niemożliwą, aby w temperaturze pokojowej istniało jakieś trwałe uporządkowanie momentów magne- tycznych. Z drugiej strony, takie właśnie uporządkowanie zachodzi dla żelaza. Pomiędzy mo- mentami magnetycznymi różnych atomów żelaza działa pewna efektywna siła, która jest znacznie, znacznie większa od bezpośredniego oddziaływania magnetycznego. Jest to pewne zjawisko oddziaływania pośredniego, które można wytłumaczyć tylko na gruncie mecha- niki kwantowej. Oddziaływanie to jest około 10 000 razy silniejsze od bezpośredniego oddziaływania magnetycznego i ono to właśnie porządkuje momenty magnetyczne w sub- stancjach ferromagnetycznych. Ten specjalny rodzaj oddziaływania omówimy w jednym z następnych rozdziałów. Teraz, gdy już spróbowaliśmy podać jakościowy opis diamagnetyzmu i paramagne- tyzmu, musimy się poprawić i powiedzieć, że nie da się zrozumieć w uczciwy sposób zjawisk magnetycznych substancji z punktu widzenia fizyki klasycznej. Takie zjawiska magnetyczne należą do zjawisk w pełni kwantowomechanicznych. Można jednak przy pomocy pewnych dość naciąganych rozważań na gruncie fizyki klasycznej zrozumieć w pewnym stopniu, co się właściwie tu dzieje. Można by to tak sformułować: wolno nam się posługiwać pewnymi argumentami klasycznymi do wyciągania wniosków dotyczących zachowania się sub- stancji, ale argumenty takie w żadnym wypadku nie są „legalne”, bo w gruncie rzeczy wia- domo jest doskonale, że mechanika kwantowa leży u podstaw każdego z tych zjawisk magnetycznych. Z drugiej strony są takie sytuacje, np. w plazmie lub w jakimś obszarze przestrzeni z dużą liczbą elektronów swobodnych, gdzie elektrony rzeczywiście się stosują do praw mechaniki klasycznej. I dla takich okoliczności niektóre z twierdzeń klasycznego magnetyzmu są w dalszym ciągu słuszne. Argumenty klasyczne mają także pewną war- tość ze względów historycznych. Na początku, kiedy ludzie byli już w stanie snuć przy- puszczenia dotyczące znaczenia i zachowania się substancji magnetycznych, posługiwali się oni argumentami klasycznymi. A wreszcie, tak jak już to zademonstrowaliśmy, me- chanika klasyczna pozwala nam czasem się domyślać, co się dzieje — mimo że naprawdę uczciwy sposób przestudiowania zagadnienia polegałby na nauczeniu się najpierw mecha- niki kwantowej, a następnie na zrozumieniu magnetyzmu z jej punktu widzenia. Nie chcemy jednak czekać ze zrozumieniem tak prostego zjawiska jak diamagnetyzm do czasu przestudiowania, od deski do deski, mechaniki kwantowej. Będziemy musieli
34-1. DIAMAGNETYZM I PARAMAGNETYZM 249 się oprzeć na mechanice klasycznej, która będzie nam w pewnym stopniu ukazywać, co się dzieje, ale będziemy jednak musieli zdawać sobie sprawę, że nasze rozumowanie nie będzie w rzeczywistości poprawne. Dlatego też podamy szereg twierdzeń, dotyczących ma- gnetyzmu klasycznego, które wprawią nas w nie lada kłopot, bo będą dowodziły przeciw- stawnych sobie rzeczy. Każde z tych twierdzeń, z wyjątkiem ostatniego, będzie fałszywe. Co więcej, będą one wszystkie fałszywe, jeżeli chodzi o opis świata fizycznego, ponie- 'waż pominięto w nich prawa mechaniki kwantowej. 34-2. Momenty magnetyczne i moment pędu*> Oto pierwsze twierdzenie, które chcemy udowodnić na gruncie mechaniki klasycznej: jeżeli elektron porusza się po orbicie kołowej (jeżeli na przykład obiega jądro pod wpły- wem siły centralnej), to jego moment magnetyczny i moment pędu pozostają do siebie w pewnym określonym stosunku. Oznaczmy przez J moment pędu a przez p. moment magnetyczny elektronu na orbicie. Wartość bezwzględna momentu pędu jest równa ilo- czynowi masy elektronu, prędkości i promienia (patrz rys. 34.2). Moment pędu jest skiero- wany prostopadle do płaszczyzny orbity. J=mvr. (34.1) (Jest to oczywiście wzór nierelatywistyczny, ale jest on dobrym przybliżeniem dla atomów, ponieważ dla elektronów w atomach stosunek v/c jest zwykle rzędu e2/hc — czyli rzędu 1%.) Moment magnetyczny tej samej orbity jest równy iloczynowi natężenia prądu i pola powierzchni ograniczonej orbitą (patrz t. II, cz. 1, § 14-5). Prąd jest równy ładunkowi przepływającemu w jednostce czasu przez jakiś obrany punkt na orbicie; dokładniej zaś: iloczynowi ładunku q i częstości obiegu. Częstość jest równa prędkości podzielonej przez obwód orbity, tak więc ' v I=q Pole powierzchni wynosi rrr2, moment magnetyczny jest więc równy qvr = (34.2) i także skierowany prostopadle do płaszczyzny orbity. Wektory J i p mają zatem ten sam kierunek: q p. = J(ruchu orbitalnego). (34.3) 2m *’ Porównaj: Tom II, cz. 1, § 15-1 (Siły działające na pętlę z prądem, energia dipola). 34.2. Dla każdej orbity kołowej moment magnetyczny p wy- nosi ?/2m razy moment pędu J i.J \ ^\r 2****^* m,ą
250 34. MAGNETYZM MATERII Stosunek wektorów J i p nie zależy ani od prędkości, ani od promienia. Moment magne- tyczny każdej cząstki poruszającej się po orbicie kołowej jest równy q!2m razy moment pędu. Dla elektronu ładunek jest ujemny; można go oznaczyć — qe. Zatem dla elektronu u. =-----J(ruchu orbitalnego elektronu). (34.4) 2m Jest to właśnie to, czego powinniśmy się Spodziewać z klasycznego punktu widzenia i, dość niespodziewanie, jest to także prawdziwe z punktu widzenia mechaniki kwantowej. No cóż, czasem tak się właśnie zdarza. Gdyby się jednak trzymać fizyki klasycznej, to można by znaleźć także inne sytuacje, w których fizyka klasyczna daje odpowiedzi nie- prawdziwe, a usiłowanie zapamiętania, co jest prawdziwe, a co nieprawdziwe — to dość uciążliwa historia. Równie dobrze można by od razu podać, co jest ogólnie prawdziwe w mechanice kwantowej. Przede wszystkim, równanie (34.4) jest prawdziwe dla ruchu orbitalnego, ale ten ruch nie jest jedynym powodem istnienia magnetyzmu. Elektron doz- naje także obrotu wokół swej własnej osi (podobnie jak Ziemia, która się obraca wokół swej osi) i w wyniku tego obrotu elektron ma zarówno pewien moment pędu (zwany spi- nem), jak i pewien moment magnetyczny. Ale z czysto kwantowomechanicznych po- wodów — klasyczne wytłumaczenie nie istnieje — stosunek wektora p do wektora J dla obrotu elektronu wokół własnej osi jest dwa razy większy niż dla ruchu orbitalnego elek- tronu z momentem pędu równym J: ' qe (X ------J(obrotu elektronu wokół osi-spinu). (34.5) W każdym atomie znajduje się, mówiąc ogólnie, kilka elektronów i tworzy się tam pewna kombinacja obrotów orbitalnych i spinów, która daje całkowity moment pędu i całkowity moment magnetyczny. Chociaż nie ma na to żadnego uzasadnienia klasycz- nego, w mechanice kwantowej (dla odosobnionego atomu) zawsze zwrot momentu magne- tycznego jest dokładnie przeciwny do zwrotu momentu pędu. Stosunek tych dwóch wiel- kości nie musi być równy ani —qelm, ani —qJ2m, ale może przyjmować jakąś wartość pośrednią, ze względu na to, że całkowity moment pędu jest mieszaniną momentów pędu pochodzących od orbit i od spinów. Można napisać: (i = -g /Aj J (36.6) gdzie g jest czynnikiem charakterystycznym dla danego stanu atomu. Będzie on równy 1 dla czystego momentu orbitalnego lub 2 dla czystego momentu spinowego, albo też będzie on równy jakiejś liczbie mniejszej od 2, a większej od 1, dla jakiegoś układu złożonego, takiego jak atom. Wzór (34.6) oczywiście nie mówi nam zbyt wiele. Mówi on, że moment magnetyczny jest równoległy do momentu pędu, ale może mieć dowolną wartość bez- względną. Postać równania (34.6) jest jednak wygodna, bo g — nazywane „czynnikiem S Landego” — jest stałą bezwymiarową, której wartość jest rzędu jedności. Określenie czynnika g dla jakiegoś konkretnego stanu atomu jest jednym z zadań mechaniki kwan- towej.
34-2. MOMENTY MAGNETYCZNE I MOMENT PĘDU 251 Można by się też zainteresować tym, co się dzieje w jądrach. W jądrach mamy protony i neutrony, które mogą się poruszać dookoła po jakiejś orbicie, a jednocześnie mogą, podobnie jak elektron, mieć pewien wewnętrzny moment pędu — spin. I w tym przypadku moment magnetyczny jest równoległy do momentu pędu, tylko że teraz rząd wielkości stosunku |i do J jest taki, jakiego należałoby się spodziewać dla protonu poruszającego się po okręgu, z masą m w równaniu (34.3) równą masie protonu. Dlatego też dla jądra zwykle się pisze następującą zależność: p=4^)j' (m” gdzie mp jest masą protonu, ag — nazywane czynnikiem jądrowym g — jest liczbą bliską jedności, którą należy określić dla każdego jądra z osobna. Inną ważną różnicą pomiędzy jądrem a atomem jest to, że moment magnetyczny pro- tonu związany z jego spinem nie ma czynnika g równego 2, tak jak elektron. Dla protonu g = 2-(2,79). Okazuje się też, dość niespodziewanie, że neutron ma także moment magne- tyczny związany ze spinem, a stosunek jego momentu magnetycznego do jego momentu pędu wynosi 2-(—1,93). Innymi słowy, neutron nie jest w sensie magnetycznym całkiem „neutralny”. Wygląda on jak mały magnes i ma moment magnetyczny tego typu, jaki miałby obracający się ładunek ujemny. 34-3. Precesja atomowych momentów magnetycznych Jedną z konsekwencji faktu, że moment magnetyczny jest proporcjonalny do momentu pędu, jest precesja atomowych momentów magnetycznych w polu magnetycznym. Roz- ważmy najpierw to zjawisko z punktu widzenia fizyki klasycznej. Przypuśćmy, że mamy moment magnetyczny |i, zawieszony swobodnie w jednorodnym polu magnetycznym. Ten moment magnetyczny dozna działania momentu siły r równego jx X B, który stara się usta- wić moment magnetyczny p. zgodnie z kierunkiem pola. Ale atomowy moment magne- tyczny jest giroskopem — ma on moment pędu J. Dlatego też pochodzący od pola magne- tycznego moment siły nie ustawi momentu magnetycznego zgodnie z liniami sił pola. Zamiast tego, moment magnetyczny będzie wykonywał precesję, tak jak to widzieliśmy przy omawianiu giroskopu w rozdz. 20 tomu I (cz. 1). Moment pędu — a wraz z nim moment magnetyczny — wykonuje precesję wokół osi równoległej do pola magnetycznego. Pręd- kość tej precesji można znaleźć tą samą metodą, jaką posługiwaliśmy się w rozdz. 20 tomu I (cz. 1). Przypuśćmy, że w ciągu małej chwili At moment pędu się zmienia z J na J', tak jak to zilustrowano na rys. 34.3, tworząc przez cały czas ten sam kąt 0 z kierunkiem pola magne- tycznego B. Oznaczmy prędkość kątową precesji przez tak że w czasie At kąt precesji Wyniesie wpAt. Z. geometrii rysunku widać, że zmiana momentu pędu po czasie At wy- niesie A J = (J sin 0) (a>p A t).
252 34. MAGNETYZM MATERII 34.3. Obiekt mający moment pędu 3 i równoległy doń mo- ment magnetyczny p, umiesz- czany w polu magnetycznym B, wykonuje precesję z prędkością kątową <op a dla jądra A zatem zmiana momentu pędu w jednostce czasu jest równa — = copJsin0, (34.8) ćo musi się. równać momentowi siły: t = (iBsinO. (34.9) Prędkość kątowa precesji jest więc równa u = (34.10) Podstawiając /j,/J z równania (34.6) widzimy, że dla układu atomowego 9eS = -g-r—; 2m (34.11) częstość precesji jest proporcjonalna do pola B. Dobrze jest zapamiętać, że dla atomu (lub elektronu) fp = == (1,4 MHz/Gs)gR, (34.12) * 2rt • fp = = (0,76 KHz/Gs)gB. (34.13) (Różnica pomiędzy wzorami dla atomów i dla jąder wynika jedynie z różnicy w określeniu czynnika g dla tych dwóch przypadków.) A więc zgodnie z teorią klasyczną orbity elektronów i ich momenty pędu w atomie powinny w polu magnetycznym wykonywać precesję. A czy to jest także słuszne z punktu widzenia mechaniki kwantowej? W zasadzie tak, ale znaczenie „precesji” jest w tym przy- padku inne. W mechanice kwantowej nie można mówić o kierunku momentu pędu w tym samym sensie, jak to się mówi klasycznie, mimo to analogia jest bardzo ścisła — na tyle ścisła, że będziemy w dalszym ciągu używali terminu „precesja”. Pomówimy o tym jeszcze później, kiedy będziemy rozważać to zjawisko na gruncie mechaniki kwantowei. 34-4. Diamagnetyzm Z kolei z punktu widzenia fizyki klasycznej chcemy rozpatrzyć diamagnetyzm. Można to zrobić na wiele różnych sposobów. Podamy tu jeden z ładniejszych. Przypuśćmy, ^e w otoczeniu jakiegoś atomu powoh włączamy pole magnetyczne. Wraz ze zmianami tego pola magnetycznego powstaje na skutek indukcji magnetycznej pole elektryczne. Zgodnie
34-4 DIAMAGNETYZM 253 z prawem Faradaya całka krzywoliniowa z pola E wzdłuż dowolnej krzywej zamkniętej jest równa szybkości zmian strumienia magnetycznego przez tę krzywą. Przypuśćmy, że wybierzemy krzywą r, która jest okręgiem o promieniu r, współśrodkowym ze środkiem atomu, tak jak to pokazano na rys. 34.4. Średnia składowa styczna pola elektrycznego E wokół tej krzywej jest dana wzorem d , , EItzt -----— (Bitr2), at J czyli powstaje tu krążące pole elektryczne o natężeniu Powstałe w wyniku indukcji pole elektryczne działając na elektron w atomie wytwarza moment siły równy —qeEr, który musi się równać szybkości zmian momentu pędu dJ/dt: dJ qer2 dB dt 2 dt' (34.14) Całkując względem czasu od chwili, w której pole B było jeszcze równe zeru, znajdujemy, że zmiana momentu pędu, pochodząca od włączenia pola magnetycznego, jest równa qer2 ——B. 2 (34.15) Jest to dodatkowy moment pędu, pochodzący od momentu siły, jaki doznają elektrony przy włączeniu pola. Ten dodatkowy moment pędu wytwarza pewien dodatkowy moment magnetyczny, który ze względu na to, że jest to ruch orbitalny, jest równy po prostu iloczynowi czynnika —qJ2m i momentu pędu. Indukowany moment diamagnetyczny jest więc równy 4,-—te 2m 4m (34.16) Znak ujemny (który, jak łatwo sprawdzić, wynika z reguły Lenza) oznacza, że ten dodatkowy moment „przeciwstawia się” polu magnetycznemu. Chcielibyśmy przepisać równanie (34.16) w tro- chę innej postaci. Wielkość r2, która się pojawia w tym równaniu, jest kwadratem odległości od osi Przechodzącej przez atom równolegle do pola B, w przypadku więc gdy wektor B ma kierunek osi z, r2 = x2+y2. Jeżeli będziemy rozważać ato- my o symetrii kulistej (lub jeżeli weźmiemy śred- n*ą po atomach, których osie własne mają wszystkie możliwe kierunki), to średnia z wyraże- nia x2+y2 będzie równa j średniej kwadratu 34.4. Indukowane siły elektryczne dzia- łające na elektrony w atomie
254 34. MAGNETYZM MATErh rzeczywistej odległości radialnej od centrum atomu. Dlatego też zwykle wygodniej jest zapisywać równanie (34.16) w postaci o 2 ' zł/<=* — —<r2>ir2ł. ' (34.17) W każdym razie znaleźliśmy powstały na skutek indukcji moment magnetyczny atomu proporcjonalny do pola magnetycznego B i przeciwstawiający się temu polu. Na tym polega diamagnetyzm materii. To właśnie zjawisko magnetyczne jest odpowiedzialne za tę nie- wielką siłę, która działa na kawałek bizmutu w niejednorodnym polu magnetycznym. (Można by obliczyć tę siłę znajdując energię indukowanych w polu momentów magne- tycznych i obserwując, jak się ta energia zmienia przy wprowadzaniu próbki substancji do lub na zewnątrz obszaru pola o dużym natężeniu.) Pozostał nam jeszcze jeden problem: co to jest średni promień kwadratowy Mechanika klasyczna nie może dać na to odpowiedzi. Musimy się cofnąć i zacząć całe rozumowanie od początku, posługując się mechaniką kwantową. Nie można naprawdę powiedzieć, gdzie się znajduje elektron w atomie; można tylko podać prawdopodobień- stwo tego, że elektron będzie w pewnym miejscu. Jeżeli będziemy interpretować <r2>fr jako średni kwadrat odległości od środka dla tego rozkładu prawdopodobieństwa, to moment diamagnetyczny dany przez mechanikę kwantową będzie akurat taki sam, jak moment określony wzorem (34.17). To równanie określa oczywiście moment jednego elektronu. Całkowity moment magnetyczny jest określony przez sumę po wszystkich elek- tronach w atomie. Zadziwiającą rzeczą jest to, że rozważania klasyczne i mechanika kwantowa dają tę samą odpowiedź, chociaż — jak to zobaczymy — rozważania klasycz- ne, które prowadzą do równania (34.17), nie są w rzeczywistości w mechanice klasycznej słuszne. To samo zjawisko diamagnetyczne zachodzi nawet wtedy, gdy atom ma już jakiś trwały moment magnetyczny. Wówczas taki układ będzie w polu magnetycznym wyko- nywał precesję. Na skutek precesji atom uzyskuje jakąś dodatkową, niewielką prędkość kątową i ten powolny obrót daje pewien mały prąd, który stanowi poprawkę do mo- mentu magnetycznego. Jest to po prostu zjawisko diamagnetyczne, tyle tylko że przed- stawione w inny sposób. Ale w rzeczywistości nie musimy się o to już troszczyć, kiedy mówimy o paramagnetyzmie. Jeżeli najpierw obliczy się efekt diamagnetyczny, tak jak to tutaj zrobiliśmy, nie musi się wtedy troszczyć o to, że jest tam jeszcze pewien niewiel- ki dodatkowy prąd pochodzący od precesji. Zostało bowiem to już uwzględnione w rów- naniu w wyrazie określającym diamagnetyzm. 34-5. Twierdzenie Larmora Z naszych dotychczasowych wyników można już wyciągnąć pewne wnioski. Przede wszystkim, w teorii klasycznej moment magnetyczny p był zawsze proporcjonalny do momentu pędu J, z pewną stałą proporcjonalności określoną dla poszczególnego atomu- Nie było tu żadnego obrotu elektronów wokół osi (spinu) i stała proporcjonalności był3
34-5- twierdzenie larmora - ’ 255 zawsze równa — qj2m-, inaczej mówiąc, w równaniu (34.6) powinniśmy przyjąć g = 1. Stosunek wektorów |i do J był niezależny od ruchu wewnętrznego elektronów. Tak więc zgodnie z teorią klasyczną, wszystkie układy elektronów wykonywałyby precesję z tą samą prędkością kątową. (Nie jest to już prawdą w mechanice kwantowej.) Wynik ten jest związany z pewnym twierdzeniem mechaniki klasycznej, które chcielibyśmy teraz udowodnić. Przypuśćmy, że mamy grupę elektronów, które są wszystkie utrzymywane razem przez centralną siłę przyciągającą — tak jak w atomie, gdzie elektrony są przycią- gane przez jądro. Elektrony te będą także oddziaływać ze sobą i w ogólnym przypadku ich ruchy mogą być całkiem skomplikowane. Przypuśćmy, że znaleźliśmy te ruchy, gdy nie było pola magnetycznego i chcemy teraz wiedzieć, jakie będą te ruchy, gdy będzie istniało słabe pole magnetyczne. Twierdzenie mówi, że ruch w obecności słabego pola magnetycznego jest zawsze złożeniem jednego z rozwiązań dla ruchu bez pola i dodatko- wego obrotu wokół osi pola, z prędkością kątową = qeBj2m. (Jest ona taka sama jak częstość cop, jeżeli g — 1.) Oczywiście, takich ruchów może być wiele. Rzecz w tym, że każdemu ruchowi bez pola magnetycznego odpowiada ruch w polu, który jest złożeniem ruchu pierwotnego i pewnego jednostajnego obrotu. Twierdzenie to nazywamy twierdze- niem Larmora, a wL nazywamy częstością Larmora. Chcielibyśmy pokazać, jak można to twierdzenie udowodnić, ale szczegóły dowodu pozostawimy już czytelnikowi. Weźmy najpierw jeden elektron w polu dowolnej siły centralnej. Niech siła ta będzie po prostu równa F(r) i niech będzie skierowana ku jakie- muś centrum. Jeżeli teraz włączymy jednorodne pole magnetyczne, to wystąpi pewna dodatkowa siła równa <?vxB. A zatem całkowita siła będzie równa F(r)+ęvxB. (34.18) Popatrzmy teraz na ten sam układ fizyczny z układu współrzędnych obracającego się z prędkością kątową m wokół osi przechodzącej przez „centrum” siły i równoległej do pola ii. Nic jest to już układ inercjalny, musimy więc wprowadzić odpowiednie siły po- zorne — siłę odśrodkową i siłę Coriolisa, o których mówiliśmy w rozdz. 19 tomu I (cz. 1). Stwierdziliśmy tam, że w układzie obracającym się z prędkością kątową co występuje pewna pozorna siła styczna, proporcjonalna do vr, składowej radialnej prędkości, równa Etyczna = 2wC0Vf. (34.19) Ponadto występuje tu też pewna pozorna siła radialna, która jest dana przez Fr = mco2r-2mcovstyczna, (34.20) gdzie vstyczna jest składową styczną prędkości, mierzoną w obracającym się układzie od- niesienia. (Składowa radialna vr jest taka sama w obracającym się, jak i w inercjalnym układzie odniesienia.) Dla dostatecznie małych prędkości kątowych (tzn. jeżeli cor < fsty(;ziia) można po- minąć pierwszy wyraz (siłę odśrodkową) w równaniu (34.20) w porównaniu z drugim wyrazem (siłą Coriolisa). Wówczas równania (34.19) i (34.20) można wspólnie zapisać jako ’. »' F = (2mwxv). (34.21)
256 34. MAGNETYZM MATERII Jeżeli teraz złożymy obrót z polem magnetycznym, to do siły w równaniu (34.18) należy dodać siłę z równania (34.21). Całkowitą siłą jest więc F(r)+?vxB-2mvxw (34.22) [Zmiana kolejności czynników iloczynu wektorowego z równania (34.21) daje ujemny znak ostatniego wyrazu w równaniu (34.22).] Jeżeli się przyjrzeć naszemu wynikowi, widać, że jeżeli 2mw = 4-ęB, to dwa ostatnie wyrazy w równaniu (34.22) się znoszą i jedyną siłą, działającą w poru- szającym się układzie, jest F(r). Ruch elektronu w układzie obracającym się jest więc do- kładnie taki sam, jak ruch, gdy brak pola — ale, oczywiście, w układzie się nie obraca- jącym. Udowodniliśmy tym samym twierdzenie Larmora dla jednego elektronu. Ponie- waż dowód zakłada, że prędkość kątową co jest mała, oznacza to także, że twierdzenie jest prawdziwe tylko dla słabych pól magnetycznych. Czytelnika moglibyśmy prosić tylko o jedno „ulepszenie” — udowodnienie tego samego twierdzenia dla przypadku wielu elektronów oddziałujących wzajemnie między sobą i znajdujących się ponadto w tym samym polu centralnym. A zatem bez względu na to, jak złożony będzie atom, twierdzenie Larmora będzie słuszne, jeżeli tylko w tym atomie występują siły centralne. Ale w tym miejscu kończą się już wnioski z mechaniki klasycznej, gdyż w rzeczywistości nie jest prawdą, że ruchy polegają na takiej właśnie precesji. Częstość precesji a>p z równa- nia (34.11) jest mianowicie równa częstości a>L tylko wtedy, gdy g jest równe 1. 34-6. Fizyka klasyczna nie daje ani diamagnetyzmu, ani paramagnetyzmu Chcielibyśmy teraz wykazać, że według mechaniki klasycznej nie może istnieć wcale ani diamagnetyzm, ani paramagnetyzm. Brzmi to idiotycznie — najpierw udowodniliśmy istnienie paramagnetyzmu, diamagnetyzmu, orbit dokonujących precesji i tak dalej, a teraz zabieramy się do udowodnienia, że to wszystko nieprawda. A tak! Mamy zamiar udowodnić, że jeżeli będzie się śledzić wnioski wynikające z mechaniki klasycznej dosta- tecznie daleko, to się okaże, że takie zjawiska jak diamagnetyzm i paramagnetyzm nie istnieją, że one się wszystkie wzajemnie znoszą. Jeżeli rozpocząć rozumowanie klasyczne w pewnym miejscu i nie zajść z tym rozumowaniem zbyt daleko, to można dostać każdą odpowiedź, jaką się zechce. Ale jedyny poprawny i słuszny dowód wykazuje, że żadne zjawiska magnetyczne nie istnieją. Z mechaniki klasycznej wynika, że jeżeli mamy jakiś układ fizyczny — gaz elektro- nów, protonów lub czegokolwiek bądź — umieszczony w pudle tak, że cńły ten układ nie może się obracać, to nie wystąpią żadne zjawiska magnetyczne. Zjawiska magnetyczne mogą wystąpić wówczas, gdy się ma do czynienia z jakimś układem odosobnionym, takim jak na przykład gwiazda utrzymująca się sama w całości, który może zacząć si?
4-6. FIZYKA KLASYCZNA A DIAMAGNETYZM I PARAMAGNETYZM 257 obracać, jeżeli włączyć pole magnetyczne. Ale jeżeli mamy próbkę substancji tak trzy- maną w jednym miejscu, że nie może się ona zacząć obracać wokół osi, to wówczas nie wystąpią żadne zjawiska magnetyczne. To, co rozumiemy przez wstrzymywanie obrotu, można by streścić w taki oto sposób: zakładamy, że w danej temperaturze jest tylko je- den stan równowagi cieplnej. Twierdzenie, które możemy wtedy wykazać, głosi, że jeżeli włączy się pole magnetyczne i odczeka, aż układ wróci do stanu równowagi cieplnej to nie powinno się stwierdzić żadnego diamagnetyzmu ani paramagnetyzmu — nie może bowiem wtedy powstać indukowany moment magnetyczny. Dowód: zgodnie z mecha- niką statystyczną prawdopodobieństwo, że układ przyjmie jakiś stan ruchu, jest propor- cjonalne do e- u,kT, gdzie U jest energią tego ruchu. No dobrze, a czym jest teraz ta ener- gia ruchu? Dla cząstki, która się porusza w stałym polu magnetycznym, energia jest sumą zwykłej energii potencjalnej i energii kinetycznej my2/2, bez żadnych „dodatków” od pola magnetycznego. [Wiemy już, że siły od pól elektromagnetycznych są równe #(E-|-v xB) i że moc F v jest równa po prostu ęE-v, a więc moc, czyli zmiana energii w jednostce czasu, nie zależy od pola magnetycznego.] Zatem energia jakiegoś układu, niezależnie od tego czy pole magnetyczne występuje, czy też nie, jest zawsze określona przez sumę energii kinetycznej i energii potencjalnej. Ponieważ prawdopodobieństwo każdego ruchu zależy tylko od energii, tzn. od prędkości i od położenia, jest ono takie samo — bez względu na to, czy jest pole magnetyczne, czy też go nie ma. Dlatego też pole magnetyczne nie ma wpływu na stan równowagi cieplnej. Jeżeli pewien układ umieś- cimy w jakimś pudle, a inny taki sam układ w innym pudle, ale tym razem w polu ma- gnetycznym, to prawdopodobieństwo znalezienia jakiejś określonej prędkości w pewnym punkcie w pierwszym pudle będzie takie samo jak w drugim. Jeżeli w pierwszym pudle nie będzie, średniej wartości krążącego prądu (który nie powinien wystąpić, jeżeli układ jest w równowadze ze ściankami pozostającymi w spoczynku), to nie będzie tam też śred- niego momentu magnetycznego. Ponieważ w drugim pudle wszystkie ruchy są takie same jak w pierwszym, to tam także nie będzie średniego momentu magnetycznego. Wynika stąd — według mechaniki klasycznej — że jeżeli temperatura jest stała i równowaga ciepl- na zostaje przywrócona po włączeniu pola, to nie może istnieć moment magnetyczny indukowany przez to pole. Zadowalające zrozumienie zjawisk magnetycznych można jedynie otrzymać na gruncie mechaniki kwantowej. Niestety, nie możemy założyć, że czytelnik posiada dokładną znajomość mechaniki kwantowej i dlatego nie jest to zbyt szczęśliwy moment na rozważanie tej sprawy. Z dru- giej strony, nie musimy zawsze się czegoś uczyć zaczynając od poznania dokładnych praw, a kończąc na umiejętności stosowania tych praw w różnych przypadkach. Prawie każde zagadnienie, którym zajmowaliśmy się w tych wykładach, było potraktowane w sposób odrębny. W przypadku elektryczności zapisaliśmy na „stronicy pierwszej” równania Max- wella, a następnie wywiedliśmy z nich wszystkie ich konsekwencje. Jest to jeden ze sposo- bów. Ale teraz nie będziemy próbować zaczynać nowej „stronicy pierwszej” od wypisania równań mechaniki kwantowej i wyprowadzenia wszystkich wniosków z tych równań. Będziemy po prostu musieli podać pewne konsekwencje mechaniki kwantowej, zanim Poznamy źródło ich pochodzenia. No to zaczynamy. 17 — Wykłady z fizyki
258 34. MAGNETYZM MAtErij 34-7. Moment pędu w mechanice kwantowej Podaliśmy już zależność występującą pomiędzy momentem magnetycznym, a mo- mentem pędu. Pięknie. Ale co oznaczają pojęcia moment magnetyczny i moment pędu w mechanice kwantowej? Okazuje się, że w mechanice kwantowej najlepiej definiować takie pojęcia jak momenty magnetyczne przy pomocy innych pojęć, np. energii, po to aby mieć pewność, że każdy będzie wiedział, o co chodzi. Otóż, łatwo można zdefinio- wać moment magnetyczny przy pomocy energii, gdyż energia momentu magnetycznego w polu magnetycznym jest równa w teorii klasycznej—|i • B. Dlatego też w mechanice kwan- towej przyjmuje się następującą definicję momentu magnetycznego: jeżeli obliczy się energię jakiegoś układu w polu magnetycznym i się stwierdzi, że jest ona proporcjonalna do natężenia pola (dla słabych pól), to współczynnik tej proporcjonalności nazywa się składową momentu magnetycznego w kierunku pola. (Nie musimy się stawać aż tak ele- ganccy w tym, co teraz będziemy robić; możemy w dalszym ciągu myśleć o momencie magnetycznym w zwykłym, klasycznym do pewnego stopnia sensie.) Chcielibyśmy omówić teraz pojęcie momentu pędu w mechanice kwantowej lub ra- czej omówić sposób opisu tego, co się w mechanice kwantowej nazywa momentem pędu. Rzecz w tym, że jeżeli się przechodzi do praw nowego typu, to nie można po prostu za- łożyć, że każde słowo będzie oznaczało dokładnie to samo co dawniej. Można by na przykład pomyśleć: „Och wiadomo przecież, co to jest moment pędu! Jest to ta wielkość, która się zmienia pod wpływem momentu sił”. No, dobrze, ale co to jest moment sił? W mechanice kwantowej musi się mieć nowe definicje starych wielkości. Dlatego też for- malnie najlepiej byłoby nazwać moment pędu jakoś inaczej, np. „kwantomomentem pędu” lub czymś w tym rodzaju, bo jest on tu pojęciem definiowanym w oparciu o me- chanikę kwantową. Ale jeżeli potrafimy znaleźć w mechanice kwantowej wielkość, która jest identyczna z naszym starym pojęciem momentu pędu w przypadku, gdy dany układ staje się wystarczająco duży, to nie ma potrzeby na wyszukiwanie nowej nazwy i równie dobrze można pozostawić starą nazwę — moment pędu. Przy takim podejściu do sprawy to dziwne pojęcie, do którego opisu się właśnie zabieramy, jest momentem pędu. Jest to ta sama wielkość, którą w jakimś dużym układzie uznajemy za moment pędu mechaniki klasycznej. Na początek weźmy pod uwagę układ, w którym moment pędu jest zachowany — taki np. układ, jak atom, znajdujący się samotnie w pustej przestrzeni. Otóż tego rodzaju obiekt (podobny do Ziemi wirującej wokół swej osi) mógłby się w zwykłym sensie obra- cać wokół każdej osi, jaką ktoś zechciałby sobie wybrać. A dla danego z góry spinu mo- głoby tam istnieć wiele różnych „stanów”, wszystkich o tej samej energii, z których każdy odpowiadałby jakiemuś szczególnemu kierunkowi osi momentu pędu. A zatem w teorii klasycznej dla danej wartości bezwzględnej momentu pędu istnieje nieskończona liczba możliwych stanów, wszystkich o tej samej energii. Okazuje się jednak, że w mechanice kwantowej dzieje się kilka dziwnych rzeczy. P° pierwsze, liczba stanów, w jakich może istnieć taki układ, jest ograniczona do liczby skończonej. Jeżeli układ jest mały, to ta skończona liczba jest bardzo mała, jeżeli zaś
34-7. MOMENT PĘDU W MECHANICE KWANTOWEJ 259 układ jest duży, to ta skończona liczba staje się bardzo, bardzo duża. Po drugie, nie można opisywać „stanu” przez podanie kierunku jego momentu pędu, ale można tylko podać składową momentu pędu wzdłuż jednego kierunku, np. wzdłuż kierunku z. Z punktu widzenia fizyki klasycznej, obiekt o danym całkowitym momencie pędu J mógłby mieć dla swojej składowej z-owej każdą z wartości od Ą-J do — J. Ale w mechanice kwantowej składowa z-owa momentu pędu może przybierać tylko pewne dyskretne wartości. Każdy dany układ — jakiś atom lub jądro, lub cokolwiek — o danej z góry energii, ma pewną liczbę charakterystyczną, j, a jego składowa w kierunku osi z momentu pędu może mieć tylko jedną z następującego zbioru wartości: jh, (j-2)h, ! ., , (34.23) < ’ ’ —(/—2)fi, -(j-l)fi, -jłl. Największa składowa z-owa jest równa j razy fi; następna po niej jest mniejsza o jedną jednostkę fi i tak dalej „w dół”, aż do —jh. Liczbę j nazywamy „spinem układu”. (Nie- którzy nazywają ją „liczbą kwantową całkowitego momentu pędu”, ale my będziemy ją nazywać „spinem”.)* *’ Można by się zaniepokoić, że to, o czym teraz mówimy, mogłoby być prawdziwe tylko dla pewnej „specjalnej” osi z. Ale tak nie jest. Dla układu, którego spin jest równy j, składowa momentu pędu wzdłuż dowolnej osi może mieć tylko jedną z wartości (34.23). Chociaż jest to zupełnie tajemnicze, musimy poprosić czytelnika, aby się po prostu z tym faktem na chwilę pogodził. Powrócimy jeszcze do tego zagadnienia i omówimy je później. Być może, że przynajmniej to zadowoli czytelnika, iż składowa z-owa zmienia się od pew- nej liczby do tej samej liczby ujemnej i nie musimy przynajmniej decydować, jaki jest dodatni zwrot osi z. (Z pewnością gdybyśmy powiedzieli, że składowa z-owa przebiega od +j do jakiejś innej wartości ujemnej, to cała sprawa stałaby się już absolutnie tajem- nicza, ponieważ nie dałoby się wtedy określić osi z, mającej zwrot przeciwny względem osi pierwotnej.) Jeżeh składowa z-owa momentu pędu musi przechodzić od do —j poprzez wiel- kości różniące się między sobą o całkowitą wielokrotność fi, to mogłoby się wydawać, że j musi być liczbą całkowitą. Tymczasem tak, nie jest! To tylko „podwojone” j musi być liczbą całkowitą, gdyż różnica pomiędzy +j a —j jest liczbą całkowitą. A zatem, ł) Należy pamiętać, ze w tym przypadku „spin” będzie oznaczał całkowity moment pędu układu, * więc — ogólnie biorąc — może się on składać z całkowitego orbitalne go momentu pędu i z całkowitego wewnętrznego momentu pędu, czyli spinu w ogólnie przyjętym znaczeniu. (Przyp. tłum.).
260 34. MAGNETYZM MATERij w ogólnym przypadku, spin j jest albo liczbą całkowitą, albo liczbą połówkową (wielo- krotnością i) w zależności od tego, czy 2j jest liczbą parzystą czy nieparzystą. Weżmy na przykład takie jądro jak lit, którego spin wynosi j = Wówczas moment pędu względem osi z, w jednostkach h, może mieć jedną z następujących wartości: +ł, +i, ~i, -ł- Jeżeli jądro znajduje się w pustej przestrzeni, bez pól zewnętrznych, to może się ono zna- leźć w jednym z czterech stanów, z których każdy ma tę samą energię. Jeżeli mamy układ o spinie dwa, to składowa z-owa momentu pędu ma tylko wartości (w jednostkach K) 2, 1, 0, -1, —2. Jeżeli policzyć, ile jest stanów dla jakiegoś danego z góry spinu j, to się okaże, że istnieje (2j+1) możliwości. Innymi słowy, jeżeli podać energię a także i spin j, to się okaże, że istnieje dokładnie (2j+1) stanów o tej energii, a każdy z tych stanów odpowiada różnym możliwym wartościom składowej z-owej momentu pędu. Chcielibyśmy tu zwrócić uwagę na jeszcze jeden fakt. Jeżeli wybrać na chybił trafił jakiś atom o znanym j i zmierzyć z-ową składową momentu pędu, to wówczas można dostać każdą z możliwych wartości i każda z tych wartości jest równie prawdopodobna. Wszystkie te stany są w rzeczywistości stanami pojedynczymi i żaden z nich nie jest gor- szy od drugiego. Każdy z tych stanów występuje w przyrodzie z taką samą „wagą”. (Za- kłada się, że nie uczyniono nic, aby ograniczyć się do jakichś szczególnych „próbek”.) Ten fakt ma, przypadkowo, pewną prostą analogię klasyczną. Jeżeli zadać to samo pytanie z klasycznego punktu widzenia: jakie jest prawdopodobieństwo dostania pewnej szczegól- nej wartości składowej z-owej momentu pędu, przy losowaniu z jakiegoś typowego zbioru układów fizycznych, wszystkich o tym samym momencie pędu? — to odpowiedzią na nie będzie, że wszystkie te wartości, od największej do najmniejszej, są równie prawdopo- dobne. (Każdy może to łatwo udowodnić.) Wynik klasyczny odpowiada w mechanice kwantowej jednakowemu prawdopodobieństwu każdej z (27+1) możliwości. Z tego, co dotąd już otrzymaliśmy, można wysnuć jeszcze jeden ciekawy i nieco nie- spodziewany wniosek. W pewnych obliczeniach klasycznych wielkość, która się pojawia w końcowym wyniku, jest kwadratem momentu pędu J — jest, innymi słowy, równa J'J. Okazuje się, że często można odgadnąć wzór, poprawny z punktu widzenia mechaniki kwantowej, korzystając z obliczeń klasycznych i posługując się taką oto prostą regułą: Aby otrzymać wzór kwantowy, należy zastąpić J2 =J J we wzorze klasycznym przez 7(j+l)S. Reguła ta jest powszechnie stosowana i zwykle daje poprawne wyniki, ale nie zawsze. Można podać następujące rozumowanie, które pokazuje, dlaczego można regułę tę darzyć zaufaniem. Iloczyn skalamy J-J można zapisać jako > J-3=J2+J2+J2. Ponieważ wyrażenie to jest skalarem, będzie ono takie samo dla dowolnej orientacji spinu. Jeżeli wybierzemy na chybił trafił „próbki” jakichś danych z góry układów atomo- wych i dokonamy pomiarów wielkości J2 lub J2, lub J2, to powinniśmy otrzymać takie
34-7. moment pędu w mechanice kwantowej 261 same wartości średnie dla każdej z tych trzech składowych. (Pomiędzy tymi trzema kie- runkami — x, y i z — nie ma żadnego specjalnego rozróżnienia.) Dlatego też średnia z iloczynu J J jest równa potrójnej wartości podniesionej do kwadratu średniej dowol- nej ze składowych, np. J2Z\ <J-J>śr = 3<J2>. Ponieważ zaś iloczyn J-J jest taki sam dla wszystkich kierunków, to jego średnia jest oczywiście równa tej jego stałej wartości; mamy więc J- J = 3<J2\. (34.24) Jeżeli teraz z kolei użyjemy tego samego równania w odniesieniu do mechaniki kwan- towej, to łatwo można znaleźć <$/2>śr. Należy tylko wziąć sumę (2y'+l) możliwych war- tości J2 i podzielić ją przez całkowitą liczbę tych wartości: <Ą2)śr = — hz. • (34.25) Dla układu o spinie | wygląda to tak: Dochodzimy zatem do wniosku, że J-J = 3<J2)śr = 3Ś&2 = ł(W)A2. Pozostawiamy czytelnikowi wykazanie, że równanie (34.25), wraz z równaniem (34.24),_ daje wynik ogólny J-J=;(;+1)A2. (34.26) Chociaż z punktu widzenia fizyki klasycznej można by się spodziewać, że największą możliwą wartością składowej z-owej wektora J jest po prostu jego wartość bezwzględna J, a mianowicie V J-J, to mechanika kwantowa daje największą wartość składowej J2 nieco mniejszą, ponieważ jh jest zawsze mniejsze od Vj(j+l)h. Moment pędu nigdy nie jest ..całkowicie skierowany wzdłuż kierunku z”. - j 34-8. Energia magnetyczna atomów Chcemy teraz znowu powrócić do momentu magnetycznego. Powiedzieliśmy, że w me- chanice kwantowej moment magnetyczny ustalonego układu atomowego można wyrazić przez moment pędu przy pomocy równania (34.6): (q \ J, - - (34.27) 2/n ' < c - .<r 'r. , gdzie — qt i m są ładunkiem i masą elektronu.
1 262 34. MAGNETYZM MATERij 34.5. Możliwe energie magnetyczne układu ato- mowego o spinie -, umieszczonego w polu magne- tycznym 34 -6. Dwa możliwe stany energetyczne elektronu -w polu magnetycznym B Moment magnetyczny atomu umiesz- czonego w zewnętrznym polu magne- tycznym będzie miał pewną dodatkową energię magnetyczną, która zależy od skła- dowej tego momentu magnetycznego wzdłuż kierunku pola. Wiemy, że Umlli = -P-B. (34.28) Obierając naszą oś z wzdłuż kierunku B mamy (34.29) Korzystając zaś z równania (34.27) otrzy- mujemy \£m / Z praw mechaniki kwantowej wynika, że może przyjmować tylko pewne war- tości: 1)S,..., —jh. Dlatego też energia magnetyczna jakiegoś układu ato- mowego nie może być dowolna; może ona mieć tylko pewne wartości. Jej naj- większa wartość wynosi na przykład Wielkość qth]2m nosi zwykle nazwę „magnetonu Bohra” i oznacza się ją jUB: 2m' Możliwymi wartościami energii magnetycznej są wartości: J, ^mag + » n gdzie JJh może być tylko równe: j, (J— 1), (J—2).(—j+1), —j. Innymi słowy, energia magnetyczna układu atomowego zmienia się, jeżeli układ ten wprowadzić do pola magnetycznego, o wielkość, która jest proporcjonalna do pola i pro- porcjonalna do Jx. Mówimy, że energia układu atomowego jest przez pole magnetyczne „rozszczepiona na 2j+l poziomów”. Tak na przykład atom, którego energia „na ze- wnątrz” pola magnetycznego wynosi Uo i którego spin j = f, będzie miał, po umieszcze- niu go w polu, cztery możliwe wartości energii. Energie te można przedstawić za pomocą
34-8. ENERGIA MAGNETYCZNA ATOMÓW 263 wykresu poziomów energii — takiego jak na rys. 34.5. Każdy poszczególny atom (z j = = |) może mieć tylko jedną z tych czterech możliwych energii w jakimś danym polu B. Oto, co mówi o zachowaniu się układu atomowego w polu magnetycznym mechanika kwantowa. Najprostszym układem „atomowym” jest pojedynczy elektron. Elektron ma spin |, a więc istnieją dla niego dwa możliwe stany: Jz = h/2 i Jz = Dla elektronu w spo- czynku (brak ruchu orbitalnego) moment magnetyczny pochodzący od spinu ma wartość g równą 2, tak że energia magnetyczna może być równa ±pBB. Energie, które może mieć elektron w polu magnetycznym, przedstawiono na rys. 34.6. Krótko mówiąc, elektron ma spin skierowany albo „w górę” (wzdłuż pola) lub „w dół” (przeciwnie do pola). Dla układów o większych spinach mamy więcej możliwych stanów. Można sobie wyobrażać, że spin jest skierowany „w górę” lub „w dół” albo też ustawiony pod pew- nym „kątem”, w zależności od wartości Jz. W następnym rozdziale posłużymy się tymi wynikami mechaniki kwantowej do omó- wienia magnetycznych własności substancji.
35 paramagnetyzm i rezonans magnetyczny 35-1. Skwantowane stany magnetyczne W poprzednim rozdziale opisaliśmy, jak to w mechanice kwantowej moment pędu jakiegoś obiektu nie ma dowolnego kierunku, a jego składowa wzdłuż danej osi może przyjmować tylko pewne wartości dyskretne, pomiędzy którymi różnica jest stała. Jest to fakt osobliwy i zadziwiający. Można by pomyśleć, że nie powinniśmy się za- głębiać w te sprawy, dopóki nasze umysły nie staną się bardziej „elastyczne” i gotowe na przyjęcie tego typu koncepcji. Faktem jednak jest, że nasze umysły nigdy się nie staną bardziej „elastyczne” — w sensie zdolności do przyjęcia łatwo takiej koncepcji. Nie ma takiego sposobu opisu, który byłby zarazem subtelny i zaawansowany w swej własnej formie, a nie byłby w istocie bardziej skomplikowany niż sam przedmiot, który próbujemy wyjaśnić. Zachowanie się materii w mikroświecie — jak już to wielokrotnie zaznaczaliśmy — różni się od wszystkiego, do czego jesteśmy przyzwyczajeni i jest rze- czywiście bardzo dziwne. Chociaż w dalszym ciągu będziemy mieć do czynienia z fizyką klasyczną, to warto próbować stopniowo się zaznajamiać z prawami fizyki w mikroświe- cie — traktując to początkowo jako pewien typ doświadczenia, bez jakiegoś głębszego zrozumienia. Zrozumienie tych spraw przychodzi bardzo powoli — jeżeli w ogóle jest możliwe. Oczywiście, powoli zaczynamy coraz lepiej poznawać to, co się dzieje w jakiejś sytuacji kwantowomechanicznej — jeżeli na tym ma polegać zrozumienie — ale wciąż nie trafia nam całkiem do przekonania to, że prawa mechaniki kwantowej są „naturalne" • One oczywiście są naturalne, ale nie z punktu widzenia naszego bezpośredniego, codzien- nego doświadczenia. Powinniśmy wyjaśnić, że nasze podejście do prawa dotyczącego momentu pędu będzie zupełnie różne od naszej postawy wobec wielu omawianych przez nas spraw. Nie będziemy próbowali go „wytłumaczyć”, ale musimy przynajmniej po^'^ dzieć, co się tu dzieje; byłoby rzeczą nieuczciwą opisywać własności magnetyczne sub-
35-1. SKWANTOWANE STANY MAGNETYCZNE 265 stancji materialnych nie wspominając o tym, że klasyczny opis magnetyzmu, tzn. mo- mentu pędu i momentów magnetycznych — nie jest poprawny. Jednym z najbardziej uderzających i niepokojących wniosków mechaniki kwantowej jest to, że moment pędu wzdłuż dowolnej osi jest zawsze równy liczbie całkowitej lub połówkowej, pomnożonej przez h. I nie jest to kwestią wyboru osi. Subtelności za- warte w tym dziwacznym fakcie—iż można wziąć każdą inną oś i zawsze okaże się, że składowa momentu pędu dla tej nowej osi może znowu przybierać tylko jedną z tego samego zbioru wartości—pozostawimy do następnego rozdziału, gdzie czeka nas radość z zobaczenia, jak ten pozorny paradoks zostaje ostatecznie rozwikłany. Teraz po prostu pogodzimy się z tym faktem, że dla każdego układu atomowego istnie- je pewna liczba j, nazywana spinem układu, która musi być liczbą całkowitą lub połów- kową i że składowa momentu pędu wzdłuż dowolnej osi będzie zawsze miała jedną spo- śród następujących wartości, leżących pomiędzy +jJl a —jJl: Jz — jednej spośród wartości (35.1) Wspomnieliśmy również, że każdy prosty układ atomowy ma moment magnetyczny, którego kierunek jest identyczny z kierunkiem jego momentu pędu. Jest to słuszne nie tylko dla atomów i jąder, lecz także dla cząstek elementarnych. Każda cząstka elementar- na ma swoją własną, charakterystyczną wartość j i swój moment magnetyczny. (Dla nie- których cząstek obie te wielkości są równe zeru.) Mówiąc „moment magnetyczny” mamy przy tym na myśli, że energię jakiegoś układu w polu magnetycznym, mającym na przy- kład kierunek osi z, można zapisać jako —pzB dla małych pól magnetycznych. Warunek, że pole nie może być zbyt wielkie, jest tu konieczny — w przeciwnym bowiem wypadku pole mogłoby zakłócić ruchy wewnętrzne układu i energia nie byłaby już miarą momentu magnetycznego, który istniał przed włączeniem pola. A jeżeli pole jest dostatecznie słabe, zmienia ono energię o wielkość AU =—p,zB, (35.2) przy czym rozumie się, że /zz w tym równaniu należy zastąpić wielkością / q \ ^==^\2^)‘/z’ • •' (35J) gdzie Jz przyjmuje jedną z wartości z równania (35.1). Przypuśćmy, że mamy dany układ o spinie j = |. Bez pola magnetycznego układ ten Ma cztery możliwe stany, odpowiadające różnym wartościom składowej momentu pędu 4> z których wszystkie mają dokładnie tę samą energię. Ale w chwili, gdy włączymy pole Magnetyczne, powstaje dodatkowa energia oddziaływania, która rozdziela te stany na
266 35. PARAMAGNETYZM I REZONANS MAGNETYCZNY 35.1. Układ atomowy o spinie J ma (2/4-1) możliwych energii w polu ma- gnetycznym B. Rozszczepienie pozio- mów energetycznych jest, dla małych pól, proporcjonalne do pola B cztery, nieco różniące się między sobą poziomy energetyczne. Energie tych poziomów są równe pewnej energii proporcjonalnej do J3, pomnożonej przez H razy f| — wartości składowej momentu pędu Jz. Na wykresach (rys. 35.1) poka- zano rozszczepienie poziomów energetycznych dla układów atomowych o spinach |, 1 i f. (Na- leży pamiętać, że dla każdego upórządkowania elektronów moment magnetyczny ma zawsze zwrot przeciwny do zwrotu momentu pędu.) Na wykresach można zauważyć, że „środek ciężkości” poziomów energetycznych jest taki sam w obecności pola magnetycznego, jak i bez niego. Zauważmy także, że odstępy pomiędzy posz- czególnymi poziomami są zawsze równe dla danej cząstki znajdującej się w jakimś danym z góry polu magnetycznym. Taki odstęp energetyczny będziemy, dla danego pola magnetycznego 5, zapisywać jako Rwp, przy czym ta postać zapisu będzie już definicją częstości <ap. Korzystając z równań (35.2) i (35.3) mamy a = g^—HB, 2m czyli <»P = g~B. (35.4) 2m Wielkość g(q/2m) jest po prostu stosunkiem momentu magnetycznego do momentu pędu — i stanowi ona własność cząstki. Równanie (35.4) jest tym samym wzorem, jaki otrzymaliśmy w rozdz. 34 na prędkość kątową precesji w polu magnetycznym dla giroskopu, którego moment pędu był równy J, a którego moment magnetyczny wynosił fi. 35-2. Doświadczenie Sterna - Gerlacha Fakt, że moment pędu jest skwantowany, jest rzeczą tak zdumiewającą, iż warto opo* wiedzieć trochę o historii tego zjawiska. Jego odkrycie stanowiło niemały wstrząs (choć było przewidziane teoretycznie). Po raz pierwszy zaobserwowano je w r. 1922, w doświad- czeniu wykonanym przez Sterna i Gerlacha. Doświadczenie to można by właściwie uwa- żać za bezpośrednie sprawdzenie hipotezy o skwantowaniu momentu pędu. Stern i G61"'
35-2. DOŚWIADCZENIE STERNA-GERLACHA 267 lach wymyślili takie oto doświadczenie dla pomiaru momentów magnetycznych poje- dynczych atomów srebra. Wytworzyli wiązkę atomów srebra odparowując srebro w pie- cu o wysokiej temperaturze oraz wyprowadzając następnie część tych atomów na zewnątrz przez układ małych otworów. Powstała w ten sposób wiązka była skierowana pomiędzy nabiegunniki specjalnego magnesu, tak jak to pokazano na rys. 35.2. Koncepcja Sterna i Gerlacha była następująca: jeżeli atom srebra ma moment magnetyczny /z, to w polu magnetycznym B będzie on miał energię—gdzie z jest kierunkiem pola magnetyczne- go. W teorii klasycznej /zz byłoby równe momentowi magnetycznemu razy cosinus kąta pomiędzy momentem a polem magnetycznym, tak że ta dodatkowa energia w polu by- łaby równa AU = — fiB cos0. (35.5) Oczywiście, momenty magnetyczne atomów wychodzących z pieca układałyby się wzdłuż wszystkich możliwych kierunków — tak że mielibyśmy wszystkie możliwe wartości kąta 0. Jeżeli teraz pole magnetyczne zmienia się bardzo gwałtownie wzdłuż osi z, czyli jeżeli jest jakiś duży gradient pola, to energia magnetyczna będzie się również zmieniać z poło- żeniem i wystąpi siła działająca na momenty magnetyczne, której kierunek zależy od znaku cos 0. Atomy będą odchylane do góry lub na dół przez siłę proporcjonalną do po- chodnej energii magnetycznej; na podstawie zasady prac wirtualnych siła ta powinna być równa 5U 5B — = (35.6) oz oz Stern i Gerlach użyli magnesu, którego jeden nabiegunnik miał postać bardzo ostrej krawędzi, po to aby wytwarzał bardzo gwałtowną zmianę pola. Wiązka atomów srebra była skierowana dokładnie wzdłuż tej ostrej krawędzi, tak że atomy doznawały w tym niejednorodnym polu działania siły „poprzecznej”. Atom srebra, którego moment magne- tyczny miał kierunek poziomy, nie powinien doznawać działania żadnej siły i przechodzić na wprost przez magnes. Na atom, którego moment magnetyczny był dokładnie „po- przeczny”, powinna działać siła, odchylająca go do góry w kierunku ostrej krawędzi magnesu. Atom o momencie magnetycznym skierowanym w dół miał doznawać odchy- 35.2. Doświadczenie Stema-Gerlacha
268 35. PARAMAGNETYZM I REZONANS MAGNETYCZNĄ lenia na dół. Tak więc, po opuszczeniu magnesu wiązka atomów powinna zostać rozmyta w zależności od składowych poprzecznych ich momentów magnetycznych. W teorii kla- sycznej były dopuszczalne wszystkie kąty, tak że po osadzeniu się atomów na płytce szklanej należałoby oczekiwać, że srebro się rozmaże wzdłuż jakiejś pionowej kreski Wysokość tej kreski byłaby proporcjonalna do wielkości momentu magnetycznego. Sro- motny upadek koncepcji klasycznych został w pełni ujawniony, gdy Stern i Gerlach zo- baczyli, co się rzeczywiście stało. Znaleźli oni na płytce szklanej dwa odrębne punkty Atomy srebra uformowały dwie wiązki. To, że wiązka atomów, których spiny były najwyraźniej w świecie skierowane na chy- bił trafił, zostaje rozszczepiona na dwie oddzielne wiązki, jest czymś cudownym. Skąd moment magnetyczny wie, że wolno mu przyjąć tylko pewne składowe względem kie- runku pola magnetycznego? No cóż, to był dopiero początek odkrycia kwantyzacji mo- mentu pędu i zamiast próbować podać teoretyczne wyjaśnienie tego faktu powiemy tylko że jesteśmy zaskoczeni wynikiem tego doświadczenia, tak samo jak fizycy owych czasów, którzy musieli przyjąć ten wynik, gdy doświadczenie zostało wykonane. To, że energia atomu w polu magnetycznym przyjmuje szereg wartości dyskretnych, jest faktem doświad- czalnym. Dla każdej z tych wartości energia jest proporcjonalna do natężenia pola. Tak więc dla obszaru, gdzie pole się zmienia, zasada prac wirtualnych mówi nam, że na ato- my może tylko działać siła magnetyczna przyjmująca pewien zbiór wartości dyskretnych; siła ta jest różna dla każdego stanu, tak że wiązka atomów zostaje rozszczepiona na kilka oddzielnych wiązek. Mierząc odchylenie tych wiązek można znaleźć wartość momentu magnetycznego. ’ - ""''j 35-3. Metoda wiązek molekularnych Rabiego . . Chcielibyśmy opisać teraz ulepszoną aparaturę służącą do pomiaru momentów magne- tycznych, która została skonstruowana przez I. I. Rabiego i jego współpracowników. W doświadczeniu Sterna-Gerlacha odchylenie atomów było bardzo małe i pomiar mo- mentu magnetycznego nie był zbyt dokładny. Metoda Rabiego pozwala mierzyć momen- ty magnetyczne z fantastyczną precyzją. Metoda ta opiera się na fakcie, że energia począt- kowa atomów zostaje w polu magnetycznym rozszczepiona na skończoną liczbę pozio- mów energetycznych. To, że energia atomu w polu magnetycznym może przyjmować tylko pewne dyskretne wartości, nie jest w rzeczywistości czymś bardziej zaskakującym od tego, że atomy mają tylko pewne dyskretne poziomy energetyczne — wspominaliśmy już o tym w tomie I (cz. 2). Dlaczego to samo nie miałoby być słuszne dla atomów w polu magnetycznym? Otóż jest słuszne, ale próba powiązania tego faktu z pojęciem zoriento- wanego momentu magnetycznego prowadzi do pojawienia się pewnych dziwnych impli- kacji mechaniki kwantowej. Gdy atom ma dwa poziomy, których energie się różnią o A U, może on dokonać przej- ścia z poziomu wyższego na poziom niższy emitując kwant światła o częstości co, gdzie koj = AU. (35.7)
35-3. METODA WIĄZEK MOLEKULARNYCH RAB1EGO 269 To samo może się stać z atomami w polu magnetycznym, tylko że teraz różnice energii są tak małe, że częstość nie odpowiada światłu tylko mikrofalom lub częstościom radio- wym. Mogą także wystąpić przejścia z niższego poziomu energetycznego na wyższy po- ziom energetyczny, którym towarzyszy pochłonięcie światła lub w przypadku atomów w polu magnetycznym pochłonięcie energii mikrofalowej. A zatem, jeżeli mamy atom w polu magnetycznym, to możemy powodować przejścia z jednego stanu do drugiego, stosując dodatkowe pole elektromagnetyczne o odpowiedniej częstości. Innymi słowy, jeżeli mamy atom w silnym polu magnetycznym i „połaskoczemy” ten atom słabo zmien- nym polem elektromagnetycznym, to zaistnieje pewne prawdopodobieństwo na wytrą- cenie atomu na inny poziom energetyczny, jeżeli częstość tego dodatkowego pola będzie zbliżona do częstości co, określonej równaniem (35.7). Dla atomu w polu magnetycznym częstość ta jest wprowadzoną poprzednio przez nas częstością a>p, określoną przez pole magnetyczne równaniem (35.4). Jeżeli „połaskotać” atom złą częstością, to szansa na spowodowanie przejścia jest bardzo mała. Tak więc w prawdopodobieństwie spowodo- wania przejścia istnieje ostry rezonans przy cop. Mierząc częstość tego rezonansu w zna- nym polu magnetycznym B można z dużą precyzją zmierzyć wielkość g(q/2m), a stąd czyn- nik g. Ciekawe, że do tych samych wniosków można dojść z punktu widzenia fizyki kla- sycznej. Zgodnie z obrazem klasycznym, jeżeli się umieści mały giroskop o momencie magnetycznym /z i o momencie pędu J w zewnętrznym polu magnetycznym, to giroskop będzie wykonywać precesję wokół osi równoległej do kierunku pola magnetycznego (patrz rys. 35.3). Przypuśćmy, że spytamy: jak można zmienić kąt, jaki tworzy klasyczny giroskop z kierunkiem pola — a mianowicie z osią z? Pole magnetyczne wytwarza mo- ment siły wokół jakiejś osi poziomej. Można by pomyśleć, że taki moment siły próbuje ustawić magnes wzdłuż kierunku pola, ale powoduje on tylko precesję. Jeżeli się chce zmienić kąt pomiędzy giroskopem a osią z, to musi się wywrzeć nań moment siły wokół osi z. Jeżeli przyłożyć moment siły o tym samym kierunku co precesja, to kąt giroskopu się zmieni, tak aby dać mniejszą składową momentu pędu J w kierunku osi z. Na rysunku 35.3 kąt pomiędzy wektorem J a osią z zwiększyłby się. Jeżeli spróbujemy powstrzymać precesję, wektor J przesunie się w kierunku pionu. W jaki sposób można przyłożyć potrzebny moment siły w przypadku naszego atomu wykonującego precesję w jedno- rodnym polu magnetycznym? Odpowiedź brzmi: przy po- mocy słabego pola magnetycznego, poprzecznego do pola pierwotnego. Można by w pierwszej chwili pomyśleć, że kierunek tego dodatkowego pola powinien się obracać wraz z precesją momentu magnetycznego, tak aby pole to było zawsze prostopadłe do momentu magnetycznego, jak to zaznaczono przy pomocy pola B' na rys. 35.4a. Pole takie będzie swe zadanie spełniało bardzo dobrze, ale prawie równie dobrze będzie działało poziome pole zmienne. Jeżeli mamy słabe poziome pole B', które ma zawsze kieru- 35.3. Precesja klasyczna ato- mu z momentem magne- tycznym p. i momentem pędu J
270 35. PARAMAGNETYZM I REZONANS MAGNETYCZNY b) 35.4. Kąt precesji momentu magnetycznego można zmie- nić przy pomocy poziomego pola magnetycznego, skiero- wanego zawsze prostopadle do p, tak jak na części a) lub przy pomocy pola oscylującego, tak jak na części b) rysunku nek osi x (dodatni lub ujemny) i którego natężenie oscyluje z częstością cop, to w każdym półokresie moment siły działa- jący na moment magnetyczny zmienia zwrot, tak że w wy- padkowym efekcie takie pole jest prawie równie skuteczne jak obracające się pole magnetyczne. Z klasycznego punktu widzenia oczekiwalibyśmy wówczas, że w obecności bardzo słabo oscylującego pola z częstością równą dokładnie w zmieniałaby się składowa momentu magnetycznego wzdłuż kierunku z. Oczywiście, według mechaniki klasycznej moment /zz zmieniałby się w sposób ciągły, ale w mechanice kwantowej składowa z-owa momentu magnetycznego nie może się zmieniać w sposób ciągły. Musi ona wykonywać nagłe skoki od jednej wartości do drugiej. Dokonaliśmy tu porównania pomiędzy konsekwencjami wynikającymi z mechaniki klasycznej i z mechaniki kwantowej, aby poka- zać, co mogłoby się zdarzyć w mechanice klasycznej i jak to jest związane z tym, co się rzeczywiście dzieje w mecha- nice kwantowej. Nawiasem mówiąc, można pokazać, że spo- dziewana częstość rezonansowa jest taka sama w obu przypadkach. Jeszcze jedna, dodatkowa uwaga: z tego, co powiedzie- liśmy o mechanice kwantowej, nie wynikają żadne oczy- wiste powody, dla których nie miałoby być przejść przy czę- stości 2wp. Okazuje się, że coś takiego nie może się zda- rzyć w przypadku klasycznym oraz że takie przejście nie zachodzi także w mechanice kwantowej — przynajmniej nie dla tej szczególnej metody wymuszania przejść, którą opi- saliśmy. Przy oscylującym, poziomym polu magnetycznym prawdopodobieństwo tego, że częstość 2<op spowoduje prze- skok od razu o dwa „stopnie”, jest równe zeru. Przejścia do poziomów wyższych, jak i niższych mogą występować tylko przy częstości a>p. Możemy teraz już przystąpić do opisania metody Rabiego pomiaru momentów magnetycznych. Będziemy tu rozważać działanie tej metody tylko dla atomów o spinie |. Sche- mat aparatury pokazano na rys. 35.5. Składa się ona z pieca atomowego, który dostarcza strumienia obojętnych atomów; strumień ten przechodzi kolejno pomiędzy biegunami trzech magnesów. Magnes 1 jest takim samym magnesem, jaki był pokazany na rys. 35.2, i ma pole o dużym gradiencie — z dodatnią, powiedzmy, składową dBJdz. Atomy mające jakiś moment magnetyczny będą odchylane w dół, w przypadku gdy J2 = +^/2 lub do góry, wtedy gdy Jz = — h/2 (ponieważ dla elektronów kierunek p jest przeciwny do kie- runku J). Jeżeli będziemy rozważać tylko te atomy, które mogą się przedostać przez szcze- linę Sj, to musimy uwzględnić, że atomy takie mogą przejść po dwóch torach, które
35-3. METODA WIĄZEK MOLEKULARNYCH RABIEGO 271 pokazano na rysunku. Atomy o momencie pędu J2 = +^/2 muszą, aby się przedostać przez szczelinę, poruszać się wzdłuż krzywej a, a torem atomów o momencie pędu J2 = = — h/2 musi być krzywa b. Atomy, które wystartują z pieca wzdłuż innych torów, przez szczelinę w ogóle nie przejdą. Magnes 2 ma pole jednorodne. W obszarze tym na atomy nie działają żadne siły, tak że atomy te przechodzą na wprost i wchodzą do magnesu 3. Magnes 3 jest podobny do magnesu 1, ale o polu odwróconym, tak że dBJdz ma tu znak przeciwny (ujemny). Atomy o J2 ~ H-S/2 (ze spinem, jak to się mówi, „do góry”), a więc te, które doznały odchylenia w dół w magnesie 1, doznają teraz w magnesie 3 odchylenia ku górze ', podążają więc one w dalszym ciągu po torze a i przechodzą przez szczelinę S2 do detektora. Atomy o mo- mencie pędu J2 — —h/2 („ze spinem w dół”) doznają w magnesach 1 i 3 również działania sił skierowanych przeciwnie i przechodzą wzdłuż krzywej b, która prowadzi je także po- przez szczelinę S2 do detektora. Detektor można wykonać na wiele różnych sposobów, w zależności od rodzaju atomu, który ma być rejestrowany. Tak na przykład dla atomów jakiegoś metalu alkalicznego, np. sodu, detektorem może być cienki, gorący drut wolframowy, połączony z czułym przyrządem mierzącym natężenie prądu. Gdy atomy sodu lądują na drucie, zostają wypa- rowane w postaci jonów Na+, pozostawiając na drucie elektron. W drucie przepływa prąd proporcjonalny do liczby atomów sodu, przybywających tam w ciągu jednej sekundy. Pomiędzy biegunami magnesu 2 znajduje się układ cewek, który wytwarza małe, po- ziome pole magnetyczne B'. Cewki są zasilane prądem zmiennym o częstości a>, którą można zmieniać. Pomiędzy biegunami magnesu 2 istnieje zatem silne, stałe pole po- przeczne B i słabe, oscylujące pole poziome B'. Przypuśćmy teraz, że częstość co oscylującego pola nastawimy na wartość cop — równą częstości „precesji” atomów w polu B. Pod wpływem zmiennego pola niektóre z przelatu- jących atomów dokonają przejść — zmieniając wartość swej składowej J2 na inną. Atom, który miał początkowo spin „do góry” (Z, = -j-ft/2), może zostać przewrócony „na dół” (J2 = — h/2). Zwrot momentu magnetycznego takiego atomu zostaje odwrócony, w re- zultacie atom ten dozna w magnesie 3 siły działającej ku dołowi i będzie się poruszał po torze a, pokazanym na rys. 35.5. Nie przejdzie on więc już przez szczelinę S2 do detek- 35.5. Aparatura używana w metodzie wiązek molekularnych Rabiego
272 35 PARAMAGNETYZM I REZONANS MAGNETYCZNY 35.6. Prąd atomóww wiązce makyc^ady w tora. Podobnie niektóre z atomów które początkowo miały spin na dół (Jz = -h/2) doznają przy przejściu przez magnes 2 przekręcenia spinów do góry (Jz = +h/2). Będą się one wówczas poruszać po torze b' i też nie przedostaną się do detektora. Jeżeli oscylujące pole B' ma częstość v znacznie różniącą się od a>p, nie spo- woduje ono żadnego przewrócenia spi- nów i atomy będą się poruszały wzdłuż swoich „niezaburzonych” torów do de- tektora. Widać zatem, że częstość pre- cesji cop atomów w polu magnetycznym B można znaleźć zmieniając częstość co pola B' aż do momentu, kiedy się zaobserwuje spadek prądu atomów dopływających do detektora. Spadek prądu nastąpi wtedy, gdy częstość bę- dzie ,,w rezonansie” z cop. Wykres prądu detektora w funkcji częstości w wygląda tak, jak to pokazano na rys. 35.6. Znając a>p można określić wartość współczynnika g dla danego atomu. Takie doświadczenia z wiązkami atomowymi lub, jak się je często nazywa, z wiązkami „molekularnymi”, są piękną i precyzyjną metodą pomiaru własności magnetycznych obiek- tów atomowych. Częstość rezonansu cop można określić z wielką precyzją, w rzeczywistości z precyzją większą, niż potrafimy zmierzyć pole magnetyczne B, które musimy znać, aby znaleźć współczynnik g. • 35-4. Paramagnetyzm elementu objętości substancji*) Chcielibyśmy teraz opisać zjawisko paramagnetyzmu w elemencie objętości substan- cji**’. Przypuśćmy, że mamy substancję, której atomy mają trwałe momenty magnetyczne, jak np. kryształ siarczanu miedzi. W krysztale tym znajdują się jony miedzi, których we- wnętrzne powłoki elektronowe mają pewien wypadkowy moment pędu i pewien wypad- kowy moment magnetyczny. Jon miedzi jest zatem obiektem, który ma pewien trwały moment magnetyczny. W związku z tym wypada powiedzieć, które atomy mają momenty magnetyczne, a które nie. Każdy atom, np. atom sodu, mający nieparzystą liczbę elektro- nów, będzie miał jakiś moment magnetyczny. Atom sodu na swej niewypełnionej powłoce ma jeden elektron. Elektron ten wnosi do atomu swój spin i moment magnetyczny. Zwykle jednak w procesie łączenia się atomów w drobinę te dodatkowe elektrony z powłoki zewnętrznej zostają związane z innymi elektronami, których spiny mają akurat kierunki *’ Porównaj: Tom II, cz. 1, rozdz. 11 (Wewnątrz dielektryków). **’ W oryginale — paramagnetism of bulk materials. Chodzi tu o skończenie wielki element objętości substancji — o opisanie zjawiska paramagnetyzmu w sensie bardziej „makroskopowym”. (Przyp. tłum-)-
35-4. PARAMAGNETYZM ELEMENTU OBJĘTOŚCI SUBSTANCJI 273 przeciwne, tak że wszystkie momenty pędu i momenty magnetyczne elektronów się zwykle znoszą. Dlatego właśnie w ogólnym przypadku drobiny nie mają momentu magnetycz- nego. Oczywiście, jeżeli mamy gaz złożony z atomów sodu, to taka redukcja nie wystę- puje*’. Również, jeżeli mamy obiekt z nieparzystą liczbą elektronów walencyjnych — to, co w chemii nazywa się „wolnym rodnikiem” — to wiązania nie są zupełnie wysycone i jest tam pewien wypadkowy moment pędu. U większości substancji moment magnetyczny występuje w elemencie objętości tylko w tym przypadku, jeżeli są tam obecne atomy, których wewnętrzna powłoka elektronowa nie jest zapełniona. Wówczas może istnieć wypadkowy moment pędu i moment magne- tyczny. Atomy takie spotyka się w „pierwiastkach przejściowych” układu okresowego — będą to na przykład takie pierwiastki jak chrom, mangan, żelazo, nikiel, kobalt, pallad i platyna. Także wszystkie pierwiastki ziem rzadkich mają niezapełnione powłoki wewnę- trzne i mają trwałe momenty magnetyczne. Jest jeszcze sporo innych dziwnych tworów, które — jak się okazuje — także mają momenty magnetyczne, tak jak np. ciekły tlen, ale wyjaśnienie tej sprawy pozostawimy chemikom. Przypuśćmy teraz, że mamy zbiornik pełen atomów lub drobin z trwałymi momentami magnetycznymi — niech to będzie gaz, ciecz lub kryształ. Chcielibyśmy wiedzieć, co się stanie, jeżeli przyłożymy zewnętrzne pole magnetyczne. Bez pola magnetycznego atomy poruszają się bezładnie w wyniku ruchów cieplnych, a ich momenty magnetyczne układają się wzdłuż wszystkich możliwych kierunków. Ale jeżeli jest pole magnetyczne, to wystę- puje tendencja uporządkowania się tych małych magnesów wzdłuż jednej linii. Mamy wówczas więcej momentów, które się układają wzdłuż linii sił pola niż momentów, których kierunki są jakieś inne. Substancja jest „namagnesowana”. Namagnesowanie materiału, M, definiujemy jako wypadkowy moment magnetyczny na jednostkę objętości, przez co rozumiemy sumę wektorową wszystkich atomowych momentów magnetycznych w jednostce objętości. Jeżeli w jednostce objętości mamy N atomów i jeżeli ich średni moment jest równy <p.śr), to namagnesowanie M można zapisać jako N razy średni moment atomowy: M = W>śr. (35.8) Definicja namagnesowania M odpowiada definicji polaryzacji elektrycznej P z rozdz. 10 (t. II, cz. 1). Klasyczna teoria paramagnetyzmu jest bardzo podobna do teorii stałej dielektrycznej, którą zamieściliśmy w rozdz. 11 (t. II, cz. 1). Zakłada się, że każdy z atomów ma pewien moment magnetyczny p, który ma zawsze tę samą wartość bezwzględną, ale może mieć dowolny kierunek. W polu B energia magnetyczna jest równa —p.- B = — pB cos 0, gdzie 0 jest kątem pomiędzy momentem a polem magnetycznym. Zgodnie z mechaniką statystycz- ną prawdopodobieństwo względne wystąpienia jakiegoś kąta jest równe e' eners|a/*r, tak że kąty bliskie zera są bardziej prawdopodobne od kątów bliskich %. Postępując dokładnie tak samo jak w § 11-3 (t. II. cz. 1) znajdujemy, że dla stałych pól magnetycznych na- *> Zwykle sód w fazie gazowej jest jednoatomowy, chociaż występuje w niej trochę drobin Na2. 18 — Wykłady z fizyki
274 35. PARAMAGNETYZM I REZONANS MAGNETYCZNY magnesowanie M jest skierowane równolegle do B, a jego wartość bezwzględna wynosi M = Ną2B 3kT (35.9) [patrz równanie (11.20)]. Ten przybliżony wzór jest poprawny tylko dla ąBjkT dużo mniej- szego od jedności. Okazuje się, że wywołane przez indukcję namagnesowanie, czyli moment magnetyczny na jednostkę objętości, jest proporcjonalne do pola magnetycznego. Jest to zjawisko paramagnetyzmu. Można zobaczyć, że zjawisko to jest silniejsze w niższych tempera- turach, a słabsze w temperaturach wyższych. Jeżeli substancję umieścimy w polu magne- tycznym, to powstaje w niej moment magnetyczny proporcjonalny, dla małych pól, do natężenia pola. Stosunek M do B (dla małych pól) nazywamy podatnością magnetyczną. Chcemy teraz rozpatrzyć paramagnetyzm z punktu widzenia mechaniki kwantowej. Na początek weźmy przypadek atomu o spinie j. Pod nieobecność pola magnetycznego atomy mają pewną energię, ale w polu magnetycznym są możliwe dwie energie — po jednej dla każdej wartości składowej momentu pędu J2. Dla J2 = +H/2 pole magnetyczne zmienia energię o wartość AU, B. (35.10) (Przesunięcie energetyczne J U jest dla atomu dodatnie, ponieważ ładunek elektronu jest ujemny.) Dla Jz = — K/2 zmiana energii wynosi AU2 = -g • B. (35.11) Aby zaosaoctdzić sobie trochę pisania, przyjmijmy wówczas AU=^0B. (35.12) (35.13) Znaczeme ft0 jest jasne: — p0 jest składową z-ową momentu magnetycznego w przypadku spinu skierowanego „do góry”, a jest składową z-ową momentu magnetycznego w przypadku spinu „na dół”. Mechanika statystyczna mówi nam teraz, iż prawdopodobieństwo tego, że atom się znajduje w danym stanie, jest proporcjonalne do g—(energia stanu)/fcr Pod nieobecność pola magnetycznego obydwa stany mają tę samą energię, tak że po usta- leniu się równowagi w polu magnetycznym prawdopodobieństwa są proporcjonalne do e-dt//*r (35.14)
35-4. PARAMAGNETYZM ELEMENTU OBJĘTOŚCI SUBSTANCJI 275 Liczba atomów na jednostkę objętości o spinie skierowanym do góry wynosi Ntin = a exp(-fi0B/kT), (35.15) a liczba atomów ze spinem na dół Ni6t = a exp(+p0B/kT). (35.16) Stałą a należy określić tak, aby (35.17) jadzie N jest całkowitą liczbą atomów w jednostce objętości. Otrzymujemy więc N a = ------------------------------. (35.18) exp(+Ja0^/fc73+exP(—PoBjkT) l Konkretnie interesuje nas średni moment magnetyczny wzdłuż osi z. Atomy o spinie Ikierowanym do góry będą miały moment magnetyczny —ji®,- a atomy o spinie na dół Łędą miały moment magnetyczny +/4q, tak że średni moment wyniesie , . ^góra(_A‘o)+^Vdół(+Mo) - </4 =-------------------------• (35.19) Moment magnetyczny na jednostkę objętości M jest równy Korzystając z rów- nań (35.15), (35.16) i (35.17) otrzymujemy ., _ Kr exp(+fi0B/kT)-exp(-fi0B[kT) exp(+fi0B/kT)+exp(—fi0B/kT) * Jest to kwantowomechaniczny wzór na namagnesowanie M dla atomów o spinie j — Wzór ten można też zapisać nieco zwięźlej, wprowadzając funkcję tangens hiperboliczny: i J/ = WMotgh^-. (35.21) ki Wykres namagnesowaniaAf jako funkcji pola B podano na rys. 35.7. Gdy B staje się bardzo duże, tangens hiperboliczny zbliża się do jedności, a M zbliża się do wartości granicz- nej Dla silnych pól następuje zatem ^ysycenie namagnesowania. Można zobaczyć, dlaczego tak jest; dla dostatecznie silnych pól wszystkie momenty zostają ułożone wzdłuż Jednego kierunku. Innymi słowy, wszystkie atomy znajdują się w stanie ze spinem do dołu 1 każdy z nich daje do średniego momentu Magnetycznego przyczynek równy +/i0. 35.7. Zależność namagneaowanla panunaina- tycznego od natężania pdła magMtyatM|O B
276 > 35. PARAMAGNETYZM I REZONANS MAGNETYCZNY W większości przypadków normalnych — powiedzmy dla typowych wartości momen- tów, temperatury pokojowej i pól, jakie normalnie można otrzymać (rzędu 10000 Gs) — stosunek wynosi około 0,02. Aby osiągnąć nasycenie, musi się przejść do bardzo niskich temperatur. Dla normalnych temperatur można zwykle zastąpić tghx przez x i napisać Nu2B M — kT (35.22) Tak samo jak w teorii klasycznej, M jest proporcjonalne do B. W istocie, wzór jest taki sam, wygląda tylko na to, że brakuje w nim czynnika |. Ale należy jeszcze związać z naszego wzoru kwantowomechanicznego z p, które się pojawia w wyniku klasycznym [równanie (35.9)]. We wzorze klasycznym występuje p.2 = p.-p., kwadrat wektora momentu magnetycz- nego, czyli (35.23) W poprzednim rozdziale zwróciliśmy uwagę, że można z dużym prawdopodobieństwem uzyskać poprawne odpowiedzi z obliczeń klasycznych, zastępując JJ przez j(;+l)S2. W naszym szczególnym przykładzie j = |, tak że j(j+W2=tfi2. Podstawiając to za J-J do równania (35.23) otrzymujemy lub Wjtażając to poprzez po, zdefiniowane równaniem (35.12), (*-(* = 3jug. Podstawienie powyższego wyniku za (u2 we wzorze klasycznym doprowadza nas rzeczy- wiście do poprawnego wzoru kwantowego [równanie (35.22)]. Teorię kwantową paramagnetyzmu można łatwo rozszerzyć na przypadek atomów o dowolnym spinie j. Namagnesowanie dla małego pola wynosi M = Ng----------, 3 kT gdzie qK Z<b = TT” 2m (35.24) (35.25) jest kombinacją stałych, mającą wymiar momentu magnetycznego. Większość atomów ma momenty tej mniej więcej wielkości. Wielkość fiB nazywamy magnetonem Bohra. Mo- ment magnetyczny związany ze spinem elektronu jest równy, prawie dokładnie, jednemu magnetonowi Bohra.
35-5 OZIĘBIENIE PRZEZ ROZMAGNESOWANIE ADIABATYCZNE 277 35-5. Oziębienie przez rozmagnesowanie adiabatyczne " • 1 Paramagnetyzm ma jedno szczególne, bardzo interesujące zastosowanie. W bardzo niskich temperaturach w silnym polu udaje się uporządkować atomowe momenty magne- tyczne. Dlatego też można osiągnąć nadzwyczaj niskie temperatury za pomocą procesu nazywanego rozmagnesowaniem adiabatycznym. Można wziąć jakąś sól paramagnetyczną (np. taką, która zawiera pewną liczbę atomów ziem rzadkich, powiedzmy azotan amono- wo-prazeodymowy) i zacząć od oziębienia jej przy pomocy ciekłego helu do 1-2 °K, w silnym polu magnetycznym. Czynnik iiBIkT jest wówczas większy od 1 i raczej wynosi około 2 lub 3. Większość spinów jest uporządkowana i namagnesowanie jest prawie na- sycone. Aby ułatwić sobie sprawę, załóżmy, że pole jest potężne, a temperatura jest bardzo niska, tak że prawie wszystkie atomy są uporządkowane. Następnie izolujemy cieplnie sól (np. usuwamy ciekły hel i zostawiamy sól w dobrej próżni) i wyłączamy pole magnetyczne. Sól oziębi się wówczas jeszcze bardziej. I Otóż, gdybyśmy nagle wyłączyli pole, drgania i wstrząsy atomów w sieci krystalicznej (wytrąciłyby stopniowo wszystkie spiny z uporządkowania. Niektóre z tych spinów byłyby skierowane do góry, a niektóre w dół. Ale jeżeli nie ma pola (i jeżeli pominąć wzajemne oddziaływania pomiędzy atomowymi momentami magnetycznymi, co prowadzi do po- pełnienia niewielkiego tylko błędu), takiemu obróceniu atomowych momentów magne- tycznych nie towarzyszy pobieranie żadnej energii. Atomy będą więc mogły rozrzucić na chybił trafił swe spiny i nie spowoduje to zmiany energii, a więc i zmiany temperatury. Przypuśćmy jednak, że wtedy gdy atomowe momenty magnetyczne są przekręcane przez ruch cieplny, jest jeszcze ciągle trochę pola magnetycznego. Wówczas przekręcenie tych momentów względem pola wymaga pewnej pracy —. muszą one wykonać pewną pracę przeciwko polu. Powoduje to odebranie pewnej energii ruchom cieplnym, co obniża temperaturę. Jeżeli więc usunąć nie za gwałtownie silne pole magnetyczne, to tempera- tura soli się obniży — sól zostaje oziębiona przez rozmagnesowanie. Z punktu widzenia mechaniki kwantowej atomy, gdy pole jest silne, są wszystkie w stanie energetycznie naj- niższym, ponieważ szanse na znalezienie się w jakimś wyższym stanie są wyjątkowo małe. Ale przy zmaleniu pola staje się coraz bardziej prawdopodobne, że fluktuacje cieplne wy- trącą jakiś atom do stanu wyższego. Jeżeli coś takiego się stanie, to atom pochłonie ener- gię AU = p0B. Jeżeli zatem wyłączać pole powoli, przejścia magnetyczne mogą ode- brać energię drganiom cieplnym kryształu i w rezultacie go oziębić. W ten sposób można przejść od temperatury kilku stopni Kelvina do temperatury zaledwie kilku tysięcznych stopnia. Gdyby ktoś chciał uzyskać jeszcze niższą temperaturę, to okazuje się, że natura zna- lazła i na to sposób. Wspomnieliśmy już, że jądra atomowe mają także momenty magne- tyczne. Nasze wzory dla paramagnetyzmu będą się równie dobrze stosować dla jąder, z tym, że momenty jąder są z grubsza tysiąc razy mniejsze (ich wartość bezwzględna jest rzędu qh,]2mp, gdzie mp jest masą protonu, tak że momenty jądrowe są mniejsze od mo- mentów atomowych w takim stosunku, w Jakim się mają do siebie masy elektronu. > protonu.) Dla takich momentów magnetycznych nawet w temperaturze 2°K czyn-
278 35. PARAMAGNETYZM I REZONANS MAGNETYCZNY nik fiB/kTiest rzędu jednej tysięcznej. Ale jeżeli skorzysta się z procesu rozmagnesowania paramagnetycznego i osiągnie się temperaturę kilku tysięcznych stopnia, to p.BjkT stanie się liczbą bliską 1, czyli przy tych niskich temperaturach można zacząć nasycać magne- tyczne momenty jądrowe. Daje to możliwość zastosowania adiabatycznego rozmagneso- wania magnetyzmu jądrowego do osiągnięcia temperatur jeszcze niższych. Tak więc ozię. bianie magnetyczne można przeprowadzić w dwóch etapach. Najpierw się korzysta z roz- magnesowania adiabatycznego jonów paramagnetycznych, aby osiągnąć temperaturę kilku tysięcznych stopnia. Następnie takiej zimnej soli paramagnetycznej można użyć do oziębienia jakiejś substancji, która ma silny magnetyzm jądrowy. Na koniec, gdy się usunie od tej substancji pole magnetyczne, to jej temperatura opadnie do milionowych części stopnia powyżej zera bezwzględnego — pod warunkiem, że wszystko było przepro- wadzone bardzo dokładnie. 35-6. Magnetyczny rezonans jądrowy Powiedzieliśmy, że paramagnetyzm atomowy jest bardzo niewielki, a magnetyzm jądrowy jest jeszcze tysiąc razy mniejszy. Mimo to magnetyzm jądrowy można zaobser- wować stosunkowo łatwo dzięki zjawisku „magnetycznego rezonansu jądrowego”. Przy- puśćmy, że weźmiemy substancję taką jak woda, w której wszystkie spiny elektronów dokładnie się równoważą, tak że ich wypadkowy moment magnetyczny jest równy zeru. Drobiny wody będą jednak wciąż jeszcze miały bardzo, bardzo maleńki moment magne- tyczny, pochodzący od jądrowego momentu magnetycznego jąder wodoru. Przypuśćmy, że małą próbkę wody wstawimy do pola magnetycznego B. Ponieważ protony (wodór) mają spin |, będą miały dwa możliwe stany energetyczne. Jeżeli woda jest w równowadze cieplnej, to troszkę więcej protonów będzie w niższych stanach energetycznych — z mo- mentami skierowanymi równolegle do pola. W jednostce objętości wystąpi więc pewien mały wypadkowy moment magnetyczny. Ponieważ moment magnetyczny protonu jest w przybliżeniu równy zaledwie jednej tysięcznej momentu atomowego, to namagnesowanie, które się zmienia jak p2 [równanie (35.22)] jest z grubsza milion razy słabsze od typowego paramagnetyzmu atomowego. (Dlatego właśnie musieliśmy wybrać substancję pozbawioną magnetyzmu atomowego.) Można obliczyć, że na 108 protonów różnica pomiędzy liczbą protonów ze spinem skierowanym do góry, a liczbą protonów ze spinem na dół wyniesie tylko 1! Zjawisko to jest więc rzeczywiście bardzo słabe, ale mimo to można je zaobser- wować w następujący sposób. Przypuśćmy, że naszą próbkę wody otoczymy małą cewką, która wytwarza niewielkie oscylujące poziome pole magnetyczne. Jeżeli pole to oscyluje z częstością a>p, to wywoła ono przejścia pomiędzy dwoma stanami energetycznymi — tak jak to opisaliśmy przy do- świadczeniu Rabiego w § 35-3. Gdy proton przeskakuje z wyższego stanu energetycznego do stanu niższego, oddaje energię fitB, która — jak widzieliśmy — jest równa h!<op. Jeśli proton przechodzi od niższego stanu energetycznego do stanu wyższego, to pochłania on z cewki energię hwp. Ponieważ jest troszkę więcej protonów w stanie niższym niż wyższym, to w efekcie nastąpi pewna absorpcja energii z cewki. Chociaż zjawisko to jest bardzo
35-6. MAGNETYCZNY REZONANS JĄDROWY 279 słabe, tę nieznaczną absorpcję energii można dostrzec za pomocą czułego wzmacniacza elektronicznego. Tak samo jak w doświadczeniu Rabiego z wiązkami molekularnymi, tę absorpcję energii będzie można dostrzec tylko wtedy, gdy pole oscylujące będzie w rezonansie, tzn. gdy ' 4 l r ( f A.', i i Często wygodniej jest szukać rezonansu zmieniając poi# Ą przy ustaIOM|czC#U>Ści a> Absorpcja energii pojawi się oczywiście wtedy, gdy > ' 2m_ B ==--- Typową aparaturę pomiarową dla magnetycznego rezonansu jądrowego pokazano na rys. 35.8. Oscylator wielkich częstości zasila małą cewkę, umieszczoną pomiędzy bie- gunami dużego elektromagnesu. Wokół jego nabiegunników znajdują się dwie pomocnicze cewki zasilane prądem o częstości 60 Hz, tak że pole magnetyczne „waha się” odrobinę wokół swej wartości średniej. Tak na przykład prąd główny magnesu może mieć takie natężenie, że daje pole 5000 Gs, a pomocnicze cewki powodują wahania wokół wartości o ±1 Gs. Jeżeli nastawi się oscylator na częstość 21,2 MHz, to rezonans protonowy na- stąpi za każdym razem, gdy pole będzie przechodzić przez wartość 5000 Gs [z równa- nia (34.13)] z g — 5,58 dla protonu. Obwód oscylatora jest tak skonstruowany, aby dawał pewien dodatkowy sygnał wyj- ściowy, proporcjonalny do każdej zmiany doprowadza się do wzmacniacza odchy- lenia pionowego oscyloskopu. Napięcie odchylenia poziomego jest wyzwalane raz ha każdy okres pola modulującego. (Naj- częściej stosuje się napięcie odchylające o amplitudzie proporcjonalnej do natęże- nia pola modulującego.) Przed umieszczeniem próbki wody wewnątrz cewki wielkiej częstości wartość mocy pobieranej z oscylatora jest cały czas taka sama (nie zmienia się z polem mag- netycznym). Jeżeli jednak umieści się w cewce małą probówkę z wodą, na oscyloskopie pojawia się sygnał, tak jak to pokazano na rysunku. Widzimy obraz mocy pochłanianej podczas przekręcenia się spinów protonów. W praktyce jest zwykle trudno ustawić główny magnes na dokładnie 5000 Gs. Prze- mocy pochłanianej z oscylatora. Sygnał ten 35.8. Aparatura jądrowego rezonansu magnetycznego
280 35. PARAMAGNETYZM I REZONANS MAGNETYCZNY ważnie tak długo się zmienia prąd główny, aż na oscyloskopie pojawi się sygnał rezonansu Okazuje.się, że w tej chwili jest to najdogodniejszy sposób na dokładne mierzenie natęże- nia pola magnetycznego. Oczywiście, ktoś kiedyś musiał zmierzyć dokładnie pole magne- tyczne i częstość, aby określić czynnik g protonu. Ale teraz, gdy zostało to już zrobione aparatura rezonansu protonowego, taka jak ta na rysunku, może być używana jako „re- zonansowy magnetometr protonowy”. Należałoby wspomnieć jeszcze o kształcie sygnału. Gdybyśmy modulowali pole magne- tyczne bardzo powoli, to powinnibyśmy się spodziewać, że ujrzymy zwykłą krzywą rezo- nansu. Absorpcja energii osiągałaby maksimum wtedy, gdy częstość oscylatora dochodzi- łaby dokładnie do <op. Dla pobliskich częstości także zajdzie pewna absorpcja (energii), ponieważ nie wszystkie protony są w dokładnie takim samym polu — a różne pola ozna- czają trochę różne częstości rezonansowe. Można by się przy okazji zastanowić, czy przy częstości rezonansu powinno się w ogóle zaobserwować jakiś sygnał. Czy nie powinno się raczej oczekiwać, że pole wielkiej częstości wyrówna liczby obsadzeń obu stanów tak, że nie będzie żadnego sygnału — z wyjątkiem momentu, w którym woda byłaby wstawiana do cewki? Niezupełnie, chociaż bowiem próbujemy wyrównać obie liczby obsadzeń, ruchy cieplne ze swojej strony próbują utrzy- mać właściwy stosunek tych liczb dla danej temperatury T. Jeżeli się znajdziemy w rezo- nansie, to moc, która jest pochłaniana przez jądra, jest właśnie tym, co jest tracone na rzecz ruchów cieplnych. Istnieje jednak stosunkowo mały „kontakt cieplny” pomiędzy mo- mentami magnetycznymi protonów a ruchami atomów. Protony są stosunkowo dobrze izolowane przez otaczające je chmury elektronowe. W czystej zatem wodzie sygnał rezo- nansu jest w rzeczywistości zwykle za mały, aby go można było zaobserwować. Aby zwiększyć absorpcję, trzeba koniecznie zwiększyć „kontakt cieplny”. Zwykle się to robi przez dodanie do wody trochę tlenku żelaza. Atomy żelaza są jak gdyby małymi magne- sikami; drgając w swoim tańcu cieplnym wytwarzają one maleńkie drgające pola magne- tyczne, działające na protony. Te zmienne pola „sprzęgają” momenty magnetyczne pro- tonów z drganiami atomów i dążą do ustalenia równowagi cieplnej. Właśnie dzięki temu „sprzężeniu” protony w wyższych stanach energetycznych mogą tracić swoją energię, tak że są one znowu zdolne do pochłaniania energii z oscylatora. W praktyce sygnał wyjściowy aparatury rezonansu jądrowego nie przypomina zwy- kłej krzywej rezonansu. Zwykle jest to jakiś bardziej skomplikowany sygnał z oscylacjami, podobny do sygnału, jaki widzimy na rys. 35.8. Powodem takich kształtów sygnałów są zmienne pola. Wyjaśnienie to powinno zostać podane na gruncie mechaniki kwanto- wej, ale można pokazać, że w takich doświadczeniach pojęcia klasyczne momentów magne- tycznych wykonujących precesję dają zawsze poprawną odpowiedź. Rozumując na grun- cie fizyki klasycznej powiedzielibyśmy, że „osiągając rezonans zaczynamy równocześnie sterować całą masą wykonujących precesję momentów”, co powoduje, że zaczynają one wykonywać precesję wspólnie. Takie jądrowe momenty magnetyczne, wspólnie się obra- cające, spowodują powstanie przy częstości a>p siły elektromotorycznej w cewce oscylatora. Ale ponieważ pole magnetyczne rośnie w czasie, to częstość precesji także rośnie i wywo- łane przez indukcję napięcie ma wkrótce częstość nieco większą od częstości oscylatora. Jednocześnie gdy indukowana SEM jest na przemian to zgodna, to przeciwna w fazie
35-6 MAGNETYCZNY REZONANS JĄDROWY 281 z oscylatorem, „absorbowana” moc jest na przemian to dodatnia, to ujemna. W oscylo- skopie zobaczymy zatem dudnienie — pomiędzy częstością protonów, a częstością oscyla- tora. Ponieważ nie wszystkie częstości protonów są identyczne (różne protony znajdują się w różniących się trochę polach), a także ze względu na możliwe zakłócenia, pochodzące od obecności tlenku żelaza, momenty wykonujące swobodną precesję wkrótce przestają być zgodne w fazie i sygnał dudnień znika. Te zjawiska rezonansu magnetycznego zostały na wiele sposobów wykorzystane jako narzędzia w odkrywaniu nowych własności materii — szczególnie w chemii i w fizyce jądrowej. Nie potrzeba chyba mówić, że wartości liczbowe momentów magnetycznych jąder mówią nam coś niecoś o ich strukturze. W chemii można wyciągnąć wiele wnio- sków ze struktury (czyli kształtu) rezonansu; ze względu na pola magnetyczne wytworzone przez pobliskie jądra dokładne położenie rezonansu jest nieco przesunięte, w zależności od otoczenia, w jakim się znajduje jakieś konkretne jądro. Pomiar tych przesunięć pomaga określić, jakie jądra znajdują się blisko siebie, i pomaga wyjaśnić szczegóły struktury drobin. Równie ważny jest rezonans spinu elektronów wolnych rodników. Chociaż takie rodniki nigdy nie występują w znacznej mierze w równowadze, to są one często pośrednimi stanami reakcji chemicznych. Pomiar rezonansu spinu elektronów stanowi precyzyjny sprawdzian obecności wolnych rodników i stanowi często wskazówkę do zrozumienia mechanizmu pewnych reakcji chemicznych.
ferromagnetyzm *, 3 t 36-1. Prądy namagnesowania*1 W rozdziale tym omówimy pewne substancje, w których wypadkowy efekt pochodzący od obecnych tam momentów magnetycznych jest dużo większy niż w przypadku parama- gnetyzmu czy diamagnetyzmu. Zjawisko to nazywamy ferromagnetyzmem. W substancjach paramagnetycznych i diamagnetycznych wywołane przez indukcję momenty magnetyczne są zwykle tak słabe, że nie musimy się martwić o dodatkowe pola, wytworzone przez nie. Natomiast dla substancji ferromagnetycznych momenty magnetyczne indukowane przez przyłożone pola są wręcz olbrzymie i wywierają duży wpływ na te pola zewnętrzne. Istotnie, indukowane momenty są tak silne, że często one właśnie decydują o formowaniu się obserwowanych pól. Jedną więc z rzeczy, o którą będziemy się musieli zatroszczyć, jest teoria matematyczna indukowanych, dużych momentów magnetycznych. Oczywi- ście, jest to tylko problem formalny — problemem rzeczywistym jest problem następujący: dlaczego te momenty magnetyczne są tak silne — jak to się wszystko dzieje? Do odpo- wiedzi na to pytanie dojdziemy za chwilę. Znajdowanie pól magnetycznych substancji ferromagnetycznych przypomina trochę znajdowanie pola elektrostatycznego w obecności dielektryków. Pamiętamy, że począ- tkowo opisywaliśmy właściwości wewnętrzne dielektryka przy pomocy pola wektoro- wego P, momentu dipolowego na jednostkę objętości. Potem przekonaliśmy się, że skutki tej polaryzacji są równoważne gęstości ładunku p^, określonej przez dywergencję wektora polaryzacji P: ppol — — V-P. (36.D Całkowity ładunek można w każdej sytuacji zapisać jako sumę tego ładunku polaryza- *J Porównaj: Tom II, cz. 1, rozdz. 10 (.Dielektryki).
36-1. PRĄDY NAMAGNESOWANIA 283 cyjnego i pozostałych ładunków, których gęstość oznaczymy*’ symbolem Wówczas równanie Maxwella, które wiąże dywergencję pola E z gęstością ładunku, przybiera postać: __ Cpol~"t~Cmne । £0 £0 lub VE = — P- +—. Co £0 Można teraz oddzielić część polaryzacyjną ładunku i przenieść ją na drugą stronę równa- nia, tak aby otrzymać nowe prawo V-(£oE+P) = oinne. (36.2) To nowe prawo mówi, że dywergencja z wielkości (e0E+P) jest równa gęstości innych ładunków. Połączenie z sobą pól E i P, tak jak uczyniliśmy to w równaniu (36.2), jest oczywiście tylko wtedy pożyteczne, jeżeli znamy pomiędzy nimi jakiś związek. Widzieliśmy, że teo- ria, która wiązała indukowany elektryczny moment dipolowy z polem elektrycznym była historią stosunkowo skomplikowaną i można ją było stosować tylko w pewnych pro- stych sytuacjach, a nawet i wtedy jako przybliżenie. Chcielibyśmy przypomnieć jedno z tych upraszczających pojęć, jakim się posługiwaliśmy. Aby znaleźć indukowany moment dipolowy atomu wewnątrz dielektryka, niezbędna jest znajomość pola elektrycznego, które działa na ten wyodrębniony atom. Zrobiliśmy przybliżenie, które w wielu wypad- kach nie jest takie złe, że pole działające na atom jest takie samo, jak pole, które znaleźli- byśmy w środku małego otworu, który pozostałby po wyjęciu atomu (przy pozostawieniu bez zmian momentów dipolowych wszystkich atomów sąsiednich). Pamiętamy także, że pole elektryczne w otworze w jakimś dielektryku spolaryzowanym zależy od kształtu tego otworu. Podsumowanie naszych poprzednich wyników zamieszczamy na rys. 36.1. Dla wąskiego otworu w kształcie krążka, prostopadłego do wektora polaryzacji, pole elek- ryczne w otworze jest dane zależnością Potwór — ^dielektryk *ł* ’ £0 co wykazaliśmy posługując się prawem Gaussa. Z drugiej strony, pokazaliśmy — korzy- stając z faktu, że rotacja pola E jest równa zeru — iż dla wąskiej szczeliny w kształcie igły, równoległej do polaryzacji, pola elektryczne wewnątrz i na zewnątrz szczeliny są takie same. Na koniec znaleźliśmy, że dla otworu kulistego pole elektryczne w otworze było większe od pola w dielektryku o trzecią część różnicy pomiędzy polami w „krążku” ’ w „igle”: 1 P Eotwór = Edielektryk+ — — (otwór kulisty). (36.3) J CQ *' Jeżeliby wszystkie „inne” ładunki występowały na przewodnikach, to ęr ilrtć taln sama Jak 6swob z rozdz. 10 (t. II, cz. 1). , -
284 36. FERROMAGNETYZM 36.1. Pole elektryczne we wnęce w dielek- tryku zależy od kształtu tej wnęki To właśnie było pole, którym posługiwaliśmy się w rozważaniach nad tym, co się dzieje z atomem wewnątrz spolaryzowanego diele- ktryka. Teraz powinniśmy omówić odpowiednik tego wszystkiego dla przypadku magnetyzmu. Moglibyśmy to zrobić przyjmując, że M moment magnetyczny na jednostkę objętości, jest po prostu odpowiednikiem P, dipolowego momentu elektrycznego na jednostkę obję- tości i że na skutek tego dywergencja nama- gnesowania M, wzięta ze znakiem ujemnym, jest równoważna „gęstości ładunku magnety- cznego” Qm — bez względu na to, co ta ostat- nia wielkość może oznaczać. Oczywiście, kło- pot w tym, że w świecie fizycznym nie istnieje nic takiego jak „ładunek magnetyczny”. Jak wiemy, dywergencja pola B jest zawsze równa zeru. Ale pomimo to nie ma powodu, abyśmy nie mogli dokonać pewnej sztucznej analogii i zapisać -V-M (36.4) przy czym należy rozumieć, że om jest wiel- kością czysto matematyczną. Wówczas można by przeprowadzić zupełną analogię z przypa- dkiem elektrostatycznym i skorzystać z wszys- kich naszych starych równań elektrostatyki. Często robiono takie rzeczy. Tak naprawdę, to kiedyś nawet wierzono, że ta analogia jest prawdziwa. Wierzono, że wielkość Qm przed- stawia gęstość „biegunów magnetycznych’ Obecnie jednak wiemy, że namagnesowanie materiałów pochodzi od krążących wewnątrz atomów prądów, pochodzących czy to od obrotów elektronów wokół osi, czy to od ru- chu elektronów w atomie. Dlatego też z punktu widzenia fizyki lepiej jest opisywać zja- wisko namagnesowania posługując się pojęciem rzeczywistych prądów atomowych, a nie pojęciem gęstości jakichś mitycznych „biegunów magnetycznych”. Nawiasem mówiąc, te prądy nazywa się niekiedy „prądami Ampere’a”, bo Ampere pierwszy poddał myśl, że magnetyzm materii pochodzi od krążących prądów atomowych. Rzeczywista, mikroskopowa gęstość prądu w namagnesowanej materii jest oczywiście bardzo złożona. Jej wartość zależy od tego, gdzie jej się będzie szukać w atomie — w nie- których miejscach w atomie jest duża, a w innych mała; w jednej części atomu prąd prze pływa w jednym kierunku, a w drugiej części przepływa w kierunku przeciwnym (tak samo
36-1. PRĄDY NAMAGNESOWANIA 285 jak wewnątrz dielektryka mikroskopowe pole elektryczne zmienia się bardzo gwałtownie). Jednak w wielu zagadnieniach praktycznych interesują nas tylko pola na zewnątrz materii lub średnie pole magnetyczne wewnątrz materii, gdzie mamy na myśli średnią, wziętą po wielu, wielu atomach. Tylko dla takich zagadnień makroskopowych wygodnie jest opisy- wać stan magnetyczny materii poprzez namagnesowanie M, będące średnim momentem dipolowym na jednostkę objętości. Chcemy teraz pokazać, że prądy atomowe namagneso- wanej materii mogą wywołać powstanie pewnych prądów na dużą skalę, które są związane z namagnesowaniem M. A zatem będziemy teraz próbować rozdzielić gęstość prądu j, która jest rzeczywistym źródłem pól magnetycznych, na różne części, tak aby jedna z tych części opisywała krążące prądy atomowych momentów magnetycznych, a pozostałe części opisywały wszystkie inne prądy, jakie mogą wystąpić. Zwykle najwygodniej jest rozdzielić prądy na trzy części. W rozdziale 32 dokonaliśmy rozróżnienia pomiędzy prądami, które przepływają swobodnie w przewodnikach, a prądami, które pochodzą od ruchów drgających ładunków związa nych w dielektrykach. W § 32-2 napisaliśmy: J — jpol+jinne’ gdzie jpol reprezentowało prądy pochodzące od ruchów ładunków związanych w dielek- trykach, a jinne miało się troszczyć o wszystkie inne prądy. Teraz chcemy pójść jeszcze dalej. Chcemy rozdzielić jinne na jedną część, jmag, która opisuje średnie prądy wewnątrz substancji namagnesowanych i na drugi, dodatkowy człon, który oznaczymy jprzew, a który ma zdawać sprawę z tego, co zostało. Ogólnie biorąc, ten ostatni człon będzie się odnosił do prądów w przewodnikach, ale może on także zawierać w sobie inne prądy, na przykład prądy od ładunków poruszających się swobodnie w pustej przestrzeni. Całko- witą gęstość prądu zapiszemy zatem jako J jpol^Jmag^-Jprzew* , (36.5) Oczywiście, to właśnie ten całkowity prąd występuje w równaniu Mwwlla na rotację B: j dE ?VxB= J- + —. - (36.6) £0 Ot , Musimy teraz związać prąd jmag z wektorem namagnesowania M. Aby czytelnik łatwiej mógł zobaczyć, do czego zmierzamy, powiemy od razu, że w wyniku powinniśmy otrzy- mać: jmag = VxM, (36.7) czyli jeżeli w jakiejś substancji magnetycznej jest wszędzie dany wektor namagnesowa- nia M, to gęstość prądu krążenia jest dana przez rotację M. Zobaczmy, czy potrafimy zrozumieć, dlaczego tak jest. Na początek weźmy przypadek pręta cylindrycznego, który jest namagnesowany Jednorodnie, przy czym wektor M jest równoległy do jego osi. Z punktu widzenia fizyki takie jednorodne namagnesowanie oznacza w rzeczywistości, jak wiemy, że wewnątrz całego ośrodka gęstość krążących prądów atomowych jest stała. Przypuśćmy, że spró-
286 36. FERROMAGNETYZM 36.2. Schematyczny obraz krążących prądów atomowych na przekroju żelaznego pręta, namagnesowanego w kierunku osi z zeru. Nigdzie wewnątrz pręta nie ma bujemy sobie wyobrazić, jak wyglądają te rzeczywiste prądy na przekroju pręta. Można by się spodziewać, że prądy te będą wyglą. dały mniej więcej tak, jak to pokazano na rys. 36.2. Każdy prąd atomowy przebiega dookoła po małej pętli i wszystkie te krążące prądy przebiegają w tym samym kierunku. Jaki jest teraz wypadkowy prąd czegoś takiego? No cóż, w całym prawie pręcie wypadkowy efekt jest równy zeru, bo tuż obok każdego prądu znajduje się prąd przebiegający w kie- runku przeciwnym. Jeżeli wyobrazić sobie małą powierzchnię, ale taką, która jest jeszcze troszkę większa od pojedynczego atomu, taką jak powierzchnia zaznaczona na rys. 36.2 linią AB — to wypadkowy prąd przepły- wający przez tę powierzchnię jest równy go od zera wypadkowego prądu. Zauważmy jednak, że na powierzchni pręta znajdują się prądy atomowe, które się nie znoszą z sąsiednimi prądami — na powierzchni jest pewien prąd wypadkowy, przebiegający wokół pręta, zawsze w tym samym kierunku. Widać teraz, dlaczego mówiliśmy po- przednio, że jednorodnie namagnesowany pręt jest równoważny długiemu solenoidowi, przez który przepływa stały prąd elektryczny. W jakim stopniu ten obraz zgadza się z opisem matematycznym przedstawionym rów- naniem (36.7)? Przede wszystkim, wewnątrz substancji namagnesowanie M jest stałe, tak że jego pochodne są wszystkie równe zeru, co się zgadza z naszym obrazem geome- trycznym. Jednak na powierzchni wektor M nie jest w rzeczywistości stały — jest on stały aż do krawędzi, a potem nagle opada do zera. A zatem, na samej powierzchni są ogromne gradienty, które zgodnie z równaniem (36.7) dadzą dużą gęstość prądu. Przypuśćmy, że się przyjrzymy temu, co się dzieje w pobliżu punktu C na rys. 36.2. Obierając osie x i y tak, jak na rysunku, widzimy, że namagnesowanie M ma kierunek osi z. Rozpisu- jąc równanie (36.7) na składowe mamy dM, dy (36.8) W punkcie C pochodna dMJdy jest równa zeru, ale dMxfdx jest duża i dodatnia. Z rów- nania (36.7) wynika, że dla ujemnego kierunku osi y mamy dużą gęstość prądu. To si? zgadza z naszym obrazem prądu powierzchniowego, opływającego pręt dookoła. Teraz chcemy znaleźć gęstość prądu dla przypadku bardziej skomplikowanego, w któ- rym namagnesowanie się zmienia w substancji od punktu do punktu. Łatwo można do-
36-1. PRĄDY NAMAGNESOWANIA 287 strzec jakościowo, że jeżeli namagnesowanie jest różne w dwóch sąsiednich obszarach, to nie nastąpi idealne zniesienie się krążących prądów, tak że w tej objętości substancji będzie pewien wypadkowy prąd. Właśnie to zjawisko chcemy prześledzić ilościowo. Najpierw musimy się powołać na wyniki z § 14-5, (t. II, cz. 1), że krążący prąd Z ma moment magnetyczny /z, dany zależnością p^IA, (36.9) gdzie A jest powierzchnią pętli prądu (patrz rys. 36.3). Rozważmy teraz mały prostopadłościan wewnątrz namagnesowanej substancji, taki jak to pokazano schematycznie na rys. 36.4. Bie- rzemy ów „klocek” na tyle mały, aby można było założyć, że wewnątrz niego namagnesowa- nie jest stałe. Jeżeli klocek ten ma w kierunku osi z namagnesowanie Mz, to wypadkowy efekt będzie taki sam, jak gdyby ścianki pionowe były opływane przez prąd powierzchniowy, co już pokazaliśmy. Wielkość tych prądów można określić z równania (36.9). Całkowity moment magnetyczny klocka jest równy namagnesowa- nie razy objętość: [j, = MĄabc), 36.3. Moment dipolowy, p., pętli z prą- dem jest równy 1A 36.4. Mały, namagnesowany „klocek” jest równoważny krążącemu prądowi po- wierzchniowemu z czego otrzymujemy (pamiętając, że powierzchnia pętli jest równa ae) 1= Mzb. Innymi słowy, prąd na jednostkę długości (pionowej) na każdej z pionowych powierzchni jest równy Mz. Wyobraźmy sobie dwa małe klocki obok siebie, tak jak to pokazano na rys. 36.5. Ze względu na to, że klocek 2 jest trochę przesunięty względem klocka 1, będzie on miał trochę inną składową pionową namagnesowania, którą oznaczymy MZ+AMZ. Całko- wity prąd na powierzchni pomiędzy klockami będzie się teraz składał z dwóch części. Klocek 1 wytworzy prąd Ą płynący w dodatnim kierunku osi y, a klocek 2 wytworzy Prąd powierzchniowy I2, płynący w ujemnym kierunku osi y. Całkowity prąd powierzch- niowy, płynący w kierunku dodatnim osi y jest sumą: I = it-i2 = Mzb—(Mz-\-AMz)b = -AMzb.
288 36. FERROMAGNETYZM 36.5. Jeżeli namagnesowanie dwóch sąsiednich klocków nie jest takie samo, to pomiędzy klockami poja- wia się pewien wypadkowy prąd powierzchniowy Można zapisać AMZ jako pochodną Mz w kierunku osi x razy przesunięcie wzajemne klocków 1 i 2, które jest równe po prostu a: .. , 3M. ' . - JAf, =----a. । dx frąd płynący pomiędzy dwoma klockami jest więc równy “ 8MZ I=-_—Lab. i dx Aby związać prąd I z średnią gęstością objętościową prądu j, należy zdać sobie sprawę, że ten prąd I jest w rzeczywistości „rozmazany” na powierzchni pewnego przekroju. Jeżeli wyobrazić sobie, że cała objętość substancji jest wypełniona tego rodzaju małymi klockami, to z każdym klockiem można związać taką jedną ściankę boczną (prostopadłą do osi x)*’. Widać teraz, że powierzchnią, którą należałoby związać z prądem Z, jest właśnie powierzchnia ab jednej z przednich ścianek. Otrzymujemy w wyniku Z 8MZ = --------- ab ox przynajmniej pierwszy wyraz rotacji wektora M. Składowa jy powinna zawierać jeszcze jeden wyraz pochodzący od zmiany składowej x-owej namagnesowania wraz ze zmienną z. Ten przyczynek do prądu j będzie pocho- dził od powierzchni pomiędzy dwoma klockami, ustawionymi jeden na drugim, tak jak to pokazano na rys. 36.6. Przeprowadzając identyczne jak poprzednio rozumowanie, można wykazać, że przyczynek od tej powierzchni do jy jest równy dMJdz. Są to jedyne •> Albo jeżeli ktoś woli, prąd I na każdej ściance musi być rozdzielony w równych ilościach pomiędzy klocki znajdujące się po bokach tej ścianki.
36-1. PRĄDY NAMAGNESOWANIA 289 powierzchnie (be i ac), które mogą dać przy- czynki do składowej y-owej prądu, tak że cał- kowita gęstość prądu w kierunku osi y jest równa . _ 8MX dM2 dz dx Obliczając prądy na pozostałych ściankach pro- stopadłościanu albo korzystając z faktu, że nasz kierunek z był zupełnie dowolny, docho- dzimy do wniosku, że wektor gęstości prą- du jest rzeczywiście określony równaniem j = V xM. Jeżeli zatem przyjmiemy do opisu sytuacji 36-6- Dwa k*00*0’ Jeden 1141(1 drugim, . . . .. , , . . mogą także dać przyczynek do jv magnetycznej w materii sredm moment ma- y gnetyczny na jednostkę objętości M, to stwierdzi- my, że krążące prądy atomowe są równoważne średniej gęstości prądu w materii, okre- ślonej równaniem (36.7). Jeżeli substancja jest ponadto dielektrykiem, to dodatkowo może wystąpić prąd polaryzacji jpol = <5P/<5r. A jeżeli ośrodek jest także przewodnikiem, to możemy mieć równie dobrze i prąd przewodnictwa, jprzew. Całkowity prąd można zatem zapisać jako dP j = jprzew+VxM+—• (36.10) 36-2. Pole H Z kolei chcemy Wstawić prąd określony równaniem (36.10) do równań Maxwella. Otrzymujemy J 5E 1 /• „ 3P\ 5E c2VxB = —+ —=— jprzew+VxM+— + —. £0 Ot £0 \ Ot I Ot Wyraz zawierający wektor M można przenieść na lewą stronę: c2Vx/b—= + — (e+— k (36.11) \ e0c2/ £0 Ot \ £0/ Jak zaznaczyliśmy w rozdz. 32, wiele osób lubi zapisywać (E4-P/£0) jako nowe pole wektorowe D/£q. Podobnie, często wygodnie jest zapisywać (B—M/£0c2) jako jedno pole wektorowe. Postanawiamy zdefiniować nowe pole H jako H-B-M,. , j (36.12) £0C2 19 — Wykłady z fizyki
290 36. FERROMAGNETYZM Wówczas równanie (36.11) przybiera postać SD £0c2VxH = jprzew+—. , .• . (36.13) Wygląda ono prosto, ale cała jego złożoność jest ukryta właśnie w symbolach D i H. Musimy teraz ostrzec czytelnika. Otóż większość z tych osób, które używają jedno- stek MKS postanowiła używać innej definicji pola H. Jeżeli oznaczyć ich pole H' (oczy- wiście oni oznaczają je w dalszym ciągu H, bez znaku prim), to jego definicja ma postać H' = £0c2B—M (36.14) (zwykle również zapisują oni £oc2 jako nową liczbę lf/z0’> mają w ten sposób jeszcze jedną stałą, o której muszą pamiętać!). Przy tej definicji równanie (36.13) wygląda jeszcze proś- ciej: SD VxH' = jprzew+—. (36.15) Ale z tą definicją pola H' związane są dwie trudności: po pierwsze — definicja ta nie zga- dza się z definicją tych osób, które nie używają jednostek MKS, a po drugie — prowa- dzi ona do tego, że pola H' i B mają różne jednostki. Uważamy, że wygodniej jest, aby pole H miało takie same jednostki jak pole B, a nie jak namagnesowane M, tak jak to się dzieje w przypadku pola H'. Ale jeżeli ktoś ma zamiar zostać inżynierem i pracować przy konstrukcji transformatorów, elektromagnesów itd., to musi uważać. Znajdzie on wiele książek, w których występuje definicja H zgodna z równaniem (36.14), a nie z na- szą definicją [równanie (36.12)] i znajdzie też wiele innych książek — szczególnie pod- ręczników na temat substancji magnetycznych — które tak wiążą pole B i H, jak my to zrobiliśmy. Trzeba być zawsze ostrożnym i upewnić się, jaką konwencją posługują się w danej książce. Jednym ze sposobów na rozstrzygnięcie tego problemu jest zbadanie, jakimi jednost- kami posługują się w danej książce. Pamiętajmy, że w układzie MKS pole B, a stąd także i nasze pole H, ma jednostkę: jeden weber na metr kwadratowy, równą 10000 Gs. W układzie MKS moment magnetyczny (prąd razy powierzchnia) ma jednostkę: 1 amper- -metr2. Namagnesowanie M ma wówczas jednostkę 1 amper-metr-1. Pole H' ma takie same jednostki jak namagnesowanie M. Widać, że to się zgadza także z równaniem (36.15), ponieważ V ma wymiar odwrotności długości. Ci, którzy mają do czynienia z elektro- magnesami, mają także zwyczaj nazywania jednostki pola H (przy definicji jak dla H ) „jeden amperozwój na metr” — mając na myśli zwoje drutu uzwojenia. Ale „zwój” jest w rzeczywistości liczbą bezwymiarową, tak że tym się nie musimy martwić. Ponieważ nasze pole H jest równe Hje0 c2, to H (w Wb/m2) jest równe, jeżeli się używa układu MKS, 4tt 10-7 H' (w A/m). Wygodniej, być może, jest pamiętać, że H (w Gs) = 0,0126 H (A/m). Jeszcze jedna, okropna rzecz. Wielu z tych, którzy używają naszej definicji pola postanowiło nadać jednostkom H i B różne nazwy! Mimo tego, że pola H i B mają takie same wymiary, to nazywają oni jednostkę pola B gausem, a jednostkę pola H — erstedem
36-2. POLE H 291 Tabela 36.1 Jednostki wielkości magnetycznych [5] = weber na metr2 = 104 gausów [tf] = weber na metr2 = 104 gausów lub 104 erstedów [M] IH'] = amper na metr = amper na metr Wygodne zamiany B (gausów) = 104 B (Wb/m2) ’ H (gausów) = H (erstedów) = 0,0126 H* (A/m) (oczywiście, nazwy pochodzą od nazwisk uczonych: Gaussa i Oersteda). Dlatego też w wielu książkach można znaleźć wykresy, na których pole B jest wykreślone w gausach, a pole H — w erstedach. W rzeczywistości jest to jedna i ta sama jednostka równa 10-4 jednostki MKS. Podsumowanie tych kłopotów z jednostkami magnetycznymi zamie- szczamy w tab. 36.1. 36-3. Krzywa namagnesowania Przyjrzyjmy się teraz kilku prostym sytuacjom, w których pole magnetyczne jest stałe lub w których pola zmieniają się na tyle wolno, że można pominąć wyraz dD/dt w porów- naniu z prądem jprzew. Wówczas pola spełniają równania: V-B = 0 (36.16) VxH = jpraw/60c2, ' (36.17) H = B—M/e0c2. (36.18) Przypuśćmy, że mamy torus (rurę toroidalną) z żelaza^ owinięty cewką z miedzianego drutu, tak jak to pokazano na rys. 36.7a. W drucie płynie prąd /. Jakie jest pole magne- tyczne? Pole magnetyczne będzie głównie zlokalizowane wewnątrz żelaza; linie sił pola B będą tam okręgami takimi, jak to pokazano na rys. 36.7b. Ponieważ strumień pola B jest ciągły, dywergencja pola B jest równa zeru i równanie (36.16) jest spełnione. Z kolei zapiszmy równanie (36.17) w innej postaci, całkując wokół zamkniętej pętli F, pokazanej na rys. 36.7b. Z twierdzenia Stokesa wynika, że {h-Js = —fjpraw-nJa, (36.19) •/ £(\ C J r $ gdzie całkę z j powinno się wziąć po dowolnej powierzchni S, ograniczonej pętlą F. Każdy ^ój uzwojenia przecina tę powierzchnię jeden raz. Każdy zwój daje do całki przyczy- nek równy prądowi I i jeżeli liczba zwojów jest równa N, to całka wynosi NI. Z symetrii
292 36. FERROMAGNETYZM 36.7. a. Cewka z izolowanego drutu, nawinięta na żelazny torus. b. Przekrój torusa, pokazujący linie sił pola naszego zagadnienia wynika, że pole B jest takie samo wokół całej krzywej P; jeżeli za- łoży się, że namagnesowanie, a stąd i pole H są także stałe wzdłuż krzywej P, to równanie (36.19) przybierze postać (36.20) gdzie / jest długością krzywej P. Tak więc 1 NI CQ C l Właśnie dlatego, że pole H, w przypadkach takich jak ten, jest wprost proporcjonalne do prądu magnesującego, czasami nazywa się je polem magnesującym. Potrzebne nam jest .teraz tylko równanie, które wiąże pola H i B. Ale takiego równa- nia nie ma! Oczywiście, mamy równanie (36.18), ale niewielka z niego pociecha, bo nie ma jakiegoś bezpośredniego związku pomiędzy namagnesowaniem M i polem B dla ma- teriału ferromagnetycznego, takiego jak żelazo. Namagnesowanie M zależy od całej historii żelaza, a nie tylko od wartości pola B w danej chwili. A jednak nie wszystko jest jeszcze stracone. Można otrzymać rozwiązania dla pew- nych prostych przypadków. Jeżeli zaczniemy od żelaza nienamagnesowanego, powiedzmy od żelaza, które zostało wyżarzone w wysokiej temperaturze, to w przypadku torusa o prostej geometrii całe to żelazo będzie miało taką samą historię magnetyczną. Wówczas można coś powiedzieć o namagnesowaniu M, a stąd o związku pomiędzy polami B i H z pomiarów doświadczalnych. Pole H w torusie jest równe [równanie (36.20)] iloczynowi stałej i prądu I w uzwojeniu. Pole B można zmierzyć całkując względem czasu siłę elektro- motoryczną w cewce (lub w dodatkowej cewce, nawiniętej na cewce magnesującej, P°" kazanej na rysunku). Ta siła elektromotoryczna jest równa szybkości zmian strumienia pola B, tak że całka z SEM względem czasu jest równa iloczynowi pola B i pola powierzch- ni przekroju torusa.
36-3. KRZYWA NAMAGNESOWANIA 293 Na rysunku 36.8 pokazano zależność pomiędzy polami B i H dla torusa z żelaza mięk- kiego. Gdy na początku się włącza prąd, pole B rośnie wraz ze wzrostem pola H wzdłuż krzywej a. Należy zwrócić uwagę na różne skale na osiach B i H; na początku stosunko- wo małej wartości pola H odpowiada już duże pole B. Dlaczego pole B jest w żelazie tylo- krotnie większe od pola B, które obserwowaliśmy w powietrzu? Wynika to z istnienia dużego namagnesowania M, które jest równoważne dużemu prądowi powierzchniowe- mu w żelazie — pole B pochodzi od sumy tego prądu i prądu przewodnictwa w uzwoje- Iniu. Później omówimy kwestię dlaczego namagnesowanie M powinno być tak duże. Dla większych wartości pola H krzywa namagnesowania ma mniejsze nachylenie. 'Mówimy, że żelazo się nasyca. Przy tych skalach, jakie mamy na rysunku, krzywa zaczyna być prawie równoległa do osi H. W rzeczywistości ona ciągle nieznacznie się podnosi — dla dużych pól pole B staje się proporcjonalne do pola H, przy czym kąt nachylenia krzywej, przy jednakowych skalach dla B i H, przyjąłby wartość 45°. Wtedy nie będzie już dalszego wzrostu namagnesowania M. Nawiasem mówiąc, należy podkreślić, że je- żeli torus byłby wykonany z jakiejś substancji niemagnetycznej, to namagnesowanie M byłoby równe zeru i dla wszystkich pól B byłoby równe H. Pierwszą rzeczą, która się rzuca w oczy, to fakt, że krzywa a na rys. 36.8 — jest to tak zwana krzywa namagnesowania — me ma w żadnym wypadku przebiegu prostego. Ale to jeszcze nic; jeżeli po osiągnięciu nasycenia zmniejszymy prąd w cewce, tak aby pole H powróciło do zera, to pole magnetyczne B będzie opadało wzdłuż krzywej b. Gdy pole H osiągnie wartość zero, ciągle jeszcze będziemy mieli „trochę” pola B. Nawet przy nieobecności prądu magnesującego będziemy mieli w żelazie jakieś pole magnetyczne, a więc żelazo stało się trwale namagnesowane. ujemny, to krzywa B-H będzie w dalszym ciągu przebiegać wzdłuż b, aż żelazo zostanie nasycone w kierunku ujemnym. Jeżeli z po- wrotem powróci się z prądem do zera, to pole B będzie przyjmowało wartości położone wzdłuż krzywej c. Jeżeli będziemy zmieniać natężenie prądu — pomiędzy dużymi warto- ściami dodatnimi a ujemnymi — to krzywa B-H będzie przebiegać tam i z powrotem prawie dokładnie wzdłuż krzywych b i c. Jeżeli jednak będziemy zmieniać pole H w jakiś dowolny sposób, to możemy otrzy- mać bardziej skomplikowane krzywe, które będą na ogół leżeć w obszarze pomiędzy krzy- wymi b i c. Pętlę powstałą na skutek ciągłych oscylacji pól nazywa się pętlą histerezy. Widać, że się nie da napisać związku funk- cyjnego typu B = f(H), ponieważ wartość Pola B w każdej chwili zależy nie tylko od war- tości, jaką ma w tej chwili pole H, ale także Jeżeli teraz podłączy się do cewki prąd 36.8. Typowe krzywe namagnesowania i hi- sterezy dla miękkiego żelaza
294 36. FERROMAGNETYZM od wartości pola H we wszystkich chwilach poprzednich. Naturalnie, namagnesowanie i krzywe histerezy są dla różnych substancji różne. Kształt krzywych zależy w zasadniczy sposób od składu chemicznego substancji, a także od szczegółów jej przygotowania i na- stępującej później „obróbki” fizycznej. Niektóre fizyczne wyjaśnienia tych komplikacji omówimy w następnym rozdziale. 36-4. Indukcyjność cewki z rdzeniem żelaznym Substancje magnetyczne znajdują jedno ze swych najważniejszych zastosowań w obwo- dach elektrycznych, np. w transformatorach, w silnikach elektrycznych itd. Jednym z po- wodów jest to, że za pomocą żelaza możemy „skierowywać” pola magnetyczne dokąd chcemy, a także otrzymywać dużo większe pola magnetyczne dla tego samego prądu elektrycznego. Tak na przykład typowa, „toroidalna” cewka indukcyjna przypomina w dużym stopniu obiekt pokazany na rys. 36.7. Przy tej samej indukcyjności taka cewka może mieć o wiele mniejszą objętość i jej konstrukcja wymaga o wiele mniejszego zużycia miedzi niż dla równoważnej jej „cewki powietrznej”. Ptzy tej samej indukcyjności opór uzwojenia jest o wiele mniejszy i dlatego cewka przypomina bardziej „doskonałą induk- cyjność” — szczególnie dla małych częstości. Działanie takiej cewki można jakościowo zrozumieć bardzo łatwo. Jeżeli przez I oznaczymy prąd w uzwojeniu, to wytworzone wewnątrz pole H jest proporcjonalne do prądu I, tak jak to określa równanie (36.20). Napięcie pomiędzy końcówkami jest związane z polem magnetycznym B — przy po- minięciu oporu uzwojenia napięcie "T jest proporcjonalne do 5B/5Z. Indukcyjność która jest stosunkiem napięciado pochodnej dl/dt (patrz t. II, cz. 1, § 17-7), daje nam więc zależność pomiędzy polami B i H w żelazie. Ponieważ pole B jest wielokrotnie wię- ksze od pola H, indukcyjność jest wielkością dużą. Można podać proste fizyczne wy- jaśnienie dlaczego tak się właśnie dzieje. Otóż mały prąd w cewce, który normalnie wytwo- rzyłby małe pole magnetyczne, wprowadza ład wśród momentów magnetycznych w żela- zie, które układają się wszystkie w tym samym kierunku i wytwarzają prąd „magnetyczny” znacznie większy od zewnętrznego prądu w uzwojeniu. Wygląda to więc tak, jak by w cew- ce płynął o wiele większy prąd niż w rzeczywistości. Jeżeli zmienić kierunek prądu, to wszystkie małe „magnesiki” się przekręcą — wszystkie prądy wewnętrzne zmienią kie- runek — i powstanie wyindukowana SEM, o wiele większa niż w przypadku cewki bez rdzenia żelaznego. leżelibyśmy chcieli obliczyć indukcyjność, to można to zrobić poprzez obliczenie energii, tak jak to opisano w § 17-8 (t. II, cz. 1). Szybkość, z jaką energia jest dostarczana ze źródła prądu, jest równa I"f. Napięcie V równe jest iloczynowi p®' wierzchni przekroju rdzenia A, liczby zwojów N i pochodnej dBJdt. Z równania (36.20) I=(e0c2I/N)H. Zatem dU dB dt dt Całkując względem czasu mamy U = (eoc2lA) f HdB. (36.21)
36-4. INDUKCYJNOŚĆ CEWKI Z RDZENIEM ŻELAZNYM 295 Zauważmy, że IA jest objętością torusa, tak więc wykazaliśmy, że gęstość energii, u = = tT/objętość, w substancji magnetycznej jest określona przez u = e0c2$HdB. (36.22) Warto zwrócić uwagę na pewne ciekawe zjawisko, które się tu kryje. Jeżeli używamy prądów zmiennych, to namagnesowanie żelaza przebiega po pętli histerezy. Ponieważ pole B nie jest jednoznaczną funkcją pola H, całka $HdB wokół jednego pełnego obiegu nie jest równa zeru. Jest ona równa polu powierzchni ograniczonej na wykresie pętlą histerezy. Tak więc źródło zasilające dostarcza w każdym obiegu pewną wypadkową ener- gię, proporcjonalną do pola powierzchni ograniczonej pętlą histerezy i energia ta jest „tracona”. Zostaje ona stracona z przebie- gów elektromagnetycznych, ale odnajduje się jako ciepło w żelazie. Nazywa się ona stratą histerezy. Aby te straty energii były małe, 36.9. Pętla histerezy, która nie osiąga war- tości nasycenia pętla histerezy powinna być możliwie jak najwęższa. Jeden ze sposobów na zmniejszenie pola powierzchni ograniczonej pętlą polega na zmniejszeniu maksymalnego pola B, które jest osiągane w każdym obiegu. Dla mniejszych wartości maksymalnych pola B krzywa histerezy wygląda tak, jak na rys. 36.9. Są także wytwarzane specjalne materiały, które mają bardzo wąską pętlę histerezy. Tak zwane żelaza transformatorowe — stopy żelaza z małą domieszką krzemu — mają właśnie tę własność. Dla jakiej cewki indukcyjnej z rdzeniem, „przebiegającej” przez pętlę histerezy, zwią- zek pomiędzy polami B i H można przybliżyć przy pomocy równania liniowego. Zwykle się Pisze D U UL B = fiH. (36.23) Stała fi nie jest tu, tak jak dawniej, momentem magnetycznym. Nazywa się ją przenikal- nością magnetyczną żelaza (czasem przenikalnością względną). Przenikalność zwykłego żelaza jest rzędu kilku tysięcy. Istnieją pewne specjalne stopy, takie jak „supermaloj”, które mogą mieć przenikalność nawet rzędu miliona. Jeżeli skorzystać z przybliżenia B = uH w równaniu (36.21), to energię w toroidalnej cewce indukcyjnej można zapisać jako U = (e0c2lA)fi J HdH = (eoc2lA)^~ Tak więc gęstość energii jest w przybliżeniu równa u e0c2 fiH2. (36.24) 2
296 36. FERROMAGNETYZM Można teraz przyrównać energię z równania (36.24) do energii cewki indukcyjnej i wyliczyć Stąd JP. Otrzymujemy = (£0c2ZA)/z Podstawiając Hjl z równania (36.20) mamy toC2l (36.25) Indukcyjność jest proporcjonalna do /z. Jeżeli potrzebne nam są cewki indukcyjne do takich układów jak wzmacniacze drgań o częstościach akustycznych, to musimy się sta- rać, by pracować na takiej pętli histerezy, dla której zależność B-H jest możliwie jak naj- bardziej liniowa. [Pamiętamy, że w rodź. 50 tomu I (cz. 2) mówiliśmy o generacji skła- dowych harmonicznych w układach nieliniowych.] Dla takich celów równanie (36.23) jest pożytecznym przybliżeniem. Z drugiej strony, jeżeli się chce generować składowe harmoniczne, to można używać cewki indukcyjnej, która pracuje celowo w sposób wy- soce nieliniowy. Wówczas musi się używać pełnych krzywych B-H (tzn. takich, które osiągają wartość nasycenia) i analizować to, co się dzieje, metodami graficznymi lub nu- merycznymi. W „transformatorze” często osadza się dwie cewki na tym samym torusie, czyli rdze- niu, z materiału magnetycznego. (Dla większych transformatorów wygodniej jest mieć rdzeń „prostokątny”.) Zmienny prąd w uzwojeniu „pierwotnym” powoduje zmiany pola magnetycznego w rdzeniu, które z kolei indukują siłę elektromotoryczną w uzwojeniu „wtórnym”. Ponieważ strumień pola magnetycznego przez każdy zwój obu uzwojeń jest taki sam, stosunek sił elektromotorycznych w obu uzwojeniach jest równy stosunkowi liczb zwojów obu uzwojeń. Napięcie przyłożone do uzwojenia pierwotnego zostaje prze- transformowane w jakieś inne napięcie w uzwojeniu wtórnym. Ponieważ w rdzeniu po- trzebny jest pewien wypadkowy prąd, aby wytworzyć wymaganą zmianę pola magnetycz- nego, to suma algebraiczna prądów w obu uzwojeniach ustala się i jest równa pożąda- nemu prądowi „magnesującemu”. Jeżeli prąd pobierany z uzwojenia wtórnego się zwię- ksza, to prąd pierwotny musi się też odpowiednio zwiększyć — na równi z transformacją napięć zachodzi także i „transformacja” prądów. 36-5. Elektromagnesy ( Omówmy teraz pewną sytuację praktyczną, która jest nieco bardziej skomplikowana. Przypuśćmy, że mamy elektromagnes, o dość standardowym kształcie, taki jak pokazano na rys. 36.10; jest to jarzmo żelazne, w kształcie litery C, na które nawinięto cewkę o dużej liczbie zwojów. Jakie jest pole magnetyczne B w szczelinie? Jeżeli szerokość szczeliny jest mała w porównaniu z innymi wymiarami, to można, w pierwszym przybliżeniu, założyć, że linie sił pola B przebiegają dookoła jarzma po pętli, tak samo jak w torusie. Będą one wyglądać mniej więcej tak, jak to pokazano na
36-5. ELEKTROMAGNESY 297 rys. 36.1 la. W samej szczelinie linie mają tendencję do pewnego rozszerzania się, ale je- żeli szczelina jest wąska, to efekt ten jest mały. Można z powodzeniem założyć, że stru- mień pola B przez każdy przekrój jarzma jest stały. Jeżeli powierzchnia przekroju jarzma jest wszędzie taka sama i jeżeli pominąć efekty w szczelinie lub na rogach jarzma, to można powiedzieć, że pole B jest stałe w całym jarzmie. Pole B będzie więc miało także tę samą wartość w szczelinie. Wynika to z równania (36.16). Wyobraźmy sobie zamkniętą powierzchnię S, pokazaną na rys. 36.1 Ib, której jedna „ścianka” znajduje się w szczelinie, a druga w żelazie. Całkowity strumień pola B przez tę powierzchnię musi być równy zeru. Oznaczając przez pole w szczelinie, a przez B2 pole w żelazie mamy Bi Ai— B2A2 = 0. Ponieważ Ai — A2 (w naszym przybliżeniu), to stąd wynika, że = B2. Przyjrzyjmy się teraz polu H. Możemy znów ikorzystać z równania (36.19) biorąc całkę krzy- woliniową wokół krzywej T przedstawionej na łys. 36.1 Ib. Tak jak przedtem, po prawej stro- nie wystąpi NI, iloczyn liczby zwojów i natęże- nia prądu. Jednakże teraz pole H będzie różne w żelazie i w powietrzu. Oznaczając przez H2 pole w żelazie, a przez l2 długość krzywej obie- gającej dookoła jarzmo, otrzymamy, że ta część 36.10. Elektromagnes 36.11. Przekrój elektromagnesu I
"W" 36. ferromagnetyzm 298 ^6.12. Znajdowanie rozwiązania dla pola elektromagnesie krzywej da do całki przyczynek H2l2 Ozna- czając zaś przez Ht pole w szczelinie, a przez Zi szerokość szczeliny, otrzymujemy od szcze- liny przyczynek Mamy więc NI Hili+H2l2 =-------(36.26) Ponadto jeszcze wiemy, że namagneso- wanie w powietrznej szczelinie można pomi- nąć, tak że = H2. Ponieważ BL = B2, równanie (36.26) przybiera postać NI B2ll+H2l2 =-------(36.27) C Ciągle jeszcze mamy dwie niewiadome. Aby znaleźć pola B2 i H2, potrzebny nam jest jeszcze jeden związek, a mianowicie zwią- zek, który określa zależność pomiędzy po- lami B i H w żelazie. Gdybyśmy mogli dokonać przybliżenia B2 = (iH2, potrafilibyśmy rozwiązać równa- nie (36.27) algebraicznie. Rozwiążmy je jednak dla ogólnego przypadku, w którym krzywa namagnesowania żelaza wygląda tak, jak krzywa z rys. 36.8. Potrzebne nam jest rozwiązanie układu równań składającego się z danego graficznie równania funkcyjnego i z równania (36.27). Można je znaleźć robiąc wykres równania (36.27) na tym samym wykresie, na którym mamy pętlę histerezy, tak jak to zrobiono na rys. 36.12.'Nasze rozwiązania odpowiadają punktom przecięcia tych dwóch krzywych. Dla jakiegoś danego z góry prądu / funkcja (36.27) jest linią prostą, oznaczoną war- tością parametru I > 0 na rys. 36.12. Prosta ta przecina oś H (B2 = 0) w punkcie H2 = = NI/e0 c2l2, a jej nachylenie wynosi — /2/Zi. Dla innych prądów prosta ta będzie po pro- stu przesunięta równolegle. Z rysunku 36.12 widać, że dla danego z góry prądu istnieje kilka różnych rozwiązań, które zależą od historii elektromagnesu. Jeżeli magnes dopiero co zbudowaliśmy i włączyliśmy prąd o natężeniu I, to pole B2 (a więc i pole Br) będzie miało wartość określoną przez punkt a. Jeżeli doszliśmy początkowo do bardzo dużych wartości prądu, a potem powróciliśmy do I, to pole będzie określone przez punkt 6. Jeżeli zaś mieliśmy w magnesie najpierw prąd ujemny, a następnie zwiększyliśmy jego natę- żenie do wartości /, to pole jest dane przez punkt c. Pole w szczelinie będzie więc zależeć od tego, co „w przeszłości” robiliśmy z elektromagnesem. Gdy natężenie prądu w magnesie jest równe zeru, to wykresem związku pomiędzy polami B2 i H2, danego równaniem (36.27), jest prosta oznaczona na wykresie parame- trem I = 0. I tym razem można mieć różne rozwiązania. Jeżeli jeszcze przedtem żelazo zostało nasycone, to w magnesie mogło pozostać znaczne pole resztkowe, określone
36-5. ELEKTROMAGNESY 299 przez punkt d. Można wtedy z elektromagnesu zdjąć cewkę i otrzymać trwały magnes. Widać, że dla dobrego trwałego magnesu potrzebny jest materiał z szeroką pętlą histe- rezy. Pewne specjalne stopy, takie jak Alnico V, mają pętle bardzo szerokie. 36-6. Namagnesowanie spontaniczne Przechodzimy teraz do problemu: jak to się dzieje, że małe pole magnetyczne wytwa- rza tak duże namagnesowanie w materiałach ferromagnetycznych? Za namagnesowanie materiałów ferromagnetycznych, takich jak żelazo i nikiel, odpowiedzialny jest moment magnetyczny elektronów z powłoki zewnętrznej atomu. Każdy elektron ma moment magnetyczny p., równy iloczynowi q)2m, czynnika g elektronu i momentu pędu elektro- nu J. Dla pojedynczego elektronu, który nie doznaje jakiegoś wypadkowego ruchu orbi- talnego, g = 2, a składowa momentu pędu J w dowolnym kierunku — powiedzmy w kierunku osi z — jest równa ±h/2, tak że składowa momentu magnetycznego p wzdłuż osi z jest równa u . = — = 0,928-10~23 A-m2. (36.28) 2m W atomie żelaza w rzeczywistości dwa elektrony dają przyczynki do ferromagnetyzmu; aby więc uprościć nasze rozważania, będziemy mówić o niklu, który tak jak żelazo, jest ferromagnetykiem, ale ma tylko jeden elektron w powłoce wewnętrznej (rozważania te można łatwo rozszerzyć na przypadek żelaza). Otóż rzecz wygląda tak, że w obecności zewnętrznego pola B atomowe momenty magnetyczne dążą do ułożenia się wzdłuż linii sił pola, ale są wytrącane z tego uporząd- kowania przez ruchy cieplne, tak samo jak opisaliśmy to dla substancji paramagnetycz- nych. W poprzednim rozdziale stwierdziliśmy, że równowaga pomiędzy polem magne- tycznym, próbującym uporządkować atomowe momenty magnetyczne, i ruchami cieplny- mi, próbującymi zniszczyć to uporządkowanie, powodowała to, że średni moment magne- tyczny na jednostkę objętości wynosił ufi M = Aptgh-y-^. (36.29) KI Przez Ba rozumiemy tu pole działające na atom, a kT jest energią Boltzmanna. W teorii paramagnetyzmu za Ba wstawialiśmy samo pole B, pomijając działającą na dany atom tę część pola, za którą były odpowiedzialne atomy sąsiednie. W przypadku ferromagnetyzmu sprawa się komplikuje. Za Ba — pole działające na pojedynczy atom — nie można tu już postawić średniego pola magnetycznego w żelazie. Zamiast tego trzeba zrobić tak, jak to zrobiliśmy w przypadku dielektryków — trzeba znaleźć pole lokalne działające na pojedynczy atom. Gdyby się chciało przeprowadzić dokładne obliczenia, to powinno się dodać wszystkie pola działające na dany atom, a pochodzące od wszystkich innych atomów sieci krystalicznej. Ale tak jak dla dielektryków dokonamy i tu przybliżenia i przyjmiemy, że pole działające na atom jest takie samo jak pole, które znaleźlibyśmy
300 36 FERROMAGNETYZM w małym kulistym otworze w materiale — przy założeniu, że obecność tego otworu nie zmienia momentów magnetycznych atomów sąsiednich. Można by pomyśleć, że zgodnie z rozważaniami z rozdz. 11 (t. II, cz. 1) powinniśmy mieć związek 1 M Botwór = B+ V----2 (fałsz!). 3 e0c2 Ale to nie jest prawdą. Można jednak posłużyć się wynikami rozdz. 11, ale trzeba dokonać dokładnego porównania równań rozdz. 11 z równaniami niniejszego rozdziału, opisu- jącymi ferromagnetyzm. Zestawmy odpowiadające sobie równania. Dla obszarów, gdzie nie ma ani prądów przewodnictwa, ani ładunków, mamy: ' Elektrostatyka Ferromagnetyzm statyczny (P \ E-|---1 = 0, VB = 0, «o/ (36.30) / M \ i.y . t VxE = 0; Vx|B----------1 = 0. \ £oc / Można przyjąć, że te dwa układy równań są analogiczne, jeżeli się dokona następujących czysto matematycznych przyporządkowań: M P E>B---------E+-----------> B. £0c £o Jest to równoważąc dokonaniu takiej oto analogii: ’ * E > H, P->M/c2. ‘ (36.31) Innymi słowy, jeżeli zapisać równania ferromagnetyzmu w postaci / M \ V- H+-------- =0, \ £oC / (36.32) VxH = 0, to będą one przypominać równania elektrostatyki. Ta czysto algebraiczna odpowiedniość wywołała w przeszłości sporo nieporozumień. Ludzie byli skłonni uważać, że to właśnie H było „polem magnetycznym”. Ale, jak to widzieliśmy, polami podstawowymi fizycznie są B i E, a H jest pojęciem pochodnym. Chociaż zatem równania są analogiczne, to ich treść fizyczna nie jest analogiczna. Nie powinno to jednak wstrzymywać nas od skorzystania z zasady, że takie same równania mają takie same rozwiązania. Można skorzystać z naszych poprzednich wyników dla pola elektrycznego w dielek- trykach w otworach o różnych kształtach; na rys. 36.1 zamieszczono ich podsumowanie, by znaleźć pole H w takich samych otworach. Znając pole H można określić pole B-
36-6. NAMAGNESOWANIE SPONTANICZNE 301 Tak na przykład (korzystając z wyników, które zebraliśmy w § 36-1) pole H w cien- kiej szczelinie, równoległej do namagnesowania M, jest takie samo jak pole H w sub- stancji, T_j _____ u “otwór “substancja • Ale ponieważ namagnesowanie M w otworze jest równe zeru, to - M ®otwór ®substancja ~ ‘ (36.33) E()C Z kolei, dla otworu w kształcie krążka prostopadłego do namagnesowania M, mamy _ P ' ^otwór ^dielektryki ’ eO co można „przetłumaczyć” na M T_J _ T_J | ____ ’ “otwór “substancja ‘ 2 cqC lub, wyrażając to poprzez pole B, ® otwór ®substancja • (36.34) Na koiiiec, dla otworu kulistego, w analogii do równania (36.3), będziemy midi M FT = W i __________________ “otwór -“substancja ‘ 2 ÓEqC lub ®otwór = ®substancja 7 2 ' (36.35) 3 Eo C Ten ostatni wynik różni się wyraźnie od wyniku, jaki otrzymaliśmy dla pola E w otworze kulistym. Można oczywiście te same wyniki otrzymać w sposób bardziej „fizyczny”, a miano- wicie korzystając bezpośrednio z równań Maxwella. Tak na przykład równanie (36.34) wynika bezpośrednio z warunku V-B = 0. (Należy wziąć powierzchnię gaussowską, która w połowie przechodzi wewnątrz substancji, a w połowie na zewnątrz niej.) Podobnie można dostać równanie (36.33), biorąc całkę krzywoliniową wzdłuż krzywej, która prze- biega wzdłuż otworu i powraca następnie poprzez wnętrze substancji. Fizycznie rzecz biorąc, pole w otworze jest zmniejszone ze względu na prądy powierzchniowe, które są dane przez rotację VxM. Pozostawiamy czytelnikowi wykazanie, że równanie (36.35) można także otrzymać rozważając efekty prądów powierzchniowych na granicy wnęki kulistej. Przy wyznaczaniu z równania (36.29) namagnesowania odpowiadającego równowa- dze okazuje się, że najwygodniej jest mieć do czynienia z polem H. Przyjmujemy więc M . Ba = H+ź--------, (36.36)
302 36. FERROMAGNETYZM 36.13. Rozwiązanie graficzne równań (36.37) i (36.38) 36.14. Znajdowanie, namagnesowania, gdy pole H = 0 W przybliżeniu otworu kulistego mielibyś- my 2 = i, ale jak zobaczymy, będziemy chcieli później posłużyć się tym wzo- rem dla pewnej innej wartości, pozosta- wiamy więc A jako parametr. Weźmiemy również wszystkie pola w jednym i tym samym kierunku, wtedy nie będziemy się musieli troszczyć o kierunki wektorów. Je- żeli teraz podstawilibyśmy równanie (36.36) do równania (36.29), to otrzymali- byśmy jedno równanie, które wiąże ze so- bą namagnesowanie M i pole magnesu- jące H: M = Np tgh AM/eoc2\ , kT /' Jest to jednak równanie, którego nie da się rozwiązać bezpośrednio; zrobimy to więc graficznie. Nadajmy naszemu zagadnieniu postać bardziej ogólną, zapisując równanie (36.29) jako —— = tghx, (36.37) ^nas gdzie Mnas jest wartością namagnesowa- nia w stanie nasycenia, a mianowicie Mnas = Np, a x = pBJkT. Zależność stosunku M/Afnas od x pokazuje krzywa a na rys. 36.13. Można także wyrazić zmienną x jako funkcję M, podstawiając Bo z równania (36.36), a mianowicie (36.38) Dla każdej danej z góry wartości pola H zależność pomiędzy A//Mnas a zmienną x jest dana linią prostą, która przecina oś x dla x — pHjkT i której nachylenie wynosi E^kTjp/.M^,.. Dla każdego danego z góry pola H będziemy mieli taką linię prostą, jak prosta oznaczona literą b na rys. 36.13. Punkt przecięcia krzywych a i b daje nam jako rozwiązanie wartość stosunku Tym samym zagadnienie to zostało rozwiązane. Zastanówmy się teraz, jak będzie się zmieniać rozwiązanie w zależności od okolicz- ności. Zacznijmy od przypadku, gdy H = 0. Mogą tu być dwie różne sytuacje, pokazane przez proste b2 i b2 na rys. 36.14. Z równania (36.38) widać, że nachylenie prostej jest proporcjonalne do temperatury bezwzględnej T. A zatem, dla wysokich temperatur nue-
36-6. NAMAGNESOWANIE SPONTANICZNE 303 libyśmy tego rodzaju prostą jak br. Nasze rozwiązanie ma wówczas postać Af/Afnas = 0, czyli gdy pole magnesujące jest równe zeru, to i namagnesowanie jest równe zeru. Ale dla niskich temperatur powinniśmy otrzymać taką prostą jak b2 — i wówczas będziemy mieli dwa rozwiązania na Af/Mnas: jedno — to M/Mms = 0, a drugie odpowiada wartoś- ciom MJMn3S bliskim jedności. Okazuje się, że tylko górne rozwiązanie jest stabilne, co można sprawdzić rozważając małe odchylenia od wartości tych rozwiązań. Z tego, co powiedzieliśmy, wynika, że substancja magnetyczna powinna się namagneso- wać spontanicznie w dostatecznie niskich temperaturach. Krótko mówiąc, gdy ruchy ciep- lne są dostatecznie małe, sprzężenie pomiędzy atomowymi momentami magnetycznymi powoduje, że wszystkie te momenty ustawiają się równolegle do siebie. Otrzymujemy wtedy trwale namagnesowaną substancję, analogiczną do ferroelektryków, które omawialiśmy w rozdz. 11 (t. II, cz. 1). Jeżeli zacząć od wysokich temperatur, a następnie przechodzić w stronę niższych temperatur, to dojdziemy do pewnej temperatury krytycznej, nazywanej temperaturą Curie, Tc, w której się nagle pojawiają własności ferromagnetyczne. Temperatura ta odpowiada na rys. 36.14 prostej b3, która jest styczną do krzywej a (w punkcie 0) i wobec tego jest nachylona do osi x pod kątem 45°. Temperatura Curie jest określona wzorem e0 c2kTc (36.39) Można, jeżeli ktoś ma na to ochotę, zapisać równanie (36.38) prościej, wstawiając doń Tc: pH kT (36.40) Chcemy teraz zobaczyć, co się dzieje dla małych pól magnesujących H. Można to odczy- tać z rys. 36.14, jeżeli się przesunie nasze proste trochę na prawo. Dla przypadku niskiej temperatury punkt przecięcia przesunie się trochę wzdłuż tej części krzywej a, która ma małe nachylenie, i zmiana namagnesowania M będzie stosunkowo mała. Jednakże dla przypadku wysokiej temperatury punkt przecięcia przebiega wzdłuż ostro nachylonej części krzywej a i M będzie się zmieniać stosunkowo dość gwałtownie. Można w istocie przybliżyć tę część krzywej a linią prostą o nachyleniu 45° i napisać M pH Tc I M \ Ir + Stąd zaś można obliczyć M pH ~ k(T-TJ (36.41) A* Otrzymaliśmy prawo, które przypomina nieco prawo, jakie mieliśmy dla paramagnetyzmu. Dla paramagnetyzmu bowiem mieliśmy f -^nas (36.42)
304 36. FERROMAGNETYZM Jedna różnica polega tu na tym, że namagnesowanie jest teraz wyrażone poprzez pole H które zawiera w sobie część efektów pochodzących od wzajemnego oddziaływania ato- mowych momentów magnetycznych, ale główną różnicą jest tu fakt, że namagnesowanie jest odwrotnie proporcjonalne do różnicy pomiędzy T i Tc, a nie do samej temperatury bezwzględnej. Pominięcie oddziaływań wzajemnych pomiędzy sąsiednimi atomami od- powiada przyjęciu A = 0, co jak wynika z równania (36.39), odpowiada przyjęciu Tc = o. Wówczas wyniki są takie same, jak te, które otrzymaliśmy w rozdz. 35. Nasz obraz teoretyczny można porównać z danymi doświadczalnymi dla niklu. W do- świadczeniach zaobserwowano, że własności ferromagnetyczne niklu znikają, gdy jego temperatura przekracza 631° K. Porównajmy tę wielkość z temperaturą Tc, obliczoną z równania (36.37). Pamiętając, że Mnas = uN mamy T c ke0c2 Biorąc gęstość i ciężar atomowy niklu otrzymujemy N = 9,1 • 1028 m-3. Podstawiając /z z równania (36.28) i przyjmując A = | otrzymujemy Tc = 0,24°K. Mamy rozbieżność o czynnik równy około 2600! Nasza teoria ferromagnetyzmu zupełnie upada. Można próbować „podreperować” naszą teorię, tak jak zrobił Weiss, mówiąc, że z pewnych nieznanych powodów 2 nie jest równe ale |-2600, czyli około 900. Okazuje się, że podobne wartości dostaje się dla innych substancji, np. dla żelaza. Aby zobaczyć, co to oznacza, powróćmy do równania (36.36). Widać, że duża wartość 2 oznacza, że Ba — pole lokalne działające na atom, jest wielokrotnie większe, niż można by się tego spodzie- wać. W istocie, przyjmując H = B—Mleoc2 mamy £0<?2 Zgodnie z naszą koncepcją pierwotną, przy 2 = |, namagnesowanie lokalne M zmniejsza efektywne pole Ba o wartość — j(Af/e0)- Gdyby nawet więc nasz model otworu kulistego nie był bardzo dobry, to i tak należałoby się spodziewać jakiegoś zmniejszenia pola elek- trycznego. Zamiast więc próbować tłumaczyć zjawisko ferromagnetyzmu, musimy sobie wyobrazić, że namagnesowanie pola wielokrotnie zwiększa pole lokalne — gdzieś rzędu ty- siąc lub jeszcze więcej razy. Wydaje się, że nie ma żadnego sensownego sposobu na wytwo- rzenie tak olbrzymich pól działających na atom, a nawet pól o właściwym znaku! Widać jasno, że nasza „magnetyczna” teoria ferromagnetyzmu jest jakimś przygnębiającym nie- porozumieniem. Musimy zatem dojść do wniosku, że ferromagnetyzm ma coś współ' nego z jakimś niemagnetycznym oddziaływaniem pomiędzy obracającymi się wokół oSI elektronami w atomach z sobą sąsiadujących. Te oddziaływania muszą wywołać wśród pobliskich spinów silną tendencję do ułożenia się wzdłuż jednego kierunku. Przekonamy się później, że ma to coś wspólnego z mechaniką kwantową i zasadą wykluczania Paulieg0- i
36-6. NAMAGNESOWANIE SPONTANICZNE 305 36.15. Namagnesowanie spontaniczne jako funk- cja temperatury (dla niklu) Na koniec zobaczmy, co się dzieje w niskich temperaturach — dla T < Tc. Widzieliśmy, że nastąpi tam namagneso- wanie spontaniczne — nawet przy H = = 0 — określone przez punkt przecięcia się krzywych a i b2 z rys. 36.14. Jeżeli obli- czy się namagnesowanie M dla różnych temperatur — a więc zmieniając nachyle- nie prostej b2 — otrzyma się krzywą teore- tyczną, pokazaną na rys. 36.15. Ta krzywa będzie taka sama dla wszystkich substancji ferromagnetycznych, dla których moment magnetyczny pochodzi od jednego elek- tronu. Krzywe dla innych substancji róż- nią się od niej tylko w niewielkim stopniu. W granicy dla T dążącego do zera bez- względnego, Afdąży do Afnas.Ze wzrostem temperatury namagnesowanie maleje, dochodząc do zera w temperaturze Curie. Punkty na rys. 36.15 są wynikami doświadczalnymi dla niklu. Pasują onecałkiem dobrze do krzy- wej teoretycznej. Chociaż więc nawet nie rozumiemy podstawowego mechanizmu zja- wiska, to wydaje się, że ogólne cechy naszej teorii są poprawne. Na koniec, w naszych próbach zrozumienia ferromagnetyzmu napotykamy jeszcze jedną przykrą rozbieżność. Znaleźliśmy, że powyżej pewnej temperatury ośrodek powi- nien się zachowywać tak, jak substancja paramagnetyczna, z namagnesowaniem M pro- porcjonalnym do pola H (lub B), a poniżej tej temperatury ośrodek powinien się spon- tanicznie namagnesować. Ale to się nie zgadza z wynikami naszych pomiarów dla krzy- wej namagnesowania żelaza. Żelazo stało się trwale namagnesowane dopiero po tym, jak je „namagnesowaliśmy”. A zgodnie z naszymi dopiero co omówionymi koncepcjami powinno się ono było samo namagnesować! Coś tu jest nie w porządku. No cóż, okazuje się, że jeżeli się przyjrzeć dostatecznie małemu kryształowi żelaza lub niklu, to się okaże, że jest on rzeczywiście całkowicie namagnesowany! Ale w dużych kawałkach żelaza jest wiele takich małych obszarów czyli „domen”, które są namagnesowane w różnych kierun- kach, tak że na dużą skalę średnie namagnesowanie jest równe zeru. Jednakże w każdej małej domenie żelazo ma „wbudowane” namagnesowanie, z M prawie równym Konsekwencją tej struktury domenowej jest fakt, że własności makroskopowe dużych ka- wałków substancji różnią się całkowicie od własności mikroskopowych, którymi się w rze- czywistości zajmowaliśmy. W następnym rozdziale opowiemy o występujących w praktyce własnościach obiektów makroskopowych, utworzonych z substancji magnetycznych. 20 — Wykłady z fizyki
37 ' substancje magnetyczne i i 37-1. Istota ferromagnetyzmu*' W rozdziale tym omówimy zachowanie się i osobliwości substancji ferromagnetycz- nych i innych dziwnych substancji magnetycznych. Zanim jednak przejdziemy do tego ostatniego tematu, przypomnimy pokrótce niektóre problemy dotyczące ogólnej teorii momentów magnetycznych, które poznaliśmy w poprzednim rozdziale. Przede wszystkim, wyobrażamy sobie, że za magnetyzm są odpowiedzialne prądy ato- mowe wewnątrz substancji, a następnie prądy te opisujemy przy pomocy objętościowej gęstości prądu jmag = VxM. Należy jednak podkreślić, że powyższy obraz nie przed- stawia rzeczywistej sytuacji. Kiedy namagnesowanie jest stałe, prądy w rzeczywistości nie znoszą się dokładnie, wirujące bowiem prądy elektronu w jakimś atomie i wirujące prądy elektronu w innym atomie nie nakładają się w taki sposób, że ich suma jest dokładnie równa zeru. Nawet wewnątrz pojedynczego atomu rozkład magnetyzmu nie jest „gładki”. Tak na przykład w atomie żelaza namagnesowanie jest rozłożone w mniej lub bardziej kulistej powłoce, oddalonej nie za blisko, ale i nie za daleko od jądra. Tak więc, magne- tyzm materii jest rzeczą bardzo skomplikowaną w swych szczegółach; jest on bardzo nie- regularny. Jesteśmy jednak zmuszeni pominąć teraz te szczegóły prowadzące do złożoności zjawisk i opisać zjawiska z makroskopowego, „uśrednionego” punktu widzenia. Wówczas prawdą jest, że w jakimś obszarze wewnętrznym średni prąd przypadający na jakąś skoń- czoną powierzchnię, która jest duża w porównaniu z atomem, jest równy zeru, gdy M = 0. Tak więc to, co będziemy rozumieć przez takie pojęcia jak namagnesowanie przypadające na jednostkę objętości, czy przez gęstość prądu jmag i inne, na rozważanym przez nas obec- ł) Patrz C. Kittel, Wstęp do fizyki ciała stałego, PWN, Warszawa 1970 (thim. z jęz. angielskiego). (Przyp. red. wyd. polskiego.)
37-1. ISTOTA FERROMAGNETYZMU 307 | nie poziomie będzie oznaczało średnią po obszarze, który jest duży w porównaniu z ob- ! szarem przestrzeni zajmowanym przez pojedynczy atom. W poprzednim rozdziale odkryliśmy także, że substancja ferromagnetyczna ma nastę- pującą interesującą własność: powyżej pewnej temperatury substancja ta nie jest silnie magnetyczna, podczas gdy poniżej tej temperatury substancja staje się magnetyczna. Można to łatwo zademonstrować. W temperaturze pokojowej kawałek drutu niklo- wego jest przyciągany przez magnes. Jeżeli jednak drut ten podgrzewać nad palnikiem ( gazowym powyżej temperatury Curie dla niklu, drut staje się niemagnetyczny i nie jest , już przyciągany, nawet jeżeli go umieścić bardzo blisko magnesu. Jeżeliby pozostawić \ ten kawałek niklu w pobliżu magnesu i pozwolić mu się oziębić, to w pewnej chwili jego temperatura spadnie poniżej temperatury krytycznej i nikiel zostanie nagle znowu przy- ciągnięty przez magnes! Ogólna teoria ferromagnetyzmu, którą się będziemy posługiwać, zakłada, że za na- magnesowanie odpowiedzialny jest spin elektronu. Elektron ma spin połówkowy i niesie z sobą moment magnetyczny równy jednemu magnetonowi Bohra; /z = /zB = qeTi]2m. Spin elektronu może być skierowany albo „w górę”, albo „w dół”. Ponieważ ładunek elektronu jest ujemny, to gdy spin elektronu jest skierowany „w górę”, elektron ma ujemny moment magnetyczny, a kiedy jego spin jest skierowany ,,w dół” — moment magnetyczny dodatni. Na podstawie naszych zwykłych umów moment /z elektronu jest liczbą ujemną. Stwierdziliśmy, że energia orientacji dipola magnetycznego w danym przyłożonym polu B jest równa — (i-B, ale energia elektronów obracających się wokół osi zależy również od uporządkowania sąsiednich spinów. Jeżeli w żelazie moment magnetyczny jakiegoś atomu jest skierowany ,,w górę”, to istnieje bardzo silna tendencja, że moment sąsiadującego z nim atomu będzie także zwrócony „w górę”. Właśnie dzięki temu żelazo, kobalt i nikiel są tak silnie magnetyczne — wszystkie momenty magnetyczne chcą być do siebie równo- ległe i mieć ten sam zwrot. Pierwsze pytanie, jakie się w związku z tym nasuwa: dlaczego tak jest? Wkrótce po rozwinięciu się mechaniki kwantowej zauważono., że istnieje bardzo silna siła pozorna — nie jest to żadna siła magnetyczna ani jakiś inny rodzaj siły rżeczywistej, lecz tylko pewna siła pozorna, starająca się ułożyć spiny sąsiednich elektronów przeciw- nie względem siebie. Te siły są ściśle związane z chemicznymi siłami walencyjnymi. Jest taka zasada w mechanice kwantowej, nazywana zasadą wykluczania, która mówi, że dwa elektrony nie mogą zajmować dokładnie takiego samego stanu, a więc nie mogą one być w takich samych warunkach, jeżeli chodzi o lokalizację i orientację spinu*’. Jeżeli na przykład oba elektrony znajdują się w tym samym punkcie, to muszą mieć spiny ułożone przeciwnie. Jeżeli zatem w przestrzeni pomiędzy atomami istnieje taki obszar, gdzie elek- trony chętnie się skupiają (tak jak w wiązaniu chemicznym), i chcemy wprowadzić jeszcze jeden elektron tam, gdzie już się znajduje jakiś elektron, to można to tylko zrobić tak, aby spin tego drugiego elektronu był skierowany przeciwnie do spinu elektronu pierwszego. Zgodne co do zwrotu ułożenie spinów jest niezgodne z tą zasadą, chyba że elektrony są od *’ Będzie o tym mowa w t. III Wykładów z fizyki (przekład polski w przygotowaniu). (Przyp. red. wydania polskiego)
308 37. SUBSTANCJE MAGNETYCZNE siebie oddalone. W wyniku tego para elektronów położonych blisko siebie, o zgodnie skierowanych spinach, ma o wiele więcej energii niż para elektronów o spinach skierowa- nych przeciwnie; wypadkowy efekt jest taki, jak gdyby istniała pewna siła próbująca obró- cić jeden ze spinów o 180°. Czasem tę siłę obracającą spin nazywamy silą wymienną, ale wówczas cała sprawa wygląda jeszcze bardziej tajemniczo -- nie jest to zbyt dobre określe- nie. Dążenie elektronów do układania swych spinów w kierunkach przeciwnych wynika po prostu z zasady wykluczania. W istocie, stanowi to wytłumaczenie braku magnetyzmu we wszystkich prawie substancjach! Spiny elektronów swobodnych, znajdujących się na zewnątrz atomów, dążą bardzo silnie do wzajemnego „kasowania się”, ustawiając się w kierunkach przeciwnych. Problem polega na wyjaśnieniu, dlaczego dla takich substancji jak żelazo sytuacja jest akurat przeciwna do tej, której należałoby się spodziewać. Ten domniemany efekt uporządkowania uwzględniliśmy dodając odpowiedni wyraz do równania energii i twierdząc, że jeżeli „magnesiki” sąsiadujących z sobą elektronów mają pewne średnie namagnesowanie M, to wówczas moment magnetyczny elektronu dąży sil- nie do ustawienia się w tym kierunku, który jest kierunkiem średniego namagnesowania atomów sąsiednich. Tak więc, dla dwóch możliwych,orientacji spinu*’ będą spełnione następujące związki: I XM \ energia dla spinu „w górę” = Ą-/J, I HĄ-— |, \ £oC / , (37.1) / IM \ ' energia dla spinu „w dół” = — /z | HĄ--— I. \ eo C2 I Kiedy stało się już rzeczą jasną, że mechanika kwantowa może dostarczyć olbrzymiej siły związanej z orientacją spinu — nawet gdyby znak tej siły miał być zły — wysunięto hipotezę, że ferromagnetyzm mógłby znaleźć swój początek w tej to właśnie sile, a uwzględ- nienie złożonej sytuacji w żelazie i dużej liczby elektronów, od których przyczynek jest istotny, powinno pozwolić na otrzymanie poprawnego znaku energii oddziaływania wza- jemnego. Od czasu kiedy o tym pomyślano — mniej więcej od roku 1927, kiedy to zaczęto rozumieć mechanikę kwantową — dokonywano różnych oszacowań i przybliżonych obli- czeń próbując otrzymać, jaka wartość 2 jest przewidywana przez teorię. Najnowsze obli- czenia energii oddziaływania pomiędzy dwoma spinami elektronów w żelazie — przy założeniu, że jest to bezpośrednie oddziaływanie w sąsiadujących ze sobą atomach — dają ciągle zły znak. Opisując obecnie to zjawisko mówi się, że powodem tej rozbieżności jest znowu ta „złożoność” sytuacji i że istnieje nadzieja, że ktoś następny, kto dokona obli- czeń dla bardziej złożonej sytuacji, otrzyma już poprawną odpowiedź! Istnieje przypuszczenie, że spin „w górę” jednego z elektronów w powłoce wewnętrznej, właśnie tego elektronu, który „tworzy” magnetyzm, dąży do ustawienia spinów elektro- nów przewodnictwa, a więc elektronów przepływających na zewnątrz atomu, w kierunku przeciwnym. Możemy się spodziewać, że tak właśnie się stanie, gdyż elektrony przewod- ♦’ Rówania te zapisujemy posługując się polem H = B—Meoc2, a nie polem B, aby pozostać w zgo- dzie z tym, co zostało zrobione w poprzednim rozdziale. Można by to zapisać inaczej: U = ±/x5o = = ±/<(B+A'Af/eoc2), gdzie A' = A —1. Ale to jest takie samo wyrażenie jak (37.1).
37-1. ISTOTA FERROMAGNETYZMU 309 nictwa przebywają w tych samych obszarach, co elektrony „magnetyczne”. Ponieważ elektrony te poruszają się we wszystkich kierunkach, to mogą one przenosić z sobą nakaz przeciwnego ustawiania się spinów sąsiadujących z sobą elektronów na następny atom; a więc jeden elektron „magnetyczny” próbuje zmusić elektrony przewodnictwa do usta- wienia ich spinów w kierunku przeciwnym do kierunku swego spinu, a następnie taki elektron przewodnictwa ustawia przeciwnie do siebie następny elektron „magnetyczny”. To podwójne oddziaływanie jest równoważne oddziaływaniu, które próbuje ułożyć w tym samym kierunku spiny dwóch elektronów „magnetycznych”. Innymi słowy, dążenie elektro- nów „magnetycznych” do ustawiania swych spinów w jednym i tym samym kierunku jest dziełem pewnego „pośrednika” — elektronu przewodnictwa — który w pewnym stopniu ustawia się antyrównolegle do obu elektronów „magnetycznych”. Ten mechanizm nie wymaga, aby wszystkie elektrony przewodnictwa były przewrócone „do góry nogami”. Wystarczy, aby było tylko trochę więcej elektronów przewodnictwa ze spinem w dół, aby powstała pewna nadwyżka elektronów „magnetycznych” ze spinem w górę. W taki właśnie mechanizm ferromagnetyzmu wierzą obecnie ci, którzy zajmowali się teoretycz- nymi rozwiązaniami powstałych tu problemów. Ale należy podkreślić, że jak dotąd nikt jeszcze nie obliczył wielkości f. opierając się jedynie na fakcie, że substancja ma liczbę porządkową 26 w układzie okresowym pierwiastków. Krótko mówiąc — zagadnienia tego dokładnie jeszcze nie rozumiemy. Będziemy teraz dalej rozwijać naszą teorię, a później powrócimy do omówienia pew- nego błędu, wynikłego ze sposobu, w jaki ta teoria została zbudowana. Jeżeli moment magnetyczny pewnego elektronu jest skierowany „w górę”, to energia pochodzi zarówno od pola zewnętrznego, jak i od dążenia spinów do ustawienia się równolegle do siebie. Ponieważ energia jest mniejsza, gdy spiny są równoległe, to czasem się mówi, że efekt ten zachodzi na skutek pewnego „efektywnego pola wewnętrznego”. Pamiętajmy jednak, że za efekt ten nie jest odpowiedzialna jakaś prawdziwa siła magnetyczna', jest to pewne oddziaływanie wzajemne, które jest bardziej złożone. W każdym razie, przyjmujemy wzory (37.1) za wzory na energię dwóch stanów spinowych elektronu „magnetycznego”. W temperaturze T względne prawdopodobieństwo tych dwóch stanów jest proporcjonalne do e~energia,<:7’, co można zapisać jako e±JC, z x = (j.{H+XMIe0c2)lkT. Jeżeli więc obliczy- libyśmy średnią wartość momentu magnetycznego, to stwierdzilibyśmy (tak jak w poprzed- nim rozdziale), że jest ona równa M = Np. tghx. (37.2) Teraz chcielibyśmy obliczyć energię wewnętrzną substancji. Zauważmy, że energia elektronu jest dokładnie proporcjonalna do jego momentu magnetycznego, tak że obli- czenia średniego momentu i obliczenia średniej energii są takie same — z tym, że w rów- naniu (37.2) zamiast /z należałoby napisać —uB, co jest równe — p{H+).MIe0c2}. Średnia energia jest zatem równa / , <v\ = -A7/UZ+ —r tghx. \ «oC / Ale to nie jest całkiem poprawny wzór. Wyraz ŻAf/e0c2 opisuje oddziaływanie wszyst-
310 37. SUBSTANCJE MAGNETYCZNE kich możliwych par atomów, a musimy pamiętać, by każdą parę policzyć tylko jeden raz. (Kiedy rozważamy energię jednego elektronu w polu pozostałych, a następnie energię jn. nego elektronu w polu pozostałych, to część tej pierwszej energii liczymy dwa razy!) Tak więc należy podzielić wyraz dotyczący wzajemnego oddziaływania przez dwa i wówczas nasz wzór na energię przyjmie postać: <.U\=-Np\HĄ AM \ 2eoc2/ tghx. (37.3) W poprzednim rozdziale odkryliśmy pewną interesującą rzecz — że poniżej pewnej temperatury dla każdego materiału istnieje pewne rozwiązanie równań, w którym moment magnetyczny nie jest równy zeru, nawet gdy nie ma zewnętrznego pola magnesującego. Jeżeli w równaniu (37.2) przyjmiemy H — 0, to znajdziemy (37.4) gdzie ń/nas = A/z i Tc~ p,AMnJke0c2. Gdy rozwiążemy to równanie (graficznie lub w jakiś inny sposób), stwierdzimy, że stosunek Af/Afnas jako funkcja TjTc jest taką krzywą jak ta, którą na rys. 37.1 oznaczono „teoria kwantowa”. Krzywa przerywana, oznaczona „kobalt, nikiel” pokazuje wyniki doświadczalne dla kryształów tych pierwiastków. Teoria i doświadczenie zgadzają się z sobą dość dobrze. Na rysunku przedstawiono także wynik 37.1. Namagnesowanie spontaniczne (H — 0) kryształów ferromagnetycznych jako funkcja temperatury
37-2. ISTOTA FERROMAGNETYZMU 311 teorii klasycznej, dla której obliczenia przeprowadzono przy założeniu, że atomowe momenty magnetyczne mogą mieć wszystkie możliwe orientacje w przestrzeni. Widać, 2e założenie to prowadzi do wyniku, który nawet nie jest zbliżony do faktów doświad- czalnych. Nawet teoria kwantowa nie opisuje dostatecznie dokładnie obserwowanych zjawisk, zarówno dla wysokich, jak i dla niskich temperatur. Powodem tej rozbieżności jest jedno, dość nieporządne założenie naszej teorii: założyliśmy, że energia atomu zależy od śred- niego namagnesowania atomów z nim sąsiadujących. Innymi słowy, każdy z tych sąsia- dujących atomów, który ma moment magnetyczny w tym samym kierunku, co nasz wy- różniony atom (będziemy mówili o tych atomach — atomy skierowane „w górę”)*’, będzie dawał pewien przyczynek do energii pochodzący od tego kwantowomechanicz- nego zjawiska uporządkowania. Ale ile jest tych atomów skierowanych „w górę”? Średnio biorąc, można by to zmierzyć, mierząc średnie namagnesowanie M, ale tak będzie tylko w średniej. Jakiś szczególny atom może się znaleźć gdzieś wśród sąsiadów, skierowanych tylko „w górę”. Wówczas jego energia będzie większa od średniej. Inny zaś atom mógłby znaleźć część sąsiadów skierowanych „w dół” — obie te części mogą być na przykład sobie równe i wówczas atom ten nie miałby w energii wyrazu wzajemnego oddziaływania, i tak dalej. Powinno się użyć tutaj średniej jakiegoś innego, bardziej skomplikowanego typu, ponieważ atomy będące w różnych miejscach mają różne otoczenia, a liczby sąsiadów skie- rowanych „w górę” i ,,w dół” są dla różnych atomów różne. Zamiast po prostu brać jeden atom, poddany jakiemuś uśrednionemu oddziaływaniu, powinno się wziąć każdy atom w jego sytuacji rzeczywistej, obliczyć jego energię i znaleźć energię średnią. Ale jak się prze- konać, ile sąsiadów jest skierowanych ,,w górę”, a ile ,,w dół”? Oczywiście, jest to właśnie to, co próbujemy obliczyć — liczba atomów skierowanych ,,w górę” i „w dół” — tak że otrzymujemy bardzo złożone i zawikłane zagadnienie korelacji, zagadnienie, którego nikt dotąd nie rozwiązał. Jest to szalenie ciekawe i intrygujące zagadnienie, na którego temat już od lat wypowiadało się wielu wielkich fizyków, ale nawet oni nie potrafili go w zupeł- ności rozwiązać. Okazuje się jednak, że dla niskich temperatur, kiedy większość atomowych momentów magnetycznych jest skierowana „w górę”, a tylko kilka ,,w dół”, zagadnienie nasze można łatwo rozwiązać; a dla wysokich temperatur, dużo powyżej temperatury Curie Tc, kiedy to prawie wszystkie momenty magnetyczne ustawione są na chybił trafił, też można łatwo znaleźć odpowiedź. Często można łatwo obliczyć małe odchylenia od jakiejś prostej, wy- idealizowanej sytuacji, tak więc można zrozumieć, dlaczego dla niskiej temperatury na- stępują odchylenia od prostej teorii. Z punktu widzenia fizyki można zrozumieć, że ze względów statystycznych namagnesowanie powinno „zanikać” w wysokich tempera- turach. Ale to, co się dzieje w pobliżu punktu Curie, nigdy nie zostało dokładnie zba- dane na drodze teoretycznej. Jest to interesujący problem do opracowania dla kogoś, kto szuka jakiegoś problemu, który nigdy nie był rozwiązany. *’ Oczywiście, słowo „skierowane” odnosi się nie tyle do atomów, co do ich momentów magnetycz- nych. (Przyp. tłum.)
312 37. SUBSTANCJE MAGNETYCZNE 37.2. Energia na jednostkę objętości i ciepło właściwe kryształu ferromagnetycznego 37*2. Własności termodynamiczne W poprzednim rozdziale położyliśmy pod- walmy niezbędne do otrzymania na drodze teoretycznej własności termodynamicznych substancji ferromagnetycznych. Własności te związane są naturalnie z energią wewnętrzną kryształu, która zawiera w sobie człon od- powiedzialny za oddziaływania różnych spi- nów, dane przez równanie (37.3). Dla energii namagnesowania spontanicznego poniżej pun- ktu Curie można w równaniu (37.3) przyjąć H = 0 i zauważając, że tgh x = Af/AfMS, zna- leźć, że średnia energia jest proporcjonalna do M2: N/jAM2 2eoc2Mm (37.5) Jeżeli teraz zrobimy wykres energii pocho- dzącej od magnetyzmu jako funkcji tempera- tury, to otrzymamy krzywą taką, jak na rys. 37.2a, która jest wykresem funkcji, równej ujemnemu kwadratowi funkcji opisanej krzy- wą z rys. 37.1. Jeżeli następnie zmierzylibyśmy ciepło właściwe naszej substancji, to otrzyma- libyśmy krzywą będącą wykresem pochodnej funkcji opisanej wykresem 37.2a. Jest ona po- kazana na rys. 37.2b. Krzywa ta rośnie powoli wraz ze wzrostem temperatury, ale dla T = — Tc spada raptownie do zera. Powodem tego ostrego spadku, który następuje dokładnie w punkcie Curie, jest zmiana nachylenia krzy- _ wej energii magnetycznej (rys. 37.2a). A za- tem nie przeprowadzając żadnych pomiarów magnetycznych można by odkryć to, co dzieje się wewnątrz żelaza lub niklu, mierząc włas- ności termodynamiczne tych substancji. Je* dnak zarówno doświadczenie, jak i ulepszona teoria (uwzględniająca fluktuacje) sugerują, że ta nieskomplikowana krzywa nie odzwier- ciedla prawdziwej sytuacji, która jest w rzeczy- wistości bardziej złożona. Prawdziwa krzywa
37-2. WŁASNOŚCI TERMODYNAMICZNE 313 ma wyżej położone maksimum i spada do zera nieco wolniej. Nawet jeżeli temperatura jest dostatecznie wysoka, aby — średnio biorąc — spiny się ułożyły zupełnie przypadkowo, to i tak będą pewne obszary lokalne, w których istnieje pewna polaryzacja i w tych obsza- rach spiny będą miały trochę dodatkowej energii oddziaływania wzajemnego, która zanika powoli z dalszym wzrostem temperatury, prowadzącym do coraz to bardziej przypadko- wego rozłożenia spinów. Dlatego też krzywa rzeczywista wygląda tak jak krzywa na rys. 37.2c. Jednym z dążeń dzisiejszej fizyki teoretycznej jest znalezienie dokładnego opisu teoretycznego sposobu zachowania się ciepła właściwego w pobliżu punktu Curie; jest to bardzo ciekawe zagadnienie, które jeszcze nie zostało rozwiązane. Zagadnienie to jest naturalnie bardzo ściśle związane z kształtem krzywej namagnesowania w tym samym obszarze. Chcemy teraz opisać pewne doświadczenia, już nie termodynamiczne, które pokazują, że w naszej interpretacji magnetyzmu jest jednak coś słusznego. Kiedy namagnesuje się do nasycenia substancję w dostatecznie niskiej temperaturze, wtedy namagnesowanie M jest bardzo bliskie Maas, czyli prawie wszystkie spiny są równoległe, tak samo jak i momenty magnetyczne. Można to sprawdzić doświadczalnie. Przypuśćmy, że zawiesimy magnes sztabkowy na cienkiej nici, a następnie otoczymy go cewką, tak że będziemy mogli zmie- niać zwrot pola magnetycznego nie dotykając magnesu, ani nie przykładając do niego żadnego momentu sił. Jest to bardzo trudne doświadczenie, ponieważ siły magnetyczne są tak olbrzymie, że każda nieregularność lub każda niedoskonałość w żelazie wytworzy przypadkowy moment siły. Doświadczenie jednak wykonano przy zachowaniu wszelkich środków ostrożności, co pozwoliło na zmniejszenie do minimum takich przypadkowo się pojawiających momentów sił. Przy pojnocy pola magnetycznego cewki, otaczającej sztab- kę, obracamy naraz „do góry nogami” wszystkie atomowe momenty magnetyczne. Zmieniamy przy tym wszystkie spiny, które były skierowane „w górę” na spiny „w dół” (patrz rys. 37.3). Jeżeli moment pędu ma być zachowany, to wtedy gdy wszystkie spiny się obrócą „do góry nogami”, reszta sztabki musi uzyskać jakąś przeciwną zmianę momentu pę- du, a więc cały magnes zacznie się obracać. I rzeczywiście, jeżeli przeprowadzimy to do- świadczenie, to zaobserwujemy niewielkie obrócenie się magnesu. Można zmierzyć całko- wity moment pędu przekazany całemu magne- sowi; jest on równy N razy h, gdzie h jest zmia- ną momentu pędu spowodowaną zmianą kie- runku każdego spinu. Stosunek momentu pę- du do momentu magnetycznego mierzony w taki właśnie sposób równy jest z dokładnością do 10 °/0 wynikowi naszych obliczeń. W rzeczy- wistości nasze obliczenia zakładają, że atomo- We momenty magnetyczne pochodzą tylko od spinów elektronów, tymczasem w większości sytuacji występuje jeszcze pewien ruch orbita- 37.3. Gdy kierunek namagnesowania pręta zmieni się na przeciwny, pręt uzyskuje pewną prędkość kątową
314 37. SUBSTANCJE MAGNETYCZNE lny. Ten ruch orbitalny natrafia na przeszkodę ze strony sieci krystalicznej i ze względu na to jego udział w magnetyzmie wynosi tylko kilka procentów. Pole magnetyczne, przy którym następuje nasycenie, wynosi — jeżeli przyjmie się, że Mnas = Np oraz że gęstość żelaza =-7,9 g/cm 3,a moment magnetyczny obracającego się wokół osi elektronu jest równy p — około 20000 Gs. Doświadczenie tymczasem daje pole w przybliżeniu równe 21500 Gs. Istnieje tu typowy błąd — 5 lub 10% — pochodzący od pominięcia przyczynków od orbital- nych momentów magnetycznych, które w naszym opisie nie zostały uwzględnione; ta niewiel- ka więc rozbieżność pomiędzy teorią a doświadczeniem „giromagnetycznym” jest całkowicie zrozumiała. < 37-3. Krzywa histerezy Nasz teoretyczny opis doprowadził nas do wniosku, że substancja ferromagnetyczna powinna się poniżej pewnej temperatury namagnesować spontanicznie, tak że jej całe pole magnetyczne powinno się „uporządkować” wzdłuż jednego kierunku. Ale wiemy, że powyższe twierdzenie nie jest prawdziwe dla zwykłego kawałka nienamagnesowanego żelaza. Dlaczego żelazo jako całość nie jest namagnesowane? Można to wyjaśnić przy po- mocy rys. 37.4. Przypuśćmy, że całe żelazo miałoby postać dużego pojedynczego kryształu, o kształcie takim, jaki pokazano na rys. 37.4a, i że kryształ ten byłby cały spontanicznie namagnesowany w jednym kierunku. Byłoby wówczas całkiem spore, zewnętrzne pole magnetyczne, które miałoby wiele energii. Tę energię pola można zmniejszyć, jeżeli się sprawi, że jedna połowa naszego żelaznego klocka będzie namagnesowana „w górę”, a druga „w dół”, tak jak na rys. 37.4b. Wówczas oczywiście pola na zewnątrz żelaza roz- ciągałyby się na mniejszych obszarach przestrzennych, a więc byłoby tam mniej energii. Ale uwaga! W warstwie pomiędzy tymi dwoma obszarami mamy elektrony o spinach w górę, przylegające do elektronów ze spinem w dół. Ale ferromagnetyzm pojawia się tylko w tych substancjach, w których energia ulega zmniejszeniu, jeżeli spiny elektronów są równolegle, a nie antyrównoległe. A zatem dodaliśmy trochę dodatkowej energii wzdłuż 37.4. Powstawanie domen w pojedynczym krysztale żelaza (C. Kittel, Introduction to Solid State Physics, John Wiley and Sons, New York 1956)
37-3. KRZYWA HISTEREZY 315 i, linii przerywanej na rys. 37.4b; energia ta — to energia ściany lub energia bariery. Obszar i mający tylko jeden kierunek namagnesowania nazywamy domeną. Na powierzchni granicz- I nej — czyli na ścianie pomiędzy dwiema domenami, w której sąsiedztwie znajdują się atomy i należące do różnych domen, a więc o spinach ułożonych w różnych kierunkach — mamy pewną energię na jednostkę powierzchni: energię bariery. Opisaliśmy to tak, jak gdyby dwa przyległe atomy miały spiny skierowane dokładnie przeciwnie, ale okazało się, że przy- i roda tak wszystko dopasowuje, że przejście to jest bardziej stopniowe. Ale nie musimy i się tu martwić o takie subtelności. ł Powstaje teraz pytanie: kiedy łatwiej, a kiedy trudniej utworzyć taką ścianę? Okazuje t się, że zależy to od rozmiaru domen. Przypuśćmy, że powiększylibyśmy każdy wymiar Ś naszego klocka dwa razy. Wówczas objętość obszaru przestrzennego na zewnątrz klocka I wypełnionego polem magnetycznym o pewnym ustalonym natężeniu byłaby osiem razy większa, a tym samym energia w polu magnetycznym, jako proporcjonalna do objętości, byłaby też osiem razy większa. Ale pole powierzchni odgraniczającej poszczególne domeny, które określa energię bariery, byłoby tylko cztery razy większe. Dlatego też, jeżeli kawałek żelaza jest dostatecznie duży, to jego rozszczepienie na więcej domen jest energetycznie bardziej opłacalne. Właśnie dlatego pojedyncze domeny mogą występować jedynie w bar- dzo maleńkich kryształach. Każdy duży obiekt, którego rozmiar przekracza 0,01 mm, będzie miał przynajmniej jedną ścianę domenową; a każdy zwykły obiekt „centymetrowy” będzie rozszczepiony na wiele domen, tak jak to pokazano na rysunku. Rozszczepianie na domeny będzie zachodziło aż do momentu, kiedy energia potrzebna na wstawienie jeszcze jednej ściany domenowej zrówna się z energią traconą przez pole magnetyczne na zewnątrz kryształu. Okazuje się, że przyroda znalazła jeszcze jeden sposób na obniżanie energii: otóż pole wcale nie musi się rozprzestrzeniać na zewnątrz kryształu, a można to uzyskać, jeżeli mały trójkątny obszar będzie namagnesowany na boki, tak jak na rys. 37.4d*>. Wówczas przy takim ustawieniu jak na rys. 37.4d widać, że nie ma pola zewnętrznego, a zamiast tego jest tylko trochę więcej ścian domen. Ale napotykamy tu nowe zagadnienie. Okazuje się, że kiedy pojedynczy kryształ żelaza jest namagnesowany, to jego długość w kierunku namagnesowania ulega zmianie, tak że „doskonały” sześcian, który ma kierunek namagnesowania np. „do góry” przestaje być już sześcianem doskonałym. Wymiar „pionowy” będzie się bowiem różnił od wymiaru „poziomego”. Zjawisko to nazywamy magnetostrykcją. Z powodu tych zmian geometrycz- nych małe trójkątne kawałki z rys. 37.4d już nie będą „pasować” do dostępnych im „otwo- rów” — kryształ w jednym kierunku będzie za długi, a w drugim za krótki. Oczywiście, w rzeczywistości te kawałki pasują, ale tylko dlatego, że są tam wciśnięte, co prowadzi do Powstania pewnych naprężeń mechanicznych. Takie więc ułożenie prowadzi także do •• •• Można by zapytać: w jaki sposób spiny, które muszą być skierowane tylko „w górę” lub „w dół”, °iogą być także skierowane „na boki”? Jest to słuszne pytanie, ale na razie nie będziemy się o nie martwić. Po prostu przyjmiemy punkt widzenia fizyki klasycznej i będziemy myśleć o atomowych „magnesikach” Jak o klasycznych dipolach, które także mogą być spolaryzowane „bocznie”. Mechanika kwantowa wy- ^laga niemałej biegłości, aby zrozumieć, jak pewne obiekty mogą być zarówno skwantowane „góra-dół” Jak i „prawo-lewo” i to w tym samym czasie.
316 37. SUBSTANCJE MAGNETYCZNE 37.5. Pole magnesujące H, tworzące pewien kąt z osią kryształu, będzie stopniowo zmieniać kie- runek namagnesowania nie zmieniając przy tym jego wartości bezwzględ- nej pewnej dodatkowej energii. Dopiero bilans tych wszystkich energii określa ów skomplj. kowany sposób, w jaki się w końcu ułożą domeny w kawałku nienamagnesowanego żelaza. Co się teraz stanie, kiedy włączymy jakieś zewnętrzne pole magnetyczne? Wybierzmy prosty przypadek, biorąc kryształ, którego domeny wyglądają tak jak na rys. 37.4d. Je- żeli przyłożymy pole magnetyczne, które ma kierunek „w górę”, to w jaki sposób kryształ się namagnesuje? Przede wszystkim środkowa ściana domenowa może się przesunąć na bok (na prawo), co prowadzi do zmniejszenia energii. Ściana się przesuwa tak, aby obszar „w górę” był większy od obszaru „w dół”. Wówczas więcej elementarnych „magnesików” będzie ułożonych zgodnie z kierunkiem pola, co spowoduje zmniejszenie się energii. A za- tem dla kawałka żelaza w słabych polach — na początku procesu magnesowania — ściany domen zaczynają się przesuwać i „wdzierają się” w obszary, które są namagnesowane w kierunku przeciwnym do kierunku pola. Z dalszym wzrostem pola cały kryształ prze- kształca się stopniowo w pojedynczą domenę, spolaryzowaną całą w jednym kierunku za pomocą pola zewnętrznego. W silnym polu kryształ „lubi” być „ułożony” jako całość w jednym kierunku, po prostu dlatego, że jego energia będzie w przyłożonym polu zmniejszona, wtedy bowiem pole zewnę- trzne samego kryształu nie ma już tak istotnego znaczenia. A co się dzieje, jeżeli geometria nie jest tak prosta? Co się dzieje, gdy osie kryształu i jego namagnesowanie spontaniczne mają jeden kierunek, a przyłożone pole ma jakiś inny kieru- nek, tworzący np. kąt 45° z kierunkiem Ml Można by po- myśleć, że domeny tak się zmienią, że ich namagnesowanie będzie równoległe do pola, a następnie, tak jak to się działo w poprzednim przypadku, wszystkie te domeny przekształcą się w jedną domenę. Ale żelazu niełatwo jest tego dokonać, ponieważ energia potrzebna do namagnesowania kryształu za- leży od kierunku namagnesowania względem osi kryształu. Sto- sunkowo łatwo można namagnesować żelazo w kierunku równoległym do którejś z osi kryształu, ale namagnesowanie żelaza w jakimś innym kierunku, np. pod kątem 45° wzglę- dem jednej z osi, wymaga więcej energii. Dlatego jeżeli przy- łoży się pole magnetyczne w takim właśnie kierunku, począt- kowo rosną te domeny, które są ułożone wzdłuż jednego z wyróżnionych kierunków zbliżonych do kierunku przyłożo- nego pola. Ten wzrost domen trwa dotąd, dopóki całe na- magnesowanie „ułoży” się wzdłuż takiego kierunku. Na- stępnie, przy znacznie silniejszych polach, wektor namagne- sowania stopniowó się przesuwa, tak że staje się bardziej równoległy do pola, jak to narysowano schematycznie na rys. 37.5. Na rysunku 37.6 pokazano kilka otrzymanych z doświad- czenia krzywych namagnesowania pojedynczego kryształu
37-3. KRZYWA H1STEREZY 317 37.6. Składowa wektora M, równoległa do pola H, dla różnych kierunków pola H (względem osi kryszta* łu) (F. Bitter, Introduction to Ferromagnetism, McGraw-Hill Book Co., Inc, 1937) Żelaza. Aby zrozumieć, co te krzywe opisują, musimy najpierw wytłumaczyć zapis, jakiego się używa do oznaczania kierunków w krysztale. Istnieje wiele sposobów, jta które można rozciąć kryształ, tak aby przekrój był płaszczyzną utworzoną z ato- inów. Wie o tym każdy, kto przejeżdżał koło jakiegoś sadu lub winnicy, że jeżeli spojrzy się w jednym kierunku, widać szeregi drzew, a w innym znowu kierunku widać inne szeregi drzew — widok wart oglądania. Podobnie kryształ ma pewne okre- ślone rodziny płaszczyzn, na których się znajduje wiele atomów i płaszczyzny te- mają taką oto ważną cechę (rozważamy kryształ regularny, aby uprościć sobie sprawę): jeżeli wyznaczymy punkty przecięcia tych płaszczyzn z trzema osiami współrzędnych, przeko- namy się, że odwrotności ich trzech odległości od początku układu mają się do siebie tak, jak proste liczby całkowite. Te trzy liczby całkowite określają już położenie płaszczyzn. Tak na przykład, na rys. 37.7a pokazano płaszczyznę równoległą do płaszczyzny yz. Płaszczyznę tę nazywa się płaszczyzną [100] (czytamy: jeden, zero, zero); odwrotności odległości jej punktów przecięcia się z osiami y i z są obie równe zeru. Kierunek prosto- padły do takiej płaszczyzny (w krysztale regularnym) jest określony przez ten sam zbiór liczb. Zapis ten można łatwo zrozumieć w przypadku kryształu regularnego, bo wówczas wskaźniki [100] oznaczają wektor, który ma jednostkową składową w kierunku osi x, a którego składowe w kierunkach osi y i z znikają. Kierunek [110] jest kierunkiem, który tworzy kąt 45° zarówno z osią x, jak i z osią y, tak jak na rys. 37.7b, a kierunek [111] Jest kierunkiem przekątnej sześcianu, tak jak na rys. 37.7c. Powróćmy teraz do rys. 37.6; widzimy tam krzywe namagnesowania pojedynczego kryształu żelaza dla różnych kierunków. Zauważmy po pierwsze, że dla maleńkich pól — tak słabych, że trudno je nawet zauważyć na osi H — namagnesowanie rośnie wyjątko- *o gwałtownie, do całkiem dużych wartości. Jeżeli pole ma kierunek [100], czyli jeden z tych „sympatycznych” i łatwych kierunków namagnesowania, to krzywa pnie się w górę
318 37. SUBSTANCJE MAGNETYCZNE 37.7. Sposób oznaczania płaszczyzn kryształu do dużej wartości, trochę się zakrzywia, a następnie następuje nasycenie. Powodem ta- kiego zachowania się krzywej jest to, że domeny, które początkowo były w żelazie, zo- stały bez żadnego trudu usunięte. Wystarczyło małe pole, aby ściany domen się przesu- nęły i żeby pochłonęły wszystkie domeny „o złym kierunku”. Pojedyncze kryształy żelaza obdarzone są ogromną przenikalnością (w sensie magnetycznym), o wiele bardziej niż zwykłe żelazo polikrystaliczne. Kryształ doskonały magnesuje się wyjątkowo łatwo. Dlaczego więc krzywa jest w ogóle zakrzywiona? Dlaczego nie przebiega ona prosto do góry, aż do nasycenia? Nie potrafimy na to dać jakiejś pewnej odpowiedzi — może ktoś zajmie się kiedyś tym problemem. Potrafimy zrozumieć dlaczego krzywa jest płaska dla dużych pól. Kiedy cały blok żelaza jest już pojedynczą domeną, to dodatkowe pole ma- gnetyczne nie może zwiększyć namagnesowania, które osiągnęło już wartość Mnas z wszyst- kimi spinami elektronów ułożonymi wzdłuż jednego kierunku. Co się teraz stanie, jeżeli tę samą rzecz zrobimy dla kierunku [11 Oj — tego, który tworzy kąty 45° z osiami kryształu? Włączamy słabiutkie pole i namagnesowanie szybko 37.8. Krzywe namagnesowania dla pojedynczych kryształów żelaza, niklu i kobaltu (C. Kittel, Introduction
37-3. KRZYWA H1STEREZY 319 wzrasta na skutek rozrastania się domen. Jeżeli teraz będziemy stopniowo zwiększać pole, przekonamy się, że „zużyjemy” sporo pola, zanim osiągniemy nasycenie, ponieważ teraz wektor namagnesowania odwraca się od „łatwego” kierunku. Jeżeli wytłumaczenie to byłoby poprawne, to punkt, w którym krzywa [110] (ekstrapolowana) przecina się z osią pionową, powinien odpowiadać 1//2 razy wartość nasycenia. Okazuje się rzeczy- wiście, że punkt ten leży niesłychanie blisko punktu Ma3slVl. Podobnie dla kierunku [111], który jest kierunkiem przekątnej sześcianu, znajdujemy, tak jak można się było tego spodziewać, że ekstrapolowana krzywa przecina się z osią pionową w pobliżu M^/^3. Rysunek 37.8 pokazuje odpowiednie sytuacje dla dwóch innych substancji, niklu i kobalty. Nikiel różni się od żelaza. Okazuje się, że w niklu kierunek [111] jest „łatwym” kierunkiem namagnesowania. Kobalt ma kryształy o strukturze heksagonalnej, a przy- jęty sposób nomenklatury dla tego przypadku został spartaczony. Wprowadzono mia- | nowicie trzy osie na podstawie sześciokąta Lj jeszcze jedną oś prostopadłą do tych trzech, tak że trzeba używać czterech wskaźników. Cierunek [0001] jest kierunkiem tej prosto- padłej osi, a kierunek [1010] jest kierunkiem prostopadłym do tej osi. Widać, że kryszta- ły różnych metali zachowują się na różne sposoby. Musimy omówić teraz przypadek metalu polikrystalicznego, takiego jak zwykły ka- wałek żelaza. Wewnątrz takich substancji jest ogromnie dużo małych kryształów, których osie krystaliczne mają wszystkie możliwe kie- runki. Takie kryształy — to już nie to samo co domeny! Pamiętajmy, że wszystkie do- meny były częściami pojedynczego kryształu, a w kawałku żelaza jest natomiast wiele róż- nych kryształów, o różnych orientacjach osi, tak jak to pokazano na rys. 37.9. Wewnątrz każdego z tych kryształów zwykle będą także pewne domeny. Jeżeli do próbki substancji po- likrystalicznej przyłoży się słabe pole magne- tyczne, to ściany domen zaczną się poru- szać i domeny, które mają korzystny kierunek ••łatwego namagnesowania”, będą rosnąć. Ten wzrost jest odwracalny tak długo, jak długo pole jest bardzo słabe; jeżeli więc wy- uczy się takie pole, to namagnesowanie po- ^róci do zera. Ta część krzywej namagne- s°wania jest oznaczona literą a na rys. 37.10. 37.9. Struktura mikroskopowa nienamagne- sowanej substancji magnetycznej. Każde ziar- no krystaliczne ma pewien „łatwy” kierunek namagnesowania i jest rozdzielone na domeny, które są namagnesowane spontanicznie, zwy- kle równolegle do tego łatwego kierunku 37.10. Krzywa namagnesowania dla żelaza polikrystalicznego
320 73. SUBSTANCJE MAGNETYCZNE Dla większych pól — w obszarze b pokazanej krzywej namagnesowania — sytuacja się mocno komplikuje. W każdym małym krysztale substancji występują odkształcenia i dyslokacje; są tam zanieczyszczenia, obce atomy i wady sieci. Jeżeli więc pole nie będzie bardzo małe, to ściany domen poruszając się ugrzęzną tam jak w pułapkach. Pomiędzy bowiem ścianą domeny i dyslokacją, czy też granicą ziaren, albo też zanieczyszczaniem występuje pewna energia oddziaływania. Gdy zatem ściana dojdzie do takiej pułapki ugrzęźnie i będzie tam tkwić w pewnym polu magnetycznym. Ale jeżeli pole się trochę zwiększy, to ściana z pułapki nagle się wyrwie. A więc ruch ścian domen nie jest już taki gładki jak w krysztale doskonałym. Ściany coraz to zostają zahamowane, by następnie poruszać się skokami. Gdybyśmy mogli spojrzeć na namagnesowanie w jakiejś skali mi- kroskopowej, to zobaczylibyśmy coś takiego jak na powiększonym fragmencie rys. 37.10. Jest rzeczą ważną, że te skoki w namagnesowaniu mogą spowodować pewną stratę energii. Po pierwsze, gdy ściana wyminie w końcu przeszkodę, to porusza się ona do na- stępnej przeszkody bardzo szybko, ponieważ pole przykroczyło już tę wartość, która byłaby koniecżna dla ruchu swobodnego. Ten gwałtowny ruch oznacza obecność gwał- townie się zmieniających pól magnetycznych, które wytwarzają w krysztale prądy wirowe. Te prądy tracą energię na ogrzanie metalu. Drugim efektem jest zmiana wymiarów części kryształu na skutek magnetostrykcji, przy nagłej zmianie domeny. Każde takie nagłe przesunięcie ściany domeny wytwarza małą falę dźwiękową, która unosi z sobą pewną energię. Ze względu na te efekty druga część krzywej namagnesowania jest nieodwracalna i opisuje proces, w którym zachodzi strata energii. Stanowi to początek zjawiska histerezy, ponieważ cykl: przesunięcie granicznej ściany do przodu — zderzenie — następnie prze- sunięcie ściany do tyłu — zderzenie prowadzi w wyniku do sytuacji różnej od sytuacji wyjściowej. Zachodzi tu zjawisko podobne do „skokowego” tarcia i ono właśnie po- chłania energię. W końcu, dla dostatecznie wielkich pól, kiedy już przesunęliśmy wszystkie ściany domen i namagnesowaliśmy każdy kryształ w jego „najlepszym” kierunku, pozostaje jeszcze pewna część krystalitów, dla których „łatwe” kierunki namagnesowania nie po- krywają się akurat z kierunkiem naszego pola zewnętrznego. Wówczas trzeba długo jeszcze zwiększać pole, aby także obrócić te momenty magnetyczne. A zatem dla wiel- kich pól namagnesowanie rośnie powoli, ale gładko — opisuje je część c krzywej na ry- sunku. Namagnesowanie nie osiąga raptownie swej wartości nasycenia, ponieważ na eta- pie opisanym ostatnią częścią krzywej atomowe momenty magnetyczne obracają się w silnym polu. Widać zatem, dlaczego krzywa namagnesowania zwykłej substancji poli- krystalicznej, taka jak na rys. 37.10, najpierw podnosi się nieznacznie i odwracalnie, na- stępnie rośnie nieodwracalnie i w końcu powoli się zagina. Oczywiście, pomiędzy tymi trzema obszarami nie ma jakichś wyraźnych punktów granicznych — obszary te stopnio- wo i gładko przechodzą w siebie. Nietrudno pokazać, że w środkowej części krzywej namagnesowania proces namagne- sowania jest naprawdę skokowy — że ściany domen ulegają w trakcie przesuwania się nagłym skrętom i zderzeniom. Potrzebna do tego celu jest tylko cewka z drutu — o wielu tysiącach zwojów — połączona z wzmacniaczem i głośnikiem, tak jak to pokazano na rys. 37.11. Jeżeli w środku cewki umieści się kilka blaszek ze stali krzemowej (podobnych
37-3. KRZYWA HISTEREZY 321 do tych, jakich się używa w transformato- rach) i będzie się zbliżać do nich powoli ma- gnes sztabkowy, to nagłe zmiany w namag- nesowaniu wytworzą impulsy SEM w cewce, które można usłyszeć jako wyraźne trzaski w głośniku. Przysuwając coraz to bliżej ma- gnes, usłyszymy nagły napływ trzasków, który brzmi trochę podobnie do dźwięku, jaki wydają ziarenka piasku przesypujące się w pochylanej puszce. Ściany domen skaczą, zderzają się i kołyszą się wraz ze wzrostem pola. Zjawisko to nazywamy efektem Bark- hausena. pasek stali krzemowe. 37.11. Nagłe zmiany namagnesowania paska stali dają się słyszeć jako trzaski w głośniku Jeżeli przesunie się magnes jeszcze bliżej do blaszek stalowych, przez chwilę hałas będzie stopniowo wzrastać, ale następnie, gdy magnes będzie już bardzo blisko, hałas stanie się stosunkowo mały. Dlaczego? Ponieważ prawie wszystkie ściany domen prze- sunęły się o tyle, o ile mogły. Każde większe pole będzie już tylko obracać wektor nama- gnesowania w każdej domenie, co już jest procesem "gładkim”. Jeżeli teraz usuniemy magnes, tak aby powrócić do dolnej gałęzi pętli histerezy, wszyst- kie domeny będą próbowały powrócić znowu do niskiej energii i usłyszymy następny przypływ trzasków, pochodzących od „skoków” powrotnych. Można także zauważyć, że jeżeli umieści się magnes w pewnym określonym miejscu, a następnie będzie się nim troszkę poruszać ruchem wahadłowym, to trzaski będą stosunkowo dość ciche. Można to znowu porównać z przechylaniem puszki piasku — gdy już raz ziarenka zajmą jakieś miejsca, to niewielkie ruchy puszki nie będą ich przesuwać. Podobnie małe zmiany pola magnetycznego w żelazie nie wystarczą, aby przesunąć którąś ze ścian granicznych przez jakąś z przeszkód. 37-4. Materiały ferromagnetyczne Chcielibyśmy teraz pomówić o różnych rodzajach spotykanych w świecie technicz- nym substancji magnetycznych, które technicy nazywają materiałami magnetycznymi, oraz rozważyć niektóre z zagadnień związanych z projektowaniem materiałów magne- tycznych dla rozmaitych celów. Przede wszystkim określenie „własności magnetyczne żelaza”, które często się słyszy, jest terminem błędnym — czegoś takiego w ogóle nie ma. „Żelazo” nie jest dobrze określonym materiałem; własności żelaza zależą w sposób krytyczny od liczby zanieczyszczeń i od tego, w jaki sposób żelazo było formowane. Można przyjąć, że własności magnetyczne będą zależeć od tego, jak łatwo mogą się poruszać ściany domen, a to jest własnością makroskopową, nie zaś własnością pojedynczych ato- mów. Praktyczny zatem ferromagnetyzm nie jest w rzeczywistości własnością atomu żelaza — jest to własność żelaza w stanie stałym o pewnej postaci. Tak na przykład żelazo 21 — Wykłady z fizyki
322 37. SUBSTANCJE MAGNETYCZNE może przybierać dwie różne postacie krystaliczne. Postać pospolita ma sieć regularną, centrowaną przestrzennie, ale żelazo może mieć też sieć regularną centrowaną powierzch- niowo, która jednak jest stabilna tylko powyżej temperatury 1100°C. Oczywiście, w ta- kiej temperaturze przestrzennie centrowana struktura regularna znajduje się już powyżej punktu Curie. Jednakże robiąc stop żelaza z niklem i chromem (jedna z możliwych mie- szanin zawiera 18% chromu i 8% niklu) można otrzymać to, co nazywa się stalą nierdzew- ną, która, chociaż składa się w większej części z żelaza, zachowuje sieć centrowaną po- wierzchniowo nawet w niskich temperaturach. Ponieważ struktura krystaliczna tego stopu jest inna, ma on zupełnie różne własności magnetyczne. Większość z typów stali nierdzewnej nie jest magnetyczna w jakimś zauważalnym stopniu, chociaż pewne jej typy są nieco magnetyczne — zależy to od składu stopu. Nawet gdy taki stop ma wła- sności magnetyczne, to nie jest on /erromagnetykiem, tak jak zwykłe żelazo, mimo tego że składa się on w większej części z żelaza. Chcielibyśmy teraz opisać kilka specjalnych materiałów, które zostały wprowadzone do świata technicznego ze względu na ich szczególne własności magnetyczne. Przede wszystkim, jeżeli chce się otrzymać trwały magnes, to należy się posłużyć materiałem o szalenie szerokiej pętli histerezy, wtedy bowiem namagnesowanie pozostanie duże po wyłączeniu prądu i zlikwidowaniu pola namagnesującego. Dla takich materiałów gra- nice ziaren powinny być „zamrożone” w miejscu na tyle, na ile się tylko da. Jednym z ta- kich materiałów jest rewelacyjny stop „Alnico V” (51% Fe, 8% Al, 14% Ni, 24% Co, 3% Cu). (Ten raczej skomplikowany skład stopu wskazuje na to, jak wiele wysiłków i pre- cyzji włożono w robienie dobrych magnesów. Jakiejż cierpliwości trzeba, aby wymie- szać razem pięć składników i poddawać takie stopy różnym próbom do momentu, aż się znajdzie najbardziej doskonałą substancję!) Gdy Alnico krzepnie, następuje wytrą- cenie tzw. „drugiej fazy”, co powoduje powstanie wielu maleńkich ziaren i bardzo du- żych naprężeń wewnętrznych. W tym materiale granice domen prawie wcale nie mogą się poruszać. Oprócz dobrania tak precyzyjnego składu Alnico poddaje się jeszcze me- 37.12. Krzywa histerezy stopu Alnico V chanicznej „obróbce” w sposób, który sprawia, że kryształy przyjmują postać długich ziaren ułożonych wzdłuż tego kierunku, który ma być kierunkiem przyszłego namagnesowania. Wów- czas namagnesowanie będzie w sposób natu- ralny dążyć do ułożenia się wzdłuż tych kie- runków i nie będzie podlegać wpływom efektów anizotropowych. Co więcej, materiał jest nawet podczas procesu produkcji oziębiany w zew- nętrznym polu magnetycznym, tak że ziarna będą rosnąć z właściwą orientacją kryształu. Pętlę histerezy Alnico V pokazano na rys. 37.12. Widać, że jest ona około 500 razy szersza od pętli histerezy miękkiego żelaza, którą poka- zaliśmy w poprzednim rozdziale na rys. 36.8.
37-4. MATERIAŁY FERROMAGNETYCZNE 323 Przejdźmy teraz do innego typu materiału. Do budowy transformatorów i silników po- trzebny jest materiał, który jest „miękki” mag- netycznie, czyli taki, w którym namagnesowanie można łatwo zmienić, tak że bardzo małe przy- łożone pola będą dawać w wyniku olbrzymie namagnesowanie. Aby to uzyskać, musi się mieć czysty, dobrze wyżarzony materiał, który będzie miał bardzo mało dyslokacji i zanieczyszczeń, gdyż ściany domen będą się mogły łatwo poru- szać. Dobrze by też było uczynić anizotropię małą. Wówczas nawet jeżeli ziarno materiału jest ustawione pod złym kątem względem pola, mate- Tabela 37.1. Własności kilku materia- łów ferromagnetycznych Materiał Br pole magne- tyczne szcząt- kowe (Gs) TĄ. koercja (Gs) Supermaloj (a 5000) 0,004 stal krzemowa 12 000 0,05 żelazo Armco 4000 0,6 Alnico V 13 000 550 riał i tak łatwo się namagnesuje. Powiedzieliśmy już, że żelazo woli się magnesować wzdłuż kierunku [100], podczas gdy nikiel woli kierunek [111]; tak więc jeżeli będziemy mie- szać żelazo i nikiel w różnych stosunkach, to możemy się spodziewać, że przy właściwym stosunku znajdziemy taki stop, który nie będzie „wołał” żadnego z tych kierunków — kierunki [100] i [111] będą równoważne. Okazuje się, że tak się dzieje dla mieszaniny zawierającej 70% niklu i 30% żelaza. W dodatku — a jest to być może szczęśliwy traf, czy też może wynik jakiejś fizycznej zależności pomiędzy anizotropią, a efektami magne- tostrykcji — okazuje się, że magnetostrykcje żelaza i niklu mają przeciwne znaki. I włas- ność ta powoduje idealne „skasowanie” się magnetostrykcji w stopie tych dwóch metali, w którym jest około 80% niklu. A zatem gdzieś pomiędzy 70% a 80% nilku dostaje się bardzo „miękkie” materiały magnetyczne — stopy; które można bardzo łatwo namagne- sować. Nazywa się je „permalojami”*). Stopy te używane są w transformatorach wysokiej jakości (przy niskich poziomach sygnałów), ale zupełnie się nie nadają na magne- sy trwałe. Proces produkcji takich stopów wymaga dużej dokładności i należy się z nimi bardzo uważnie obchodzić. Własności magnetyczne kawałka permaloju zmieniają się krańcowo, jeżeli zostanie on poddany naprężeniom przekraczającym jego granice sprę- żystości; nie wolno więc go zginać! Przy tym przenikalność magnetyczną permaloju zmniejszają dyslokacje, pasma poślizgu i inne zjawiska, które powstają na skutek od- kształceń mechanicznych. Granice ziaren nie mogą się już wówczas łatwo przesuwać. Wysoką przenikalność można jednak przywrócić przez wyżarzenie w wysokich tempera- turach. Często wygodnie jest mieć pewne liczby, które by pozwalały charakteryzować różne materiały magnetyczne. Dwie takie użyteczne liczby, to punkty przecięcia się pętli histe- rezy z osiami B i H, tak jak to zaznaczono na rys. 37.12. Te dwa punkty nazywamy polem magnetycznym szczątkowym Br i koercją Hc. W tabeli 37.1 zamieszczamy te liczby dla kilku materiałów magnetycznych. ♦’ Jest to termin raczej handlowy, wzięty z języka angielskiego (permalloy — złożenie dwóch słów: permability — przenikalność i alloy — stop), oznaczający po prostu stop o dużej praenikalności magnetycz- nej. (Przyp. tłum.)
324 37. SUBSTANCJE MAGNETYCZNE 37-5. Nadzwyczajne materiały magnetyczne Chcielibyśmy omówić teraz niektóre z bardziej egzotycznych materiałów magnetycz- nych. W układzie okresowym pierwiastków jest wiele takich, których wewnętrzne powłoki elektronowe nie są zupełnie zapełnione, wskutek czego pierwiastki te mają atomowe momenty magnetyczne. Tak na przykład tuż po pierwiastkach ferromagnetycznych, żelazie, niklu i kobalcie, znajdują się chrom i mangan. Dlaczego te pierwiastki nie są ferro- magnetykami? Otóż okazuje się, że wyraz z A w równaniu (37.1) ma dla nich znak prze- ciwny. W sieci krystalicznej chromu, na przykład, spiny atomów chromu zmieniają swój zwrot od atomu do atomu, tak jak to pokazano na rys. 37.13b. Chrom zatem jest „magne- tyczny” z własnego punktu widzenia, ale technicznie nie jest on interesujący, ponieważ nie wykazuje zewnętrznych efektów magnetycznych. Chrom jest więc przykładem materia- łu, w którym zjawiska kwantowomechaniczne ustawiają spiny na przemian antyrówno- legle. Taki materiał nazywamy antyferromagnetykiem. Uporządkowanie w materiale antyferromagnetycznym zależy także od temperatury. Poniżej pewnej temperatury kry- tycznej wszystkie spiny są ułożone w na przemian antyrównoległy szereg, ale gdy pod- grzać materiał powyżej tej pewnej temperatury, którą i tym razem nazywamy tempera- turą Curie, to spiny nagle przyjmują ułożenie całkiem przypadkowe. Wewnątrz ma- teriału następuje jakieś gwałtowne przejście, które można zobaczyć na wykresie ciepła właściwego i które także objawia się w postaci pewnych szczególnych zjawisk „magne- tycznych”. Tak na przykład, istnienie na przemian antyrównoległych spinów można sprawdzić rozpraszając neutrony na krysztale chromu. Ponieważ neutron ma sam pe- wien spin (i moment magnetyczny), amplituda rozproszenia neutronu będzie różna w za- leżności od tego, czy spin jego jest równoległy, czy też antyrównoległy do spinu cząstki rozpraszającej. Tak więc dostaje się różne obrazy interferencyjne w przypadku, gdy spiny są ułożone na przemian antyrównolegle i w przypadku, gdy spiny są ułożone na chybił trafił. 37.13. Wzajemne uszeregowanie spinów w różnych materiałach: a) ferromagnetyk, b) antyferromagnetyk, c) ferryt, d) stop zelaza i itru. (Strzałki przerywane pokazują kierunek całkowitego momentu pędu zawie- rającego w sobie orbitalny moment pędu.)
37-5. NADZWYCZAJNE MATERIAŁY MAGNETYCZNE 325 Są jeszcze innego rodzaju substancje, w których na skutek efektów kwantowomecha- nicznych spiny są ułożone na przemian anty- równolegle, ale które mimo to są ferromagne- tykami — to znaczy ich kryształy mają pewne wypadkowe trwałe namagnesowania. Struk- turę krystaliczną takich materiałów pokazano na rys. 37.14. Rysunek pokazuje strukturę krystaliczną spinelu (glinianu magnezowego), który — jak to pokazano — nie jest magne- tyczny. Tlenek ten ma dwa rodzaje atomów metali: magnez i glin. Jeżeli teraz zastąpić magnez i glin dwoma pierwiastkami magne- tycznymi, na przykład żelazem i cynkiem lub cynkiem i manganem — innymi słowy, jeżeli podstawić za atomy niemagnetyczne atomy magnetyczne — to dzieją się ciekawe rze- czy. Oznaczmy jeden rodzaj atomów metalu symbolem a, a drugi rodzaj atomów metalu symbolem b\ należy wówczas rozważyć na- 37.14. Struktura krystaliczna spinelu (MgAl2O4,). Jony Mg2+ zajmują położenia w czworościanach, każdy otoczony przez cztery jony tlenu. Jony Al3+ zajmują poło- żenia w ośmiościanach, każdy otoczony przez sześć jonów tlenu (C. Kittel, Introduction to Solid State Physics, John Wiley and Sons, New York 1956) stępujący układ sił. Mamy oddziaływanie a-b, które próbuje ustawić antyrównolegle spiny atomów a i b, ponieważ żąda tego zawsze mechanika kwantowa (z wyjątkiem ta- kich tajemniczych materiałów, jak żelazo, nikiel i kobalt). Następnie mamy oddziały- wanie bezpośrednie a-a, które próbuje ustawić antyrównolegle spiny atomów a, oraz oddziaływanie b-b, które próbuje ustawić antyrównolegle spiny atomów b. Oczywiście, nie można mieć wszystkich spinów wzajemnie antyrównoległych — a antyrównolegle do b, a antyrównolegle do a i b antyrównolegle do b. Prawdopodobnie ze względu na odległości pomiędzy atomami rodzaju a i ze względu na obecność tlenu (chociaż tak naprawdę, to nie wiadomo dlaczego) okazuje się, że oddziaływanie a-b jest silniejsze od oddziaływania a-a lub b-b. Przyroda wybiera zatem w tym przypadku takie oto rozwiąza- nie: wszystkie atomy rodzaju a mają spiny równolegle, a także wszystkie atomy rodzaju b mają spiny równoległe, ale oba te układy są do siebie antyrównolegle. Takie ułożenie daje najniższą energię ze względu na to, że najsilniejsze jest oddziaływanie a-b. W rezul- tacie wszystkie atomy typu a mają spiny skierowane w górę, a wszystkie typu b mają spiny w dół lub, oczywiście, odwrotnie. Ale jeżeli momenty magnetyczne atomów typu a i atomów typu b nie są sobie równe, to można otrzymać sytuację pokazaną na rys. 37.13c i w materiale może wystąpić pewne wypadkowe namagnesowanie. Materiał będzie wówczas ferromagnetykiem, chociaż dość słabym. Takie materiały nazywamy ferrytami. Nie mają one — z oczywistych względów — tak dużej wartości nasycenia namagnesowania jak żelazo, dlatego też można ich używać tylko dla mniejszych pól. Ale mają one bardzo istotną cechę, która różni je od ferromagnetyków — są one izolatorami; ferryty są izo- latorami ferromagnetycznymi. W polach wielkiej częstości będą się w nich pojawiać bardzo małe prądy wirowe i dlatego też można je używać na przykład w układach mikrofalo-
326 37. SUBSTANCJE MAGNETYCZNE wych. Pola mikrofalowe będą się mogły przedostać do wnętrza takiego materiału izo- lującego, podczas gdy nie przedostaną się one do przewodnika, takiego jak żelazo, ze względu na płynące w nim prądy wirowe. Jest jeszcze inna klasa materiałów magnetycznych, która właśnie niedawno została odkryta; należą do niej substancje z rodziny ortokrzemianów, nazywane gametami. Są to znowu kryształy, których sieć zawiera dwa rodzaje atomów metalicznych i mamy tu także taką sytuację, że prawie zupełnie dowolnie można za te dwa rodzaje podstawiać różne ato- my. Wśród wielu takich zasługujących na uwagę związków jest jeden, który jest całkowicie ferromagnetyczny. Jego strukturę „garnetową” tworzą itr i żelazo, a jest on ferromagne- tykiem z bardzo ciekawych przyczyn. Tutaj znowu mechanika kwantowa ustawia anty- równolegle sąsiadujące z sobą spiny, tak że mamy tu „uwięziony” układ spinów — spiny żelaza są ułożone w jednym kierunku, a w kierunku przeciwnym spiny itru. Ale atom itru jest złożony — jest to pierwiastek ziem rzadkich i do jego momentu magnetycznego duży wkład wnosi ruch orbitalny elektronów. Dla itru wkład do momentu magnetycznego pochodzący od ruchu orbitalnego ma znak przeciwny niż wkład pochodzący od spinu oraz jest od niego większy. Tak więc, choć mechanika kwantowa poprzez zasadą wyklu- czenia ustawia spiny itru przeciwnie do spinów żelaza, całkowity moment magnetyczny itru jest równoległy do momentu magnetycznego żelaza, ze względu na przyczynek od ruchu orbitalnego — tak jak to naszkicowano na rys. 37.13d. Związek ten jest więc jak najprawdziwszym ferromagnetykiem. Inny ciekawy przykład ferromagnetyzmu występuje u niektórych pierwiastków ziem rzadkich. Ma to związek z jeszcze bardziej dziwacznym uporządkowaniem spinów. Tego rodzaju materiał nie jest ferromagnetykiem, ponieważ nie ma wszystkich spinów równo- ległych, ani nie jest antyferromagnetykiem, ponieważ nie ma spinów ułożonych na prze- mian antyrównolegle. W kryształach tych wszystkie spiny w jednej warstwie są do siebie równoległe i leżą w płaszczyźnie tej warstwy. W następnej warstwie wszystkie spiny są znowu równoległe do siebie, ale ich wspólny kierunek różni się trochę od kierunku spi- nów pierwszej warstwy. W kolejnej warstwie spiny mają jeszcze inny wspólny kierunek i tak dalej. W wyniku tego wektor lokalnego namagnesowania zmienia się jak gdyby po spirali — momenty magnetyczne następujących po sobie warstw obracają się, gdy prze- suwamy się po linii prostopadłej do warstw. Interesująca może być próba opisu tego, co się stanie, jeżeli przyłoży się do takiej spirali jakieś pole magnetyczne — opisu wystę- pujących tam skrętów i obrotów wszystkich tych atomowych momentów magnetycznych. (Są tacy, którzy lubią się zabawiać teorią tych zjawisk!) Są tam nie tylko przypadki „pła- skich” spiral, ale także przypadki, w których kierunki momentów magnetycznych na- stępujących po sobie warstw rozkładają się po stożku, tak że każda warstwa ma składową „spiralną” momentu magnetycznego, a także pewną stałą składową „ferromagnetyczną” w jednym kierunku! Własności magnetyczne materiałów przedstawione w sposób bardziej zaawansowany od tego, w jaki potrafiliśmy to tu zrobić, fascynowały fizyków wszystkich specjalności. Przede wszystkim, wymienić należy tu ludzi praktyki, którzy ubóstwiają wynajdywanie różnych sposobów na robienie rzeczy lepiej — starają się oni wynajdywać coraz to nowe i coraz to lepsze materiały magnetyczne. Odkrycie takich materiałów jak ferryty, czy też
37-5. NADZWYCZAJNE MATERIAŁY MAGNETYCZNE 327 zastosowanie tych materiałów zachwyca natychmiast tych, którzy chcą znaleźć nowe sprytne sposoby na robienie różnych rzeczy. Oprócz tego są tacy, których fascynuje ta olbrzymia złożoność zjawisk, powstających z tych kilku podstawowych praw przyrody. Zaczynając od jednego i tego samego pojęcia ogólnego natura przechodzi przez ferro- magnetyzm żelaza i jego domeny do antyferromagnetyzmu chromu, do magnetyzmu ferrytów i garnetów, do struktury spiralnej pierwiastków ziem rzadkich, coraz to dalej i dalej. Odkrywanie na drodze doświadczalnej tych wszystkich dziwnych rzeczy, które się dzieją w tych szczególnych substancjach, jest sprawą fascynującą. Z kolei, jeżeli chodzi o fizyków teoretyków, ferromagnetyzm ofiaruje im pewną liczbę bardzo interesujących, nie rozwiązanych i przepięknych zadań. Jedno z tych zadań polega na zrozumieniu, dla- czego ferromagnetyzm w ogóle istnieje. Inny problem, to określenie statystyki oddziały- wających z sobą spinów w doskonałej sieci krystalicznej. Nawet jeżeli się pominie wszyst- kie możliwe komplikacje pochodzące z zewnątrz, to problem ten, jak dotąd, nie został w pełni zrozumiany. Jest to dlatego tak ciekawy problem, że można go tak prosto sfor- mułować. Dana jest tu cała masa spinów w regularnej sieci krystalicznej, oddziałujących z sobą na podstawie takiego a takiego prawa i należy stwierdzić, co się z nimi powinno dziać. Brzmi to prosto, ale przez wiele lat nie udaje się znaleźć kompletnego opisu tego problemu. Chociaż został on dość dokładnie opisany dla temperatur niezbyt bliskich punktu Curie, to teoria nagłego przejścia w punkcie Curie wymaga ciągle jeszcze uzu- pełnień. Na koniec, całe to zagadnienie układu obracających się wokół osi atomowych momen- tów magnetycznych w ferromagnetykach lub paramagnetykach i w magnetyzmie jądro- wym było też rzeczą fascynującą dla studentów wyższych lat fizyki. Układ spinów może być „popychany” lub „pociągany” przez zewnętrzne pola magnetyczne, tak żę można tu robić wiele różnych sztuczek z rezonansami, efektami relaksacji, echem spinowym i z in- nymi zjawiskami. Taki układ służy za model wielu złożonych układów termodynamicz- nych. Ale w materiałach paramagnetycznych sytuacja jest często dość prosta i ludzie mieli masę przyjemności zarówno robiąc eksperymenty, jak i wyjaśniając te zjawiska teore- tycznie. Zamykamy na tym naszą naukę o elektryczności i magnetyzmie. Najpierw mówiliśmy o wielkim postępie, jaki nastąpił od wczesnych odkryć Greków dziwnego zachowania się bursztynu i magnetytu. Mimo to, w naszych długich i zawikłanych rozważaniach nigdy nie wytłumaczyliśmy, dlaczego tak to się dzieje, że po potarciu kawałka bursztynu pojawi się na nim ładunek, ani też nie wyjaśniliśmy, dlaczego magnetyt jest namagnesowany'. I nie można by tu nawet powiedzieć: „Ach, po prostu nie dostaliśmy poprawnego znaku”. O nie, sprawa wygląda znacznie gorzej. Nawet gdybyśmy dostali poprawny znak, to i tak mielibyśmy jeszcze problem: dlaczego kawałek magnetytu w Ziemi jest namagnesowany^! Oczywiście, Ziemia ma pole magnetyczne, ale skąd się ono bierze? Tak naprawdę to nikt tego nie wie — jak dotąd stawiano tylko hipotezy — lepsze lub gorsze. Jak widzicie, cała ta nasza fizyka, to masa blagi, zaczęliśmy od zjawisk magnetytu i bursztynu i skończyliśmy, nie rozumiejąc dobrze żadnego z nich. Ale za to po drodze uzyskaliśmy ogromnie dużo in- teresujących i bardzo praktycznych wiadomości!
38 sprężystość ł , i 38-1. Prawo Hooke’a Teoria sprężystości zajmuje się zachowaniem się tych substancji, które mają własność odzyskiwania swych rozmiarów i kształtów po usunięciu sił powodujących odkształcenia. Tę własność sprężystą mają, do pewnego stopnia, wszystkie ciała stałe. Gdybyśmy mieli dość czasu, aby omówić obszernie to zagadnienie, to chcielibyśmy rozpatrzyć wiele spraw: zachowanie się poszczególnych substancji, ogólne prawa sprężystości, ogólną teorię sprężystości, mechanizm atomowy, który określa własności sprężyste, i na koniec — zakres stosowalności praw sprężystości, gdy siły stają się tak wielkie, że następuje odkształcenie plastyczne i złamanie. Dokładne omówienie tych zagadnień zajęłoby więcej czasu, niż go mamy do dyspozycji, tak że wiele rzeczy będziemy musieli pominąć. Nie omówimy na przykład zjawiska plastyczności ani ograniczeń możliwości stosowania praw sprężystości. (Wspomnieliśmy pokrótce o tych zagadnieniach, kiedy mówiliśmy o dyslokacjach w me- talach.) Nie będziemy też mogli omówić wewnętrznego mechanizmu zjawiska sprężystości, tak że naszemu podejściu będzie brakowało tej kompletności, którą się staraliśmy uzyskać w poprzednich rozdziałach. Nasz cel polega głównie na pewnym zaznajomieniu czytelnika z niektórymi ze sposobów rozwiązywania takich zagadnień praktycznych, jak na przykład ugięcie belek. Jeżeli naciskać kawałek jakiejś substancji, to kawałek ten się „poddaje” — substancja zostaje odkształcona. Jeżeli siły są dostatecznie małe, to przesunięcia względne różnych punktów w substancji są proporcjonalne do siły działającej; mówimy, że substancja za- chowuje się sprężyście. Omówimy tylko przypadek zachowania się sprężystego. Najpierw wypiszemy podstawowe prawa sprężystości, a następnie zastosujemy je do pewnych sytuacji. Przypuśćmy, że bierzemy prostopadłościenny element substancji o długości /, szero- kości w i wysokości h, tak jak to pokazano na rys. 38.1. Jeżeli będziemy ciągnąć ten element
38-1. PRAWO HOOKE’A 329 za oba końce z siłą F, to długość jego się zwiększy o wielkość dl. We wszystkich przypad- kach będziemy zakładać, że zmiana długości jest tylko małym ułamkiem długości począt- kowej. Prawdę powiedziawszy, takie materiały jak drzewo i stal złamią się, jeżeli zmiana długości będzie większa niż kilka procentów długości początkowej. Dla dużej liczby ma- teriałów doświadczenia wykazują, że dla dostatecznie małych wydłużeń siła jest proporcjo- nalna do wydłużenia: F~4l. ' (38.1) Ten związek jest znany jako prawo Hooke’a. Wydłużenie pręta dl będzie także zależało od jego długości. Można się o tym przekonać przy pomocy następującego rozumowania. Jeżeli skleimy końcami dwa identyczne ele- menty, to na każdy z elementów będą działać te same siły; każdy z nich się wydłuży o dl. Tak więc wydłużenie elementu o długości 21 będzie dwa razy większe od wydłużenia ele- mentu o tym samym przekroju, ale o długości /. Aby otrzymać pewną liczbę, która jest bardziej charakterystyczna dla danego rodzaju substancji, w ogóle, a nie dla jakiegoś jej szczególnego kształtu, będziemy się zajmować stosunkiem dljl — wydłużenia do długości początkowej. Ten stosunek jest proporcjonalny do siły, ale nie zależy od l: dl F~~. (38.2) Siła F będzie także zależeć od pola powierzchni przekroju elementu poprzecznego do kierunku jej działania. Przypuśćmy, że zestawimy dwa elementy, bokami do siebie. Wówczas dla jakiegoś danego wydłużenia mielibyśmy siłę F działającą na każdy element, czyli dwa razy większą siłę działającą na takie złożenie obu elementów. Dla danego wydłu- żenia siła musi być proporcjonalna do pola A powierzchni przekroju elementu. Aby otrzy- mać prawo, w którym współczynnik proporcjonalności nie zależy od rozmiarów ciała, zapiszmy prawo Hooke’a dla elementu prostopadłościennego w postaci dl F=YA—. (38.3) 38.1. Rozciąganie pręta pod wpływem stałego napięcia ^'W + ÓW
330 38. SPRĘŻYSTOŚĆ (38.4) Stała Kjest wewnętrzną własnością samej tylko substancji; nazywa się ją modułem Younga. (Zwykle moduł Younga oznacza się symbolem E. Ale litery E używaliśmy już dla oznacza- nia pól elektrycznych, energii i sił elektromotorycznych, tak że wolimy tu posłużyć się inną literą.) Silę na jednostkę powierzchni nazywa się naprężeniem, a wydłużenie na jednostkę dłu- gości — wydłużenie względne — nazywa się odkształceniem (względnym). Równanie (38.3) można dlatego przepisać w sposób następujący: F Al — =Kx—, ' Al naprężenie = (moduł Younga) X (odkształcenie). Prawo Hooke’a składa się z jeszcze jednej części: jeżeli element substancji rozciąga się w jednym kierunku, to element ten zwęża się w kierunkach prostopadłych do kierunku rozciągania. To zwężenie szerokości jest proporcjonalne do szerokości w, a także i do Al'l. Takie boczne zwężenie względne zachodzi w jednakowym stopniu zarówno dla szerokości, jak i dla wysokości, i zwykle się je zapisuje w postaci Aw Ah Al ----= — = —a — w h r (38.5) gdzie stałą a wyrażającą inną własność substancji, nazywa się stalą Poissona. Jest to liczba zawsze dodatnia i mniejsza od |. (Wydaje się „zrozumiałe”, że a powinno być na ogół dodatnie, ale nie jest to całkiem jasne, że tak właśnie musi być.) Te dwie stałe, Y i a, określają w zupełności własności sprężyste substancji jednorodnych i izotropowych (tzn. niekrystalicznych). W kryształach wydłużenia i skrócenia mogą być różne w różnych kierunkach i może być tam dużo więcej stałych sprężystych. Chwilowo nasze rozważania ograniczymy do przypadku substancji jednorodnych i izotropowych, których własności można opisać tylko przy pomocy Y i a. Jak zwykle, jest kilka różnych sposobów opisywania tych zjawisk — niektórzy wolą na przykład używać innych stałych do opisu własności sprężystych substancji. Wśród stałych tych zawsze jednak muszą być dwie niezależne, które można wyrazić przy pomocy stałych Y i <r. Ostatnim potrzebnym nam tu ogólnym prawem jest zasada superpozycji. Zasada ta jest tu spełniona, gdyż oba prawa: (38.4) i (38.5) są liniowe względem sił i przesunięć. Jeżeli więc jest dany jeden układ sił, które dają pewne przesunięcia, a następnie się doda pewien nowy układ sił powodujący dodatkowe przesunięcia, to przesunięcia wypadkowe będą sumą tych przesunięć, które wystąpiłyby przy obu układach sił działających od siebie nieza- leżnie. Mamy więc już sformułowane wszystkie ogólne zasady — zasadę superpozycji i rów- nania (38.4) i (38.5) — i to jest właściwie cała teoria sprężystości. Ale brzmi to tak, jak powiedzenie, że jak się już raz ma prawa Newtona, to ma się tym samym całą mechanikę. Albo jeśli dane są równania Maxwella, to dana już jest cała elektryczność. Jest oczywiście prawdą, że przy pomocy tych zasad można otrzymać bardzo dużo, ponieważ przy naszych obecnych możliwościach matematycznych potrafimy już wiele zdziałać. Omówimy tu jeszcze zastosowania tych zasad w kilku szczególnych przypadkach.
38-2. ODKSZTAŁCENIA JEDNORODNE 331 38-2. Odkształcenia jednorodne Jako nasz pierwszy przykład rozważmy, co się dzieje z prostopadłościennym elemen- tem, poddanym działaniu stałego ciśnienia hydrostatycznego. Wprowadźmy ten element pod wodę w zbiorniku ciśnieniowym. Na każ- dą ściankę elementu będzie wówczas działała, do wewnątrz, siła proporcjonalna do pola jej powierzchni (patrz rys. 38.2). Ponieważ ciśnienie hydrostatyczne jest stałe, napręże- nie (czyli siła na jednostkę powierzchni) dzia- łające na każdą ściankę elementu jest takie samo. Znajdźmy najpierw zmianę długości. Tę zmianę długości elementu można rozpa- trywać jako sumę zmian długości, jakie na- stąpią w trzech niezależnych od siebie przy- padkach, które są schematycznie przedsta- wione na rys. 38.3. Przypadek 1. Jeżeli na oba końce ele- mentu podziałamy ciśnieniem p, powstanie odkształcenie ściskania, równe p/Y, o znaku ujemnym: 411 _ _P_ l ~ Y' Przypadek?. Jeżeli będziemy naciskać na ściankę górną i dolną elementu ciśnieniem p, to odkształcenie ściskania i tym razem wyniesie —p/ Y, a odpowiednie odkształcenie boczne jest znowu równe ap/ Z. Otrzymujemy J/2 p ~F - ’7' Przypadek 3. Jeżeli przyłożymy ciśnie- nie p do obu ścianek bocznych elementu, to znowu powstanie odkształcenie ściskania, równe pl Y, ale potrzebne nam będzie w zasa- dzie odkształcenie podłużne. Można je otrzymać mnożąc odkształcenie boczne przez —<r. Odkształcenie boczne jest więc równe 38.2. Pręt pod wpływem stałego ciśnienia hydrostatycznego 38.3. Ciśnienie hydrostatyczne jest superpo- zycją trzech ściskań podłużnych Jw p
332 38. SPRĘŻYSTOŚĆ a odkształcenie podłużne Dodając przyczynki do względnej zmiany długości, otrzymane w tych trzech przy- padkach — to znaczy przyjmując Al = Ali+A^+Als — otrzymujemy Al p — = -^(l-2<7). (38.6) W zagadnieniu tym wszystkie trzy kierunki są oczywiście równouprawnione; tak więc również Aw Ah p ----= — = (38.7) w h y Warto się też zainteresować zmianą objętości pod wpływem ciśnienia hydrostatycznego. Ponieważ V = Iwh, to dla małych przesunięć można przyjąć, że AV Al Aw Ah 'Stając z zależności (38.6) i (38.7) mamy AV __ = -3-|(1-2a). (38.8) Niektórzy lubią nazywać AV/V odkształceniem objętościowym i piszą AV p = —K---. * V Naprężenie objętościowe p jest proporcjonalne do odkształcenia objętościowego — jeszcze raz mamy więc prawo Hooke’a. Współczynnik K nazywamy modułem ściśliwości; jest on związany z innymi stałymi przez związek: Y 3(1—2cr)' (38.9) Ponieważ współczynnik K ma pewne znaczenie praktyczne, wiele podręczników podaje K i y zamiast stałych Y i a. Jeżeli komuś jest potrzebna stała <7, to może ją zawsze otrzymać z równania (38.9). Z równania (38.9) można także wywnioskować, że stała Poissona o musi być mniejsza od |. Gdyby tak nie było, moduł ściśliwości K byłby ujemny i substancja zwiększałaby swoją objętość przy wzroście ciśnienia. Pozwoliłoby to na czerpanie energii mechanicznej z każdego „starego” elementu, wtedy bowiem taki element byłby w równo- wadze chwiejnej. Gdyby mianowicie raz zaczął on zwiększać swą objętość, robiłby to już dalej sam — oddając przy tym pewną energię.
38-2. ODKSZTAŁCENIA JEDNORODNE 333 Chcemy teraz rozważyć, co się stanie, jeżeli podda się jakiś obiekt odkształceniu „ścinania”. Przez odkształcenie ścinania rozumiemy ten typ zniekształcenia, który pokazano na rys. 38.4. Wstępem do tego zagadnienia jest analiza od- kształceń w sześcianie utworzonym z substancji sprężystej, poddanej działaniu sił pokazanych na rys. 38.5. Problem ten można znowu roz- bić na dwa przypadki: ściskanie pionowe i roz- ciąganie poziome. Oznaczając przez A pole powierzchni ściany sześcianu, dojdziemy, po po- dobnym do poprzedniego rozumowaniu, że zmiana długości w kierunku poziomym jest równa Al ~T 1 F 1 F 1+<t F -------)-(T -— —--------------. Y A Y A Y A (38.10) Zmiana wysokości w kierunku pionowym jest równa po prostu temu samemu wyrażeniu z prze- ciwnym znakiem. Przypuśćmy teraz, że ten sam sześcian pod- damy działaniu sił ścinania, tak jak to pokaza- no na rys. 38.6a. Zauważmy, że wszystkie siły muszą tu być sobie równe, gdyż w przeciwnym przypadku pojawiłyby się wypadkowe momenty sił i sześcian nie byłby jako całość w równo- 38.4. Sześcian w stanie czystego ścinania 38.5. Sześcian, na którego górną i dolną ściankę działają siły ściskające, a na dwie boczne ścianki działają, równe im co do wielkości, siły rozciągające 38.6. Dwie pary sił ścinających na a) wytwarzają takie samo naprężenie jak siły ściskające i rozciągające na b)
134 38. SPRĘŻYSTOŚĆ vadze. (Podobne siły muszą także istnieć na rys^ 38.4, ponieważ przedstawiony am element jest w równowadze. Siły te pochodzą od „kleju”, przy pomocy którego ele- nent jest przytwierdzony do stołu.) Mówi się wówczas, że sześcian jest w stanie czystego .cinania. Ale zauważmy, że jeżeli przetniemy sześcian płaszczyzną pod kątem 45°, np. jłaszczyzną wzdłuż przekątnej A na rysunku, to całkowita siła działająca poprzez tę płasz- czyznę jest do niej prostopadła i równa 1^2 G. Pole powierzchni, na której działa ta siła, jest •ówne 1'2 A; dlatego też naprężenie rozciągające, prostopadłe do tej płaszczyzny, jest po prostu równe GjA. Podobnie, jeżeli rozpatrzymy inną płaszczyznę tworzącą kąt 45° z kra- wędzią sześcianu — tę wzdłuż przekątnej B na rysunku — to zobaczymy, że występuje tam naprężenie ściskające, prostopadłe do tej płaszczyzny i równe —GjA. Widać stąd, że na- prężenie w „czystym ścinaniu” jest równoważne złożeniu naprężeń rozciągania i ściskania, prostopadłych do siebie i tworzących kąty 45° z pierwotnymi ściankami sześcianu. Naprę- żenia wewnętrzne i odkształcenia są takie same, jakie znaleźlibyśmy w jakimś większym elemencie materiału, poddanym działaniu takich sił jak na rys. 38.6b. Ale zagadnienie to już rozwiązaliśmy. Zmiana długości przekątnej jest więc dana równaniem (38.10), AD 1+<t G ~D~ ~ Y ~A‘ (38.11) 38.7. Odkształcenie ścinania 0 jest równe 2AD/D 38.8. Rozciąganie przy uwięzionych ścianach bocznych (brak przewężeń bocznych) (Jedna przekątna jest skrócona, druga zaś wydłużona.) Często wygodnie jest wyrażać odkształce- nie ścinania przy pomocy kąta, o jaki sześcian zostaje skręcony — kąt 6 na rys. 38.7. Z ry- sunku widać, że przesunięcie poziome górnej krawędzi, ó, jest równe y2AD. A zatem 0 = d /2 AD AD — =--------= 2----. I l D (38.12) Naprężenie ścinania g definiuje się jako siłę styczną, działającą na jedną ściankę, podzie- loną przez pole powierzchni tej ścianki; g = G/A. Podstawiając równanie (38.11) do równania (38.12) otrzymujemy 0 = 2~~g. Możemy to zapisać też w postaci „naprę- żenie = stała razy odkształcenie”: g = n6. (38.13) Współczynnik proporcjonalności p nazywa- my modułem ścinania (lub niekiedy współ-
38-2. ODKSZTAŁCENIA JEDNORODNE 335 czynnikiem sztywności). Można go wyrazić przy pomocy stałych Y i a; Y 2(1 +<x) (38.14) Nawiasem mówiąc, moduł ścinania musi być dodatni, w przeciwnym bowiem wypadku można by otrzymać energię z bloku, który by samoczynnie ulegał ścinaniu. Z równania (38.14) wynika zatem, że stała <r musi być większa od —1. Wiemy więc, że współczynnik <r musi się zawierać pomiędzy —la +|, jednakże w praktyce a jest zawsze większe od zera. Jako ostatni przykład sytuacji, w której naprężenia są jednorodne w całej substancji, rozważmy zagadnienie elementu, który jest rozciągany, podczas gdy jednocześnie jego ściany boczne są uwięzione, tak że nie mogą nastąpić zwężenia boczne. (Technicznie łat- wiej jest ściskać element i jednocześnie powstrzymywać ściany boczne od wybrzuszania się — ale to jest to samo zagadnienie.) Co się wtedy dzieje? No cóż, muszą tam być jakieś siły boczne, nie pozwalające substancji zmienić swej grubości, siły, których tak „od ręki” nie znamy, ale które będziemy musieli obliczyć. Jest to zagadnienie tego samego typu, jakie już rozwiązaliśmy — tylko obliczenia będą trochę inne. Wyobrażamy teraz sobie, że siły działają we wszystkich trzech kierunkach, tak jak to pokazano na rys. 38.8; obliczamy zmiany rozmiarów, a następnie tak dobieramy siły poprzeczne, aby szerokość i wysokość elementu pozostały bez zmian. Przeprowadzając te same rozważania, co poprzednio, otrzy- mujemy wzory na odkształcenia we wszystkich trzech kierunkach: (38.15) (38.16) (38.17) Ponieważ Aly i zfZz mają teraz być równe zeru, wzory (38.16) i (38.17) dają dwa równania wiążące Fy i Fz z Fx. Rozwiązując te równania otrzymujemy F F a F Ay Az 1—<r Ax Podstawiając to do równania (38.15) mamy Alx _ 1 / 2<t2 \ Fx _ 1 Z 1-<T-2<t2 \ Fx ~ 1-<T^ 17 i-<* Z 4? (38.18) (38.19) Często równanie to spotyka się w postaci „odwrotnej”, z trójmianem kwadratowym wzglę- dem stałej <T przedstawionym w postaci iloczynowej: F 1—<r JZ 7 “ (14-cr)(l—2ct7 Z ’ (38.20)
336 38. SPRĘŻYSTOŚĆ <jdy uwięzimy boki, moduł Younga w prawie Hooke’a zostaje przemnożony przez skom- plikowaną funkcję stałej a. Jak można to najłatwiej zobaczyć z równania (38.19), ten czynnik przed modułem Tjest zawsze większy od 1. Trudniej jest więc rozciągać element, gdy jego boki są uwięzione — co także oznacza, że element jest bardziej wytrzymały wtedy, gdy jego boki są uwięzione, niż gdy są one swobodne. 38-3. Skręcanie pręta; fale ścinania*1 Zwróćmy teraz naszą uwagę na pewien przykład, który jest bardziej złożony, ponieważ naprężenia są różne w różnych częściach substancji. Będziemy rozważać pręt podlegający skręcaniu, taki jaki można znaleźć w wale napędowym w maszynach lub w zawieszeniu przy pomocy włókna kwarcowego w instrumentach precyzyjnych. Czytelnicy pamiętają zapewne z doświadczeń z wagą skręceń, że moment sił działający na skręcony pręt jest proporcjonalny do kąta, przy czym stała proporcjonalności zależy oczywiście od długości pręta, od jego promienia i od własności materiału. Pytaąie brzmi: Dlaczego tak jest? Teraz jesteśmy w stanie odpowiedzieć na to pytanie; to tylko kwestia przeprowadzenia pewnych rozważań geometrycznych. Na rysunku 38.9a pokazano cylindryczny pręt o długości L i o promieniu a, którego jeden koniec jest skręcony względem końca drugiego o kąt <p. Jeżeliby chcieć powiązać odkształcenia z tym, co już wiemy, to można przyjąć, że pręt składa się z wielu cylindrycz- nych współosiowych warstw, i oddzielnie rozpatrywać, co się z każdą z tych warstw dzieje. Zacznijmy od rozpatrzenia cienkiej, krótkiej warstwy cylindrycznej o promieniu r (mniej- szym od a) i o grubości Jr — tak jak to przedstawiono na rys. 38.9b. Jeżeli weźmiemy teraz pod uwagę fragment tej warstwy, który był początkowo małym kwadratem, to widać, 38.9. a. Cylindryczny pręt poddany skręcaniu, b. Warstwa cylindryczna poddana skręcaniu, c. Każdy kawałek tej cylindrycznej warstwy doznaje ścinania 1 Porównaj: Tom I, cz. 2, rozdz. 47 (Dźwięk). dr
38-3. SKRĘCANIE PRĘTA; FALE ŚCINANIA 337 że został on przekształcony w równoległobok. Każdy taki element warstwy doznaje ści- nania, przy czym kąt ścinania 6 jest równy Naprężenie g ścinania w substancji jest więc równe [z równania (38.13)] „ r<P g = ^ = F~-- (38>2i) La Naprężenie ścinania jest równe sile stycznej AF, działającej na brzeg kwadratu, po- dzielonej przez pole powierzchni brzegu równe Al Ar (patrz rys. 38.9c) AF 8~ Al Ar' Siła AF, działająca na brzeg takiego kwadratu, daje moment siły At względem osi pręta, równy At = r AF = rgAl Ar. (38.22) Całkowity moment t jest sumą takich momentów sił po pełnym obwodzie cylindra. Skła- dając zatem razem dostateczną liczbę tego rodzaju fragmentów, tak aby ich elementy Al dały w sumie 27tr, stwierdzamy, że całkowity moment skręcający dla pustej w środku rury jest równy rg(27rr) Ar (38.23) lub, po skorzystaniu z wzoru (38.21), r3Ar a> r = 2~p- _ (38.24) La Otrzymaliśmy więc, że sztywność na skręcanie, T/<p, pustej w środku rury jest proporcjo- nalna do sześcianu jej promienia r i do grubości jej ścianki Ar, a odwrotnie proporcjonalna do długości L. Można sobie teraz wyobrazić, że pełny pręt składa się z ciągu takich współśrodkowych rur, z których każda jest skręcona o ten sam kąt <p (chociaż naprężenia wewnętrzne są dla każdej rury różne). Całkowity moment sił jest sumą momentów potrzebnych do obró- cenia każdej powłoki; dla pręta pełnego przy czym całkujemy tu w granicach od r = 0 do r = o, gdzie a jert promieniem pręta. Po scałkowaniu tc a4 * = <p. (38.25) £La W przypadku pręta poddanego skręcaniu moment sił jest proporcjonalny do kąta i do czwartej potęgi średnicy, czyli 2 razy grubszy pręt jest 16 razy bardziej „sztywny” na skrę- canie. 22 — Wykłady z fizyki
338 38. SPRĘŻYSTOŚĆ 38.10. a. Fala skrętna w pręcie, b. Element objętości pręta Zanim zakończymy omawiać zagadnienie skręcania, spróbujmy jeszcze zastosować nabyte wiadomości do interesującego problemu rozchodzenia się fal skrętnych. Jeżeli wziąć długi pręt i nagle skręcić jeden z jego końców, to przez pręt, na całej jego długości, przejdzie fala skręcania, jak to schematycznie przedstawiono na rys. 38.10a. Jest to zagad- nienie trochę ciekawsze od zagadnienia skręcania statycznego. Zobaczmy, czy potrafimy określić, co się tu dzieje. Niech z będzie odległością jakiegoś punktu pręta od skręconego końca. Przy skręca- niu statycznym moment sił jest taki sam wzdłuż całego pręta i jest on proporcjonalny do <p/L — stosunku całkowitego kąta skręcenia do całkowitej długości. Substancja doznaje na skutek skręcania odkształcenia lokalnego, które, jak można wykazać, jest równe Syjdz. Dla skręcania, które nie jest takie samo wzdłuż całego pręta, równanie (38.25) powinno się zastąpić równaniem 7ta4 cm , „ *(*) = -z-« (38.26) 2 oz Zobaczmy teraz, co się dzieje z pewnym elementem o długości dz, pokazanym w powięk- szeniu na rys. 38. lOb. Na jeden koniec, 1, małego „plasterka” pręta działa moment siły t(z), a na drugi koniec, 2, działa inny moment siły t(z-J-Az). Jeżeli dz jest dostatecznie małe, to można się posłużyć rozwinięciem Taylora i zapisać ' / dv\ t(z+Az) — t(z)+ I—Idz, (38.27) \oz / Wypadkowy moment skręcający At, działający na mały kawałek pręta pomiędzy z a z+Az jest oczywiście równy różnicy pomiędzy t(z) i t(z-^-Az), czyli równy At = = (5r/5z) Az. Różniczkując równanie (38.26) względem z otrzymujemy = (38.28) 2 oz2 W wyniku działania tego wypadkowego momentu skręcającego nasz plasterek pręta uzyskuje pewne przyspieszenie kątowe. Masa tego plasterka wynosi AM = (na2Az)g,
38-3. SKRĘCANIE PRĘTA; FALE ŚCINANIA 339 gdzie o jest gęstością substancji. W rozdziale 19 tomu I (cz. 1) wyprowadziliśmy wzór na moment bezwładności walca kołowego: Z = mr2/2; oznaczając moment bezwładności naszego plasterka przez Al mamy Al = — ga*dz. (38.29) Prawo Newtona mówi, że moment sił jest równy momentowi bezwładności rajy przyspie- szenie kątowe, czyli 52® Z1t= Al—i-. dt2 Reasumując, otrzymujemy łtfl4 d2<p M 2 Iź2" 7t . d2<P czyli 32ę> Q d2<p _ q Sz2 /i dt2 (38.30) (38.31) Łatwo poznać, że jest to jednowymiarowe równanie fali. Znaleźliśmy więc, że fale skręca- nia przemieszczają się wzdłuż pręta z prędkością (38.32) Im większą pręt ma zatem gęstość — przy takiej samej jego sztywności — tym wolniejsze będą fale, a im sztywniejszy jest pręt, tym szybciej będą się fale wzdłuż niego rozchodzić. Prędkość ta nie zależy od średnicy pręta. Fale skrętne są szczególnym przykładem fal ścinania. Ogólnie, fale ścinania są to takie fale, w których odkształcenia nie zmieniają objętości żadnej części ośrodka. W falach skręt- nych występuje szczególny rozkład naprężeń ścinających; są tu one mianowicie rozło- żone na kole. Ale dla każdego rozkładu naprężeń ścinających fale będą się rozchodzić z tą samą prędkością, ókreśloną równaniem (38.32). Tak na przykład, sejsmologowie stwierdzają, że fale ścinania rózchodzą się we wnętrzu Ziemi. W ośrodkach sprężystych, będących ciałami stałymi, mogą występować fale jeszcze innego typu. Wywierając nacisk na pewną część ośrodka można dać początek falom „po- dłużnym”, nazywanym także falami „ściskania”. Przypominają one fale dźwiękowe w po- wietrzu lub w wodzie — kierunek przesunięć jest w nich taki sam jak kierunek rozchodze- nia się fali. (Na powierzchniach ciał sprężystych mogą być także inne typy fal, nazywane „falami Rayleigha” lub „falami Love’a”. W tych falach odkształcenia nie są ani czysto podłużne, ani czysto poprzeczne. Nie mamy jednak czasu, aby omówić te fale.) Ponieważ już zaczęliśmy mówić o falach, to zastanówmy się jeszcze, jaka jest pręd- kość czystych fal ściskania w dużym ciele stałym, takim np. jak Ziemia? Mówimy „dużym”, ponieważ prędkość dźwięku w grubym ciele jest różna od prędkości dźwięku, np. w cien- kim pręcie. Przez „grube” ciało rozumie się taki obiekt, którego wymiary poprzeczne
340 38. SPRĘŻYSTOŚĆ są dużo większe od długości fali dźwiękowej. Wówczas, gdy w takim obiekcie wywrze się w pewnym miejscu nacisk, nie może się on rozszerzać na boki — może on tylko ulegać ściskaniu w jednym wymiarze. Na szczęście, omówiliśmy już szczególny przypadek ściska- nia „uwięzionej po bokach” substancji sprężystej. W rozdziale 47 tomu I (cz. 2) wypro- wadziliśmy także wzory na prędkość fal dźwiękowych w gazie. Przeprowadzając takie same rozważania można się przekonać, że prędkość dźwięku w ciele stałym jest równa }/ Y'/q, gdzie Y' jest „modułem podłużnym”, czyli ciśnieniem podzielonym przez względną zmianę długości, dla przypadku „uwięzionych ścian bocznych”. Prędkość ta równa jest po prostu stosunkowi Alfl do F/A, który otrzymaliśmy już w równaniu (38.20). A zatem prędkość fal podłużnych jest określona wzorem _ Y' _ 1—<r Y podto- e ~ (1+cr)(1_2ff) Q (38.33) Dopóki a jest większe od zera, a mniejsze od moduł ścinania /i jest mniejszy od modułu Younga, a także Y' jest większe od Y, tak że H < Y <Y'. Oznacza to, że fale podłużne poruszają się prędzej od fal ścinania. Jeden z najdokładniej- szych sposobów pomiaru stałych sprężystych substancji polega na mierzeniu ich gęstości oraz prędkości tych dwóch typów fal. Z wyników tych pomiarów można wyznaczyć zarówno Y, jak i <r. Nawiasem mówiąc, właśnie mierząc różnice w czasach przybycia tych dwóch typów fal od miejsca, w którym nastąpiło trzęsienie Ziemi, sejsmolog może osza- cować — nawet z sygnałów dochodzących do jednej tylko stacji — odległość do miejsca trzęsienia. 38-4. Ugięcie belki ’ Chcemy teraz rozpatrzyć jeszcze jedno zagadnienie praktyczne — zginanie pręta lub belki. Jakie siły występują przy zginaniu pręta o pewnym dowolnym przekroju? Nasze rozważania przeprowadzimy przy założeniu, że przekrój belki jest kołem, ale otrzymana odpowiedź będzie dotyczyła przekroju o dowolnym kształcie. Aby jednak zaoszczędzić trochę czasu, poczynimy pewne uproszczenia, tak że teoria, którą wyprowadzimy, będzie stanowić tylko przybliżenie. Nasze wyniki będą słuszne jedynie wtedy, gdy promień zgi- nania będzie dużo większy od grubości belki. Przypuśćmy, że ktoś chwyci oba końce prostego pręta i wygnie go — na przykład tak, jak to pokazano na rys. 38.11. Co się dzieje wewnątrz pręta? No cóż, jeżeli pręt jest zakrzy- wiony, to znaczy, że substancja po wklęsłej stronie krzywej jest ściśnięta, a pó jej wypukłej stronie jest rozciągnięta. Istnieje więc pewna powierzchnia, która przebiega mniej lub więcej równolegle do osi pręta, która ani nie jest ściśnięta, ani rozciągnięta. Nazywa się ją po- wierzchnią neutralną. Można by się spodziewać, że ta powierzchnia będzie blisko „środka” przekroju. Można wykazać (ale nie będziemy tego tu robić), że w przypadku małego wy-
38-4. UGIĘCIE BELKI 341 gięcia nieskomplikowanej belki powierzchnia neutralna przechodzi przez „środek ciężkości” przekroju. Jest to prawdą tylko dla „czystego” zginania, tzn. gdy belka nie jest jednocześnie rozciągana lub ściskana. Przy czystym zatem zginaniu cienki, poprze- czny plasterek pręta zostaje odkształcony, tak jak to pokazano na rys. 38.12a. Substancja po- niżej powierzchni neutralnej doznaje odkształ- cenia ściskania i odkształcenie to jest proporcjo- nalne do odległości od powierzchni neutralnej: 38.11. Ugięcie belki a substancja powyżej tej powierzchni jest roz- ciągana także proporcjonalnie do swej odległo- ści od powierzchni neutralnej. A więc wydłuże- nie podłużne Al jest proporcjonalne do wysokości y. Stała proporcjonalności jest po prostu równa stosunkowi l do promienia krzywizny pręta (patrz rys. 38.12): Al _ y ~T~T‘ Tak więc siła na jednostkę powierzchni — naprężenie — w małym „pasku” na wyso- kości y jest także proporcjonalna do odległości od powierzchni neutralnej: AF ~AA y R (38.34) Przypatrzmy się teraz silom, które wywołują takie odkształcenie. Na rysunku 38.12 pokazano mały wycinek pręta wraz z działającymi nań siłami. Przez dowolny poprzeczny przekrój pręta siły działające powyżej płaszczyzny neutralnej mają jeden kierunek, a po- niżej tej płaszczyzny mają kierunek przeciwny. Siły te występują parami i tworzą „moment T 38.12. a. Mały wycinek ugiętej belki, b. Przekrój belki
342 38. SPRĘŻYSTOŚĆ 38.13. Belka typu „I” 38.14. Belka-dźwigar, z zawieszonym na jednym jej końcu ciężarem i) zginający” SUł, przez co się rozumie moment sił względem linii neutralnej. Całkowity moment można obliczyć całkując iloczyn siły i odległości od powierzchni neutralnej dla jednej ze ścianek wycinka z rys. 38.12: 3Jl= f ydF. (38.35) po powierzchni przekroju Z równania (38.34) dF = Y(y/R)dA, tak że Y C , Wl = - y2dA. J\ J Całka z y2dA określa to, co się nazywa „mo- mentem bezwładności” przekroju geometrycz- nego względem osi poziomej, przechodzącej przez „środek masy” przekroju*’; ten „mo- ment bezwładności” oznaczamy przez Z: = —, (38.36) R I = jy2dA. (38.37) Równanie (38.36) daje nam więc zależność pomiędzy momentem zginającym SUł a krzy- wizną l/R belki. „Sztywność” pręta jest proporcjonalna do modułu Younga Y i do mo- mentu bezwładności I, Innymi słowy, jeżeli się chce mieć możliwie jak najsztywniejszą belkę wykonaną z danej ilości np. aluminium, to należy możliwie jak najwięcej tego alu- minium umieścić jak tylko się da najdalej od płaszczyzny neutralnej, aby belka miała duży moment bezwładności. Nie można jednak z tym przesadzać, bo wówczas belka nie bę- dzie się wyginała, tak jak to powinna robić, lecz będzie się wybaczać lub skręcać i znowu się stanie słaba. Ale widać teraz, dlaczego belki budowlane robi się w postaci litery I lub H, tak jak to pokazano na rys. 38.13. Jako przykład zastosowania równania (38.36) znajdźmy odchylenie belki-dźwigaru, na której wolny koniec działa jakaś skoncentrowana siła W, tak jak to pokazano na rys. 38.14. (Przez „dźwigar” rozumie się po prostu taką belkę, która jest tak podtrzymywana, że zarówno położenie, jak i nachylenie belki są ustalone na jednym jej końcu, np. zacemento- wanym w betonowej ścianie.) Jaki jest kształt takiej belki? Oznaczmy przez z odchylenie na odległości x od zamocowanego końca; chcemy znaleźć z(x). Rozważania przepro- wadzimy tylko dla małych odchyleń. Założymy także, że długość belki jest duża w porów- naniu z jej przekrojem. Otóż, jak Czytelnik wie z wykładów matematyki, krzywizna 1/R *’ W rzeczywistości jest to oczywiście moment bezwładności plasterka, którego gęstość powierzch- niowa jest równa jedności.
38-4. UGIĘCIE BELKI 343 (38.38) dowolnej krzywej z(x) jest dana wzorem 1 d2zfdx2 ~R ~\l+(dzldx)2]212 ' Ponieważ interesują nas tylko małe odchylenia, jak to zwykle bywa w przypadku kon- strukcji budowlanych, pominiemy tu wyraz (Jz/Jx)2 w porównaniu z 1 i przyjmiemy 1 d2z R dx2 (38.39) Musimy także znać moment zginający 3Jł. Jest on funkcją x, ponieważ jest on równy mo- mentowi sił względem osi neutralnej każdego przekroju. Pomińmy ciężar belki i uwzględ- nijmy tylko siłę W, działającą ku dołowi na koniec belki. (Czytelnik może spróbować przeprowadzić obliczenia z uwzględnieniem ciężaru belki.) Wówczas moment zginający w punkcie x jest równy SJl(x) = W(L-x), ponieważ jest on równy momentowi sił względem punktu x, jaki wywiera ciężar W, czyli momentowi sił, jaki belka „odczuwa” w punkcie x. Otrzymujemy W(L-x) czyli d2z dx2 Można to bez żadnych specjalnych sztuczek scałkować; otrzymujemy d2z YIIX2’ YI ~R W =----(L—x). YI (38.40) korzystając z naszych założeń, że z(0) = 0 i że dzfdx jest także równe zeru dla x = 0. Taki właśnie jest kształt belki. Odchylenie końca wynosi W L2 z{L) = ~—- (38.42) odchylenie końca belki rośnie więc wraz z sześcianem długości belki. Przy wyprowadzaniu naszej przybliżonej teorii belki założyliśmy, że podczas zginania belki jej przekrój się nie zmieniał. Gdy grubość belki jest mała w porównaniu z promie- niem krzywizny, przekrój się zmienia bardzo mało i nasz wynik jest w porządku. Jednakże w ogólnym przypadku tego efektu nie należy pomijać, jak to każdy sam może łatwo wy- kazać, zginając w palcach miękką gumkę do mazania. Jeżeli początkowo przekrój gumki był prostokątem, to po zgięciu gumki okaże się, że przekrój wybrzusza się ku dołowi (patrz rys. 38.15). Dzieje się tak, ponieważ przy ściskaniu podstawy gumki materiał rozszerza się na boki — tak jak to opisaliśmy przy pomocy stałej Poissona. Gumę można łatwo zginać
344 38. SPRĘŻYSTOŚĆ 38.15. a. Ugięcie gumki do mazania, b. Przekrój 38.16. Belka wyboczona i rozciągać, ale przypomina ona trochę ciecz, w której trudno jest zmienić objętość, co widać pięknie przy zginaniu gumki do mazania. Dla nieściśliwej substancji stała Poissona byłaby do- kładnie równa | — dla gumy jest ona zaś bar- dzo bliska tej wartości. 38-5. Wyboczenie Chcemy teraz przy pomocy naszej teorii bel- ki zrozumieć teorię „wyboczenia” belek, słupów lub prętów. Rozważmy sytuację taką, jak np. na rys. 38.16, kiedy to pręt, który normalnie byłby prosty, jest utrzymywany w swoim wygię- tym kształcie przez dwie przeciwnie skierowa- ne siły, które naciskają oba jego końce. Chcieli- byśmy wyznaczyć kształt pręta i wielkości sił działających na końce. Niech y(x) będzie odchyleniem pręta od li- nii prostej, łączącej oba końce, przy czym x jest odległością od jednego z końców. Moment zginający 33? w punkcie P na rysunku jest rów- ny sile F pomnożonej przez ramię tej siły, które jest odległością „prostopadłą” y 9R(x) = Fy. (38.43) Korzystając z równania (38.36) dla belki otrzymujemy (38.44) Dla małych odchyleń można przyjąć, że 1/R = —d2y/dx2 (znak minus ze względu na to, że krzywizna jest „wypukła”). Otrzymujemy równanie d2y _ F 77 ~ ~yi y’ (38.45) które jest równaniem różniczkowym fali sinusoidalnej. A więc dla małych odchyleń krzywa takiej zgiętej belki jest krzywą sinusoidalną. „Długość fali” ź tej fali sinusoidalnej jest równa podwojonej odległości Spomiędzy końcami. Jeżeli ugięcie jest małe, to ź jest jedno- cześnie równe podwójnej długości pręta nieugiętego. A zatem szukana krzywa ma rów- nanie y = K sin mc/L.
38-5. WYBOCZENIE 345 Biorąc drugą pochodną, otrzymujemy d2y r.2 ~d^~ = ~7Jy' Porównując to z równaniem (38.45) widzi- my, że siła jest równa F=tz2 YI T2' Dla małych ugięć siła ta jest niezależna od przesunięcia y, opisującego ugięcie belki\ Mamy zatem następujący obraz fizyczny. Jeżeli siła jest mniejsza od siły F, określonej równaniem (38.46), ugięcie wcale nie nastą- pi. Ale jeżeli siła będzie troszkę większa niż siły F, belka zostanie nagle ugięta i to dość znacznie, tzn. dla sił powyżej siły granicznej 7r217/L2 (często nazywanej „siłą Eulera”) bel- ka będzie ulegała wyboczeniu. Jeżeli obcią- żenie na drugim piętrze jakiegoś budynku przekroczy siłę Eulera dla podtrzymujących słupów, to budynek się zawali. Siła wybo- czenia jest także bardzo ważna w konstrukcji rakiet kosmicznych. Z jednej strony rakieta musi być dostatecznie sztywna, by utrzymać swój ciężar na wyrzutni i wytrzymać naprę- żenia powstające podczas jej przyspieszania, a z drugiej strony ważną rzeczą jest ograni- czenie ciężaru tej „budowli” do minimum, tak aby ciężar jej ładunku i ilość paliwa były (38.46) 38.18. Kształty ugiętego pręta F2 Fz możliwe jak największe. W rzeczywistości belka nie musi się całkiem załamać, gdy siła przekroczy siłę Eulera. Gdy przesunięcia staną się duże, siła Eulera będzie większa, niż to obliczyliśmy, ze względu na wyrazy, które pominęliśmy w wyrażeniu na 1/7? danym równaniem (38.38). Aby znaleźć siły przy dużym wyboczeniu belki, należy powrócić do dokładnego równania, równania (38.44), które było niezależne od przybliżonego związku pomiędzy R i y. Równanie (38.44) ma dość prostą własność geometryczną*’. Jej dowód jest trochę skomplikowany, ale jest ona raczej interesująca. Zamiast opisywać krzywą za pomocą zmiennych x i y można użyć *> Nawiasem mówiąc, to samo równanie pojawia się również w innych sytuacjach fizycznych, np. dla memsku cieczy zawartej pomiędzy dwiema równoległymi płaszczyznami i można tam posługiwać się tym samym opisanym tu rozwiązaniem geometrycznym.
346 38. SPRĘŻYSTOŚĆ dwóch nowych zmiennych: S, długości łuku krzywej, i 6, kąta nachylenia stycznej do krzy- wej (patrz rys. 38.17). Krzywizna jest równa „szybkości” zmiany kąta z odległością: 1 dd Dokładne równanie (38.44) można zatem zapisać w postaci de F y dS-------YI Biorąc tu stronami pochodną względem S i zastępując dyjdS przez sinfl dostajemy d2e F — = (38.47) [Jeżeli 0 jest małe, to stąd dostaniemy z powrotem równanie (38.45). Wszystko jest więc w porządku.] Może Cię to Czytelniku ucieszy (a może i nie), że równanie (38.47) jest dokładnie takim samym równaniem, jakie się otrzymuje dla wahadła, wahającego się z dużą amplitudą — z F/YI zastąpionym oczywiście jakąś inną stałą. W rozdziale 9 tomu I (cz. 1) nauczyliśmy się, jak takie równanie rozwiązywać numerycznie*’. W wyniku otrzymuje się pewne fan- tastyczne krzywe. Rysunek 38.18 pokazuje trzy takie krzywe dla różnych wartości FjYI. *’ Rozwiązania tego zagadnienia można także wyrazić przez pewne funkcje, nazywane „eliptycznymi funkcjami Jacobiego”, których wartości zostały już kiedyś obliczone.
39 ośrodki sprężyste 39-1. Tensor odkształceń W poprzednim rozdziale mówiliśmy o zniekształceniach pewnych szczególnych obiek- tów sprężystych. W tym rozdziale chcemy rozpatrzyć, co się może ogólnie rzecz biorąc dziać wewnątrz ośrodka sprężystego. Chcielibyśmy umieć opisać warunki naprężeń i od- kształceń wewnątrz jakiejś dużej bryły galarety, skręconej i zgniecionej w pewien skompli- kowany sposób. Aby to zrobić, musimy znać opis odkształceń lokalnych w każdym punkcie ciała sprężystego; opis taki sprowadza się do przyporządkowania każdemu punktowi zbioru sześciu liczb, będących składowymi tensora symetrycznego. Poprzednio mówiliśmy o tensorze naprężeń (rozdz. 31); teraz potrzebny nam jest tensor odkształceń. Wyobraźmy sobie, że za punkt wyjścia przyjmiemy ośrodek początkowo nie odkształ- cony i będziemy obserwować, jak się przesuwa mała, osadzona wewnątrz ośrodka plamka „zanieczyszczenia”, gdy ośrodek doznaje odkształcenia. Plamka, która była w punkcie P, znajdującym się w r = (x, y, z), przesuwa się do nowego położenia P', w r' — (%', y', z'), tak jak to pokazano na rys. 39.1. Wektor przesunięcia od punktu P do P' oznaczamy przez u. Wówczas u = r'—r. (39.1) Przesunięcie u zależy oczywiście od punktu, z którego wystartowaliśmy, tak że u jest funkcją wektorową zmiennej r albo, co na jedno wychodzi, funkcją zmiennych x,y,z. Rozpatrzmy najpierw prostą sytuację, gdy odkształcenie jest stałe w całym ośrodku; mamy wówczas tzw. odkształcenie jednorodne. Przypuśćmy na przykład, że mamy jakiś element ośrodka i że będziemy go równomiernie rozciągać. Będziemy po prostu równo- miernie zmieniać jego rozmiary w jednym kierunku, na przykład w kierunku x, tak jak to pokazano na rys. 39.2. Droga ux plamki, która się początkowo znajdowała w punkcie x,
348 39. OŚRODKI SPRĘŻYSTE 39.1. Plamka zlokalizowana w ośrodku w punkcie P w nieodkształconym bloku ośrodka przesuwa się do punktu P' po odkształceniu 39.2. Jednorodne odkształcenie typu rozciągania jest proporcjonalna do x. W istocie Al X l ux będziemy zapisywać w taki oto sposób: ux = Stała proporcjonalności exx jest oczywiście do- kładnie tym samym co Aljl. (Wkrótce zoba- czymy, dlaczego użyliśmy podwójnego wskaź- nika.) Jeżeli odkształcenie nie jest równomierne, to związek pomiędzy ux i x będzie się zmieniać w ośrodku od miejsca do miejsca. Dla sytuacji ogólnej exx definiujemy jako pewien rodzaj lokal- nego odkształcenia Al[l, a mianowicie exx— dujdx. (39.2) Ta liczba, która jest teraz funkcją x, y i z, opi- suje jak wielkie jest rozciąganie w kierunku x W kawałku galarety. Oczywiście, może tam także zachodzić rozciąganie w kierunkach y i z. Opisujemy je liczbami du du2 fi ~ _____- fi ~_______ w dy ’ " dz / / (39.3) Powinniśmy także móc opisać odkształcenia typu ścinania. Weźmy na przykład mały
39-1. TENSOR ODKSZTAŁCEŃ 349 39.3. Jednorodne odkształcenie typu ścinani* sześcian znajdujący się w niezdeformowanej początkowo galaretce. Jeżeli zmienimy kształt galaretki, to sześcian ten może się zmieniać w równoległościan, tak jak to naszkicowano na rys. 39.3*’. Przy takim odkształceniu przesunięcie w kierunku osi x każdej cząstki jest proporcjonalne do jej współrzędnej y, ux = -^y. . ' (39.4) Mamy tu też ruch w kierunku y, w którym droga jest proporcjonalna do x, 0 uy = -x. (39.5) Takie więc odkształcenie ścinania można opisać wzorami "x &xyy ’ uy = eyxx, r , s przyjmując w nich , , 0 exy ~ eyx Można by teraz sądzić, że gdy odkształcenia nie są jednorodne, to uogólnione odkształ- cenia ścinania można by opisać definiując wielkości exy i eyx jako *> Na chwilę rozdzielimy całkowity kąt ścinania 0 na dwie równe części i założymy, że odkształce- nie jest symetryczne względem x i y.
350 39. OŚRODKI SPRĘŻYSTE 39.4. Obrót jednorodny, przy którym nie ma odkształcenia Ale jest tu jedna trudność. Przypuśćmy, że przesunięcia ux i uy byłyby określone nastę- pująco: 0 ff = uy = -—x. Równania te są bardzo podobne do równań (39.4) i (39.5), z tym że znak przy uy został zmieniony na przeciwny. Przy takich przesunięciach mały sześcian w galaretce zostaje po prostu przesunięty o kąt 0/2, tak jak to pokazano na rys. 39.4. Nie ma tu wcale żadnego odkształcenia, mamy tylko obrót w przestrzeni. Ośrodek nie zostaje w ogóle zniekształ- cony; względne bowiem położenia wszystkich atomów wcale nie ulegają zmianie. Musimy tak podobierać nasze definicje, aby definicje odkształcenia ścinania nie zawierały w sobie czystych obrotów. Kluczowym punktem jest tu fakt, że jeżeli dujdy i duy/8x są sobie równe i mają znaki przeciwne, to wówczas nie ma żadnego odkształcenia; można więc uporząd- kować nasze definicje przyjmując, że e*? = eyx = i(8uy/dx+dux/8y). Dla czystego obrotu obie te wielkości są równe zeru, ale dla czystego ścinania exy jest równe eyx, zgodnie z tym, co chcielibyśmy otrzymać. W najbardziej ogólnie pojętym odkształceniu, które może ’ zawierać rozciąganie lub ściskanie na równi ze ścinaniem, stan odkształcenia określamy przez podanie dziewięciu liczb: <3u, > dx du eyy = ’ oy eXy = Wu^+dujdy), (39.7)
39-1. TENSOR ODKSZTAŁCEŃ 351 Są to wyrazy tensora odkształceń. Ponieważ jest to tensor symetryczny — z naszych de- finicji wynika, że exy = eyx — więc w rzeczywistości jest tu tylko sześć różnych liczb. Pamiętamy (rozdz. 31), że zgodnie z własnością ogólną tensora jego wyrazy transformują się jak iloczyny składowych dwóch wektorów. (Jeżeli A i B są wektorami, to Cfj — AtBj jest tensorem.) Każdy z wyrazów eu jest iloczynem (lub sumą takich iloczynów) składo- wych wektora u = (ux, uy, uz) i składowych operatora V = (d!dx, djdy, d/dz), który — jak wiemy — transformuje się tak jak wektor. Zastąpmy współrzędne x, y i z współrzęd- nymi x15 x2 i x3, a składowe ux, uy i u. składowymi u2, u2 i u3; wówczas ogólny wyraz tensora odkształceń można zapisać jako = }(8uj[dxi+8uil8x}), (39.8) gdzie i oraz j mogą być równe 1, 2 lub 3. Dla odkształcenia jednorodnego, które może zawierać zarówno rozciąganie, jak i ści- nanie, wszystkie wyrazy e/y są stałymi i można napisać = exxx+e^y+e„z. (39.9) [Początek naszego układu (x,y,z) obieramy w takim punkcie, w którym u jest równe zeru.] W tym przypadku tensor odkształceń daje zależność pomiędzy dwoma wekto- rami: wektorem położenia r = (x, y,z) i wektorem przesunięcia u = (ux, uy, uz). Gdy odkształcenia nie są jednorodne, każdy kawałek galaretki może zostać także nieco skręcony — będzie zachodzić pewien obrót lokalny. Jeżeli wszystkie odkształcenia są małe, to AXj, (39.10) i gdzie (Ojj jest tensorem mtysymetrycznym ~ i(t>u}ldxi~Sui/dx}), (39.11) który opisuje obrót. Nie będziemy się jednak już więcej troszczyć o obroty, a zajmiemy się tylko takimi odkształceniami, które są opisane przez tensor symetryczny e^. 39-2. Tensor sprężystości , Teraz, gdy już opisaliśmy odkształcenia, chcielibyśmy powiązać je z siłami wewnętrz- nymi — z naprężeniami w ośrodku. Zakładamy, że dla każdego małego elementu ośrodka jest słuszne prawo Hooke’a i przyjmujemy, że naprężenia są proporcjonalne do odkształ- ceń. W rozdziale 31 zdefiniowaliśmy tensor naprężeń S,7 jako i-tą składową siły działają- cej poprzez jednostkową powierzchnię, prostopadłą do osi x. Prawo Hooke’a mówi, że każda składowa jest zależna liniowo od każdej ze składowych odkształcenia. Ponieważ 5 i e mają po dziewięć składowych, istnieje 9-9 = 81 możliwych współczynników, które opisują własności sprężyste ośrodka. Te współczynniki są stałymi, jeżeli sam ośrodek
352 39. OŚRODKI SPRĘŻYSTE jest jednorodny. Zapisuje się je jako CiJlcl, a definiuje się je przy pomocy równania ^CiJklekl, (39.12) *,z gdzie i,j, k, l przyjmują wartości 1, 2, lub 3. Ponieważ współczynniki Cijkl wiążą z sobą dwa tensory, to tworzą one także tensor — tensor czwartego rzędu. Można go nazwać tensorem sprężystości. Załóżmy, że wszystkie współczynniki Cijkl są znane i że do jakiegoś obiektu, o pewnym dziwacznym kształcie, przykładamy jakąś skomplikowaną siłę. Będą tam wszystkie typy odkształceń i nasz obiekt przybierze w końcu jakiś „wykrzywiony” kształt. Jakie są prze- mieszczenia w tym obiekcie? Widać, że zagadnienie jest dość złożone. Gdybyśmy znali odkształcenia, moglibyśmy znaleźć naprężenia z równania (39.12) — lub odwrótnie. Ale te naprężenia i odkształcenia, które się na koniec ustalają w każdym punkcie, zależą od tego, co się dzieje w reszcie ośrodka. Najprostszy sposób na „dobranie się” do tego zagad- nienia polega na rozpatrzeniu energii. Jeżeli mamy siłę F proporcjonalną do przesunięcia, powiedzmy F — kx, to praca wymagana do wykonania przesunięcia x jest równa kx2f2. W podobny sposób, praca w, wykonywana w każdej jednostkowej objętości odkształco- nego materiału, jest równa w = ł Cijkieaeki- (39.13) ijkl Całkowita praca W potrzebna do odkształcenia ciała jest równa całce Z w po objętości ciała: — f i ^vkieijekidV. (39.14) ijkl Praca ta jest równa energii potencjalnej zmagazynowanej w naprężeniach wewnętrznych ośrodka. Jeżeli teraz ciało jest w równowadze, to ta energia wewnętrzna musi przyjmować minimum. Zagadnienie znalezienia odkształceń w ciele można zatem rozwiązać znajdując taki układ przesunięć u w całym ciele, przy którym energia W przyjmie minimum. W roz- dziale 19 tomu II (cz. 1) podaliśmy kilka ogólnych pojęć rachunku wariacyjnego, których się używa w takich zagadnieniach szukania minimum. Niestety, tego zagadnienia nie mo- żemy rozpatrzyć tu bardziej szczegółowo. Przede wszystkim interesuje nas teraz to, co potrafimy powiedzieć o ogólnych włas- nościach tensora sprężystości. Jest rzeczą jasną, że w rzeczywistości tensor Cijkt nie jest wcale scharakteryzowany przez 81 różnych wyrazów. Ponieważ zarówno Sb, jak i ei} są tensorami symetrycznymi, z których każdy ma tylko 6 różnych wyrazów, to w C,jk może być najwyżej 36 różnych wyrazów. Zwykle jednak jest ich o wiele mniej. Rozpatrzmy szczególny przypadek kryształu regularnego. Dla takiego kryształu gęstość energii w ma następującą postać: + ^xxxy ^xx ^xy 4“ ^xxxz &xx &xz4" ’~^~^~'xxyx^xx^yx~^'^-'xxyy^xx^yy^~r** •••4“ + Cwwe^+... itd.... itd.... itd. ...). (39.15)
39-2. TENSOR SPRĘŻYSTOŚCI 353 W sumie 81 wyrazów! Ale kryształ regularny ma pewne symetrie. W szczególności, jeżeli obróci się kryształ o 90 °, to jego własności fizyczne nie ulegną zmianie. Ma on więc taką samą sztywność na rozciąganie w kierunku y, co na rozciąganie w kierunku x. Dlatego też jeżeli zmienić naszą definicję kierunków osi współrzędnych x i y w równaniu (39.15), to dla dowolnych przesunięć energia się nie zmieni. A więc dla kryształu regularnego muszą zachodzić związki: (39.16) Z kolei można pokazać, że takie wyrazy jak Cxxxy muszą być równe zeru. Kryształ regularny ma bowiem tę własność, że jest on symetryczny wobec odbicia względem każdej płaszczyzny prostopadłej do jednej z osi. Jeżeli więc zastąpi się y przez — y, to nic się nie zmieni. Ale zamiana y na — y zmienia exy na — exy — przesunięcie, które było w kie- runku +y, jest teraz w kierunku — y. Jeżeli energia ma się nie zmienić, to przy odbiciu współczynnik musi przejść w — Cxxxy. Ale odbity kryształ jest taki sam, jaki był przed odbiciem, tak że Cyyyj, musi być takie samo jak — Cxxxy, a to się może stać tylko wtedy, gdy oba współczynniki C są równe zeru. „No, dobrze — powiecie — ale takie same rozważania wykażą, że Cyyyy = 0!” Nie, ponieważ tu są cztery wskaźniki y. Znak się zmienia raz dla każdego y, a cztery minusy dają w wyniku plus! Jeżeli więc mamy dwa lub cztery wskaźniki, to odpowiedni wyraz nie musi być równy zeru. Wyraz taki jest równy zeru tylko wtedy, gdy ma jeden lub trzy wskaź- niki y. A zatem, dla kryształu regularnego każdy niezerowy współczynnik C będzie miał tylko parzystą liczbę wskaźników identycznych. (Rozważania przeprowadzone tu dla y stosują się oczywiście także dla x i dla z.) Powinny by więc wystąpić tu tylko takie wyrazy, jak Cxw, Cxyxy, Cxyyx i tak dalej. Ale pokazaliśmy już, że jeżeli zmieni się każde y na x i odwrotnie (lub każde z na x itd), to musi się otrzymać — dla kryształu regularnego — znowu ten sam współczynnik. Oznacza to, że są tylko 3 różne niezerowe możliwości: (39.17) A zatem gęstość energii kryształu regularnego będzie miała postać następującą: 2 Cxxyy (exx eyy 4- eyy e2Z 4- eZ2 &yy) 4~ + 4CXyxy (exy + e>z + ezx)] . (39.18) Dla materiału izotropowego, tzn. niekrystalicznego, symetria ta jest jeszcze wyższa. Wszystkie współczynniki C muszą być takie same dla każdego wyboru układu współrzęd- nych. Okazuje się, że mamy wtedy jeszcze jeden związek pomiędzy współczynnikami C, a mianowicie (39.19) 23 — Wykłady z fizyki
354 39. OŚRODKI SPRĘŻYSTE Można się o tym przekonać przy pomocy następującego ogólnego rozumowania. Ten- sor naprężeń Sy musi być powiązany z tensorem ev w sposób, który nie zależy wcale od kierunków współrzędnych — musi on być powiązany tylko przez wielkości skalarne. „To proste” — powiecie. „Jedyny sposób na otrzymanie Sy z sprowadza się do po- mnożenia ey przez jakąś stałą skalarną. To jest po prostu prawo Hooke’a. Musi więc zachodzić związek Sy — (stała)-ey.” Ale to nieprawda; mógłby tu jeszcze wystąpić tensor Jednostkowy dy, pomnożony przez jakiś skalar, wyrażony liniowo poprzez etj. Jedynym, jaki można utworzyć, niezmiennikiem liniowym w wyrazach jest £eu. (Trans- formuje się on jak x2+y2+z2, a więc tak jak skalar). A zatem najbardziej ogólną postacią dla równania wiążącego Sy z etj — dla ośrodków izotropowych — jest związek 5(/ = 2(we<,.+A(2/?^)<5,r (39.20) (Pierwszą stałą zapisuje się zwykle jako 2p; wówczas współczynnik p jest równy modułowi ścinania, który zdefiniowaliśmy w poprzednim rozdziale.) Stałe p i 2 nazywamy stałymi sprężystymi Lamego. Porównując równanie (39.20) z równaniem (39.12) widzimy, że Cjayy — (39.21) C™* — 2^4-2. Udowodniliśmy zatem, że równanie (39.19) jest rzeczywiście prawdziwe. Widać także, że własności sprężyste ośrodka izotropowego są w pełni określone dwiema stałymi, jak już to stwierdziliśmy w rozdziale poprzednim. Tensor sprężystości można także wyrazić przy pomocy dwóch dowolnych stałych sprężystości, spośród tych, którymi posługiwaliśmy się poprzednio, na przykład przy pomocy modułu Younga Y i stałej Poissona a. Pozostawiamy czytelnikowi wykazanie, że C*w 1-j-tr 39-3. Ruchy w ciele sprężystym Wykazaliśmy, że dla ciała sprężystego w równowadze naprężenia wewnętrzne tak się wzajemnie dopasowują, że energia przyjmuje minimum. Chcemy się teraz przyjrzeć temu, co się dzieje, gdy siły wewnętrzne nie są w równowadze. Powiedzmy, że wyodrębnimy mały element ośrodka, ograniczony pewną powierzchnią A (patrz rys. 39.5). Jeżeli element ten
39-3. RUCHY W CIELE SPRĘŻYSTYM 355 jest w równowadze, to całkowita działająca nań siła F musi być równa zeru. Siłę tę można rozłożyć na dwie części. Jedna z tych części może pochodzić od sił „zewnętrznych”, takich jak siła ciężkości, które dzia- łają z pewnej odległości na materię w tym elemencie, tak aby wytworzyć pewną siłę na jednostkę objętości, fzewn. Całkowita siła zewnętrzna FMwn będzie równa całce z fzewn po objętości tego elementu: Fzewn = f 4ewn<^. (39.23) W równowadze siła ta powinna być zrównoważona przez całkowitą siłę Fwewn, pochodzącą od materii w sąsiedztwie naszego elementu i działanie tej siły powinno być przekazywane przez powierzchnię A. Gdy jednak rozważany element ośrodka nie jest w równowadze, to znaczy jeżeli się porusza, suma będzie równa iloczynowi masy i przyspieszenia. Będziemy więc mieli 39.5. Mały element objętości V ograniczony powierzchnią A siły wewnętrznej i zewnętrznej F,ewn + Fwewn = faldV, (39.24) gdzie q jest gęstością ośrodka, a r jest jego przyspieszeniem. Można teraz równania (39.23) i (39.24) zebrać razem pisząc: Fwewn J ( ^zewn + t? f)dF. V Uprościmy nasz zapis wprowadzając oznaczenie ś ^zewn 4" J? t. Wówczas równanie (39.25) można zapisać w postaci: Fwewn= ffdV. V <39.25) (39.26) (39.27) Siła, którą oznaczyliśmy F^, wiąże się z naprężeniami w materiale. Zgodnie z de- finicją tensora naprężeń Sl} (rozdz. 31) x-owa składowa siły dF działającej poprzez element powierzchni da o jednostkowej normalnej n jest dana wzorem dFx = (S^+S^+S^Jda. (39.28) Składowa .r-owa siły Fwewn, działająca na nasz mały element, jest zatem równa całce z dFx po powierzchni A. Uwzględniając ten wynik i wypisując x-ową składową równa- nia (39.27) otrzymujemy f (^xxflx+^xyfly~^^xini)^a — J fx^‘ (39.29)
356 39. OŚRODKI SPRĘŻYSTE Mamy całkę powierzchniową związaną z całką objętościową, a to przypomina nam coś, o czym mówiliśmy w elektryczności. Zauważmy, że gdyby nie zwracać uwagi na pierwszy wskaźnik x w każdym z S-ów po lewej stronie równania (39.29), to lewa strona wygląda- łaby tak, jak całka z wielkości ,,S”n, tzn. z normalnej składowej jakiegoś wektora, po powierzchni A. Całka taka byłaby równa strumieniowi „S” z tej objętości. A to można by zapisać, korzystając z prawa Gaussa, w postaci całki objętościowej z dywergencji ,,S”. Ale twierdzenie Gaussa jest prawdziwe niezależnie od tego, czy będzie tam ten wskaźnik x, czy też nie; jest to po prostu twierdzenie matematyczne, które się otrzymuje całkując przez części. Innymi słowy, równanie (39.29) można zamienić na * , CldSXx dSxv dSxz\ , C , \ . \^dV- (39.30) \J \ dx dy dz / J Teraz, korzystając z dowolności obszaru całkowania, można odrzucić znaki całek obję- tościowych i zapisać równanie różniczkowe dla ogólnej składowej f: V SSij <39-31) j j Równanie to mówi nam, jak siła na jednostkę objętości jest związana z. tensorem naprę- żeń Stj. Aby sformułować teorię ruchów wewnątrz ciał stałych, należy przeprowadzić na- stępujące postępowanie: przyjmując za punkt wyjścia znajomość przesunięć początkowych, określonych na przykład przez wektor u, można znaleźć składowe tensora odkształceń etj. Z odkształceń można wyznaczyć naprężenia przy pomocy równania (39.12). Mając na- prężenia można przy pomocy równania (39.31) otrzymać gęstość siły f. Znając zaś f można otrzymać z równania (39.26) przyspieszenie r ośrodka, które pozwoli nam określić zmianę przesunięć w czasie. Wykonując to wszystko po kolei, dostaje się dość nieprzyjemne rów- nanie ruchu dla sprężystych ciał stałych. Podamy tu tylko wyniki tego postępowania i to jedynie dla ośrodka izotropowego. Korzystając z równania (39.20) na Stj i wyrażając jako \{duildxj+dujldx^, dostanie się na koniec równanie wektorowe: f = (A+/z)V(V • u)+/zV2u. (39.32) Można jednak bezpośrednio stwierdzić, że równanie wiążące z sobą f i u musi mieć taką właśnie postać. Siła musi bowiem zależeć od drugich pochodnych przesunięć u. Ja- kie zaś drugie pochodne u mogą być wektorami? Jedną z nich jest V(V-u) (jest to praw- dziwy wektor), a drugą (i ostatnią) jest V2u. A zatem najogólniejszą możliwą postacią jest związek f = nV(V-u)+óV2u, który jest w zasadzie identyczny z równaniem (39.32), gdyż różni się od niego tylko ozna- czeniami stałych. Można by zapytać: dlaczego nie mamy trzeciego wyrazu postaci Vx xVxu, który jest także wektorem? Ale pamiętamy, że VxVxu jest równe V2u— —V(V-u), a więc jest liniową kombinacją tych dwóch wyrazów, które już mamy. Dodając
39-3. RUCHY W CIELE SPRĘŻYSTYM 357 więc V x V x u nie dodalibyśmy nic nowego. Jeszcze raz zatem udowodniliśmy, że ośrodek izotropowy ma tylko dwie stałe sprężyste. Aby otrzymać równanie ruchu ośrodka, można przyrównać równanie (39.32) do Qd2uldt2 — pomijając na razie wszystkie siły objętościowe, takie jak siła ciężkości — i wówczas <52u = (A+/z)V(V-u)+/zV2u. (39.33) ot Przypomina to trochę równanie falowe, które mieliśmy w elektromagnetyzmie, z tą różnicą, że mamy tu pewien dodatkowy, złożony wyraz. Dla ośrodków, których własności sprę- żyste są wszędzie takie same, można w następujący sposób stwierdzić, jak wygląda rozwią- zanie ogólne. Pamiętamy, że każde pole wektorowe można zapisać jako sumę dwóch wektorów: jednego, którego dywergencja jest równa zeru, i drugiego, którego rotacja jest równa zeru. Innymi słowy, można przyjąć u = Ui+u2, (39.34) gdzie V-U1=0, Vxu2 = 0. (39.35) Podstawiając sumę Uj+u2 za pole wektorowe u do równania (39.33) otrzymujemy d2 q— (01+u2) - (A+/z)V(V-u2)+/zV2(u1+u2). (39.36) dr Pole wektorowe Ui można wyeliminować, biorąc dywergencję obu stron tego równania: o2 Q— (Vu2) = ot Ponieważ kolejność operatorów (V2) i (V) można dowolnie zmieniać, to można operator dywergencji wyciągnąć przed nawias: r 52u2 i V- L——(A+2/z)V2u2 = 0. ; (39.37) L ot2 j Ponieważ zaś Vxu2 jest z definicji równe zeru, rotacja z wyrażenia znajdującego się w nawiasie kwadratowym jest także równa zeru; tak więc nawias ten sam musi tożsamoś- ciowe znikać i 52u2 = (A+2/z)V2u2. (39.38) ot Jest to wektorowe równanie fali dla fal rozchodzących się z prędkością C2 = v'(2+2/i)/q. Ponieważ rotacja wektora u2 jest równa zeru, fali tej nie towarzyszy żadne ścinanie i jest ona tylko falą ściskania, czyli typem fali dźwiękowej, którą opisaliśmy w poprzednim roz- dziale, a jej prędkość jest równa znalezionej tam właśnie prędkości CpodlU2. W podobny sposób — biorąc rotację z równania (39.36) — można pokazać, że wek-
358 39. OŚRODKI SPRĘŻYSTE poddany naprężeniom 39.6. Mierzenie naprężeń wewnętrznych przy po- mocy światła spolaryzowanego 39.7. Model z plastyku, w którym panują naprę- żenia, widziany pomiędzy dwoma skrzyżowany- mi polaroidami. [Z pracy F. W. Sears, Optics, Addison-Wesley Publishing Co., Reading, Mass., 1949.] tor spełnia równanie 52iii e^-=juV2u1. (39.39) Ot Jest to znowu wektorowe równanie fali dla fal o prędkości C2 = Ponie- waż V-Uj jest równe zeru, przesunięcie Uj nie powoduje żadnych zmian objętoś- ci; wektor uŁ odpowiada zatem fali po- przecznej (fali ścinania), którą omawialiś- my w poprzednim rozdziale i C2 = = c '“-'ścinania • Gdyby ktoś chciał znaleźć naprężenie statyczne w jakimś ośrodku izotropowym, to mógłby w zasadzie je znaleźć rozwią- zując równanie (39.32) z siłą f równą zeru lub równą statycznym siłom objętościo- wym ciążenia, takim jak <?g. Równanie (39.2) należałoby przy tym rozwiązać przy pewnych warunkach brzegowych, które byłyby określone przez siły działające na powierzchni ograniczającej cały element ośrodka sprężystego. Zagadnienie to jest nieco trudniejsze do rozwiązania niż odpo- wiadające mu zagadnienie elektromagne- tyki. Jest ono trudniejsze, gdyż, po pierw- sze, rozwiązywanie występujących tu rów- nań sprawia troszkę więcej kłopotu, a po drugie, kształty ciał sprężystych, które nas zwykle interesują, są przeważnie o wie- le bardziej skomplikowane. W elektroma- gnetyzmie interesuje nas często rozwiąza- nie równań Maxwella wokół obiektów o stosunkowo prostych kształtach geo- metrycznych, takich jak walce, kule itd., ponieważ są to dogodne kształty dla urzą- dzeń elektrycznych. W teorii sprężystości obiekty, które chciałoby się opisać, mają zwykle kształty dość skomplikowane, jak np. hak dźwigu, wał korbowy samochodu albo wirnik turbiny gazowej. Takie zagad- nienia można czasem rozwiązać w przybli- żeniu przy pomocy metod numerycznych,
39-3. RUCHY W CIELE SPRĘŻYSTYM 359 korzystając z zasady minimum energii, o której to zasadzie wspomnieliśmy już poprze- dnio. Inny jeszcze sposób polega na wykonaniu modelu obiektu i na doświadczalnym zmierzeniu odkształceń wewnętrznych; używa się do tego celu światła spolaryzowanego. Robi się to tak: gdy przezroczysty ośrodek izotropowy, np. taki przezroczysty materiał jak lucyt, zostaje poddany naprężeniom, staje się on materiałem dwójłomnym. Jeżeli przepuści się przez taki ośrodek światło spolaryzowane, to płaszczyzna polaryzacji zo- stanie obrócona o pewien kąt, proporcjonalny do naprężenia; mierząc więc ten obrót, można zmierzyć naprężenie. Rysunek 39.6 pokazuje, jak może wyglądać takie urządzenie, fotografia zaś 39.7 przedstawia model fotosprężysty, o skomplikowanym kształcie, pod- dany naprężeniom. 39-4. Zachowanie się niesprężyste We wszystkim, co dotąd zostało powiedziane, zakładaliśmy, że naprężenie jest pro- porcjonalne do odkształcenia; ogólnie, nie jest to jednak prawdą. Na rysunku 39.8 po- kazano typową krzywą, przedstawiającą naprężenie jako funkcję odkształcenia dla ja- kiegoś materiału plastycznego. Dla małych odkształceń naprężenie jest proporcjonalne do odkształcenia. Jednakże później, po przekroczeniu pewnego odkształcenia, ten zwią- zek pomiędzy naprężeniem i odkształceniem przestaje już być opisywany przez funkcję liniową. Dla wielu materiałów, tych, które nazwalibyśmy „łamliwymi”, odkształcenia powodują złamanie się takiego obiektu tuż powyżej tego punktu, w którym krzywa za- czyna się pochylać. Ponadto w ogólnym przypadku w tym związku naprężenie-odkształ- cenie pojawiają się jeszcze inne komplikacje. Tak na przykład, jeżeli będzie się odkształ- cać jakiś obiekt, to naprężenia mogą być od razu duże, ale później będą rosły powoli z czasem. W innych natomiast przypadkach, jeżeli przejdzie się do dużych naprężeń, ale jeszcze poniżej punktu „złamania”, a następnie się zmniejszy odkształcenia, to naprę- żenia „powrócą” wzdłuż innej krzywej. Zachodzi tu, chociaż w niewielkim stopniu, zja- wisko histerezy (przypominające związek pomię- dzy polami B i H w materiałach magnetycznych). Naprężenie, przy którym materiał się łamie, różni się znacznie w zależności od materiału. Niektóre materiały będą się łamać, gdy maksy- malne naprężenie rozciągające osiągnie pewną wartość. Inne zaś materiały się „rozlecą”, gdy maksymalne naprężenie ścinające osiągnie pewną wartość. Kreda jest przykładem takiego materia- łu, który jest o wiele mniej wytrzymały na rozciąganie niż na ścinanie. Jeżeli naciśnie się na końce kawałka kredy do pisania, to złamie się ona prostopadle do kierunku przyłożonego na- prężenia, tak jak to pokazano na fot. 39.9a. Kre- da łamie się prostopadle do przyłożonej siły, po- 39.8. Typowa zależność naprężenie-od- kształcenie dla dużych odkształceń I
360 39. OŚRODKI SPRĘŻYSTE 39.9. Kawałek kredy a) złamany przez nacisk na oba końce, b) złamany przez skręcenie nieważ w tym przypadku trzeba rozerwać tylko niewielką grupę upakowanych wspólnie cząstek, co można łatwo zrobić. Materiał ten jest jednak o wiele bardziej odporny na ścinanie, ponieważ wówczas cząstki stają sobie wzajemnie na drodze. Pamięta- my teraz, że gdy mieliśmy pręt, który był skręcany, to cały pręt był dookoła poddany ścinaniu. Pokazaliśmy także, że ścinanie było równoważne złożeniu roz- ciągania i ściskania pod kątem 45°. Z tych to powodów, jeżeli się skręci kawałek kredy, złamie się on wzdłuż pewnej skompliko- wanej powierzchni, która na po- czątku złamania tworzy z osią kredy kąt 45°. Kawałek kredy złamany w taki właśnie sposób pokazano na fot. 39.9b. Kreda się łamie tam, gdzie w materiale powstaje największe naprężenie. Inne materiały zachowują się w sposób dziwny i skompliko- wany. Im bardziej złożona jest struktura materiału, tym bar- dziej interesująco się on za- chowuje. Jeżeli wziąć arkusz „Saran-Wrap”*’, zmiąć go w kulę i rzucić na stół, to arkusz ten powoli się rozłoży i powróci do swej pierwotnej, płaskiej formy. Na pierwszy rzut oka mogłoby się wydawać, że to bezwładność powstrzymuje materiał od powrotu do pierwotnej postaci. Jed- nakże prosty rachunek wykazuje, że bezwładność jest o kilka rzędów wielkości za mała, aby mogła powodować to zjawisko. Są tam widocznie dwa ważne, konkurujące z sobą efekty: „pewne czynniki” wewnątrz materiału „pamiętają” jego pierwotny kształt i „pró- bują” do niego powrócić, ale „inne czynniki” „wolą” ten nowy kształt i „opierają” się powrotowi do starego kształtu. *’ Jest to produkowana w USA cienka folia plastykowa, w której prawdopodobnie „zamrożono” elektryczne momenty dipolowe. Służy ona głównie do opakowywania produktów żywnościowych, do któ- rych ścisłe przylega i samoczynnie się nie odwija. W opisanym doświadczeniu arkusz folii „usiłuje” na ma- ksymalnej swej powierzchni przylgnąć do powierzchni stołu. (Przyp. red. wyd. polskiego.)
39-4. ZACHOWANIE SIĘ NIESPRĘŻYSTE 361 Nie będziemy usiłowali opisywać mechanizmu tej zabawy z folią Saran, ale nastę- pujący model może nam pomóc w zrozumieniu, skąd się takie zjawisko może wziąć. Wyobraźmy sobie materiał utworzony z długich, giętkich, ale mocnych włókien wymie- szanych wraz z jakimiś komórkami, wypełnionymi jakąś lepką cieczą. Wyobraźmy sobie też, że pomiędzy poszczególnymi komórkami są jakieś wąskie „ścieżki”, tak że ciecz może przeciekać powoli z jednej komórki do drugiej. Mnąc arkusz czegoś takiego odkształci się te długie włókna, w jednym miejscu wypychając ciecz z komórek i wpychając ją do innych komórek, które są w trakcie tego procesu rozciągane. Gdy zostawimy taki zmięty w kulę arkusz w spokoju, te długie włókna będą się starały powrócić do swego pier- wotnego kształtu. Ale aby to zrobić, muszą one przepchać ciecz do jej położenia pier- wotnego, co będzie się działo stosunkowo dość wolno, ze względu na lepkość. Siły, które my przykładamy mnąc arkusz, są o wiele większe od sił wywieranych przez włókna. Można zmiąć arkusz szybko, ale powrót do pierwotnego kształtu nastąpi o wiele wol- niej. W Saran-Wrap musi bez wątpienia być jakaś kombinacja dużych a sztywnych i mniej- szych a ruchliwych cząsteczek, która jest odpowiedzialna za zachowanie się tego mate- riału. Do tej koncepcji pasuje też fakt, że materiał powraca do swego pierwotnego kształ- tu szybciej, gdy go podgrzać — ciepło zwiększa ruchliwość (zmniejsza lepkość) tych mniej- szych cząsteczek. Chociaż omawialiśmy właśnie, jak to prawo Hooke’a się załamuje, to jednak najdzi- wniejszą rzeczą jest nie to, że prawo Hooke’a nie ma zastosowania do dużych odkształ- ceń, ale to, że jest ono tak uniwersalne. Można podać pewną próbę wytłumaczenia tego, rozpatrując energię odkształcenia w ośrodku. Powiedzenie, że naprężenie jest propor- cjonalne do odkształcenia, jest równoznaczne powiedzeniu, że energia odkształcenia zmienia się jak kwadrat odkształcenia. Przypuśćmy, że mamy pręt i że skręcimy go o mały kąt 0. Jeżeli prawo Hooke’a ma tu mieć zastosowanie, to energia odkształcenia powinna być proporcjonalna do kwadratu 0. Przypuśćmy, że energia jest jakąś dowolną funkcją kąta; moglibyśmy ją wówczas wyrazić w postaci rozwinięcia w szereg Taylora wokół kąta 0 = 0. U(ff) = t7(0)+ C7'(O)0+it7"(O)024-C7'"(O)03... (39.40) Moment sił r jest równy pochodnej U względem kąta; tak więc dla założonego przez nas przypadku t(0) = C/'(O)+C/''(O)0+lt7"'(O)02+... . (39.41) Jeżeli teraz będziemy mierzyć kąty, licząc je od położenia równowagi, to pierwszy wyraz w rozwinięciu Taylora (39.40) jest równy zeru. A zatem, jako pierwszy pozostaje wyraz proporcjonalny do 0; i dla dostatecznie małych kątów będzie on znacznie większy od wy- razu z 02. [W rzeczywistości występujące w przyrodzie substancje są dostatecznie symetrycz- ne wewnętrznie, tak że r(0) = — r(—0); wyraz w szeregu (39.40) z 02 będzie więc równy zeru i odchylenie od liniowości będzie pochodzić tylko od wyrazu z 03. Nie ma jednakże żadnego powodu, aby to miało być prawdą dla ściskania i rozciągania.] Nie wytłuma- czyliśmy tutaj jednej rzeczy, a mianowicie tego, dlaczego materiały zwykle się łamią, wkrótce po tym jak wyrazy wyższych rzędów zaczynają mieć istotne znaczenie.
362 39. OŚRODKI SPRĘŻYSTE 39-5. Obliczanie stałych sprężystości Naszym ostatnim tematem ze sprężystości będzie pokazanie, jak można próbować obliczać stałe sprężystości jakiejś substancji, biorąc za punkt wyjścia znajomość własności atomów, z których dana substancja jest zbudowana. Rozpatrzmy tylko prosty przypadek regularnego kryształu jonowego, takiego jak np. chlorek sodu. Gdy kryształ taki zostaje odkształcony, jego objętość lub jego kształt ulega zmianie. W wyniku tych zmian rośnie energia potencjalna kryształu. Aby obliczyć zmianę energii odkształcenia, musi się wie- dzieć, dokąd każdy z atomów przechodzi. W kryształach złożonych atomy będą się prze- suwać w sieci w jakiś bardzo skomplikowany sposób, tak aby całkowita energia stała się możliwie jak najmniejsza. Utrudnia to w znacznym stopniu obliczanie energii od- kształcenia. Jednak w przypadku prostego kryształu regularnego można łatwo przewi- dzieć, co się będzie działo. Odkształcenia wewnątrz kryształu będą geometrycznie podobne do odkształceń zewnętrznych ścian i krawędzi kryształu. Stałe sprężyste kryształu regularnego można zatem obliczyć w następujący sposób. Po pierwsze, zakłada się jakieś prawo oddziaływania pomiędzy każdą parą atomów w krysz- tale. Następnie oblicza się zmianę energii wewnętrznej kryształu, w przypadku gdy zo- stanie on odkształcony i straci swój kształt równowagi. To daje nam pewien związek pomiędzy energią i odkształceniami. Związek ten jest formą kwadratową ze względu na wszystkie odkształcenia. Porównując energię otrzymaną w ten sposób z równaniem (39.13) można zidentyfikować współczynniki przy każdym z wyrazów ze stałymi sprężystości Cijkl. Dla naszego przykładu założymy proste prawo oddziaływania: siła pomiędzy sąsied- nimi atomami jest siłą centralną, przez co się rozumie, że działa ona wzdłuż linii łączącej 39.10. a. Siły międzyatomowe, które uwzględniamy w naszych obliczeniach, b. Model, w którym atomy są połączone z sobą przy pomocy sprężyn
39-5. OBLICZANIE STAŁYCH SPRĘŻYSTOŚCI 363 oba atomy. Można się spodziewać, że takie właśnie będą siły w kryształach jonowych, ponieważ siły te są przede wszystkim określone przez prawo Coulomba. (Siły wiązań kowalencyjnych są zwykle bardziej złożone, ponieważ mogą one nadać atomowi znaj- dującemu się w pobliżu jakiś „prztyczek” w bok; tę komplikację pominiemy.) Będziemy też uwzględniać tylko te siły, które działają pomiędzy każdym atomem, a jego najbliż- szym i drugim z kolei sąsiadem. Innymi słowy, dokonamy takiego przybliżenia, które pomija wszystkie siły pochodzące od dalszych jeszcze sąsiadów. Te siły, które będziemy uwzględniać, dla płaszczyzny xy pokazano na rys. 39.10a. Należy też uwzględnić odpo- wiednie siły działające w płaszczyznach yz i zx. Ponieważ interesują nas tylko te współczynniki sprężystości, które mają zastosowanie do niewielkich odkształceń, i — co na jedno wychodzi — ponieważ chcemy mieć w ener- gii tylko te wyrazy, które się zmieniają jak kwadraty odkształceń, możemy sobie wyobra- zić, że siła pomiędzy każdą parą atomów zmienia się liniowo z przesunięciem. Można zatem wyobrazić sobie, że każda para atomów jest połączona idealną sprężyną, tak jak to pokazano na rys. 39.10b. Wszystkie sprężyny łączące poszczególne atomy sodu z ato- mami chloru powinny mieć tę samą stałą sprężyny, nazwijmy ją k\. Sprężyny łączące dwa atomy sodu i sprężyny łączące dwa atomy chloru mogłyby mieć stałe różne, ale uprościmy nasze rozważania i przyjmiemy, że te stałe są sobie równe; oznaczymy je k2. (Można by po zobaczeniu, jak wyglądają obliczenia, cofnąć się i dokonać zróżnicowania tych stałych.) Zakładamy teraz, że kryształ jest odkształcony i że odkształcenie jest jednorodne, opisane przez tensor odkształceń e^. W ogólnym przypadku będziemy mieli składowe opatrzone wskaźnikami x, y i z; ale teraz będziemy rozważać tylko odkształcenie o trzech składowych exx, exy i eyy, tak aby można było je sobie łatwiej wyobrazić. Jeżeli obrać jeden atom za początek naszego układu, to przesunięcie każdego innego atomu jest dane przez dostosowane do poczynionych uproszczeń równanie (39.9): = exxx+exyy, (39.42) m, = eyxx+eyyy. Nazwijmy atom znajdujący się w punkcie x = y = 0 „atomem 1” i ponumerujmy jego sąsiadów na płaszczyźnie xy, tak jak to pokazano na rys. 39.11. Oznaczając stałą sieci przez a otrzymujemy składowe przesunięcia w kierunkach x i y, ux i uy, zamieszczone w tab. 39.1. Teraz można obliczyć energię zmagazynowaną w sprężynach, która dla każdej sprę- żyny jest równa k2/2 razy kwadrat wydłużenia. Tak na przykład, energia w poziomej sprę- żynie łączącej atom 1 z atomem 2 jest równa k1(exxa)2 - ~2 (39.43) Zauważmy, że przesunięcie w kierunku osi y atomu 2 nie zmienia, z dokładnością do wyrazów pierwszego rzędu, długości sprężyny łączącej atom 1 z atomem 2. Aby jednak otrzymać energię odkształcenia w sprężynie wzdłuż przekątnej, takiej jak pomiędzy ato-
364 39 OŚRODKI SPRĘŻYSTE 35.11. Przesunięcia najbhzszydi i drugich z kolei sąsiadów atomu 1 (przejaskrawione) Tabela 39.1 Atom Usytuowanie x/y Ux Uy k 1 o, o 0 0 — 2 ' a, o exxa eyxa 3 a, a ^xx+eXy>a (eyx+eyy)<l ^2 4 , 0, a exya eyya ^1 5 —a, a <—exx~eXy>a ( ’eyx~^~eyy)a k2 6 —a, 0 —exxa €yXQ kl 7 —4(j —a —(eXX—exy>a —(eyx+eyy)a k2 8 0, —a - cxya eyya kl 9 a, —a (exx exy)a (eyx eyy)a k2
39-5. OBLICZANIE STAŁYCH SPRĘŻYSTOŚCI 363 mami 1 i 3, należy obliczyć zmianę długości, pochodzącą zarówno od przesunięcia po- ziomowego, jak i od przesunięcia pionowego. Dla małych odchyleń od pierwotnego sześcianu tę zmianę odległości atomu 3 można zapisać jako sumę składowych ux i uy w kierunku przekątnej, a mianowicie jako 1 F2 Podstawiając za ux i uy wartości z tabeli otrzymujemy energię = ^-(.exx+eyx+exy+eyy)2. (39.44) Aby otrzymać całkowitą energię wszystkich sprężyn w płaszczyźnie xy, należy dodać do siebie 8 wyrazów, takich jak (39.43) i (39.44). Oznaczając tę energię Uq otrzymujemy a2 r , Z , ^0 = — l^lgxx+ y \eXX+eyX+eXy+eyy) + k +k1eyy+ — (exx—eyx+exy— eyy)2+ H"^l®XxH y XX~^~ yx~^~ xy~^~ yy) H- + k1e2y+^(exx-eyx+exy-eyy)2^. ' (39.45) Aby otrzymać całkowitą energię wszystkich sprężyn połączonych z atomem 1, musimy jeszcze coś dodać do równania (39.45). Chociaż w grę wchodzą tylko x-owe i j-owe skła- dowe odkształcenia, to mimo to są jeszcze pewne energie, związane z najbliższymi są- siadami atomu 1, leżącymi poza płaszczyzną xy. Ta dodatkowa energia jest równa k2(e^a2+e2ya2). (39.46) Stałe sprężystości są związane z gęstością energii w za pomocą równania (39.13). Ener- gia, którą obliczyliśmy, jest energią związaną z jednym atomem, a właściwie jest to po- dwojona wartość energii przypadającej na jeden atom, ponieważ energia sprężyny jest rozdzielona po połowie pomiędzy oba atomy, które ta sprężyna łączy. Ponieważ w jednost- kowej objętości jest 1 /a3 atomów, to wielkości w i Uo są związane z sobą zależnością «. Aby znaleźć stałe sprężystości CiJkl, należy tylko wykonać przekształcenie algebra- i$Ene w równaniu (39.45), dodać doń wyrazy z (39.46) i porównać współczynniki stojące
366 39. OŚRODKI SPRĘŻYSTE przy z odpowiednimi współczynnikami w równaniu (39.13). Wykonując odpowied- nie obliczenia możemy stwierdzić, że na przykład, przed wyrazem exx i e2y występuje czynnik (k1+2k2)a2, czyli C _k^lk* ^xxxx '''yyyy * Dla pozostałych wyrazów sprawa się nieco komplikuje. Ponieważ nie da się rozróżnić iloczynu dwóch wyrazów, takiego jak na przykład exxeyy i eyyexx, współczynnik przy takich wyrazach w wyrażeniu na energię jest równy sumie dwóch wyrazów z równania (39.13). Współczynnikiem przy exxeyy w równaniu (39.45) jest 2k2a2, tak że 2k2 Cyyxx) ~ • Ale ze względu na symetrię naszego kryształu C^y = i dlatego k2 C = C = — ^xxyy yyxx • Przy pomocy podobnego postępowania można także otrzymać fc2 C = C = — ^xyxy yxyx ♦ Łatwo też można dostrzec, że każdy wyraz, który zawiera albo x, albo y tylko jeden raz jest równy zeru, tak jak to udowodniliśmy już poprzednio na gruncie rozważań o syme- trii. Podsumujmy nasze wyniki: _ c _ *i+2fc2 ^xxxx ^yyyy » V ('• < a 1 k2 C = C = — ^'xyxy ^yxyx > (39.47) ^yyxx ^xyyx • Cxxxy = cxyyy = itd. = 0. Potrafiliśmy zatem związać stałe sprężystości elementu objętości substancji z włas- nościami atomowymi, których odzwierciedleniem są stałe ki i k2- W naszym szczegól- nym przypadku Cxyxy = Cxxyy. Okazuje się, jak z pewnością czytelnik zauważył, śle- dząc tok obliczeń, że te wyrazy są zawsze sobie równe dla kryształu regularnego, bez względu na to, ile sił się weźmie pod uwagę, jeżeli tylko siły te będą działały wzdłuż pro- stych łączących poszczególne pary atomów, to znaczy wtedy tylko, gdy siły działające pomiędzy atoniami będą przypominały sprężynki, a nie będą zawierały jakichś wyrazów
39-5. OBLICZANIE STAŁYCH SPRĘŻYSTOŚCI 367 Tabela 39.2. Współczynniki sztywności sprężystej kryszta- łów regularnych w 1012 dyn/cm2*’ Cxxxx ^xxyy ^xyxy Na 0,055 0,042 0,049 K 0,046 0,037 0,026 Fe 2,37 1,41 1,16 diament 10,76 1,25 5,76 Al 1,08 0,62 0,28 LiF 1,19 0,54 0,53 NaCl 0,486 0,127 0,128 KC1 0,40 0,062 0,062 NaBr 0,33 0,13 0,13 KJ 0,27 0,043 0,042 AgCl 0,60 0,36 0,062 Z książki C. Kittel, Introduction to Solid State Physics, John Wiley and Sons, Inc. New York 1956, str. 93. powodujących odchylenia na boki, tak jak to się na przykład dzieje w przypadku belki, której jeden koniec jest zamurowany. (Takie siły działające na bok występują w wią- zaniach kowalencyjnych.) Wniosek ten można sprawdzić posługując się wynikami pomiarów doświadczalnych stałych sprężystości. W tabeli 39.2 podajemy wartości obserwowane trzech współczyn- ników sprężystości dla kilku kryształów regularnych*’. Zauważmy, że na ogół i Cxyxy nie są sobie równe. Powodem tego jest fakt, że w takich metalach jak sód i potas siły międzyatomowe nie działają wzdłuż linii łączących atomy, tak jak to założyliśmy w naszym modelu. Diament też się „nie słucha” tego prawa, ponieważ siły w diamencie są siłami kowalencyjnymi i mają pewne własności kierunkowe — wiązania wolą zwykle tworzyć czworościany. Kryształy jonowe, takie jak fluorek litu, chlorek sodu itd., mają prawie wszystkie te własności fizyczne, które zakładał nasz model i tabela pokazuje, że stałe Cxxyy i Cxyxy są sobie prawie równe. Nie bardzo natomiast jest jasne, dlaczego wa- runek, że Cxxyy = Cxyxy, nie jest spełniony dla chlorku srebra. *’ W literaturze przedmiotu często można się spotkać z innym zapisem. Tak na przykład, zwykle się pisze Cxxxx — Cllt C^y — C12 i Cxyxy = C44..
40 j przepływ „suchej wody” 40-1. Hydrostatyka Zagadnienie przepływu różnych cieczy, a szczególnie wody fascynuje każdego czło- wieka. Każdy z nas chyba pamięta, jak, będąc dzieckiem, bawił się tym dziwnym „two- rem” w wannie czy też w błotnistej kałuży. Gdy już trochę podrośniemy, obserwujemy strumienie, wodospady i wiry i jesteśmy zafascynowani tą substancją, która się wydaje być prawie żywa w porównaniu z ciałami stałymi. Zachowanie się cieczy jest w wielu przypadkach zupełnie nieoczekiwane i interesujące — i to właśnie będzie tematem tego i następnego rozdziału. Wysiłki dziecka próbującego zagrodzić tamą mały strumień pły- nący ulicą i jego zdziwienie na widok tego dziwnego sposobu, w jaki woda przedziera się przez tamę, mają swój odpowiednik w naszych wieloletnich próbach zrozumienia prze- pływu cieczy. Próbowano już zatamować wodę — w naszym pojęciu — przy pomocy praw i równań, które miały opisywać jej przepływ. Te próby opiszemy w tym rozdziale. W następnym rozdziale opiszemy ten jedyny w swoim rodzaju sposób, w jaki to woda przerwała tamę i wymknęła się naszym próbom zrozumienia jej przepływu. Zakładamy, że czytelnikowi są już znane elementarne własności wody. Taką główną własnością, która odróżnia ciecz od ciała stałego, jest to, że w cieczy nie może się utrzy- mywać przez żaden skończony czas naprężenie ścinające. Jeżeli poddamy ciecz naprę- żeniom ścinającym, spowodują one jej ruch. Płyny gęstsze, takie jak miód, poruszają się przy tym z większą trudnością niż takie płyny jak powietrze lub woda. Miarą tej trudności, z jaką dana ciecz przepływa, jest jej lepkość. W tym rozdziale będziemy rozważać tylko takie sytuacje, w których zjawisko lepkości będzie można pominąć. Skutkami lepkości zajmiemy się w następnym rozdziale. Zaczynamy od hydrostatyki, teorii cieczy znajdujących się w spoczynku. Gdy ciecz jest w spoczynku, to nie mogą wystąpić żadne siły ścinania (nawet dla cieczy lepkich).
40-1. HYDROSTATYKA 369 Prawo hydrostatyki mówi zatem, że na- prężenia są zawsze prostopadłe do każ- dej powierzchni wewnątrz cieczy. Tę prostopadłą siłę na jednostkę powierzchni nazywamy ciśnieniem. Z faktu, że w cie- czy statycznej nie ma ścinania, wynika, że naprężenie ciśnienia jest we wszystkich kierunkach takie samo (rys. 40.1). Do- wód tego pozostawiamy czytelnikowi. Dokładniej, chodzi o wykazanie, że jeżeli na żadnej płaszczyźnie w cieczy nie ma ścinania, to ciśnienie musi być we wszy- stkich kierunkach takie samo. Ciśnienie w cieczy może się zmieniać od miejsca do miejsca. Tak na przykład w cieczy statycznej na powierzchni Ziemi ciśnienie będzie się zmieniało z wysoko- ścią, ze względu na ciężar cieczy. Jeżeli gęstość cieczy q będzie się uważać za stałą i jeżeli ciśnienie na jakimś dowolnie obranym poziomie zerowym oznaczy się p0 (rys. 40.2), to wówczas ciśnienie p na wysokości h powyżej tego punktu będzie równe p = p0—Qgh, gdzie g jest siłą gra- witacyjną działającą na jednostkę masy (czyli przyspieszeniem ziemskim). Suma P+Qgh jest więc w cieczy statycznej stała. Zwią- zek ten jest nam znany, ale teraz wypro- wadzimy pewien ogólniejszy wynik, któ- rego szczególnym przypadkiem jest właś- nie powyższy związek. Jeżeli wyodrębnimy w myśli mały sześ- cian wody, to jaka wypadkowa siła, po- chodząca od ciśnienia, będzie na niego działała? Ponieważ w każdym punkcie ciś- 40.1. W cieczy statycznej siła działająca na do- wolną powierzchnię jednostkową jest prostopa- dła do tej powierzchni i jest taka sama dla do- wolnej orientacji powierzchni 40.2. Ciśnienie w cieczy statycznej nienie jest takie samo we wszystkich kierunkach, wypadkowa siła będzie różna od zera tylko dlatego, że ciśnienie się zmienia od punktu do punktu. Przypuśćmy, że ciśnienie się zmienia w kierunku osi x, i obierzmy kierunki osi współrzędnych równolegle do krawędzi sześcianu. Ciśnienie na ściankę w punkcie x wywołuje siłę p dy Jz (rys. 40.3). a ciśnienie na ściankę w punkcie x-f-zlx daje siłę — [p-r(ćp/cx)dx]dy dz, tak że wypadkowa siła jest równa — (cp!cx)dx dy dz. Jeżeli rozpatrzymy pozostałe pary ścianek sześcianu, to łatwo zo- 24 — wykłady z fizyki
370 40. PRZEPŁYW „SUCHEJ WODY” 40.3. Wypadkowa — pochodząca od ciśnienia — siła, która działa na sześcian, jest równa — na jednostkę objętości cieczy, to siła na jednostkę objętości wynosi dzałająca na jednostkę objętości dodana do od ciśnienia musi dać zero: baczymy, że wywołana przez ciśnienie si- ła na jednostkę objętości jest równa —Vp. Jeżeli oprócz ciśnienia są jeszcze inne si- ły, np. siła ciężkości, to ciśnienie musi je zrównoważyć, tak aby się ustaliła równo- waga. Weźmy taki przypadek, w którym tę dodatkową siłę można opisać przy pomo- cy energii potencjalnej, tak jak to się czyni dla siły ciężkości; niech ę? oznacza energię potencjalną na jednostkę masy. (Dla siły ciężkości, na przykład, <p = gz.) Siła działająca na jednostkę masy jest dana przez — V<p, a jeżeli q jest gęstością -oV<p. Aby się ustaliła równowaga, ta siła siły na jednostkę objętości pochodzącej —V/>—Q^(p = 0. (40.1) Równanie (40.1) jest równaniem hydrostatyki. W ogólnym przypadku nie ma ono roz- wiązań. Jeżeli bowiem gęstość się zmienia w przestrzeni w jakiś dowolny sposób, to nie ma na to sposobu, aby siły się równoważyły, i ciecz nie może być w równowadze statycz- nej — powstaną wtedy prądy konwekcyjne. Można to stwierdzić na podstawie równania, ponieważ wyraz z ciśnieniem jest czystym gradientem, podczas gdy drugi wyraz, w przy- padku zmiennej gęstości q, już na ogół czystym gradientem być nie może. Wyraz z ener- gią potencjalną jest czystym gradientem tylko w pewnych sytuacjach, na przykład wtedy, gdy gęstość q jest stała. Wówczas rozwiązaniem równania (40.1) jest p+gę? = const. Inna możliwość, dopuszczająca równowagę hydrostatyczną, pojawia się wtedy, gdy gę- stość q jest funkcją tylko ciśnienia p. Zagadnieniem hydrostatyki nie będziemy się jednak zajmować, ponieważ nie jest ono tak ciekawe, jak sytuacja gdy ciecze są w ruchu. 40-2. Równania ruchu Najpierw omówimy ruchy cieczy w pewien czysto abstrakcyjny, teoretyczny sposób, a później rozważymy kilka szczególnych przykładów. Aby opisać ruch jakiejś cieczy, musi się podać jej własności w każdym punkcie. Tak na przykład woda (nazywajmy tę naszą ciecz „wodą”) porusza się w różnych miejscach z różnymi prędkościami. Aby więc scharakteryzować przepływ, musi się podać trzy składowe prędkości w każdym punkcie i w każdej chwili. Jeżeli będziemy potrafili znaleźć równania, które określają prędkość, to będziemy już wiedzieć, jak się ciecz przez cały czas porusza. Jednakże pręd- kość nie jest jedyną zmieniającą się od punktu do punktu własnością, która daną ciecz cha-
40-2. RÓWNANIA RUCHU 371 rakteryzuje. Przed chwilą właśnie omawialiśmy zmianę ciśnienia od punktu do punktu. Ponadto mogą tu wystąpić jeszcze inne zmienne wielkości. Może więc zmieniać się od punktu do punktu na przykład gęstość. Oprócz tego, ciecz może dodatkowo być prze- wodnikiem i przenosić prąd elektryczny, którego gęstość j też będzie zmieniała się od punktu do punktu, zarówno co do wielkości jak i co do kierunku. W cieczy może też zmieniać się od punktu do punktu jej temperatura albo pole magnetyczne i szereg innych wielkości. Liczba pól potrzebnych zatem do opisu kompletnej sytuacji zależy od tego z jak skomplikowanym zagadnieniem będziemy mieli do czynienia. Istnieją interesujące zjawiska, gdy dominującą rolę odgrywają prądy elektryczne i magnetyzm w określaniu zachowania się cieczy; zagadnienia takie są przedmiotem magnetohydrodynamiki, której obecnie poświęca się wiele uwagi. Jednakże nie będziemy tu rozważać tych bardziej zło- żonych sytuacji, ponieważ interesujące zjawiska znajdziemy już na niższym szczeblu „złożoności”, a nawet ten bardziej elementarny poziom będzie wystarczająco skompli- kowany. Zajmiemy się sytuacją, w której nie ma pola magnetycznego ani przewodnictwa i nie będziemy się martwić o temperaturę, ponieważ będziemy zakładać, że gęstość i ciśnienie określają w sposób jednoznaczny temperaturę w każdym punkcie. Pójdziemy nawet dalej i uprościmy naszą pracę, zakładając, że gęstość jest stała, a założenie takie oznacza, że ciecz jest zupełnie nieściśliwa. Innymi słowy, będziemy brali pod uwagę tak małe zmiany ciśnienia, że wywołane przez nie zmiany gęstości będziemy mogli pominąć. Gdy- byśmy nie przyjęli tego założenia, to oprócz zjawisk, które tu będziemy omawiać, natknę- libyśmy^się na dodatkowe zjawiska, na przykład na zjawisko.rozchodzenia się fal dźwię- kowych lub fal uderzeniowych. Rozchodzenie się tych fal już częściowo omówiliśmy w 2 części tomu I, tak że teraz pominiemy w naszych rozważaniach hydrodynamicznych te „dodatkowe” zjawiska właśnie zakładając, że gęstość q jest stała. Łatwo można określić, kiedy to przybliżenie będzie dobre. Nie trzeba się mianowicie martwić o zmiany gęstości wtedy, gdy prędkości przepływu będą o wiele mniejsze od prędkości fali dźwiękowej w danej cieczy. To, że woda się wymyka naszym próbom zrozumienia jej przepływu, nie jest związane z przybliżeniem stałej gęstości. Komplikacje, które powodują tę ucieczkę, będą omówione w następnym rozdziale. Ogólną teorię cieczy trzeba zacząć od równania stanu, które w danej cieczy wiąże ciś- nienie z gęstością. W naszym przypadku tym równaniem stanu jest po prostu warunek q = const. Jest to zatem pierwszy związek, jaki muszą spełniać nasze zmienne. Następny związek wyraża zasadę zachowania materii — jeżeli stwierdzimy, że z jakiegoś punktu materia wypływa, to jej ilość, jaka w tym punkcie pozostaje, musi maleć. Jeżeli prędkość cieczy wynosi v, to masa, która w jednostce czasu przepływa przez jednostkową powierzchnię, jest równa składowej @v, normalnej do tej powierzchni. Podobny związek mieliśmy w elek- tryczności. Z elektryczności wiemy także, że dywergencja takiej wielkości jest równa prędkości malenia gęstości. Z podobnych powodów możemy twierdzić że równanie do = (40.2)
372 40. PRZEPŁYW „SUCHEJ WODY” wyraża zasadę zachowania masy dla cieczy; jest to hydrodynamiczne równanie ciągłości. W naszym przybliżeniu, które jest przybliżeniem cieczy nieściśliwej, q jest pewną stałą i równanie ciągłości przechodzi po prostu w równanie Vv = 0. (40.3) Prędkość płynu v ma tu więc — podobnie jak i pole magnetyczne B — dywergencję równą zeru. (Równania hydrodynamiki są często ścisłymi odpowiednikami równań elektrody- namiki; dlatego właśnie najpierw się uczyliśmy elektrodynamiki. Niektórzy rozumują akurat odwrotnie: uważają, że najpierw powinno się poznać hydrodynamikę, aby potem łatwiej móc zrozumieć elektryczność. Ale elektrodynamika jest, tak naprawdę, znacznie łatwiejsza od hydrodynamiki.) Następne nasze równanie otrzymamy z prawa Newtona, które określa jak się zmienia prędkość na skutek działania sił. Masa pewnego elementu objętości cieczy pomnożona przez jego przyspieszenie musi być równa sile działającej na ten element. Biorąc element o objętości jednostkowej i oznaczając siłę na jednostkę objętości (czyli gęstość siły) przez f, mamy q • (przyspieszenie) = f. Gęstość siły przedstawimy w postaci sumy trzech wyrazów. Rozważaliśmy już pochodzą- cą od ciśnienia siłę na jednostkę objętości, — Vp. Poza tą siłą mogą jeszcze występować siły „zewnętrzne”, które działają na odległość, takie jak siła ciężkości czy siła Coulomba. Jeżeli będą to siły zachowawcze, o potencjale (na jednostkę masy) równym <p, to dadzą one gęstość siły —oV<p. (Gdyby siły zewnętrzne nie były siłami zachowawczymi, to siłę zewnętrzną działającą na jednostkę objętości musielibyśmy zapisać po prostu jako fzewn.) Jest tu jednak jeszcze jedna siła „wewnętrzna”, której istnienie wiążesię z faktem, że w prze- pływającej cieczy może też wystąpić naprężenie ścinające. Siłę tę nazywamy siłą lepkości; oznaczamy ją flepk. Nasze równanie ruchu ma zatem postać: o (przyspieszenie) = — Vp—J?V<p+flepk. (40.4) W tym rozdziale będziemy zakładać, że ciecz jest „rzadka” w tym sensie, że dla jej ruchu lepkość nie jest istotna i w równaniu (40.4) możemy siłę flepk opuścić. Trzeba jednak pamiętać, że jeżeli się odrzuca wyraz z siłą lepkości, to dokonuje się przybliżenia, które opisuje jakiś twór doskonały, a nie rzeczywistą wodę. John von Neumann zdawał sobie dobrze sprawę z olbrzymiej różnicy, jaką stwarza obecność siły lepkości, a także zdawał sobie sprawę z tego, że podczas największego rozwoju hydrodynamiki, aż do roku około 1900, największy nacisk położono na rozwiązywanie pięknych problemów matematycz- nych przy pominięciu lepkości cieczy, które to problemy nie miały prawie nic wspólnego z rzeczywistymi cieczami. On to właśnie nazwał teoretyków, którzy się zajmowali takim opisem, ludźmi zajmującymi się „suchą wodą”. Taki bowiem opis pomija najbardziej zasadniczą własność cieczy. Właśnie dlatego, że pomijamy tę własność w rachunkach tego rozdziału, daliśmy mu tytuł: „Przepływ suchej wody”. Rozważania na temat wody rzeczywistej odkładamy natomiast do następnego rozdziału. Jeżeli opuścimy siłę flepk, to jedyną jeszcze rzeczą potrzebną nam do napisania rów-
40-2. RÓWNANIA RUCHU 373 40.4. Przyspieszenie cząstki cieczy nania (40.4) w jawnej postaci będzie wyrażenie na przyspieszenie. Można by sądzić, że wzór na przyspieszenie cząstki cieczy powinien być bardzo prosty. Wydaje się bowiem, że jeżeli v jest prędkością cząstki cieczy znajdującej się gdzieś tam w cieczy, to jej przyspie- szenie będzie równe 8y/dt. Tak jednak nie jest — i to z dość subtelnych powodów. Po- chodna cy/ct jest równa szybkości, z jaką prędkość y(x, y, z, t) zmienia się w pewnym ustalonym punkcie przestrzeni. Tymczasem musimy wiedzieć jak szybko się zmienia pręd- kość poszczególnej cząstki cieczy. Wyobraźmy sobie, że jedną z kropli wody oznaczyliśmy kolorową plamką i możemy ją obserwować. W małym przedziale czasu, At, ta kropla przesunie się do jakiegoś nowego miejsca. Jeżeli kropla się porusza po pewnym torze, takim na przykład jak na rys. 40.4, to w chwili At przesunie się ona od punktu PY do P2. W istocie przesunie się ona w kierunku x o „odcinek” vxAt, w kierunku y o vyAt i w kierunku z o vzAt. Widać stąd, że jeżeli v(x, y, z, t) jest prędkością cząstki płynu, która się znajduje w chwili t w punkcie (x, y, z), to prędkość tej samej cząstki w chwili t+At jest dana przez y(x-pAx, y+Ay, z-pAz, t-pAt), przy czym Ax — vxAt, Ay = vyAt, Az = vzAt. Z definicji pochodnych cząstkowych [patrz równanie (2.7), t. U, cz. 1] mamy z dokład- nością do wyrazów pierwszego rzędu, y(x-pvxAt, y+vyAt, z+vzAt, t+At) = v(x, y, z, t)+ dy 5v dy dy + —vxAt+—vAt+-—vzAt+ — At. dx dy dz dt Przyspieszenie Ay/At jest więc równe dy dy dy dy dx dy dz dt Można to symbolicznie zapisać — traktując operator V tak jak wektor — jako dy (v.V)v+--. ' (40.5) ot
374 40. PRZEPŁYW „SUCHEJ WODY" Zauważmy, że przyspieszenie może być różne od zera nawet wtedy, gdy <3v/dt = O, a więc wtedy, gdy prędkość w danym punkcie się nie zmienia. Tak na przykład, woda płynąca po kole ze stałą prędkością doznaje przyspieszenia, chociaż prędkość w danym punkcie nie ulega zmianie. Oczywiście, przyspieszenie to istnieje dlatego, że prędkość pojedynczej cząstki wody, która początkowo jest w jednym punkcie koła, ma w chwilę później inny kierunek; przyspieszenie jest tu przyspieszeniem dośrodkowym. Reszta naszej teorii — to już tylko matematyka: szukanie rozwiązań równania ruchu, które otrzymujemy wstawiając przyspieszenie (40.5) do równania (40.4). Równaniem ruchu jest więc dv , „ Vp „ —- +(v V)v =-----------V<p, (40.6) Ot Q przy czym została w nim pominięta lepkość. Równaniu temu można nadać nieco inną postać, korzystając z następującej tożsamości analizy wektorowej: (v-V)v = (V Xv)xv+|V(vv). Jeżeli teraz zdefiniuje się nowe pole wektorowe Si, jako rotację v, S2 = V xv, (40.7) to tę tożsamość wektorową można zapisać w postaci (v V)v = S2 xv+|Vr2, i nasze równanie ruchu (40.6) przybierze postać dv ---pS2xv+|Vr2=-------------V®. (40.8) dt q Czytelnik może sam sprawdzić, że równania (40.6) i (40.8) są sobie równoważne, spraw- dzając, że składowe obu stron równania są sobie równe, jeśli się skorzysta z definicji (40.7). Pole wektorowe S2 nazywamy gęstością wirów. Jeżeli gęstość wirów jest wszędzie równa zeru, to mówimy, że przepływ jest bezwirowy. W § 3-5 (t. II, cz. 1) zdefiniowaliśmy pojęcie krążenia pola wektorowego. Krążenie wokół każdej zamkniętej pętli w cieczy jest równe całce krzywoliniowej z prędkości cieczy, w danej chwili, wokół tej pętli: (krążenie) = J vds. Krążenie na jednostkę powierzchni dla nieskończenie małej pętli jest więc — korzystając z twierdzenia Stokesa — równe Vxv. Gęstość wirów £2 jest zatem równa krążeniu wokół jednostkowej powierzchni (prostopadłej do kierunku £2). Wynika też stąd, że jeżeli wpro- wadzi się do cieczy jakieś źdźbło „brudu”, lecz nie nieskończenie mały punkt!, to będzie się on obracał z prędkością kątową £2/2. Spróbuj to Czytelniku udowodnić. Można także sprawdzić, że dla wiadra wody, postawionego na stoliku obrotowym, £2 jest równe podwojonej lokalnej prędkości kątowej wody. Jeżeli interesuje nas tylko pole prędkości, to można z naszych równań wyeliminować
40-2. RÓWNANIA RUCHU 375 ciśnienie. Biorąc rotację po obu stronach równania (40.8) oraz pamiętając, że gęstość Q jest stała i że rotacja każdego gradientu jest równa zeru, a ponadto korzystając z równa- nia (40.3) otrzymujemy o £2 — + V x(£2 xv) = 0. (40.9) dt Równanie to wraz z równaniami £2 = Vxv (40.10) oraz V-v = 0, (40.11) opisuje w zupełności pole prędkości v. Mówiąc „matematycznie” — jeżeli znamy £2 w ja- kiejś chwili, to znamy rotację wektora prędkości, ponieważ ponadto wiemy, że dywer- gencja wektora prędkości jest równa zeru, a więc dla danej sytuacji fizycznej mamy już to wszystko, co może być potrzebne do określenia prędkości v w każdym punkcie. (Przy- pomina to sytuację w magnetyzmie, gdzie mieliśmy V-B = 0 i VxB = j/e0c2). Znajo- mość zatem gęstości wirów £2 pozwala określić prędkość v, podobnie jak znajomość gę- stości prądu j określała pole B. Następnie, gdy znamy już prędkość v, równanie (40.9) wyznacza nam szybkość zmian £2, z której można dostać nową gęstość wirów £2 dla chwili następnej. Korzystając z równania (40.10) znajdujemy znowu nową prędkość v i tak dalej. Widać, że znajomość tych równań pozwala na rozwiązanie zagadnienia przepływu. Zau- ważmy jednak, że równania te dają tylko pole prędkości; straciliśmy całą informację do- tyczącą ciśnienia. Zwróćmy uwagę na jedną ważną konsekwencję tych równań. Jeżeli wszędzie i w każdej chwili t wektor £2 = 0, to GSŁjct także znika, tak że £2 w dalszym ciągu jest wszędzie równe zeru w chwili t-j-Jt. Mamy więc jedno rozwiązanie naszego równania: przepływ jest trwale bezwirowy. Jeżeli w takim przepływie na początku gęstość wirów była równa zeru, to będzie ona równą zeru w dowolnej chwili w przyszłości. Równania, jakie wówczas należy rozwiązać, sprowadzają się do następujących: V-v = 0, Vxv —0. Są to równania analogiczne do równań dla pól elektrostatycznych lub magnetycznych w przestrzeni swobodnej. Powrócimy do nich trochę później i rozpatrzymy wtedy ich pewne szczególne przypadki. 40-3. Przepływ ustalony — twierdzenie Bernonlliego Chcemy teraz powrócić do równania ruchu (40.8), ale ograniczyć się do sytuacji, w któ- rych przepływ jest „ustalony”. Mówimy, że przepływ jest ustalony, jeżeli w każdym miejscu w cieczy prędkość się nigdy nie zmienia. W każdym punkcie ciecz zostaje zawsze zastępo- wana nową cieczą, poruszającą się dokładnie w taki sam sposób. Obraz prędkości wygląda wtedy zawsze tak samo, czyli v jest statycznym polem wektorowym. Tak samo, jak ryso-
376 40 PRZEPŁYW „SUCHEJ WODY” 40.5. Linie prądu w przepływie ustalo- nym waliśmy „linie sił pola” w magnetostatyce, można teraz narysować linie, które są zawsze styczne do prędkości cieczy, tak jak to pokazano na rys. 40.5. Linie te nazywamy liniami prądu. Dla przepływu ustalonego są one oczywiście rzeczywistymi torami cząstek cieczy. (W przepływie nieustalonym obraz linii prądu zmienia się w czasie; linie prądu w jakiejś chwili nie reprezentują torów cząstek cieczy.) Gdy przepływ jest ustalony, to wcale nie ozna- cza, że nic się nie dzieje, wtedy bowiem atomy cieczy poruszają się i zmieniają swoje prędkości. Oznacza to tylko, że <3v/<3t = 0. Jeżeli teraz rów- nanie ruchu pomnoży się skalarnie przez v, to wyraz v(S2xv) znika i zostaje nam / p 1 \ rVi----FgH---v21 = 0. 2 / (40.12) Równanie to głosi, że dla małego przesunięcia w kierunku prędkości cieczy wielkość we- wnątrz nawiasów nie ulega zmianie. Otóż w przepływie ustalonym wszystkie przesunięcia zachodzą wzdłuż linii prądu, a więc równanie (40.12) mówi nam, że dla wszystkich punktów wzdłuż linii prądu można napisać: p 1 , ----1---o2 + q> = const (wzdłuż linii prądu). (40.13) q 2 Jest to twierdzenie Bernoulliego. W ogólnym przypadku występująca tu stała może być różna dla różnych linii prądu; wiemy tu bowiem tylko, że lewa strona równania (40.13) jest stała wzdłuż danej linii prądu. Przy okazji możemy zauważyć, że dla ustalonego ruchu bezwirowego, dla którego gęstość wirów £2 = 0, równanie ruchu (40.8) daje nam związek: (n 1 \ — + — v2+p] = 0, Q 2 I tak że ’ ' ’’ i ---1--r2+?> = const (wszędzie). (40.14) 6 2 Związek ten jest całkiem podobny do równania (40.13), z tym że teraz występuje w nim stała, która ma tę samą wartość w całym płynie. Twierdzenie Bernoulliego w gruncie rzeczy nie jest niczym innym jak zasadą zacho- wania energii. Tego typu zasada zachowania daje nam bardzo dużo informacji o przepły- wie, nie wymagając przy tym od nas rozwiązania szczegółowych równań. Twierdzenie Ber- noulliego jest tak ważne i tak proste, że chcielibyśmy również pokazać, jak można Je wyprowadzić w pewien inny sposób, różny od użytych powyżej formalnych rachunków. Wyobraźmy sobie wiązkę przylegających do siebie linii prądu, które tworzą „rurkę
4C-3 PRZEPŁYW USTALONY — TWIERDZENIE BERNOULLIEGO 377 prądu”, tak jak to naszkicowano na rys. 40.6. Ponieważ ścianki rurki składają się z linii prądu, to przez taką ściankę nie może przepłynąć ani odrobina cieczy. Oznaczmy pole powierzchni przekroju rurki na jednym jej końcu przez , w tym samym miejscu mamy ponadto daną prędkość cieczy , jej gęstość i jej energię potencjalną . Dla drugiego końca rurki mamy odpowiednie wielkości ?t2, v2, q2 i <?2- Po krótkim odstępie czasu At płyn znajdujący się na powierzchni Ax przesunął się o odległość v±At, a płyn z powierzch- ni A2 przesunął się o odległość v2At (rys. 40.6b). Z zasady zachowania masy wynika, że masa, która dopływa do rozważonego obszaru przez powierzchnię At musi być równa masie, która wypływa przez A2. Te dwie masy muszą na obu końcach być takie same: AM = Q1A1v1At = ()2A2v2At. Mamy zatem rowność = Q2A2v2. ' ' (40.15) Z równości tej wynika, że jeżeli o jest stałe, to prędkość się zmienia odwrotnie proporcjo- nalnie do powierzchni przekroju rurki prądu. Obliczmy teraz pracę wykonaną przez ciśnienie cieczy. Praca wykonana na cieczy wpływającej przez powierzchnię A2 jest równa p1A1v1At, a praca oddana przez ciecz na powierzchni /t2 jest równap2A2v2At. Wypadkowa praca wykonana na cieczy pomiędzy Ar i ?12 jest więc równa piA1v1 At—p2A2v2At i musi się równać przyrostowi energii masy AM cieczy, przy przejściu od powierzchni AY do ?12. Innymi słowy, p1A1v1At—p2A2v2At = AM{E2—E1), (40.16) 40.6. Ruch cieczy w rurce prądu a) b) -rr" V \ f i KU'"’ v24t^ 1 \ 1 1 s ul V \
378 40. PRZEPŁYW „SUCHEJ WODY" / / gdzie E2 jest energią przypadającą na jednostkę masy na powierzchni Alt a E2 odpo- wiednią energią na A2. Całkowitą energię przypadającą na jednostkę masy cieczy można przedstawić w postaci sumy E = %v2 + q>+U, gdzie %v2 jest energią kinetyczną jednostki masy, <p — energią potencjalną jednostki masy, a U jest dodatkowym wyrazem, który przedstawia energię wewnętrzną jednostki masy cieczy. Energia wewnętrzna mogłaby odpowiadać na przykład energii cieplnej w cieczy ściśliwej lub energii chemicznej. Wszystkie te wielkości mogą się zmieniać od punktu do punktu. Podstawiając tę postać energii do równania (40.16) mamy PiA^At p2A2v2At 1 1 2 AM Ale widzieliśmy, że AM = (>AvAt, tak więc p, 1 , p2 1 , — +^v2+q>1+U1^ — + — v2A-(p2+U2, (AGAT) (?i 2 o2 2 co jest w zasadzie prawem Bernoulhego, z tym że mamy tu dodatkowy wyraz odpowia- dający energii wewnętrznej. Jeżeli ciecz jest nieściśliwa, to wyraz ten jest taki sam po obu stronach równania i wobec tego równanie (40.14) jest słuszne wzdłuż każdej Unii prądu. Rozważymy teraz kilka prostych przykładów, w których całka Bemoulliego daje nam opis przepływu. Przypuśćmy, że mamy wodę wypływającą z otworu znajdującego się w po- bliżu dna zbiornika, tak jak to pokazano na rys. 40.7. Bierzemy pod uwagę taką sytuację, w której prędkość wypływu rwypl w otworze jest znacznie większa od prędkości przepływu w pobliżu górnej powierzchni płynu; innymi słowy, wyobrażamy sobie, że średnica zbior- nika jest tak duża, że można pominąć opadanie poziomu cieczy. (Można by, gdyby ktoś chciał, zrobić bardziej dokładne obliczenia.) nieniu atmosferycznemu p0, a ciśnienie po 40.7. Wypływ ze zbiornika U szczytu zbiornika ciśnienie jest równe cis- obu stronach wypływającej strugi także wy- nosi p0. Wypiszemy teraz równanie Ber- noulhego dla pewnej linii prądu, takiej jak to pokazano na rysunku. Przyjmujemy, że prędkość v jest równa zeru u szczytu zbior- nika, oraz że także potencjał grawitacyjny <p jest tam równy zeru. Prędkość na dole przy otworze jest równa vwypi i potencjał = —gh, tak że Po = Po-ri^^-pgh, czyli Pwypł = ^2gh. (40.18) Jest to taka sama prędkość, jaką miałoby ciało swobodne, spadające z wysokości h. Nie
40-3. PRZEPŁYW USTALONY — TWIERDZENIE BERNOULLIEGO 379 40.8. Przy cofniętej w głąb naczynia rurze wypływu powierzchnia strugi zwęża się tak, źe stanowi połowę powierzchni otworu spustowego jest to zbyt wielką niespodzianką, ponieważ woda przy wyjściu zwiększa swą energię kine- tyczną kosztem energii potencjalnej wody na górze. Niech jednak Czytelnik nie wyobraża sobie, że można by obliczyć wydatek, z ja- kim woda wypływa ze zbiornika, mnożąc tę prędkość przez powierzchnię otworu. Pręd- kości cieczy, w momencie gdy struga opuszcza otwór, nie są do siebie równolegle, ale mają składowe skierowane do wnętrza, do środka strugi — struga się zwęża. Po przebyciu przez strugę pewnej, niewielkiej drogi przestaje się ona zwężać i prędkości stają się do siebie równoległe. A zatem całkowity wypływ jest równy iloczynowi prędkości i pola powie- rzchni w tym punkcie, w którym prędkości stają się równoległe. Okazuje się, że jeżeli otwór spustowy ma kształt koła o ostrej krawędzi, to struga się zwęża tak, że pole po- wierzchni jej przekroju jest równe 62 % powierzchni otworu. Ta zredukowana, efektywna powierzchnia wypływu zmienia się dla różnych kształtów otworów wylotowych, a doś- wiadczalnie mierzone zwężenia strugi można znaleźć w tabelach współczynników wypływu. Jeżeli ciecz wypływa przez rurę, która jest cofnięta w głąb naczynia, tak jak to pokazano na rys. 40.8, można udowodnić w przepiękny sposób, że współczynnik wypływu wynosi •dokładnie 50 %. Podamy tylko pewną wskazówkę do tego dowodu. Posłużyliśmy się za- sadą zachowania energii, aby otrzymać prędkość [równanie (40.18)], ale przecież jest jeszcze zasada zachowania pędu! Ponieważ w wypływającej strudze zachodzi wypływ pędu, to na powierzchni poprzecznego przekroju strugi musi działać jakaś siła. Skąd się ta siła bierze? Musi ona pochodzić od ciśnienia na ścianki. Dopóty, dopóki otwór wypływu jest mały i oddalony od ścianek, prędkość cieczy w pobliżu ścianek zbiornika będzie bardzo mała. Dlatego też ciśnienie na każdą ściankę jest prawie takie samo, jak ciśnienie statyczne w cieczy znajdującej się w spoczynku — równanie (30.14). A zatem ciśnieniu statycznemu, •działającemu na każdy punkt ściany bocznej zbiornika, musi odpowiadać równe mu ciś- nienie, działające na leżący vis a vis punkt ścianki przeciwległej, z wyjątkiem tych punktów, które leżą naprzeciwko rury wypływu. Jeżeli obliczy się pęd, jaki wypływa przez ten otwór na skutek działania tego ciśnienia, to się okaże, że współczynnik wypływu wynosi Metody tej nie można jednak zastosować do otworu takiego, jak ten na rys. 40.7, ponieważ wzrost prędkości wzdłuż ścianek będących w bezpośrednim sąsiedztwie powierzchni wypływu daje pewien spadek ciśnienia, którego nie potrafimy obliczyć. Rozpatrzmy jeszcze jeden przykład — poziomą rurę o zmieniającym się przekroju, tak jak to pokazano na rys. 40.9, z przepływającą w niej wodą. Z zasady zachowania energii, czyli z wzoru Bernoulliego wynika, że ciśnienie jest mniejsze tam, gdzie powierzch- nia przekroju jest mniejsza, a więc tam, gdzie prędkość jest większa. Zjawisko to można łatwo wykazać, mierząc ciśnienia dla różnych przekrojów przy pomocy małych, piono-
380 40. PRZEPŁYW „SUCHEJ WODY’. 40.9. Ciśnienie jest najmniejsze tam, gdzie prędkość jest największa wych słupków wody, dołączonych do rury przepływu poprzez otwory, które są na tyle małe, że nie zakłócają przepływu. Miarą ciś- nienia jest w tym przypadku wysokość tych słupków wody. Okazuje się, że ciśnienie jest mniejsze przy przewężeniu niż po obu jego stronach. Jeżeli powierzchnia przekroju za przewężeniem powraca do tej samej wartości, jaką miała przed przewężeniem, to ciśnienie znowu się zwiększa. Ze wzoru Bernoulliego wynikałoby, że ciśnienie cieczy, która już przepłynęła przez przewężenie, powinno być takie samo jak przed przewężeniem, ale w rzeczywistości to ciśnienie pod koniec przewę- żenia jest w sposób zauważalny mniejsze. 40.10. Dowód, że prędkość v nie jest równa Wniosek ten jest niesłuszny dlatego, że pomi- nęliśmy siły tarcia, czyli siły lepkości, które po- wodują spadek ciśnienia wzdłuż rury. Pomimo tego spadku ciśnienia ciśnienie jest wyraźnie mniejsze w przewężeniu niż po obu jego stronach, tak jak to przepowiedział Bernoulli. Prędkość t>2 musi być oczywiście większa od vL , aby ta sama ilość wody przeszła przez węższą rurę. Woda doznaje zatem przyspie- szenia przechodząc od części szerokiej do wąskiej. Siła, która daje to przyspieszenie, po- chodzi od spadku ciśnienia. O słuszności naszych wyników można się również przekonać za pomocą jeszcze jednego prostego doświadczenia. Przypuśćmy, że ma- my zbiornik, którego rura wylotowa wyrzuca strugę wody do góry, tak jak to pokazano na rys. 40.10. Gdyby prędkość wypływu była dokładnie równa V2gh, to wypływająca woda powinna dotrzeć aż do poziomu powierzchni wody w zbiorniku. Tymczasem doświadczenie pokazuje, że woda aż tak wysoko nie do- ciera. Nasze przewidywania są z grubsza słuszne, ale znowu lepkość, której nie uwzględ- niliśmy w naszej zasadzie zachowania energii, spowodowała pewną stratę energii. Czy ktoś trzymał kiedyś blisko siebie dwie kartki papieru i próbował je rozdzielić wdmu- chując pomiędzy nie strumień powietrza? Spróbujcie! Kartki przylgną do siebiel Powodem tego jest oczywiście to, że powietrze ma większą prędkość przechodząc przez ściśniętą przestrzeń pomiędzy arkuszami, niż gdy przechodzi na zewnątrz arkuszy. Ciśnienie po- między arkuszami jest więc mniejsze od ciśnienia atmosferycznego, tak że arkusze się bar- dziej przycisną do siebie, a nie rozdzielą.
40-4. KRĄŻENIE 381 40-4. Krążenie Na początku poprzedniego paragrafu stwierdziliśmy, że jeżeli mamy płyn nieściśliwy którego krążenie jest równe zeru, to przepływ spełnia następujące dwa równania: V-v = 0, Vxv = 0. (40.19) Są to takie same równania jak równania elektrostatyki lub magnetostatyki w przestrzeni swobodnej. Dywergencja pola elektrycznego jest przecież równa zeru, gdy nie ma ładun- ków, a rotacja pola elektrostatycznego jest zawsze równa zeru. Podobnie rotacja pola magnetycznego jest równa zeru, gdy nie ma prądów, a dywergencja pola magnetycznego jest zawsze równa zeru. Dlatego też równania (40.19) mają takie same rozwiązania, jak równania na pole E w elektrostatyce lub równania na pole B w magnetostatyce. Prawdę mówiąc, rozwiązaliśmy już zagadnienie opływu kuli, posługując się odpowiednikiem elek- trostatycznym w § 12-5 (t. II, cz. 1). Tym odpowiednikiem elektrostatycznym było je- dnorodne pole elektryczne plus pole dipola. To pole dipola jest tak dobrane, że prędkość przepływu ma normalną składową do powierzchni kuli równą zeru. To samo zagadnie- nie w przypadku opływu walca można roz- wiązać w podobny sposób posługując się do- branym odpowiednio jednorodnym rozkła- dem momentu dipolowego wzdłuż linii prostej oraz jednorodnym polem prędkości przepły- wu. To rozwiązanie opisuje sytuację, w której prędkość cieczy na dużych odległościach od opływanego obiektu jest stała — zarówno co do wartości bezwzględnej, jak i co do kie- runku. Rozwiązanie zostało naszkicowane na rys. 40.1 la. Opływ walca ma jeszcze inne rozwiązanie, w przypadku gdy warunki są takie, że ciecz w dużych odległościach porusza się po okrę- gach wokół walca. Przepływ jest więc wszędzie kołowy, tak jak to pokazano na rys. 40.1 Ib. Dla takiego przepływu nie znika krążenie wokół walca, chociaż V xv jest w dalszym ciągu równe zeru w każdym punkcie w cieczy. Jak może istnieć krążenie przy znikającej ro- tacji? Otóż krążenie wokół walca nie znika, bo całka krzywoliniowa z pola prędkości v wokół każdej pętli otaczającej walec nie jest równa zeru. Jednocześnie całka krzywoliniowa z v wokół każdej drogi zamkniętej, która nie obejmuje walca, jest równa zeru. Z tym sa- mym zjawiskiem zetknęliśmy się przy szukaniu 40.11. a. Opływanie walca przez ciecz dosko- nałą. b. Krążenie wokół walca, c. Złożenie a) i b)
382 40. PRZEPŁYW „SUCHEJ WODY” 40.12. Woda, w któ- rej nie znika krążenie, wypływająca ze zbior- nika pola magnetycznego wokół drutu. Rotacja pola B była wtedy równa zeru na zewnątrz drutu, chociaż całka krzywoliniowa z pola B wokół pętli otaczającej drut wcale nie znikała. Pole pręd- kości w bezwirowym krążeniu wokół walca jest dokładnie takie samo, jak pole magnetyczne wokół drutu. Dla drogi kołowej o środku leżącym na osi walca całka krzywoliniowa z prędkości jest równa y vds = 2nrv. Dla przepływu bezwirowego całka ta musi być niezależna od r, czyli musi być równa stałej, którą oznaczamy C. Wówczas C v — ——, (40.20) 2w gdzie v jest prędkością styczną do okręgu o promieniu r i o środku leżącym na osi walca. Istnieje ładny sposób zademonstrowania krążenia cieczy wokół otworu. Należy mianowicie wziąć przezroczysty, cylindryczny zbiornik z otworem spustowym w samym środku dna zbiornika. Zbiornik ten napełnia się wodą, następnie mieszając patykiem wzbudza się jakieś krążenie i wyciąga zatyczkę z otworu. Widzi się wówczas piękne zjawisko, takie jak na rys. 40.12. (Każdy z nas widział podobną rzecz wiele razy w wannie!) Chociaż na początku wprowadzono pewną prędkość kątową w, to prędko zamiera ona ze względu na lepkość i przepływ staje się bezwirowy, mimo że wokół otworu będzie ciągle istniało pewne krążenie. Teoria pozwala obliczyć kształt wewnętrznej powierzchni wody. Gdy jakaś cząstka wody porusza się do wewnątrz, jej prędkość rośnie. Z równania (40.20) widać, że prędkość styczna zmienia się tak jak 1/r; wynika to po prostu z zasady zachowania momentu pędu, tak samo jak to, że łyżwiarka zaczyna się szybciej obracać, gdy ściągnie ramiona do siebie. Prędkość radialna także się zmienia jak 1/r. Pomijając ruch styczny, mamy wodę, która biegnie radialnie w kierunku otworu; z faktu, że V • v = 0, wynika, że prędkość radialna jest proporcjonalna do 1/r. Całkowita prędkość także rośnie zatem jak 1/r i woda do- pływa do otworu wzdłuż spirali Archimedesa. Na całej powierzchni woda-powietrze pa- nuje ciśnienie atmosferyczne i dla powierzchni tej — na podstawie równania (40.14) — musi być spełniony związek: gz+imt)2 = const. Ale prędkość v jest proporcjonalna do 1/r, czyli kształt powierzchni jest określony rów- naniem k (z-z0) = —. r2 Jeszcze jedna interesująca uwaga, która jednak nie jest ogólnie prawdziwa, lecz tylko dla przepływu nieściśliwego i bezwirowego. Otóż jeżeli mamy jedno rozwiązanie opisujące
40-4. KRĄŻENIE 383 pewien przepływ i jakieś inne rozwiązanie, to ich suma także będzie rozwiązaniem. Rów- nania (40.19) są bowiem równaniami liniowymi. Równania opisujące natomiast w pełni hydrodynamikę — (40.8)-(40.10) — nie są liniowe, co stanowi olbrzymią różnicę. Jednakże w przypadku bezwirowego opływu walca można nałożyć przepływ z rys. 40.1 la na prze- pływ z rys. 40.1 Ib i otrzymać nowy obraz przepływu, pokazany na rys. 40.lic. Przepływ ten zasługuje na szczególną uwagę. Prędkość przepływu jest tu większa na górnej ściance walca niż na ściance dolnej. Ciśnienia są zatem mniejsze na ściance górnej niż na ściance dolnej. Jeżeli mamy zatem superpozycję krążenia wokół walca oraz poziomego (w nie- skończoności) przepływu, to na walec działa wypadkowa siła poprzeczna, nazywana siłą nośną lub siłą wyporu. Oczywiście, jeżeli krążenie znika, to na żadne ciało nie działa żadna, tego rodzaju siła wypadkowa, zgodnie z naszą teorią „suchej wody”. 40-5. Linie wiru Wypisaliśmy już ogólne równania dla przepływu cieczy nieściśliwej, w której może nie znikać gęstość wirów. Są to równania: I. V-v = 0, II. £2 = Vxv, c£2 III. — + V X (£2 xv) = 0. Ot Zawartość fizyczną tych równań opisał słownie Helmholtz w postaci trzech twierdzeń. Po pierwsze, wyobraźmy sobie, że w cieczy potrafilibyśmy narysować linie wiru zamiast linii prądu. Przez linie wiru rozumiemy linie sił pola, które mają kierunek wektora £2, a których gęstość jest w każdym obszarze proporcjonalna do wartości bezwzględnej £2. Z równania II wynika, że dywergencja wektora £2 jest zawsze równa zeru [pamiętamy — §3-7 (t. II, cz. 1) — że dywergencja rotacji jest zawsze równa zeruj. Linie wiru zatem przy- pominają linie sił pola B, gdyż nigdzie się nie zaczynają oraz nigdzie nie kończą i mają ten- dencję do przebiegania wzdłuż zamkniętej pętli. Helmholtz podał ponadto słowne sfor- mułowanie równania III w postaci następującego twierdzenia: linie wiru poruszają się wraz z cieczą. Oznacza to, że gdybyśmy oznaczyli jakoś cząstki cieczy znajdujące się wzdłuż linii wiru — zabarwiając je np. atramentem — to gdy ciecz podczas ruchu będzie je prze- nosiła wraz z sobą, cząstki te będą zawsze określać nowe położenie linii wiru. Niezależnie od tego, w jaki sposób będą się poruszały atomy cieczy, linie wiru będą się poruszać wraz z zabarwionymi cząstkami. Oto jeden ze sposobów na wyrażenie słowne praw hydrody- namiki. Nasuwa to także pewną metodę rozwiązywania dowolnych zagadnień sprowadzają- cych się do równań I-III. Jeśli dany jest początkowy obraz przepływu, powiedzmy pręd- kość v w każdym punkcie, można obliczyć gęstość wirów £2. Znając prędkość v można, także powiedzieć, gdzie w chwilę później znajdą się linie wiru, gdyż poruszają się one właś- nie z prędkością v. Mając nową gęstość wirów £2 można posłużyć się równaniami I i II,
384 40. PRZEPŁYW „SUCHEJ WODY” aby znaleźć nową prędkość v. (Przypomina to dokładnie zagadnienie szukania pola B, jeśli są określone prądy.) Jeżeli więc dany jest obraz przepływu w jednej chwili, to w zasa- dzie można go obliczyć dla każdej chwili późniejszej. Postępowanie takie pozwala zatem znaleźć ogólne rozwiązanie dla przepływu nielepkiego. Chcielibyśmy pokazać, jak można, przynajmniej częściowo, zrozumieć twierdzenie Helmholtza opisane równaniem III. W rzeczywistości przedstawia ono po prostu zasadę zachowania momentu pędu, zastosowaną do cieczy. Przypuśćmy, że w myśli wyodręb- nimy z cieczy mały walec, którego oś jest równoległa do linii wiru, tak jak przedstawiono 40.13. a. Grupa linii wiru w chwili t. b. Te same linie w chwili późniejszej t' to na rys. 40.13a. W chwilę później ta sama por- cja cieczy będzie już gdzie indziej. W ogólnym przypadku będzie ona jednak też zajmowała jakiś walec o innej średnicy i zlokalizowany oczywiście w innym miejscu. Ten nowy walec może mieć też jakąś inną orientację, na przy- kład taką, jak na rys. 40.13b. Jeżeli jednak średnica się zmieniła, to długość walca też musi się zmienić, tak aby objętość cieczy pozostała stała (zakładamy bowiem, że ciecz jest nie- ściśliwa). Także, ponieważ linie wiru są zwią- zane z substancją tworzącą ciecz, ich gęstość będzie rosnąć ze zmniejszaniem się pola po- wierzchni przekroju walca. Iloczyn gęstości wi- rów £2 i pola powierzchni A walca będzie po- zostawał stały, a zatem według Helmholtza powinniśmy mieć 12^2 = 12^!. (40.21) Zauważmy teraz, że w cieczy nielepkiej wszystkie siły działające na powierzchni tego walca (lub nawet na powierzchni dowolnego obszaru, jaki możemy wyodrębnić w myśli z cieczy) są prostopadłe do powierzchni. Siły ciśnienia mogą spowodować przemieszczanie rozważanego obszaru z miejsca do miejsca lub zamianę jego kształtu; ale wobec braku sił stycz- nych wartość momentu pędu substancji będącej wewnątrz walca nie może się zmienić. Moment pędu cieczy w małym walcu jest w przybliżeniu równy iloczynowi jego momentu bezwładności I i prędkości kątowej cieczy, która jest propor- cjonalna do gęstości wirów Q. Moment bez- władności walca jest proporcjonalny do mr1. Z za- sady zachowania momentu pędu wnioskujemy
40-5. LINIE WIRU 385 zatem, że 40.14, Wytwarzanie podróżujących pierścieni wiru (MlR2^Qt = (M2R22-)Q2. Masy są tu jednak takie same, AĄ = M2, a pola powierzchni są proporcjonalne do R2, czyli znowu otrzymaliśmy równanie (40.21). Twierdzenie Helmholtza, będące słownym sformułowaniem prawa III, jest po prostu konsekwencją faktu, że w cieczy nielepkiej mo- ment pędu dowolnego elementu cieczy nie może się zmienić. Istnieje ładny sposób doświadczalnego zademonstrowania poruszającego się wiru, dający się wykonać za pomocą prostej aparatury przedstawionej na rys. 40.14. Mamy tu „bęben” o średnicy 60 cm i o takiej samej wysokości, powstały w wyniku naciągnięcia grubej powłoki gumowej na otwartym końcu walcowatego „pudła”. „Dno” tego pudła — bęben jest przewrócony na bok—jest sztywne, a do- kładnie w jego środku znajduje się otwór o średnicy 7,5 cm. Jeżeli się gwałtownie uderzy ręką w gumową przesłonę, to z otworu wyleci wir powietrza w kształ- cie pierścienia. Chociaż wir taki jest niewidzialny, to można się przekonać o jego istnieniu, ponieważ po- trafi on zdmuchnąć świecę umieszczoną w odległości 3-6 m od bębna. Ponieważ zgaśnięcie świecy nastąpi z pewnym opóźnieniem, można wnioskować, że „coś” podróżuje z pewną skończoną prędkością. Zjawisko to można lepiej zaobserwować, jeżeli najpierw wdmu- chnie się do pudła trochę dymu. Wówczas można zo- baczyć wir w postaci pięknego okrągłego „kółka dymu”. To kółko dymu jest wiązką linii wiru o kształcie toroidalnym, taką właśnie jak przedstawiona na rys. 40.15a. Ponieważ gęstość wirów £2 = V xv, to linie wiru przedstawiają także krążenie prędkości v, tak jak to pokazano na części b rysunku. Ruch do przodu pierścienia można zrozumieć w następujący spo- sób: prędkość krążąca wokół „dna” pierścienia przesuwa się ku „wierzchołkowi” pierścienia, co powoduje ruch pierścienia do przodu. Ponieważ linie 40.15. Poruszający się pierścień wiru (pierścień dymu), a. Linie wiru. b. Przekrój pierścienia 25 — Wykłady z fizyki
386 40. PRZEPŁYW „SUCHEJ WODY” \ wiru £2 poruszają się wraz z płynem, to poruszają się one do przodu także z prędkością v. (Oczywiście, krążenie prędkości v wokół górnej części pierścienia jest odpowiedzialne za ruch do przodu linii wiru będących na „dnie” pierścienia.) Musimy jeszcze wspomnieć o pewnej poważnej trudności. Zauważyliśmy już, iż z rów- nania (40.9) wynika, że jeżeli gęstość wirów £2 była pierwotnie równa zeru, to będzie ona już zawsze równa zeru. Wynik ten stanowi piętę achillesową teorii „suchej wody”, gdyż oznacza on, że jeśli gęstość wirów £2 na początku była zerem, to już zawsze będzie ona równa zeru — co oznacza, że w żadnej sytuacji nie można wytworzyć żadnej nie znikającej gęstości wirów. Tymczasem w naszym prostym doświadczeniu z bębnem udało nam się wytworzyć pierścień wiru w powietrzu, które początkowo było w spoczynku. (Na pewno bowiem v = 0 i £2 = 0 wszędzie w pudle, zanim się je uderzy.) Wiemy także, że można wytworzyć posługując się wiosłem pewną gęstość wirów na powierzchni wody jeziora. Widać więc jasno, że aby w pełni zrozumieć zachowanie się cieczy, należy przejść do teorii „mokrej” wody. Jeszcze jeden nieprawdziwy punkt w naszej teorii „suchej wody”, to przypuszczenie, dotyczące przepływu na granicy pomiędzy cieczą a powierzchnią jakiegoś ciała stałego. Kiedy omawialiśmy opływ walca — taki na przykład jak na rys. 40.11 — pozwoliliśmy cieczy „ślizgać” się po powierzchni ciała stałego. W naszej teorii prędkość na powierzchni ciała stałego mogła mieć każdą wartość, w zależności od tego, jakie były warunki począt- kowe na ruch, a ponadto nie rozważaliśmy żadnego „tarcia” pomiędzy cieczą a ciałem stałym. Tymczasem z doświadczenia wynika, że na powierzchni ciał stałych prędkość cie- czy rzeczywistej zawsze spada do zera. Dlatego też nasze rozwiązanie opisujące opływ walca z krążeniem czy bez, nie jest zgodne z rzeczywistością — tak samo zresztą, jak i nasz wynik dotyczący wytwarzania gęstości wirów. W następnym rozdziale opowiemy o teo- riach, które są już bardziej poprawne. 9
41 przepływ „mokrej wody” 41-1. Lepkość W poprzednim rozdziale omówiliśmy zachowanie się wody, pomijając zjawisko lep- kości. Teraz chcielibyśmy opisać zjawiska przepływu cieczy już z uwzględnieniem skut- ków lepkości. Chcemy więc rozpatrzyć rzeczywiste zachowanie się cieczy. Podamy jakoś- ciowy opis rzeczywistego zachowania się cieczy w kilku różnych sytuacjach, tak aby czy- telnik mógł się nieco zaznajomić z zagadnieniami, jakie tu mogą się pojawiać. Chociaż więc zobaczymy tu kilka skomplikowanych równań i dowiemy się o kilku skomplikowanych sprawach, to jednak nie zakładamy, że czytelnik będzie uczył się tych wszystkich rzeczy z tego rozdziału. Jest to w pewnym sensie rozdział „poglądowy”, w którym zamierzamy dać pewne pojęcie o tym, jaki jest otaczający nas świat. Jeden tylko punkt będzie tu wart nauczenia się, a jest nim prosta definicja lepkości, do której za chwilę dojdziemy. Cała reszta ma służyć tylko „celom rozrywkowym”. W poprzednim rozdziale stwierdziliśmy, że prawa ruchu cieczy są dane takim oto rów- naniem : ~+(v-V)v= -3L±_Vę>+-^. (41.1) St e Q Przyjmując przybliżenie „suchej wody” opuściliśmy ostatni wyraz, pomijając przez to wszelkie zjawiska „lepkie”. Czasami także robiliśmy dodatkowe założenie, uważając ciecz za nieściśliwą; wówczas mieliśmy jeszcze dodatkowe równanie V-v = 0. To ostatnie założenie jest często zupełnie dobre, szczególnie wtedy, kiedy prędkości prze- pływu są dużo mniejsze od prędkości dźwięku. Ale dla cieczy rzeczywistych prawie nigdy nie jest prawdą, że można pominąć tarcie wewnętrzne, które nazywamy lepkością; więk- szość interesujących zjawisk, które tam zachodzą, jest w taki czy inny sposób związana
388 41. PRZEPŁYW „MOKREJ WODY” właśnie z lepkością. Widzieliśmy na przykład, że w „suchej” wodzie krążenie nigdy się nie zmienia — jeżeli nie było go na początku, to nigdy ono się nie pojawi. Tymczasem krążenie w cieczach jest zjawiskiem spotykanym codziennie. Należy więc naszą teorię poprawić. Zaczniemy od pewnego ważnego faktu doświadczalnego. Kiedy rozważaliśmy przepływ „suchej” wody wokół walca, tzw. przepływ potencjalny, nie mieliśmy żadnych powodów, aby wykluczyć z naszych rozważań takie przepływy, podczas których woda mogła mieć prędkość styczną do powierzchni; tylko składowa normalna musiała być równa zeru. Nie wzięliśmy bowiem pod uwagę możliwości, że pomiędzy cieczą a ciałem stałym mogą występować siły ścinania. Okazuje się — chociaż nie jest to wcale oczywiste — że we wszyst- kich przypadkach, które były sprawdzone doświadczalnie, prędkość cieczy na powierzchni ciała stałego jest dokładnie równa zeru. Bez wątpienia czytelnik miał okazję zaobserwować, że na łopatkach wentylatora może się gromadzić cienka warstwa kurzu, która nie będzie przez powietrze usunięta podczas pracy wentylatora. To samo zjawisko można zaobser- wować nawet na dużym wentylatorze w tunelu aerodynamicznym. Dlaczego kurz nie zostaje przez powietrze zdmuchnięty? Pomimo tego, że taka łopatka wentylatora porusza się z wielką prędkością w powietrzu, prędkość powietrza względem łopatki będzie na samej powierzchni wentylatora dążyła do zera. Dlatego te najmniejsze cząstki kurzu są pozostawione w spokoju*’. Należy więc tak zmienić naszą teorię, aby zgadzała się ona z tym faktem doświadczalnym, że we wszystkich zwykłych cieczach drobiny będące w bez- pośrednim sąsiedztwie ciała stałego mają prędkość (względem powierzchni) równą zeru**’. W początkowo przyjętej przez nas charakterystyce cieczy przyjmowaliśmy, że jeżeli przyłoży się do cieczy naprężenie ścinające — nawet jak najmniejsze — to ustąpi ona pod tym naciskiem i zacznie płynąć. W sytuacjach statycznych rzeczywiście nie ma naprężeń ścinania. Ale zanim równowaga zostanie osiągnięta — dopóty, dopóki będą działały siły powodujące ruch cieczy — mogą występować siły ścinające. Lepkość opisuje właśnie te siły ścinania, które istnieją w poruszającej się cieczy. Aby się przekonać, jaka jest wielkość tych sił ścinania podczas ruchu cieczy, rozważmy takie oto doświadczenie. Przypuśćmy, że mamy dwie płaskie płytki, zrobione z jakiegoś ciała stałego, a pomiędzy nimi wodę, tak jak to przedstawiono na rys. 41.1 i że jedną z tych płytek utrzymujemy w spoczynku, podczas gdy drugą przesuwamy równolegle do niej z niewielką prędkością v0. Jeżeli zmierzy się siłę, jaka jest potrzebna do podtrzymania ruchu górnej płytki, to przekona- my się, że siła ta jest proporcjonalna do pola powierzchni płytki i do stosunku vojd, gdzie d jest odległością pomiędzy płytkami. A zatem naprężenie ścinania, FjA, jest proporcjo- nalne do v$ld: F v0 Stałą proporcjonalności rj nazywa się współczynnikiem lepkości. ♦’ Można zdmuchnąć z powierzchni stołu duże cząstki kurzu, ale nie te najmniejsze. Te duże cząstki „wystają” nieco nad powierzchnią stołu i dlatego podmuch może je porwać ze sobą. Można sobie wyobrazić takie okoliczności, kiedy to nie jest prawdą: szkło teoretycznie jest „cie- czą”, ale na pewno można je zmusić do „ślizgania się” wzdłuż stalowej powierzchni. To nasze twierdzenie musi się zatem gdzieś załamywać.
41-1. LEPKOŚĆ 389 pole powierzchni = A , .V - F d l / •. • •. u 1 v / • płyn V v=0 41.1. Siła lepkości pomiędzy dwiema równoległymi płaszczyznami Jeżeli mamy jakąś bardziej złożoną sytuację, to zawsze można rozważać małą, płaską i pro- stokątną ,,komórkę” w wodzie, o ściankach rów- noległych do przepływu, tak jak na rys. 41.2. Siła ścinania działająca na tę komórkę jest dana przez AF Avx dvx U “ V ~Ay ~ ^1/' (41.2) Pochodna 8vx[dy jest tu szybkością zmian od- kształcenia ścinania, które zdefiniowaliśmy w rozdz. 38, tak więc dla cieczy naprężenie ścinania jest proporcjonalne do szybkości zmian odkształce- nia ścinania. W przypadku ogólnym piszemy 41.2. Naprężenie ścinania w cieczy lepkiej / cv., dvx \ Sxv = fl —- H-1 • xy \dx dy) (413) Jeżeli mamy jednostajny obrót cieczy, to dvjdy równe jest ć)vy/8x ze znakiem ujemnym i Sxy jest równe zeru — tak jak być powinno, ponieważ w obracającej się ruchem jednostajnym cieczy nie ma żadnych naprężeń (podobną sytuację mie- liśmy przy definicji exy w rozdz. 39). Istnieją oczy- wiście odpowiednie wyrażenia na Syz i Szx. Jako przykład zastosowania tych pojęć rozważ- my ruch cieczy pomiędzy dwoma współosiowy- mi walcami. Niech walec wewnętrzny ma promień a i prędkość obwodową va, a zewnętrzny - - promień b i prędkość vb (patrz rys. 41.3). Moż- na by zapytać: jaki jest rozkład prędkości pomiędzy tymi walcami? Aby odpowiedzieć na to pytanie, 41.3. Przepływ pomiędzy dwoma współśrodkowymi walcami, obracają- cymi się z różnymi prędkościami ką- towymi
390 41. PRZEPŁYW „MOKREJ WODY” zacznijmy od znalezienia wzoru na naprężenie ścinające spowodowane lepkością cieczy, w odległości r od osi. Ze względu na symetrię zagadnienia można założyć, że istnieje tu tylko przepływ w kierunku prostopadłym do płaszczyzn przechodzących przez oś walców i że jego wielkość zależy tylko od promienia r; v = v(r). Jeżeli obserwować pyłek poruszają- cy się wraz z wodą, w odległości r od osi, to jego współrzędne jako funkcja czasu są równe x = r cos (ot, . y = r sincot, gdzie o>~ v/r. Składowe prędkości w kierunkach x i y są zatem równe vr = — r(o sincot = — wy, (41.4) vy — rco cos cot = (ox. Z (41*3) mamy f 8 8 I f 8(o dwl sxy= v —y-r- • (4i-5) z \_8x dy J [ & 8yj Dla punktu o współrzędnej y — 0, C(o)Cy = 0 i x8a>]ox jest równe rdco/dr. Dla tego zatem punktu (5xA-o = w—r- <41-6) (Powyższy wynik, że 5 zależy od ćw/5r, jest zgodny z intuicją, gdyż jeśli (o się nie zmienia wraz z r, to ciecz podlega jednostajnemu obrotowi i wszystkie naprężenia powinny zni- kać.) Naprężenie, które obliczyliśmy, jest naprężeniem ścinającym w kierunku prostopa- dłym do płaszczyzny przechodzącej przez oś walca i prostą y = 0 (oś x). Ze względu na symetrię zagadnienia nic się nie zmieni, jeśli za oś x przyjmiemy dowolną prostą prosto- padłą do osi i dlatego naprężenie to jest takie samo wokół całego walca. Moment siły, działający na powierzchnię walca utworzonego z cząstek cieczy w odległości r od osi, można otrzymać mnożąc naprężenie ścinające przez ramię r i powierzchnię 2~rl. Otrzy- mujemy dco r = 2nr2l(SX]/)0 = 2nt]lr3 —. (41.7) ar Ponieważ ruch wody jest jednostajny — nie ma przyspieszenia kątowego — wypad- kowy moment działający na cylindryczną warstwę wody zawartą pomiędzy r a r-\-dr, musi być równy zeru; a to znaczy, że moment siły działający w r musi być równoważony przez równy mu i skierowany przeciwnie moment siły w r+dr, czyli r musi być niezależne od r. Innymi słowy, r^dajdr jest równe jakiejś stałej, np. A i d(o A ~dT = V' (41.8)
41-1. LEPKOŚĆ 391 Całkując znajdujemy, że w zmienia się z r jak u>=-^+B. (41.9) Stałe A i B należy tak określić, ąby spełnione zostały warunki: <o = <oa dla r — a i a> = <o6 dla r = b. Dostajemy więc 2a2b2 , _ b2mb-a2ma b2—a2 Znamy zatem a> jako funkcję r, a stąd v — a>r. Z równań (41.7) i (41.8) możemy otrzymać moment siły: t = 2izr]lA, 47rł?/a2ń2 z czyli T = —------r- (<O4 - <oj. (41.11) b —a Moment siły jest proporcjonalny do względnej prędkości kątowej obu walców. W opar- ciu o ten wynik konstruuje się jeden z typów powszechnie dziś używanej aparatury do pomiaru współczynników lepkości. Jej podstawową częścią są dwa współosiowe walce. Jeden z walców, na przykład ten zewnętrzny, jest osadzony na osiach, ale utrzymuje go w stałym położeniu sprężyna, która jednocześnie mierzy działający na ten walec moment siły, podczas gdy walec wewnętrzny obraca się ze stałą prędkością kątową. Współczyn- nik lepkości można wówczas określić z równania (41.11). Z definicji widać, że jednostką r] jest N-s/m2. Dla wody w temperaturze 20°C T) = 103 N-s/m2. Zwykle wygodniej jest używać lepkości właściwej, która jest równa rj podzielonemu przez gęstość q. Wówczas wartości tych współczynników dla wody i dla powietrza są porówny- walne : woda (20 °C) n/o = 10~6 m2/s, (41.12) powietrze (20°C) y/g = 15-I0-6m2/s. Współczynniki lepkości zależą zwykle silnie od temperatury. Tak na przykład dla wody, tuż powyżej punktu krzepnięcia, r//g jest 1,8 razy większe niż w temperaturze 20 °C. 41-2. Przepływ lepki Przechodzimy teraz do ogólnej teorii przepływu lepkiego — w jej najogólniejszej dziś znanej postaci. Dowiedzieliśmy się już, że składowe naprężenia ścinania są proporcjo- nalne do pochodnych przestrzennych różnych składowych prędkości, takich jak dvjdy
392 41. PRZEPŁYW „MOKREJ WODY” lub dv>.ldx. Jednak w ogólnym przypadku cieczy ściśliwej w naprężeniu występuje jeszcze jeden wyraz, który zależy od pozostałych pochodnych przestrzennych prędkości (np. takich jak Svjdx...). Wyrażenie ogólne ma postać 15vi 5v,\ . ' (41.13) \dXjCXjl gdzie -v, oznacza dowolną z współrzędnych prostokątnych (x = xlty = ylf z = z,), a V/ jest odpowiadającą jej składową prędkości w prostokątnym układzie współrzędnych. (Symbol jest deltą Kroneckera, która jest równa 1, gdy i — j, a 0, gdy i / j.) Ten dodatkowy wyraz dodaje ?;'V-v do wszystkich elementów diagonalnych tensora naprężeń S,7. Dla cieczy nieściśliwej (V v = 0) ten dodatkowy wyraz się nie pojawia. Ma on zatem coś wspólnego z siłami wewnętrznymi, pojawiającymi się podczas ściskania. A pa- tena do opisu cieczy potrzebne są dwie stałe, podobnie jak dwie stałe były potrzebne do opisu jednorodnego ciała sprężystego. Współczynnik r/ jest tym „zwykłym” współczyn- nikiem lepkości, z którym się już spotkaliśmy w poprzednim paragrafie. Nazywa się go także pierwszym współczynnikiem lepkości lub „współczynnikiem lepkości przy ścinaniu”, a nowy współczynnik rj' nazywa się drugim współczynnikiem lepkości. Chcemy teraz określić siłę lepkości na jednostkę objętości, flepk, po to abyśmy mogli ją wstawić do równania (41.1) i otrzymać równanie ruchu cieczy rzeczywistej. Siła, jaka działa na mały sześcienny element cieczy, jest wypadkową sił działających na wszystkie sześć ścianek. Biorąc po dwie z tych sił jednocześnie otrzymamy ich różnice, które zależą od pochodnych naprężeń, a więc od drugich pochodnych prędkości. To bardzo dobrze, bo prowadzi nas to z powrotem do równania wektorowego. Składowa siły lepkości na jednostkę objętości w kierunku współrzędnej prostokątnej xi wynosi (Uk).= = (4L14) P Z-/ CX; ć-j OX. 1 \ CX: OXj / J oxi J=1 J /=! J - ' 1 J ' Zmiana współęzynników lepkości wraz z położeniem zwykle nie jest znaczna i można ją pominąć. Wówczas siła lepkości na jednostkę objętości zawiera tylko drugie pochodne prędkości. W rozdziale 39 widzieliśmy, że najogólniejszą postacią drugich pochodnych, jaka może występować w równaniu wektorowym, jest suma wyrazu z laplasjanem (V-Vv = V2v) i wyrazu z gradientem dywergencji [V(V-v)]. Równanie (41.14) jest właśnie taką sumą ze współczynnikami i) i (>?+)/). Otrzymujemy: f)epk = »?V2v+(ł?+ł?')V(V-v). (41.15) W przypadku cieczy nieściśliwej V v = 0 i siła lepkości na jednostkę objętości wynosi po prostu ?;V2v. Niektórzy zadowalają się takim przybliżeniem, jednakże jeżeli ktoś chciałby obliczyć absorpcję dźwięku w cieczy, to byłby mu wtedy potrzebny również drugi wyraz z równania (41.15). - Możemy teraz uzupełnić nasze ogólne równanie ruchu dla cieczy rzeczywistej. Pod-
41-2 PRZEPŁYW LEPKI 393 stawiając równanie (41.15) do równania (41.1) otrzymujemy eHy -r(v-V)v Ct = —V/>-oV<^^-z/V2v:-(z/ + z/)V(V-v). To dość skomplikowane równanie. Ale taka już jest przyroda. Jeżeli wprowadzimy, tak jak poprzednio, gęstość wirów Si = Vxv, to nasze równanie będzie można zapisać w postaci IdN \ ' q I—--FS2xv+1Vd2| = — V/>—oVę>+>jV2v+(?;+^')V(V-v). (41.16) Zakładamy znowu, że jedyne siły objętościowe, jakie działają z zewnątrz na ciecz, są si- łami zachowawczymi, takimi jak siła ciężkości. Aby zobaczyć, co oznacza tu nowy wyraz ze współczynnikiem lepkości, rozpatrzmy przypadek płynu nieściśliwego. Otóż, jeżeli wziąć rotację z równania (41.16), otrzyma się cSl ri —-+Vx(Słxv) = - V2S2. (41.17) Ot Q Przypomina to równanie (40.9), z tym że po prawej stronie występuje teraz nowy wyraz. Gdy prawa strona była równa zeru, to mieliśmy twierdzenie Helmholtza mówiące, że gęstość wirów jest podczas ruchu cieczy zachowana. Teraz po prawej stronie mamy dość złożony wyraz, który ma jednak bezpośrednie następstwa fizyczne. Jeżeli na chwilę po- miniemy wyraz Vx(S2xv), to będziemy mieli równanie dyfuzji. Ten nowy wyraz ozna- cza, że gęstość wirów SI ulega dyfuzji w cieczy. Jeżeli gradient gęstości wirów jest duży, to wiry rozprzestrzeniają się na ciecz znajdującą się w pobliżu. Ten to właśnie „nowy" wyraz powoduje, że nasze kółko dymu staje się coraz grubsze w miarę posuwania się do przodu. Skutki tego wyrazu dają się też wyraźnie odczuć, je- żeli wyśle się „czysty" wir („bezdymny” pierścień, wytworzony przez aparaturę opisaną w poprzednim rozdziale) przez chmurę dymu. Pierścień ten przechodząc przez chmurę zabiera z sobą trochę dymu i po wyjściu z chmury można go zobaczyć w postaci pustego w środku kółka, otoczonego z zewnątrz mgiełką dymu. Część gęstości wirów SI przeszła w wyniku dyfuzji na zewnątrz do dymu, zachowując cały czas swój ruch do przodu wraz z wirem. 41-3. Liczba Reynoldsa Opiszemy teraz zmiany, jakim ulega charakter przepływu cieczy na skutek wystę- powania nowego wyrazu opisującego lepkość. Rozpatrzymy tu dość szczegółowo dwa zagadnienia. Pierwszym z nich jest opływ walca, który próbowaliśmy opisać w poprzed- nim rozdziale opierając się na teorii przepływu nielepkiego. Rozwiązania ruchu cieczy lepkiej znane są dziś tylko w kilku szczególnych przypadkach. Dlatego też część tego, o czym będziemy mówić, opiera się na pomiarach doświadczalnych — przy założeniu, że model doświadczalny spełnia równanie (41.17).
394 41. PRZEPŁYW „MOKREJ WODY" Problem matematyczny wygląda następująco: szukamy rozwiązania opisującego prze- pływ nieściśliwy, lepkiego płynu, opływającego długi walec o średnicy D. Przepływ powi- nien być określony równaniem (41.17) przez związek SI = V xv (41.18) i przez warunki brzegowe, że prędkość na dużych odległościach jest stała, równa np. V (równoległa do osi x) oraz że prędkość na powierzchni walca jest równa zeru. Drugi z tych warunków sprowadza się do żądania, aby vx = vy = vz = 0 (41.19) dla D2 x2+y2 = — 4 Powyższy zespół równań i warunków brzegowych określa w pełni nasz problem mate- matyczny. Jeżeli przyjrzymy się równaniom, to stwierdzimy, że występują w nich cztery różne parametry określające nasze zagadnienie: r[, q, D i V. Można by sądzić, że powinniśmy rozpatrzyć szereg przypadków dla różnych V, dla różnych D i tak dalej. Nie jest to jednak prawdą. Wszystkie różne, możliwe tu rozwiązania odpowiadają różnym wartościom tylko jednego parametru} Jest to najważniejsza z ogólnych własności, które potrafimy wywnio- skować z równań ruchu przepływu lepkiego. Aby zobaczyć, dlaczego tak jest, zauważmy najpierw, że lepkość i gęstość pojawiają się tylko w stosunku rj/g — jako lepkość właści- wa. Zmniejsza to liczbę niezależnych parametrów do trzech. Przypuśćmy teraz, że wszyst- kie odległości będziemy mierzyć w jednostkach określonych przez jedyną „długość”, jaka się pojawia w tym zagadnieniu, a więc w stosunku do średnicy walca D; sprowadza się to do zastąpienia współrzędnych x, y, z nowymi zmiennymi x', y , z', przy czym x = x'D, y = y'D, z = z'D. Wówczas w warunkach (41.19) nie będzie występował parametr D. W ten sam sposób możemy wyrazić wszystkie prędkości w jednostkach określonych przez V, czyli jeżeli przyjmiemy v — v'V, pozbędziemy się parametru V, a nowa prędkość v' będzie na dużych odległościach po prostu równa 1. Ponieważ ustaliliśmy już jednostki długości i prędkości, naszą jednostką czasu jest teraz D/V; tak więc powinniśmy przyjąć r = f'y. (41.20) Po wprowadzeniu naszych nowych zmiennych musimy pochodne w równaniu (41,18) zmienić z 5/dx na (1/D)d/Sx' i tak dalej; tak że równanie (41.18) przybiera postać £2 = Vxv = —V'xv' = —£2'. (41.21) D D
41-3. LICZBA REYNOLDSA 395 Nasze główne równanie (41.17) ma teraz postać 3S2' ri —- + V' x(£2' xv') = —— dt' qVD Wszystkie stałe możemy zebrać w jeden czynnik, który zgodnie z tradycją oznaczymy 1/^: o % = — VD. (41.22) Jeżeli będziemy pamiętać, że wszystkie nasze równania należy' zapisać wyrażając wszyst- kie wielkości w nowych jednostkach, to można opuścić wszystkie znaki prim. Naszymi równaniami przepływu są zatem „ 1 —-+Vx(Słxv) = — V2£2 (41.23) ot oraz £2 = V xv z warunkami v = 0 dla x2+y2 = J (41.24) oraz vy = vz = Q dla x2+y2+z2^> 1. Wszystko to ma bardzo interesujący sens fizyczny. Wynika stąd na przykład, że jeżeli rozwiążemy zagadnienie przepływu przy jakiejś prędkości V\ i jakiejś średnicy , a na- stępnie jeżeli się zainteresujemy przepływem jakiejś innej cieczy, przy jakiejś innej śred- nicy walca Z>2, to ten nowy przepływ będzie taki sam jak stary, jeżeli za pomocą jego prędkości Vz można utworzyć tę samą liczbę Reynoldsa, to znaczy, jeżeli Pi Po = — ki Dl = = — V2D2. (41.25) Dla każdych dwóch sytuacji, które mają tę samą liczbę Reynoldsa, przepływy będą „wy- glądać” tak samo — jeśli wyrazi się je przez odpowiednio przeskalowane zmienne x, y', z' i t'. Jest to podstawowe twierdzenie, ponieważ z niego wynika, że można określić jak powietrze będzie opływało skrzydło samolotu, nie potrzebując do tego wcale budować samolotu i wypróbowywać go. Zamiast tego można zrobić model samolotu i zrobić po- miary przy prędkości, która daje tę samą liczbę Reynoldsa. Zasada ta pozwala nam sto- sować wyniki pomiarów z małymi samolocikami w tunelu aerodynamicznym lub po- miarów z małymi modelami statków w basenie modelowym do obiektów o naturalnej wielkości. Pamiętajmy jednak, że można to zrobić tylko przy założeniu, że ściśliwość cieczy można pominąć. W przeciwnym bowiem wypadku pojawia się nowa wielkość —
396 41. PRZEPŁYW „MOKREJ WODY” prędkość dźwięku, a różne sytuacje będą naprawdę odpowiadały sobie tylko wtedy, gdy stosunek V do prędkości dźwięku będzie także taki sam. Ten ostatni nazywamy liczbą Macha. A zatem dla prędkości bliskich prędkości dźwięku lub większych przepływy w różnych sytuacjach są takie same, jeżeli zarówno liczba Macha, jak i liczba Reynoldsa są dla obu tych sytuacji takie same. 41-4. Opływ walca kołowego Powróćmy do zagadnienia przepływu prawie nieściśliwej cieczy, która z niewielką prędkością opływa walec. Podamy jakościowy opis przepływu cieczy rzeczywistej. Wiele jest rzeczy, które chcielibyśmy wiedzieć o takim przepływie, na przykład, z jaką siłą ciecz pociąga walec za sobą? Na rysunku 41.4 podano wykres siły, z jaką ciecz pociąga walec, jako funkcji liczby Reynoldsa która, jeżeli pozostałe parametry są ustalone, jest pro- porcjonalna do prędkości V cieczy. W rzeczywistości, na rysunku podano wykres tzw. współczynnika oporu czołowego CD, który jest liczbą bezwymiarową, równą sile podzie- lonej przez V2Dł, gdzie D jest średnicą, a l — długością walca, podczas gdy o jest gę- stością cieczy: F Cd~ \qV2DI’ Współczynnik oporu czołowego zmienia się w sposób raczej dość skomplikowany, dając nam wskazówkę, że z przepływem dzieje się coś dość interesującego i skomplikowanego. 41.4. Współczynnik oporu czołowego dla walca kołowego jako funkcja liczby Reynoldsa
41-4. OPŁYW WALCA KOŁOWEGO 397 Opiszemy teraz charakter przepływu dla różnych „zakresów” liczby Reynoldsa. Naj- pierw, gdy liczba Reynoldsa jest bardzo mała, przepływ jest zupełnie ustalony, to znaczy prędkość jest stała w każdym miejscu i' ciecz przepływa symetrycznie po obu stronach walca. Rzeczywisty rozkład linii przepływu nie jest jednak taki sam jak w przepływie po- tencjalnym. Linie te stanowią tu rozwiązania zmienionego nieco równania. Gdy prędkość jest bardzo mała lub, co na to samo wychodzi, gdy lepkość jest bardzo duża, tak że ciecz przypomina miód, to wyrazy „bezwładności” można pominąć i przepływ jest opisany równaniem V2ft = o. Równanie to zostało pierwszy raz rozwiązane przez Stokesa. Rozwiązał on również to samo zagadnienie dla kuli. Jeżeli mamy małą kulę poruszającą się w takich warunkach scharakteryzowanych przez małą liczbę Reynoldsa, to siła oporu jest równa gdzie a jest promieniem kulki, a V jest jej prędkością. Jest to bardzo pożyteczny wzór, ponieważ mówi on nam, z jaką prędkością poruszają się w cieczy maleńkie ziarenka ja- kiegoś zanieczyszczenia (lub inne cząstki, które z pewnym przybliżeniem można uznać za kule) na skutek działania pewnej określonej siły — takiej na przykład jak w wirówce lub w procesie dyfuzji, albo podczas wytrącania się jakiegoś osadu. W obszarze małej liczby Reynoldsa — dla 31 mniejszych od 1 — linie sił pola prędkości v wokół walca wv- glądają tak jak na rys. 41.5. Jeżeli zwiększymy nieco prędkość cieczy, tak aby dostać liczbę Reynoldsa trochę większą od 1, przekonamy, się że przepływ ma już inny charakter. W obszarze za kulą pojawi się krążenie, tak jak pokazano na rys. 41.6b. Ciągle jeszcze pozostaje otwartą kwestia, czy krążenie to istniejezzawsze, nawet przy najmniejszych liczbach Reynoldsa, czy też pojawia się ono nagle przy pewnej wartości liczby Reynoldsa. Dawniej myślano, że krążenie narasta tu w sposób ciągły. Ale teraz uważa się, że pojawia się ono nagle, a jest rzeczą pewną, że wzrasta ono z JC. W każdym razie przepływ zmienia swój charak- ter dla wartości liczby Reynoldsa 3ł w przedziale od 10 do 30. W obszarze za walcem po- jawia się para wirów. Gdy dojdziemy do liczby Reynoldsa 3% ® 40, przepływ się znowu zmienia — nagle następuje zupełna zmiana charakteru ruchu. Otóż jeden z wirów znajdujących się za wal- cem staje się tak długi, że odrywa się i zaczy- na płynąć z prądem, a w cieczy za walcem za- czyna się tworzyć nowy wir. Wiry odrywają się na przemian po obu stronach i „migaw- kowy” obraz przepływu wygląda z grubsza tak, jak to narysowano na rys. 41.6c. Tę strukturę wirów nazywamy „ścieżką wirów Karmana”. Pojawiają się one zawsze dla Si > 40. Przepływ taki przedstawia fot. 41.7. Takie dwa przepływy — ten z rys. 41.6c, z jednej, i dowolny z przedstawionych na rys. 41.6a lub b z drugiej strony — mają zu- 41.5. Przepływ lepki (małe prędkości) wokół walca kołowego
398 41. PRZEPŁYW „MOKREJ WODY” 41.6. Opływ walca dla różnych Eczb Reynoldsa pełnie odmienną naturę. Na rysunku 41.6a lub b prędkość jest stała, podczas gdy na rys. 41,6c prędkość w każdym punkcie się zmienia z czasem. Powyżej wartości Sfc = 40 — zazna- czonej na rys. 41.4 linią przerywaną — rozwiązanie ustalone już nie istnieje. Dla tych wyż- szych liczb Reynoldsa przepływ się zmienia z czasem, ale w sposób regularny, okresowy. Można spróbować wytłumaczyć z fizycznego punktu widzenia, w jaki sposób są te wiry wytwarzane. Wiemy, że prędkość cieczy na powierzchni walca musi być równa zeru
41-4 OPŁYW WALCA KOŁOWEGO 399 i że prędkość ta gwałtownie rośnie przy oddalaniu się od tej powierzchni. Właśnie na skutek tej dużej, lokalnej zmiany prędkości cieczy tworzy się gęstość wirów. Otóż gdy prędkość głównej strugi jest dostatecznie mała, to gęstość wirów ma dość czasu, aby przedyfundować z wąskiego obszaru w pobliżu powierzchni (zwanego warstwą gra- niczną), gdzie została ona wytworzona, i rozprzestrzenić się na duży obszar. Ten fizyczny obraz powinien przygotować nas na następną zmianę charakteru przepływu w przypadku, gdy prędkość głównej strugi, a więc i liczba Reynoldsa & się jeszcze zwiększy. Gdy prędkość jeszcze bardziej rośnie, to gęstość wirów ma coraz to mniej czasu na przedyfundowame do większego obszaru cieczy. Gdy dochodzimy do liczby Reynoldsa rzędu kilkuset, gęstość wirów zaczyna wypełniać wąskie pasmo, tak jak to pokazano na rys. 41.6d. W warstwie tej przepływ jest chaotyczny i nieregularny. Obszar ów nazywa się turbulentną warstwą graniczną, która ze wzrostem śł przesuwa się coraz to dalej w górę prądu W tym burzliwym obszarze (zwanym też obszarem turbulentnym) prędkości są bardzo nieregularne i nieuporządkowane; również przepływ przestaje już być dwuwy- miarowy, ale wygina się i wykręca we wszystkich trzech wymiarach. Na ruch burzliwy jest tu w dalszym ciągu nałożony pewien ruch regularnie zmienny. Jeżeli w dalszym ciągu będzie się zwiększać liczbę Reynoldsa, to obszar burzliwy będzie się dalej przesuwał do przodu, aż dotrze do punktu, w którym linie prądu opuszcza- ją walec — dla przepływów z wartością Si nieco większą od 105. Przepływ wygląda tak jak na rys. 41.6e i w obszarze za ciałem pojawia się tzw. ślad turbulentny. Zachodzi tu także drastyczna zmiana siły oporu czołowego (tzw. kryzys oporu); siła ta wielokrotnie się zmniejsza, jak to pokazano na rys. 41.4. W tym obszarze prędkości w rzeczywistości siła oporu maleje ze wzrostem prędkości. Wydaje się, że nie ma tu zbyt wiele śladów ja- kiejś okresowości. Co się dzieje przy jeszcze większych liczbach Reynoldsa? Gdy będziemy w dalszym ciągu zwiększać prędkość, rozmiary śladu turbulentnego jeszcze bardziej się zwiększą, a także zwiększy się siła oporu czołowego. Najnowsze doświadczenia, w których £% do- chodzi mniej więcej do 107, wykazują, że w śladzie pojawia się jakaś nowa okresowość, 41.7. Sfotografowana przez Prandtla „ścieżka wirów” w przepływie za walcem
400 41. PRZEPŁYW „MOKREJ WODY” czy to dlatego, że cały ślad oscyluje tam i z powrotem w jakimś totalnym ruchu, czy też dlatego, że wraz z nieregularnym, burzliwym ruchem (stanowiącym swego rodzaju tło) pojawia się pewien nowy rodzaj wiru. Te szczegóły nie są dotąd jasne i ciąglp jeszcze są badane doświadczalnie. 41-5. Granica lepkości zerowej Chcielibyśmy podkreślić, że żaden z opisanych tu przepływów nie przypomina w ża- dnym stopniu rozwiązania dającego przepływ potencjalny, które znaleźliśmy w poprzed- nim rozdziale. Na pierwszy rzut oka wydaje się to dość dziwne. Przecież mimo wszystko liczba Reynoldsa Sfc jest proporcjonalna do I/77. Dążenie więc ze współczynnikiem lep- kości t) do zera jest równoważne z przechodzeniem liczby Reynoldsa do nieskończo- ności. Przechodząc zaś w równaniu (41.23) do granicy dla dużych wartości pozbędzie- my się jego prawej strony i otrzymamy po prostu równania poprzedniego rozdziału. Tymczasem wydaje się nieprawdopodobne, aby ten wysoce burzliwy przepływ dla war- tości rzędu 107 miał dążyć do gładkiego przepływu, będącego rozwiązaniem równań „suchej wody”. Jak to się dzieje, że przechodząc z liczbą Reynoldsa Sł do nieskończo- ności otrzymujemy równanie (41.23), którego rozwiązaniem jest przepływ burzliwy, a więc zu- pełnie różny od rozwiązania, które otrzymaliśmy przyjmując w tym równaniu od samego po- czątku r/ = 0? Odpowiedź jest bardzo interesująca. Zauważmy, że po prawej stronie rów- nania mamy iloczyn liczby 1/'^ i drugich pochodnych przestrzennych prędkości. Te po- chodne mają jednak rząd wyższy od każdej innej pochodnej w tym równaniu. Chociaż więc współczynnik 1 /j? jest bardzo mały, w przestrzeni w pobliżu powierzchni zachodzą bardzo gwałtowne zmiany Si. Te gwałtowne zmiany kompensują wpływ małego współ- czynnika 1 i wspomniany iloczyn nie dąży do zera dla rosnących wartości 2%. Omówio- ne w poprzednim paragrafie rozwiązania wcale nie dążą zatem do przypadku granicz- nego, odpowiadającego zerowaniu się współczynnika V2S2. Można by zapytać: „Czym więc jest ta drobnoziarnista turbulencja i w jaki sposób ona się podtrzymuje? Jak może gęstość wirów, powstająca gdzieś na krawędzi walca, spowodować takie zamieszanie na »drugim planie«?” I tym razem odpowiedź jest intere- sująca. Gęstość wirów wykazuje tendencję do wzmacniania się — sama przez się. Jeżeli na chwilę zapomnimy o dyfuzji gęstości wirów, która powoduje straty energii, to prawa przepływu stwierdzają (tak jak to widzieliśmy), że linie wiru są unoszone przez ciecz z pręd- kością v. Można sobie wyobrazić pewną liczbę linii sił pola Si, które są zniekształcone i skręcone na skutek skomplikowanego obrazu przepływu linii sił pola v. Powoduje to, że linie zbliżają się do siebie i mieszają się z sobą. Linie, które poprzednio były prostymi, nieskomplikowanymi liniami, zostają poplątane i ściśnięte razem. Będą one dłużej prze- bywać blisko siebie. Natężenie gęstości wirów będzie rosło i jej nieregularności — plusy i minusy — będą w ogólnym przypadku też rosły. W rezultacie będzie wzrastał moduł wektora gęstości wirów w trzech wymiarach, jeżeli będzie się ciecz wzburzać. Można by równie dobrze zapytać: „W jakich warunkach przepływ potencjalny będzie w ogóle dostarczał teoretycznie zadowalającego opisu?” Przede wszystkim będzie on za-
41-5. GRANICA LEPKOŚCI ZEROWEJ 401 dowalający w obszarze, gdzie nie dotarła na skutek dyfuzji, w znacznym przynajmniej stopniu, gęstość wirów. Sporządzając ciała o kształtach opływowych można obszar burzli- wy uczynić możliwie jak najmniejszym; przepływ wokół skrzydeł samolotu, które są w odpowiedni sposób skonstruowane, jest prawie całkowicie prawdziwym przepływem potencjalnym. 41-6. „Przepływ wstęgowy” Można pokazać, że ten złożony i zmieniający się charakter opływu walca nie jest niczym szczególnym, ale że ta wielka rozmaitość możliwości przepływu zachodzi ogólnie. W § 41-1 wyprowadziliśmy rozwiązanie dla przepływu lepkiego pomiędzy dwoma wal- cami i otrzymane tam wyniki możemy porównać z tym, co się dzieje rzeczywiście. Jeżeli weźmie się dwa współśrodkowe walce, wypełni się przestrzeń pomiędzy nimi olejem i wpro- wadzi się do niego trochę drobnego proszku aluminiowego, to łatwo można zobaczyć, jaki charakter będzie miał przepływ. Jeżeli zewnętrzny walec będzie się powoli obracać, to nic nieoczekiwanego się nie będzie działo; patrz rys. 41.8a. Podobnie, jeżeli będzie się obracać powoli walec wewnętrzny, to też nic bardzo uderzającego się nie będzie działo. Jeżeli jednak zaczniemy obracać walec wewnętrzny szybciej, to czeka nas niespodzianka. Płyn rozdzieli się na poziome pasma, tak jak to pokazano na rys. 41.8b. Gdy natomiast obraca się z podobną szybkością walec zewnętrzny, to takie zjawisko nie występuje. Skąd się bierze ta różnica pomiędzy przypadkiem, w którym obracamy walec zewnętrzny, a przypadkiem, w którym obracamy walec wewnętrzny? Przecież charakter przepływu, tak jak to wyprowadziliśmy w § 41-1, zależał tylko od różnicy a>b—a>a. Odpowiedź na to można otrzymać po przyjrzeniu się przekrojowi, pokazanemu na rys. 41.9. Jeżeli war- stwy wewnętrzne cieczy poruszają się szybciej od warstw zewnętrznych, to te warstwy wewnętrzne dążą do przesuwania się na zewnątrz — siła odśrodkowa jest większa od* ciś- nienia, które utrzymuje te warstwy na miejscu. Cała jednak warstwa nie może się jedno- cześnie przesunąć, ponieważ na przeszkodzie stoją jej warstwy zewnętrzne. Taka warstwa musi się więc rozpaść na „komórki”, w których zachodzi krążenie cieczy, tak jak to po- 41.8. Obrazy przepływu cieczy pomiędzy dwoma przezroczystymi, obracającymi się walcami 26 — Wykłady z fizyki
402 41. PRZEPŁYW „MOKREJ WODY” 41.9. Wyjaśnienie dlaczego przepływ rozdziela się na „wst^i” kazano na rys. 41.9b. Przypomina to prądy konwekcyjne w pokoju, w którym blisko po- dłogi jest gorące powietrze. Gdy walec wewnętrzny pozostawimy w spoczynku, a walco- wi zewnętrznemu nadamy dużą prędkość, to siły odśrodkowe wytworzą pewien gradient ciśnienia, który utrzyma wszystko w równowadze — patrz rys. 41.9c (tak jak w pokoju, w którym gorące powietrze jest przy suficie). Zwiększmy teraz prędkość walca wewnętrznego. Początkowo liczba pasm będzie wzrastać. Potem nagle zobaczymy, że pasma te stają się faliste, tak jak na rys. 41.8c i utwo- rzą fale przebiegające dookoła walca. Prędkość tych fal można łatwo zmierzyć. Dla dużych prędkości obrotu prędkość fal dąży do | prędkości walca wewnętrznego. I nikt nie wie dlaczego! To dopiero jest wyzwanie dla fizyków! Taka prosta liczba jak | i nikt tego nie potrafi wytłumaczyć. W istocie, cały mechanizm formowania się fal nie jest bardzo dobrze zrozumiany; w każdym razie jest to ustalony przepływ laminarny. Jeżeli teraz zacząć także obracać walec zewnętrzny', ale w przeciwnym kierunku, to obraz przepływu zaczyna się zmieniać. Otrzymujemy obszary faliste na zmianę z obsza- rami pozornie spokojnymi (rys. 41.8d), układające się w postaci spirali. Można się jednak przekonać, że w tych spokojnych obszarach przepływ jest w rzeczywistości całkiem nie- regularny; jest on w istocie zupełnie burzliwy. W obszarze falistym także pojawia się nie- regularny przepływ burzliwy. Jeżeli obracać walce jeszcze szybciej, to cały przepływ się stanie chaotycznie turbulentny. W tym prostym doświadczeniu widzimy wiele interesujących struktur przepływu, które się zupełnie między sobą różnią, a mimo to wszystkie one są zawarte w naszym prostym równaniu, dla różnych wartości parametru SI. W doświadczeniu z obracającymi się walcami dostrzeżemy wiele z tych efektów, które występują przy opływie walca: naj- pierw jest przepływ ustalony; następnie pojawia się przepływ, który się zmienia z czasem, ale w sposób regularny, gładki; na koniec przepływ się staje zupełnie nieregularny. Każdy z nas widział te same efekty w kolumnie dymu unoszącej się z papierosa w spokojnym powietrzu — najpierw jest gładki, nieruchomy słup dymu, następnie strumień dymu
41-6. „PRZEPŁYW WSTĘGOWY” 403 zaczyna się rozrywać, układając się w szereg zakrętasów, które na koniec przechodzą w nieregularną, kłębiącą się chmurę dymu. Z tego wszystkiego należy wyciągnąć taką oto zasadniczą nauczkę — w pros- tym układzie równań (41.23) kryje się olbrzymia liczba różnorodnych sytuacji. Wszy- stkie rozwiązania odnoszą się do tych samych równań, a różnią się jedynie wartoś- ciami Si. Nie ma powodu, aby myśleć, że w równaniach tych brakuje jeszcze jakichś wy- razów. Jedyna trudność polega na tym, że dzisiaj nie mamy możliwości matematycznych, aby te równania zanalizować, z wyjątkiem bardzo małych liczb Reynoldsa, to znaczy dla przypadku zupełnie „lepkiego”. Wypisanie równań przepływu nie usuwa jeszcze z prze- pływu płynu jego uroku, tajemniczości, czy też jego niespodzianek. Jeżeli taka różnorodność jest możliwa w tak prostym równaniu z jednym parametrem, to jakaż dopiero różnorodność jest możliwa przy bardziej złożonych równaniach! Być może, że hipotetyczne równanie fundamentalne, które opisuje wirujące mgławice i zgę- szczające się, obracające się i eksplodujące gwiazdy i galaktyki jest właśnie tym prostym równaniem hydrodynamiki, opisującym zachowanie się prawie czystego gazu wodoro- wego. Często ludzie na skutek jakiegoś nieuzasadnionego lęku przed fizyką mówią, że nie da się wypisać równania dla życia. No cóż, może się i da. Prawdę mówiąc, to bardzo możliwe, że już mamy takie równanie stanowiące dostatecznie dobre przybliżenie. Jest nim być może równanie mechaniki kwantowej: S dw Hv =--------- Y i dt Widzieliśmy już, że złożona natura rzeczy potrafi tak łatwo i tak dramatycznie wymknąć się prostocie opisujących te rzeczy równań. Często człowiek nieświadomy zasięgu prostych równań dochodził do wniosku, że do wytłumaczenia złożonej natury świata konieczny jest sam Bóg, a nie same zwykłe równania. Wypisaliśmy równania przepływu wody. Na podstawie doświadczenia doszliśmy do pewnego zbioru pojęć i przybliżeń, których należy użyć do opisu rozwiązania — takich pojęć jak ścieżki wiru, ślady turbulentne, czy warstwy graniczne. Gdy podobne równania mamy w sytuacji mniej nam znanej i takiej, dla której nie potrafimy jeszcze przeprowa- dzić doświadczeń, próbujemy te równania rozwiązać w sposób prymitywny, niezgrabny i zawikłąny, chcąc na takiej to podstawie określić, jakie mogą się pojawić nowe pojęcia jakościowe, czyli określić, jakie nowe formy jakościowe są konsekwencją tych równań. Nasze równania dla Słońca, na przykład, opisujące je jako kulę wodoru, opisują Słońce bez plam słonecznych, bez drobnoziarnistej struktury powierzchni, bez prominencji i bez koron słonecznych. A przecież wszystkie te zjawiska w rzeczywistości tkwią w tych rów- naniach; tylko że nie znaleźliśmy sposobu, aby je stamtąd wydobyć. Są ludzie, którzy się będą czuli rozczarowani, gdy na innych planetach nie znaj- dziemy życia. Ja nie — ja chcę, aby takie poszukiwania międzyplanetarne jeszcze raz mnie zachwyciły, olśniły i przypomniały o nieskończonej różnorodności i nowości zjawisk, które mogą się zrodzić z tak prostych zasad. Sprawdzianem nauki jest jej zdolność do przepowiadania. Gdyby ktoś z was nigdy nie był na Ziemi, to czy potrafiłby przepowie- dzieć burzę z piorunami, wulkany, fale oceanu, tęcze i barwne zachody Słońca? Jakże
404 41. PRZEPŁYW „MOKREJ WODY” pożyteczna to będzie lekcja, kiedy się dowiemy o wszystkim, co się dzieje na każdej z tych martwych planet — na tych ośmiu czy dziesięciu kulach, z których każda jest otoczona taką samą chmurą pyłu i z których każda jest posłuszna dokładnie tym samym prawom fizyki. Zbliżająca się wielka era rozbudzenia się umysłu ludzkiego może z powodzeniem wytworzyć metodę zrozumienia zawartości jakościowej równań. Dzisiaj tego me potra- fimy. Dzisiaj nie potiafimy zobaczyć, czy równania przepływu wody zawierają w sobie takie rzeczy jak wstęgową strukturę turbulencji, jaką można zaobserwować pomiędzy dwoma obracającymi się walcami. Dzisiaj nie potrafimy zobaczyć, czy równanie Schródin- gera zawiera w sobie — czy też nie — żaby, kompozytorów muzycznych lub moralność. Nie potrafimy powiedzieć, czy poza takim równaniem potrzebne jest — czy też nie — coś takiego jak Bóg. I dlatego każdy z nas może mieć na ten temat swoją własną, zdecy- dowaną opinię.
42 przestrzenie zakrzywione 42-1. Przykłady dwuwymiarowych przestrzeni zakrzywionych Newton nauczył nas, że dowolne ciało we Wszechświecie jest przyciągane przez każde inne ciało siłą proporcjonalną do kwadratu jego odległości oraz że każde ciało doznaje przyspieszenia wprost proporcjonalnego do sił nań działających. Taka jest właśnie treść newtonowskiego prawa powszechnego ciążenia i newtonowskich praw ruchu. Prawa te, jak wiemy, pozwalają nam zdać sprawę z ruchów piłek, planet, ich satelitów, galaktyk i wielu innych obiektów. Odmienną interpretację prawa powszechnego ciążenia podał natomiast Einstein. Według niego przestrzeń i czas — rozpatrywane łącznie jako czasoprzestrzeń — są w po- bliżu ciężkich mas zakrzywione. Ciała zaś wykonują obserwowane przez nas ruchy tylko dzięki ich tendencji do poruszania się w tej zakrzywionej czasoprzestrzeni wzdłuż „linii prostych”. Jest to naprawdę niezwykle zawiła koncepcja. W bieżącym rozdziale przed- stawimy jej najistotniejszą treść i to tylko w zarysie. W rozważaniach naszych zwrócimy uwagę na trzy odmienne aspekty tego zagadnie- nia. Pierwszy dotyczy samego zjawiska ciążenia, drugi zawiera omówioną już przez nas koncepcję czasoprzestrzeni, a trzeci jest związany z problemem krzywizny czasoprze- strzeni. We wstępnych rozważaniach uprościmy nasze podejście i nie będziemy się przej- mować ani grawitacją, ani też pojęciem czasu — zajmiemy się po prostu przestrzenią zakrzywioną. Pozostałe aspekty tego zagadnienia zostaną wyłożone w następnych pa- ragrafach, teraz zaś zajmiemy się wyłącznie pojęciem krzywizny przestrzeni; spró- bujemy wyjaśnić: co się w ogóle rozumie przez przestrzeń zakrzywioną oraz co się rozumie mówiąc o pojęciu przestrzeni krzywej w szczególnym przypadku wspomnianego zastosowania tego pojęcia przez Einsteina. Nawet tak ograniczone zagadnienie okazuje się jeszcze zbyt trudne w przypadku trzech wymiarów. Będziemy więc musieli zawęzić
406 42. PRZESTRZENIE ZAKRZYWIONE 43.1. t/fk na płaszczyźnie nasze zagadnienie jeszcze bardziej i wyja- śnić znaczenie słów „przestrzeń zakrzywiona” przede wszystkim w odniesieniu do dwóch wymiarów. Aby zrozumieć koncepcję przestrzeni za- krzywionej w dwóch wymiarach, musimy się odwołać do ograniczonego punktu widzenia istot, które by taki dwuwymiarowy świat zamieszkiwały. Wyobraźmy sobie, na przy- kład, pozbawionego oczu żuka, który żyje na płaszczyźnie, i którego przedstawiliśmy na rys. 42.1. Żuk ten może poruszać się tylko na płaszczyźnie i nie ma żadnych możliwości dowiedzenia się, że poza jego płaszczyzną istnieje jakikolwiek „świat zewnętrzny”. (Nie ma on bowiem Twojej Czytelniku wyobraźni.) Zamierzamy oczywiście oprzeć nasze rozumowanie na analogii. To właśnie my żyjemy w trójwymiarowym świecie i to właśnie nasza wyobraźnia nie dopuszcza możliwości wzniesienia się z naszego trójwymiarowego świata w jakimś nowym kierunku; dlatego też musimy przedstawić całą sprawę odwołując się do analogii. Jesteśmy w podobnej sytuacji jak żuki żyjące na płaszczyźnie, dla których przestrzeń w kierunkach wyprowadza- jących poza płaszczyznę nie istnieje. Dlatego też będziemy śledzić w naszym rozumowaniu najpierw postępowanie żuka, pamiętając, że może on żyć tylko na określonej powierzchni i nie może tej powierzchni opuszczać. Innym przykładem żyjącego w świecie dwuwymiarowym żuka, którego postępowanie będziemy śledzić, będzie żuk żyjący na powierzchni kuli. Tutaj również wyobrażamy sobie, że żuk ten może spacerować po powierzchni kuli, jak to przedstawiliśmy na rys. 42.2, lecz nie istnieją dla niego takie pojęcia jak „góra” lub „dół”, ani w ogóle pojęcie kierunku wyprowadzającego na zewnątrz z zamieszkałej przez niego powierzchni,. W rozważaniach naszych potrzebny nam będzie jeszcze trzeci rodzaj stworów tego typu. Będą to też żuki, podobne do poprzednich; tak samo będą żyły na płaszczyźnie, lecz tym razem będzie to płaszczyzna szczególnego rodzaju. Na płaszczyźnie tej w różnych miejscach będzie występowała różna temperatura. Zakładamy, że zarówno sam żuk, jak i pręty miernicze, którymi będzie się on posługiwał, są zbudowane z substancji tego sa- mego rodzaju, o tym samym współczynniku rozszerzalności cieplnej. Jeśli nasz żuk prze- niesie pręt mierniczy w celu wykonania po- miaru do dowolnego miejsca na płaszczyźnie, pręt natychmiast, na skutek rozszerzalności cieplnej, zmieni swoją długość na taką, jaka odpowiada temperaturze w danym miejscu. W podobny sposób będą się zmieniały roz- miary każdego obiektu — samego żuka, pręta mierniczego, trójkąta czy czegokolwiek innego — gdyż obiekt taki będzie natychmiast zmieniał swe rozmiary na skutek rozszerzał- 42.2. Żuk na powierzchni kuli
42-1. PRZYKŁADY DWUWYMIAROWYCH PRZESTRZENI 407 ności cieplnej. Każdy przedmiot będzie dłuż- szy w miejscach gorących niż w miejscach zimnych, a wszystko będzie miało taki sam współczynnik rozszerzalności cieplnej. Miej- sce zamieszkania naszego trzeciego żuka na- zwiemy ,.rozgrzaną płytą”. Będziemy mieli przy tym na myśli specjalny rodzaj rozgrzanej płyty, która będzie zimna w pewnym punkcie środkowym i będzie się stawała coraz bardziej gorąca w miarę posuwania się w kierunku krawędzi (rys. 42.3). Przypuśćmy, że nasze żuki rozpoczną badanie podstaw geometrii. Chociaż założy- liśmy, że żuki te są ślepe i nie mogą widzieć niczego co się dzieje w „zewnętrznym” świecie, mogą one jednak wykonać szereg czyn- ności za pomocą swoich nóżek i czułków. Mogą one rysować linie krzywe i mierzyć ich długości za pomocą sporządzonych przez siebie prętów mierniczych. Przypuśćmy, że najpierw zajmą się one najbardziej podstawo- wymi pojęciami geometrii.Nauczą się więc,jak prowadzić linię prostą, którą będą określały jako najkrótszą krzywą łączącą dwa dane punkty. Nasz pierwszy żuk (por. rys. 42.4) nauczy się prowadzić bardzo ładne linie pro- ste. Co natomiast uczyni żuk na powierzchni kuli? Jego linia prosta będzie charakteryzo- wała się najkrótszą — z jegopunktu widzenia — odległością pomiędzy dwoma punktami, jak to widzimy na rys. 42.5. Z naszego punktu widzenia będzie to oczywiście linia krzywa, żuk jednak nie może opuścić powierzchni kuli i stwierdzić, że „w rzeczywistości” istnieje inna krzywa, wzdłuż której odległość między danymi dwoma punktami jest krótsza. Zgo- dnie z jego informacjami długość mierzona wzdłuż dowolnej innej krzywej leżącej w jego świecie będzie zawsze dłuższa niż wzdłuż jego linii prostej. Pozostawmy go więc z jego linią prostą zdefiniowaną jako łuk o naj- krótszej długości łączący dwa punkty. (Bę- dzie to oczywiście część hiku koła wielkiego.) 42.3. Żuk na rozgrzanej płycie 42.4. Konstrukcja „linii prostej” na płaszczyźnie 42.5. Konstrukcja „linii prostej” na powierz- chni kuli
408 42 PRZESTRZENIE ZAKRZYWIONE 42 6 Konstrukcja „linii prostej” na rozgrzanej płycie Również nasz trzeci żuk — ten z rys. 42.3 — będzie kreślił „linie proste”, które my uznalibyśmy za krzywe. Tak na przykład, najkrótszą odległoś- cią pomiędzy punktami A i B przedstawionymi na rys. 42.6 będzie odległość mierzona wzdłuż krzywej w rodzaju krzywej przedstawionej na rysunku. Dlaczego? Otóż jego lima powinna się wy- ginać w kierunku cieplejszych części rozgrzanej płyty, gdyż w częściach tych pręty miernicze się wydłużą (z naszego wszechwiedzącego punktu widzenia) i wystarczy pręty te odłożyć mniejszą liczbę razy, by przemierzyć drogę od A do B. Dla niego więc krzywa taka będzie limą pro- stą, nie dysponuje on bowiem żadnym innym sposobem dowiedzenia się, że na zewnątrz, w dziwnym trójwymiarowym świecie, istnieje ktoś, kto uznałby mną za krzywą hmę prostą. W tym miejscu czytelnik może przypuszczalnie dojść do wmosku, że również dalsza część analizy, którą żuk poprowadzi, uwieńczona zostanie wnioskami słusznymi jedynie z punktu widzenia szczególnej powierzchni dwuwymiarowej i nie mającymi nic wspólnego z naszym punktem widzenia. Pamiętając o tej konkluzji, zobaczmy, jakie nowe fakty po- jawią się w geometrii naszego żuka. Przypuśćmy, że żuki nauczyły się konstruować dwie proste prostopadłe. (Czytelnik może sam uzupełnić szczegóły tego rodzaju konstrukcji.) Nasz pierwszy żuk (mieszkający na zwyczajnej płaszczyźnie) dojdzie wtedy do interesują- cego wniosku. Jeżeli on wyjdzie z ustalonego punktu A i odbędzie spacer wzdłuż odcin- ka linii prostej o długości 250 cm, po czym wykona skręt pod kątem prostym w prawo i odmierzy następne 250 cm wzdłuż linii prostej, wykona następny skręt w prawo i przej- dzie następne 250 cm, i po raz trzeci zrobi skręt o 90° w prawo i po raz czwarty odmierzy 250 cm wzdłuż linii prostej, to zakończy swój spacer dokładnie w punkcie wyjścia, co po- kazuje rys. 42 7a Jest to własność jego świata — jeden z faktów jego‘„geometrii”. Potem dokona on innego interesującego odkrycia. Jeżeli skonstruuje on trójkąt, tzn. figurę, której bokami będą odcinki trzech jego linii prostych, to suma wszystkich 42 7 Kwadrat, trójkąt i okrąg w przestrzeni płaskiej
42-1. PRZYKŁADY DWUWYMIAROWYCH PRZESTRZENI 409 kątów będzie wynosiła 180°, czyli będzie równa sumie dwóch kątów prostych (por. rys. 42.7b). Następnym jego odkryciem będzie okrąg. Jakie jest określenie okręgu? Aby skon- struować okrąg, należy przez ustalony punkt poprowadzić wiele linii prostych i od- mierzyć na tych prostych odcinki o jednakowej długości, których jeden koniec umieś- cimy w ustalonym poprzednio punkcie (patrz rys. 42.7c). (Musimy tu bardzo starannie prześledzić określenia tych pojęć, gdyż powinniśmy umieć wykonać analogiczne konstruk- cje środkami dostępnymi naszym żukom.) Inny, równoważny powyższemu sposób kon- strukcji będzie polegał na zakreśleniu linii krzywej jednym końcem pręta mierniczego, którego drugi koniec będzie umocowany w ustalonym punkcie. Tak czy inaczej, żuk nasz nauczy się konstruować okręgi. Mając zaś okrąg, prędzej czy później pomyśli o zmie- rzeniu jego obwodu. Wykona pomiary dla kilku różnych okręgów i znajdzie przyjemny związek: obwód okręgu jest zawsze tą samą wielokrotnością jego promienia r (który jest oczywiście równy odległości od środka do hiku okręgu). Stosunek obwodu i promienia będzie więc dla każdego okręgu taki sam — w przybliżeniu równy 6,283. Zastanówmy się teraz, do jakich wniosków o swych geometriach dojdą pozostałe żuki. Jak więc żukowi żyjącemu na powierzchni kuli powiedzie się konstrukcja „kwadra- tu”? Jeżeli wykona on wszystko zgodnie z podanymi przez nas poprzednio wskazówkami, pomyśli prawdopodobnie, że dla takiego rezultatu nie warto było zawracać sobie głowy. Przybliżo- nym bowiem obrazem figury, jaką powinien otrzy- mać, jest figura z rys. 42.8. Końcowy punkt B tej figury nie pokrywa się tu z punktem wyjścia A. Figura jego nie będzie zatem wielobokiem ogra- niczonym krzywą zamkniętą. Czytelnik może to łat- wo sprawdzić na modelu kuli. Podobnie poto- czą się sprawy naszego przyjaciela na rozgrzanej płycie. Jeżeli odłoży on cztery jednakowe odcin- ki prostoliniowe — jednakowe w sensie pomiarów wykonanych za pomocą rozszerzających się prę- tów — tworzące z sobą kąty proste, to otrzyma figurę, której obraz podaliśmy na rys. 42.9. Przypuśćmy z kolei, że każda z populacji na- szych żuków ma swego Euklidesa, który powie jej, jaka powinna być geometria. Wykonując nie- zbyt dokładne pomiary i to na małą skalę, żuki mogą sprawdzić słuszność reguł geometrii eukli- desowej. Wykonując natomiast precyzyjniejsze pomiary, w dużej skali, i próbując skonstruo- wać dokładne kwadraty dojdą one do wniosku, że coś nie jest w porządku. Istota rzeczy polega tu właśnie na tym, że wyłącznie za pomocą pomia- rów geometrycznych odkryją one dziwne własności 42.8. Próba konstrukcji „kwadratu”' na powierzchni kuli 42.9. Próba konstrukcji „kwadratu” na rozgrzanej płycie
410 42. PRZESTRZENIE ZAKRZYWIONE swych przestrzeni. Przestrzenią zakrzywioną nazwiemy przestrzeń, której geometria różni się od geometrii płaszczyzny. Geometria żuków żyjących na powierzchni kuli lub na gorą- cej płycie jest właśnie geometrią przestrzeni zakrzywionej. Zawodzą w niej bowiem reguły geometrii euklidesowej. Widzimy więc, że zdolność unoszenia się ponad płaszczyzną nie jest wcale rzeczą konieczną, aby stwierdzić, że otaczający nas świat jest zakrzywiony. Nie trzeba więc wcale opływać globu dookoła, aby przekonać się, że jest on kulą. O tym, że żyjemy na kuli, możemy się przekonać za pomocą próby skonstruowania kwadratu. Jeżeli kwadrat będzie bardzo mały, potrzebna będzie przy tym duża precyzja, w przypadku zaś dużych kwadratów można poprzestać na mniej dokładnych pomiarach. Przeprowadźmy na przykład porównanie własności trójkątów na różnych powierzch- niach. W trójkącie na płaszczyźnie suma kątów jest równa 180°. Nasz przyjaciel na po- wierzchni kuli może natomiast otrzymać bardzo dziwne trójkąty. Może on, na przykład, konstruować trójkąty, w których wszystkie trzy kąty będą kątami prostymi. Jest to w isto- cie prawda! Jeden z takich trójkątów przedstawiono na rys. 42.10. Przypuśćmy bowiem, że żuk nasz wyruszy z bieguna północnego i będzie posuwał się wzdłuż linii prostej aż do równika. Tam wykona on zwrot pod kątem prostym i odmierzy linię prostą o tej samej co poprzednio długości. Postępowanie to powtórzy on raz jeszcze i po przebyciu odcinka o tej wybranej, bardzo specjalnej długości dotrze on dokładnie do swego punktu wyjścia, przecinając swą pierwszą prostą dokładnie pod kątem prostym. Tak więc z punktu widzenia jego geometrii trójkąt ten ma bez wątpienia dokładnie trzy kąty proste, czyli suma jego kątów wynosi 270°. Okazuje się, że suma kątów w trójkątach, jakie mo- że on konstruować, zawsze będzie większa niż 180°. Co więcej, nadwyżka kątowa (która jest równa sumie kątów w trójkącie minus 180°, a więc we wspomnianym przy- padku jest równa 90°) jest proporcjonalna do pola powierzchni trójkąta. Jeżeli więc trój- kąt na powierzchni kuli będzie bardzo mały, suma jego kątów będzie prawie równa 180° i nadwyżka kątowa będzie liczbą bardzo małą. Będzie ona jednak wzrastała wraz ze wzro- stem trójkąta. Podobne własności będą wykazywały trójkąty konstruowane przez żuka na rozgrzanej płycie. Zwróćmy z kolei uwagę, do jakich wniosków co do swych kół dojdą pozostałe żuki. Pozwólmy im skonstruować okręgi i zmierzyć ich obwody. Tak na przykład, żuk na po- wierzchni kuli mógłby skonstruować taki okrąg, jaki pokazaliśmy na rys. 42.11. Odkryłby on wtedy, że obwód jest mniejszy od iloczynu 2k razy promień. (Czytelnik może się łatwo przekonać, dysponując wiedzą istot trójwymiarowych, że to co żuk nazywa „promieniem” jest lukiem krzywej, który jest oczywiście dłuższy niż prawdziwy promień okręgu.) Jeśliby żuk na powierzchni kuli czytał dzieła Euklidesa, mógłby spróbować obliczyć przewidy- wany promień, dzieląc obwód C przez 2k; otrzymałby wtedy _ C rprzew ~ 2^' (42.1) Stwierdziłby więc, że mierzony przez niego promień jest większy niż przewidywany. Mógłby on nazwać różnicę pomiędzy tymi promieniami „nadwyżką promienia” i napisać '"mierz '"przew '"nadwyż > (42.2)
42-1. PRZYKŁADY DWUWYMIAROWYCH PRZESTRZENI 411 a następnie badać jak nadwyżka promienia bę- dzie zależała od rozmiarów okręgu. . Żuk na rozgrzanej płycie spotkałby się z po- dobnym zjawiskiem. Przypuśćmy, że narysował on okrąg o środku w najzimniejszym miejscu pły- ty, jak na rys. 42.12. Gdybyśmy obserwowali jego czynności, zauważylibyśmy, że jego pręty mier- nicze byłyby krótkie w pobliżu środka i wydłu- żałyby się w miarę ich przenoszenia do punktów oddalonych od środka, chociaż żuk oczywiście o tym by nie wiedział. Podczas pomiaru obwodu pręt mierniczy byłby cały czas stały i dlatego również ten żuk stwierdziłby, że jego mierzony promień jest dłuższy niż promień przewidywany, równy C/2k. Tak więc żuk na rozgrzanej płycie także otrzymałby „nadwyżkę promienia”. Wiel- kość tej nadwyżki znowu zależałaby od długości promienia okręgu. Przestrzenią zakrzywioną nazwiemy więc taką przestrzeń, w której wystąpi jeden z następujących rodzajów odstępstw geometrycznych: Suma ką- tów w trójkącie różni się od 180°; stosunek ob- wodu okręgu i liczby 2tt nie jest równy promienio- wi; podana przez nas reguła konstruowania kwa- dratu nie prowadzi do krzywej zamkniętej. Czy- telnik mógłby rozszerzyć tę listę odstępstw o jesz- cze inne. Podaliśmy tu dwa odmienne przykłady prze- strzeni zakrzywionej: powierzchnię kuli i rozgrza- ną płytę. Jest rzeczą interesującą, że przy odpowied- nim dobraniu zmian temperatury jako funkcji odle- głości na rozgrzanej płycie, geometrie na obu tych powierzchniach będą dokładnie takie same. Jest to dość zabawne. Można tak dobrać warunki, aby żuk na rozgrzanej płycie otrzymywał we wszystkich przypadkach dokładnie te same odpowiedzi co żuk na powierzchni kuli. Tym z czytelników, którzy lubią geometrię i zadania geometryczne, powiemy jak można tego dokonać. Jeżeli się przyjmie, że dłu- gość nieskończenie małych prętów mierniczych pod wpływem temperatury zmienia się o czyn- nik równy jedności plus iloczyn pewnej stałej razy kwadrat odległości od środka, wtedy okaże się, 42.10. Na powierzchni kuli można skonstruować „trójkąt”, którego każ- dy z kątów będzie równy 90° 42.11. Konstrukcja okręgu na po- wierzchni kuli 42.12. Konstrukcja okręgu na roz- grzanej płycie
412 42. PRZESTRZENIE ZAKRZYWIONE 42.13. „Okrąg” na powierzchni siodłowej że geometria na takiej rozgrzanej płycie będzie we wszystkich szczegółach dokładnie taka sama jak geometria na powierzchni kuli. Istnieją oczywiście również inne rodzaje geometrii. Moglibyśmy na przykład rozważać geometrię żuka, który żyje na powierzchni gruszki, a więc na powierzchni, która w pewnych swych miejscach ma większą krzywiznę niż w innych, wtedy nadwyżka kątowa w trójką- tach będzie zależała od tego, w jakich miejscach swego świata żuk będzie trójkąty te kon- struował. Innymi słowy, krzywizna przestrzeni może zmieniać się od miejsca do miejsca. Takie przestrzenie krzywe są prostym uogólnieniem poprzedniej definicji. Można je rów- nież imitować za pomocą odpowiedniego rozkładu temperatury na rozgrzanej płycie. Chcielibyśmy również zwrócić uwagę, że są możliwe przypadki, w których odstępstwa od geometrii euklidesowej będą miały znak przeciwny niż w powyższych przykładach. Można więc, na przy- kład, znaleźć powierzchnie, na których suma kątów w dużych trójkątach będzie mniejsza niż 180°. Na pier- wszy rzut oka może się to wydawać rzeczą niemożliwą, ale tak nie jest. Przede wszystkim moglibyśmy mieć roz- grzaną płytę, na której temperatura malałaby w miarę oddalania się od środka. Wtedy wszystkie zmiany mia- łyby kierunek przeciwny. Tego rodzaju przykład może- my jednak otrzymać również na czysto geometrycznej drodze, rozważając na przykład dwuwymiarową geome- trię na powierzchni siodła. Wyobraźmy sobie siodłową powierzchnię w rodzaju tej, którą naszkicowaliśmy na rys. 42.13. Narysujmy na niej „okrąg”, określony jako miejsce geometryczne punktów równoodległych od pew- nego środka. Tego rodzaju okrąg będzie oscylującą krzy- wą, stanowiącą brzeg powichrowanej powierzchni. Jego obwód będzie więc większy niż 2w. Tak więc C/2tt jest te- raz mniejsze niż r. „Nadwyżka promienia” jest tu zatem ujemna. Powierzchnie kul i gruszek są przykładami powierz- chni o dodatniej krzywiźnie: w ostatnim zaś przykładzie spotkaliśmy się z powierzchnią o krzywiźnie ujemnej. W ogólnym przypadku, dwuwymiarowa przestrzeń może mieć krzywiznę zmieniającą się od miejsca do miejsca i może być przestrzenią o dodatniej krzywiźnie w pew- nych punktach, a o ujemnej w innych. Przestrzenią zakrzywioną nazywamy ogólnie taką przestrzeń, w której po prostu reguły geometrii Euklidesa załamują się nie- zależnie od znaku występujących tu odstępstw od geo- metrii euklidesowej. Wartość krzywizny przestrzeni — określona, na przykład, za pomocą nadwyżki promie- nia — może się zmieniać od punktu do punktu. 42.14. Dwuwymiarowa przestrzeń o znikającej krzywiźnie wewnętrz-
42-1. przykłady dwuwymiarowych przestrzeni 413 Zwróćmy uwagę, że zgodnie z naszą definicją krzywizny powierzchnia walca, wbrew wszelkim oczekiwaniom, nie jest przestrzenią krzywą. Żuk żyjący na powierzchni walca, jak to przedstawiliśmy na rys. 42.14, stwierdziłby, że jego trójkąty, kwadraty i okręgi mają wszystkie własności dokładnie takie same jak na płaszczyźnie. Można się z tym łatwo zgodzić, jeśli uprzytomnimy sobie, jak te wszystkie figury będą wyglądały po rozwinięciu powierzchni walca na płaszczyznę. Wtedy wszystkie te figury geometryczne będą identyczne z ich odpowiednikami w geometrii płaskiej. Dlatego też żuk żyjący na powierzchni walca (przy założeniu, że nie będzie on walca obchodził dookoła, lecz wykonywał jedynie po- miary lokalne) nie możne w żaden sposób stwierdzić, że jego przestrzeń jest zakrzywiona. Przyjmując więc punkt widzenia oparty na podanych tu konstrukcjach, musimy przyjąć, że jego przestrzeń nie jest przestrzenią zakrzywioną. Przedmiotem naszych rozważań bę- dzie bowiem to, co bardziej precyzyjnie jest nazywane krzywizną wewnętrzną przestrzeni; czyli krzywizną, której istnienie można stwierdzić jedynie za pomocą pomiarów przepro- wadzanych w lokalnym otoczeniu danego punktu. (Powierzchnia walca nie ma więc krzy- wizny wewnętrznej.) To właśnie znaczenie krzywizny miał na myśli Einstein twierdząc, że przestrzeń nasza jest przestrzenią krzywą. Na razie jednak podaliśmy tylko definicję dwuwymiarowej przestrzeni krzywej; musimy więc z kolei zastanowić się jakie znaczenie może mieć to pojęcie w przestrzeni o trzech wymiarach. 42-2. Krzywizna w przestrzeni trójwymiarowej ' Jesteśmy istotami żyjącymi w przestrzeni trójwymiarowej i zamierzamy rozważyć możliwość, że nasza trójwymiarowa przestrzeń jest zakrzywiona. Czytelnik mógłby za- pytać: „W jaki sposób jednak możemy sobie wyobrazić, że nasza przestrzeń jest w jakimś kierunku wygięta?” Otóż wcale nie musimy sobie wyobrażać, że nasza przestrzeń wygina się w jakimkolwiek kierunku, gdyż nasza wyobraźnia do tego się nie nadaje. (Być może, że dokładnie z takich samych powodów nie możemy wyobrażać sobie zbyt dużo, z jakich też nie możemy za bardzo się wyzwolić od rzeczywistego świata.) Krzywiznę możemy jednak określić bez możliwości wychodzenia z naszego trójwymiarowego świata. Wszystko to, o czym mówiliśmy, posługując się dwuwymiarowymi przykładami, było po prostu ćwi- czeniem, które miało doprowadzić nas do sposobu określania krzywizny, niezależnie od możliwości uzyskania „wglądu” od zewnątrz. Możemy więc stwierdzić I(pzy świat nasz jest zakrzywiony, czy też nie, postępując do- kładnie tak samo jak osobnicy, którzy żyli na powierzchni kuli lub na rozgrzanej płycie. Nie mamy, być może, sposobu rozróżnienia pomiędzy tymi dwoma przypadkami, lecz z pewnością możemy odróżnić oba te przypadki od przestrzeni płaskiej, od zwyczajnej płaszczyzny. Jak możemy to uczynić? Bardzo prosto: możemy odłożyć trójkąt i zmierzyć jego kąty. Możemy też skonstruować wielki okrąg i zmierzyć stosunek jego obwodu do jego promienia. Możemy także próbować utworzyć dokładne kwadraty lub skonstruować sześcian. Każdy z tych przypadków dostarczy nam sprawdzianu słuszności praw geo- metrii. Jeżeli prawa te nie będą spełnione, mówimy, że nasza przestrzeń jest krzywa. Jeżeli więc utworzymy duży trójkąt i stwierdzimy, że suma jego kątów przewyższa 180°, dowiemy
414 42. PRZESTRZENIE ZAKRZYWIONE 42.15. Nadwyżka promie- • ni a może być różna dla okręgów o różnej orientacji w przestrzeni się, że nasza przestrzeń jest zakrzywiona. Tak samo to, że zmierzony promień okręgu nie będzie równy ilorazowi jego obwodu i liczby 2k, będzie dowodem, że nasza prze- strzeń jest krzywa. Czytelnik łatwo może zauważyć, że w trzech wymia- rach będziemy mieli znacznie bardziej skomplikowaną sy- tuację niż w przypadku dwuwymiarowym. W każdym punkcie przestrzeni dwuwymiarowej występowała pewna krzywizna. W przestrzeni trójwymiarowej natomiast mogą występować różne składowe krzywizny. Jeśli skonstruujemy trójkąt na pewnej płaszczyźnie, możemy otrzymywać różne odpowiedzi w zależności od różnych orientacji tej płasz- czyzny. Do tego samego wniosku doprowadzą nas rozwa- żania związane z okręgiem. Przypuśćmy więc, że narysowa- liśmy pewien okrąg, zmierzyliśmy jego promień i otrzymaliśmy w wyniku liczbę różną od Cj2n, otrzymaliśmy więc pewną nadwyżkę promienia. Przypuśćmy dalej, że w płaszczyźnie prostopadłej do płaszczyzny pierwszego okręgu narysowaliśmy inny okrąg (por. rys. 42.15). Nie ma żadnego powodu, aby nadwyżka promienia była dla obu okręgów taka sama. Wię- cej nawet, jeden z tych okręgów mógłby mieć dodatnią nadwyżkę, a drugi pewien ubytek promienia (czyli nadwyżkę ujemną). Uważny czytelnik może w tym miejscu zaproponować lepsze wyjście z sytuacji: Czy nie moglibyśmy uniknąć tych wszystkich składowych, posługując się kulą w trzech wymia- rach? Możemy przecież wziąć pod uwagę powierzchnię pewnej kuli, będącą zbiorem wszyst- kich punktów równoodległych od pewnego danego punktu w przestrzeni. Następnie może- my przecież zmierzyć pole jej powierzchni przez utworzenie na tej powierzchni bardzo drob- nej prostokątnej siatki i zsumowanie przyczynków pochodzących od pól poszczególnych oczek. Zgodnie z geometrią euklidesową całkowite pole A powierzchni kuli powinno być równe iloczynowi liczby 4rc i kwadratu promienia kuli, możemy więc określić „przewidy- wany promień”, który powinien być równy ^/4rr. Promień możemy jednak zmierzyć również bezpośrednio przez wywiercenie na przykład w kuli otworu sięgającego do jej środka i zmierzenie odpowiedniej odległości. Możemy wtedy znowu wziąć różnicę po- między zmierzonym promieniem i przewidywanym i nazwać ją nadwyżką promienia: mierzone pole \1/2 nadwyż 'mierz 4k nadwyżka ta powinna być całkowicie wystarczającą miarą krzywizny. Ma ona tę wielką zaletę, że nie zależy od orientacji trójkąta lub okręgu. Tak określona nadwyżka promienia ma również pewną wadę; nie dostarcza ona peł- nej charakterystyki przestrzeni. Jest ona miarą wielkości, którą zwykle nazywa się średnią krzywizną przestrzeni trójwymiarowej, gdyż związany jest z nią pewien proces średniowania ze względu na różne krzywizny. Ponieważ jednak jest ona pewną średnią wielkością, nie rozwiązuje w sposób zupełny zagadnienia określenia geometrii. Jeśli jest znana tylko ta liczba, nie można przewidzieć wszystkich własności geometrii przestrzeni, gdyż nie można
42-2. KRZYWIZNA W PRZESTRZENI TRÓJWYMIAROWEJ 415 na przykład powiedzieć, co się będzie działo z okręgami mającymi różne orientacje w prze- strzeni. Pełna definicja krzywizny wymaga podania sześciu „współczynników krzywizny” w każdym punkcie przestrzeni. Matematycy naturalnie wiedzą, jak wyznaczyć te wszyst- kie współczynniki. Kiedyś w przyszłości, za pośrednictwem odpowiednich podręczników matematycznych, czytelnik zapozna się zapewne z bardziej eleganckimi i bardziej zaawan- sowanymi sposobami opisu krzywizny, warto jednak znać również mniej precyzyjny, ale za to bardziej poglądowy sposób opisu tych pojęć. Dla większości naszych celów będzie nam wystarczało pojęcie średniej krzywizny*'. 42-3. Nasza przestrzeń jest zakrzywiona Stajemy teraz przed podstawowym pytaniem. Czy to wszystko jest prawdą? Czy na- prawdę rzeczywista trójwymiarowa przestrzeń fizyczna, w której żyjemy, jest przestrzenią zakrzywioną? Skoro umysł ludzki miał już dość wyobraźni, aby uzmysłowić sobie możli- wość występowania przestrzeni zakrzywionych, to musiał naturalnie zadać sobie pytanie, czy rzeczywisty świat jest czy też nie jest zakrzywiony. Zaprojektowano wiele bezpośred- nich pomiarów geometrycznych, które miały udzielić odpowiedzi na to pytanie i nie stwier- dzono żadnych odchyleń od geometrii euklidesowej. Z drugiej jednak strony, w wyniku rozważań dotyczących grawitacji, Einstein doszedł do wniosku, że przestrzeń jest zakrzy- wiona. Chcielibyśmy podać tu einsteinowskie prawo określające wielkość tej krzywizny oraz przedstawić w krótkim zarysie sposób, w jaki doszedł on do sformułowania tego prawa. Einstein orzekł, że przestrzeń jest zakrzywiona i że źródłem jej krzywizny jest materia. (Materia jest również źródłem grawitacji, a więc grawitacja i krzywizna przestrzeni są z sobą powiązane — do tego jednak aspektu zagadnienia dojdziemy w następnych częściach tego rozdziału.) Aby uprościć nieco to zagadnienie, załóżmy, że materia jest rozłożona w sposób ciągły, z pewną gęstością, która może się przy tym zmieniać od punktu do punktu przestrzeni**’. Einstein podał następującą regułę dotyczącą krzywizny przestrzeni: Jeśli w przestrzeni mamy obszar wypełniony materią i weźmiemy w tym obszarze tak małą kulę, że gęstość o materii we wnętrzu tej kuli jest praktycznie stała, wtedy nadwyżka pro- mienia tej kuli będzie proporcjonalna do zawartej w niej masy. Korzystając z definicji ł) Dla zupełności chcielibyśmy jeszcze zwrócić uwagę na pewien dodatkowy szczegół. Gdybyśmy chcieli przenieść do trzech wymiarów model zakrzywionej przestrzeni jako rozgrzanej płyty, musielibyśmy założyć, że długość pręta mierniczego zależy nie tylko od miejsca, w którym się go przykłada, lecz także od orientacji pręta w tym miejscu. Stanowiłoby to uogólnienie prostego przypadku, w którym długość pręta zależałaby tylko od tego, gdzie on się znajduje i byłaby taka sama dla jego wszystkich możliwych kierunków. Tego rodzaju uogólnienie jest konieczne, jeśli chce się za pomocą takiego modelu opisać trój- wymiarową przestrzeń o dowolnej geometrii, nie było ono natomiast potrzebne w przypadku dwuwymia- rowym. *ł) Nikt — nawet Einstein — nie wie, jak można to zrobić, jeśli masa jest skoncentrowana w pewnych punktach.
416 42. PRZESTRZENIE ZAKRZYWIONE nadwyżki promienia, mamy G nadwyżka promienia = 1/--------rmierz = (42.3) r 4ir 3c2 Współczynnik G jest tu stałą grawitacji (tą samą co w teorii Newtona), c jest prędkością światła, a M = 4rtpr3/3 jest masą materii znajdującej się wewnątrz kuli. Jest to einsteinow- skie prawo określające średnią krzywiznę przestrzeni. Dla przykładu weźmy pod uwagę Ziemię i dla uproszczenia załóżmy, że jej gęstość jest stała, wtedy nie będziemy musieli obliczać żadnych całek. Przypuśćmy, że bardzo starannie zmierzyliśmy pole powierzchni Ziemi, a następnie wywierciliśmy szyb sięgający do jej środka i zmierzyliśmy promień Ziemi. Znając pole powierzchni możemy obliczyć przewi- dywany promień Ziemi, przyjmując że pole to jest równe 4nr2. Gdybyśmy porównali przewidywany promień z jej rzeczywistym promieniem, stwierdzilibyśmy, że rzeczywisty promień jest większy od promienia przewidywanego właśnie o wielkość daną w równa- niu (42.3). Stała G/3c2 jest w przybliżeniu równa 2,5-10“29 cm na gram, czyli nadwyżka promienia odpowiadająca jednemu gramowi materii jest równa 2,5-10~29cm. Biorąc zaś masę Ziemi, która jest w przybliżeniu równa 6-1027 g, możemy obliczyć, że rzeczywisty promień Ziemi jest o 1,5 mm większy niż jej promień przewidywany*’. Przeprowadzając ten sam rachunek dla Słońca, możemy stwierdzić, że nadwyżka promienia Słońca jest równa pół kilometra. Należy zauważyć, że zgodnie ze wspomnianym prawem, średnia krzywizna wokół fikcyjnej kuli ponad powierzchnią Ziemi jest równa zeru. Wcale to jednak nie oznacza, że wszystkie składowe krzywizny są tam równe zeru. Również w obszarach ponad powierzch- nią Ziemi może występować — i w rzeczywistości występuje — pewna krzywizna prze- strzeni. Jeżeli w obszarze takim weźmie się pod uwagę leżący w pewnej płaszczyźnie okrąg, to dla pewnych orientacji płaszczyzny okrąg taki będzie miał nadwyżkę promienia o jakimś znaku, a dla innych orientacji o znaku przeciwnym. Średnia krzywizna wokół jakiejś kuli znika tylko wtedy, gdy we wnętrzu tej kuli nie znajdują się żadne masy. Można dodać, że różne składowe krzywizny są zależne od zmian średniej krzywizny przestrzeni. Jeżeli więc dana jest średnia krzywizna w całej przestrzeni, można na podstawie tej zależności wyznaczyć samą krzywiznę w dowolnym punkcie przestrzeni. W obszarach ponad po- wierzchnią Ziemi średnia krzywizna zmienia się z wysokością, czyli w obszarach tych przestrzeń jest zakrzywiona. Istnienie tej właśnie krzywizny manifestuje się w postaci siły grawitacyjnej. Powróćmy do przykładu z żukiem na płaszczyźnie i załóżmy, że na „płaszczyźnie” tej występują niewielkie lokalne wzniesienia. Ilekroć nasz żuk natrafi na takie wzniesienie, będzie wnioskował, że natrafił na mały lokalny obszar, w którym jego przestrzeń jest zakrzywiona. Z podobnym zjawiskiem spotykamy się w trzech wymiarach. W miejscach, gdzie występują grudki materii, nasza trójwymiarowa przestrzeń ma lokalną krzywiznę — występuje tam trójwymiarowy odpowiednik lokalnego wzniesienia. *’ Oszacowanie to jest oczywiście przybliżone, gdyż w rzeczywistości gęstość Ziemi zależy od jej promienia.
42-3. NASZA PRZESTRZEŃ JEST ZAKRZYWIONA 417 Jeżeli na „płaszczyźnie” będziemy mieli wiele wybojów, może tam wystąpić pewna globalna krzywizna poza jej lokalnymi fluktuacjami w postaci małych wzniesień — możemy wtedy zamiast płaszczyzny otrzymać na przykład powierzchnię kuli z niewielkimi wznie- sieniami. Byłoby rzeczą interesującą, gdybyśmy wiedzieli, czy nasza przestrzeń ma obok lokalnych wzniesień spowodowanych przez takie grudki materii jak Ziemia lub Słońce również pewną globalną średnią krzywiznę. Na pytanie to próbują odpowiedzieć astro- fizycy wykonując pomiary i obserwacje bardzo odległych galaktyk. Gdyby na przykład liczba galaktyk obserwowanych w sferycznej warstwie o bardzo dużym promieniu różniła się od tego, czego moglibyśmy oczekiwać na podstawie znajomości promienia takiej war- stwy, to otrzymalibyśmy tym samym miarę nadwyżki promienia gigantycznej kuli. Na pod- stawie takich pomiarów ma się nadzieję, iż uda się rozstizygnąć czy cały nasz Wszech- świat jest średnio rzecz biorąc płaski, czy też zakrzywiony — czy jest „zamknięty” jak powierzchnia kuli, czy też „otwarty” jak płaszczyzna. Czytelnik spotkał się już zapewne z dyskusjami na ten temat. Cała sprawa jest ciągle jeszcze dyskusyjna, gdyż pomiary astronomiczne są ciągle jeszcze nieprzekonywąjące’; dane eksperymentalne nie są jesz- cze wystarczająco dokładne, aby można było na ich podstawie dać jednoznaczną odpo- wiedź. Nie mamy więc, niestety, najmniejszego pojęcia, jaka jest globalna krzywizna ca- łego naszego Wszechświata. 42-4. Geometria czasoprzestrzeni ' Musimy wreszcie wziąć pod uwagę również pojęcie czasu. Jak wiemy ze szczególnej teorii względności, pomiary wielkości przestrzennych oraz pomiar czasu są z sobą ściśle związane. Nie jest więc do pomyślenia, aby sama przestrzeń mogła ulegać pewnym zmia- nom, a czas byłby od tych zmian niezależny. Jak pamiętamy, pomiar czasu zależał od prędkości, z jaką poruszał się obserwator. Dla obserwatora mijającego nas na przykład w pojeździe kosmicznym wszystkie procesy przebiegają wolniej niż dla nas. Jeśli taki obserwator wystartuje w podróż kosmiczną i powróci po 100 sekundach wyznaczonych przez nasze zegarki, czas na jego zegarku może wynosić na przykład 95 sekund. W porów- naniu z naszymi zegarami jego zegarek — tak jak i przebieg wszystkich innych procesów, na przykład bicie jego serca — będzie miał zwolniony rytm. Spróbujmy rozpatrzyć następujące, interesujące zagadnienie. Przypuśćmy, że znaj- dujemy się w rakiecie kosmicznej. Na dany sygnał mamy wystartować i mamy powrócić do miejsca naszego startu dokładnie wtedy, gdy zostanie tam nadany następny sygnał — po czasie dokładnie równym, powiedzmy, 100 sekundom według wskazań zegara w spo- czynku. Mamy ponadto tak zaplanować wycieczkę, aby zgodnie z naszym zegarem upłynął możliwie najdłuższy czas. W jaki sposób powinniśmy się poruszać? Otóż powinniśmy stać w miejscu. Jeśli bowiem będziemy się w ogóle poruszać, nasz zegar wskaże po powro- cie zawsze mniej niż 100 sekund. Wprowadźmy jednak w tym zagadnieniu pewną drobną zmianę. Przypuśćmy, że mamy wystartować z pewnego punktu A na dany sygnał i mamy dotrzeć do innego punktu B (oba punkty spoczywają w pewnym ustalonym układzie); mamy przy tym tak zaplanować 27 — Wykłady z fltykl
418 42. PRZESTRZENIE ZAKRZYWIONE naszą podróż, aby dotrzeć do celu właśnie w chwili nadania tam drugiego sygnału (np. po upływie 100 sekund po pierwszym sygnale według wskazań zegara spoczywającego wraz z oboma punktami). Mamy ponadto tak zaplanować podróż, aby podróżujący z nami zegar wskazał w chwili przybycia możliwie największy upływ czasu. W jaki sposób możemy to osiągnąć? Dla jakiego toru ruchu i dla jakiego rozkładu jazdy zegar nasz wskaże możli- wie najdłuższy czas podróży? Okazuje się, że podróż nasza będzie trwała najdłużej, z na- szego punktu widzenia, jeśli odbędziemy ją podróżując ruchem jednostajnym po linii prostej. Wtedy bowiem każdy dodatkowy ruch i każda dodatkowa prędkość zwolnią bieg naszego zegara. (Ponieważ zaś odchylenie czasu zależy od kwadratu prędkości, tego co stracimy idąc trochę prędzej na pewnym odcinku naszej podróży nigdy nie będziemy mogli odrobić, niezależnie od tego jak wolno próbowalibyśmy poruszać się w innych okresach podróży.) Z rozważań tych wynika przede wszystkim, że również w czasoprzestrzeni możemy określić pojęcie „Unii prostej”. Odpowiednikiem linii prostej w przestrzeni jest w przypadku czasoprzestrzeni ruch z jednostajną prędkością w stałym kierunku. Odpowiednikiem krzywej o najkrótszej odległości w przestrzeni jest w czasoprzestrzeni nie ruch w najkrótszym możliwie czasie, lecz ruch z najdłuższym czasem własnym, a jest to związane z odmiennym znakiem, jaki towarzyszy w teorii względności wielkościom czasowym. Ruch „prostoliniowy” — będący odpowiednikiem „ruchu ze stałą prędkością wzdłuż linii prostej” — jest teraz tym ruchem, podczas którego zegar zostaje tak przenie- siony z jednego punktu i odpowiadającej mu chwili czasu do innego punktu w innej chwili, że czas podróży wskazany przez ten zegar będzie możliwie najdłuższy. To właśnie jest naszą definicją odpowiednika linii prostej w czasoprzestrzeni. 42-5. Grawitacja i zasada równoważności Jesteśmy już przygotowani, aby przystąpić do dyskusji nad prawami grawitacji. Ein- stein podjął szereg prób, aby sformułować taką teorię grawitacji, która byłaby zgodna z poprzednio przez niego podaną teorią względności. Borykał się on z tym zagadnieniem dość długo, aż w końcu przyjął pewną ważną zasadę, która doprowadziła go do otrzymania poprawnych praw. Podstawą tej zasady jest obserwacja, że we wnętrzu swobodnie spada- jącego przedmiotu wszystko wydaje się być w stanie nieważkości. Tak na przykład, znaj- dujący się na orbicie satelita Ziemi spada swobodnie w polu ciężkości Ziemi i dlatego znajdujący się w nim astronauta będzie odczuwać stan nieważkości. Koncepcja ta, sfor- mułowana z większą precyzją, jest nazywana einsteinowską zasadą równoważności. Jest ona związana z faktem, że wszystkie przedmioty spadają z dokładnie tym samym przyspie- szeniem, niezależnym ani od ich masy, ani też od ich wewnętrznej struktury. Jeśli weźmiemy pod uwagę lecący z wyłączonymi silnikami pojazd kosmiczny, czyli spadający swobodnie statek, i znajdującego się w jego wnętrzu człowieka, wtedy zarówno ruch człowieka, jak i pojazdu będzie powodowany przez dokładnie te same prawa. Skoro więc człowiek ów umieści się w środkowym punkcie pojazdu, będzie on tam pozostawał. Nie będzie spadał
42-5. GRAWITACJA I ZASADA RÓWNOWAŻNOŚCI 419 na żadną ze ścian statku. Taką właśnie sytuację mamy na myśli, mówiąc że pozostaje on w „stanie nieważkości”. Przypuśćmy teraz, że znajdujemy się w poruszającej się ruchem przyspieszonym rakie- cie kosmicznej. Względem czego jednak porusza się ona ruchem przyspieszonym? Uj- mijmy to inaczej i powiedzmy, że silniki rakiety pracują wytwarzając siłę ciągu, wskutek czego jej ruch nie jest już spadkiem swobodnym. Przypuśćmy także, że znajdujemy się dość daleko w pustej przestrzeni kosmicznej, gdzie praktycznie na pojazd nie działają żadne siły grawitacyjne. Jeśli pojazd będzie miał przyspieszenie równe „Ig”, będziemy mogli stać na „podłodze” i będziemy odczuwali nasz normalny ciężar. Gdybyśmy również podrzucili do góry piłkę, zaczęłaby ona „spadać” na podłogę. Dlaczego? Otóż dlatego, że pojazd porusza się ruchem przyspieszonym „ku górze”, a na piłkę nie będą natomiast działały żadne siły i nie będzie ona brała udziału w tym ruchu przyspieszonym; nie będzie ona więc nadążała za pojazdem. Ze względu na wnętrze pojazdu piłka będzie poruszała się pozornym ruchem przyspieszonym w dół, o przyspieszeniu równym „Ig”. Porównajmy to teraz z sytuacją, w której pojazd kosmiczny będzie spoczywał na po- wierzchni Ziemi. Wszystkie tego typu zjawiska będą miały przebieg dokładnie taki sam jak poprzednio! Pasażerowie będą odczuwali nacisk w kietunku podłogi, piłka będzie spadać z przyspieszeniem równym Ig itd. Czy jest więc możliwe, żeby ktoś siedzący wewnątrz pojazdu kosmicznego mógł powiedzieć, czy spoczywa na powierzchni Ziemi, czy też porusza się ruchem przyspieszonym w przestrzeni kosmicznej? Zgodnie z einsteinowską zasadą równoważności tego nie można w ogóle rozstrzygnąć, jeśli korzysta się tylko z po- miarów wykonanych we wnętrzu pojazdu! Dla ścisłości należy stwierdzić, że jest to prawdą tylko w przypadku pomiarów wy- konywanych w dokładnie jednym punkcie wewnątrz pojazdu. Pole grawitacyjne Ziemi nie jest bowiem dokładnie jednorodne i spadająca w nim swobodnie piłka będzie dla dwóch sąsiednich torów miała trochę różne przyspieszenia — o różnych kierunkach i o różnych wartościach bezwzględnych. Gdybyśmy mieli natomiast ściśle jednorodne pole grawita- cyjne, moglibyśmy je zastąpić układem odniesienia poruszającym się ruchem jedno- stajnie przyspieszonym. W stwierdzeniu tym zawarta jest właśnie podstawowa treść za- sady równoważności. 42-6. Rytm zegarów w polu grawitacyjnym Posłużymy się teraz zasadą równoważności, aby rozważyć dziwne zjawiska, które mogą zachodzić w polu grawitacyjnym. Zwrócimy więc uwagę na pewne zjawisko w rakiecie kosmicznej, którego możliwości istnienia w polu grawitacyjnym czytelnik prawdopodobnie by nie oczekiwał. Przypuśćmy, że jeden zegar umieściliśmy w „głowicy” rakiety kosmicznej, tzn. w jej przedniej części, a drugi, identyczny zegar — w jej tylnej części, jak to przedstawiono na rys. 42.16. Oznaczmy te zegary odpowiednio literami A i B. Jeśli porównamy wskazania tych zegarów podczas przyspieszonego ruchu pojazdu, to się okaże, że zegar na przodzie pozornie idzie szybciej niż zegar w tyle. Aby się o tym prze-
420 42. PRZESTRZENIE ZAKRZYWIONE 42.16. Poruszający się ru- chem przyspieszonym po- jazd rakietowy z dwoma ze- garami na pokładzie następnymi błyskami. Dlatego obserwator konać, przypuśćmy, że przedni zegar wysyła co sekundę błysk światła, a z tyłu rakiety znajduje się obserwator, który porównuje częstość przybywających błysków światła ze wskazaniami zegara B. Niech rakieta będzie na przykład w położeniu oznaczonym literą a na rys. 42.17’ wtedy, gdy zegar A wysyła błysk światła, a w położeniu b, gdy błysk ten dotrze do zegara B. Następny z kolei błysk zegar A wyśle wtedy, gdy pojazd będzie znajdował się w położeniu c, a w położeniu d błysk ten będzie odebrany przez obserwatora znajdującego się przy zegarze B. Pierwszy błysk przebędzie odległość Z-j, a następny przej- dzie krótszą już odległość L2. Odległość ta będzie krótsza, gdyż pojazd porusza się ruchem jednostajnie przyspieszonym i w chwili wysłania drugiego błysku będzie miał już większą prędkość. Widać więc stąd, że dwa błyski wysłane przez zegar A w odstępie jednosekundowym dotrą do zegara B w odstępie krótszym od jednej sekundy, gdyż drugi z kolei błysk nie będzie potrzebował na przebycie swej drogi tak dużo czasu, jak pierwszy. To samo będzie się również działo ze wszystkimi znajdujący się w tyle statku dojdzie do wniosku, że zegar A idzie prędzej niż zegar B. Gdybyśmy przeprowadzili podobne doświadczenie myślowe odwracając rolę obu zegarów — pozwolili emitować światło zegarowi B i obserwowali je przy zegarze A — doszlibyśmy do wniosku, że zegar B idzie wolniej niż A. Oba więc wnioski byłyby z sobą zgodne i nic w tym nie byłoby tajemniczego. Weźmy teraz pod uwagę pojazd kosmiczny spoczywający w polu grawitacyjnym Ziemi. Przypuśćmy, te przeprowadzamy to samo doświadczenie. Siedzący więc na podłodze obser- wator z jednym zegarkiem w ręku i patrzący na drugi identyczny zegar umieszczony na wysokiej półce powinien by dojść do wniosku, że zegar na półce spieszy się w porównaniu z zegarem na podłodze! Czytelnik może w tym miejscu zaprotestować: „Wniosek ten musi być błędny. Wskazania obu zegarów powinny być takie same. Jeśli zegary nie wyko- nują ruchów przyspieszonych, nie ma powodów, aby ich rytmy były niezgodne.” Tak jednak być musi, jeśli zasada równoważności jest słuszna. Einstein chciał zaś koniecznie, aby zasada ta była słuszna, i zgodnie z tym żądaniem odważnie i logicznie kontynuował swe rozumowanie. Zaproponował, aby uznać, że zegary umieszczone w różnych punktach w polu grawitacyjnym muszą pozornie chodzić różnie. Jeśli przy tym różnica ich wskazań będzie się stale zwiększać, należy uznać, że mają one odmienne rytmy. Widać teraz ścisłą analogię pomiędzy zegarami w polu grawitacyjnym i rozszerzającym się pod wpływem ciepła prętem mierniczym, o którym mówiliśmy poprzednio, kiedyśmy się zajmowali żukiem na rozgrzanej płycie. Wyobrażaliśmy sobie, że pręty, żuki, jak i wszystkie inne przedmioty jednakowo zmieniały swe długości pod wpływem zmian tem-
42-6. RYTM ZEGARÓW W POLU GRAWITACYJNYM 421 peratury i dlatego żuki nie miały możliwości stwierdzenia, że ich pręty miernicze zmieniały swą długość podczas ich przesuwania po rozgrzanej płycie. To samo dzieje się z zegarami w polu grawitacyjnym. Każdy zegar umieszczony na wyższym poziomie wydaje się spie- szyć. Przyspieszeniu ulega wtedy zarówno rytm bicia serca, jak i przebieg wszystkich innych procesów. Gdyby tak nie było, istniałaby możliwość odróżnienia pola grawitacyjnego od porusza- jącego się ruchem przyspieszonym układu odniesienia. Jest to trudna do przyjęcia koncep- cja, że czas może się zmieniać od miejsca do miejsca, ale jest to koncepcja, którą Einstein posługiwał się w swych rozumowaniach, i — wierzcie mi lub nie — jest ona poprawna. Posługując się zasadą równoważności możemy obliczyć jak zmienia się prędkość chodu zegara w zależności od jego wysokości w polu grawitacyjnym. W tym celu rozwa- żymy po prostu pozorną rozbieżność wskazań dwóch zega- rów w poruszającej się ruchem przyspieszonym rakiecie kosmicznej. Najprościej możemy to zrobić powołując się na wyniki otrzymane w rozdz. 34 tomu 1 (cz. 2) dla zja- wiska Dopplera. Stwierdziliśmy tam (por. równanie 34.14), że jeśli v jest względną prędkością źródła i odbiornika, odbierana częstość co jest związana z nadawaną częstością o>o wzorem 1-f-n/c CO = CO0 —=. =.- - . ^\—V2!c2 Teraz, w przypadku przedstawionej na rys. 42.17 rakiety,' poruszającej się ruchem przyspieszonym, odbiornik i nadaj- nik poruszają się w danej chwili z jednakowymi prędkościa- mi. W tym jednak czasie, w którym sygnał świetlny prze- chodzi od zegara A do zegara B, pojazd przyspiesza. Przy- rost jego prędkości jest więc wtedy równy gt, gdzie g jest przyspieszeniem, a t — czasem, jaki światło potrzebuje do przebycia odległości H od punktu A do B. Czas ten jest w przybliżeniu równy H/c. Wtedy więc, gdy sygnał dociera do punktu B, statek ma nową prędkość powiększoną o wiel- kość gH/c. Ten przyrost prędkości reprezentuje względną prędkość odbiornika i nadajnika w chwilach wysłania i ode- brania sygnałów. Prędkość tę należy podstawić do wzoru (42.4) na przesunięcie Dopplera. Zakładając, że przyspie- szenie i długość pojazdu kosmicznego są tak małe, że odpo- wiadający im przyrost prędkości jest znacznie mniejszy od prędkości światła, możemy pominąć wyraz proporcjo- nalny do v2/c2. 42.17. Zegar umieszczony na przodzie poruszającego się ruchem przyspieszonym pojazdu rakietowego ma po- zornie przyspieszony rytm w porównaniu z zegarem umieszczonym w tyle po- jazdu
422 42. PRZESTRZENIE ZAKRZYWIONE Mamy więc / gH\ « = 1+Ą-L (42.5) \ c2 f Tak więc pomiędzy dwoma zegarami w rakiecie kosmicznej zachodzi związek / gff\ i (rytm odbierany) = (rytm nadawany) 11 --I, (42.6) t ' c2 / gdzie 27 jest różnicą w wysokości nadajnika i odbiornika. Z zasady równoważności wynika, że ten sam rezultat musi być słuszny dla dwóch zegarów umieszczonych na różnych wysokościach, o różnicy H, w polu grawitacyjnym, w którym przyspieszenie ciał spadających jest równe g. Rezultat ten jest tak ważny, że chcielibyśmy pokazać również, jak wynika on z innego prawa fizyki — z zasady zachowania energii. Jak wiemy, siła grawitacyjna działająca na dowolny obiekt jest proporcjonalna do jego masy M, która z kolei jest związana z jego całkowitą energią wewnętrzną E wzorem M = E/c2. Tak na przykład, masy jąder atomo- wych otrzymane na podstawie tego wzoru z energii jądrowych reakcji przemiany danego jądra w inne, są zgodne z masami otrzymanymi z ich ciężarów atomowych. Weźmy teraz pod uwagę atom, który może znajdować się albo w stanie całkowitej energii Eq, będącym jego najniższym stanem energetycznym, albo też w wyższym stanie energii E^. Na skutek przejścia ze stanu do stanu Eo atom ten emituje światło. Czę- stość co tego światła będzie równa hw — Et— Eq. (42.7) Przypuśćmy teraz, że atom ten jest w stanie Et oraz że umieściliśmy go na podłodze. Przenieśmy go następnie z podłogi na pewien poziom o wysokości H. Aby to uczynić, musimy wykonać pracę polegającą na przeniesieniu masy mt = EJc2 przeciwko sile pola grawitacyjnego. Praca ta jest równa ^-gH. (42.8) c Po przeniesieniu go pozwólmy atomowi wyemitować foton, co spowoduje jego przejście do niższego stanu energii Eo. Następnie przenieśmy atom z powrotem na podłogę. Prze- nosimy teraz jednak masę równą E0[c2‘, zyskamy więc energię —^gH. (42.9) c2 Całkowita praca, jaką musieliśmy wykonać przy przenoszeniu atomu, jest więc równa AU- E1~E° gH. (42.10) c2 Podczas emisji atom oddał fotonowi energię równą Et— Eo. Przypuśćmy teraz, że
42-6. RYTM ZEGARÓW W POLU GRAWITACYJNYM 423 również foton powrócił na podłogę i został tu zaabsorbowany. Jak duża będzie energia, dostarczona przez foton w momencie absorpcji? W pierwszej chwili mogłoby się wydawać, że energia ta będzie po prostu równa Et— Eo. Tak jednak być nie może, jeśli energia jest zachowana. Powinno nas o tym przekonać następujące rozumowanie. Na początku mie- liśmy energię Et atomu na podłodze. Na końcu, całkowita energia na podłodze była równa sumie energii Eo atomu w jego najniższym stanie i energii Ef otrzymanej od fotonu. Podczas procesu musieliśmy dostarczyć dodatkowej energii AU danej równaniem (42.10). Z zasady zachowania energii wynika, że energia końcowa powinna być równa sumie energii początkowej i wykonanej pracy. Musimy więc mieć Ey+Eo ~ EiĄ- AU, czyli E^ = Et—E0+AU. (42.11) Stąd więc wynika, że energia fotonu na podłodze nie była po prostu równa Et— Eo, lecz była od tej wielkości większa. W przeciwnym bowiem przypadku część energii zostałaby stracona. Jeśli do równania (42.11) podstawimy otrzymane na AU wyrażenie (42.10), stwierdzimy, że energia, z jaką foton przybył na podłogę, była równa Ef = (Er-£0)i 1+^rl- (42.12) Foton o energii Ef ma jednak częstość a> = Ef/H. Jeśli przez a>0 ożnaczymy częstość, z jaką foton był emitowany, to równanie (42.12) staje się identyczne ze związkiem (42.5) pomiędzy częstością fotonu ulegającego absorpcji na podłodze i częstością fotonu podczas jego emisji. Związek ten możemy otrzymać jeszcze w inny sposób. Foton o częstości oj0 ma ener- gię Eo = Ha>0. Ponieważ energii Eo odpowiada masa grawitacyjna E0/c2, foton ma masę (która nie jest jego masą spoczynkową) równą Hw0/c2 i jest przez Ziemię „przyciągany”. Spadając z wysokości H uzyska on energię równą (Tkwolc2)gH i przybędzie na podłogę z energią / gH\ E — h<oQ l+Ą- \ c2 I Ponieważ zaś jego częstość po spadku jest równa E/Jl, w wyniku otrzymujemy znowu równanie (42.5). Widzimy, że wiele koncepcji dotyczących względności, fizyki kwantowej oraz zasady zachowania energii będzie z sobą zgodnych tylko wtedy, gdy przewidziane przez Einsteina zachowanie zegarów w polu grawitacyjnym będzie poprawne. Rozważane tu zmiany częstości są w normalnych warunkach bardzo małe. Tak na przykład, 20-me- trowej różnicy wzniesień na powierzchni Ziemi odpowiada względna różnica częstości równa 2 10-15. Dokładnie taka właśnie zmiana częstości została niedawno stwierdzona doświadczalnie za pomocą zjawiska Mossbauera*1. Einstein miał więc absolutną rację. 1 R. V. Pound i G. A. Rebka, Jr., Physical Review Letters 4, 337 (1960).
424 42. PRZESTRZENIE ZAKRZYWIONE H a) H A C) , 100 m -•» t 42.18. Próba konstrukcji prostokąta w czaso- przestrzeni 42-7. Krzywizna czasoprzestrzeni Teraz chcemy powiązać otrzymane powyżej wyniki z koncepcją krzywej czaso- przestrzeni. Stwierdziliśmy już powyżej, że istnieje analogia pomiędzy różnicą w chodzie zegarów w różnych miejscach i występowaniem krzywizny przestrzeni na rozgrzanej płycie. Jest to jednak czymś więcej niż analogią; jest to stwierdze- niem, że czasoprzestrzeń jest zakrzywio- na. Spróbujmy spojrzeć na czasoprze- strzeń z punktu widzenia geometrycznego. Może to z początku brzmieć nieco dziw- nie, przypomnijmy sobie jednak, że już dość często podawaliśmy diagramy czaso- przestrzeni, na których na jednej osi była odmierzona odległość, a na drugiej od- stępy czasu. Przypuśćmy, że chcemy skon- struować w czasoprzestrzeni pewien pro- stokąt. Próbę jego konstrukcji przedsta- wimy za pomocą wykresu przedstawiają- cego wysokość H w zależności od czasu t, w układzie o osiach jak na rys. 42.18a. Aby wykonać podstawę naszego prosto- kąta, weźmiemy pewien przedmiot w spo- czynku, znajdujący się na wysokości i podążymy wzdłuż jego linii świata przez 100 s. Otrzymamy w ten sposób odcinek BD na części b) wykresu, równoległy do osi t. Weźmy teraz pod uwagę inny przed- miot, znajdujący się 100 m wyżej niż pierw- szy, w czasie t — 0. Niech przedmiotowi temu w chwili t — 0 odpowiada punkt A na rys. 42.18c. Podążmy teraz za tym przedmiotem wzdłuż jego linii świata przez 100 s zmierzonych przez zegar w punkcie A. W tym czasie przedmiot przejdzie od punktu A do C w czaso- przestrzeni, co zostało pokazane w części d) wykresu. Ponieważ jednak na obu tych wysokościach czas biegnie inaczej — za-
42-7. KRZYWIZNA CZASOPRZESTRZENI 425 kładamy bowiem, że istnieje tu pole grawitacyjne — punkty C i D nie przedstawiają zdarzeń jednoczesnych. Gdybyśmy więc spróbowali uzupełnić kwadrat przez pociągnięcie linii prostej do punktu C, znajdującego się 100 m powyżej punktu D w tym samym czasie (por. rys. 42.18e), nie otrzymalibyśmy krzywej łamanej zamkniętej. Fakt ten jest równoważny stwierdzeniu, że czasoprzestrzeń jest zakrzywiona. 42-8. Rnch w czasoprzestrzeni zakrzywionej Rozważmy teraz pewną interesującą zagadkę. Przypuśćmy, że mamy dwa identyczne zegary, A i B, znajdujące się na powierzchni Ziemi. Przypuśćmy dalej, że unieśliśmy zegar A na pewną wysokość H, potrzymaliśmy go tam przez chwilę i opuściliśmy go z powrotem na powierzchnię Ziemi dokładnie wtedy, gdy zegar B odmierzył odstęp czasu równy 100 s. Odpowiedni odstęp czasu, odmierzony przez zegar A, będzie wynosił wtedy, na przykład 107 sekund, gdyż na skutek uniesienia go w powietrze rytm tego zegara był przyspieszony. I teraz właśnie możemy postawić naszą zagadkę. Jaki ruch musi wykonać zegar A, jeśli odmierzony przez niego odstęp czasu ma być możliwie największy — przy założeniu, że zegar A będzie zawsze powracał wtedy, gdy zgodnie z zegarem B upłynie 100 s? Czytelnik mógłby na przykład tak odpowiedzieć: „Sprawa jest prosta. Należy unieść zegar A po prostu tak wysoko, jak jest tylko możliwe. Wtedy zegar A maksymalnie przyspieszy swój rytm, i po powrocie wykaże możliwie naj- większy upływ czasu.” Rozumowanie takie jest jednak błędne. Czytelnik bowiem tu za- pomina, iż mamy do dyspozycji tylko 100 s ńa to, by wznieść nasz zegar i opuścić go z po- wrotem. Jeśli uniesiemy go bardzo wysoko, będziemy musieli spowodować bardzo szyb- ki jego ruch w obie strony, aby zdążyć w przeciągu 100 s. Musimy przy tym pamiętać o tym, że zgodnie ze szczególną teorią względności, rytm poruszającego się zegara ulegnie zwolnieniu w stosunku FI—v2/c2. Gdybyśmy wzięli pod uwagę tylko tę poprawkę rela- tywistyczną, okazałoby się, że odstęp czasu mierzony przez zegar A jest mniejszy niż od- powiedni odstęp mierzony przez zegar B. Mamy więc tu do czynienia ze swego rodzaju grą. Jeśli pozostawimy zegar A w spokoju, odmierzy on 100 s. Jeśli zaś będziemy go po- woli unosić, osiągając raczej małą wysokość, a następnie powoli sprowadzimy go na po- wierzchnię Ziemi, wskaże nam on trochę więcej niż 100 s. Jeżeli natomiast uniesiemy go jeszcze trochę wyżej, nie wykluczone, że jeszcze bardziej na tym zyskamy. Jeśli jednak będziemy chcieli unieść go zbyt wysoko, będziemy musieli się spieszyć, aby zdążyć to wykonać; może to spowodować tak duże zwolnienie rytmu zegara, że po powrocie będzie wskazywał on mniej niż 100 s. Jaki więc powinniśmy przygotować program zmian wysokości w czasie, tzn. jaką powinniśmy dobrać wysokość i prędkość do- tarcia do niej, abyśmy zdążyli powrócić do zegara B wtedy, gdy odmierzony przez niego odstęp czasu będzie wynosił 100 s, a odstęp czasu odmierzony przez zegar A będzie możliwie największy? Odpowiedź: Należy wyznaczyć, z jaką prędkością początkową powinno się wyrzucić piłkę pionowo w górę, aby powróciła ona na powierzchnię Ziemi po dokładnie 100 s. Taki ruch piłki — składający się z jej szybkiego wznoszenia, zwalniania, zatrzymania się
426 42. PRZESTRZENIE ZAKRZYWIONE 42.19. W jednorodnym polu grawitacyjnym torem, wzdłuż którego czas własny przyjmuje maksimum dla ustalonego odstępu czasu, jest parabola i powrotu na powierzchnię Ziemi — jest właśnie dokładnie tym ruchem, podczas którego upłynie maksymalny odstęp czasu na zegarku poruszającym się wraz z piłką. Rozważmy teraz trochę inne zagad- nienie. Przypuśćmy, że mamy dane dwa punkty A i B na powierzchni Ziemi, umieszczone w pewnej odle- głości od siebie. Chcemy rozwiązać tu to samo zagadnienie, jak wtedy, gdyśmy próbowali znaleźć odpowied- nik linii prostej w czasoprzestrzeni. Pytamy się więc, jak powinniśmy się poruszać od punktu A do punktu B, aby czas wskazany przez poruszający się tak zegar był najdłuższy — przy założeniu, że na dany sygnał startujemy z punktu A i przybywamy do punktu B jednocześnie z innym sygnałem, nadanym w punkcie B, po upływie określonego odstępu czasu, np. 100 s po pierwszym sygnale, mierzonego przez zegar w spoczynku. Czytelnik może nam na to odpowiedzieć: „Stwierdzilibyśmy jednak wtedy, że należy poruszać się z wyłączonym silnikiem wzdłuż linii prostej z tak dobraną stałą prędkością, aby pojawić się w punkcie B dokładnie po upływie 100 s. Gdybyśmy bowiem nie poruszali się wzdłuż linii prostej, musielibyśmy przyspieszać, co spowodowałoby zwolnienie rytmu naszego zegara.” Czy jednak na pewno! Wynik taki otrzymaliśmy, nie biorąc pod uwagę zjawiska grawitacji. Czy jednak nie byłoby lepiej wznieść sie trochę po linii krzywej, a następnie znowu się opuścić? Czy nie moglibyśmy zyskać na tym, że na dużych wysokościach zegar nasz przy- spiesza swój rytm? Okazuje się, że rzeczywiście jest to prawdą. Jeżeli rozwiąże się zagad- nienie matematyczne, polegające na takim dobraniu toru ruchu zegara, aby wskazany przez niego odstęp czasu był możliwie najdłuższy, okaże się, że torem tym jest parabola, a więc ta sama krzywa, która jest swobodnym balistycznym torem obiektów poruszających się w polu grawitacyjnym, czyli krzywa przedstawiona na rys. 42.19. Dlatego też prawu ruchu w polu grawitacyjnym można także nadać następujące sformułowanie: Każde ciało tak. się zawsze porusza, aby poruszający się z nim zegar wskazywał dla toru rzeczywistego dłuższy czas niż wskazywałby on dla jakiegokolwiek innego możliwego toru — przy założeniu, oczy- wiście, tych samych warunków na początku i na końcu takiego ruchu. Czas mierzony przez poruszający się zegar jest często nazywany „czasem własnym”. Podczas swobodnego spadku czas własny danego ciała przyjmuje wzdłuż rzeczywistego toru jego ruchu wartość maksymalną. Sprawdźmy, jak ta zasada działa. Za punkt wyjścia przyjmujemy równanie (42.5), które stwierdza, że różnica rytmów pomiędzy poruszającym się i spoczywającym zegarem jest równa c2 (42.13)
42-8. RUCH W CZASOPRZESTRZENI ZAKRZYWIONEJ 427 Ponadto musimy uwzględnić, że podczas ruchu pojawia się poprawka o przeciwnym znaku, która jest związana z prędkością ciała. Powoduje ona zmianę rytmu zegara określoną wzorem CO = COo^l— v2/c2. Rozważana tu zasada jest prawdziwa dla każdej prędkości ciała. Dla uproszczenia bę- dziemy tu jednak zakładali, że prędkość ciała jest dużo mniejsza niż prędkość światła c- Wtedy powyższe równanie można zapisać w postaci co = coo(l—v2/2c2) i różnica rytmów naszego zegara w ruchu i w spoczynku jest równa v2 -«0TT. (42.14) Zc ‘ Uwzględniając obie poprawki, (42.13) i (42.14), widzimy, że (42.15) Jeśli więc spoczywający zegar wskaże odstęp czasu dt, to wskutek powyższej zmiany rytmu poruszający się zegar zarejestruje czas równy (42.16) Całkowita różnica czasów, mierzona przez zegar w spoczynku i w ruchu, wzdłuż całego toru, jest równa całce z powyższej poprawki względem czasu, czyli (42.17) przy czym całka ta dla toru rzeczywistego powinna przybierać wartość maksymalną. Wyraz gH jest po prostu równy potencjałowi grawitacyjnemu cp. Otrzymaną całkę możemy pomnożyć przez stały czynnik — mc2, gdzie m jest masą spoczynkową ciała. Wtedy w wyniku takiego pomnożenia dostaniemy wyrażenie, które będzie miało takie samo ekstremum, lecz z powodu pojawienia się znaku minus ekstremum to ulegnie zmianie z maksimum na minimum. Równanie (42.17) można wtedy zastąpić warunkiem stwier- dzającym, że podczas ruchu ciała mu2 —mcp\ dt = minimum. (42.18) Wyrażenie podcałkowe jest tu po prostu różnicą energii kinetycznej i potencjalnej. Jak czytelnik zapewne pamięta, w rozdz. 19 tomu II (cz. 1) poświęconym zasadzie najmniej- szego działania, pokazaliśmy, że newtonowskie prawa ruchu ciała w dowolnym polu potencjalnym można zapisać w postaci danej równaniem (42.18).
428 42. PRZESTRZENIE ZAKRZYWIONE 42-9. Einsteinowska teoria ciążenia Einsteinowska postać równań ruchu — równoważna stwierdzeniu, że czas własny w zakrzywionej przestrzeni powinien przyjmować wartość maksymalną — prowadzi w przypadku małych prędkości do tych samych wyników co prawa Newtona. Tak więc zegarek astronauty Gordona Coopera podczas jego ruchu wokół Ziemi spóźniał się w porównaniu z tym, co by ten zegarek wskazywał, gdyby pojazd kosmiczny Coopera poruszał się po jakimś innym, nierzeczywistym torze, jaki moglibyśmy sobie wyobrazić*’. Prawo ciążenia można więc sformułować za pomocą pojęć geometrii czasoprzestrzeni w ten oto szczególny sposób: Czas własny poruszającej się cząstki — będący w czasoprze- strzeni odpowiednikiem „najkrótszej drogi” — jest zawsze najdłuższy. Jest to prawo ruchu w polu grawitacyjnym. W takim sformułowaniu prawo to nie zależy ani od układów współ- rzędnych, ani też od innych sposobów opisu rozważanej sytuacji; i to jest największą za- letą tego sformułowania. Spróbujmy zreasumować nasze dotychczasowe rozważania. Poznaliśmy dwa prawa teorii grawitacji: 1. W obecności materii zmienia się geometria czasoprzestrzeni i to tak, że krzywizna czasoprzestrzeni wyrażona za pomocą nadwyżki promienia jest proporcjonalna do masy zawartej we wnętrzu kuli o tym promieniu, co zostało wyrażone równaniem (42.3). 2. W przypadku, gdy siły grawitacyjne są jedynymi działającymi siłami, ciała się tak poruszają, że czas własny pomiędzy dwoma ich ustalonymi punktami w czasoprzestrzeni przyjmuje wartość maksymalną. Powyższe dwa prawa są w ścisłej analogii z odpowiednimi parami praw, z którymi spotykaliśmy się poprzednio. Pierwotnie ruch w polu grawitacyjnym opisywaliśmy za pomocą newtonowskiego prawa powszechnego ciążenia oraz za pomocą newtonow- skich praw ruchu. Prawa te zostały teraz zastąpione prawami 1 i 2. Ta nasza nowa para praw wykazuje także pewne podobieństwo do tego, z czym spotkaliśmy się w elektrodynamice. Podstawowe prawo było tam wyrażone za pomocą równań Maxwella, które pozwalały określać wytwarzane przez ładunki pola elektromagnetyczne. Prawo to mówiło jak zmienia się charakter „przestrzeni” na skutek obecności naładowanej materii, a więc spełniało podobną rolę jak prawo 1 w przypadku teorii grawitacji. Ponadto mieliśmy także prawo określające ruch cząstek w danym polu elektromagnetycznym: d(rm)fdt = <?(E+vxB). Funkcję tę w przypadku teorii grawitacji przejmuje prawo 2. Prawa 1 i 2 są ścisłym sformułowaniem einsteinowskiej teorii grawitacji, chociaż w li- teraturze podaje się zwykle ich bardziej skomplikowaną matematyczną postać. Powin- *’ Mówiąc ściśle, maksimum to ma tylko charakter lokalny. W bardziej poprawnym sformułowaniu omawianej zasady powinniśmy uwzględnić, że czas własny przyjmuje dla ruchu po torze rzeczywistym większą wartość niż dla dowolnego sąsiedniego toru. Tak więc czas własny dla ruchu po, na przykład, elip- tycznej orbicie wokół Ziemi nie musi wcale być większy niż dla ruchu po torze balistycznym, jaki będzie wykonywało ciało wystrzelone na niezbyt dużą wysokość nad powierzchnię Ziemi.
42-9. EINSTEINOWSKA TEORIA CIĄŻENIA 429 niśmy tu jeszcze zwrócić uwagę na pewien szczegół. W polu grawitacyjnym przy przecho- dzeniu od miejsca do miejsca zmienia się nie tylko jednostka czasu, lecz także jednostka długości. Pręty miernicze zmieniają swą długość na skutek ich położenia. Skoro czas i prze- strzeń są tak nierozerwalnie związane, nie może absolutnie nic przytrafić się wielkościom związanym z czasem, co nie miałoby jakiegoś wpływu na zachowanie się wielkości zwią- zanych z przestrzenią. Weźmy taki oto najprostszy przykład: przypuśćmy, że ktoś oddala się od Ziemi. Wtedy to, co będzie „czasem" z jego punktu widzenia, będzie odległością przestrzenną z naszego punktu widzenia. Zmianie w czasie musi tu bowiem towarzyszyć zmiana w przestrzeni. W teorii grawitacji jednak cała czasoprzestrzeń jest zniekształcona na skutek obecności materii, jest to znacznie bardziej skomplikowaną rzeczą niż prosta zmiana jednostek czasowych. Reguła, którą sformułowaliśmy za pomocą równania (42.3) w zupełności jednak wystarcza do określenia wszystkich praw teorii grawitacji, o ile się będzie rozumiało, że wypowiedzi tej reguły dotyczące krzywizny przestrzeni są słuszne z punktu widzenia każdego obserwatora. Ktoś mijający na przykład bryłę materialną bę- dzie za jej masę przyjmował liczbę różną od jej masy spoczynkowej, gdyż przy wyzna- czaniu masy mijającej go bryły będzie musiał uwzględnić masę związaną z jej energią ki- netyczną. Teorię należy tak sformułować, aby każdy obserwator — niezależnie od stanu swego ruchu — stwierdzał, po skonstruowaniu w swoim układzie odniesienia powierzchni kuli, że nadwyżka promienia tej kuli równa się iloczynowi czynnika G/3c2 i całkowitej masy (lub, bardziej poprawnie, czynnika G/3c4 i całkowitej energii) zawartej we wnętrzu tej kuli. Stwierdzenie, że to prawo — prawo 1 — jest spełnione w dowolnie poruszającym się układzie odniesienia, jest jednym z najbardziej podstawowych praw teorii grawitacji, zwanych einsteinowskimi równaniami pola. Następnym z kolei podstawowym prawem jest prawo 2 — stwierdzające, że podczas ruchu ciał ich czas własny przyjmuje wartość maksymalną — które jest nazywane einsteinowskim równaniem ruchu. Napisanie tych praw w ich pełnej algebraicznej postaci, porównanie ich z prawami Newtona lub powiązanie ich z prawami elektrodynamiki jest matematycznie trudnym zadaniem. Z fizycznego jednak punktu widzenia prawa te stanowią najbardziej pełną, współcześnie znaną wersję praw teorii grawitacji. Chociaż w rozpatrywanym przez nas prostym przykładzie otrzymaliśmy na ich pod- stawie wyniki zgodne z mechaniką Newtona, to na ogół jednak nie muszą one prowadzić do takiej zgodności. Einstein na ich podstawie przewidział następujące trzy odstępstwa od mechaniki newtonowskiej, które zostały potwierdzone na drodze doświadczalnej: orbita Merkurego nie jest ustaloną w przestrzeni elipsą; światło gwiazd przechodzące w pobliżu Słońca jest uginane dwukrotnie więcej, niż można by się tego spodziewać; rytm zega- rów zależy od ich położenia w polu grawitacyjnym. Ilekroć dotychczas teoria Einsteina przewidywała odstępstwa od mechaniki newtonowskiej, Przyroda zawsze przyznawała rację Einsteinowi. Zreasumujmy raz jeszcze wszystko to, cośmy w tym rozdziale powiedzieli. Po pierwsze, zmiany w czasie i w przestrzeni zależą od przestrzennego położenia miejsca, w którym są wyznaczone, oraz od czasu, w którym są mierzone. Zdanie to jest równoważne stwier- dzeniu, że czasoprzestrzeń jest zakrzywiona. Mierząc pole A powierzchni kuli można
430 42. PRZESTRZENIE ZAKRZYWIONE określić jej przewidywany promień, równy V AI4n, rzeczywiście jednak mierzony promień będzie miał nadwyżkę ponad tę wartość, proporcjonalną (ze współczynnikiem proporcjo- nalności równym G/3c2) do całkowitej masy zawartej wewnątrz tej kuli. Prawo to dokładnie ustala stopień zakrzywienia czasoprzestrzeni. Tak wyznaczona krzywizna musi być zawsze taka sama, niezależnie od obserwatora, który będzie ją wyznaczał i niezależnie od jego stanu ruchu. Po drugie, cząstki poruszają się „po liniach prostych” (którym odpowiadają tory o maksymalnym czasie własnym) w tej zakrzywionej czasoprzestrzeni. Taka jest właśnie treść podanego przez Einsteina sformułowania praw teorii grawitacji.
Rozdział 22 zadania 22.1. Sieć w kształcie sześciennej ramki ma końcówki w każdym wierzchołku i jednoomowy opór wzdłuż każdej krawędzi. Znajdź wypadkowy opór między wszyst- kimi możliwymi kombinacjami końcówek. 22.2. a. Znajdź prąd I w podanym obok obwodzie. b. Jaki jest prąd I, jeśli istnieje wzajemna indukcyjność y/, która sprzęga obie występujące tu indukcyjności. 22.3. Na rysunku obok pokazano sieć skrzyżowaną do układu hi-fi**. Efektywny opór każdego głośnika wynosi R. a. Wykaż, że jeżeli R2 = L/2C, to oporność pozorna na wejściu (oporność pozorna taka, jaką odczuwa gene- rator) jest czysto oporowa i równa jest R. b. Wykaż. że krzyżowa częstość dana jest wzorem w2 = \)LC. Krzyżowa częstość a>c zdefiniowana jest jako ta częstość, przy której każdy z głośników otrzymuje połowę całkowitej mocy. 22.4. Wykaż, że w podanym obok obwodzie różnica potencjałów (napięcie) między' punktami a i b ma ampli- tudę niezależną od częstości w. Podaj wykres fazy tej róż- nicy potencjałów jako funkcji w. Gdyby źródło miało opór wewnętrzny R *10, jaki by to miało wpływ na amplitudę napięcia między punktami a i b oraz na jego fazę? duży gtosntk do ruskich torów 03 maty gtosmk do . wysokich tonów *’ Układ elektroakustyczny o wysokiej czułości i wierności odtwarzania. Od słów high fidelity. (Przyp. tłum.)
432 ZADANIA Eocos a>t VoCOSCi)t 22.5. Prosty równolegle łączony obwód pokazano na ry- sunku obok. a. Narysuj z grubsza wykres obrazujący amplitudę prądu jako funkcję częstości dla wybranych wartości L, C i R. b. Gdy R >ł-/Z,/C. porównaj częstość rezonansową i szerokość krzywej rezonansowej dla tego obwodu z takimi samymi wiel- kościami dla obwodu zawierającego te same elementy połączo- ne szeregowo, w którym jednak R<źy'L/C. W szczególności rozważ równoległy obwód z R — K^L/C i szeregowy obwód z R = — Yl[Ć. K 22.6. Przedstawiony obwód jest mostkiem używanym do mierzenia indukcyjności. Generator ma zmienną siłę elek- tromotoryczną o częstości a>. Gdy mostek jest w równowadze, prąd w detektorze RD wynosi zero. Znajdź L i wyraź przez R i C. 22.7. Przedstawiony obwód jest mostkiem Weina, często używanym w oscylatorach RC. Mówi się, że jest on w równo- wadze, gdy przez detektor nie płynie prąd. Wykaż, że aby zachodziła równowaga, muszą być spełnione równocześnie oba następujące równania: \r2 / \ ^2 / \C1 / 1 CO = —========-. }/RlR2C1C2 22.8. Źródło napięcia K(t) = Po cos rot przyłożone jest do obwodu pokazanego na rysunku obok. a. Wykaż, że jeśli R, L i C dobrane są tak, że RC = L/R, to prąd /jest niezależny od częstości. b. Jaka jest różnica faz między przyłożonym napięciem a spadkiem napięcia na parze kondensator-opomik (dla RC = = L/R)? 22.9. Obwód zmontowany jest tak, że pokazane na rysun- ku połączenie w punkcie P3 może być zrobione w każdym z punktów P0,Pi,P2, ...,Pn. a. Znajdź wyrażenie na średnią moc rozpraszaną w opor- niku R, jeżeli połączenie zrobiono w punkcie Pm, gdzie 0 < m < n. b. Gdy R = 1000 Q, L = 10 henrów, C = 20 p.F <u = = 100 rad/s,
ZADANIA DO ROZDZIAŁU 22 433 i) Dla jakiej wartości m moc osiąga maksimum? ii) Jaki jest maksymalny spadek napięcia między punktami i P3, gdy m = = 2 i Ko = 100 N, jaki zaś na oporniku R1 Rozdział 23 23.1. Znajdź przybliżoną wartość częstości rezonansowej pokazanego poniżej rezo- natora. Załóż, że d<^a, d <^(b—a). Jakie najważniejsze efekty nie są uwzględnione przez takie założenia? Gdy rezonator jest chłodzony równomiernie (tzn. tak, że cały rezonator ma tę samą temperaturę), czy skurczenie termiczne prowadzi do wzrostu częstości rezonansowej, jej zmniejszenia, czy też nie powoduje żadnych jej zmian. Rozdział 24 24.1. Linia przesyłowa ma indukcyjność na jednostkę długości Lo i pojemność na jednostkę długości Co. Wykaż, że jeśli napięcie i prąd zmieniają się powoli (co odpowiada przesyłaniu sygnałów o długości fali dużej w porównaniu z odstępem między liniami), to podstawowymi równaniami są: dV _ dl dx ’ dl dV , dx dt Wykaż, że wynika stąd, iż zarówno I, jak i V spełniają równanie falowe d2I _ 1 d2I d2V __ 1 d2V dx2 v2 dt2 ’ dx2 v2 dt2 * . . ,1 gdzie v2 =-------. Lo Co Chcielibyśmy zwrócić uwagę, że założenie dotyczące wolno zmiennych sygnałów nie jest konieczne, ale dowód tego wykracza poza zakres wiadomości podanych w tym rozdziale. 24.2. Charakterystyczna oporność pozorna linii przesyłowej Zo = ^LojCo, gdzie Lo jest indukcyjnością na jednostkę długości, a Cq jest pojemnością na jednostkę długości. Wykaż, że dla linii przesyłowej składającej się z dwóch cienkich pasków o szerokości b, oddalonych o a (a b) 1 a Z° ~ e0C ~b' 28 — Wykłady z fizyki
434 ZADANIA 24.3. Przez przystawienie przewodzących płyt do końców kawałka cylindrycznego współosiowego przewodu o długości l utworzono rezonator. a. Znajdź częstość najniższych drgań, przy których pole elektryczne pozostaje zawsze radialne. b. Podaj wyrażenie na pole E. c. Porównaj częstość rezonansową z częstością o>0 = l/^LC, gdzie L i C są indukcyj- nością i pojemnością współosiowego przewodu o długości l. 24.4. Prostopadłościenny falowód zbudowany z doskonałego przewodnika ma krawę- dzie o długości a i b, tak jak pokazano na rysunku. Końce jego fragmentu o długości l przykryto płytami z przewodzącego materiału i falowód stał się w efekcie rezonatorem. Jeśli pole elektryczne dane jest przez część rzeczywistą wy- rażenia E(x, y, z, t) = E0(x, z) eim'ey, to jaka będzie amplituda E0(x, z) dla drgań rezonatora o naj- niższej częstości rezonansowej? Czemu przy tym będzie się równała najniższa rezonansowa częstość rezonatora? 24.5. Współosiowy kabel złożony jest z dwóch koncentrycznych przewodzących wal- ców. Jeden koniec (x = 0) podłączony jest do generatora napięcia, który wytwarza na- pięcie V(t) — Kocosw/. Drugi koniec kabla (x = l) przykryty jest przewodzącą płytą. Indukcyjność na jednostkę długości wynosi Lo, a pojemność Co. a. Naszkicuj napięcie między przewodnikami jako funkcję odległości x, gdy długość kabla wynosi 5nc/2a>, gdzie c jest prędkością światła. Wyznacz wartość x, przy której napięcie jest maksymalne. b. Wypisz wyrażenie na fale: postępującą do przodu i odbitą, które wytwarzają napię- cie między przewodnikami. c. Jaki jest prąd w punktach o współrzędnej x = 0, x = 1/2 = |(57tc/2a>) i x = l — = 5nc/2ft>? d. Jeśli źródło napięcia jest idealnym generatorem, którego wirnik obraca się z pręd- kością kątową w, jaki musi być średni moment siły przyłożony do generatora? 24.6. Wykaż, że jeśli linia przesyłowa jest zakończona w punkcie o współrzędnej x = l opornością pozorną ZT, to oporność pozorna „przesyłającego końca” (x = 0) dana jest wzorem: tgwFLC l—iZTIZ0 Zs = iZ0 , 1 + iZT/Z0 tg w F LC l gdzie Zo = L/C jest charakterystyczną opornością pozorną linii. Czemu będzie się równało Zs, jeśli a. ZT = 0, b. ZT = oo, c. ZT = Z01 |.
ZADANIA DO ROZDZIAŁU 24 435 24.7. Linia przesyłowa o charakterystycznej oporności pozornej Zx przyłączona jest do linii przesyłowej o charakterystycznej oporności pozornej Z2. Wykaż, że jeśli układ zasilany jest przez generator podłączony do pierwszej linii (ZJ, to „współczynnik odbicia” określony jako iloraz Voib[ Lprzj,, jest równy ^odb _ Zj ^przyl Z2 + Z1 podczas gdy „współczynnik przejścia” dany jest wyrażeniem ^przęśl _ 2Z2 Pprzyl Z1+Z2 24.8. W pewnej stacji radarowej klatka elektroniczna oddzielona jest od podstawy odbiorczej o długości 3048,0 cm falowodem, którego długość jest równa 1219,20 cm, a wewnętrzne wymiary wynoszą 14,60 cmx29,21 cm. Porównaj prędkość sygnału z pręd- kością w przestrzeni swobodnej, gdy częstość fali nośnej wynosi 960 MHz. 24.9. Pole elektryczne wewnątrz falowodu opisanego w rozdz. 24 ma tę własność, że składowa pola elektrycznego w kierunku propagacji równa jest zeru, czyli pole elektryczne jest transwersalne. (Typy fali, takie jak te, nazywane są przeto TE lub falami elektrycznie transwersalnymi). Istnieją również fale zwane TM, w których w kierunku propagacji nie ma pola magnetycznego. Dla prostokątnego falowodu przedstawionego na rys. 24.3 i 24.4 (str. 64 i 65) potencjał wektorowy fali typu TM dany jest wzorem: mitx ntty A = e.sin------sin-----exp[i(wt—k.z)}, a b gdzie a. Przekonaj się, że pole magnetyczne, obliczone z tych wzorów, jest rzeczywiście transwersalne i wykaż, że pola E i B spełniają równanie falowe i właściwe warunki brze- gowe. Wskazówka: Żądamy, żeby SA E = -V9>-—, B = VXA, gdzie b. Wykaż, że drgania scharakteryzowane liczbami n i m, nie będą się propagowały, jeśli , /lmn\2 Znit\2 " < CV (v) +rr) •
436 ZADANIA przed (zderzeniem) e 7i PO Rozdział 25 W zadaniach tego rozdziału jednostki są tak dobrane, że c = I. 25.1. Zapisz poniższe wyrażenia za pomocą cztero wektorów: (<p2-A2), (Aj-Q<p). Ą 25,2. W zjawisku Comptona spoczywający elektron ude- rzany jest przez foton, w wyniku czego pęd każdej z tych cząstek zmienia się. Znajdź energię emitowanego fotonu i wyraź ją przez energię początkową i kąt odchylenia od jego toru początkowego. 25.3. Pozytron można utworzyć bombardując spoczywający elektron fotonem. y+e~ -> e~+e++e~. Jaka jest minimalna energia fotonu? Używaj wszędzie, gdzie można, czterowektorów i niezmienników, jakie one tworzą. 25.4. Para elektron-pozytron może być wytworzona przy pomocy fotonu (y) w wyniku reakcji: y+e-->er+(e++er). Niemożliwa do zrealizowania jest natomiast reakcja y->e++e~ z jednym izolowanym fotonem, nawet jeśli energia fotonu jest większa niż dwie masy spoczynkowe elektronu i mimo że ładunek jest zachowany. Wykaż, że jest to prawda, posługując się czterowektorami. 25.5. Cząstka o masie m w spoczynku uderzona została przez inną cząstkę o masie M i o pędzie P. Po całkowicie niesprężystym zderzeniu cząstki te się połączyły tworząc po- jedynczą nową cząstkę. Jaka jest jej masa i prędkość ? Porównaj swoje wyniki z wartościami, które otrzymałoby się z obliczeń nierelatywi- stycznych. Rozdział 26 W zadaniach tego rozdziału jednostki dobrane są tak, Że c = 1. 26.1. Rozpisz na składowe i oblicz a V F .
ZADANIA DO ROZDZIAŁU 26 437 26.2. Znajdź czterowektor, którego przestrzenną częścią jest wektor (>E+jxB. Jakie jest fizyczne znaczenie zarówno czasowej, jak i przestrzennej składowej tegocztcro wektora? 26.3. Wykaż, że wyrażenia E2—B2 i (E-B) są niezmiennikami względem przekształceń Lorentza. Zauważ, że jeśli wektory E i B tworzą kąt ostry w jednym układzie, to dzieje się tak we wszystkich układach. W jakim ważnym zjawisku fizycznym oba te niezmienniki równają się zeru? 26.4. Niech E i B będą polami elektrycznym i magnetycznym w pewnym punkcie przestrzeni w danym układzie odniesienia. Określ prędkość innego układu, w któryir pola elektryczne i magnetyczne będą równoległe. Istnieje wiele układów, które mają t^ własność; jeśli znaleźlibyśmy jeden z nich, wtedy tę samą własność miałby każdy ukłac poruszający się względem tego pierwszego z prędkością równoległą do wspólnego kie runku E' i B'. Mamy swobodę wyboru, wystarczy więc i wygodnie jest znaleźć układ którego prędkość jest prostopadła do obu pól. Odpowiedź: v ExB 1 +v2 = E24-B2 ’ 26.5. Omówione w rozdz. 26 pola pochodzące od naładowanych cząstek poruszają cych się z jednostajną prędkością otrzymano przez przekształcenie potencjału nierucho mego ładunku do poruszającego się układu odniesienia. Pola E i B zostały następnie otrzy manę z potencjału A? w standardowy sposób. Obecnie znajdź te pola biorąc za punkt wyjścia wyrażenia na pola nieruchomegi ładunku i stosując prawa transformacyjne dla pól. 26.6. Wykaż, że pola elektryczne i magnetyczne pochodzące od ładunku poruszającegi się z jednostajną prędkością v mogą być przedstawione w postaci qt 1—u2 £ __ _2____________________ 47teor3 (1 — i?sin20)3/2 ’ q vxr l—v2 D __ ?________________________ 47te0 r3 (1—u2sin20)3/2 ’ gdzie r jest promieniem wodzącym od chwilowego położenia cząstki do obserwator; a 0 jest kątem między wektorami r i v. . 26.7. Bardzo długi prosty drut przewodzi prąd I wytworzony przez elektrony porusz; jące się z prędkością v. Istnienie w drucie stacjonarnych dodatnich jonów powoduje. ; globalna gęstość ładunku równa jest zeru. a. Znajdź pola na zewnątrz drutu w układzie nieruchomym Względem drutu. b. Przekształć te pola do układu poruszającego się razem z elektronami. [W rozdziale :
438 ZADANIA (t. II, cz. 1) pole elektryczne obserwowane z takiego poruszającego się układu zostało obli- czone inną metodą; por. równanie (13.28).] 26.8. Dwa elektrony o jednakowych prędkościach v poruszają się obok siebie, odda- lone od siebie o a. W środku między nimi znajduje się nieskończona warstwa stałego do- datniego ładunku o powierzchniowej gęstości ładunku <r. a. Jak duża musi być gęstość a, aby elektrony zacho- ~ wały odległość a? ----------b. Porównaj potrzebną gęstość ładunku w przypad- ku, gdy elektrony mają energię 500 MeV z gęstością po- ę »--------_______k. trzebną w przypadku, gdy poruszają się one z bardzo małą prędkością. 26.9. Wykaż, że jeżeli jest czterowektorem siły działającej na cząstkę, a jest czterowektorem jej prędkości, to = 0. 26.10. Cząstka o ładunku q porusza się w płaszczyźnie xy ze stałą szybkością v wzdłuż toru przedstawionego na rysunku linią przerywaną. (Cząstka rozprasza się w początku układu.) Szybkość jej przez cały czas pozostaje stała. W chwi- x y 1 p li t = Zi cząstka znajduje się w punkcie o współrzędnych \ • x = a, y = 0. 45.^ a. Punkt P ma współrzędne x = y = a. Znajdź pole elektryczne w punkcie P w chwili Ą, jeśli v/'c = 0,5 (c jest prędkością światła). b. Jak zmieni się wynik, jeżeli w części a. zadania tor cząstki przed rozproszeniem będzie biegł w dół osi y? Rozdział 27 27.1. Stosując metody użyte do wyprowadzenia wzoru (27.11) znajdź równoważne wyrażenia dla Vx(AxB), V(A-B). 27.2. Ile megaton energii zawarte jest na zewnątrz Ziemi w jej polu magnetycznym? Załóż, że pole ziemskie jest polem dipola o natężeniu $ Gs przy równiku. Jedna megatona równoważna jest energii wyzwolonej przy wybuchu jednego miliona ton trotylu czyli 4,2 1015J. W świetle swojego wyniku zastanów się, na ile, twoim zdaniem, eksplozja jednej megafonowej bomby wodorowej wysoko w atmosferze zaburzyłaby ziemskie pole magnetyczne. 27.3. Dany jest długi prosty drut o oporze R na jednostkę długości. Oblicz strumień S przy powierzchni tego drutu, gdy płynie w nim prąd I. Porównaj ten wynik z wyzwalają- cym się ciepłem, obliczonym przy użyciu prawa Ohma.
ZADANIA DO ROZDZIAŁU 27 <łjy 27.4. Długi współosiowy kabel sporządzono z dwóch doskonale przewodzących współ- osiowych walców. Jeden koniec kabla podłączono do baterii, której napięcie na wyjściu jest V, drugi zaś koniec połączono z oporem R tak, że płynie prąd I = VjR. Oblicz posłu- gując się wektorem Poyntinga szybkość przepływu energii. 27.5. Średnia moc promieniowana przez stację nadawczą wynosi 10 kW. a. Jaka jest wielkość wektora Poyntinga w punktach przy powierzchni Ziemi odległych od siebie o 10 km? W tej odległości falę można uważać za płaską. Rozsądnie jest założyć, że moc jest promieniowana przez ćwierćfalową (|A) antenę ponad doskonale przewodzącą powierzchnią. b. Znajdź maksymalne natężenia pola elektrycznego i magnetycznego. 27.6. Pola najniższych drgań typu TE prostokątnego falowodu przedstawionego na rys. 24.6 (str. 66) dane są przez wyrażenia: E = erEosin — cosfcot—k2z), j a kz k ttx B = — exE0 — sin— cos(wt—kzz)—e.E0— cos — sin (oj/ —kzz). a> a <»a a a. Wykaż, że podane powyżej rozwiązania spełniają warunki brzegowe dla tego za- gadnienia. b. Oblicz wektor Poyntinga S i gęstość energii U. c. Oblicz średnią prędkość przepływu energii przez dowolną płaszczyznę prostopadłą do osi z. d. Oblicz średnią gęstość energii w falowodzie. e. Użyj wyników otrzymanych w części c i d zadania do obliczenia średniej prędkości, z jaką propaguje się energia. Pokaż, że jest ona taka sama, jak prędkość grupowa okre- ślona wzorem (24.27) ze str. 69. 27.7. a. Znajdź szybkość przepływu energii przez jednostkę powierzchni z oscylują- cego dipola o momencie dipolowym pcosoit. Wskazówka: Weź pod uwagę wyrazy promieniste (tj. te, które maleją jak 1/r). b. Całkując po powierzchni dużej kuli, której środkiem jest dipol, wykaż że średnia moc promieniowana wynosi 1 p2 <u4 1 3 47teoc2 c 27.8. Płaska fala świetlna pada na swobodny elektron. Elektron oscyluje pod wpływem pola E. Oblicz stosunek energii promieniowanej przez elektron na jednostkę czasu do energii świetlnej padającej na jednostkę powierzchni w jednostce czasu. Załóż, że fala świetlna ma niską częstość i pomiń wpływ pola B fali na elektron. 27.9. Na cząstkę pyłu w Układzie Słonecznym działają dwie siły: siła grawitacyjni Słońca i planet i promienista siła światła skierowana od Słońca. Ze względu na to, że siła grawitacyjna jest proporcjonalna do objętości cząstki, a siła promienista jest proporcjo-
44U ZADANIA nalna do powierzchni jej przekroju poprzecznego, znajdą się cząstki o takich wymiarach, dla których te dwie siły będą się równoważyć. Przyjmując, że cząstka pyłu jest kulista i że absorbuje ona całe padające na nią promieniowanie, znajdź taki promień cząstki przy którym obie siły się równoważą. Wytłumaczenie tego, że ogon komety zwrócony jest od Słońca, opiera się na omówio- nym powyżej zjawisku, przy założeniu, że ogon składa się z małych cząstek, może nawet i molekuł gazu. Czy jest to sensowna teoria? Energia promieniowana przez Słońce wynosi 4-1026 W, a jego masa jest równa ł-1030kg. 27.10. Totus o powietrznym rdzeniu, średnim promieniu R i powierzchni przekroju w2, iwinięty jest N zwojami drutu (r << R). Prąd o zależności czasowej danej wzorem I(t) = = Kt włączony jest w chwili t = 0. a. Znajdź bezpośrednio z wyrażenia na pole magnetyczne energię nagromadzoną v polu magnetycznym w chwili t. b. Znajdź kierunek i długość wektora Poyntinga w wewnętrznym punkcie torusa / chwili t. c. Posługując się wektorem Poyntinga znajdź szybkość zmiany energii pola wewnątrz orusa w czasie t. Sprawdź swój wynik porównując z wynikiem otrzymanym w części a za- ania. ozdział 28 28.1. Oblicz promień elektronu zakładając, że jego masa spoczynkowa utożsamiona st z energią elektrostatyczną jego ładunku i że ładunek rozmieszczony jest równomiernie r objętości kuli. Porównaj wynik z wartością daną wzorem (28.2) ze str. 133. 28.2. Dobrze wiadomo, że elektron poza ładunkiem i masą ma moment pędu (spin) moment magnetyczny, przy czym stosunek tych wielkości jest równy i moment pędu m '' ' * ' moment magnetyczny q yrażenie to jest poprawne z dokładnością do około 0,1 °/0. Przyjmijmy, że masa dana jest torem (28.4). a. Niech będzie dana równomiernie naładowana powłoka o ładunku q i o promieniu a, której środku umieszczony jest dipol magnetyczny o momencie /i. Wykaż, że moment du pola elektromagnetycznego jest równy L = — qf* 1 3 47teoc2 a b. Znajdź stosunek momentu pędu do momentu magnetycznego i porównaj z pny- ;zoną powyżej wartością (rn)q).
ZADANIA DO ROZDZIAŁU 28 441 c. Jeśli moment magnetyczny elektronu dany jest jako oblicz maksymalną pręd- kość przy powierzchni wirującego elektronu, która powoduje powstanie takiego momentu magnetycznego. Jaki komentarz uznałbyś za właściwy. Wielkość 4Keoc7i/g2 = 1/a ma wartość 137. Rozdział 29 > 29.1. Naładowana cząstka (o ładunku q i o masie spoczynkowej m0) znajdowała się początkowo w spoczynku w początku układu. Działa na nią stałe pole elektryczne w kie- runku osi x. a. Oblicz prędkość i położenie jako funkcję czasu (relatywistycznie). b. Jak zmieni się Twój wynik, jeśli cząstka miała początkową prędkość v0 w kierunku osi y? 29.2. W protonowym cyklotronie protony biegną po kołowych torach w jednorodnym polu magnetycznym. Znajdź „częstość cyklotronową”, czyli prędkość kątową, jako funk- cję q, B, m przy niskich energiach. Jak zmienia się częstość przy wzroście energii. Przy ja- kiej energii częstość zmieni się o 1%. 29.3. W chwili t = 0 cząstka o masie m i o ładunku q znajdowała się w początku układu współrzędnych w spoczynku. Na cząstkę działa jednorodne pole E w kierunku osi y i jedno- rodne pole B w kierunku osi z. a. Znajdź ruch cząstki, x(l),y(l), z(l), zakładając, że jest on nierelatywistyczny. Jakie ograniczenia założenie to nakłada na pola E i B? b. Czy możesz w sposób jakościowy wskazać, jaki byłby ruch relatywistyczny? Co się dzieje, gdy E/B > c? c. Jeśli jedną płytę umieścimy w płaszczyźnie xz(y = 0), a drugą równoległą w płasz- czyźnie o równaniu y = d o potencjale Ko = Ed względem pierwszej płyty i przyłożymy pole magnetyczne równoległe do płyt, otrzymamy to, co nosi nazwę magnetronu. Gdy elektrony emitowane są z ujemnej katody głównie w spoczynku, jak silne musi być pole magnetyczne, żeby elektrony nie mogły osiągnąć dodatniej anody? 29.4. Zasadę ogniskowania przez zmienny gradient można zilustrować na przykładzie z optyki, przedstawionym na rysunku obok. Mimo że obie soczewki mają tu takie same ogniskowe, ich kombinacja może w pewnych warunkach działać skupiająco. a. Wyznacz dla równoległych promieni padającego światła odległość l jako funkcję d. b. W jakich warunkach otrzymany obraz jest rzeczy- f -f wisty, a w jakich pozorny? Rozdział 32 32.1. Wykaż, że w substancjach niepolarnych kwadrat współczynnika załamania przy niskich częstościach równy jest stałej dielektrycznej. 1
442 ZADANIA 32.2. Dla częstości około 6MHz jonosfera staje się przezroczyste. Oszacuj gęstość elektronów w jonosferze stosując model elektronów swobodnych. 32.3. Pole elektryczne przyłożone do metalu utrzymywane jest jako stałe przez dłuższy czas, po czym nagle zostaje wyłączone. Stosując model elektronowego gazu w metalu wykaż, że czas relaksacji (tj. czas potrzebny na to, by prędkość unoszenia zmalała do 1/e swojej początkowej wartości) równy jest 2 t, dwukrotnemu odstępowi czasu między zde- rzeniami. 32.4. W metalu istnieją rozwiązania równań Maxwella w postaci fali płaskiej: Ex = Eoe'(m,~kz), gdzie k jest liczbą zespoloną. Dla niskich częstości k = (l-i)l/ ... u ,f . , 2e°c a. Wypisz wyrażenie na pole magnetyczne związane z taką falą. b. Ile wynosi kąt między wektorami E i B? c. Ile wynosi stosunek szczytowej wartości pola B do szczytowej wartości pola E przy dowolnym z? d. Jaka jest różnica faz między polami E i B? [Gdy maksimum pola E występuje w czasie t2, a maksimum pola B występuje w czasie t2, różnica faz zdefiniowana jest jako G)-] 32.5. Równanie (32.50) sugeruje, że w metalu występuje całkiem wyraźne obcięcie nadfioletu (obcięcie to jest określone przez wartość co, przy której współczynnik n zmienia się z rzeczywistego w urojony). Doświadczenie tymczasem wykazuje, że obcięcie to nie jest określone wyraźnie. Stosując lepsze przybliżenie dla n2 wykaż, że doświadczalny wynik jest w istocie zgodny z teorią. Rozdział 33 33.1. a. Wyznacz współczynnik przejścia dla płaskiej fali elektromagnetycznej prze- chodzącej przez trzy ośrodki dielektryczne tak, jak pokazano na rysunku poniżej. b. Wykaż, że jeżeli n2 = i l = ź2/4, stosunek przejścia równy jest jedności. (Jest to powód, dla którego w dobrych aparatach fotograficznych i lornetkach soczew- ki pokrywa się warstwami przeciwodblaskowymi.) c. Jaka jest grubość l warstwy przeciwodblaskowej w lornetkach przeznaczonych do użytku w zwykłym bia- łym świetle? d. Gdy możliwe jest pokrycie tylko jednej strony soczewki, czy ważne jest, która strona zostanie pokryta? Dlaczego?
ZADANIA DO ROZDZIAŁU 33 443 33»2. Promień światła o długości fali 4500 A (w próżni) pada na pryzmat tak, jak pokazano na rysunku poniżej, i ulega całkowitemu odbiciu pod kątem 90°. Współczynnik załamania pryzmatu wynosi 1,6. Oblicz odległość od dłu- k giego boku pryzmatu, na której natężenie pola elektry- 45K cznego spada do 1/e wartości przy samej powierzchni. r , X. Załóż, że światło jest spolaryzowane, a pole E jest prosto- n=l,6 X. padłe do płaszczyzny padania. Czy wynik zmieni się, jeśli wektor E leży w płaszczyźnie padania? ' Rozdział 34 , 34.1. Naładowana cząstka porusza się w płaszczyźnie prostopadłej do jednorodnego pola magnetycznego B. Pokaż, że jeżeli pole B zmienia się powoli w czasie, to moment magnetyczny wytworzony przez ruch orbitalny pozostaje stały. Co rozumiemy tu przez słowo powoli? « Rozdział 35 35.1. W cyklotronie niskich energii protony obiegają pełną kołową orbitę w czasie T równym około 0,13 p.s. Doświadczenia nad protonowym jądrowym rezonansem magnetycz- nym przy użyciu protonów w tym samym polu magnetycznym wskazują na istnienie re- zonansu przy 21 MHz. Na podstawie tych danych znajdź czynnik g protonu. 35.2. Wyprowadź wzór (35.9) w sposób sugerowany w rozdz. 35. Czy możesz pogodzić to wyprowadzenie z podanym w rozdz. 34 dowodem, że paramagnetyzm nie mógłby istnieć, jeśli oprzeć się na teorii czysto klasycznej? 35.3. Sól paramagnetyczna zawiera 1022 jonów w centymetrze sześciennym. Moment magnetyczny każdego jonu jest równy 1 magnetonowi Bohra. Sól ta została umieszczona w polu jednorodnej indukcji magnetycznej B o natężeniu 10 000 Gs (1 Wb/m2). Oblicz procent nadwyżki równoległych spinów zarówno w temperaturze pokojowej, jak i w temperaturze ciekłego helu. 35.4. Wyprowadź wzór na kwantowomechaniczny paramagnetyzm cząstek o spinie 1, naśladując wyprowadzenie z rozdz. 35 dla spinu Rozdział 36 36.1. Równomiernie namagnesowana kula ma całkowity moment magnetyczny równj -i 7t(a)3Af, gdzie u jest jej promieniem, a M— namagnesowaniem. Oblicz równoważny prąd powierzchniowy, który powodowałby na zewnątrz kuh takie same skutki, jak namagneso- wana kula. Pokaż, że ten rozkład prądu ma taki sam globalny moment magnetyczny.
444 ZADANIA 36.2. Magnetyczna rama żelazna przedstawiona na rysunku lewym jest owinięta 2150 zwojami drutu, przez który płynie prąd o natężeniu 5 A. Rama ma jednostajną szerokość 28 cm w kierunku prostopa- dłym do płaszczyzny rysunku, a żelazo, z którego jest spo- • rządzona, charakteryzuje się - krzywą zależności B od H pokazaną na wykresie (rysu- nek prawy). Przeprowadź oszacowanie, jak wielkie po- le magnetyczne otrzymamy w szparze powietrznej. Jakie są główne pominięte przez Ciebie efekty? ~2 (Wb/m2) p powierzchnia przekroju mer - nesu trwałego wynosi lOOcm2 zelazo miękkie Wskazówka: Ze względu na to, że zależność B-H jest empiryczna i nieliniowa, nie bądź zdziwiony, że problemu nie będzie można rozwiązać analitycznie ani ściśle. 36.3. Strumień magnetyczny wytworzony jest w szczelinie powietrznej przy użyciu sztabki magnesu trwałego i kawałków pręta z miękkiego żelaza. Dane charakteryzujące magnes i rozmiary urządzenia zostały podane na rysunku lewym. Materiał, z którego jest sporządzony magnes, na- magnesowano do punktu P (rysunek prawy) przepuszcza- jąc prąd o dużym natężeniu przez uzwojenia cewki. Zakła- dając, że miękkie żelazo ma nieskończoną przenikalność magnetyczną i pomijając rozproszenie strumienia na krawędziach, znajdź gęstość stru- mienia w szczelinie po wyłączeniu prądu. 36.4. Bardzo długi cylindryczny pręt żelazny namagnesowany jest trwale z jednorodnym namagnesowaniem M, które skierowane jest wzdłuż osi pręta. Pomijając wszelkie efekty związane z końcami, znajdź pola B i H w żelazie. Jeśli wydrąży się wzdłuż osi długi otwór w kształcie igły, jakie będzie pole B w środku tego otworu? +0,1 H ,,u (Wb/m2) Rozdział 38 38.1. W badaniach przestrzeni kosmicznej w wielu przypadkach ważne jest, żeby używać materiałów o maksymalnym stosunku wytrzymałości do ciężaru. a. Porównaj promienie masowej aluminiowej podpory o kołowym przekroju i stalowej podpory o tej samej sztywności i tej samej długości L. (Sztywność zdefiniowana jest jako stosunek przyłożonej poprzecznej siły do wywołanego odkształcenia.) b. Jak duże w stosunku do siebie są masy tych podpór?
ZADANIA DO ROZDZIAŁU 38 445 38.2. Aluminiowa belka o długości L i o kwadrato- wym przekroju ma jeden koniec sztywno umocowany, jak pokazano na rysunku obok. Do swobodnego końca belki przymocowana jest masa m. Znajdź naturalną częstość drgań tego układu. Załóż, że belka ma kwadratowy prze- krój poprzeczny o boku a, że masa belki jest dużo mniejsza od m oraz że masa m może być uważana za masę punktową. 38.3. W rozdziale 47 tomu I (cz. 2) prędkość głosu w cieczy wyrażona została przez szybkość zmiany ciśnienia ze zmianą gęstości. Wykaż, że dla podłużnych fal w ciele sta- łym (płaskie fale zgęszczeń) prędkość fazowa dana jest wyrażeniem y2 _ (i-g)y podl (1-2n)(l+n)e ’ (Prędkość ta odnosi się do podłużnych fal w „nieskończonym” ośrodku. W tym przypadku ruch każdej cząstki jest zawsze równoległy do kierunku fali; gdy ośrodek jest ściśnięty przez falę, nie występują żadne ruchy boczne, takie jakie zdarzają się na przykład w pręcie, który gdy jest ściśnięty, staje się grubszy.) Jak wielkie, według Ciebie, muszą być wymiary bloku, żeby ten wzór miał zastosowanie. 38.4. Stalowa linijka o długości 30,48 cm o szerokości 1,27 cm i o grubości 0,08 cm została zaklinowana między dwoma blokami ustawionymi na stole w odległości 29,21 cm od siebie tak, jak pokazano na rysunku obok. a. W jakiego rodzaju krzywą wygnie się ta linijka? b. Znajdź siłę działającą na bloki. 38.5. Wyznacz obciążenie krytyczne (przy wyboczeniu) dla belki o długości L o umocowanym jednym końcu i swobodnym drugim tak, jak pokazano na rysunku obok. Belka ma prostokątny przekrój poprzeczny o grubości t i o szerokości w. r-----29.2cm—*f Rozdział 40 40.1. a. Udowodnij, dla własnego zadowolenia, twierdzenie sformułowane w rozdz. 40, że jeśli w cieczy nie może istnieć napięcie ścinające, to ciśnienie jest we wszystkich kierun- kach takie samo. b. Jako ćwiczenie matematyczne wyprowadź całkiem pożyteczną wektorową toż- samość stosowaną w rozdz. 40: (vV)v = |V(w)+(S2 x v),
446 ZADANIA gdzie *« S2 = (V x v). • 40.2. Ciecz w naczyniu o kształcie walca o kołowym przekroju poprzecznym wiruje wokół osi ze stałą prędkością kątową o. Znajdź kształt powierzchni swobodnej cieczy, gdy cząstka w odległości r od osi wiruje z prędkością v — a>r. Wykaż, jak wskazano w rozdz. 40, że krążenie na jednostkę powierzchni, czyli rotv, jest równe podwojonej prędkości kątowej, z jaką ciecz wiruje. 40.3. Kula o promieniu a i o masie m porusza się w „suchej” wodzie ze stałą pręd- kością v. Wykaż, że całkowita łączna energia kinetyczna kuli i cieczy jest równa gdzie M jest masą cieczy wypartej przez kulę. Jaki jest całkowity łączny pęd kuli i cieczy? na rysunku poniżej. Rozdział 41 41.1. Kula o promieniu a jest ciągnięta ze stałą prędkością v w lepkiej cieczy na tyle powoli, że przepływ jest laminarny; przyłożona siła jest miarą siły lepkości, z jaką ciecz działa na kulę. Mimo że jesteś w stanie obliczyć ściśle tę siłę, postaraj się znaleźć postać tej siły z analizy wymiarowej po spostrzeżeniu, od jakich parametrów powinna ona zależeć. Zrób to. Czy możesz znaleźć jakościowe argumenty fizyczne, dlaczego parametry te wcho- dzą do wzoru w ten właśnie sposób? 41.2. Gdy lepka ciecz płynie w małej rurce, przepływ można uważać za laminar- ny, tzn. warstwy cieczy w cylindrycznej rurze przepływają jedna koło drugiej. Dla rury o promieniu a profil prędkości w poprzek rury wygląda z grubsza tak, jak pokazano Wykaż, że jeśli r jest odległością w kierunku radialnym od środka rury, jeśli r] jest lepkością cieczy i jeśli istnieje spadek ciśnienia (Pt— PiUL na jednostkę długości rury, to prędkość dana jest wzorem: t>(r) = — -— -------(a2-r2). 4ij L Analogicznie jak w prawie Ohma, prędkość wypływu cieczy Q z takiej rury wiąże się z róż- nicą ciśnień AP = Pt—P2 równaniem AP = QR, gdzie R jest „oporem” rury. Znajdź opór rury o promieniu a i o długości L. Czy Twoim zdaniem definicja takiego oporu jest tylko definicją formalną, czy widzisz powody, dla których podobne analogie są użyteczne? Jaki jest odpowiednik kondensatora? V
ZADANIA DO ROZDZIAŁU 41 447 41.3. Duża, płytka taca napełniona jest częściowo wodą (nieściśliwą cieczą o lepkości Tj). Po wodzie pływa cienka płaska drewniana deska, a jej dolna powierzchnia znajduje się na wysokości d nad dnem tacy. Oba pozostałe wymiary deski są dużo większe niż d. Deska poruszana jest poziomo z małą prędkością v. Jaka jest szybkość rozpraszania energii na jednostkę objętości wody w pobliżu środka deski?
skorowidz Adiabatyczne rozmagnesowanie 277 Alnico V 322 Ampćre’a prądy 284 antyferromagnetyczne materiały 324 atomowa polaryzowalność 208 Barkhausena efekt 321 belka-dźwigar 342 Bernoulliego twierdzenie 375 Bessela funkcja 48 bezwirowy przepływ 374 bierne elementy obwodu 15 Bohra magneton 262 Bopp, F. 143 Bom, M. 142 Bragg, L. 179 Bragga i Nye’a model kryształu 179 Całkowite odbicie wewnętrzne 242 cechowania warunek 91 chemiczne ogniwo 18 ciepło właściwe 312 Clausiusa-Mossottiego równanie 215 Curie temperatura 303 czasoprzestrzeń 112 częstość — graniczna 31 — Larmora 254 — plazmowa 224 czterowektory 79 czynnik g jądrowy 251 -----Landego 250 czynne elementy obwodu 15 Dalambercjan 90 diamagnetyzm 246 Dirac, P.A.M. 142 domena 315 doświadczenie Sterna—Gerlacha 266 drobinowy kryształ 167 dyslokacja 177, 178 — poślizgowa 178 — śrubowa 178 dywergencja (czterowektora) 87 Einstein, A. 129, 405, 413, 415, 420 elektrodynamika w zapisie relatywistycz- nym 79 elektromagnetyczna masa 135 elektromagnes 296 elektronu klasyczny promień 136 elementy obwodu 40 -----bierne 15 ----- czynne 15 energia 26 — pola 115 -----dla ładunku punktowego 132 — ściany 315 energii gęstość 117 — strumień 117
SKOROWIDZ 44' energii zasada zachowania 115 ersted (jednostka) 290 Fale — odbite 236 — ścinania 339 — załamane 236 falowody 59 ferromagnetyzm 246, 282, 306 ferromagnetyczne izolatory (ferryty) 325 . Feynman, R. 143 filtry 31 Gamet 326 gaus (jednostka) 290 generator elektryczny 15 Gerlach, W. 266 gęstość wirów 374 głębokość naskórkowa 222 graniczna częstość 31 grawitacja 415 Heksagonalna komórka 174 Helmholtz, H. 383 histerezy krzywa 314 — pętla 293 Hooke’a prawo 328 hydrostatyka 368 Iloczyn skalamy 82 indukcyjność 11 — wzajemna 36 Infeld, L. 142 izolatory ferromagnetyczne (ferryty) 325 Jednoskośna komórka 174 Karmana ścieżka wirów 397 kąt precesji 251 Kirchhoffa prawa 19 klasyczny promień elektronu 136 komórka heksagonalna 174 — jednoskośna 174 — regularna 174 — rombowa 174 — tetragonalna 174 — trygonalna 174 kondensator 12, 42 Kroneckera delta 193 kryształ drobinowy 167 kryształu sieć 167 kryształów geometria 164 kryształy 164 krzywizna dodatnia 412 — średnia 414 — ujemna 412 — wewnętrzna 413 — w przestrzeni trójwymiarowy 413 kwadrupolowe soczewki 161 Lamćgo stałe sprężyste 354 Landego czynnik g 250 Larmora częstość 255 — twierdzenie 254 Lenza reguła 247 lepkość 387 lepkości współczynnik 388 liczba Reynoldsa 393 linia koncentryczna 60 — przesyłowa 59 linie prądu 376 — wiru 383 Lorentz, H. A. 79, 95 Lorentza transformacja 79 ----pól 95 — warunek 91 Ładunku ruch 151 Macha liczba 396 magnesujące pole 292 magneton Bohra 262 magnetostrykcja 315 magnetyczna podatność 274 — soczewka 155 magnetyczne momenty 249 — substancje 306 magnetyczny rezonans 264 ----jądrowy 278 magnetyzm materii 246 masa elektromagnetyczna 135 Maxwella równania 209, 428 metoda wiązek molekularnych RabiegO 268 mikroskop elektronowy 156 Minkowskiego przestrzeń 203 moduł ścinania 333 — ściśliwości 332 — Younga 330 Móss bauera zjawisko 423 „Nadwyżka promienia” 412 naprężenie 330 Neuman, J. von 372 Newtona prawa 405, 428 Nye, J. F. 179
450 w SKOROWIDZ Objętościowe naprężenie 332 — odkształcenie 332 obwodu elementy 40 — bierne 15 — czynne 15 obwody prądu zmiennego 9 — rezonansowe 56 — zastępcze 25 odbicie — całkowite wewnętrzne 242 — od metali 241 — światła 226 odkształcenia jednorodne 331 odkształcenie 330 ogniwo chemiczne 18 opornik 14 oporność pozorna 9 oporu czołowego współczynnik 396 ośrodki sprężyste 347 Paramagnetyzm 246, 264 pęd pola 127 ----poruszającego się ładunku 134 pędu spektrometr 152 — widmo 153 permaloj 323 plazmowa częstość 224 płaszczyzna hipliwości 165 pochłaniania współczynnik 217 podatność magnetyczna 274 Poincarego napięcia 137 Poissona stała 330 pola prowadzące w akceleratora# 137 — wskaźnik 158 polaryzacja metali 206 polaryzowalność atomowa 208 pole magnesujące 292 — tensorowe 202 potencjał Yukawy 150 1 Poynting, J. 118 Poyntinga wektor 122 prawa Kirchhoffa 19 — Newtona 405, 428 prawo Hooke’a 328 — powszechnego ciążenia 405 prądy Ampere’a 284 — namagnesowania 282 precesja atomowych momentów magnetycznych 251 precesji kąt 251 prostownik 34 przenikalność magnetyczna 295 przepływ bezwirowy 374 — lepki 391 — ustalony 375 — „wstęgowy” 401 przestrzeń zakrzywiona 405 przewodność 220 Rabi, I. I. 268 Rabiego metoda wiązek molekularnych 268 Rayleigha fale 339 reaktancja 27 regularna komórka 174 Reynoldsa liczba 393 rezonansowa wnęka 48 rezonansowe obwody 56 rezonator wnękowy 40 rezystancja 27 rombowa komórka 174 rozmagnesowanie adiabatyczne 277 równania einsteinowskie pola 429 — Maxwella 209, 428 równanie Clausiusa-Mossottiego 215 — einsteinowskie ruchu 429 ruch ładunku 151 — orbitalny 249 Sieć płaska 171 — trójskośna 174 siła wymienna 308 skalamy iloczyn 82 skręcanie pręta 331 skwantowane stany magnetyczne 264 Snelliusa prawo 226 soczewka elektrostatyczna 154 — magnetyczna 155 soczewki kwadrupolowe 161 spinel 325 sprężyste ośrodki 347 sprężystości stałe 354, 362 1 — tensor 351 Stern, O. 266 Stema-Gerlacha doświadczenie 266 „sucha” woda 268 „supermaloj” 295 Ścinanie 334 ścinania fale 339 — moduł 333 śrubowa dyslokacja 178 Temperatura Curie 303 tensor naprężeń 197
SKOROWIDZ 451 I" ! tensor odkształceń 202, 347 — sprężystości 351 tensorowe pole 202 tensory 106, 186 teoria einsteinowska ciążenia 428 termodynamika 312 tetragonalna komórka 174 transformacja Lorentza 79 -----pól 95 transformator 296 trygonalna komórka 174 turbulentna warstwa graniczna 399 twierdzenie Bernoulliego 375 — Larmora 254 typy drgań w rezonatorach wnękowych 53 Warunek Lorentza 91 Wheeler, J. A. 142 wnęka rezonansowa 48 wnękowe rezonatory 40 woda „mokra” 387 — „sucha” 368 współczynnik lepkości 388 — oporu czołowego 396 — pochłaniania 217 — załamania 206 Załamanie światła 206 załamania współczynnik 206 zasada równoważności 417 — zachowania energii 115 zastępcze obwody 25 zorientowany moment magnetyczny 268
Wydawnictwo Naukowe PWN SA Wydanie trzecie Arkusz) drukarskich 28.25 + I ark wkł Druk ukończono w maju 2001 r Druk i oprawa Pabianickie Zakłady Graficzne SA Zam 91/2001
DO NABYCIA WKSIĘGARNIACH F.C. Adams, G.R Laughhn Ewolucja Wszechświata S. Chandrasekhar, M. Kac, R. Smoluchowski Marian Smoluchowski. His Life and Scientific Work A. Drzewiński, A.Wojtkiewicz Opowieści z historii fizyki RJ Durka Komputer, Internet, cyfrowa rewolucja R. Penrose Nowy umyst cesarza. O komputerach, umyśle i prawach fizyki I Stewart Czy Bóg gra w kości? Nowa matematyka chaosu C. Suplee Fizyka XX wieku Książki PWN są do nabycia w księgarniach własnych PWN: Warszawa, ul Miodowa 10, tel (22) 635 80 88, Gdańsk, ul Korzenna 33/35, tel (58) 305 24 50, Katowice, al Korfantego 51, tel (32) 58 32 26, Kraków, ul Sw Tomasza 30, tel (12) 421 75 64, Łodz ul Więckowskiego 13, tel (42) 630 67 69, Poznań, ul Wodna 8/9, tel (61) 85174 94, Wrocław, ul Kuzmcza 56, tel (71) 343 54 52 Zamówienia telefoniczne i pisemne przyjmuje Dział Dystrybucji Wysyłkowej i Prenumerat, ul Miodowa 10, 00-251 Warszawa, infolinia 0-801 351 929, fax 69 54 179 Zapraszamy do księgarni PWN w Internecie www.pwn.com.pl