Автор: Feynman R.P.   Leighton R.B.   Sands M.  

Теги: optyka   fizyka   nauki przyrodnicze   termodynamika  

ISBN: 83-01-01-13484-4

Год: 2001

Текст
                    R.P. FEYHMAN, R.B.IEIGHION, M.SANDS
I I
wykłady z fizyki
Optyka
Termodynamika
Fale
WjlawnittND Naukowe PWN


liichard Feynman Iwo Biatymcki-Bimla \ c\a Teorie .s.atyw^.yjzne ' graw'.acja. Warszawa 1962
RJ. FEYNMAN, R.B.IEIGHTON, M.SANDS Feynmana ^ wykłady z fizyki TDM 1.2 Optyka Termodynamika Fale ./arszav.a 2001 .z PWN J „ 4-. .-. h I „ I
Dane oryginału Richard P. Feynman, Robert B. Leighton, Matthew Sands The Feynman Lectures on Physics, vol.1 Copyright © 1963, California Institute of Technology All rights reserved Commemorative issue published by arrangement with the original publisher, Addison Wesley Longman, a Pearson Education Company Przekład z języka angielskiego Andrzej Jurewicz (rozdziały 26-36) Marek Grynberg (rozdziały 37-52) Mirosław Kozłowski (rozdziały 39-51) Teresa Butler (zadania) Redakcja naukowa Stanisław Bażański Projekt okładki i stron tytułowych Joanna Sobieraj Copyright O for the Polish edition By Państwowe Wydawnictwo Naukowe Warszawa 1968 Copyright O for the Polish edition by Wydawnictwo Naukowe PWN SA Warszawa 2001 Wydawnictwo Naukowe PWN SA ul. Miodowa 10,00-251 Warszawa teł.: 69 54 321, e-mail: pwn(g pwn.com.pl www.pwn.com.pl ISBN 83-01-01-13484-4 t.1-3 ISBN 83-01-13486-0 t.1.2 Wydawnictwo Naukowe PWN SA Wydanie czwarte Arkuszy drukarskich 27.0 Druk ukończono w marcu 2001 r. Druk i oprawa: Pabianickie Zakłady Graficzne SA Zam. 68/2001
spis rzeczy Rozdział 26. Optyka. Zasada najkratszega czasu . . 11 26-1. Światło ... . 11 26-2. Odbicie i załamanie . . 13 26-3. Zasada Fermata najkrótszego czasu . 14 26-4. Zastosowanie zasady Fermata . . 17 26-5. Dokładniejsze sformułowanie zasady Fermata . 22 26-6. Jak to się wszystko odbywa naprawdę? . . 23 Rozdział 27. Optyka geometryczna . 25 27-1. Wstęp . . 25 27-2. Odległość ogniskowa powierzchni kulistej 26 27-3. Odległość ogniskowa soczewki 30 27-4. Powiększanie . 32 27-5. Soczewki złożone . 33 27-6. Aberracje j . 35 27-7. Zdolność rozdzielcza ... 36 Rozdział 28. Promieniowanie tlektromagnetyczne . . . 38 28-1. Elektromagnetyzm 38 28-2. Promieniowanie 42 28-3. Dipol promieniujący 43 28-4. Interferencja 45 Rozdział 29. Interferencja ... . 47 29-1. Fale elektromagnetyczne . 47 29-2. Energia promieniowania 49 29-3. Fale sinusoidalne . . . 50 29-4. Dwa dipole promieniujące .... 51 29-5. Matematyczne ujęcie interferencji 55
SPIS Rozdział 30. Dyfrakcja ... 59 30-1. Wypadkowa amplituda promieniowania n jednakowych oscylatorów 59 30-2. Siatka dyfrakcyjna 63 30-3. Zdolność rozdzielcza siatki 67 30-4. Antena paraboliczna . . 68 30-5. Warstewki barwne; kryształy ... 69 30-6. Ugięcie na nieprzezroczystych ekranach . . 70 30-7 Pole pochodzące od płaszczyzny drgających ładunków 73 Rozdział 31. Skąd się bierze współczynnik załamania . 77 31-1. Współczynnik załamania 77 31-2. Pole pochodzące od ośrodka materialnego . 82 31-3. Dyspersja ... . 84 31-4. Pochłanianie (absorpcja) ... 88 31-5. Energia niesiona przez falę elektryczną 89 31-6. Ugięcie światła na ekranie 90 Rozdział 32. Tłumienie pramieniawania. Rozpraszanie światła .... 93 32-1. Opór promieniowania 93 32-2. Szybkość wypromieniowywania energii 95 32-3. Tłumienie promieniowania 97 32-4. Niezależne źródła 98 32-5. Rozpraszanie światła 100 Rozdział 33. Polaryzacja ... . . . 106 33-1. Elektryczny wektor światła 106 33-2. Polaryzacja światła rozproszonego . 108 33-3. Dwójłomnośc 109 33-4. Polaryzatory . . 111 33-5. Aktywność optyczna 113 33-6. Natężenie światła odbitego 114 33-7. Anomalne załamanie 117 Rozdział 34. Relatywistyczne efekty w promieniowaniu . . 120 34-1. Ruchome źródła . . 120 34-2. Znajdowanie ruchu „pozornego" . 122 34-3. Promieniowanie synchrotronowe 124 34-4. Kosmiczne promieniowanie synchrotronowe 128 34-5. Promieniowanie hamowania . 129 34-6. Zjawisko Dopplera 130 34-7. Czterowektor k, co 133 34-8. Aberracja 135 34-9. Pęd światła . 136 Rozdział 35. Widzenie barwne . 138 35-1. Oko ludzkie ... 138 35-2. Barwa zależy od natężenia światła 140 35-3. Mierzenie wrażenia barwnego 142 35-4. Wykres barwności . ... 146 35-5. Mechanizm widzenia barwnego 148 35-6. Fizjochemia widzenia barwnego 150
Rozdział 36. Mechanizm widzenia 153 36-1. Wrażenie barwy 153 36-2. Fizjologia oka ... . . 156 36-3. Komórki pręcikowe 160 36-4. Oko złożone (owadzie) 162 36-5. Jeszcze inny rodzaj oczu . . 165 36-6. Neurologia widzenia ... '66 Rozdział 37. Efekty kwantowe .172 37-1. Mechanika atomowa . . 172 37-2. Doświadczenie z pociskami . . . . 173 37-3. Doświadczenie z falami ..... 175 37-4. Doświadczenie z elektronami . 177 37-5. Interferencja fal elektronowych .... 179 37-6. Obserwacja elektronów . 181 37-7. Podstawowe zasady mechaniki kwantowej . . 185 37-8. Zasada nieoznaczoności . . 187 Rozdział 38. Porównanie dwóch punktów widzenia: falowego i korpuskularnego 189 38-1. Falowe amplitudy prawdopodobieństwa 189 38-2. Pomiar położenia i pędu . . '90 38-3. Dyfrakcja na kryształach 194 38-4. Rozmiary atomu . '96 38-5. Poziomy energetyczne . . • '98 38-6. Konsekwencje filozoficzne 200 Rozdział 39. Kinetyczna teoria gazów . 203 39-1. Własności materii . . 203 39-2. Ciśnienie gazu ..... . 205 39-3. Ściśliwość promieniowania . . 209 39-4. Temperatura i energia kinetyczna 210 39-5. Prawo gazu doskonałego 215 Rozdział 40. Zasady mechaniki statystycznej . 218 40-1. Wzór barometryczny ... 218 40-2. Prawo Boltzmanna 220 40-3. Parowanie cieczy 221 40-4. Rozkład prędkości cząsteczkowych . . 223 40-5. Ciepła właściwe gazów .... 227 40-6. Załamanie się fizyki klasycznej 230 Rozdział 41. Ruchy Browna 233 41-1. Ekwipartycja energii 233 42-2. Termodynamiczna równowaga promieniowania 237 41-3. Ekwipartycja i oscylator kwantowy 341 41-4. Błądzenie przypadkowe 244 Rozdział 42. Zastosowania teorii kinetycznej 248 42-1. Parowanie . 248 42-2. Termoemisja . 252 42-3. Jonizacja termiczna 253
8 SPIS RZECZY 42-4. Kinetyka reakcji chemicznych . .... ... 256 42-5. Prawa promieniowania Einsteina .... 258 Rozdział 43. Dyfuzja . . . . . 262 43-1. Zderzenia między cząsteczkami . . 262 43-2. Średnia droga swobodna . . .... 265 43-3. Szybkość unoszenia 267 43-4. Przewodnictwo jonowe 270 43-5. Dyfuzja cząsteczkowa 271 43-6. Przewodnictwo cieplne . . . 274 Rozdział 44. Zasady termodynamiki . 276 44-1. Silniki cieplne, pierwsza zasada ... . . 276 44-2. Druga zasada . 279 44-3. Silniki odwracalne ... 281 44-4. Sprawność silnika idealnego 285 44-5. Termodynamiczna skala temperatur .... . . 288 44-6. Entropia ... 290 Rozdział 45. Zastosowania termodynamiki . . 295 45-1. Energia wewnętrzna . . 295 45-2. Zastosowania .... 299 45-3. Równanie Clausiusa-Clapeyrona ... . 302 Rozdział 46. Mechanizm zapadkowy . . . . 307 46-1. Jak pracuje zębatka . 307 46-2. Zębatka w roli silnika . . 309 46-3. Odwracalność w mechanice . . 312 46-4. Nieodwracalność . . ... 313 46-5. Porządek i entropia . 315 Rozdział 47. Dźwięk. Równanie falowe . . . 319 47-1. Fale .... . . . 319 47-2. Rozchodzenie się dźwięku . . 322 47-3. Równanie falowe 323 47-4. Rozwiązania równania falowego . 326 47-5. Szybkość dźwięku . 328 Rozdział 48. Dudnienia . . 330 48-1. Dodawanie dwóch fal ... 330 48-2. Dudnienia i modulacja . 333 48-3. Pasma boczne 334 48-4. Zlokalizowane paczki falowe . 336 48-5. Amplitudy prawdopodobieństw dla cząstek 339 48-6. Fale trójwymiarowe . . 341 48-7. Drgania własne 342 Rozdział 49. Fale stające ... . . . 345 49-1. Odbicie fal ... 345 49-2. Fale stojące i częstości własne 347 49-3. Dwuwymiarowe fale stojące 349
SPIS RZECZY 49-4. Wahadła sprzężone . . 353 49-5. Układy liniowe 354 Rozdział 50. Składowe harmoniczne 356 50-1. Tony muzyczne 356 50-2. Szeregi Fouriera 358 50-3. Barwa i harmonia 360 50-4. Współczynniki Fouriera 362 50-5. Twierdzenie o energii 366 50-6. Zjawiska nieliniowe 367 Rozdział 51. Fale 370 51-1. Fale czołowe 370 51-2. Fale uderzeniowe 372 51-3. Fale w ciałach stałych 375 51-4. Fale powierzchniowe 379 Rozdział 52. Symetria praw fizyki 384 52-1. Operacje symetrii 384 52-2. Symetria czasu i przestrzeni . 385 52-3. Symetria a zasady zachowania . 388 52-4. Odbicia zwierciadlane . 389 52-5. Wektory i pseudowektory . 392 52-6. Która ręka jest prawa? . 394 52-7. Parzystość nie jest zachowana! . 395 52-8. Antymateria ... 398 52.9. Naruszone symetrie 399 Zadania . . 401 Odpowiedzi do zadań 425 Skorowidz 429
26 optyka: zasada najkrótszego czasu 26-1. Światło Oto pierwszy z cyklu rozdziałów poświęconych promieniowaniu elektromagnetycznemu. Światło widzialne stanowi tylko małą część rozległego widma fal podobnych do światła, przy czym rozmaite części tego widma charakteryzują się różnymi wartościami pewnej zmiennej wielkości, którą można nazwać „długością fali". W miarę tego jak zmienia się ona w zakresie fal widzialnych, światło w sposób widoczny zmienia barwę od czerwieni do fioletu. Chcąc zaś systematycznie badać całe widmo, poczynając od fal o dużych długościach w stronę fal o długościach coraz to mniejszych, powinniśmy zacząć od fal nazywanych zwykle falami radiowymi. W technice fale radiowe otrzymuje się w szerokim zakresie długości fali. Mogą być one nawet dłuższe od fal używanych do stałych transmisji radiowych; w regularnych programach korzystamy z fal o długości około 500 m. Po nich następują tak zwane „fale krótkie" (tzn. fale radarowe), fale milimetrowe i tak dalej. Między kolejnymi zakresami długości fali nie ma właściwie żadnych granic, ponieważ przyroda nie zna ostrych odgraniczeń. Wszelka liczbowa charakterystyka związana z daną nazwą fal jest tylko orientacyjna, podobnie jak i same nazwy nadawane poszczególnym zakresom. Dalej, po długiej drodze przez fale milimetrowe dochodzimy wreszcie do obszaru fal zwanego podczerwienią, a jeszcze dalej — do widma widzialnego. Przeszedłszy na drugi jego kraniec dochodzimy do obszaru zwanego nadfioletem. Tam, gdzie się kończy nadfiolet, zaczyna się obszar promieniowania rentgenowskiego, ale nie możemy dokładnie określić miejsca, w którym to następuje: dzieje się to przy około 10~8 m czyli 10 ~2 u. Jest to obszar „miękkich" promieni rentgenowskich, po nich następuje obszar promieni rentgenowskich zwykłych i wreszcie promieni bardzo twardych; dalej mamy obszar promieni y, które się rozciągają w obszar coraz to mniejszych wartości długości fal.
12 26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU W tym ogromnym zakresie długości fal istnieją co najmniej trzy zakresy szczególnie ciekawe ze względu na dokonywane w nich przybliżenia. W jednym z nich spełniony jest warunek, który mówi, że długości fal są bardzo małe w porównaniu z rozmiarami urządzeń służących do ich badania, a ponadto energie fotonów (w języku teorii kwantów) są małe w porównaniu z czułością energetyczną przyrządu. Gdy warunki te są spełnione, możemy dokonać pierwszego przybliżenia zwanego optyką geometryczną. Jeżeli zaś długości fal są porównywalne z rozmiarami przyrządów, co trudno osiągnąć w przypadku światła, ale łatwiej w przypadku fal radiowych, i jeżeli energię fotonu nadal można pominąć, bardzo użyteczne przybliżenie polega na uwzględnieniu charakteru falowego i pominięciu mechaniki kwantowej. Metoda ta oparta jest na klasycznej teorii promieniowania elektromagnetycznego, którą omówimy w jednym z dalszych rozdziałów. Gdy przejdziemy dalej, do fal o bardzo małej długości, których charakter falowy możemy pominąć, ale których fotony mają bardzo dużą energię w porównaniu z czułością naszego przyrządu, sprawy znowu staną się proste. Będziemy mieli prosty obraz fotonowy, którym zajmiemy się tylko pobieżnie. Pełnego jednak obrazu, łączącego wszystkie te zjawiska w jednym modelu, długo jeszcze nie będziemy mieli. W rozdziale tym ograniczymy się do omówienia obszaru fal, w którym możemy stosować prawa optyki geometrycznej. Zapominamy więc teraz o długości fali i o fotonowym charakterze światła, do spraw tych wrócimy jednak we właściwym czasie. Nie zastanawiamy się więc teraz wcale nad tym, czym jest światło, ale po prostu badamy jak ono się zachowuje w skali dużej w porównaniu z jego długością fali. Wszystko to mówimy, aby podkreślić, że będziemy rozważać tylko bardzo grube przybliżenie. Metoda podana w tym rozdziale jest jedną z tych, których potem będziemy musieli się „oduczać". Oduczenie to nastąpi jednak bardzo szybko, ponieważ prawie zaraz przejdziemy do bardziej dokładnej metody. Optyka geometryczna, mimo że jest tylko przybliżeniem, ma bardzo duże znaczenie praktyczne, a przy tym jest ogromnie ciekawa ze względów historycznych. Temat ten ujmiemy więc może bardziej od strony historycznej niż inne, aby dać pojęcie o rozwoju teorii lub idei fizycznej. Zacznijmy od stwierdzenia, że światło jest oczywiście dobrze wszystkim znane i to od niepamiętnych czasów. Pojawia się jednak od razu pytanie: w wyniku jakiego procesu w ogóle widzimy światło? Teorii wyjaśniających było wiele, ale ostatecznie ustaliła się jedna, według której w procesie widzenia uczestniczy coś, co wychodzi z przedmiotów i wchodzi do oka. Z poglądem tym jesteśmy oswojeni od tak dawna, że wprost nie możemy sobie wyobrazić, jak niektórzy bardzo inteligentni ludzie mogli proponować teorie przeciwstawne, według których na przykład coś wychodzi z oka i „wymacuje" przedmiot. Pewne inne ważne spostrzeżenia pozwalają nam stwierdzić, że światło przechodząc z jednego miejsca do drugiego rozchodzi się po liniach prostych, gdy mu nic nie stoi na drodze, i że promienie świetlne, jak się zdaje, nie przeszkadzają sobie wzajemnie. Znaczy to, że światło porusza się wprawdzie w przestrzeni tam i sam we wszystkich kierunkach, ale światło, przechodzące w poprzek naszej linii wzroku, nie wpływa na światło, przychodzące do nas od jakiegoś przedmiotu. Był to kiedyś jeden z najpotężniejszych argumentów przeciwko teorii korpu- skularnej; posługiwał się nim Huygens. Gdyby światło było pękiem lecących strzał,
26-1. ŚWIATŁO 13 jakże mogłyby z taką łatwością przechodzić przezeń inne strzały? Takie filozoficzne argumenty nie mają jednak wielkiego znaczenia. Zawsze może się znaleźć ktoś, kto powie, że światło jest zrobione ze specjalnych strzał, które wzajemnie przenikają przez siebie! 26-2. Odbicie i załamanie Powyższe rozważania dają wystarczające wyobrażenie o podstawowej idei optyki geometrycznej — czas teraz na pogłębienie jej związków ilościowych. Dotąd rozważaliśmy światło rozchodzące się po liniaeh prostych między dwoma punktami; zbadajmy teraz jak zachowuje się światło, gdy natrafia na różne ośrodki materialne. Najprostszym takim przedmiotem jest zwierciadło. Obowiązuje dla niego prawo mówiące, że gdy światło pada na zwierciadło, nie biegnie dalej po linii prostej, ale odbija się po nowej linii prostej, która się zmienia, gdy zmieniamy nachylenie zwierciadła. W starożytności stawiano sobie pytanie: jaki związek zachodzi między dwoma wchodzącymi tu w grę kątami? Związek ten jest bardzo prosty i dawno go już odkryto. Światło padając na zwierciadło biegnie tak, że kąty między każdą z wiązek a zwierciadłem są sobie równe. Z pewnych powodów przyjęto mierzyć kąty względem normalnej do powierzchni zwierciadła. Wobec tego tak zwane prawo odbicia brzmi: 0p.d=0o (26.1) (rys. 26.1). Tutaj sprawa jest dość prosta, ale problem staje się trudniejszy, gdy światło przechodzi z jednego ośrodka do drugiego, na przykład z powietrza do wody; widzimy, że i wtedy nie biegnie ono po tej samej linii prostej. Pro-- mień w wodzie jest nachylony względem kierunku swojego rozchodzenia się w powietrzu (rys. 26.2). Jeśli dobieramy kąt 6 tak, aby promień padał prawie pionowo w stosunku do powierzchni wody, kąt „załamania" jest bardzo niewielki. Jeżeli jednak zmienimy nachylenie wiązki światła o spory kąt, kąt odchylenia staje się bardzo duży. Powstaje pytanie: jaki jest związek między jednym kątem a drugim? Również nad tą sprawą przez długi czas zastanawiali się starożytni, w tym jednak wypadku nigdy nie udało im się znaleźć odpowiedzi! Jest to jednak jedno z niewielu zagadnień całej greckiej fizyki, dla którego można znaleźć zestawienie pewnych wyników doświadczalnych. Klaudiusz Ptolemeusz sporządził wykaz kątów w wodzie, odpowiadających kilku różnym kątom w powietrzu. Tabela 26.1 podaje wartości kątów w powietrzu (mierzone w stopniach) i odpowiednie kąty zmierzone w wodzie. (Mówi się zwykle, że uczeni greccy nigdy nie przeprowadzali 26.1. Kąt padania jest równy kątowi odbicia 26.2. Promień świetlny załamuje się, gdy przechodzi z jednego ośrodka do drugiego Ppad- "zat\
14 26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU Tabela 26.1 Tabela 26.2 Kąt w wodzie 10 20 30° 40° 50° 60 70° 80c Kąt w powietrzu 8° 15ł° 22ł 28° 35° 40JC 45° 50° Kąt w wodzie 10° 20° 30" 40° 50° 60° 70' 80° Kąt w powietrzu 7i° 15° 22° 29° 35° 40° 48° 49ł° doświadczeń. Ale nie znając właściwego prawa nie mogliby bez doświadczeń otrzymać tej tabeli wartości. Należy jednak zauważyć, że wartości te nie stanowią starannych, niezależnych pomiarów dla każdego kąta z osobna. Są one liczbami interpolowanymi z kilku tylko pomiarów. Sądzimy tak dlatego, że leżą doskonale na paraboli.) Na tym właśnie polega jeden z ważnych kroków w rozwoju prawa fizycznego: najpierw obserwujemy jakieś zjawisko, potem dokonujemy pomiarów i wyniki zestawiamy w tabeli; wreszcie próbujemy znaleźć regułę, za pomocą której można kilka rzeczy wzajemnie powiązać. Wspomnianą tabelę liczbową ułożonowroku 140,ale dopiero w roku 1621 znaleziono wreszcie regułę wiążącą ze sobą owe dwa kąty! Reguła znaleziona przez holenderskiego matematyka Willebrorda Snella brzmi następująco: jeżeli 0pad jest katem w powietrzu, a 0zał — kątem w wodzie, to sinus kąta 0pad jest równy pewnej stałej pomnożonej przez sinus kąta 0zal: sin0pad = nsin0Ml. (26.2) Dla wody liczba n wynosi w przybliżeniu 1,33. Równanie (26.2) nazywamy prawem Snella. Pozwala nam ono przewidzieć, jak się światło zakrzywi przechodząc z powietrza do wody. W tabeli 26.2 zestawiono kąty w powietrzu i w wodzie według prawa Snella. Zauważmy wyjątkową zgodność tej tabeli z wykazem Ptolemeusza. 26-3. Zasada Fermata najkrótszego czasu W miarę dalszego rozwoju nauki szukamy czegoś więcej niż wzoru. Najpierw obserwujemy, potem otrzymujemy liczby będące wynikami pomiarów, wreszcie dochodzimy do prawa, łączącego w sobie wszystkie te liczby. Ale prawdziwa chluba nauki polega na tym, że możemy znaleźć taki sposób podejścia, w którego wyniku prawo staje się oczywiste. Sposób podejścia, dzięki któremu prawo zachowania się światła stało się oczywiste, został odkryty przez Fermata około roku 1650 i nazywa się go zasadą najkrótszego czasu albo zasadą Fermata. Pomysł Fermata wiąże się z obserwacją, że światło spośród wszystkich możliwych torów łączących dwa punkty wybiera ten, którego przebycie wymaga najkrótszego czasu.
26-3. ZASADA FERMATA NAJKRÓTSZEGO CZASU 1! %c — — ~ "~Ź? lfv -*■ S n X. -->- >^ i \ \ .. -'-' S \ X. ^^ ./^ iN >ć' X M l^K^S 5 r^ ćsn ^ N -« x ^ V >. \ "">> r s\ .8 M F •yB Pokażemy najpierw, że jest to prawda w przypadku odbicia od zwierciadła, że ta prosta zasada obejmuje zarówno prawo prostoliniowego rozchodzenia się światła, jak i prawo odbicia od zwierciadła. Rozszerzymy w ten sposób nasz zakres rozumienia zjawisk! Spróbujmy znaleźć rozwiązanie następującego zagadnienia. Na rysunku 26.3 pokazano dwa punkty, A i B, oraz płaskie zwierciadło MM'. Po jakiej drodze można się dostać z punktu A do B w najkrótszym czasie? Odpowiedź brzmi: idąc prosto 26.3. Objaśnienie zasady najkrótszego od punktu A do 8! Odpowiedź nie jest jednak już taka czasu łatwa, jeśli dołączymy dodatkowy warunek, że światło ma w najkrótszym czasie paść na zwierciadło i wrócić. Jeden z wyborów drogi mógłby polegać na jak najszybszym pobiegnięciu do zwierciadła, a stamtąd do punktu B po drodze A DB. Do przebycia pozostanie wtedy długa droga DB. Jeśli przesuniemy się nieco w prawo, do punktu E, zwiększymy wprawdzie trochę pierwszą odległość, ale znacznie zmniejszymy drugą, skrócimy więc całkowitą długość toru i dzięki temu czas przelotu stanie się krótszy. W jaki sposób możemy znaleźć punkt C, dla którego czas ten będzie najkrótszy? Możemy posłużyć się bardzo pomysłowym chwytem geometrycznym. Po przeciwnej stronie płaszczyzny MM' umieszczamy fikcyjny punkt B', który leży pod płaszczyzną MM' w takiej samej odległości od niej jak punkt B. Rysujemy z kolei linię EB'. Ponieważ kąt BFM jest kątem prostym i BF=FB', więc EB jest równe EB'. Wobec tego suma dwu odległości AE+EB', która z kolei jest proporcjonalna do czasu przelotu światła poruszającego się ze stałą prędkością, jest równa sumie AE+EB. Zagadnienie sprowadza się więc do następującego pytania: kiedy suma tych dwu długości jest najmniejsza? Odpowiedź jest prosta: wtedy, gdy linia przechodząca przez punkt C jest linią prostą łączącą punkty A i B'\ Musimy, innymi słowy, znaleźć punkt, przez który przechodzi prosta do punktu fikcyjnego i on właśnie będzie punktem szukanym. Jeśli ACB' będzie linią prostą, kąt BCFbędzie równy kątowi B'CF, a stąd kątowi ACM. Wobec tego równość kąta padania i kąta odbicia jest równoważna stwierdzeniu, że światło biegnie do zwierciadła tak, aby przybyć do punktu B' w możliwie najkrótszym czasie. Twierdzenie pierwotnie wypowiedziane przez Herona z Aleksandrii mówiło, że światło od jednego punktu do drugiego porusza się po takim torze, że biegnie do zwierciadła, a następnie do tego drugiego punktu po możliwie najkrótszej drodze. Nie mówi ono więc dokładnie tego, co współczesna teoria. Ale to właśnie twierdzenie podsunęło Fermatowi myśl, że może i proces załamania światła odbywa się według podobnych zasad. Ponieważ zaś przy załamaniu światło oczywiście nie wybiera drogi zgodnie z najkrótszą odległością, Fermat wpadł na pomysł, że światło biegnie po drodze wymagającej najkrótszego czasu. Zanim przejdziemy do rozpatrywania zjawiska załamania światła, zróbmy jeszcze jedną uwagę tyczącą się zwierciadła. Niech w punkcie B znajduje się źródło wysyłające światło w kierunku zwierciadła. Światło biegnąco od punktu B do .4/zachowuje się zupełnie tak, jak gdyby nie było żadnego zwierciadła, a źródło znajdowało się w punkcie B'. Oko wykrywa naturalnie tylko to światło, które fizycznie do niego wchodzi; jeżeli więc przedmiot znaj-
16 26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU duje się w punkcie B, a zwierciadło powoduje, że światło dochodzi do oka dokładnie tak, jak gdyby znajdował się on w punkcie B', układ oko-mózg (przy założeniu, że nie wie zbyt wiele) interpretuje całe zjawisko jako obecność przedmiotu w punkcie B'. Tak więc złudzenie, że przedmiot znajduje się za zwierciadłem, polega po prostu na tym, że światło przychodzące do oka fizycznie wchodzi do niego tak, jak gdyby przedmiot rzeczywiście znajdował się z drugiej strony zwierciadła (nie biorąc pod uwagę zanieczyszczeń szkła i tego, że mamy świadomość obecności przedmiotu oraz tym podobnych poprawek wprowadzanych przez mózg). Pokażmy teraz, że z zasady najkrótszego czasu wynika prawo załamania Snella. Musimy jednak założyć coś o prędkości światła w wodzie. Otóż założymy, że prędkość światła w wodzie jest o pewien czynnik n mniejsza od prędkości światła w powietrzu. Nasz problem, przedstawiony na rys. 26.4, polega znowu na przejściu od punktu A do B w najkrótszym czasie. Dla zobrazowania, że poiuszanie się zwyczajnie wzdłuż prostej nie jest najlepszym wyjściem, wyobraźmy sobie następującą sytuację: z łodzi wypadła piękna dziewczyna i znajdując się w wodzie w punkcie B woła o pomoc. Niech oś X stanowi linię brzegu. Znajdujemy się na lądzie w punkcie A, widzimy wypadek i na pomoc możemy zarówno biec, jak i płynąć. Ale biec możemy szybciej niż płynąć. Co robimy? Czy biegniemy po linii prostej? (Niewątpliwie tak!) Jednakże po zastanowieniu się stwierdzimy, że lepiej będzie przebyć nieco dłuższą drogę po lądzie, aby skrócić sobie drogę w wodzie, ponieważ w wodzie poruszać się będziemy o wiele wolniej. (Rozumując w ten sposób doszlibyśmy do wniosku, że lepiej byłoby najpierw dokładnie obliczyć drogę, jaką mamy do przebycia!) Spróbujmy w każdym razie pokazać, że rozwiązaniem zagadnienia jest tor ACB i że czas jego przebycia jest najkrótszy ze wszystkich możliwych. Jeżeli ma to być najszybsza droga, to każda inna droga będzie od niej wolniejsza. Wykreślając zużyty czas w zależności od położenia punktu ^(przecięcia się drogi z osią X), otrzymamy krzywą podobną do pokazanej na rys. 26.5, na którym punkt C odpowiada najkrótszemu możliwemu czasowi. Znaczy to, że gdy przesuwamy punkt X w pobliżu punktu C, w pierwszym przybliżeniu nie powodujemy istotnych zmian w czasie, ponieważ w najniższym punkcie krzywej jej nachylenie wynosi zero. Nasza metoda poszukiwania matematycznej postaci prawa załamania będzie zatem polegała na 26.4. Objaśnienie zasady Fermata dla załamania 26.5. Czas minimalny odpowiada punktowi C, ale pobliskie punkty odpowiadają prawie takiemu samemu czasowi fj,
ZASADA FERMATA NAJKRÓTSZEGO CZASU 17 rozważaniu tak niewielkich przesunięć punktu, dla których nie następuje istotna zmiana czasie. (Będzie istniała tu naturalnie nieskończenie mała zmiana drugiego rzędu; następuje bowiem wzrost czasu dla dowolnych przesunięć od punktu C.) Rozważmy więc pobliski punkt X i obliczmy, jak długo będzie trwała droga od punktu A do B po dwu torach, co pozwoli na porównanie nowego toru z dawnym. Bardzo łatwo to zrobić. Chcemy oczywiście, aby różnica wynosiła prawie zero, gdy odległość XA będzie mała. Spójrzmy najpierw na drogę po lądzie. Prowadząc prostopadłą XE zauważamy, że droga po lądzie ulega skróceniu w przybliżeniu o wielkość EC. Stanowi to nasz zysk, że nie potrzebujemy pokonywać tej dodatkowej odległości. Przeprowadzając z drugiej strony odpowiednią prostopadłą CF znajdujemy, że w wodzie mamy do przebycia dodatkową odległość XF, wskutek czego tracimy czas. Zastanówmy się nad czasem przejścia. Zyskujemy czas, jaki by zabrało przebycie odległości EC, ale tracimy czas na przebycie odległości XF. Czasy te powinny być sobie równe, ponieważ w pierwszym przybliżeniu czas przejścia nie może ulec zmianie. Zakładając, że w wodzie szybkość wynosi I/h szybkości w powietrzu, musimy mieć EC = nXF. (26v3) Widzimy więc, że biorąc właściwy punkt otrzymujemy XC sin fc EXC=n- XC sin fc XCF czyli, skracając obie strony tej równości przez wspólną przeciwprostokątną XC i zauważając, że * EXC = * ECN = 0p,d oraz *XCF=% BCN' = 6>ial, mamy sin0pad = nsin0Ml. (26.4) Tak więc widać, że aby przejść w najkrótszym czasie od jednego punktu do drugiego, gdy stosunek prędkości wynosi n, światło powinno wchodzić pod takim kątem, aby stosunek sinusów kątów #pad i #al był równy stosunkowi prędkości w dwu ośrodkach. 26-4. Zastosowanie zasady Fermata Rozważmy teraz pewne ciekawe konsekwencje wynikające z zasady najkrótszego czasu. Pierwsza z nich — to zasada wzajemności. Mówi ona, że jeżeli najkrótszy czas Przejścia od punktu A do B jest osiągany na pewnym torze, to również na nim osiągany jest najkrótszy czas przejścia w kierunku przeciwnym (przy założeniu że światło porusza Sl? w każdym kierunku z tą samą szybkością). Jeśli zatem światło rozchodzi się w jednym Kierunku, to może się także rozchodzić w kierunku przeciwnym. Drugą ciekawą konsekwencją są zjawiska zachodzące w szklanym bloku o płaskich ownoległych ścianach, ustawionym pod kątem do padającej wiązki światła. Światło Iegnąc przez blok od punktu A do punktu B (rys. 26.6) nie przechodzi po linii prostej, e ^raca sobie czas drogi zmniejszając kąt nachylenia przy przejściu przez blok, mimo wskutek tego nieco traci na drodze w powietrzu. W wyniku wiązka zostaje po prostu esunięta równolegle względem początkowego kierunku, ponieważ kąty wyjścia i wejścia ** fckie same.
18 26 OPTYKA: ZASADA NAJKRÓTSZEGO CZASU B' 6 26.6. Wiązka światła zostaje przesunięta przy przejściu przez przezroczysty blok. do Słońca pozornego tor światła Trzecią ciekawą konsekwencją jest fakt, że gdy oglądamy zachodzące słońce, w rzeczywistości znajduje się ono już pod horyzontem! To tylko nam się wydaje, że jeszcze znajduje się ono nad horyzontem, ale naprawdę jest inaczej (rys. 26.7). Atmosfera ziemska jest rzadka w górnych warstwach, a gęsta w dolnych. Światło rozchodzi się w powietrzu wolniej niż w próżni i w ten sposób światło słoneczne szybciej może osiągnąć punkt 5 za horyzontem, jeżeli zamiast biec po prostej, będzie unikać obszarów gęstych, w których porusza się powoli, przechodząc przez nie pod większym nachyleniem. Gdy wydaje się, że słońce dopiero zachodzi za horyzont, naprawdę znajduje się ono już dobrze za nim. Innym przykładem tego zjawiska są miraże, które się często widzi jadąc po rozgrzanej szosie. Widzi się „wodę" na szosie, ale dojechawszy na miejsce okazuje się, że jest ono suche jak pustynia! Zjawisko tłumaczy się następująco: to, co naprawdę widzimy, jest światłem słonecznym „odbitym" od drogi. Światło słoneczne zmierzające w stronę szosy może dojść do oka tak, jak pokazano na rys. 26.8. Dlaczego? Dlatego, że powietrze bezpośrednio nad szosą jest bardzo gorące, wyżej zaś chłodniejsze. Gorące powietrze jest optycznie rzadsze (tzn. ma mniejsze n) niż zimne i dlatego prędkość światła spada tam w mniejszym stopniu. Światło biegnie więc szybciej w obszarze gorącym niż chłodnym. Wobec tego zamiast decydować się na bieg bezpośrednio po prostej drodze światło porusza się po torze najkrótszego czasu, oszczędzając czas w obszarze, gdzie przez chwilę biegnie szybciej. Dlatego może poruszać się po krzywej. Rozważając inny ważny przykład zasady najkrótszego czasu spróbujmy stworzyć sytuację, w której wszystko światło przychodzące z jednego punktu P odnajdzie się zebrane znowu w innym punkcie P' (rys. 26.9). Znaczy to naturalnie, że światło może się poruszać 26.8. Miraż Ziemia 26.7. Blisko horyzontu pozorne Słońce znajduje się o około ł° wyżej od prawdziwego. światło słoneczne gorąca szosa lub piasek
26-4. ZASTOSOWANIE ZASADY FERMATA 19 [Z^^le: po linii prostej od punktu P do P'. Rzeczywiście tak jest, ale czy możemy tak zrobić, żeby odnaleźć w punkcie P' nie tylko światło biegnące na wprost, ale także rozchodzące się od punktu P w stronę CP. Chcemy z powrotem zebrać wszystko światło w punkcie zwanym ogniskiem. Jak to zrobić? Przecież jeżeli światło zawsze wybiera tor najkrótszego czasu, to naturalnie nie będzie chciało biec po jakichś innych torach. Będzie ono mogło rzeczywiście wybierać różne tory jedynie wtedy, gdy odpowiadające im czasy przejścia staną się dokładnie równe\ W przeciwnym bowiem razie światło wybierze tylko tor najkrótszego czasu. Wobec tego zagadnienie zbudowania układu ogniskującego polega po prostu na ustawieniu takiego urządzenia, w którym całej rozmaitości torów odpowiada ten sam czas rozchodzenia się światła! Sprawa jest prosta. Weźmy kawałek szkła, w którym światło rozchodzi się wolniej niż w powietrzu (rys. 26.10), i rozważmy promień, który w powietrzu biegnie po torze PQP'. Tor ten jest dłuższy niż bezpośrednia droga PP' i bez wątpienia zabiera więcej czasu. Ale wstawiając kawałek szkła o odpowiedniej grubości (a jakiej, obliczymy później) możemy skompensować nadmiar czasu, jaki światłu zabiera droga załamana pod pewnym kątem! W tych warunkach może się okazać, że czas odpowiadający przejściu na wprost będzie dokładnie równy czasowi upływającemu na torze PQP'. Rozważmy w podobny sposób promień PRR'P'. Jest on tylko częściowo nachylony, a więc nie tak długi jak PQP' i wobec tego pewne wyrównanie jest konieczne, chociaż nie tak duże jak dla promienia biegnącego prosto. Ostatecznie więc nasza płytka będzie wyglądała tak, jak na rys. 26.10. Przy takim kształcie wszystko światło wychodzące z punktu P będzie docierało do punktu P'. Wszystko to jest nam oczywiście dobrze znane; urządzenie takie nazywamy soczewką skupiającą. W następnym rozdziale obliczymy, jaki właściwie kształt musi mieć soczewka, aby dawać doskonałe ogniskowanie. Weźmy inny przykład. Spróbujmy ustawić kilka zwierciadeł tak, aby światło z punktu P zawsze dochodziło do P' (rys. 26.11). Biegnie ono po różnych torach do zwierciadeł i wraca, odpowiednie zaś czasy muszą być sobie rów- ne- W tym przypadku światło rozchodzi się stale w powietrzu tak, że czas i odległość są do siebie proporcjonalne. Wobec tego stwier- 26.9. Bliżej niesprecyzowany układ optyczny 26.10. Ogniskujący układ optyczny 26.11. Zwierciadło elipsoidalne
20 26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU dzenie, że wszystkie czasy są jednakowe, jest równoważne stwierdzeniu, że całkowita odległość jest zawsze taka sama. Tak więc suma dwóch odległości r, i r2 musi być stała. Suma odległości od dwu punktów jest stała dla każdego punktu na krzywej zwanej elipsą; w takim wypadku możemy być więc pewni, że światło z jednego ogniska będzie dochodzić do drugiego. Na tej samej zasadzie opiera się skupianie światła jakiejś gwiazdy. Wielki, prawie pięciometrowy teleskop na Mount Palomar jest zbudowany w następujący sposób: Wyobraźmy sobie gwiazdę odległą o miliony kilometrów. Chcemy wszystko przychodzące od niej światło zebrać w ognisku. Nie możemy oczywiście narysować promieni biegnących hen od gwiazdy na całej ich długości, ale mimo to spróbujmy sprawdzić czy czasy są równe. Wiemy oczywiście, że gdy różne promienie przechodzą przez płaszczyznę KK' do nich prostopadłą, to odpowiednie czasy na tej płaszczyźnie są wszystkie sobie równe (rys. 26.12). Promienie następnie dochodzą do zwierciadła i biegną dalej w kierunku punktu P w jednakowym czasie. Musimy więc znaleźć krzywą, która ma własność, że suma odległości XX' + + X'P' jest stała, niezależna od wyboru punktu X. Prosty sposób jej znalezienia polega na przedłużeniu linii XX' at do płaszczyzny LL'. Jeżeli spełniane będą warunki, że A'A" = = A'P', B'B"=B'P', C'C"=C'P' i tak dalej, to otrzymamy żądaną krzywą, ponieważ wówczas A A' + A''P' = AA' + A' A" będzie naturalnie stałe. Wobec tego nasza krzywa jest miejscem geometrycznym punktów równo oddalonych od pewnej prostej i od punktu. Taką krzywą nazywa się parabolą; zwierciadło teleskopu jest więc zbudowane w kształcie paraboli. Powyższe przykłady obrazują zasadę, na której można się opierać przy projektowaniu podobnych przyrządów optycznych. Dokładne krzywe można wyliczyć posługując się zasadą, że dla uzyskania doskonałego ogniskowania czasy przebiegu muszą być dokładnie równe dla wszystkich promieni świetlnych i muszą być krótsze niż czasy odpowiadające jakiemukolwiek innemu sąsiedniemu torowi. W następnym rozdziale będziemy dalej rozważać ogniskujące urządzenia optyczne, a teraz zajmiemy się dalszym rozwojem teorii. Śledząc rozwój nowej zasady teoretycznej, takiej jak zasada najkrótszego czasu, skłonni jesteśmy może sądzić, że jest to coś bardzo ładnego, nawet zachwycającego, ale zadajemy sobie pytanie: czy w ogóle pomaga ona w rozumieniu fizyki? Można by wprawdzie odpowiedzieć, że tak, że ułatwia ona zrozumienie wielu nowych faktów, ale prawdą jest też, że i bez niej można zrozumieć działanie zwierciadła. Wystarczy znaleźć krzywą, dla której każda płaszczyzna styczna tworzy równe kąty z dwoma promieniami. Podobnie można zrozumieć działanie soczewki, bowiem każdy promień, który do niej dochodzi, jest załamywany pod kątem danym przez prawo Snella. Bez wątpienia twierdzenie o najkrótszym czasie mówi to samo co twierdzenie, że przy odbiciu kąty są sobie równe, a przy załamaniu sinusy kątów są do siebie propor- A A* ' fi lx"~—-~ X x e' c 7r D p' ~fi X X' 1 1 i i i i. i i i -l—L' " A" B" C"D" X" 26.12. Zwierciadło paraboloidalne
26-4. ZASTOSOWANIE ZASADY FERMATA 21 cjonalne. Czy zatem sprawa polega tylko na estetyce, czy też ma głębszy sens? Obie strony mogą tu wysunąć swoje argumenty. Sprawa zawiera się w tym, że znaczenie ważnej zasady polega na możności przewidzenia nowych fak lów. Łatwo pokazać, że zasada Fermata przewiduje szereg nowych faktów. Weźmy najpierw trzy ośrodki: szkło, wodę i powietrze; przeprowadźmy doświadczenie nad załamaniem światła w tych trzech ośrodkach i zmierzmy współczynnik n jednego ośrodka względem drugiego. Współczynnik załamania powietrza (I) względem wody (2) oznaczmy n12, a współczynnik załamania powietrza (I) względem szkła (3) oznaczmy n,3. Przeprowadzając pomiary dla wody względem szkła znaleźlibyśmy inny współczynnik załamania, który oznaczmy n23. A priori nie ma powodu, aby istniał jakikolwiek związek między n,,, nl3 i n2i, natomiast zgodnie z zasadą najkrótszego czasu związek taki jest dobrze określony. Współczynnik ni2 jest stosunkiem prędkości światła w powietrzu do prędkości światła w wodzie; nI3 jest stosunkiem prędkości światła w wodzie do prędkości światła w szkle. Możemy więc pozbyć się prędkości w powietrzu otrzymując n23 = i;2/i>3=—— =—. (26.5) l',/l.'2 HI2 Przewidujemy zatem, że współczynnik załamania dla nowej pary substancji można wyliczyć ze współczynników załamania każdej z tych substancji względem powietrza lub względem próżni. Wzór nasz stanie się bardzo prosty, jeżeli z pomiarów prędkości światła we wszystkich substancjach otrzymamy charakteryzujące je liczby, mianowicie ich współczynniki załamania względem próżni oznaczone nt (n, jest prędkością światła w powietrzu względem prędkości światła w próżni, itd.). Współczynnik załamania dla jakichkolwiek dwu substancji będzie bowiem wynosił nu-*=X (26.6) vj n, Korzystając tylko z prawa Snella nie mamy podstaw do takich przewidywań*', chociaż przewidywanie to rzeczywiście się spełnia. Związek (26.5) poznano bardzo wcześnie i stanowił poważny argument na korzyść zasady najkrótszego czasu. Innym argumentem na korzyść tej zasady, innym przewidywaniem, jest, że prędkość światła zmierzona w wodzie okaże się mniejsza od prędkości w powietrzu. Przewidywanie to ma zupełnie inny charakter niż wszystkie dotychczasowe. Jest ono znakomite, ponieważ dotychczas mierzyliśmy kąty, teraz zaś mamy przewidywanie teoretyczne, zupełnie różne od spostrzeżeń, na których podstawie Fermat wyprowadził zasadę najkrótszego czasu. Okazuje się, że prędkość światła w wodzie jest rzeczywiście mniejsza od prędkości światła w powietrzu, dokładnie w takim samym stosunku, że daje poprawny współczynnik załamania! *' Aczkolwiek można ten wzór wyprowadzić, zakładając dodatkowo, że umieszczenie warstwy jednej substancji na powierzchni drugiej nie zmieni ostatecznego kąta załamania w tym drugim ośrodku.
22 26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU 26-5. Dokładniejsze sformułowanie zasady Fermata Zasada najkrótszego czasu nie została przez nas wypowiedziana poprawnie i właściwie powinniśmy sformułować ją nieco bardziej dokładnie. Nie jest w ogóle rzeczą poprawną nazywanie jej zasadą najkrótszego czasu i tylko dla wygody posługiwaliśmy się dotąd tym niewłaściwym sformułowaniem. Teraz musimy jednak zobaczyć, jakie jest jej poprawne brzmienie. Wyobraźmy sobie zwierciadło takie jak na rys. 26.3. Skąd światło wie, że ma w ogóle biec do zwierciadła? Torem najkrótszego czasu jest oczywiście AB, a więc można by sądzić, że niekiedy czas jest maksymalny. W naszym przypadku czas jednak nie jest maksymalny, ponieważ niewątpliwie dłuższego czasu wymagałby tor zakrzywiony! Poprawne sformułowanie zasady brzmi następująco: promień biegnący po danym torze ma własność, że jeśli dokonamy w nim jakiejkolwiek niewielkiej zmiany (dajmy na to przesunięcia o 1 %), na przykład zmieniając miejsce jego padania na zwierciadło albo kształt krzywej, albo jeszcze coś innego, wówczas w czasie nastąpią zmiany nie rzędu pierwszego, a tylko drugiego. Innymi słowy, zasada ta mówi, że światło wybiera taki tor, w którego sąsiedztwie znajduje się wiele innych torów wymagających prawie dokładnie takiego samego czasu. Z zasadą najkrótszego czasu związana jest jeszcze inna trudność i to taka, że nigdy jej nie strawią ludzie, którzy nie lubią teorii tego rodzaju. Przy pomocy teorii Snella możemy „zrozumieć" zachowanie się światła. Biegnie ono przed siebie, widzi jakąś powierzchnię i załamuje się, ponieważ na tej powierzchni coś się z nim dzieje. Światło biegnie od jednego punktu do drugiego i do następnego i tak dalej, więc idea przyczynowości jest tu łatwo zrozumiała. Zasada najkrótszego czasu jest natomiast zupełnie odmienną filozoficznie zasadą działania przyrody. Zamiast mówić, że coś jest sprawą przyczynową, że zrobienie jednej rzeczy powoduje w następstwie coś innego i tak dalej, powyższa zasada głosi, że my ustalamy pewną sytuację, a światło decyduje, który czas jest najkrótszy lub ekstremalny i wybiera odpowiedni tor. Me jak światło to robi? Jak wynajduje ten tor? Czyżby obwąchiwała ono sąsiadujące tory porównując je? Odpowiedź jest twierdząca; światło w pewnym sensie tak właśnie postępuje. Własność ta jest oczywiście nieznana w optyce geometrycznej i zawarta jest w pojęciu długości fali; długość fali mówi nam w przybliżeniu o tym jak daleko do przodu światło musi „ob- wąchać" tor, aby móc go sprawdzić. W przypadku światła trudno zjawisko to pokazać w dużej skali, ponieważ długości jego fali są strasznie małe. Ale dla fal radiowych, np. fal o długości 3 cm, odległości, na których dokonuje się porównywań, są większe. Weźmy źródło fal radiowych, detektor i szczelinę, jak to przedstawiono na rys. 26.13. Promienie będą wówczas biegły oczywiście od S do D, ponieważ jest to linia prosta, i nic się nie zmieni, jeśli szczelinę uczynimy węższą. Jeśli jednak przesuniemy detektor w bok do D', fale nie przebiegną przez 26.13. Przechodzenie fal radiowych przez wąską szczelinę
26-i DOKŁADNIEJSZE SFORMUŁOWANIE ZASADY FERMATA 23 szeroką szczelinę od S do D', ponieważ porównując szereg pobliskich torów powiedzą sobie: „Nic z tego, wszystkie tory odpowiadają innym czasom". Jeśli jednak uda się nam zabezpieczyć promieniowanie przed porównywaniem torów przez przymknięcie szczeliny aż do utworzenia się bardzo wąskiej szparki, wówczas możliwy będzie tylko jeden tor i promieniowanie jego właśnie wybierze! W rezultacie więcej promieniowania dotrze do D przy wąskiej szczelinie niż przy szerokiej! Ze światłem można zrobić to samo, ale trudno to pokazać w dużej skali. Zjawisko można jednak zauważyć w następujących prostych warunkach. Poszukajmy jakiegoś małego jasnego źródła światła, na przykład przezroczystej żarówki w dalekiej latarni ulicznej albo odbicia słońca w zakrzywionym zderzaku samochodowym. Ustawmy teraz przed jednym okiem dwa palce tak, aby patrzeć przez szparę między nimi i bardzo łagodnie starajmy się stłumić światło aż do zera. Zobaczymy, że obraz źródła światła, który przedtem był małą kropką, stanie się wydłużony i nawet rozciągnie się w długą linię. Przyczyna zjawiska leży w tym, że palce znajdują się bardzo blisko siebie i światło, które powinno przyjść po linii prostej, rozkłada się wewnątrz pewnego kąta tak, że wchodząc do oka przybywa z różnych kierunków. Przypatrując się bardzo uważnie, spostrzeżemy również boczne maksima i liczne prążki wzdłuż brzegów. Co więcej, całe zjawisko będzie barwne. Wszystko to wyjaśnimy sobie w odpowiednim czasie, bo teraz służy to tylko do łatwego wykazania, że światło nie zawsze rozchodzi się po liniach prostych. 26-6. Jak to się wszystko odbywa naprawdę? Na zakończenie podamy bardzo prymitywny obraz tego, co się właściwie dzieje; przedstawimy, w jaki sposób cała sprawa naprawdę się odbywa, ze ścisłego, uważanego za poprawny, punktu widzenia mechaniki kwantowej. Opis nasz będzie oczywiście tylko jakościowy. Śledząc światło między punktami A i B na rys. 26.3 stwierdzamy, że wcale nie przejawia ono swej postaci falowej. Wydaje się natomiast że promienie składają się z fotonów i właściwie one powodują cykanie licznika fotonowego, jeśli się nim posługujemy. Jasność światła jest proporcjonalna do średniej liczby fotonów przechodzących w ciągu sekundy, a to, co liczymy, jest prawdopodobieństwem, że foton przedostanie się z punktu A do B. na przykład padając na zwierciadło. Prawdopodobieństwem tym rządzi następujące bardzo dziwne prawo. Weźmy jakiś tor i znajdźmy dla niego czas przelotu; utwórzmy następnie liczbę zespoloną albo narysujmy mały zespolony wektor pe", którego kąt 0 jest proporcjonalny do czasu. Liczba jego obrotów na sekundę określa częstość światła. Weźmy teraz inny tor, któremu odpowiada jakiś inny czas; jego wektor będzie więc obrócony o inny kąt — nadal proporcjonalny do czasu. Weźmy teraz wszystkie możliwe tory ' pododawajmy malutkie wektory odpowiadające każdemu z nich; okazuje się, że prawdopodobieństwo przybycia fotonu jest proporcjonalne do kwadratu długości wektora wypadkowego! Pokażmy teraz, jak z tego wynika zasada najkrótszego czasu dla zwierciadła. Rozważmy Wszystkie promienie, wszelkie możliwe tory ADB, AEB. ACB itd. na rys. 26.3. Tor ADB daje pewien mały przyczynek, ale dla sąsiedniego toru AEB czas jest zupełnie inny, a więc
24 26. OPTYKA: ZASADA NAJKRÓTSZEGO CZASU jego kąt 0 jest zupełnie inny. Niech punkt C odpowiada czasowi minimalnemu, to znaczy takiemu, dla którego czasy się nie zmieniają przy zmianie toru. Tak więc w miarę zbliżania się do punktu C(rys. 26.14) czasy najpierw ulegają zmianie, a potem zaczynają zmieniać 26.14. Sumowanie amplitud prawdopo- się coraz to mniej. Wobec tego wektory, któ- dobieństwa dla wielu sąsiadujących torów K mamy dodawaCj ustawiają się w pobliżu C prawie dokładnie pod stałym kątem. Czas zaczyna potem stopniowo wzrastać, fazy zmieniają się i tak dalej. Wynika z tego ostatecznie dość zaplątany węzeł. Całkowite prawdopodobieństwo dane jest przez kwadrat odległości między obu końcami. Tak nagromadzone prawdopodobieństwo pochodzi prawie w całości z obszaru, w którym wszystkie wektory mają ten sam kierunek (albo tę samą fazę). Wszystkie przyczynki od torów, których czasy bardzo się różnią między sobą, znoszą się wzajemnie, ponieważ są skierowane w różne strony. Dlatego też, gdy zasłonimy zewnętrzne części zwierciadła, będzie ono odbijać prawie tak samo jak niezasłonięte, ponieważ sprawa polega na usunięciu części diagramu wewnątrz końców spirali, co powoduje tylko bardzo małą zmianę ilości światła. W taki to sposób zasadę najkrótszego czasu wiąże się z obrazem fotonowym, w którym prawdopodobieństwo przyjścia zależy od nagromadzenia opisanych tu wektorów. ■G^O
27 optyka geometryczna 27-1. Wstęp W rozdziale tym omówimy szereg praktycznych i elementarnych urządzeń, w których znalazły zastosowanie idee podane w poprzednim rozdziale. Posłużymy się przybliżeniem zwanym optyką geometryczną. Jest to przybliżenie bardzo użyteczne przy praktycznym projektowaniu wielu układów i przyrządów optycznych. Optykę geometryczną można przedstawić w sposób albo bardzo prosty, albo bardzo złożony. Jak to należy rozumieć? Z jednej strony możemy badać ją tylko powierzchownie, tak aby móc ogólnie projektować przyrządy posługując się bardzo prostymi regułami, które prawie nie wymagają wyjaśnień, ponieważ praktycznie są na poziomie szkoły średniej. Z drugiej strony, jeżeli chcemy się czegoś dowiedzieć o wadach soczewek i o tym podobnych szczegółach, sprawa staje się bardzo skomplikowana, ponadto tak specjalna, że nie możemy jej tutaj rozważać! Jeżeli ktoś rzeczywiście stoi przed specjalnym zagadnieniem z dziedziny projektowania soczewek, wymagającym analizy aberracji, niech poczyta sobie na ten temat, albo korzystając z prawa załamania niech po prostu nakreśli promienie przechodzące przez różne powierzchnie (a jak to zrobić - podają podręczniki) i niech znajdzie miejsce wychodzenia promieni, aby się przekonać czy dają one zadowalający obraz. Dawniej drogę tę uważano za zbyt żmudną, ale dziś, gdy korzysta się z maszyn liczących, jest to najwłaściwsza droga postępowania. Wystarczy sformułować zagadnienie od strony matematycznej i wykonać bardzo łatwe obliczenia dla jednego promienia po drugim. Ostatecznie więc sprawa staje się naprawdę zupełnie prosta i nie wymaga nowych zasad. Okazuje się ponadto, że reguły optyki zarówno elementarnej jak i zaawansowanej na ogół nie dają się przenieść do innych dziedzin; nie ma więc szczególnego powodu, aby się w nie bardzo zagłębiać, choć istnieje jeden ważny wyjątek. Najbardziej rozwiniętą, abstrakcyjną teorię optyki geometrycznej opracował Hamilton i jak się okazało znalazła ona bardzo ważne zastosowanie w mechanice. Prawdę mó-
26 27. OPTYKA GEOMETRYCZNA , wiąc, ma ona nawet większe znaczenie w mechanice N*s^^ niż w optyce i dlatego teorię Hamiltona zostawimy / ^^-x. jako temat dla wyższej mechaniki analitycznej, któ- / ^^n. r3 s'ę stu^'uJe "a starszym roku lub na studiach f ^^^^ podyplomowych. Uznajmy więc, że optyka geome- ^^^ tryczna przedstawia wartość tylko ze względu na d siebie samą i przejdźmy teraz do rozważenia elementarnych własności prostych układów optycz- 27.1 nych. Będziemy je badać opierając się na zasadach naszkicowanych w poprzednim rozdziale. Dla naszych celów musimy mieć jeszcze następujący wzór geometryczny: weźmy trójkąt prostokątny o małej wysokości h i o długiej podstawie d. Jego przeciwprostokątna s (która będzie nam potrzebna do znalezienia różnicy w czasie między dwiema różnymi drogami) jest dłuższa niż podstawa (rys. 27.1). O ile mianowicie? Różnicę A=s — d można znaleźć na wiele sposobów. Jeden z nich jest następujący. Widzimy, że s2 — d2 — h2, czyli (s—d)(s+d) = = h2. Ale s — d=A, a s + d~2s. A więc h2 ń~- (27.1) 2s I to jest cała geometria potrzebna nam do badania w jaki sposób zakrzywione powierzchnie tworzą obrazy! 27-2. Odległość ogniskowa powierzchni kulistej Pierwszym i najprostszym układem, który omówimy, jest pojedyncza powierzchnia załamująca, oddzielająca dwa ośrodki o różnych współczynnikach załamania (rys. 27.2). Przypadek dowolnych współczynników załamania pozostawiamy do rozważenia czytelnikowi, ponieważ najważniejszą rzeczą jest zawsze ogólna idea, a nie określona sytuacja, zagadnienie zaś jest tak proste, że można je rozwiązać w każdym przypadku. Przypuśćmy 27.2 Ogniskowanie przez pojedynczą powierzchnię załamującą
27-? ODLEGŁOŚĆ OGNISKOWA POWIERZCHNI KULISTEJ 27 więc, że w rozpatrywanym przypadku (rys. 27.2) prędkość na lewo wynosi 1, a na prawo |/n. gdzie n jest współczynnikiem załamania. Światło w szkle porusza się n razy wolniej. Weźmy teraz punkt O w odległości 5 od przedniej powierzchni szkła i punkt O' w odległości s' wewnątrz szkła. Chcemy dobrać zakrzywioną powierzchnię w taki sposób, aby każdy promień z O padający na powierzchnię w dowolnym punkcie P załamywał się tak, aby biec w kierunku punktu O'. Aby rzeczywiście tak się działo, powierzchnia musi mieć taki kształt, żeby czas zużywany przez światło na przejście od punktu O do P był stały i niezależny od punktu P. Czas ten jest równy odległości OP, podzielonej przez prędkość światła (która tutaj wynosi 1) plus n-0'P, co określa czas przejścia od punktu P do O'. Warunek ten daje nam równanie wyznaczające powierzchnię. Jako wynik otrzymujemy, że przekrój tej powierzchni jest skomplikowaną krzywą czwartego stopnia i czytelnik może spróbować ją obliczyć metodami geometrii analitycznej. Prościej jest wziąć szczególny przypadek odpowiadający j->oo, ponieważ wówczas szukana krzywa jest krzywą drugiego stopnia i łatwiej ją rozpoznać. Ciekawe jest porównanie tej krzywej z parabolą, którą znaleźliśmy dla zwierciadła ogniskującego, gdy światło przybywało z nieskończoności. Niełatwo więc utworzyć odpowiednią powierzchnię. Ogniskowanie światła z jednego punktu w drugim wymaga powierzchni dość skomplikowanej. W praktyce zwykle nie próbujemy nawet wykonania takich skomplikowanych powierzchni i decydujemy się na kompromis. Zamiast się starać, aby wszystkie promienie dochodziły do ogniska, urządzamy się tak, że dochodzą do niego tylko promienie bliskie osi OO'. Dalsze promienie mogą niestety zbaczać, ponieważ zamiast skomplikowanej idealnej powierzchni bierzemy powierzchnię kulistą o właściwej krzywiźnie na osi. Praktyczne wykonanie kuli jest tak dalece łatwiejsze niż innej powierzchni, że warto zobaczyć, co się dzieje z promieniami padającymi na powierzchnie kuliste przy założeniu, że doskonałe ogniskowanie ma obowiązywać tylko promienie bliskie osi. Promienie bliskie osi zwiemy niekiedy promieniami przyosiowymi {paraksjalnymi), a więc przedmiotem analizy będą warunki ogniskowania promieni przyosiowych. Omówimy potem, jakie błędy biorą się stąd, że nie wszystkie promienie są zawsze bliskie osi. Załóżmy więc, że punkt P leży blisko osi i opuśćmy prostopadłą PQ tak, aby wysokość PQ wynosiła h. Wyobraźmy sobie na chwilę, że powierzchnia stanowi płaszczyznę przechodzącą przez punkt P. W tym wypadku czas potrzebny do przejścia od punktu O do P przewyższałby czas przejścia od punktu O do Q, a czas przejścia od punktu P do O' przewyższałby czas przejścia od punktu Q do O'. Szkło dlatego właśnie musi być zakrzywione, żeby całkowity nadmiar czasu został skompensowany przez opóźnienie na drodze od punktu V do Q\ Nadwyżka czasu wzdłuż drogi OP wynosi teraz h2\2s, a nadwyżka czasu na drugiej drodze wynosi nh2l2s'. Nadwyżka, która musi zostać wyrównana przez opóźnienie na drodze VQ, jest inna niż w próżni, ponieważ obecnie droga promienia przechodzi przez ośrodek. Innymi słowy, czas przejścia od punktu V do Q nie jest po prostu taki jak w powietrzu, ale n razy dłuższy. Nadwyżka opóźnienia na tej drodze wynosi więc (n-1) VQ. A teraz, ile wynosi VCP. Jeśli punkt C jest środkiem kuli ° promieniu R, to z naszego wzoru wynika, że odległość VQ równa jest h2/2R. W ten sposób dochodzimy do następującego prawa, które wiąże odległości s i s' i daje nam R,
28 27. OPTYKA GEOMETRYCZNA promień krzywizny żądanej powierzchni: (/i2/2s)+(n/i2/2s')=(n -1) h'l2R , (27.2) czyli (l/s) + (n/s')=(n-l)/K. (27.3) Mając dane punkty O i O' i chcąc zogniskować światło z punktu O w punkcie O' możemy przy pomocy tego wzoru obliczyć żądany promień krzywizny R. Ciekawe, że ta sama soczewka, o tej samej krzywiinie l/R, będzie ogniskowała i dla innych odległości; zachodzić to będzie dla dowolnej pary takich odległości, że suma ich odwrotności, z których jedna pomnożona jest przez n, ma wartość stałą. Dana soczewka będzie więc ogniskować (jeśli ograniczymy się do promieni przyosiowych) nie tylko dla pary punktów O i O', ale dla nieskończenie wielu innych par punktów, jeżeli dla nich (1 /*)+(«/s') będzie pewną stałą charakterystyczną dla soczewki. Interesujący przypadek zachodzi w szczególności wtedy, gdy s-*oo. Ze wzoru widzimy, że gdy s rośnie, s' maleje. Innymi słowy, jeśli punkt O oddala się, punkt O' przybliża się, i odwrotnie. W miarę jak punkt O oddala się do nieskończoności, punkt O' przybliża się, aż osiągnie pewną odległość wewnątrz szkła, zwaną odległością ogniskową /'. Promienie padające równolegle spotykają się z osią w odległości /'. Możemy także wyobrazić sobie sytuację odwrotną. (Pamiętajmy o zasadzie wzajemności: jeśli światło biegnie od punktu O do O', to oczywiście będzie także biec od punktu O' do O.) Weźmy zatem źródło światła wewnątrz szkła i zapytajmy, gdzie obecnie znajduje się ognisko. W szczególności, gdyby źródło światła w szkle znajdowało się w nieskończoności (to samo zagadnienie co poprzednio), to gdzie na zewnątrz następowałoby ogniskowanie? Szukaną odległość oznaczamy jako/. Możemy pomyśleć o odwrotnej sytuacji. Jeżeli źródło światła znajduje się w odległości/, światło przechodzące przez powierzchnię wychodzi na zewnątrz jako wiązka równoległa. Łatwo znaleźć czemu są równe / i /': nlf'=(n-l)IR, czyli f'=Rnl(n-\), (27.4) llf = (n-l)/R, czyli f=R/(n-l). (27.5) Zauważmy ciekawą rzecz: jeśli podzielimy każdą odległość ogniskową przez odpowiedni współczynnik załamania, to otrzymamy to samo! Twierdzenie to jest rzeczywiście ogólne. Warto je zapamiętać, bo jest ono prawdziwe dla każdego dowolnie skomplikowanego układu soczewek. Twierdzenia tego nie dowiedliśmy w ogólnym przypadku — stwierdziliśmy po prostu, że jest prawdziwe dla pojedynczej powierzchni. Jest jednak prawdą, że również w ogólnym przypadku dwie ogniskowe układu są ze sobą związane w powyższy sposób. Równanie (27.3) bywa czasem pisane w postaci: (l/s)+ («/»')= 1/T (27.6) Postać ta jest bardziej użyteczna niż postać (27.3), ponieważ łatwiej zmierzyć / niż krzywiznę i współczynnik załamania soczewki: jeśli soczewkę po prostu bierzemy z półki, a nie interesuje nas ani sposób jej projektowania, ani jak została zrobiona, to ważną dla na« wirllcoćcia iest f. a nie n czy 1, czy też R\
27-2. ODLEGŁOŚĆ OGNISKOWA POWIERZCHNI KULISTEJ 29 Ciekawą będzie sytuacja, gdy s stanie się mniejsze od/. Cc się wtedy dzieje? Jeśli s<f, to (l/s) >(!//) ' wobec tego s' jest ujemne; z naszego równania wynika tylko tyle, że światło będzie ogniskowane w ujemnej odległości s', choć nie wiadomo, co to oznacza! Oznacza to zaś coś bardzo ciekawego i bardzo dobrze określonego. Innymi słowy, wzór nasz jest użyteczny i wtedy, gdy pojawiają się liczby ujemne. Znaczenie tego obrazuje rys. 27.3. Jeśli poprowadzimy promienie rozchodzące się z punktu O, to ulegną one załamaniu na powierzchni, ale nie będą przechodziły przez ognisko, ponieważ punkt O leży tak blisko, że są one jeszcze „pozarównoległe". Rozchodzą się one jednak tak, jak gdyby przyszły z punktu O' leżącego na zewnątrz szkła. Ten rodzaj obrazu nazywamy niekiedy obrazem pozornym. Jeśli światło rzeczywiście dochodzi do pewnego punktu, to obraz nazywamy obrazem rzeczywistym. Jeśli zaś światło pozornie wychodzi z jakiegoś fikcyjnego punktu różnego od punktu właściwego, mówimy wówczas o obrazie pozornym. Jeśli więc otrzymujemy ujemne s', oznacza to, że punkt O' znajduje się po przeciwnej stronie powierzchni, poza tym zaś wszystko jest w porządku. Rozważmy teraz inny ciekawy przypadek, gdy A? jest nieskończone; wtedy (\ls) + (n/s') = =0. Innymi słowy, s'= —ns, co oznacza, że patrząc z ośrodka gęstego do rzadkiego widzimy punkt w ośrodku rzadkim pozornie n razy głębiej. Możemy także posłużyć się tym równaniem w odwrotnej sytuacji. Tak więc, gdy patrzymy na płaską powierzchnię w stronę przedmiotu znajdującego się w pewnej odległości wewnątrz gęstego ośrodka, będzie się nam wydawać, że światło przychodzi z odległości mniejszej (rys. 27.4). Jeśli patrzymy z góry na dno basenu pływackiego, to wydaje się on nam płytszy niż w rzeczywistości i to o czynnik |, który jest odwrotnością współczynnika załamania wody. W dalszym ciągu moglibyśmy jeszcze omówić działanie zwierciadła kulistego. Kto Jednak zrozumiał idee tu zawarte, może dalej już liczyć sobie sam. Pozostawiamy więc czytelnikowi wyprowadzenie wzoru dla zwierciadła kulistego, nadmieniając tylko, że °brze jest przyjąć pewne umowy tyczące się rozważanych odległości: •• Odległość, przedmiotu s jest dodatnia, jeśli punkt O leży na lewo od powierzchni. 2- Odległość obrazu s' jest dodatnia, jeśli punkt O' leży na prawo od powierzchni. -■ Promień krzywizny powierzchni jest dodatni, jeśli jej środek leży na prawo od Powierzchni. Na rysunku 27.2, na przykład, wielkości s, s' oraz R są wielkościami dodatnimi, na 27.3. Obraz urojony powietrze szkło 27.4. Płaska powierzchnia odtwarza w punkcie O światło z punktu O'
30 27. OPTYKA GEOMETRYCZNA rys. 27.3 wielkości s i R są dodatnie, natomiast s' jest ujemne. Jeżeli weźmiemy powierzchnię wklęsłą i po prostu przyjmiemy, że R jest wielkością ujemną, nasz wzór (27.3) nadal będzie dawał poprawny wynik. Gdybyśmy korzystali z powyższych konwencji przy wyprowadzeniu odpowiedniego wzoru dla zwierciadła, to okazałoby się, że poprawny wzór otrzymamy przyjmując wszędzie we wzorze (27.3) n = — 1! (Tak jak gdyby ośrodek za zwierciadłem miał współczynnik załamania równy —1!) Wywód wzoru (27.3) przy pomocy zasady najkrótszego czasu jest prosty i elegancki, ale można oczywiście wyprowadzić go przy pomocy prawa Snella, pamiętając o tym, że sinusy kątów można zastąpić przez same kąty, ponieważ są one bardzo małe. 27-3. Odległość ogniskowa soczewki Rozważmy teraz inną sytuację mającą znaczenie praktyczne. Większość używanych soczewek ma dwie powierzchnie zakrzywione, a nie tylko jedną. Jak dalece zmienia to sprawę? Załóżmy, że mamy dwie powierzchnie o różnej krzywiźnie, a przestrzeń między nimi wypełniona jest szkłem (rys. 27.5). Chcemy zbadać kwestię ogniskowania między punktem O, a zmiennym punktem O'. Jak to zrobić? Odpowiedź jest następująca: Korzystamy najpierw ze wzoru (27.3) dla pierwszej powierzchni, zapominając na razie o drugiej. Wzór ten powie nam, że światło rozchodzące się z punktu O pozornie zbiega się lub rozbiega (zależnie od znaku s') z pewnego innego punktu, np. O'. Rozważmy następnie nowe zagadnienie. Mamy drugą powierzchnię, oddzielającą szkło od powietrza, wewnątrz której promienie schodzą się w kierunku pewnego punktu O'. W którym miejscu zejdą się one naprawdę? Korzystamy ponownie z tego samego wzoru i stwierdzamy, że zbiegają się one w punkcie O". Jeśli zajdzie więc potrzeba, możemy tak przejść kolejno 75 powierzchni, korzystając raz po raz z tego samego wzoru! Istnieją pewne bardzo specjalne wzory, które mogłyby nam zaoszczędzić sporo trudu w tych kilku wypadkach w naszym życiu, w których zajdzie potrzeba śledzenia biegu światła przez 5 powierzchni. Jeżeli taki problem w ogóle się pojawi, to prościej jednak prześledzić bieg światła przez 5 powierzchni, niż zapamiętywać mnóstwo wzorów, gdyż może nigdy nie będziemy musieli śledzić biegu światła przez jakieś powierzchnie! W każdym razie zasada jest taka, że przy przechodzeniu światła przez jakąś powierz- 27.5. Tworzenie obrazu w soczewce dwu- chnię znajdujemy nowe położenie punktu powierzchniowej ogniskowania; bierzemy ten punkt za punkt wyjściowy dla następnej powierzchni, i tak dalej. Aby to wszystko naprawdę móc policzyć, potrzebne jest uogólnienie wzoru (27.3) na przypadek, gdy mamy dwa różne współczynniki załamania, n, i n2, a nie tylko n. Chodzi o to, że na drugiej powierzchni przechodzimy od współczynnika n do 1, a nie od
27-3. ODLEGŁOŚĆ OGNISKOWA SOCZEWKI 31 1 do n, a poza tym w wielu układach występuje więcej niż jeden rodzaj szkła, tak że współczynniki załamania są równe »,, n2 ... Nie trudno wtedy udowodnić, że takie uogólnienie wzoru (27.3) ma postać (it,/s)+(n2/s') = («2-»i)/1- (27.7) Wyjątkowo prosty jest szczególny przypadek, w którym obie powierzchnie leżą tak blisko siebie, że możemy pominąć małe błędy pochodzące od grubości soczewki. Narysujmy soczewkę tak, jak pokazano na rys. 27.6 i zadajmy sobie pytanie: w jaki sposób musi być ona zbudowana, aby w punkcie O' ogniskować światło z punktu O? Załóżmy, że światło pada dokładnie na brzeg soczewki, w punkcie P. Nadmiar czasu przy przejściu od punktu O do O' wynosi wówczas (<nlh2j2s) + (nlh2j2s'), jeśli pominiemy na chwilę grubość T szkła o względnym współczynniku załamania n2. Aby czas przejścia na wprost stał się równy czasowi przejścia drogą OPO', musimy wstawić kawałek szkła o takiej grubości T w środku, aby opóźnienie wywołane przejściem przez szkło wystarczało do zrównoważenia obliczonego nadmiaru czasu. Wobec tego grubość soczewki w środku musi być dana przez związek: («1/i2/2s) + («,fi2/2s') = («2-n1)r. (27.8) Możemy także wyrazić T przy pomocy promieni Rt i R2 obu powierzchni. Mając w pamięci naszą konwencję 3, znajdujemy dla R,<R2 (soczewka wypukła) T = (h2l2R,)-(h2l2R2), (27.9) stąd otrzymujemy ostatecznie: (nlls) + (nlls') = (n2-nl)(\IRl-\IR1). (27.10) Zauważmy teraz znowu, że jeżeli jeden z punktów znajdzie się w nieskończoności, to drugi będzie się znajdował w odległości zwanej odległością ogniskową /. Jest ona określona wzorem: !//=(«-!)(1/K,-1/R2), (27.11) gdzie n = n2ln,. Weźmiemy teraz przypadek odwrotny, w którym i ucieka do nieskończoności. Widzimy, że s' znajdzie się teraz w odległości ogniskowej/', przy czym obie odległości ogniskowe są tym razem równe. (Jest to jeszcze jeden szczególny przypadek ogólnej reguły, że stosunek dwu odległości ogniskowych jest równy stosunkowi współczynników załamania dwu ośrodków, w których promienie ulegają ogniskowaniu. W tym szczególnym układzie optycznym początkowy i końcowy współczynnik jest taki sam i obie ogniskowe są równe.) Zapomnijmy na chwilę o naszym wzorze na odległość ogniskową. Gdybyśmy kupili zaprojektowaną przez kogoś soczewkę o pewnych promieniach krzywizny i o pewnym 27.6. Cienka soczewka o dwu dodatnich promieniach
32 27. OPTYKA GEOMETRYCZNA współczynniku załamania, moglibyśmy zmierzyć odległość ogniskową poszukując na przykład miejsca, w którym ogniskuje się punkt z nieskończoności. Mając już odległość ogniskową byłoby lepiej zapisać nasze równanie korzystając z niej bezpośrednio. Wówczas wzór nasz przybiera postać: (l/s)+(l/s') = (l//)- (27.12) Zobaczymy teraz, jak się tym wzorem posługiwać i co z niego w różnych warunkach wynika. Przede wszystkim wynika z niego, że jeżeli s jest nieskończone, to s' jest równe /, i odwrotnie. Oznacza to, że wiązka równoległa ogniskuje się w odległości /, co stanowi właściwie definicję f. Drugą ciekawą rzeczą, o której się dowiadujemy z wzoru, jest to, że oba punkty przesuwają się w tym samym kierunku. Jeżeli jeden z nich przesuwa się w prawo, to z drugim dzieje się to samo. Inną rzeczą, o której mówi nasz wzór, jest to, że s i s' są równe wtedy, gdy oba wynoszą 2/. Innymi słowy, jeśli szukamy sytuacji wykazującej symetrię względem soczewki, okazuje się, że ogniskowanie z obu stron następuje w odległości 2/ 27-4. Powiększanie Na razie rozważaliśmy tylko działanie ogniskujące dla punktów na osi. Teraz zaś rozważymy tworzenie się obrazów przedmiotów, które nie leżą dokładnie na osi, ale w jej pobliżu. Chodzi nam teraz o zrozumienie zjawiska powiększania. Ustawmy soczewkę tak, aby światło z niewielkiego włókna zogniskować „punktowo" na ekranie. Zauważymy wówczas na nim „obraz" włókna, tyle że rozmiarów większych lub mniejszych od prawdziwego przedmiotu. Światło musi więc przybywać do ogniska z każdego punktu włókna. Aby to lepiej zrozumieć, zbadajmy cienki układ soczewek, pokazany schematycznie na rys. 27.7. Wiemy już, że: 1. Dowolny promień wchodzący równolegle do osi soczewki z jednej jej strony, podąża do pewnego szczególnego punktu zwanego ogniskiem, położonego po .drugiej stronie soczewki w odległości /. 2. Dowolny promień przybywający do soczewki z ogniska po jednej jej stronie wychodzi z drugiej strony równolegle do osi. 27.7. Geometria tworzenia obrazu przez cienką soczewkę p y V x (A f y X T Q NA X' W f "\ y s
27-4 POWIĘKSZANIE 33 To jest wszystko, co nam będzie potrzebne do geometrycznego wyprowadzenia wzoru (27.12). Załóżmy, że przedmiot leży w pewnej odległości x od ogniska; niech jego wysokość wynosi y. Wiemy, że jeden z promieni, oznaczmy go PQ, załamie się tak, że przejdzie przez ognisko R po drugiej stronie soczewki. Jeżeli soczewka będzie w ogóle ogniskować punkt P, to łatwo znaleźć, gdzie to nastąpi, badając po prostu bieg jakiegoś innego promienia. Nowe ognisko znajdzie się bowiem w punkcie przecięcia obu promieni. Musimy tylko dobrze pomyśleć, jak znaleźć dokładny kierunek jeszcze jednego promienia. Przypomnijmy sobie, że promień równoległy do osi przechodzi przez ognisko i vice versa: promień przechodzący przez ognisko będzie wychodził równolegle do osi! Prowadzimy więc promień PT przez punkt U. (Rzeczywiste promienie, ulegające ogniskowaniu, powinny być co prawda znacznie bliżej osi niż te dwa, które poprowadziliśmy, ale ponieważ trudniej je przedstawić, więc uznajmy, że te, które narysowaliśmy, są jeszcze dobre.) Ponieważ będzie on wychodził równolegle do osi, prowadzimy prostą TS równolegle do XW. Punkt przecięcia 5 wyznacza poszukiwany punkt. Określać on będzie poprawne położenie i poprawną wysokość obrazu. Oznaczmy jego wysokość przez y', a odległość od ogniska x'. Teraz już możemy wyprowadzić wzór soczewkowy. Korzystając z podobnych trójkątów PVU i TXU znajdujemy: -= - (27.13) / x Podobnie, z trójkątów SWR i QXR otrzymujemy: -, = 4 <2714> x f Rozwiązując każdy z tych wzorów względem y'/y znajdujemy, że "-AJ-. (27-15) y f x Równanie (27.15) jest słynnym wzorem soczewkowym; zawiera on wszystko, co trzeba wiedzieć o soczewkach: daje nam powiększenie y'jy wyrażone przez odległości obrazu i przedmiotu od ognisk i odległości ogniskowe. Wiąże on także dwie odległości x i x' z ogniskową /: xx'=/2. (27.16) Wzór ten jest w praktyce znacznie wygodniejszy niż równanie (27.12). Czytelnik łatwo może pokazać, że jeśli s~x+f i s'=x'+f, równanie (27.12) będzie równoważne równaniu (27.16). 27-5. Soczewki złożone Opiszemy teraz krótko, bez wyprowadzenia, ogólny wynik dla większej liczby soczewek. Jak w ogóle możemy analizować układ wielu soczewek? Sprawa jest prosta.
34 27. OPTYKA GEOMETRYCZNA 1 2 27.8. Ilustracja płaszczyzn głównych układu optycznego Rozpoczynamy od jakiegoś przedmiotu i obliczamy, gdzie znajduje się jego obraz dla pierwszej soczewki. Posługujemy się wzorem (27.16) lub (27.12), lub innym im równoważnym, lub też robimy wykresy. Znaleziony w ten sposób obraz przedmiotu traktujemy następnie jako przedmiot dla następnej soczewki o dowolnej ogniskowej i posługujemy się nią do ponownego znalezienia obrazu. Przechodzimy tak po prostu przez cały ciąg soczewek. Oto i wszystko, co można powiedzieć. Nie ma tu w zasadzie niczego nowego, nie musimy się więc w te sprawy zagłębiać. Ciekawy jest jednak ostateczny wynik działania dowolnego układu soczewek na światło, które wchodzi do układu z jakiegoś ośrodka zewnętrznego i wychodzi z układu z powrotem do tego samego ośrodka. Ośrodkiem tym może być np. powietrze. Dowolny przyrząd optyczny — teleskop lub mikroskop zawierający dowolną liczbę soczewek i zwierciadeł — ma następującą własność. Istnieją w nim dwie płaszczyzny, zwane płaszczyznami głównymi układu (płaszczyzny te leżą blisko pierwszej powierzchni pierwszej soczewki i ostatniej powierzchni ostatniej soczewki). Mają one następujące własności: 1. Światło wchodzące do układu równolegle do osi z jednej jego strony wychodząc skupia się w pewnym ognisku odległym od drugiej płaszczyzny o odległość ogniskową, tak jak gdyby układ stanowił cienką soczewkę ustawioną w tej właśnie płaszczyźnie. 2. Wiązka równoległa do osi, wchodząca z drugiej strony układu, skupia się w ognisku oddalonym o tę samą odległość / od pierwszej płaszczyzny głównej, znowu tak jak gdyby była w niej ustawiona cienka soczewka (patrz rys. 27.8). Jeśli tak jak poprzednio mierzymy odległości x i x oraz y i y', wzór (27.16) napisany dla cienkiej soczewki będzie oczywiście zupełnie ogólny, byle tylko mierzyć ogniskowe od płaszczyzn głównych, a nie od środka soczewki. Okazuje się, że dla cienkiej soczewki, płaszczyzny główne się ze sobą pokrywają. Sprawa wygląda tak, jak gdyby można było rozciąć cienką soczewkę w środku i rozsunąć, nie zauważając, że została ona rozdzielona. Każdy wchodzący promień wyskakuje z przeciwnej strony drugiej płaszczyzny głównej, dokładnie w tym samym punkcie, w którym przeszedł on przez płaszczyznę pierwszą! Płaszczyzny główne i ogniskowe można znaleźć metodą albo doświadczalną, albo rachunkową i daje to nam cały zbiór własności układu optycznego. Ciekawe, że gdy się już uporamy z takim wielkim i skomplikowanym układem optycznym, wynik wcale nie będzie skomplikowany.
27-6 ABERRACJE 35 27-6. Aberracje Zanim zdążymy wpaść w zachwyt nad tym, jakie to cudowne są te soczewki, musimy pospieszyć się i dodać, że istnieje tu jednak poważne ograniczenie. Pochodzi ono stąd, że sami ściśle mówiąc ograniczyliśmy się do promieni przyosiowych. Rzeczywiste soczewki o skończonych rozmiarach będą na ogół wykazywać aberracje. I tak na przykład promień, który leży na osi, oczywiście przechodzi dokładnie przez ognisko, a promień, który jest bardzo bliski osi, nadal będzie z bardzo dobrym przybliżeniem przechodził przez ognisko. Ale w miarę oddalania się od osi promienie zaczynają się odchylać od ogniska i może nawet wcale do niego nie dojdą, a promień przechodzący w pobliżu górnej krawędzi soczewki załamie się do dołu i minie ognisko w sporej odległości. W ten sposób, zamiast otrzymać obraz punktowy, otrzymamy plamę. Zjawisko to zwiemy aberracją sferyczną, ponieważ jest własnością powierzchni kulistych, które zastępują powierzchnie właściwego kształtu. Aberrację można poprawić dla każdej określonej odległości przedmiotu, zmieniając kształt powierzchni soczewki albo biorąc szereg soczewek ułożonych tak, że aberracje poszczególnych elementów układu będą się wzajemnie znosić. Soczewki wykazują jeszcze inną wadę: światło o różnych barwach ma różne prędkości, a co za tym idzie — różne współczynniki załamania w szkle i wobec tego odległość ogniskowa danej soczewki jest różna dla różnych barw. Obraz białego punktu jest więc barwny, ponieważ gdy osiągniemy ogniskowanie się światła czerwonego, niebieskie wypadnie poza ogniskiem, i odwrotnie. Zjawisko to nazywamy aberracją chromatyczną. Istnieją jeszcze inne wady soczewek. Dla przedmiotu znajdującego się poza osią ogniskowanie nie jest doskonałe, szczególnie jeżeli ognisko leży dostatecznie daleko od osi. Najłatwiej sprawdzić to najpierw ogniskując światło w soczewce, a następnie przechylając ją tak, aby promienie padały pod dużym kątem względem osi Tworzący się wówczas obraz będzie na ogół zupełnie nieostry i można wcale nie znaleźć takiego miejsca, w którym będzie dobre ogniskowanie. Soczewki mają więc różne wady, które optyk-projektant stara się usunąć, używając wielu soczewek do wzajemnego wyrównywania tych wad. Jaką dokładność jesteśmy w stanie osiągnąć? Czy jest możliwe zbudowanie bezwzględnie doskonałego układu optycznego? Wyobraźmy sobie, że zbudowaliśmy układ optyczny, który z założenia skupia światło dokładnie w punkcie. Jak znaleźć warunek na doskonałość układu, posługując się zasadą najkrótszego czasu? Układ będzie zaopatrzony w jakiś rodzaj wejściowego otworu dla światła. Weźmy najdalszy od osi promień, mogący trafić do ogniska (oczywiście, jeśli układ jest doskonały); wówczas czasy dla wszystkich innych promieni są dokładnie takie same. Ale nie ma rzeczy doskonałych, tak że powstaje pytanie, jakim błędem może być obarczony czas dla tego promienia, aby nie potrzeba było oprowadzać dalszych poprawek? To zależy od tego, jak doskonały chcemy mieć obraz. Ale załóżmy, że» chcemy mieć obraz tak doskonały, jak tylko można. Przypuszczamy oczywiście, że trzeba, aby czas przebiegu każdego promienia był prawie taki sam, tak dalece jak tylko to jest możliwe. Okazuje się jednak, że nie jest to możliwe; poczynając °d pewnego punktu staramy się zrobić coś, co przekracza możliwości optyki geometrycznej, Ponieważ sama teoria optyki geometrycznej już tam nie działa!
36 27. OPTYKA GEOMETRYCZNA Pamiętajmy, że zasada najkrótszego czasu nie jest dokładnym sformułowaniem, inaczej niż zasada zachowania energii, czy też zasada zachowania pędu. Zasada najkrótszego czasu jest tylko przybliżeniem i warto wiedzieć, jak wielki błąd można popełnić, nie powodując jeszcze widocznych różnic. Odpowiedzią na to jest stwierdzenie, że jeśli różnica w czasie między promieniem maksymalnym, czyli „najgorszym", tzn. najbardziej zewnętrznym, a promieniem środkowym jest mniejsza niż w przybliżeniu okres odpowiadający jednemu drganiu światła, wówczas dalsze poprawianie nie ma sensu. Światło jest obiektem drgającym z określoną częstością, związaną z długością fali, i jeżeli zadbamy o to, aby różnice czasów dla różnych promieni były mniejsze niż czas rzędu okresu, wówczas nie ma celu dalej zwiększać dokładności. 27-7. Zdolność rozdzielcza Inną, bardzo ciekawą kwestią z punktu widzenia zastosowań technicznych, dotyczącą wszystkich przyrządów optycznych, jest sprawa ich zdolności rozdzielczej. Mikroskop musimy zbudować tak, aby rzeczywiście widzieć oglądane pod nim przedmioty. Oznacza to na przykład, że jeżeli bakteria ma dwa punkciki, to w powiększeniu chcemy naprawdę zobaczyć na niej dwie kropki. Można by sądzić, że sprawa polega tylko na uzyskaniu dostatecznego powiększenia. Możemy przecież zawsze dodawać nowe soczewki i uzyskiwać coraz to większe powiększenia, a przy pewnej pomysłowości konstruktorów znieść wszystkie aberracje, sferyczne i chromatyczne. Mogłoby się więc wydawać, iż nie ma powodu, który uniemożliwiłby nam otrzymywanie coraz to większych powiększeń obrazu. Tymczasem ograniczenia mikroskopu polegają nie na trudnościach zbudowania soczewki, która powiększa więcej niż 2000 razy. Możemy zbudować układ soczewek powiększający 10 000-krotnie, ale mimo to nie będziemy mogli zobaczyć dwóch punktów, leżących zbyt blisko siebie. Powodem są ograniczenia optyki geometrycznej, czyli fakt, że zasada najkrótszego czasu nie jest ścisła. Regułę określającą jak daleko od siebie muszą znajdować się dwa punkty, aby ich obrazy pojawiły się oddzielnie, można wyprowadzić w piękny sposób uwzględniający, jaki czas jest potrzebny dla przebiegu różnych promieni. Pomińmy teraz aberracje i wyobraźmy sobie, że dla pewnego punktu P (rys. 27.9) wszystkie promienie zużyją ten sam czas na przejście od przedmiotu do obrazu T. (Nie jest to oczywiście prawdą, ponieważ układ nie jest doskonały, ale to już inna sprawa.) 27.9. Zdolność rozdzielcza układu optycznego R
r-7. ZDOLNOŚĆ ROZDZIELCZA 37 Weźmy teraz inny pobliski punkt, P', i zapytajmy, czy jego obraz będzie oddzielony od obrazu T,cty, innymi słowy, możemy je od siebie odróżnić? Zgodnie z zasadami optyki geometrycznej powinny się pojawić dwa obrazy punktowe, ale to, co naprawdę zobaczymy, może być tak rozmyte, że nie będziemy w stanie stwierdzić obecności dwóch punktów. Drugi punkt będzie zogniskowany w punkcie wyraźnie różnym od pierwszego, jeżeli dwóm skrajnym promieniom P'ST'i P'RTpo obu stronach dużego otworu soczewki będą odpowiadały nierówne czasy przejścia od obu możliwych punktów przedmiotów do danego punktu- -obrazu. Dlaczego? Gdyby bowiem czasy przebiegu były równe, oczywiście oba punkty zostałyby zogniskowane w jednym miejscu. Czasy więc nie mogą być równe. Jak bardzo muszą się one jednak różnić od siebie, abyśmy mogli stwierdzić, że dwa punkty nie ogniskują się razem i możemy rozróżnić ich punkty-obrazy? Ogólne prawidło dotyczące zdolności rozdzielczej każdego przyrządu optycznego jest następujące: Dwa różne źródła punktowe mogą być rozdzielone tylko wówczas, jeżeli pierwsze źródło jest zogniskowane w takim punkcie, że czasy przebiegu promieni skrajnych od drugiego źródła do tego punktu-obrazu różnią się o więcej niż jeden okres od czasów przebiegu tych promieni do drugiego punktu-obrazu. Różnica czasów przebiegu do fałszywego ogniska dla promienia górnego i dolnego (na rys. 27.9) musi więc przewyższać pewną wielkość, mianowicie w przybliżeniu okres drgań światła l2-*,>l/v, (27.17) gdzie v jest częstością światła (czyli liczbą drgań na sekundę albo prędkością podzieloną przez długość fali). Niech odległość dwu punktów wynosi D; kąt widzenia soczewki oznaczymy jako 0. Można wówczas pokazać, że wzór (27.17) jest dokładnie równoważny twierdzeniu, że D musi być większe od Xjn sin 0, gdzie n jest współczynnikiem załamania w punkcie P, a ). jest długością fali. Najmniejsze przedmioty, jakie możemy zauważyć, mają więc w przybliżeniu rozmiary długości fali świetlnej. Odpowiedni wzór istnieje i dla teleskopów. Mówi on nam o najmniejszej różnicy w kącie widzenia dwu gwiazd, którą można jeszcze stwierdzić*'. *' Kąt wynosi w przybliżeniu XjD, gdzie D jest średnicą soczewki. Czy widać, skąd się to bierze?
28 promieniowanie elektromagnetyczne 28-1. Elektromagnetyzm Najbardziej dramatyczne chwile w rozwoju fizyki to te, w których następują wielkie syntezy. Nagle okazuje się, że zjawiska, które poprzednio sprawiały wrażenie nie związanych ze sobą, są różnymi aspektami tego samego procesu. Historia fizyki jest historią takich właśnie syntez, a podstawą sukcesu fizyki jako nauki jest głównie to, że jesteśmy zdolni do przeprowadzania takich syntez. Najbardziej chyba dramatyczna chwila w rozwoju fizyki w XIX w. przydarzyła się gdzieś w siódmym dziesiątku lat owego wieku J. C. Maxwellowi, kiedy zestawiał prawa elektryczności i magnetyzmu z prawami zachowania się światła. Wynikiem tego było częściowe poznanie własności światła, owego pradawnego i subtelnego żywiołu, tak ważnego i tajemniczego, że przypisaniu Księgi Rodzaju konieczne było ułożenie dla niego specjalnego aktu stwórczego. Maxwell dokonawszy swego odkrycia mógł powiedzieć: .,Niech będzie elektryczność i magnetyzm, i niech się stanie światło!" Ten kulminacyjny moment był od dawna przygotowany przez stopniowe odkrywanie i rozwijanie praw elektryczności i magnetyzmu. Historię tę zachowamy do szczegółowego omówienia w drugim tomie. Pokrótce mówiąc jest ona następująca. Odkrywane stopniowo własności elektryczności i magnetyzmu, elektrycznych sił przyciągania i odpychania, a także sił magnetycznych, doprowadziły do wniosku, że siły te są wprawdzie skomplikowane, ale wszystkie zanikają jak odwrotność kwadratu odległości. W dostatecznie dużych odległościach wpływ jednego układu ładunków na drugi jest bardzo mały. Maxwell zauważył, że odkryte przed nim równania i prawa były wzajemnie niezgodne, jeśli chciało się je zebrać razem. Aby uzyskać wewnętrzną zgodność całego układu, musiał on dopisać do swoich równań dodatkowy wyraz. Wyraz ten pozwolił wysnuć zaskakujący wniosek.
ELEKTROMAGNETYZM 39 że pola elektryczne i magnetyczne będą częściowo zanikać znacznie wolniej niż odwrotność kwadratu odległości, a mianowicie jak odwrotność jej pierwszej potęgi! Tak więc Maxwell zrozumiał, ze prądy elektryczne w jednym miejscu mogą wpływać na inne odległe ładunki i przepowiedział wynikające stąd skutki, z którymi dzisiaj stykamy się na co dzień: transmisje radiowe, radar i tak dalej. To przecież cudownie, że kogoś mówiącego w Europie można usłyszeć w Los Angeles, w odległości tysięcy kilometrów, wyłącznie dzięki oddziaływaniom elektrycznym Jak do tego może dochodzić? Dzieje się tak, ponieważ pola zmieniają się nie jak odwrotność kwadratu odległości, ale tylko jak odwrotność jej pierwszej potęgi. Stwierdzono wreszcie, że nawet samo światło stanowi rozciągające się na wielkich odległościach oddziaływanie elektryczne i magnetyczne wytwarzane przez niewiarygodnie szybkie drgania elektronów w atomach. Wszystkie te zjawiska łączymy w pojęciu promieniowania lub bardziej dokładnie — promieniowania elektromagnetycznego, ponieważ istnieją jeszcze, jeden czy dwa, inne rodzaje promieniowania. Prawie jednak zawsze słowo promieniowanie oznacza promieniowanie elektromagnetyczne. Tak oto cały wszechświat jest wewnętrznie powiązany. Ruchy atomów odległej gwiazdy wywierają z tej wielkiej odległości wpływ wystarczający na to, aby wprawić w ruch elektrony w naszym oku. W ten sposób dowiadujemy się czegoś o gwiazdach. Gdyby to prawo nie istniało, bylibyśmy dosłownie odcięci od świata zewnętrznego! Tymczasem drgania elektryczne w galaktyce odległej o 5 miliardów lat świetlnych — w najdalszym znalezionym dotąd obiekcie — mogą jeszcze w znaczny i wykrywalny sposób wpływać na prądy w wielkim „półmisku" radioteleskopu. Właśnie dzięki temu dostrzegamy gwiazdy i galaktyki. Takie oto ważne zjawisko będzie przedmiotem rozważań obecnego rozdziału. Na wstępie naszego kursu fizyki naszkicowaliśmy ogólny obr-az świata, a ponieważ teraz jesteśmy już lepiej przygotowani do zrozumienia niektórych jego aspektów, znowu się nimi zajmiemy, ale już bardziej szczegółowo. Zacznijmy od opisu stanu, w jakim się znajdowała fizyka w końcu XIX w. Cała ówczesna wiedza o prawach podstawowych dawała się zebrać następująco. Przede wszystkim istniały prawa dla sił; jedną z sił opisywało prawo ciążenia, które już pisaliśmy wiele razy: siłę działającą na ciało o masie m, pochodzącą od innego ciała o masie M, opisuje wzór: F = GmMe,!r2, (28.1) gdzie er jest wektorem jednostkowym, skierowanym od m do M, a /-jest odległością między nimi. Dalej, prawa elektryczności i magnetyzmu, takie jak je znano w końcu XIX w., były następujące: siły elektryczne działające na ładunek q mogą być opisane za pomocą dwu pól oznaczonych E i B oraz za pomocą prędkości v ładunku q równaniem » F=g(E+vxB). (28.2) Aby uzupełnić to prawo, musimy jeszcze dopisać wzory na pola E i B w określonych warunkach. Jeśli ładunków jest więcej, zarówno pole E, jak i B jest sumą przyczynków pochodzących od poszczególnych ładunków. Jeśli więc uda się nam znaleźć pola E i B wytwarzane
40 28. PROMIENIOWANIE ELEKTROMAGNETYCZNE przez pojedynczy ładunek, wystarczy potem dodać wszystkie przyczynki od wszystkich ładunków we wszechświecie, aby otrzymać całkowite pola E i B! Na tym polega zasada superpozycji. Jak wygląda wzór na pole elektryczne i magnetyczne wytwarzane przez pojedynczy ładunek? Okazuje się, że sprawa jest bardzo skomplikowana i żeby ją zrozumieć, potrzeba długich studiów i pewnej wprawy. Ale nie to jest istotne. Napiszemy teraz wspomniane prawo po to tylko, aby czytelnik dostrzegł w nim piękno przyrody, polegające na tym, że można zebrać całą podstawową wiedzę na jednej kartce papieru, używając zapisu, z którym już jesteśmy obyci. Prawo dla pola pojedynczego ładunku jest, o ile wiemy, pełne i ścisłe (nie biorąc pod uwagę mechaniki kwantowej), ale ma postać raczej skomplikowaną. Nie będziemy teraz badać wszystkich jego aspektów. Piszemy je po to tylko, aby mieć o nim pojęcie, aby pokazać, że w ogóle można je napisać i że już teraz możemy zobaczyć, jak ono wygląda. W istocie najwygodniej zapisywać ścisłe prawa elektryczności i magnetyzmu nie tak, jak to teraz zrobimy, ale przy pomocy tak zwanych równań pola, które poznamy lepiej w tomie drugim. Ich matematyczny zapis jest jednak odmienny i nowy i dlatego wypiszemy nasze prawo w postaci niewygodnej dla rachunków, ale za to w znanym już zapisie. Pole elektryczne E dane jest wzorem q Te,., r d(t,.\ 1 d2 1 Co mówią nam poszczególne wyrazy wzoru? Weźmy pierwszy wyraz: E= —qer-/4ne0r'2. Oczywiście, jest to znane nam już prawo Coulomba: q oznacza ładunek wytwarzający pole, er. — wektor jednostkowy w kierunku od punktu P, w którym mierzymy pole E, r zaś odległość od punktu P do ładunku q. Prawo Coulomba jest jednak błędne. Odkrycia XIX w. pokazały, że oddziaływania nie mogą przenosić się szybciej niż z pewną podstawową szybkością c, którą obecnie nazywamy prędkością światła. Prawo Coulomba opisywane przez pierwszy tylko wyraz jest niepoprawne, nie tylko dlatego, że nie można wiedzieć, gdzie ładunek się teraz znajduje i w jakiej jest teraz odległości, ale także dlatego, że wpływać na pole w danym miejscu i czasie może jedynie zachowanie się ładunków w przeszłości. Jak odległa ma być ta przeszłość? Opóźnieniem w czasie, czyli tak zwaną retardacją, nazywamy czas potrzebny na to, aby z prędkością c dostać się od ładunku od punktu pola P. Opóźnienie wynosi więc r'/c. Aby uwzględnić to opóźnienie w czasie, stawiamy przy r znak' („prim"), oznaczający odległość w chwili, gdy sygnał przybywający teraz do P opuszczał ładunek q. Wyobraźmy sobie na chwilę, że ładunek niesie światło, które może przybyć do punktu P tylko z prędkością c. Gdy zatem spoglądamy na ładunek q, oczywiście widzimy nie punkt, w którym znajduje się on teraz, ale w którym się znajdował w pewnej wcześniejszej chwili. W naszym wzorze pojawia się więc pozorny kierunek 6t- — kierunek wzięty z przeszłości, zwany kierunkiem retardowanym. Pojawia się też opóźniona odległość r'. Byłoby to łatwe do zrozumienia, gdyby nie to, że jest nieprawdziwe. Cała sprawa jest znacznie bardziej złożona. We wzorze widzimy jeszcze kilka wyrazów. Następny wyraz pokazuje, z grubsza mówiąc.
bLEKTROMACNETYZM 41 jak przyroda próbuje wziąć pod uwagę fakt opóźnienia zjawiska. Mówi on, że powinniśmy obliczyć opóźnione pole kulombowskie i dodać do niego poprawkę równą iloczynowi szybkości zmiany pola przez opóźnienie. Przyroda jak gdyby próbuje ocenić, jakie ma być pole w obecnej chwili, biorąc szybkość jego zmiany i mnożąc ją przez opóźnienie. We wzorze widzimy jeszcze trzeci wyraz — drugą pochodną czasową jednostkowego wektora skierowanego do ładunku. W ten sposób wyczerpaliśmy cały wzór i to jest wszystko, co się tyczy pola elektrycznego pochodzącego od dowolnie poruszającego się ładunku. Pole magnetyczne dane jest wzorem B=-e,.xE/c (28.4) Znowu napisaliśmy to tylko dla pokazania piękna przyrody lub, inaczej mówiąc, potęgi matematyki. Nie staramy się zrozumieć, dlaczego można napisać tak wiele na tak małej przestrzeni, ale przecież wzory (28.3) i (28.4) opisują mechanizm, dzięki któremu pracują prądnice elektryczne, działa światło, zachodzą wszystkie zjawiska elektryczne i magnetyczne. Dla uzupełnienia całej sprawy powinniśmy oczywiście powiedzieć coś jeszcze o zachowaniu się wchodzących w grę ośrodków materialnych, o własnościach materii, które nie są poprawnie opisane przez wzór (28.3). Aby zakończyć nasz opis dziewiętnastowiecznego świata fizyki, musimy jeszcze wspomnieć o innej syntezie, której dokonano w tym stuleciu. Była to synteza zjawisk ciepła i mechaniki, a Maxwell i w niej miał swój wielki udział. Będziemy się wkrótce zajmować i tym tematem. W wieku XX okazało się, że potrzebne są uzupełnienia. Odkryto, że prawa dynamiki Newtona są zupełnie fałszywe, a dla ich poprawienia należało wprowadzić mechanikę kwantową. Prawa Newtona są słuszne w przybliżeniu, wtedy gdy rozmiary obiektów materialnych są dostatecznie duże. Owe prawa mechaniki kwantowej zostały zupełnie niedawno połączone z prawami elektryczności w jeden układ praw zwany elektrodynamiką kwantową. Odkryto ponadto liczne nowe zjawiska, z których pierwszym była promieniotwórczość. Odkryta przez Becquerela w roku 1898, jakby wkradła się jeszcze do wieku XIX. Odkrycie zjawiska promieniotwórczości doprowadziło do stworzenia naszej wiedzy o jądrach atomowych i o nowym rodzaju sił, które nie są ani grawitacyjne, ani elektryczne. Chodzi tu o nowe cząstki przejawiające się w różnych oddziaływaniach. Zagadnienie to nie zostało jeszcze dotąd rozwikłane. Dla dbających o ścisłość, tych, którzy wiedzą więcej (np. dla profesorów, którym przyjdzie czytać tę książkę), trzeba dodać, że nie jest zupełnie, dokładne mówienie o wzorze (28.3) jako o pełnym wyrażeniu wiedzy o elektrodynamice. Do końca XIX w. nie został mianowicie w pełni rozwiązany pewien problem. Usiłując obliczyć pole od wszystkich 'adunków, włączając w to i ten ładunek, na który ma działać pole, natrafiamy na kłopot dzieląc na przykład jakieś wyrażenie przez odległość ładunku od siebie samego, wynosi ona bowiem zero. Kwestia, jak poradzić sobie z częścią pola, wytwarzaną przez ten ładunek, na który pole ma działać, nie jest jeszcze rozwiązana i do dzisiaj. Pozostawiamy ją więc, tek jak jest. Nie mając jeszcze całkowitego rozwiązania zagadki, będziemy jej unikać tek długo, jak tylko się da.
42 28. PROMIENIOWANIE ELEKTROMAGNETYCZNE 28-2. Promieniowanie Tak oto w skrócie wygląda obraz świata. Posłużymy się nim teraz podczas omawiania zjawisk zwanych promieniowaniem. W tym celu musimy wybrać z równania (28.3) tylko te wyrazy, które zmieniają się jak odwrotność odległości, a nie jak odwrotność jej kwadratu. Gdy je w końcu znajdziemy, okażą się one tak proste w swej postaci, że uzasadnione będzie badanie optyki i elektrodynamiki w sposób elementarny, traktując rozważaną część wzoru jako „prawo" pola elektrycznego, wytwarzanego przez poruszający się, odległy ładunek. Na razie potraktujemy to prawo jako dane, a w następnym tomie poznamy je bardziej szczegółowo. Pierwszy z wyrazów występujących we wzorze (28.3) zachowuje się oczywiście jak odwrotność kwadratu odległości, a drugi stanowi tylko poprawkę do opóźnienia. Łatwo więc pokazać, że oba te wyrazy zmieniają się jak odwrotność kwadratu odległości. Wszystkie interesujące nas efekty pochodzą od wyrazu trzeciego, który wcale nie jest taki skomplikowany. Oto co nam ten wyraz daje: spójrzmy na ładunek i zastanówmy się nad kierunkiem wektora jednostkowego (którego koniec możemy zrzutować na powierzchnię kuli jednostkowej). Gdy ładunek kręci się dookoła, wektor jednostkowy kołysze się, my zaś interesujemy się jego przyspieszeniem. I to wszystko. Wobec tego wzór jest sformułowaniem praw promieniowania. Zawiera on bowiem jedyny ważny wyraz dla odległości wystarczająco dużych na to, aby pola zmieniały się jak odwrotność odległości (wyrazy zachowujące się jak odwrotność kwadratu odległości wygasają na tyle, że nie trzeba się nimi interesować). Zajmijmy się teraz bardziej wnikliwie wzorem (28.5) i zobaczmy, co on oznacza. Załóżmy, że obserwujemy z pewnej odległości dowolnie poruszający się ładunek. Wyobraźmy sobie na chwilę, że został on w pewien sposób „zaświecony" (chociaż właśnie staramy się wytłumaczyć zjawisko światła) i widzimy go jako mały biały punkcik. Punkcik ten porusza się dookoła. Nie widzimy jednak dokładnie, jak biegnie on teraz, w danej właśnie chwili, z powodu opóźnienia, o którym mówiliśmy. To, co obserwujemy, jest jego ruchem wcześniejszym. Jednostkowy wektor er wskazuje kierunek pozornego położenia ładunku. Koniec wektora e„ porusza się oczywiście po torze lekko zakrzywionym tak, że jego przyspieszenie ma dwie składowe. Jedna — to składowa transwersalna, ponieważ koniec wektora porusza się w dół i w górę. a druga - to składowa radialna, ponieważ wektor stale leży na kuli. Łatwo pokazać, że ta ostatnia składowa jest znacznie mniejsza i dla bardzo dużych r zmienia się jak odwrotność kwadratu r. Wyobraźmy sobie bowiem, że nasze źródło odsuwamy coraz dalej. Kołysanie się wektora er będzie coraz to mniej widoczne, odwrotnie proporcjonalnie do odległości, natomiast radialna składowa przyspieszenia będzie się zmieniała znacznie szybciej. Do celów praktycznych musimy więc zrzutować ruch na płaszczyznę w odległości jednostkowej. W ten sposób dochodzimy do następującej reguły: Przedstawmy sobie, że patrzymy na poruszający się ładunek i wszystko widzimy opóźnione — tak jak widzi to malarz starający się namalować jakąś scenę na ekranie w odległości jednostkowej.
,2 PBOMIENIOWANIF 43 prawdziwy malarz nie bierze jednak pod uwagę faktu, że światło porusza się z pewną szybkością. a'e maluje świat tak, jak go widzi. Zastanówmy się, jak będzie tutaj wyglądał jego 0braz. Zobaczymy punkcik przedstawiający ładunek, poruszający się dookoła na obrazie. Przyspieszenie tej kropki jest proporcjonalne do pola elektrycznego. 1 to jest wszystko, czego potrzebujemy. Tak więc równanie (28.5) stanowi pełny i poprawny wzór dla promieniowania; nawet wszystkie efekty relatywistyczne są w nim zawarte. Często jednak chcemy stosować wzór w jeszcze prostszych warunkach, w których ładunki przesuwają się niewiele ze stosunkowo małą prędkością. Poruszając się powoli nie oddalają się znacznie od punktu wyjścia, tak że opóźnienie jest praktycznie stałe. Prawo staje się wówczas jeszcze prostsze, ponieważ opóźnienie jest ustalone. Wtedy możemy sobie wyobrazić, że ładunek wykonuje niewielkie ruchy w praktycznie stałej odległości. Opóźnienie w odległości r wynosi r/c. Wobec tego nasza reguła staje się następująca: jeżeli naładowany przedmiot wykonuje małe ruchy i poprzecznie przesuwa się o odległość x(t), kąt, o który przesuwa się wektor er-, wynosi x/r, a ponieważ r jest praktycznie stałe, więc składowa x-owa d2er-/dt2 jest po prostu przyspieszeniem samego x wziętym we wcześniejszym czasie. W ten sposób dostajemy wreszcie szukane prawo, które brzmi: £,(')=—~-\ax(t-r). (28.6) 4n£0 er \ c) Ważna jest tylko składowa ax, prostopadła do kierunku obserwacji. Zobaczymy, dlaczego tak się dzieje. Jeżeli ładunek porusza się tam i z powrotem dokładnie w naszym kierunku, to jednostkowy wektor w tym kierunku nie kołysze się wcale i nie doznaje przyspieszenia. A więc ważny jest jedynie ruch poprzeczny, tylko to przyspieszenie, które widzimy zrzutowa- ne na ekran. 28-3. Dipol promieniujący Przyjmiemy teraz, że nasze podstawowe „prawo" promieniowania elektromagnetycznego jest dane wzorem (28.6), czyli że pole elektryczne, wytworzone przez przyspieszany ładunek poruszający się nierelatywistycznie, przyjmuje postać (28.6) w przybliżeniu dla bardzo dużej odległości r. Pole elektryczne zmienia się jak odwrotność r i jest proporcjonalne do rzutu przyspieszenia ładunku na „płaszczyznę obserwacji". Przyspieszenie to jest nie przyspieszeniem ładunku w danej chwili, ale przyspieszeniem w czasie wcześniejszym o wielkość r\c Pozostałą część tego rozdziału poświęcimy omówieniu tego właśnie prawa. Chodzi ° to, żeby lepiej zrozumieć jego sens fizyczny, ponieważ posłuży nam ono do zrozumienia wszystkich zjawisk z dziedziny rozchodzenia się światła i fal radiowych, tzn. zjawisk odbicia, załamania, interferencji, ugięcia i rozpraszania. Prawo to jest kluczowe i obejmuje Wszystko, co potrzebujemy. Cała reszta równania (28.3) została wypisana tylko „dla dekoracji", tak abyśmy mogli zdać sobie sprawę, skąd się bierze wzór (28 6) i w jakim sensie należy go rozumieć. Szerzej będziemy omawiać wzór (28.3) dopiero w drugim tomie. Na razie założymy,
44 28. PROMIENIOWANIE ELEKTROMAGNETYCZNE że jest on słuszny, ale nie tylko teoretycznie. Możemy obmyśleć kilka doświadczeń, które zilustrują charakter tego prawa. Będzie nam do tego potrzebny przyspieszany ładunek. Powinien to być ładunek pojedynczy, ale wiemy, że wprawiając w taki sam ruch wielką liczbę ładunków, otrzymujemy pole będące sumą przyczynków od każdego z nich: po prostu dodamy je razem. Rozważmy jako przykład dwa kawałki drutu połączone z generatorem tak, jak pokazano na rys. 28.1. Idea polega na tym, że generator wytwarza różnicę potencjałów, czyli pole, które w pewnej chwili wyciąga elektrony z części A i wpycha je w B, a następnie, po bardzo krótkim czasie, odwraca działanie i wyciąga elektrony z części B przepompowując je z powrotem do A\ A więc ładunki w obu drutach zostaną w pewnym momencie przyspieszone powiedzmy do góry w drucie A i do góry w drucie B, w chwilę później zaś zostaną przyspieszone do dołu w drucie A i do dołu w drucie B. Układ dwu drutów z generatorem stanowi tylko pewien sposób wykonania doświadczenia. W istocie chodzi tu o to, że mamy po prostu ładunek przyspieszany tam i z powrotem, tak jak gdyby A i B stanowiły jeden drut. Drut, który jest bardzo krótki w porównaniu z odległością przebywaną przez światło w jednym okresie drgań, nazywamy elektrycznym dipolem drgającym. Znajdujemy się więc w sytuacji, w której trzeba zastosować nasze prawo mówiące, że ładunek taki wytwarza pole elektryczne. Do wykrycia tego pola potrzebny jest nam jakiś przyrząd. Posłużymy się w tym celu parą takich samych drutów jak A i B\ Pole elektryczne działając na takie urządzenie wytwarza w obu drutach siłę pchającą elektrony w górę lub w dół. Sygnał ten zostanie wykryty za pomocą prostownika włączonego między druty A i B, cienki zaś drut przeniesie informację do wzmacniacza, który wzmocni ją tak, że usłyszymy ton o częstości akustycznej, którą jest modulowana częstość radiowa. Gdy taka sonda wyczuje pole elektryczne, pojawia się donośny dźwięk z głośnika, gdy zaś wzbudzającego ją pola elektrycznego nie będzie, nie pojawi się również i dźwięk. Ponieważ pokój, w którym wykonujemy pomiary, zawiera także inne przedmioty, nasze pole elektryczne będzie i w nich poruszało elektrony. Pole elektryczne spowoduje ruch tych ładunków tam i z powrotem, one zaś z kolei będą też miały wpływ na naszą sondę. Aby zatem doświadczenie wypadło należycie, musimy poszczególne części układu ustawić dość blisko siebie, tak aby działanie ścian i nas samych, czyli fale odbite, były stosunkowo małe. Efekt nie będzie więc idealnie zgodny z równaniem (28.6), ale jego zgodność będzie jednak na tyle dobra, że umożliwi nam ocenę wartości samego prawa. Włączmy teraz generator i posłuchajmy sygnału dźwiękowego. Wykrywamy silne pole wtedy, gdy detektor Z) jest równoległy do generatora w punkcie 1 (rys. 28.2). Tę samą wielkość pola znajdujemy także przy każdym innym azymutalnym kącie względem osi generatora G, ponieważ zjawisko nie jest kierunkowe. Z drugiej strony, gdy detektor znajduje się w punkcie 3, pole okazuje się równe zeru. Tak być powinno, ponieważ nasz wzór orzeka, że pole ma być proporcjonalne do przyspieszenia ładunku zrzutowanego prostopadle do kierunku obserwacji. Jeśli więc będziemy patrzeć na generator G z punktu 3, ładunek ł fc-—-^ ■= generator % 28.1. Generator sygnałów o wysokiej częstości porusza tam i z powrotem ładunki w dwóch drutach
,j DIPOL PROMIENIUJĄCY 45 będzie się poruszał wzdłuż kierunku GD i efekt nie wystąpi. W ten sposób sprawdzamy pierwszą regułę, mówiącą, że nie ma efektu wtedy, gdy ładunek porusza się prosto na nas. Wzór nasz również orzeka, że pole elektryczne ma być prostopadłe do r i do płaszczyzny, w której leży generator G i promień r. Umieszczając więc w punkcie / detektor D, obrócony o90°,nie powinniśmy odebrać sygnału. Możemy to rzeczywiście stwierdzić; pole elektryczne jest więc naprawdę pionowe, a nie poziome. Obracając detektor D o jakiś pośredni kąt zauważymy, że najsilniejszy sygnał pojawi się przy takiej orientacji D.jak pokazano to na rysunku, bo chociaż generator G jest ustawiony pionowo, to jednak powstające pole nie jest do niego po prostu równoległe — ważny jest rzut przyspieszenia prostopadły do linii obserwacji. Sygnał jest słabszy w punkcie 2 nit w 1 właśnie w wyniku rzutowania. 28.2. Chwilowe pole elektryczne na kuli, której środek pokrywa się ze zlokalizowanym, liniowo drgającym ładunkiem 28-4. Interferencja Sprawdźmy teraz, co się dzieje, gdy mamy dwa źródła umieszczone obok siebie w odległości kilku centymetrów (rys. 28.3). Prawo nasze stwierdza, że efekty obu źródeł dodadzą się w punkcie / wtedy, gdy oba źródła będą przyłączone do tego samego generatora i oba będą się w ten sam sposób poruszały tam i z powrotem. Całkowite pole elektryczne będzie wtedy ich sumą, a więc będzie dwa razy silniejsze niż poprzednio. Pojawia się teraz ciekawa możliwość. Załóżmy, że przyspieszamy tam i z powrotem ładunki w punktach S, i S2, ale S2 spóźnia się tak, że ruchy ładunków różnią się w fazie o 180°. Gdy w danej chwili pole wytwarzane przez źródło 5i będzie miało pewien kierunek, pole wytworzone przez źródło S2 będzie miało kierunek przeciwny. Wobec tego nie powinniśmy znaleźć żadnego efektu w punkcie /. Fazę drgań można zręcznie dobrać za pomocą rury, przenoszącej sygnał do punktji S2. Zmie- n'ając jej długość zmieniamy czas zużywany Przez sygnał na dotarcie do punktu S2 i w ten sPosób zmieniamy fazę drgań. Dobierając Ją możemy rzeczywiście znaleźć takie miejsce, w którym nie pojawi się już żaden sygnał, mimo że zarówno źródło 5,, jak i S2 będą się Poruszały! Łatwo możemy sprawdzić, że oba 28.3. Ilustracja interferencji źródeł widok z góry
28.4. Ilustracja składania źródeł wektorowego charakteru ładunki znajdują się w ruchu, usuwając po prostu jeden z nich i stwierdzając ruch drugiego. Oba więc łącznie mogą dawać pole równe zeru, pod warunkiem że wszystko zostało należycie, dopasowane! Jest rzeczą interesującą, że dodawanie obu pól jest naprawdę dodawaniem wektorowym. Sprawdziliśmy to właśnie dla ruchu w górę i w dół, ale sprawdźmy i dla dwu kierunków nierówno- ległych. Najpierw przywracamy źródłom 5, i 52 jednakowe fazy, to znaczy że znowu będą się one poruszały zgodnie. Obróćmy teraz źródło S,o90D, jak pokazano na rys. 28.4. W punkcie 1 powinniśmy znaleźć sumę dwu efektów, z których jeden będzie związany z kierunkiem pionowym, a drugi z poziomym. Pole elektryczne będzie sumą wektorową tych dwu sygnałów w fazie - oba one będą równocześnie najsilniejsze i oba jednocześnie przejdą przez zero. Przy 45° całkowite pole powinno dawać sygnał R. Obracając detektor D w poszukiwaniu maksymalnego dźwięku, powinniśmy go znaleźć przy położeniu 45°, a nie przy pionowym. Ustawiając detektor D prostopadle do tego kierunku, powinniśmy otrzymać natężenie zerowe, co łatwo zmierzyć. Takie właśnie zachowanie możemy stwierdzić w rzeczywistości! Jak się przedstawia sprawa z retardacją? W jaki sposób możemy wykazać, że sygnał jest opóźniony? Dysponując wielkim' wyposażeniem moglibyśmy wprawdzie zmierzyć czas przybycia sygnału, ale istnieje też inny bardzo prosty sposób. Spójrzmy znowu na rys. 28.3 i załóżmy, że źródła Si i S2 są w fazie. Oba one drgają więc zgodnie i wytwarzają równe pola elektryczne w punkcie /. Przesuńmy się jednak do pewnego punktu 2, znajdującego się bliżej źródła S2, a dalej od 5,. Ponieważ zasada nasza mówi, że przyspieszenia powinny być opóźnione o wielkość równą r/c, to skoro retardacje nie będą równe, sygnały nie będą w fazie. Można więc znaleźć położenie, w którym odległości detektora D do źródeł S{ i S2 będą się różnić o pewną wielkość A, taką że wypadkowy sygnał wcale się nie pojawi. Odległość A musi przy tym być odległością, którą światło przebywa w ciągu połowy jednego drgania generatora. Możemy się przesunąć jeszcze dalej i znaleźć punkt, w którym różnica wyniesie cały okres, co będzie znaczyło, że sygnał z pierwszej anteny osiągnął punkt 5 z opóźnieniem, które będzie większe niż opóźnienie sygnału z drugiej anteny, dokładnie o czas potrzebny prądowi elektrycznemu do wykonania jednego drgania. Wobec tego dwa pola elektryczne wytworzone w punkcie 3 będą znowu w fazie. W punkcie 3 sygnał będzie więc znowu silny. W ten sposób wyczerpaliśmy naszą dyskusję, polegającą na doświadczalnym sprawdzeniu niektórych ważnych cech równania (28.6). Oczywiście, naprawdę nie sprawdziliśmy' że natężenie pola elektrycznego zmienia się jak l/r, ani że istnieje pole magnetyczne towarzyszące polu elektrycznemu. Sprawdzenie tego wymagałoby dość złożonej techniki i "lC prawie by nam nie pomogło w zrozumieniu istoty sprawy. Sprawdziliśmy w każdym razie te własności, które są najważniejsze dla naszych dalszych zastosowań. W drugim toffii' wrócimy znowu do badania pozostałych własności fal elektromagnetycznych.
29 interferencja 29-1. Fale elektromagnetyczne W rozdziale tym będziemy nadal omawiać zagadnienia z poprzedniego rozdziału, ale ujmiemy je od strony matematycznej. Pokazaliśmy już, posługując się jakościowymi argumentami, że w polu promieniowania dwóch źródeł istnieją maksima i minima. Obecnie stoi przed nami problem opisania pola nie tylko jakościowo, ale ze szczegółami matematycznymi. Podaliśmy już zupełnie zadowalającą analizę fizycznego sensu wzoru (28.6). Pozostało nam jeszcze kilka spraw, które ujmiemy od strony matematycznej. Przede wszystkim, gdy ładunek, przyspieszany tam i z powrotem wzdłuż prostej, wykonuje ruch o bardzo raa- 'ej amplitudzie, pole obserwowane pod pewnym kątem 0 względem osi ruchu skierowane jest prostopadle do kierunku obserwacji i leży w płaszczyźnie zawierającej ten kierunek i kierunek przyspieszenia (rys. 29.1). Niech r będzie odległością; w chwili / pole elektryczne b?dzie miało wartość <°K) — sin 6 29.1. Pole elektryczne E pochodzące od ładunku, którego opóźnione przyspieszenie wynosi a' £(,)= 1 1^ f (29.1) 4ite0 er « Zle a{t~rjc) jest przyspieszeniem w chwi ~rlc), zwanym przyspieszeniem opóźnionym. iekawe będzie teraz narysowanie obrazu adu pola w różnych warunkach. Najbardziej eresującym czynnikiem we wzorze (29.1) jest ciście czynnik a(t-rjc). Aby zrozumieć
48 29. 1KTERFERENCJA 29.2. Przyspieszenie ładunku jako funkcja czasu. £ ' jego sens, weźmy najprostszy przypadek, gdy kąt 6 = 90°, i wyrysujmy graficzny obraz pola. Poprzednio zastanawialiśmy się nad zagadnieniem jak pole zmienia się z czasem przy ustalonym położeniu. Teraz natomiast zobaczymy, jak wygląda pole w różnych punktach przestrzeni w danej chwili. Chcemy więc podać coś w rodzaju „migawkowego" zdjęcia, które by nam powiedziało, jak wygląda pole w różnych punktach. Zależy ono oczywiście od przyspieszenia ładunku. Załóżmy, że początkowo ładunek wykonywał określony ruch: najpierw spoczywał, potem nagle został przyspieszony w taki sposób, jak pokazuje rys. 29.2, wreszcie się zatrzymał. W chwilę później mierzymy pole w jakimś innym punkcie. Możemy stwierdzić, że będzie ono wówczas tak wyglądało, jak pokazuje to rys. 29.3. Pole w każdym punkcie określone jest przez przyspieszenie ładunku w chwili wcześniejszej o opóźnienie r/c. Pole w coraz dalszych punktach jest wyznaczone przez przyspieszenie ładunku w odpowiednio wcześniejszych chwilach. A więc krzywa na rys. 29.3 rzeczywiście jest, w pewnym sensie, „odwróconym" wykresem przyspieszenia jako funkcji czasu; odległość jest związana z czasem poprzez stały czynnik przeliczeniowy c, który często przyjmujemy równy jedności. Łatwo to widzieć, rozpatrując zachowanie się funkcji a(t —r/c). Jeśli dodamy niewielki czas At, to otrzymamy oczywiście tę samą wartość a(t—r/c), którą byśmy otrzymali odejmując niewielką odległość Ar= -cAt. Ujmijmy to inaczej: jeśli dodamy niewielki czas At, to poprzednią wartość a(t—r/c) możemy przywrócić przez dodanie niewielkiej odległości Ar=c At. Znaczy to, że w miarę upływu czasu pole porusza się jak fala w kierunku od źródła. Dlatego też mówimy niekiedy, że światło rozchodzi się ruchem falowym. Jest to równoważne powiedzeniu, że pole jest opóźnione, albo powiedzeniu, że pole elektryczne porusza się w kierunku od źródła w miarę upływu czasu. Ciekawy przypadek mamy wtedy, gdy ładunek q porusza się tam i z powrotem ruchem drgającym. W doświadczalnie badanym przypadku z ostatniego rozdziału przesunięcie X w każdej chwili t było równe pewnej stałej x0 oznaczającej wielkość drgań, pomnożonej przez cos cat. Przyspieszenie w tym ruchu wynosi 29.3. Pole elektryczne jako funkcja położenia w późniejszej chwili (pominięta jest zmienność typu l/r) a= — co2x0 cosoof=a0 coscof, (29.2) gdzie a0 jest przyspieszeniem maksymalnym, równym — o)2x0. Wstawiając ten wzór do równania (29.1) znajdujemy ■i
FALE ELEKTROMAGNETYCZNE 49 E- —ą sin0 a0 cos co (t —r/c) (29.3) 4jt£0 rc2 Pomijając teraz kąt 0 i stałe czynniki spójrzmy, jak wygląda pole jako funkcja położenia lub jako funkcja czasu. 29-2. Energia promieniowania Zwróćmy przede wszystkim uwagę, że w każdej określonej chwili lub w każdym określonym miejscu natężenie pola zmienia się jak odwrotność odległości r, zgodnie z tym, cośmy mówili poprzednio. Natomiast zasób energii w fali albo też działanie energetyczne, jakie może przejawiać pole elektryczne, jest proporcjonalne do kwadratu pola. Weźmy bowiem na przykład jakiś ładunek lub oscylator w polu elektrycznym. Działanie pola wprawia go w ruch. Jeżeli będzie to oscylator liniowy, to przyspieszenie, prędkość i przesunięcie spowodowane polem elektrycznym działającym na ładunek będą proporcjonalne do pola, zatem energia kinetyczna ładunku będzie proporcjonalna do kwadratu pola. Przyjmijmy więc, że energia, którą pole może przekazać układowi, jest w pewien sposób proporcjonalna do jego kwadratu. Oznacza to, że energia, którą pole może przekazać, spada w miarę oddalania się od źródła: zmienia się ona dokładnie jak odwrotność kwadratu odległości. Fakt ten ma bardzo prostą interpretację: zbierzmy całą możliwą energię fali w pewnym stożku w odległości r, (rys. 29.4) i zróbmy to samo w innej odległości r2; okazuje się, że ilość energii na jednostkę powierzchni w każdym miejscu zmienia się jak odwrotność kwadratu r. Pole powierzchni objętej stożkiem zmienia się wprost jak kwadrat r, zatem energia, którą możemy wybrać z fali w danym kącie stożkowym, jest zawsze taka sama, bez względu na to, jak daleko się znajdujemy. W szczególności dokładnie ustaloną wartość ma całkowita energia, jaką moglibyśmy uzyskać z pełnej fali, umieszczając wszędzie dookoła pochłaniające oscylatory. Tak więc zmienność amplitudy £ jak I jr oznacza to samo, co stwierdzenie, że istnieje strumień energii, który nigdy się nie gubi, że istnieje energia, która rozchodzi się coraz dalej i rozprzestrzenia się na coraz to większej powierzchni efektywnej. Widzimy więc, że drgający ładunek traci pewną energię, której n'gdy nie może odzyskać; energia wciąż rozcho- zi się coraz dalej, bez ubytku. Jeśli więc znajdziecie tak daleko, że nasze zasadnicze przybliżenie spełnione, ładunek nie może już odzyskać ener- e'> która została, jak mówimy, wypromieniowana. ergia ta naturalnie wciąż gdzieś istnieje i można Zebrać przy pomocy innych układów. W rożnie 32 będziemy dalej jeszcze badać tę „stratę" energii. . . 29.4. Energia zawarta w stożku O A BCD nie zależy od odległości r, w której jest mierzona
50 29. INTERFERENCJA Rozpatrzmy teraz dokładniej zmiany fali określonej wzorem (29.3) jako funkcję czasu / w danym miejscu i jako funkcję położenia w danym punkcie. Nadal pomijamy zmienność typu l/r i wszystkie stałe. 29-3. Fale sinusoidalne Ustalmy najpierw położenie r i przyjrzyjmy się polu jako funkcji czasu. Ma ono charakter drgań o częstości kątowej co. Częstość kątowa oj może być określona jako szybkość zmiany fazy w czasie (w radianach na sekundę). Pojęcie to powinno być nam znane, ponieważ badaliśmy już podobne rzeczy. Okres jest czasem potrzebnym na wykonanie jednego drgania, jednego całkowitego cyklu, co również już wyprowadzaliśmy; wynosi on 2jt/a>, ponieważ co pomnożone przez okres daje jeden cykl cosinusa. Wprowadźmy teraz nową wielkość, bardzo szeroko stosowaną w fizyce. Pojawia się ona w sytuacji odwrotnej, gdy mianowicie ustalamy / i obserwujemy falę jako funkcję odległości r. Oczywiście widzimy, że jako funkcja odległości r fala określona równaniem (29.3) ma także charakter oscylacyjny. To znaczy, że poza pomijanymi wyrazami typu l/r dostrzegamy drgania £ ze zmianą położenia. Przez analogię z co możemy więc zdefiniować wielkość zwaną liczbą falową, oznaczaną przez k. Określa się ją jako szybkość zmian fazy z odległością (w radianach na metr). A więc faza zmienia się, gdy w ustalonej chwili zmieniamy położenie w przestrzeni. Istnieje jeszcze inna wielkość, odpowiadająca okresowi. Moglibyśmy ją nazwać okresem przestrzennym, ale zwykle bywa nazywana długością fali i oznaczana literą X. Długość fali jest odległością zajmowaną przez jeden całkowity cykl. Łatwo więc widzieć, że długość fali wynosi 2njk, ponieważ k pomnożone przez długość fali jako iloczyn szybkości zmian radianów na metr i liczby metrów daje nam zmianę liczby radianów, która w jednym cyklu wynosi 2n. A więc równość kA = 2n jest analogiczna do równości cot0 — 2n. Chociaż powyższy związek między częstością i długością fali wyprowadziliśmy tylko dla naszej szczególnej fali, to jednak podane definicje wielkości k i co są faktycznie zupełnie ogólne. Znaczy to, że w innych sytuacjach fizycznych długość fali i częstość nie muszą być ze sobą związane w taki właśnie sposób. W naszym przypadku łatwo wyznaczyć szybkość zmiany fazy z odległością, ponieważ jeśli fazą nazwiemy ę—co{t — rjc) i zróżniczkujemy (cząstkowo) względem odległości r, to szybkość zmian dęjdr wyniesie \dq> dr CO = *=-. (29.4) c Wynik ten można przedstawić na wiele sposobów: X = ct0, (29.5) co = ck, (29.6) Av = c, (29.7) o>k = 2nc. (29.8)
3 FALE SINUSOIDALNE 51 Dlaczego długość fali jest równa okresowi pomnożonemu przez r? Odpowiedź jest oczywiście bardzo prosta: ponieważ jeśli siedzimy w miejscu czekając na upłynięcie jednego okresu, fale posuwając się z prędkością c przebywają odległość ct0 i oczywiście przesuwają się dokładnie o jedną długość fali. Dla obiektów fizycznych różnych od światła wielkość k nie musi być tak prosto związana z w. Jeżeli odległość mierzoną wzdłuż pewnej osi oznaczymy x, wzór na cosinusową falę poruszającą się w kierunku osi x o liczbie falowej k i o częstości kątowej w zapisuje się ogólnie jako cos{iot~kx). Ponieważ wprowadziliśmy już pojęcie długości fali, możemy więcej powiedzieć o warunkach, w których wzór (29.1) jest prawdziwy. Przypomnijmy sobie, że pole zbudowane jest z kilku części, z których jedna zmienia się jak odwrotność r, druga jak odwrotność r2, a inne zmieniają się nawet szybciej. Warto by wiedzieć, w jakich warunkach część pola typu \jr jest najważniejsza, a inne są stosunkowo mało ważne. Odpowiemy oczywiście, że następuje to wtedy, gdy odsuniemy się „dostatecznie daleko", bowiem wyrazy, które zmieniają się jak odwrotność kwadratu, można wreszcie pominąć w porównaniu z wyrazem l/r. Zapytajmy jednak: co rozumieć przez „dostatecznie daleko"? Jakościowa odpowiedź mówi, że wyższe wyrazy są mniejsze od wyrazu l/r o rząd A/r. Jeśli więc tylko znajdziemy się dalej niż kilka długości fali, wyrażenie (29.1) stanowić będzie doskonałe przybliżenie dla pola. Obszar znajdujący sią poza zasięgiem kilku długości fali nazywamy niekiedy „strefą falową". 29-4. Dwa dipole promieniujące Rozważmy zagadnienia matematyczne pojawiające się przy składaniu działania dwu oscylatorów, gdy szukamy wypadkowego pola w ustalonym punkcie. Dla tych kilku przypadków, które rozważaliśmy w poprzednim rozdziale, jest to bardzo łatwe zadanie. Wyniki opiszemy najpierw jakościowo, a następnie bardziej ilościowo. Weźmy prosty przypadek oscylatorów, których środki leżą w tej samej poziomej płaszczyźnie co detektor, kierunek zaś drgań jest pionowy. Rysunek 29.5a przedstawia takie dwa oscylatory widziane z góry, przy czym w tym szczególnym przykładzie odległość ich wynosi pół długości fali w kierunku N-S, a drgają one zgodnie w fazie, którą nazywamy fazą zerową. Chcemy teraz poznać natężenie promieniowania w różnych kierunkach. Przez natężenie rozumiemy ilość energii, którą w ciągu sekundy pole przenosi mimo nas i która jest proporcjonalna do kwadratu pola uśrednionego w czasie. Gdy chcemy znać jasność światła, wówczas wielkością, na którą trzeba zwracać uwagę, jest nie samo pole, a jego kwadrat. (Pole elektryczne podaje natężenie siły odczuwanej przez spoczywający ładunek, zasób zaś przepływającej energii w watach "a metr kwadratowy jest proporcjonalny do kwadratu pola elektrycznego. Stałą tej proporcjonalności wyprowadzimy w następnym rozdziale.) Jeśli spoglądamy na nasz układ °d strony W (zachodniej), oba oscylatory dają przyczynki równe i zgodne w fazie, tak że Pole elektryczne jest dwukrotnie silniejsze niż pole pochodzące od pojedynczego oscylatora, więc natężenie będzie cztery razy większe niż natężenie jednego oscylatora. (Liczby na
52 29. IHTERFEREHCJA -i?*-!'.' wypromicnłowywane w r&taych kierunkach przez dwa drgające dipole odległe o pót UH: ft) ffczy zgodne (<*=0), b) fazy ptzesunięte o pól okresu (<*=*) rys. 29.5 określają w tym przypadku wartość natężenia w porównaniu z pojedynczym oscylatorem o natężeniu jednostkowym.) Weźmy teraz kierunek wzdłuż linii łączącej oscylatory; może to być kierunek N lub S. Ponieważ oscylatory są rozsunięte o pół długości fali, więc efekt jednego z nich będzie przesunięty w fazie względem drugiego dokładnie o pół drgania i składanie pól da w wyniku natężenie zerowe. Przy pewnym kącie pośrednim (dokładnie przy 30°) natężenie wynosi 2 i spada: mamy więc natężenie równe 4, 2, 0 i tak dalej. Musimy się nauczyć znajdowania tych liczb dla innych kątów. Sprawa polega na dodawaniu dwu drgań z różnymi fazami. Spójrzmy jeszcze pokrótce na niektóre inne ciekawe przypadki. Załóżmy, że oscylatory nadal są rozsunięte o połowę długości fali, ale faza a jednego z nich wyprzedza o pół okresu drgań fazę drugiego (rys. 29.5b). Natężenie w kierunku W jest teraz zerowe, ponieważ gdy jeden z oscylatorów „pcha", drugi „ciągnie". W kierunku N natomiast sygnał od bliższego oscylatora w danej chwili wyprzedza o pół okresu sygnał od drugiego. Ale ten ostatni został od razu ustawiony na spóźnianie się o pół okresu, są więc one teraz dokładnie zgodne w czasie i natężenie w tym kierunku wynosi zatem 4 jednostki. Natężenie pod kątem 30° wynosi nadal 2, co wykażemy później. Dochodzimy teraz do ciekawego przypadku, który wykazuje pewne własności, mogące mieć znaczenie w zastosowaniach. Zauważmy, że wśród powodów, dla których interesujemy się związkami fazowymi w oscylatorach, jest sprawa kierunkowych nadajników radiowych. Wyobraźmy sobie na przykład, że zbudowaliśmy układ anten i chcemy posłać sygnał radiowy powiedzmy na Hawaje. Ustawiamy wówczas anteny tak, jak na rys. 29.5a, i nadajemy za pomocą dwóch anten w fazie, ponieważ Hawaje znajdują się na zachód od Kalifornii. Następnego dnia postanawiamy nadawać w kierunku Alberty w Kanadzie. Ponieważ kierunek jest teraz północny a nie zachodni, wystarczy odwrócić fazę jednej z naszych anten i możemy już nadawać na północ. W ten sposób możemy budować rozmaicie ustawione układy anten. Nasz układ jest jednym z najprostszych możliwych; można budować układy znacznie bardziej skomplikowane i przez zmiany fazy w różnych antenach wysyłać wiązki w rozmaitych kierunkach, posyłając większość mocy tam, dokąd chcemy przesłać informacje, i to nie poruszając nawet anteną! W obu poprzednich przypadkach stosowaliśmy jednak metodę, w której nadając na przykład w stronę Alberty traciliśmy mnóstwo mocy na rzecz
-j.4 DWA DIPOLE PROMIENIUJĄCE 53 Wyspy Wielkanocnej. Ciekawa byłaby więc kwestia: czy można posyłać moc tylko w jednym kierunku? Na pierwszy rzut oka wydaje się, że dla pary omawianych anten wynik zawsze będzie symetryczny. Aby przedstawić nowe możliwości, rozważmy więc przypadek, który daje w wyniku asymetrię. Zapytajmy, co się dzieje, gdy anteny są rozsunięte o jedną czwartą długości fali i antena j\j wyprzedza w czasie antenę S o jedną czwartą okresu (rys. 29.6)? W kierunku W otrzymujemy natężenia równe 2, jak się później przekonamy. W kierunku S otrzymujemy zaś zero, ponieważ dla danej chwili sygnał z N przybywa o 90° później w czasie niż sygnał z S, ale będąc już o 90° w tyle ze względu na swoją własną, fazę, dochodzi przesunięty ostatecznie o 180° w fazie i efekt jest zerowy. Z drugiej strony, w kierunku N sygnał N przybywa o 90° wcześniej w czasie od sygnału S, ponieważ antena leży bliżej o jedną czwartą długości fali. Ale własną fazę ma tak ustawioną, że jego drgania spóźniają się w czasie o 90°, co dokładnie równoważy różnicę opóźnień i w ten sposób sygnały pojawiają się zgodnie w fazie czyniąc natężenie pola dwukrotnie większym, a energię cztery razy większą. Wykazując więc nieco zręczności przy rozmieszczaniu i nastawianiu naszych anten, możemy posłać moc całkowicie w jednym kierunku. Nadal jednak jest ona rozłożona w dużym obszarze kątów. Czy możemy tak się urządzić, aby moc była jeszcze ostrzej skupiona w określonym kierunku? Rozważmy znowu przypadek Hawai, kiedy to na wschód i na zachód wysyłamy wiązkę rozłożoną we wcale sporym kącie. Tracimy moc, ponieważ nawet przy 30° nadal będzie można odbierać połowę natężenia. Czy możemy coś tu poprawić? Rozważmy sytuację, w której odstęp wynosi dziesięć długości fali (rys. 29.7). Przypomina to sytuację badaną w poprzednim rozdziale, ponieważ odstępy wynosiły wówczas wiele długości fali, a nie mały jej ułamek. Obraz sytuacji staje S'C teraz zupełnie inny. Gdy rozsuniemy oscylatory o 10 długości fali (bierzemy dla ułatwienia przypadek zgodnych faz), widzimy, że w kierunku E-W są one w fazie i uzyskujemy duże natężenie, cztery razy większe niż d'a jednego oscylatora. Z drugiej stro- ny. już pod bardzo małym kątem w bok czasy dojścia różnią się o 180° i natężenie wynosi zero. Mówiąc dokładnie, jeżeli nadajemy proste od każdego oscylatora X/4- C--1T/2 29.6. Para anten dipolowych dających maksymalną moc w jednym kierunku 29.7. Rozkład natężeń dla dwóch dipoli rozsuniętych o 10A do odległego punktu
54 29. INTERFERENCJA 29.8. Układ 6 anten dipolowych i fragment jego rozkładu natężeń do pewnego odległego punktu i różnica A tych dwóch odległości wyniesie A/2, połowę oscylacji, drgania wypadną z fazy. Wspomniane pierwsze zero pojawia się w takiej właśnie sytuacji (skala rysunku nie jest właściwa; jest to tylko gruby szkic). Znaczy to, że rzeczywiście mamy bardzo ostrą wiązkę w żądanym kierunku, bo poruszając się nawet niewiele tracimy całe natężenie. Niestety, gdybyśmy chcieli praktycznie zbudować w ten sposób urządzenie radionadawcze, to podwajając odległość, otrzymalibyśmy niezgodność w fazach o cały cykl, co jest znowu dokładną zgodnością faz! Otrzymalibyśmy więc wiele kolejnych maksimów i minimów, takich jak dla odstępu 2\k, o czym mówiliśmy w rozdz. 28. Jak można się pozbyć wszystkich tych dodatkowych maksimów, tak zwanych „listków"? Otóż nie chcianych listków można się pozbyć w dość ciekawy sposób. Umieśćmy inny układ anten pomiędzy tymi dwoma, które teraz rozważamy (rys. 29.8). Zewnętrzne anteny są więc nadal odległe o 10,1, ale między nimi, powiedzmy co 2/1, ustawiamy inne anteny i uruchamiamy je w zgodnej fazie. Mamy więc teraz 6 anten i natężenie w kierunku E-W będzie oczywiście znacznie większe przy sześciu antenach niż przy jednej. Pole byłoby większe 6 razy, a natężenie 36(jako kwadrat pola). Uzyskujemy w tym kierunku 36 jednostek natężenia. W sąsiednich punktach znajdujemy zero, z grubsza tak jak poprzednio, ale posuwając się dalej, tam gdzie zwykliśmy otrzymywać wielki „garb", otrzymujemy teraz „garb" znacznie mniejszy. Zobaczmy dlaczego. Rzecz w tym, że chociaż spodziewamy się wielkiego garbu dla odległości A dokładnie równej długości fali, to przecież naprawdę tylko dipole 1 i 6 są wtedy w fazie i współdziałają w wysyłaniu natężenia w danym kierunku. Dipole 3 i 4 są natomiast o około \ długości fali przesunięte względem I i 6; chociaż 1 i 6 razem pchają, to 3 i 4 też pchają wspólnie, ale w fazie przeciwnej. Otrzymujemy więc bardzo małe natężenie w rozważanym kierunku, ale jednak nie znikające - nie zeruje się ono całkowicie. Podobne sytuacje powtarzają się dalej: garby są bardzo małe, podczas gdy wiązka w żądanym kierunku jest silna. Zauważmy jednak, co się jeszcze dzieje w tym szczególnym przykładzie: ponieważ odległość między kolejnymi dipolami wynosi IX, można więc znaleźć taki kąt, dla którego odległość 3 między kolejnymi dipolami wynosi dokładnie jedną długość fali. Przyczynki od wszystkich dipoli będą wtedy znowu w fazie, ponieważ każdy z nich jest opóźniony względem następnego o 360° i otrzymujemy inną silną wiązkę w nowym kierunku! W praktyce łatwo tego uniknąć, ponieważ można umieścić dipole bliżej siebie niż co jedną długość fali i efekt się nie pojawi. Ale sam fakt, że efekt taki może się zdążyć przy pewnych kątach, jeżeli tylko odstępy są większe od jednej długości fali, jest zjawiskiem bardzo ciekawym i użytecznym. Znajduje ono zastosowanie, wprawdzie nie w nadajnikach radiowych, ale w siatkach dyfrakcyjnych.
29-5 MATEMATYCZNE UJĘCIE INTERFERENCJI 55 29-5. Matematyczne ujęcie interferencji Zakończyliśmy w ten sposób naszą jakościową analizę układu dipoli promieniujących i będziemy się teraz starać zanalizować je ilościowo. Znalezienie wypadkowego promieniowania dwóch źródeł pod pewnym szczególnym kątem w najbardziej ogólnym przypadku dwu oscylatorów różniących się o pewną wewnętrzną fazę względną a i o różnych natężeniach -41 i A2 polega na dodaniu dwu cosinusów o tej samej częstości, ale o różnych fazach. Znalezienie tej różnicy faz jest bardzo łatwe: składa się ona z opóźnienia pochodzącego od różnicy w odległości oraz z wewnętrznej, wbudowanej fazy drgań. Matematycznie rzecz biorąc, mamy znaleźć sumę R dwu fal: R = At cos(cot + ęl)+A2 cos (cot+ q>2)- Jak się do tego zabrać? Zadanie to jest naprawdę bardzo łatwe i powinniśmy uznać, że już umiemy je rozwiązać. Naszkicujemy jednak pewne szczegóły postępowania. Jeden sposób rozwiązania polega po prostu na wyliczeniu R, co nie powinno nam sprawić trudności, jeżeli potrafimy się zręcznie posługiwać matematyką i wiemy dosyć o sinusach i cosinusach. Rozważmy najprostszy przypadek, w którym Ax i A2 są równe i niech A będzie ich wspólną wartością. W tej sytuacji (moglibyśmy to nazwać trygonometryczną metodą rozwiązania zagadnienia) mamy R = A [cos (cot +cpl) + cos (cor + ę2)]. (29.9) Z trygonometrii powinniśmy znać regułę: cos.4+cosB = 2cosi04 + .8)cosi04-.B). (29.10) Znając ją możemy natychmiast napisać R jako R = 2A cosiię^ ę2) cos(ojt + ięi+i(p2). (29.11) Otrzymaliśmy więc falę o nowej fazie i o nowej amplitudzie. W ogólnym przypadku (dodawania fal o różnych amplitudach) wynik będzie falą harmoniczną o nowej amplitudzie AR, którą nazwiemy amplitudą wypadkową, o tej samej częstości drgań, ale z różnicą faz </>„, zwaną fazą wypadkową. Uwzględniając to wszystko w naszym szczególnym przypadku otrzymujemy, że wypadkowa amplituda wynosi AR = 2Acos±(<pl-ę2), (29.12) a wypadkowa faza jest średnią arytmetyczną dwu faz i w ten sposób nasze zagadnienie zostało całkowicie rozwiązane. Wyobraźmy sobie teraz, że nie pamiętamy, iż suma dwu cosinusów jest równa podwojonemu cosinusowi połowy sumy razy cosinus polowy różnicy. Możemy posłużyć się wówczas inną geometryczną metodą. Funkcja cos(cot + (p) (z dowolną stałą fazą ę) może Dyć uważana za wynik poziomego rzutowania wirującego wektora. Wyobraźmy sobie wektor A, o długości A{, wirujący tak, że jego kąt względem osi wynosi cat + ęx (za chwilę °Puścimy cot i zobaczymy, że to nie powoduje różnicy). W chwili f = 0 wykonujemy migawkowe zdjęcie (rys. 29.9) pamiętając, że w rzeczywistości obraz wiruje z prędkością Kątową co, Rzut wektora A, na osi poziomej wynosi dokładnie ,4, cos(&>/ + #>,). Drugą
56 29. INTERFERENCJA falę można w chwili / = 0 przedstawić jako inny również wirujący wektor A2 o długości A2, ustawiony pod kątem ę2. Oba wektory wirują z tą samą prędkością kątową a> i wobec tego ich względne położenie jest ustalone. Układ obraca się jak ciało sztywne. Rzut poziomy wektora A2 wynosi A2 cos(cot + <p2). Wiemy jednak z teorii wektorów, że przy dodawaniu dwóch wektorów w zwykły sposób, według reguły równole- głoboku, składowa x-owa wypadkowego wektora AR jest sumą składowych x-owych dwu pozostałych wektorów. Zagadnienie nasze jest w ten sposób rozwiązane. Łatwo sprawdzić, że dla rozważanego poprzednio szczególnego przypadku AX=A2 = A otrzymujemy poprawny wynik. Z rysunku 29.9 widać, że w tym przypadku wektor AR leży w środku między wektorami A, i A2i tworzy kąt \{ę2 —<Pi)z każdym z nich. Widzimy więc, że AR = 2A cosi(^2-c>|), tak jak obliczyliśmy poprzednio. Widać także z trójkąta, że gdy obie amplitudy są równe, faza AR przy obrocie jest średnią kątów wektorów A, i A2. Z równą także łatwością rozwiążemy oczywiście przypadek nierównych amplitud. Możemy to nazwać geometrycznym sposobem rozwiązania postawionego zagadnienia. Istnieje jeszcze inna droga rozwiązania tego problemu, a mianowicie droga analityczna. Polega ona na tym, że zamiast robienia rysunków, takich jak rys. 29.9, możemy napisać coś, co jest dokładnie równoważne rysunkowi: zamiast kreślenia wektorów przedstawiamy je za pomocą liczb zespolonych. Biorąc rzeczywiste części liczb zespolonych, otrzymamy właściwe wielkości fizyczne. Tak więc w naszym szczególnym przypadku fale można by zapisać za pomocą liczb Ax exp[i(a>f + c>,)] [jej rzeczywistą częścią jest At cos(a>f + p,)] oraz A2 e\p[i(cot + ę2)]. Możemy teraz dodać je razem otrzymując: 29.9. Geometryczna metoda składania dwóch fal cosinusowych. Należy sobie wyobrazić, że cały wykres obraca się z częstością kątową co przeciwnie do ruchu wskazówek zegara R =/4,exp[i(<yf+ c>i)]-M2exp[i'(<yf+ ^2)] = [/41exp(i>1) + /42exp(i^2)]exp(/(y/) (29.13) albo R =/41exp(i>1) + /42exp(i>2) = /4Rexp(i>J,). (29.14) Jest to rozwiązanie naszego zagadnienia, ponieważ przedstawia wynik jako liczbę zespoloną o module AR i o fazie ęR. Zobaczmy, jak działa ta metoda, i znajdźmy amplitudę AR, która jest „długością" k. Aby otrzymać „długość" wielkości zespolonej, zawsze mnożymy tę wielkość przez liczbę zespoloną do niej sprzężoną, co daje nam kwadrat długości. Liczbę sprzężoną zespoloną otrzymujemy zamieniając w liczbie pierwotnie danej znak przy / na przeciwny. Mamy więc ^=[^(1exp(i>1)+'42exP(,>2)] [^iexp(-i>1) + /42exp(-if2)]. (29.15) Wykonując mnożenie, otrzymujemy A\ + A\ (funkcje wykładnicze bowiem się tu znoszą),
29-5. MATEMATYCZNE UJĘCIE INTERFERENCJI 57 dla wyrazów zaś mieszanych mamy At A2{exp[i(ęl- ę2)]+exp[i(ę2- ę^]} , ponieważ zaś e" + e~ "= cos d + i sin 0 + cos 9 - i sin 6 , to e" + e"" = 2 cos 6. Naszym końcowym wynikiem jest więc A2r = A\ + A\ + 2A{ A2cos(ę2-<Pi) ■ (29.16) Zgadza się to, jak widać z rys. 29.9, z długością AR obliczoną za pomocą praw trygonometrii. Wobec tego fala będąca wynikiem nałożenia się fal z dwóch źródeł ma natężenie A\ (jednej z nich) plus natężenie A\ (pochodzące tylko od drugiej) plus pewna poprawka. Poprawkę tę nazywamy efektem interferencyjnym. Jest to różnica między tym, co otrzymujemy dodając po prostu natężenia, a tym, co się dzieje naprawdę. Wyraz ten nazywamy poprawką interferencyjną, niezależnie od tego, jaki będzie on miał znak. Przypadek, w którym wyraz interferencyjny jest dodatni, nazywamy interferencją konstruktywną. Przypadek przeciwny nazywamy interferencją destruktywną. Zastosujmy teraz nasz ogólny wzór (29.16) do układu dwu oscylatorów, w tych szczególnych przypadkach, które omawialiśmy od strony jakościowej. Aby zastosować wzór ogólny, wystarczy znaleźć różnicę faz ęy —ę2 między sygnałami dochodzącymi do danego punktu (wszystko zalety oczywiście tylko od różnicy faz, a nie od samych faz). Rozważmy więc przypadek dwóch oscylatorów, o równej amplitudzie, odległych od siebie o d i różniących się o wewnętrzną względną fazę a (gdy jeden z nich jest w fazie zero, faza drugiego wynosi a). Zapytujemy, jakie będzie natężenie w pewnej azymutalnej odległości 6 od linii E-W. [Zauważmy, że nie chodzi tutaj o wielkość 9, pojawiającą się we wzorze (29.1). Mimo obawy o nieporozumienie, zamiast jakiegoś nowego niezwykłego symbolu, użyjemy jednak przyjętego symbolu 6 (rys. 29.10).] Zależność fazową znajdujemy zauważając, że różnica odległości od punktu P do obu oscylatorów wynosi d sin 0. Daje ona przyczynek do różnicy faz, równy liczbie długości fali zawartych w d sin 0 razy 2rt. (Czytelnik lepiej przygotowany możet/sin 0 Pomnożyć przez liczbę falową, która daje szybkość zmiany fazy z odległością; wynik Jest dokładnie taki sam.) Różnica faz pochodząca z różnicy odległości wynosi zatem 2nd sin Ojk, z powodu zaś różnic w drganiach obu oscylatorów dochodzi jeszcze dodatkowa faza a. W chwili przybycia sygnału różnica faz będzie zatem wynosiła <p2-ęt=<x + 2ndsindjX. (29.17) 29.10. Dwa oscylatory o jednakowej amplitudzie, których fazy różnią się o a nktu P
58 29. INTERFERENCJA Wzór ten obejmuje wszystkie przypadki. Wystarczy więc podstawić to wyrażenie do wyrażenia (29.16) dla AX = A2 i otrzymać najrozmaitsze wyniki dla dwu anten o równym natężeniu. Zobaczmy, co się dzieje w różnych przypadkach. Wiemy na przykład, że według rys. 29.5 natężenie przy 30° wynosi 2, przyczyna zaś jest następująca. Oba oscylatory są rozsunięte o \X, więc przy 30° dńvtQ=\\\. Wobec tego ę1—ę^—2TiXj^X = \ii i wyraz interferencyjny jest równy zeru (dodajemy dwa wektory prostopadłe). Geometrycznie wynik odpowiada przeciwprostokątnej trójkąta o kącie 45°, która jest równa amplitudzie jednostkowej razy ,/2. Podnosząc ją do kwadratu, otrzymujemy podwojone natężenie pojedynczego oscylatora. Wszystkie inne przypadki można wyliczyć w taki sam sposób.
T 30 dyfrakcja 30-1. Wypadkowa amplituda promieniowania n jednakowych oscylatorów Rozdział ten jest bezpośrednią kontynuacją poprzedniego, mimo że nie jest on już zatytułowany interferencja, ale dyfrakcja. Nikomu nie udało się zadowalająco określić różnicy między interferencją a dyfrakcją. Jest to tylko sprawa zwyczaju i nie ma żadnej ważnej, wyraźnie określonej różnicy fizycznej między obu zjawiskami. Najlepiej chyba z grubsza powiedzieć, że interferencją nazywamy zwykle wynik nakładania się fal świetlnych z nielicznych źródeł, np. dwóch, gdy zaś liczba źródeł jest wielka, używa się częściej nazwy dyfrakcja. Nie przejmujmy się więc nazwą interferencja czy dyfrakcja, ale podejmijmy przerwany w środku temat poprzedniego rozdziału. Rozważmy zatem układ n równoległych oscylatorów o takich samych amplitudach, ale różniących się między sobą fazami albo dlatego, że ich fazy zostały inaczej ustawione, albo dlatego, że obserwujemy je pod kątem powodującym różnicę w opóźnieniu czasowym. Niezależnie od przyczyny tej różnicy faz musimy obliczyć następującą sumę cosi- nusów: R = /l{coswt+cos(wl + p) + cos(a)f + 2p) + ...+cos[a)l+(n-l)¥>]} , (30.1) gdzie ę jest różnicą faz między kolejnymi oscylatorami obserwowanymi z ustalonego kierunku. Dokładnie mówiąc <p = <x + (2ndsin0//.). Musimy teraz pododawać wszystkie te wyazy. Zrobi my to sposobem geometrycznym. Pierwszy wyraz ma moduł A i fazę zero. astępny ma także moduł A, ale fazę równą </>. Dalszy ma znowu moduł A, ale fazę równą V i tak dalej. Widać więc, że na płaszczyźnie posuwamy się wzdłuż kolejnych n boków w,elokąta równobocznego (rys. 30.1).
60 30. DYFRAKCJA Wszystkie wierzchołki tego wielokąta leżą oczywiście na pewnym okręgu i wypadkową amplitudę najłatwiej znajdziemy obliczając jego promień. Załóżmy, że punkt Q jest środkiem koła. Wiemy wówczas, że kąt OQS jest kątem fazowym ę. (Ponieważ promień QS pozostaje w takim samym stosunku geometrycznym do wektora A2, jak QO do A,, tworzą one kąt ę.) Wobec tego promień r musi być taki, żeby A — 2r sin (ę/2), co nam ustala wartość r. Ale duży kąt O QT jest równy nę i stąd wynika, że AR = 2r sin(nę/2). Pozbywając się r z tych dwóch wyrażeń otrzymujemy AR = A sin (n p/2) sin (p/2) ' Wypadkowe natężenie wynosi więc /=/0 sin2 (n ę/2) sin2(W2) ' (30.2) (30.3) Zbadajmy teraz to wyrażenie i rozpatrzmy niektóre wynikające z niego konsekwencje. Możemy najpierw sprawdzić wzór dla n=l. Wzór się sprawdza: I—I0. Sprawdzamy go następnie dla n=2: pisząc sin ę=2 sin (ę/2) cos (ę/2) znajdujemy, że AR = 2A cos (ę/2), co jest w zgodzie z wyrażeniem (29.12). Pomysł rozpatrzenia wyniku dodawania szeregu źródeł wziął się z nadziei, że w jednym kierunku uda się nam uzyskać znacznie większe natężenie niż w innym, że bliskie maksima występujące przy dwu tylko źródłach powinny przy wielu źródłach mieć znacznie słabsze natężenie. Zjawisko to zauważymy wykreślając krzywą odpowiadającą wzorowi (30.3) dla ogromnej liczby n w obszarze bliskim ę—O. Przede wszystkim, dla ę dokładnie równego zeru, otrzymujemy wyrażenie typu 0/0, ale gdy ę jest nieskończenie małe, iloraz kwadratów dwu sinusów wynosi po prostu n2, bo sinus i kąt są w przybliżeniu sobie równe. A więc natężenie maksimum krzywej jest n2 razy większe od natężenia jednego oscylatora. Przekonać się o tym łatwo, bo gdy wszystkie oscylatory są w fazie, wówczas względne kąty małych wektorów są równe zeru i n oscylatorów dodaje się tak, że amplituda jest większa n-krotnie, a natężenie n2-krotnie. W miarę jak wzrasta faza ę, stosunek dwu sinusów zaczyna maleć i po raz pierwszy osiąga zero, gdy nę/2=n, bo simt = 0. Innymi słowy, ę=2n/n odpowiada pierwszemu minimum krzywej (rys. 30.2). Opisując przebieg zjawiska za pomocą strzałek na rys. 30.1, widzimy, że pierwsze minimum pojawia się, gdy wszystkie strzałki powracają do punktu wyjściowego. Oznacza to, że na to, aby móc zamknąć koło, całkowity kąt zakreślony przez wszystkie strzałki, czyli całkowita różnica faz między pierwszym a ostatnim oscylatorem, musi wynosić 2%. 30.1. Wypadkowa amplituda n = 6 równoodległych źródeł, dla których różnica między sąsiednimi fazami wynosi <p
30-1. WYPADKOWA AMPLITUDA 61 0 12 3 4 5 n<p/27T 30.2. Natężenie jako funkcja kąta fazowego dla wielkiej liczby oscylatorów o równym natężeniu Przechodzimy teraz do następnego maksimum i chcemy naocznie stwierdzić, że tak jak przypuszczamy, jest ono rzeczywiście znacznie mniejsze od pierwszego. Będzie nam trudno znaleźć dokładne położenie maksimum, ponieważ zarówno licznik, jak i mianownik ułamka we wzorze (30.3) ulegają zmianie, ale sin(c>/2) zmienia się dość powoli w porównaniu z sin(/ic>/2) dla dużych n, tak że gdy sin(/ic>/2)= 1, maksimum jest już bardzo blisko. Następne maksimum sin2(nęj2) pojawia się dla «9>/2 = 3rt/2, czyli dla ę = 3n/n. Odpowiada to półtorakrotnemu obiegnięciu okręgu przez strzałki. Aby znaleźć wielkość maksimum, przyjmujemy we wzorze (30.3) ę = 3n/n i znajdujemy, że sin2(3rt/2)= 1 w liczniku (właśnie dlatego wybraliśmy przecież ten kąt), w mianowniku zaś mamy sin2(3rt/2«). Dla dostatecznie dużego n kąt ten jest bardzo mały i sinus staje siew przybliżeniu równy kątowi, tak że we wszystkich praktycznych obliczeniach możemy przyjąć sin (3rt/2«) = 3rt/2«. Znajdujemy zatem natężenie w maksimum, które wynosi /=/0(4«2/9rt2). Ponieważ n2I0 było natężeniem maksymalnym, mamy teraz 4/9rt2 jego wartości, co wynosi około 0,047; mniej niż 5%! Dla jeszcze większych wartości fazy natężenia oczywiście nadal się zmniejszają. Mamy więc bardzo ostre centralne maksimum z bardzo słabymi dodatkowymi maksimami po bokach. Można udowodnić, że pole całej krzywej, włączając wszystkie małe garbki, równe jest 2t«/0, czyli podwojonemu polu kropkowanego prostokąta z rys. 30.2. Teraz zastanówmy się jeszcze, jak w różnych okolicznościach możemy stosować równanie (30.3) i spróbujmy zrozumieć, co się wtedy dzieje. Wyobraźmy sobie, że wszystkie nasze źródła leżą na prostej, jak pokazuje rys. 30.3. Mamy ich n, odstępy między nimi wynoszą d; załóżmy, że własna faza względna dwu sąsiednich źródeł wynosi a. Przy dokonywaniu obserwacji w danym kierunku 0 względem normalnej pojawia się dodatkowa taza 2nd sin ęj)., wynikająca ze wspomnianego poprzednio opóźnienia czasowego między dwoma sąsiednimi oscylatorami. A więc ę = x + (2nd sin 0/A) = a + kd sin 0 . (30.4) Rozpatrzymy najpierw przypadek a = 0. Znaczy to, że wszystkie oscylatory są w fazie
62 30. DYFRAKCJA 30.3. Liniowy układ n jednakowych oscylatorów włączonych z fazami a,=sa zgodnej, my zaś chcemy poznać natężenie jako funkcję kąta 9. Aby ją znaleźć, wystarczy przyjąć ę = kd sin 9 we wzorze (30.3) i spojrzeć, co z tego wynika. Najpierw mamy maksimum dla ę = 0. Znaczy to, że dla wszystkich oscylatorów w fazie zgodnej otrzymujemy duże natężenie w kierunku kąta #=0. Rodzi się dalej ciekawe pytanie: gdzie leży pierwsze minimum? Zachodzi ono wtedy, gdy ę=2n/n. Mówiąc inaczej, dla 2ndńn9/X = 2n/n uzyskujemy pierwsze minimum krzywej. Pozbywamy się 2rt dla większej przejrzystości wzoru i odczytujemy z niego: ndsin6 = X. (30.5) Postarajmy się teraz zrozumieć fizyczne przyczyny, dla których minimum pojawia się właśnie w tym położeniu; nd jest całkowitą długością L urządzenia. Odwołując się do rys. 30.3 stwierdzamy, że nd sin 9=Lsin9=A. Wzór (30.5) mówi, że minimum pojawia się, gdy A jest równe jednej długości fali. Dlaczego otrzymujemy minimum właśnie dla A = A? Ponieważ przyczynki od rozmaitych oscylatorów mają wówczas fazy rozłożone równomiernie od 0° do 360°. Strzałki (rys. 30.1) obiegają cały okrąg - sumujemy równe wektory o różnych kierunkach, a taka suma jest równa zeru. Minimum zachodzi więc dla takich kątów, dla których A = ).. Jest to pierwsze minimum. Wzór (30.3) wykazuje jeszcze inną ważną właściwość. Jeżeli kąt ę wzrasta o dowolną wielokrotność 2rt, nie powoduje to we wzorze żadnej różnicy. Otrzymamy więc dalsze silne maksima dla <p = 2n, An, 6rt i tak dalej. W pobliżu każdego z tych wielkich maksimów obraz z rys. 30.2 powtarza się. Zapytajmy zatem: jakie warunki geometryczne prowadzą do innych dużych maksimów? Warunkiem na to jest równość: ę=2nm, gdzie m jest dowolną liczbą całkowitą. Znaczy to, że 2ndsin9/?. = 2nm. Dzieląc obie strony przez 2n znajdujemy dsind = mX. (30.6) Wzór ten przypomina wzór (30.5), ale niezupełnie; poprzedni wzór miał postać: nd sin 0 = /- Różnica polega na tym, że tam rozważaliśmy poszczególne źródła, a gdy mówimy t/sin 0 =/wyznaczy, że bierzemy kąt ó = m).. Innymi słowy, każde źródło daje swój przyczynek, a że poszczególne źródła są kolejno przesunięte w fazie o całkowitą wielokrotność 360°, wi?c nrzvczvnki te są zgodne w fazie, ponieważ przesunięcie w fazie o 360° jest tym samy11
I WYPADKOWA AMPLITUDA 63 co zgodność fazy. Składanie następuje więc w fazie zgodnej i daje takie samo maksimum jak poprzednio omawiane dla m = 0. Dodatkowe garby, w ogóle cały charakter rysunku jest dokładnie taki sam jak w pobliżu <p = 0, z dokładnie tymi samymi minimami po obu stronach i z wszystkimi innymi szczegółami. Rozważany przez nas układ będzie więc wysyłał wiązki w rozmaitych kierunkach. Każda z nich będzie miała silne centralne maksimum i pewną liczbę słabych „bocznych listków". Kolejną wiązkę określa się jako wiązkę rzędu pierwszego itd., zgodnie z wartością m; m nazywamy rzędem wiązki. Zauważmy, że jeśli t/jest mniejsze od A, to równanie (30.6) może nie mieć rozwiązań poza m = 0. Jeżeli więc odstępy są za małe, możliwa jest tylko jedna wiązka rzędu zerowego ześrodkowana w kącie 0 = 0 (oczywiście, istnieje także wiązka w kierunku przeciwnym). Aby otrzymać dodatkowe wielkie maksimum, odstępy w naszym urządzeniu muszą być większe od pojedynczych długości fali. 30-2. Siatka dyfrakcyjna W technice anten i przewodów możliwe są urządzenia, w których wszystkie fazy małych oscylatorów albo anten są równe. Powstaje pytanie: czy i jak można zrobić coś podobnego ze światłem? W tym wypadku nie możemy zwyczajnie zbudować małych stacji radiowych o częstości optycznej, połączonych nieskończenie małymi drutami i następnie uruchomić ich z daną fazą. Istnieje jednak bardzo łatwy sposób zbudowania urządzenia, które w wyniku daje dokładnie to samo. Załóżmy, że mamy wiele równoległych drutów, równo rozstawionych z odstępem d, oraz bardzo daleko, praktycznie w nieskończoności, źródło o częstości radiowej, które wytwarza pole elektryczne przybywające do każdego z drutów z tą samą fazą (pole powstaje tak daleko, że przesunięcie w czasie jest jednakowe dla wszystkich drutów). (Można rozważać przypadki urządzeń zakrzywionych, ale my weźmiemy płaskie.) Zewnętrzne pole elektryczne pierwotnego źródła będzie poruszać tam i z powrotem elektronami w drucie. Elektrony te poruszając się stanowić będą nowe generatory. Zjawisko takie nazywa się rozpraszaniem: fala świetlna z pewnego źródła może indukować ruch elektronów w jakimś ośrodku materialnym, ruchy te zaś powodują powstawanie swoich własnych fal. Trzeba więc tylko ustawić wiele równoodległych drutów, wzbudzić je za pomocą odległego źródła o częstości radiowej i tak oto mamy żądany układ, bez mnóstwa specjalnych Połączeń. Jeżeli fala pada prostopadle, fazy będą równe i otrzymamy dokładnie te wa- runki, które już rozważaliśmy. Jeżeli wobec tego odstępy między drutami będą większe °d długości fali, otrzymamy rozpraszanie o silnym natężeniu w kierunku normalnej i w niektórych innych kierunkach danych wzorem (30.6). To samo można zrobić ze światłem\ Zamiast drutów posługujemy się płaskim kawałkiem SzMa, robiąc na nim nacięcia tak, aby rozpraszały one światło nieco inaczej niż reszta szkła. ezeli teraz puścimy światło na szkło, każde z nacięć stanie się nowym źródłem światła. ^dy zaś odstępy między liniami będą bardzo małe, ale nie mniejsze niż długość fali (co Jest w każdym razie technicznie prawie niemożliwe), możemy się spodziewać wspaniałego JavWska: światło nie tylko będzie przechodziło na wprost, ale pojawi się także jako silna wiąz-
64 30. DYFRAKCJA ka pod kątem różnym od zera, zależnie od odstępów między szczelinami. Takie urządzenia naprawdę się buduje i powszechnie się ich używa — nazywa się je siatkami dyfrakcyjnymi. Jedna z postaci siatki dyfrakcyjnej — to po prostu płaska warstwa przezroczystego i bezbarwnego szkła pokrytego rysami. Często przypada ich kilkaset na milimetr i są one bardzo starannie sporządzone, tak aby ich odległości były stałe. Jak działa taka siatka, można zobaczyć ustawiając rzutnik tak, aby dawał wąski pionowy prążek światła (obraz szczeliny) na ekranie. Umieszczając w wiązce siatkę tak, aby rysy były pionowe, przekonamy się, że prążek będzie nadal widoczny, ale ponadto pojawia się z każdej jego strony silna barwna plama świetlna. Jest to oczywiście obraz szczeliny rozmyty w szerokim obszarze kątowym, ponieważ kąt 9 ze wzoru (30.6) zależy od długości X, światło zaś różnej barwy odpowiada, jak wiemy, różnym częstościom, zatem różnym długościom fali. Najdłuższą widzialną długość fali ma czerwień, a ponieważ d sin 9 = 1, więc kąt musi być większy. I rzeczywiście, odnajdujemy czerwień przesuniętą o większy kąt w stosunku do centralnego obrazu! Musi także istnieć wiązka po drugiej stronie, i rzeczywiście, odnajdujemy ją na ekranie. Następnie powinny się odnaleźć rozwiązania (30.6) dla m = 2. Widzimy w odpowiednim miejscu coś niewyraźnego — bardzo słabego — a dalej są nawet inne wiązki. Dowodziliśmy przed chwilą, że wszystkie te wiązki powinny mieć to samo natężenie, ale widzimy, że wcale nie mają i nawet pierwsze wiązki po prawej i lewej stronie nie są jednakowe! Przyczyna leży w tym, że siatka dyfrakcyjna została starannie zbudowana z myślą o takim właśnie działaniu. Jak to uzyskano? Gdyby siatka składała się z bardzo subtelnych, nieskończenie cienkich, równo rozstawionych nacięć, wówczas wszystkie natężenia rzeczywiście byłyby równe. Rozważaliśmy tylko najprostszy przypadek, ale moglibyśmy przecież rozważać także zespół par anten, w których każdy partner miałby swoje natężenie i swoją fazę względną. W tym przypadku można by uzyskać rozmaite natężenia w różnych rzędach. Siatkę robi się często z małych nacięć „piłowatych", a nie symetrycznych. Starannie ustawiając „zęby piły" można więcej światła skierować do jednego rzędu widma niż do innego. Praktycznie w siatce chcielibyśmy mieć jak najwięcej światła w jednym tylko rzędzie. Rozwiązanie jest bardzo dowcipne, mimo że wydaje się trudne do zrealizowania, a dzięki niemu siatka staje się bardziej użyteczna. Rozważaliśmy dotąd przypadek, gdy wszystkie fazy źródeł były takie same. Mamy jednak też wzór na ę wtedy, gdy kolejne fazy różnią się o kąt a. Wymaga to połączenia naszych anten z małym przesunięciem fazowym. Czy coś takiego daje się zrobić ze światłem? Owszem, daje się to zrobić bardzo łatwo. Weźmy bowiem źródło w nieskończoności pod takim kątem, że światło dochodzi pod kątem #przych, i badajmy wiązkę rozproszoną, wychodzącą powiedzmy pod kątem 9^^ (rys. 30.4). #wych jest tym samym kątem 9, który mieliśmy poprzednio, a wprowadzenie kąta 0przych jest po prostu środkiem, który zapewnia, że faza każdego źródła jest odmienna. Światło przychodzące z odległego źródła pobudzającego uderza najpierw w jedną rysę, potem w następną, znowu następną i tak dalej, z przesunięciem fazowym między jednym a drugim uderzeniem, wynoszącym, jak widzimy, a= -d sin 9pnycJX. Mamy wobec tego wzór na dyfrakcję na siatce, w której światło przychodzi i wychodzi pod pewnym kątem: • <P = 2nd(sindwyJl)-2nd(sin6pnyJX). (30.7)
1.2. SIATKA DYFRAKCYJNA 65 Spróbujmy zobaczyć, gdzie w tych warunkach pojawiają się duże natężenia. Warunek dużego natężenia wymaga oczywiście, żeby ę było wielokrotnością 2jt. Zasługuje przy tym na uwagę wiele ciekawych spraw. Je'dnym z bardziej chyba ciekawych przypadków jest przypadek, w którym m—Q. Wtedy d może być mniejsze od A; dokładniej, jeżeli d< X, to jedynym możli- ,„„„..■ . - ,, uu J J < j j j 30 4 Różnica torów dla promieni rozproszo- wym rozwiązaniem jest w = 0. W tym wy- nych na dwóch sąsiednich liniach sjatki dyfrak- padku widzimy, że sin 0wych = sin 0przych, co Cyjnej wynosi rfsin 6wych~if sin 0przyCh oznacza, że światło wychodzące ma ten sam kierunek, co światło pobudzające siatkę. Można by sądzić, że światło „po prostu przechodzi", ale tak nie jest, teraz mówimy o innym świetle. Światło przechodzące pochodzi wprost z pierwotnego źródła: a to, o którym teraz mówimy, jest nowym światłem, wytworzonym w wyniku rozpraszania. Okazuje się więc, że światło rozproszone biegnie w tym samym kierunku, co światło pierwotne. Rzeczywiście, mogą one z sobą interferować — własnością tą będziemy się zajmować w przyszłości. W tym przypadku istnieje jeszcze inne rozwiązanie. Przy danym kącie #pr2ych kąt 0wych może być dopełnieniem kąta 0pTZych. Otrzymujemy więc nie tylko wiązkę w tym samym kierunku, co wiązka padająca, ale także wiązkę w innym kierunku, takim (do czego możemy dojść po chwili zastanowienia), że kąt padania jest równy kątowi rozpraszania. Wiązkę tę nazywamy wiązką odbitą. Zaczynamy więc rozumieć podstawowy mechanizm odbicia: padające światło wytwarza ruch atomów w ośrodku odbijającym; ruch ten jest następnie przyczyną powstania nowej fali, równanie zaś dla kierunku rozpraszania ma jedno takie rozwiązanie, że kąt, pod którym światło pada, jest równy kątowi, pod którym ono wychodzi. Gdy odległość między centrami rozpraszającymi jest mała, rozwiązanie to jest jedynym rozwiązaniem! Rozważmy dalej szczególny przypadek, gdy rf-+0. Wtedy, mówiąc po prostu, mamy lity kawałek substancji o skończonej długości. Chcemy ponadto, aby przesunięcie fazowe między sąsiednimi centrami rozpraszającymi dążyło do zera. Wstawiamy, innymi słowy, coraz to więcej anten między już istniejące, tak że każda z różnic fazowych maleje, liczba zaś anten wzrasta, ale całkowita różnica faz między jednym a drugim końcem linii pozostaje stała. Zobaczmy, co się dzieje z wzorem (30.3), jeżeli przechodzimy z liczbą n do nieskończoności, a pojedynczym przesunięciem fazowym do zera, utrzymując stałą różnicę fazy nę między jednym końcem a drugim (niech nę=<P). Kąt ę staje się tak mały, że sin ę = ę, i jeżeli uznamy n2I0 za Im, maksymalne natężenie w środku wiązki, to / = 4/nsin2(±<Ż>)/<*>2. (30.8) Ten właśnie graniczny przypadek widzimy na rys. 30.2.
66 30. DYFRAKCJA 30.5. Rozkład natężenia ciągłej linii oscylatorów ma pojedyncze silne maksimum i wiele słabych „bocznych listków" Ogólnie w tym przypadku znajdujemy taki sam typ obrazu, jak przy skończonym odstępie dla d>k; wszystkie boczne listki są praktycznie takie jak poprzednio, ale nie ma maksimów wyższego rzędu. Jeśli wszystkie czynniki rozpraszające mają zgodne fazy, to otrzymujemy maksimum dla kierunku #^,.,, = 0, a minimum wtedy, gdy odległość A jest równa X, tak jak dla skończonych d i n. Możemy więc uwzględnić w naszej analizie nawet ciągły rozkład centrów rozpraszających lub oscylatorów, posługując się całkowaniem zamiast sumowania. Rozważmy jako przykład długą linię oscylatorów, z ładunkami drgającymi wzdłuż kierunku linii (rys. 30.5). Natężenie promieniowania z takiego układu jest największe w kierunkach prostopadłych do linii. Istnieje niewielkie natężenie także nad i pod płaszczyzną równikową, ale jest ono bardzo nikłe. Znajomość tego wyniku pozwala nam na zajęcie się bardziej złożoną sytuacją. Załóżmy, że mamy układ linii, z których każda wytwaiza wiązkę tylko w płaszczyźnie do siebie prostopadłej. Sprawa znalezienia przestrzennego rozkładu natężenia pochodzącego od układu długich drutów (a nie nieskończenie małych) wygląda tak samo jak i dla drutów nieskończenie małych, jeśli tylko znajdujemy się w centralnej płaszczyźnie prostopadłej do drutów. Rzecz polega po prostu na dodaniu przyczynków od każdego z długich drutów. Dlatego właśnie, po przeanalizowaniu właściwie tylko cienkich anten, mogliśmy otrzymany wynik zastosować do siatki z długimi, wąskimi szczelinami. Każda z długich szczelin daje efekt tylko w swoim własnym kierunku, a nie do niego prostopadle, a interferencja bierze się stąd, że szczeliny są ustawione poziomo blisko siebie. Korzystając z tego możemy budować bardziej skomplikowane układy, biorąc czynniki rozpraszające rozłożone liniowo, płasko lub przestrzennie. Najpierw rozważyliśmy przypadek, kiedy czynniki rozpraszające były ułożone wzdłuż linii; przed chwilą naszą analizę rozszerzyliśmy na przypadek pasów; aby wszystko dokładnie wyliczyć, musimy po prostu wykonać konieczne sumowanie przyczynków od poszczególnych centrów rozpraszających. Zasada pozostaje jednak zawsze taka sama.
30-3. ZDOLNOŚĆ ROZDZIELCZA SIATKI 67 30-3. Zdolność rozdzielcza siatki Nasze obecne wiadomości pozwalają nam już zrozumieć wiele ciekawych zjawisk. Rozważmy, na przykład, sprawę wykorzystania siatki do rozdzielania fal o różnych długościach. Widzieliśmy, jak na ekranie całe widmo zostało rozciągnięte, siatka może być więc wykorzystana jako narzędzie do rozdzielenia światła na składniki o różnych długościach fali. Oto wiążące się z tym ciekawe zagadnienie: weźmy dwa źródła światła o nieco różniących się częstościach, czyli o nieco różniących się długościach fal. Pytamy: jak dalece można zmniejszyć różnicę obu częstości, aby za pomocą siatki nie dało się stwierdzić, ze rzeczywiście mamy do czynienia z dwiema różnymi długościami fali? Czerwień i błękit jawnie się rozdzielały. Niech jednak pierwsza fala będzie czerwona, a druga tylko trochę czerwieńsza. Jak blisko siebie mogą one leżeć? Wchodzącą tu w grę własność nazywamy zdolnością rozdzielczą siatki, a oto jeden ze sposobów analizy problemu: załóżmy, że dla światła o określonej barwie znaleźliśmy maksimum ugiętej wiązki, pod określonym kątem. Jeśli zmieniamy długość fali, faza 2nd sin 0/X staje się inna, maksimum pojawia się więc oczywiście pod innymi kątami. Dlatego to czerwień i błękit są rozmyte. Jaką różnicę kątów jesteśmy w stanie jeszcze dostrzec? Jeżeli dwa maksima dokładnie pokrywają się wierzchołkami, to oczywiście nie można ich odróżnić. Jeśli jedno maksimum jest dostatecznie daleko od drugiego, w rozkładzie światła daje się dostrzec podwójny garb. Dla dokładnego odróżnienia wzrokiem podwójnego garbu korzysta się zwykle z prostego kryterium, zwanego kryterium Rayleigha, przedstawionego na rys. 30.6. Rzecz polega na tym, aby pierwsze minimum jednego garbu pokrywało się z maksimum garbu drugiego. Bardzo łatwo teraz obliczyć, jaka jest różnica długości fali, kiedy jedno minimum „siedzi" na drugim maksimum. Najlepiej zrobić to metodą geometryczną. Aby otrzymać maksimum dla długości fali A', odległość A (rys. 30.3) musi wynosić nk', a jeśli rozważamy wiązkę m-tego rzędu, to odległość musi wynosić mnX'. Innymi słowy, 2nd sin 0/X' = 2nm, a więc nd sin d, czyli A, jest równe X razy n lub mnX'. Dla drugiej wiązki, o długości fali X, chcemy mieć w tym miejscu minimum. Żądamy więc, aby A było dokładnie o jedną długość fali X większe od mnX. Znaczy to, że A = mnX + X=mnX'. Jeżeli więc X' = X+AX, to AX/X=l/mn. (30.9) Stosunek X/AX nazywany jest zdolnością rozdzielczą siatki. Widzimy, że jest ona równa całkowitej liczbie linii w siatce pomnożonej przez rząd wiązki. Nietrudno udowodnić 30.6. Ilustracja kryterium Rayleigha. Maksimum jednego rozkładu przypada na pierwsze minimum drugiego
68 30. DYFRAKCJA równoważność tego wzoru z następującą formułą mówiącą, że rozmycie częstości jest równe odwrotności różnicy czasów między skrajnymi drogami, dla których może zachodzić interferencja*' jv=i/r. Niewątpliwie jest to najlepsza postać do zapamiętania, ponieważ wzór ten jest ogólnie słuszny nie tylko dla siatek, ale i dla dowolnych przyrządów, podczas gdy szczególny wzór (30.9) jest słuszny tylko wtedy, gdy posługujemy się siatką. 30-4. Antena paraboliczna Rozważmy teraz inne zagadnienie, wiążące się ze zdolnością rozdzielczą. Zajmiemy się anteną radioteleskopu używanego do wyznaczania położenia źródeł radiowych na niebie, to znaczy do stwierdzania, jakie są ich rozmiary kątowe. Gdybyśmy do szukania sygnałów użyli którejś z dawniej rozważanych anten, to oczywiście nie moglibyśmy się dowiedzieć, z jakiego one przychodzą kierunku. Ale powinniśmy jednak wiedzieć, czy światło znajduje się w tym, czy w innym miejscu. W związku z tym może się nasunąć pomysł ułożenia szeregu równoodległych drutów dipolowych w krajobrazie australijskim. Wtedy możemy połączyć razem wszystkie przewody prowadzące od tych anten i zasilić nimi jeden odbiornik tak, aby wszystkie opóźnienia w liniach zasilających były jednakowe. W ten sposób odbiornik otrzyma sygnały od wszystkich drutów w zgodnej fazie. Znaczy to, że doda on z tą samą fazą wszystkie fale od każdego dipola. I co wtedy? Otóż jeśli źródło będzie leżało dokładnie ponad układem, w nieskończoności lub prawie tak daleko, jego fale radiowe będą pobudzały anteny w jednakowej fazie i będą one zgodnie zasilały odbiornik. Załóżmy teraz, że źródło radiowe znajduje się pod niewielkim kątem 9 względem pionu. Poszczególne anteny odbiorą wówczas sygnały nieco przesunięte w fazie. Odbiornik zsumuje wszystkie te niezgodne w fazie sygnały i otrzymamy zero, jeżeli kąt 0 będzie dostatecznie duży. Jak wielki musi być ten kąt? Odpowiedź brzmi: otrzymujemy zero, gdy kąt A/L = 9 (rys. 30.3) odpowiada przesunięciu fazowemu 360°, to znaczy, gdy A równa się długości fali A. Dzieje się tak dlatego, że przyczynki wektorowe tworzą razem pełny wielokąt o wypadkowej równej zeru. Najmniejszy kąt, jaki może być rozróżniony przez układ antenowy o długości Z,, wynosi 9 = A/L. Zauważmy, że opisany obraz odbioru sygnałów przez antenę wygląda dokładnie tak samo jak rozkład natężeń, który otrzymalibyśmy zamieniając odbiornik na nadajnik. Jest to przykład tak zwanej zasady wzajemności. Jest ona rzeczywiście ogólnie słuszna dla dowolnego układu anten, dowolnych kątów i tak dalej. Wyliczmy najpierw względne natężenia w różnych kierunkach, tak jak gdyby odbiornik był nadajnikiem. Względna czułość kierunkowa odbiornika o takich samych zewnętrznych połączeniach i o takim samym układzie anten jest dokładnie równa względnemu natężeniu obliczonej emisji. *' W naszym przypadku T=djc = mnXlc, gdzie c jest prędkością światła. Częstość v = c/X, więc Jv = cAXIX2. ,
30-4. ANTENA PARABOLICZNA 69 Niektóre anteny radiowe są wykonane inaczej. Zamiast całego mnóstwa dipoli umieszczonych na długiej prostej, co wymaga wielu drutów zasilających, możemy ułożyć dipole nie na prostej, ale na krzywej, a odbiornik umieścić w takim punkcie, w którym może on wykrywać fale rozproszone. Krzywą tę dobiera się tak zręcznie, że gdy fale radiowe padają z góry, tworząc nową falę, wszystkie fale rozproszone na drutach osiągają odbiornik w takim samym czasie (rys. 26.12). Inaczej mówiąc, krzywa jest parabolą i gdy źródło znajduje się dokładnie na jej osi, otrzymujemy bardzo silne natężenie w ognisku. Łatwo w tym przypadku zrozumieć, jaka jest zdolność rozdzielcza przyrządu. Ustawienie anten na krzywej parabolicznej nie jest sprawą istotną. Jest tylko wygodnym sposobem zebrania wszystkich sygnałów w jednym punkcie, bez względnego opóźnienia i bez drutów zasilających. Kąt, który daje się rozróżnić w takim urządzeniu, może wynosić nadal 0 = 1/L, gdzie L jest odległością między pierwszą i ostatnią anteną. Nie zależy on od wzajemnej odległości anten i mogą one znajdować się bardzo blisko siebie albo nawet stanowić po prostu jednolity kawałek metalu. Mamy teraz oczywiście na myśli zwierciadło teleskopu. Tak więc znaleźliśmy zdolność rozdzielczą teleskopu! Zdolność rozdzielcza zapisywana jest niekiedy jako 0=\,22/./L, gdzie L jest średnicą teleskopu. Nie jest ona jednak dokładnie równa ).jL z następującego powodu. Wynik 0 = ).jL otrzymaliśmy przyjmując równe natężenia dla wszystkich linii dipolowych, gdy jednak mamy teleskop kulisty (taki, jakie zwykle się buduje), wówczas z brzegów zewnętrznych dochodzi mniej sygnałów. Nie jest to bowiem przypadek kwadratu, dla którego otrzymujemy jednakowe natężenia wzdłuż całego brzegu. W rezultacie korzystamy tylko z części teleskopu i efekt jest nieco mniejszy. Łatwo więc zrozumieć, że efektywna średnica jest nieco krótsza niż średnica prawdziwa. Z tego właśnie zdaje nam sprawę czynnik 1,22. Mimo to korzystanie z takiej dokładności we wzorze na zdolność rozdzielczą wydaje się trochę pedanterią**. 30-5. Warstewki barwne; kryształy Przedstawiliśmy powyżej niektóre efekty interferencyjne uzyskane przez dodawanie rozmaitych fal. Jest wiele innych przykładów tego rodzaju i chociaż podstawowego ich mechanizmu na razie nie rozumiemy, kiedyś stanie się on dla nas jasny, a już teraz możemy zrozumieć jak się interferencja odbywa. Weźmy na przykład światło padające w kierunku normalnej na powierzchnię ośrodka o współczynniku załamania n. Część światła zostaje wówczas odbita. Przyczyny odbicia nie możemy na razie zrozumieć; będziemy ją badać później. Załóżmy jednak, że część światła zostaje odbita zarówno przy wchodzeniu, jak i przy wychodzeniu z ośrodka załamującego. Spoglądając na odbicie źródła światła w cienkiej warstewce, zobaczymy sumę dwu fal. Jeżeli grubość warstewki będzie dostatecznie mała, *' Przede wszystkim dlatego, że już samo kryterium Rayleigha jest pojęciowo przybliżone. Mówi ono, kiedy pojawiają się duże trudności w stwierdzeniu, czy obraz został wywołany przez jedną, czy przez dwie gwiazdy. Ale właściwie, jeżeli daje się dostatecznie starannie zmierzyć dokładny rozkład natężenia na dyfrakcyjnej plamce obrazu, to można wykazać, że plamka została wytworzona przez dwa źródła nawet wtedy, gdy 6 jest mniejsze niż X/L.
70 30. DYFRAKCJA obie fale ulegną interferencji bądź konstruktywnej, bądź destruktywnej, zależnie od znaków faz. Może się na przykład zdarzyć, że dla światła czerwonego uzyskujemy odbicie spotęgowane, a dla światła niebieskiego, o innej długości fali, fala odbita interferuje destruktywnie tak, że widzimy tylko jasne odbicie czerwone. Zmieniając grubość warstewki, na przykład patrząc w inne miejsce, gdzie warstewka jest grubsza, możemy spostrzec zjawisko odwrotne - czerwień się znosi, a błękit nie, tak że w rezultacie pojawia się silna barwa błękitna albo zielona, albo żółta, albo jeszcze jakaś inna. Patrząc na cienką warstwę dostrzegamy więc barwy, które się zmieniają, gdy spoglądamy pod różnymi kątami, bo jak wiemy, stosunki czasowe są różne przy różnych kątach. Tak oto w jednej chwili wyjaśniają się tysiące nowych sytuacji, w których obserwujemy pod różnymi kątami barwy na warstewkach oleju, na bańkach mydlanych i tak dalej. Zasada pozostaje jednak zawsze ta sama: po prostu dodajemy fale z różnymi fazami. Jako inne ważne zastosowanie dyfrakcji wspomnijmy sprawę następującą. Widzieliśmy na ekranie obraz dyfrakcyjny utworzony za pomocą siatki dyfrakcyjnej. Gdybyśmy użyli światła jednobarwnego, obraz znalazłby się w pewnym określonym miejscu. Pojawiłyby się wtedy także różne obrazy wyższego rzędu. Gdyby długość fali światła była znana, to z położeń obrazów można by wywnioskować, jak odległe są od siebie linie na siatce. Z różnicy natężeń poszczególnych obrazów moglibyśmy znaleźć kształt rys na siatce i stwierdzić, czy została ona zrobiona z drutów, piłowatych szczerb czy inaczej, chociaż nie możemy przecież tego zobaczyć. Zasadę tę wykorzystuje się do wykrywania położeń atomów w krysztale. Trudność polega tylko na tym, że kryształ jest trójwymiarowy; jest to powtarzający się, trójwymiarowy układ atomów. Nie możemy także użyć zwykłego światła, bo jeżeli efekt ma się pojawić, musimy użyć promieniowania, które ma długość fali mniejszą niż odległość między atomami. Musimy więc użyć promieniowania o bardzo małej długości fali, to znaczy promieni Róntgena. Tak więc oświetlając kryształ promieniami rentgenowskimi i badając, jakie jest natężenie odbić w różnych rzędach wiązki, możemy określić wewnętrzny układ atomów nie mogąc ich zobaczyć na własne oczy! W ten sposób poznajemy ułożenie atomów w różnych substancjach i dzięki temu mogliśmy w pierwszym rozdziale (t. I, cz. 1) rysować obrazki pokazujące układ atomów w soli kamiennej i tak dalej. Wrócimy później do tego tematu i omówimy go bardziej szczegółowo, dlatego nie będziemy teraz już więcej o tej ciekawej sprawie mówić. 30-6. Ugięcie na nieprzezroczystych ekranach Zajmiemy się teraz bardzo ciekawą sprawą. Załóżmy, że mamy nieprzezroczystą kartkę papieru z otworami i światło padające z jednej jej strony. Chcemy wiedzieć, jakie natężenie panuje z drugiej strony kartki. Mówi się na ogół, że światło świeci poprzez otwory wytwarzając po drugiej stronie jakiś efekt. Okaże się, że w doskonałym przybliżeniu poprawną odpowiedź można otrzymać, jeżeli się założy, że źródła są rozłożone z jednostajną gęstością w otworach i że fazy tych źródeł są takie, jakby nieprzezroczystego materiału wcale nie było. Oczywiście, nie ma naprawdę żadnych źródeł w otworach, jest to właściwie jedyne miejsce, gdzie na pewno źródeł nie ma. Uzyskujemy jednak poprawny
30-6. UGIĘCIE NA NIEPRZEZROCZYSTYCH EKRANACH 71 obraz dyfrakcyjny uważając otwory za jedyne miejsce, gdzie są źródła. Jest to dosyć dziwne i wyjaśnimy sobie później, dlaczego jest prawdziwe. Na razie załóżmy po prostu, że tak jest. W teorii dyfrakcji istnieje jeszcze inny rodzaj ugięcia, który powinniśmy krótko omówić. Zwykle nie robi się tego tak wcześnie w kursie elementarnym po prostu dlatego, że wzory matematyczne polegające na dodawaniu omawianych dawniej małych wektorów są trochę skomplikowane. Poza tym jednym szczegółem dyskusja nie różni się od tego, co robiliśmy dotąd. Wszystkie zjawiska interferencyjne są takie same; ich teoria nie zawiera niczego bardziej skomplikowanego. Warunki mogą być tylko bardziej złożone, co utrudnia dodawanie wektorów. To wszystko. Załóżmy, że światło przychodzące z nieskończoności rzuca na ekran cień jakiegoś przedmiotu. Rysunek 30.7 pokazuje ekran, na którym cień przedmiotu AB utworzony jest przez źródło światła bardzo odległe w porównaniu z pojedynczą długością fali. Spodziewamy się pewnie, że na zewnątrz cienia jest wszędzie jasno, a wewnątrz wszędzie ciemno. W rzeczywistości, jeżeli wykreślimy natężenie w pobliżu granicy cienia jako funkcję położenia, to wzrasta ono i opada, waha się i oscyluje koło krawędzi w bardzo dziwny sposób (rys. 30.8). Zbadamy teraz przyczynę tego zjawiska. Korzystając z nie udowodnionego dotąd twierdzenia, możemy zastąpić właściwy układ przez zbiór efektywnych źródeł jednostajnie rozłożonych w niezasłoniętej części przestrzeni za przedmiotem. Wyobraźmy sobie układ wielu bardzo gęsto rozstawionych anten; szukamy natężenia w pewnym punkcie P. Sprawa wygląda prawie tak, jak to, co robiliśmy dotąd. Ale niezupełnie: nasz ekran nie znajduje się bowiem w nieskończoności, ale w odległości skończonej. Aby obliczyć natężenie w pewnym określonym punkcie, dusimy pododawać przyczynki od wszystkich anten. Najpierw mamy antenę w Punkcie D, dokładnie naprzeciw punktu P Jeżeli przesuniemy się o niewielki kąt, odpowiadający na przykład wysokości h. A przedmiot nieprzezroczysty 30.7. Odległe źródło światła rzuca na ekran cień nieprzezroczystego przedmiotu 30.8. Dodawanie amplitud dla wielu oscylatorów o zgodnej fazie, których opóźnienie fazowe zmienia się jak kwadrat odległości od punktu D z poprzedniego rysunku
72 30. DYFRAKCJA J-i -To 1,0 , Q^y r 1 V/*r następuje wzrost opóźnienia. (Następuje także zmiana w amplitudzie, spowodowana zmianą odległości, ale efekt ten jest bardzo mały, gdy znajdujemy się dość daleko. Jest on znacznie mniej ważny niż różnica w fazach.) Różnica dróg ED-DP wynosi teraz h2/2s, tak że róż- x° * nica faz jest proporcjonalna do kwadra- „„„ v, . . ,_,.. , J . . . _ , tu odległości od D, natomiast w naszych 30.9. Natężenie w pobliżu krawędzi cienia. Cień geo- metryczny wypada w punkcie *„ poprzednich rachunkach s było nieskończone i różnica faz była liniowo proporcjonalna do h. Gdy fazy są proporcjonalne liniowo, wektory ustawiają się tak, że kąt między dwoma sąsiednimi wektorami jest stały. My zaś szukamy krzywej powstającej z dodawania wielu nieskończenie małych wektorów, z tym że kąty między tymi wektorami wzrastają nie liniowo, ale jak kwadrat długości krzywej. Konstrukcja takiej krzywej wymaga trochę wyższej matematyki, ale za wsze możemy ją zbudować rysując po prostu strzałki i mierząc kąty. Tak czy inaczej, otrzymujemy zdumiewającą krzywą (zwaną spiralą Cornu), pokazaną na rys. 30.8. Jak się nią mamy posługiwać? Chcąc znaleźć natężenie na przykład w punkcie P dodajemy mnóstwo przyczynków dawanych przez fazy od punktu D w górę aż do nieskończoności i od D w dół tylko do punktu BP. Zaczynamy więc od punktu BP na rys. 30.8 i rysujemy szereg strzałek pod stale wzrastającym kątem. Wobec tego całkowity przyczynek powyżej punktu BP stale posuwa się wzdłuż zwijającej się krzywej. Zaprzestając całkowania w jakimś punkcie otrzymalibyśmy całkowitą amplitudę jako wektor od punktu B do tego właśnie punktu. W naszym szczególnym przypadku posuwamy się aż do nieskończoności i pełnym rozwiązaniem jest wektor BPcc. Położenie na krzywej, odpowiadające punktowi BP na przedmiocie, zależy od położenia punktu P, ponieważ D, punkt przegięcia, zawsze odpowiada położeniu punktu P. Zależnie więc od tego, gdzie leży punkt P ponad B, punkt początkowy będzie przyjmował rozmaite położenia na lewej dolnej części krzywej, a wypadkowy wektor BP=C będzie przechodził przez liczne maksima i minima (rys. 30.9). Jeżeli jednak znajdujemy się w punkcie Q, po przeciwnej stronie punktu P, uwzględniamy tylko jeden koniec spirali, a nie korzystamy w ogóle z drugiego. Inaczej mówiąc, nie zaczynamy wcale od punktu D, ale od punktu BQ, tak że po tej stronie otrzymujemy natężenie spadające w sposób ciągły, w miarę jak punkt Q zagłębia się w cieniu Dla pokazania, że naprawdę rozumiemy całą sprawę, możemy natychmiast obliczyć z łatwością natężenie akurat naprzeciw krawędzi. Natężenie wynosi tutaj i padającego światła. Przyczyna: dokładnie na krawędzi (wtedy gdy końcowy punkt B strzałek znajduje się w D na rys. 30.8) pozostaje nam z krzywej połowa wartości osiąganej daleko w jasnym obszarze. Gdy nasz- punkt R leży daleko w obszarze oświetlonym, posuwamy się od jednego końca krzywej do drugiego, to znaczy o jeden pełny wektor jednostkowy. Gdy zaś znajdujemy się na krawędzi cienia, mamy tylko pół amplitudy - i natężenia. Zajmowaliśmy się w tym rozdziale natężeniem wytwarzanym w różnych kierunkach
30-6. UGIĘCIE NA NIEPRZEZROCZYSTYCH EKRANACH 73 przez rozmaite rozkłady źródeł. Teraz rozpatrzymy ostatni nasz przykład prowadzący do wzoru, który będzie nam potrzebny w następnym rozdziale, dotyczącym teorii współczynnika załamania. Dotąd do naszych celów wystarczała znajomość względnych natężeń, teraz jednak znajdziemy pełny wzór na pole. 30-7. Pole pochodzące od płaszczyzny drgających ładunków Załóżmy, że mamy płaszczyznę wypełnioną źródłami zgodnie wykonującymi w płaszczyźnie ruchy drgające o takich samych amplitudach i fazach. Jakie jest pole w skończonej, ale bardzo wielkiej odległości od płaszczyzny? (Oczywiście, nie możemy się bardzo zbliżać do płaszczyzny, ponieważ nie mamy odpowiednich wzorów na pole blisko źródeł.) Niech ładunki leżą w płaszczyźnie AT, my zaś będziemy szukali pola w punkcie P daleko na osi Z (rys. 30.10). Zakładamy, że na jednostce powierzchni płaszczyzny znajduje się r\ ładunków, z których każdy ma wielkość q. Wszystkie ładunki poruszają się ruchem drgającym prostym o tym samym kierunku, amplitudzie i fazie. Niech ruch każdego ładunku względem jego własnego położenia średniego będzie opisany przez x0 cos cot. Posługując się zaś zapisem zespolonym i pamiętając, że właściwy ruch przedstawiony jest przez część rzeczywistą, możemy go opisać przez x0 e10". Obliczamy teraz w punkcie P pole wszystkich ładunków, znajdując najpierw pole każdego ładunku q, a następnie dodając przyczynki od nich wszystkich. Wiemy, że pole promieniowania jest proporcjonalne do przyspieszenia ładunku, które wynosi -uj2x0 e""' (i jest takie samo dla każdego ładunku). Pole elektryczne w punkcie P, pochodzące od ładunku w punkcie Q, jest proporcjonalne do przyspieszenia ładunku q, przy czym musimy pamiętać, że pole w punkcie P w chwili ł dane jest przez przyspieszenie ładunku we wcześniejszej chwili t' = t-rjc, gdzie r/c jest czasem zużytym przez fale na przebycie odległości r od punktu Q do P. Wobec tego pole w punkcie P jest proporcjonalne do -aj2x0eM'_,/c). (30.10) Gdy wartość przyspieszenia, mierzoną w punkcie P, wstawimy do naszego wzoru na pole elektryczne w dużych odległościach od 30 ,0 PoIe pr0mieniowania płaszczyzny drga- promieniującego ładunku, otrzymamy jących ładunków (pole elektryczne w punkcie P\ q od ładunku w punkcie Q I 4ne0 c2 2„ Jia(t- r/c) W XOe X-— (w przybliżeniu). (30.11) r W obecnej postaci wzór ten nie jest zupełnie ścisły, ponieważ powinniśmy wstawić nie przyspieszenie ładunku, ale jego składową prostopadłą do linii QP. Bierzemy jednak drgający ładunek płaszczyzna drgających ładunków
74 30. DYFRAKCJA tak dużą odległość punktu P w porównaniu z odległością punktu Q od osi (odległość p na rys. 30.9), że dla tych zmian, które uwzględniamy, czynnik cosinusowy (i tak prawie równy 1) można pominąć. Aby uzyskać całkowite pole w punkcie P, dodajemy teraz wszystkie przyczynki od ładunków na płaszczyźnie. Suma powinna oczywiście być sumą wektorową. Ponieważ jednak kierunek pola elektrycznego jest prawie taki sam dla wszystkich ładunków, możemy zgodnie z naszym poprzednim przybliżeniem po prostu dodawać wartości pól. W przybliżeniu tym pole w punkcie P zależy od odległości r i wszystkie ładunki o tym samym r wytwarzają tu jednakowe pola. Dodajemy więc najpierw pola ładunków w pierścieniu o szerokości dp i o promieniu p. Całkowite pole otrzymamy wykonując następnie całkowanie po wszystkich p. Liczba ładunków w pierścieniu jest iloczynem pola powierzchni pierścienia 2np dp i liczby ładunków na jednostkowej powierzchni tj. Mamy więc -f. <o2x0e,ol'-"e) całkowite pole w punkcie P= I j rjlnpdp. (30.12) 47ie0c r Zamierzamy obliczyć tę całkę w granicach od p = 0 do p=oo. Zmienna t musi być oczywiście ustalona podczas całkowania, a jedynymi zmieniającymi się wielkościami będą p i r. Po opuszczeniu na chwilę wszystkich stałych czynników, włącznie z czynnikiem e"0', otrzymamy szukaną całkę: /• g-iwr/c pdp. (30.13) p = 0 Aby ją obliczyć, musimy skorzystać ze związku między p i r: r2 = p2 + z2. (30.14) Ponieważ z nie zależy od p, różniczkujemy więc to równanie i otrzymujemy 2r dr = 2p dp , co jest bardzo szczęśliwą okolicznością, ponieważ w naszej całce możemy zastąpić iloczyn p dp iloczynem r dr i r zniesie się z r w mianowniku. Poszukujemy więc prostszej całki: J e'^dr. (30.15) r = z Całkowanie funkcji wykładniczej jest bardzo łatwe. Dzielimy ją przez współczynnik przy zmiennej r w wykładniku i wyliczamy funkcję wykładniczą na krańcach przedziału całkowania. Ale granice r nie są takie same jak granice p. Gdy p = 0, r = z, tak że r zmienia się w granicach od z do oo i dla całki otrzymujemy wartość -^[e-ioo-e-(iw/c)2], (30.16) « ioa
30-7. POLE POCHODZĄCE OD PŁASZCZYZNY DRGAJĄCYCH ŁADUNKÓW 75 6= A8= ~c t o>Ar 1 "C " — ■■■ ^ *~ n S' c. oś urojona oś rzeczywista ^8 \ v4e \ 4r\> A T Ae gdzie napisaliśmy oo zamiast (co/c)oo, ponieważ oba te wyrażenia oznaczają po prostu bardzo dużą liczbę! Wyrażenie e-,a) jest bardzo dziwne. Tak na przykład jego część rzeczywista wynosi cos(-oo), który z punktu widzenia matematyki jest całkowicie nieoznaczony (chociaż możemy się spodziewać, że znajdziemy go w pewnym punkcie — albo też w jakimś przedziale (?) - między + 1 a -1!). Ale z punktu widzenia fizyki wyrażenie to może oznaczać coś zupełnie sensownego i zwykle bywa po prostu uznawane za zero. Aby się o tym i w naszym przypadku przekonać, wracamy znowu do badania początkowej całki (30.15). Możemy rozumieć całkę (30.15) jako sumę wielu małych liczb zespolonych, z których każda ma moduł Ar i fazę 9= -cor/c w płaszczyźnie zespolonej. Spróbujmy obliczyć tę sumę sposobem graficznym. Na rysunku 30.11 zaznaczyliśmy pierwsze pięć wyrazów tej sumy. Każdy odcinek krzywej ma długość Ar i jest ustawiony pod kątem A6= -co Arjc względem poprzedniego. Suma tych pięciu składników jest przedstawiona jako strzałka od punktu początkowego do końca piątego odcinka! W miarę dalszego dodawania odcinków zakreślamy wielobok, aż dojdziemy z powrotem do punktu początkowego (w przybliżeniu) i wówczas znowu rozpoczyna się ruch dookoła. Dodając coraz więcej odcinków po prostu wędrujemy wkoło, stale pozostając blisko okręgu, którego promień, jak łatwo pokazać, wynosi cjm. Widać teraz, dlaczego całkowanie nie daje określonej odpowiedzi! Wróćmy jednak znowu do fizyki całej sytuacji. W każdym rzeczywistym układzie płaszczyzna ładunków nie może być nieskończenie rozciągła, ale musi się gdzieś kończyć. Gdyby kończyła się nagle i miała dokładnie kształt koła, nasza całka przyjmowałaby jakąś wartość leżącą na okręgu z rys. 30.11. Jeżeli jednak gęstość ładunków na płaszczyźnie będzie w pewnej dużej odległości od środka stopniowo maleć (albo też spadać nagle, ale wzdłuż nieregularnej krzywej, tak aby dla większych p całkowity pierścień o szerokości dp suma\ 30.11. Graficzne rozwiązanie funkcji fe ""r'c<fr 30.12. Graficzne rozwiązanie funkcji J' 7 e ,w,/e dr o urojona
76 30. DYFRAKCJA nie dawał już przyczynków), współczynnik 77 w ścisłej całce będzie spadał do zera. Jeżeli dodajemy zmniejszające się odcinki, ale nadal obracamy się o ten sam kąt, to wykres naszej całki przybiera kształt krzywej spiralnej. Spirala osiąga wreszcie kres w środku naszego początkowego okręgu, jak to przedstawia rys. 30.12. Fizycznie poprawną wartością całki jest zespolona liczba A, pokazana na rysunku jako odległość od punktu początkowego do środka koła, równa dokładnie ~e-i0,z/c, (30.17) ico co można sobie samemu obliczyć. Jest to taki sam wynik, jaki otrzymalibyśmy z równania (30.16), przyjmując w nim e""x' = 0. (Z innego jeszcze powodu przy dużych wartościach r przyczynki do całki ubywają; chodzi mianowicie o czynnik opuszczony przez nas przy rzutowaniu przyspieszenia na płaszczyznę prostopadłą dla linii PQ.) Interesują nas oczywiście tylko sytuacje fizyczne, przyjmiemy więc, że e~lco jest równe zeru. Wracając do naszego początkowego wzoru (30.12) dla pola i wstawiając z powrotem wszystkie czynniki towarzyszące całce, otrzymujemy: całkowite pole w punkcie P= ia;x0eM'_I/c) (30.18) 2e0c (pamiętamy, że l/<=-<)• Warto zauważyć, że (ia>x0 t'0") jest dokładnie równe prędkości ładunków. Możemy więc także napisać równanie dla pola w postaci: całkowite pole w punkcie /*= [prędkość ładunków] , (30.19) ££q ^ tot — zfc co wygląda dość dziwnie, ponieważ opóźnienie jest spowodowane dokładnie przez odległość z, czyli przez najkrótszą odległość punktu P od płaszczyzny ładunków. Ale taki właśnie jest wynik rachunków, które na szczęście dają raczej prosty wzór. (Możemy przy okazji dodać, że chociaż nasze wyprowadzenie jest ważne tylko dla dużych odległości od płaszczyzny drgających ładunków, końcowe jednak wzory (30.18) lub (30.19) są, jak się okazuje, poprawne dla każdej odległości, nawet dla odległości z<k.)
31 skqd się bierze współczynnik załamania 31-1. Współczynnik załamania Powiedzieliśmy poprzednio, że światło rozchodzi się w wodzie wolniej niż w powietrzu, w powietrzu zaś nieco wolniej niż w próżni. Opisując to zjawisko posługujemy się pojęciem współczynnika załamania n. Teraz chcielibyśmy zrozumieć, skąd się bierze taka zmniejszona prędkość. W szczególności postaramy się zobaczyć, jak to się wiąże z pewnymi założeniami czy stwierdzeniami fizycznymi, które wypowiedzieliśmy już wcześniej. Były one następujące: 1. Całkowite pole elektryczne w dowolnych warunkach fizycznych można zawsze przedstawić jako sumę pól pochodzących od wszystkich ładunków we wszechświecie. 2. Pole promieniowania pochodzące od pojedynczego ładunku jest proporcjonalne do przyspieszenia ładunku, wziętego z opóźnieniem odpowiadającym zawsze prędkości c. My jednak rozważamy światło rozchodzące się w kawałku szkła. Narzuca się więc myśl zmiany naszych założeń. Czy nie należy raczej powiedzieć, że opóźnienie odpowiada prędkości cjnl Otóż nie jest to prawda i trzeba zrozumieć dlaczego. W przybliżeniu prawdą jest, że w substancji, której współczynnik załamania wynosi n, światło albo jakakolwiek fala elektryczna pozornie rozchodzi się z szybkością c/n. Jednakże pola zawsze powstają wskutek ruchu wszystkich ładunków — włączając w to i ładunki poruszające się w substancji - i ostateczna prędkość tych wszystkich przyczynków do pola wynosi c. Wynika więc sprawa zrozumienia, skąd się tu bierze pozornie mniejsza prędkość. Zjawisko to postaramy się zrozumieć, rozpatrując bardzo prosty przypadek. W dużej odległości od cienkiej płytki wykonanej z przezroczystej substancji, np. szkła, umieszczamy źródło, które będziemy nazywać „źródłem zewnętrznym". Jakie będzie pole w dużej odległości po przeciwnej stronie płytki? Sytuację przedstawia rys. 31.1, przy czym należy sobie wyobrazić, że punkty 5 i P są bardzo odległe od płytki. Zgodnie z wypowiedzianymi
78 31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA źródło fali elektrycznej 31.1. Fale elektryczne przechodzące przez warstwę przezroczystego ośrodka poprzednio zasadami pole elektryczne gdzieś daleko od wszystkich poruszających się ładunków jest sumą (wektorową) pól wytworzonych przez zewnętrzne źródło (w punkcie 5) i pól wytworzonych przez każdy z ładunków poruszających się w płytce szkła. Wszystkie te pola występują w tej sumie ze swoimi własnymi opóźnieniami odpowiadającymi prędkości c. Pole pochodzące od każdego ładunku nie zmienia się przy tym wskutek obecności innych ładunków. To są właśnie podstawowe zasady. Pole w punkcie P można więc zapisać w postaci: E= l_ -każdego ładunku (-»1-1) wszystkie ładunki albo E = E, + 2, -każdego ładunku ' (31-2) wszystkie ładunki gdzie Es jest polem pochodzącym od samego tylko źródła. Byłoby ono dokładnie równe polu w punkcie P, gdyby pomiędzy punktami S i P nie było żadnego ośrodka. Przewidujemy, że pole w punkcie P będzie różne od pola E,, jeżeli wprowadzimy jeszcze inne poruszające się ładunki. Skąd jednak w szkle mają się znaleźć poruszające się ładunki? Otóż wiemy, że każdy ośrodek materialny składa się z atomów zawierających elektrony. Pole elektryczne źródła działając na te atomy porusza elektronami tam i z powrotem, ponieważ działa na nie siłą. Poruszające się zaś elektrony wytwarzają pole, czyli stają się nowymi źródłami promieniowania. Te nowe źródła są związane ze źródłem 5, ponieważ wzbudzane są przez jego pole. Całkowite pole nie jest więc już dokładnie polem źródła S, bo zmieniło się o dodatkowe przyczynki od innych poruszających się ładunków. Znaczy to, że pole nie jest już takie, jakie było przed umieszczeniem szkła, ale uległo zmianie i zmiana ta jest taka, że pole wewnątrz szkła pozornie porusza się z inną prędkością. Taka jest główna myśl, którą będziemy chcieli ująć ilościowo. Jest to zadanie dość skomplikowane, jeżeli sprawę mamy potraktować ściśle. Nie jest bowiem całkowicie prawdziwe, że wszystkie poruszające się ładunki są pobudzane tylko przez pole źródła. Skupmy uwagę na określonym ładunku. Zauważmy, że odczuwa on nie tylko obecność źródła, ale jak wszystko inne na świecie odczuwa on także wpływ wszystkich fala padająca / fala „odbita' fala .przepuszczona" A p czemu się równa pole elektryczne w tym punkcie? płytka szklana
31-1. WSPÓŁCZYNNIK ZAŁAMANIA 79 poruszających się ładunków, a w szczególności wpływ ładunków poruszających się w innych miejscach szkła. Całkowite pole, działające na określony ładunek, składa się z pól od innych ładunków, których ruchy zależą z kolei od tego, co robi nasz wybrany ladunekl Widać, że do uzyskania pełnego i dokładnego wzoru trzeba skomplikowanego układu równań. Sprawa jest tak złożona, że odkładamy to zagadnienie do następnego tomu. Zamiast tego zbadamy bardzo prosty przypadek, który pozwoli nam jasno zrozumieć wszystkie zasady fizyczne. Rozważmy sytuację, w której wpływ innych atomów jest bardzo słaby w porównaniu z wpływem źródła. Innymi słowy, rozważmy ośrodek, w którym całkowite pole nie zmienia się wskutek ruchu innych ładunków. Odpowiada to ośrodkowi, którego współczynnik załamania jest bardzo bliski 1. Tak się dzieje na przykład wtedy, gdy gęstość atomów jest bardzo mała. Nasz rachunek będzie ważny w dowolnym przypadku, w którym współczynnik załamania jest z jakiegokolwiek powodu bliski 1. Unikniemy w ten sposób komplikacji towarzyszących najbardziej ogólnemu, pełnemu rozwiązaniu. Warto tu przy okazji zauważyć, że ruch ładunków w płytce powoduje jeszcze inne zjawisko. Ładunki te będą promieniowały fale także z powrotem w kierunku źródła 5. Takie biegnące wstecz pole jest światłem, które widzimy jako odbite od powierzchni przezroczystych substancji. Nie pochodzi ono po prostu z powierzchni. Promieniowanie biegnące wstecz pochodzi z całego wnętrza, ale okazuje się, że całkowity wynik równoważny jest odbiciu od powierzchni. Takie zjawiska odbicia przekraczają chwilowo zakres naszego przybliżenia, ponieważ w rachunkach ograniczamy się do substancji o współczynniku załamania tak bliskim jedności, że tylko bardzo mała ilość światła ulega odbiciu. 31.2. Związek między załamaniem i zmianą prędkości / Zanim uczynimy dalszy krok w badaniu, skąd się bierze współczynnik załamania, musimy sobie uprzytomnić, że zrozumienie zjawiska załamania sprowadza się do zrozumienia tego, dlaczego pozorna szybkość fali jest różna w różnych substancjach. Zakrzywianie się promieni świetlnych zachodzi po prostu dlatego, że wypadkowa prędkość fal zależy od ośrodka. Dla przypomnienia skąd się to bierze, narysowaliśmy na rys. 31.2 kilka kolejnych grzbietów fali elektrycznej, padającej z próżni na powierzchnię szklanego bloku. Strzałka prostopadła do grzbietów wskazuje kierunek ruchu fali. Zauważmy, że wszystkie drgania fali muszą mieć tę samą częstość. (Widzieliśmy, że drgania wzbudzone mają tę samą częstość co źródło pobudzające.) Oznacza to też, że grzbiety fal po obu stronach powierzchni granicznej muszą leżeć "a niej w równych odstępach. Muszą one bowiem poruszać się razem tak, aby ładunek znajdujący się na granicy ośrodka odczuwał tylko jedną częstość. Ale najkrótszą odległością między grzbietami fali jest długość fali równa prędkości podzielonej próżnia / A 'i ' I / V / grzbiety fal /u /szk,°
80 31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA przez częstość. Dla próżni mamy ?.0 = 2nc/oj, a po drugiej stronie X = 2nv/co, czyli 2nc/a>n, gdzie v = cin oznacza prędkość fali. Z rysunku można dostrzec, że jedyny sposób właściwego „dopasowania się" fal na powierzchni granicznej polega na tym, aby fale w ośrodku posuwały się pod zmienionym kątem względem powierzchni. Z zależności geometrycznych wynikających z rysunku można się przekonać, że dla „dopasowania" musi zachodzić /.o/sinOo = /./sin0 , czyli sin 0Q; sin 0 = « , co stanowi treść prawa Snella. W pozostałej części naszych rozważań będziemy się zastanawiać tylko nad tym, dlaczego w substancji o współczynniku załamania n światło ma efektywną szybkość c/n. Sprawą zakrzywienia kierunku światła nie będziemy się w tym rozdziale więcej zajmować. Wracamy znowu do sytuacji przedstawionej na rys. 31.1. Widzimy, że sprawa polega na obliczeniu pola wytwarzanego w punkcie P przez wszystkie ładunki drgające w szklanej płytce. Tę część pola oznaczymy jako Ea. Ona właśnie stanowi sumę napisaną jako drugi ■wyraz w równaniu (31.2). Gdy dodamy ją do wyrazu £s, pochodzącego od źródła, otrzymamy całkowite pole w punkcie P. To, o czym teraz będziemy mówić, jest zapewne najtrudniejszym fragmentem materiału tego tomu. Ale trudność bierze się tylko stąd, że na całość rozumowania składa się wiele części, które trzeba złożyć razem każda część z osobna jest jednakże bardzo prosta. W odróżnieniu od większości przypadków, kiedy to możemy powiedzieć: „Co tam wyprowadzenie, ważny jest wynik!", tym razem nie zależy nam tyle na wyniku, ile na wyprowadzeniu. Innymi słowy, trzeba teraz zrozumieć fizyczne przyczyny pojawiania się współczynnika załamania. Aby zrozumieć tok postępowania, trzeba najpierw znaleźć takie „pole-poprawkę" Ea, aby całkowite pole w punkcie P wyglądało jak promieniowanie ze źródła, spowolnione podczas przechodzenia przez cienką płytkę. Gdyby płytka nie miała na nie wpływu, polem fali poruszającej się w prawo (wzdłuż osi z) byłoby Es = E0cos [w(f-zje)] ' (31.3) albo, używając zapisu wykładniczego, £s = £0eM'-r/c). (31.4) Co by się teraz stało, gdyby fala przechodząc przez płytkę rozchodziła się wolniej? Niech Az będzie grubością płytki. Gdyby płytki nie było, fala przebyłaby odległość Az w czasie Azje. Jeżeli jednak porusza się ona pozornie z prędkością cjn, to przejście zabierze jej dłuższy czas n Azje, czyli dodatkowy czas At = {n- \)Azjc. Po wyjściu z płytki będzie się ona rozchodzić znowu z prędkością c. Możemy uwzględnić dodatkowe opóźnienie spowodowane przechodzeniem przez płytkę, jeśli zastąpimy w równaniu (31.4) t przez (t — At), czyli przez [f-(n-l)/fz/c]. A więc po wstawieniu płytki fala powinna być zapisana w postaci , Łz* płytką -Ł0e • (Jl-J)
l.|. WSPÓŁCZYNNIK ZAŁAMANIA 81 Równanie to możemy także napisać jako P _ -iu>(n-1 I Jz/cp iui(t-zlc) •^za płytką — c C0C (31.6) Mówi nam ono, że fala za płytką powstaje z fali rozchodzącej się bez płytki, to jest z £,' pomnożonej przez czynnik e_"u<',-1><li/r Wiemy jednak, że mnożenie przez czynnik e'8 funkcji oscylującej e"°* oznacza po prostu zmianę fazy drgań o kąt 9. Jest to oczywiście spowodowane dodatkowym opóźnieniem przy przechodzeniu przez płytkę o grubości Az. Z tego właśnie powodu faza została cofnięta o wielkość a>(n-\)Az (cofnięta, ponieważ występuje znak minus w wykładniku). Poprzednio powiedzieliśmy sobie, że płytka powinna dodać jakieś pole £a do właściwego pola £s= £0e"*"-I/e), a tymczasem stwierdziliśmy, że działanie płytki polega na mnożeniu pola przez czynnik przesuwający jego fazę. Wszystko jest jednak w zupełnym porządku, gdyż ten sam wynik możemy uzyskać przez dodanie odpowiedniej liczby zespolonej. Liczbę tę szczególnie łatwo można znaleźć w przypadku małego o grubości Az, pamiętamy bowiem, że jeśli x jest małą liczbą, to e* jest w przybliżeniu równe 1 +x. Możemy więc napisać e"to("",Ml/c=l-iw(«-l)Jz/c. (31.7) Wykorzystując tę równość w równaniu (31.6) mamy £ _P eM«-./r> M"-0^ Łza płytką — ^0 c £0e ,i<o(i-2/c) (31.8) Pierwszy wyraz określa właśnie pole źródła, a drugi musi być dokładnie równy polu £a wytwarzanemu na prawo od płytki przez jej drgające ładunki. Pole to jest tutaj wyrażone za pomocą współczynnika załamania i zależy, oczywiście, od natężenia fali ze źródła. 31.3. Wykres fali przepuszczonej w określonym czasie t i przy określonym z Przeprowadzone rozumowanie łatwo jest zilustrować na płaszczyźnie liczb zespolonych przedstawionej na rys. 31.3. Najpierw przedstawiamy geometrycznie liczbę £s (wybierając takie wartości na z i t, aby wektor Es był poziomy, ale to nie jest konieczne). Opóźnienie wywołane spowolnieniem w płytce cofnie fazę o pewną liczbę, to znaczy obróci wektor E, o kąt ujemny. Jest to równoważne dodaniu małego wektora Ea prostopadłego w przybliżeniu do wektora Es. Takie właśnie znaczenie ma czynnik -iw drugim wyrazie równania (31.8). Mówi on, że jeżeli Es jest liczbą rzeczywistą, to £a jest liczbą ujemną urojoną albo, ogólnie biorąc, że wektory Es i Ea tworzą między sobą kąt prosty. ''oś urojona kąt=w(n-1)4z/c
82 31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA 31-2. Pole pochodzące od ośrodka materialnego Musimy teraz postawić sobie pytanie: Czy pole Ea przedstawione matematycznie jako drugi wyraz wyrażenia (31.8) jest takie właśnie, jakiego oczekujemy od drgających ładunków w płytce? Jeżeli się nam uda to pokazać, to tym samym obliczymy wielkość, która powinna być współczynnikiem załamania n\ [Ponieważ n jest jedyną niepodstawową wielkością w równaniu (31.8).] Zajmiemy się więc obliczaniem pola Ea wytwarzanego przez ładunki w ośrodku. (Dla ułatwienia orientacji zebraliśmy w tab. 31.1 liczne używane dotąd oznaczenia, którymi będziemy się jeszcze posługiwać w pozostałej części naszego rachunku.) Tabela 31.1. Oznaczenia używane w rachunkach E, — pole źródła Ec — pole wytworzone przez ładunki w płytce Az — grubość płytki z — prostopadła odległość od płytki n — współczynnik załamania w — częstość (kątowa) promieniowania N — liczba ładunków na jednostkę objętości płytki r\ — liczba ładunków na jednostkę powierzchni płytki qe — ładunek jednego elektronu m — masa elektronu to0 — rezonansowa częstość elektronu związanego w atomie Jeżeli źródło S (z rys. 31.1) znajduje się daleko na lewo, to pole Es ma tę samą fazę wszędzie na płytce. Możemy więc napisać, że w sąsiedztwie płytki ą = £0ei<o"-z/c). (31.9) Dokładnie na płytce, tam gdzie z = 0, będziemy mieli Es = £0eia" (na płytce). (31.10) Każdy z elektronów w atomach płytki odczuje obecność tego pola elektrycznego. Będzie ono poruszało nimi w górę i w dół (zakładamy, że pole E0 ma kierunek pionowy) działając na nie elektryczną siłą qE. Dla znalezienia spodziewanego ruchu elektronów będziemy zakładali, że atomy są małymi oscylatorami. Znaczy to, że elektrony są przyczepione do atomów sprężyście, co z kolei oznacza, że wychylenie elektronu z położenia normalnego jest proporcjonalne do siły działającej na ten elektron. Ktoś, kto słyszał o elektronach kręcących się po orbitach, mógłby pomyśleć, że podajemy tu dość zabawny model atomu. A jednak właśnie obraz orbit jest uproszczony. Poprawny obraz atomu, podany przez teorię mechaniki falowej, mówi, że w zakresie zjawisk związanych ze światłem elektrony zachowują się tak, jak gdyby były utrzymywane na sprężynach. Będziemy więc zakładać, że na elektrony działa wprost proporcjonalna do wychylenia siła przywracająca, która wraz z ich masą m sprawia, że zachowują się one jak małe oscy-
3|-2. POLE POCHODZĄCE OD OŚRODKA MATERIALNEGO 83 latory o częstości rezonansowej a>0 .Oscylatory takie już badaliśmy i wiemy, że ich równanie ruchu zapisuje się wzorem: d2x ^2+o>Sx) = F. (31.11) gdzie F jest silą pobudzającą. W naszym zagadnieniu silą pobudzająca pochodzi od pola elektrycznego fali źródła, powinniśmy więc przyjąć F = qeEs = qeE0e"»', (31.12) gdzie qe jest elektrycznym ładunkiem jednego elektronu, Es zastępujemy zaś wyrażeniem Es = E0e'"" z wzoru (31.10). Naszym równaniem ruchu elektronu jest więc m(-^ + u>lx\ = ąeE0ck°'. (31.13) Równanie to rozwiązaliśmy już przedtem i wiemy, że jego rozwiązaniem jest x = x0e"°', (31.14) gdzie x0, po podstawieniu do równania (31.13), okazuje się równe qeE0 tak że *o: m m(u>l- 1eE0 (tol-to -»2) t/"' (31.15) (31.16) Mamy więc to, czego szukaliśmy — opis ruchu elektronów w płytce. Ruch ten jest taki sam dla każdego elektronu, z tym jednak że średnie położenie („punkt zerowy" ruchu) każdego elektronu jest oczywiście inne. Teraz jesteśmy przygotowani do znalezienia pola Ea wytwarzanego w punkcie P przez atomy, gdyż już przedtem (na końcu rozdz. 30) obliczyliśmy pole wytwarzane przez warstwę ładunków zgodnie się poruszających. Odwołując się do wzoru (30.19) stwierdzamy, że pole Ea w punkcie P jest po prostu równe pewnej ujemnej stałej pomnożonej przez prędkość ładunków opóźnioną w czasie o wielkość z/c. Zróżniczkowanie x w wyrażeniu (31.16) w celu otrzymania prędkości i wprowadzenie opóźnienia [albo po prostu wstawienie x0 z wzoru (31.15) do (30.18)] daje W, 2e qjL \ico q'E° e*»(.-x/c>] (3U7) 0c(_ m(o}0-(o ) J Wynik jest właśnie taki, jakiego się spodziewaliśmy. Wzbudzony ruch elektronów wytworzył dodatkową falę poruszającą się w prawo [to właśnie mówi czynnik e"°('_z/c)]. Amplituda tej fali jest proporcjonalna do liczby atomów na jednostkę powierzchni płytki (czynnik V) i do natężenia źródła (czynnik E0). Występują tu ponadto pewne czynniki, które zależą °d własności atomowych {qe, m i a>0), czego się również należało spodziewać.
84 31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA Najważniejsze jednak jest to, że wzór (31.17) dla E0 wygląda bardzo podobnie do wyrażenia na E0 uzyskanego we wzorze (31.8). Założyliśmy wtedy, że fala wyjściowa została opóźniona na skutek przejścia przez ośrodek o współczynniku załamania n. Oba te wyrażenia będą rzeczywiście identyczne, jeżeli ml (n-\)Az=- —2 T (31.18) 2e0m(eu0 —eu ) Zauważmy, że obie strony tego równania są proporcjonalne do Az, ponieważ n, liczba atomów na jednostkę powierzchni, jest równa A' Az, gdzie A' oznacza liczbę atomów na jednostkę objętości płytki. Podstawiając wyrażenie N Az zamiast n i skracając przez Az otrzymujemy nasz główny wynik — wzór na współczynnik załamania wyrażony przez własności atomów ośrodka — i przez częstość światła: Na2 n=l+ « (3U9) 2ł0 m (eu0 — a> ) Równanie to daje nam „wyjaśnienie" współczynnika załamania, co właśnie chcieliśmy uzyskać. 31-3. Dyspersja Zauważmy, że powyższe przekształcenia dały nam w wyniku coś bardzo ciekawego. Nie tylko bowiem mamy liczbową wartość współczynnika załamania, którą możemy obliczyć z podstawowych wielkości atomowych, ale widzimy także, jak współczynnik załamania powinien się zmieniać z częstością światła co. Nigdy do tego byśmy nie doszli opierając się tylko na stwierdzeniu, że „światło w przezroczystym ośrodku rozchodzi się wolniej". Pozostaje oczywiście nadal otwarta sprawa, ile atomów przypada na jednostkę objętości i jaka jest ich naturalna częstość co0. Sprawy tej nie możemy teraz rozstrzygnąć, ponieważ wielkości te są różne dla różnych substancji, a nie mamy na razie ogólnej teorii zjawiska. Sformułowanie ogólnej teorii własności różnych ośrodków materialnych - ich naturalnych częstości itd. — jest możliwe tylko przy pomocy kwantowej mechaniki atomowej. Poza tym różne ośrodki mają różne własności i różne współczynniki załamania, tak że nie ma co liczyć na uzyskanie ogólnego wzoru dla współczynnika załamania, który by można było stosować do wszystkich substancji. Otrzymany przez nas wzór przedyskutujemy jednak w rozmaitych możliwych warunkach. Przede wszystkim, dla większości zwykłych gazów (np. dla powietrza, większości gazów bezbarwnych, wodoru, helu i tak dalej) naturalne częstości oscylatorów elektronowych odpowiadają światłu nadfioletowemu. Częstości te są wyższe od częstości światła widzialnego, a zatem co0 jest znacznie większe od w dla światła widzialnego. W pierwszym przybliżeniu możemy więc opuścić co2 w porównaniu z w0, ponieważ współczynnik załamania jest prawie stały. A więc dla gazu współczynnik załamania powinien być prawie stały. Jest to słuszne także dla większości innych przezroczystych substancji, np. dla szkła. Jeśli jednak przyjrzymy się dokładniej naszemu wyrażeniu, zauważymy, że w miarę jak
31-3. DYSPERSJA 85 co rośnie, uszczuplając nieco mianownik, wzrasta także współczynnik załamania. A więc n powoli rośnie z częstością. Współczynnik załamania jest większy dla światła niebieskiego niż dla czerwonego. Dlatego właśnie pryzmat bardziej ugina światło w niebieskiej niż w czerwonej części widma. Zjawisko polegające na zależności współczynnika załamania od częstości nazywamy zjawiskiem dyspersji. Równanie dla współczynnika załamania jako funkcji częstości nazywamy równaniem dyspersyjnym. Tak więc otrzymaliśmy równanie dyspersyjne. (W ostatnich kilku latach „równania dyspersyjne" znalazły nowe zastosowanie w teorii cząstek elementarnych.) Nasze równanie dyspersyjne wskazuje na jeszcze inne ciekawe możliwości. Jeżeli naturalna częstość w0 leży w obszarze widzialnym albo jeżeli dla takiego ośrodka materialnego jak szkło mierzymy współczynnik załamania w nadfiolecie, gdzie a; jest bliskie to0, to widać, że przy częstościach bardzo bliskich częstości naturalnej współczynnik załamania może osiągnąć ogromną wartość, ponieważ mianownik wyrażenia wchodzącego do równania zbliża się do zera. Załóżmy dalej, że co>co0. Jest to możliwe np. wtedy, gdy szkło oświetlimy promieniowaniem rentgenowskim. Ponieważ zaś wiele ośrodków nieprzezroczystych dla widzialnego światła, np. grafit, wykazuje przezroczystość dla promieniowania Rónt- gena, możemy więc mówić także o współczynniku załamania węgla dla promieni rentgenowskich. Wszystkie naturalne częstości atomów węgla będą znacznie niższe od częstości promieniowania rentgenowskiego, ponieważ częstość tego promieniowania jest bardzo duża. Współczynnik załamania będzie dany przez nasze równanie dyspersyjne, jeżeli przyjmiemy w nim to0 równe zeru (pomijamy iol w porównaniu z to2). Podobna sytuacja może wyniknąć, jeżeli skierujemy fale radiowe (albo światło) na gaz swobodnych elektronów. Gaz taki występuje na przykład w górnej części atmosfery, gdyż nadfioletowe światło słońca uwalnia tam elektrony z atomów. Dla swobodnych elektronów wo = 0 (nie wykonują one więc ruchów drgających, gdyż odpowiedzialna za to siła sprężysta znika). Położenie co0 = 0 w naszym równaniu dyspersyjnym daje poprawny wzór na współczynnik załamania fal radiowych w stratosferze, przy czym N oznacza teraz gęstość (tzn. liczbę na jednostkę objętości) swobodnych elektronów w stratosferze. Ale spójrzmy znowu na równanie. Jeżeli skierujemy promienie Róntgena na materię albo fale radiowe (lub jakiekolwiek inne fale elektryczne) na swobodne elektrony, wyraz (w0—w2) stanie się ujemny, a tym samym n będzie mniejsze od jedności. Oznacza to, że efektywna prędkość fal w substancji będzie większa od r! Czy aby tu wszystko jest w porządku? Istotnie. Chociaż bowiem twierdzimy, że nie można przesyłać sygnałów szybciej niż z prędkością światła, to jednak współczynnik załamania różnych ośrodków przy określonej częstości może być albo większy, albo mniejszy od 1. Znaczy to akurat tyle, że przesunięcie fazowe spowodowane przez światło rozproszone może być albo dodatnie, albo ujemne. Można jednak pokazać, że szybkość, z jaką daje się przesłać sygnał, nie jest określona Przez współczynnik załamania przy jednej częstości, ale zależy od wartości współczynnika załamania przy wielu częstościach. Współczynnik załamania daje nam tylko szybkość Posuwania się węzłów (czyli grzbietów) fal, a węzeł fali sam przez się nie jest sygnałem. O fali doskonałej, która nie ma żadnej modulacji, to znaczy jest stałą oscylacją, nie można ^ ogóle powiedzieć gdzie się „zaczyna też" i dlatego nie można jej użyć do sygnału synchro-
86 31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA nizującego. Aby przesłać sygnał, musimy w jakiś sposób falę zmienić, zrobić w niej szczerbę, uczynić ją nieco grubszą lub cieńszą. Znaczy to, że fala musi mieć więcej niż jedną częstość i można pokazać, że prędkość, z jaką przenoszą się sygnały, zalety nie od samego współczynnika załamania, ale od tego, jak się on zmienia z częstością. Także i ten temat musimy na razie odłożyć (aż do rozdz. 48). Obliczymy sobie wtedy rzeczywistą prędkość sygnałów w kawałku szkła i przekonamy się, że nie jest ona większa od prędkości światła, mimo że węzły, które są punktami matematycznymi, poruszają się szybciej niż światło. Napomykając tylko o tym zjawisku zauważmy, że, cała trudność polega na tym, iż siła reakcji ładunków jest skierowana przeciwnie do wektora pola, to znaczy że znak uległ odwróceniu. Wobec tego w naszym wyrażeniu na x [równanie (31.16)] przesunięcie ładunku następuje w kierunku przeciwnym do pola wzbudzającego, ponieważ różnica coq —co2 jest ujemna dla małych co0. Wzór ten mówi, że pole ciągnie w jednym kierunku, ładunek porusza się w przeciwnym. Skąd się jednak bierze ten przeciwny kierunek ruchu ładunku? Z całą pewnością ładunek nie rusza w kierunku przeciwnym dokładnie w chwili włączenia pola po raz pierwszy. W chwili gdy rozpoczyna się ruch, powstaje stan nieustalony, który wkrótce się ustala i tylko wówczas drgania ładunku są przeciwne w fazie do wzbudzającego pola. Właśnie wtedy faza przekazywanego pola może wyprzedzać falę źródła. Właśnie to wyprzedzenie w fazie mamy na myśli, gdy mówimy, że „prędkość fazowa" albo prędkość węzłów jest większa od c. Na rysunku 31.4 podajemy schematycznie wygląd fal w wypadku, gdy fala zostaje nagle włączona (aby wytworzyć sygnał). Z wykresu widać, że sygnał (tzn. początek fali) wcale nie jest wcześniejszy dla fali kończącej się wyprzedzeniem w fazie. Wracamy teraz znowu do naszego równania dyspersyjnego. Trzeba zaznaczyć, że nasza analiza współczynnika załamania daje wynik nieco prostszy od rzeczywiście obserwowanego w przyrodzie. Dla zupełnej dokładności trzeba by uwzględnić w tym równaniu jeszcze kilka rzeczy. Powinniśmy się po pierwsze spodziewać, że nasz model atomowego oscyla- 31.4. „Sygnały" falowe początek Ó) w nieobecności ■ ■■ f \—/ \—/ \—/ \» ośrodka I ! V/ \T\Jt v fala u) przepuszczona, gdy n>1 fala Ćf przepuszczona, gdy n<i wyprzedzanie w fazie
31-3. DYSPERSJA 87 1.1 n! 1 0 IV \ Al III l\ / \\J 0)2 itd. ltd. *- U) 31.3. Współczynnik załamania jako funkcja częstości torą uwzględni istnienie siły tłumiącej (w przeciwnym wypadku oscylator raz poruszony drgałby wiecznie, a tego przecież nie oczekujemy). Ruch tłumionego oscylatora wyliczyliśmy już poprzednio [równanie (23.8), t.I, cz. 1] i otrzymaliśmy, że mianownik w równaniu (31.16), a zatem i w (31.19), zmienia się z (»J-w2) po prostu na {<u>l — co2 + iyco), gdzie y oznacza współczynnik tłumienia. Druga potrzebna tu modyfikacja powinna wziąć pod uwagę fakt, że dla danego rodzaju atomów istnieje szereg częstości rezonansowych. Łatwo to można uwzględnić w naszym równaniu dyspersyjnym zakładając, że istnieje wiele różnych rodzajów oscylatorów i każdy tak działa oddzielnie, że przyczynki od nich wszystkich po prostu się dodają. Przypuśćmy, że na jednostkę objętości przypada Nk elektronów, których naturalna częstość wynosi cok, a czynnikiem tłumiącym jest yk. Wtedy nasze równanie dyspersyjne przyjmie postać: n = \ + ć Nt 2e0m k (Dk—co +iykco (31.20) Mamy wreszcie pełne wyrażenie opisujące współczynnik załamania mierzony dla wielu ośrodków materialnych*'. Współczynnik załamania opisany tym wzorem zmienia się z częstością z grubsza tak, jak pokazuje rys. 31.5. Zauważmy, że jeżeli wartość częstości w nie zbliża się zbytnio do jednej z wartości częstości rezonansowych, nachylenie krzywej jest dodatnie. Takie dodatnie nachylenie zwane jest dyspersją „normalną" (ponieważ, oczywiście, zdarza się najczęściej). Bardzo blisko częstości rezonansowych mamy jednak mały obszar wartości co, dla których nachylenie jest ujemne. Takie ujemne nachylenie przeważnie bywa nazywane dyspersją „anomalną" (czyli nienormalną), ponieważ wydała się ona niezwykła ludziom, którzy ją po raz pierwszy zaobserwowali, o wiele wcześniej niż znane były takie obiekty jak elektrony. Z naszego punktu widzenia oba nachylenia są najzupełniej „normalne"! *' W mechanice kwantowej równanie (31.20) jest nadal ważne, chociaż jego interpretacja jest właściwie trochę inna. W mechanice kwantowej nawet atom z jednym elektronem, np. wodór, ma szereg częstości rezonansowych. Wobec tego AT* naprawdę nie oznacza liczby elektronów mających częstości oj», ale zostaje zastąpione przez Nfk, gdzie N jest liczbą atomów, przypadających na jednostkę objętości, a/» (zwane siłą oscylatora) jest czynnikiem mówiącym jak silnie atom przejawia każdą ze swoich rezonansowych częstości oj, .
88 31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA 31-4. Pochłanianie (absorpcja) Zwróćmy uwagę na pewien dość dziwny szczegół w ostatniej postaci naszego równania dyspersyjnego [równanie (31.20)]. Wyraz iy, który wstawiliśmy, aby uwzględnić tłumienie, powoduje, że współczynnik załamania stał się liczbą zespoloną*. Co to oznacza? Rozdzielając rzeczywistą i urojoną część n możemy napisać n = n'-in", (31.21) gdzie ri i n" są liczbami rzeczywistymi. (Piszemy znak minus przed in", ponieważ n" okazuje się wtedy liczbą dodatnią, co czytelnik sam może dowieść.) Dla przekonania się, co oznacza taki zespolony współczynnik załamania, wrócimy do równania (31.6). Jest to równanie fali, która przeszła przez płytkę ośrodka materialnego o pewnym współczynniku załamania n. Wstawiając nasze zespolone n do tego równania i dokonując przegrupowań, otrzymamy ..... F _ -wn"dz/c -M(B'-l)i!/cr i<u((-z/c) /ii -,-,-. ^za płytką-e c ^O* • l.-31-",) Czynniki oznaczone symbolem B w równaniu (31.22) mają dokładnie tę postać, którą znamy z poprzednich rachunków. Opisują one falę, której faza, przy przechodzeniu przez materię, została opóźniona o kąt co(ri — l) Az/c. Pierwszy wyraz (A) jest nowy, stanowi pewien czynnik wykładniczy z wykładnikiem rzeczywistym, który powstał w wyniku mnożenia dwóch wyrazów czysto urojonych. Wykładnik jest poza tym ujemny, a więc cały czynnik jest liczbą rzeczywistą mniejszą od jedności. Tak, jak się spodziewamy, opisuje ona spadek wielkości pola o wartość, która jest tym większa, im większe jest Az. W miarę przechodzenia przez materię fala ulega osłabieniu. Materia „pochłania część fali". Fala wychodzi z drugiej strony płytki z mniejszą energią. Nie ma się czemu dziwić, ponieważ tłumienie, które uwzględniliśmy w oscylatorach, jest rzeczywiście siłą tarcia i trzeba było się spodziewać, że spowoduje stratę energii. Widać więc, że urojona część n" zespolonego współczynnika załamania opisuje pewne pochłanianie (albo „uszczuplenie") fali. Istotnie, n" bywa niekiedy nazywane „współczynnikiem pochłaniania". Należy zwrócić uwagę także i na to, że urojonej części współczynnika załamania n odpowiada na rys. 31.3 odchylenie strzałki wektora Ea w stronę początku układu. Oczywiste jest, dlaczego przepuszczane pole zostaje wówczas zmniejszone. Normalnie, np. w szkle, pochłanianie światła jest bardzo małe. Spodziewamy się tego na podstawie naszego równania (31.20), ponieważ urojona część mianownika, iykio, jest znacznie mniejsza od wyrazu (cok —co2). Jeśli jednak częstość światła co jest bardzo bliska cok, rezonansowy wyraz (a>k —oj2) może być mały w porównaniu z wyrazem iykta i współczynnik stanie się prawie całkowicie urojony. Pochłanianie światła jest wtedy zjawiskiem dominującym. Właśnie to zjawisko stanowi przyczynę powstawania ciemnych linii — linii absorpcyjnych — w widmie światła, które otrzymujemy ze Słońca. Światło z powierzchni słonecznej przeszło poprzez atmosferę Słońca (tak jak i Ziemi) i zostało silnie pochłonięte przy rezonansowych częstościach atomów atmosfery słonecznej. Obserwacja takich linii widmowych w świetle słonecznym pozwala nam znaleźć częstości
31-4. POCHŁANIANIE 89 rezonansowe atomów, a stąd skład chemiczny atmosfery Słońca. Obserwacje tego rodzaju mówią nam też o materii w gwiazdach. Dowiadujemy się z nich, że pierwiastki chemiczne w Słońcu i gwiazdach są takie same, jak znajdowane na Ziemi. 31-5. Energia niesiona przez falę elektryczną Przekonaliśmy się, że urojona część współczynnika załamania oznacza pochłanianie. Korzystając z tego znajdziemy teraz ilość energii niesioną przez falę świetlną. Argumentowaliśmy poprzednio, że energia niesiona przez światło jest proporcjonalna do E2, średniej czasowej kwadratu elektrycznego pola fali. Spadek wartości E na skutek absorpcji musi oznaczać stratę energii. Przejdzie ona w tarcie elektronów i jak się domyślamy, odnajdzie się jako ciepło w ośrodku materialnym. Rozważając światło padające na powierzchnię jednostkową, np. na 1 cm2 naszej płytki z rys. 31.1, możemy napisać następujące równanie energii (jeśli, energia jest zachowana, co w istocie zakladamyl): energia wchodząca na sekundę = = energia wychodząca na sekundę 4- praca wykonana na sekundę. (31.23) Zamiast pierwszego wyrazu możemy napisać a£s2, gdzie a jest nieznaną dotąd stałą proporcjonalności, która wiąże średnią wartość E2 z niesioną energią. Do drugiego wyrazu musimy włączyć udział promieniujących atomów substancji, tak że trzeba wziąć a(Es + Ea)2 albo (obliczając kwadrat) (E?+2EsEa + E2). Wszystkie nasze rachunki zostały przeprowadzone dla cienkiej warstwy substancji, której współczynnik załamania niezbyt się różni od 1, tak że wartość Ea będzie zawsze znacznie mniejsza od Es (po prostu dla ułatwienia rachunków). Trzymając się naszego przybliżenia możemy więc odrzucić wyraz E2, ponieważ jest on dużo mniejszy od wyrazu E*Ea. Można by powiedzieć, że wobec tego trzeba odrzucić także wyraz EsEa, ponieważ jest on znacznie mniejszy od wyrazu E2. Rzeczywiście, wyraz EsEa jest o wiele mniejszy od wyrazu £s2, ale EsEa musimy zachować, bo inaczej nasze przybliżenie polegałoby na całkowitym pominięciu obecności ośrodka! Jednym ze sposobów sprawdzenia wewnętrznej zgodności naszych rachunków jest stwierdzenie, że zawsze zachowujemy wyrazy proporcjonalne do -N Az, do gęstości atomów ośrodka, opuszczamy zaś wyrazy proporcjonalne do (N Az)2 albo do jakiejkolwiek wyższej potęgi N Az. Przybliżenie nasze powinno nazywać. S'C „przybliżeniem niskiej gęstości". Rozumując dalej w ten sposób, zauważmy, że w naszym równaniu energii pominęło S'C energię fali odbitej. Jest to uzasadnione, ponieważ także i ten wyraz jest proporcjonalny do (N Az)2, bo amplituda fali odbitej jest proporcjonalna do N Az. Przechodząc do ostatniego wyrazu w równaniu (31.23), chcemy obliczyć szybkość, z jaką wchodząca fala wykonuje pracę na elektronach. Wiemy, że praca - to siła razy odległość, zatem szybkość wykonywania pracy (zwana także mocą) — to siła razy prędkość. Ściśle mówiąc wynosi ona Fv, ale nie musimy się przejmować iloczynem skalarnym, gdy
90 31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA tak jak tutaj, prędkość i siła mają ten sam kierunek (z wyjątkiem być może znaku minus). Przyjmujemy więc dla każdego atomu qeEsv jako średnią szybkość wykonywania pracy. Ponieważ na jednostkowej powierzchni znajduje się N Az atomów, więc ostatni wyraz w równaniu (31.23) powinien być równy N AzqeEsv. Nasze równanie energii wygląda zatem następująco: a.E25=a.E2s+2a. EsEa + N Azq^v. (31.24) Wyrazy E? znoszą się i mamy 2EJEa = NAzqe~E^. " (31.25) Wracamy znowu do równania (30.19), które mówi nam, że dla dużych z NAzqe Ea = v (opóźnione o zjc) (31.26) 2e0c (pamiętamy, że rj = N Az). Wstawiając wyrażenie (31.26) do lewej strony równania (31.25) otrzymujemy NAzqe 2<x £ (opóźnione o z) • v (opóźnione o z/ć). 2e0c Ale pole E, (w punkcie z) jest równe polu Es (w atomach) opóźnionemu o z/c. Ponieważ zaś wartość średnia jest niezależna od czasu, więc jest ona taka sama, czy to wzięta teraz, czy to opóźniona o z/c, czyli wynosi Es (w atomach)-vs, co daje tę samą średnią, która pojawia się po prawej stronie równania (31.25). Obie strony są więc sobie równe, jeżeli — = 1 czyli a=£0c. (31.27) t0c Okazało się, że jeżeli energia ma być zachowana, energia niesiona w fali elektrycznej przypadająca na jednostkę powierzchni i czas jednostkowy (czyli to, co nazwaliśmy natężeniem) musi być dana przez e0c£2. Jeśli natężenie oznaczymy S, to mamy natężenie czyli energia / powierzchnia / czas £0cE2, (31.28) gdzie kreska oznacza średnie czasowe. Mamy więc w nagrodę jeszcze i ten wniosek z naszej teorii współczynnika załamania. 31-6. Ugięcie światła na ekranie Zajmiemy się teraz nieco innym zagadnieniem, korzystając z tego, że też możemy je ująć przy pomocy formalizmu tego rozdziału. W ostatnim rozdziale mówiliśmy o tym, że nieprzezroczysty ekran, zaopatrzony w otwory, przez które może przechodzić światło,
31-6. UGIĘCIE ŚWIATŁA NA EKRANIE 91 daje dokładnie taki rozkład dyfrakcyjny, jaki można otrzymać wyobrażając sobie, że otwory -S E=0 P zostały zastąpione przez źródła (oscylatory) " 5 vekran ..... . \ nieprzezroczysty jednostajnie rozłożone w całym otworze. a) Innymi słowy, fala ugięta jest taka, jak gdyby otwór stanowił nowe źródło. Fakt ten wyma- i ga wyjaśnienia, ponieważ otwór oczywiście do- 5 £=£$ *■ E=ES+Eprzest kładnie znajduje się tam, gdzie nie ma źródeł, * 1^ . gdzie więc nie ma przyspieszanych ładun- jj\ |—przesłona ków. Zadajmy sobie przede wszystkim pytanie: I „ . , 0., -, ... i Kzatyczka P „Cotojestnieprzezroczysty ekran? Załóżmy I • dalej, że całkowicie nieprzezroczysty ekran £=£s %£=£s+£pries<.+Eiatyczka=0 znajduje się między źródłem S, a obserwa- c) |— przesłona torem w punkcie P, tak jak na rys. 31.6a. Jeśli ekran jest „nieprzezroczysty", to w punkcie P 31.6. Ugięcie światła na ekranie pola nie ma. Zastanówmy się, dlaczego. Przecież według podstawowych zasad powinniśmy otrzymać pole w punkcie Pjako opóźnione pole E, od źródła plus od wszystkich innych ładunków dookoła. Ale z naszych poprzednich rozważań wynika, że ładunki ekranu będą wprawiane w ruch przez pole E„ ruchy te tworzą zaś nowe pole, które - jeżeli ekran jest nieprzezroczysty — musi dokładnie znosić pole Es po odwrotnej stronie ekranu. Czyżby to był cud, że pole znosi się dokładniel A niechby tak znoszenie się nie zachodziło ściśle? Gdyby pola nie znosiły się dokładnie, wówczas pole w pobliżu tylnej ściany ekranu nie byłoby dokładnie równe zeru (pamiętajmy, że ten nieprzezroczysty ekran ma pewną grubość). Gdyby nie było równe zeru, wprawiłoby w ruch inne ładunki w materiale ekranu i w ten sposób wytworzyłoby dodatkowe pola, dążąc do pełnego zrównoważenia. Jeśli więc ekran uczynimy dostatecznie grubym, pola szczątkowego nie będzie, ponieważ jest wtedy dość sposobów na to, aby całe pole ostatecznie doprowadzić do zerowania się. W języku naszych poprzednich wzorów powiemy, że ekran ma duży i urojony współczynnik załamania, tak że przechodzące przezeń fale zostają pochłonięte w stosunku wykładniczym. Wiadomo przecież, że dostatecznie cienka warstwa najbardziej nieprzezroczystego materiału, nawet złota, jest jednak przezroczysta. Zobaczmy teraz, co się dzieje z nieprzezroczystym ekranem mającym otwory jak na rys. 31.6b. Jakiego pola oczekujemy w punkcie PI Pole w punkcie P może być przedstawione jako suma dwu pól: pola pochodzącego od źródła S i pola pochodzącego od ściany, to znaczy pochodzącego z ruchu ładunków w ścianach. Spodziewamy się, że ruchy ładunków w ścianach będą skomplikowane, ale pole przez nie wytwarzane daje się znaleźć dość prosto. Weźmy pod uwagę taki sam ekran, ale z zatkanymi otworami jak pokazuje część c) rysunku. Wyobraźmy sobie, że zatyczki i ściana są zrobione z dokładnie takiego samego materiału. Pamiętamy dalej, że zatyczki wchodzą dokładnie tam, gdzie w przypadku b) znajdowały się otwory. Obliczmy teraz pole w punkcie P. W przypadku c) pole w punkcie P Jest dokładnie równe zeru, ale jest także równe polu pochodzącemu od źródła plus pole
92 31. SKĄD SIĘ BIERZE WSPÓŁCZYNNIK ZAŁAMANIA pochodzące od wszystkich atomów w ścianach i zatyczkach. Możemy napisać następujące równania: przypadek b) EwP = Es + £ściana, przypadek c) Kp = 0=E:i+E^+E'^^ , gdzie znaki prim odnoszą się do przypadku, gdy zatyczki są na swoim miejscu, Es zaś w obu przypadkach jest oczywiście takie samo. Odejmując teraz od siebie oba równania otrzymujemy: Ł*P V'-'ściana -^ściana^ -^zatyczka" Jeśli tylko otwory nie będą zbyt małe (niech mają szerokość wielu długości fali), nie spodziewamy się, aby obecność zatyczek zmieniła pole przychodzące do ścian, co najwyżej zmieni je trochę wokół krawędzi otworów. Pomijając ten mały efekt, możemy przyjąć Ąciana = Ąciana ' Otrzymać, Że Ew p = — Patyczka • Wynika stąd, że gdy w ekranie są otwory (przypadek b) pole w punkcie P jest (z dokładnością do znaku) takie samo jak pole wytworzone przez tę część całkowicie nieprzezroczystej ściany, która jest umieszczona na miejscu otworowi (Znak nie jest bardzo istotny, ponieważ zwykle obchodzi nas tylko natężenie proporcjonalne do kwadratu pola.) Wygląda to na zabawne dowodzenie na opak, a przecież jest nie tylko prawdziwe (w przybliżeniu dla niezbyt małych otworów), ale i użyteczne; stanowi uzasadnienie podawanej zwykle teorii dyfrakcji. W każdym szczególnym przypadku możemy obliczyć pole E^lyczka pamiętając, że ruch ładunków wszędzie w ekranie znosi dokładnie pole Es za ekranem. Znając te ruchy dodajemy w punkcie P pola promieniowania pochodzące dokładnie od ładunków w zatyczkach. Przypomnijmy znowu, że taka teoria ugięcia jest tylko przybliżona. Jest ona dobra tylko wtedy, gdy otwory nie są zbyt małe. W wypadku za małych otworów wyraz £2'atycIka będzie mały i wówczas różnica między J?4iana i 4iu« (którą to różnicę przyjęliśmy równą zeru) może być albo porównywalna z małym wyrazem 'Ezatyczka> ^^bo nawet od niego większa i nasze przybliżenie nie będzie już wtedy ważne.
32 tłumienie promieniowania • rozpraszanie światła 32-1. Opór promieniowania Dowiedzieliśmy się z ostatniego rozdziału, że drganiom dowolnego układu towarzyszy wypływanie z niego energii, i wyprowadziliśmy wzór na energię wypromieniowaną przez taki układ drgający. Mając dane pole elektryczne, wiemy, że średnia jego kwadratu pomnożona przez c0c jest równa ilości energii przechodzącej w ciągu sekundy przez metr kwadratowy powierzchni prostopadłej do kierunku rozchodzenia się promieniowania: P = e0c(E2). (32.1) Energię promieniuje dowolny drgający ładunek, np. pobudzona antena. Skoro układ promieniuje energię, musimy uznać, że dla jej zachowania po drutach prowadzących do anteny płynie pewna moc. Znaczy to, że w obwodzie wzbudzającym antena zachowuje się jak opór, czyli jak miejsce, w którym „traci się" energię (w rzeczywistości energii sienie traci, zostaje ona wypromieniowaną, ale jeśli ograniczymy się do rozpatrywania samego obwodu, energia jest tracona). W zwykłym oporze „stracona" energia przechodzi w ciepło, a w tym wypadku uchodzi w przestrzeń. Jednakże z punktu widzenia teorii obwodów, która nie wnika w sprawę dokąd uchodzi energia, ostateczny „efekt" jest zawsze taki sam ~ obwód taki „traci" energię. Wobec tego generatorowi wydaje się, że antena wykazuje °pór, nawet jeżeli jest zrobiona z doskonałej miedzi. 1 rzeczywiście, jeżeli antena jest dobrze zbudowana, to będzie się zachowywać prawie jak czysty opór o bardzo małej indukcyjności 1 Pojemności, ponieważ chcemy, aby wypromieniowywała jak najwięcej energii. Opór, Wykazywany przez antenę nazywamy oporem promieniowania. Jeśli do anteny dopływa prąd o natężeniu /, to średnia szybkość, z jaką dostarczana Jest do niej moc, równa się średniej kwadratu natężenia prądu pomnożonej przez opór.
94 32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA Szybkość,z jtką moc zostaje wypromieniowana przez antenę, jest oczywiście proporcjonalna do kwadrati natężenia prądu w antenie, ponieważ pola są zawsze proporcjonalne do prądów, awjizielona energia jest proporcjonalna do kwadratu pola. Współczynnik proporcjonalności między wypromieniowana mocą a </2> jest właśnie oporem promieniowania. Ciekawy jest problem: skąd w ogóle pochodzi opór promieniowania? Weźmy prosty przykład: załóżmy, że prądy w antenie są pobudzane do płynięcia tam i z powrotem. Okazuje się,że na to, aby antena promieniowała energię, musimy włożyć w nią pracę. Weźmy naładowane ciało i przyspieszajmy je tam i z powrotem: promieniuje ono energię. Gdyby zaśnie było naładowane, energii by nie promieniowało. Inną sprawą jest obliczenie z zasady zachowania energii, jaka energia została stracona, a inną jest odpowiedź na pytanie: przeciwko jakiej sile wykonujemy pracę? Pytanie to jest ciekawe i bardzo trudno na nie odpowiedzieć. Nie potrafimy dotąd dać na nie wyczerpującej i zadowalającej odpowiedzi, jeżeli rozważamy elektrony, chociaż znamy odpowiedź w przypadku anten. Sprawa przedstawia się następująco: pola wytworzone w antenie przez ładunki poruszające się w jednej jej części oddziałują na ruch ładunków w drugiej części. Siły te możemy obliczyć i znaleźć, jatą wykonują pracę. Znajdziemy w ten sposób odpowiedni wzór na opór promieniowania Ściśle mówiąc, nie mamy jednak prawa powiedzieć: „Możemy obliczyć". My sami me możemy, ponieważ jeszcze nie badaliśmy praw elektryczności na małych odległościach; pole elektryczne znamy tylko dla odległości dużych. Oglądaliśmy wprawdzie wzór (28.3),ale jest on dla nas obecnie zbyt skomplikowany na to, aby móc obliczyć pola wewnątrz strefy falowej. Ponieważ, oczywiście, obowiązuje zasada zachowania energii, możemy jednak znaleźć poprawny wynik nie znając pól na małych odległościach. (Istotnie, jeśli posłużymy się tym argumentem w drugą stronę, okaże się, że korzystając tylko z praw zachowania energii można znaleźć wzór dla siły na małych odległościach, znająt pole tylko bardzo daleko. Nie będziemy się jednak w to teraz zagłębiać.) Dla pojedynczego elektronu zagadnienie przedstawia się następująco: jeśli istnieje tylko jeden ładunek, to jaka siła będzie w ogóle na niego działać? Stara klasyczna teoria proponowała, żeby ładunek uważać za małą piłkę, której jedna część działa na drugą. Na skutek opóźnienia w oddziaływaniu poprzez malutki elektron siła i ruch nie są dokładnie zgodne w fazie. Jeśli elektron spoczywa, to jak wiemy, „akcja równoważy reakcję", co oznacza, że rozmaite wewnętrzne siły są sobie równe i nie powstaje żadna siła wypadkowa. Gdy jednak elektron zostaje przyspieszony, wówczas siła, która działa od tylu do przodu, nie jest taka sama, jak siła działająca od przodu do tyłu, a jest to spowodowane opóźnieniem przy przechodzeniu przez elektron. To przesunięcie w przebiegu czasowym jtst przyczyną braku równowagi i w ostatecznym wyniku elektron jakby sam się „ciągnąłza włosy"! Powyższe wyjaśnienie pochodzenia oporu ujawniającego się przy przyspieszaniu, czyli oporu promieniowania poruszającego się ładunku, napotkało liczne trudności, ponieważ zgodnie z naszymi obecnymi poglądami elektron nie jest jednak „małą piłką". Zagadnienie to nie zostało jeszcze dotąd rozwiązane. Możemy jednak dokładnie obliczyć, jaka musi być wypadkowa siła oporu promieniowania, to znaczy, jakie muszą być straty podczas przyspieszania ładunku, mimo że nie znamy samego mechanizmy działania tej siły.
32-2. SZYBKOŚĆ WYPROM1ENIOWYWAN1A ENERGII 95 32-2. Szybkość wypromieniowywania energii Obliczmy teraz całkowitą energię wypromieniowywaną przez przyspieszany ładunek. Dla ogólności rozważań weźmy przypadek ładunku przyspieszanego w dowolny sposób, byle nierelatywistycznie. Wiemy, że w chwili gdy przyspieszenie jest na przykład pionowe, wytwarzane pole elektryczne jest proporcjonalne do ładunku- pomnożonego przez rzut opóźnionego przyspieszenia i podzielonego przez odległość. Stąd znamy pole elektryczne w każdym punkcie, a zatem i kwadrat pola elektrycznego i wreszcie energię e0cE2 wychodzącą w ciągu sekundy przez jednostkową powierzchnię. Wielkość e0c pojawia się dość często w wyrażeniach opisujących rozchodzenie się fal radiowych. Jej odwrotność nazywamy impedancją próżni; jest ona liczbą łatwą do zapamiętania: ma wartość l/e0c = 377 ft. Tak więc moc w watach na metr kwadratowy jest równa średniej kwadratu pola podzielonej przez 377. Korzystając z naszego wyrażenia (29.1) dla pola elektrycznego znajdujemy, że .2, S = q2a'2 sina0 16n2e, ,rV (32.2) jest mocą na metr kwadratowy, wypromieniowaną w kierunku kąta 9. Widzimy, że zachowuje się ona jak odwrotność kwadratu odległości, zgodnie z tym, co powiedzieliśmy poprzednio. Poszukajmy teraz całkowitej energii wypromieniowanej we wszystkich kierunkach: musimy zatem scałkować wyrażenie (32.2) po wszystkich kierunkach. Najpierw wykonujemy mnożenie przez pole powierzchni, aby znaleźć ilość energii, która przepływa przez mały kąt dO (rys. 32.1). Potrzebne nam jest do tego pole powierzchni wycinka kuli. Rozumujemy w taki sposób: jeżeli r jest promieniem kuli, szerokość wycinka pierścienia na niej wynosi r d9, a jego obwód 27trsin0, gdyż r sin 9 jest promieniem koła. A więc powierzchnia małego kawałka kuli wynosi 2nr sin 9 razy r d9: dA = 2nr2 sin 9 d9. Mnożąc strumień [wzór (32.2), moc przypadająca na metr kwadratowy] przez powierzchnię (w metrach kwadratowych) zawartą w małym kącie dO znajdujemy ilość energii wychodzącą w tym kierunku w przedziale między 9 a 9 + d9. Całkujemy następnie to wyrażenie po wszystkich kątach 9 od 0 do 180°: (32.3) 32.1. Powierzchnia wycinka kulistego wynosi 2nr sin 9r dd f 1 a f >= SdA = ~ , si sin3 9 d9. (32.4) Plsząc sin30 = (l-cos20)sin0 łatwo pokazać, że J sin30</0 = 5. Korzystając z tego faktu otrzymujemy w końcu P = bne0 c3 (32.5)
96 32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA Wyrażenie to zasługuje na chwilę uwagi. Przede wszystkim, ponieważ a' jest wektorem i ma pewien określony kierunek, a'2 we wzorze (32.5) ma znaczenie kwadratu wektora a' czyli a'-a', a wiec jest długością wektora w kwadracie. Po wtóre, strumień wyrażony wzorem (32.2) został obliczony za pomocą opóźnionego przyspieszenia, tzn. jest wartością przyspieszenia w chwili, gdy została wypromieniowana energia teraz właśnie przechodząca przez kulę. Skłonni jesteśmy sądzić, że energia ta została rzeczywiście wysłana w tej wcześniejszej chwili, ale nie jest to dokładne; jest to tylko pogląd przybliżony. Nie można ściśle określić chwili, w której energia została wysłana. Naprawdę dokładnie możemy obliczyć tylko to, co się dzieje podczas całego ruchu, np. w ciągu jednego drgania lub też innego ruchu, na którego końcu przyspieszenie znika. Obliczamy w ten sposób, że całkowity strumień energii w jednym okresie jest proporcjonalny do średniej kwadratu przyspieszenia w pełnym okresie i właśnie ta wielkość powinna pojawić się we wzorze (32.5). Jeśli zaś rozważamy ruch, w którym przyspieszenie znika na początku i na końcu, to całkowita energia, która wypłynęła, jest równa wyrażeniu (32.5) scałkowanemu względem czasu. Aby zilustrować konsekwencje wynikające z wzoru (32.5) w przypadku układu drgającego, zobaczymy, co się dzieje, jeżeli przesunięcie x ładunku zmienia się tak, że przyspieszenie a wynosi — co2x0e,a". Średnia kwadratu przyspieszenia w ciągu okresu (pamiętajmy, że musimy być bardzo ostrożni, gdy podnosimy do kwadratu wielkości zapisane w notacji zespolonej — naprawdę chodzi tu o cosinus, a średnia cos2 cot wynosi ł) jest zatem równa <a'2> = tco*x20. Wobec tego 2 4 2 ą co xa P=- %. . (32.6) I2ne0c Wzory, które teraz rozważamy, reprezentują stosunkowo zaawansowaną i dość nowoczesną teorię; datują się z początku XX w. Są to bardzo słynne wzory i właśnie ze względu na ich wartość historyczną musimy umieć je czytać tak, jak są podane w starych książkach. Prawdę mówiąc, w książkach tych posługiwano się jednostkami odmiennymi od naszego układu mks. Wszystkie jednak komplikacje można usunąć już w ostatecznych wzorach opisujących elektrony. Reguła jest następująca: wielkość q2/4ne0> gdzie ge oznacza ładunek elektronu (w kulombach), była tradycyjnie oznaczana e2. Bardzo łatwo obliczyć, że e w układzie mks jest liczbowo równe 1,5188-10-14, ponieważ wiemy, że liczbowo tfe= 1,60206-10~19 a l/4ne0 = 8,98748■ 109. Będziemy więc często używać wygodnego skrótu .2 4 .2 e2 = -^. (32.7) 47I£0 Jeśli w starszych wzorach będziemy używali podanej wartości liczbowej e i traktowali je tak, jak gdyby były zapisane w jednostkach mks, to otrzymane wyniki numeryczne będą poprawne. Tak na przykład starszą postacią wzoru (32.5) jest wzór P=$e2a2/c3- Podobnie energia potencjalna protonu i elektronu w odległości r wynosi q2!4ne0r albo e2lr, z wartością e= 1,5188-10~14 mks.
32-3. TŁUMIENIE PROMIENIOWANIA 97 32-3. Tłumienie promieniowania Z tego, że oscylator traci pewną energię, wnioskujemy, że ładunek zawieszony na )<ońcu sprężyny (albo elektron w atomie) wprawiony w drgania z naturalną częstością (X>0 nie będzie drgał wiecznie nawet wtedy, gdyby znajdował się w próżni w odległości wielu milionów kilometrów od innych przedmiotów. Nie ma tu smarów, ani żadnego oporu w zwykłym sensie — w sumie żadnej „lepkości". Mimo to układ taki, jak już powiedzieliśmy, nie będzie drgał „wiecznie", bo jako naładowany wypromieniowuje energię i dlatego jego drgania będą powoli zamierać. Jak wolno? Jaka jest wartość Q takiego oscylatora, spowodowana przez efekty elektromagnetyczne, czyli tzw. opór promieniowania albo tłumienie promieniowania takiego oscylatora? Dla dowolnego układu drgającego wartość Qjest równa całkowitej energii zawartej w każdej chwili w oscylatorze, podzieloną przez stratę energii na radian: W Q- dW\dę Mamy też (zapisując to samo w inny sposób), coW 1-IwTm- <32'8) ponieważ dWld(p = (dW/dt)/(d<p/dt) = (dW/dt)co. Jeżeli znamy Q, powyższy wzór nam mówi. jak spada energia drgań, bo dW/dt = —{(ojQ)W, co daje po rozwiązaniu W= = W0e~"il,Q, gdzie W0 oznacza energię początkową (dla r=0). Aby znaleźć Q dla układu promieniującego, wracamy do wzoru (32.8) i wstawiamy zależność (32.6) na miejsce dWfdt. Zastanówmy się teraz, czemu jest równa energia W oscylatora? Energia kinetyczna oscylatora jest równa \ mv2, a średnia energia kinetyczna wynosi mco2x0/4. Przypomnijmy sobie teraz, że średnio połowa całkowitej energii oscylatora jest energią kinetyczną, a druga połowa — energią potencjalną, tak że ostatnią liczbę musimy podwoić, aby otrzymać całkowitą energię oscylatora: W = \mco2x20. (32.9) Co podstawiamy za częstość w obu powyższych wzorach? Bierzemy naturalną częstość wo. ponieważ dla wszystkich celów praktycznych jest to częstość, z którą nasz atom promieniuje, a jako wartość m bierzemy masę elektronu me. Dokonujemy następnie koniecznych dzieleń i uproszczeń, w których wyniku wzór (32.8) przyjmuje postać ± = -l^-2. (32.10) (Dla lepszej orientacji przedstawiliśmy wzór ten w bardziej tradycyjnej postaci używając skrótu q2/4ne0 = e2, a opuszczony czynnik oi0jc zapisując jako 2n/A.) Ponieważ wielkość Q jest wielkością bezwymiarową, kombinacja e2/mec2 powinna być właściwością samego
98 32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA tylko ładunku i masy elektronu, wewnętrzną cechą elektronu, a do tego powinna mieć wymiar długości. Nazwano ją klasycznym promieniem elektronu, ponieważ wszystkie wczesne modele atomowe, które miały wyjaśnić opór promieniowania przy pomocy siły działającej między różnymi częściami elektronu a innymi, wymagały, aby jego rozmiary były właśnie wielkością tego rzędu. Obecnie wielkość ta nie ma już tak dużego znaczenia i nie musimy wierzyć, że promień elektronu jest naprawdę taki. Jego wartość wynosi r0 = 2 = 2,82- 10-15m. (32.11) <;>. mec Obliczmy wreszcie wartość Q dla jakiegoś atomu wysyłającego światło, np. dla atomu sodu. Długość fali wynosi wtedy około 6000 A; długość ta należy do żółtej części widma widzialnego i jej wartość jest bardzo typowa. Wobec tego 3A 2 = *5-107, (32.12) 47ir0 tak że Q atomu jest rzędu 108. Oznacza to, że oscylator atomowy będzie drgał przez 108 rd, czyli wykona I07 drgań, zanim jego energia spadnie o czynnik l/e. Częstość drgań światła o długości fali 6000 A, v = c/A, jest rzędu 10" Hz. Wobec tego czas życia, czas, w ciągu którego energia promieniującego atomu spada o czynnik l/e, jest rzędu 10~8 s. W normalnych warunkach swobodnie emitujący atom promieniuje zwykle przez taki właśnie okres czasu. Jest to możliwe tylko dla atomów znajdujących się w próżni, nie zakłócanych w żaden sposób. Gdy elektron znajduje się w ciele stałym i ulega zderzeniom z innymi atomami lub innymi elektronami, wówczas pojawiają się dodatkowe opory i inne tłumienia. Efektywny opór y występujący we wzorze na opór oscylatora można znaleźć ze związku \/Q = y/co0; pamiętajmy przy tym, że wielkość y określa szerokość krzywej rezonansu (rys. 23.2 z t. I, cz. I). W ten więc sposób obliczyliśmy szerokość linii widmowych dla swobodnie promieniujących atomów! Ponieważ X = 2ncjco, znajdujemy że /fA = 2ncz/a>/ca2 = 27icy/a>o = 2nc/ea>0 = A/g = 4nr0/3 = l,18-10-14m. (32.13) 32-4. Niezależne źródła Przygotowując się do naszego drugiego tematu, rozpraszania światła, musimy już teraz omówić pewną cechę zjawiska interferencji, którą pominęliśmy w poprzednich rozważaniach. Chodzi tu o odpowiedź na pytanie: kiedy interferencja nie zachodzi? Weźmy dwa źródła St i S2 o amplitudach Ax i A2 i obserwujmy je z kierunku, w którym mierzone fazy dwu sygnałów wynoszą ęx i ę2 (wynikają one z pewnej kombinacji właściwego czasu drgania i opóźnienia zależnego od miejsca, w którym dokonujemy obserwacji). Odbieraną przez nas energię można znaleźć składając dwa zespolone wektory Ax i A2
32-4. NIEZALEŻNE ŹRÓDŁA 99 ustawione odpowiednio pod kątem c?, i ę2 (tak jak robiliśmy w rozdz. 30). Wynika stąd, że wypadkowa energia jest proporcjonalna do A2R = A2i+A22 + 2AlA2cos((pi-ę2). (32.14) Gdyby nie występował tutaj wyraz mieszany 2A1A2cos(<p1—<p2), całkowita energia odbierana w danym kierunku byłaby po prostu sumą energii A2 + Al- wysyłanych przez każde źródło osobno. Otrzymalibyśmy więc to, czego zwykle oczekujemy, mianowicie, że wypadkowe natężenie światła padającego na jakiś przedmiot z dwóch źródeł stanowi sumę natężeń obu świateł. Jeśli jednak sprawę stawiamy poprawnie i zachowujemy wyraz mieszany, to nie otrzymujemy dokładnie sumy, ponieważ pojawia się także pewna interferencja. Gdy zdarzają się warunki, w których ten wyraz nie ma znaczenia, możemy powiedzieć, że interferencja pozornie się gubi. Oczywiście, występuje ona zawsze w przyrodzie, ale możemy nie być w stanie, aby ją wykryć. Rozważmy kilka przykładów. Załóżmy najpierw, że dwa źródła są odległe o 7 000 000 000 długości fali, co jest sytuacją zupełnie prawdopodobną. Mamy wówczas dla danego kierunku bardzo dobrze określoną wartość omawianej różnicy faz. Gdy zaś przesuniemy się w pewnym kierunku choćby o włos, o kilka długości fali, co można w ogóle pominąć (bo nasze własne oko ma tak duży otwór, że średniuje zjawiska w obszarze o wiele szerszym niż pojedyncza długość fali), wówczas zmieniamy jednak fazę względną, a wartość cosinusa zmienia się bardzo szybko. Jeśli bierzemy teraz średnią natężenia po małym obszarze, cosinus przybiera wartość na przemian plus, minus, plus, minus i przy obchodzeniu całego zakresu uśrednia się do zera. Jeśli więc bierzemy wartość średnią z obszarów, gdzie faza zmienia się bardzo szybko ze zmianą położenia, to interferencji nie uzyskujemy. Weźmy inny przykład. Załóżmy, że dwa źródła są dwoma niezależnymi oscylatorami radiowymi — chodzi tu nie o jeden oscylator zasilany przez dwa druty, co zapewnia, że fazy są utrzymywane razem, ale o dwa niezależne źródła. Załóżmy dalej, że nie są one nastrojone dokładnie na tę samą częstość (bardzo trudno ustawić je na tę samą częstość, jeżeli nie są naprawdę połączone razem). Mamy w tym przypadku układ zwany dwoma niezależnymi źródłami. Skoro ich częstości nie są dokładnie równe, to oczywiście nawet gdy oba źródła mają początkowo zgodne fazy, jedno z nich zaczyna po chwili wyprzedzać drugie i wkrótce ich fazy stają się niezgodne, po czym to samo źródło nadal wysuwa się naprzód i wkrótce fazy stają się znowu zgodne. W ten sposób różnica faz między obu źródłami zmienia się stopniowo w czasie. Jeśli teraz nasze obserwacje nie są wystarczające, aby odróżnić tak małe czasy, jeśli zatem dokonujemy uśredniania po czasie znacznie dłuższym, to narastanie i opadanie natężenia, podobne do tak zwanych >,dudnień" dźwięku, może być za szybkie na to, aby nasze urządzenie je wyśledziło, i wyraz interferencyjny zniesie się przy średniowaniu. Innymi słowy, we wszelkich warunkach, w których przesunięcie fazowe znika przy średniowaniu, nie otrzymujemy żadnej interferencji! Istnieje wiele książek, w których się podaje, że dwa odrębne źródła światła nigdy ze sobą nie interferują. Nie są to jednak wypowiedzi odnoszące się do fizyki, a tylko do stopnia czułości techniki eksperymentalnej w czasie, gdy książka była pisana. W samym
100 32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA źródle światła rzecz odbywa się tak, że najpierw promieniuje jeden atom, potem drugi itd., a ponieważ przed chwilą stwierdziliśmy, że atomy wypromieniowują ciąg fal tylko przez około 10~8 s, więc po tym czasie rolę przejmuje prawdopodobnie inny atom, potem jeszcze inny itd. Tak więc fazy mogą pozostawać naprawdę takie same tylko przez około 10 ~8 s. Przy uśrednianiu po czasie znacznie dłuższym niż 10"8 s nie zauważamy interferencji światła pochodzącego z dwu różnych źródeł, bo źródła te nie mogą utrzymać stałej różnicy swoich faz przez dłużej niż 10 ~8 s. Posługując się fotokomórkami, które umożliwiają bardzo szybką detekcję, można pokazać, że istnieje wtedy interferencja zmieniająca się w czasie tam i z powrotem w okresie około 10"8 s. Ponieważ większość urządzeń wykrywających oczywiście nie śledzi tak subtelnych odstępów czasowych, interferencji nie zauważamy. Z całą pewnością dla dwóch różnych źródeł zwykłego światła nie ma żadnych szans zauważenia interferencji za pomocą oka, dla którego czas uśredniania wynosi około ^ s. Ostatnio udało się zbudować źródła światła, w których powyższe zjawisko nie zachodzi, ponieważ emisja we wszystkich atomach następuje jednocześnie. Urządzenie, które tego dokonuje, jest bardzo skomplikowane, a jego działanie trzeba opisywać w sposób kwantowy. Nazywamy je laserem i można uczynić z niego źródło, w którym częstość interferencji, czas, w ciągu którego utrzymuje się stałość fazy, jest znacznie dłuższa od 10 ~8 s. Może ona być rzędu ~, -^ albo nawet 1 s i dzięki temu można za pomocą zwykłych fotokomórek uchwycić względną częstość dwu różnych laserów. Łatwo można wykryć pulsowanie dudnień ż dwu źródeł laserowych. Niewątpliwie wkrótce będzie można pokazywać ścianę oświetloną przez dwa źródła, których dudnienia będą na tyle powolne, że uda się zobaczyć rozjaśnianie i zaciemnianie ściany! Inny przypadek, w którym interferencja znosi się przy średniowaniu, zdarza się wtedy, gdy zamiast dwóch źródeł mamy ich wiele. W tym przypadku wyrażenie dla A\ będzie kwadratem sumy szeregu amplitud przedstawionych jako liczby zespolone. Jako wynik otrzymamy sumę kwadratów każdej amplitudy plus wyrazy mieszane dla każdej pary i gdy zdarzy się sytuacja, w której te ostatnie wyrazy wypadną przy średniowaniu, nie będzie wówczas zjawisk interferencji. Może się zdarzyć tak bezładne rozmieszczenie poszczególnych źródeł, że różnica faz między np. A2 i A3 będzie dobrze określona, ale zupełnie odmienna od różnicy faz między np. Ax i A2 itd. W rezultacie z całego mnóstwa cosinusów — wiele będzie z plusami, wiele z minusami — wszystkie zniosą się w średniowaniu. Dlatego właśnie w wielu sytuacjach nie obserwujemy wyników interferencji, a tylko całkowite, wspólne natężenie, równe sumie wszystkich pojedynczych natężeń. 32-5. Rozpraszanie światła Omówione wyżej sprawy doprowadzają nas do pewnego zjawiska zachodzącego w powietrzu, a wynikającego z nieregularnych położeń atomów. Przy omawianiu współczynnika załamania dowiedzieliśmy się, że wchodząca wiązka światła pobudza elektrony do ruchu tam i z powrotem i że elektrony te na skutek przyspieszania promieniują. To
32-5. ROZPRASZANIE ŚWIATŁA 101 wiązka padająca (niespolaryzowana) promieniowanie rozproszone 32.2. Wiązka promieniowania pada na atom i wprawia w ruch jego ładunki (elektrony). Poruszające się elektrony promieniują z kolei w rozmaitych kierunkach rozproszone promieniowanie tworzy wiązkę o takim samym kierunku jak wiązka wchodząca, ale o nieco innej fazie i stąd właśnie bierze się współczynnik załamania. Co jednak powiedzieć o ilości światła pochłoniętego i ponownie wypromieniowanego w jakimś innym kierunku? Jeżeli atomy, jak zazwyczaj, będą ładnie ustawione, tworząc piękną konstrukcję, to łatwo pokazać, że w innych kierunkach nie otrzymamy rozpraszania, ponieważ przy dodawaniu wielu wektorów o zmieniających się wciąż fazach wyjdzie wynik zerowy. Jeśli jednak atomy będą ustawione bezładnie, to całkowite natężenie w każdym kierunku będzie sumą natężeń światła rozproszonego przez każdy atom, tak właśnie jak mówiliśmy poprzednio. W gazie natomiast atomy są właściwie w ruchu, tak że chociaż w danej chwili względna faza dwu atomów może być dobrze określoną wielkością, to później stanie się zupełnie inna i w rezultacie każdy cosinus zniknie przy średniowaniu. Aby więc znaleźć ilość światła rozpraszaną przez gaz w danym kierunku, musimy po prostu zbadać działanie pojedynczego atomu, a następnie wypromieniowane natężenie pomnożyć przez liczbę atomów. Wspomnieliśmy poprzednio, że tego rodzaju zjawisko rozpraszania światła jest przyczyną tego, że niebo jest błękitne. Wiemy, że światło słoneczne przechodzi przez powietrze i wiemy, że patrząc w bok od słońca, np. prostopadle do wiązki, widzimy niebieskie światło. Teraz zaś mamy obliczyć, ile światła widzimy i dlaczego jest ono niebieskie. Jeśli pole elektryczne wiązki padającej jest równe E = E0e'°" w punkcie, w którym umieszczony jest atom, to elektron w takim atomie będzie — jak wiemy — pod wpływem tego pola E (rys. 32.2) drgał tam i z powrotem. Z równania (23.8), t. I, cz. 1, wynika, że amplituda jego drgania będzie równa x = VeE0 m(co0 — co +iyco) (32.15) Moglibyśmy uwzględnić tłumienie i możliwość, że atom działa jak szereg oscylatorów o różnych częstościach, a następnie wykonać względem nich sumowanie, ale dla uproszczenia weźmy pojedynczy oscylator i pomińmy jego tłumienie. Otrzymamy wówczas jako wynik działania zewnętrznego pola elektrycznego wielkość, z której już korzystaliśmy przy obliczaniu współczynnika załamania. Wynosi ona po prostu x = ?«E0 m(co0 — co ) (32.16) Korzystając ze wzoru (32.2) moglibyśmy teraz łatwo obliczyć natężenie światła wysyłanego w rozmaitych kierunkach i przyspieszenie odpowiadające powyższej amplitudzie x.
102 32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA Zamiast tego obliczmy jednak dla zaoszczędzenia czasu po prostu całkowitą ilość światła rozproszonego we wszystkich kierunkach. Całkowita energia świetlna na sekundę, rozpraszana we wszystkich kierunkach przez pojedynczy atom będzie oczywiście dana równaniem (32.6). Zbierając razem różne przyczynki i dokonując ich przegrupowania otrzymujemy więc P'l2KEoci m,W-^)2~ie° ° 3 V6K24mlcĄ (c2-^)1 = te0cE20^ 7-*-Trt (32'17) 3 (u) -<o0) dla całej rozproszonej mocy wypromieniowanej we wszystkich kierunkach. Wynik napisaliśmy w powyższej postaci, gdyż wtedy można go łatwiej zapamiętać. Przede wszystkim energia rozproszona jest proporcjonalna do kwadratu wzbudzającego pola. Cóż to znaczy? Kwadrat wzbudzającego pola jest oczywiście proporcjonalny do energii wchodzącej w ciągu sekundy. Mówiąc dokładnie, energia padająca na metr kwadratowy w ciągu sekundy wynosi c0c razy średnia <£2> kwadratu pola elektrycznego i jeżeli E0 jest maksymalną wartością E, <£2> = |£"o- Całkowita energia rozproszona jest, innymi słowy, proporcjonalna do wchodzącej energii na metr kwadratowy; im jaśniejsze jest światło słoneczne padające na niebo, tym niebo wygląda jaśniej. Zapytajmy z kolei, jaki ułamek wchodzącego światła zostaje rozproszony? Wyobraźmy sobie „tarczę" o pewnej powierzchni, powiedzmy a (nie prawdziwą, materialną tarczę, ponieważ taka rozpraszałaby światło ze wszystkimi tego konsekwencjami; mamy na myśli wyimagowaną powierzchnię wyodrębnioną w przestrzeni). Całkowita energia przechodząca przez powierzchnię a w danych warunkach będzie proporcjonalna zarówno do wchodzącego natężenia, jak i do er i wyniesie P = {{e0cEl)a. (32.18) Przyjmujemy teraz następujący punkt widzenia: zakładamy, że całkowite natężenie rozproszone przez atom jest równe natężeniu padającemu na pewną powierzchnię geometryczną. Odpowiedź na nasze pytanie będzie polegała na podaniu pola tej powierzchni. Jest ona zatem niezależna od padającego natężenia; podaje bowiem stosunek energii rozproszonej do energii padającej na metr kwadratowy. Innymi słowy, stosunek całkowita energia rozproszona na sekundę = pole pewnej powierzchni. energia padająca na metr kwadratowy na sekundę Pole tej powierzchni jest dlatego tak ważną wielkością, że padająca na tę powierzchnię snergia po całkowitym rozproszeniu we wszystkich kierunkach stanowiłaby dokładnie mergię rozproszoną przez atom. Pole tej powierzchni nazywamy przekrojem czynnym na rozpraszanie. Pojęcie przekroju :zynnego jest używane zawsze, ilekroć jakieś zjawisko zachodzi proporcjonalnie do natężenia wiązki. W takich wypadkach miarę wielkości zjawiska opisuje się zawsze przez Jodanie pola efektywnej powierzchni, która by zasłoniła dokładnie taką samą część wiązki. W żadnym razie nie oznacza to, że dany oscylator ma naprawdę taką powierzchnię. Gdy-
32-5. ROZPRASZANIE SWIATŁ-A 103 byśmy mieli w próżni tylko swobodny elektron drgający w górę i w dół, to nie istniałaby, fizycznie rzecz biorąc, żadna powierzchnia bezpośrednio z nim związana. Jest to tylko sposób podania odpowiedzi na pewnego rodzaju zagadnienie. Dowiadujemy się, na jak dużą powierzchnię powinna podać wiązka, aby wytłumaczyć daną ilość energii wychodzącej. Tak więc w naszym wypadku 8nr* w* 2 ,2\2 3 K-oS) (32.19) (wskaźnik r odróżnia przekrój czynny na rozpraszanie). Rozpatrzmy kilka przykładów. Weźmy najpierw bardzo niską naturalną częstość «0 albo zajmijmy się całkowicie nie związanymi elektronami, dla których co0 = 0. Czynnik w skraca się wówczas i przekrój czynny jest wielkością stałą. Taka granica dla niskich częstości, czyli przekrój czynny swobodnych elektronów, znana jest jako przekrój czynny rozpraszania Thomsona. Długość boku tej powierzchni wynosi około 10"~15 m, co daje 10~3om2, a więc dość mało! Weźmy z drugiej strony przypadek światła rozproszonego w powietrzu. Pamiętamy, że naturalne częstości oscylatorów powietrza są wyższe niż częstości rozważanego światła. Oznacza to, że w pierwszym przybliżeniu możemy pominąć a>2 w mianowniku i znaleźć, że rozpraszanie jest proporcjonalne do czwartej potęgi częstości. Wynika stąd, że światło o częstości, powiedzmy, dwukrotnie wyższej jest rozpraszane 16 razy bardziej intensywnie, a różnica taka jest dobrze uchwytna. Tak więc światło niebieskie, którego częstość jest mniej więcej dwa razy większa niż w czerwonym krańcu widma, jest rozpraszane w daleko większym stopniu niż światło czerwone. Stąd właśnie bierze się widziany przez nas wspaniały błękit nieba! Powyższe wyniki wymagają jeszcze kilku wyjaśnień. Ciekawy jest na przykład problem, dlaczego w ogóle widzimy chmury'] Skąd się biorą chmury? Każdy wie, że stanowią one skondensowaną parę wodną. Para wodna znajduje się oczywiście w atmosferze, zanim jeszcze ulegnie kondensacji, dlaczego więc nie widzimy jej przedtem? Gdy para już ulegnie kondensacji, sprawa staje się oczywista. Skondensowanej pary nie było w jakimś miejscu, a teraz tam jest. więc ją widać. A więc zagadka, skąd się biorą chmury, nie jest wcale dziecinną zagadką w rodzaju: „Skąd się bierze woda, Tato?", ale wymaga wyjaśnienia. Wyjaśniliśmy sobie przed chwila, że każdy atom rozprasza światło i oczywiście para wodna też będzie je rozpraszać. Cała tajemnica leży w tym, dlaczego woda skondensowana w chmury rozprasza tak bardzo zwiększoną ilość światła? Rozważmy, co by się działo, gdybyśmy zamiast pojedynczego atomu mieli na przykład zlepek dwu atomów, położonych bardzo blisko siebie w porównaniu z długością fali światła. Pamiętajmy, że średnica atomu wynosi około 1 A, podczas gdy długość fali wynosi około 5000 A, tak że kilka atomów tworzących grupkę może rzeczywiście leżeć bardzo blisko siebie w porównaniu z długością fali światła. Pod wpływem pola elektrycznego oba atomy będą się poruszały razem. Rozproszone pole elektryczne będzie więc sumą dwu pól o zgodnej fazie, co znaczy, że amplitudę rozpraszania na pojedynczym atomie należy podwoić, a rozproszoną energię już nie podwoić, ale powiększyć czterokrotnie w stosunku do pojedynczego atomu! Tak więc grupki atomów promieniują lub rozpra-
104 32. TŁUMIENIE PROMIENIOWANIA. ROZPRASZANIE ŚWIATŁA szają znacznie więcej energii niż atomy działające pojedynczo. Nasz dawny argument o niezależności faz oparty był na założeniu, że istnieje rzeczywista i duża różnica w fazie między dowolną parą atomów, co jest prawdą tylko wtedy, gdy są one oddalone od siebie o wiele długości fali i bezładnie rozmieszczone lub poruszające się. Jeśli natomiast znajdują się one tuż obok siebie, muszą rozpraszać zgodnie w fazie i dają spójną interferencję, która powoduje wzrost rozpraszania. Jeśli mamy grupę N atomów, a więc malutką kropelkę wody, każdy atom będzie pobudzany przez pole elektryczne w przybliżeniu jakby był swobodny (oddziaływanie jednego atomu na drugi nie jest ważne; chodzi po prostu o uchwycenie głównej myśli), ponieważ zaś amplitudy rozpraszania na każdym z nich będą jednakowe, całkowite pole rozpraszania będzie N razy większe. Natężenie światła rozproszonego wzrośnie więc jak kwadrat, /V2-krotnie. Gdyby atomy były bezładnie rozrzucone w przestrzeni, spodziewalibyśmy się tylko N-krotnego wzrostu natężenia, a w tym przypadku uzyskujemy N2 razy więcej! Tak więc rozpraszanie na kropelkach wody w grupkach złożonych z N cząsteczek jest N razy bardziej intensywne niż rozpraszanie na pojedynczych cząsteczkach. Tak więc rozpraszanie wzrasta, gdy woda ulega skupieniu. Czy jednak wzrasta ono ad infinitum} Wcale nie! Kiedy więc analiza ta zaczyna się załamywać? He atomów możemy zebrać razem, aby rozumowanie takie było jeszcze poprawne? Odpowiedź: Gdy krople wody stają się tak duże, że ich średnica osiąga mniej więcej długość fali, wówczas poszczególne atomy przestają rozpraszać w fazie, ponieważ są od siebie zbyt odległe. W miarę więc powiększania się rozmiarów kropelek rozpraszanie wzrasta tylko do chwili, w której rozmiary kropli wynoszą około jednej długości fali. Odtąd rozpraszanie nie wzrasta już tak szybko, jak powiększa się kropla. Co więcej — błękit znika, ponieważ graniczna średnica kropli dla dużych długości fali jest większa niż dla małych. Pojedyncze atomy silniej rozpraszają krótkie fale niż długie, ale gdy wszystkie krople są większe od pojedynczej długości fali, efekt bardziej się potęguje dla czerwonego krańca widma niż dla niebieskiego i w rezultacie zabarwienie przesuwa się od błękitu w stronę czerwieni. Zróbmy teraz doświadczenie, które bę- 32.3. Ilustracja pochodzenia polaryzacji promieniowania rozproszonego pod kątem do padającej wiązki elektron porusza się w płaszczyźnie JL k wiązka padająca (niespolaryzowana) atom promieniowanie rozproszone 1 k jest spolaryzowane liniowo dzie pokazywać to wszystko. Możemy utworzyć cząstki, które najpierw będą bardzo małe, a następnie stopniowo będą swoje rozmiary powiększać. Posłużymy się w tym celu roztworem tiosiarczanu sodu (tzw. hypo) w kwasie siarkowym, z którego wytrącają się bardzo drobne ziarna siarki. Ziarna te początkowo są bardzo małe i rozpraszanie jest trochę błękitnawe. Przy dalszym wytrącaniu się zabarwienie staje się coraz bardziej intensywne i w miarę wzrostu cząstek jest coraz bielsze. Zauważamy poza tym, że światło przechodzące na wprost jest pozbawione błękitu. Dlatego właśnie zachód słońca jest czer-
32-5 ROZPRASZANIE SW1ATŁ.A 105 wony, albowiem w świetle przechodzącym do oka przez grubą warstwę powietrza ulega rozproszeniu tyle błękitu, że uzyskuje ono barwę żółtoczerwoną. Omówmy na koniec jeszcze jedną ważną sprawę, która wprawdzie należy już do tematu następnego rozdziału (do polaryzacji), ale jest tak ciekawa, że warto na nią już teraz zwrócić uwagę. Chodzi o to, że pole elektryczne światła rozproszonego stara się wykonywać drgania w pewnym określonym kierunku. Pobudzony oscylator wykonuje drgania w tym samym kierunku co pole elektryczne światła padającego i jeżeli ustawimy się w przybliżeniu prostopadle do wiązki, to zobaczymy światło spolaryzowane, tzn. światło, w którym pole elektryczne drga tylko w jednym kierunku. Na ogół atomy wykonują drgania w dowolnym kierunku prostopadłym do wiązki, ale gdy zostają pobudzone do drgań wprost na nas lub od nas, wówczas ich nie widzimy. Gdy zatem pole elektryczne wchodzącego światła zmienia się i drga w różnych kierunkach, co określamy jako światło niespolaryzowane, wówczas światło wychodzące pod kątem 90° do wiązki wykonuje drgania tylko w jednym kierunku (patrz rys. 32.3)! Istnieje substancja zwana polaroidem, która ma tę własność, że z przechodzącego przez nią światła wybiera tylko tę część pola elektrycznego, która jest ustawiona wzdłuż pewnej określonej osi. Możemy jej użyć jako testu polaryzacji i stwierdzić, że światło rozproszone przez roztwór hypo jest rzeczywiście silnie spolaryzowane.
33 polaryzacja 33-1. Elektryczny wektor światła W rozdziale tym będziemy rozważać zjawiska wynikające z faktu, że pole elektryczne opisujące zjawisko światła jest polem wektorowym. W poprzednich rozdziałach nie zajmowaliśmy się kierunkiem drgań pola elektrycznego. Zauważyliśmy tylko, że wektor elektryczny leży w płaszczyźnie prostopadłej do kierunku rozchodzenia się światła, a nie interesował nas określony kierunek w tej płaszczyźnie. Teraz będziemy rozważali zjawiska, których główną cechą jest właśnie określony kierunek drgań pola elektrycznego. W doskonale monochromatycznym świetle pole elektryczne musi drgać z dobrze określoną częstością. Ponieważ zaś składowe w kierunku osi x i y mogą drgać z tą częstością niezależnie od siebie, musimy najpierw rozważyć wypadkowy efekt nakładania się dwu niezależnych, wzajemnie prostopadłych drgań. Jakiego rodzaju pole elektryczne tworzy się ze składowych x i y drgających z tą samą częstością? Jeżeli do drgań x dodać pewne drgania y o tej samej fazie, wynik będzie drganiem w nowym kierunku w płaszczyźnie xy. Rysunek 33.1 obrazuje nakładanie się drgań x i drgań y o różnych amplitu- 33.1. Składanie zgodnych w fazie drgań w kierunku osi x i drgań w kierunku osi y £*=o £,= 1
33-1. ELEKTRYCZNY WEKTOR ŚWIATŁA 107 £x=coscjt; 1 C) cos cot; 1 -sinart; i d) cos (jjt; 1 cos <ot; 1 zos((Jt+3^/4;ei3"^ -coswt; -1 Ex=cosojt; 1 coswt; f cosŁit; cos^t; f E^-cosfut+n/Ąi-e1** sinwf; -i -cos(«it+3n/4); -e'3ff^ coswt; f 33.2. Składanie drgań x i drgań > o równych amplitudach, ale rozmaitych fazach względnych. Składowe E, i E, podane są w zapisie rzeczywistym i zespolonym dach. Wyniki pokazane na rys. 33.1 nie są jedynymi możliwościami; we wszystkich tych przypadkach założyliśmy, że drgania x i y mają zgodne fazy, co wcale nie musi zachodzić. Może się zdarzyć, że drgania x i y będą przesunięte w fazie. Gdy drgania x i drgania y nie mają zgodnych faz, wektor pola elektrycznego obiega dookoła po elipsie, co możemy zobrazować za pomocą znanego przykładu. Zawieśmy kulkę na długim sznurku tak, aby mogła się kołysać swobodnie w płaszczyźnie poziomej. Będzie ona wówczas wykonywać drgania sinusoidalne. Jeżeli wyobrazimy sobie poziome współrzędne x i y o początku w położeniu równowagi kulki, to będzie się ona kołysać bądź w kierunku osi x, bądź osi y z tą samą częstością wahadłową. Wybierając odpowiednie przesunięcie początkowe i prędkość możemy wprawić kulkę w drgania bądź wzdłuż osi x, bądź y albo wzdłuż dowolnej linii prostej w płaszczyźnie xy. Ruchy kulki będą analogiczne do przedstawionych na rys. 33.1 drgań wektora pola elektrycznego. Ponieważ drgania x i drgania y osiągają swoje maksima i minima w tym samym czasie, więc w każdej chwili drgania x i y są w fazie zgodnej. Wiemy jednak, że najogólniejszym ruchem kulki jest ruch po elipsie, odpowiadający drganiom, w których kierunki x ' y nie mają tej samej fazy. Na rysunku 33.2 przedstawiono nakładanie się niezgodnych w fazie drgań x i v dla różnych wartości kąta między ich fazami. Ogólny wynik jest taki, ze wektor elektryczny porusza się po elipsie. Ruch po linii prostej jest szczególnym przypadkiem odpowiadającym różnicy faz 0 (albo całkowitej wielokrotności jt); ruch po okręgu odpowiada równym amplitudom z różnicą faz wynoszącą 90° (albo całkowitą nieparzystą wielokrotność k/2). Na rysunku 33.2 wektory pola elektrycznego w kierunku osi x i y oznaczyliśmy za Pomocą liczb zespolonych, które pozwalają na wygodne przedstawienie różnicy faz. Nie należy mylić rzeczywistej i urojonej części przedstawionego w ten sposób zespolo- nego wektora elektrycznego ze składowymi x i y pola. Składowe x i y wykreślone na rys.
108 33. POLARYZACJA 33.1 i rys. 33.2 są właściwymi, mierzalnymi polami elektrycznymi. Część rzeczywista i urojona zespolonego wektora pola elektrycznego - to tylko udogodnienie matematyczne i nie ma żadnego znaczenia fizycznego. Ustalmy teraz terminologię. Światło jest spolaryzowane liniowo (czasem zwane światłem spolaryzowanym w płaszczyźnie), gdy pole elektryczne drga wzdłuż linii prostej. Rysunek 33.1 obrazuje polaryzację liniową. Gdy koniec wektora pola elektrycznego porusza się po elipsie, światło jest spolaryzowane eliptycznie. Gdy koniec wektora pola elektrycznego wędruje po okręgu, mamy polaryzację kołową. Jeżeli koniec wektora pola elektrycznego (gdy obserwujemy go tak, że światło pada wprost na nas) porusza się w kierunku przeciwnym do wskazówek zegara, nazywamy to prawoskrętną polaryzacją kołową. Rysunek 33.2g pokazuje prawoskrętną polaryzację kołową, a rys. 33.2c pokazuje lewo- skrętną polaryzację kołową. W obu przypadkach światło biegnie od stronicy książki do czytelnika. Nasza umowa oznaczania lewo- i prawoskrętnej polaryzacji kołowej jest zgodna z umową przyjętą w fizyce dla wszystkich innych cząstek wykazujących polaryzację (np. elektronów). Mimo to w niektórych książkach z dziedziny optyki przyjęto odmienne konwencje, tak że należy zachować ostrożność. Omówiliśmy światło spolaryzowane liniowo, kołowo i eliptycznie, co wyczerpuje wszystkie przypadki, z wyjątkiem światła niespolaryzowanego. Jak to się dzieje, że światło może być niespolaryzowane, skoro wiemy, że jego wektor musi poruszać się po pewnej elipsie? Jeżeli światło nie jest dokładnie monochromatyczne albo jeżeli fazy x i y nie są idealnie utrzymywane razem, tak że wektor elektryczny najpierw drga w jednym kierunku, a następnie w innym, polaryzacja stale się zmienia. Pamiętajmy, że emisja z jednego atomu trwa 10 ~8 s i jeżeli jeden atom wysyła światło o pewnej polaryzacji, a następnie inny o innej, to będzie się ona zmieniała co 10 ~8 s. Jeśli polaryzacja zmienia się szybciej, niż ją możemy wykryć, światło nazywamy niespolaryzowanym, ponieważ wszystkie efekty polaryzacyjne wyśredniowują się. Żaden z interferencyjnych efektów polaryzacyjnych nie objawi się dla światła niespolaryzowanego. Jednak według definicji światło jest niespolaryzowane tylko wtedy, gdy nie jesteśmy w stanie stwierdzić,- czy jest spolaryzowane, czy też nie. 33-2. Polaryzacja światła rozproszonego Pierwszym, omawianym przez nas przykładem efektu polaryzacyjnego, jest rozpraszanie światła. Weźmy na przykład wiązkę światła słonecznego, padającego na powietrze. Pole elektryczne wytworzy drgania ładunków w powietrzu, a ruchy tych ładunków spowodują promieniowanie światła, którego natężenie będzie największe w płaszczyźnie prostopadłej do kierunku drgań ładunków. Wiązka pochodząca ze Słońca jest niespolary- zowana i kierunek polaryzacji zmienia się stale, a więc zmienia się i kierunek drgań ładunków w powietrzu. Jeżeli obserwujemy światło rozproszone pod kątem 90°, drgania cząstek naładowanych powodują promieniowanie w kierunku obserwatora tylko wtedy, gdy są prostopadłe do linii obserwacji. Światło będzie wtedy spolaryzowane wzdłuż kierunku drgań. Rozpraszanie stanowi więc przykład, w jaki sposób można wytworzyć polaryzację.
33-3, DWÓJLOMNOŚĆ 109 33-3. Dwójlomność Innym ciekawym zjawiskiem polaryzacyjnym jest istnienie substancji, w których współczynnik załamania jest różny dla światła spolaryzowanego liniowo w różnych kierunkach. Wyobraźmy sobie ośrodek materialny, składający się z wydłużonych, niekuli- stych cząsteczek i załóżmy, że są one w nim ułożone tak, że ich długie osie są wzajemnie równoległe. Co się dzieje, gdy drgające pole elektryczne przechodzi przez taki ośrodek? Załóżmy, że na skutek budowy cząsteczek elektrony w ośrodku łatwiej reagują na drgania pola elektrycznego w kierunku równoległym do osi cząsteczek niż w kierunku prostopadłym. Dlatego też polaryzacja w pewnym kierunku będzie dawała inny efekt niż polaryzacja w kierunku do niego prostopadłym. Kierunek osi cząsteczek nazwijmy osią optyczną. Gdy polaryzacja ma kierunek osi optycznej, współczynnik załamania jest inny niż dla polaryzacji prostopadłej do osi. Ośrodek taki nazywamy ośrodkiem dwójlomnym. Załamuje on światło na dwa różne sposoby, czyli ma dwa współczynniki załamania zależne od kierunku polaryzacji światła w ośrodku. Jakiego rodzaju ośrodki mogą być dwójłomne? W substancji dwójłomnej musi, z tej lub innej przyczyny, istnieć pewien stopień uszeregowania niesymetrycznych cząsteczek. Kryształ o symetrii sześciennej z całą pewnością nie może być dwójłomny. Ale długie, igłowate kryształy niewątpliwie zawierają niesymetryczne cząsteczki i w nich można bardzo łatwo zauważyć to zjawisko. Zobaczmy, jakich efektów powinniśmy się spodziewać przy przechodzeniu światła spolaryzowanego przez płytkę substancji dwójłomnej. Światło przechodzi z pewną prędkością, jeżeli polaryzacja jest równoległa do osi optycznej, a z inną, jeżeli polaryzacja jest do niej prostopadła. Ciekawa sytuacja powstaje wtedy, gdy światło jest na przykład liniowo spolaryzowane pod kątem 45° do osi optycznej. Polaryzację 45° można, jak wiadomo, przedstawić w postaci superpozycji spolaryzowanych w kierunkach osi x \y fal o równych amplitudach i o zgodnej fazie, jak pokazano na rys. 33.2a. Ponieważ światło spolaryzowane w kierunkach xiy rozchodzi się z rozmaitymi prędkościami, więc w miarę przechodzenia światła przez ośrodek fazy zmieniają się w różnym stopniu. Chociaż więc na początku drgania w kierunkach osi x i y są w fazie, wewnątrz ośrodka powstanie między drganiami x i y różnica faz proporcjonalna do stopnia zagłębienia się w materię. W miarę jak światło przechodzi przez ośrodek, polaryzacja zmienia się tak, jak pokazuje szereg diagramów na rys. 33.2. Jeżeli grubość płytki tak dobierzemy, aby wprowadzić przesunięcie fazowe 90° między polaryzacjami .v i y (rys. 33.2c), światło wyjdzie spolaryzowane kołowo. Płytkę o takiej grubości nazywamy ćwierćfalówką, ponieważ wprowadza między Polaryzacjami x i y różnicę faz równą {- okresu. Jeżeli światło spolaryzowane liniowo zostaje przepuszczone przez dwie ćwierćfalówki, to wychodzi ono znowu spolaryzowane w płaszczyźnie, ale prostopadle do kierunku początkowego, tak jak to widzimy na rys. 33.2e. Łatwo można pokazać to zjawisko posługując się kawałkiem celofanu. Celofan jest zbudowany z długich, włóknistych cząsteczek i nie jest izotropowy, ponieważ włókna są Przeważnie ustawione w określonym kierunku. Aby zobaczyć dwójłomność, potrzebna jest nam wiązka światła spolaryzowanego liniowo, możemy zaś ją łatwo otrzymać przepuszczając światło niespolaryzowane przez warstwę polaroidu. Polaroid, o którym później będziemy
110 33. POLARYZACJA mówić bardziej szczegółowo, ma tę korzystną własność, że bardzo słabo pochłania światło spolaryzowane liniowo w kierunku równoległym do swej osi, podczas gdy światło spolaryzowane w kierunku prostopadłym pochłania silnie. Gdy przez warstwę polaroidu przepuszczamy światło niespolaryzowane, przechodzi tylko część niespolaryzowanej wiązki, drgająca równolegle do osi polaroidu, i w rezultacie wychodząca wiązka jest spolaryzowana liniowo. Ta sama własność polaroidu oddaje również usługi przy wykrywaniu polaryzacji wiązki spolaryzowanej liniowo albo przy określeniu czy wiązka jest spolaryzowana liniowo, czy nie. Przepuszcza się po prostu wiązkę światła przez warstwę polaroidu i obraca się nim w płaszczyźnie prostopadłej do wiązki. Wiązka spolaryzowana liniowo nie będzie przepuszczana przez polaroid wtedy, gdy oś polaroidu będzie prostopadła do kierunku polaryzacji. Przepuszczana wiązka zostanie tylko nieznacznie osłabiona, gdy oś warstwy polaroidu obrócimy o 90°. Jeżeli przepuszczane natężenie nie zależy od orientacji polaroidu, wiązka nie jest spolaryzowana liniowo. Aby pokazać dwójłomność celofanu, używamy dwóch warstw polaroidu, tak jak to widać na rys. 33.3. Pierwsza warstwa daje nam liniowo spolaryzowaną wiązkę, którą następnie przepuszczamy przez celofan i przez drugą warstwę polaroidu. Służy ona do wykrycia wszelkiego działania, jakie celofan mógłby wywrzeć na przechodzące spolaryzowane światło. Jeśli najpierw ustawimy osie dwóch warstw polaroidu wzajemnie prostopadle i usuniemy celofan, to drugi polaroid nie będzie przepuszczał żadnego światła. Wprowadźmy teraz celofan między dwie warstwy polaroidu i obracajmy arkusz wokół osi wiązki. Zauważymy, że celofan na ogół powoduje przepuszczenie części światła przez drugi polaroid. Istnieją jednak dwa wzajemnie prostopadłe ustawienia arkusza celofanu, przy których światło wcale nie może przejść przez drugi polaroid. Ustawienia, przy których liniowo spolaryzowane światło jest przepuszczane przez celofan bez zmiany kierunku polaryzacji, muszą być równoległe do osi optycznej kartki celofanowej. Przypuszczamy, że przy tych dwu różnych ustawieniach światło wprawdzie przechodzi przez celofan z dwiema różnymi prędkościami, ale jest przepuszczane bez zmiany kierunku polaryzacji. Gdy celofan zostanie obrócony o połowę kąta między tymi ustawieniami, tak jak pokazuje to rys. 33.3, zobaczymy, że światło przepuszczone przez drugi polaroid będzie wówczas mocne. Tak się składa, że zwykły celofan używany w handlu do opakowań ma grubość bardzo zbliżoną do połowy długości fali dla większości barw światła białego. Arkusz taki obraca oś liniowo spolaryzowanego światła o 90°, jeżeli padająca wiązka spolaryzowana liniowo tworzy kąt 45° z osią optyczną, i wiązka wychodząca zcelofanu drga wtedy w takim kierunku, że może przejść przez drugą warstwę polaroidu. Ponieważ arkusz celofanu ma odpowiednią półfalową grubość tylko dla pewnej skła- 33.3. Doświadczalne wykazanie dwójłomno- ści celofanu. Wektory elektryczne światła są oznaczone liniami przerywanymi. Osie przepuszczania warstw polaroidu i optyczne osie celofanu są zaznaczone strzałkami. Wiązka padająca jest niespolaryzowana celofan polaroid'
33-J. DWÓJLOMNOSĆ 111 dowej światła białego, więc przepuszczana wiązka ma barwę tej właśnie składowej, jeżeli tylko do naszego pokazu użyjemy światła białego. Przepuszczana warstwa zależy od grubości arkusza i możemy zmieniać efektywną grubość celofanu pochylając go tak, aby światło przechodziło pod kątem i w rezultacie po dłuższej drodze. W miarę pochylania arkusza zmienia się przepuszczana barwa. Z celofanu o różnej grubości możemy budować filtry przepuszczające różne barwy. Filtry te mają ciekawą własność, polegającą na tym, że przepuszczają jedną barwę, gdy osie obu warstw polaroidowych są wzajemnie prostopadłe, a barwę dopełniającą, gdy osie te są wzajemnie równoległe. Uszeregowane cząsteczki znajdują także ciekawe zastosowanie praktyczne. Niektóre masy plastyczne są zbudowane z bardzo długich i złożonych cząsteczek skręconych razem. Gdy masę plastyczną zestalamy bardzo ostrożnie, cząsteczki zostają razem skręcone w masie substancji, tak że ustawiają się bezładnie w różnych kierunkach i masa nie wykazuje szczególnej dwójłomności. Zwykle jednak przy zestalaniu substancji powstają odkształcenia i naprężenia, tak że nie jest ona doskonale jednorodna. Przyłożenie zaś napięcia do kawałka takiej masy plastycznej polega jakby na ciągnięciu całego splotu sznurków, na skutek czego więcej ich ułoży się równolegle do napięcia niż w innych kierunkach. Gdy zatem w niektórych masach plastycznych powstają naprężenia, stają się one dwójłomne, co można stwierdzić przepuszczając przez masę plastyczną światło spolaryzowane. Badając przepuszczone światło za pomocą warstwy polaroidu, można zaobserwować obraz jasnych i ciemnych prążków (zabarwionych, jeśli używamy światła białego). Obraz zmienia się, w miarę jak poddajemy próbkę naciskowi, licząc zaś prążki i obserwując, gdzie się większość z nich znajduje, można określić wielkość nacisku. Inżynierowie posługują się tym sposobem do znalezienia naprężeń w elementach o nieregularnym kształcie, które trudno obliczyć. Weźmy inny ciekawy przykład uzyskiwania dwójłomności w ośrodkach ciekłych. Rozważmy ciecz utworzoną z długich asymetrycznych cząsteczek, które obdarzone są na końcach średnim ładunkiem dodatnim lub ujemnym, tak że cząsteczka stanowi dipol elektryczny. Na skutek zderzeń w cieczy cząsteczki będą zwykle ustawione bezładnie i tyle samo cząsteczek ustawi się w jednym kierunku, co w innym. Jeśli przyłożymy pole elektryczne, cząsteczki będą się starały uszeregować i ciecz stanie się dwójłomna. Za pomocą dwóch warstw polaroidu i przezroczystej komórki zawierającej taką polarną ciecz możemy zbudować urządzenie, które ma własność przepuszczania światła tylko wtedy, gdy zostanie przyłożone pole elektryczne. Mamy więc elektryczny wyłącznik dla światła, który nazywamy komórką Kerra. Zjawisko polegające na tym, że pole elektryczne może w pewnych cieczach wytworzyć dwójłomność, nazywamy zjawiskiem Kerra. 33-4. Polaryzatory Rozważaliśmy dotąd substancje, w których współczynnik załamania był różny dla światła spolaryzowanego w różnych kierunkach. Dużą wartość praktyczną mają także kryształy i inne substancje, w których nie tylko współczynnik załamania, ale i współczynnik Pochłaniania jest różny dla światła spolaryzowanego w różnych kierunkach. Rozumowanie,
112 33. POLARYZACJA TW////////M^&yyWMM 33.4. Odbicie liniowo spolaryzowanego światła pod kątem Brewstera. Kierunek polaryzacji oznaczony jest strzałkami przerywanymi; punkty oznaczają polaryzację prostopadłą do papieru którym uzasadnialiśmy pojęcie dwójłomności, tłumaczy też, że pochłanianie może zależeć od kierunku, w którym pobudzane są do drgań ładunki ośrodka anizotropowego. Znanym od dawna, słynnym przykładem jest turmalin. Innym przykładem jest polaroid. Polaroid składa się z cienkiej warstwy malutkich kryształków herapatytu (pewnej soli jodu i chininy), których osie są ustawione równolegle. Kryształy te pochłaniają światło wtedy, gdy drgania odbywają się w jednym kierunku, nie wykazują zaś dostrzegalnego pochłaniania, gdy drgania odbywają się w kierunku prostopadłym do pierwszego. Załóżmy, że na warstwę polaroidu pada światło spolaryzowane liniowo pod kątem 0 do kierunku przepuszczania. Jakie natężenie przejdzie na wylot? Padające światło można rozłożyć na składową prostopadłą do kierunku przepuszczania, proporcjonalną do sin 9, i składową wzdłuż tego kierunku, proporcjonalną do cos 9. Amplituda przechodząca przez polaroid stanowi tylko część cosinusową, składowa sinusowa zostaje pochłonięta. Amplituda przechodząca przez polaroid jest więc mniejsza od amplitudy wchodzącej o czynnik cos 9. Energia przepuszczona przez polaroid, to znaczy natężenie światła, jest proporcjonalna do kwadratu cos 9. Tak więc gdy światło padające jest spolaryzowane pod kątem 9 do kierunku przepuszczania, przechodzące natężenie jest proporcjonalne do cos2 9. Pochłonięte zaś natężenie jest oczywiście proporcjonalne do sin2 0. Zastanówmy się nad następującą ciekawą i paradoksalną sytuacją. Wiemy, że nie można przepuścić wiązki światła przez dwie warstwy polaroidu o osiach wzajemnie prostopadłych. Jeśli jednak między takimi dwoma polaroidami umieścimy trzeci, o osi przepuszczania pod kątem 45° do osi skrzyżowanych, to układ taki przepuści nieco światła. Wiemy, że polaroid tylko pochłania światło, a nie stwarza nowego. Niemniej jednak dodanie trzeciego polaroidu pod kątem 45° umożliwia przejście większej ilości światła. Pozostawiamy analizę tego zjawiska jako ćwiczenie dla czytelnika. Jednego z najciekawszych przykładów polaryzacji dostarczają nie skomplikowane kryształy albo jakieś złożone substancje, ale najprostsza i najlepiej znana sytuacja - odbicie światła od powierzchni. Można w to wierzyć lub nie, ale światło odbite od szklanej powierzchni może być spolaryzowane, a fizyczne wytłumaczenie tego zjawiska jest bardzo proste. Brewster odkrył doświadczalnie, że światło odbite od powierzchni jest całkowicie spolaryzowane wtedy, gdy wiązka odbita i wiązka załamująca się w ośrodku tworzą między sobą kąt prosty. Sytuację tę przedstawia rys. 33.4. Jeżeli wiązka padająca będzie spolaryzowana w płaszczyźnie padania, odbicie wcale nie nastąpi. Przyczyna zjawiska jest bardzo prosta. W ośrodku odbijającym światło jest spolaryzowane poprzecznie, wiemy zaś, że wychodząca wiązka, którą nazywamy wiązką odbitą, wytwarza właśnie ruch ładunków w ośrodku. Pochodzenie tak zwanego światła odbitego nie tłumaczy się zwykłym
U-4. POLARYZATORY 113 odbiciem wiązki; po głębszym zbadaniu sprawy okazuje się, że padająca wiązka wzbudza drgania ładunków w ośrodku, który z kolei wytwarza wiązkę odbitą. Z rysunku 33.4 widać, że w kierunku wiązki odbitej mogą promieniować tylko drgania normalne do powierzchni papieru i w rezultacie odbita wiązka będzie spolaryzowana prostopadle do płaszczyzny padania. Jeśli padająca wiązka będzie spolaryzowana w płaszczyźnie padania, światła odbitego nie będzie. Zjawisko to łatwo pokazać odbijając liniowo spolaryzowaną wiązkę od płaskiego kawałka szkła. Obracając szkłem tak, aby wiązka spolaryzowana padała pod różnymi kątami, zauważymy nagłe osłabienie odbitego natężenia, gdy kąt padania przejdzie przez kąt Brewstera. Osłabienie to widać tylko wtedy, gdy płaszczyzna polaryzacji pokrywa się z płaszczyzną padania. Jeżeli płaszczyzna polaryzacji jest prostopadła do płaszczyzny padania, przy wszystkich kątach spostrzeżemy zwykłe odbite natężenie. 33-5. Aktywność optyczna Inne ważne zjawisko polaryzacyjne obserwuje się w substancjach złożonych z cząsteczek nie wykazujących symetrii zwierciadlanej. Chodzi o cząsteczki zbudowane na kształt korkociągu albo ręki w rękawiczce, albo wreszcie jakiegoś przedmiotu, którego odbicie zwierciadlane jest odwrócone, podobnie jak odbicie lewej rękawiczki, mające wygląd rękawiczki prawej. Załóżmy, że wszystkie cząsteczki w substancji są takie same, to znaczy że żadna z nich nie jest zwierciadlanym odbiciem drugiej. Substancja taka może wykazywać ciekawe działanie, zwane aktywnością optyczną, na skutek którego liniowo spolaryzowane światło przechodzące przez ośrodek doznaje skręcania kierunku polaryzacji wokół osi wiązki. Zrozumienie zjawiska aktywności optycznej wymaga przeprowadzenia pewnych rachunków, ale i bez nich możemy właściwie zobaczyć jakościowo, skąd się to zjawisko bierze. Rozważmy asymetryczną cząsteczkę o kształcie śruby, jak pokazuje rys. 33.5. Aby przejawiać aktywność optyczną, cząsteczki wcale nie muszą mieć kształtu korkociągu, ale ten prosty kształt weźmiemy jako typowy przykład obiektu nie wykazującego symetrii zwierciadlanej. Gdy wiązka światła spolaryzowana liniowo wzdłuż kierunku osi y pada na taką cząsteczkę, pole elektryczne porusza ładunkami w górę i w dół po linii śrubowej, wytwarzając w ten sposób prąd w kierunku osi y 33-5- Cząsteczka, której kształt nie wy- i powodując wypromieniowanie pola elektryczne- kazuje symetrii z^rciadlanej. Na cząs- „ , . , . _ teczkę pada wiązka światła spolaryzowa- go Ły spolaryzowanego w kierunku osi v. Po- XO nego liniowo w kierunku osi y nieważ jednak elektrony muszą pozostawać na śrubowej, więc pobudzane do ruchu w górę dół muszą także poruszać się w kierunku osi x. y Gdy prąd płynie w górę śrubowej, wówczas jego kierunek na rys. 33.5 jest prostopadły do płasz- =jw uuck na iys. jj.j jcm piusiupauiy uo piasz- —— Sr. j r"T— 7+a " czyzny rysunku, przy tym dla z = r, wchodzi za X* * Ccd * płaszczyznę, a dla z = z, +A — wychodzi, jeżeli -* ♦W=2»—r*—**--
114 33. POLARYZACJA A jest średnicą naszej śruby cząsteczkowej. Można by sądzić, że prąd w kierunku osi x nie będzie wytwarzał efektywnego promieniowania, ponieważ po przeciwnych stronach spirali prądy płyną w przeciwnych kierunkach. Rozważając jednak składową x pola elektrycznego w punkcie z = z2 stwierdzamy, że pola wypromieniowane przez prąd w punktach z=z{+Ai z = z{ dochodzą do punktu z2 z różnicą czasu wynoszącą Ajc i tym samym z różnicą faz n + ojA/c. Jeżeli różnica faz nie wynosi dokładnie n, oba pola nie znoszą się całkowicie i pozostaje nam mała x-owa składowa pola elektrycznego wytworzonego przez ruch elektronów w cząsteczce, mimo że wzbudzające pole elektryczne ma tylko składową y. Mała składowa x dodana do dużej składowej y daje pole wypadkowe lekko obrócone względem osi y, stanowiącej początkowy kierunek polaryzacji. Kierunek polaryzacji obraca się wokół osi wiązki, w miarę jak światło porusza się przez ośrodek. Rozpatrując kilka przykładów i rozważając prądy wzbudzone przez padające pole elektryczne, można się przekonać, że istnienie aktywności optycznej i znak skręcenia nie zależą od ustawienia cząsteczki. Pospolitą substancją wykazującą aktywność optyczną jest cukier rozpuszczony w wodzie. Zjawisko łatwo pokazać za pomocą urządzenia składającego się z warstwy polaroidu, która służy do wytworzenia wiązki spolaryzowanej liniowo, komórki, która zawiera roztwór cukru przepuszczający światło, i drugiej warstwy polaroidu, która wykrywa skręcenie kierunku polaryzacji przy przechodzeniu światła przez roztwór. 33-6. Natężenie światła odbitego Omówimy teraz w sposób ścisły współczynnik odbicia jako funkcję kąta. Rysunek 33.6a pokazuje wiązkę światła padającą na powierzchnię szkła, na której częściowo następuje odbicie, a częściowo załamanie wiązki w szkle. Załóżmy, że padająca wiązka ma amplitudę jednostkową i jest spolaryzowana liniowo w kierunku normalnej do płaszczyzny papieru. Amplitudę fali tak odbitej oznaczymy b, a amplitudę fali załamanej a. Obie fale, odbita i załamana, będą oczywiście spolaryzowane liniowo, a wektory pola elektrycznego fali padającej, odbitej i załamanej będą wzajemnie do siebie prostopadłe. Rysunek 33.6b pokazuje analogiczną sytuację, przy czym fala padająca, o amplitudzie jednostkowej, jest teraz spolaryzowana w płaszczyźnie papieru. Amplitudy fali odbitej i załamanej oznaczamy w tym przypadku odpowiednio A i B. Chcemy obliczyć, jak wielkie jest od- 33.6. Padająca fala o amplitudzie jednostkowej odbija się i załamuje na powierzchni szkła, a) Fala padająca jest liniowo spolaryzowana prostopadle do płaszczyzny papieru; b) fala padająca jest liniowo spolaryzowana w kierunku pokazanym przez wektor elektryczny (przerywany) a) b)
53-6. NATĘŻENIE ŚWIATŁA ODBITEGO 115 bicie w obu przypadkach przedstawionych na rys. 33.6a i 33.6b. Wiemy już, że gdy kąt między falą odbitą i załamaną jest prosty, wówczas na rys. 33.6b nie ma fali odbitej. Zobaczmy jednak, czy się nam nie uda znaleźć odpowiedzi ilościowej, ścisłego wzoru dla B i b jako funkcji kąta padania /'. Musimy zrozumieć następującą ideę. Prądy wzbudzone w szkle wytwarzają dwie fale; przede wszystkim falę odbitą. Wiemy także, że gdyby nie było prądów wzbudzonych w szkle, fala padająca poruszałaby się dalej prosto przez szkło. Pamiętajmy bowiem, że na wypadkowe pole składają się wszystkie źródła we wszechświecie. Źródło padającego światła wytwarza pole o amplitudzie jednostkowej, które powinno się rozchodzić wewnątrz szkła wzdłuż kropkowanej linii na rysunku. Ponieważ pola tego nie obserwujemy, wnioskujemy, że prądy wzbudzone w szkle muszą wytwarzać pole o amplitudzie -1, które rozchodzi się wzdłuż linii kropkowanej. Korzystając z tego, obliczmy amplitudy fal odbitych a i A. Z rysunku 33.6a widzimy, że pole o amplitudzie b jest wypromieniowywane na skutek ruchu ładunków reagujących w szkle na pole a i wobec tego b jest proporcjonalne do a. Ponieważ zaś oba nasze rysunki różnią się od siebie tylko kierunkiem polaryzacji, moglibyśmy przypuszczać, że stosunek BI A będzie taki sam jak stosunek bja. Nie jest to jednak całkiem ścisłe, ponieważ na rys. 33.6b kierunki polaryzacji nie są wzajemnie równoległe w odróżnieniu od sytuacji z rys. 33.6a. Na tworzenie się B ma wpływ tylko składowa A prostopadła do B, mianowicie A cos(/-f-r). Poprawna proporcja będzie więc dana wzorem b B - = . (33.1) a A cos (i + r) Zastosujemy teraz pewien zręczny chwyt. Wiemy, że w przypadkach a) i b) na rys. 33.6 pole elektryczne w szkle musi powodować drgania ładunków, które wzbudzają pole o amplitudzie -1, spolaryzowane równolegle do padającej wiązki i rozchodzące się w kierunku linii kropkowanej. Ale z części b) rysunku widać, że w wytwarzaniu tej fali uczestniczy tylko składowa A, prostopadła do linii przerywanej, która ma odpowiednią do tego polaryzację. Z rysunku 33.6a wynika natomiast, że działa pełna amplituda a, ponieważ polaryzacja fali a jest prostopadła do polaryzacji fali o amplitudzie - 1. Możemy więc napisać A cosii — r) — 1 - = , (33.2) a -1 ponieważ obie amplitudy po lewej stronie wzoru (33.2) wytwarzają falę o amplitudzie- I. Dzieląc równanie (33.1) stronami przez (33.2) otrzymujemy *,"»<'• + '> (33.3) b cos(i-r) 1 wynik ten możemy sprawdzić na znanym nam przykładzie. Jeżeli bowiem przyjmiemy *(»" + /■) = 90°, z równania (33.3) wynika, że B=0, tak jak to powinno być według Brewstera, a wiec przynajmniej w tym przypadku nasze wyniki nie są jawnie błędne. Założyliśmy, że fale padające mają amplitudy jednostkowe, tak że \B\z/l2 stanowi
116 33. POLARYZACJA współczynnik odbicia dla fal spolaryzowanych w płaszczyźnie padania, a |6|2/12 jest współczynnikiem odbicia dla fal spolaryzowanych prostopadle do tej płaszczyzny. Stosunek tych dwóch współczynników odbicia jest określony przez równanie (33.3). Teraz dokonamy cudu i obliczymy nie tylko stosunek, ale każdy ze współczynników \B\2i |£|2 z osobna! Z zasady zachowania energii wiemy, że energia w fali załamanej musi być równa energii fali padającej mniej energia fali odbitej, czyli 1 - \B\2 w jednym przypadku, 1 — \b\2 — w drugim. Co więcej, energia przechodząca do szkła na rys. 33.6b ma się tak do odpowiedniej energii na rys. 33.6a jak stosunek kwadratów amplitud załamanych |.4|2/|a|2. Można by się spytać, czy rzeczywiście wiemy, jak obliczyć energię wewnątrz szkła, bo przecież obok energii pola elektrycznego są tam energie ruchu atomów. Jest jednak oczywiste, że wszelkie przyczynki do energii całkowitej będą zawsze proporcjonalne do kwadratu amplitudy pola elektrycznego. Możemy więc napisać: 1-\B\2 Ul2 —'-L-Jj • (33-4) Wykorzystujemy teraz równanie (33.2) dla wyeliminowania wielkości A/a z powyższego wzoru i wyrażamy B przez b za pomocą równania (33.3): cos-(,>r) "•"-'» ' (33.5) l-|fcj2 cos2(i-r) Równanie to zawiera tylko jedną nieznaną amplitudę b. Rozwiązując je ze względu na \b\2 otrzymujemy |2 sin2 (/-r) H -^-277—;. <33-6) sin (i + r) * tt pomocą równania (33.3) ,2 tg2(/-r) \B\2 = ~ '. (33.7) 1 ' tg2(i + r) Znaleźliśmy w ten sposób nie tylko współczynnik odbicia \b\2 dla padającej fali, spolaryzowanej prostopadle do płaszczyzny padania, ale także współczynnik odbicia \B\2 dla padającej fali spolaryzowanej w płaszczyźnie padania! Można dalej poprowadzić te rozważania i wywnioskować, że wielkość b jest rzeczywista. Aby to udowodnić, trzeba rozważyć przypadek, w którym światło dochodzi do obu stron powierzchni szkła w tej samej chwili. Sytuację taką niełatwo zrealizować doświadczalnie, ale zabawna jest jej analiza teoretyczna. Rozpatrując ten ogólny przypadek, możemy udowodnić, że b musi być rzeczywiste i że mianowicie b = ± sin (/ —r)/sin (i + r). Można nawet określić znak, rozważając bardzo cieniutką warstwę, w której następuje odbicie od przedniej i tylnej powierzchni i obliczając ilość odbitego światła. Wiemy zaś, ile światła powinna odbijać cienka warstwa, ponieważ znamy wielkość wzbudzonego prądu, obliczaliśmy nawet wytworzone przez niego pole.
33-6. NATĘŻENIE ŚWIATŁA ODBITEGO 11' Za pomocą takiego rozumowania można pokazać, że sin(i-r) tg(i-r) *>=-—7—:, B=-1tt- • (33.8 sm(j + r) tg(i-t-r) Powyższe wyrażenia dla współczynników odbicia jako funkcji kątów padania i odbicii nazywamy wzorami Fresnela dla odbicia. Gdy rozważamy granice tych wrażeń dla dążących do zera kątów / i r, stwierdzamy że w przypadku padania w kierunku normalnej B2xb2x(i — r)2/(i + r)2 dla obu polaryzacji ponieważ wartości sinusów i tangensów są praktycznie równe kątom. Wiemy zaś, żi sin /'/sin r = n i gdy kąty są małe, i/rxn. Łatwo więc pokazać, że współczynnik odbicia dli padania w kierunku normalnej wynosi B2 = b2= -_. (i + l)2 Ciekawe jest obliczenie, ile światła przy prostopadłym padaniu zostaje odbite tu przykład od powierzchni wody. Dla wody « = *, tak że współczynnik odbicia (|)2«2% Przy padaniu prostopadłym tylko 2% światła zostaje odbite od powierzchni wody. 33-7. Anomalne załamanie Ostatnie zjawisko dotyczące polaryzacji, które zamierzamy rozważać, zostało właści wie odkryte jako jedno z pierwszych; chodzi o anomalne załamanie. Żeglarze odwiedzający Islandię przywozili do Europy kryształy szpatu islandzkiego (CaC03), który ma zabawną własność podwajania wszystkiego, co się przezeń widzi, to znaczy tworzenia dwu obrazów. Sprawa ta zainteresowała Huygensa i odegrała ważną rolę w odkryciu polaryzacji. Często się zdarza, że zjawisko najpierw odkryte jest w końcu najtrudniejsze dc wyjaśnienia. Dlatego też dopiero po dokładnym zrozumieniu idei fizycznej możemy starannie wybierać zjawiska, które ją najjaśniej i najprościej ilustrują. Anomalne załamanie jest szczególnym przypadkiem dwójłomności, którą rozważaliśmy poprzednio. Pojawia się ono wtedy, gdy oś optyczna, dłuższa oś naszych asymetrycznych cząsteczek, nie jest równoległa do powierzchni kryształu. Na rysunku 33.7 narysowano dwa kawałki kryształu dwójłomnego i zaznaczono kierunek ich osi optycznych. Na górnym rysunku wiązka padająca na kryształ jest spolaryzowana w kierunku prostopadłym do osi optycznej. Gdy wiązka ta pada na powierzchnię kryształu, każdy punkt powierzchni działa jak źródło fali rozchodzącej się w krysztale z prędkością vx, to znaczy z prędkością światła odpowiadającą polaryzacji prostopadłej do osi optycznej. Czoło fali jest po prostu obwiednią wszystkich małych fal kulistych i sunie prosto przez kryształ wychodząc z drugiej jego strony. Jest to zachowanie, jakiego zwykle oczekujemy, 1 promień ten nazywamy promieniem zwyczajnym. Na dolnym rysunku kierunek liniowej polaryzacji światła padającego na kryształ jest obrócony o 90° i oś optyczna leży w płaszczyźnie polaryzacji. W tym przypadku małe Tale powstające w pewnym punkcie powierzchni nie rozchodzą się już jak fale kuliste.
118 33. POLARYZACJA F f 1 ł ^ czoło fali ♦ i • oś optyczna 33.7. a) Tor promienia zwyczajnego w krysztale dwójlomnym, b) tor promienia nadzwyczajnego. Oś optyczna leży w płaszczyźnie papieru Światło biegnące wzdłuż osi optycznej rozchodzi się z prędkością vL, ponieważ jego polaryzacja jest prostopadła do osi optycznej, a światło biegnące prostopadle do osi optycznej rozchodzi się z prędkością v^, ponieważ jego polaryzacja jest do osi optycznej równoległa. W substancji dwójłomnejf tj ¥=v±, a na rysunku mamy V\.<v±. Z pełniejszej analizy wyniknęłoby, że fale rozchodzą się jako powierzchnie elipsoid, których oś główna jest jednocześnie osią optyczną. Obwiednią wszystkich tych fal elipsoidalnych jest czoło fali sunące przez kryształ w kierunku zaznaczonym na rysunku. Na tylnej powierzchni kryształu wiązka zostanie odgięta dokładnie tak samo jak na przedniej. W ten sposób światło wyjdzie przesunięte równolegle do wiązki padającej. Wiązka ta nie stosuje się oczywiście do prawa Snella, ale rozchodzi się w niezwykłym kierunku. Dlatego też nazywa się ją promieniem nadzwyczajnym. Gdy na anomalnie łamiący kryształ pada wiązka niespolaryzowana, zostaje rozdzielona na promień zwyczajny, przechodzący na wprost w zwykły sposób, oraz na promień nadzwyczajny, który przy przejściu przez kryształ zostaje przesunięty. Oba wychodzące promienie są spolaryzowane liniowo, prostopadle do siebie. Można to pokazać, analizując za pomocą polaroidu polaryzację wychodzących promieni. Możemy także wykazać, że nasza interpretacja zjawiska jest poprawna. Puszczamy mianowicie na kryształ światło liniowo spolaryzowane i ustawiając odpowiednio kierunek polaryzacji możemy spowodować przechodzenie tego światła bez rozdwojenia na wprost albo bez rozdwojenia, ale z przesunięciem. Na rysunkach 33.1 i 33.2 przedstawiliśmy różne przypadki polaryzacji jako wynik składania dwóch szczególnych przypadków polaryzacyjnych, mianowicie w kierunkach osi x i y, wziętych w różnym stosunku i z różnymi fazami. Równie dobrze można użyć do tego celu inne pary. Nadaje się do tego polaryzacja wzdłuż jakichkolwiek dwu prostopadłych osi x' i y', nachylonych względem osi x i y (każdą polaryzację można utworzyć np. ze złożenia przypadków a i e z rys. 33.2). Ciekawe jednak, że pomysł ten można rozciągnąć także na inne przypadki. Tak na przykład dowolną liniową polaryzację można utworzyć przez złożenia polaryzacji kołowej prawo- i lewoskrętnej (przypadki c i g z rys. 33.2) w odpowiednim stosunku i z odpowiednimi fazami, ponieważ dodanie dwu różnych wektorów wirujących w przeciwnych kierunkach daje pojedynczy wektor drgający wzdłuż
13-7. ANOMALNE ZAŁAMANIE 119 33.8. Dwa przeciwnie wirujące wektory o różnej amplitudzie dodając się tworzą wektor o ustalonym kierunku, ale o drgającej amplitudzie 33.9. Ładunek poruszający się po kole pod wpływem światła spolaryzowanego kołowo linii prostej (rys. 33.8). Jeśli faza jednego wektora jest przesunięta względem drugiego, to linia jest nachylona. Tak więc wszystkie części rys. 33.1 można tłumaczyć jako „złożenie z różnymi fazami względnymi równych ilości światła spolaryzowanego kołowo prawo i lewoskrętnie". W miarę jak faza światła lewo- skrętnego zostaje w tyle za prawoskrętnym, kierunek polaryzacji liniowej zmienia się. Wobec tego substancje optycznie czynne można w pewnym sensie uważać za dwójłomne. Ich własności można tłumaczyć w ten sposób, że mają różne współczynniki załamania dla światła spolaryzowanego kołowo prawo i lewoskrętnie. Złożenie światła spolaryzowanego kołowo prawo- i lewoskrętnie, o różnych natężeniach, daje światło spolaryzowane eliptycznie. Światło spolaryzowane kołowo ma jeszcze inną ciekawą własność — niesie ono moment pędu (względem kierunku rozchodzenia się). Aby się o tym przekonać, załóżmy, że światło takie pada na atom przedstawiony jako oscylator harmoniczny, który może się dowolnie przemieszczać w dowolnym kierunku w płaszczyźnie xy. Przesunięcie x elektronu będzie wówczas zależne od składowej Ex pola, przesunięcie zaś ^ będzie zależeć od składowej Ey, takiej samej co do wartości, ale cofniętej o 9(F w fazie. Znaczy to, że elektron będzie się obracał po okręgu z prędkością kątową u w rytmie wirującego pola elektrycznego światła (rys. 33.9). W zależności od charakterystyki tłumienia reakcji oscylatora kierunek przesunięcia a elektronu i kierunek działającej nań siły qtE mogą nie być takie same, ale mogą wirować dookoła. Pole E może mieć składową prostopadłą do a, tak że na układzie będzie wykonywana praca i będzie działał moment skręcający r. Praca wykonana w ciągu sekundy wyniesie toj. Energia pochłonięta w ciągu czasu T wyniesie xa>T, podczas gdy zT będzie momentem pędu przekazanym materii pochłaniającej energię. Widzimy więc, że wiązka światła spolaryzowanego kołowo prawoskrętnie, zawierająca całkowitą energię <f, niesie moment pędu (o wektorze skierowanym wzdłuż kierunku rozchodzenia się) &\(a. Gdy bowiem wiązka ta zostaje Pochłonięta, absorbentowi jest przekazywany taki właśnie moment pędu. Światło spolaryzowane kołowo lewoskrętnie niesie zaś moment pędu o przeciwnym znaku: — <?/«.
34 relatywistyczne efekty w promieniowaniu 34-1. Ruchome źródła Obecny rozdział poświęcimy opisowi wielu rozmaitych zjawisk związanych z promieniowaniem i w ten sposób zakończymy omawianie klasycznej teorii rozchodzenia się światła. Nasze badanie światła przeprowadziliśmy dość wnikliwie, aż do drobnych szczegółów. Pominęliśmy tylko jedną ważniejszą klasę zjawisk związanych z promieniowaniem elektromagnetycznym. Co się mianowicie dzieje, gdy fale radiowe albo zostaną zamknięte w pudle o ścianach odbijających (przy czym rozmiary pudła są porównywalne z długością fali), albo przepuszczane przez długą rurę? Zjawiska te, zachodzące w tzw. rezonatorach wnękowych i falowodach, będziemy omawiali później; powrócimy do tego tematu po rozpatrzeniu innego podobnego przykładu fizycznego, mianowicie dźwięku. Z tym jednym wyjątkiem obecny rozdział jest ostatnim rozdziałem, który poświęcamy rozważaniu klasycznej teorii światła. Wszystkie zjawiska, które teraz będziemy omawiali, możemy krótko opisać jako odnoszące się do efektów związanych z ruchem źródeł. Teraz już nie zakładamy, że źródło jest zlokalizowane, a jego ruch odbywa się ze stosunkowo małą prędkością w pobliżu ustalonego punktu. Przypominamy, że według podstawowych praw elektrodynamiki pole elektryczne w dużych odległościach od ruchomego ładunku dane jest wzorem E^-i-jĄ. (34.1) 47r£0c2 dr Druga pochodna jednostkowego wektora eR , wskazującego w kierunku pozornego położenia ładunku, stanowi istotną cechę pola elektrycznego. Ten wektor jednostkowy nic wskazuje oczywiście kierunku położenia ładunku jednoczesnego z chwilą obserwacji.
34-1 - RUCHOME ŹRÓDŁA 121 ale kierunek, w którym powinien on się znajdować, jeżeli się uwzględni, że informacja przenosi się od ładunku do obserwatora tylko ze skończoną prędkością c. Z polem elektrycznym stowarzyszone jest pole magnetyczne, zawsze prostopadłe do pola elektrycznego i prostopadłe do wektora położenia pozornego źródła. Jest ono dane wzorem B=-eR.xE/c. (34.2) Dotąd zajmowaliśmy się tylko przypadkiem, w którym prędkośpi ładunku były nierela- tywistyczne, tak że nie trzeba było uwzględniać żadnej znacznej zmiany kierunku źródła. Teraz zbadamy bardziej ogólny przypadek, w którym ruch odbywa się z dowolną prędkością. Zobaczymy, jakie zjawiska można zaobserwowaćw tych warunkach. Dopuszczając dowolną prędkość ruchu źródła będziemy nadal oczywiście zakładać, że znajduje się ono bardzo daleko od detektora. Wiemy już z naszych rozważań przeprowadzonych w rozdz. 28, że na wartość d2eR'/dt2 mają wpływ tylko zmiany kierunku wektora eR. Oznaczmy współrzędne ładunku przez (x, y, z), przy czym niech z będzie mierzone wzdłuż kierunku obserwacji (rys. 34.1). W danej chwili, dajmy na to w chwili t, trzy składowe wektora określającego położenie ładunku są równe x(r), y(r), z(r). Odległość R jest zaś w przybliżeniu równa R(r)==R0 + z(r). Taka zależność R od współrzędnych ładunku sprawia, że kierunek wektora eR. zależy głównie od x iv, a bardzo mało od z: poprzeczne składowe wektora jednostkowego wynoszą bowiem xjR i yjR, różniczkując je zatem otrzymamy wyrażenia zawierające R2 w mianowniku, na przykład d(xlR)_dxjdt dz x = £5- dt R dt Jeśli więc znajdujemy się dostatecznie daleko, to jedyne istotne wyrazy pochodzą ze zmian x i y. W wyrazach tych możemy ponadto zastąpić czynnik R przez R0 i w rezultacie otrzymać d2x' _ q d2y' £.= - 4ue0c2Rq dl2 £>■= 4ne0c2R0 dt (34.3) 34.1. Tor poruszającego się ładunku. Prawdziwym położeniem w chwili t jest T, ale położeniem opóźnionym jett A
122 34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU gdzie R0 jest w przybliżeniu odległością od ładunku q; niech będzie to odległość OP od początku układu współrzędnych (x, y, z). Pole elektryczne jest więc równe stałej, pomnożonej przez bardzo proste wyrażenie, a mianowicie przez drugie pochodne współrzędnych x i y (możemy wysłowić to bardziej matematycznie, nazywając x i y transwersalnymi składowymi wektora r położenia ładunku, ale nie jest to bardziej przejrzyste). Musimy tu oczywiście pamiętać, że współrzędne te trzeba mierzyć w czasie opóźnionym. Wtedy stwierdzimy, że w tym wypadku z(t) rzeczywiście musi mieć wpływ na opóźnienie. Ile więc ono wynosi? Otóż, jeżeli czas, w którym dokonujemy obserwacji, oznaczymy przez / (czas w punkcie P), to odpowiadający mu czas x w punkcie A nie jest równy /, ale jest opóźniony o czas równy całkowitej drodze, którą ma przebyć światło, podzielonej przez jego prędkość. W pierwszym przybliżeniu opóźnienie to wynosi R0/c, a więc jest stałe (co nie jest niczym ciekawym), w następnym natomiast przybliżeniu musimy już uwzględnić rolę składowej z położenia w chwili t, jeśli bowiem ładunek q cofnie się nieco wstecz, opóźnienie się jeszcze nieznacznie powiększy. Poprzednio pomijaliśmy ten efekt, a stanowi on jedyną zmianę, jaką trzeba wprowadzić, aby nasze wyniki stały się ważne dla wszystkich prędkości. Aby osiągnąć nasz cel, należy teraz ustalić pewną wartość /, obliczyć z niej wartość r i znaleźć stąd położenia x i y w chwili r. Wartości te będą zatem opóźnionymi wartościami współrzędnych x i y i będziemy je oznaczać przez x' i y'; ich drugie pochodne wyznaczą pole. Tak więc r określone jest wzorem R0z(r) t = T-\ H c c oraz x'(0 = x(t), y'(t) = y(r). (34.4) Równania te są skomplikowane, ale ich rozwiązania można stosunkowo łatwo przedstawić graficznie. Przedstawienie takie będzie dobrym jakościowym opisem całej sprawy. Gdybyśmy natomiast chcieli otrzymać ścisłe wnioski dotyczące tego skomplikowanego zagadnienia, musielibyśmy posłużyć się wieloma dość specjalnymi faktami matematycznymi. 34-2. Znajdowanie ruchu „pozornego" Równania (34.4) dają się ciekawie uprościć. Jeżeli pominiemy nieciekawe stałe opóźnienie R0/c, które oznacza tylko, że trzeba przesunąć początek układu / o stałą, to wówczas równania te przyjmą postać c/ = cr + z(r), x' = x(x), y' = y(x). (34.5) Szukamy teraz x' i y' jako funkcji / a nie r i możemy je znaleźć w następujący sposób: równania (34.5) mówią, że powinniśmy wziąć właściwy ruch i dodać do niego stałą (prędkość światła) pomnożoną przez t. Na rysunku 34.2 widać, co z tego wynika. Bierzemy właściwy ruch ładunku (pokazany po lewej stronie) i wyobrażamy sobie, że podczas ruchu dookoła zostaje on uniesiony z punktu P z prędkością c (nie pojawiają się tu żadne
34-2. ZNAJDOWANIE RUCHU „POZORNEGO" 123 34.2. Geometryczne rozwiązanie równania (34.5) w celu znalezienia krzywej *'(') relatywistyczne skrócenia ani nic podobnego; chodzi tu po prostu o matematyczne dodanie er). Otrzymujemy w ten sposób nowy ruch, dla którego współrzędną wzdłuż linii obserwacji jest et, jak widać to z prawej strony. (Rysunek pokazuje wynik dla dość złożonego ruchu w płaszczyźnie, ale oczywiście ruch nie musi się odbywać w jednej płaszczyźnie, lecz może być bardziej złożony niż ruch płaski.) Istotne jest to, że odległość pozioma (tzn. mierzona wzdłuż linii obserwacji) nie jest już równa dawnemu z, ale z+cz i wobec tego wynosi et. Znaleźliśmy więc zależność x' (i y') od /'. Aby znaleźć pole, trzeba jeszcze tylko obliczyć przyspieszenie na tej krzywej (czyli przyspieszenie dla ruchów jednostajnych po tej krzywej), to znaczy dwukrotnie ją zróżniczkować. A więc końcowa odpowiedź brzmi: aby znaleźć pole elektryczne poruszającego się ładunku, bierzemy ruch tego ładunku i przesuwamy go wstecz z prędkością c, tak aby się „rozciągnął". Zakreślona w ten sposób krzywa jest krzywą położeń x' i y' w funkcji /. Przyspieszenie na tej krzywej daje nam pole elektryczne jako funkcję /. Jeżeli chcemy, możemy sobie wyobrazić, że tor ruchu przesuwa się „sztywno" z prędkością c i przebija płaszczyznę obserwacji (tzn. płaszczyznę prostopadłą do kierunku obserwacji, w miejscu obserwacji) właśnie w takiej chwili, by poruszający się po torze elektron przebił płaszczyznę obserwacji w punkcie o współrzędnych x' i y'. Przyspieszenie ruchu tego punktu przebicia daje nam pole elektryczne. Rozwiązanie to jest równie ścisłe, jak nasz początkowy wzór — jest ono po prostu jego przedstawieniem geometrycznym. Jeżeli weźmiemy stosunkowo powolny ruch, na przykład ruch oscylatora drgającego powoli z góry na dół, i przesuniemy go naprzód z prędkością światła, to otrzymamy oczywiście zwyczajną krzywą cosinusową. Dostajemy w ten sposób wzór, którego szukaliśmy od dawna: wzór na pole wytworzone przez drgający ładunek. Ciekawszy przykład stanowi elektron poruszający się po okręgu bardzo szybko, prawie z prędkością światła. Spoglądając na płaszczyznę koła, widzimy opóźnione x'(t) w postaci pokazanej na rys. 34.3. Co to jest za krzywa? Wyobraźmy sobie promień wychodzący od środka koła do ładunku ' przedłużmy tę linię radialną nieco poza ładunek (tylko odrobinę, jeżeli ruch jest szybki), tak aby dojść do punktu poruszającego się z prędkością światła po trochę większym okręgu. Dokonajmy teraz cofnięcia tego ruchu wstecz z prędkością światła. Będzie to równoważne umieszczeniu ładunku wewnątrz większego koła, które będzie się toczyć (bez poślizgu) ruchem wstecznym z prędkością światła. Krzywa będąca śladem na płaszczyźnie ładunku szty-
124 34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU —I— »■ __ JC3. Krzywa x' (r) dla cząstki poruszającej się po kole ze stalą szybkością v = 0,94 c wno związanego z toczącym się kołem będzie bardzo zbliżona do cykloidy - nazywamy ją cykloidą skróconą, a wykres jej będzie w naszym przypadku odwrócony w porównaniu z wykresami, jakie można znaleźć w podręcznikach matematyki. Jeżeli ładunek będzie się poruszał z prędkością światła, „zęby" krzywej będą bardzo ostre, gdyby zaś biegł on dokładnie z prędkością światła, wówczas „zęby" byłyby nieskończenie ostre, a krzywa na wykresie byłaby odwróconą cykloidą zwyczajną. Taka „nieskończona ostrość" jest czymś bardzo ciekawym. Oznacza ona, że w pobliżu zęba druga pochodna osiąga olbrzymią wartość. Raz na okres uzyskujemy więc ostrą pulsację pola elektrycznego. W ruchu nierela- tywistycznym efekt ten nie pojawia się wcale, bo w każdym obiegu ładunku uzyskujemy drgania o natężeniu w przybliżeniu stałym w czasie. Tutaj natomiast mamy bardzo ostre pulsację pola elektrycznego, oddzielone w czasie interwałami l/7*0, gdzie T0 jest okresem obiegu. Te silne pola elektryczne wysyłane są w wąskim stożku w kierunku ruchu ładunku. Gdy ładunek oddala się od punktu P, krzywizna staje się bardzo mała i w kierunku punktu P zostaje wypromieniowana bardzo niewielka część pola. 34-3. Promieniowanie synchrotronowe W synchrotronie elektrony poruszają się bardzo szybko po torach kołowych; biegną one z prędkością bardzo bliską c i można zobaczyć omawiane promieniowanie jako prawdziwe światlol Omówimy tę sprawę bardziej szczegółowo. W synchrotronie elektrony biegną dookoła po okręgach w jednorodnym polu magnetycznym. Zobaczymy najpierw, dlaczego poruszają się one właśnie po okręgach. Z równania (28.2) wiemy, że siła działająca na cząstkę w polu magnetycznym dana jest wzorem F = gvxB (34.6) i skierowana jest prostopadle do pola i do prędkości. Siła jest jak zwykle równa szybkości zmiany pędu w czasie. Jeżeli pole jest skierowane do góry, od kartki papieru, to pęd cząstki i siła na nią działająca są takie, jak pokazuje rys. 34.4. Ponieważ siła jest prostopadła do prędkości, energia kinetyczna, a więc i sama prędkość, pozostaje stała. Działanie pola magnetycznego polega tylko na zmianie kierunku ruchu. W krótkim odstępie czasu At
34-3. PROMIENIOWANIE SYNCHROTRONOWE 125 wektor pędu zmienia się w kierunku do siebie prostopadłym o wielkość Ap = F At i wobec tego obraca się o kąt A8-Apjp = qvBAtjp, ponieważ \F\=qvB. Ale w tym samym czasie cząstka przebywa odległość As = v At. Obie linie, AB i CD, przetną się oczywiście w takim punkcie O, że OA = OC=R, gdzie As=RA6. Wstawiając to. do poprzednich wyrażeń znajdujemy, że R A6/At = Rto = v = qvBR/p, skąd otrzymujemy p = qBR (34.7) oraz w = qvB/p. (34.8) Ponieważ to samo rozumowanie możemy przeprowadzić w następnej chwili i jeszcze następnej, i tak dalej, stąd wniosek, że cząstka musi się poruszać po okręgu o promieniu R z prędkością kątową co. Wynik mówiący, że pęd cząstki jest równy ładunkowi pomnożonemu przez promień j przez pole magnetyczne, stanowi bardzo ważne prawo, z którego często korzystamy. Jest ono ważne praktycznie, ponieważ obserwując w znanym polu magnetycznym cząstki elementarne obdarzone jednakowymi ładunkami, możemy zmierzyć promienie krzywizny ich orbit i określić w ten sposób ich pędy. Mnożąc obie strony równania (34.7) przez c i wyrażając ą przez ładunek elektronu, możemy mierzyć pęd w jednostkach zwanych elektronowoltami. W jednostkach tych wzór nasz wygląda następująco: Pc(eV) = 3-10a(qlqe)BR, (34.9) gdzie każda z wielkości B, R i prędkość światła została wyrażona w układzie mks, przy czym wartość ostatniej z nich jest równa 3 108. , Jednostką pola magnetycznego w układzie mks jest weber na metr kwadratowy (Wb/m2). Istnieje starsza jednostka, która jest nadal w powszechnym użyciu: nazywa się ją gausem (Gs). 1 Wb/m2 jest równy 10* Gs. Aby mieć pojęcie o wielkości pól magnetycznych, uprzy- tomnijmy sobie, że najsilniejsze pola magnetyczne, jakie zazwyczaj wytwarza się w żelazie, wynoszą 1,5-10* Gs; powyżej tej wartości posługiwanie się żelazem nie daje żadnych korzy- 34.4. Naładowana cząstka porusza się po kołowym (lub spiralnym) torze w jednorodnym polu magnetycznym 0 ""-^ R
126 34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU —- impuls od elektronu promieniowanie rozproszone przez siatkę 34.5. Światło padające na siatkę jako pojedynczy, ostry sygnał rozprasza się w rozmaitych kierunkach jako światło różnobarwne ści. Dzisiejsze elektromagnesy owinięte drutem nadprzewodzącym mogą wytworzyć trwałe pola o natężeniu ponad 105 Gs, tzn. 10 jednostek mks. Pole Ziemi na równiku wynosi kilka dziesiątych części gausa. Wracając do równania (34.9) wyobraźmy sobie synchrotron osiągający 109 eV, tak że wartość iloczynu pc wynosi 109 (za chwilę powrócimy do tej energii). Widzimy zatem, że gdyby wartość B odpowiadała np. 10 000 Gs, co stanowi bardzo pokaźne pole o natężeniu jednej jednostki mks, wówczas R musiałoby wynosić 3,3 m. Promień synchrotronu w Kalifornijskim Instytucie Techniki jest równy 3,7 m, pole jest nieco większe a energia wynosi 1,5-109, ale synchrotron działa w zasadzie tak samo, jak omawiany wyżej model. Mamy więc pewne pojęcie o tym, dlaczego synchrotron ma takie właśnie rozmiary. Obliczyliśmy tylko pęd, ale wiemy, że energia całkowita, włączając energię spoczynkową, dana jest wzorem W=\Jp2c2 + m2c*. Dla elektronu energia spoczynkowa równa mc2 wynosi 0,511-106eV, tak że gdy pc równa się 109 eV, możemy pominąć mc2 i dla wszystkich praktycznych celów przyjąć, że W=pc przy prędkościach relatywistycznych. Potwierdzenie, że energia elektronu wynosi 10' eV jest równoważne praktycznie powiedzeniu, że pęd razy c wynosi 109 eV. Jeśli W = 109 eV, łatwo pokazać, że prędkość różni się od prędkości światła tylko o jedną ośmiomilionową! Wracamy teraz do promieniowania wysyłanego przez taką cząstkę. Cząstka poruszająca się po okręgu o promieniu 3,3 m, czyli po 20-metrowym obwodzie, dokonuje jednego obiegu w mniej więcej takim czasie, jaki światłu zabiera przebycie 20 m. A więc długość fali, którą taka cząstka powinna wysyłać, będzie wynosić 20 m i znajdować się w dziedzinie krótkich fal radiowych. Ponieważ jednak pojawia się omawiane już poprzednio zjawisko „kumulacji'* (rys. 34.3), a promień musimy przedłużyć tylko o jedną ośmiomilionową, aby osiągnąć prędkość c, więc zęby cykloidy będą ogromnie ostre w porównaniu z odległościami między nimi. Przyspieszenie, zawierające drugą pochodną względem czasu, ulegnie dwa razy „czynnikowi ściskającemu", ponieważ skala czasu w sąsiedztwie zęba dwukrotnie zostanie zmniejszona osiem milionów razy. Powinniśmy więc oczekiwać, że efektywna fa'a
34-3. PROMIENIOWANIE SYNCHROTRONOWE 127 będzie znacznie krótsza, 64-1012 razy mniejsza od 20 m, co odpowiada obszarowi promieni rentgenowskich. (Prawdę mówiąc, sam ząb nie stanowi jedynego determinującego czynnika; trzeba uwzględnić także pewien obszar w jego okolicy. Dlatego też „czynnik ściskający" wystąpi w potędze 5, a nie w kwadracie, ale mimo to znajdziemy się powyżej obszaru optycznego.) Gdyby więc powoli poruszający się elektron promieniował nawet 20-metrową falę radiową, to i tak zjawiska relatywistyczne na tyle skurczą jej długość, że będziemy mogli ją zobaczyćl Światło powinno być oczywiście spolaryzowane; jego pole elektryczne będzie prostopadłe do jednorodnego pola magnetycznego. Aby zdać sobie lepiej sprawę z tego, co powinniśmy zobaczyć, skierujmy takie światło (dla uproszczenia sprawy weźmiemy po prostu jeden sygnał, ponieważ są one i tak bardzo rozsunięte w czasie) na siatkę dyfrakcyjną zbudowaną z bardzo wielu rozpraszających drutów. Co zobaczymy po przejściu sygnału przez siatkę? Wydawałoby się, że jeżeli w ogóle pojawi się jakieś światło, to powinno wystąpić całe jego widmo od barwy czerwonej do niebieskiej. Co jednak naprawdę zobaczymy? Sygnał czołowo uderza w siatkę i wszystkie jej oscylatory zostają razem gwałtownie pobudzone, a następnie wracają z powrotem do położenia równowagi, gdyż zachodzi to tylko raz. Efekty tego drgnięcia rozchodzą się następnie w różnych kierunkach, tak jak pokazuje rys. 34.5. Ponieważ zaś punkt P leży bliżej jednego końca siatki niż drugiego, do punktu tego dochodzi najpierw pole elektryczne od drutu A, następnie od drutu B i tak dalej; na koniec dochodzi wreszcie sygnał od ostatniego drutu. Krótko mówiąc, suma odbić od kolejnych drutów przedstawia się tak, jak widać z rys. 34.6a; jest to pole elektryczne składające się z szeregu drgań, bardzo przypominające falę sinusoidalną, której długością jest odległość między poszczególnymi sygnałami. Zjawisko przebiega tak, jak gdyby na siatkę padało światło jednobarwne! Otrzymujemy więc jak należy światło barwne! Czy jednak opierając się na tym samym rozumowaniu, nie powinniśmy otrzymywać światła z dowolnego rodzaju „drgnień"? Nie. Załóżmy bowiem, że krzywa jest znacznie gładsza i dodajmy razem wszystkie rozproszone fale, oddzielone od siebie krótkimi chwilami (rys. 34.6b). Widzimy, że pole nie skacze, wypadkowa krzywa jest bardzo gładka, ponieważ pojedyncze sygnały niewiele się zmieniają w przedziale czasu, który je od siebie oddziela. Promieniowanie elektromagnetyczne wysyłane przez naładowane relatywistyczne cząstki krążące w polu magnetycznym nazywamy promieniowaniem synchrotronowym. Pochodzenie tej nazwy jest oczywiste, ale zjawisko zachodzi nie tylko w synchrotronach czy w ogóle w ziemskich laboratoriach. Podniecające i ciekawe jest to, że zdarza się ono również w przyrodzie! 34.6. Całkowite pole elektryczne pochodzące od szeregu a) ostrych, b) łagodnych impulsów a) b)
128 34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU 34-4. Kosmiczne promieniowanie synchrotronowe W roku 1054 cywilizacja chińska i japońska należały do najbardziej rozwiniętych na Ziemi. Chińczycy i Japończycy interesowali się zjawiskami w otaczającym wszechświecie i w tym właśnie roku w najbardziej godny uwagi sposób zanotowali pojawienie się wybuchającej, błyszczącej gwiazdy. (Żadnemu zaś z europejskich mnichów piszących średniowieczne księgi nie przyszło do głowy zapisanie, że na niebie wybuchła gwiazda. Jest to zastanawiające, ale tak rzeczywiście było.) Jeszcze dzisiaj możemy sfotografować tę gwiazdę i to, co zobaczymy, pokazano na fot. 34.7. Na zewnątrz mamy dużą masę czerwonych włókien, wytworzoną przez atomy rzadkiego gazu „dźwięczące" ze swoimi naturalnymi częstościami; dają one jasne widmo z prążkami odpowiadającymi różnym częstościom. Czerwień, jak się okazuje, pochodzi w tym wypadku z azotu. Z drugiej strony, w środkowym obszarze mamy tajemniczą zamazaną plamę świetlną, dającą ciągły rozkład częstości, to znaczy pozbawioną szczególnych częstości związanych z określonymi atomami. Nie jest to jednak pył „prześwietlony" przez pobliskie gwiazdy, co mogłoby tłumaczyć pochodzenie widma ciągłego. Możemy widzieć przez niego gwiazdy, a więc jest przezroczysty, chociaż wysyła światło. Na fotografii 34.8 widzimy ten sam obiekt w świetle z takiej części widma, która nie zawiera żadnej jasnej linii widmowej, widać więc tylko obszar centralny. Ale w teleskopie zostały tym razem umieszczone polaryzatory i dwa pokazane zdjęcia odpowiadają dwóm wzajemnie prostopadłym ustawieniom polaryzatorów. Widzimy, że zdjęcia są różne! Wnioskujemy stąd, że światło jest spolaryzowane. Przyczyną zjawiska jest prawdopodobnie lokalne pole magnetyczne, w którym kręci się wiele elektronów o dużej energii. 34.7. Mgławica Krab widziana we wszystkich barwach (bez filtru). (Ilustracje 34.7, 34.11-34.13 zostały przedrukowane z pozwoleniem z pracy. Goldsmith, Sensory Communications, pod red. W. A. Rosen- blitha, Copyright 1961, Massachusetts Institute of Technology)
)4-4. KOSMICZNE PROMIENIOWANIE SYNCHROTRONOWE 129 34.8. Mgławica Krab widziana przez niebieski filtr i polaroid, a) Wektor elektryczny pionowy, b) wektor elektryczny poziomy Wyjaśniliśmy przed chwilą, w jaki sposób elektrony mogą obiegać pole po okręgu. Możemy naturalnie do tego dodać dowolny ruch jednostajny w kierunku pola, ponieważ siła <7?xB nie ma składowej w tym kierunku i jak już zauważyliśmy, promieniowanie synchrotronowe jest wyraźnie spolaryzowane w kierunku prostopadłym do rzutu pola magnetycznego na płaszczyznę obserwacji. Łącząc oba te fakty, wnioskujemy, że w obszarze, gdzie pierwszy obraz jest jasny, a drugi czarny, pole elektryczne światła musi być całkowicie spolaryzowane w określonym kierunku. Znaczy to, że istnieje tam pole magnetyczne prostopadłe do tego kierunku, podczas gdy w innych obszarach, gdzie mamy silną emisję widoczną na drugim rysunku, pole magnetyczne musi mieć inny kierunek. Spoglądając uważnie na fot. 34.8 możemy wyróżnić na niej, z grubsza biorąc, układ „linii" ustawionych w pewnym kierunku na pierwszym zdjęciu, a prostopadłych do niego na drugim. To, co widzimy na obrazie, ma budowę włóknistą. Linie pola magnetycznego rozciągają się na stosunkowo duże odległości w kierunku pola i stąd prawdopodobnie istnieją duże obszary pola magnetycznego, w których elektrony kręcą się w jedną stronę, podczas gdy w innych obszarach, w których pole skierowane jest inaczej, elektrony kręcą się w drugą stronę. Co utrzymuje energię elektronów na tak wysokim poziomie przez tak długie okresy czasu? Upłynęło już przecież 900 lat od wybuchu gwiazdy - jak mogą one nadal jeszcze Pozostawać w tak szybkim ruchu? Przyczyna, dzięki której utrzymują one swoją energię 1 cała rzecz pozostaje wciąż w ruchu, nie jest jeszcze zupełnie jasna. **-5. Promieniowanie hamowania Wspomnimy teraz krótko o innym ciekawym zjawisku, mianowicie o promieniowaniu energii przez szybko poruszającą się cząstkę. Idea jest bardzo podobna do tego, co przed chwilą omawialiśmy. Wyobraźmy sobie bardzo szybki elektron, który przechodzi w pobliżu "aładowanych jąder (rys. 34.9). Na skutek istnienia pola elektrycznego wokół jądra ato-
130 34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANI J • jądro a) b) 34.9. Szybki elektron prttchoózący w pobliżu jądra promieniuje energię w kierunku swego ruchu mowego na elektron działa siła i zostaję on tak przyspieszony, że jego tor wykazuje lekkie skręcenie albo ugięcie. Jakie pole elektryczne zostanie wytworzone w kierunku C, jeżeli elektron będzie się poruszał prawie z prędkością światła? Przypomnijmy sobie naszą regułę: bierzemy rzeczywisty ruch, cofamy go z prędkością c i to daje nam krzywą, której krzywizna jest miarą pola elektrycznego. Elektron biegł do nas z prędkością v, a więc wsteczny ruch daje obraz ściśnięty w takim stosunku, w jakim c—v ma się do c. Jeśli więc 1— v/c<s:\, w punkcie B' pojawi się ostra, gwałtowna krzywizna i biorąc w tym punkcie drugą pochodną otrzyma się bardzo wielkie pole w kierunku ruchu. Tak więc bardzo energiczne elektrony poruszając się przez materię wyrzucają ku przodowi promieniowanie. Nazywa się je promieniowaniem hamowania. Warto zauważyć, że synchrotronu używa się nie tyle do otrzymywania elektronów o wielkiej energii (nie mówilibyśmy zresztą o tym, gdyby istniał wygodniejszy sposób ich produkcji), ile do otrzymywania fotonów o wielkiej energii — promieni gamma. Przepuszczając mianowicie elektrony o dużej energii przez masywną „tarczę" wolframową, zmusza się je do promieniowania fotonów, właśnie na skutek zjawiska hamowania. 34-6. Zjawisko Dopplera Przechodzimy teraz do omówienia niektórych przykładów zjawisk spowodowanych ruchem źródeł promieniowania. Załóżmy, że źródłem tym jest stacjonarny atom, drgający zjedna ze swoich częstości własnych a>0. Częstość obserwowanego wtedy przez nas światła też będzie, jak wiemy, wynosiła coc. Jako drugi przykład weźmy inny podobny oscylator drgający z częstością a>,, który w całości przesuwa się z prędkością v w kierunku do obserwatora. Jego rzeczywisty ruch w przestrzeni wygląda wtedy oczywiście tak, jak pokazuje rys. 34.10a. Posługujemy się teraz naszym zwykłym chwytem - dodajemy er, to znaczy, cofamy całą krzywą i stwierdzamy, że oscyluje ona tak, jak na rys. 34.10b. W czasie 7, w którym oscylator przebyłby odległość vr, na wykresie x' względem et przesuwa się on o odległość (c—v)t. Wszystkie drgania o częstości wv w czasie Ar odnajdują się więc teraz w przedziale At=(\ —v/c) Ar; są one ściśnięte razem i gdy krzywa taka przybywa do nas z prędkością c, widzimy światło o wyższej częstości, wyższej mianowicie o współczynnik ;r~;t„;»,*■,v n _»iM Ohsenvuiemv wiec częstość
34-6, ZJAWISKO DOPPLERA 131 l-»/c (34.10) Sytuację tę możemy oczywiście analizować na liczne inne sposoby. Załóżmy, że zamiast fal sinusoidalnych atom wysyła serię sygnałów: pip, pip, pip, pip — z pewną częstością a>,. Z jaką częstością byłyby one przez nas odbierane? Pierwszy dochodzący sygnał ulega pewnemu opóźnieniu, ale następny jest opóźniony mniej, ponieważ w tym czasie atom zbliżył się do odbiornika. A więc czas między „piśnięciami" na skutek ruchu się zmniejsza. Analizując stosunki geometryczne tej sytuacji stwierdzamy, że częstość piśnięć wzrasta o czynnik 1/(1 -f/c). Czy zatem co = coQl(\ —vjc) jest obserwowaną częstością zwykłego atomu o naturalnej częstości to0, poruszającego się w kierunku odbiornika z prędkością vi Nie, bo dobrze wiemy, że z powodu relatywistycznego wydłużenia szybkości upływania czasu naturalna częstość a>i poruszającego się atomu nie jest taka sama, jak częstość co0 zmierzona w spoczynku. Jeżeli więc a>0 jest prawdziwą, naturalną częstością, zmodyfikowana częstość naturalna jest równa ' """ (34.11) )l=(o0\/l —v2lc2 Stąd obserwowana częstość co wynosi 2/„2 ,Vl-»2/c 1-p/c (34.12) Obserwowane w tych warunkach przesunięcie częstości nazywamy zjawiskiem Dopplera: jeśli jakiś obiekt porusza się w naszą stronę, to wysyłane przezeń światło wydaje się bardziej fioletowe, a gdy obiekt oddala się od nas, wydaje się ono bardziej czerwone. Podamy teraz dwa dalsze wyprowadzenia tego samego ciekawego i ważnego wyniku. Załóżmy, więc że źródło znajduje się w spoczynku i wysyła fale o częstości coQ, a obserwator porusza się z prędkością v w stronę źródła. Po upływie czasu t obserwator przesunie się do nowego położenia odległego ovt od położenia w chwili 7 = 0. Jaka będzie zaobserwowana przez niego faza (w radianach) mijającej go fali? W dowolnym ustalonym punkcie w czasie 7 faza zmieni się o oj0t, a ponadto na skutek swego własnego ruchu obserwator dojdzie do 34.10. Krzywe x — z oraz x' — t dla poruszającego się oscylatora A' a) -(c-v)t b) B' et
132 34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU » punktu, w którym faza w porównaniu z punktem wyjścia będzie zmieniona o liczbę vtk0 (liczbę radianow na metr razy odległość). Tak więc całkowite przesunięcie fazy względem obserwatora w czasie /, mierzone w radianach, czyli obserwowana częstość, wyniesie col=co0 + k0v. Analizy tej dokonaliśmy jednak z punktu widzenia obserwatora spoczywającego, chcielibyśmy zaś wiedzieć, jak ona wygląda dla obserwatora poruszającego się. Musimy znowu wziąć pod uwagę różnicę w biegu zegarów u obu obserwatorów, co tym razem oznacza, że częstość musimy dzielić przez vi —v2jc2. Jeśli więc k0 jest liczbą falową, liczbą radianow na metr w kierunku ruchu, a co0 jest częstością, obserwowana częstość dla poruszającego się obserwatora wyniesie i~nl: :< CO0 + k0V VI-u/c Wiemy, że dla światła k9=><o0/c. W tym więc szczególnym zagadnieniu równanie to przyjmie postać VoV+v/c) ...... a>= r , ~ , (34.14) zupełnie niepodobną do postaci wzoru (34.12)! Czyżby częstość, którą obserwujemy poruszając się w kierunku źródła, była różna od częstości obserwowanej, gdy źródło się do nas przybliża? Oczywiście, że nie! Teoria względności mówi nam, że obie te częstości muszą być dokładnie równe. Gdybyśmy byli wystarczająco biegłymi matematykami, poznalibyśmy pewnie, że oba te wyrażenia matematyczne są dokładnie sobie równe! Konieczna równość obu wyrażeń jest rzeczywiście jednym ze sposobów, za których pomocą wykazuje się, że względność wymaga wydłużenia czasu, ponieważ gdybyśmy nie wstawili tam czynników pierwiastkowych, wyrażenia te nie byłyby już sobie równe. Skoro wiemy coś o teorii względności, zanalizujmy nasze zjawisko jeszcze inną metodą, która wydawać się może nieco bardziej ogólna (naprawdę nie jest to nic nowego, ponieważ sposób postępowania nie jest istotny!). Zgodnie z teorią względności istnieje związek między położeniem i czasem obserwowanym przez jednego człowieka, a położeniem i czasem obserwowanym przez innego człowieka, poruszającego się względem pierwszego. Związki te wypisaliśmy sobie już w cz. 1 (rozdz. 16). Jest to przekształcenie Lorentza i jego odwrotność: , X + Vt X —Vt' X ——. = , X = Vi-»V' vW/c2' (3415) t + vxlc2 t'-vx'/c2 Gdybyśmy pozostawali w spoczynku na Ziemi, fala miałaby kształt cos(wt-kx); położenia wszystkich węzłów, maksimów i minimów zgadzałyby się z tym wzorem. Co jednak zobaczyłby poruszający się człowiek obserwując tę samą fizyczną falę? Punkty zerowania się pola, czyli położenia wszystkich węzłów, muszą być takie same dla obu obserwatorów (pole jest zerowe dla każdego obserwatora). Jest to niezmiennik relatywistyczny.
34-6. ZJAWISKO DOPPLERA 133 A więc dla drugiego człowieka fala ma taką samą postać, z tym że musi on ją opisać w swym układzie odniesienia: . . . i i -vj. /r cosf , v T i'-vx'lc2 x'-vt' 1 ; (coi — kx) = cos co , — — k —==: L y/l-V2lc2 Vl-^/c2J Jeśli przegrupujemy wyrazy wewnątrz nawiasu, otrzymamy [to + kv k + vco/c2 1 , t , x = Vl-ttV y/l-v'lc2 J = cos[ co' t'- k' x']. (34.16) Znowu jest to fala, fala cosinusowa, w której występuje pewna częstość co' jako współczynnik przy t' oraz pewna inna stała k', jako współczynnik przy x'. Stałą k' nazywamy liczbą falową albo liczbą fal na metr, w nowym układzie odniesienia. Drugi człowiek zmierzy więc nową częstość i nową liczbę falową dane wzorami: co + kv «>'=7=== (34.17) Vl-V/c2 k + covlc2 k'= -7=4=;. (34.18) Vl-t;2/c2 Jeśli spojrzymy na wzór (34.17), stwierdzimy, że jest to znany wzór (34.13), który wtedy wyniknął z bardziej fizycznego rozumowania. 34-7. Czterowektor k, co Związki dane równaniami (34.17) i (34.18) są bardzo ciekawe, ponieważ mówią, że nowa częstość to' jest kombinacją dawnej częstości co i dawnej liczby falowej k, nowa zaś liczba falowa k' jest kombinacją dawnej liczby falowej i dawnej częstości. Liczba falowa jest, jak wiemy, miarą zmiany fazy z odległością, a częstość - miarą zmiany fazy w czasie. W wyrażeniach tych dostrzegamy ścisłą analogię z przekształceniem Lorentza dla położenia i czasu: jeśli wyobrazimy sobie, że a> jest czymś w rodzaju t, a k jest czymś podobnym do x podzielonego przez c2, to wówczas nowe co' będzie czymś w rodzaju t', a k' czymś podobnym do x'jc2. Dokładniej możemy to sformułować mówiąc, że przy przekształceniu Lorentza w i k transformują się w taki sam sposób, jak t i x. Tworzą one razem wielkość, którą nazywamy czterowektorem; każda bowiem wielkość, która ma cztery składowe transformujące S'C tak jak czas i przestrzeń, jest czterowektorem. Wydaje się więc, że wszystko jest w porządku, z wyjątkiem jednej drobnej rzeczy: powiedzieliśmy, że czterowektor musi mieć cztery składowe. Gdzie są zatem dwie pozostałe? Stwierdziliśmy, że co i k są podobne do czasu 1 Przestrzeni dla jednego kierunku przestrzennego, a nie dla wszystkich i dlatego musimy zaraz zbadać zagadnienie rozchodzenia się światła w trzech kierunkach przestrzennych, a nie tylko w jednym, jak to dotąd robiliśmy. Załóżmy, że mamy układ współrzędnych x, y, z i rozchodzącą się falę, której czoła
134 34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU pokazano na rys. 34.11. Długość fali wynosi k, ale kierunek rozchodzenia się fali nie jest zgodny z kierunkiem żadnej osi. Jakim wzorem opisywana jest taka fala? Oczywista odpowiedź brzmi: cos (cot -ks), gdzie k = 2n/k, a s jest odległością mierzoną wzdłuż kierunku rozchodzenia się fali, czyli składową położenia przestrzennego w kierunku ruchu. Ujmijmy to w taki sposób: gdy r jest wektorem położenia punktu w przestrzeni, wtedy s — rek, gdzie et oznacza jednostkowy wektor w kierunku ruchu. Oznacza to, że s jest równe r cos (r, ek), czyli składowej odległości w kierunku ruchu. Tak więc nasza fala ma postać cos (cot — kek -r). Bardzo wygodną rzeczą jest zdefiniowanie wektora k, który nazywamy wektorem falowym, a który ma długość równą liczbie falowej 2tt/A i kierunek zgodny z kierunkiem rozchodzenia się fali: 34.11. Fala płaska rozchodząca się ukośnie k = 2nek/k = kek . (34.19) Posługując się tym wektorem możemy zapisać naszą falę jako cos(a>7— kr) albo jako cos (cot—kxx — kyy-kzź). Jakie znaczenie mają poszczególne składowe wektora k, np. składowa-? Oczywiście, składowa —jest miarą zmiany fazy w zależności od x. Na rysunku 34.11 widzimy, że przy zmianie x fala zmienia się tak, jak gdyby w kierunku osi x rozchodziła się fala o większej długości. „Długość fali w kierunku osi x" jest większa od naturalnej, prawdziwej długości fali, a ich stosunek jest równy sekansowi kąta a między właściwym kierunkiem rozchodzenia się fali a osią x: kx = A/cos a.. (34.20) A więc szybkość zmiany fazy proporcjonalna do odwrotności kz jest mniejsza o czynnik cos a. Składowa kx będzie się zmieniać jak długość wektora k pomnożona przez cosinus kąta między wektorem k a osią x\ Na tym właśnie polega istota wektora falowego, którym się posługujemy w przedstawianiu fali w trzech wymiarach. Cztery wielkości: co, kx, ky, kz transformują się w teorii względności jak czterowektor, przy czym a> odpowiada czasowi, a kx, ky i kt odpowiadają składowym x, y i z czterowektora. Omawiając poprzednio szczególną teorię względności (t. I, cz. 1, rozdz. 17) dowiedzieliśmy się, że można tworzyć relatywistyczne iloczyny skalarne czterowektorów. Jeśli posługujemy się wektorem położenia x„, gdzie wskaźnik n przyjmuje cztery wartości odpowiadające czterem składowym (czasowej i trzem przestrzennym) i jeśli wektor falowy oznaczymy k„, gdzie wskaźnik fi ma znowu cztery wartości: czasową i trzy przestrzenne, iloczyn skalarny czterowektorów x„ i — zapisuje się jako £'—x„ (patrz rozdz. 17). Taki iloczyn skalarny jest pewnym niezmiennikiem niezależnym od układu współrzędnych. Ile
34-7. CZTEROWLKTOR k, u, 135 on wynosi? Z definicji iloczynu skalarnego w czterech wymiarach wynika, że Y!k^x,, =(i)t-kxx-kyy-kz 2 . (34.21) Z naszych studiów nad wektorami wiemy, że ^'/c^x^ jest niezmiennikiem przekształcenia Lorentza, ponieważ A„ jest czterowektorem. Wielkość ta stanowi zaś dokładnie argument cosinusa dla tali płaskiej, który musi być niezmiennikiem przekształcenia Lorentza. We wzorach nie mogą występować zmienne wielkości w argumencie cosinusa, ponieważ faza fali nie może, jak wiadomo, zależeć od zmiany układu współrzędnych. 34-8. Aberracja Przy wyprowadzaniu równań (34.17) i (34.18) rozważaliśmy prosty przykład, w którym wektor k pokrywał się z kierunkiem ruchu, ale oczywiście możemy to uogólnić i na inne przypadki. Weźmy na przykład źródło, które wysyła światło w danym kierunku, z punktu widzenia jakiegoś człowieka spoczywającego, podczas gdy my poruszamy się na przykład razem z Ziemią (rys. 34.12). Jak się nam wydaje, z jakiego kierunku przychodzi wówczas światło? Aby na to odpowiedzieć, powinniśmy wypisać cztery składowe &„ i zastosować przekształcenie Lorentza. Odpowiedź można jednak znaleźć też za pomocą następującego rozumowania: aby ujrzeć światło, musimy nasz teleskop ustawić pod pewnym kątem. Dlaczego? Ponieważ światło pada z góry z prędkością c, a my poruszamy się w bok z szybkością v, zatem teleskop musi być pochylony do przodu, aby światło biegnące w dół przechodziło „prosto" przez rurę. Bardzo łatwo stwierdzić, że pozioma odległość wynosi vt, pionowa zaś jest et i stąd, jeśli 9' jest kątem nachylenia, tg9' = v/c. Prawda, jaki to ładny wynik? Rzeczywiście, wynik jest bardzo ładny - z wyjątkiem „jednego małego ale": 9' nie jest kątem, pod jakim powinniśmy ustawić teleskop względem Ziemi, ponieważ analizy dokonaliśmy z punktu widzenia „unieruchomionego" obserwatora. Gdy my mówiliśmy, że odległość pozioma wynosi vt, człowiek na Ziemi znalazł inną odległość, ponieważ mierzył za pomocą „ściśniętej" linijki. Okazuje się, że z powodu tego efektu skrócenia tg 0=--—==, (34.22) vi-pV c° jest równoważne sin 0 = d/c. (34.23) Pouczającym ćwiczeniem dla czytelnika będzie wyprowadzenie tego wyniku przy użyciu Przekształcenia Lorentza. Fakt, że teleskop musi być pochylony, jest s*utkiem zjawiska, które nazywamy aberracją, 34.12. Odległe źródło S' oglądane przez a) nieruchomy teleskop, b) teleskop poruszający się poprzecznie \i a) b) n i l' ifi U ij, V 7' A 1 l -7 / /
136 34. RELATYWISTYCZNE EFEKTY W PROMIENIOWANIU i rzeczywiście zjawisko to jest obserwowane. W jaki jednak sposób można je w ogóle zaobserwować? Kto może powiedzieć, gdzie powinna znajdować się dana gwiazda? Przyjmijmy, że rzeczywiście, powinniśmy patrzeć w niewłaściwym kierunku, aby zobaczyć gwiazdę. Skąd się możemy dowiedzieć, że kierunek ten jest niewłaściwy? Stąd, że Ziemia obiega Słońce dookoła. Dzisiaj musimy skierować teleskop w jedną stronę, po sześciu miesiącach będziemy musieli skierować go w drugą stronę. W ten sposób możemy się przekonać, że efekt rzeczywiście istnieje. 34 9. Pęd światła Przechodzimy teraz do innego tematu. W ostatnich kilku rozdziałach nie mówiliśmy nic o działaniu pola magnetycznego związanego ze światłem. Działanie pola magnetycznego jest zazwyczaj bardzo małe, powoduje jednak pewne ciekawe i ważne zjawisko. Załóżmy, że światło przychodzące ze źródła działa na ładunek poruszając nim tam i z powrotem. Przyjmijmy, że pole elektryczne ma kierunek x, tak że ruch ładunku odbywa się również w kierunku x. Niech ładunek ma pewne położenie x i pewną prędkość v pokazaną na rys. 34.13. Pole magnetyczne jest prostopadłe do pola elektrycznego. Zapytajmy teraz, co robi pole magnetyczne, gdy pole elektryczne działa na ładunek poruszając nim tam i z powrotem? Pole magnetyczne działa na ładunek (niech to będzie elektron) tylko wtedy, gdy jest on w ruchu, a elektron właśnie się porusza, gdyż jest on pobudzany przez pole elektryczne. Oba pola działają więc razem: gdy ciało porusza się tam i z powrotem, ma różną od zera prędkość i działa nań siła, której długość wynosi B razy v razy q; ale jaki jest jej kierunek? Działa ona w kierunku rozchodzenia się światła. Gdy zatem światło pada na ładunek, który zaczyna drgać reagując na pole, pojawia się pchająca siła w kierunku wiązki świetlnej. Nazywa się ją ciśnieniem promieniowania albo ciśnieniem światła. Wyznaczmy teraz wielkość ciśnienia promieniowania. Wynosi ono oczywiście F=qvB, a ponieważ wszystko drga, jest ona raczej średnią czasową tego wyrażenia: <F>. Ze wzoru (34.2) wynika, że natężenie pola magnetycznego jest równe natężeniu pola elektrycznego podzielonemu przez c, trzeba więc znaleźć średnią pola elektrycznego razy prędkość, razy ładunek, razy l/c: <F> = ^<f£>/c. Ładunek q pomnożony przez pole E stanowi siłę elektryczną działającą na ten ładunek, a siła działająca na ładunek pomnożona przez prędkość jest pracą dWjdt wykonaną na ładunku! A więc siła, „pęd pchający", przenoszony przez światło w ciągu sekundy, jest równa l/c razy energia pochłonięta ze światła w jednej sekundzie! Ta reguła jest ogólna, ponieważ nic nie mówiliśmy, jak silny był oscylator ani że niektóre ładunki się znosiły. W dowolnych warunkach, gdy światło jest pochłaniane, pojawia się ciśnienie. Pęd przenoszony 34.13. Siła magnetyczna działająca na ładunek poruszany przez pole w kierunku wiązki światła v ,\
34-9. PĘD ŚWIATŁA 137 przez światło jest zawsze równy pochłanianej energii podzielonej przez prędkość c: dWjdt <F>=^-. (34.24) c To, że światło niesie energię, wiedzieliśmy już przedtem. Teraz widzimy, że niesie ono także pęd i że jest on zawsze równy energii razy l/c. Gdy światło emitowane jest ze źródła, następuje zjawisko odrzutu; coś analogicznego do omawianego poprzednio zjawiska zachodzącego w odwrotną stronę. Jeśli atom wysyła w pewnym kierunku energię W, to istnieje wówczas pęd odrzutu p = W je. Jeśli światło zostaje odbite prostopadle od zwierciadła, siła zostaje podwojona. Tyle możemy powiedzieć opierając się na klasycznej teorii światła. Wiemy oczywiście, że istnieje teoria kwantowa i że pod wieloma względami światło działa jak cząstka. Energia cząstki świetlnej jest równa stałej razy częstość: W = hv = hco. (34.25) Wiemy już, że światło niesie pęd równy energii podzielonej przez c, musi więc być prawdą, że owe efektywne cząstki, fotony, niosą pęd: p=Wlc = h(olc = hk. (34.26) Kierunkiem pędu jest oczywiście kierunek rozchodzenia się światła. Posługując się zapisem wektorowym mamy więc W = hco, p = ftk. (34.27) Wiemy również, że energia i pęd powinny oczywiście tworzyć czterowektor. Odkryliśmy właśnie, że co i k tworzą czterowektor. Dobrze się więc składa, że we wzorach (34.27) występują te same stałe; znaczy to, że teoria kwantowa i teoria względności są wzajemnie zgodne. Równanie (34.27) można zapisać w bardziej eleganckiej postaci jako p^ — hk^, relatywistyczne równanie dla cząstki stowarzyszonej z falą. Omówiliśmy je tylko dla fotonów, dla których k (długość wektora k) jest równe co/c a p—W/c, ale związek ten jest znacznie ogólniejszy. W mechanice kwantowej wszystkie cząstki, nie tylko fotony, przejawiają własności falowe, a częstość fali i liczba falowa wiążą się z energią i pędem przy pomocy wzorów (34.27) (zwanych wzorami de Broglie'a) nawet wtedy, gdy p nie jest równe Wjc. Dowiedzieliśmy się z ostatniego rozdziału, że wiązka światła spolaryzowanego kołowo prawo- lub lewoskrętnie niesie także moment pędu w ilości proporcjonalnej do energii & fali. W obrazie kwantowym wiązka kołowo spolaryzowanego światła uważana jest za strumień fotonów, z których każdy niesie moment pędu równy ±h i skierowany równolegle do kierunku rozchodzenia się. Taki właśnie sens ma polaryzacja z korpuskularnego punktu widzenia - fotony niosą moment pędu podobnie jak wirujące pociski karabinowe. W rzeczywistości jednak „pociskowy" obraz jest równie niekompletny jak obraz „falowy" i przedstawione tu idee będziemy musieli omówić bardziej obszernie w dalszym rozdziale Poświęconym zjawiskom kwantowym (rozdz. 37).
35 widzenie barwne 35-1. Oko ludzkie Zjawiska barwne częściowo należą do świata fizyki. Omawiamy przecież barwy blonek mydlanych i tym podobne efekty, powstające na skutek interferencji. Zjawiska te ponadto zależą oczywiście od oka albo raczej od.tego, co się dzieje za okiem, w mózgu. Fizyka opisuje światło wchodzące do oka, a następujące potem nasze wrażenia są wynikiem reakcji fotochemicznonerwowych i psychologicznych. Istnieje wiele ciekawych zjawisk wzrokowych, w których występują zarówno procesy fizyczne, jak i fizjologiczne, i aby w pełni zrozumieć naturalne zjawisko widzenia, musimy wyjść poza obręb fizyki w zwykłym sensie tego słowa. Takie wypady w inne dziedziny wiedzy są zupełnie usprawiedliwione, ponieważ sam podział zjawisk na różne dziedziny następuje, jak to już podkreślaliśmy, tylko ze względu na ludzką wygodę i jest w gruncie rzeczy nienaturalny. Nasze podziały nie obchodzą przyrody i wiele ciekawych zjawisk — to pomosty między różnymi dziedzinami. Już w rozdz. 3 (t. I, cz. 1) omówiliśmy z grubsza stosunek fizyki do innych nauk przyrodniczych. Teraz zajmiemy się dokładniej pewną szczególną dziedziną, która wiąże ściśle fizykę z innymi naukami. Dziedziną tą jest widzenie. W szczególności omówimy widzenie barwne. W rozdziale tym omówimy przede wszystkim obserwowalne przejawy ludzkiego widzenia, a w rozdziale następnym będziemy rozważali fizjologiczne aspekty widzenia u ludzi i u zwierząt. Cały proces widzenia ma swój początek w oku, musimy więc najpierw czegoś się o nim dowiedzieć, aby zrozumieć jak właściwie przebiega całe zjawisko. W następnym rozdziale będziemy dość szczegółowo omawiali działanie różnych części oka i ich wzajemne połączenia z układem nerwowym. Obecnie tylko w skrócie opiszemy jak działa oko (rys. 35.1)- Światło wchodzi do oka przez rogówkę i w znany nam już sposób zostaje załamane
35-1. OKO LUDZKIE 139 - tworząc obraz w tylnej części oka na warstwie zwanej siatkówką - tak, że na różne części siatkówki pada światło z różnych części zewnętrznego pola widzenia. Siatkówka nie jest ściśle jednorodna: w środku naszego pola widzenia znajduje się miejsce, plamka, którą się posługujemy, gdy chcemy coś zobaczyć bardzo dokładnie. W miejscu tym mamy największą ostrość widzenia; nazywa się je dołkiem środkowym albo plamką żółtą. Własne doświadczenie mówi nam od razu, że przy oglądaniu przedmiotów boczne części oka nie są tak sprawne w rozróżnianiu szczegółów, jak jego środek. Na siatkówce znajduje się też plamka, z której wychodzą nerwy przenoszące wszystkie informacje; jest to plamka ślepa. Siatkówka w tym miejscu nie jest czuła, co można pokazać zamykając np. lewe oko i kierując wzrok w jakiś punkt położony na wprost nas. Przesuwając jakiś niewielki obiekt, np. palec, powoli poza pole widzenia, zauważamy, że znika on gdzieś nagle. Zjawisko to zostało praktycznie wykorzystane chyba tylko wtedy, gdy pewien fizjolog pokazał je królowi Francji, stając się dzięki temu jego faworytem. W czasie nudnych posiedzeń ze swymi dworzanami król mógł się zabawiać „obcinaniem im głów" - patrząc na jednego z dworzan śledził znikanie głowy drugiego. Na rysunku 35.2 widać w nieco schematycznej postaci powiększony obraz wnętrza siatkówki. W poszczególnych częściach siatkówki znajdują się struktury różnego rodzaju. Obiekty gęściej występujące w pobliżu brzegów siatkówki nazywamy pręcikami. Bliżej dołka środkowego obok komórek pręcikowych znajdujemy także komórki czopkowe. Budowę tych komórek opiszemy później. W miarę zbliżania się do dołka liczba czopków wzrasta i w samym dołku są już tylko komórki czopkowe ułożone tak ciasno, że są one tutaj o wiele cieńsze lub węższe niż gdzie indziej. Stwierdzamy więc, że w samym polu widzenia widzimy za pomocą czopków, w miarę zaś przesuwania się do brzegów pojawiają się inne komórki - pręciki. Ciekawe, że w siatkówce żadna komórka światłoczuła nie jest połączona włóknem bezpośrednio z nerwem wzrokowym, ale z wielu innymi komórkami, które z kolei są połączone z sobą. Istnieją różne rodzaje komórek: komórki, które przenoszą informacje do nerwu wzrokowego, i inne, które przede wszystkim są połączone 35.1. Oko soczewka ciało wodniste więzadło 111 soczewki II naczyniówka \x^ twardówka fce£j3»A; ciało lir . rogówka i-L ♦ - i. ^ 12>v. tęczówka f, «\ micsień JI soczewki , szkliste jf / JrJ- siatkówka plamka zólta nerw wzrokowy
140 35. WIDZENIE BARWNE 35.2. Budowa siatkówki (światło wchodzi od dołu) wzajemnie „poziomo". Rodzajów komórek jest w zasadzie cztery, ale nie będziemy teraz wchodzić w te szczegóły. Podkreślamy tylko najważniejszą rzecz, że sam sygnał świetlny zostaje „przemyślany". Znaczy to, że informacje z rozmaitych komórek nie przechodzą od razu do mózgu, ale że pewna ich ilość zostaje w siatkówce przetworzona dzięki złożeniu informacji z szeregu receptorów wzrokowych. Bardzo ważne jest zrozumienie, że pewne zjawiska typu mózgowego zachodzą już w samym oku. 35-2. Barwa zależy od natężenia światła Jednym z najbardziej uderzających zjawisk wzrokowych jest przystosowanie się oka do ciemności. Jeśli przejdziemy z jasno oświetlonego pokoju do ciemnego, przez chwilę widzimy źle, ale stopniowo przedmioty stają się coraz bardziej widoczne i w końcu możemy coś zobaczyć tam, gdzie przedtem nie było widać niczego. Jeśli natężenie światła jest bardzo małe, widziane przez nas przedmioty nie mają barwy. Wiadomo, że to widzenie zmierzchowe zawdzięczamy prawie wyłącznie pręcikom, podczas gdy widzenie w pełnym świetle zawdzięczamy czopkom. Takie przekazywanie czynności czopków i pręcików razem wziętych samym pręcikom pozwala nam łatwo zrozumieć szereg zjawisk. W wielu sytuacjach moglibyśmy widzieć barwy, gdyby natężenie światła było większe. Przekonalibyśmy się wtedy, że efekty te są bardzo ładne. Tak na przykład przez teleskopy prawie zawsze widzimy „biało-czarne" obrazy słabych mgławic, ale W. C. Miller z obserwatoriów na Mt. Wilson i Mt. Palomar miał dość cierpliwości na to, aby wykonać barwne zdjęcia niektórych z tych mgławic. W rzeczywistości nikt nigdy nie widział tych barw gołym okiem, ale nie są one sztuczne, po prostu natężenie światła nie jest dość silne na to, aby czopki w naszym oku moeły na nie zareagować. Wśród najbardziej efektownych obiektów
35-2. BARWA ZALEŻY OD NATĘŻENIA ŚWIATŁA 141 tego rodzaju są: mgławica pierścieniowa i mgławica Krab. Pierwsza ma na zdjęciu piękną niebieską część wewnętrzną z zewnętrzną jasnoczerwoną aureolą, a druga ukazuje ogólnie niebieskawą mgiełkę, przetykaną jasnymi czerwonopomarańczowymi włóknami. W pełnym świetle pręciki prawdopodobnie wykazują bardzo małą czułość, ale w świetle zmierzchowym zwiększają z upływem czasu swoją zdolność reagowania na światło. Natężenie światła, do którego można się przystosować, może się zmieniać w granicach od ponad miliona do jedności. Przyroda nie dokonuje tego za pomocą tylko jednego rodzaju komórek, ale zadania te przekazują sobie wzajemnie dzienne komórki, czyli reagujące na barwę czopki, i komórki reagujące na małe natężenie światła, czyli zmierzchowe pręciki. Ciekawą konsekwencją tego przesuwania się jest to, że najpierw barwy nie ma, a następnie, że istnieje różnica we względnych jasnościach różnie zabarwionych przedmiotów. Okazuje się, że pręciki reagują lepiej w dziedzinie niebieskiej niż czopki, czopki zaś mogą na przykład reagować na światło ciemnoczerwone, czego pręciki zupełnie nie potrafią. Dla pręcików czerwone światło jest więc czarne. Weźmy dwa kawałki kolorowego papieru, np. niebieski i czerwony. W dobrym świetle czerwony może być jaśniejszy od niebieskiego, ale o zmierzchu wrażenie nasze będzie odwrotne. Zjawisko to jest bardzo ciekawe. Jeśli o zmierzchu weźmiemy ilustrowany barwny magazyn i ocenimy jaśniejsze i ciemniejsze obszary, nie wiedząc na pewno, jakie tam są barwy, a następnie przeniesiemy magazyn w pełne oświetlenie, możemy wówczas zobaczyć ważne przesunięcie między tą barwą, która się wydawała najjaśniejsza przedtem i tą, która wydaje się najjaśniejsza obecnie. Zjawisko to nazywamy zjawiskiem Purkinjego. Na rysunku 35.3 krzywa przerywana pokazuje czułość oka zmierzchowego, to znaczy oka posługującego się pręcikami, krzywa zaś ciągła pokazuje czułość oka dziennego. Widzimy, że szczytowa czułość pręcików znajduje się w obszarze zielonym, a czopków bardziej w żółtym. Kartkę barwy czerwonej (czerwień odpowiada około 650 mu) możemy zobaczyć wtedy, gdy jest jasno oświetlona, w ciemności zaś jest ona prawie niewidoczna. 35.3. Widmowa czułość oka. Linia przerywana — pręciki, linia ciągła — czopki 100 80 N ■o i c ■o ©■ 60 40 5 20 mA . * i / i / / / ► i / / \ ) A r X ' A V \ 0 i \ \ V \ \ \ \ \ \ . 700 80 60 40 20 600 80 60 40 20 500 80 60 40 20 400 długość fali w mu.
142 35. WIDZENIE BARWNE Innym następstwem tego, że w ciemności główną rolę odgrywają pręciki, i tego, że w dołku nie ma pręcików, jest to, że gdy w ciemności patrzymy na wprost, nasze widzenie nie jest ostre, jak przy patrzeniu w bok. Słabą gwiazdę lub młgawicę można czasem lepiej widzieć wtedy, gdy patrzy się na nią nieco z boku niż na wprost, ponieważ w środku dołka nie mamy czułych na słabe światło pręcików. Ciekawą konsekwencją faktu, że liczba czopków maleje w miarę przesuwania się do brzegu pola widzenia jest to, że nawet w pełnym świetle barwa znika, gdy przedmiot ucieka daleko w bok. Sposób sprawdzenia tego polega na patrzeniu przez nas w pewnym ustalonym kierunku, podczas gdy inna osoba podchodzi z boku z barwnymi kartami. Spróbujmy ustalić, jakiej są one barwy, zanim znajdą się na wprost nas. Okazuje się, że same karty można zobaczyć na długo przedtem, zanim daje się określić ich barwy. Przeprowadzając doświadczenie należy podchodzić do osoby patrzącej od strony przeciwnej do jej plamki ślepej, bo inaczej będzie dość mylące najpierw prawie rozróżnianie barw, następnie niewidzenie niczego, a potem znowu widzenie barw. Jeszcze innym ciekawym zjawiskiem jest wielka wrażliwość brzegu siatkówki na ruch przedmiotów. Kątem oka nie możemy wprawdzie bardzo dobrze widzieć, ale jeśli nadlatuje drobny owad, natychmiast na to reagujemy, nawet gdy z tamtej strony nie oczekujemy niczego poruszającego się. Jesteśmy wszyscy „nastawieni" na patrzenie za czymś poruszającym się na brzegu pola widzenia. 35-3. Mierzenie wrażenia barwnego Zajmiemy się teraz widzeniem za pomocą czopków, czyli widzeniem dziennym, dochodząc w ten sposób do zjawiska najbardziej charakterystycznego dla widzenia, mianowicie do barwy. Białe światło można, jak wiadomo, rozłożyć za pomocą pryzmatu na widmo świetlne o różnych długościach fal, które, jak nam się wydaje, mają różne barwy. Barwy bowiem nie są oczywiście niczym innym jak wrażeniami. Każde źródło światła można analizować za pomocą siatki dyfrakcyjnej czy pryzmatu i można określić jego rozkład widmowy, to znaczy „ilość" każdej długości fali. Dane światło może zawierać wiele błękitu, sporo czerwieni, bardzo mało żółtego i tak dalej. Wszystko to jest bardzo dobrze określone w sensie fizyki, ale powstaje pytanie, jaką będzie wydawać się barwa tego światła? Oczywiście, różne barwy zależą w pewien sposób od widmowego rozkładu światła, ale sprawa polega na wykryciu cech rozkładu widmowego, które powodują powstawanie określonych wrażeń. Jak na przykład mamy postąpić, aby otrzymać wrażenie barwy zielonej? Wiemy wszyscy, że możemy po prostu wziąć tzw. zieloną część widma. Ale czy jest to jedyny sposób uzyskania wrażenia zielonej, czy pomarańczowej, czy jakiejkolwiek innej barwy? Czy istnieje więcej niż jeden rozkład widmowy, który powoduje takie samo wrażenie wzrokowe? Odpowiedź jest zdecydowanie twierdząca. Liczba wrażeń wzrokowych jest bardzo ograniczona, ich rozmaitość - jak wkrótce zobaczymy - jest dokładnie trójwymiarowa, podczas gdy dla światła przychodzącego z różnych źródeł możemy wyrysować nieskończoną liczbę różnych krzywych — jego rozkładów widmowych. Zagadnieniem wymagającym teraz omówienia jest to, w jakich warunkach różne rozkłady widmowe światła dają oku wrażenie dokładnie tej samej barwy?
35-3. MIERZENIE WRAŻENIA BARWNEGO 143 Najbardziej skuteczna technika psychofizyczna przy ocenie barwy polega na przyjęciu oka za narzędzie zerowe. Znaczy to, że nie usiłujemy określić, co stanowi istotę wrażenia zieleni, ani też mierzyć, w jakich warunkach powstaje wrażenie zieleni, ponieważ okazuje się, że sprawy te są niezmiernie złożone. Badamy tylko warunki, w których dwa bodźce są nierozróżnialne. Nie musimy wtedy rozstrzygać tego, czy dwaj ludzie odbierają takie samo wrażenie wzrokowe w różnych warunkach, a tylko — czy dwa wrażenia takie same dla jednej osoby są też takie same i dla innej. Nie musimy rozstrzygać, czy ktoś widzący coś zielonego odczuwa wewnętrznie to samo, co ktoś inny widzący coś zielonego; o tym nic nie wiemy. Dla pokazania możliwych sytuacji posłużymy się układem czterech lamp projekcyjnych zaopatrzonych w filtry. Jasność lamp można regulować w sposób ciągły w szerokim zakresie: jedna z lamp ma filtr czerwony i na ekranie daje plamę światła czerwonego, następna ma filtr zielony i daje plamę zieloną, trzecia ma filtr niebieski, a czwarta daje białe koło z czarnym punktem w środku. Puszczając na ekran trochę światła czerwonego, a następnie trochę zielonego, zobaczymy, że w obszarze pokrywania się świateł wywołują one wrażenie, którego nie nazwiemy czerwonawą zielenią, bo stanowi ono nową barwę, w tym wypadku żółtą. Zmieniając wzajemny stosunek czerwieni i zieleni możemy przejść przez różne odcienie pomarańczowego i tak dalej. Wyobraźmy sobie, że otrzymaliśmy w ten sposób pewien odcień żółty. Tę samą żółtą barwę możemy także otrzymać nie przez mieszanie wspomnianych dwu barw, ale inaczej, przepuszczając np. białe światło przez filtr żółty albo wywołując w inny sposób takie samo wrażenie. Innymi słowy, mieszając światło przechodzące przez rozmaite filtry można różne barwy utworzyć na więcej niż jeden sposób. To, co właśnie odkryliśmy, można analitycznie wyrazić jak następuje. Określoną żółtą barwę można na przykład przedstawić za pomocą symbolu Y, który określa „sumę" pewnych ilości przefiltrowanego światła czerwonego (/?) i zielonego (G). Używając dwóch liczb r i g do opisu jasności (/?) i (G) możemy dla naszej barwy żółtej napisać wzór: Y = rR+gG. (35.1) Powstaje pytanie: czy można wytworzyć pełną rozmaitość barw przez dodawanie do siebie światła o dwóch lub trzech różnych, ale ustalonych barwach? Zobaczmy, co z tego założenia może wyniknąć. Drogą mieszania tylko czerwieni i zieleni nie uda się z pewnością uzyskać pełnej rozmaitości barw, ponieważ w takiej kombinacji nie pojawi się nigdy np. błękit. Dodając jednak trochę błękitu można dojść do tego, że obszar centralny, w którym trzy plamki się nakładają, będzie się wydawał prawie zupełnie biały. Mieszając rozmaite barwy i przypatrując się obszarowi centralnemu stwierdzamy, że zmieniając wzajemne proporcje możemy w nim uzyskać spory zakres barw. Nie jest więc wykluczone, że wszystkie barwy można utworzyć przez mieszanie tych trzech barw. Zastanowimy się teraz, w jakim stopniu jest to prawdziwe. Rzeczywiście, jest to w zasadzie prawda. Przekonamy się wkrótce, jak to założenie można lepiej sformułować. Dla zilustrowania tej sprawy zsuńmy 3 barwne plamki na ekranie tak, aby nakładały S'C całkowicie na siebie i starajmy się odtworzyć barwę, którą widać w pierścieniu kołowym, utworzonym przez czwartą lampę. Wychodzące z niej światło, które dawniej wydawało się nam „białe", teraz wygląda żółtawo. Spróbujmy odtworzyć tę barwę dopaso-
144 35. WIDZENIE BARWNE wując czerwień, zieleń i błękit, jak umiemy najlepiej, metodą prób i błędów. Stwierdzamy, że udało się nam wcale dokładnie odtworzyć ten szczególny odcień „kremowy". Łatwo uwierzyć, że możemy w ten sposób utworzyć wszystkie barwy. Za chwilę będziemy się starali utworzyć barwę żółtą, ale zanim się do tego zabierzemy, weźmy jeszcze jedną barwę, której utworzenie może być bardzo trudne. W większości wykładów o barwach tworzy się wszystkie „żywe" barwy, a nigdy się nie tworzy brązowej i trudno sobie nawet przypomnieć, czy się kiedykolwiek widziało brązowe światło. Istotnie, barwy tej nie używa się nigdy do żadnego efektu scenicznego, nigdy też nie widzi się świetlnej plamy barwy brązowej; możemy więc sądzić, że utworzenie brązu okaże się niemożliwe. Aby się przekonać, czy można go wytworzyć, zauważmy najpierw, że światła brązowego nigdy nie widujemy bez tła. Istotnie, możemy je utworzyć mieszając trochę czerwieni i żółtego. Aby wykazać, że patrzymy na światło brązowe, wystarczy po prostu zwiększyć jasność tła pierścieniowego, na którym to światło widzimy. Stwierdzamy, że rzeczywiście, ma ono barwę, którą nazywamy brązową! Brązową jest zawsze ciemna barwa, sąsiadująca z jaśniejszym tłem. Charakter brązu możemy łatwo zmienić. Zabierając na przykład trochę czerwieni, uzyskujemy czerwonawy brąz, wyglądający jak czekoladowoczerwonawy brąz, a wkładając stosunkowo więcej zieleni, uzyskujemy znaną barwę mundurów wojskowych, która jest obrzydliwa, chociaż światło o tej barwie samo przez się nie jest takie okropne; jest ono żółtawozielone, tyle tylko, że oglądane na jasnym tle. Wstawmy teraz żółty filtr do czwartej lampy i starajmy się odtworzyć widzianą barwę (natężenie musi znajdować się w zakresie natężenia pozostałych lamp; nie możemy dobierać czegoś, co jest za jasne, ponieważ moc w lampie nie będzie wystarczająca). Barwę żółtą możemy jednak odtworzyć; bierzemy mieszaninę czerwieni i zieleni i dodajemy odrobinę błękitu, aby uczynićjąjeszcze doskonalszą. Możemy już chyba uwierzyć, że w odpowiednich warunkach uda nam się doskonale odtworzyć każdą żądaną barwę. Omówimy teraz prawa mieszania barw. Stwierdziliśmy najpierw, że różne rozkłady widmowe mogą dawać wrażenie tej samej barwy; widzieliśmy następnie, że „dowolną" barwę można utworzyć przez dodawanie trzech szczególnych barw: czerwonej, niebieskiej i zielonej. Najciekawsza cecha mieszania polega na tym, co następuje: jeśli pewne światło, które możemy określić jako X, oku wydaje się nierozróżnialne od Y (może to być inny rozkład widmowy, który wydaje się jednak nierozróżnialny), to barwy te nazywamy „równymi" w tym sensie, że oko widzi je jako równe, i piszemy: X = Y. (35.2) Tak oto dochodzimy do jednego z wielkich praw teorii barw: jeśli dwa rozkłady widmowe są nierozróżnialne i do każdego z nich dodamy pewne światło Z (pisząc X+ Z mamy na myśli puszczanie obu rodzajów światła na to samo pole), to nowe mieszaniny także będą nierozróżnialne: X + Z = Y + Z. (35.3) Dopasowaliśmy właśnie naszą barwę żółtą; jeśli oświetlimy teraz wszystko światłem różowym, to dopasowanie pozostanie. Tak więc dodanie dowolnego światła do świateł już dopasowanych zachowuje dopasowanie. Wszystkie te zjawiska barwne możemy innymi słowy streścić następująco: gdy mamy już dopasowane dwa światła barwne, wi-
35-3. MIERZENIE WRAŻENIA BARWNEGO 145 dziane obok siebie w tych samych warunkach, to wówczas w dowolnej innej sytuacji mieszania barw dopasowanie to pozostaje i jedno światło może być zastąpione przez drugie. Istotnie, okazuje się - i jest to bardzo ważna i ciekawa sprawa — że dopasowanie barw światła nie zależy od cech oka w chwili obserwacji. Wiemy, że jeśli po wpatrywaniu się przez długi czas w żywo czerwoną powierzchnię albo w jasne światło czerwone spojrzymy na biały papier, wyda się nam on zielonkawy. Podobnie i inne barwy zostaną zniekształcone na skutek naszego długiego patrzenia na żywą czerwień. Wyobraźmy sobie teraz dopasowywanie powiedzmy dwóch barw żółtych. Przypatrzywszy się i dopasowawszy je do siebie wpatrujmy się przez dłuższy czas w jakąś żywą czerwoną powierzchnię, po czym wróćmy do naszej barwy żółtej. Wcale nie będzie ona już wyglądała żółto: nie wiem, jaka to będzie barwa, ale na pewno nie będzie miała wyglądu barwy żółtej. Mimo to, barwy pierwotnie żółte pozostaną nadal dopasowane, bo gdy nawet oko przystosowuje się do różnych poziomów natężenia, dopasowanie barw pozostaje, chyba że natężenie światła spadnie tak nisko, że następuje przestawienie się z czopków na pręciki. Dopasowanie barwne nie jest już wtedy dopasowaniem barwnym, ponieważ posługujemy się innym układem widzenia. Inna zasada barwnego- mieszania świateł brzmi następująco: dowolną barwę można utworzyć z trzech różnych barw, w naszym przypadku ze światła barwy czerwonej, zielonej i niebieskiej. Odpowiednio mieszając wszystkie te trzy barwy możemy utworzyć w ogóle każdą barwę, jak pokazaliśmy w naszych dwu przykładach. Poza tym prawa te są bar- dzociekawe pod w zględem matematycznym. Tym, którzy interesują się stroną matematyczną całej sprawy, przedstawimy ją następująco. Załóżmy, że bierzemy nasze trzy barwy, którymi są czerwień, zieleń i błękit, ale oznaczamy je A, B, C i nazywamy naszymi barwami zasadniczymi. Każdą barwę powinno się więc dać utworzyć z pewnych ilości tych trzech: niech na przykład pewna ilość a barwy A, pewna ilość b barwy B i pewna ilość c barwy C dają barwę X: X = aA + bB + cC. (35.4) Załóżmy teraz, że z tych samych trzech barw utworzona jest inna barwa Y: Y = dA + b'B + ćC. (35.5) Okazuje się, że mieszaninę tych dwóch barw (jest to jedna z konsekwencji praw, o których już wspomnieliśmy) otrzymuje się biorąc sumę składowych X i Y: Z = X+Y = (a+d)A+{b + b')B + (c+c')C . (35.6) Przypomina to dodawanie wektorów, gdzie (a, b, c) odgrywają rolę składowych jednego wektora, (a', b', c') — składowych innego wektora, nowa zaś barwa Z stanowi „sumę" 'ych wektorów. Zagadnienie to ciekawiło zawsze fizyków i matematyków. Schródinger napisał nawet o widzeniu barwnym wspaniałą pracę, w której rozwinął sprawę zastosowania teorii analizy wektorowej do mieszania barw. Powstaje teraz pytanie: jak należy poprawnie wybrać barwy zasadnicze, którymi mamy się posługiwać? Otóż okazuje się, że nie istnieje pojęcie „ustalonych" poprawnie barw zasadniczych przy mieszaniu barw. W praktyce mogą wprawdzie istnieć trzy
146 1 35. WIDZENIE BARWNI. farby bardziej od innych użyteczne do uzyskiwania większej rozmaitości mieszanych barwików, ale nie o to nam teraz chodzi. Dowolne trzy światła różnej barwy*1 zmieszane w odpowiedniej proporcji mogą zawsze utworzyć dowolne wrażenie barwne. Czy możemy uykazać tę fantastyczną tezę? Zamiast posługiwania się czerwienią, zielenią i błękitem użyjmy w naszym projektorze barwy czerwonej, niebieskiej i żółtej. Czy możemy się nimi posłużyć do wytworzenia na przykład barwy zielonej? Mieszając te trzy barwy w rozmaitych proporcjach uzyskujemy sporą gamę różnych barw, rozciągającą się w widmo. Ale po wielu próbach i błędach stwierdzimy, że żadna z tych barw nie przypomina zieleni. Pytanie: czy w ten sposób w ogóle możemy utworzyć zieleń? Odpowiedź: tak. Jak jednak? Otóż puśćmy trochę czerwieni na zieleń. Otrzymaną barwę możemy odtworzyć przy pomocy pewnej ilości światła żółtego i niebieskiego! Barwy dopasowaliśmy więc, tyle że oszukańczo umieściliśmy czerwień po „drugiej stronie" równania. Ale ponieważ nie brak nam pewnego sprytu matematycznego, więc możemy uznać, że to, co pokazaliśmy, nie oznaczało naprawdę, że barwę X zawsze można utworzyć z czerwieni, błękitu i żółtego, ale że stawiając czerwień po „drugiej stronie" równania, barwa czerwień plus X mogła zostać utworzona z błękitu i żółtego. Pozostawienie pewnej wielkości po drugiej stronie równania możemy interpretować jako jej ilość ujemną. Jeśli więc dopuszczamy zarówno dodatnie, jak i ujemne współczynniki w równaniach typu (35.4) i jeżeli interpretujemy znaczenie ujemnych ilości jako dodawanie ich po drugiej stronie równania, to dowolną barwę rzeczywiście można odtworzyć przy pomocy dowolnych trzech barw i nie istnieje pojęcie „ustalonych" podstawowych barw zasadniczych. Możemy zapytać: czy istnieją takie trzy barwy, które do wszystkich mieszanin wchodzą tylko w dodatnich ilościach? Odpowiedź jest przecząca. Każdy układ barw zasadniczych wymaga ujemnych ilości dla uzyskania pewnych barw i dlatego nie ma jednoznacznego sposobu określenia barw zasadniczych. W elementarnych podręcznikach mówi się, że barwami zasadniczymi są czerwona, zielona i niebieska, ale tylko dlatego, że przy ich pomocy uzyskuje sięszerszy zakres barw, bez ujemnych współczynników w niektórych zestawieniach. 35-4. Wykres barwności Omówimy teraz geometryczną interpretację zestawiania barw. Jeśli dowolna barwa jest przedstawiona za pomocą równania (35.4), to możemy wykreślić ją jako wektor w przestrzeni odkładając wzdłuż trzech osi liczby a, b, c. Daną barwę reprezentuje wówczas pewien punkt. Jeśli inną barwę określają liczby a', b', c', barwę tę reprezentuje inny punkt w przestrzeni. Suma obu barw daje, jak wiemy, barwę wynikającą z ich dodawania wektorowego. Możemy uprościć tę interpretację i przedstawić wszystko na płaszczyźnie. Jeżeli bowiem mając określone światło barwne po prostu podwoimy a, b, c, a więc *' Wyjątek zdarza się oczywiście wtedy, gdy jedna z tych trzech barw może być dobrana przez zmieszanie dwóch pozostałych.
15-4 WYKRES BARWNOŚCI 147 y 0,8 0,7 U,b 0,5 0,4 0,3 0,2 0,1 I 520 h\o 500 4490 48o\ 460 40 ! >^530 ^> ~r 1 1 T - v540 1 OO50 1 1 & s \ ^ X560 s X S0\5™ X-sV580 S\\590 nS^oo ^.^»V620 - ^ ^ C X630 uczynimy je dwukrotnie silniejszym, to otrzymamy tę samą barwę, ale żywszą. Jeśli więc zdecydujemy się na redukcję wszystkich składników do tego samego należenia światła, lo możemy zrzutować wszystko na płaszczyznę, co właśnie zostało zrobione na rys. 35.4. Wynika stąd, że dowolna barwa uzyskana ze zmieszania dwu danych barw w pewnym stosunku będzie leżała gdzieś na prostej wykreślonej między dwoma odpowiadającymi im punktami. Tak na przykład mieszanina pół na pół pojawi się w połowie ich odległości, a mieszanina i jednej barwy i J drugiej pojawi się w l odległości jednego punktu do drugiego, i tak dalej. Jeśli jako barwy zasadnicze przyjmiemy czerwoną (C), zieloną (Z) i niebieską (N), to wszystkie barwy, które możemy z nich złożyć z dodatnimi współczynnikami, leżą - jak widzimy — wewnątrz kropkowanego trójkąta, obejmującego prawie wszystkie widzialne barwy, ponieważ w ogóle wszystkie widzialne barwy są zamknięte w nieregularnym obszarze ograniczonym krzywą. Skąd wziął się ten obszar? Kiedyś ktoś bardzo starannie odtworzył wszystkie widzialne barwy przy pomocy trzech wybranych barw. My jednak nie musimy sprawdzać wszystkich barw, które możemy widzieć, wystarczy sprawdzić tylko czyste barwy widmowe, linie widma. Światło można uważać za sumę różnych dodatnich ilości poszczególnych czystych barw widmowych ~ czystych z fizycznego punktu widzenia. Dane światło będzie miało określoną zawartość czerwonej barwy widmowej, żółtej, niebies- K'ej i dalszych składowych widma. Jeśli się W|ec dowiemy, ile mamy wziąć każdej z naszych wybranych barw zasadniczych, aby utwo- rzyć którąś ze wspomnianych czystych składowych, to będziemy mogli obliczyć, ile każdej barwy zasadniczej trzeba do utworzenia dowolnej barwy. Jeśłi więc znajdziemy Współczynniki barwne wszystkich barw widmowych przy dowolnie zadanych trzech barach zasadniczych, to będziemy mogli ułożyć pełną tabelę mieszania barw. Na rysunku 35.5 podany jest przykładowo wynik takiego doświadczalnego mieszania ^ch barw. Rysunek ten pokazuje ilości każdej z określonych trzech barw zasadniczych, 0 0,1 0,2 0^ 0,4 0,5 0,6 0,7 35.4. Standardowy wykres barwności 35.5. Współczynniki barwne czystych barw widmowych wyrażone w pewnym układzie standardowych barw zasadniczych (1 — czerwona, 2 — zielona, 3 — niebieska) 720 680 640 600 560 520 480 440 400 długość fali w mu.
148 35 WIDZENIE BARWNE jakie są potrzebne do utworzenia dowolnej barwy widmowej. Czerwona barwa znajduje się w lewym krańcu widma, potem następuje żółta i tak dalej aż do niebieskiej. Zauważmy, że w pewnych punktach konieczne są znaki minus. Za pomocą danych tego rodzaju można ustalić położenie wszystkich barw na wykresie, na którym współrzędne x i y odnoszą się do różnych ilości przyjętych barw zasadniczych. W taki właśnie sposób znaleziono krzywą ograniczającą. Jest nią miejsce geometryczne czystych barw widmowych. Każdą inną barwę można oczywiście utworzyć przez dodawanie barw widmowych. W ten sposób okazuje się, że dowolna barwa utworzona przez połączenie dwóch punktów tej krzywej jest barwą występującą w przyrodzie. Linia prosta łączy skrajny fioletowy koniec widma ze skrajnym końcem czerwonym. Jest to miejsce geometryczne purpur. Wewnątrz krzywej ograniczającej leżą barwy, które można utworzyć ze świateł o różnych barwach, a na zewnątrz leżą barwy, których nie daje się utworzyć w ten sposób i których nikt nigdy nie widział (chyba tylko w powidokach!). 35-5. Mechanizm widzenia barwnego Dalszym aspektem całej sprawy jest zagadnienie, dlaczego wrażenia barwne mają takie właśnie cechy? Najprostsza teoria, zaproponowana przez You.nga i Helmholtza, przyjmuje, że w oku istnieją trzy różne barwiki (pigmenty) odbierające światło. Mają one różne widma absorpcyjne, tak że jeden barwik silnie pochłania na przykład w dziedzinie czerwonej, inny pochłania silnie w dziedzinie niebieskiej, a jeszcze inny w dziedzinie zielonej. Jeśli zatem puścimy na nie światło, otrzymujemy w trzech obszarach różne pochłanianie i aby określić barwę, zbiera się w pewien sposób te trzy elementy informacji w mózgu, czy w oku, czy jeszcze gdzie indziej. Łatwo wykazać, że wszystkie reguły mieszania barw są konsekwencją tej teorii. Wszystkie te sprawy były bardzo roztrząsane, ponieważ powstała natychmiast sprawa znalezienia charakterystyk pochłaniania każdego z tych barwików. Ponieważ jednak współrzędne barwne możemy przekształcać w dowolny sposób, więc okazuje się, niestety, że na drodze doświadczalnego mieszania barw możemy znaleźć tylko wszelkie rodzaje liniowych kombinacji krzywych pochłaniania a nie krzywe dla poszczególnych barwików. Ludzie różnymi sposobami usiłowali uzyskać jakąś określoną krzywą, która by opisywała pewną szczególną fizyczną własność oka. Jedną z krzywych tego rodzaju nazywamy krzywą wrażliwości świetlnej. Przedstawiają rys. 35.3. Na rysunku tym mamy dwie krzywe, jedną dla oka zmierzchowego, drugą dla oka dziennego. Ta ostatnia jest krzywą wrażliwości świetlnej receptorów czopkowych. Wrażliwość tę mierzy się znajdując, jaka jest najmniejsza ilość barwnego światła, które można ledwie dostrzec. Stanowi to miarę czułości oka w różnych obszarach widmowych. Istnieje także inny bardzo ciekawy sposób mierzenia tej wielkości Weźmy dwie plamy barwne, widoczne na jakiejś powierzchni, i poruszajmy nimi szybko tak, że na zmianę tylko jedna będzie widoczna. Jeżeli częstość będzie za niska, zauważymy migotanie. Gdy będzie ona wzrastać, migotanie przy pewnej częstości zależnej od jasności światła całkowicie zniknie Załóżmy, że następuje to przy 16 Hz. Dopasowujmy teraz jasność albo natężenie jednej barwy do drugiej; dojdziemy do takiego natężenia, że migotanie przy 16 Hz zniknie. Aby zo-
35-5. MECHANIZM WIDZENIA BARWNEGO baczyć migotanie przy tak dopasowanej jasności, będziemy musieli znacznie obniżyć częstość. Otrzymamy w ten sposób to, co nazywamy migotaniem jasności przy większej częstości, a migotaniem barwy przy mniejszej częstości. Tą techniką migotania można dopasować dwie barwy do „równej jasności". Wynik jest prawie, choć nie dokładnie taki sam, jak wynik mierzenia progowej czułości oka na widzenie słabego światła przez czopki. Większość badaczy posługuje się systemem migotania do wyznaczenia krzywej wrażliwości świetlnej. Jeśli w oku naprawdę istnieją trzy barwoczułe pigmenty, to zagadnienie polega na określeniu kształtu widma absorpcyjnego każdego z nich. W jaki'sposób? Wiemy, że istnieją ludzie ślepi na barwy — stanowią oni 8 % wszystkich mężczyzn i 0,5% wszystkich kobiet. Większość ludzi ślepych na barwy lub o nienormalnym widzeniu barwnym ma wprawdzie różny od innych ludzi stopień czułości na zmianę barwy, ale jednak potrzebuje trzech barw do dopasowywania. Istnieją jednak i tacy, których nazywamy di- chromatami, a którzy każdą barwę mogą dobrać przy użyciu tylko dwu barw zasadniczych. Nasuwa się oczywiście myśl, że brakuje im jednego z trzech barwików. Gdybyśmy zatem mogli znaleźć trzy rodzaje ślepych na barwy dichro- matów, u których występowałyby różne reguły mieszania barw, wówczas jednemu rodzajowi brakowałoby czerwonej, 'nnemu zielonej, a jeszcze innemu - niebieskiej pigmentacji. Dokonując pomiarów na tych trzech typach moglibyśmy wyznaczyć trzy szukane krzywe! Okazje się, że rzeczywiście istnieją trzy typy ^'chromatycznej ślepoty barwnej; dwa 'ypy są pospolite, a trzeci iest bardzn 149 35.6. Miejsce geometryczne barw mylonych przez deuteranopów 35.7. Miejsce geometryczne barw mylonych przez protanopów
150 35. WIDZENIE BARWNE 2,0 1,0 4000 5000 6000 o 7000 35.8. Krzywe czułości widmowej normalnych receptorów trichromaty (/ — niebieska, 2 - zielona, 3 — czerwona) rzadki*'. Ich istnienie umożliwiło poznanie widma absorpcyjnego barwików. Rysunek 35.6 pokazuje mieszanie barw u pewnego typu osoby ślepej na barwy, zwanej deuteranopem. Miejsca geometryczne stałych barw są dla niego nie punktami, ale pewnymi prostymi, wzdłuż których barwa wydaje mu się taka sama. Jeśli teoria, że brak mu jednego z trzech składników informacji, jest prawdziwa, to wówczas wszystkie proste powinny przecinać się w jednym punkcie. Jeśli dokładnie pomierzymy podany wykres, to okaże się, że proste rzeczywiście przecinają się doskonale. Stąd oczywisty wniosek, że wykres został sporządzony przez matematyka i nie przedstawia wyników rzeczywistych pomiarów! Istotnie, jeśli sięgniemy do najnowszej pracy z wynikami rzeczywistych pomiarów, to się okaże, że punkt ogniskowy wszystkich prostych z rys. 35.6 nie leży dokładnie we właściwym miejscu. Posługiwanie się prostymi z powyższego rysunku nie prowadzi do sensownych widm; w różnych obszarach konieczne są zarówno ujemne, jak i dodatnie absorpcje. Jeśli jednak skorzysta się z nowych danych Yustovej, okaże się, że każda z krzywych absorpcyjnych jest wszędzie dodatnia. Rysunek 35.7 ilustruje inny rodzaj ślepoty barwnej, mianowicie protanopię, przy której ognisko znajduje się w pobliżu czerwonego krańca krzywej ograniczającej. W tym przypadku Yustova otrzymuje w przybliżeniu takie samo położenie. Korzystając z istnienia trzech rodzajów ślepoty barwnej wyznaczono ostatecznie trzy krzywe czułości barwików; pokazano je na rys. 35.8. Czyżbyśmy więc wreszcie je mieli? Być może. Pozostaje jeszcze otwarty problem, czy idea trzech barwików jest w ogóle słuszna, czy ślepota barwna rzeczywiście wynika z braku jednego barwika, a nawet czy dane o ślepocie barwnej uzyskane z mieszania barw są w ogóle prawdziwe. Różni badacze uzyskują różne wyniki. Dziedzina ta jest w dużym stopniu wciąż jeszcze w stadium rozwoju. 35-6. Fizjochemia widzenia barwnego Zapytajmy teraz, jak wygląda porównanie tych krzywych z wynikami dla rzeczywistych barwików w oku? Barwiki, które można wydobyć z siatkówki, składają się głównie z tzw. czerwieni (purpury) wzrokowej. Najciekawszą jej własnością jest po pierwsze to, że znajdujemy ją w oku prawie każdego kręgowca, a po drugie, że jej krzywa reaktywności doskonale się zgadza z krzywą czułości oka, jak to widać z rys. 35.9. Na wykresie *' Dichromatów dzieli się zwykle na cztery typy: protanopów, deuleranopów, tritanopów i ie- tratanopów. (Przyp. tłum.)
15-6. FIZJOCHEMIA WIDZENIA BARWNEGO 151 5 1,0 n | 0,8 1o,6 a Z °>4 O % °.2 o J 0 fi O \ 400 500 600 długość fali w m^i przedstawionym na tym rysunku odłożono w tej samej skali pochłanianie czerwieni wzrokowej i czułość oka zmierzchowego. Barwik ten niewątpliwie pozwala nam widzieć o zmroku: czerwień wzrokowa jest barwikiem pręcików i nie ma nic wspólnego z widzeniem barwnym. Fakt ten odkryto w roku 1877 i jeszcze po dziś dzień nikt nie zebrał do probówki barwnych pigmentów czopkowych. W roku 1958 można było jeszcze mówić, że barwnych pigmentów w ogóle nikt nigdy nie widział, ale od tego czasu dwa z nich odkrył Rushton za pomocą bardzo prostej i pięknej techniki. Trudność polega przypuszczalnie na tym, że ponieważ oko jest bardzo mało czułe na pełne światło, w porównaniu z czułością na światło o niskim natężeniu, więc potrzebuje do widzenia wiele czerwieni wzrokowej, a niewiele barwnych pigmentów do widzenia barwnego. Idea Rushtona polega na wykonywaniu pomiaru na barwiku bez usuwania go z oka. Oto jak postępuje Rushton. Istnieje przyrząd zwany oftalmoskopem, który służy do wpuszczania światła do oka przez soczewkę i do ogniskowania światła powracającego. Za jego pomocą można zmierzyć ilość odbitego światła. Mierzy się więc współczynnik pochłaniania światła, które dwukrotnie przeszło przez barwik (po odbiciu od tylnej warstwy w gałce ocznej przeszło ono znowu przez barwik czopka). Przyroda nie zawsze daje nam takie szerokie możliwości. Czopki są bardzo ciekawie zbudowane, bo wchodzące światło odbija się dookoła szukając sobie drogi do wnętrza, do małych czułych punktów w wierzchołku czopka. Światło, które przechodzi do środka aż do czułego punktu, odbija się na dnie i wychodzi znowu przez znaczną ilość pigmentu widzenia barwnego. Jeśli po- 35.9. Krzywa czułości oka zmierzchowego porównana z krzywą pochłaniania czerwieni wzrokowej 35.10. Widmo absorpcyjne barwnego pigmentu w ślepym na barwy oku protanopa (kwadraty) i w oku normalnym (kropki) 0 500 650 K,m^
152 36. WIDZENIE BARWNE nadto będziemy spoglądali na plamkę żółtą, gdzie nie ma pręcików, to nie będzie nas myliła czerwień wzrokowa. Barwa samej siatkówki jest znana już od dawna: jest ona pomarańczoworóżowa; ponadto musimy uwzględnić barwę naczyń krwionośnych, barwę substancji dna oka i tak dalej. Skąd więc dowiemy się, że w ogóle oglądamy pigment? Odpowiedź: Po pierwsze - bierzemy osobę ślepą na barwy, która ma mniej barwików, a zatem analizę jest łatwiej przeprowadzić. Po wtóre - rozmaite barwiki, takie jak czerwień wzrokowa, wykazują zmianę natężenia przy oświetlaniu, zmieniają swoje stężenie, gdy pada na nie światło. Aby więc znaleźć widmo absorpcyjne, Rushton wpuścił dodatkowo do całego oka jeszcze inną wiązkę, zmieniającą stężenie barwika, i zmierzył zmianę w widmie, która oczywiście nie ma nic wspólnego z ilością krwi, czy barwą warstw odbijających, ani czymś podobnym, ale zależy tylko od pigmentu. W ten sposób dla barwika oka protanopa Rushton otrzymał krzywą pokazaną na rys. 35.10. Druga krzywa na rys. 35.10 jest krzywą otrzymaną dla oka normalnego. Posłużono się okiem normalnym i mając wyznaczony już jeden barwik rozjaśniano drugi w dziedzinie czerwonej, tam gdzie pierwszy jest nieczuły. Czerwone światło nie działa na oko protanopa, ale działa na oko normalne i w ten sposób można było otrzymać krzywe dla brakującego barwika. Kształt jednej z krzywych pasuje pięknie do zielonej krzywej Yusto- vej, ale krzywa czerwona jest trochę przemieszczona. Może więc trafiliśmy na właściwy ślad. Ale może i nie — ostatnie prace nad deuteranopami nie wykazują braku żadnego określonego barwika. Barwa nie jest sprawą samej tylko fizyki światła. Barwa jest wrażeniem, a wrażenia barwne są różne w różnych okolicznościach. Mając na przykład światło różowe, utworzone przez nałożenie krzyżujących się wiązek światła białego i czerwonego (ze światła białego i czerwonego możemy oczywiście otrzymać jedynie różne odcienie barwy różowej), możemy pokazać, że białe światło wyda się nam niebieskie. Umieśćmy na drodze wiązek jakiś przedmiot. Rzuca on dwa cienie: jeden oświetlony tylko światłem białym, a drugi czerwonym. Dla większości ludzi „biały" cień przedmiotu wyda się niebieski, ale jeśli rozprzestrzenimy cień, aż do pokrycia całej ściany, zobaczymy nagle, że wydaje się on biały, a nie niebieski! Inne zjawiska tego rodzaju możemy otrzymać mieszając czerwone, żółte i białe światło. Czerwone, żółte i białe światło może dawać odcienie tylko pomarań- czowożółte i podobne. Tworząc jednak w świetle cienie różnego kształtu, które dają nakładanie się barw, można otrzymać spory zakres pięknych barw, które występują nie w samym świetle (bo ono jest tylko pomarańczowe), ale w naszych wrażeniach. Bez wątpienia widzimy wiele różnych barw, które są zupełnie niepodobne do barw „fizycznych" w wiązce. Należy zdać sobie sprawę z tego, że już siatkówka „myśli" o świetle; nieświadomie porównuje to, co widzi w jednym obszarze, z tym, co widzi w innym. W następnym rozdziale będziemy mówili o tym, co wiemy na temat jej działania.
I 36 mechanizm widzenia 36-1. Wrażenie barwy Omawiając rolę zmysłu wzroku musimy sobie zdawać sprawę, że na ogół (poza galeriami sztuki nowoczesnej) nie widzimy bezładnych plam barwnych ani plam świetlnych. Patrząc na jakiś obiekt widzimy człowieka lub rzecz; innymi słowy, mózg interpretuje to, co widzimy. Nikt nie wie, na czym polega jego działanie, a jest ono naturalnie bardzo skomplikowane. Wiadomo np., że dopiero po wielu doświadczeniach uczymy się rozpoznawać człowieka z wyglądu. Istnieje jednak szereg bardziej elementarnych cech widzenia, które także obejmują łączenie informacji z różnych części oglądanego obiektu. Aby łatwiej zrozumieć, w jaki sposób dokonujemy interpretacji pełnego obrazu, warto przebadać początkowe stadia łączenia informacji pochodzących z różnych komórek siatkówki. W rozdziale tym skupimy się głównie na tym aspekcie widzenia, chociaż rozwijając ten temat będziemy musieli wspomnieć i o kilku sprawach pobocznych. Przypomnijmy sobie niebieski cień w białym świetle, widziany na ekranie oświetlonym biało i czerwono. Stanowi on przykład, że już przy odbieraniu bardzo prostych wrażeń wzrokowych wykazujemy umiejętność jednoczesnego gromadzenia informacji zrozma- 'tych części oka niezależną od kontroli naszej woli lub zdolności uczenia się. O zjawisku tym musimy wiedzieć co najmniej to, że tło ekranu jest różowe, mimo że do określonego punktu w oku dochodzi tylko „białe" światło, gdy patrzymy na niebieski cień; różne elementy informacji zostały gdzieś połączone razem. Im lepiej i kompletniej znamy rzeczywistość, tym bardziej oko koryguje niezwykłe cechy widoku. Istotnie, Land pokazał, że jeśli wspomniany Pozorny błękit i czerwień zmieszamy w rozmaitych proporcjach za pomocą dwóch przezroczy fotograficznych pochłaniających w różnym stopniu czerwień i biel, to można je Uzyć do dość wiernego przedstawienia jakiejś rzeczywistej sceny z rzeczywistymi przedmiotami. W tym przypadku „widzimy" także wiele barw pośrednich, analogicznych do
154 3«. MECHANIZM WIDZENIA 36.1. Podczas wirowania krążka lego rodzaju barwy pojawiają się tylko w jednym z dwu ciemniejszych „pierścieni". Gdy odwrócimy kierunek obrotu, barwy pojawiają się w drugim pierścieniu barw otrzymanych z mieszania barw czerwonej i niebies- kozielonej. Sprawiają one wrażenie pełnego kompletu barw, i dopiero dokładniejsze wpatrywanie się w nie pokazuje, że tak nie jest. Mimo to jest rzeczą zdumiewającą, ile można uzyskać ze zwykłej czerwieni i bieli. Im bardziej scena przypomina rzeczywistą sytuację, tym bardziej oku udaje się skompensować fakt, że całe światło jest właściwie tylko różowe! Innym przykładem jest pojawianie się „barw" na biało- czarnej wirującej tarczy, której białe i czarne pola są widoczne na rys. 36.1. Przy obrocie tarczy zmiany świateł i cieni wzdłuż każdego promienia są dokładnie takie same; jedynie tło jest różne dla dwóch rodzajów „pasów". Mimo to jeden z „pierścieni" wydaje się inaczej zabarwiony niż drugi*'. Nikt dotąd nie zna przyczyny występowania tych barw, ale jest jasne, że informacje zostają połączone już w bardzo wczesnym stadium procesu widzenia, najprawdopodobniej w samym oku. . Prawie wszystkie współczesne teorie widzenia barwnego zgadzają się, że dane o mieszaniu barw wskazują na istnienie tylko trzech barwików w czopkach oka i że zasadniczą przyczyną powstawania wrażenia barwnego jest pochłanianie widmowe w tych trzech barwikach. Mimo to pełne wrażenie związane z charakterystykami pochłaniania trzech współdziałających barwików nie musi być sumą pojedynczych wrażeń. Zgadzamy się wszyscy, że kolor żółty wcale nie wygląda na czerwonawą zieleń i dla wielu ludzi straszną niespodzianką byłoby pewnie odkrycie, że światło jest w istocie mieszaniną barw. Wrażenie wzrokowe jest prawdopodobnie wynikiem jakiegoś procesu, który istotnie różni się od prostego mieszania przypominającego akord muzyczny, w którym trzy nuty są jednocześnie obecne i można je usłyszeć oddzielnie, uważnie się wsłuchując. Wpatrując się pilnie w żółtą barwę nie możemy jednak zobaczyć czerwieni i zieleni. Najwcześniejsze teorie dotyczące widzenia głosiły, że istnieją trzy barwiki i trzy rodzaje czopków, z których każdy zawiera tylko jeden barwik; że nerw biegnie od każdego czopka do mózgu i przenosi tam trzy składniki informacji, a cała reszta procesu zachodzi już w mózgu. Pogląd taki nie jest oczywiście pełny: samo bowiem odkrycie, że jakaś informacja przenoszona jest wzdłuż nerwu wzrokowego do mózgu, niczego nie daje, ponieważ nic nie wiemy jeszcze o samym zagadnieniu. Musimy postawić bardziej podstawowe pytanie. Czy istotne jest, gdzie informacje są łączone razem? Czy jest istotne, aby były one przenoszone wzdłuż nerwu wzrokowego wprost do mózgu, czy też sama siatkówka mogłaby najpierw dokonywać pewnej analizy? Pokazany obraz siatkówki ukazał nam ją jako coś niezwykle złożonego, z mnóstwem wewnętrznych połączeń (rys. 35.2) i wydaje się, że mogłaby ona przeprowadzać pewne analizy. Rzeczywiście, badacze, którzy zajmują się anatomią i rozwojem oka, wykazali, że •' Barwy zależą od prędkości obrotu, od jasności oświetlenia, a w pewnym slopniu lakże od tego, kto na nie patrzy i jak się im pilnie przypatruje.
w 36-1. WRAŻENIE BARWY 155 siatkówka istotnie należy do mózgu: w czasie rozwoju embrionu część mózgu wysuwa się do przodu, a do tyłu rosną długie włókna łączące oczy z mózgiem. Siatkówka zbudowana jest tak samo jak mózg, co ktoś pięknie ujął słowami: „Mózg rozwinął sobie' sposób wyglądania na świat". Oko stanowi część mózgu, o której można powiedzieć, że dotyka zewnętrznego świata. Jest więc rzeczą zupełnie prawdopodobną, że częściowa analiza barwy dokonuje się już w siatkówce. Otwiera to przed nami bardzo ciekawą możliwość. Żaden inny zmysł nie wymaga wielkiej liczby czynności przypominających obliczenia, zanim jeszcze sygnał dostanie się do nerwu, na którym można wykonywać pomiary. Dla wszystkich pozostałych zmysłów podobne obliczenia wykonywane są zwykle w samym mózgu. W mózgu zaś bardzo trudno dokonywać pomiarów w określonym miejscu z powodu wielu krzyżujących się połączeń. Zajmując się zmysłem wzroku, spotykamy tak różne elementy, jak światło, trzy warstwy komórek wykonujących obliczenia i nerw wzrokowy, wzdłuż którego przesyłane są wyniki obliczeń. Pojawia się więc pierwsza możliwość fizjologicznej obserwacji działania pierwszych warstw mózgu już na najniższym szczeblu. Sprawa jest więc podwójnie ciekawa i ze .względu na widzenie, i ze względu na całokształt zagadnień fizjologicznych. istnienie trzech barwików nie oznacza, że wrażenia mają być trzech rodzajów. Pewna odmienna teoria widzenia barwnego utrzymuje, że naprawdę istnieją antagonistyczne schematy barwne (rys. 36.2). Oznacza to, że jedno z włókien nerwowych przenosi wiele bodźców, gdy oglądamy żółtą barwę, a mniej bodźców niż zwykle, przy barwie niebieskiej. Inne włókno nerwowe w taki sam sposób przenosi czerwoną i zieloną informację, a jeszcze inne białą i czarną. Mówiąc inaczej, ktoś w tej teorii zaczął już snuć przypuszczenia na temat istniejącego układu połączeń, czyli sposobu obliczania. Snując domysły co do tych pierwotnych obliczeń staramy się rozwiązać takie zagadnienia jak: sprawy tyczące się pozornych barw widzianych na różowym tle, sprawy przystosowywania się oka do różnych barw, a także tak zwane zjawiska psychologiczne. Psychologiczne zjawiska połgają na przykład na tym, że bieli nie „odczu- Wa się" jako czerwieni, żółci i błękitu, a teoria, która się tym zajmuje, została wysunięta dlatego, 2e według psychologów istnieją cztery barwy, które wydają się czyste: „Istnieją cztery bodźce, któ- re mają wybitną zdolność wywoływania psycho- '°gicznie prostych odcieni, mianowicie niebies- klego, żółtego, zielonego i czerwonego. W od- r°2nieniu od sjeny, karmazynu, purpury lub W|?kszości rozkładalnych barw, te proste odcie- 36.2. Połączenia nerwowe według „an- tagonistycznej" teorii widzenia barwnego. (N — niebieska, Ż — żółta, Z -zielona, C — czerwona, B — biała, Cz — czarna) reakcje nerwowe pochłanianie fotochemiczne C-Z = k2(>x + y~2p), B-Cz=ks(z + Y+P)-k*(z + P+Y)-
156 36. MECHANIZM WIDZENIA nie nie są mieszaninami w tym znaczeniu, że żaden z nich nie dzieli swej istoty z drugą; w szczególności niebieski nie jest ani żółtawy, ani czerwony, ani zielonkawy i tak dalej; są to psychologicznie zasadnicze odcienie". Ma to rzekomo być tak zwanym faktem psychologicznym. Aby stwierdzić, na czym się to opiera, musimy nadzwyczaj pilnie prześledzić literaturę z tej dziedziny. Wszystko, co znajdujemy na ten temat w nowoczesnej literaturze, jest powtórzeniem albo dokładnie tego stwierdzenia, albo podobnego, które pochodzi od pewnego niemieckiego psychologa. Ten zaś wśród swoich autorytetów podaje Leonarda da Vinci, którego oczywiście wszyscy znamy jako wielkiego artystę. Psycholog ten mówi: „Leonardo sądził, że istnieje pięć barw". Sięgając do jeszcze starszych książek znajdziemy na ten temat świadectwo tego rodzaju: „Purpura jest czerwononiebieska, barwa pomarańczowa jest czerwonożółta, ale czy można sobie wyobrazić, że czerwień jest pomarańczowopurpurowa? Czyż barwy czerwona i żółta nie są bardziej jednolite od purpurowej i pomarańczowej? Przeciętny człowiek zapytany o to, które barwy są jednolite, wymienia ich trzy: czerwoną, żółtą i niebieską, a niektórzy obserwatorzy dodają jeszcze czwartą: zieloną. Psychologowie zwykli przyjmować te cztery odcienie za pierwotne". Psychologiczna analiza tego zagadnienia przedstawia się więc następująco: jeśli wszyscy mówią, że jest trzy, a ktoś mówi, że jest cztery i chce się, żeby było cztery, to niech będzie cztery. Ukazuje to trudności w badaniach psychologicznych. Jest oczywiste, że odczucia nasze są właśnie takie, ale bardzo trudno czegoś więcej się o nich dowiedzieć. Inną drogą postępowania jest więc podejście fizjologiczne, aby doświadczalnie stwierdzić, co właściwie dzieje się w mózgu, w oku, w siatkówce czy gdziekolwiek indziej. Uda się wtedy może odkryć, że pewne kombinacje bodźców z rozmaitych komórek poruszają się wzdłuż określonych włókien nerwowych. Nawiasem mówiąc, zasadnicze pigmenty nie muszą znajdować się w oddzielnych komórkach; można sobie wyobrazić komórki, w których znajdują się mieszaniny rozmaitych barwików, komórki z pigmentem czerwonym i zielonym, komórki zawierające wszystkie trzy (informacja o wszystkich trzech jest wówczas informacją białą), i tak dalej. Istnieje wiele sposobów połączenia całego układu, a do nas należy stwierdzenie, której drogi użyła przyroda. Prowadząc badania w tym kierunku mamy nadzieję, że gdy zrozumiemy powiązania fizjologiczne, w końcu uda się nam też trochę zrozumieć niektóre wyżej wymienione aspekty psychologiczne. 36-2. Fizjologia oka Rozpoczniemy od omówienia nie tylko procesu widzenia barwnego, ale widzenia w ogóle, aby sobie po prostu przypomnieć wewnętrzne połączenia w siatkówce pokazanej na rys. 35.2. Siatkówka wygląda rzeczywiście jak powierzchnia mózgu. Chociaż jej prawdziwy obraz pod mikroskopem jest bardziej skomplikowany niż ten dość schematyczny rysunek, to jednak uważna analiza pozwala dostrzec wszystkie wewnętrzne połączenia. Nie ulega wątpliwości, że każda część powierzchni siatkówki jest połączona z innymi i że wszystkie informacje wychodzące po długich włóknach osiowych (aksonach), tworzących nerw wzrokowy, są kombinacjami informacji z wielu komórek. Istnieją trzy warstwy komórek, według kolejności działania: komórki siatkówki, na które działa światło,
36-2. FIZJOLOGIA OKA 157 36.3. Wzajemne połączenia nerwów dła mechanicznego działania oczu pewna pośrednia komórka, która odbiera informacje od jednej lub kilku komórek siatkówki i przekazuje je dalej komórkom w trzeciej warstwie, skąd informacje przechodzą do mózgu. Między komórkami we wszystkich warstwach istnieją wszelkie możliwe połączenia krzyżowe. Wróćmy teraz do pewnych aspektów budowy i działania oka (patrz rys. 35.1). Ogniskowania światła dokonuje głównie rogówka, ponieważ ma ona zakrzywioną powierzchnię, która „ugina" światło. Gdy patrzymy w wodzie, nie możemy widzieć wyraźnie, ponieważ różnica między współczynnikiem załamania rogówki, wynoszący ml,37, a wody, wynoszącym 1,33, jest niewystarczająca „do ugięcia" światła. Za rogówką znajduje się praktycznie woda o współczynniku załamania 1,33, a za nią soczewka, która ma bardzo ciekawą budowę: składa się ona z szeregu warstw, jak cebula, z tym że jest cała przezroczysta i jej warstwy środkowe mają współczynnik załamania 1,40, a warstwy brzegowe 1,38. (Byłoby pięknie, gdybyśmy umieli produkować szkło optyczne, w którym można by regulować współczynnik załamania; nie musielibyśmy wtedy zakrzywiać takiego szkła tak silnie, jak szkła, które ma jednorodny współczynnik załamania.) Rogówka nie jest poza tym kulista. Soczewka kulista wykazuje w pewnym stopniu aberrację sferyczną. Rogówka na brzegu jest „bardziej płaska" niż kula, tak że jej aberracja sferyczna jest mniejsza niż u odpowiedniej soczewki kulistej! Układ rogówka-soczewka ogniskuje światło na siatkówce. Gdy patrzymy na obiekty bliskie lub dalekie, soczewka kurczy się lub rozluźnia, zmieniając ogniskową, aby ją dostosować do różnych odległości. Do regulowania całkowitej ilości wpadającego światła służy tęczówka, od której zależy kolor oka, brązowy lub niebieski. W miarę jak ilość światła zwiększa się i zmniejsza, tęczówka otwiera się i zamyka. Spójrzmy teraz na pokazany schematycznie na rys. 36.3 mechanizm nerwowy, który kontroluje akomodację soczewki, ruch oka, mięśnie obracające oko w oczodole i źrenicę. Większość informacji, która wychodzi z nerwu wzrokowego A, odłącza się do jednej 7 dwu wiązek (o których będziemy mówić później) i stąd wędruje do mózgu. Istnieją Jednak pewne interesujące nas teraz włókna, które nie biegną wprost do kory wzrokowej mózgu, czyli do miejsca, gdzie „widzimy" obrazy, ale zamiast tego biegną do śródmózgo- wia H. Są to włókna, które mierzą średnie światło i powodują dostosowywanie się tęczówki; jeżeli zaś obraz jest zamglony, to starają się one skorygować soczewkę; jeżeli wreszcie °brazjest podwójny, starają się dopasować oko do widzenia dwuocznego. W każdym razie biegną one do śródmózgowia i są sprzężone zwrotnie z okiem. W miejscu oznaczonym na rysunku literą K znajdują się mięśnie, które uruchamiają akomodację soczewki, awi znajduje się inny mięsień, który ściąga tęczówkę. Tęczówka ma dwa układy mięśniowe. Je-
158 36. MECHANIZM WIDZENIA przyskroniowa potowa pola widzenia przynosowa połowa pola widzenia 36.4. Połączenia nerwów oczu z mózgową korą dnym z nich jest okrężny mięsień (Z,), który pobudzony kurczy się i zamyka tęczówkę; działa on bardzo szybko, a nerwy bezpośrednio łączą mózg krótkimi aksonami z tęczówką. Mięśnie przeciwstawne mają układ promienisty, tak że gdy robi się ciemno i mięsień okrężny rozluźnia się, mięśnie promieniste się kurczą. Tutaj, podobnie jak i w wielu miejscach ciała, mamy parę mięśni pracujących w kierunkach przeciwnych. Prawie w każdym takim przypadku kontrolujące układy nerwowe są bardzo precyzyjnie ze sobą zgrane, tak że sygnałowi nakazującemu ściągnąć jeden z mięśni automatycznie towarzyszy sygnał, aby drugi mięsień zwolnić. Tęczówka jest jednak osobliwym wyjątkiem: nerwy, które właśnie opisaliśmy, powodują kurczenie się tęczówki, ale nerwy, które powodują rozszerzanie się tęczówki, wychodzą nie wiadomo dokładnie skąd, schodzą do części piersiowej rdzenia kręgowego z tyłu za klatkę piersiową, wychodzą z rdzenia do góry przez węzły szyjne i wracają tą samą drogą z powrotem do głowy, aby w końcu uruchamiać drugi koniec tęczówki. Rzeczywiście, sygnał przechodzi przez zupełnie odmienny układ nerwowy, mianowicie nie przez centralny układ nerwowy, ale przez układ współczulny. Cały mechanizm działa więc w bardzo dziwny sposób. Zwracaliśmy już uwagę na inną dziwną cechę budowy oka: światłoczułe komórki znajdują się po niewłaściwej stronie siatkówki, tak że światło, zanim dostanie się do receptorów, musi przejść przez kilka warstw innych komórek - oko jest zbudowane na opak! Widać więc, że niektóre jego cechy są wprost wspaniałe, inne wydają się nielogiczne. Rysunek 36.4 pokazuje połączenia oka z częścią mózgu, która jest najbardziej bezpośrednio związana z procesem widzenia. Włókna nerwów wzrokowych wchodzą do pewnego obszaru położonego wprost za miejscem oznaczonym na rysunku literą D: obszar ten nazywamy ciałem kolankowatym bocznym, skąd włókna nerwów wybiegają do części mózgu zwanej korą wzrokową. Zauważmy, że niektóre włókna od każdego oka przechodzą na przeciwną stronę mózgu, tak że tworzący się obraz nie jest zupełny. Nerwy wzrokowe z lewej strony prawego oka przechodzą przez skrzyżowanie nerwów wzrokowych w punkcie B, podczas gdy nerwy z lewej strony lewego oka omijają punkt B i biegną dalej. Tak więc do lewej strony mózgu dochodzi pełna informacja z lewej strony gałki ocznej każdego oka, to znaczy z prawej strony pola widzenia, podczas gdy prawa strona mózgu widzi lewą stronę pola widzenia. Informacje od każdego z dwojga oczu są w ten sposób łączone razem, dzięki czemu można ocenić, jak daleko znajdują się przedmioty. System ten nazywamy widzeniem dwuocznym.
36-2. FIZJOLOGIA OKA 159 Ciekawe są połączenia między siatkówką i korą wzrokową. Jeżeli jakiś obszar siatkówki zostaje wycięty lub w inny sposób zniszczony, całe włókno obumiera i dzięki temu możemy stwierdzić, gdzie ono było połączone. Okazuje się, że połączenia zasadniczo są wzajemnie jednoznaczne - każdemu punktowi siatkówki odpowiada jeden punkt w korze wzrokowej — i punkty, które leżą blisko siebie w siatkówce, leżą też blisko siebie w korze wzrokowej. Tak więc kora wzrokowa odtwarza przestrzenny układ pręcików i czopków, chociaż oczywiście jest on bardzo zniekształcony. Obiektom, znajdującym się w środku pola widzenia, zajmującym małą część siatkówki, odpowiada obszar rozciągający się na przestrzeni wielu komórek w korze wzrokowej. Jest oczywiście rzeczą bardzo wygodną, że temu, co pierwotnie leżało blisko siebie, nadal odpowiadają obiekty położone blisko. Najbardziej godnym uwagi jest jednak następujący aspekt całej sprawy. Ktoś mógłby sądzić, że najistotniejsze powinno być zestawienie blisko siebie tego, co odpowiada dokładnie środkowi pola widzenia. Tymczasem można wierzyć lub nie, ale prosta poprowadzona z góry na dół w naszym polu widzenia ma własność, że informacje z punktów po jej prawej stronie przechodzą do lewej strony mózgu, a informacje z punktów po jej lewej stronie przechodzą do prawej strony mózgu. Obszar pola widzenia jest przecięty dokładnie wśrodku, tak że wszystko to, co znajduje się dokładnie w środku pola widzenia bardzo blisko siebie, staje się bardzo oddalone od siebie w mózgu! Jest więc naprawdę zdumiewające, że informacja musi przez jakieś kanały przechodzić z jednej strony mózgu na drugą. Jest bardzo ciekawe jak w ogóle sieć ta zostaje połączona w całość. Od bardzo dawna stawiano sobie pytanie, ile jest w niej z góry połączone, a ile zostaje wyuczone. Dawniej sądzono zwykle, że nie jest ona wcale połączona starannie, ale powiązana tylko z grubsza i dopiero na drodze doświadczeń małe dziecko uczy się, że gdy jakaś rzecz znajduje się „tam", powoduje to pewne wrażenie w mózgu (lekarze zawsze nam mówią, co „czuje" małe dziecko, ale skąd właściwie oni wiedzą, co czuje dziecko mające rok?) Roczne dziecko przypuszczalnie widzi, że jakiś przedmiot znajduje się „tam", odbiera pewne wrażenia i uczy się „tam" sięgać, ponieważ gdy sięga „tu", nic z tego nie wychodzi. Podejście to prawdopodobnie nie jest poprawne, ponieważ jak się już przekonaliśmy, w wielu wypadkach istnieją pewne szczególne, dobrze określone powiązania wzajemne. Bardziej konkretne są pewne znakomite doświadczenia wykonane na salamandrze. (Nawiasem mówiąc u salamandry istnieją bezpośrednie połączenia krzyżowe, bez krzyżowania nerwów wzrokowych, ponieważ oczy znajdują się na bokach głowy i nie mają wspólnego pola widzenia. Salamandry nie posiadają widzenia dwuocznego.) Doświadczenia polegały na następującym. Gdy przetniemy nerw wzrokowy salamandry, wyrośnie on znowu z oka. Tysiące Włókien komórkowych odtworzą się więc same. Trzeba zaś wiedzieć, że w nerwie wzrokowym włókna nie są równo ułożone obok siebie — wygląda on raczej jak wielki, niedbale Zrobiony kabel telefoniczny, w którym wszystkie druty są posplatane i pokręcone. Gdy jednak nerw dociera do mózgu, wszystkie włókna zostają znowu rozdzielone. Przecinając nerw wzrokowy salamandry stajemy przed ciekawym zagadnieniem, czy się on w ogóle fozplącze? Odpowiedź jest zastanawiająca: tak. Jeśli odrośnie przecięty nerw wzrokowy Mlamandry, odzyskuje ona dobrą ostrość wzroku. Jeśli jednak przetniemy nerw wzro- i. kowy i obrócimy oko tak, że jego górna część znajdzie się na dole, a nerwowi pozwolimy j§ odrosnąć, to zwierzę odzyska wprawdzie dobra ostrość wzroku al<> w ct-o„ i-»-j
160 36. MECHANIZM WIDZENIA salamandra widząc muchę „u góry" skacze na nią „w dół" i nie może się tego oduczyć. Musi wiec istnieć jakiś tajemniczy sposób, dzięki któremu wiele tysięcy włókien odnajduje swoje pierwotne miejsca w mózgu. Sprawa, ile połączeń jest wrodzonych, a ile nie, stanowi ważne zagadnienie teorii rozwoju stworzeń. Odpowiedź nie jest znana, prowadzone są jednak intensywne badania. To samo doświadczenie przeprowadzone na złotej rybce pokazuje, że w miejscu, gdzie nerw wzrokowy został przecięty, pojawia się na nim straszne zgrubienie, jakby wielka blizna lub węzeł, a mimo to włókna odrastają do swoich pierwotnych miejsc w mózgu. W tym celu włókna odrastające w starych kanałach nerwu wzrokowego muszą podejmować wiełe decyzji, w jakim kierunku powinny rosnąć. Jak to się dzieje? Wydaje się, że istnieją pewne bodźce chemiczne, na które różne włókna reagują w różny sposób. Pomyślmy o olbrzymiej liczbie rosnących włókien, z których każde stanowi pewne indywiduum, różniące się od swoich sąsiadów. Reakcja na jakiś bodziec chemiczny musi być wystarczająco jednoznaczna, aby włókno znalazło właściwe miejsce swojego końcowego połączenia w mózgu! Sprawa jest fantastycznie ciekawa. Stanowi jedno z ostatnio odkrytych zjawisk biologicznych i jest niewątpliwie związana z wielu starszymi, nie rozwiązanymi dotąd zagadnieniami wzrostu, organizacji i rozwoju żywych organizmów, a w szczególności embrionów. Inne ciekawe zjawisko odnosi się do ruchu oka. Oczy muszą się poruszać, aby zapewnić koincydencję dwóch obrazów w różnych warunkach. Ruchy te są rozmaite: jeden z nich polega na śledzeniu przedmiotów; wymaga to ruchu obojga oczu w tym samym kierunku, w prawo lub w lewo; drugi ruch połega na kierowaniu oczu w to samo miejsce przy roz- maitych odległościach, co wymaga przeciwstawnego ruchu oczu. Nerwy biegnące do mięśni oka są od razu połączone odpowiednio z tym właśnie przeznaczeniem. Jeden układ nerwów ściąga mięśnie wewnętrznej strony jednego oka i zewnętrznej drugiego, zwalniając mięśnie przeciwstawne tak, aby oczy poruszały się razem. Inny ośrodek pobudzania powoduje ruch oczu od położenia równoległego wzajemnie ku sobie. Każde oko może się obracać do kącika, jeżeli drugie obraca się w stronę nosa, ale nie można świadomie bądź nieświadomie jednocześnie obrócić obojga oczu na zewnątrz. Przyczyną nie jest brak odpowiednich mięśni, ale to, że nie ma sposobu przesłania sygnału obrócenia obojga oczu na zewnątrz, chyba że spotkał nas wypadek albo że istnieje jakiś inny powód, na przykład nerw został przecięty. Mimo że mięśnie jednego oka mogą kierować je w różne strony, nawet jogin nie potrafi swobodnie obracać obojga oczu na zewnątrz pod kontrolą woli. Wydaje się bowiem, że nie sposób tego dokonać. Od początku istnieją w nas pewne połączenia. Sprawa ta jest ważna, ponieważ w większości starszych książek z dziedziny anatomii, psychologii itp. nie docenia się albo nie podkreśla faktu, że istnieje w nas tyle wrodzonych połączeń — twierdzi się tam, że wszystko jest po prostu wyuczone. 36-3. Komórki pręcikowe Rozpatrzmy teraz bardziej szczegółowo, co się dzieje w komórkach pręcikowych Rysunek 36.5 pokazuje elektronową mikrografię środka komórki pręcikowej (komórka
r~36-3. KOMÓRKI PRĘCIKOWE 161 ~210A 36.5. Elektronowa pręcikowej mikrografia komórki pręcikowa wychodzi poza pole widzenia). Warstwa za warstwą występują tu płaskie struktury pokazane z prawej strony w powiększeniu, zawierające substancję zwaną rodopsyną (czerwienią wzrokową), to znaczy barwik lub pigment umożliwiający zjawisko widzenia w pręcikach. Rodopsyna, która stanowi ten barwik, jest wielką proteiną, zawierającą szczególną grupę, zwaną retinenem. Grupę tę można oddzielić od proteiny i ona niewątpliwie stanowi główną przyczynę pochłaniania światła. Przyczyny występowania wspomnianych płaskich struktur nie rozumiemy, ale najprawdopodobniej z jakiegoś powodu wszystkie cząsteczki rodopsyny utrzymywane są w położeniach równoległych. Zjawisko to od strony chemicznej zostało już w dużym stopniu opracowane, ale może być potrzebne jeszcze trochę fizyki. Możliwe, że wszystkie cząsteczki są ułożone w rodzaj rzędu, tak że gdy jedna z nich zostaje pobudzona, wytworzony elektron na przykład przebiega wzdłuż rzędu aż do pewnego miejsca na końcu, umożliwiając sygnałowi wyjście na zewnątrz. To zagadnienie jest bardzo ważne i nie jest jeszcze opracowane. W dziedzinie tej zostaną pewnie w końcu wykorzystane wspólnie biochemia i fizyka ciała stałego lub inne jeszcze gałęzie wiedzy. Warstwowa budowa tego rodzaju pojawia się i w innych warunkach, gdzie światło odgrywa istotną rolę, np. w chloroplastach roślin, w których powoduje ono fotosyntezę. 1 Oglądając je w powiększeniu znajdujemy tę samą budowę z warstwami prawie takiego samego rodzaju, choć oczywiście występuje tutaj chlorofil zamiast retinenu. Wzór chemiczny retinenu pokazano na rys. 36.6. Retinen ma szereg na przemian podwójnych wiązań wzdłuż bocznego łańcucha, co jest charakterystyczną cechą prawie wszystkich silnie pochłaniających substancji organicznych, jak chlorofil, krew itp. Istoty ludzkie nie mogą wytworzyć tej substancji w swoich własnych komórkach — musimy ją przyjmować w jedzeniu. Zjadamy ją w postaci specjalnej substancji mającej taki sam wzór chemiczny, z tym tylko, & na prawym jej końcu przyczepiony jest :- Wodór. Substancję tę nazywamy witaminą A 1 jeśli jej nie zjadamy w dostatecznej ilości, nie jesteśmy zaopatrywani w retinen, oko zaś "lega tak zwanej nocnej ślepocie, ponieważ [ * rodopsynie nie wystarcza pigmentu do Wierzchowego widzenia pręcikowego. Przyczyna, dla której wspomniany szereg Podwójnych wiązań bardzo silnie pochłania CHi 36.6. Budowa retinenu i i -CH3 CHi I C\ .Cs CHj "O
162 .1ft MFCHAN17M WIDZfcNU światło, jest znana. O sprawie tej wspomnimy krótko: szereg na przemian podwójnych wiązań nazywamy sprzężonym wiązaniem podwójnym; wiązanie podwójne oznacza, że znajduje się tam dodatkowy elektron, który łatwo się przesuwa w prawo lub w lewo Gdy światło zderza się z cząsteczką, elektrony z każdego podwójnego wiązania zostają przesunięte o jedno miejsce. Wszystkie elektrony w całym łańcuchu przesuwają się jak szereg przewracających się kamieni domina i chociaż każdy z nich przesuwa sie niewiele (powinniśmy się spodziewać, że w pojedynczym atomie przesunięcie elektronu będzie niewielkie), w ostatecznym wyniku elektron z jednego końca przesunie się jak gdyby na drugi! Wygląda to tak, jak gdyby całą odległość tam i z powrotem przebył jeden elektron. W ten właśnie sposób pod wpływem pola elektrycznego uzyskujemy pochłanianie, które jest znacznie silniejsze wtedy, gdy elektron może przesuwać się o odległość związaną z jednym tylko atomem. Ponieważ więc łatwo przesuwać elektrony tam i z powrotem, retinen bardzo silnie pochłania światło; na tym polega mechanizm jego fizykochemicznego przeznaczenia. 36-4. Oko złożone (owadzie) Powróćmy teraz do biologii. Oko ludzkie nie jest jedynym rodzajem oka. Wprawdzie u kręgowców prawie wszystkie oczy mają zasadniczo taką samą budowę, jak oko ludzkie, ale wśród niższych zwierząt występuje jednak wiele innych rodzajów oczu. Są to plamki oczne, różne oczy kubkowate i inne mniej czułe obiekty, których nie mamy czasu omawiać U bezkręgowców istnieje jednak jeszcze inne, wysoko rozwinięte oko, mianowicie złożone oko owadzie (większość owadów mających duże oczy złożone posiada również rozmaite dodatkowe prostsze oczy). Owadem, którego widzenie zostało zbadane bardzo starannie, jest pszczoła. Badanie własności widzenia u pszczół jest łatwe, ponieważ można je przywabić do miodu. W doświadczeniu identyfikujemy miód przez umieszczenie go na nie bieskim lub czerwonym papierze i patrzymy, do którego z nich pszczoły przychodzą. Metodą tą odkryto wiele ciekawych zjawisk z dziedziny widzenia u pszczół. W pierwszym rzędzie próbowano zmierzyć, jak wyraźnie pszczoły mogą dostrzec różnicę barwy między dwoma kawałkami „białego" papieru. Niektórzy badacze stwierdzili. że sprawność pszczół w tym zakresie nie jest wielka, inni zaś znaleźli, że jest wprost fantastyczna. Pszczoły były w stanie odróżnić dwa kawałki białego papieru, nawet gdy kawałki te były prawie dokładnie takie same. Eksperymentatorzy wzięli jeden kawałek papieru koloru bieli cynkowej, a drugi koloru bieli ołowiowej i chociaż dla nas wyglądają one dokładnie tak samo, pszczoły mogą łatwo je odróżnić, ponieważ farby te w różnym stopniu odbijają nadfiolet. W ten sposób odkryto, że oko pszczoły jest czułe w szerszym zakresie widma niż nasze. Nasze oko działa w zakresie od 7000 A do 4000 A, od czerwieni do fioletu, oko zaś pszczoły może widzieć aż do 3000 A, w nadfiolecie! Powoduje to wiele różnych ciekawych zjawisk. Przede wszystkim pszczoły mogą rozróżniać wiele kwiatowi które dla nas wyglądają tak samo. Musimy oczywiście przy tym zdawać sobie sprane z tego, że barwy kwiatów nie są przeznaczone dla naszych oczu, ale dla oczu pszczół, są one sygnałami, które przyciągają pszczoły do określonego kwiatu Wiemy wszyscy,
^36-4 OKO ZŁOŻONE (OWADZIE) 163 że istnieje wiele „białych" kwiatów. Prawdziwa bie! najwyraźniej nie bardzo interesuje pszczoły, ponieważ wszystkie białe kwiaty mają, jak się okazuje, różne współczynniki odbicia w nadfiolecie; nie odbijają 100% nadfioletu, tak jak powinna czynić prawdziwa biel. Nie całe światło powraca, brak w nim nadfioletu, a to stanowi już pewną barwę; dokładnie tak jak u nas, gdzie brak barwy niebieskiej powoduje barwę żółtą. W ten sposób dla pszczół wszystkie kwiaty są barwne. Wiemy jednak, że pszczoły nie mogą widzieć czerwieni. Moglibyśmy się zatem spodziewać, że wszystkie czerwone kwiaty w oczach pszczół wyglądają czarno. Nic podobnego! Staranne badanie czerwonych kwiatów dowodzi, że po pierwsze — nawet naszym własnym okiem możemy zauważyć niebieskie zabarwienie u znacznej większości czerwonych kwiatów, ponieważ przeważnie odbijają one dodatkową ilość błękitu, który leży w części widma widzianej przez pszczoły. Po drugie — doświadczenie wykazuje, że kwiaty te różnią się swoimi własnościami odbijania nadfioletu w różnych częściach płatków itp. Gdybyśmy więc mogli widzieć kwiaty tak, jak je widzą pszczoły, wydałyby się nam one jeszcze piękniejsze i różnorodniejsze! Wykazano jednak, że istnieją pewne czerwone kwiaty, które nie odbijają światła w dziedzinie błękitu i wobec tego pszczołom powinny wydawać się czarne! Niepokoiło to bardzo zajmujących się tymi sprawami, ponieważ wydaje się, że czerń jest nieciekawą barwą, bo trudno odróżniać brudne cienie. Okazało się, że rzeczywiście kwiaty te nie są odwiedzane przez pszczoły, odwiedzane są zaś przez kolibry, a kolibry mogą widzieć czerwień! Innym ciekawym aspektem widzenia u pszczół jest to, że patrząc na skrawek błękitnego nieba mogą one niewątpliwie określić kierunek słońca, nie widząc jego samego. My nie możemy łatwo tego dokonać. Czy patrząc przez okno na niebo i widząc, że jest ono błękitne, wiemy na pewno, w którym kierunku znajduje się słońce? Pszczoła może to określić, ponieważ jest dość wrażliwa na polaryzację światła, a rozproszone światło nieba jest spolaryzowane*' Nadal roztrząsa się problem, jaki jest mechanizm tej wrażliwości. Nie wiadomo jeszcze, czy dzieje się tak dlatego, że odbicie światła jest różne w różnych warunkach, czy też że samo oko pszczoły jest bezpośrednio wrażliwe**'. Mówi się także, że pszczoła może zauważyć migotanie aż do częstości 200 drgań na sekundę, podczas gdy my widzimy je tylko do 20. Ruchy pszczół w ulu są bardzo szybkie: nogi ich poruszają się, a skrzydła drgają, ale naszym okiem bardzo trudno zauważyć te ruchy. Moglibyśmy je zobaczyć, gdyby proces widzenia zachodził u nas szybciej. Fakt, te oko pszczoły wykazuje taką szybką reakcję, przypuszczalnie ma dla niej duże znaczenie. Omówimy teraz ostrość widzenia, jakiej możemy oczekiwać u pszczół. Oko pszczoły jest okiem złożonym i składa się z wielkiej liczby specjalnych komórek, zwanych fasetkami {ommatidia) ułożonych stożkowo na powierzchni kulistej (w przybliżeniu) na zewnątrz głowy pszczoły. Rysunek 36.7 przedstawia obraz jednej takiej fasetki. Na szczycie znaj- *' Oko ludzkie również wykazuje niewielką wrażliwość na polaryzację światła i można nauczyć ■, *•? określania położenia Słońca! Zjawisko, które tu wchodzi w grę, nazywamy figurą Haidingera. Jest j «0 niewyraźny, żółtawy, klepsydrowaty obraz pojawiający się w środku pola widzenia, gdy patrzymy | P*2ez polaryzujące szkła na szeroką bezkształtną przestrzeń. Można ją także zobaczyć na błękitnym L-webie bez szkieł polaryzacyjnych, jeśli się obraca głową tam i z powrotem wokół osi wzroku. fef •*> Dane uzyskane od czasu, w jakim wygłoszono ten wykład, wskazują, że oko jest bezpośrednio E*Ąrażliwe. fii»
164 36. MECHANIZM WIDZENIA duje się przezroczysty obszar, rodzaj „soczewki", ale właściwie przypomina on bardziej filtr lub rurę świetlną przeprowadzającą światło wzdłuż wąskiego włókna, w którym przypuszczalnie zachodzi pochłanianie. Z drugiego końca fasetki wychodzi włókno nerwowe. Środkowe włókno otoczone jest po bokach sześcioma komórkami, które w ogóle wydzieliły z siebie włókno. Opis ten wystarczy dla naszych celów; istotne jest to, że w grę wchodzi przedmiot stożkowaty i że wiele ich można ułożyć obok siebie na całej powierzchni oka pszczoły. Omówmy teraz zdolność rozdzielczą oka pszczoły. Rysując kreski (rys. 36.8), przedstawiające fasetki na powierzchni będącej z założenia kulą o promieniu r, możemy właściwie obliczyć jak szeroka jest każda fasetka, korzystając z własnego rozumu i zakładając, że ewolucja powinna doprowadzić do rozwiązań, które sami uznalibyśmy za najmądrzejsze! Jeśli fasetka będzie bardzo szeroka, nie osiągniemy dużej zdolności rozdzielczej. Znaczy to, że jedna komórka odbierze część informacji z jednego kierunku, a przyległa komórka odbierze część informacji z drugiego kierunku, i tak dalej, w wyniku czego pszczoła nie będzie mogła bardzo dobrze widzieć przedmiotów pośrednich. Tak więc błąd w ostrości widzenia będzie na pewno odpowiadać pewnemu kątowi, mianowicie kątowi rozwarcia końca fasetki względem środka krzywizny oka (komórki oczne leżą oczywiście tylko na powierzchni kuli; wewnątrz niej znajduje się głowa pszczoły). Kąt ten mierzony między sąsiednimi fasetkami jest oczywiście średnicą fasetki podzieloną przez promień powierzchni oka: A8% = 5lr (36.1) Możemy więc powiedzieć: „Im weźmiem mniejsze 5, tym większa będzie ostrość widzenia. Dlaczego więc pszczoły nie mają po prostu bardzo drobnych fasetek?" Odpowiedź: Fizykę znamy wystarczająco dobrze, żeby zrozumieć, że usiłując złapać światło w wąską szczelinę nie możemy patrzeć dokładnie w wybranym kierunku z powodu zjawiska dyfrakcji. Ponieważ wpadać może światło przychodzące z wielu kierunków, na skutek dyfrakcji odbierzemy też światło wchodzące pod kątem ABA takim, że A0d = X/8. (36.2) Widzimy teraz, że jeżeli weźmiemy za małe ó, wówczas z powodu dyfrakcji każda fasetka będzie patrzeć nie tylko w wybranym kierunku, ale i obok! Jeśli fasetki będą za duże, to wprawdzie każda będzie patrzeć w określonym kierunku, ale liczba ich nie wystarczy do uzyskania dobrego widzenia scenerii. Musimy więc dobrać 6 w taki sposób, aby całkowity wpływ powyższych dwu efektów był minimalny. Dodając je razem i szukając punktu, w którym suma ma minimum (rys. 36.9) znajdziemy, że 36.7. Budowa fasetki (ommatidiuni) — pojedynczej komórki oka złożonego d(J0, + J0d) J__ db co daje nam wartość <5 = 7>lr (36.3) (36.4)
36-4. OKO ZŁOŻONE (OWADZIE) 165 36.8. Schematyczny obraz ułożenia fasetek w oku pszczoły 36.9. Optymalnym rozmiarem dla fasetki jest Sm Jeśli założymy, że r wynosi około 3 mm, przyjmiemy, że światło widziane przez pszczołę ma długość fali 4000 A, zbierzemy to razem i wyciągniemy pierwiastek kwadratowy, to znajdziemy <5 = (3-10~3-4-10"7)im = = 3,5-10-5m = 35u. (36.5) Podręczniki podają, że średnica ta wynosi 30 u, otrzymaliśmy zatem dość dobrą zgodność! Widocznie więc cały rachunek jest rzeczywiście sensowny i możemy zrozumieć, jakie czynniki określają rozmiary oka pszczoły! Łatwo także wstawić z powrotem powyższe liczby i znaleźć, jaka jest właściwie sprawność oka pszczoły w rozdzielaniu kątowym. Okazuje się, że jest ono pod tym względem znacznie gorsze od naszego. My dostrzegamy przedmioty o pozornych rozmiarach 30 razy mniejszych niż te, które widzi pszczoła. W porównaniu z tym, co my możemy widzieć, wzrok pszczoły daje raczej mętny i nieostry obraz. Mimo to pszczołom tyle wystarcza i to jest wszystko, na co je stać. Moglibyśmy się zapytać, dlaczego pszczoły nie rozwinęły sobie dobrego oka, podobnego do naszego, z soczewką i tak dalej. Można podać szereg ciekawych przyczyn. Po pierwsze, pszczoła jest na to za mała: gdyby miała takie oko jak nasze, ale w swojej skali, wówczas otwór miałby średnicę około 30 u i dyfrakcja odgrywałaby tak ważną rolę, że pszczoła zupełnie by nie mogła bardzo dobrze widzieć. Oko nie jest dobre, jeśli jest za małe. Po wtóre, gdyby oko było tej wielkości co głowa pszczoły, zajmowałoby jej całą głowę. Piękno oka złożonego polega na tym, że nie zajmuje ono dużo miejsca, stanowi po prostu bardzo cienką warstwę na powierzchni głowy pszczoły. Gdy więc dowodzimy, że pszczoły powinny były rozwinąć sobie oko na nasz sposób, musimy pamiętać, że stały one przed swoimi własnymi problemami! 68 Mm i ^^Mfl5 -d/r A6d**\/6 36-5. Jeszcze inny rodzaj oczu Poza pszczołami wiele innych zwierząt może widzieć barwy. Ryby, motyle, ptaki i gady 'nogą widzieć barwy, ale większość ssaków nie może, jak się przypuszcza. Naczelne (Prima- s| *w) mogą widzieć barwy. Ptaki z pewnością widzą barwy, co uzasadnia ich własne ubar-
166 J6. MECHANIZM WIDZENIA wienie. Nie miałoby celu istnienie tak świetnie barwnie upierzonych samców, gdyby samice nie mogły tego zauważać! Tak więc rozwój płciowego „wabika" u ptaków jest wynikiem zdolności samicy do widzenia barw. Gdy więc w przyszłości będziemy się przyglądać pawiowi i pomyślimy sobie, jaki też świetny widzimy pokaz bogatych barw i jak delikatne są wszystkie odcienie i jakie wspaniałe wrażenie estetyczne daje podziwianie tego wszystkiego, to powinniśmy gratulować nie pawiowi, a pawicy, ponieważ ona to właśnie dzięki ostrości wzroku i zmysłowi estetycznemu jest prawdziwym twórcą tego pięknego widowiska! Wszystkie kręgowce mają oczy bardzo podobne do naszych, wszystkie zaś bezkręgowce mają albo słabo rozwinięte oczy, albo oczy złożone. Jest jednak jeden wyjątek. Rozpatrując najwyższe formy zwierzęce, mówimy zwykle „to my". Jeśli jednak przyjmiemy bardziej skromny punkt widzenia i ograniczymy się do bezkręgowców, aby wykluczyć nas samych, i zapytamy, jakie bezkręgowe zwierzę jest na najwyższym stopniu rozwoju, to większość zoologów zgodzi się na ośmiornicę] Bardzo ciekawe, że rozwijając mózg, jego reakcje itd. odpowiednie dla bezkręgowca? ośmiornica rozwinęła jednak niezależnie, zupełnie inne oko. Nie jest to ani oko złożone, ani plamka oczna — ma ono rogówkę, ma powieki, tęczówkę, soczewkę, dwie komory i siatkówkę z tyłu. Jest ono zasadniczo takie samo jak oko kręgowców! Mamy tu dobitny przykład zbieżności ewolucyjnej; przyroda dwa razy odkryła rozwiązanie tego samego zagadnienia, z jednym małym ulepszeniem. Zdumiewające, że siatkówka ośmiornicy jest, jak się okazuje, kawałkiem mózgu, który w swoim rozwoju embrionalnym wysunął się w taki sam sposób jak u kręgowców. Ciekawą jednak cechą odróżniającą oko ośmiornicy jest to, że komórki światłoczułe znajdują się od wewnątrz, a komórki dokonujące obliczeń — za nimi, a nie są „wywrócone na lewą stronę" jak w naszym oku. Widzimy więc wreszcie, że nie ma ważnego powodu tego wywrócenia. Gdy przyroda ponowiła próbę budowy oka, otrzymała już poprawne rozwiązanie (patrz rys. 36.10). Największymi oczami na świecie są oczy archikalmara. Znaleziono takie, które mają do 36 cm średnicy! 36-6. Neurologia widzenia Jednym z głównych punktów naszego zagadnienia jest wzajemny związek informacji pochodzących z różnych części oka. Rozważmy złożone oko skrzypłocza (Limulus poly- phemuś), na którym przeprowadzono wiele doświadczeń. Musimy przede wszystkim zdać sobie sprawę, jaki rodzaj informacji może biec wzdłuż nerwów. Nerw przenosi rodzaj zaburzenia, które przejawia się jako łatwe do wykrycia działanie elektryczne, rodzaj biegnącego wzdłuż nerwu zakłócenia falowego, które wytwarza pewne działanie na końcu:
36-6. NEUROLOGIA WIDZENIA 167 informacje przenosi długi odcinek ko- a) morki nerwowej zwany włóknem osio- J v wym (aksonem). Jeśli pobudzamy go - * H £ ;. ,, z jednego końca, przebiega po nim '.,' \v *"* u'* i ^ V * • * specjalny rodzaj impulsu, zwany „po- j\*»"X» '** "• •* * tencjałem szczytowym" („iglicą"). Gdy »** *' - ' *•*• taki potencjał szczytowy przebiega wzdłuż nerwu, następny nie może natychmiast za nim podążać. Wszystkie potencjały szczytowe są tej samej wysokości, gdy więc akson zostaje silniej ' m % pobudzony, otrzymujemy nie wyższe potencjały szczytowe, lecz więcej potencjałów szczytowych na sekundę. i Jl Wysokość potencjału szczytowego jest ^ określona przez samo włókno. Trzeba y zdawać sobie z tego sprawę, aby móc * śledzić, co się dalej dzieje. Rysunek 36.1 la pokazuje złożone 36u. złożone 0ko skrzyplocza: a) widok normalny, oko skrzypłocza; oko to nie ma bardzo b) przekrój wyszukanej budowy, liczy zaledwie około tysiąca fasetek. Rysunek 36.1 Ib przedstawia przekrój układu; można na nim zobaczyć fasetki i włókna nerwowe, które z nich wychodzą i biegną do mózgu. Ale zauważmy, że nawet u skrzypłocza istnieje mało wewnętrznych połączeń. Są one znacznie mniej wyszukane niż w oku ludzkim i daje to nam możność badania prostszego przykładu. Spójrzmy teraz na doświadczenia, które przeprowadzano umieszczając cienkie elektrody w nerwie wzrokowym skrzypłocza. Następnie puszczano światło tylko na niektóre fasetki, co łatwo zrobić za pomocą soczewek. Włączając światło w pewnej chwili t0 i mierząc wychodzące impulsy elektryczne stwierdzimy, że po niewielkim opóźnieniu (okresie utajenia) następuje szereg szybkich wyładowań, które stopniowo zwalniają do jednostajnej częstości, jak pokazuje rys. 36.12a. Gdy światło się wyłącza, wyładowania ustają. Ciekawe, że gdy puszczamy światło nie na tę fasetkę, której włókno nerwowe jest połączone ze wzmacniaczem, wówczas nic się nie dzieje; sygnału nie ma! Przeprowadzamy teraz inne doświadczenie: puszczamy światło na początkowo wybraną fasetkę i otrzymujemy tę samą reakcję co poprzednio; jeśli teraz oświetlamy także i sąsiednie fasetki, drgania na krótko ustają, a następnie płyną ze znacznie mniejszą częstością. A więc tempo działania jednej fasetki jest hamowane przez impulsy przychodzące z drugiej. Inaczej mówiąc, każde włókno przenosi informacje od jednej tylko fasetki, ale liczba przenoszonych informacji jest hamowana przez sygnały z innych fasetek. Jeśli więc na Przykład całe oko będzie oświetlone w przybliżeniu jednostajnie, to informacja przychodząca z określonej fasetki będzie stosunkowo słaba, ponieważ jest ona hamowana przez wiele innych. Hamowanie jest rzeczywiście addytywne —jeśli oświetlamy wiele sąsiadu-
168 36 MECHANIZM WIDZENIA splot boczny a) receptory nerw Wl*^ ~*- do wzrokowy—Jr wzmacniacza i.i i I l l i i światło w: ł splot l boczny "" receptory b) nerw w7rnknwv ' rin ''1Tl """" ' i .'iihliiid'UMillniu iii rriiiiKiini.r.frlnh rffiiri wzmacniacza 36.12. Odpowiedzi na światło włókien nerwowych w oku skrzypłocza jących fasetek, hamowanie jest bardzo duże. Staje się ono większe, gdy fasetki znajdują się bliżej siebie, a jeśli znajdują się dostatecznie daleko, hamowania praktycznie nie ma. Jest ono więc addytywne i zależy od odległości. Mamy tu pierwszy przykład tego, jak są zestawiane w oku informacje z różnych jego części. Zastanawiając się przez chwilę, zauważymy może, że system ten służy do wzmacniania kontrastu na krawędziach przedmiotów, ponieważ jeżeli część pola widzenia jest jasna, a część czarna, fasetki w jasnym obszarze wytwarzają impulsy hamowane przez całe pozostałe światło w sąsiedztwie. W rezultacie są one stosunkowo słabe. Z drugiej zaś strony pewna graniczna fasetka odbierająca „biały" impuls jest wprawdzie hamowana przez sąsiednie fasetki, ale nie tak liczne, ponieważ niektóre z nich są czarne; wypadkowy sygnał jest więc silniejszy. W rezultacie powstanie więc krzywa podobna do krzywej z rys. 36.13. Skrzypłocz zobaczy wzmocnienie konturu. Fakt wzmacniania konturów był znany od dawna; to naprawdę ważne zjawisko było wiele razy komentowane przez psychologów. Aby narysować jakiś przedmiot, wystarczy podać tylko jego zarys (sylwetkę). Jakże jesteśmy przyzwyczajeni do patrzenia na obrazy, na których widać tylko zarys! Czym jest zarys? Jest to tylko ostra granica między światłem a ciemnością albo między jedną barwą a drugą. Nie jest to coś dobrze określonego. Można wierzyć w to lub nie, ale nieprawda, że każdy przedmiot jest ograniczony pewną linią! Takiej linii w przyrodzie nie ma. Jest ona tylko wynikiem naszej własnej kosmetyki psychologicznej. Zaczynamy więc rozumieć, dlaczego linia jest wystarczającym kluczem 36.13. Czyste odpowiedzi fasetek skrzypłocza w pobliżu ostrej zmiany oświetlenia • m— odpowiedź fasetki ■ » i — oświetlenie > ..
16-6 NEUROLOGIA WIDZENIA 169 do zobaczenia całego przedmiotu. Przypuszczalnie bowiem nasze własne oko działa w sposób, podobny do wyżej opisanego, chociaż znacznie bardziej złożony. Na koniec krótko opiszemy pewną znacznie bardziej pomysłową pracę, na bardzo wysokim poziomie, wykonaną na żabie. W doświadczeniu tym, wprowadzając bardzo delikatne, pięknie zrobione igłowe sondy do nerwu wzrokowego żaby, można odebrać sygnały biegnące wzdłuż jednego określonego aksonu. Okazuje się, że jak w przypadku skrzypłocza, informacja zależy nie tylko od jednego punktu w oku, ale jest sumą informacji z wielu punktów. Według najnowszych poglądów obraz działania oka żaby jest następujący. Można znaleźć cztery rodzaje włókien nerwu wzrokowego, różne w tym sensie, że istnieją cztery różne rodzaje ich reakcji. Doświadczenia te nie były wykonane metodą włączania i wyłączania puszczanych impulsów światła, ponieważ nie na tym polega normalne widzenie żaby. Żaba po prostu siedzi sobie na przykład na liściu lilii wodnej i jej oczy nigdy się nie poruszają, chyba że liść faluje. W tym wypadku oczy tak właśnie łypią, że obraz pozostaje nieruchomy. Żaba nie zwraca swoich oczu w określoną stronę. Jeśli cokolwiek porusza się w jej polu widzenia, np. mały owad (żaba musi umieć dostrzegać coś małego poruszającego się na nieruchomym tle), wówczas okazuje się, że następuje w tej chwili wyładowanie w czterech różnych rodzajach włókien. Dane dotyczące ich własności zebrane są w tab. 36.1. Pierwsze hasło w tej tabeli (niewymazywalne wykrywanie nieruchomej krawędzi) oznacza, że gdy wprowadzimy pewien przedmiot krawędzią do pola widzenia żaby, wówczas w danym włóknie pojawią się w czasie ruchu przedmiotu liczne impulsy, które potem spadną do pewnego stałego poziomu, utrzymującego się tak długo, jak długo krawędź nawet nieruchoma będzie znajdowała się w polu widzenia. Impulsy ustają, jeśli wyłączamy światło. Jeśli je znowu włączamy, a krawędź nadal pozostaje w polu widzenia, impulsy zaczynają się od nowa. Nie są one wymazywalne. Drugi rodzaj włókien jest bardzo podobny do pierwszego, z tym tylko, że nie działają one, gdy krawędź spoczywa. Krawędź ta musi być wypukła i zaciemniona od strony przedmiotu! Jakże złożony musi być układ wzajemnych połączeń w siatkówce oka żaby, aby mogła ona zrozumieć, że w polu widzenia pojawiła się wypukła figura! Poza tym włókno to reaguje wprawdzie na stan stacjonarny, ale jednak nie tak długo jak poprzednio i jeśli wyłączamy światło, a potem znowu je włączamy, reakcja Tabela 36.1. Typy odpowiedzi we włóknach nerwu wzrokowego żaby Typ 1. Wykrywanie nieruchomego brzegu (niewymazywalne) 2. Wykrywanie wypukłej krawędzi (wymazywalne) 3. Wykrywanie zmieniającego się kontrastu 4. Wykrywanie przyciemnienia 5. Wykrywanie ciemności Szybkość 0,2-0,5 m/s 0,5 m/s 1-2 m/s do i m/s 7 Pole kątowe 1° 2°-3° 7°-10° do 15° bardzo duże
170 36 MECHANIZM WIDZENIA się nie odbudowuje. Jest ona związana z ruchem wypukłej figury. Oko widzi, że figura wsunęła się w pole widzenia, i pamięta, że w nim pozostała, ale jeśli tylko na chwilę wyłączymy światło, oko po prostu zapomina o niej i więcej jej już nie widzi. Innym przykładem zestawiania w oku informacji jest wykrywanie kontrastu. Jeśli jakaś krawędź wsuwa się lub wysuwa z pola widzenia, pojawiają się impulsy, ale jeśli przedmiot spoczywa, nie ma ich wcale. Istnieje następnie w oku żaby wykrywacz ściemniania. Daje on impulsy wtedy' gdy natężenie światła spada, ale gdy nie ulega ono zmianie lub wzrasta, impulsy ustają. Działa on tylko wtedy, gdy światło ulega ściemnieniu. Istnieje tam wreszcie kilka włókien, wykrywaczy ciemności, które — rzecz zdumiewająca — są przez cały czas czynne! 36.14. Pokrywa (tectum) żaby Jeśli zwiększymy światło, ich czynność słabnie, ale nie ustaje. Jeśli zmniejszymy światło, ich czynność wzrasta bardzo gwałtownie, choć jest jednostajna. W ciemności jest bardzo intensywna, sygnalizując „ciemno! ciemno! ciemno!". Reakcje te wydają się dość skomplikowane i można się zastanawiać, czy doświadczenia te nie są aby źle interpretowane. Ciekawe jednak, że te same cztery rodzaje włókien można bardzo wyraźnie rozróżnić w anatomii żaby! Po sklasyfikowaniu powyższych reakcji (ważne jest tutaj, że po) dzięki innym pomiarom odkryto, że szybkości przenoszenia sygnałów wzdłuż różnych włókien są różne, mamy więc inną, niezależną drogę sprawdzenia, który rodzaj włókna znaleźliśmy w danej chwili. Innym ciekawym zagadnieniem jest sprawa: jak wielki obszar ogarnia w swoich obliczeniach jedno określone włókno? Odpowiedź jest różna dla różnych rodzajów włókien. Rysunek 36.14 pokazuje tak zwaną pokrywę (tectum) żaby, gdzie nerwy wzrokowe wchodzą do mózgu. Wszystkie włókna nerwowe wychodzące z nerwu wzrokowego włączają się do rozmaitych warstw pokrywy. Ta warstwowa budowa podobna jest do siatkówki i stąd m. in. wiemy właśnie, że mózg i siatkówka są bardzo do siebie podobne. Przesuwając elektrodę w dół przez kolejne warstwy możemy stwierdzić, gdzie kończą się różne rodzaje nerwów wzrokowych. Otrzymujemy piękny i wspaniały wynik, że różne rodzaje włókien kończą się w różnych warstwach! Pierwsze kończą się w typie numer 1, drugie w typie numer 2, trzecie i piąte kończą się w tym samym miejscu, a numer czwarty znajduje mC najgłębiej ze wszystkich. (Cóż za nadzwyczajna zgodność, że zostały one ponumerow.me
36-6. NEUROLOGIA WIDZENIA 171 we właściwym porządku! O nie, właśnie z tej przyczyny zostały one uszeregowane w podany sposób; pierwsza publikacja podawała numery w innym porządku!) To, czego się nauczyliśmy, możemy teraz krótko podsumować. W oku istnieją przypuszczalnie trzy pigmenty. Istnieje być może wiele różnych rodzajów komórek receptorowych zawierających trzy barwiki w różnych stosunkach, ale istnieje też wide połączeń krzyżowych, które umożliwiają dodawanie i odejmowanie w postaci dodawania i wzmacniania w układzie nerwowym. Zanim więc naprawdę zrozumiemy, jak przebiega proces widzenia barwnego, będziemy musieli zrozumieć powstawanie wrażeń końcowych. Temat ten jest nadal otwarty, ale wspomniane badania za pomocą mikroelektrod i podobne w końcu dostarczą nam być może więcej informacji o tym, jak widzimy barwy.
37 efekty kwantowe 37-1. Mechanika atomowa W kilku ostatnich rozdziałach omówiliśmy podstawowe pojęcia niezbędne do zrozumienia większości zjawisk dotyczących światła lub bardziej ogólnie — promieniowania elektromagnetycznego. (Kilka zagadnień pozostawiliśmy do omówienia w następnym tomie, przede wszystkim teorię zjawiska załamania dla ciał o niezbyt małej gęstości oraz całkowite odbicie wewnętrzne.) To, o czym mówiliśmy dotąd, nosi nazwę „klasycznej teorii" fal elektrycznych. Jak się okazuje, jest ona całkowicie wystarczającym opisem przyrody w odniesieniu do dużej liczby zjawisk. Nie musieliśmy się dotąd martwić tym, że energia światła przybywa w małych „grudkach", zwanych fotonami. Chcielibyśmy z kolei omówić zachowanie się stosunkowo dużych porcji materii, np. ich własności mechaniczne i cieplne. Gdy przejdziemy do tego zagadnienia, przekonamy się, że zastosowanie tu „klasycznej" (czyli starszej) teorii zawodzi niemal natychmiast - materia bowiem jest zbudowana z cząstek o rozmiarach atomowych. Mimo to będziemy się zajmować jedynie klasyczną stroną zagadnienia, gdyż tylko to możemy zrozumieć posługując się mechaniką klasyczną, którą poznaliśmy do tej pory. Jednak wielkich sukcesów nie osiągniemy. Przekonamy się, że w przypadku materii, w przeciwieństwie do światła, natrafimy na trudności stosunkowo szybko. Moglibyśmy oczywiście pomijać bez przerwy efekty atomowe, zamiast tego jednak odbędziemy obecnie krótki wypad w świat podstawowych pojęć związanych z kwantowymi własnościami materii, tzn. przedstawimy kwantowe koncepcje fizyki atomowej. Da nam to pewne pojęcie o tym, co pomijamy. Będziemy bowiem musieli pominąć kilka ważnych zagadnień, do których zbliżenia nie możemy uniknąć. Obecnie dokonamy więc pewnego wprowadzenia do mechaniki kwantowej, jednak samą istotę tego przedmiotu będziemy mogli zgłębić dopiero znacznie później. „Mechanika kwantowa" jest uwzględniającym wszelkie szczegóły opisem zachowania się materii, w szczególności jest opisem zjawisk zachodzących w skali atomowej. Bardzo
37-1. MECHANIKA ATOMOWA 173 małe obiekty zachowują się zupełnie inaczej niż obiekty, z którymi mamy do czynienia bezpośrednio. Nie zachowują się ani jak fale, ani jak cząstki, nie zachowują się jak chmury, czy kule bilardowe lub ciężarki na sprężynach, ani jak coś, co kiedykolwiek widzieliśmy. Newton uważał, że światło składa się z cząstek, później jednak wykryto, jak przekonaliśmy się o tym na podstawie poprzednich rozdziałów, że zachowuje się ono jak fale. Jeszcze później (na początku XX w.) stwierdzono jednak, że światło rzeczywiście zachowuje się czasami jak cząstki. Początkowo uważano, że elektron zachowuje się jak cząstka, potem jednak stwierdzono, że pod wieloma względami przypomina on falę. W rzeczywistości zaś nie zachowuje się ani jak fala, ani jak cząstka. Pogodziliśmy się już z tym obecnie. Możemy więc powiedzieć: „On nie jest podobny do czegokolwiek". Jedna rzecz jest w tej sytuacji pocieszająca — elektrony zachowują się tak samo jak światło. Efekty kwantowe związane z zachowaniem się obiektów atomowych (elektronów, protonów, neutronów, fotonów itd.) są takie same; wszystkie są falami materialnymi, czy jak je nazwiemy. To, czego dowiemy się o własnościach elektronów (którymi będziemy operować przykładowo), będzie więc również słuszne dla innych „cząstek", z fotonami włącznie. Stopniowe nagromadzenie informacji o zjawiskach atomowych, dokonane podczas pierwszego ćwierćwiecza naszego stulecia, dało pewne wyobrażenie o tym, jak zachowują się małe obiekty, równocześnie jednak powstało pewne zamieszanie, z którego wyjście zostało wskazane w latach 1926 i 1927 przez Schródingera, Heisenberga i Borna. Otrzymali oni w końcu niesprzeczny opis zachowania się materii w bardzo małej skali. Głównymi cechami tego opisu zajmiemy się w tym rozdziale. Ponieważ zachowanie się atomów w niczym nie przypomina zachowania się obiektów, z jakimi mamy do czynienia na co dzień, bardzo trudno to zachowanie zrozumieć i wydaje się ono bardzo dziwne każdemu — zarówno nowicjuszowi, jak i doświadczonemu fizykowi. Nawet eksperci nie rozumieją go tak, jak by tego pragnęli i jest to zupełnie zrozumiałe, całe bowiem nasze bezpośrednie doświadczenie i intuicja odnoszą się do dużych obiektów. Wiemy, jak się będą one zachowywać. Obiekty bardzo małe nie zachowują się jednak tak jak duże. Trzeba poznawać je na drodze abstrakcyjnej, a nie przez powiązanie z naszym bezpośrednim doświadczeniem. W rozdziale tym zajmiemy się od razu przypadkiem, w którym tajemniczość zjawisk atomowych występuje szczególnie jaskrawo. Opiszemy zjawisko, którego zupełnie, ale to zupełnie nie można wytłumaczyć w jakikolwiek klasyczny sposób i w którym tkwi sama istota mechaniki kwantowej. W gruncie rzeczy nie potrafimy całkowicie wyjaśnić tajemniczego charakteru tego zjawiska, to znaczy nie umiemy „wytłumaczyć", dlaczego ono przebiega w taki a nie inny sposób, możemy natomiast opowiedzieć, w jaki sposób ono przebiega, a mówiąc o tym, opowiemy równocześnie o podstawowych osobliwościach mechaniki kwantowej w ogóle. 37-2. Doświadczenie z pociskami Aby spróbować zrozumieć kwantowe zachowanie się elektronów, porównamy i przeciwstawimy ich zachowanie się zachowaniu się pocisków i fal, w rodzaju fal wodnych, w okre-
174 37. HFFKTY KWANTOWf ruchomy detektor ** karabin *^>. "^ 12 przesłona a) 37.1. Doświadczenie z pociskami V pochłaniacz b) /}2-/',+p2 c) ślonym zestawie eksperymentalnym. Zaczynamy od zbadania zachowania się pocisków w zestawie doświadczalnym pokazanym schematycznie na rys. 37.1. Mamy tu karabin maszynowy, 7 którego nieustannie wylatują pociski. Nie jest to zbyt dobry karabin, gdyż jak widzimy z rysunku, wyrzuca on pociski w sposób przypadkowy w obszar stosunkowo dużego kąta. Przed karabinem mamy ścianę (wykonaną z płyt pancernych) z dwoma otworami na tyle dużymi, aby pocisk mógł przez nie przejść. Za ścianą tą znajduje się pochłaniacz pocisków. Może nim być np. gruba drewniana ściana, w której pociski grzęzną. Przed ta drewnianą ścianą mamy urządzenie, które będziemy nazywać detektorem pocisków. Może to być pudełko z piaskiem. Pociski wchodzące do detektora będą się w nim zatrzymywać i gromadzić. Od czasu do czasu możemy opróżnić pudełko i przeliczyć pociski, które do niego wpadły. Detektor można przesuwać tam • z powrotem w kierunku, który będziemy nazywać kierunkiem x. Za pomocą tego urządzenia możemy udzielić odpowiedzi na pytanie: „Jakie jest prawdopodobieństwo tego, że pocisk, który przeszedł przez otwory w ścianie, dotrze do pochłaniacza w odległości x od środka"? Trzeba sobie przede wszystkim zdać sprawę z tego, że musimy posługiwać się pojęciem „prawdopodobieństwa", nie możemy bowiem powiedzieć z całą pewnością dokąd dany pocisk dotrze Pocisk, który trafi w jeden z otworów, może odbić się od jego krawędzi i trafić w dowolne miejsce. Przez „prawdopodobieństwo" rozumiemy tu szansę znalezienia pocisku w detektorze: można je 7mierzyć obliczając liczbę pocisków, które znajdą się w detektorze w pewnym okresie czasu, a następnie znajdując stosunek tej liczby do całkowitej liczby pocisków, które w iyr» samym czasie ugrzęzły w pochłaniaczu. Jeśli założymy, że karabin w czasie pomiaru strzela z tą samą szybkością, prawdopodobieństwo o które nam chodzi, jest po prostu proporcjonalne do liczby pocisków, które osiągnęły detektor w pewnym standardowym przedziale czasu.
37-2. DOŚWIADCZENIE Z POCISKAMI 175 Dla naszych obecnych celów przyjmiemy, że mamy do czynienia z cokolwiek wyidealizowanym doświadczeniem. Pociski nie są zwykłymi pociskami, lecz są niezniszczalne — nigdy nie rozpadają się na połowę. W naszym doświadczeniu zawsze przybywają one w takich samych porcjach i jeżeli znajdziemy coś w detektorze, jest to zawsze cały pocisk. Jeśli szybkość, z jaką strzela karabin maszynowy, będzie bardzo mała, stwierdzimy, że w danej chwili albo nic nie przybywa, albo jeden i tylko jeden pocisk dociera do pochłaniacza. Również rozmiary dochodzącego pocisku nie zależą od szybkości, z jaką strzelamy. W związku z tym mówimy: „Pociski zawsze przybywają w jednakowych »grud- kach«". Za pomocą naszego detektora mierzymy prawdopodobieństwo pojawienia się takiej grudki. Przy tym mierzymy je jako funkcję x. Wyniki pomiarów wykonanych za pomocą tego urządzenia (doświadczenie takie nie zostało dotychczas wykonane, wyobrażamy więc sobie tylko wyniki) podano w postaci wykresu w części c rys. 37.1. Na wykresie odłożono prawdopodobieństwo na osi poziomej, a x na osi pionowej, oś x przebiega więc w takim samym kierunku, jaki ma wielkość x, którą określiliśmy w urządzeniu. Zmierzone prawdopodobieństwo oznaczamy jako Pl2, gdyż kule mogły przejść albo przez otwór /, albo przez otwór 2. Nie powinno nas dziwić, że wartość Pxl jest duża dla środkowej części wykresu i staje się bardzo mała, gdy x jest bardzo duże. Moglibyśmy się jednak zastanowić, dlaczego prawdopodobieństwo Pl2 ma wartość maksymalną dla x = 0. Fakt ten można jednak zrozumieć, jeżeli przeprowadzimy ponownie nasze doświadczenie, zasłaniając za pierwszym razem otwór 2, a za drugim — otwór /. Gdy otwór 2 będzie zasłonięty, pociski będą mogły przechodzić tylko przez otwór / i wówczas otrzymamy krzywą oznaczoną w części b rysunku jako P,. Jak można było oczekiwać, jej maksimum leży na przecięciu się osi x z prostą przechodzącą przez karabin i otwór 1. Gdy otwór l będzie zasłonięty, otrzymamy symetryczną względem poprzedniej, widoczną na rysunku krzywą P2. Krzywa P2 jest krzywą rozkładu prawdopodobieństwa dla kul przechodzących przez otwór 2. Porównując części b i c rys. 37.1 otrzymujemy ważny wynik: PI2 = P,+P2. (37.1) Prawdopodobieństwa po prostu się dodają. Efekt występujący przy odsłoniętych obu otworach jest sumą efektów występujących, gdy jeden z otworów jest zasłonięty. O otrzymanym wyniku - z przyczyn które poznamy później - mówimy, że stwierdziliśmy „brak interferencji". Tyle o pociskach. Przybywają one w „grudkach", a prawdopodobieństwo ich pojawienia się nie wykazuje interferencji. 37-3. Doświadczenie z falami Obecnie rozpatrzymy doświadczenie z falami wodnymi. Urządzenie, którego użyjemy, Pokazano schematycznie na rys. 37.2. Mamy tu płytki zbiornik z wodą, w którym pewien mały przedmiot, nazywany „źródłem fal", jest wprawiany mechanicznie w ruch ' wywołuje fale koliste. Na prawo od źródła mamy podobnie jak w poprzednim doświadczeniu ścianę z dwoma otworami, za nią znajduje się druga ściana, która, aby uniknąć
176 37. EFEKTY KWANTOWE przesłona pochłaniacz A = |/?i|2 ^n=\^\+hl\Z h~\hl\Z a) b) c) 37.2. Doświadczenie z falami wodnymi zbytnich komplikacji, jest „pochłaniaczem", tak że fale, które docierają do niej, już się nie odbijają. W tym celu można na przykład zbudować stopniowo wznoszący się brzeg piaszczysty. Przed brzegiem umieszczamy detektor, który podobnie jak poprzednio, można przesuwać w górę i w dół w kierunku x. Detektor jest tu teraz przyrządem, który mierzy „natężenie" ruchu falowego. Możecie sobie wyobrazić przyrząd, który mierzy wysokość fali, lecz jest wykalibrowany proporcjonalnie do kwadratu wysokości, a więc wskazuje natężenie fali. Wskazania naszego detektora są więc proporcjonalne do energii, jaką niesie fala, lub raczej proporcjonalne do szybkości, z jaką energia dociera do detektora. Operując tym urządzeniem, stwierdzamy przede wszystkim, że natężenie fali może być całkiem dowolne. Gdy źródło porusza się nieznacznie, detektor rejestruje niewielki ruch falowy. Gdy ruch źródła się zwiększa, wskazania detektora są większe. Natężenie fali może przybierać każdą wartość. Nie motemy powiedzieć, że stwierdziliśmy jakąkolwiek „grudkowatość" natężenia. Zmierzmy obecnie natężenie fali dla różnych wartości .v (ruch źródła jest przy tym przez cały czas taki sam). Otrzymujemy w ten sposób interesująco wyglądającą krzywą, oznaczoną w części c rys. 37.2 jako /, 2. Gdy zajmowaliśmy się interferencją fal elektrycznych, przekonaliśmy się już, w jaki sposób otrzymujemy taką krzywą. W tym przypadku również początkowa fala zostaje ugięta na dwóch otworach, z których rozchodzą się dwie nowe fale koliste. Jeżeli zasłonimy jeden z otworów i zmierzymy rozkład natężenia, otrzymamy zupełnie nieskomplikowane krzywe, pokazane w części b rys. 37.2. /, przedstawia natężenie fali rozchodzącej się z otworu / (które znajdujemy dokonując pomiaru, gdy otwór 2 jest zasłonięty), a h
37-J. DOŚWIADCZENIE Z FALAMI 177 przedstawia natężenie fali wychodzącej z otworu 2 (zmierzone, gdy otwór / jest zasłonięty). Natężenie /, 2, obserwowane gdy oba otwory są odsłonięte, z całą pewnością nie jest sumą natężeń /, i I2. Mówimy, że występuje „interferencja" obu fal. W pewnych miejscach (w których krzywa 712 ma maksima) fale są zgodne w fazie i dodają się, dając większą amplitudę, a więc i większe natężenie. Mówimy, że w tych miejscach obie fale „inter- ferują konstruktywnie". Taka konstruktywna interferencja wystąpi, gdy tylko odległość od detektora do jednego z otworów jest o pełną liczbę długości fali większa (lub mniejsza) niż odległość od detektora do drugiego z otworów. W tych miejscach, w których obie fale docierają do detektora z różnicą faz rt (tam, gdzie są „niezgodne w fazie"), amplituda ruchu falowego notowanego przez detektor będzie różnicą obu amplitud. Fale „interferują destruktywnie" i otrzymujemy małą wartość natężenia. Takich małych wartości oczekujemy wszędzie tam, gdzie odległość między otworem / a detektorem różni się od odległości między otworem 2 a detektorem o nieparzystą liczbę połówek fali. Małe wartości /,2 na rys. 37.2 odpowiadają miejscom, w których obie fale interferują destruktywnie. Jak pamiętamy, ilościową zależność między natężeniami /,, /2 i 1,2 można przedstawić w następujący sposób: wysokość fali wodnej wychodzącej z otworu / i zmierzonej w detektorze w określonej chwili można zapisać jako (część rzeczywistą) h, e'°", gdzie „amplituda"/!, jest w ogólności liczbą zespoloną. Natężenie jest proporcjonalne do wartości średniej kwadratu wysokości, czyli gdy używamy liczb zespolonych, do \hi\2. Podobnie dla otworu 2 wysokość dana jest przez /^e""', a natężenie jest proporcjonalne do |/!2|2. Gdy oba otwory są odsłonięte, wysokości obu fal dodają się, dając (/!, +h2) e'"", i natężenie wynosi |fi|+/!2|2. Opuszczając zbyteczne dla naszych celów stałe proporcjonalności, otrzymujemy obowiązujące dla interferujących fal związki: /. = N2- '2 = N2, ',2 = 1^+^. (37.2) Zauważmy, że wynik jest zupełnie inny niż w przypadku pocisków (37.1). Jeżeli rozwiniemy wyrażenie |fii+/i2|2, stwierdzimy, że |fi,+fi2|2 = |«l|2 + |fi2|2 + 2|/l1j|/i2|cosó, (37.3) gdzie S jest różnicą faz między fi, i fi2. Wprowadzając natężenia możemy napisać Il2 = Il+I2 + 2sJllI1cosó. (37.4) Ostatni człon we wzorze (37.4) — to „człon interferencyjny". Tyle o falach wodnych. Ich natężenie może mieć dowolne wartości i wykazuje interferencję. 37-4. Doświadczenie z elektronami Wyobraźmy sobie teraz podobne doświadczenie z elektronami Schemat tego doświadczenia pokazano na rys. 37.3. Sporządzamy działo elektronowe, które składa się z ogrzewanego przez prąd elektryczny drutu tungstenowego umieszczonego w metalowym pu-
178 37. EFEKTY KWANTOV.H detektor działo elektronowe przesłona 0) 37.3. Doświadczenie z elektronami pochłaniacz P, = \ip\2 dełku z otworem. Jeśli drut znajduje się w stosunku do pudełka pod ujemnym napięciem, elektrony będą przyspieszane w stronę ścianek i któryś z nich przejdzie przez otwór. Wszystkie elektrony wystrzeliwane z tego działa będą miały (prawie) tę samą energię. Przed działem podobnie jak w poprzednim doświadczeniu umieszczamy ścianę (po prostu cienką metalową płytę) z dwoma otworami. Za tą ścianą ustawiona jest inna płyta, służąca jako pochłaniacz. Przed pochłaniaczem umieszczamy ruchomy detektor. Może nim być licznik Geigera lub jeszcze lepiej mnożnik elektronowy połączony z głośnikiem. Musimy od razu powiedzieć, że nie należy próbować przeprowadzenia takiego doświadczenia (w odróżnieniu od dwóch doświadczeń poprzednich, które można było wykonać). Doświadczenie to nie zostało nigdy wykonane. Rzecz w tym, że aby uzyskać efekt, który nas interesuje, urządzenie musiałoby być wykonane w niezmiernie malej skali. Przeprowadzamy więc „eksperyment myślowy", który wybraliśmy z tych względów, że łatwo o nim mówić i myśleć. Wiemy, jaki wynik otrzymamy, ponieważ przeprowadzono już wiele eksperymentów, w których zachowano odpowiednią skalę i proporcje, co pozwoliło uzyskać efekty, które opiszemy. Pierwsza rzecz, jaką stwierdzamy w naszym doświadczeniu z elektronami, to wyraźne pojedyncze dźwięki, jakie słyszymy z detektora (tzn. z głośnika). Wszystkie one są takie same. Me ma „połówek" takich dźwięków. Stwierdzamy również, że są one bardzo nieregularne. Coś w rodzaju: tik tik-tik . tik tik-tik tik..., itd., tak jak to już pewnie słyszeliście w czasie pracy licznika Geigera. Jeżeli będziemy liczyć takie tykanie w ciągu wystarczająco długiego czasu powiedzmy przez wiele minut, a następnie przeliczymy je jeszcze raz w takim samym odstępie czasu, stwierdzimy, że obie liczby są niemal takie same. Możemy więc mówić o średniej częstości, z jaką słyszymy te tykania (średnio tyle a tyle tykań na minutę).
37-4. DOSWlADCZENIL Z ŁLEKTRONAM1 179 Gdy przesuwamy detektor, częstość tych dźwięków jest większa lub mniejsza, lecz ich wielkość (siła dźwięku) jest zawsze taka sama. Jeżeli obniżymy temperaturę drutu w naszym dziale elektronowym, częstość rejestrowanych dźwięków zmniejszy się, lecz dalej każdy z nich będzie brzmiał tak samo. Stwierdzamy poza tym, że jeżeli umieścimy przed pochłaniaczem dwa detektory, tykać będzie jeden albo drugi, lecz nigdy oba na raz (chyba, że od czasu do czasu oba tykniccia są tak bliskie siebie, że ucho ich nie rozdzieli). Stwierdzamy więc, że czymkolwiek jest to, co dociera do pochłaniacza, przybywa to w „grudkach". Wszystkie grudki są tej samej wielkości: tylko całe grudki docierają do pochłaniacza i tylko jedna na raz. Mówimy, że „elektrony zawsze przybywają w jednakowych »grudkach«". Dokładnie tak samo jak w doświadczeniu z pociskami możemy obecnie znaleźć doświadczalnie odpowiedź na pytanie: „Jakie jest względne prawdopodobieństwo tego, że grudka elektronowa dotrze do pochłaniacza w odległości x od środka"? Tak jak poprzednio, względne prawdopodobieństwo otrzymamy notując częstość tykania przy niezmienionych warunkach działania działa elektronowego. Prawdopodobieństwo pojawiania się grudek dla pewnego szczególnego x równa się średniej częstości tykania zanotowanej dla tego x. Wynikiem naszego doświadczenia jest interesująco wyglądająca krzywa, oznaczona jako Pl2 w części c rys. 37.3. Tak jest! W ten właśnie sposób poruszają się elektrony. 37-5. Interferencja fal elektronowych Spróbujmy obecnie zanalizować krzywą z rys. 37.3 i przekonać się, czy potrafimy zrozumieć zachowanie się elektronów. Przede wszystkim chciałoby się powiedzieć, że ponieważ elektrony przybywają w grudkach, każda grudka, którą możemy równie dobrze nazwać elektronem, przeszła albo przez otwór 7, albo przez otwór 2. Zapiszmy to w postaci „twierdzenia": Twierdzenie A: Każdy elektron przechodzi albo przez otwór 7, albo przez otwór 2. Jeżeli założymy prawdziwość tego twierdzenia, wszystkie elektrony, które docierają do pochłaniacza, można podzielić na dwie klasy: do klasy pierwszej zaliczamy te, które przeszły przez otwór 7, do klasy drugiej — te, które przeszły przez otwór 2. Otrzymana przez nas krzywa musi więc być sumą efektów dotyczących elektronów przechodzących przez otwór 7 i przechodzących przez otwór 2. Sprawdźmy tę koncepcję doświadczalnie. Dokonamy najpierw pomiarów dla elektronów przechodzących przez otwór 1. Zasłaniamy otwór 2 i liczymy dźwięki dochodzące z detektora. Z ich częstości otrzymujemy prawdopodobieństwo Pt. Wynik pomiarów przedstawia krzywa oznaczona jako P{ w części b rys. 37.3. Wynik ten wydaje się zupełnie sensowny. W podobny sposób mierzymy P2 — rozkład prawdopodobieństwa dla elektronów, które przeszły przez otwór 2. Wynik tego pomiaru został również podany na rysunku. ^12 — wynik otrzymany przy obu otworach odsłoniętych — najwyraźniej nie jest sumą P, i P2> prawdopodobieństw dla każdego z otworów z osobna. W analogii z do-
180 17. EFEKTY KWANTOWE świadczeniem z falami wodnymi mówimy, że „występuje interferencja": dla elektronów P11¥=P1+P2- (37.5) W jaki sposób może dojść do takiej interferencji? Być może, powinniśmy powiedzieć: „Prawdopodobnie oznacza to, że nie jest prawdą, że grudki przechodzą bądź przez otwór 7, bądź przez otwór 2, gdyż gdyby tak było, prawdopodobieństwa dodawałyby się. Być może, elektrony poruszają się w bardziej skomplikowany sposób. Dzielą się na połowę, a następnie..." Ależ skąd! To niemożliwe, zawsze zjawiają się w grudkach..." No, to może niektóre z nich przechodzą przez otwór /, a następnie przez otwór 2 i tak jeszcze kilka razy dookoła lub poruszają się po jakichś innych skomplikowanych torach... w tym wypadku zasłoniwszy otwór 2, zmieniamy prawdopodobieństwo tego, że elektron, który przeszedł na początku przez otwór /, dotrze do pochłaniacza..." Zwróćmy jednak uwagę, że gdy oba otwory są odsłonięte, do pewnych punktów dociera tylko bardzo mało elektronów, gdy jednak zasłonimy jeden z otworów, notujemy w tych punktach od razu znacznie większą liczbę elektronów. Zasłonięcie jednego otworu zwiększa więc liczbę elektronów przechodzących przez drugi. Z drugiej jednak strony, widzimy, że Pt 2 w środkowej części wykresu jest więcej niż dwa razy większe od sumy P,+P2. Zasłonięcie jednego z otworów zmniejsza więc jak gdyby liczbę elektronów przechodzących przez drugi. Wyjaśnienie obu tych efektów poprzez założenie, że elektrony poruszają się po skomplikowanych torach, wydaje się bardzo trudne. Wszystko to jest bardzo tajemnicze. 1 im bardziej się temu przyglądamy, wydaje się tym bardziej tajemnicze. Wysunięto wiele propozycji mających wyjaśnić przebieg krzywej Pi2 poprzez skomplikowane tory elektronów. Żadna z nich nie była jednak zadowalająca. Przy pomocy żadnej z nich nie można było otrzymać prawidłowej krzywej Pl2 wyrażonej poprzez P, i P2. Okazuje się jednak, że zależności matematyczne potrzebne do powiązania ze sobą wielkości P,, P2 i PIZ są niezwykle proste. Pl2 jest bowiem krzywą w rodzaju krzywej /i2 z rys. 37.2, gdzie wszystko było bardzo proste. To, co obecnie zachodzi w płaszczyźnie pochłaniacza, można opisać przy pomocy dwóch liczb zespolonych, które nazwiemy <P\ i <P2 (są to oczywiście funkcje x). Kwadrat modułu co, daje efekt, jaki się otrzymuje przy odsłoniętym jedynie otworze /. tzn. Pi=\<Pi\2- Efekt pojawiający się przy odsłoniętym otworze 2 dany jest w ten sam sposób przez (j>2. A więc P2 = \<P2\2- Połączony efekt dla obu otworów - to P,2 = \c>{ +V>2\2- Zależności matematyczne są tu takie same, jak dla fal wodnych! (Trudno dostrzec, w jaki sposób tak prosty wynik można by otrzymać ze skomplikowanego zachowania się elektronów, poruszających się tam i z powrotem poprzez płytkę po jakichś dziwnych torach). Stwierdzamy więc, że elektrony przybywają w grudkach jak cząstki, a rozkład prawdopodobieństwa pojawienia się tych grudek jest taki sam jak rozkład natężenia fali. W tym właśnie sensie elektron zachowuje się „czasami jak cząstka, a czasami jak fala". Poprzednio, gdy zajmowaliśmy się falami w fizyce klasycznej, zdefiniowaliśmy ich natężenie jako średnią po czasie kwadratu amplitudy falowej i użyliśmy liczb zespolonych jako pewnego wybiegu matematycznego, upraszczającego analizę. Jednakże, jak się okazuje, w mechanice kwantowej amplitudy muszą być reprezentowane przez liczby zespo-
37-5. INTERFERENCJA FAL ELEKTRONOWYCH 181 lone. Same części rzeczywiste nie wystarczą. Chwilowo jest to tylko uwaga o charakterze technicznym, oba wzory mają bowiem taką samą postać Ponieważ prawdopodobieństwo przybycia elektronu przy obu otworach odsłoniętych dane jest przez tak prosty wzór (aczkolwiek nie przez Pi+P2), to już właściwie wszystko, co można o nim powiedzieć. Pozostaje jednak wiele subtelności związanych z faktem, że natura zachowuje się właśnie w taki sposób. Chcielibyśmy obecnie dostarczyć kilku ilustracji tych subtelności. Ponieważ liczba elektronów pojawiających się w określonym punkcie nie jest równa sumie elektronów, jakie przeszły przez otwór / i przez otwór 2, jakbyśmy to wywnioskowali z twierdzenia A, bez wątpienia musimy więc stwierdzić, że twierdzenie A jest fałszywe. Nie jest prawdą, że elektron przechodzi bądź przez otwór 1, bądź przez otwór 2. Jednakże wniosek ten można jeszcze poddać sprawdzeniu w innym doświadczeniu. 37-6. Obserwacja elektronów Spróbujmy teraz przeprowadzić następne doświadczenie. Do poprzedniego urządzenia dołączamy bardzo silne źródło światła, które umieszczamy za ścianą między oboma otworami, tak jak to pokazano na rys. 37.4. Wiemy o tym, że ładunki elektryczne rozpraszają światło. Gdy więc elektron będzie się przemieszczać (w jakikolwiek sposób by się to odbywało) w stronę detektora, rozproszone przez niego światło dojdzie do naszego oka i zobaczymy, którędy elektron biegnie. Jeśli na przykład podąża przez otwór 2, jak to naszkicowano na rys. 37.4, zobaczymy błysk światła dochodzący z okolicy miejsca, 37.4. Inne doświadczenie z elektronami działo elektronowe "0r IV- i2 źródło światła Z ? a) i 1 1 i X ■
182 37. EFŁK.TY KWANT UWF zaznaczonego na rysunku jako A. Gdy elektron przechodzi przez otwór /, oczekujemy błysku w sąsiedztwie górnego otworu. Jeżeli zdarzy się, że zaobserwujemy światło w obu miejscach, ponieważ elektron podzielił się na połowę... Przejdźmy jednak lepiej do doświadczenia! Oto co obserwujemy: za każdym razem, gdy słyszymy „tyknięcie"" detektora (umieszczonego przed pochłaniaczem), widzimy również błysk świetlny albo w pobliżu otworu /, albo w pobliżu otworu 2, lecz nigdy w obu miejscach na raz! Przy czym to, co zaobserwowaliśmy, nie zależy zupełnie od tego, w jakim miejscu został umieszczony detektor. Wnioskujemy więc, że gdy patrzymy na elektrony, stwierdzamy, iż przechodzą one albo przez jeden, albo przez drugi otwór. Z doświadczenia wynika, że twierdzenie A jest najwyraźniej prawdziwe. Czy w naszej argumentacji przeciwko temu twierdzeniu tkwi więc jakiś błąd? Dlaczego Pl2 nie równa się po prostu P,+P2? Wróćmy do doświadczenia! Obserwujmy dalej elektrony i patrzmy, co one robią. Dla każdego położenia detektora (ustalone je) będziemy liczyć elektrony, które do niego docierają, a obserwując równocześnie błyski świetlne, będziemy notować, przez który otwór przeszły. Można to zrobić w następujący sposób: za każdym razem, gdy słyszymy „tyknięcie", a błysk widzieliśmy w pobliżu otworu 7, rejestrujemy elektron w kolumnie 1, gdy natomiast widzieliśmy błysk w pobliżu otworu 2, rejestrujemy elektron w kolumnie 2. Każdy elektron zostaje zarejestrowany w jednej z dwóch klas: wśród tych, które przeszły przez otwór 1, albo wśród tych, które przeszły przez otwór 2. Na podstawie liczby elektronów zarejestrowanych w kolumnie I obliczamy P\, prawdopodobieństwo tego, że elektron dotrze do detektora przez otwór /; a na podstawie liczby elektronów zarejestrowanych w kolumnie 2 obliczamy P'2, prawdopodobieństwo tego, że elektron dotrze do detektora przez otwór 2. Jeżeli powtórzymy taki pomiar dla wielu wartości x, otrzymamy krzywe P', i P'2 pokazane w części b rys. 37.4. Jak na razie, nie jest to specjalnie zaskakujące! Otrzymaliśmy jako krzywą P\ krzywą zupełnie podobną do krzywej P,, której wartości zmierzyliśmy, gdy otwór 2 był zamknięty. Krzywa P'2 natomiast jest podobna do tej, którą otrzymaliśmy poprzednio, zamykając otwór /. Nie mamy więc niczego w rodzaju przechodzenia przez oba otwory. Elektrony, gdy obserwujemy je, poruszają się tak, jak tego oczekujemy. Te, które przechodzą przez otwór 7, są rozłożone w ten sam sposób, niezależnie od tego, czy otwór 2 jest zamknięty, | czy otwarty. Chwileczkę! A czemu się równa obecnie całkowite prawdopodobieństwo pojawienia się w detektorze elektronu biegnącego po dowolnym torze? Mamy już wszystkie potrzebne informacje. Udajemy po prostu, że nigdy nic patrzyliśmy na błyski świetlne i łączymy w jedną całość łyknięcia detektora, które poprzednio rejestrowaliśmy w dwóch kolumnach. Trzeba po prostu dodać obie liczby. Na prawdopodobieństwo pojawienia się elektronu, który przeszedł przez dowolnv otwór, otrzymujemy P\2 = P, + P2. Wprawdzie udało się nam zaobserwować, przez który z otworów przechodzą elektrony, nie otrzymaliśmy jednak starej krzywej Pl2, lecz nową P\2, która nie wykazuje interferencji. Jeśli wyłączymy światło, otrzymamy, z powrotem krzywą Pi2. Musimy więc stwierdzić, że gdy „patrzymy" na elektrony, ich rozkład na ekranie jest
37-6. OBSERWACJA ELEKTRONÓW 183 inny, niż gdybyśmy tego nie robili. Być może, właśnie włączenie światła zaburzyło wszystko? Prawdopodobnie elektrony są bardzo czułe i gdy światło rozprasza się na nich, doznają wstrząsu, po którym ruch ich się zmienia. Wiemy, że pole elektryczne światła działające na ładunek wywiera nań pewną siłę. Być może, należało więc oczekiwać; że ruch się zmieni. W każdym bądź razie światło wywiera duży wpływ na elektrony. Usiłując „obserwować" elektrony, zmieniliśmy ich ruch. Wstrząs, jakiego doznaje elektron, gdy rozprasza się na nim światło, wystarcza, aby ruch elektronu zmienić do tego stopnia, że jeżeli poprzednio elektron biegł tam, gdzie krzywa Pl2 miała maksimum, obecnie pobiegnie tam, gdzie krzywa Pl2 ma minimum. Oto dlaczego nie widzimy dłużej efektów interferencyjnych. Powiecie być może: „Nie używajmy tak jasnego źródła! Zmniejszmy jego siłę! Fale świetlne będą wówczas słabsze i nie będą już tak bardzo zaburzać elektronów. Z pewnością, gdy światło będzie coraz słabsze, jego wpływ będzie w końcu można pominąć". Doskonale, spróbujmy tak postąpić. Stwierdzimy od razu, że błyski światła rozproszonego na przechodzących elektronach nie stają się słabsze. Błysk jest zawsze taki sam. Jedyną rzeczą, jaką stwierdzamy, gdy światło jest słabsze, jest to, że czasami słyszymy „tyknię- cie", lecz nie widzimy w ogóle błysku. Elektron przeszedł „niezauważony". Widzimy więc, że światło również zachowuje się jak elektrony; wiedzieliśmy już, że było ono „faliste", a obecnie przekonaliśmy się, że jest również „ziarniste". Zawsze pojawia się — jest rozpraszane — w grudkach, które nazywamy „fotonami". Gdy zmniejszyliśmy natężenie źródła światła, nie zmniejszyliśmy rozmiarów fotonów, a jedynie częstość, z jaką są emitowane. To wyjaśnia, dlaczego gdy źródło jest bardzo słabe, niektóre elektrony przechodzą niezaobserwowane. W czasie, w którym elektron przechodził, nie było akurat żadnego fotonu. Nie wygląda to wszystko zbyt zachęcająco. Jeśli prawdą jest, że gdy tylko „widzimy" elektron, obserwujemy zawsze błysk tych samych rozmiarów, wszystkie elektrony, które widzimy, są zawsze zaburzone. Mimo wszystko wykonamy doświadczenie ze słabym źródłem światła. Obecnie, gdy usłyszymy tyknięcie detektora, będziemy prowadzić rejestrację w trzech kolumnach: w kolumnie I zanotujemy elektrony widziane przy otworze /, w kolumnie 2 elektrony widziane przy otworze 2, a w kolumnie 3 te elektrony, które nie zostały w ogóle zauważone. Gdy opracujemy dane doświadczalne (obliczając prawdopodobieństwo), otrzymamy następujące wyniki: elektrony „widziane przy otworze /" mają taki sam rozkład jak P[; „widziane przy otworze 2" mają rozkład w rodzaju P2 (..widziane albo przy otworze /, albo przy otworze 2" mają więc rozkład w rodzaju P\2): wreszcie „nie widziane w ogóle" mają rozkład „falisty", taki jak Pl2 na rys. 37.3! Gdy elektrony nie są „widziane", mamy interferencję*. Jest to zupełnie zrozumiałe. Jeżeli nie widzimy elektronu, żaden foton go nie zaburza, jeżeli natomiast elektron był widziany, musiał zostać zaburzony przez foton. Wielkość zaburzenia jest zawsze taka sama, ponieważ każdy foton powoduje taki sam efekt, zawsze wystarczająco duży. aby zniszczyć wszelki efekt interferencyjny. Czy nie ma więc żadnego sposobu obserwowania elektronów bez zaburzenia ich'.' 2 wcześniejszego rozdziału dowiedzieliśmy się, że pęd niesiony przez „foton" jest odwrotnie proporcjonalny do długości jego fali (p = h A). Z pewnością wstrząs, jakiego
184 37. EFEKTY KWANTÓW doznaje elektron, gdy foton rozprasza się na nim, zależy od pędu niesionego przez foton. Aha! Jeżeli chcemy tylko nieznacznie zaburzyć elektrony, powinniśmy nie tyle zmniejszyć natężenie światła, ile obniżyć jego częstość (to samo co zwiększyć długość fali). Użyjmy „bardziej czerwonego" światła. Możemy nawet użyć promieniowania podczerwonego lub fal radiowych (w rodzaju radaru) i obserwować przechodzące elektrony za pomocą pewnego urządzenia, które może „widzieć" światło o większych długościach fali. Jeżeli użyjemy „delikatniejszego" światła, unikniemy być może nadmiernego zaburzenia elektronów. Wykonajmy więc doświadczenie z dłuższymi falami. Będziemy powtarzać je wielokrotnie, dobierając za każdym razem światło o większej długości fali. Początkowo nic się w zasadzie nie zmienia Wyniki są takie same. Po jakimś czasie dzieje się jednak coś strasznego. Pamiętamy, że rozważając działanie mikroskopu, zwróciliśmy uwagę na to, że wskutek falowej natury światła mamy ograniczenie na odległość dwóch punktów, które można widzieć oddzielnie. Odległość ta jest rzędu długości fali świetlnej. Gdy więc długość fali będzie większa od odległości między obu otworami, wówczas w momencie, gdy światło zostanie rozproszone przez elektron, zobaczymy duży rozmyty błysk. Nie można już powiedzieć, przez który z otworów elektron przeszedł! I dopiero przy świetle o tej barwie stwierdzamy, że wstrząsy doznawane przez elektron są wystarczająco małe i krzywa P'I2 zaczyna wyglądać jak krzywa Pl2 — to znaczy zaczynamy otrzymywać pewne efekty interferencyjne. I jedynie dla fal o długościach znacznie większych od odległości między otworami (gdy nie mamy już w ogóle możliwości stwierdzenia którędy przeszedł elektron) zaburzenie spowodowane przez światło staje się wystarczająco małe, abyśmy z powrotem otrzymali krzywą Pl2 z rys. 37.3. Przekonaliśmy się więc, że w naszym doświadczeniu nie można zastosować światła w ten sposób, abyśmy mogli powiedzieć, przez który otwór przeszedł elektron, a krzywa interferencyjna pozostała równocześnie niezaburzona. Heisenberg jako pierwszy zwrócił uwagę na to, że nowe prawa przyrody mogą być tylko wtedy niesprzeczne, jeżeli istnieje zasadnicze ograniczenie naszych możliwości doświadczalnych, z którego poprzednio nie zdawano sobie sprawy. Zaproponował on jako ogólnie obowiązujące prawo — swoją zasadę nieoznaczoności, którą w języku naszego doświadczenia można wypowiedzieć następująco: „Nie można zaprojektować urządzenia, które by pozwoliło określić, przez który otwór elektron przechodzi nie zaburzając równocześnie obrazu interferencyjnego". Jeżeli urządzenie pozwala na określenie otworu, przez który przeszedł elektron, nie może być na tyle czułe, aby nie zaburzyć w zasadniczy sposób obrazu interferencyjnego. Nikt nie wymyślił jeszcze sposobu obejścia zasady nieoznaczoności. Musimy więc przyjąć, że opisuje ona podstawową cechę przyrody. Używana obecnie do opisu atomów, a faktycznie do opisu całej materii, mechanika kwantowa zależy w zasadniczy sposób od poprawności zasady nieoznaczoności. Ponieważ jednak mechanika kwantowa ma tak wielkie sukcesy, utwierdza to naszą wiarę w słuszność tej zasady. Jeśli jednak kiedykolwiek zasada nieoznaczoności zostanie „obalona", mechanika kwantowa zacznie dawać sprzeczne wyniki i trzeba będzie zaniechać jej używania jako teprii obowiązującej. „No, dobrze" - powiecie — a co z twierdzeniem A? Czy to w końcu prawda czy nie.
37-6. OBSERWACJA ELEKTRONÓW 185 \8z(wygładzone) że elektron przechodzi albo przez otwór /, albo przez otwór 2"? Możemy na to jedynie odpowiedzieć, że na podstawie doświadczenia przekonaliśmy się, że istnieje pewien specjalny sposób rozumowania, którym trzeba się posłużyć, aby nie popaść w sprzeczności. Aby uniknąć błędnych przewidywań, musimy powiedzieć, co następuje: Jeżeli patrzymy na otwory, lub bardziej dokładnie, jeżeli mamy urządzenie, które pozwala określić czy elektrony przeszły przez otwór 1, czy przez otwór 2, mamy prawo powiedzieć, że elektron przeszedł przez otwór 1, albo przez otwór 2. Kiedy jednak nie staramy się określić, którędy przeszedł elektron, gdy nie ma w doświadczeniu niczego, co by zaburzało elektrony, wówczas nie wolno nam powiedzieć, że elektron przeszedł albo przez otwór /, albo przez otwór 2. Gdybyśmy zakaz ten złamali i na podstawie tego stwierdzenia usiłowali dokonać jakichś dedukcji, wówczas w naszej analizie popełnilibyśmy błędy. Oto logiczna lina akrobatyczna, po której musimy kroczyć, jeżeli chcemy skutecznie opisać przyrodę. 37.5. Obraz interferencyjny w doświadczeniu z pociskami: a) rzeczywisty (schematycznie), b) obserwowany Jeżeli ruch całej materii — tak jak to było z elektronami — trzeba opisywać za pomocą pojęć dotyczących fal, dlaczego nie było to konieczne w pierwszym doświadczeniu z pociskami? Dlaczego wówczas nie wystąpiła interferencja? Okazuje się, że w przypadku pocisków długości fal są tak maleńkie, że obraz interferencji staje się bardzo subtelny. Do tego stopnia, że za pomocą żadnego detektora o skończonych rozmiarach nie można rozdzielić poszczególnych maksimów i minimów. To, co widzieliśmy, było tylko swojego rodzaju średnią, czyli krzywą klasyczną. Na rysunku 37.5 staraliśmy się zaznaczyć w postaci schematu, co dzieje się w przypadku dużych ciał. Część a rysunku pokazuje rozkład prawdopodobieństwa, jaki można przewidzieć dla pocisków posługując się mechaniką kwantową. Gwałtowne zmiany krzywej mają przedstawiać obraz interferencyjny, jaki otrzymuje się dla fal o bardzo małej długości. Jednakże każdy fizyczny detektor obejmuje wiele maksimów i minimów krzywej prawdopodobieństwa, pomiary dają więc krzywą gładką, pokazaną w części b rysunku. 37-7. Podstawowe zasady mechaniki kwantowej Dokonamy obecnie podsumowania ważniejszych wniosków wypływających z naszych doświadczeń. Wyniki nasze zapiszemy jednak w takiej postaci, aby były prawdziwe dla całej klasy takich doświadczeń. Dokonanie podsumowania będzie prostsze, jeżeli zde-
186 37 EFEKTY KWANTOWE finiujemy najpierw tzw. doświadczenie idealne, jako doświadczenie, w którym nie mamy niekontrolowanych wpływów zewnętrznych, to znaczy nie zachodzi nic takiego, czego nie moglibyśmy uwzględnić. Będziemy wystarczająco dokładni, jeżeli powiemy, że „doświadczenie idealne — to takie doświadczenie, w którym wszelkie możliwe warunki początkowe i końcowe są całkowicie określone". To, co będziemy nazywać „zdarzeniem", jest ogólnie biorąc, po prostu pewnym szczególnym układem warunków początkowych i końcowych (np. „elektron opuszcza działo, dociera do detektora i nic więcej się nie dzieje"). Przejdźmy obecnie do naszego podsumowania. Podsumowanie 1. Prawdopodobieństwo pewnego zdarzenia w doświadczeniu idealnym dane jest przez kwadrat modułu liczby zespolonej ę, która nosi nazwę amplitudy prawdopodobieństwa. P=prawdopodobieństwo, \ ę=amplituda prawdopodobieństwa, J (37.6) p=W\2. i 2. Gdy jakieś zdarzenie może zajść na kilka możliwych sposobów, amplituda prawdopodobieństwa dla tego zdarzenia jest sumą amplitud prawdopodobieństwa dla każdego ze sposobów z osobna. Występuje interferencja. ę = ^ + ^\2 (37.7) p=ki + d- 3. Jeśli w doświadczeniu można określić, która z możliwości zachodzi, prawdopodobieństwo zdarzenia jest sumą prawdopodobieństw dla każdej z tych możliwości. Interferencja znika. P=Pl+P2. (37.8) Można się jednak w dalszym ciągu pytać: „Dlaczego wszystko się odbywa w taki właśnie sposób? Jaki mechanizm kryje się za tymi prawami?" Nikt jeszcze nie odkrył żadnego mechanizmu. Nikt nie potrafi „wyjaśnić" więcej, niż my tu „wyjaśniliśmy". Nikt nie da wam głębszej analizy sytuacji. Nic nie wiemy o jakimś bardziej podstawowym mechanizmie, z którego działania można by nasze rezultaty wydedukować. Chcielibyśmy jeszcze podkreślić bardzo ważną różnicę między mechaniką klasyczną a kwantową. Mówiliśmy o prawdopodobieństwie pojawienia się elektronu w określonych warunkach. Daliśmy więc do zrozumienia, że w naszym urządzeniu doświadczalnym (a również i w najlepszym z możliwych) nie można dokładnie przewidzieć, co się stanie. Możemy tylko przewidzieć szanse, jakie istnieją! Jeśli to prawda, oznaczałoby to, że fizyka zrezygnowała z możliwości dokładnych przewidywań, co zajdzie w określonych warunkach. I taK właśnie jest! Fizyka rzeczywiście zrezygnowała. Nie wiemy, w jaki sposób przewidywać, co zajdzie w określonych warunkach i obecnie wierzymy, że takie przewidywania są w ogóle niemożliwe, a jedyna rzecz, jaką można przewidzieć, to prawdopodobieństwo poszczególnych zdarzeń. Trzeba sobie zdać sprawę, że jest to ograniczenie w stosunku
37-7. PODSTAWOWE ZASADY MECHANIKI KWANTOWEJ 187 do naszego dawnego ideału rozumienia przyrody. Być może, jest to krok wstecz, lecz nikt nie znalazł, jak dotąd, sposobu jego usunięcia. Ustosunkujemy się obecnie do propozycji, którą czasami się robi, starając się uniknąć opisu, który podaliśmy przed chwilą. Mówi się, że „być może elektrony mają jakiś mechanizm wewnętrzny, którego jeszcze nie znamy. Być może, dlatego właśnie nie możemy przewidzieć, co się stanie. Gdybyśmy mogli przyjrzeć się elektronowi dokładniej, potrafilibyśmy powiedzieć, w jakim miejscu w końcu się znajdzie. O ile nam wiadomo, to również jest niemożliwe. W dalszym ciągu mielibyśmy kłopoty. Przypuśćmy, że założyliśmy istnienie wewnątrz elektronu jakiegoś mechanizmu, który wyznacza miejsce, w jakim się elektron znajdzie. Maszyneria ta musi również określić otwór, przez który elektron przejdzie. Nie wolno nam jednak zapominać, że to, co się dzieje we wnętrzu elektronu, powinno być niezależne od tego, co my robimy, a w szczególności nie powinno zależeć od tego, czy zasłaniamy, czy odsłaniamy jeden z otworów. Jeśli więc elektron przed wyruszeniem zdecydował się a) przez który otwór przejdzie i b) gdzie wyląduje, powinniśmy otrzymać prawdopodobieństwo P, dla tych elektronów, które wybrały otwór /, a prawdopodobieństwo P2 dla tych, które wybrały otwór 2, a wiec Pi + P2 dla tych, które przybywają przechodząc przez którykolwiek z otworów. Wydaje się, że nie można tego uniknąć. Sprawdziliśmy jednak doświadczalnie, że tak się nie dzieje. I nikt, jak dotąd, nie znalazł wyjścia z tej sytuacji. Musimy się więc obecnie ograniczyć do obliczania prawdopodobieństw. Mówimy „obecnie", jednak bardzo silnie podejrzewamy, że taka sytuacja pozostanie już na zawsze, że nie ma z niej wyjścia i że przyroda zachowuje się właśnie tak, a nie inaczej. 37-8. Zasada nieoznaczoności A oto oryginalne sformułowanie zasady nieoznaczoności dokonane przez Heisen- berga: Jeżeli dokonujemy pomiarów jakiegoś ciała i możemy wyznaczyć składową x jego pędu z dokładnością Ap, nie możimy równocześnie określić jego współrzędnej x z dokładnością większą niż Ax=h\Ap. Iloczyn nieoznaczoności położenia i pędu musi być w każdej chwili większy niż stała Plancka. Jest to szczególny przypadek zasady nieoznaczoności sformułowanej poprzednio bardziej ogólnie. Bardziej ogólne sformułowanie głosiło, że nie można zaprojektować urządzenia, nie niszczącego obrazu interferencyjnego i pozwalającego na stwierdzenie, która z dwóch możliwości wystąpiła. Pokażmy na szczególnym przypadku, że jeżeli nie chcemy popaść w kłopoty, relacja podana przez Heisenberga musi być słuszna. Wyobraźmy sobie modyfikację doświadczenia pokazanego na rys. 37.3, polegającą na tym, że ściana z obu otworami jest płytą umieszczoną na rolkach, w ten sposób, że może się poruszać swobodnie w górę i w dół (w kierunku x), jak to pokazano na rys. 37.6. Obserwując dokładnie ruch płyty, możemy próbować powiedzieć, przez który z otworów przeszedł elektron. Wyobraźmy sobie, co się stanie, jeśli umieścimy detektor w punkcie x = 0. Oczekujemy, że elektron, który przechodzi przez otwór / i ma osiągnąć detektor, musi zostać odbity w dól. Ponieważ składowa pionowa pędu elektronu uległa zmianie, płyta musi doznać odrzutu i przesunąć S'C z równym pędem w przeciwnym kierunku. Płyta dozna pchnięcia ku górze. Jeżeli
188 37. EFEKTY KWANTOWE elektron przeszedł przez dolny otwór, płyta dozna pchnięcia ku dołowi. Jest jasne, że dla każdego położenia detektora pęd, jaki uzyska płyta, będzie inny dla przejścia przez otwór 1, a inny dla przejścia przez otwór 2. Nie zaburzając więc h- ogóle elektronów, obserwując po prostu płytę, możemy powiedzieć, jaką drogę wybrał elektron. Aby to wszystko przeprowadzić, musimy znać pęd przesłony przed przejściem przez nią elektronu, tak aby mierząc pęd po jego przejściu, można było obliczyć, o ile pęd płyty się zmienił. Pamiętajmy jednak, że zgodnie z zasadą nieoznaczoności nie możemy równocześnie znać położenia płyty z dowolną dokładnością. Jeśli jednak nie wiemy dokładnie, gdzie płyta się znajduje, nie możemy również powiedzieć, gdzie są oba otwory. Przy przejściu każdego elektronu będą one w różnych miejscach. Oznacza to, że środek obrazu interferencyjnego będzie miał dla każdego elektronu inne położenie. Maksima i minima będą więc wygładzone. W następnym rozdziale pokażemy ilościowo, że gdy pęd płyty wyznaczymy na tyle dokładnie, aby z pomiaru odrzutu móc określić, który otwór został wybrany, wówczas nieoznaczoność współrzędnej x płyty będzie, zgodnie z zasadą nieoznaczoności, wystarczająca, aby obraz interferencyjny rejestrowany przez detektor przesunąć w górę i w dół na odległość równą odstępowi między maksimum a najbliższym minimum. Takie przypadkowe przesunięcie wystarcza do wygładzenia obrazu na tyle, aby żadna interferencja nie była obserwowana. Zasada nieoznaczoności „ratuje" mechanikę kwantową. Heisenberg pierwszy zrozumiał, że gdyby można było równocześnie zmierzyć położenie i pęd z większą dokładnością, mechanika kwantowa runęłaby. Postawił więc hipotezę, że musi to być niemożliwe. Wielu ludzi starało się wówczas znaleźć sposób, by temu zaprzeczyć, nikomu jednak nie udało się podać metody zmierzenia położenia i pędu jakiegokolwiek ciała — przesłony, elektronu, kuli bilardowej, czegokolwiek — z większą dokładnością. Mechanika kwantowa prowadzi dalej swój niebezpieczny, lecz akuratny żywot. 37.6. Doświadczenie, w klórym mierzy się odrzut przesłony przestana pochłaniacz
38 porównanie dwóch punktów widzenia: falowego i korpuskularnego 38-1. Falowe amplitudy prawdopodobieństwa W rozdziale tym dokonamy porównania dwóch punktów widzenia: falowego i korpuskularnego. Wiemy już z poprzedniego rozdziału, że zarówno jeden, jak i drugi nie są właściwe. Zwykle staraliśmy się przedstawiać omawiane zagadnienia zupełnie dokładnie, a przynajmniej na tyle precyzyjnie, aby w trakcie dalszej nauki nie trzeba ich było zmieniać — zostaną być może rozszerzone, lecz w żadnym wypadku zmienione! Gdy jednak staramy się mówić o obrazie falowym lub o obrazie cząstkowym, musimy sobie zdać sprawę, że oba są przybliżone i oba ulegną zmianie. To, czego nauczymy się z obecnego rozdziału, nie będzie więc w pewnym sensie ścisłe; będziemy operować półintuicyjnymi argumentami, które dopiero później uściślimy, pewne jednak sprawy, gdy zinterpretujemy je poprawnie w mechanice kwantowej, zmienią się tylko nieznacznie. Oczywiście, postępujemy tak tylko dlatego, że nie zamierzamy się obecnie zajmować mechaniką kwantową, a mimo to chcielibyśmy uzyskać pewne pojęcie o tym, jakich efektów możemy oczekiwać. Poza tym całe nasze doświadczenie dotyczy fal lub cząstek, wydaje się wiec użyteczne wykorzystać te pojęcia do zrozumienia pewnych zjawisk, nim opanujemy w pełni matematykę amplitud kwantowomechanicznych. Będziemy się starali wskazywać na słabe punkty w naszym rozumowaniu, jednak w większości wypadków wszystko jest właściwie niemal ścisłe, chodzi tylko o odpowiednią interpretację. Jak wiemy, nowy sposób opisu świata w mechanice kwantowej polega na podaniu amplitudy dla każdego zdarzenia, które może wystąpić. Jeżeli zdarzenie to polega na Pfzykład na przybyciu jednej cząstki, możemy podać amplitudę określającą możliwość znalezienia tej cząstki w różnych miejscach, w różnych chwilach czasu. Prawdopodobieństwo natrafienia na taką cząstkę jest wówczas proporcjonalne do kwadratu modułu tej
190 38. PORÓWNANIE DWÓCH PUNKTÓW WIDZFNIa amplitudy. W ogólności amplituda znalezienia cząstki w różnych miejscach, w różnych chwilach czasu zmienia się z czasem i z położeniem W pev-nym szczególnym przypadku amplituda ta może się zmieniać sinusoidalnie jak 38.1. Paczka falowa o długości Jjc e,(t0'~kr) (nie zapominajmy, że amplitudy te - to liczby zespolone, a nie rzeczywiste), ma zatem określoną częstość w i wektor falowy k. Jak się okazuje, odpowiada to klasycznemu przypadkowi granicznemu, w którym oczekiwalibyśmy, że mamy cząstkę o znanej energii E powiązanej z częstością zależnością E = hw (38.1) i o znanym pędzie p, powiązanym z wektorem falowym związkiem p=fck. (38.2) Oznacza to, że pojęcie cząstki jest ograniczone. Pojęcie cząstki — jej położenia, pędu itd. — tak często przez nas używane, jest pod pewnymi względami nie zadowalające. Jeśli na przykład amplituda znalezienia cząstki w różnych miejscach dana jest przez funkcję e' ""-k'r), której kwadrat modułu jest stały, oznacza to, że prawdopodobieństwo znalezienia cząstki jest takie samo dla wszystkich punktów. Nie wiemy więc, gdzie się ona rzeczywiście znajduje — może być w dowolnym miejscu: nieoznaczoność jej położenia jest ogromna. Z drugiej strony, jeżeli położenie cząstki jest mniej lub bardziej znane i możemy je przewidzieć dość dobrze, prawdopodobieństwo znalezienia jej w różnych miejscach musi się ograniczać do obszaru o pewnej średnicy Ax. Poza nim prawdopodobieństwo równa się zeru. Ponieważ prawdopodobieństwo to równa się kwadratowi modułu pewnej amplitudy, sama amplituda musi również być równa zeru. Mamy więc pewien ciąg fal, którego całkowita długość jest równa Ax (rys. 38.1), a długość fali (odległość między węzłami w tym ciągu) tego ciągu jest tym, co odpowiada pędowi cząstki. Natrafiamy tu na pewną osobliwość dotyczącą fal; jest to coś bardzo prostego, nie mającego zasadniczo nic wspólnego z mechaniką kwantową. Wie o tym każdy, kto uczył się o falach, nawet jeśli nie miał nigdy do czynienia z mechaniką kwantową. Mianowicie, nie można zdefiniować jednej długości fali dla krótkiego ciągu fal. Ciąg taki nie ma określonej długości fali: występuje nieoznaczoność wektora falowego, która jest związana ze skończoną długością ciągu, mam> więc również i nieoznaczoność pędu. 38-2. Pomiar położenia i pędu Rozpatrzmy dwa przykłady tej koncepcji i zobaczmy, jakie są przyczyny tego, że mamy nieoznaczoność położenia i (lub) pędu. Widzieliśmy już poprzednio, że gdyby takiej nieoznaczoności nie było - gdyby można było zmierzyć położenie i pęd czegokolwiek równocześnie — natrafilibyśmy na paradoks; na szczęście nie mamy takiego paradoksu, a to, że taka sama nieoznaczoność wynika w sposób naturalny z obrazu falowego, wskazuje, że wszystko jest wzajemnie zgodne. V\M/v^
38-2 POMIAR POŁOŻENIA I PĘDU 191 Oto pierwszy z przykładów, ukazujących związek, jaki zachodzi między położeniem a pędem w łatwej do zrozumienia sytuacji. Przypuśćmy, że mamy pojedynczą szczelinę, a cząstki mające określoną energię przybywają z bardzo daleka — zasadniczo więc wszystkie biegną poziomo (rys. 38.2). Skoncentrujemy się na poprzecznych składowych pędu. Wszystkie te cząstki mają pewien, określony w sensie klasycznym pęd poziomy, powiedzmy />0. W sensie klasycznym więc pęd poprzeczny py przed przejściem cząstek przez otwór jest również określony. Cząstka nie porusza się ani w górę, ani w dół, gdyż przebywa z bardzo oddalonego źródła — jej pęd poprzeczny jest więc oczywiście równy zeru. Przypuśćmy jednak, że przechodzi ona przez otwór o szerokości B. Wówczas po przejściu przez ten otwór znamy jej położenie w kierunku pionowym — składową y — ze znaczną dokładnością, mianowicie ±B. A więc nieokreśloność położenia, Ay, jest rzędu B. Chciałoby się również powiedzieć — ponieważ wiemy, że pęd jest całkowicie poziomy — że Apy równa się zeru; byłoby to jednak błędne. Wiedzieliśmy, że poprzednio pęd był poziomy, nie wiemy jednak, czy i obecnie jest to prawda. Przed przejściem cząstek przez otwór nie znaliśmy ich położeń poprzecznych. Obecnie, gdy przepuszczając cząstkę przez otwór znaleźliśmy je, straciliśmy informację o pędzie poprzecznym! Dlaczego? Zgodnie z teorią falową po przejściu fal przez szczelinę następuje, tak jak w przypadku światła, dyfrakcja. Mamy więc pewne prawdopodobieństwo tego, że cząstki po przejściu przez szczelinę nie biegną zupełnie prosto. Wskutek efektu dyfrakcyjnego obraz zostaje rozszerzony, a kąt określający to rozszerzenie, który możemy zdefiniować jako kąt pierwszego minimum, jest miarą nieokreśloności końcowego kąta cząstki. W jaki jednak sposób następuje to rozszerzenie? Bezsprzecznie oznacza ono, że istnieje pewna szansa, aby cząstka poruszała się w górę lub w dół, czyli miała tak właśnie skierowaną składową pędu. Mówimy szansa i cząstka, ponieważ obraz dyfrakcyjny, o którym mowa, możemy wykrywać za pomocą licznika cząstek i gdy licznik ten rejestruje cząstkę, powiedzmy w punkcie C na rys. 38.2, jest to zawsze cala cząstka, tak że w sensie klasycznym cząstka ma pęd poprzeczny, inaczej bowiem nie przeszłaby od szczeliny do punktu C. Aby uzyskać przybliżone pojęcie o rozmyciu pędu, przyjmijmy, że pęd poprzeczny py ma rozmycie równe pa A6, gdzie p0 jest pędem poziomym. Jak duże jest natomiast A6 w otrzymanym obrazie dyfrakcyjnym? Wiemy, że pierwsze minimum występuje przy kącie -W, przy którym fale z jednego końca szczeliny muszą przebyć o jedną długość fali więcej niż fale z drugiego końca. Przekonaliśmy się o tym poprzednio. Zatem J0 równa się A B, a Apy w tym doświadczeniu równa się PoA/B. Zwróćmy uwagę, że jeśli zmniejszymy B i dokonamy dokładniejszego pomiaru położenia cząstki, obraz dyfrakcyjny stanie się szerszy. Pamiętamy, że gdy przysłoniliśmy szczelinę w doświadczeniu z mikrofalami. 38.2. Dyfrakcja cząstek przechodzących przez szczelinę . t* AB
192 38. PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA natężenie mierzone w oddalonych miejscach wzrosło. Im więc szczelina będzie węższa, tym szerszy stanie się obraz i tym większa możliwość, że stwierdzimy, iż cząstka ma pęd poprzeczny. Nieokreśloność pędu poprzecznego jest więc odwrotnie proporcjonalna do nieokreśloności y. Widzimy mianowicie, że iloczyn równa się p0A. Lecz A jest długością fali, a Po - pędem, a zgodnie z mechaniką kwantową iloczyn długości fali i pędu równa się stałej Plancka h. Stwierdzamy więc, że iloczyn nieoznaczoności pędu poprzecznego i współrzędnej poprzecznej jest rzędu h: AyApyxh. (38.3) Nie można przygotować układu, w którym znalibyśmy położenie pionowe cząstki i umieli przewidzieć, jak będzie się ona poruszać w kierunku pionowym, z większą pewnością niż dana przez wzór (38.3). A więc nieoznaczoność pędu poprzecznego musi przekraczać h/Ay, gdzie Ay jest nieoznaczonością, z jaką znamy położenie. Czasami ludzie mówią, że mechanika kwantowa jest zupełnie błędna. Gdy cząstka przybywała z lewej strony, jej pęd w kierunku pionowym równał się zeru. Obecnie natomiast, gdy przeszła przez szczelinę, jej położenie jest znane. Wydaje się więc, że zarówno położenie, jak i pęd znane są z dowolną dokładnością. To prawda, że możemy zarejestrować cząstkę i wyznaczyć jej położenie oraz stwierdzić, jaki pęd musiała mieć poprzednio, aby wylądować właśnie w tym miejscu. To prawda, ale nie tę sytuację ilustruje związek (38.3). Wzór (38.3) dotyczy możliwości przewidywania określonej sytuacji, a nie uwag o przeszłości. Nie ma żadnego pożytku ze stwierdzenia: „Znałem pęd cząstki, nim przeszła ona przez szczelinę, a obecnie znam jej położenie", gdyż obecnie informacje o pędzie zostały stracone. Fakt, że cząstka przeszła przez szczelinę, nie pozwala już dłużej przewidzieć, jaki jest jej pęd w kierunku pionowym. Mówimy o teorii, która ma zdolność dokonywania przewidywań, a nie o pomiarach dokonanych po fakcie. Trzeba więc mówić o tym, co możemy przewidzieć. Podejdźmy obecnie do omawianego zagadnienia w nieco inny sposób. Rozpatrzmy nieco bardziej ilościowo inny przykład tego samego zjawiska. W poprzednim przykładzie mierzyliśmy pęd przy pomocy metody klasycznej. Rozważaliśmy mianowicie kierunek, prędkość, kąty itd. Ponieważ jednak pęd jest związany z wektorem falowym, istnieje w przyrodzie jeszcze inny sposób zmierzenia pędu cząstki — fotonu lub jakiejś innej — który nie ma swojego klasycznego odpowiednika, gdyż korzysta ze związku (38.2). Sposób ten polega na zmierzeniu długości 38.3. Wyznaczanie pędu za fal. Spróbujmy zmierzyć pęd w ten właśnie sposób, pomocą siatki dyfrakcyjnej Przypuśćmy, że mamy siatkę dyfrakcyjną o bardzo wielu liniach (rys. 38.3), na którą pada wiązka cząstek. Problem ~~ ten rozważaliśmy dość często: jeśli cząstki mają określony pęd, otrzymujemy, wskutek interferencji, bardzo silne wzmocnienie w pewnych kierunkach. Mówiliśmy również o tym, _ z jaką dokładnością można wyznaczyć ten pęd, to znaczy jaka jest zdolność rozdzielcza takiej siatki. Zamiast wyprowadzać to od nowa, powołamy się na rozdz. 30, w którym stwierdziliśmy, że względna nieokreśloność długości fali, mierzo-
38-2. POMIAR POŁOŻENIA 1 PĘDU 193 nej za pomocą danej siatki, równa się l/Nm, gdzie N jest liczbą linii siatki, a m określa rząd obrazu dyfrakcyjnego. Tak więc /4A/A=l/Nw. (38.4) Wzór ten można również zapisać jako zlA/A2 = l/NroA=l/L, (38.5) gdzie L jest odległością pokazaną na rys. 38.3. Odległość ta równa jest różnicy między drogą, jaką przebywa cząstka, fala czy coś jeszcze innego, co się odbija od dolnego końca siatki, a drogą, jaką musi przebyć, gdy jest odbite od górnego końca. A więc fale, które tworzą obraz dyfrakcyjny, są falami przybywającymi z różnych punktów siatki. Pierwsze, które przybywają, przychodzą z jej dolnego końca i pochodzą z czoła ciągu fal, pozostałe natomiast pochodzą z dalszych części ciągu i przybywają z innych części siatki, aż wreszcie przybędzie ostatnia, związana z punktem ciągu falowego, leżącym w odległości L za jego czołem. Aby więc otrzymać w naszym widmie ostrą, odpowiadającą określonemu pędowi linię, z dokładnością daną przez związek (38.4), musimy mieć ciąg fal o długości równej przynajmniej L. Gdy ciąg ten jest zbyt krótki, nie wykorzystujemy całej siatki. Jeżeli tylko ciąg będzie zbyt krótki, fale tworzące widmo zostaną odbite od krótkiego odcinka siatki i nie będzie ona działać należycie — stwierdzimy duże rozmycie kątowe. Aby stało się ono węższe, musimy użyć całej siatki, tak żeby przynajmniej przez chwilę ciąg fal rozpraszał się równocześnie na wszystkich jej częściach. Aby więc nieoznaczoność długości fali nie przekraczała podanej przez wzór (38.5), ciąg fal musi mieć długość L. Ponieważ jednak zU/A2=zJ(l/A) = zJk/2jt, (38.6) więc zJ/c = 2ti/L, (38.7) gdzie L jest długością ciągu fal. Oznacza to, że gdy mamy ciąg fal o długości mniejszej od L, nieoznaczoność wektora falowego musi przewyższać 2n/L. A więc nieoznaczoność wektora falowego mnożona przez długość ciągu fal, którą chwilowo oznaczymy Ax, przewyższa 2tc. Wprowadziliśmy określenie Ax, ponieważ długość ciągu odpowiada nieoznaczoności położenia cząstki. Gdy ciąg fal ma skończoną długość, wówczas tylko w obszarze jego występowania można z dokładnością Ax znaleźć cząstkę. Ta własność fal, na której mocy długość pewnego ciągu mnożona przez nieoznaczoność związanego z nim wektora falowego równa się co najmniej 2n, jest dobrze znana każdemu, kto się kiedykolwiek o nich uczył. Nie ma ona nic wspólnego z mechaniką kwantową. Chodzi po prostu o to, że gdy mamy skończony ciąg fal, nie umiemy przeliczyć wystarczająco dokładnie liczby fal, jakie on zawiera. Spróbujmy znaleźć przyczynę tego w jeszcze inny sposób. Przypuśćmy, że mamy skończony ciąg o długości L. Ze względu na to, że musi się on zmniejszać przy końcach, tak jak to pokazano na rys. 38.1, liczba fal, jaką mamy na długości L, określona jest z dokładnością w rodzaju ±1. Lecz liczba fal na odcinku o długości L równa się kLjln. Dokładna wartość k nie jest więc określona i ponownie otrzymujemy związek (38.7), po prostu jako własność fal. Jest to słuszne zarówno wtedy, gdy fale
194 38. PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA biegną w przestrzeni, a k równa się liczbie radianów na centymetr, L zaś jest długością ciągu, jak i wtedy, gdy przebieg odbywa się w czasie, a to jest liczbą drgań na sekundę, T zaś „długością" czasu, w jakim obserwujemy ten ciąg. Jeśli więc mamy ciąg fal trwający tylko przez pewien skończony czas T, nieoznaczoność częstości dana jest wzorem Am = 2njT. (38.8) Staraliśmy się podkreślić, że te własności są własnościami fal w ogólności i są dobrze znane, np. w teorii dźwięku. Możliwość ich wykorzystania do naszych celów bierze się stąd, że w mechanice kwantowej interpretujemy wektor falowy jako miarę pędu cząstki (p=hk); związek (38.7) mówi nam więc,że ApKhjAx. Mamy więc ograniczenie klasycznego pojęcia pędu (oczywiście, musi być ono w pewien sposób ograniczone, jeżeli mamy reprezentować cząstki przez fale!). Dobrze, że znaleźliśmy prawo, które daje nam pewne wyobrażenie o zakresie pojęć klasycznych. 38-3. Dyfrakcja na kryształach Rozpatrzmy z kolei odbicie fal materialnych od kryształu. Kryształ — to coś grubego, złożonego z ogromnej liczby jednakowych atomów (pewne komplikacje uwzględnimy później) tworzących zgrabną siatkę. Chodzi o to, jak ustawić tę siatkę, aby otrzymać silne maksimum w określonym kierunku dla określonej wiązki, np. światła (promieni Róntgena), elektronów, neutronów czy czegokolwiek. Jeżeli mamy otrzymać silne odbicie, rozproszenie na wszystkich atomach musi być zgodne w fazie. Gdyby równe sobie liczby fal były zgodne i niezgodne w fazie, redukowałyby się nawzajem. Aby wszystko przebiegało pomyślnie, należy, jak to już wyjaśniliśmy poprzednio, znaleźć obszary stałej fazy; są nimi płaszczyzny ustawione pod takim samym kątem względem kierunku początkowego i końcowego (rys. 38.4). Gdy rozpatrzymy dwie płaszczyzny równoległe, jak to pokazano na rys. 38.4, fale odbite od nich będą zgodne w fazie, pod warunkiem, że różnica odległości przebytych przez front fali równa się całkowitej liczbie długości fal. Jak widzimy z rysunku, różnica ta równa się Id sin 6, gdzie d jest odległością między dwiema płaszczyznami. Warunek na koherentne odbicie wygląda więc następująco: 2dńr>6=nX (n = l ,2, ...). (38.9) Jeśli na przykład kryształ będzie taki, że atomy będą leżały akurat na płaszczyznach spełniających warunek (38.9) z n=\, nastąpi silne odbicie, jeżeli natomiast w krysztale wystąpią również inne atomy o tej samej gęstości co poprzednie i umieszczone w połowie drogi między nimi, wówczas płaszczyzny pośrednie, które one tworzą, będą rozpraszać równie silnie i odbite fale będą interferować z poprzednimi powodując brak jakiegokolwiek efektu. Wielkość d we wzorze (38.9) musi więc dotyczyć płaszczyzn przylegających do siebie; nie wolno brać płaszczyzn przedzielonych pięcioma innymi i stosować do nich naszego wzoru!
38-3. DYFRAKCJA NA KRYSZTAŁACH 195 Jednakże prawdziwe kryształy nie są zbudowane z jednego gatunku powtarzających się atomów. Są natomiast podobne — jeżeli wprowadzimy dwuwymiarową analogię — do tapet, które zwykle mają pewien powtarzający się rysunek. W przypadku atomów przez „rysunek" rozumiemy pewne ich ustawienie — wapń, węgiel i trzy atomy tlenu dla węglanu wapnia — które może składać się ze stosunkowo dużej liczby atomów. W każdym bądź razie konfiguracja ta powtarza się w całej siatce. Tę zasadniczą konfigurację nazywamy komórką podstawową. Na podstawie tej powtarzającej się konfiguracji określamy to, co nazywamy typem sieci krystalicznej; typ sieci można natychmiast wyznaczyć patrząc na obraz, jaki otrzymujemy w wyniku odbicia, i określając jego symetrię. Innymi słowy, miejsca, w których notujemy odbicie, określają typ sieci. Aby jednak stwierdzić, z czego ona jest zbudowana, musimy wziąć pod uwagę natężenie rozproszenia w różnych kierunkach. W którym kierunku odbywa się rozproszenie, zależy od typu sieci, jak silnie natomiast się ono odbywa, zależy od tego, co się mieści w komórce podstawowej. W ten właśnie sposób poznaje się strukturę kryształów. Dwie fotografie obrazu dyfrakcyjnego, otrzymanego za pomocą promieni Rónt- gena (fot. 38.5 i 38.6), przedstawiają odpowiednio rozpraszanie ■ na soli kamiennej i mioglobinie. Ciekawa rzecz występuje, gdy odstępy między najbliższymi płaszczyznami są mniejsze niż A/2. W tym przypadku równanie (38.9) nie ma rozwiązania na n. Jeśli więc A jest większe niż podwojona odległość między sąsiadującymi płaszczyznami, nie ma obrazu dyfrakcyjnego i światło — lub cokolwiek to jest - przechodzi przez sub- 38.4. Rozpraszanie fal na płaszczyznach krystalicznych 38.5 38.6
196 38. PORÓWNANIE DWÓCH PUNKTÓW WrDZENIA neutrony o małym 'K // reaktor -*■ grafit -♦■ neutrony -»■ o dużym A. neutrony o małym \ 38.7. Dyfuzja neutronów reaktorowych przez blok grafitu 38.8. Natężenie neutronów po przejściu przez blok grafitu jako funkcja długości fal stancję nie odbijając się ani nie ulegając osłabieniu. A zatem światło, którego długość fali A jest o wiele większa od tych odległości, przechodzi bez przeszkód i nie ma żadnego obrazu dyfrakcyjnego spowodowanego odbiciem od płaszczyzn kryształu. Fakt ten ma również interesujące konsekwencje w przypadku produkowanych w reaktorze neutronów (są one z pewnością cząstkami, można się o to założyć!). Jeśli neutrony te przepuścimy przez długi blok grafitowy, będą one dyfundować i torować sobie drogę naprzód (rys. 38.7). Dyfundują, ponieważ zostają odbite od atomów grafitu, jednakże dokładnie, według teorii falowej, zostają odbite przez atomy wskutek dyfrakcji na płaszczyznach krystalicznych. Okazuje się, że jeśli weźmiemy bardzo długi kawałek grafitu, wszystkie neutrony, które dotrą do drugiego końca, będą miały dużą długość fali! Jeżeli wykreślimy natężenie jako funkcję długości fali, efekt niezerowy otrzymamy dopiero dla fal powyżej pewnego minimum (rys. 38.8). Innymi słowy, możemy w ten sposób otrzymać bardzo powolne neutrony. Tylko najwolniejsze neutrony przechodzą, nie ulegają dyfrakcji ani rozproszeniu na płaszczyznach krystalicznych grafitu, lecz biegną prosto przed siebie, tak jak światło przez szkło. Istnieje wiele innych sposobów pokazania, że fale neutronowe występują w rzeczywistości i że tak samo jest dla fal związanych z innymi cząstkami. A-mln 38-4. Rozmiary atomu Rozpatrzymy teraz inne zastosowanie zasady nieoznaczoności [równanie (38.3)]. Nie należy jednak tego, co będziemy robili, brać zbyt poważnie; sama idea jest słuszna, analiza jednak nie jest zbyt dokładna. Chodzi o wyznaczenie rozmiarów atomów oraz o to, że z punktu widzenia fizyki klasycznej elektrony promieniowałyby światło i po jakimś czasie lądowałyby na jądrze. Nie może to jednak być słuszne w mechanice kwantowej, gdyż wówczas wiedzielibyśmy, gdzie każdy elektron się znajduje oraz jak szybko się porusza. Przypuśćmy, że mamy atom wodoru i mierzymy położenie elektronu. Możliwość dokładnego przewidzenia, gdzie elektron będzie się znajdować, powinna być niemożliwa,
38-4. ROZMIARY ATOMU 197 gdyż rozmycie pędu byłoby wówczas nieskończone. Za każdym razem, gdy patrzymy na elektron, znajduje się on w pewnym miejscu, jednakże jego amplituda nie znika i w innych punktach. Istnieje więc prawdopodobieństwo znalezienia elektronu w różnych miejscach. Miejsca te nie mogą przypadać jedynie na jądro. Założymy, że istnieje rozmycie położenia rzędu a, tzn. że odległość elektronu od jądra wynosi przeważnie około a. Wyznaczymy a, minimalizując całkowitą energię atomu. Ze względu na zasadę nieoznaczoności rozmycie pędu równa się w przybliżeniu h\a. Jeśli więc będziemy się starali wyznaczyć w pewien sposób pęd elektronu, np. rozpraszając na nim promienie Róntgena i mierząc powstający efekt Dopplera, nie powinniśmy otrzymać za każdym razem zera - elektron nie stoi nieruchomo — pędy, które mierzymy, muszą być rzędu p za h/a. Energia kinetyczna równa się wówczas w przybliżeniu \mv2=p2\2m = = h2/2ma2. (W pewnym sensie jest to swojego rodzaju analiza wymiarów, pozwalająca stwierdzić, w jaki sposób energia kinetyczna zależy od stałej Plancka, od masy m i od rozmiarów atomu. Nie musimy wierzyć naszej odpowiedzi, jeśli chodzi o czynniki w rodzaju 2, n itd. Nie zdefiniowaliśmy nawet zbyt dokładnie a.) Energia potencjalna natomiast równa się minus e2, dzielone przez odległość od środka, powiedzmy —e2\a, gdzie jak pamiętamy e2 jest podniesionym do kwadratu ładunkiem elektronu podzielonym przez 4n£0- Widzimy, że gdy a staje się mniejsze, energia potencjalna również ulega zmniejszeniu, lecz im mniejsze staje się a, tym większy, ze względu na zasadę nieoznaczoności, musi być pęd, a tym samym i energia kinetyczna. Całkowita energia równa się E=h2l2ma2-e2la. (38.10) Nie wiemy, czemu się równa a, wiemy jednak, że atom będzie się starać osiągnąć pewien kompromis, tak aby energia była najmniejsza, jak to jest możliwe. Aby zminimalizować E, różniczkujemy wyrażenie (38.10) względem a, przyrównujemy pochodną do zera i otrzymane równanie rozwiązujemy względem a. Pochodna E równa się dElda=-h2/ma3 + e2la2, (38.11) a przyjęcie dEjda=0 daje na a wartość ao = /»2/"»?2=0,528A=0,528-10"I0m. (38.12) Odległość ta nosi nazwę promienia Bohra. Dowiedzieliśmy się w ten sposób, że wymiary atomowe są rzędu angstremów, co jak się okazuje, jest prawdą. To wspaniale, gdyż jak dotychczas, nie mieliśmy żadnej podstawy pozwalającej oszacować rozmiary atomów! Z punktu widzenia fizyki klasycznej istnienie atomów jest zupełnie niemożliwe, gdyż elektron opuściłby się po spirali na jądro. Jeśli wartość a0, daną wyrażeniem (38.12), wstawimy do wzoru (38.10), stwierdzimy, ze energia równa się E0= -e2l2a0= -me*/2h2= -13,6eV. (38.13) Co oznacza ujemna energia? Oznacza, że gdy elektron przebywa w atomie, ma mniej energii niż wtedy, gdy jest swobodny, a więc elektron jest w atomie związany. Oznacza, że dla wyrzucenia elektronu na zewnątrz potrzebna jest energia; aby zjonizować atom wodoru
198 38. PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA potrzebna jest energia rzędu 13,6 eV. Nie ma powodu, dla którego nie moglibyśmy przypuszczać, że energia ta jest 2 albo 3 razy większa lub równa się połowie, czy też (l/n) tej wielkości, gdyż argumenty, jakich używaliśmy, nie były zbyt porządne. Chociaż trochę „oszukiwaliśmy", użyliśmy jednak wszystkich stałych w ten sposób, że wyszła dobra liczba! Tę liczbę, 13,6 eV, nazywa się jednym Rydbergiem energii. Jest to energia jonizacji atomów wodoru. Rozumiemy więc już, dlaczego chodząc po podłodze nie spadamy na dół. Gdy przechadzamy się, nasze buty składające się z olbrzymiej liczby atomów napierają na podłogę, która również składa się z dużej liczby atomów. Aby ścisnąć bardziej atomy, trzeba zamknąć elektrony w mniejszym obszarze, a wówczas ich pędy, na podstawie zasady nieoznaczoności, będą musiały być średnio większe, a to oznacza wyższą energię; odporność atomów na ściskanie jest więc efektem kwantowym, a nie klasycznym. Z punktu widzenia fizyki klasycznej oczekiwalibyśmy, że gdy będziemy coraz bardziej przybliżać do siebie elektrony i protony, energia będzie się w dalszym ciągu zmniejszać, a najlepszym ustawieniem ujemnych i dodatnich ładunków będzie umieszczenie jednych na drugich. Było to rozumowanie dobrze znane fizyce klasycznej i stanowiło dla niej wielką zagadkę, ponieważ istniały atomy. Oczywiście, ówcześni naukowcy musieli znaleźć jakieś wyjście z tych kłopotów — nieważne jakie ono było, w każdym bądź razie obecnie mamy już właściwe wyjaśnienie! (Być może.) Jak się również okazuje, chociaż nie potrafimy tego chwilowo zrozumieć, gdy mamy dużo elektronów, starają się one unikać nawzajem. Gdy jeden elektron zajmuje pewien obszar, drugi nie może się już w nim znajdować. Dokładniej mówiąc, mamy jeszcze dwie możliwości dla spinów, tak że jeden elektron może się znajdować na drugim, jeżeli tylko ich spiny skierowane są przeciwnie. Lecz więcej elektronów w tym miejscu umieścić już nie można. Inne trzeba lokować gdzie indziej i to jest prawdziwa przyczyna wytrzymałości substancji. Gdybyśmy mogli umieścić wszystkie elektrony w tym samym miejscu, substancje uległyby jeszcze większemu zgęszczeniu, niż dzieje się to normalnie. To właśnie fakt, że elektronów nie można umieszczać jeden na drugim, powoduje trwałość stołów czy krzeseł. Widzimy więc, że aby wyjaśnić własności materii, będziemy musieli posłużyć się mechaniką kwantową, a nie zadowalać się jedynie mechaniką klasyczną. 38-5. Poziomy energetyczne Mówiliśmy dotychczas o atomie w jego najniższym stanie energetycznym. Okazuje się jednak, że elektron może się poruszać i w bardziej energiczny sposób, mamy więc również i inne możliwe ruchy atomu. Zgodnie z mechaniką kwantową, atom w warunkach stacjonarnych może mieć tylko pewne ściśle określone wartości energii. Widzimy to z rys. 38.9, na którym odkładamy energię pionowo i dla każdej dozwolonej wartości energii rysujemy linię poziomą. Gdy elektron jest swobodny, tzn. wtedy gdy energia jest dodatnia, każda wartość energii jest dopuszczalna; elektron może się poruszać z dowolną szybkością- Energie elektronu związanego nie są natomiast dowolne Atom ma do wyboru tylko jedną z układu pewnych dopuszczalnych wartości, takich jak te 7 rys. 38.9.
38-S. POZIOMY ENERGETYCZNE 199 Oznaczmy te dozwolone wartości energii £0, E,, £2, £,. Atom znajdujący się początkowo w jednym z tych „stanów wzbudzonych", £,, £2 itd., nie pozostaje w nim na zawsze. Prędzej czy później spada do stanu niższego, wypromieniowujac energię w postaci światła. Częstość emitowanego światła określona jest przez zasadę zachowania energii wraz z warunkiem mechaniki kwantowej mówiącym, że częstość światła jest związana z jego energią zależnością (38.1). Tak więc częstość światła emitowanego przy przejściu z poziomu Ej na poziom E, równa się w31=(£J-E1)/ft. (38.14) Jest to więc pewna charakterystyczna częstość atomu, która określa położenie pewnej linii widmowej w emitowanym przez ten atom promieniowaniu. Inne możliwe przejście — to przejście z poziomu £3 na poziom E0. Będzie ono miało inną częstość: w30=(E3-E0)jh. (38.15) Jeszcze inna możliwość występuje wtedy, gdy atom wzbudzony do stanu £,, spada do stanu podstawowego emitując foton o częstości w10 = (£,-£„)/*. (38.16) Podaliśmy aż trzy przejścia, gdyż chcielibyśmy wskazać na pewien interesujący związek. Z zależności (38.14), (38.15) i (38.16) wynika, że W3o = W3,+tó10 (38.17) Całkiem ogólnie, jeżeli znaleźliśmy dwie linie widmowe, oczekujemy, że dla częstości równej sumie (lub różnicy) poprzednich częstości znajdziemy jeszcze jedną linię oraz że położenia wszystkich tych linii można zrozumieć wprowadzając pewien ciąg poziomów, taki że każda linia odpowiada różnicy energii jakiejś pary poziomów. Ta wspaniała zgodność częstości widmowych została zauważona przed odkryciem mechaniki kwantowej i nazywa się ją zasadą kombinacji Ritza. Z punktu widzenia mechaniki klasycznej jest to jeszcze jedna zagadka. Nie zatrzymujmy się już dłużej nad tym, że fizyka klasyczna zawodzi kompletnie w dziedzinie atomowej; wydaje się, że pokazaliśmy to już dość dobrze. Mówiliśmy już o tym, że w mechanice kwantowej pojawiło się pojęcie amplitud, które zachowują się jak fale z pewnymi częstościami i wektorami falowymi. Zobaczmy czy operując jedynie amplitudami można zrozumieć pojawienie się dyskretnych poziomów energetycznych atomu. Na podstawie tego, co powiedzieliśmy do tej pory, trudno zrozumieć, jak to jest możliwe. Przypomnijmy jednak sobie dobrze znany fakt, że fale zamknięte w ograniczonej przestrzeni mają określone częstości. Gdy na przykład fale dźwiękowe są zamknięte w piszczałce organowej lub w czymś podobnym, drgania mogą się odbywać na różne sposoby; każdemu z nich odpowiada jednak ściśle określona częstość. Obiekt, w którym fale zostały zamknięte 38.9. Diagram poziomów energetycznych atomu ukazujący różne możliwe przejścia i LU u £ (J' .', >/>. F? 1 <-2 f. T . r„
200 38 PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA ma więc pewne częstości rezonansowe. A zatem, możliwość występowania tylko przy pewnych określonych częstościach jest własnością fal zamkniętych w ograniczonej przestrzeni (zagadnieniem tym, włącznie z podaniem odpowiednich wzorów, zajmiemy się później). Ponieważ jednak między częstością amplitudy a energią istnieje określony związek, nie powinno więc nas zbytnio dziwić, że dla elektronów związanych w atomach otrzymujemy określone energie. 38-6. Konsekwencje filozoficzne Rozpatrzmy krótko niektóre filozoficzne wnioski wypływające z mechaniki kwantowej. Jak zwykle, mamy dwie strony tego zagadnienia: pierwsza — to wnioski filozoficzne płynące dla fizyki, druga - to ekstrapolacja problemów filozoficznych do innych dziedzin. Gdy związane z nauką koncepcje filozoficzne są przenoszone do innej dziedziny, zostają przeważnie całkowicie zniekształcone. Ograniczymy się więc jak tylko można do samej fizyki. Najbardziej interesującą sprawą jest bez wątpienia koncepcja zasady nieoznaczoności; dokonanie obserwacji zmienia samo zjawisko. O tym, że dokonywanie obserwacji ma wpływ na zjawisko, wiedziano zawsze. Istotne jest jednak, że efektu tego nie można pominąć, zminimalizować lub zmniejszyć w określony sposób zmieniając odpowiednio urządzenie. Gdy badamy jakieś zjawisko, nie możemy uniknąć zaburzenia go w pewien określony, minimalny sposób i zaburzenie to jest niezbędne do utrzymania nie sprzeczności całego obrazu. Również w fizyce przedkwantowej obserwator był czasami potrzebny, lecz raczej w banalnych sytuacjach. Wysuwano na przykład następujący problem: w lesie wali się drzewo, a w pobliżu nie ma nikogo, kto by mógł to usłyszeć. Czy wywoła ono jakiś dźwięk? Prawdziwe drzewo padające w prawdziwym lesie zawsze wywołuje dźwięk, oczywiście nawet i wtedy, gdy nikogo tam nie było. Nawet jeśli nie było nikogo, kto by mógł to usłyszeć, pozostały jakieś ślady. Dźwięk spowoduje wstrząs liści i jeśli będziemy wystarczająco dokładni, stwierdzimy, że na którymś tam liściu powstało jakieś maleńkie zadrapanie, którego nie można wytłumaczyć, jeżeli się nie założy, że ilść doznał wibracji. W pewnym więc sensie musimy przyznać, że dźwięk wystąpił. Można się natomiast pytać, czy wystąpiło wrażenie dźwięku. Odpowiadamy na to negatywnie, gdyż wrażenia są prawdopodobnie związane ze świadomością. A o tym czy mrówki mają świadomość i czy były mrówki w tym lesie oraz czy drzewo ma świadomość — nie wiemy. Zostawmy ten problem w takiej właśnie postaci. Od chwili powstania mechaniki kwantowej kładzie się również nacisk na to, że nie powinniśmy mówić o wielkościach, których nie umiemy zmierzyć (również teoria względności mówiła o tym). Tak długo, jak długo jakaś wielkość nie może zostać zdefiniowana przez pomiar, nie ma dla niej miejsca w teorii. A ponieważ dokładna wartość pędu zlokalizowanej cząstki nie może zostać zdefiniowana przez pomiar, nie powinna więc występować w teorii- Koncepcja głosząca, że to właśnie było błędem fizyki klasycznej, jest jednak niesłuszna i świadczy o niedokładnej analizie sytuacji. To, że nie możemy dokładnie zmierzyć położenia i pędu, nie oznacza a priori, że nie możemy o nich mówić. Oznacza jedynie, że nie musimy o nich mówić. W naukach ścisłych mamy następującą sytuację: Wielkości, których
38-6. KONSEKWENCJE FILOZOFICZNE 201 nie możemy zmierzyć, i koncepcje lub pojęcia, których nie możemy powiązać bezpośrednio z doświadczeniem, mogą być lub nie być użyteczne. Nie jest jednak konieczne, aby występowały w teorii. Innymi słowy, przypuśćmy, że porównujemy klasyczny opis świata z opisem kwantowym i przypuśćmy dalej, że doświadczalnie prawdą jest, że położenie i pęd możemy mierzyć jedynie niedokładnie. Chodzi teraz o to, czy pojęcia dokładnego położenia cząstki i dokładnego pędu cząstki są ważne czy nie. Teoria klasyczna przyjmuje te pojęcia, teoria kwantowa — nie. Ale nie oznacza to jeszcze, że fizyka klasyczna jest błędna. Gdy odkryto mechanikę kwantową, fizycy „klasyczni" — a byli nimi wtedy wszyscy z wyjątkiem Heisenberga, Schrodingera i Borna — mówili: „Spójrzcie sami, z waszej teorii nie ma żadnego pożytku, gdyż nie możecie odpowiedzieć na pytanie w rodzaju: jakie jest dokładne położenie cząstki? przez który otwór ona przechodzi? Itp.". Odpowiedź Heisenberga brzmiała: „Nie muszę odpowiadać na takie pytania, ponieważ nie umiecie postawić ich doświadczalnie". Chodzi właśnie o to, że nie musimy. Rozpatrzmy dwie teorie: a i b. Teoria a zawiera koncepcję, której nie można sprawdzić bezpośrednio, którą jednak posługujemy się w czasie analizy zjawiska, druga teoria, b, nie zawiera natomiast tej koncepcji. Gdy obie teorie będą się różnić w swych przewidywaniach, nie możemy twierdzić, że teoria b jest fałszywa, gdyż nie wyjaśnia koncepcji zawartej w a, koncepcja ta jest bowiem jedną z tych rzeczy, których nie można sprawdzić bezpośrednio. Dobrze zawsze wiedzieć, których koncepcji nie można sprawdzić bezpośrednio, nie ma jednak potrzeby usuwania ich wszystkich. Nie jest prawdą, że możemy posuwać wiedzę naprzód używając tylko wielkości tych, które są bezpośrednio mierzone w doświadczeniu. W samej mechanice kwantowej posługujemy się pojęciami amplitudy funkcji falowej potencjału oraz wielu innymi konstrukcjami, których nie można bezpośrednio zmierzyć. Podstawą nauki jest jej zdolność do dokonywania przewidywań. Przewidzieć — to znaczy powiedzieć, co zajdzie w doświadczeniu, które jeszcze nigdy nie zostało wykonane. W jaki sposób można to zrobić? Trzeba założyć, że niezależnie od doświadczenia wiemy, co się tam dzieje. Musimy ekstrapolować doświadczenia do obszaru, w którym nie zostały jeszcze wykonane. Musimy rozszerzyć stosowalność naszych koncepcji na dziedziny, w których nie zostały jeszcze sprawdzone. Jeśli nie zrobimy tego, nie będziemy mogli przewidywać. Było więc zupełnie zrozumiałe, że fizycy klasyczni z całym spokojem zakładali, że położenie, które z całą pewnością oznaczało coś dla piłki futbolowej, oznacza coś również i dla elektronu. Nie była to głupota. Było to całkiem sensowne postępowanie. Dzisiaj mówimy, że teoria względności jest prawdziwa dla wszystkich energii, lecz pewnego pięknego dnia zjawi się ktoś i stwierdzi, jacy to głupi byliśmy tak sądząc. Tak długo, jak długo „nie nadstawimy karku", nie będziemy wiedzieli, w kórym miejscu popełniliśmy głupstwo. Chodzi więc o to, aby nadstawić karku. I jedynym sposobem na przekonanie się, że nie mamy racji, jest dokonanie pewnych przewidywań. Tworzenie konstrukcji myślowych jest absolutnie niezbędne. Poczyniliśmy już poprzednio kilka uwag o indeterminizmie mechaniki kwantowej. Powiedzieliśmy, że w danej sytuacji fizycznej, najstaranniej nawet przygotowanej, nie Jesteśmy w stanie przewidzieć, co się zdarzy. Gdy mamy atom, który znajduje się w stanie obudzonym i w związku z tym wyemituje po pewnym czasie foton, nie potrafimy powiedzieć, kiedy to nastąpi. Mamy jedynie pewną amplitudę określającą możliwość wyemi-
202 38. PORÓWNANIE DWÓCH PUNKTÓW WIDZENIA towania w danym momencie i możemy jedynie określić prawdopodobieństwo emisji; nie możemy przewidzieć dokładnie przyszłości. Stało się to źródłem najrozmaitszych nonsensów i pytań dotyczących wolności woli i nieoznaczoności świata. Oczywiście, musimy podkreślić, że w fizyce klasycznej również mamy w pewnym sensie indeterminizm. Zwykle uważa się, że indeterminizm, niemożność przewidzenia przyszłości, jest ważną cechą mechaniki kwantowej. Twierdzi się, że cecha ta ma wyjaśnić zachowanie się naszego umysłu, nasze uczucie, wolną wolę itd. Gdyby jednak świat był „klasyczny" - gdyby prawa mechaniki były prawami fizyki klasycznej — nie jest wcale oczywiste, że nasz umysł nie zachowywałby się mniej lub bardziej tak samo jak obecnie. Z punktu widzenia mechaniki klasycznej prawdą jest, że gdybyśmy znali położenie i prędkość każdej cząstki na świecie czy też w naczyniu z gazem, moglibyśmy przewidzieć, co się stanie. W związku z tym świat klasyczny jest światem deterministycznym. Przypuśćmy jednak, że dysponujemy tylko skończoną dokładnością i nie wiemy dokładnie, gdzie znajduje się jeden z atomów. Powiedzmy.że określiliśmy jego położenie z dokładnością do jednej miliardowej. Gdy atom ten zderzy się następnie z innym atomem, wówczas, ze względu na błąd, z jakim znaliśmy jego położenie, po zderzeniu stwierdzamy, że znamy je z jeszcze większym błędem. Dokładność, z jaką znamy położenie, maleje oczywiście jeszcze bardziej po następnym zderzeniu. Jeśli więc zaczniemy nawet od maleńkiego błędu, szybko będzie on wzrastać, dając bardzo dużą nieoznaczoność. Aby dać jakiś przykład: gdy woda przelatuje poprzez zaporę, rozpryskuje się. Jeżeli stoimy opodal — coraz to jakaś kropla ląduje na naszym nosie. Wydaje się to zupełnie przypadkowe, niemniej jednak zachowanie to można dokładnie przewidzieć przy pomocy praw fizyki klasycznej. Dokładne położenie wszystkich kropel wody zależy od ich zachowania się przed przejściem przez zaporę. W jaki sposób? Najmniejsze nieregularności ruchu wody zostają wzmocnione przy jej spadaniu, otrzymujemy więc zupełną przypadkowość. Z całą pewnością nie możemy przewidzieć położenia poszczególnych kropel, nie znając ruchu wody z zupełną dokładnością. Mówiąc ściślej, przy pewnej dokładności, z jaką znamy warunki początkowe, jak duża by ona była, możemy zawsze podać taką chwilę, dla której nie możemy już robić żadnych przewidywań. Ważne jest lo, że chwila ta nie jest zbyt odległa. Gdy mamy dokładność równą jednej miliardowej, wspomniany czas nie równa się milionom lat. W rzeczywistości zależy on od błędu w sposób logarytmiczny i jak się okazuje, po bardzo małym okresie czasu tracimy wszelkie informacje. Jeżeli dokładność będzie równa jednej wielo-wielo- miliardowej — bez znaczenia, ile miliardów weźmiemy, bylebyśmy tylko w pewnym miejscu stanęli — wówczas stwierdzimy, że po czasie mniejszym od potrzebnego do otrzymania tej dokładności nie potrafimy już przewidzieć, co się stanie! Nie należy więc mówić, że z widocznej swobody i indeterminizmu umysłu ludzkiego powinniśmy byli wywnioskować, że klasyczna „deterministyczna" fizyka nie może mieć żadnych szans na zrozumienie go, i witać mechanikę kwantową jako uwolnienie z „całkowicie mechanistycznego" świata- Już bowiem w mechanice klasycznej mieliśm> indeterminizm z praktycznego punktu widzenia.
39 kinetyczna teoria gazów 39-1. Własności materii W rozdziale tym rozpoczynamy omawianie nowego tematu, któremu chcemy teraz poświęcić nieco czasu. Stanowi on pierwszą część analizy własności materii z punktu widzenia fizyki. Punktem wyjścia tej analizy jest uznanie, że materia jest zbudowana z wielkiej liczby atomów lub jakichś elementarnych części, które oddziałują elektrycznie i podlegają prawom mechaniki. Opierając się na tym poglądzie postaramy się zrozumieć, dlaczego różne zespoły atomów zachowują się właśnie w ten, a nie w inny sposób. Trzeba stanowczo podkreślić, że omawiany temat jest naprawdę trudny. Dlatego będziemy go traktować inaczej niż poprzednie. W przypadku mechaniki i nauki o świetle mogliśmy rozpocząć od precyzyjnego ustalenia pewnych praw, na przykład praw Newtona lub wzoru dla pola wytworzonego przez przyspieszony ładunek. Prawa te od razu pozwalały zrozumieć całe bogactwo zjawisk i stanowiły podstawę naszego rozumienia mechaniki i optyki. I chociaż następnie mogliśmy rozszerzyć naszą wiedzę, to jednak nie mogliśmy poznać innej fizyki, a tylko uzyskać doskonalsze metody matematycznego badania zjawisk. Takie postępowanie nie będzie skuteczne przy badaniu własności materii. Potrafimy badać materię tylko najbardziej uproszczonymi metodami. Rozpoczęcie od odpowiednich Podstawowych praw, które są po prostu prawami mechaniki i elektryczności byłoby zbyt skomplikowane. Prawa te są zbyt odległe od zjawisk, którymi chcemy się zająć. Zbyt wiele etapów dzieli znajomość praw Newtona od poznania własności materii, przy tym poszczególne etapy są dość skomplikowane. Przejdziemy tylko parę spośród nich. Ale chociaż w'ele naszych rozważań będzie zupełnie ścisłych, ich ostateczny wynik okaże się mało dokładny. Zdobędziemy tylko przybliżoną znajomość własności materii. Jednym z powodów ograniczenia się do takiej niedoskonałej analizy jest to, że poznanie własności materii wymaga głębokiej znajomości rachunku DrawdoDodobienstwa:
204 39 KINETYCZNA TEORIA GAZÓW nie chcemy bowiem wiedzieć, dokąd każdy atom rzeczywiście zmierza, aJe raczej, ile ich średnio porusza się w jakimś kierunku oraz jakie jest prawdopodobieństwo wystąpienia różnych zjawisk. W stosunku do tych wymagań nasze przygotowanie matematyczne jest niewystarczające i nie chcemy go zbytnio poszerzać. Drugim powodem, ważniejszym z punktu widzenia fizyki jest to, że atomy zachowują się niezgodnie z prawami mechaniki klasycznej, lecz zgodnie z prawami mechaniki kwantowej, i poprawne zrozumienie naszego tematu nie jest możliwe bez znajomości mechaniki kwantowej. Tutaj, inaczej niż w przypadku zachowania się kul bilardowych lub samochodów, różnica między prawami mechaniki klasycznej i mechaniki kwantowej jest bardzo istotna i doniosła — zatem wiele z tego, co wydedukujemy przy pomocy fizyki klasycznej, będzie z gruntu nieprawdziwe. Wskutek tego pewne zjawiska poznamy tylko częściowo. Jednak zawsze przypadki błędnych wyników będziemy sygnalizowali i w ten sposób poznamy granice możliwości mechaniki klasycznej. W poprzednich rozdziałach zajmowaliśmy się mechaniką kwantową właśnie po to, żeby wskazać na różne dziedziny, w których mechanika klasyczna w mniejszym lub większym stopniu zawodzi. Dlaczego jednak teraz zajmujemy się tym tematem? Dlaczego nie poczekamy rok lub pół, kiedy poznamy lepiej rachunek prawdopodobieństwa oraz mechanikę kwantową — i będziemy mogli poznać własności materii gruntowniej? Otóż temat nasz jest trudny i najlepszym sposobem zrozumienia go jest postępowanie stopniowe! Najpierw musimy się zorientować, w mniejszym lub większym stopniu, co powinno nastąpić w różnych okolicznościach, i dopiero wtedy, po lepszym poznaniu praw, będziemy mogli lepiej te prawa sformułować. Każdy, kto chce badać właściwości materii, może rozpocząć od wypisania podstawowych równań i próbować je rozwiązać. Niektórzy rzeczywiście tak postępują, próby te jednak skazane są na niepowodzenie. Sukcesy osiągają ci, którzy za punkt wyjścia obierają fizykę, którzy z grubsza wiedzą, dokąd zmierzają i którzy rozpoczynają od uzasadnionych przybliżeń, wiedząc, co ma większe, a co mniejsze znaczenie w kolejnych skomplikowanych sytuacjach. Napotkamy problemy tak skomplikowane, że przyda się nawet elementarna, chociaż niedokładna i niekompletna wiedza o nich i dlatego w ciągu całego kursu fizyki będziemy powracali do naszego tematu wielokrotnie, za każdym razem z coraz większą dokładnością. Innym powodem, dla którego rozpoczynamy nasz temat właśnie w tym momencie jest okoliczność, że poznaliśmy już wiele z jego elementów, np. w chemii, a nawet stykaliśmy się z nimi w szkole średniej. Interesujące będzie zapoznanie się z fizycznymi podstawami tych zjawisk. Podamy tu jeden z takich interesujących przykładów. Wiemy wszyscy, że w równych objętościach gazów o tej samej temperaturze i przy tym samym ciśnieniu znajdują się jednakowe liczby cząsteczek. Prawo stosunków wielokrotnych mówiące, że objętości gazów reagujących muszą Rozostawać w stosunku liczb całkowitych, doprowadziło Avogadre do stwierdzenia, że w równych objętościach gazów znajdują się jednakowe liczby atomów- Ale dlaczego tak jest? Czy możemy to wydedukować z praw Newtona? Tą sprawą zajmiemy się obecnie. W następnych rozdziałach omówimy jeszcze inne zjawiska, dotyczące ciśnienia,
39-1. WŁASNOŚCI MATERII 205 Przekonamy się także o możliwości traktowania naszego tematu bez odwoływania się do atomowej struktury substancji oraz o występowaniu wielu wewnętrznych zależności między własnościami substancji. Tak na przykład przy sprężaniu substancja się ogrzewa, a przy ogrzewaniu zwiększa objętość. Zależność między tymi dwoma faktami można wykryć bez znajomości całego mechanizmu, na którym się ona opiera. Zajmuje się tym termodynamika. Gruntowną wiedzę o termodynamice uzyskuje się oczywiście drogą poznania tego mechanizmu. Tym właśnie będziemy się zajmować: przyjmiemy za punkt wyjścia atomową strukturę substancji i na tej drodze postaramy się zrozumieć różne własności materii i prawa termodynamiki. Rozpocznijmy zatem omawianie własności gazów biorąc za punkt wyjścia prawa mechaniki newtonowskiej. 39-2. Ciśnienie gazn Wiemy wszyscy, że gaz wywiera ciśnienie i powinniśmy wyraźnie sobie uświadomić, skąd się ono bierze. Jeżeliby nasze uszy były kilkakrotnie czulsze, słyszelibyśmy nieustanny, gwałtowny hałas. Ewolucja nie rozwinęła ich do tego stopnia, ponieważ byłoby to nieużyteczne — słyszelibyśmy ciągły zgiełk. Błona bębenkowa styka się z powietrzem, które składa się z wielkiej liczby cząsteczek, będących w ciągłym ruchu i uderzających o nią. Uderzając, cząsteczki wywołują nieregularne bębnienie, którego nie słyszymy, ponieważ atomy są zbyt małe, a ucho nie dość czułe, aby je usłyszeć. W wyniku tego nieustannego bombardowania błonka powinna się przesunąć, ale od jej drugiej strony występuje oczywiście taki sam nacisk, tak że wypadkowa siła nacisku równa się zeru. Jeżeli usunęlibyśmy powietrze z jednej strony błonki lub zmienilibyśmy stosunek ilości powietrza z obu stron, błona przesunęłaby się w jedną lub drugą stronę, ponieważ liczba uderzeń z jednej strony byłaby większa niż z drugiej. Czasami doznajemy tego nieprzyjemnego uczucia, jadąc zbyt szybko windą lub lecąc samolotem, szczególnie gdy jesteśmy przeziębieni (przy przeziębieniu stan zapalny powoduje zamknięcie rurki doprowadzającej powietrze z gardła do wewnętrznej strony błony bębenkowej, tak że ciśnienia z obu jej stron nie mogą się szybko wyrównać). Próbując ilościowo zanalizować sytuację, wyobrażamy sobie, że w zbiorniku zamkniętym ruchomym tłokiem znajduje się gaz. Chcielibyśmy znaleźć działającą na tłok siłę, wywieraną przez atomy znajdujące się w zbiorniku. Objętość zbiornika równa się V. Atomy poruszają się w nim z różnymi prędkościami i uderzają w tłok. Załóżmy, że z drugiej strony tłoka jest próżnia. Co się stanie, gdy zostawimy tłok bez podparcia? Za każdym uderzeniem będzie zyskiwał on bardzo mały pęd i stopniowo wysunie się ze zbiornika. Aby więc temu zapobiec, musimy go trzymać siłą F. Pow- &taje pytanie: jak duża ma być ta siła? Jednym ze sposobów JeJ wyrażenia jest posługiwanie się wielkością siły przypadającej na jednostkę powierzchni: jeżeli A jest powierzchnią 39.1. Atomy gazu w zbiorniku zamkniętym tłokiem poruszającym się bez tarcia
206 39. KINETYCZNA TEORIA GAZÓW tłoka, siła działająca na tłok jest proporcjonalna do tej powierzchni. Z kolei ciśnienie określamy jako siłę, którą musimy trzymać tłok, podzieloną przez powierzchnię tłoka: P = F/A. (39.1) Aby się upewnić, czy zrozumieliśmy o co chodzi, obliczmy różniczkę pracy dW (którą musimy i tak kiedyś obliczyć) koniecznej do sprężenia gazu przez przesunięcie tłoka o — dx. Powinna ona się równać iloczynowi siły i odległości, o jaką przesunęliśmy tłok, co zgodnie z wzorem (39.1) jest równe ciśnieniu razy powierzchnia, razy odległość. A to równa się, ze znakiem minus, iloczynowi ciśnienia i zmiany objętości: dW=F(-dx)=-PAdx=-PdV. (39.2) (Mnożąc powierzchnię A przez odległość dx otrzymamy zmianę objętości.) Postawiliśmy znak minus, ponieważ przy sprężaniu gazu objętość maleje. Po zastanowieniu się spostrzeżemy, że jeżeli objętość gazu maleje, to musiała być nad nim wykonana jakaś praca. Jaka siła potrzebna jest do zrównoważenia uderzeń cząsteczek? Tłok przy każdym uderzeniu otrzymuje jakiś pęd. Pewna ilość pędu przekazana tłokowi w ciągu sekundy powoduje jego ruch. Aby mu zapobiec, musimy przekazać tłokowi w ciągu sekundy taki sam pęd kosztem naszej siły. Oczywiście, siła równa się pędowi, który musimy dostarczyć tłokowi w ciągu sekundy. Możemy to też sformułować inaczej: jeżeli pozwolimy tłokowi się wysuwać, jego szybkość będzie wzrastała na skutek uderzeń cząsteczek — każde uderzenie zwiększy szybkość tłoka. Przyrost prędkości tłoka, jego przyspieszenie, jest proporcjonalne do przyłożonej siły. Zatem siła, o której mówiliśmy jako o iloczynie ciśnienia i powierzchni, równa się pędowi przekazanemu tłokowi w ciągu jednej sekundy przez zderzające się z nim cząsteczki. Łatwo możemy obliczyć pęd przekazany w ciągu sekundy. Zrobimy to w dwóch etapach: najpierw obliczymy pęd przekazany przez atom zderzający się z tłokiem, a następnie pomnożymy to przez liczbę uderzeń atomów o tłok w ciągu sekundy. Siła będzie iloczynem tych dwóch czynników. Zobaczmy teraz, jakie są te czynniki. Przede wszystkim przyjmiemy, że tłok jest idealnym „reflektorem" dla atomów. W przeciwnym razie cała teoria byłaby fałszywa, tłok zacząłby się ogrzewać i wszystko przebiegałoby inaczej, chociaż ostatecznie po ustaleniu się stanu równowagi zderzenia i tak byłyby idealnie sprężyste. Średnio biorąc, każda cząsteczka dobiegająca do tłoka opuszcza go z taką samą energią. Zatem wyobrażamy sobie, że gaz jest w stanie stacjonarnym i nie występuje przekazywanie energii tłokowi, ponieważ jest on nieruchomy. W tych warunkach cząsteczka uderzająca o tłok z pewną szybkością odskakuje odeń z taką samą szybkością, przy czym masa cząsteczek się nie zmienia. Jeżeli v jest prędkością atomu, a vx — składową x-ową v, wtedy mvx jest joową składową pędu w kierunku tłoka; mamy także równą jej składową pędu w kierunku przeciwnym. Dlatego całkowity pęd przekazany tłokowi przez cząstkę w jednym akcie zderzenia równa się 2mvx, ponieważ odbija się ona „idealnie". Z kolei chcemy znać liczbę uderzeń atomów w ciągu jednej sekundy lub w pewnym odstępie czasu dt; potem podzielimy ją przez dt. Ile atomów uderza? Przyjmijmy, że S ... — j.... —,;h.,;<» cio m nhi^trićri V czyli « = A7 K atomów w jednostkowej objętości. W celu
39-2. CIŚNIENIE GAZU 207 obliczenia, ile atomów uderza w tłok, zanotujmy, przyjąwszy określony odstęp czasu /, że jeżeli cząstka ma jakąś prędkość w kierunku tłoka, to się z nim zderzy w ciągu tego czasu /, jeżeli będzie dostatecznie blisko. Jeżeli będzie ona zbyt daleko, to w czasie / zdąży przebyć zaledwie część drogi dzielącej ją od tłoka, ale do niego nie dotrze. Dlatego nie ulega wątpliwości, że tylko cząsteczki odległe od tłoka o vxt uderzą weń w ciągu czasu /. Zatem liczba zderzeń z tłokiem w ciągu czasu / równa się liczbie atomów zawartych w prostopadłościanie o wysokości vxt. Ponieważ powierzchnia tłoka wynosi A, objętość obszaru, który wypełniają atomy uderzające o tłok, równa się vxtA. Zatem liczba atomów, które uderzą o tłok, jest równa iloczynowi tej objętości i liczby atomów zawartych w jednostkowej objętości, nvxtA. Oczywiście, nie chodzi nam o liczbę zderzeń w ciągu czasu /, ale w ciągu 1 s, dzieląc zatem przez / otrzymamy nvxA. (Możemy przyjąć bardzo krótki czas /; jeżeli chcemy postąpić w bardziej wyszukany sposób, oznaczmy go przez dt i zróżniczkujmy — wynik będzie taki sam.) Stwierdziliśmy więc, że siła równa się F = nvxA-2mvx (39.3) Jak widzimy, siła jest proporcjonalna do powierzchni, jeśli ją zmieniamy przy ustalonej gęstości cząstek! Ciśnienie jest zatem równe P = 2nmvl. (39.4) Zwróćmy uwagę na następujące trudności: po pierwsze — nie wszystkie cząsteczki mają tę samą szybkość, po drugie — nie poruszają się w tym samym kierunku. A więc dla każdej cząsteczki vi będzie inne! Musimy zatem wziąć średnią wszystkich vi, ponieważ każda z nich wnosi swój odrębny wkład. To, o co nam chodzi, równa się vx do kwadratu, uśrednione na wszystkie cząsteczki: P = nm<t>x2>. (39.5) Czy zapomnieliśmy tu o czynniku 2? Nie, ponieważ tylko połowa wszystkich atomów zmierza do tłoka. Druga połowa porusza się w przeciwnym kierunku, zatem jeśli obliczymy <t'*>, uwzględnimy zarówno ujemne vx do kwadratu, jak i dodatnie. A więc biorąc <!>*> bez zwracania uwagi na znak, otrzymamy dwukrotnie więcej, niż chcemy. Średnia vx dodatnich vx równa się średniej v\ wszystkich vx, podzielonej przez 2. Skoro atomy poruszają się we wszystkich kierunkach, to kierunek x niczym się nie wyróżnia. Atomy mogą się poruszać w kierunku z góry na dół, w przód i do tyłu, w kierunku tłoka lub przeciwnie. Dlatego możemy powiedzieć, że <i\> — średni ruch atomów w jednym kierunku i średnie ruchy w dwu pozostałych kierunkach są takie same: <^> = <^2> = <^>- (39-6) Wystarczy tylko prosty chwyt matematyczny, by spostrzec, że każdy z nich równa się jednej trzeciej ich sumy, która oczywiście jest równa kwadratowi szybkości: <vl>=Kv2x+v2y+v2z> = <v2»3. (39.7) Wyższość tego wyrażenia polega na tym, że nie musimy się już martwić o jakiś określony
208 39. KINETYCZNA TEORIA GAZÓW kierunek i możemy teraz nasz wzór na ciśnienie zapisać jako P=fn<roi;2/2>. (39.8) Ostatni czynnik napisaliśmy w postaci <mt>2/2>, ponieważ określa on energię kinetyczną ruchu środka masy cząsteczki. Stwierdziliśmy więc, że />F = N(ś)<mt>2/2>. (39.9) Mając to równanie, możemy obliczyć ciśnienie, jeżeli znamy szybkości. Jako bardzo prosty przykład weźmy hel albo jakiś inny gaz, np. argon, którego cząsteczki są pojedynczymi atomami bez żadnych ruchów wewnątrzcząsteczkowych. Mogą to być też pary rtęci lub potasu w dostatecznie wysokiej temperaturze. Jeśli cząsteczka jest złożona, to mogą w niej wystąpić jakieś ruchy wewnętrzne, np. drgania lub coś podobnego. Przyjmiemy tu, że możemy je pominąć. Jest to dość istotna sprawa i będziemy musieli do niej powrócić, ale przekonamy się, że nasze założenie jest słuszne. Zakładamy więc, że możemy nie uwzględniać ruchów wewnętrznych cząstek, a tym samym, że energia kinetyczna ruchu środka masy cząsteczki stanowi, w rozważanym przypadku, całkowitą energię w ogóle. Dla gazu jednoatomowego energia kinetyczna jest więc jego energią całkowitą. Od tego miejsca całkowitą energię będziemy oznaczali literą U (czasami bywa ona nazywana całkowitą energią wewnętrzną; nie wiadomo dlaczego, skoro w odniesieniu do gazu nie ma energii zewnętrznej). Przez całkowitą energię rozumiemy energię wszystkich cząsteczek gazu lub dowolnego innego obiektu. Przyjmiemy, że dla gazu jednoatomowego całkowita energia U równa się iloczynowi liczby atomów i średniej energii kinetycznej każdego atomu, ponieważ odrzuciliśmy możliwość wzbudzenia ruchów wewnątrz atomu. W tej sytuacji otrzymamy zatem PV = $U (39.10) Przy okazji możemy znaleźć odpowiedź na następujące pytanie: Jeżeli gaz w zbiorniku będziemy zwolna sprężali, to jakie ciśnienie będzie potrzebne do zmniejszenia jego objętości? Możemy na to łatwo odpowiedzieć, gdyż ciśnienie jest równe $ energii podzielonej przez V. Przy sprężaniu gazu wykonujemy nad nim pracę zwiększając energię U. Otrzymamy więc pewnego rodzaju równanie różniczkowe. Przyjmując za punkt wyjścia stan o pewnej energii i objętości, możemy obliczyć ciśnienie. Kiedy z kolei sprężamy gaz, energia U wzrasta, a objętość V maleje, a więc ciśnienie się zwiększa. Musimy zatem rozwiązać równanie różniczkowe i za chwilę to zrobimy. Przedtem musimy jednak zwrócić uwagę na założenie, że przy sprężaniu gazu cała wykonana praca jest zużyta na powiększenie energii atomów wewnątrz zbiornika. Możemy mieć wątpliwości, czy tak musi być. Co się z tą pracą może jeszcze stać? Okazuje się, że może być użyta do czegoś innego. Zachodzi mianowicie to, co nazywamy „przeciekaniem ciepła' przez ścianki zbiornika: gorące (tzn. szybko poruszające się) atomy, które bombardują ścianki, ogrzewają je i energia ucieka ze zbiornika. W tym przykładzie przyjmiemy, iż to nie występuje. Aczkolwiek ciągle robimy bardzo szczegółowe założenia dotyczące naszego gazu, to jednak dla uzyskania swego rodzaju bardziej ogólnej sytuacji zastąpimy zależność
39-1. CIŚNIENIE GAZU 209 P V= | U wzorem PV=(y-\)U. (39.11) Tradycyjnie piszemy (y — l) razy U. Później bowiem zajmiemy się paroma innymi przypadkami, w których \ przed U należy zastąpić innymi liczbami. A.by więc mieć możliwość bardziej ogólnego potraktowania tej sprawy, piszemy (y — I), zgodnie z historycznie przyjętym sposobem oznaczenia tej wielkości od prawie stu lat. Zatem dla gazu jedno- atomowego, np. helu, y równa się |, ponieważ | —1 równa się |. Pamiętamy, że przy sprężeniu gazu wykonana jest praca —PdV. Sprężanie, przy którym nie ma .dopływu ani wypływu energii cieplnej, nazywamy sprężaniem adiabatycznym, od greckiego a (nie)+ dia (przez) + bainein (iść). (Słowa „adiabatyczny" używa się w fizyce w różnych okolicznościach i czasami trudno dostrzec, co je łączy.) Zatem przy adiabatycznym sprężaniu cała wykonana praca użyta jest do zmiany energii wewnętrznej. Istotne jest, że nie ma żadnych innych strat energii i dlatego mamy P dV= —dU. Ale ponieważ U= PV/(y— I), możemy napisać dU = (PdV+VdP)l(y-l). (39.12) Mamy więc PdV= —(PdV+ VdP)/(y—l),czy\i grupując wyrazy podobne,yPdV= —VdP a inaczej — (y dV/V)+(dP/P) = 0. (39.13) Tak się szczęśliwie składa, że przyjmując stałe y, co zachodzi w wypadku gazu jedno- atomowego, możemy to równanie scałkować i otrzymujemy y In V+ln P=laC, gdzie In C jest stałą całkowania. Podnosząc e do potęgi In C otrzymamy prawo: PVy = C (pewna stała). (39.14) Inaczej mówiąc, przy adiabatycznym sprężaniu gazu jednoatomowego, gdy jego temperatura rośnie z powodu braku strat energii, iloczyn ciśnienia i objętości do potęgi § jest stały. Chociaż otrzymaliśmy ten wniosek na drodze teoretycznej, wiadomo z doświadczenia, że gazy tak się właśnie zachowują. 39-3. Ściśliwość promieniowania Możemy podać inny przykład z kinetycznej teorii gazów, który jest szczególnie ważny w astronomii. Mamy wielką liczbę fotonów w zbiorniku, w którym panuje bardzo wysoka temperatura. (Zbiornikiem takim może być tylko gaz w bardzo gorącej gwieździe. Słońce jest nie dość gorące do tego celu. W gwieździe występuje oczywiście ogromna liczba atomów, ale przy bardzo wysokiej temperaturze możemy je pominąć i twierdzić, że jedynymi obiektami w zbiorniku są fotony.) Foton ma pewien pęd p. (Zawsze, gdy zajmujemy się kinetyczną teorią gazu jesteśmy w kłopocie: p oznacza bowiem ciśnienie, ale oznacza też pęd; v jest prędkością, ale może być też objętością; T może oznaczać temperaturę, energię kinetyczną, czas lub moment siły — trzeba być kutym na cztery nogi, żeby się w tym nie zgubić!) p oznacza obecnie wektor pędu. Postępując tak jak poprzednio, stwier-
210 39 KIN1 TYCZNA Tl OR1A GAZÓW dzamy. że właśnie składowa jr-owa p powoduje „uderzenie", a podwojona składowa x-owa p jest pędem przekazanym w takim jednym „uderzeniu" Zatem 2px zastępuje 2mvx, ale przy obliczaniu liczby zderzeń vx pozostaje nadal i\. Po wykonaniu wszystkich obliczeń przekonamy się, że ciśnienie różni się teraz od ciśnienia określonego wzorem (39.4) i wynosi P = 2npxv„. (39 15) Po uśrednieniu otrzymamy: średnia z ciśnienia równa się n razy średnia z pxvx (ten sam czynnik 2). W końcu po uwzględnieniu kierunków odpowiadających dwom pozostałym współrzędnym otrzymamy PK = /V<pv>/3. (39.16) Wzór ten zgadza się ze wzorem (39.9), ponieważ pęd cząsteczki równa się m\; jest tylko bardziej ogólny A więc ciśnienie razy objętość równa się iloczynowi całkowitej liczby atomów i średniej wartości j(p*)- Ile wynosi p-ł dla fotonów? Pęd i prędkość mają ten sam kierunek, a prędkość równa się szybkości światła, zatem /w jest dla każdego fotonu iloczynem pędu i szybkości światła. Dla każdego fotonu iloczyn pędu i szybkości światła równa się jego energii: E=pc. Zatem pv są energiami poszczególnych fotonów i powinniśmy wziąć średnią energię pomnożona przez liczbę fotonów. Otrzymamy zatem \ energii wewnętrznej gazu: PV=U/3 (gaz fotonowy). (39 17) Zatem dla fotonów y=^, ponieważ (y— 1) ze wzoru (39.11) dla fotonów wynosi |. Odkryliśmy, że promieniowanie zamknięte w zbiorniku podlega następującemu prawu: PV*I3 = C (39.18) Poznaliśmy w ten sposób ściśliwość promieniowania! Jest to bardzo istotne w badaniu roli ciśnienia promieniowania w gwiazdach. Potrafiliśmy je obliczyć i przewidzieć, jak się zmienia, gdy sprężamy promieniowanie. Jakież wspaniałe rzeczy są już w naszej mocy! 39-4. Temperatura i energia kinetyczna Do tej pory nie zajmowaliśmy się temperaturą; unikaliśmy tego celowo. Wiemy, że przy sprężaniu gazu energia jego cząsteczek wzrasta. Mówimy wtedy, że gaz się ogrzewa; chcielibyśmy zrozumieć, co to ma wspólnego z temperaturą. Jak powinniśmy postąpić, aby przeprowadzić eksperyment nie adiabatycznie, ale w warunkach, które nazywamy temperaturą stałąl Wiemy, że jeżeli zetkniemy z sobą dwa zbiorniki z gazem i pozostawimy je dostatecznie długo w takim stanie (nawet jeśli początkowo oba były w warunkach, które nazywamy różnymi temperaturami), to ich temperatury będą w końcu jednakowe. Co to znaczy? Otóż znaczy to, że oba zbiorniki znajdują się w warunkach, które by osiągnęły stykając się z sobą dostatecznie długo. To właśnie mamy na myśli mówiąc o jednakowej temperaturze przedmiotów - stan końcowy przedmiotów, które stykając się ze sobą przez dostatecznie długi czas, oddziaływały na siebie. Zastanówmy się co zajdzie, jeżeli w dwóch zbiornikach oddzielonych ruchomym tło-
39-4. TEMPERATURA I f NERGIA KINETYCZNA 211 • • • V I o o O o o o kiem.jak na rys. 39.2, znajdują się dwa gazy (dla uproszczenia weźmy dwa jednoatomowe gazy, np. hel i neon). W zbiorniku / atomy mają masy m,, prędkość v, i gęstość n,. W zbiorniku 2 masy atomów są równe m2, ich prędkość r2, a gęstość równa się n2- Jakie są warunki (') u) równowagi? Oczywiście, uderzenia w tłok od strony lewej prze- '9.2. Atomy dwóch różnych je- suną go w prawo, co spowoduje sprężenie gazu po dnoatomowych gazów oddzielone . . , ■ ■ ^ ■ * Ti i i_ ruchomym tłokiem prawej stronie i wzrost ciśnienia z tej strony. Iłok będzie się zatem poruszał z lewej strony na prawą, następnie powracał, aż po kilku takich ruchach zatrzyma się w miejscu, w którym ciśnienia na obie jego strony będą takie same. Możemy zatem tak dobrać warunki, by ciśnienia były równe, to znaczy, by energie wewnętrzne przypadające na jednakowe objętości były jednakowe, albo by iloczyny liczb n i średnich energii kinetycznych po obu stronach tłoka były takie same. Chcemy teraz udowodnić, że gęstości po obu stronach tłoka są jednakowe. Dotąd udowodniliśmy tylko, że n, (m, v]/2> = n1 <m2 ^/2>, na podstawie wzoru (39.8), gdyż są równe ciśnienia. Musimy jednak uprzytomnić sobie, że nie jest to jedyny warunek, jaki na dłuższą metę ma być spełniony, w miarę bowiem ustalania się prawdziwej, zupełnej równowagi odpowiadającej równym temperaturom musi się coś jeszcze powoli zmieniać. Aby zrozumieć o co chodzi, przyjmijmy, że ciśnienie z lewej strony otrzymaliśmy dzięki bardzo dużej gęstości, ale przy niewielkiej prędkości. Mając duże n i małe v możemy otrzymać takie samo ciśnienie jak przy małym n i dużym v. Atomy poruszające się powoli mogą być bardzo gęsto stłoczone albo też może być ich mniej, lecz silniej uderzających. Czy taki stan utrzyma się nieskończenie? Z początku tak się może nam wydawać, ale po namyśle spostrzeżemy, że pominęliśmy pewien ważny moment. Chodzi o to, że na tłok nie jest wywierane stałe ciśnienie — tłok drga tak jak błonka bębenkowa, ponieważ uderzenia nie są zupełnie jednakowe. Nie ma tu jednostajnego, ciągłego nacisku, ale raczej bębnienie, a więc zmienny nacisk, pod którego wpływem tłok drga. Przyjmijmy, że atomy z prawej strony nie uderzają mocno, a z lewej są nieliczne, rzadko rozmieszczone, ale bardzo energiczne. Tłok, otrzymując co pewien czas silne uderzenie z lewej strony, będzie nadawał większą szybkość powolnym atomom po prawej stronie. (Atom zderzając się z tłokiem traci lub zyskuje energię, zależnie od kierunku, w którym porusza się tłok w chwili zderzenia.) W wyniku zderzeń tłok ustawicznie drgając przekazuje energię atomom drugiego gazu, co zwiększa ich szybkość aż do momentu, gdy mogą one już zrównoważyć uderzenia tłoka. Układ osiągnie stan równowagi polegający na tym, że tłok będzie poruszać się z taką średnią kwadratową prędkością, przy której ilość energii pobieranej od gazu będzie równa ilości energii przekazanej atomom gazu. W ten sposób tłok zyskuje pewną średnią prędkość ' właśnie ją chcemy wyznaczyć. Pozwoli nam to lepiej rozwiązać nasze zadanie, gdyż Prędkości gazów będą się zmieniać zbliżając się do siebie aż do chwili, gdy gazy zaczną wzajemnie przekazywać sobie za pośrednictwem tłoka równe ilości energii.
212 39. KINETYCZNA TEORIA GAZÓW Dość trudno jest zanalizować szczegóły ruchu tłoka w podanych okolicznościach; łatwo je zrozumieć, ale nieco trudniej przeprowadzić ich analizę. Zanim do niej przystąpimy, zajmijmy się innym zagadnieniem. Mamy zbiornik, w którym znajdują się gazy złożone z cząsteczek różnego rodzaju o masach mt i mz, o szybkościach vt i v2 itd. Tutaj oddziaływanie jest bardziej bezpośrednie. Jeżeli nawet wszystkie cząsteczki drugiego gazu są nieruchome, to ten stan nie potrwa długo, ponieważ uderzają o nie cząsteczki gazu pierwszego zwiększając ich szybkość. Jeżeli zaś poruszają się szybciej niż cząsteczki pierwszego gazu, to też niedługo, gdyż w końcu przekażą im swoją energię z powrotem. Chcemy teraz znaleźć wzór, który by określał względne szybkości cząsteczek dwóch takich gazów w jednym zbiorniku. To jest też trudne zadanie, ale rozwiążemy je w następujący sposób. Z początku zastanowimy się nad pewnym zadaniem pomocniczym (jest to jedno z zadań, których końcowy wynik niezależnie od wyprowadzenia łatwo zapamiętać, a samo wyprowadzenie jest bardzo pomysłowe). Przyjmijmy, że dwie zderzające się cząsteczki o różnych masach obserwujemy, dla uproszczenia, w układzie ich środka mas (ŚM). Jak wiemy na podstawie praw zderzeń, cząsteczki po zderzeniu, dzięki zasadom zachowania energii i pędu, poruszają się tak, że zachowują swoje pierwotne szybkości, a zmieniają ich kierunki. Zatem dowolne zderzenie wygląda tak jak na rys. 39.3. Przyjmijmy na chwilę, że obserwujemy wszystkie zderzenia, w których ŚM spoczywa. Załóżmy, że początkowo wszystkie cząsteczki poruszają się poziomo. Oczywiście, po pierwszym zderzeniu niektóre z nich poruszają się pod pewnym kątem. Inaczej mówiąc, jeżeli wszystkie cząsteczki poruszały się poziomo, to po pierwszym zderzeniu przynajmniej niektóre z nich będą poruszały się pionowo. W następnych zderzeniach cząsteczki zderzając się pod pewnym kątem odskoczą pod innym. Jeżeli zatem na początku ich ruch był całkowicie uporządkowany, to wskutek zderzeń rozbiegną się we wszystkich kierunkach. Kolejne zderzenia doprowadzą do tego, że wszystkie kierunki będą równouprawnione. Jaki będzie ostateczny rozkład kierunków? Odpowiadamy: prawdopodobieństwo znalezienia dowolnej pary cząsteczek poruszających się w dowolnym kierunku jest takie samo. Potem już żadne dalsze zderzenia nie mogą zmienić rozkładu. Wiemy już, że cząsteczki mogą z równym prawdopodobieństwem poruszać się we wszystkich kierunkach, ale jak to wyrazić? Prawdopodobieństwo poruszania się cząsteczek w jakimś określonym kierunku jest oczywiście równe zeru, -„ 3 _. ed k ponieważ wyrażenie „określony kierunek" jest zbyt dokła- wych cząsteczek oglądane dne » dlatego musimy wybrać „coś innego". Chodzi o to, że w układzie ich środka mas przez każdy wycinek powierzchni kuli, której środkiem jest punkt zderzenia, będzie przelatywało tyle samo cząsteczek, jeśli porównywane wycinki mają te same wymiary. Zatem w wyniku zderzeń powstanie taki rozkład prędkości, że jednakowe elementy powierzchni kuli będą miały takie same szanse trafienia przez cząsteczki. Przy okazji zauważmy interesujący fakt, że przy wybranym początkowym kierunku i kierunku tworzącym z mm kąt 6 odpowiadający mu różniczkowy element powierzchni
39-4- TEMPERATURA 1 ENERGIA KINETYCZNA 213 kuli o jednostkowym promieniu wynosi sin 6 dO pomnożone przez 2n, a więc tyle samo, ile wynosi różniczka 2jtcos 6. To znaczy, że prawdopodobieństwa dowolnej wartości cosinusa kąta 8 między dwoma dowolnymi kierunkami, leżącej w przedziale od — 1 do +1, są takie same. Z kolei musimy się zająć konkretnym przypadkiem zderzenia, nie w układzie ŚM, lecz wtedy, gdy spotykają się dwa dowolne atomy z prędkościami v, i v2 ■ Co się wtedy zdarzy? Możemy zanalizować to zderzenie w następujący sposób: najpierw twierdzimy, że istnieje pewien układ ŚM. Prędkość tego układu równa się „średniej" prędkości z wagami proporcjonalnymi do mas cząsteczek v$M = (m,vl+m2*2)/(m,+m2). Jeżeli obserwujemy to zderzenie w układzie ŚM, wtedy wygląda ono tak jak na rys. 39.3, przy pewnej względnej prędkości cząsteczek w, która wynosi *, — v2. Zatem stwierdzamy, że po pierwsze — cały układ ŚM się porusza i po drugie — w układzie tym cząsteczki poruszają się ze względną prędkością w, zderzają się i odskakują w innym kierunku. W czasie gdy to wszystko zachodzi, układ ŚM nadal się porusza bez żadnych zmian. Jaki będzie w takim razie rozkład prędkości? Z naszych poprzednich rozważań wnioskujemy, że w równowadze wszystkie kierunki w są rozłożone z równym prawdopodobieństwem względem kierunku ruchu układu ŚM.*' Nie będzie zatem żadnej korelacji między kierunkiem ruchu układu ŚM i kierunkiem prędkości względnej w. Oczywiście, jeśliby taka korelacja zachodziła, to zderzenia powinny ją znieść i przywrócić pełną symetrię. Dlatego średnia wartość cosinusa kąta między w i vŚM jest równa zeru, tzn. Ale w*sM może być wyrażone przy pomocy v, oraz v2: (ł,-v2)(w, v,+m2ł2) WVŚN ml+m1 {mlv\-m2v\) + (m2-ml)(vli1) ml+m1 (39.20) Najpierw zajmijmy się iloczynem v,v2 i zapytajmy: ile wynosi jego średnia wartość? lub, co na jedno wychodzi: czemu równa jest średnia wartość składowej prędkości jednej cząsteczki w kierunku ruchu drugiej? Oczywiście, każdy kierunek ruchu danej cząsteczki jest jednakowo prawdopodobny. Średnia wartość prędkości ł2 w dowolnym kierunku jest więc równa zeru. Stąd średnia wartość *2 w kierunku v, jest z pewnością równa zeru. Zatem wartość średnia *, v2 równa się zeru! Dochodzimy więc do wniosku, że średnia wartość 'n.,o, musi być równa średniej wartości m2v\. A zatem średnie energie kinetyczne obu rodzajów cząsteczek muszą być sobie równe: \miv\ = \miv\. (39.21) *' To rozumowanie, pochodzące od Maxwella, zawiera pewne subtelności. Chociaż ostateczny ^niosek jest poprawny, to jednak nie wynika on bezpośrednio z naszych poprzednich rozważań o symetrii, ponieważ przejście do układu odniesienia poruszającego się w gazie może w>wolac zmianę rozkładu prędkości. Nie znaleźliśmy Drosteco dowodu h'un lwierH/rma
214 39. KINETYCZNA TEORIA GAZÓW Jeżeli mamy dwa rodzaje atomów w gazie, to można udowodnić — i przyjmujemy, iż to udowodniliśmy — że średnia energia kinetyczna jednego rodzaju atomów jest taka sama, jak średnia energia kinetyczna . atomów drugiego rodzaju, jeżeli atomy te wchodzą 39.4. Dwa gazy w zbiorniku od- .... ą dzielone półprzepuszczalną prze- w skład Sazu znajdującego się w równowadze w je- grodą dnym zbiorniku. To znaczy, że cięższe atomy poruszają się wolniej niż lżejsze. Obecnie przejdziemy do następnego etapu i powiemy, że dwa różne gazy oddzielone od siebie w zbiorniku będą, po dojściu do stanu równowagi, miały również takie same średnie energie kinetyczne, nawet jeśli nie będą znajdowały się w tym samym zbiorniku. Można to udowodnić na różne sposoby. Oto jeden z nich: Bierzemy zbiornik z nieruchomą przegrodą, w której znajduje się otworek tak mały, że tylko cząsteczki jednego rodzaju mogą przez niego przejść (rys. 39.4), a cząsteczki drugiego rodzaju już się w nim nie zmieszczą. Załóżmy, że cały układ osiągnął stan równowagi. Wtedy, jak wiemy z poprzedniego rozumowania, w tej części, gdzie występuje mieszanina gazów, oba gazy będą miały jednakowe średnie energie kinetyczne. Ponieważ część cząsteczek pierwszego rodzaju będzie przechodziła przez otwór bez straty energii kinetycznej, średnia energia kinetyczna w czystym gazie będzie taka sama, jak w mieszaninie. Nie jest to szczególnie przekonujący dowód, ponieważ nie ma chyba takich otworków, które by mogły rozdzielić dwa rodzaje cząsteczek. Powróćmy do zagadnienia tłoka w zbiorniku z gazem. Możemy twierdzić, że energia kinetyczna tego tłoka musi być także równa i/w2^2 • W rzeczywistości byłaby to tylko energia jego ruchu poziomego; zapominając więc o jego ruchu pionowym, powiemy, że powinna ona być równa \m2v\x. Podobnie ze stanu równowagi z drugiej strony tłoka możemy wywnioskować, że jego energia kinetyczna równa jest ^Witf,^. Wprawdzie tłok nie jest ze wszystkich stron otoczony gazem i styka się tylko z jednym rodzajem z każdej strony, ale nadal, choć jest to nieco trudniejsze, możemy korzystać z faktu, że średnia energia kinetyczna tłoka w wyniku zderzeń cząsteczek z tłokiem równa się średniej energii cząsteczek gazu. Jeżeli i ten dowód nam nie wystarcza, to możemy podać dość sztuczny przykład ustalenia równowagi za pomocą przedmiotu, który może być bombardowany cząsteczkami ze wszystkich stron. Weźmy w tym celu krótki pręt zakończony z obu stron kulkami. Pręt ten wetkniemy w tłok tak, aby mógł poruszać się w nim we wszystkie strony bez tarcia. Każda kulka, podobnie jak cząsteczka, może być uderzana ze wszystkich stron. Cały ten przedmiot ma masę m. Tak jak poprzednio, mamy cząsteczki z masami m, oraz m2. W wyniku zderzeń, jak to udowodniliśmy poprzednio, średnia energia kinetyczna ciała o masie m musi być z jednej strony tłoka równa \mv\. Podobnie z drugiej strony mamy średnią energię kinetyczną równą \mi\. A zatem obie strony muszą mieć taką samą energię kinetyczną, jeżeli są w stanie równowagi cieplnej. A więc chociaż udowodniliśmy to tylko dla mieszaniny gazów, to nie nastręcza większych trudności rozszerzenie naszego twierdzenia dla dwóch różnych gazów oddzielonych od siebie w tej samej temperaturze. • . I o. . 0 . • °.o ' • "o • • !• O • •
J9-4. TEMPERATURA 1 ENERGIA KINETYCZNA 215 Zatem dla dwóch gazów o tej samej temperaturze średnie energie kinetyczne ruclui środków mas cząsteczek są takie same. Średnia energia kinetyczna cząsteczek jest własnością tylko „temperatury". Dlatego, że jest własnością „temperatury", a nie gazu, możemy użyć jej do definicji temperatury. Średnia energia kinetyczna cząsteczek jest w ten sposób pewną funkcją temperatury. Ale kto nam podpowie, jakiej skali użyć do jej mierzenia? Możemy z góry zdefiniować skalę temperatury tak, aby średnia energia kinetyczna była wprost proporcjonalna do temperatury. Najlepiej byłoby nazwać samą średnią energię „temperaturą". To byłaby najprostsza z możliwych funkcji. Niestety, skala temperatury została wybrana inaczej, dlatego zamiast energię nazwać po prostu „temperaturą", używamy stałej proporcjonalnej wiążącej średnią energię cząsteczki i stopień temperatury bezwzględnej, zwany stopniem Kelvina. Stała ta wynosi fc=l,38- 10~2i dżula na każdy stopień Kelvina*'. Zatem jeżeli T jest temperaturą bezwzględną, to zgodnie z naszą definicją średnia energia kinetyczna cząsteczek równa się \kT (\ wzięto dla wygody, aby nie pisać ich w dalszych wzorach). Przypominamy, że energia kinetyczna związana ze składową ruchu w określonym kierunku wynosi tylko \kT. Dopiero wystąpienie trzech niezależnych kierunków prowadzi do ±kT. 39-5. Prawo gazu doskonałego Obecnie możemy oczywiście wstawić naszą definicję temperatury do równania (39.9) i stąd znaleźć prawo dla ciśnienia gazu jako funkcji temperatury: iloczyn ciśnienia i objętości równa się iloczynowi liczby atomów w tej objętości (N), uniwersalnej stałej (k) i temperatury (7-): PV = NkT. (39.22) Co więcej, w określonej temperaturze i w odpowiadającym jej ciśnieniu i objętości liczba atomów jest określona; jest ona także stałą uniwersalną! Zatem równe objętości różnych gazów w tej samej temperaturze i przy tym samym ciśnieniu zawierają takie same liczby cząsteczek i to wynika z praw Newtona. Jest to naprawdę zdumiewający wniosek! W praktyce mając do czynienia z cząsteczkami musielibyśmy posługiwać się bardzo wielkimi liczbami. Dlatego dla ułatwienia chemicy wybrali pewną liczbę, też bardzo wielką, i dali jej specjalną nazwę. Nazwali ją molem. Mol jest po prostu wygodną liczbą. Dlaczego chemicy nie wybrali 1024 obiektów, chociaż tak byłoby jeszcze wygodniej — pozostanie pytaniem dla historyków Tak się złożyło, że chemicy wybrali jako standardową liczbę ^0 = 6,02-10" obiektów i nazwali ją jednym molem tych obiektów. Zamiast podawać liczbę cząsteczek, posługują się pojęciem mola.**' Mając liczbę N0 możemy napisać *» 0" w skali Celsjusza odpowiada 273,16CK, więc 7"=273,l6 + temperalura w skali Celsjusza. **' Chemicy nazywają gramocząsieczkami masy moli cząsteczek wyrażone w gramach. Mol jesi »ak zdefiniowany, że masa jednego mola atomów izotopu węgla 12 Oj. mających 6 protonów i 6 neutronów w jądrze) wynosi dokładnie 12 g
216 39. KINETYCZNA TEORIA GAZÓW iloczyn liczby moli, liczby atomów w jednym molu oraz wielkości kT i jeśli chcemy, to możemy także dać nowe oznaczenie iloczynowi k i liczby atomów w jednym molu, tzn. molowej wartości k, a mianowicie symbol R. Molowa wartość stałej k wynosi 8,317 J: /?=7V0fc=8,317 J/(mol-°K). Znaleźliśmy więc prawo gazu zapisane jako iloczyn liczby moli (również nazywanej N) i RT lub jako iloczyn liczby atomów i kT: PV = NRT (39.23) Wzory (39.22) i (39.23) przedstawiają dokładnie to samo, tylko użyto różnych skal do wyznaczania liczb. We wzorze (39.22) jako jednostki używamy jedynki, a chemicy [wzór (39.23)] liczby 6-10". Omówimy teraz jeszcze jedną kwestię dotyczącą stosowania prawa gazów do innych obiektów niż cząsteczki jednoatomowe. Do tej pory mieliśmy do czynienia tylko z ruchem atomów gazu jednoatomowego w układzie ŚM. Co się zdarzy, gdy wystąpią siły? Najpierw zastanówmy się nad przypadkiem, w którym tłok jest utrzymywany przez poziomą sprężynę, działającą na niego pewną siłą. Wzajemne przekazywanie sobie ruchu skokowego przez atomy i tłok nie zależy oczywiście od miejsca, w którym tłok się w danym momencie znajduje. Warunki równowagi są takie same. Niezależnie od tego, gdzie tłok się znajduje, musi on mieć taką szybkość ruchu, aby przekazać odpowiednią ilość energii cząsteczkom. Zatem obecność sprężyny niczego nie zmienia. Szybkość, z jaką ma się poruszać tłok, jest średnio biorąc, taka sama. A więc nasze twierdzenie, że średnia energia kinetyczna przypadająca na składową ruchu w jednym kierunku wynosi \kT, jest prawdziwe niezależnie od tego, czy siły wystąpią, czy też nie. Weźmy na przykład pod uwagę dwuatomową cząsteczkę złożoną z atomów o masach mA\mB. Udowodniliśmy już, że ruch w ŚM atomu A i atomu B odbywa się tak, że (\mAv\) = = (\mBvBy = \kT. Jak to możliwe, skoro atomy te są związane? Otóż, mimo że są związane, podczas ich wirowania oraz obrotów w cząsteczce jedyną rzeczą, którą trzeba brać pod uwagę przy zderzeniach, jest prędkość ich ruchu. Tylko ten czynnik determinuje szybkość wymiany energii w zderzeniach. W tym szczególnym wypadku siła nie jest czynnikiem istotnym. Dlatego ta sama zasada jest słuszna nawet przy występowaniu sił. Udowodnijmy w końcu, że prawo gazu pozostanie w mocy, gdy nie uwzględnimy ruchu wewnętrznego. Właściwie do tej pory nie mówiliśmy o ruchu wewnętrznym, zajmowaliśmy się tylko gazem jednoatomowym. Teraz udowodnimy, że cały obiekt traktowany jako pojedyncze ciało o masie M ma taką prędkość środka masy, że ±MviM = \kT. (39.24) Innymi słowy, możemy brać pod uwagę równie dobrze cały obiekt, jak i poszczególne jego części. Znajdźmy uzasadnienie, dlaczego tak się dzieje. Masa dwuatomowej cząsteczki równa się U = mA + mB, a prędkość jej środka mas wynosi VśM=(mAvA + mBvB)IM Chcemy znać <UsV\ Podnosząc vsvl do kwadratu, mamy 2 _mAc\ + 2mAmB\A\B + m\v2B Mnożymy obie strony tej równości przez +/V/, bierzemy średnią i otrzymujemy:
39-5. PRAWO GAZU DOSKONAŁEGO 217 ,, ., 2 v mA WT+2mAmB<vA -vB> + mB\kT 2mAmB <Ti4- vB> <iW^śM>= - =$kT+ M m (skorzystaliśmy z faktu że (mA + mB)jM = 1 ]. Czemu równa się <t/,tb>? (Powinno się równać zeru!) Aby na lo odpowiedzieć, skorzystamy z naszego założenia, że prędkość względna v/=\A—\B nie wyróżnia żadnego kierunku, to znaczy, że średnia wartość jej składowej w dowolnym kierunku jest równa zeru. Zatem przyjmujemy, że Ale czemu się równa w vŚM? Otóż (^-VeXm^v^ + mBTg) mAvA + (mB-mA)(vA- vB)-mBvl w»śm = M M Ponieważ (mAvAy = imBvBy, po wzięciu średnich pierwszy i ostatni wyraz znoszą się i otrzymujemy (mB-mA){yAyBy=Q. Jeżeli więc mA^mB, to <v/tvB> = 0, a zatem ruch całej cząsteczki traktowanej jako cząsteczka pojedyncza o masie W jest taki, że jego średnia energia kinetyczna wynosi 32kT. Przy okazji udowodniliśmy także, że średnia energia kinetyczna ruchu wewnętrznego dwuatomowej cząsteczki, bez uwzględnienia energii kinetycznej środka mas, równa się •|A7"! Całkowita bowiem energia kinetyczna obu części cząsteczki wynosi łmAvA + ĄmBi'B, co po uśrednieniu daje *kT+^kT, a zatem 3A7" Energia kinetyczna ruchu środka mas wynosi ĄkT. zatem średnia energia kinetyczna ruchu obrotowego i drgającego dwóch atomów wewnątrz cząsteczki, będąc różnicą energii całkowitej i energii środka mas, równa się^T. Twierdzenie o średniej energii ruchu środka masy jest bardzo ogólne. W dowolnym obiekcie traktowanym jako całość, niezależnie od występowania lub niewystępowania sił, średnią energia kinetyczna każdego istniejącego w nim niezależnego kierunku ruchu wynosi \kT. Te „niezależne kierunki ruchu" są czasami nazywane stopniami swobody układu. Liczba stopni swobody cząsteczki zbudowanej z r atomów równa się 3r, ponieważ dla każdego atomu potrzeba trzech współrzędnych do określenia jego położenia. Całkowita energia kinetyczna cząsteczki może być wyrażona albo jako suma energii kinetycznych wszystkich atomów, albo jako suma energii kinetycznej ruchu ŚM i energii kinetycznej ruchu wewnętrznego. Tę ostatnią można czasami wyrazić jako sumę energii obrotowej cząsteczki 1 energii drgań, ale jest to tylko przybliżenie. Nasze twierdzenie zastosowane do r-atomowej cząsteczki głosi, że będzie ona miała średnio ~rkT J energii kinetycznej, z czego f kT jest energią kinetyczną ruchu środka masy całej cząsteczki, a pozostałe \(r— \)kT przypada na wewnętrzną energię drgań i obrotów cząsteczki.
40 zasady mechaniki statystycznej 40-1. Wzór biometryczny Omówiliśmy już pewne własności dużej liczby zderzających się atomów. Przedmiot tych rozważań nosi nazwę teorii kinetycznej i opisuje materię z punktu widzenia zderzeń między atomami. Uważamy, że większość własności materii powinna dać się w zasadzie wyjaśnić za pomocą badania ruchów jej części. Ograniczymy się na razie do warunków równowagi cieplnej, która zachodzi tylko dla pewnej klasy zjawisk przyrody. Prawa mechaniki, które stosuje się właśnie do równowagi cieplnej, nazwano mechaniką statystyczną i w tym rozdziale chcemy zapoznać się z pewnymi głównymi jej twierdzeniami. Znamy już jedno z twierdzeń mechaniki statystycznej, mianowicie, że średnia wartość energii kinetycznej dowolnego ruchu wynosi \kT dla każdego niezależnego ruchu, tj. dla każdego stopnia swobody, jeżeli temperatura bezwzględna równa się T. Na tej podstawie wiemy już coś o średnich kwadratowych szybkościach atomów. Chcemy teraz dowiedzieć się czegoś więcej o położeniach atomów, wykryć, ile z nich znajdzie się w różnych miejscach w stanie równowagi cieplnej i zapoznać się bardziej szczegółowo z rozkładem prędkości. Chociaż znamy średnią kwadratową prędkość, to nie potrafilibyśmy odpowiedzieć na pytanie: ile cząsteczek ma szybkość trzykrotnie większą od pierwiastka kwadratowego średniej kwadratowej prędkości lub ile z nich porusza się z szybkością równą jednej czwartej tej samej wielkości? albo też na pytanie: czy wszystkie cząsteczki mają dokładnie tę samą szybkość? Mamy zatem dwa pytania, na które spróbujemy odpowiedzieć: Jak rozmieszczone są cząsteczki w przestrzeni, gdy działają na nie siły? Jaki jest rozkład ich prędkości? Okazuje się, że pytania te są zupełnie niezależne oraz że rozkład prędkości jest zawsze laki sam. Na prawdziwość ostatniego stwierdzenia wskazywało już to, że średnia energia
40-1 WZÓR BAROMFTRYC7NY 219 kinetyczna jest taka sama i wynosi \kT na stopień swobody, niezależnie od sił działających na cząsteczki. Rozkład prędkości cząsteczek nie zależy od sil, ponieważ nie zależą od nich częstości zderzeń. Jako pierwszy przykład weźmy rozkład cząsteczek w atmosferze takiej jak ziemska, ale pozbawionej wiatrów oraz innych zakłóceń. Przypuśćmy, że mamy kolumnę gazu sięgającą wielkich wysokości i będącą w równowadze cieplnej, nie taką więc jak nasza atmosfera, która jest coraz zimniejsza, im wyżej się wznosimy. Możemy zauważyć, że jeżeli temperatura zmienia się z wysokością, to moglibyśmy zademonstrować brak równowagi cieplnej umieszczając pionowo pręt i dołączając do niego u dołu kolumny gazu kuleczki (rys. 40.1), które otrzymywałyby tam energię SkT od cząsteczek i potrząsałyby za pośrednictwem pręta kulkami umieszczonymi na górze, które z kolei przekazywałyby wstrząsy górnym cząsteczkom atmosfery. W końcu oczywiście temperatura byłaby jednakowa, niezależnie od wysokości w polu grawitacyjnym. Jeżeli temperatura jest taka sama na każdej wysokości, to powstaje pytanie: jakie prawo powoduje, że atmosfera staje się coraz rzadsza, gdy się wznosimy wyżej? Skoro N jest całkowitą liczbą cząsteczek w objętości V gazu przy ciśnieniu P, wiemy, że PV=NkT, czyli P = nkT, gdzie /i=/V/Kjest liczbą cząsteczek w jednostkowej objętości. Innymi słowy, znając liczbę cząsteczek w jednostkowej objętości wiemy, jakie jest ciśnienie, i odwrotnie. Wielkości te są wzajemnie proporcjonalne, ponieważ w tym przykładzie temperatura jest stała. Ciśnienie natomiast nie jest stałe, musi rosnąć wraz ze spadkiem wysokości, ponieważ musi utrzymywać cały gaz znajdujący się powyżej. Dzięki tej wskazówce możemy określić, jak zmienia się ciśnienie wraz z wysokością. Jeżeli na wysokości h wybierzemy jednostkową powierzchnię, wtedy siła pionowa działająca z dołu na tę powierzchnię jest ciśnieniem P. Taka sama siła pionowa działałaby na jednostkową powierzchnię z góry na wysokości h+dh, gdyby nie było sił ciążenia. Ale tak nie jest. Siła z dołu musi być większa od siły z góry o tyle, ile wynosi ciężar gazu zawartego między h, a h + dh. Siła ciążenia działająca na każdą cząsteczkę wynosi mg, gdzie g jest przyspieszeniem ziemskim. W jednostkowym przekroju znajduje się n dli cząsteczek Stąd otrzymujemy równanie różniczkowe Ph+Jh-Ph = dP= -mgn dh. Ponieważ P = nkT. przy czym T jest stałe, możemy więc wyeliminować P lub n Powiedzmy, że eliminujemy P i otrzymujemy równanie: 40.1. Ciśnienie gazu na wysokości h musi być większe od ciśnienia na wysokości h-rdh, aby zrównoważyć ciężar gazu /awarlego między wysokością da h + dh dn dh kT mechanizm wyrównujący temperaturę które mówi nam, jak maleje gęstość ze wzro- s<em wysokości. Otrzymaliśmy równanie dla gęstości cząste- n, która zmienia się z wysokością tak. <-?ek
220 40 ZASADY MECHANIKI STATYSTYC7NEJ że jej pochodna jest proporcjonalna do niej samej. Funkcją, której pochodna jest proporcjonalna do funkcji różniczkowanej, jest funkcja wykładnicza i dlatego rozwiązaniem tego równania jest „=„0e-m'*/ir (40.1) Tutaj stała całkowania n0 jest oczywiście gęstością na wysokości // = 0 (która może być wybrana w dowolnym miejscu). Gęstość maleje wykładniczo z wysokością. Zauważmy, że dla różnych rodzajów cząsteczek z różnymi masami malenie gęstości będzie opisywane przez różne wykładniki potęgowe. Gęstość cząsteczek cięższych będzie malała szybciej ze wzrostem wysokości niż lżejszych. Dlatego powinniśmy oczekiwać, że przy wznoszeniu się w atmosferze złożonej z tlenu i azotu stosunek azotu do tlenu wzrasta, ponieważ tlen jest cięższy od azotu. Ale w naszej atmosferze tak się nie dzieje, przynajmniej na umiarkowanych wysokościach, na skutek istnienia wielu ruchów mieszających gazy. Nasza atmosfera nie jest izotermiczna. Mimo to występuje w niej tendencja do dominowania na bardzo dużych wysokościach składników lżejszych, takich jak wodór, ponieważ bardzo lekkie składniki występują jeszcze tam, gdzie inne funkcje wykładnicze praktycznie równają się zeru (rys. 40.2). 40-2. Prawo Boltzmanna Zauważmy interesujący fakt, że licznik w wykładniku równania (40.1) określa energię potencjalną atomu. Prawo to możemy zatem sformułować także w następujący sposób: gęstość w dowolnym punkcie jest proporcjonalna do —(energia potencjalna każdego atomu'kT) Może to być tylko przypadek — to znaczy powyższe prawo może być słuszne tylko w omawianym przez nas wypadku jednorodnego pola grawitacyjnego. Możemy jednak udowodnić, że jest to ogólniejsze twierdzenie. Załóżmy, że na cząsteczki gazu działa jakaś inna siła, nie grawitacyjna. Tak na przykład cząsteczki mogą być naładowane elektrycznie i może na nie działać pole elektryczne innego ładunku, który je przyciąga. Może też na skutek wzajemnego przyciągania atomów albo przyciągania przez ścianki, albo przez ciała stałe czy przez coś innego występować siła, która zmienia się w zależności od położenia i która działa na wszystkie cząsteczki. Załóżmy dalej dla uproszczenia, że wszyst' kie cząsteczki są takie same i że siła działa na każdą oddzielnie, tak że całkowita siła. działająca na pewną ilość gazu, równa się po prostu iloczynowi liczby cząsteczek i s"-v wysokość, km 40.2. Znormalizowane gęstości tlenu i wodoru w ziemskim polu grawitacyjnym w stałej temperaturze jako funkcje wysokości
40-2. PRAWO BOLTZMANNA 221 działającej na jedną cząsteczkę. Dla uniknięcia zbędnych komplikacji wybierzmy układ współrzędnych z osią x w kierunku siły F. Jeżeli ustalimy w gazie dwie równoległe płaszczyzny odległe o dx, to siła działająca na każdy atom pomnożona przez n atomów w cm3 (uogólnienie poprzedniego nmg), pomnożona przez dx, musi być tak jak poprzednio zrównoważona przez zmianę ciśnienia: fn dx = dP=kTdn. Można też zapisać to prawo w postaci, która będzie bardziej przydatna dla naszych późniejszych rozważań: d F = kT—(Inn). (40.2) dx Na razie widzimy, że —Fdx jest pracą, którą musimy wykonać przenosząc cząsteczkę z x <\o x + dx i jeżeli F pochodzi od potencjału, to znaczy jeżeli wykonana praca może być w ogóle przedstawiona jako energia potencjalna, to —Fdx byłoby także zmianą energii potencjalnej (£p). Różniczka energii potencjalnej wzięta ze znakiem minus równa się wykonanej pracy Fdx i okazuje się, że d{\nń)= —d(Ep)/kT lub po scałkowaniu w =(stała) exp(-E,JkT). (40.3) Okazuje się więc, że spostrzeżenie poczynione w szczególnym przypadku jest ogólnie słuszne. [A co się dzieje wtedy, gdy siła F nie jest potencjalna? Wówczas równanie (40.2) nie ma w ogóle rozwiązania. Energia może być wytwarzana lub tracona przez atomy poruszające się cyklicznie po drogach, na których wykonana praca nie jest równa zeru i stan równowagi nie może być osiągnięty. Równowaga cieplna nie może istnieć, jeżeli siły zewnętrzne działające na atomy nie są zachowawcze.] Równanie (40.3) znane jako prawo Bollzmanna jest jedną z zasad mechaniki statystycznej. Zgodnie z tą zasadą prawdopodobieństwo tego, że cząsteczki będą tworzyły dany układ przestrzenny, zmienia się wykładniczo wraz z energią potencjalną tego układu podzieloną przez kT i wziętą ze znakiem minus. Prawo to może służyć do określania rozkładu cząsteczek. Zakładając na przykład, że mamy w cieczy dodatni jon, przyciągający sąsiadujące z nim jony ujemne, zapytajmy: ile tych jonów będzie znajdowało się w różnych odległościach od jonu dodatniego? Jeżeli energia potencjalna jest znaną funkcją odległości, to liczby jonów w różnych odległościach są określone przez prawo Boltzmanna. Podobnie jest w wielu innych zastosowaniach tego prawa. 40-3. Parowanie cieczy Omówimy teraz pewien doniosły problem, którym zajmuje się wyższa mechanika statystyczna. Weźmy pod uwagę zbiór cząsteczek przyciągających się wzajemnie i załóżmy, że siła między dwoma dowolnymi cząsteczkami, np. i-tą oraz y-tą, zależy tylko °d ich odległości rki i może być przedstawiona jako pochodna potencjału V{rij)- Rysunek 40-3 pokazuje kształt, jaki może mieć taki potencjał. Dla r> r0 energia maleje, gdy cząsteczki zbliżają się do siebie dzięki swemu wzajemnemu przyciąganiu. Gdy cząsteczki
222 40 ZASADY MECHANIKI STATYSTYCZNEJ V(r) zbliżają się w dalszym ciągu, ich energia bardzo szybko rośnie na skutek odpychania. W taki oto, w ogólnych zarysach, charakterystyczny sposób zachowują się cząsteczki. Załóżmy teraz, że mamy cały zbiornik takich cząsteczek i chcemy wiedzieć, jak są, średnio biorąc, rozmieszczone? Odpowiadamy: exp( — Ep/kT). Całkowita energia potencjalna w tym wypadku byłaby sumą po wszystkich parach cząsteczek, przy założeniu, że mamy do czynienia tylko z siłami dwuciałowymi (w bardziej skomplikowanych przypadkach mogą występować siły trójciałowe, ale np. w elektrostatyce energia potencjalna składa się tylko z energii pochodzących dosiłdwuciałowych). W takim razie prawdopodobieństwo znalezienia cząsteczek w dowolnie wybranej kombinacji rKi byłoby proporcjonalne do exp[-XF(rl7)/A:7-] 40.3. Potencjał dwóch cząsteczek zależny tylko od ich odległości Jeżeli temperatura jest bardzo wysoka, tak że kTp\V(r0)\, wykładnik jest niemal wszędzie stosunkowo mały i prawdopodobieństwo znalezienia cząsteczki jest prawie niezależne od położenia. Weźmy pod uwagę tylko dwie cząsteczki; wtedy prawdopodobieństwo znalezienia ich w różnych wzajemnych odległościach r byłoby równe exp(-£,,/£ 7"). Oczywiście, tam gdzie potencjał jest najbardziej ujemny, prawdopodobieństwo jest największe, a tam, gdzie potencjał dąży do nieskończoności, prawdopodobieństwo jest prawie równe zeru, co zachodzi przy bardzo małych odległościach; tzn. że takie atomy w gazie nie mogą się zetknąć, ponieważ odpychają się bardzo silnie. Istnieje natomiast znacznie większa szansa znalezienia ich w jednostkowej objętości w otoczeniu punktu r0 niż w otoczeniu każdego innego punktu. O ile większa, to zależy od temperatury. Jeżeli temperatura jest bardzo duża w porównaniu z różnicą energii między r = r0 i r= oo, funkcja wykładnicza jest zawsze bliska jedności. W tym przypadku średnia energia kinetyczna (około kT) znacznie przewyższa energię potencjalną i siły nie mają wielkiego wpływu. Gdy natomiast temperatura maleje, prawdopodobieństwo znalezienia cząsteczek w najkorzystniejszej odległości r0 stopniowo wzrasta w stosunku do prawdopodobieństwa znalezienia ich gdziekolwiek indziej, i rzeczywiście, skoro energia kT jest znacznie mniejsza od |^(/"0)|, mamy względnie duży dodatni wykładnik wokół tego miejsca. Inaczej mówiąc, jest o wiele bardziej prawdopodobne, że w danej objętości cząsteczki znajdą się w odległości odpowiadającej minimum energii niż daleko od siebie. Gdy temperatura maleje, atomy zbliżają się, zlepiają się w grudki, tworzą ciecze i ciała stałe oraz cząsteczki, natomiast po podgrzaniu substancje wyparowują. Wymagania, które należy spełnić w celu dokładnego określenia, jak odbywa się parowanie, co się dokładnie dzieje w określonych warunkach, są następujące. Najpierw musimy znaleźć poprawne prawo sił międzycząsteczkowych V(r). Musimy to prawo wziąć z jakiejś innej dziedziny, np. z mechaniki kwantowej, lub też z doświadczenia. Skoro
40-3- PAROWANIE CIECZY 223 znamy już prawo opisujące siły międzycząsteczkowe, możemy zbadać, jak zachowuje się miliard cząsteczek, zajmując się tylko funkcją exp(—£ V^jkT). Wbrew oczekiwaniom, •i mimo że jest to tak prosta funkcja i tak łatwa do zrozumienia idea, przy znanym potencjale, postępowanie to jest niesłychanie skomplikowane; trudność sprawia olbrzymia liczba zmiennych. Mimo tych trudności problem jest bardzo interesujący, wręcz ekscytujący! Często nazywa się go przykładem „problemu wielu ciał", który jest rzeczywiście bardzo zajmujący. W jednym wzorze musi być na przykład zawarte wszystko, co dotyczy zestalania gazu lub różnych kształtów kryształów ciał stałych. Istnieją wprawdzie próby objęcia tych wszystkich danych jednym wzorem, jednak trudności matematyczne są bardzo duże i to nie w samym zapisaniu prawa, ale w postępowaniu z tak olbrzymią liczbą zmiennych. Tyle o rozkładzie cząsteczek w przestrzeni. Na tym kończy się praktycznie biorąc klasyczna mechanika statystyczna, ponieważ skoro znamy siły, to możemy w zasadzie znaleźć rozkład cząsteczek w przestrzeni, a rozkład prędkości możemy ustalić raz na zawsze i to dla wszystkich poszczególnych przypadków. Większe trudności nastręcza otrzymywanie z naszego formalnego rozwiązania szczegółowych informacji i to jest właśnie głównym przedmiotem badań klasycznej mechaniki statystycznej. 40-4. Rozkład prędkości cząsteczkowych Obecnie przystępujemy do omawiania rozkładu prędkości, ponieważ czasem warto wiedzieć, ile cząsteczek porusza się z różnymi szybkościami. W tym celu możemy skorzystać z wiadomości, które zdobyliśmy zajmując się gazem w atmosferze. Przedmiotem naszych badań był tylko gaz doskonały, co założyliśmy, kiedy zapisując energię potencjalną pominęliśmy energię wzajemnego przyciągania atomów. Jedyną energią potencjalną, jaką uwzględniliśmy w naszym pierwszym przykładzie, była energia grawitacyjna. Uwzględnienie także sił działających między atomami wywołałoby oczywiście dalsze komplikacje. Zakładamy więc. że nie ma sił między atomami i na razie pomijamy także zderzenia, co później postaramy się uzasadnić. Wiemy już, że na wysokości h jest mniej cząsteczek niż na wysokości 0 (rys. 40.4). Zgodnie ze wzorem (40.1) liczba ich maleje wykładniczo z wysokością. Ale dlaczego ma ich być mniej na większych wysokościach? Może wszystkie cząsteczki poruszające się do góry na wysokości 0 w końcu osiągną wysokość /;? Oczywiście nie! Niektóre bowiem z nich poruszają się zbjt wolno, by wzbić się na wysokość h. Wiedząc o tym, możemy obliczyć, ile Cz4steczek musi poruszać się z różnymi szybkościami, Ponieważ z wyrażenia (40.1) wiemy, ile z nich porusza 40.4. Tylko dostatecznie szybkie cząsteczki spośród wszystkich zmierzających w górę na wysokości /i=0 osiągną wysokość h h=h />=0
224 40. ZASADY MECHANIKI STATYSTYCZNEJ się z szybkością zbyt małą, żeby wspiąć się na daną wysokość h. Z powodu tych właśnie cząsteczek gęstość na wysokości h jest mniejsza niż na wysokości 0. Postarajmy się sprecyzować nasz problem: obliczmy, ile cząsteczek przebiega z dołu przez płaszczyznę h = 0 (oznaczając tę wysokość przez 0, nie twierdzimy, że na tej wysokości jest podstawa naszego słupa gazu; jest to tylko wygodne oznaczenie, gaz bowiem znajduje się także tam, gdzie h ma wartość ujemną). Cząsteczki gazu poruszają się we wszystkich kierunkach, ale niektóre z nich przebiegają przez naszą płaszczyznę i w każdej chwili pewna ich liczba na sekundę przebija płaszczyznę z dołu do góry z różnymi prędkościami. Następnie zauważmy, że jeżeli prędkość, która jest niezbędna, aby cząsteczka osiągnęła wysokość h (odpowiada jej energia kinetyczna mu2/2 = mgh), oznaczymy literą u, to liczba cząsteczek na sekundę, które przebiegają przez dolną płaszczyznę na wysokości 0 w kierunku pionowym ze składową prędkości większą niż u, jest dokładnie taka sama jak liczba cząsteczek przebiegających w tym samym kierunku przez górną płaszczyznę na wysokości h z dowolną, skierowaną do góry prędkością. Te spośród cząsteczek, których pionowa prędkość nie przewyższa u, nie mogą przedostać się przez górną płaszczyznę. A więc widzimy, że liczba cząsteczek przebiegających przez płaszczyznę h = 0 z prędkością vt>u = = liczbie cząsteczek przebiegających przez płaszczyznę h~h z prędkością v, ~>0. Jednak liczba cząsteczek, które przebiegają przez płaszczyznę h z dowolną prędkością większą niż 0, jest mniejsza niż liczba tych, które przebiegają przez dolną płaszczyznę z dowolną prędkością większą od 0, ponieważ na niższym poziomie jest więcej atomów. O to nam właśnie chodziło. Wiemy już, że rozkład prędkości jest taki sam, gdy temperatura w całej atmosferze jest stała. Zatem skoro rozkład prędkości jest taki sam i skoro liczba cząsteczek rośnie w miarę przesuwania się ku dołowi, to liczba n>0(h) cząsteczek przebiegających na wysokości h z dodatnią prędkością i liczba n>0(0) cząsteczek przebiegających na wysokości 0 z dodatnią prędkością pozostają w stosunku równym stosunkowi gęstości na tych dwu wysokościach, który wynosi e~'n»*'*r. Ale n>0(h) — n3,JP) i dlatego otrzymujemy n > iW) -mghlkT __ -mu'/2kT «>o(0) ponieważ \mu2 — mgh, czyli liczba cząsteczek przypadających na jednostkową powierzchnię i przebiegających w ciągu sekundy przez płaszczyznę h = 0 z z-ową składową prędkości większą niż u wynosi e~m" l2kT, pomnożone przez całkowitą liczbę cząsteczek przebiegających przez tę płaszczyznę z prędkością większą od 0. Oczywiście, powyższe twierdzenie jest prawdziwe nie tylko w odniesieniu do dowolnie wybranej wysokości 0, ale także do każdej innej wysokości, a więc wszystkie rozkłady prędkości są takie same. (Ostateczny wynik nie zawiera wysokości h, która wystąpiła tylk° w pośrednich rozważaniach.) Jest to ogólne twierdzenie o rozkładzie prędkości. Mo**" ono te ieżeli w ścianie rury z gazem wydrążymy otwór tak mały, że zderzenia będą bard?0
4(M. ROZKŁAD PRĘDKOŚCI CZĄSTECZKOWYCH 225 nieliczne i będą zachodziły w odległościach znacznie większych niż wynosi średnica otworu, cząsteczki wybiegające z rury będą miały wprawdzie różne prędkości, ale liczba tych, które wybiegają z prędkościami większymi od u, będzie się równać e~MU'i2kT. Wracamy obecnie do pominięcia zderzeń. Dlaczego nie zmieniają one wyniku? Moglibyśmy zastosować ten sam dowód, biorąc jednak nie skończoną wysokość h, ale wysokość nieskończenie małą, tak małą, że nie byłoby miejsca dla zdarzeń między poziomami 0 i h. Nie musimy jednak tego robić: dowód opiera się na analizie występujących energii, na zasadzie zachowania energii, a w zachodzących zderzeniach następuje wymiana energii między cząsteczkami. Właściwie jednak nie obchodzi nas, czy obserwujemy ciągle tę samą cząsteczkę, jeżeli tylko cząsteczki wymieniają energię między sobą. W końcu okazuje się, że nawet gdy problem analizujemy bardziej starannie (a taki skrupulatny dowód oczywiście znacznie trudniej przeprowadzić), to i tak otrzymujemy identyczny wynik. Interesujące jest, że rozkład prędkości, który znaleźliśmy, jest właśnie taki: -energia kinetyczna/kT »>U~C (40.4) Ten sposób opisu rozkładu prędkości — przez podanie liczby cząsteczek, które przebiegają przez daną powierzchnię z pewną minimalną składową z-ową — nie jest najwygodniejszy. Znacznie częściej chcemy wiedzieć na przykład, ile cząstek porusza się w gazie z z-ową składową prędkości zawartą między dwoma danymi wartościami, a to nie jest od razu widoczne ze wzoru (40.4). Wolelibyśmy sformułować nasz wynik w wygodniejszy sposób, chociaż jego obecna postać jest już wystarczająco ogólna. Zauważmy, że nie można powiedzieć, iż jakai cząsteczka ma pewną ściśle określoną prędkość; żadna z nich nie ma prędkości równej ściśle 1,7962899173 m/s. Aby więc sensownie sformułować problem, możemy tylko zapytać, ile cząsteczek znajduje się w pewnym przedziale prędkości. Możemy określić, ile mamy cząsteczek o prędkościach między 1,796 a 1,797 itd. Matematycznie sformułujemy to tak: niech f(u)du oznacza tę część wszystkich cząsteczek, których prędkości są zawarte między u i u + du, lub, co na to samo wychodzi (gdy du jest nieskończenie małe), których prędkości równają się u z dokładnością do du. Rysunek 40.5 przedstawia jedną z możliwych postaci funkcji f(u), a zakreskowany wycinek o szerokości du i średniej wysokości /(«) przedstawia tę część cząsteczek f{u)du. Inaczej mówiąc, stosunek zakres- kowanej powierzchni do całej powierzchni °bjętej krzywą równa się względnej liczbie ^steczek o prędkości u wyznaczonej z dokładnością du. Jeżeli określimy funkcję f(u) tak, że część cząsteczek mających Prędkości w tym przedziale jest dana po Prostu przez zakreskowaną powierzchnię "~ cała powierzchnia równa się względnej liczbie wszystkich cząsteczek, tzn. 40.3. Funkcja rozkładu prędkości. Zakreskowaną powierzchnia /(u) du przedstawia grupę cząsteczek mających prędkości u w przedziale du
226 40. ZASADY MECHANIKI STATYSTYCZNEJ jedności: OD $f(u)du = l. (40.5) — OD Aby teraz otrzymać szukany rozkład, wystarczy porównać go z twierdzeniem, które udowodniliśmy poprzednio. Najpierw zapytamy: jak można wyrazić przy pomocy funkcji f(u) liczbę cząsteczek przebiegających przez powierzchnię w ciągu sekundy z prędkością większą niż //? W pierwszej chwili możemy pomyśleć, że równa się ona po prostu całce OC \f(u)du, ale tak nie jest, ponieważ chcemy znać liczbę cząsteczek, które przebiegają u przez powierzchnię w ciągu sekundy. Chodzi o to, że szybsze cząsteczki przebiegają częściej niż wolniejsze i aby obliczyć, ile ich przebiega, trzeba mnożyć przez prędkość (mówiliśmy o tym w poprzednim rozdziale, gdy zajmowaliśmy się liczbą zderzeń). W danym czasie / całkowitą liczbę cząsteczek przebiegających przez powierzchnię stanowią te, które są w stanie dotrzeć do powierzchni, to znaczy te, które przybywają z odległości ut, zatem liczba cząsteczek przybywających nie równa się po prostu liczbie wszystkich istniejących cząsteczek, lecz liczbie cząsteczek zawartych w jednostkowej objętości, pomnożonej przez odległość przebytą w drodze do powierzchni, przez którą mają się przedostać. Odległość ta jest proporcjonalna do u. Zatem musimy obliczyć całkę z u razy f(u)du, całkę z górną granicą nieskończoną, a dolną u. Całka ta musi być równa temu, co obliczyliśmy przedtem, mianowicie e~n"'1ilkT ze stałą proporcjonalności, którą znajdziemy później: 00 j"u/(«)</« = stała-e~m,/2/"\ (40.6) u Różniczkując całkę względem u otrzymamy funkcję podcałkową (ze znakiem minus, ponieważ u jest dolną granicą). Różniczkując prawą stronę otrzymamy u razy ta sama funkcja wykładnicza (i jakaś stała). Oba u skracają się i otrzymujemy f(u)du = Ce-mu2'2kTdu (40.7) Pozostawiamy du z obu stron dla przypomnienia, że określają one rozkład, który mówi, jaka część ogólnej liczby cząsteczek ma prędkość między u a u+du. Stała C musi być tak dobrana, aby całka równała się jedności, zgodnie z zależnością (40.5). Możemy udowodnić, że*' *> Aby obliczyć wartość całki, oznaczamy — OD Wtedy /2= J e^dx J e^dy^ J J ^^dxdy, — <c — «, - » — * co jest podwójną całką po całej płaszczyźnie xy. Można ją także zapisać we współrzędnych biegunowych: OD » l2=f e"'-2nrdr=n je"dt=n. o o
40-4. ROZKŁAD PRĘDKOŚCI CZĄSTECZKOWYCH 227 — CD Korzystając z tego. łatwo znajdziemy, że C=\ mj2nkT. Ponieważ prędkość i pęd są wzajemnie proporcjonalne, możemy powiedzieć, że rozkład pędów jest także proporcjonalny do exp(-EJkT) na jednostkę przedziału pędu. Okazuje się, że powyższe twierdzenie jest słuszne także w teorii względności, jeżeli zapiszemy je przy pomocy pędów, natomiast nie jest słuszne przy zapisie z prędkościami, zatem lepiej badać je w postaci wyrażonej przy pomocy pędów: J(p)dp=Cexp(-EJkT)dp. (40.8) Obliczyliśmy więc, że prawdopodobieństwa różnych stanów energetycznych, zarówno dla energii kinetycznej, jak i potencjalnej są dane przez c~a,eTB'iikT_ Łatwo więc można zapamiętać to piękne twierdzenie. Do tej pory wyznaczyliśmy oczywiście tylko rozkład „pionowy" prędkości. Możemy zapytać: jakie jest prawdopodobieństwo, że cząsteczka porusza się w innym kierunku? Oczywiście, oba te rozkłady będą związane ze sobą i pełny rozkład można otrzymać na podstawie posiadanych przez nas wiadomości, ponieważ zależy on tylko od kwadratu prędkości, a nie od jej składowej z-owej. Pełny rozkład musi być czymś, co nie zależy od kierunku, i musi być określany tylko przez jedną funkcję - prawdopodobieństwo różnych wielkości prędkości. Skoro mamy rozkład składowej z-owej, możemy z niego otrzymać rozkłady innych składowych prędkości. W rezultacie okazuje się, że prawdopodobieństwo jest nadal proporcjonalne do exp( — EklkT), ale teraz energia kinetyczna zawiera trzy części: mv2xj2, mry/2 i mv2/2, zsumowane w wykładniku. Wynik ten można też zapisać jako iloczyn J(vx, vy. vz)dvx dvydvx ~ exp(— mvx/2kT) exp(— mvlj2kT) exp(— mv2j2kT)dv,, dvydvz. (40.9) Widzimy, że wzór ten jest prawdziwy, ponieważ po pierwsze — zawiera tylko funkcję v2, tak jak należy, a po drugie — prawdopodobieństwa różnych wartości vz otrzymane po scałkowaniu po wszystkich vx i vy są ściśle takie, jak we wzorze (40.7). Oba te wnioski wynikają z jednej tylko funkcji (40.9)! 40-5. Ciepła właściwe gazów Z kolei postaramy się w jakiś sposób sprawdzić naszą teorię i przekonać się o osiągnięciach klasycznej teorii gazów. Zauważyliśmy już wcześniej, że jeżeli U jest energią wewnętrzną N cząsteczek, to niekiedy dla pewnych gazów spełnione jest równanie PV= = NkT=(y — \)U. Wiemy, że w wypadku gazu jednoatomowego prawa strona równa się J energii kinetycznej ruchu środka masy atomów. Energia kinetyczna takiego gazu równa się energii wewnętrznej i dlatego y-l=$. Gdy jednak weźmiemy bardziej skomplikowaną cząsteczkę, która może wirować oraz drgać i założymy (co według mechaniki klasycznej okazuje się słuszne), że energie ruchów wewnętrznych są także proporcjonalne
228 40. ZASADY MECHANIKI STATYSTYCZNEJ do kT, to wówczas w danej temperaturze cząsteczka oprócz kinetycznej energii kT ma także energię wewnętrzną związaną z drganiami i obrotami. Całkowita zatem energia U składa się wtedy nie tylko z wewnętrznej energii kinetycznej, ale także z energii ruchu obrotowego i otrzymamy inną wartość y. Praktycznie najlepiej wyznaczyć y mierząc ciepło właściwe, które równa się zmianie energii przy zmianie temperatury. Do tej metody jeszcze powrócimy. Dla naszych obecnych celów możemy przyjąć, że y zostało znalezione eksperymentalnie za pomocą krzywej PVr w przypadku sprężania adiabatycznego. Obliczmy y dla kilku przypadków. Dla gazów jednoatomowych U stanowi całkowitą energię, równą energii kinetycznej, i wiemy już, że y powinno się równać |. Przyjmujemy, że cząsteczki gazów dwuatomowych, np. tlenu, jodku wodoru lub wodoru, można przedstawić jako dwa atomy związane siłą, podobną do tej, jaką ilustruje rys. 40.3. Możemy także przyjąć, co okaże się słuszne, że w temperaturach aktualnych w wypadku gazów dwuatomowych pary atomów bardzo silnie dążą do zachowania między atomami odległości r0 odpowiadającej minimum potencjału. Gdyby tak nie było, gdyby prawdopodobieństwo nie zamieniało się na tyle szybko, aby zapewnić znacznej większości cząsteczek miejsce blisko minimum potencjału, gazowy tlen byłby mieszaniną 02 i niemałej liczby pojedynczych atomów tlenu. W rzeczywistości wiadomo, że pojedyncze atomy są bardzo nieliczne, co oznacza, jak stwierdziliśmy, że wartość minimum energii potencjalnej jest znacznie większa niż kT. Ponieważ cząsteczki bardzo silnie gromadzą się wokół r0, jedyna część krzywej, która jest potrzebna, znajduje się blisko minimum i możemy ją w przybliżeniu traktować jako parabolę. Paraboliczny potencjał wiąże się z oscylatorem harmonicznym i rzeczywiście, możemy z doskonałym przybliżeniem przedstawić cząsteczkę tlenu jako dwa atomy połączone sprężyną. Zapytajmy następnie: jaka jest całkowita energia tej cząsteczki w temperaturze H Wiemy, że energia kinetyczna każdego z dwu atomów powinna być równa \kT a zatem energia obu równa się \kT+\kT. Możemy to też wyrazić inaczej: te same \ plus -można traktować jako kinetyczną energię środka masy (\), kinetyczną energię obrotów (*) i kinetyczną energię drgań Q). Wiemy, że kinetyczna energia drgań równa się ^, ponieważ te drgania są jednowymiarowe, a na każdy stopień swobody przypada %kT. Biorąc pod uwagę obroty, widzimy, że cząsteczka może obracać się wokół jednej z dwu osi, zatem występują dwa niezależne ruchy. Przyjmujemy, że atomy są pewnego rodzaju punktami, a więc nie mogą wirować wokół osi, która je łączy. Warto o tym pamiętać, bo gdy natkniemy się na jakieś sprzeczności, to tu może leżeć ich przyczyna. Występuje tu jeszcze jedna rzecz, energia potencjalna drgań; ile ona wynosi? W oscylatorze harmonicznym średnia energia potencjalna i średnia energia kinetyczna są równe, a więc energia potencjalna drgań wynosi także \kT. Zatem całkowita energia równa się U=\kT\ub kT równa się §£/ na atom. A to oznacza, że y=|, a nie *, czyli y= 1,286. Możemy porównać te liczby z odpowiednimi wartościami z tab. 40.1. Sprawdzając najpierw wartości dla helu, gazu jednoatomowego, widzimy, że y jest bardzo bliskie 3. a błąd pochodzi prawdopodobnie z eksperymentu, chociaż w tak niskiej temperaturze mogą występować jakieś siły między atomami. Wartości dla kryptonu i argonu, także gazów jednoatomowych, zgadzają się również z naszymi wynikami w granicach błędu wynikłego z doświadczenia.
40-5. CIEPŁA WŁAŚCIWE GAZÓW 229 Tabela 40.1. Wartości stosunku ciepel właściwych y dla różnych gazów Gaz He Kr Ar H, o, 7Y°0 180 19 15 100 100 r 1,660 1,68 1,668 1,404 1,399 Gaz HJ Br, Ji NHj C,H6 T(°C) 100 300 185 15 15 V 1,40 1,32 1,30 1,310 1.22 Przechodząc do gazów dwuatomowych widzimy, że wodór ma zgodnie z tą tabelą wartość 1,404, która nie zgadza się z naszym wynikiem wynoszącym 1,286. Tlen ma wartość y= 1,399, bardzo bliską poprzedniej wartości z tej tabeli, ale znów odległą od wartości teoretycznej. Dla jodku wodoru y ma także wartość 1,40. Już mogłoby się wydawać, że poprawna wartość dla gazów dwuatomowych wynosi 1,40, ale tak nie jest, szukając bowiem dalej znajdziemy dla bromu wartość 1,32 i dla jodu wartość 1,30. Ponieważ 1,30 jest liczbą stosunkowo bliską 1,286, możemy powiedzieć, że wyniki dla jodu raczej zgadzają się z naszymi wynikami, natomiast dla tlenu już nie. Jesteśmy w kłopocie: dla jednych cząsteczek otrzymujemy zgodność, dla innych nie. Trzeba pewnej dozy sprytu, aby z tego wybrnąć. Zajmijmy się jeszcze bardziej skomplikowaną cząsteczką, zawierającą dużo składników, np. etanem, CZH6. Ma on osiem różnych atomów, które drgają i obracają się w różnych kombinacjach. Dlatego całkowita energia wewnętrzna etanu musi równać się dużej wielokrotności kT, przynajmniej 12 A: T'dla samej energii kinetycznej, a y — 1 powinno być bardzo bliskie zera, czyli y powinno się prawie dokładnie równać jedności. W rzeczywistości jest ono mniejsze od 1,40, ale 1,22 jest niewiele mniejsze, a jest większe od ly'j, liczby uzyskanej na podstawie samej energii kinetycznej. I to właśnie jest niezrozumiałe! Nasze trudności dodatkowo powiększa to, że dwuatomowej cząsteczki nie można uczynić absolutnie sztywną. Nawet jeżeli więzy nieskończenie usztywnimy, to cząsteczka nadal będzie drgała, chociaż bardzo słabo. Energia drgań wewnętrznych w dalszym ciągu będzie się równać kT, ponieważ nie zależy ona od mocy sprzężenia. Jeśli jednak spróbujemy wyobrazić sobie sztywność, hamującą całkowicie drgania, a więc eliminującą jedną zmienią, to otrzymamy dla gazów dwuatomo- 40.6. Uzyskane doświadczalnie wartości y dla wodoru i tlenu jako funkcje temperatury. Teoria klasyczna przewiduje niezależnie od temperatury wartość y= 1,286 fi 1.6 1,4 1,2 i n i -9 —o— H2 —X-- ()2 i , 500 1000 temperatura, "C
230 40. ZASADY MECHANIKI STATYSTYCZNEJ wych V=\kT\ y=l,40. To by pasowało do H2 lub 02. Z drugiej strony powstaną dalsze trudności, ponieważ y zarówno dla wodoru, jak i dla tlenu zmienia się wraz z temperaturą! Ze zmierzonych wartości przytoczonych na rys. 40.6 widzimy, że dla H2 y zmienia się od około 1,6 dla -185°C do 1,3 dla 2000°C. W wypadku tlenu zmiana ta jest mniej radykalna, ale i tu y rośnie zdecydowanie ze spadkiem temperatury. 40-6. Załamanie się fizyki klasycznej W rezultacie możemy stwierdzić, że mamy pewne trudności. Można by spróbować posłużyć się innym modelem ilustrującym prawo przyciągania, rezygnując z modelu sprężyny, ale okazuje się, że inny model zwiększyłby tylko wartość współczynnika y. Jeżeli uwzględnimy więcej postaci energii, wartość współczynnika y jeszcze bardziej zbliży się do jedności, na przekór faktom. Wszystkie pomysły zaczerpnięte z klasycznej teorii tylko pogarszają sytuację. Faktem jest, że w każdym atomie znajdują się elektrony i wiemy z ich widm, że występują w nim ruchy wewnętrzne; każdy z elektronów powinien mieć przynajmniej $kT energii kinetycznej i jakąś energię potencjalną; po dodaniu obu wielkości y stanie się jeszcze mniejsze. To jest absurdalne. To jest nieprawdziwe. Pierwszą wielką pracę o dynamicznej teorii gazów napisał Maxwell w roku 1859. Na podstawie koncepcji, które omawialiśmy, zdołał precyzyjnie wyjaśnić wiele znanych zjawisk i praw, jak prawo Boyle'a, teorię dyfuzji, lepkość gazów oraz wiele innych spraw, o których będziemy mówić w następnym rozdziale. Podsumowując wszystkie te wielkie odkrycia, na zakończenie Maxwell stwierdził: „Ostatecznie po ustaleniu koniecznego związku między ruchami translacyjnymi i obrotami (mówi on o twierdzeniu o \ kT) wszystkich niesferycznych cząsteczek, udowodniliśmy, że zbiór takich cząsteczek nie mógłby spełniać znanej zależności między dwoma ciepłami właściwymi". Maxwellowi chodzi tu o współczynnik y (który jak zobaczymy później, wiąże się z dwoma sposobami pomiaru ciepła właściwego) i stwierdza to, o czym już wiemy, że nie można znaleźć poprawnego rozwiązania. Dziesięć lat potem Maxwell powiedział w wykładzie: „Przedstawiam państwu to, co uważam za największą z dotychczas napotykanych trudności w teorii cząsteczkowej". Te słowa były pierwszym stwierdzeniem, że prawa fizyki klasycznej się mylą. Była to pierwsza wskazówka, że istnieje jakiś zasadniczy błąd, ponieważ ściśle udowodnione twierdzenie nie zgadzało się z doświadczeniem. Około roku 1890 Jeans znów musiał wspomnieć o tej zagadce. Panuje przekonanie, iż fizycy ostatnich lat XIX wieku uważali, że znają wszystkie istotne prawa fizyki i jedyną rzeczą, jaką robili, było szukanie kolejnych dziesiętnych miejsc po przecinku. Ktoś pewnie kiedyś wygłosił taką opinię powtórzoną następnie przez innych. Jednak sumienna lektura ówczesnej literatury wskazuje, że wszyscy fizycy przeżywali jakiś niepokój. Jeans powiedział o tej zagadce, że jest tajemniczym zjawiskiem, które wygląda jak gdyby wraz z obniżaniem temperatury pewne rodzaje ruchów „zamarzały". Jeżeli założylibyśmy, że ruch drgający ustaje w niskiej temperaturze a istnieje w wyższej, to moglibyśmy przyjąć istnienie gazu zarówno w temperaturze tak niskiej, że drgania
4(1-6 ZAŁAMANIE SIĘ FIZYKI KLASYCZNEJ 231 w niej nie zachodzą — a więc y = 1,40 — jak i w wyższej, w której się pojawiają — a zatem y maleje. To samo można powiedzieć o ruchach obrotowych. Gdybyśmy mogli wyeliminować obroty, powiedzmy „zamrozić je" w dostatecznie niskiej temperaturze, to moglibyśmy zrozumieć, dlaczego y dla wodoru osiąga 1,66 przy spadku temperatury. Jak należy wyjaśnić to zjawisko? Rzecz jasna, że tego „zamrażania" ruchów nie można wytłumaczyć opierając się na mechanice klasycznej. Stało się ono zrozumiałe dopiero wtedy, gdy odkryto mechanikę kwantową. Możemy przytoczyć tu bez dowodu wnioski dla mechaniki statystycznej wypływające z teorii kwantowomechanicznej. Przypominamy sobie, że zgodnie z mechaniką kwantową dowolny układ związany potencjałem, np. układ drgający, ma nieciągły zbiór poziomów energii, tzn. stanów o różnej energii. Powstaje pytanie: jak należy zmodyfikować mechanikę statystyczną, aby była zgodna z mechaniką kwantową? Okazuje się, co jest bardzo interesujące, że chociaż większość problemów nastręcza w kwantowej mechanice większe trudności niż w klasycznej, to problemy mechaniki statystycznej przedstawiają się w teorii kwantowej o wiele prościej! Prosty wynik otrzymany zgodnie z zasadami mechaniki klasycznej, /ł = H0e_energ,a"tT, staje się następującym, bardzo doniosłym twierdzeniem: Jeżeli energię stanów cząsteczek oznaczymy, na przykład, przez £0, £,.£,,...,£,, ..., to w stanie równowagi cieplnej prawdopodobieństwo znalezienia cząsteczki w jednym ze stanów o energii £f będzie proporcjonalne do exp(-EJkT). Powyższe twierdzenie określa prawdopodobieństwo znalezienia się cząsteczek w różnych stanach. Inaczej mówiąc, względna szansa, prawdopodobieństwo znalezienia się cząsteczki w stanie £, w stosunku do prawdopodobieństwa znalezienia się w stanie £0, wynosi P. exp(-£./fcT) — = -Jll— -—' , (40.10) P0 exp(-E0/kT) co oczywiście można napisać tak: n,=«0exp[-(£1-E0)/kT], (40. LL) ponieważ Pl=ni/Noraz P0 = n0/N. A więc prawdopodobieństwo znajdowania się w stanie o wyższej energii jest mniejsze niż w stanie niskoenergetycznym. Stosunek liczby atomów w wyższym stanie do liczby atomów w stanie niższym równa się e podniesionemu do potęgi (różnica energii ze znakiem minus dzielona przez kT), co jest bardzo prostym twierdzeniem. Okazuje się następnie, że odległości między poziomami energetycznymi dla oscylatora harmonicznego są jednakowe. Nazywając najniższą energię £o = 0 (w rzeczywistości trochę się ona różni od zera, ale przesunięcie wszystkich energii o stałą wartość nie jest rzeczą istotną), otrzymamy pierwszą energię £,=ftcu, drugą Ez = 2hoi, trzecią 3fto» itd. Zobaczmy teraz, co się dzieje. Załóżmy, że zajmujemy się drganiami cząsteczki dwutomowej, którą w przybliżeniu traktujemy jako oscylator harmoniczny. Zapytajmy, jakie jest względne prawdopodobieństwo znalezienia się cząsteczki w stanie Et zamiast w stanie £0. Odpowiedź brzmi, że stosunek tego prawdopodobieństwa do prawdopodobieństwa znajdowania się w stanie £0 wynosi e"'io,"lT. Załóżmy teraz, że kT jest znacznie Mniejsze niż hej, to znaczy, że panuje niska temperatura. Wówczas prawdopodobieństwo
232 40 ZASADY MECHANIKI STATYSTYCZNEJ znalezienia się cząsteczki w stanie El jest bardzo małe. Praktycznie wszystkie atomy są w stanie E0. Jeżeli zmieniamy temperaturę, ale ciągle utrzymujemy ją bardzo niską, to szansa znalezienia się w stanie E1=ho) pozostaje nieskończenie mała — energia oscylatora jest nadal bliska zera i nie zmienia się wraz z temperaturą tak długo, jak długo temperatura jest mniejsza od hco/k. Wszystkie oscylatory znajdują się w najniższym stanie i ruch ich jest skutecznie „zamrożony" — nie wnosi on żadnego wkładu do ciepła właściwego. Następnie z tabl. 40.1 dowiadujemy się, że w temperaturze 100CC, które równają się 373°K, kT jest znacznie mniejsze od energii drgań w cząsteczkach tlenu lub wodoru; ale już dla cząsteczki jodu sytuacja przedstawia się inaczej. Powodem tej różnicy jest o wiele większy ciężar atomu jodu w porównaniu z atomem wodoru i chociaż siły w obu cząsteczkach są porównywalne, cząsteczka jodu jest tak ciężka, że ma częstość drgań własnych bardzo małą w porównaniu z częstością własną wodoru. W temperaturze pokojowej przy hta większym od kT dla wodoru, ale mniejszym dla jodu, tylko ten ostatni ma klasyczną energię drgań. Gdy zwiększamy temperaturę gazu, rozpoczynając od bardzo niskiej wartości T, w której prawie wszystkie cząsteczki znajdują się w swym najniższym stanie, prawdopodobieństwa ich znalezienia się w drugim stanie i kolejno w następnych zaczynają stopniowo osiągać dostrzegalne wartości. Gdy prawdopodobieństwo jest znaczne już dla wielu stanów, gaz zaczyna zachowywać się zgodnie z prawami fizyki klasycznej, ponieważ stany kwantowe stają się prawie nierozróżnialne w continuum energii i układ może mieć prawie każdą energię. Dlatego też gdy temperatura rośnie, powinniśmy znów otrzymać wyniki zgodne z fizyką klasyczną, co właśnie widać z rys. 40.6. W ten sam sposób można pokazać, że stany energetyczne ruchów obrotowych cząsteczki też są skwantowane, ale leżą tak blisko siebie, że w zwykłych warunkach kT jest większe niż ich odległości. Zatem wzbudzonych jest wiele poziomów a obrotowa energia kinetyczna występuje w układzie na sposób klasyczny. Wodór jest jednym z gazów, w którym powyższa sytuacja nie występuje w temperaturze pokojowej. Jest to pierwszy w historii fizyki przypadek, w którym przez porównanie z doświadczeniem stwierdzono, że rzeczywiście coś jest nie w porządku z fizyką klasyczną; podaliśmy tu rozwiązanie tej trudności za pomocą mechaniki kwantowej prawie w ten sam sposób, jak to zrobiono po raz pierwszy. Minęło prawie 30 lub 40 lat zanim odkryto następną trudność, znów związaną z mechaniką statystyczną, ale tym razem z mechaniką gazu fotonowego. Ten problem rozwiązał Planck w pierwszych latach naszego stulecia.
41 ruchy Browna 41-1. Ekwipartycja energii Ruchy Browna zostały odkryte w r. 1827 przez botanika Roberta Browna. Prowadząc badania mikrobiologiczne zauważył on w płynie oglądanym przez mikroskop nieregularne ruchy drobinek i doszedł do wniosku, że nie są to ruchy żyjątek, lecz po prostu pyłki roślinne krążące w wodzie. Robert Brown rozstrzygnął ostatecznie, że ruchy te nie mają nic wspólnego z życiem, badając stary odłamek kwarcu zawierający wewnątrz odrobinę uwięzionej wody. Woda ta została uwięziona przed milionami lat, ale również w niej zaobserwował on to samo zjawisko. Polega ono na nieustannym, nieregularnym ruchu bardzo małych cząstek. Później udowodniono, że jest to jeden z przejawów ruchu cząsteczkowego. Możemy to zrozumieć jakościowo, wyobrażając sobie olbrzymią piłkę na obserwowanym z wielkiej odległości boisku, wypełnionym ludźmi, którzy odbijają tę piłkę w różnych kierunkach. Nie możemy odróżnić poszczególnych osób, ponieważ zakładamy, że jesteśmy zbyt daleko, ale piłkę widzimy i stwierdzamy, że porusza się ona dosyć nieregularnie. Wiemy także, z twierdzeń omawianych w poprzednich rozdziałach, że średnia energia kinetyczna małej cząstki zawieszonej w cieczy lub gazie równa się \kTt choćby nawet ciężar jej był znacznie większy od ciężaru cząsteczek cieczy lub gazu. Jeśli ta cząstka Jest bardzo ciężka, jej szybkości są stosunkowo niewielkie, ale okazuje się, że nie są one znów tak małe. W gruncie rzeczy niełatwo nawet wyznaczyć tę szybkość, bo chociaż średnia energia kinetyczna równa się \kT, co daje szybkość około milimetra na sekundę dla obiektu o średnicy jednego do dwu mikronów, to bardzo trudno ją zmierzyć nawet Przez mikroskop, gdyż cząstka nieustannie zmienia kierunek ruchu i nie przesuwa się * określonym kierunku. O tym, w jakim stopniu zmienia położenie, będziemy mówili na końcu niniejszego rozdziału. Problem ten rozwiązał po raz pierwszy Einstein na Początku naszego stulecia.
234 41. RUCHY BROWNA Nawiasem mówiąc, gdy powiadamy, że średnia energia kinetyczna wspomnianej cząstki wynosi ~kT, jesteśmy przekonani, że zostało to wyprowadzone z teorii kinetycznej, a więc na podstawie praw Newtona. Okaże się, że z teorii kinetycznej możemy wyprowadzić najrozmaitsze wspaniałe wnioski. To doprawdy zadziwiające, że z tak niewielu przesłanek potrafimy tak dużo wywnioskować. Oczywiście, nie chcemy przez to powiedzieć, że prawa Newtona to „niewiele" — do tych celów wystarczają one w zupełności — ale że nasz wkład jest niewielki. Jak więc możemy tak wiele otrzymywać? Otóż ciągle robimy pewne ważne założenie, a mianowicie, że jeśli dany układ pozostaje w równowadze cieplnej w pewnej temperaturze, to będzie on również pozostawał w równowadze ze wszystkim, co ma tę samą temperaturę. Tak na przykład, jeśli chcielibyśmy zobaczyć, jakie ruchy wykonałaby cząstka zderzając się z wodą, to moglibyśmy wyobrazić sobie gaz, składający się z innego rodzaju cząsteczek, malutkich idealnych kulek, które (załóżmy) nie oddziałują z wodą, a tylko uderzają o naszą cząstkę zderzając się z nią w sposób „twardy". Załóżmy, że cząstka ma wystający kolec, w który mają uderzać wszystkie nasze kulki. Wiemy wszystko o tym wyimaginowanym gazie złożonym z kulek w temperaturze T — jest to gaz doskonary. Woda ma budowę złożoną, ale gaz doskonały — prostą. Otóż nasza cząstka musi pozostawać w równowadze z gazem złożonym z kulek. Wobec tego średni ruch cząstki musi być taki, jak przy zderzeniach w gazie, gdyby bowiem cząstka nie poruszała się z odpowiednią prędkością względem cząsteczek wody, ale - powiedzmy — szybciej, znaczyłoby to, że kulki pobierają od niej energię i stają się cieplejsze od wody. Na początku jednak mieliśmy taką samą temperaturę i przyjmujemy, że jeśli coś jest raz w równowadze, pozostaje w niej stale — jedne części nie mogą spontanicznie ogrzewać się, a inne spontanicznie oziębiać. Twierdzenie to jest prawdziwe i można je wyprowadzić z praw mechaniki, ale dowód jest skomplikowany i wymaga znajomości mechaniki teoretycznej. Łatwiej go przeprowadzić na podstawie mechaniki kwantowej niż mechaniki klasycznej. Pierwszy dokonał tego Boltzmann, ale my na razie uznamy to twierdzenie po prostu za prawdziwe i powiemy, że nasza cząstka musi mieć energię \kT, jeśli zderza się z hipotetycznymi kulkami, a zatem musi mieć także energię \kT, gdy zderza się z cząsteczkami wody o tej samej temperaturze po usunięciu kulek. Pozostajemy więc przy wielkości \kT. Dowodzenie nasze przebiega może dziwnie, ale jest bez zarzutu. Oprócz ruchów cząstek koloidalnych, których dotyczyło odkrycie Browna, znamy wiele innych zjawisk, obserwowanych zarówno w laboratorium, jak i poza nim, w których występują ruchy Browna. Jeśli spróbujemy zbudować bardzo czułe urządzenie, na przykład maleńkie zwierciadełko zawieszone na cienkiej nici kwarcowej przeznaczone do galwano- metru balistycznego o dużej czułości (rys. 41.1), to zwierciadełko nie pozostanie nieruchome, lecz nieustannie będzie drgało tak, że gdy je oświetlimy i zaobserwujemy położenia odbitej plamki, przekonamy się, że nie mamy idealnego przyrządu, ponieważ zwierciadełko stale drży. Dlaczego? Dlatego, że średnia energia kinetyczna obrotów tego zwiercia- dełka musi wynosić \kT. Czemu równa się średnia kwadratu kąta wychylenia zwierciadełka? Przypuśćmy, zC wyznaczyliśmy okres drgań własnych zwierciadełka popchnąwszy je z jednej strony i zmie" rzywszy czas, jaki zużywa ono na wykonanie pełnego drgania, oraz że wiemy, jaki jes
41-1. EKWIPARTYCJA ENERGII 235 //W?///'. »* ■^rxly^r^l ., >'wy////. 41.1. a. Czuły galwanometr z promieniem świetlnym jako wskazówką. Światło ze źródła L po odbiciu od małego zwierciadełka pada na skalę. b. Schemat zapisu na skali galwanometru jako funkcja czasu moment bezwładności, /. Znamy wzór (19.8)*' na energię kinetyczną ruchu obrotowego T=±Ia>2. To jest energia kinetyczna; odpowiadająca jej energia potencjalna będzie proporcjonalna do kwadratu kąta V=\aSL. Ale jeśli znamy okres t0 i obliczymy częstość własną co = 2n/t0, to energia potencjalna równa się V=^Io)l62. Ponieważ wiemy, że średnia energia kinetyczna wynosi \kT, i ponieważ jest to oscylator harmoniczny, zatem średnia energia potencjalna również wynosi \kT. Dlatego czyli tIv2o<02>=łkT, <02> = fcT//^. (41.1) W ten sposób możemy obliczyć drgania zwierciadełka galwanometru i znaleźć ograniczenia w stosowaniu naszego przyrządu. Aby mieć mniejsze drgania, musimy oziębiać zwier- ciadełko. Powstaje pytanie: w którym miejscu je oziębiać? To zależy od tego, skąd pochodzą „szturchnięcia". Jeśli pochodzą od nitki, to właśnie ją oziębiamy od góry; jeśli zwierciadelko jest otoczone gazem i doznaje wstrząsów przede wszystkim na skutek zderzeń, to najlepiej oziębić gaz. Okazuje się, że jeśli wiemy, co tłumi drgania, to jak się przekonamy, to samo jest zarazem źródłem fluktuacji. Ale do tej sprawy jeszcze powrócimy. Dziwna rzecz, że to samo dotyczy obwodów elektrycznych. Przypuśćmy, że konstruujemy bardzo czuły, dokładny wzmacniacz dla określonej częstości i na wejściu mamy obwód rezonansowy tak dobrany, aby wzmacniacz był bardzo czuły na tę wybraną częstość — coś w rodzaju odbiornika radiowego, ale naprawdę bardzo dobrego (rys. 41.2). Załóżmy, że chcemy osiągnąć granice czułości, wprowadzamy więc na wzmacniacz napięcie, np. indukcyjne, i przesyłamy je do dalszego wzmacniania. Oczywiście, w każdym *' Z tomu I, cz. 1. (Przyp. red. wyd. polskiego.)
236 41. RUCHY BROWNA I G O obwodzie tego rodzaju występują pewne straty. Nie jest to idealny obwód rezonansowy, tylko bardzo dobry, w którym opór jest bardzo mały (wmontowaliśmy opornik, więc go widzimy, ale założyliśmy, że » ia jego opór jest bardzo mały). Zapytajmy: jakie są fluktuacje napięcia na indukcyjnośći? Odpowiedź: ..„,— ,. ... Wiemy, że \LI2 jest „energią kinetyczną" — ener- 41.2. Obwód rezonansowy o duzcj '* i j » e> i j t wartości 0. a. Właściwy obwód &$ związaną z cewką indukcyjną w obwodzie rezo- w temperaturze T. b. Zastępczy nansowym (t. I, cz. 1, rozdz. 25). Dlatego średnia obwód z idealnym („bezszumo- wartość \LI2 = \kT - co określa nam wartość skute- wym") oporem i „generatorem czną natęZenia prądu, a zarazem wartość skuteczną szumów" G . . T . ,. ,, . j , napięcia. Jeżeli przyjmiemy dla napięcia na indukcyjnośći wzór VL=itoLI oraz dla średniej kwadratu bezwzględnej wartości napięcia na indukcyjnośći wzór <Kf>=L2w2</2>, to podstawiając \L(I2')=\kT, otrzymamy (V£>=L<o20kT. (41.2) Teraz możemy już projektować obwody i przewidywać występujące w nich szumy związane z fluktuacjami termicznymi, tzw. szumy Johnsona1. Skąd tym razem pochodzą fluktuacje? Ich źródłem jest znów opornik — elektrony znajdujące się w oporniku poruszają się we wszystkich kierunkach, ponieważ pozostają w równowadze cieplnej z resztą opornika, a to właśnie wywołuje fluktuacje ich gęstości. W ten sposób elektrony wytwarzają słabe pola elektryczne w obwodzie rezonansowym. Inżynierowie-elektrycy podają inne wytłumaczenie pochodzenia fluktuacji. Z fizycznego punktu widzenia opornik jest rzeczywiście źródłem szumów. Możemy jednak zastąpić rzeczywisty obwód mający solidny, prawdziwy opornik fizyczny, który wytwarza zakłócenia, przez obwód zastępczy zawierający mały generator odpowiedzialny za szumy i idealny opornik, który szumów nie wytwarza. Wszystkie zakłócenia pochodzą z tego zastępczego generatora. A zatem jeżeli znalibyśmy charakterystyki szumów wytwarzanych przez opornik wyrażone jakimś wzorem, moglibyśmy przewidzieć, jak zachowa się obwód reagując na szumy. Dlatego musimy znać wzór określający szumy fluktuacyjne. Szumy wytwarzane w oporniku występują we wszystkich częstościach, ponieważ sam opornik nie jest układem rezonansowym. Oczywiście, obwód rezonansowy „słyszy" tylko tę ich część, której częstość jest bliska częstości rezonansowej, podczas gdy opornik wytwarza wiele różnych częstości. Moc generatora szumów możemy określić w następujący sposób: Średnia moc, którą mógłby absorbować opornik podłączony bezpośrednio do generatora szumów, wynosi <ZT2)//?, jeżeli ZTjest napięciem wytwarzanym przez generator. Chcielibyśmy jednak dowiedzieć się bardziej szczegółowo, jaka moc odpowiada różnym częstościom. Trudno tu mówić o mocy przypadającej na określoną częstość; istnieje jakiś jej rozkład. Niech P(co) dco oznacza moc dostarczaną przez generator w przedziale częstości o szerokości da> temu opornikowi. Wówczas możemy udowodnić (zrobimy to dla innego przypadku- -"- * * -~.ł«~«„an;«» i#»«t taWip wmol że otrzymamy moc równą
41-1. EKW1PARTYCJA ENERGII 237 P((o)dco = l— jkTda), (41.3) która jest niezależna od potraktowanego w taki sposób oporu. 41-2. Termodynamiczna równowaga promieniowania Przechodzimy obecnie do omówienia jeszcze trudniejszego i bardziej interesującego twierdzenia. Przypuśćmy, że mamy naładowany oscylator, taki, o jakim wspominaliśmy omawiając światło, na przykład elektron drgający w atomie do góry i na dół. Oscylując wysyła on światło. Załóżmy, że oscylator ten znajduje się w bardzo rozrzedzonym gazie, którego atomy od czasu do czasu się z nim zderzają. Wówczas, pozostając w równowadze, po dostatecznym upływie czasu oscylator będzie pobierał tyle energii, że energia kinetyczna jego drgań wyniesie \kT, a ponieważ jest to oscylator harmoniczny, więc całkowita energia jego ruchu będzie równa kT. Jak dotychczas, ten opis nie odpowiada rzeczywistości, ponieważ oscylator jest naładowany i mając energię kT, drga do góry i na dół wypromie- niowując światło. Dlatego nie można osiągnąć równowagi dla samej rzeczywistej substancji nie uwzględniając ładunków, które emitują światło. Skoro jednak światło jest emitowane, to energii ubywa, oscylator traci swoją energię kT z biegiem czasu i wskutek tego gaz, którego cząsteczki zderzają się z oscylatorem, stopniowo traci ciepło. Takie właśnie zjawisko zachodzi, gdy gorący piec stygnie w zimną noc wypromieniowując energię, ponieważ atomy z drgającymi ładunkami nieustannie promieniują i dzięki temu ich drgania powoli słabną. Z drugiej strony, gdy całość zamkniemy w zbiorniku, tak aby światło nie uciekało do nieskończoności, osiągniemy w końcu stan równowagi cieplnej. Możemy albo zamknąć gaz w zbiorniku, w którego ścianach znajdują się inne źródła promieniowania wysyłające światło do wnętrza, albo — co wygodniejsze — przyjąć, że zbiornik ten ma ścianki lustrzane. Łatwiej sobie wyobrazić tę drugą ewentualność. W każdym razie przyjmujemy, że całe promieniowanie wysyłane przez oscylator pozostaje w zbiorniku. Oscylator zaczyna oczywiście promieniować, ale natychmiast odzyskuje swoją energię kinetyczną kT, mimo wypromieniowania jej, ponieważ jest stale, można to tak powiedzieć, oświetlony swym własnym światłem odbitym od ścian zbiornika. Zatem po chwili cały zbiornik jest wypełniony światłem. I chociaż oscylator trochę promieniuje, to światło wraca do niego przynosząc część wypromieniowanej energii. Obliczymy teraz, ile światła musi znajdować się w zbiorniku o temperaturze T, aby oświetlenie oscylatora dawało mu tyle samo energii, ile wypromieniowuje jej w postaci światła. Weźmy gaz rozrzedzony, tak aby mieć oscylator doskonały, napotykający tylko opór Promieniowania. Wtedy uwzględniamy, że o pozostającym w równowadze cieplnej oscylatorze można powiedzieć dwie rzeczy. Po pierwsze — ma on średnią energię kT 1 możemy obliczyć, ile promieniowania wysyła. Po drugie — wysyłanego promieniowania Powinno być tyle, ile powstaje go w wyniku rozproszenia światła padającego na oscyla-
238 41 RUCHY BROW,N-\ tor. Ponieważ energia nie ma innego ujścia, więc efektywne promieniowanie oscylatora jest po prostu światłem rozproszonym, pochodzącym z promieniowania, które jest w zbiorniku. Wobec tego najpierw obliczymy, jaką energię wypromieniowuje w ciągu sekundy oscylator mający pewną jej ilość. (Z rozdziału 32, mówiącego o oporze promieniowania, zaczerpniemy kilka równań, nie powtarzając ich wyprowadzenia.) Energia wypromienio- wana, przypadająca na radian i dzielona przez energię oscylatora, została tam oznaczona przez ]/Q [równanie (32.8)]: \,Q = (dW/dt)oj0lV Posługując się wielkością y, stałą tłumienia, można także to równanie zapisać następująco: \\Q = y\co{i, gdzie co0 jest częstością własną oscylatora. Jeżeli y jest bardzo małe, to Q jest bardzo duże, a energia wypromie- niowana w ciągu sekundy równa się dW co0W co0Wy -— = -—= =yW. (41.4) dl Q co0 Energia wypromieniowana w ciągu sekundy równa się po prostu iloczynowi y i energii oscylatora. Oscylator z kolei powinien mieć średnią energię równą kT, zatem widzimy, że y razy AT jest średnią energią wypromieniowana w ciągu sekundy: 'dWjdf) = ykT (41.5) Musimy teraz tylko dowiedzieć się, czemu równa się y. Łatwo ją znaleźć z równania (32.12): «o 2 r0Wo >>=—=- , (41.6) Q 3 c gdzie r0 = e2/mc2 jest klasycznym promieniem elektronu, a l = 2nc/co0. W wyniku otrzymamy dla średniej ilości promieniowania o częstości bliskiej co0 następujące równanie: dW 2 r0coZkT — = —— (41.7) dl 3 c Pytamy z kolei: ile światła musi padać na oscylator? Musi padać go dokładnie tyle samo, ile oscylator pochłania (a następnie rozprasza). Inaczej mówiąc, wyemitowane światło traktujemy jako rozproszone promieniowanie pochodzące ze światła padającego na oscylator znajdujący się w zbiorniku. Musimy więc następnie obliczyć, ile światła rozprasza oscylator, jeżeli pada nań pewna — nieznana — ilość promieniowania. Niech /(tu) dco oznacza energię niesioną przez światło o częstości co zawartej w przedziale dco (ponieważ nie ma światła o częstości dokładnie równej co, ale rozkłada się ono na całe widmo). Tak więc l(co) jest pewnym rozkładem widmowym, który chcemy znaleźć; jest to kolor paleniska o temperaturze T, który widzimy, gdy otworzymy drzwiczki pieca i spojrzymy do środka. Zastanówmy się teraz, jaka ilość światła zostaje absorbowana. Obliczyliśmy już ilość pochłoniętego promieniowania pochodzącego z danego padającego strumienia światła wprowadzając pojęcie przekroju czynnego. Mieliśmy wtedy taką sytuację, jakby zostało pochłonięte całe światło padające na pewne pole przekroju poprzecznego, nazwanego przez nas przekrojem czynnym. A zatem całkowita ilość światła, które jest
41-2. TERMODYNAMICZNA RÓWNOWAGA PROMIENIOWANIA 239 teraz reemitowane (rozproszone) równa się natężeniu padającego światła /(to) dw pomnożonemu przez przekrój czynny a. Wyprowadzony przez nas wzór na przekrój czynny [równanie (32.19)] nie uwzględnia tłumienia. Nietrudno jeszcze raz otrzymać ten wzór uwzględniając wyraz opisujący opór, który przedtem opuściliśmy. Jeżeli to zrobimy i obliczymy tak samo przekrój czynny, otrzymamy 8nr2 ( w4 \ 3 \(cj -<o0) + y w J Widzimy, że a, jako funkcja częstości różni się w sposób istotny od zera tylko dla wartości w bardzo bliskich częstości drgań własnych w0. (Pamiętajmy, że Q dla promieniującego oscylatora jest rzędu 108.) Oscylator rozprasza bardzo silnie, gdy w równa się co0, a bardzo słabo dla innych wartości co. Wobec tego możemy zastąpić wielkość w wielkością w0 oraz wyrażenie (y2-wj wyrażeniem 2w0(co-co0) i otrzymamy -,2 2 2nr0w0 °,= -r , , .,■ (41.9) 3[(co-co0)2 + y2/4] Powyższej zależności o, od w odpowiada krzywa, która ma silne maksimum dla co = oj0 i różni się w sposób istotny od zera jedynie dla argumentów co w otoczeniu to0. (Właściwie nie musieliśmy się tu posłużyć dopiero co opisanym przybliżeniem, ale ułatwi to znacznie obliczenie całki, która za chwilę się pojawi, gdy uda się nam uprościć jej wyrażenie podcałkowe.) Pomnóżmy teraz natężenie w danym przedziale częstości przez przekrój czynny rozproszenia, by otrzymać energię rozpraszaną w przedziale dw. Całkowita energia rozproszona będzie się wtedy równała całce po wszystkich w z tej wielkości. Zatem cc oo dWs f f 2nrlwll(co)dw = I(w)<js(w)dto = r 7 i -■• (4,l0) dt J J 3[(co-fl>0)2+y2/4] o o Podstawiamy teraz dWJdt=3ykT. Skąd tu trójka? Zajmując się przekrojem czynnym w rozdz. 32 przyjmowaliśmy odpowiednią polaryzację, aby światło mogło oddziaływać na oscylator. Jeżeli użyjemy oscylatora, który będzie mógł drgać tylko w jednym kierunku i światło będzie spolaryzowane nieodpowiednio, nie otrzymamy rozproszenia. Dlatego musimy uśrednić przekrój czynny dla takiego oscylatora na wszystkie kierunki rozchodzenia się i polaryzacji światła, albo - co jest łatwiejsze — wyobrazić sobie oscylator, który oddziaływałby z polem niezależnie od jego kierunku. Oscylator, który mógłby drgać równie dobrze w każdym z trzech kierunków, miałby energię 3kT, ponieważ miałby trzy stopnie swobody. Dlatego właśnie powinniśmy przyjąć 3ykT. Teraz musimy obliczyć całkę. Załóżmy, że nieznany rozkład widmowy światła /(w) jest gładką krzywą wolnozmienną w wąskim przedziale częstości, w którym a, ma ostre maksimum (rys. 41.3). Wówczas istotne znaczenie mają takie to, które od to0 różnią się tylko o bardzo małą wielkość y. Wobec tego chociaż I(to) może być nieznaną, skomplikowaną funkcją, istotny wpływ na całkę mają tylko jej wartości dla argumentów to bliskich <o = oj0. Możemy więc zastąpić ją przez prostą przebiegającą na stałej wysokości — przez
240 41. RUCHY BROWNA Wo-7 Mo+7 41.3. Czynniki występujące pod całką (41.10). Pik przedstawia krzywą rezonansową l/[(«u—co0)2 + y2l4]. Z bardzo dobrym przybliżeniem czynnik I (co) można zastąpić czynnikiem /(a>o) 41.4. Rozkłady natężenia promieniowania ciała doskonale czarnego dla dwóch różnych temperatur otrzymane z fizyki klasycznej (krzywe ciągłe). Krzywe przerywane przedstawiają właściwe rozkłady. / — obszar fal radiowych, 2 — obszar promieniowania podczerwonego, 3 — obszar promieniowania widzialnego, 4 — obszar promieniowania nadfioletowego, 5 — obszar promieniowania rentgenowskiego „stałą". Inaczej mówiąc, wynosimy funkcję I(io) przed znak całki i oznaczamy ją I(co0). Po wyniesieniu pozostałych stałych przed całkę otrzymamy $nrla)20I(co0) or. I dco (co-a)oy+yAl4 = 3ykT. (41.11) Całkę należy wziąć w granicach od 0 do oo, ale punkt 0 jest tak odległy od to0, że krzywa jest w jego otoczeniu (i dla ujemnych wartości argumentu co) bardzo bliska osi odciętych. Możemy więc dolną granicę w całce zastąpić przez minus oo, co nie zmienia sytuacji, a ułatwia wykonanie całkowania. Całka jest typu arcus tangens, tzn. J dx/(x2+a2). Po sprawdzeniu w tablicach całek przekonamy się, że równa się ona n/a, co w naszym przypadku odpowiada 2n/y. Dlatego po pewnych przekształceniach otrzymamy 9y2kT /Oo) = 4ji 2rWQ (41.12) Następnie podstawiamy tu wzór (41.6) na y (nie musimy tu pisać co0, ponieważ wzór jest prawdziwy dla dowolnego to0 i możemy je po prostu oznaczać jako w) i otrzymujemy następujący wzór na I (co): I(co)=- co kT (41.13) Określa on rozkład promieniowania gorącego paleniska. Nazywa się je promieniowaniem ciała doskonałe czarnego, czarnego, ponieważ otwór w drzwiczkach, przez który patrzymy, jest czarny, gdy temperatura wynosi zero. Wzór (41.13) określa rozkład energii promieniowania w zamkniętym zbiorniku w temperaturze T, zgodnie z teorią klasyczną. Najpierw zwróćmy uwagę na doniosłą cechę tego wyrażenia. Ładunek oscylatora, jego masa i pozostałe własności uprościły się, ponieważ skoro raz osiągnęliśmy równowagę przy określonym oscylatorze, to musimy mieć równowagę przy każdym innym oscylatorze o innej masie, bo w przeciwnym wypadku mielibyśmy trudności. Jest to więc ważny sprawdzian twierdzenia, że równowaga nie zależy
41-2. TERMODYNAMICZNA RÓWNOWAGA PROMIENIOWANIA 241 od tego, z czym zachodzi, a tylko od temperatury. Wykreślmy teraz krzywą I(c>) (rys. 41.4). Określi nam ona, ile jest światła przy różnych częstościach. Widzimy, że natężenie promieniowania w naszym zbiorniku, przypadające na jednostkowy przedział częstości, zmienia się jak kwadrat częstości, a to oznacza, że jeśli weźmiemy zbiornik o dowolnej temperaturze i zapytamy się, jaką część promieniowania stanowi promieniowanie rentgenowskie, to otrzymamy odpowiedź, że bardzo dużą! Oczywiście, wiemy, że to nieprawda. Gdy otworzymy piec i spojrzymy do środka, to nasze oczy nie zostaną w ogóle porażone promieniami Róntgena. To jest zupełnie niemożliwe. Co więcej, całkowita energia w zbiorniku, całkowite natężenie sumowane po wszystkich częstościach równałoby się powierzchni zawartej pod tą nieskończoną krzywą. Widzimy więc, że coś tu jest z gruntu zasadniczo i całkowicie fałszywe. Zatem teoria klasyczna zupełnie nie była w stanie należycie opisać rozkładu promieniowania ciała doskonale czarnego, podobnie jak nie mogła należycie opisać ciepła właściwego gazów. Fizycy zajmowali się tym wyprowadzeniem z różnych punktów widzenia, ale bez rezultatu. Jest ono wnioskiem wypływającym z fizyki klasycznej. Równanie (41.13), nazywane prawem Rayłeigha, jest wnioskiem wypływającym z fizyki klasycznej, bez wątpienia absurdalnym. 41-3. Ekwipartycja i oscylator kwantowy Omówiona powyżej trudność — to jeszcze jedna strona problemu ciągłości w fizyce klasycznej, która rozpoczęła się z trudnościami dotyczącymi ciepła właściwego gazów, a obecnie skupiła się na promieniowaniu ciała doskonale czarnego. Kiedy teoretycy zajmowali się tą sprawą, dokonywano także wielu pomiarów prawdziwej.krzywej. Okazało się, że poprawna krzywa wygląda tak, jak krzywa przerywana z rys. 41.4. A więc to znaczy, że promieniowania rentgenowskiego w ogóle tam nie ma. Jeżeli obniżymy temperaturę, cała krzywa obniża się proporcjonalnie do T zgodnie z teorią klasyczną, ale oprócz tego krzywa doświadczalna szybciej znika dla niższej temperatury. Widzimy więc, że nisko- częstościowy kraniec krzywej teoretycznej odpowiada doświadczeniu, a wysokoczęstoś- ciowy — nie. Dlaczego? Gdy James Jeans badał ciepło właściwe gazów, zauważył, że ruchy wewnątrzcząsteczkowe o wysokich częstościach są „zamrożone", gdy temperatura zbytnio się obniży, to znaczy, że jeśli temperatura jest zbyt niska, a częstości drgań zbyt duże, oscylatory nie mają średniej energii równej kT Przypomnijmy, jak przebiegało nasze wyprowadzenie wzoru (41.13). Opiera się ono w całości na energii jednego oscylatora pozostającego w równowadze cieplnej. Wyrażenie kT, które występowało we wzorze (41.5), i to, które było we wzorze (41.13), jest tą samą średnią energią oscylatora o częstości w w temperaturze T. Z punktu widzenia fizyki klasycznej energia ta jest równa kT, ale z doświadczenia wiemy, że tak nie jest! Nie jest tak, gdy temperatura jest zbyt niska lub częstość oscylatora zbyt wysoka. Zatem powód, dla którego krzywe są nieprawdziwe, Jest taki sam jak w przypadku załamania się teorii ciepła właściwego gazów. Łatwiej badać krzywe promieniowania ciała doskonale czarnego niż ciepła właściwe gazów, z którymi jest więcej kłopotów. A więc skupimy uwagę na poprawnym określeniu takiej krzywej.
242 41. RUCHY BROWNA W„ , , ponieważ określi ona ściśle średnią energię oscyla- —2S—EĄ=4t>*> P4-Ae*p(-4t>w/kT) \ . ■ i r i - 1 P\ a. torą harmonicznego jako funkcję temperatury dla Ł_E3=3r)w P3=Aextf-3t>u/kT) każdej częstości. ———E2=2fi<x> P2=Aexp(-2t)cjkT) Krzywą tą zajmował się Planck. Najpierw po- N* E - f)ui P\=Aem(-t)w/kT) ^a' rozwiązanie eksperymentalne, dopasowując ob- /V0 serwowane krzywe do funkcji, która najlepiej zga- 0 dzała się z doświadczeniem. Otrzymał w ten sposób „ . . eksperymentalny wzór na średnią energię oscylato- 41.5. Poziomy energetyczne oscyla- J torą harmonicznego znajdują się w « harmonicznego jako funkcję częstości drgań. równych odległościach E„=nKto Inaczej mówiąc, otrzymał właściwe wyrażenie zamiast k T, a następnie drogą różnych kombinacji znalazł jego proste wyprowadzenie, które wymagało bardzo osobliwego założenia. Planck zakładał mianowicie, że oscylator harmoniczny może na raz pochłonąć tylko energię równą hu>. Wyobrażanie sobie, że może on mieć dowolną energię, okazało się fałszywe. Oczywiście, był to początek końca mechaniki klasycznej. Wyprowadzimy teraz pierwszy poprawnie określony wzór mechaniki kwantowej. Załóżmy, że dozwolone poziomy energetyczne oscylatora harmonicznego są od siebie jednakowo oddalone o hiu0, tak że oscylator może mieć tylko jedną z tych energii (rys. 41.5). Argumentacja Plancka była bardziej skomplikowana, ponieważ działo się to u zarania mechaniki kwantowej, i musiał wiele rzeczy udowadniać. Ale my przyjmiemy za fakt (co Planck udowodnił w tym przypadku), że prawdopodobieństwo zajęcia poziomu o energii E równa się P(E) = otc~ElkT Przy takim założeniu otrzymamy wynik prawidłowy. Przypuśćmy teraz, że mamy dużo oscylatorów, z których każdy drga z częstością c>0. Niektóre z nich są w najniższym stanie kwantowym, inne w następnym co do wielkości i tak dalej. Chcemy znać średnią energię tych oscylatorów. W tym celu obliczymy ich całkowitą energię i podzielimy ją przez liczbę oscylatorów. Otrzymamy wówczas średnią energię oscylatora pozostającego w równowadze cieplnej z promieniowaniem ciała doskonale czarnego, która zastąpi wyraz kT w równaniu (41.13). Niech A0 oznacza liczbę oscylatorów w stanie podstawowym (w stanie o najniższej energii), A', — liczbę oscylatorów w stanie E,, A', — liczbę oscylatorów w stanie E2 itd. Zgodnie z hipotezą (której nie dowodziliśmy), iż w mechanice kwantowej prawo, które zastępuje prawdopodobieństwo exp( ~EpjkT) lub exp( — Ek>kT) z mechaniki klasycznej, mówi, że prawdopodobieństwo maleje jak e~ M kT (gdzie AE oznacza przyrost energii), musimy przyjąć liczbę A, oscylatorów w pierwszym stanie jako równą A0 razy e~y'lokT. Podobnie A2 — liczba oscylatorów w drugim stanie — równa się N2 = N0e'2'"'kT. Dla uproszczenia obliczeń oznaczamy e-vir = x wtedy mamy po prostu A, = A0.v, !\2 = N0x2, ,A'„=A0xn. Obliczymy najpierw całkowitą energię wszystkich oscylatorów. Oscylator znajdujący się w stanie podstawowym nie ma wcale energii. Jeżeli znajduje się w pierwszym stanie energetycznym, ma energię hto0. Takich oscylatorów jest A,. Mają one więc razem energię A,fau lub hu>iyox. W drugim stanie energetycznym energia równa się 2ha>, a więc A\ oscylatorów ma energię ■N2-2hoj = 2hoN0x2 Dodając wszystkie energie otrzymamy ECii = Noh<u(0 + x + 2x2 + 3x3 + . .). Następnie zastanówmy się, ile je>t wszystkich oscylatorów razem. Oczywiście, jest
41-3. EKWrPARTYCJA 1 OSCYLATOR KWANTOWY 243 ich N0 w stanie podstawowym, A', - w pierwszym itd.; po dodaniu otrzymamy: WCB| = = A'0(l+x + x2 ...)■ Dlatego średnia energia równa się <£>^::*°*"(0+x+2*/h3*,+-). (4i.i4) N«i /V0(l+x + x2 + ...) Niechaj Czytelnik zabawi się obliczeniem powyższych sum. Gdy obliczymy sumy i podstawimy do nich wartość x, wówczas jeżeli nie zrobiliśmy błędu, powinniśmy otrzymać /£> = _ (41.15) s ' eV/*T_ ^ • V Był to pierwszy z dotychczas znanych i badanych wzorów mechaniki kwantowej. Stanowił on wspaniałe zakończenie okresu zagadek. Maxwell wiedział, że coś jest nie w porządku, ale pozostawał problem: co jest dobrel Otrzymaliśmy jakościową odpowiedź na pytanie: jakie wyrażenie naprawdę powinno zająć miejsce k77 Powinno ono oczywiście przechodzić w kT, gdy co-*0 lub gdy 7"->oo. Sprawdźmy, czy potrafimy to udowodnić - zastanówmy się, jak to zrobić. Tak właśnie wygląda słynny czynnik „obcinający" duże częstości, którego szukał Jeans, i jeżeli skorzystamy z niego zamiast z czynnika kTwc wzorze (41.13), to otrzymamy na rozkład światła w czarnym zbiorniku wzór ho)3d<o ^cV^-1) Ponieważ w mianowniku mamy e podniesione do bardzo dużej potęgi, więc dla dużych a>, mimo występowania w3 w liczniku, krzywa obniża się i nie „wybucha" — nie znajdujemy ani promieniowania ultrafioletowego, ani promieniowania rentgenowskiego, tam gdzie się ich nie spodziewamy! Ktoś mógłby ubolewać, że w naszym dowodzie użyliśmy teorii kwantowej do wyprowadzenia poziomów energetycznych oscylatora, a klasycznej - do otrzymania przekroju czynnego as. Jednak kwantowa teoria oddziaływania światła z oscylatorem harmonicznym daje dokładnie taki sam wynik jak teoria klasyczna. Jesteśmy ponadto usprawiedliwieni, że tak długo zajmowaliśmy się współczynnikiem załamania światła i rozproszeniem światła, traktując atomy jak małe oscylatory. Postępowaliśmy tak, ponieważ wzory kwantowe są w istocie takie same. Wróćmy teraz do szumów Johnsona w oporniku. Wspominaliśmy już, że teoria mocy tych szumów jest w istocie taka sama jak teoria rozkładu promieniowania ciała doskonale czarnego Mówiliśmy nawet, że jeżeli opór obwodu stanowi tylko antena (antena działa jak opór, ponieważ promieniuje energię) stawiająca opór promieniowaniu i brak jest zwykłego oporu, to łatwo możemy wyliczyć moc. Byłaby to właśnie moc, którą przekaże antenie otaczające światło i powinniśmy otrzymać taki sam rozkład, co najwyżej różniący się jednym lub dwoma czynnikami. Możemy przyjąć, że opornik jest generatorem o nieznanym widmie mocy P(a>). Widmo to ustalamy na podstawie faktu, że ten sam generator dołączony do obwodu rezonansowego dla dowolnej częstości, iak na rvs. 41.2b.
244 41. RUCHY BROWNA wytwarza na indukcyjności napięcie określone równaniem (41.2). W ten sposób dochodzimy do tej samej całki jak we wzorze (41.10) i przy pomocy tej samej metody otrzymamy równanie (41.3). Dla niskich temperatur trzeba oczywiście zastąpić czynnik kT we wzorze (41.3) wyrażeniem (41.15). Te dwie teorie (promieniowania ciała doskonale czarnego i szumów Johnsona) są także ściśle związane fizycznie, gdyż możemy oczywiście włączyć do obwodu rezonansowego antenę i opór R będzie wtedy czystym oporem promieniowania. Ponieważ zależność (41.2) nie uwzględnia fizycznych własności źródła oporu, generator G będzie więc taki sam i dla rzeczywistego oporu i dla oporu promieniowania. A co wytworzy moc P(co), jeżeli oporem R będzie idealna antena pozostająca w równowadze z otoczeniem w temperaturze T! Generatorem tym będzie promieniowanie I(io) otaczające antenę w temperaturze T, które oddziałuje na nią jako „odebrane sygnały". Dlatego możemy od razu otrzymać zależność między funkcjami P(to) i I(to), przechodząc następnie od wyrażenia (41.13) do (41.3). Wszystko o czym mówiliśmy, a więc i teoria szumów Johnsona i rozkład Plancka, a także poprawna teoria ruchów Browna, do której przejdziemy za chwilę — to osiągnięcia pierwszego dziesięciolecia XX w. Obecnie, pamiętając o tych osiągnięciach i o całej historii problemu, wróćmy do ruchów Browna. 41-4. Błądzenie przypadkowe Zastanówmy się, jak zmieni się położenie drgającej cząstki po upływie czasu o wiele dłuższego od czasu między kolejnymi „uderzeniami". Zajmijmy się małą cząstką podlegającą ruchom Browna, która skacze na wszystkie strony, bombardowana zewsząd nieregularnie drgającymi cząsteczkami wody. Pytanie: Jak daleko od położenia wyjściowego znajdzie się cząstka po upływie określonego czasu? Problem ten rozwiązali Einstein i Smo- luchowski. Jeżeli wyobrazimy sobie, że podzieliliśmy ten czas na małe odstępy, na przykład długości Y^p s, wtedy w pierwszym odstępie cząstka przesuwa się w pewnym kierunku, w następnym trochę dalej, w następnym jeszcze dalej w innym kierunku itd. W porównaniu z czasem upływającym między kolejnymi uderzeniami r^ s trwa bardzo długo. Czytelnik może łatwo sprawdzić, że liczba uderzeń doznanych przez cząsteczkę wody w ciągu 1 s wynosi 1014, zatem w ciągu y^0 s wynosi I012 uderzeń, a więc bardzo dużo! Dlatego po upływie -' s cząstka już 41.6. Błądzenie przypadkowe składające się . . . ,. i„„^7»i ,, . . . r. . - , , . . . . nie pamięta, co zdarzyło się przedtem. Inaczej z 36 kroków o długości L. Jak daleko znaj- r x ' r duje się punkt S3t od JV Odpowiedź: średnio mówiąc, wszystkie zderzenia są przypadkowe, o około 6L tak że następny „krok" nie jest związany z poprzednim. Jest to zagadnienie analogiczne do słynnego problemu pijanego marynarza- Marynarz wychodzi z baru i robi kilka kroków, ale każdy krok jest skierowany pod innym kątem, na chybił trafił (rys. 416). Pyta" my: gdzie znajdzie się marynarz po uptyvvie
41-4 BŁĄDZENIE PRZYPADKOWE 245 dłuższego czasu? Oczywiście, nie wiadomo! Nie można na to odpowiedzieć. Co najwyżej wiemy tylko mniej więcej, że znalazł się w jakimś miejscu przypadkowo. No, to w takim razie zapytajmy: gdzie się znajduje średnio biorąc? Jak daleko, średnio biorąc, oddalił się od baru? Już odpowiedzieliśmy na to pytanie, gdy zajmowaliśmy się interferencją światła z wielu różnych źródeł o różnych fazach. Rozwiązanie polegało na dodawaniu wielu wektorów skierowanych pod różnymi kątami (rozdz. 32). Stwierdziliśmy wówczas, że średni kwadrat odległości od jednego do drugiego końca szeregu przypadkowych kroków, który odpowiada natężeniu światła, równa się sumie natężeń oddzielnych źródeł. W ten sam sposób możemy natychmiast udowodnić, że jeśli R^ oznacza wektor odległości od punktu wyjściowego po wykonaniu jV kroków, to średni kwadrat tej odległości jest proporcjonalny do liczby kroków A'; tzn. Rf, = NL2, gdzie L oznacza długość każdego kroku. Ponieważ w tym wypadku liczba kroków jest proporcjonalna do czasu, średni kwadrat odległości jest także proporcjonalny do czasu: <R2>=at. (41.17) Nie chcemy przez to powiedzieć, że średnia odległość jest proporcjonalna do czasu, gdyż znaczyłoby to. że cząstka porusza się ze ściśle określoną stałą prędkością. Marynarz wprawdzie posuwa się dostrzegalnie naprzód, ale tylko tak, że średni kwadrat przebytej odległości jest proporcjonalny do czasu. To jest właśnie cecha charakterystyczna błądzenia przypadkowego. Możemy łatwo udowodnić, że każdy kolejny krok zwiększa kwadrat odległości średnio o L1. Pisząc R^ = RV_|+L otrzymamy dla R*: Rn'Rn~R/i = Rn- i +2Rw_| -L + L i po uśrednieniu po wielu błądzeniach mamy </?jJ> = </?w_i> + L2, ponieważ <R,¥-iL>=0. Następnie drogą indukcji otrzymujemy <R2N> = NL2 (41.18) Z kolei chcemy wyznaczyć współczynnik a w równaniu (41.17). W tym celu musimy wziąć pod uwagę pewne dodatkowe okoliczności. Zamierzamy się więc zastanowić, co się będzie działo z taką cząstką, gdy przyłożymy do niej pewną siłę (ruch naszej cząstki nie ma teraz nic wspólnego z ruchem Browna — zagadnienie to jest chwilowo tylko dygresją). Jak zatem cząstka będzie się zachowywała? Przede wszystkim da znać o sobie jej bezwładność. Niech m oznacza współczynnik bezwładności, efektywną masę obiektu (niekoniecznie równą rzeczywistej masie cząstki, ponieważ jeżeli popchniemy cząstkę, woda też będzie się Poruszała. Wobec tego, jeżeli mówimy o ruchu w jednym tylko kierunku, przyłożona siła będzie przede wszystkim zrównoważona przez wyraz m(d2xjdt2). Następnie Przyjmiemy, że obok stałej siły działającej na obiekt wystąpi opór cieczy proporcjonalny do Jego prędkości. Unoszona przez cząstkę ciecz jest nie tylko bezwładna, lecz istnieje w niej °Pór przepływu spowodowany lepkością i złożoną budową płynu. Dla wystąpienia fluktuacji absolutnie niezbędne jest istnienie pewnych nieodwracalnych strat, takich jakie powoduje na przykład opór. Nie można otrzymać wyrazu kT, posługując się modelem nie uwzględniającym takich strat. Źródło fluktuacji jest ściśle związane z tymi stratami. Będziemy wkrótce
246 41. RUCHY BROWNA omawiać mechanizm tego oporu — zajmiemy się sitami, które są proporcjonalne do prędkości, i znajdziemy ich źródło. Na razie jednak załóżmy tylko, że taki opór istnieje. Wówczas wzór na ruch pod wpływem siły zewnętrznej zapisany w zwykły sposób będzie miał postać następującą: d2x dx miitI+ti7t=F""' (41,9) Wielkość n można wyznaczyć z doświadczenia. Tak na przykład możemy obserwować spadanie kropli pod wpływem siły grawitacji. Wtedy wiemy, że siła równa się mg i wartość fi równa się mg podzielonemu przez końcową szybkość spadania kropli. Możemy też obserwować szybkość osadzania się kropli w wirówce lub naładowaną kroplę umieścić w polu elektrycznym. Ostatecznie więc fi jest wielkością mierzalną, a nie wprowadzoną sztucznie. Znamy ją dla wielu typów cząstek koloidalnych i innych. Powróćmy teraz do ruchów Browna i skorzystajmy ze wzoru (41.19), już nie dla dowolnej siły zewnętrznej, lecz dla sił nieregularnych występujących w ruchach Browna. Następnie spróbujemy określić średni kwadrat odległości, na jaką obiekt się przemieści. Zamiast obliczać odległości w trzech wymiarach, weźmiemy tylko jeden wymiar i traktując to jako ćwiczenie znajdziemy średnią wartość x1. (Średnia wartość x2 jest oczywiście taka sama jak średnia wartość y2 oraz z2, a zatem średni kwadrat odległości jest trzy razy większy od tego, co mamy teraz obliczyć.) Składowa x-owa siły nieregularnej jest tak samo nieregularna jak każda z pozostałych składowych. Jaka jest szybkość zmian x21 Równa się ona d(x2)/dt = 2x(dx/dt) a więc chcemy znać średnią wartość iloczynu prędkości i położenia. Mamy udowodnić, że jest to wielkość stała i dlatego średni kwadrat promienia będzie rósł proporcjonalnie do czasu; chcemy też znać szybkość tego przyrostu. Jeśli pomnożymy równanie (41.19) przez x, otrzymamy mx(d2x/dt2)+fvc(dx/dt) = xFx. Chcemy znać uśrednioną po czasie wartość x(dx/dt), weźmy więc średnią z całego równania i zbadajmy wszystkie trzy wyrazy. Co otrzymamy z iloczynu x i siły? Jeżeli cząstka przemieściła się o x, to ponieważ nieregularna siła jest całkowicie przypadkowa i niezależna od punktu wyjściowego cząstki, następne uderzenie może mieć zupełnie dowolny zwrot względem x. Jeżeli x jest na przykład dodatnie, to nie ma powodu, aby i średnia siła miała zwrot dodatni. Może mieć równie dobrze zwrot dodatni, jak i przeciwny. Siły nieregularne nie popychają więc cząstki w określonym kierunku. Dlatego średnia wartość iloczynu x i F równa się zeru. Wyraz mx(d2x/dt2) możemy natomiast zapisać w takiej oto, trochę dziwnej postaci: d2x d\x{dxjdt)\ (dx\2 mx t =m — m ( — I ^*F dt \dtj i jego średnią możemy zastąpić przez średnie czasowe obu otrzymanych wyrazów. Zastanówmy się, ile powinno wynosić x pomnożone przez prędkość. Średnia wartość iloczynu X i prędkości nie zmienia się w czasie, bo skoro cząstka zajmie jakieś położenie, to zapomiDa o swym poprzednim położeniu i dlatego wyrażenie to nie zależy od czasu. A więc średnia wartość pierwszego składnika równa się zeru. Pozostało nam tylko mv2; i tu możemy skorzystać z naszych wiadomości, że średnia wartość mv2/2 wynosi \kT. Stwierdziliśmy
41-4. BŁĄDZENIE PRZYPADKOWE 247 więc, że z tego, iż (mx^r) + /J(x-) = <xFx>. wynika, że -<™2>+^—<x2>=0. 2 dl czyli c/<x2> fcT -^ = 2 — (41.20) Wskutek tego nasz obiekt po upływie czasu i przemieści się na odległość, której średni kwadrat (R2> = 6kT—. (41.21) W ten sposób nareszcie możemy określić jak daleko cząstki się przesuwają! Najpierw musimy stwierdzić, jak cząstki reagują na siłę stacjonarną, jak szybko przesuwają się pod wpływem znanej siły (znaleźć n) i dopiero wtedy możemy odpowiedzieć na pytanie, jak daleko przesuną się przy błądzeniu przypadkowym. To równanie było ze względów historycznych bardzo ważne, ponieważ przy jego pomocy po raz pierwszy określono stałą k. Można przecież zmierzyć fi, wyznaczyć czas, odległość, na jaką przesuną się cząstki, i obliczyć wartość średnią. Określenie k miało wielkie znaczenie, ponieważ z prawa gazu doskonałego dla jednego mola, PV=RT, znamy R, które można wyznaczyć i które równa się liczbie atomów w jednym molu pomnożonej przez k. Z początku mol definiowano jako określoną ilość gramów tlenu, mianowicie 16 (teraz używamy węgla), liczba zatem atomów w jednym molu nie była początkowo znana. Był to interesujący i ważny problem: Jak duże są atomy? Ile ich jest w jednym molu? Najwcześniejszą więc metodą określania liczby atomów było zbadanie, jak porusza się malutka cząstka pyłu, kiedy obserwujemy ją cierpliwie przez pewien czas pod mikroskopem. Właśnie w ten sposób została określona stała Boltzmanna k i liczba Avogadry A', ponieważ R było zmierzone wcześniej.
42 zastosowania teorii kinetycznej 42-1. Parowanie W rozdziale niniejszym omówimy dalsze zastosowania teorii kinetycznej. Poprzednio położyliśmy nacisk na jedno z twierdzeń tej teorii, mówiące, że średnia energia kinetyczna przypadająca na dowolny stopień swobody cząsteczki lub innego obiektu równa się \kT Centralnym punktem naszego obecnego tematu będzie z kolei fakt, że prawdopodobieństwo znalezienia cząsteczki w różnych miejscach, obliczone dla jednostkowej objętości, zmienia się jak e-energia P°,encJalna/*7'. Podamy wiele zastosowań tego twierdzenia. Zjawiska, które zamierzamy omówić, są dość skomplikowane: parowanie cieczy, emisja elektronów z powierzchni metalu, czy też reakcja chemiczna, w której bierze udział duża liczba atomów. W tych przypadkach nie można, korzystając tylko z teorii kinetycznej, wyciągnąć prostych i poprawnych wniosków, ponieważ zjawiska te są zbyt skomplikowane. Dlatego też treść niniejszego rozdziału nie jest zbyt ścisła poza przypadkami, na które specjalnie zwrócimy uwagę. Chodzi tu o to, że na podstawie teorii kinetycznej możemy tylko w przybliżeniu zrozumieć przebieg zjawisk. Stosując twierdzenia termodynamiki lub wyniki pomiarów pewnych wielkości krytycznych, moglibyśmy przebieg tych zjawisk przedstawić dokładniej. Jednak warto wiedzieć, choćby tylko z grubsza, dlaczego coś przebiega tak a nie inaczej — po to, aby w przypadku nieznanych warunków lub takich, których jeszcze nie badaliśmy, móc powiedzieć, co się powinno w zasadzie zdarzyć. Nasze dalsze rozważania będą bardzo niedokładne, lecz w istocie rzeczy prawdziwe — prawdziwe co do samei idei; tylko sytuacja jest, powiedzmy, trochę uproszczona, jeżeli chodzi o pewne specyficzne szczegóły. Naszym pierwszym przykładem będzie parowanie cieczy. Weźmy duży zbiornik częściowo wypełniony cieczą pozostającą w równowadze oraz parą w pewnej temperaturze
42-1. PAROWANIE 249 Przyjmiemy, że cząsteczki pary są w dużych odległościach wzajemnych, natomiast w cieczy cząsteczki są bardzo ciasno upakowane. Chcemy określić, ile cząsteczek znajduje się w fazie lotnej w porównaniu z cząsteczkami zawartymi w cieczy. Jaka jest gęstość pary w danej temperaturze i w jaki sposób zależy ona od temperatury? Powiedzmy, że « oznacza liczbę cząsteczek w jednostce objętości pary. Liczba ta zmienia się oczywiście wraz z temperaturą. Przy ogrzewaniu parowanie jest szybsze. Weźmy też wielkość \IVa, która równa się liczbie atomów w jednostce objętości cieczy. Przyjmujemy, że każda cząsteczka cieczy zajmuje pewną objętość, a zatem większa liczba cząsteczek zajmuje większą objętość. Jeżeli więc Va jest objętością zajmowaną przez jedną cząsteczkę, to liczba cząsteczek w jednostkowej objętości cieczy równa się jednostkowej objętości podzielonej przez objętość każdej cząsteczki Następnie przyjmiemy, że między cząsteczkami występuje siła przyciągania, która utrzymuje je wewnątrz cieczy, gdyż w przeciwnym razie nie moglibyśmy zrozumieć zjawiska skraplania pary. Zakładamy więc istnienie tej siły oraz energii wiązania cząsteczek w cieczy, którą tracą przechodząc do pary. Chcemy tym samym przyjąć, że do wyparowania jednej cząsteczki potrzebna jest praca W. Istnieje pewna różnica, W. między energią cząsteczki w cieczy i jej energią w parze, ponieważ musimy cząsteczkę wydobyć spomiędzy innych cząsteczek, które ją przyciągają. Następnie skorzystamy z ogólnej zasady, że stosunek liczb atomów w jednostce objętości w dwóch różnych miejscach równa się n2ln,=exp[—(E2—El)/kT], czyli n (liczba cząsteczek w jednostce objętości pary) podzielone przez 1 'VB (liczbę cząsteczek w jednostce objętości cieczy) równa się nVe = c~w,'kT, (42.1) gdyż wynika to z ogólnej reguły. Podobną sytuację spotkaliśmy w atmosferze będącej w równowadze w polu grawitacyjnym, kiedy to gaz u dołu był gęstszy niż u góry na skutek konieczności wykonania pracy mgh potrzebnej do przeniesienia cząsteczek na wysokość h. Gęstość w cieczy jest większa niż w parze, gdyż chcąc wydobyć cząsteczkę z cieczy musimy pokonać „wzgórze" energii o wysokości W. Stosunek tych gęstości równa się e~wlkT. O to właśnie nam chodziło - o to tylko, że gęstość pary zmienia się jak e do minus pewnej energii podzielonej przez kT. Czynniki stojące przed e nie są dla nas ważne, ponieważ w większości przypadków gęstość pary jest znacznie mniejsza niż gęstość cieczy. W przypadkach, kiedy jesteśmy daleko od punktu krytycznego, w którym obie gęstości są prawie równe, gęstość pary jest dlatego znacznie mniejsza od gęstości cieczy, tzn. liczba n jest znacznie mniejsza od \jVa, że energia W jest znacznie większa od kT. Zatem wzory takie jak (42.1) są interesujące tylko wtedy, gdy W jest znacznie większe od kT. W przypadkach tych bowiem e jest podniesione do bardzo dużej ujemnej potęgi i jeżeli choć trochę zmienimy T, ten olbrzymi wykładnik też się zmieni, a ta zmiana wykładnika niesłychanie Przewyższa swym wpływem każdą zmianę, która mogłaby wystąpić w czynnikach stoją- cych przed e. Czy mogłyby w ogóle występować zmiany w takich czynnikach jak Va1 Naturalnie, chociażby dlatego, że nasza analiza była przybliżona. Przede wszystkim nie •stnieje właściwie określona objętość dla każdej cząsteczki; ze zmianą temperatury objętość Ki nie pozostaje stała — ciecz rozszerza się. Występują jeszcze inne drobne podobne Osobliwości i dlatego rzeczywista sytuacja jest bardziej skomplikowana. Wszędzie znajduje-
250 42. ZASTOSOWANIA TEORII KINETYCZNEJ my współczynniki wołnozmienne z temperaturą. Moglibyśmy na przykład twierdzić, ie samo W także zmienia się wraz z temperaturą, ponieważ w wyższej temperaturze przy zmienionej objętości cząsteczkowej zmienia się uśrednione przyciąganie itd. Dlatego moglibyśmy myśleć, że wzór nasz jest bez wartości, skoro wszystko w nim jest w nieokreślony sposób uzależnione od temperatury. Jednakże jeżeli uprzytomnimy sobie, że wykładnik W\kT jest na ogół bardzo duży, zobaczymy, że największe zmiany krzywej gęstości pary jako funkcji temperatury pochodzą właśnie od niego. Stwierdzimy także, że traktując W jako stałą \\\Va jako prawie stałą otrzymamy dobre przybliżenie dla niedużych przedziałów krzywej. Inaczej mówiąc, istotne zmiany są opisywane przez funkcję e~wlkT. Okazuje się, że istnieje bardzo wiele zjawisk w przyrodzie, które przebiegają przy energii pobieranej z zewnątrz. Ich istotna zależność od temperatury jest postaci e do potęgi minus energia podzielona przez kT. Własność ta jest pożyteczna tylko wtedy, gdy występuje duża energia w porównaniu z kT, tzn. wtedy, gdy zmiana spowodowana przez zmianę temperatury za pośrednictwem wyrazu kT jest w sposób istotny większa od zmiany spowodowanej w stałej lub w innych współczynnikach. Z kolei zajmiemy się innym sposobem otrzymania podobnego opisu parowania, traktując go tym razem bardziej szczegółowo. Do otrzymania wzoru (42.1) skorzystaliśmy po prostu z reguły słusznej w stanie równowagi, ale nic nie przeszkadza, aby w celu lepszego zrozumienia zająć się dokładniej zachodzącym tu procesem. Przebieg parowania możemy również opisać następująco: cząsteczki pary nieustannie bombardują powierzchnię cieczy; przy zderzeniach z nią mogą albo odskoczyć, albo ugrzęznąć. Nie wiemy, jaki stosunek określa te możliwości może 50 do 50 a może 10 do 90. Powiedzmy, że wszystkie cząsteczki grzęzną — później zbadamy to jeszcze raz przy założeniu, że tak nie jest. Wówczas w każdej chwili pewna liczba atomów biorących udział w procesie skraplania przejdzie przez powierzchnię cieczy. Liczba cząsteczek biorących udział w procesie skraplania, a ściślej — liczba tych, które wejdą do cieczy przez jednostkę powierzchni, jest równa liczbie n cząsteczek w jednostkowej objętości razy prędkość i>. Prędkość cząsteczek jest uzależniona od temperatury, wiemy bowiem, że \mv2 równa się średnio biorąe \kT. Prędkość v jest więc pewnego rodzaju prędkością średnią. Powinniśmy oczywiście wykonać jeszcze całkowanie po kątach i uśrednić, ale wynik z grubsza biorąc jest proporcjonalny do pierwiastka ze średniej kwadratowej prędkości z dokładnością do współczynnika. W ten sposób N3 = nv (42.2) jest liczbą cząsteczek, które dobiegają do jednostki powierzchni cieczy i biorą udział w procesie skraplania. Ale atomy cieczy także się poruszają i od czasu do czasu niektóre z nich wydostają si? na zewnątrz. Chcemy obliczyć, jak często się to zdarza. Kierować będziemy się tym, ze w stanie równowagi liczba cząsteczek, które wydostają się w ciągu 1 s jest równa liczbie cząsteczek, które w tym samym czasie powracają do cieczy. Ile cząsteczek wydostaje się z cieczy? Aby wyskoczyć, cząsteczka musi przypadków0 uzyskać nadwyżkę energii w porównaniu z energiami swych sąsiadek — dużą nadwyzKv energii, ponieważ jest silnie przyciągana przez inne cząsteczki cieczy Zwykle cząsteczK nie opuszcza cieczy, gdyż jest z nią silnie związana, ale niekiedy na skutek zderzeń przyPa
42-1. PAROWANIE 251 kowo zyskuje dodatkową energię. Jednak prawdopodobieństwo uzyskania tej dodatkowej energii W, niezbędnej do opuszczania cieczy przez cząsteczkę, jest znikome w przypadkach, gdy WpkT. Właśnie wyraz e_H7*T jest proporcjonalny do prawdopodobieństwa, że atom uzyska nadwyżkę energii większą od W. Jest to ogólna zasada teorii kinetycznej: szanse uzyskania przez cząsteczkę nadwyżki energii W ponad średnią są określone przez e podniesione do potęgi minus nadmiar energii podzielony przez kT. Załóżmy, że niektóre cząsteczki uzyskały tę energię. Musimy teraz ocenić, ile cząsteczek opuszcza powierzchnię w ciągu 1 s. Oczywiście, cząsteczka, która ma już tę niezbędną energię, nie musi od razu wyparować, ponieważ może ona tkwić zbyt głęboko albo, jeżeli nawet jest blisko powierzchni, poruszać się w niewłaściwym kierunku. Liczbę cząsteczek, które opuszczą jednostkową powierzchnię cieczy w ciągu I s, możemy w przybliżeniu określić w następujący sposób. Jest to liczba atomów tkwiących blisko powierzchni, obliczona dla jednostkowej powierzchni, podzielona przez czas potrzebny do ucieczki z cieczy i pomnożona przez prawdopodobieństwo e-fK/*r zdolności do ucieczki, a więc posiadania dostatecznej energii. Załóżmy, że każda cząsteczka przy powierzchni cieczy zajmuje pewien obszar tej powierzchni równy polu jej przekroju poprzecznego A. Wtedy liczba cząsteczek na jednostkową powierzchnię cieczy równa się 1 I A. Zastanówmy się teraz: ile czasu potrzebuje cząsteczka do wydostania się z cieczy? Jeżeli cząsteczki mają pewną średnią szybkość v i muszą pokonać na przykład odległość równą średnicy cząsteczki D, to znaczy grubość pierwszej warstwy cieczy, wtedy czas użyty na przebycie tej odległości jest czasem ucieczki, oczywiście dla cząsteczek mających dostateczną energię. Ten czas równa się D/v. W takim razie liczba parujących cząsteczek będzie równa w przybliżeniu N„=(llA)(vlD)e~WlkT ■ (42.3) Z kolei powierzchnia zajmowana przez każdy atom pomnożona przez grubość warstwy równa się w przybliżeniu objętości Va zajmowanej przez jeden atom. Ponieważ w równowadze musimy mieć Np = Ns, więc nv=(vlVe)e~wlkT. (42.4) Możemy uprościć prędkości v po obu stronach, ponieważ są one równe; mimo że jedna z nich jest prędkością cząsteczki pary, a druga prędkością cząsteczki wyparowującej, są one równe, gdyż ich średnia energia kinetyczna (przypadająca na jeden kierunek) równa się JAT. Można by się z tym nie zgodzić: „Nie! Nie! Wyparowują cząsteczki wyjątkowo szybkie, które uzyskały nadwyżkę energii". Niezupełnie, ponieważ w chwili rozpoczęcia ucieczki z cieczy straciły one ten nadmiar energii na korzyść energii potencjalnej. Zatem gdy osiągnęły powierzchnię, zwolniły i mają prędkość vi Mamy tu podobną sytuację jak w rozkładzie prędkości cząsteczek w atmosferze — na dole cząsteczki mają pewien rozkład eQergii. W wyższych warstwach rozkład energii jest taki sam, ponieważ powolne cząsteczki n,e mogą się tam dostać, a szybkie zmniejszyły swą prędkość. Tak wiec cząsteczki na po- W|erzchni, biorące udział w parowaniu, mają taki sam rozkład energii, jaki mają cząsteczki Wewnątrz cieczy. Jest to rzecz godna uwagi. W każdym razie nie ma sensu zbyt ściśle yskutować nasz wzór ze względu na inne popełnione nieścisłości, jak na przykład większ© Prawdopodobieństwo odbicia cząsteczki niż przejścia do cieczy, itd. Otrzymaliśmy zatem
. ii kii M;\ iviv oiini* rbko parowania i skiaplania i widzimy, że gęstość pai tak jak poprzedni tym że teraz zrozumieliśmy to dokładni tylk podstawie d'^sjc dowolnego wzoru. 'iłyh' 'umienie pozwala nam zbadać niektóre zjawiska. Załóżmy na przykł in> [ LaKd s tokoNUd, z jaka powstaje ta więc niamj bardzo wyda> mp paruje powoli) Zapytajmy jak szybko następuje parowanie, jeżeli utrzymu tuhpei iturecieczv 77 Zało/my ponadto, że zmierzylismyjużdoświadczalnie gęste ary adze, tak że wiemy, ile w danej temperaturze znajduje się cząsteczek dn ^stki 'ih|eto pary będącej w równowadze z cieczą. Chcielibyśmy teraz wiedzu k c/ będzie parowała Mimo że nasza analiza w części dotyczącej parowar yła «lk przybliżona, liczbę cząsteczek docierających do cieczy określiliśmy niezłe atkiem nieznanego współczynnika odbicia. A więc możemy skorzystać z faki • w n 'wadze liczba cząsteczek opuszczających ciecz i powracających do niej jest dnakc To prawda, że parę usuwamy i cząsteczki tylko parują, ale gdybyśmy zostawih arę w sp >k ju, to osiągnęłaby ona gęstość, przy której liczba cząsteczek wracając yłaby sama jak liczba cząsteczek parujących Dlatego od razu spostrzegamy, liczba cz"ste>_zek parujących z powierzchni cieczy w ciągu sekundy równa się iloczynowi eznaneco współczynnika odbicia R i liczby cząsteczek, które w ciągu sekundy wracałyby na powierzchnię cieczy, gdyby była nad nią para Ta równość zachodzi, ponieważ właśnie aka liczba cząsteczek równoważyłaby parowanie w stanie równowagi: Np = nvR=(vR'Va)t~wlkT (42 51 iczywiacie, łatwo obliczyć liczbę cząsteczek, które uderzają w ciecz od strony pary, ponie- - aż nie musimy tyle wiedzieć o siłach, co w przypadku, gdy interesuje nas ucieczka cząsli- ■ ki przez powierzchnię cieczy, pierwszy sposób jest znacznie łatwiejszy 42-2. Termoemisja 'ni m\ pc inn pr/vkł id powszechnie znanego zjawiska podobnego do par >*a nie warto osobno nim się zajmować Jest to w istoci- ;n W mpic znajduic >ię ziodło elektronów, ogrzane włókii idłaui elektroda przyciągająca elektrony Każdy elekt""1*1 lmu natvehrma prz\ciącan\ przez elektrody T' In mp kt< ra nn« >dpompo\Min lektrony C trzsmac k lłka ilframu oraz jak ich (42.51 ponieważ okazui lub ltomy nutalu W przybić i el >trzebn ilu VV1 iwie z przekra^z
42-2 TLRMObMlSJA 253 (np. bateryjkę kieszonkową), które powstaje w wyniku reakcji chemicznej, wynosi około I V. Jak obliczyć, ile elektronów wylatuje w ciągu 1 s? Byłoby trudno prześledzić wszystko, co wywiera wpływ na wylatujące elektrony; lepiej postąpić inaczej. Przede wszystkim wyobraźmy sobie, że nie odciągamy elektronów, które tworzą jak gdyby gaz otaczający metal i mogą do niego powracać. Wtedy otrzymamy w równowadze pewną gęstość elektronów, określoną przez ten sam wzór (42.1), gdzie Va oznacza objętość przypadającą w przybliżeniu na jeden elektron w metalu, a W równa się qtip, gdzie ip jest tzw. potencjałem wyjścia, tzn. potencjałem potrzebnym do wyciągnięcia elektronu nad powierzchnię. Wzór ten określi nam, ile elektronów powinno otaczać metal i bombardować go, aby zrównoważyć wylatujące elektrony. W ten sposób możemy łatwo obliczyć, ile elektronów wybiega, jeżeli stale wszystkie je usuwamy, ponieważ liczba elektronów wybiegających jest dokładnie równa liczbie elektronów uderzających o metal przy podanej poprzednio gęstości „pary" elektronowej. Na nasze pytanie możemy więc odpowiedzieć, że prąd elektryczny płynący do metalu na jednostkę powierzchni równa się iloczynowi ładunku każdego elektronu oraz liczby elektronów, które docierają do jednostkowej powierzchni metalu w ciągu 1 s. A to równa się liczbie elektronów w jednostce objętości pomnożonej przez prędkość, czyli, co pisaliśmy już wiele razy: l = qenv = (qevlVa)exp(-qe(pjkT). (42.6) I eV odpowiada wyrażeniu kT obliczonemu dla temperatury 11600°. Włókno lampy radiowej ma temperaturę powiedzmy 1100°, a zatem czynnik wykładniczy równa się e-10. Gdy zmienimy temperaturę, czynnik wykładniczy znacznie się zmieni. A zatem istotnym wyrazem we wzorze (42.6) jest znów czynnik exp(-qetplkT). Właściwie czynnik stojący przed funkcją wykładniczą jest zupełnie błędny okazuje się, że to mechanika kwantowa, a nie teoria klasyczna pozwala poprawnie opisać zachowanie się elektronów w metalu, lecz zmienia to niewiele nasz współczynnik. Właściwie nikt nie był w stanie obliczyć go dobrze, chociaż wielokrotnie stosowano do tych obliczeń zaawansowaną mechanikę kwantową. Główny problem stanowi to, czy W zmienia się choćby powoli wraz z temperaturą. Jeżeli tak to nie można odróżnić powolnej zmiany W wraz z temperaturą od zmiany współczynnika stojącego przed e, to znaczy, że jeżeli na przykład W zmienia się liniowo wraz z temperaturą, tak że W=W0 + ikT, wówczas mielibyśmy e\p( W kD = exp[-(W()+xkT)/kT] = exp(-a)exp(-W0lkT). A zatem liniowj /miana W wraz z temperaturą jest równoważna zmienionej „stałej" Jest to rzeczywiście bardzo trudne zagadnienie i próby otrzymania dokładnej wartości tego współczynnika -.4 zwykle bezowocne. 42-3. Jonizacja termiczna Przechodzi im teraz do innego przykładu ilustrującego tę samą ideę; ciągle tę samą. ' ym razem iest u- jonizacja Załóżmy, że w gazie znajduje się bardzo dużo atomów nie zjoni- Zovvanych ' u ra~ w ;; można ie zjoniznwać Chcielibyśmy wiedzieć, ile jonów
254 42. ZASTOSOWANIA TEORII KINETYCZNEJ istnieje w danych warunkach przy danej gęstości atomów i w danej temperaturze. Znów weźmiemy zbiornik zawierający N atomów mających swoje elektrony. (Jeżeli atom straci elektron, nazwiemy go jonem.) Załóżmy, że w danym momencie w jednostce objętości znajduje się na atomów nienaładowanych, ni — jonów i nt — elektronów. Chcemy znać zależność między tymi trzema liczbami. Przede wszystkim mamy dwa warunki, dwie zależności spełniane przez te liczby. Gdy na przykład zmieniamy warunki, powiedzmy temperaturę, to na + nj powinno się nie zmieniać, ponieważ suma ta równa się liczbie Njąder atomowych znajdujących się w zbiorniku. Gdy gęstość jąder jest ustalona i zmieniamy na przykład temperaturę, wówczas na skutek jonizacji niektóre atomy staną się jonami, ale całkowita liczba jonów plus liczba atomów nie powinna się zmienić; tzn. nj+na = N. Jest jeszcze inny warunek, mianowicie taki, że jeżeli gaz jest nienaładowany (i jeżeli pomijamy podwójną oraz potrójną jonizację), to przez cały czas gęstość jonów równa się gęstości elektronów, czyli nt=ne. Są to warunki dodatkowe, które wyrażają po prostu zasadę zachowania ładunku i liczby atomów. Te zależności są prawdziwe i w końcu z nich skorzystamy, gdy zajmiemy się rozwiązaniem rzeczywistego problemu. Chcemy jednak znaleźć jeszcze inną zależność między tymi wielkościami. Zrobimy to jak następuje. Znów skorzystamy z faktu, że potrzebna jest pewna energia do oddzielenia elektronu od atomu. Energię tę nazwiemy energią jonizacji i oznaczymy ją przez W, aby wszystkie wzory wyglądały tak samo. A więc W jest energią potrzebną do wyciągnięcia elektronu z atomu i wytworzenia jonu. Następnie znów powiemy. że liczba swobodnych elektronów w jednostce objętości „pary" równa się gęstości elektronów związanych w atomach razy e do minus różnica energii elektronu swobodnego i związanego, podzielona przez kT. To jest znowu podstawowe równanie. Jak je zapisać? Oczywiście, gęstość swobodnych elektronów równa się n„ ponieważ taka właśnie jest definicja ne. Ale co poczniemy z liczbą elektronów związanych w atomach przypadających na jednostkową objętość? Pełna liczba miejsc, w których możemy umieścić elektrony, równa się na pozór na + nj. Załóżmy, że każdy ze związanych elektronów zajmuje pewną objętość Va. Zatem całkowita objętość dostępna dla elektronów, które byłyby związane, równa się ina + nt)Va. Moglibyśmy więc zażądać, by nasz wzór miał postać: n n" e~wikT ' (nc + nj)Va Jednak wzór ten jest nieprawdziwy, gdyż nie uwzględniliśmy bardzo istotnego faktu: gdy jeden elektron jest już w atomie, żaden inny nie może skorzystać z tej objętości! Inaczej mówiąc, objętości wszystkich możliwych miejsc w rzeczywistości nie są dostępne dla elektronu, który zastanawia się, czy zostać w parze, czy też przejść do atomu, ponieważ istnieje tu dodatkowa właściwość, że gdy elektron zbliża się do miejsca już zajętego przez inny elektron, to zostaje odepchnięty. Z tego właśnie powodu powinniśmy obliczyć tę część objętości, która jest dostępna dla elektronu. To znaczy, że miejsc już zajętych przez elektrony powinniśmy nie liczyć w całkowitej dostępnej objętości. Liczy się tylko objętość związaną z jonami, gdzie istnieją puste miejsca, które mogą być zajęte przez elektrony. Wobec tego dochodzimy do wniosku, że lepszy sposób zapisania naszego wzoru jest następujący:
42-3 JONIZACJA TERMICZNA 255 n_,«,= 1 e.wlkr Wzór ten nazywamy równaniem jonizacji Sahy. Przekonamy się teraz, czy rozpatrując kinetykę zachodzących zjawisk możemy jakościowo zrozumieć, dlaczego jest on prawdziwy. Przede wszystkim od czasu do czasu elektrony spotykają się z jonami i tworzą razem atomy. Jednocześnie co pewien czas atomy zderzają się i rozpadają na elektrony i jony. Te dwa zjawiska muszą zachodzić z taką samą szybkością. Jak często elektrony spotykają się z jonami? Na pewno tym częściej, im większa jest gęstość elektronów oraz im większa jest gęstość jonów. To znaczy, że szybkość rekombinacji musi być proporcjonalna do iloczynu liczby elektronów i liczby jonów. Jednocześnie szybkość jonizacji spowodowanej zderzeniami atomów musi zależeć liniowo od liczby atomów, które mają być zjonizowane. Oba zjawiska będą w równowadze, jeżeli będzie istniała odpowiednia zależność między iloczynem ntns i liczbą atomów nn. Tę zależność podaje nasz wzór, w którym W7jest energią jonizacji. Dostarcza on nam wprawdzie więcej informacji, ale moglibyśmy od razu przewidzieć, że zależność, o którą nam chodzi, powinna zawierać gęstości elektronów, jonów i atomów w postaci ilorazu «,«,/«„, aby dać wielkość stałą, niezależną od poszczególnych liczb w, a zależną od temperatury, atomowych przekrojów czynnych oraz od innych stałych współczynników. Ponieważ w równaniu występują liczby odnoszące się do jednostkowej objętości, możemy również stwierdzić, że gdybyśmy przeprowadzili dwa doświadczenia z tą samą liczbą N atomów i jonów, tzn. z tą samą liczbą jąder atomowych, ale z dwoma zbiornikami o różnych objętościach, to powinniśmy otrzymać w większym zbiorniku liczby n mniejsze. Ponieważ jednak stosunek ntns\na pozostaje ten sam, całkowita liczba elektronów i jonów musi być większa w większym zbiorniku. Aby się o tym przekonać, załóżmy, że w zbiorniku o objętości V zawartych jest N jąder, których pewna część, dana ułamkiem /", jest zjonizowana. Wtedy ne=fN/V=nj oraz «„ = (! —f)N/v. Nasz wzór zapiszemy zatem następująco: f2 N e """" - = (42.8) \-fV V. Inaczej mówiąc, im bardziej będziemy zmniejszać gęstości atomów lub zwiększać objętość zbiornika, tym otrzymamy większy ułamek /^elektronów i jonów. Ta jonizacja wynikająca ' „ekspansji" przy zmniejszaniu się gęstości uzasadnia nasze przekonanie, że przy bardzo małych gęstościach, jakie panują w zimnej przestrzeni międzygwiezdnej, mogą istnieć jony, choćby nam to było trudno zrozumieć ze względu na wielkość występującej tam energii. Chociaż do jonizacji niezbędna jest bardzo duża wielokrotność kT, to jednak jony tam istnieją. Dlaczego jony mogą istnieć w takiej bezdennej pustce oraz dlaczego ich liczba maleje ze wzrostem gęstości? Aby na to odpowiedzieć, przypatrzmy się atomowi. Od czasu do czasu promieniowanie, inny atom, jon lub cokolwiek, co pozostaje w równowadze cieplnej z atomem, zderza się z nim. Bardzo rzadko, ze względu na olbrzymią nadwyżkę energii, jakiej to wymaga, jakiś elektron wyskakuje i pozostawia jon. Skoro dzieje się to w olbrzymiej pustej przestrzeni, elektron wędruje nieraz latami i niczego nie napotyka
256 42. ZASTOSOWANIA TEORII KINETYCZNEJ Ale w końcu, po bardzo długim czasie, wraca jednak do jonu i łączy się z nim w atom. Widzimy więc, że elektrony są bardzo rzadko wybijane z atomów. Jeżeli jednak przestrzeń jest bardzo duża, elektron, który uciekł z atomu, tak długo szuka jonu, żeby się z nim połączyć, że prawdopodobieństwo rekombinacji jest znikomo małe. Zatem, mimo że wymaga to dużej nadwyżki energii, znajduje się tam dostrzegalna liczba elektronów. 42-4. Kinetyka reakcji chemicznych Z takim samym zagadnieniem, jakie określiliśmy mianem „jonizacji", spotykamy się w reakcjach chemicznych. Jeżeli na przykład obiekty A i B tworzą związek AB, to po chwili namysłu możemy stwierdzić, że AB jest odpowiednikiem atomu, B — elektronu, a A — jonu. Po tym podstawieniu otrzymamy równanie równowagi dokładnie w tej samej postaci: "^=ce-^r (42.9) "ab Ten wzór nie jest oczywiście ścisły, ponieważ „stała" c zależy od tego, jaka objętość jest dozwolona dla zajścia reakcji A z B, itd., jednak na podstawie rozważań termodynamicznych można stwierdzić, co oznacza wielkość W w wykładniku. Okazuje się, że wielkość W jest ściśle związana z energią potrzebną do zajścia reakcji. Spróbujmy potraktować ten wzór jako wynik zderzeń. Będziemy postępowali podobnie, jak w przypadku wzoru na parowanie, przy którego otrzymaniu ocenialiśmy, ile elektronów ubywa, a ile wraca w jednostce czasu. Załóżmy, że obiekty A i B zderzając się od czasu do czasu tworzą związek AB. AB byłaby więc złożoną cząsteczką, która wykonując ruchy nieregularne zderza się z innymi cząsteczkami, dzięki czemu, od czasu do czasu, uzyskuje energię dostateczną do rozpadnięcia się znów na obiekty A i B. W rzeczywistości okazuje się, że jeżeli podczas reakcji chemicznej atomy zetkną się mając zbyt małą energię, choćby nawet ta energia pochodziła z reakcji A + B-*AB, to z samego faktu zetknięcia atomów jeszcze nie wynika, że reakcja musi się rozpocząć. Zwykle zderzenie musi być bardzo mocne, aby reakcja mogła zajść; „miękkie" zderzenie między obiektami A i B może być niewystarczające, nawet gdyby wydzieliła się w nim energia. Przyjmijmy więc, że w reakcjach chemicznych do utworzenia związku AB z A i B nie wystarcza zwykle samo tylko zderzenie — musi nastąpić zderzenie z wystarczającą energią- Tę energię nazywa się energią aktywacji; jest to energia niezbędna do wywołania reakcji. Oznaczmy energię aktywacji, tzn. nadwyżkę energii niezbędną do zajścia reakcji chemicznej przez A*. Wówczas wzór na szybkość R„ z jaką obiekty A i B tworzą związek AB, zawierałby iloczyn liczby atomów A, liczby atomów B i prędkości, z jaką pojedynczy atom uderza w pewne pole powierzchni przekroju poprzecznego, które nazywamy przekrojem czynnym aAB, oraz współczynnika e~A'lkT, który oznacza prawdopodobieństwo posiadania przez atomy dostatecznej energii: R, = nAnBvaABe-A'>kT. (42.10 Z kolei musimy obliczyć szybkość Rr, z jaką odbywa się rozpad związku AB. Istnieje
42-4- KINETYKA REAKCJI CHEMICZNYCH 257 pewne prawdopodobieństwo rozpadnięcia się AB. Do rozpadu związek AB musi mieć nie tylko energię W, niezbędną do tego, aby podział w ogóle nastąpił. Skoro bowiem trudno było zlepić obiekt A i B, musi istnieć coś w rodzaju wzgórza, na które obiekty A i B muszą się wspiąć, aby móc się rozłączyć. Muszą mieć nie tylko tyle energii, ile trzeba x na sam rozpad, ale także pewną jej nadwyżkę. ^ , ^.^ energetyczne w reakcjj Mamy tu do czynienia z czymś podobnym a + b~*ab do pokonywania grzbietu górskiego, aby dostać się do głębokiej doliny. Składniki A i B dążąc do połączenia się muszą się wspiąć na wzgórze i podobnie muszą wydostać się z doliny i znów wdrapać się na to wzgórze, aby się rozłączyć (rys. 42.1). Dlatego szybkość, z jaką związek AB rozpada się na składniki A i B, będzie proporcjonalna do liczby nAB istniejących cząsteczek AB, pomnożonej przez e~(w+A*)ikT: Rr = c'n,Be-(,r + /l,)/kr (42.11) Wielkość c' składa się z objętości atomów i z częstości zderzeń, którą możemy obliczyć jak przy parowaniu, mnoiąc powierzchnię, grubość warstwy i czas - ale nie będziemy tego robili. Interesuje nas tutaj tylko to, że stosunek równych szybkości rozpadu i rekombinacji równa się 1. Stąd zaś wnioskujemy, jak poprzednio, że nAnB\nAB = cc~Vfm", gdzie c zawiera przekroje czynne prędkości i inne współczynniki niezależne od n. Znamienne jest, że szybkość reakcji zależy także od wielkości e~cons"'lT, chociaż stała jest inna od tej, która rządzi gęstościami; energia aktywacji A* różni się zasadniczo od energii W. Energia W rządzi stosunkiem między ilościami A, Bi AB, które występują w równowadze. Jeżeli jednak chcemy wiedzieć, jak szybko ze składników A i B tworzy się związek AB, to nie mamy do czynienia z równowagą i dlatego inna energia, a mianowicie energia aktywacji, decyduje o szybkości reakcji występując w wykładniku potęgi. Ponadto wielkość A* nie jest stałą uniwersalną, taką jak W. Załóżmy, że na powierzchni ściany zbiornika lub w jakimś innym miejscu obiekty A i B zderzają się tak, że mogą łatwiej tworzyć związek. Znaczyłoby to, że znaleźliśmy „tunel" we wzgórzu albo nawet niższe wzgórze. Z zasady zachowania energii wiemy, że po zapoczątkowaniu reakcji A + B^AB wynik nie zależy od sposobu, w jaki reakcja przebiega. Tak więc różnica energii W będzie zupełnie niezależna od sposobu, w jaki reakcja zachodzi, ale energia aktywacji A* będzie bardzo od niego zależała. Dlatego właśnie szybkości reakcji chemicznych tak bardzo 'ależą od warunków zewnętrznych. Szybkość reakcji możemy zmienić zmieniając powierzchnię ścianek lub przeprowadzając reakcję w „innej beczce", jeżeli zależy ona od rodzaju powierzchni. Możemy też wprowadzić trzeci obiekt, który może bardzo istotnie zmienić szybkość reakcji. Niektóre ciała powodują olbrzymie zmiany szybkości, po prostu zmieniając nieco wielkość A*; c'ała te nazywamy katalizatorami. Praktycznie biorąc, reakcja może w ogóle nie zajść w danej temperaturze, ponieważ energia A* w tej temperaturze jest zbyt wielka, ale po
258 42. ZASTOSOWANIA TEORII K1NETYCZNFJ wprowadzeniu specjalnych substancji - katalizatorów reakcja przebiega bardzo szybko, ponieważ wartość A* maleje. Nawiasem mówiąc, przy takiej reakcji (A + B daje AB) występują pewne trudności, ponieważ gdy chcemy utworzyć z dwóch obiektów jeden, bardziej stabilny, nie możemy spełnić jednocześnie zasad zachowania energii i pędu. Dlatego potrzebny nam jest przynajmniej jeszcze jeden obiekt C, a więc prawdziwa reakcja jest znacznie bardziej skomplikowana. Wzór na szybkość tworzenia powinien więc zawierać iloczyn nAnBnc i wydawałoby się, że nasz wzór jest fałszywy, ale tak nie jest! Jeżeli zastanowimy się nad szybkością, z jaką obiekt A B się rozpada, zauważymy, że musi on także zderzyć się z obiektem C, a zatem mamy też iloczyn nABnc we wzorze na szybkość rozpadu. Liczba nc upraszcza się zatem we wzorze dla gęstości w stanie równowagi. Prawo równowagi (42.9), które wypisaliśmy poprzednio, jest absolutnie słuszne, niezależnie do mechanizmu reakcji! 42-5. Prawa promieniowania Einsteina Przechodzimy teraz do analogicznej interesującej sprawy dotyczącej prawa promieniowania ciała czarnego. W ostatnim rozdziale rozważaliśmy prawo rozkładu promieniowania w zbiorniku. Wyprowadziliśmy je, podobnie, jak zrobił to Planck, tzn. rozważając promieniowanie oscylatora. Oscylator musi mieć pewną energię średnią, a ponieważ drga, więc powinien promieniować i wysyłać energię do zbiornika, póki nie nagromadzi się tam jej tyle, że zajdzie równowaga między emisją i absorpcją promieniowania. Na podstawie tego obliczyliśmy, że natężenie promieniowania o częstości co wyraża się wzorem: hw3dw /M^ = -ww-T). (42.12) Wynik ten otrzymaliśmy przy założeniu, że promieniujący oscylator miał określone, równoodległe poziomy energetyczne. Nie mówiliśmy, że światło składa się z fotonów lub z czegoś podobnego. Nie zajmowaliśmy się tym, jak otrzymujemy energię świetlną w postaci jednostek energii hcu, gdy atom przechodzi z jednego poziomu energii na inny. Zgodnie z oryginalną ideą Plancka skwantowana była materia, a nie światło: materialne oscylatory nie mogły wziąć dowolnej energii, ale mogły ją pochłaniać w określonych porcjach. Nadal jednak istnieje pewna trudność związana z wyprowadzeniem, polegająca na tym, że było ono częściowo oparte na fizyce klasycznej. Ilość promieniowania emitowanego przez oscylator obliczyliśmy zgodnie z fizyką klasyczną, a potem przyjrzeliśmy się mu i stwierdziliśmy: „Nie, ten oscylator ma wiele poziomów energetycznych". 1 tak, w celu otrzymania prawdziwego wyniku opartego wyłącznie na mechanice kwantowej, rozwijano ją stopniowo, aż do pełnego jej rozkwitu w roku 1927. W tym czasie jednak Einstein spróbował zmienić punkt widzenia reprezentowany przez Plancka, że tylko oscylatory są skwantowane, i zaproponował, aby traktować światło jako rzeczywiste fotony, które można by uważać w pewnym stopniu za cząstki o energii Ino. Później Bohr wykazał, że każdy układ atomów ma poziomy energii, które nie muszą być jednak równoodległe, jak w oscylatorze Plancka. Dlatego zaszła konieczność ponownego wyprowadzenia, a przynajmniej
42-5. PRAWA PROMIENIOWANIA EINSTEINA 259 absorpcja' , a-~' - — - _____ emtsja spontaniczna - — emisja T T indukowana 'n 42.2. Przejścia między dwoma poziomami energetycznymi atomu przedyskutowania prawa promieniowania z punktu widzenia mechaniki kwantowej. Einstein przyjął, że końcowy wzór Plancka jest prawdziwy, i skorzystał z niego do otrzymania nowych informacji, poprzednio nieznanych, o oddziaływaniu promieniowania z materią. Jego rozumowanie przebiegało w następujący sposób. Weźmy dwa z wielu poziomów energetycznych atomu, powiedzmy poziomy m-ty oraz «-ty (rys. 42.2). Jeżeli światło o odpowiedniej częstości padnie na atom, to może on pochłonąć foton promieniowania i przejść ze stanu n do stanu m. Prawdopodobieństwo zajścia tej absorpcji w ciągu sekundy jest proporcjonalne do natężenia promieniowania padającego na atom i zależy oczywiście od tych dwóch poziomów. Oznaczmy stałą proporcjonalności przez Bmn, aby uprzytomnić sobie po prostu, że nie jest ona stałą uniwersalną przyrody, ale zależy od każdej pary poziomów; jedne poziomy łatwiej wzbudzić, inne trudniej. Jaki więc będzie wzór na szybkość emisji i przejścia ze stanu m do «? Einstein zaproponował, żeby wziąć tu pod uwagę dwie rzeczy. Przede wszystkim nawet w nieobecności światła atom w stanie wzbudzonym powinien mieć pewną możliwość przejścia do stanu niższego przez wysłanie fotonu: to zjawisko nazwiemy emisją spontaniczną. Nawet fizyka klasyczna przewidywała, że oscylator nie utrzymuje swego zasobu energii, lecz traci go przez promieniowanie. Odpowiednikiem zatem spontanicznej emisji w układzie klasycznym jest istnienie prawdopodobieństwa Amn przejścia atomu wzbudzonego ze stanu m do n, zależącego znowu od poziomów energii. Prawdopodobieństwo to nie zależy natomiast od tego, czy promieniowanie pada na atom, czy też nie. Einstein jednakże poszedł dalej i przez porównanie z teorią klasyczną, a także opierając się na innych argumentach wywnioskował, że emisja zależy od światła, które otacza atom: gdy mianowicie światło o odpowiedniej częstości padnie na atom, to prawdopodobieństwo emisji fotonu wzrośnie proporcjonalnie do natężenia światła i stałą proporcjonalności będzie Bmn. Gdyby udało nam się wykazać, że ten współczynnik równa się zeru, moglibyśmy pomyśleć, że Einstein się mylił. Zobaczymy jednak za chwilę, że miał on oczywiście rację. A więc Einstein założył, że są trzy rodzaje procesów: absorpcja proporcjonalna do natężenia światła, emisja także proporcjonalna do natężenia światła, nazywana emisją indukowaną lub czasami emisją wymuszoną, oraz emisja spontaniczna, niezależna od światła. Załóżmy teraz, że mamy w równowadze w temperaturze T pewną liczbę A', atomów w stanie n i inną liczbę Nm atomów w stanie m. Wówczas całkowita liczba atomów, które Przechodzą ze stanu n do m, równa się liczbie atomów w stanie n, pomnożonej przez Prawdopodobieństwo, że w ciągu sekundy atom przejdzie ze stanu n do m. Otrzymujemy Hięc następujący wzór na liczbę atomów przechodzących ze stanu n do m w ciągu sekundy: R = NnB„mlUo) (42.13)
260 42. ZASTOSOWANIA TEORII KINETYCZNEJ Liczbę atomów przechodzących ze stanu m do n wyrażamy w ten sam sposób jako liczbę Nm atomów w stanie m pomnożoną przez prawdopodobieństwo na sekundę, że każdy z nich przejdzie do stanu n. Tym razem mamy Rm-* = NJiAm. + BmmHt0)]. (42.14) Załóżmy następnie, że w równowadze termodynamicznej liczby atomów przechodzących na wyższy poziom i spadających na niższy muszą być takie same. Jest to w końcu jedna z możliwości zapewnienia stałej liczby atomów na każdym poziomie*'. Przyrównujemy te dwa prawdopodobieństwa w stanie równowagi. Ale przecież mamy jeszcze jedną informację: wiemy, jak duże są Nm w porównaniu z N„ - ich stosunek równa się exp [-(Em—En)jkT]. Einstein przyjął, że jedynym światłem, które jest w stanie spowodować przejście ze stanu n do m jest światło o częstości odpowiadającej różnicy energii, a więc E„—En=ha> we wszystkich naszych wzorach. Zatem Nm = Nne-^lkT. (42.15) Przyrównując oba prawdopodobieństwa N„BnmI(co) = Nm[Am„ + Bm„I(co)] i dzieląc przez N„ otrzymujemy Bm I (co) ev"r = Anm + Bm l (co) . (42.16) Z tego równania możemy obliczyć I(co): I(o>) ™ O*2*7) Ale Planck już nam powiedział, że słuszny musi być wzór (42.12). Dlatego możemy już coś wywnioskować. Przede wszystkim Bnm musi być równe B^, ponieważ inaczej nie otrzymalibyśmy wyrażenia (ew*T — 1). A więc Einstein-odkrył coś, czego nie umiał obliczyć: że prawdopodobieństwa emisji indukowanej i absorpcji muszą być równe. To bardzo interesujące. Oprócz tego, aby wzory (42.17) i (42.12) się zgadzały y<JB,,n musi równać się /ico3/7t2c2. (42.18) Jeżeli znamy, na przykład, prawdopodobieństwo absorpcji dla danego poziomu, możemy obliczyć prawdopodobieństwo emisji spontanicznej oraz prawdopodobieństwo emisji indukowanej lub dowolną ich kombinację. Tylko tyle Einstein lub ktokolwiek inny mógł otrzymać korzystając z takich założeń. Do obliczenia bezwzględnej wartości prawdopodobieństwa emisji spontanicznej lub innego prawdopodobieństwa jakiegoś określonego przejścia atomowego potrzebna była wiedza o mechanice atomu, nazwana kwantową elektrodynamiką, która została odkryta 11 lat później. Te obliczenia Einstein wykonał w roku 1916. Emisja indukowana znalazła dziś bardzo interesujące zastosowania. Obecność światła może wywołać przejścia na niższe poziomy energetyczne. Wówczas w wyniku tych przejść •' Nie jest to tylko jedna z możliwości gwarantująca stałą liczbę atomów na każdym poziomie energetycznym, lecz w taki właśnie sposób odbywa się to w przyrodzie. Zasada, że w równowadze termodynamicznej każdemu procesowi musi odpowiadać proces dokładnie odwrotny, nosi nazwę zasady równowagi szczegółowej.
42-5. PRAWA PROMIENIOWANIA EINSTEINA 261 dojdzie energia będąca wielokrotnością hw do istniejącej energii świetlnej pod warunkiem, że pewne atomy znajdowały się w wyższym stanie. Obecnie możemy za pomocą nietermicznych metod otrzymać gaz, w którym liczba atomów w stanie m jest znacznie większa niż w stanie n. Oczywiście, nie jest to stan równowagi, nie odnosi się więc do niego wzór t~tl"'lkT, mający zastosowanie tylko do stanu równowagi. Możemy nawet doprowadzić gaz do stanu, w którym liczba atomów w stanie wyższym jest bardzo duża, a w niższym praktycznie równa zeru. Wówczas światło o częstości odpowiadającej różnicy energii Em — E„ będzie słabo absorbowane, ponieważ jest niewiele atomów w nąć. Z drugiej strony istniejące światło będzie indukowało emisję z tego wyższego stanu! A zatem w przypadku dużej liczby atomów w stanie wzbudzonym otrzymujemy coś w rodzaju reakcji łańcuchowej, w której światło emitowane przez atomy momentalnie wywoła jednoczesną emisję z wielu atomów i wszystkie one przejdą razem na niższy poziom. Tak właśnie działa laser lub w przypadku dalekiej podczerwieni — maser. Atomy w stanie m można otrzymać na różne sposoby. Może się zdarzyć, że istnieją wyższe od nich poziomy, na które możemy przenieść atomy, jeżeli oświetlimy je silnym strumieniem światła o wysokiej częstości. Z tych wyższych poziomów atomy, emitując różne fotony, przechodzą niżej, aż utkną w stanie m. Jeżeli trwają w stanie m nie emitując fotonów, to stan taki nazywamy stanem metastabilnym. Następnie na skutek emisji indukowanej wszystkie atomy spadają niżej. Jest tu jeszcze jedna techniczna trudność. Jeżeli taki układ atomów umieścimy w zwykłym zbiorniku, to emituje on spontanicznie w różnych kierunkach, co osłabia emisję indukowaną. Możemy jednak wzmocnić efekt, zwiększyć wydajność, ustawiając prawie idealne zwierciadła przy każdej ściance zbiornika, tak że wyemitowane światło może odbijając się indukować wielokrotnie emisję. Chociaż zwierciadła te odbijają światło prawie w 100%, jednak zawsze trochę światła przepuszczą. W końcu, oczywiście, na skutek zasady zachowania energii całe światło wydostaje się na zewnątrz w ściśle określonym kierunku, dając bardzo silne strumienie świetlne, które otrzymujemy obecnie z laserów. niebi eski e ( —j—,—■ rn czerwone światło wysyłane przez laser ■ n 42.3. Wzbudzając za pomocą, powiedzmy, światła niebieskiego wyżsey stan A, z którego atomy przechodzą po wysłaniu fotonów do stanu m, możemy otrzymać tak dużo atomów w tym stanie m, że laser może zacząć działać stanie n, które mogłyby je pochło-
43 dyfuzja 43-1. Zderzenia między cząsteczkami Do tej pory zajmowaliśmy się ruchem cząsteczek gazu, który pozostawał w stanie równowagi cieplnej. Teraz chcemy zająć się zjawiskami przebiegającymi blisko stanu równowagi. W warunkach odległych od równowagi zjawiska są bardzo skomplikowane, ale łatwo można przewidzieć, co się stanie, gdy układ jest bardzo blisko stanu równowagi. W tym celu musimy jednak powrócić do teorii kinetycznej. Mechanika statystyczna i termodynamika pozwala nam badać jedynie stany równowagi, dlatego z dala od tych stanów musimy stosować inne metody i badać, co się dzieje, jeśli można tak się wyrazić, śledząc losy poszczególnych atomów. Jako prosty przykład warunków, w których nie ma równowagi, weźmiemy dyfuzję jonów w gazie. Załóżmy, że w gazie jest względnie małe stężenie jonów — elektrycznie naładowanych cząsteczek. Jeżeli gaz poddamy działaniu pola elektrycznego, na każdy jon będzie działać siła różna od sił działających na nienaładowane cząsteczki gazu. Gdyby nie było innych cząsteczek, każdy jon poruszałby się ze starym przyspieszeniem aż do chwili zderzenia się ze ścianą zbiornika. Tak jednak nie jest ze względu na obecność innych cząsteczek. Prędkość jonu wzrasta tylko do momentu zderzenia z inną cząsteczką, w wyniku czego jon traci swój pęd. Od nowa jednak nabiera prędkości, by znowu stracić w następnym zderzeniu. Wskutek tego jon porusza się bardzo dziwacznie, jednak jego wypadkowy ruch utrzymuje się w kierunku siły elektrycznej. Zobaczymy, że jon ma pewne średnie „przemieszczenie" Średnia szybkość jonu jest proporcjonalna do pola elektrycznego- im silniejsze pole, tym szybciej jon się porusza. Gdy działa przyłożone pole i pod jeg° wpływem jon się porusza, nie ma oczywiście równowagi termodynamicznej. Jon usiłuje >1 osiągnąć, czyli stara się osiąść na ściance zbiornika. Szybkość przesuwania się jonu możemy obliczyć na podstawie teorii kinetycznej.
43-1. ZDERZENIA MIĘDZY CZĄSTECZKAMI 263 Okazuje się, że przy pomocy naszych obecnych matematycznych umiejętności właściwie nie możemy dokładnie obliczyć, co się będzie działo, a możemy tylko uzyskać przybliżony wynik, który odzwierciedli wszystkie istotne właściwości zjawiska dyfuzji. Możemy przewidzieć zależność od ciśnienia, od temperatury itp., ale nie będziemy w stanie otrzymać poprawnych liczbowych współczynników we wszystkich wyrażeniach. Nie będziemy więc się martwić w tym wyprowadzeniu, by współczynniki liczbowe miały dokładne wartości. Można je otrzymać tylko za pomocą znacznie bardziej zaawansowanych metod matematycznych. Zanim przejdziemy do rozważania sytuacji, w której nie ma równowagi, musimy dokładniej poznać gaz w stanie równowagi cieplnej. Będziemy bowiem musieli na przykład znać średni czas, jaki upływa między kolejnymi zderzeniami cząsteczek. Każda cząsteczka doznaje kolejnych zderzeń z innymi — oczywiście zupełnie przypadkowo. Jakaś wybrana cząsteczka dozna w długim okresie czasu T pewnej liczby N zderzeń. Jeżeli wydłużymy dwukrotnie czas, liczba zderzeń też się dwukrotnie zwiększy. Liczba zderzeń jest zatem proporcjonalna do czasu T. Spróbujemy zapisać to w następujący sposób: N = T/t (43.1) Stałą proporcjonalności zapisaliśmy jako I/t, gdzie x ma wymiar czasu. Stała r jest średnim czasem między zderzeniami. Załóżmy na przykład, że w ciągu godziny zachodzi 60 zderzeń, wówczas t równa się 1 min. Powiemy wówczas, że t(1 min) jest średnim czasem między zderzeniami. Często chcielibyśmy znać odpowiedź na następujące pytanie: „Jakie jest prawdopodobieństwo doznania przez cząsteczkę zderzenia w właśnie nadchodzącym krótkim odstępie czasu dt?" Intuicyjnie możemy odpowiedzieć, że wynosi ono dtjz. Spróbujmy jednak przeprowadzić bardziej przekonywający dowód. Weźmy bardzo dużą liczbę cząsteczek N. Ile będzie zderzeń w dowolnym odstępie czasu dt? W stanie równowagi nic średnio biorąc nie zmienia się w czasie. A więc N cząsteczek dozna w czasie dt tyle samo zderzeń, co jedna cząsteczka w czasie N dt. Wiemy, że liczba zderzeń w tym czasie równa się N dt/r. Liczba zderzeń A' cząsteczek w czasie dt równa się więc N dtjr, a prawdopodobieństwo zderzenia dla dowolnej jednej cząsteczki jest \/N razy mniejsze, czyli równa się (\/N)x x(Ndtlx) = dtjz, tak jak przewidywaliśmy na początku. Widzimy więc, że ułamek cząsteczek, które zderzą się w czasie dt równa się dt/r. Jeżeli na przykład t równa się 1 min, to w ciągu 1 s dozna zderzeń ~ wszystkich cząsteczek. Oznacza to oczywiście, że ta ^ ogólnej liczby cząsteczek jest dostatecznie blisko tych, z którymi mają nastąpić zderzenia, oraz ze te zderzenia dokonują się w następnej minucie. Mówiąc, że r, średni czas między zderzeniami, wynosi 1 min, nie twierdzimy, że wszystkie zderzenia zajdą w jednominutowych odstępach czasu. Nie oznacza to bowiem, że każda cząsteczka po odczekaniu 1 min doznaje zderzenia. Odstępy czasu między kolejnymi zderzeniami są bardzo nieregularne. Oderwiemy się teraz na chwilę od głównego tematu naszego wykładu i chociaż nie będzie nam to później potrzebne, zastanowimy się nad odpowiedzią na pytanie: „Jak długie są właściwie odstępy między zderzeniami?" Wiemy, że dla rozpatrywanego przez nas przykładu średni czas wynosi 1 min, ale chcieli-
264 43. DYFUZJA byśmy wiedzieć na przykład, jakie jest prawdopodobieństwo, że nie będzie zderzeń w ciągu dwóch minut. Podamy tu właściwie odpowiedź na ogólniejsze pytanie: „Jakie jest prawdopodobieństwo, że cząsteczka przetrwa czas t bez zderzeń?" W dowolnej chwili, nazwijmy ją / = 0. rozpoczniemy obserwację wybranej cząsteczki. Jakie jest prawdopodobieństwo, że upłynie czas t, zanim się ona zderzy z inną cząsteczką? Aby obliczyć to prawdopodobieństwo, zastanówmy się, co się dzieje ze wszystkimi jV0 cząsteczkami w zbiorniku. Jeżeli odczekaliśmy czas t, niektóre z nich się zderzą. Oznaczmy przez N(t) liczbę cząsteczek, które nie doznały zderzeń do chwili /. Oczywiście N(t) jest mniejsze od N0. Możemy znaleźć N(t), ponieważ wiemy, jak zmienia się ono w czasie. Jeżeli bowiem wiemy, że N(t) cząsteczek przetrwało bez zderzeń do chwili t, to N(t+dt), tzn. liczba cząsteczek, które przetrwały bez zderzeń do chwili t+dt, jest mniejsza od N(t) o liczbę cząsteczek, które doznały zderzeń w czasie dt. Liczbę cząsteczek, które zderzyły się w ciągu czasu dt, zapisaliśmy już przy pomocy średniego czasu x jako dN=N(t)dt/x. Otrzymujemy równanie: dt N(t + dt) = N(t)-N(t)—. (43.2) T Wyrażenie z lewej strony, N(t +dt), można zapisać zgodnie z rachunkiem różniczkowym jako N(t) + (dN/dt)dt. Podstawiając to do równania (43.2) otrzymujemy: dN(t) N(t) ~ = (43.3) dt r Liczba cząsteczek ubywających w odstępie rf/jest proporcjonalna do liczby istniejących cząsteczek i odwrotnie proporcjonalna do średniego czasu r. Równanie (43.3) łatwo można scałkować, jeżeli przepiszemy je w postaci dN(f) dt (43.4) N(t) r Każda strona równania jest tu różniczką zupełną, a więc mamy całkę: lnW(f)=-//T + stała, (43.5) lub — co na to samo wychodzi — JV(/)=conste",/'. (43.6) Wiemy, że ta stała musi się równać N0 — całkowitej liczbie istniejących cząsteczek, ponieważ one wszystkie — począwszy od t=0 — czekały na swoje „następne" zderzenie. Nasz wynik możemy zapisać w postaci N(t)=N0e-"\ (43.7) Stąd możemy otrzymać prawdopodobieństwo P(t), że zderzenie nie zajdzie, dzieląc N(t) przez N0, a wiec P(0=e_,/I. (43.8)
43-1. ZDERZENIA MIĘDZY CZĄSTECZKAMI 265 Znaczy to, że cząsteczka może bez zderzeń przetrwać czas / z prawdopodobieństwem e-,/T, gdzie r jest średnim czasem między zderzeniami. Prawdopodobieństwo to w chwili i=0 równa się jedności (czyli cząsteczka w chwili 7=0 z pewnością się nie zderzy) i ze wzrostem t maleje. Prawdopodobieństwo, że cząsteczka uniknie zderzenia w czasie r wynosi e_,=0,37 Prawdopodobieństwo, że czas między zderzeniami będzie dłuższy od średniego czasu między zderzeniami jest więc mniejsze od £. Nie ma w tym żadnej sprzeczności, ponieważ jest dość cząsteczek, które nie zderzają się przez znacznie dłuższy okres czasu niż średni czas między zderzeniami, średni więc czas mimo wszystko będzie się równał r. Początkowo zdefiniowaliśmy r jako średni czas między zderzeniami. Z równania (43.7) wnioskujemy, że średni czas liczony od dowolnej chwili początkowej do następnego zderzenia także wynosi r. Ten nieco zaskakujący wniosek możemy uzasadnić w sposób następujący. Liczba cząsteczek, które doznają następnego zderzenia w odstępie czasu dt po czasie /, który upłynął od dowolnie obranego momentu początkowego, równa się N(t) dt/r. Oczywiście, ich „czas do chwili następnego zderzenia" równa się właśnie r. „Średni czas do następnego zderzenia" obliczamy w zwykły sposób: cc 1 f N(t) średni czas do następnego zderzenia = — I t dt. NoJ * o Korzystając z wartości N{t) otrzymanej ze wzoru (43.7) i wykonując całkowanie znajdujemy, że rzeczywiście r jest średnim czasem, który upłynął od dowolnie wybranego momentu do następnego zderzenia. 43-2. Średnia droga swobodna Opisując zderzenia między cząsteczkami możemy zamiast mówić o czasie między zderzeniami, mówić o drodze, jaką cząsteczka w tym czasie przebędzie. Stąd, że średni czas między zderzeniami równa się r oraz że cząsteczki poruszają się ze średnią prędkością v, możemy się spodziewać, że średnia odległość między zderzeniami, którą oznaczymy symbolem /, równa się po prostu iloczynowi r oraz v. Tę odległość między zderzeniami nazywamy zwykle średnią drogą swobodną: średnia droga swobodna Z = tt;. (43.9) W niniejszym rozdziale nie będziemy się zastanawiali, o jaki sposób brania średniej chodzi nam w każdym wybranym przypadku. Różne możliwe średnie: średnia arytmetyczna, pierwiastek ze średniego kwadratu itd., są sobie prawie równe i różnią się tylko współczynnikami niewiele odbiegającymi od jedności. Ponieważ do otrzymania poprawnych współczynników liczbowych tak czy owak potrzebna jest bardzo szczegółowa analiza, więc nie będziemy się martwić, o jaką średnią w każdym przypadku chodzi. Chcemy także ostrzec czytelnika, że symbole używane przez nas dla niektórych wielkości fizycznych (np. / dla średniej drogi swobodnej) nie odpowiadają ogólnie przyjętej konwencji, przede wszystkim dlatego, iż brak czegoś takiego.
266 43. DYFUZJA Widzieliśmy, że prawdopodobieństwo zderzenia się cząstki w krótkim odstępie czasu dl wynosi dr/r; z podobnych powodów prawdopodobieństwo, że zderzy się ona po przejściu drogi dx, jest równe dxjl. W podobny sposób jak poprzednio czytelnik może wykazać, że prawdopodobieństwo przebycia przez cząsteczkę przed następnym zderzeniem przynajmniej drogi x równa się e_x". Średnia odległość, którą cząsteczka przebywa, zanim się zderzy z inną - średnia droga swobodna / — zależy od liczby cząsteczek, które ją otaczają, oraz od ich „rozmiarów", to znaczy od tego, jak wielką stanowią one tarczę. Efektywne „rozmiary" tarczy podczas zderzenia zwykle opisujemy za pomocą „przekroju czynnego zderzenia", pojęcia, którego się używa w fizyce jądrowej lub w opisie zjawisk rozpraszania światła. Weźmy pod uwagę poruszającą się cząsteczkę, która przebywa odległość dx w gazie zawierającym n0 centrów rozpraszających (cząsteczek) w jednostce objętości (rys. 43.1). Jeżeli spojrzymy na jednostkową powierzchnię prostopadłą do drogi naszej cząsteczki, to znajdziemy w niej n0 dx cząsteczek. Jeżeli każda z nich ma pewną czynną powierzchnię zderzenia lub jak się zwykle mówi, „przekrój czynny zderzenia" ac, to całkowita powierzchnia zakryta przez te cząsteczki równa się a^n0dx. Przez „przekrój czynny zderzenia" rozumiemy pole powierzchni, wewnątrz której musi znajdować się środek naszej cząsteczki, aby mogła się ona zderzyć z inną wybraną cząsteczką. Gdyby cząsteczki były malutkimi kulkami (obraz klasyczny), powinniśmy oczekiwać, że a = n(rlĄ-r1Y, gdzie r, oraz r2 są promieniami dwu zderzających się obiektów. Prawdopodobieństwo, że nasza cząsteczka dozna zderzenia, równa się stosunkowi powierzchni utworzonej przez zderzające się cząsteczki do całkowitej powierzchni, którą przyjęliśmy równą jedności. Zatem prawdopodobieństwo zderzenia przy przejściu odległości dx równa się po prostu acn0dx. prawdopodobieństwo zderzenia na drodze dx = a,n^dx. (43.10) Poprzednio wyraziliśmy prawdopodobieństwo zderzenia na drodze dx przy pomocy średniej drogi swobodnej /jako dxjl. Porównując to z zależnością (43.1) możemy powiązać średnią drogę swobodną z przekrojem czynnym zderzenia: — =<rc«o, (43 11) który łatwiej zapamiętać po przepisaniu go jako acn0l=\ (43.12) Wzór ten można by odczytać mówiąc, że cząsteczka przebywająca odległość / weźmie udział w średnio biorąc jednym zderzeniu, jeżeli odległości / odpowiada taka warstwa substancji rozpraszającej, że znajdujące się w niej cząsteczki ułożone obok siebie dokładnie pokryłyby całkowitą powierzchnię (w naszym przypadku o polu równym jedności)- W walcu o tworzącej / i o podstawie o jednostkowej powierzchni znajduje się n0l centrów rozpraszających; jeżeli każde z nich ma powierzchnię o polu ac, to pokryte przez nie pole całkowitej powierzchni równa się n0lac, co właśnie równa się jedności. Normalnie oczywiście powierzchnia nie jest w całości pokryta, ponieważ niektóre cząsteczki są częs-
43-2. Średnia drooa swobodna 267 powierzchnia zderzenia i wynosi dc 1 o o o ® o Q © ^ © o powierzchnia całkowicie zakrywana równa się O"n0dx 43.1. Przekrój czynny zderzenia ciowo zasłaniane przez inne. Dlatego właśnie niektóre cząsteczki mogą przebyć drogę dłuższą niż /, nie biorąc udziału w żadnym zderzeniu. Tylko ujmując rzecz statystycznie możemy twierdzić, że cząsteczki biorą udział w zderzeniu w czasie, gdy przebywają odległość /. Mierząc średnią drogę swobodną możemy określić przekrój czynny rozpraszania ac i porównać wynik z obliczeniami opartymi na dokładnej teorii budowy atomu. Ale to już jest inny temat! Powróćmy zatem do zagadnienia stanów nie będących w równowadze. 43-3. Szybkość unoszenia Chcemy opisać, jak zachowuje się jedna cząsteczka lub kilka cząsteczek, które w jakiś sposób różnią się od większości cząsteczek gazu. Tę „większość" cząsteczek będziemy nazywali cząsteczkami „tła", a cząsteczki odróżniające się od tła nazwiemy cząsteczkami „specjalnymi" lub krócej - cząsteczkami S. Cząsteczki mogą mieć charakter specjalny z różnych powodów. Mogą być na przykład cięższe od zwykłych cząsteczek. Mogą mieć inny skład chemiczny. Mogą też mieć ładunek elektryczny, a więc być jonami w zbiorowisku cząsteczek nienaładowanych. Dzięki innym masom lub ładunkom na cząsteczki ■S mogą działać inne siły niż na cząsteczki „tła". Badając zachowanie się cząsteczek S możemy zrozumieć istotne własności występujące w podobny sposób w wielu różnych zjawiskach. Wymienimy parę z nich: dyfuzja gazów, prąd elektryczny w ogniwach, osadzanie się zawiesin, odwirowywanie itd. Na początku zajmiemy się zjawiskiem podstawowym: na pewną cząsteczkę S otoczoną przez cząsteczki „tła" działa pewna specyficzna siła F (która może być np. siłą grawitacyjną lub elektryczną) oraz, dodatkowo, zwykłe siły pochodzące ze zderzeń z cząsteczkami tła. Chcielibyśmy określić ogólne własności zachowania się cząsteczki S. W szczegółach zachowanie to polega na tym, że cząsteczka przedziera się między innymi cząsteczkami, porusza się tam i z powrotem ciągle się zderzając. Po dokładnej jednak obserwacji stwierdzimy, że stale przesuwa się ona w kierunku siły F. Mówimy, że na jej zupełnie powier7elnia jednostkowa liczba wszystkich cząstek wynosi n0dx
268 43. DYFUZJA bezładny ruch nakłada się ruch unoszenia. Chcielibyśmy znać szybkość tego unoszenia wywołaną przez siłę F. Jeżeli w pewnej chwili zaczniemy obserwację cząsteczki S, to najprawdopodobniej trafimy na moment między dwoma zderzeniami. Oprócz prędkości, jaką miała ona po ostatnim zderzeniu, cząsteczka zyskuje jakąś składową prędkość w wyniku działania siły F. Po chwili (średnio po czasie r) cząsteczka się zderzy i rozpocznie nowy odcinek swej drogi. Będzie miała nową prędkość początkową, ale stale takie samo przyspieszenie pochodzące od siły F. Na razie, dla uproszczenia, założymy, że po każdym zderzeniu nasza cząsteczka S startuje zupełnie „świeża", to znaczy, że nie pamięta przyspieszenia wywołanego w przeszłości przez siłę F. To założenie jest zupełnie uzasadnione, jeżeli nasza cząsteczka 5 jest znacznie lżejsza od cząsteczek tła, ale ogólnie na pewno nie jest słuszne. Później omówimy bardziej poprawne założenie. Tymczasem przyjmiemy, że po każdym zderzeniu cząsteczka 5 ma prędkość, która z równym prawdopodobieństwem może być dowolnie skierowana. Prędkość, z jaką cząsteczka startuje, będzie zatem przyjmować zupełnie przypadkowo jakiś dowolny kierunek i nie da żadnego przyczynku do ruchu w określonym kierunku. Nie będzie więc nam potrzebna znajomość prędkości po zderzeniu. Oprócz ruchu przypadkowego każda cząsteczka S będzie miała w dowolnej chwili w kierunku siły F dodatkową prędkość, którą nabrała od chwili swego ostatniego zderzenia. Jaka jest średnia wartość tej dodatkowej prędkości? Jest ona równa przyspieszeniu F/m (gdzie m oznacza masę cząsteczki S) pomnożonemu przez średni czas, który upłynął od ostatniego zderzenia. Ale średni czas od ostatniego zderzenia równa się średniemu czasowi do następnego zderzenia, który oznaczyliśmy przez t. Średnia prędkość spowodowana przez siłę F jest oczywiście szukaną prędkością unoszenia, mamy więc zależność F koszenie = (43-,3> m Ta podstawowa zależność stanowi istotę naszego zagadnienia. Mogą być pewne komplikacje przy określeniu, czym jest r, ale podstawowy proces jest określony przy pomocy równania (43.13). Zwróćmy uwagę, że prędkość unoszenia jest proporcjonalna do siły. Niestety, brak ogólnie przyjętej nazwy dla stałej proporcjonalności. Dla sił różnego rodzaju używa się różnych nazw. Przy zjawiskach elektrycznych siłę zapisujemy jako iloczyn ładunku i natężenia pola F = cE i stałą proporcjonalności między prędkością i natężeniem pola elektrycznego E zwykle nazywamy „ruchliwością". Mimo możliwości powstania nieporozumień, użyjemy określenia ruchliwość dla stosunku prędkości unoszenia do siły dla dowolnych sił. Napiszemy ogólnie v ■ =uF (43.14) ■'unoszenie r1' \^-'- * i nazwiemy n ruchliwością. Z równania (43.13) otrzymamy \i = x\m. (43.15) Ruchliwość jest proporcjonalna do średniego czasu między zderzeniami (mniej liozne
43-3- SZYBKOŚĆ UNOSZENIA 269 zderzenia mniej ją osłabiają) i odwrotnie proporcjonalna do masy (większa bezwładność oznacza mniejszą szybkość uzyskaną między zderzeniami). Otrzymanie dobrego współczynnika liczbowego w równaniu (43.13), którego podana tu wartość okazuje się poprawna, wymaga pewnej ostrożności. Nie chcąc wprowadzić zamieszania, chcielibyśmy jednak podkreślić, że nasze rozważania zawierają pewne subtelności, które stają się widoczne dopiero po uważnym i szczegółowym zbadaniu. Aby wykazać, że mimo pozorów są pewne trudności, jeszcze raz wyprowadzimy równanie (43.13), postępując w sposób wydawałoby się rozsądny, ale z gruntu fałszywy (który jednak można znaleźć w wielu podręcznikach!). Moglibyśmy rozumować tak: Średni czas między zderzeniami wynosi r. Po zderzeniu cząsteczka rozpoczyna ruch z jakąś przypadkową prędkością, ale zyskuje jeszcze dodatkową prędkość między zderzeniami, która równa się iloczynowi przyspieszenia i czasu. Ponieważ do następnego zderzenia upływa czas r, cząsteczka ponownie zderza się mając prędkość (F/m) t. Po pierwszym zderzeniu jej prędkość była równa zeru, czyli jej średnia prędkość między dwoma zderzeniami jest równa połowie prędkości końcowej i średnia prędkość unoszenia równa się \Fxlm (błąd!). Ten wynik jest jednak błędny, a wynik otrzymany z równania (43.13) jest poprawny, chociaż oba dowody wydają się jednakowo przekonujące. Istnieje bardzo subtelna przyczyna, która sprawia, że drugi dowód jest fałszywy. O co chodzi? Otóż dowód jest tu tak przeprowadzony, jakby między wszystkimi zderzeniami upływał średni czas r. W rzeczywistości niektóre czasy są dłuższe, a inne krótsze od czasu średniego. Krótkie czasy występują częściej, ale wnoszą mniejszy wkład do prędkości unoszenia, ponieważ mają mniejszą możliwość „porządnego rozruszania cząstki". Jeśli wziąć pod uwagę rozkład swobodnych czasów między zderzeniami, to można wykazać że nie powinno być współczynnika \. który uzyskaliśmy w drugim wyprowadzeniu. &łąd został popełniony podczas próby powiązania za pomocą prostego argumentu średniej końcowej prędkości z prędkością średnią w ogóle. Ta zależność nie jest wcale tak prosta, a więc najlepiej ograniczyć się do tego, co jest niezbędne: do samej tylko prędkości średniej. W pierwszym wyprowadzeniu określiliśmy średnią prędkość od razu — i poprawnie! Teraz jednak powinniśmy już być przekonani, dlaczego nie zawsze wolno nam obliczać dokładnych wartości liczbowych dla wszystkich współczynników za pomocą elementarnych wyprowadzeń. Wróćmy obecnie do naszego upraszczającego założenia, że przy każdym zderzeniu cząsteczka zapomina o swym poprzednim ruchu — że po każdym zderzeniu następuje zupełnie świeży start. Załóżmy, że nasza cząsteczka 5 jest ciężkim obiektem na tle lżejszych cząsteczek. Wówczas nie będzie już ona traciła całego pędu „do przodu" w każdym zderzeniu. I trzeba będzie paru zderzeń, zanim jej ruch stanie się znów przypadkowy. Możemy po prostu przyjąć, że w każdym zderzeniu — średnio w każdym odstępie czasu r — cząsteczka traci pewną część swego pędu. Nie będziemy wchodzić w szczegóły, a tylko zauważmy, że wynik jest równoważny zastąpieniu t — średniego czasu między zderzeniem — przez nowy i dłuższy czas r, który odpowiada średniemu „czasowi zapominania", tzn. średniemu czasowi potrzebnemu do „zapomnienia" przez cząsteczkę jej pędu do przodu. Przy takiej interpretacji czynnika t możemy stosować nasz wzór (43.15) do zjawisk, które nie są tak proste jak te. które rozważaliśmy n.i wstmie
270 43. DYFUZJA 43-4. Przewodnictwo jonowe Zastosujemy teraz nasze wyniki do szczególnego przypadku. Weźmy gaz w zbiorniku, w którym znajdują się także jony — naładowane elektrycznie atomy lub cząsteczki. Przedstawiliśmy to schematycznie na rys. 43.2. Jeżeli dwie przeciwległe ściany zbiornika będą z metalu, to możemy je połączyć z elektrodami ogniwa i w ten sposób wytworzyć pole elektryczne w gazie. Pole elektryczne będzie działało na jony z pewną siłą, a więc zaczną się one przesuwać w kierunku jednej z metalowych ścianek. Wytworzy to pewien prąd elektryczny i gaz wraz ze swymi jonami będzie zachowywał się jak opornik. Obliczając strumień jonów za pomocą szybkości unoszenia możemy obliczyć także opór. W szczególności interesuje nas, w jaki sposób przepływ prądu elektrycznego zależy od przyłożonej do ścianek różnicy napięć V. Zajmiemy się przypadkiem, w którym nasz zbiornik jest prostopadłościanem o wysokości b i o powierzchni pola podstawy A (rys. 43.2). Jeśli różnica potencjałów, napięcie między ściankami, równa się V, natężenie pola elektrycznego między nimi wynosi V\b. (Potencjał elektryczny równa się pracy potrzebnej do przeniesienia jednostkowego ładunku z jednej ścianki do drugiej. Siła działająca na jednostkowy ładunek równa się E. Jeżeli natężenie pola E jest wszędzie między ściankami stałe, co w naszym przypadku jest uzasadnionym przybliżeniem, to praca wykonana nad jednostkowym ładunkiem równa się Eb, a więc V=Eb.) Siła działająca na jon gazu równa się qE, gdzie q jest ładunkiem jonu. Wówczas szybkość unoszenia jonu równa się n razy ta siła: V v . =uF = uq (43.16) "unoszenie Ji Prąd elektryczny / równa się przepływowi ładunku w jednostce czasu. Całkowity ładunek jonów dopływających do jednej ścianki w jednostce czasu równa się prądowi elektrycznemu płynącemu przez tę ściankę. Jony przesuwające się w kierunku ścianki z prędkością "unoszenie « znajdujące się w odległości równej vuros«nie ■ T osiągną ściankę po upływie czasu T. Jeżeli gęstość jonów równa się w,, to liczba jonów, które dobiegną do ścianki w czasie T, równa się (»j A ■"unc.ni.n- Każdy jon niesie ładunek q, mamy więc ładunek zebrany w czasie T= = q"jAvUBOiMRicT (43.17) Prąd / równa się ładunkowi nagromadzonemu w czasie T i podzielonemu przez T, a więc I=qnjAvunoacBit. (43.18) Po podstawieniu runoszerie z wzoru (43.16) 43.2. Prąd elektryczny w gazie zjonizowanym metal powierzchnia A ■* — o o o o c gaz o W b 1 o o o ° o o ° E_ o » o o ° .0 o A/i jonach jednostce ° D objętości e \ izolator do baterii o napięciu V
43-4. PRZEWODNICTWO JONOWE 271 mamy i A I = fiq1nj—V. (43.19) b Okazało się, że natężenie prądu elektrycznego jest proporcjonalne do napięcia, a to jest właśnie prawo Ohma. Opór R równa się odwrotności stałej proporcjonalności: i=/Vn,4 (43.20) Otrzymaliśmy zależność między oporem i właściwościami cząsteczkowymi gazu nJt q i fi, które z kolei zależą od m i x. Jeżeli znamy «, i q z innych doświadczeń, to pomiar R może posłużyć do wyznaczenia fi, a za pomocą fi także t. 43-5. Dyfuzja cząsteczkowa Przechodzimy teraz do innego zagadnienia i do innego sposobu jego badania: zajmiemy się teorią dyfuzji. Weźmy zbiornik gazu znajdującego się w równowadze cieplnej i wprowadźmy w jakimś miejscu zbiornika trochę innego gazu. Gaz, który mieliśmy na początku, nazwiemy gazem „tła", a nowy — gazem „specjalnym". Gaz „specjalny" zacznie rozchodzić się po całym zbiorniku, ale będzie to robił powoli zć względu na obecność gazu „tla". Ten powolny proces rozchodzenia się nazywamy dyfuzją. Dyfundują przede wszystkim cząsteczki gazu specjalnego, potrącane ze wszystkich stron przez cząsteczki „tła". Po wielkiej liczbie zderzeń cząsteczki specjalne są mniej więcej równomiernie rozmieszczone w całej objętości zbiornika. Musimy uważać, aby nie pomylić dyfuzji gazu z jego przenoszeniem (transportem), który może wystąpić w obecności prądów konwekcyjnych. Mieszanie się dwu gazów zachodzi najczęściej w wyniku złożenia konwekcji i dyfuzji. Nas interesuje tylko przypadek, w którym nie ma „wiatrów" konwekcyjnych. Gaz rozchodzi się tylko dzięki ruchom cząsteczek; tylko dzięki dyfuzji. Chcemy obliczyć, jak szybko odbywa się dyfuzja. Najpierw zajmiemy się obliczeniem wypadkowego strumienia cząsteczek gazu specjalnego, spowodowanego ruchem cząsteczek. Strumień wypadkowy otrzymamy tylko wtedy, gdy istnieje niejednorodny rozkład cząsteczek. W przeciwnym bowiem razie wszystkie ruchy cząsteczek uśredniają się i nie dadzą żadnego strumienia wypadkowego. Najpierw zajmijmy się strumieniem w kierunku osi x. Aby go wyznaczyć, wyobraźmy sobie płaszczyznę umieszczoną prostopadle do osi x i obliczmy, ile cząsteczek „specjalnych" przepływa przez tę płaszczyznę. W tym celu musimy traktować jako dodatnie te cząsteczki, które przechodzą płaszczyznę w dodatnim kierunku osi x i odjąć od tego te cząsteczki, które przechodzą przez nią w kierunku ujemnym osi x. Jak już widzieliśmy wiele razy, liczba cząsteczek przechodzących przez powierzchnię w czasie AT równa się tej ich liczbie, która w czasie AT znajduje się w obszarze wvznaczonym przez odległość u AT od płaszczyzny (zwróćmy uwagę, że tym razem v oznacza prędkość cząsteczek, a nie prędkość unoszenia). Uprościmy obliczenia przyjmując, że nasza powierzchnia ma pole jednostkowe. Wtedy
272 4i PYFUZJA liczba cząsteczek „specjalnych" przelatujących z lewa na prawo (przyjmując, że dodatni kierunek x jest zwrócony na prawo) równa się n_v AT, gdzie n_ oznacza gęstość cząsteczek specjalnych z lewej strony (ze współczynnikiem 2 lub podobnym, ale my nie zwracamy na to uwagi!). Podobnie liczba cząsteczek przelatujących z prawa na lewo równa się n+v AT, gdzie n+ równa się gęstości cząsteczek „specjalnych" z prawej strony płaszczyzny. Jeżeli przez J oznaczymy wypadkowy prąd cząsteczkowy, tzn. wypadkowy strumień cząsteczek przez jednostkową powierzchnię w jednostce czasu, to otrzymamy n_vAT — n+vAT J= - , (43.21) AT ' czyli J = (n_-n+)v (43.22) Co powinniśmy podstawić za n. oraz n+? Gdy mówimy „gęstość z lewej strony", o jakie miejsce dokładnie nam chodzi? Powinniśmy wziąć gęstość w miejscu, od którego cząsteczki rozpoczynają swój „swobodny lot", ponieważ liczba cząsteczek rozpoczynających taką podróż zależy od liczby cząsteczek znajdujących się w danym miejscu. A zatem n- powinno oznaczać gęstość w odległości średniej drogi swobodnej / na lewo od naszej wyimaginowanej płaszczyzny, a n+ — gęstość w odległości / na prawo. Wygodnie jest traktować rozkład naszych „specjalnych" cząsteczek w przestrzeni jako ciągłą funkcję zmiennych x, y oraz z. Nazwiemy ją na: na(x,y,z) oznacza gęstość numeryczną cząsteczek „specjalnych" w małym elemencie objętości ze środkiem w punkcie \.x,y> z). Przy pomocy na możemy w następujący sposób wyrazić różnicę (n+ — n_): dn. dna (n+-n_)= — Ax=~ -21. (43.23) dx dx Podstawiając to do równania (43.22) i pomijając współczynnik 2 otrzymujemy: dn„ Jx=-lv-^. (43.24) dx Obliczyliśmy, że prąd cząsteczek „specjalnych" jest proporcjonalny do pochodnej gęstości ub — jak się mówi niekiedy — do „gradientu" gęstości. Oczywiście, przyjęliśmy kilka grubych przybliżeń. Poza opuszczeniem różnych współczynników, umieściliśmy v tam, gdzie powinno być vx, oraz przyjęliśmy, że n+ oraz n- odnoszą ^ię do punktów odległych o / prostopadle do naszej powierzchni, chociaż dla cząsteczek, które nie poruszają się prostopadle do powierzchni, / powinno odpowiadać ukośnej odległości od powierzchni. Wszystkie te poprawki można wprowadzić. W wyniku dokładniejszej analizy okazuje się, że prawą stronę równania (43.24) należy pomnożyć przez J. A więc poprawiony wynik wygląda następująco: lv dn., J,= -. (43 25) 3 dx Podobne równania można napisać dla prądów w kierunkach osi y oraz z. Prąd Jx oraz gradient gęstości dnjdx można wyznaczyć na podstawie pomiarów ma-
43-5. DYFUZJA CZĄSTECZKOWA 273 kroskopowych. Ich stosunek zmierzony doświadczalnie nazywamy „współczynnikiem dyfuzji", D. A więc dn„ Jx=-D-f. (43.26) dx Wykazaliśmy więc, że dla gazów D = ilv. (43.27) Dotychczas braliśmy pod uwagę, w tym rozdziale, dwa oddzielne procesy: ruchliwość, unoszenie cząsteczek spowodowane siłami „zewnętrznymi", oraz dyfuzję, rozprzestrzenianie się cząsteczek określone tylko przez siły wewnętrzne, przez przypadkowe zderzenia. Istnieje jednak między nimi związek, ponieważ oba procesy zasadniczo zależą od ruchów cieplnych i w obu rachunkach występuje średnia droga swobodna /, Jeżeli w równaniu (43.25) podstawimy /=rr oraz T=pm, to otrzymamy Jz=-$mv2p (43.28) dx Ale czynnik nn1 zależy tylko od temperatury. Przypominamy, że {mv2 = ikT, (43.29) a więc dna Jx= -pkT -? (43.30) dx Widzimy więc, że D, współczynnik dyfuzji, równa się po prostu kT pomnożonemu przez p. (przez ruchliwość): D = pkT (43.31) Okazuje się też, że współczynnik liczbowy we wzorze (43.31) jest ścisły — nie potrzeba dodawać tu żadnych współczynników dla poprawienia naszych przybliżonych założeń. Można nawet udowodnić, że wzór (43.31) musi być zawsze słuszny — nawet w przypadkach złożonych (w takich jak na przykład zawiesiny w cieczy), do których nasze proste obliczenia w ogóle by się nie stosowały. Aby udowodnić, że wzór (43.31) musi być zawsze słuszny, wyprowadzimy go inaczej, korzystając tylko z naszych podstawowych zasad mechaniki statystycznej. Wyobraźmy sobie, że istnieje gradient gęstości cząsteczek „specjalnych" i że mamy prąd dyfuzji proporcjonalny do gradientu gęstości zgodnie z równaniem (43.26). Nakładamy teraz pole sił o kierunku osi x, tak aby na każdą cząsteczkę działała siła F. Zgodnie z definicją ruchliwości p. otrzymamy następującą prędkość unoszenia: Wen, = /^ (43-32) Tak jak zwykle, prąd unoszenia (wypadkowa liczba cząsteczek przechodzących przez jednostkową powierzchnię w jednostce czasu) równa się unoszenie « unoszenie * l*+-'--,-,7 czyli
274 43. DYFUZJA znoszenie = "a^F. (43.34) Dobieramy następnie taką siłę F, aby spowodowany przez nią prąd unoszenia zrównoważył dyfuzję, czyli aby nie było przepływu wypadkowego cząsteczek specjalnych. Mamy więc/J1 + ./unosz<:ni<r = 0 lub dna D — =natiF. (43.35) dx W warunkach równowagi obliczamy stacjonarny (stały w czasie) gradient gęstości określony przez dna napF ~ = ~- (43.36) ax D Ale uwaga! Opisujemy warunki równowagi, a więc możemy stosować nasze prawa równowagi z mechaniki statystycznej. Zgodnie z tymi prawami prawdopodobieństwo znalezienia cząsteczki o współrzędnej x jest proporcjonalne do e~v,kT, gdzie U jest energią potencjalną. Po wprowadzeniu gęstości numerycznej na oznacza to, że na = n0e-v,kT. (43.37) Różniczkując wyrażenie (43.37) względem x znajdujemy dna _„,lT 1 dU -'=-«0e VlkTT~- . (43.38) dx kT dx czyli (/«._ "„ dU dx kT dx W naszym przypadku, ponieważ siła F działa w kierunku osi x, energia potencjalna L' równa się — Fx oraz —dl)ldx = F. Z równania (43.39) otrzymujemy dna n„F —'=-£- (43.40) dx kT [Jest to dokładnie równanie (40.2), z którego otrzymaliśmy początkowo e~v,kT, a więc koło się zamknęło.] Porównując równanie (43.40) z (43.36) otrzymujemy dokładnie równanie (43.31). Udowodniliśmy więc, że równanie (43.31), które określa prąd dyfuzyjny przy pomocy ruchliwości, ma poprawny współczynnik i jest słuszne w bardzo ogólnych warunkach. Ruchliwość i dyfuzja są ściśle związane. Tę zależność po raz pierwszy wykr>ł Einstein. 43-6. Przewodnictwo cieplne Metody teorii kinetycznej, z których korzystaliśmy wyżej, mogą także służyć do obliczenia przewodnictwa cieplnego gazu Jeżeli gaz u góry zbiornika jest cieplejszy niż gaz będący na dole, to ciepło będzie przypływało z góry do dołu. (Gaz cieplejszy musi b>ć
43-6. PRZEWODNICTWO CIEPLNF 275 u góry, bo w przeciwnym razie wystąpiłyby prądy konwekcyjne i nie mielibyśmy do czynienia tylko z zagadnieniem przewodnictwa ciepła.) Przekazywanie ciepła od gazu gorętszego do zimniejszego odbywa się drogą dyfuzji „gorących" cząsteczek — cząsteczek o większej energii — do dołu oraz dyfuzji „zimnych" cząsteczek do góry. Aby obliczyć strumień energii cieplnej, obliczymy energię przenoszoną przez pewien element powierzchni na dół za pomocą cząsteczek opadających oraz energię niesioną do góry przez cząsteczki przebijające tę powierzchnię w kierunku odwrotnym. Różnica ich da nam wypadkowy strumień energii. Przewodnictwo cieplne k jest zdefiniowane jako stosunek ilości energii cieplnej przenoszonej w jednostce czasu przez jednostkową powierzchnię do gradientu temperatury: 1 dQ dT = -*— (43.41) A dt dz v ' Ponieważ rachunki są identyczne z tymi, które wykonywaliśmy przy obliczaniu przepływu prądu elektrycznego w zjonizowanym gazie, więc pozostawiamy czytelnikowi do udowodnienia, że knlv * = - —-, (43.42) y-i gdzie (y— \)kT jest średnią energią cząsteczki w temperaturze T. Jeżeli skorzystamy z naszej zależności nloc=\, przewodnictwo cieplne możemy zapisać w następującej postaci: 1 kv k= (43.43) y-i °c Otrzymaliśmy wynik raczej zaskakujący. Wiemy, że średnia prędkość cząsteczek gazu zależy od temperatury, a nie zależy od ich gęstości. Spodziewamy się, że cc zależy tylko od rozmiarów cząsteczek. Tak więc nasz prosty wynik głosi, że przewodnictwo cieplne k (a więc i ilość ciepła przepływającego w jakichś określonych warunkach) nie zależy od gęstości gazu! Zmiana liczby „nosicieli" energii wraz ze zmianą gęstości jest całkowicie skompensowana przez zmianę odległości, którą „nosiciele" muszą przebyć między zderzeniami. Ktoś mógłby zapytać: „Czy przypływ energii przy gęstości gazu dążącej do zera również jest niezależny od gęstości? A co wtedy, gdy w ogóle nie ma gazu?" Oczywiście nie! Wzór (43.43) został wyprowadzony, tak jak zresztą wszystkie inne w tym rozdziale, przy założeniu, że średnia droga swobodna między zderzeniami jest znacznie krótsza od dowolnego wymiaru zbiornika. Skoro bowiem gęstość gazu jest tak mała, że cząsteczki mogą swobodnie bez zderzeń przebiegać między ściankami zbiornika, nie będą miały zastosowania żadne z obliczeń wykonanych w tym rozdziale. W takich przypadkach musimy z powrotem odwołać się do teorii kinetycznej i rozważyć przebieg zjawisk od nowa.
44 zasady termodynamiki 44-1. Silniki cieplne, pierwsza zasada Do tej pory omawialiśmy własności materii z punktu widzenia fizyki atomowej, próbując z grubsza zrozumieć przebieg zjawisk przy założeniu, że otaczające nas przedmioty składają się z atomów podlegających pewnym prawom. Istnieje jednak wiele zależności między własnościami substancji, które można otrzymać nie wchodząc w szczegóły budowy materii. Termodynamika właśnie zajmuje się określeniem zależności między różnymi własnościami materii, nie badając jej wewnętrznej budowy. Historycznie rzecz biorąc, termodynamika rozwinęła się wcześniej nim poznano wewnętrzną budowę materii. Oto jeden z przykładów: wiemy z teorii kinetycznej, że ciśnienie gazu jest spowodowane przez uderzenia cząsteczek. Wiemy także, że jeżeh ogrzejemy gaz, to liczba uderzeń się zwiększy, a więc ciśnienie musi wzrosnąć. I odwrotnie, jeżeli wsuwamy tłok do zbiornika zawierającego gaz, kierując go przeciw sile uderzeń cząsteczek, to wzrośnie energia cząsteczek bombardujących tłok, a więc wzrośnie i temperatura. Z jednej zatem strony, jeżeli zwiększymy temperaturę przy stałej objętości, zwiększymy ciśnienie. Z drugiej zaś strony jeżeli sprężymy gaz, wzrośnie jego temperatura. Teoria kinetyczna umożliwia wyprowadzenie ilościowej zależności między tymi dwoma zjawiskami, ale intuicyjnie czujemy że są one związane w jakiś konieczny sposób, niezależny od szczegółowych warunków zderzeń. Weźmy inny przykład. Znana jest interesująca własność gumy: jeżeli rozciągniemy taśmę gumową, to się ona ogrzeje. Trzymając rozciąganą taśmę w ustach czujemy wyraźny przyrost ciepła, który jest odwracalny w tym znaczeniu, że jeżeli szybko puścimy gumkę, to wyraźnie odczujemy jej oziębienie Znaczy to, że gumka ogrzewa się przy naciąganiu, a oziębia się po zwolnieniu napięcia. Intuicyjnie podejrzewamy, że jeżeli ogrzejemy gumkę, może w niej powstać napięcie, czyli skoro rozciągana gumka się ogrzewa.
44-1. SILNIKI CIEPLNE, PIERWSZA ZASADA 277 to także ogrzewanie gumki powinno spowodować jej kurczenie. I rzeczywiście, jeżeli dotkniemy płomieniem gazowym gumki utrzymującej jakiś ciężarek, to zobaczymy, że ona się skurczy raptownie (rys. 44.1), czyli ogrzana gumka naprawdę się kurczy i fakt ten jest z pewnością związany ze zjawiskiem oziębiania się gumki przy zmniejszaniu jej napięcia. Wewnętrzne przyczyny, które wywołują takie efekty w gumce, są dość złożone. W pewnym stopniu postaramy się je opisać z punktu widzenia budowy cząsteczkowej materii, chociaż głównym celem tego rozdziału jest poznanie tego rodzaju związków niezależnie od modelu cząsteczkowego. Mimo to możemy wykazać za pomocą modelu cząsteczkowego, że wspomniane zjawiska są ściśle związane. Jedyną drogą wiodącą do zrozumienia zachowania się gumy jest stwierdzenie, że zbudowana jest ona z olbrzymiego splotu długich łańcuchów cząsteczkowych, w rodzaju „cząsteczkowego spaghetti", z dodatkową komplikacją: między tymi łańcuchami znajdują się poprzeczne łączniki — tak jak spaghetti, które splatane jest czasem poprzecznymi kawałkami ciasta — w sumie straszna gmatwanina. Jeżeli rozciągamy ten splot, niektóre łańcuchy dążą do ustawienia się wzdłuż kierunku rozciągania. Jednocześnie łańcuchy są w ciągłym ruchu termicznym, a więc ciągle zderzają się ze sobą. W rezultacie rozciągany łańcuch nie pozostanie rozciągnięty, lecz na skutek zderzeń z innymi łańcuchami i cząsteczkami będzie się znów zwijał. Oto więc właściwy powód, dla którego gumka wykazuje tendencję do kurczenia się. Gdy gumkę rozciągamy, łańcuchy ustawiają się w kierunku podłużnym, a termiczne uderzenia cząsteczek w boki łańcuchów zmierzają do ich zwinięcia i skracają je. Staje się więc widoczne, że jeżeli łańcuchy są rozciągnięte i temperatura wzrasta, a więc wzrasta i wigor uderzeń cząsteczek, łańcuchy zaczynają się kurczyć i są w stanie podciągnąć duży ciężarek podczas ogrzewania. Jeżeli zwolnimy gumkę napiętą przez pewien czas, to każdy łańcuch wiotczeje i uderzające weń cząsteczki tracą energię trafiając w zwolniony łańcuch. A więc temperatura się obniża! Przekonaliśmy się, że dwa zjawiska: kurczenie się podczas ogrzewania i oziębianie w czasie kurczenia są z punktu widzenia teorii kinetycznej z sobą ściśle związane, ale znalezienie ich ścisłego związku byłoby ogromnym zadaniem. Musielibyśmy wiedzieć, ile jest zderzeń w ciągu sekundy, jak wyglądają łańcuchy, a oprócz tego musielibyśmy wziąć pod uwagę wiele innych czynników. Szczegółowy mechanizm zjawiska jest tak skomplikowany, że na podstawie kinetycznej teorii nie możemy wywnioskować jak ono naprawdę przebiega; nadal jednak twierdzimy, że określoną zależność między zaobserwowanymi zjawiskami można wyprowadzić bez żadnej znajomości ich wewnętrznego mechanizmu! Cała termodynamika sprowadza się w istocie do następującego rozumowania: po- 44.1. Ogrzewanie taśmy gumowej
278 «4. ZASADY TERMODYNAMIKI nieważ gumka jest „silniejsza" w wyższych temperaturach niż w niższych, to można podnosić i przesuwać ciężary, a więc wykonywać pracę kosztem ciepła. Przecież doświadczalnie stwierdziliśmy, że ogrzewana gumka może podnosić ciążarek. Badanie sposobu otrzymania pracy kosztem ciepła zapoczątkowało naukę termodynamiki. Czy możemy zbudować silnik, który wykorzystuje zachowanie się podgrzewanej gumki do wykonania pracy? Można by sobie wykonać taki zabawny silnik. Składałby się on z koła rowerowego, 44.2. Silnik cieplny z taśmami gumowymi w którym szprychy zastąpionoby gumkami (rys. 44.2). Gumki z jednej strony koła po podgrzaniu ich za pomocą żarówek stałyby się „silniejsze" od gumek z przeciwnej strony. Środek ciężkości koła przesunąłby się poza jego oś i koło by się obróciło. W czasie obrotu zimne gumki poruszałyby się w kierunku źródła ciepła, a gorące — oddalałyby się od żarówek, a więc koło obracałoby się tak długo, jak długo dostarczanoby ciepła. Sprawność takiego silnika byłaby bardzo mała. 400 W mocy dostarczone do dwóch żarówek mogłoby najwyżej utrzymać go w ruchu! Warto się jednak zastanowić, czy można zamieniać ciepło na pracę w bardziej wydajny sposób. Właściwie całą naukę termodynamiki zapoczątkował wielki inżynier Sadi Carnot badaniem możliwości zbudowania najlepszego, najbardziej wydajnego silnika. Był to jeden z nielicznych słynnych przypadków, w którym technika wniosła istotny wkład do teorii fizycznej. Innym przykładem przychodzącym mi na myśl są niedawne badania nad teorią informacji prowadzone przez Claude'a Shannona. Przypadkowo te dwie analizy okazały się ściśle z sobą związane. Silnik parowy zwykle pracuje w ten sposób, że ciepło pobrane od ognia, na którym gotujemy wodę, tworzy parę, która rozszerzając się popycha tłok obracający koło. A więc para przesuwa tłok — i co dalej? Należy jakoś skończyć robotę — można by głupio dokończyć cykl wypuszczając parę w powietrze, trzeba by wówczas stale uzupełniać zapas wody. Tańszy i wydajniejszy sposób polega na przesłaniu pary do innego zbiornika, gdzie się ją skrapla za pomocą zimnej wody i później z powrotem przepompowuje do kotła, tak aby woda ciągle krążyła. Ciepło jest w ten sposób dostarczane do silnika i zamieniane na pracę. A może lepiej byłoby użyć alkoholu? Jakie własności powinna mieć substancja, aby można było zbudować możliwie najlepszy silnik? Takie było pytanie, które postawił sobie Carnot i jednym z jego ubocznych wyników było odkrycie tej zależności, którą wyjaśniliśmy wyżej. Wszystkie osiągnięcia termodynamiki są zawarte w niewielu pozornie prostych twierdzeniach, nazwanych zasadami termodynamiki. Za czasów Carnota pierwsza zasada termodynamiki, zasada zachowania energii, nie była znana. Argumenty Carnota były jednak tak starannie dobrane, że są słuszne, mimo że nie znał tej zasady! Dopiero później Clausius podał prostsze wyprowadzenie, które było przystępniejsze od bardzo subtelnej
44-1. SILNIKI CIEPLNE, PIERWSZA ZASADA 279 argumentacji Carnota. Okazało się jednak, że Clausius zakładał nie zachowanie energii, a tylko zachowanie ciepła, zgodnie z teorią cieplika, której fałszywość później udowodniono. Dlatego często się mówi, że Carnot rozumował błędnie. Jego rozumowanie było tymczasem zupełnie poprawne, a nieprawdziwa jest tylko powszechnie znana wersja rozumowania podana przez Clausiusa. W ten sposób tzw. druga zasada termodynamiki została odkryta przez Carnota przed pierwszą zasadą! Byłoby interesujące przytoczenie dowodu Carnota, który nie korzysta z pierwszej zasady, ale nie zrobimy tego, gdyż uczymy się fizyki a nie historii. Będziemy używali pierwszej zasady od samego początku, mimo że można bardzo dużo osiągnąć bez niej. Rozpocznijmy od sformułowania pierwszej zasady, zasady zachowania energii: jeżeli do układu dostarczymy ciepło i wykonamy nad nim pracę, wówczas jego energia wzrośnie o włożoną pracę i o dostarczone ciepło. Możemy tę zasadę zapisać w następujący sposób: Ciepło Q dostarczane do układu plus praca W wykonana nad układem równa się przyrostowi energii U układu; tę ostatnią nazywamy niekiedy energią wewnętrzną: zmiana U=Q + W. (44.1) Zmianę U możemy przedstawić jako sumę małej ilości ciepła AQ i niewielkiej ilości pracy A W: AU=AQ + AW. (44.2) Jest to tak zwana różniczkowa postać tej samej zasady. Znamy ją bardzo dobrze z jednego z poprzednich rozdziałów. 44-2. Druga zasada A jaka jest druga zasada termodynamiki? Wiemy, że jeżeli wykonamy pracę przeciwko tarciu, to praca stracona przez nas równa będzie wytworzonemu ciepłu. Jeżeli wykonujemy tę pracę w pokoju w temperaturze T i robimy to dostatecznie wolno, to temperatura w pokoju zmieni się nieznacznie, a więc zamieniamy pracę na ciepło w stałej temperaturze. Ale czy można postąpić przeciwnie? Czy można z powrotem zamienić ciepło na pracę w stałej temperaturze? Druga zasada twierdzi, że nie. Byłoby bardzo wygodnie, gdybyśmy byli w stanie zamienić ciepło na pracę, odwracając po prostu taki proces, jak na przykład tarcie. Jeżeli stoimy tylko na gruncie zachowania energii, to możemy sądzić, że energia cieplna, na przykład energia drgań cząsteczek, może stanowić bardzo dobre źródło użytecznej energii. Ale Carnot założył, że nie można wykorzystać energii cieplnej w stałej temperaturze. Inaczej mówiąc, jeżeli cały Wszechświat znajdowałby się w tej samej temperaturze, to nie można by przekształcić żadnej z jego energii cieplnych na pracę. O ile procesy zamiany pracy na ciepło mogą zachodzić w stałej temperaturze, o tyle nie można ich odwrócić dla otrzymania pracy z powrotem. Ściśle mówiąc, Carnot twierdził, że ciepło w stałej temperaturze nie może być pobrane i zamienione na pracę bez dodatkowych zmian w układzie lub w otoczeniu.
280 44. ZASADY TERMODYNAMIKI Ostatnie zdanie jest bardzo ważne. Przypuśćmy, że mamy zbiornik sprężonego powietrza w stałej temperaturze i pozwolimy powietrzu się rozprężyć. Może ono wykonać pracę; może na przykład uruchomić młoty pneumatyczne. W trakcie rozprężania powietrze trochę się ochłodzi, ale jeżeli mamy wielkie morze, ocean, o stałej temperaturze — zbiornik ciepła — to możemy znów je ogrzać. A więc pobraliśmy ciepło z oceanu i wykonaliśmy pracę przy pomocy sprężonego powietrza. Carnot nie mylił się jednak, ponieważ nie pozostawiliśmy wszystkiego w poprzednim stanie. Jeżeli ponownie sprężymy powietrze, które się rozszerzyło, to przekonamy się, że wykonaliśmy dodatkową pracę i na końcu stwierdzimy, że nie tylko nie otrzymaliśmy pracy z układu w stałej temperaturze T, ale nawet jakąś pracę włożyliśmy. Musimy zająć się tylko takimi sytuacjami, w których jedynym rezultatem całego procesu jest pobranie ciepła i zamiana go na pracę, tak jak jedynym rezultatem procesu wykonywania pracy przeciw tarciu jest pobranie pracy i zamiana jej na ciepło. Jeżeli wykonujemy proces kołowy, to możemy przeprowadzić układ z powrotem do punktu wyjściowego, a jedynym rezultatem będzie wykonanie pracy przeciwko tarciu i wytworzenie ciepła. Czy można odwrócić ten proces? Jeżeli przestawimy przełącznik, tak aby wszystko przebiegło z powrotem, to czy tarcie wykona pracę przeciwko nam i oziębi morze? Według Carnota: nie! A więc załóżmy, że jest to niemożliwe. Gdyby to było możliwe, znaczyłoby to między innymi, że można wziąć ciepło od ciała zimnego i przekazać je ciału gorącemu bez żadnych strat. Wiemy, że zwykle ciało gorące może ogrzać zimne; jeżeli zetkniemy je ze sobą i nic poza tym nie zmienimy, nasze doświadczenie zapewnia nas, że ciało cieplejsze nie może jeszcze bardziej się ogrzać a zimniejsze ostygnąć! Ale jeżeli można by wykonać pracę pobierając ciepło z oceanu lub z innego źródła w stałej temperaturze, to można by ją także z powrotem zamienić za pomocą tarcia na ciepło w innej temperaturze. Tak na przykład inne ramię pracującej maszyny mogłoby trzeć o coś, co jest już gorące. Wtedy jednak w ostatecznym rachunku ciepło byłoby pobrane z „zimnego" ciała, oceanu, i przekazane ciału „gorącemu". Czasami więc hipotezę Carnota, drugą zasadę termodynamiki, formułuje się następująco: ciepło samo nie może płynąć od ciała zimnego do gorącego. Ale, jak widzieliśmy, te dwa sformułowania są równoważne: pierwsze, mówiące o tym, że nie można wymyślić procesu, którego jedynym wynikiem byłaby zamiana ciepła na pracę w stałej temperaturze, i drugie, że ciepło samo nie może przepływać z zimniejszego miejsca do cieplejszego. Częściej będziemy używali pierwszego sformułowania. Dokonana przez Carnota analiza silników cieplnych jest bardzo podobna do rozważań, które przeprowadziliśmy dla dźwigni w rozdz. 4 tomu I (cz. 1) przy omawianiu zasady zachowania energii. Właściwie wtedy wzorowaliśmy się na argumentacji Carnota dla silników cieplnych, a więc obecne rozważania nie wydadzą nam się obce. Przypuśćmy, że zbudowaliśmy silnik cieplny z „kotłem" o temperaturze T1. Taki silnik parowy będzie pobierał z kotła pewną ilość ciepła g,, wykonywał pracę W, a następnie przekazywał trochę ciepła Q2 do skraplacza (chłodnicy) o innej temperaturze 7\ (rys. 44.3). Carnot nie określił, ile ciepła silnik przekazuje, ponieważ nie znał pierwszej zasady i nie skorzystał z prawa, że Q2 równa się 2,, gdyż w nie nie wierzył. Chociaż wszyscy sądzili, że zgodnie z teorią cieplika Qi i Q2 powinny być równe, Carnot z tego nie korzystał i na tym między innymi polegała zręczność jego dowodu. My natomiast korzystając z pierw-
44-2. DRUGA ZASADA 281 szej zasady termodynamiki stwierdzamy, że ciepło Q2 przekazane chłodnicy równa się ciepłu pobranemu £?, minus wykonana praca W: Qi = Qi-W. (44.3) Wl 7J -0,* -%♦ T2 44.3. Silnik cieplny (Jeżeli mamy pewien proces cykliczny, w którym woda po skropleniu pary jest przepompowywana z powrotem do kotła, to powiemy, że zostało zaabsorbowane ciepło Qt i wykonana została praca W podczas każdego cyklu przy pewnej ilości krążącej cyklicznie wody.) Spróbujmy następnie zbudować inny silnik i zobaczymy, czy nie można otrzymać więcej pracy z tej samej ilości dostarczonego ciepła w temperaturze Tt, z chłodnicą o tej samej temperaturze T2. Pobieramy tę samą ilość ciepła Q, z kotła i spróbujemy otrzymać więcej pracy niż z silnika parowego używając tym razem innej cieczy, może np. alkoholu. 44-3. Silniki odwracalne Teraz musimy zbadać warunki pracy naszych silników. Jedno jest jasne: będą występować straty, jeżeli silniki będą miały urządzenia pracujące z tarciem. Najlepszym silnikiem byłby silnik bez tarcia. Dlatego też przyjmiemy stan idealny, podobnie jak przy badaniu zasady zachowania energii, tzn. założymy, że istnieje silnik pracujący bez tarcia. Musimy także znaleźć cieplny odpowiednik ruchu bez tarcia, „beztarciowe" przekazywanie ciepła. Jeżeli wywołamy przepływ ciepła stykając obiekt o wysokiej temperaturze z obiektem zimnym, to nie można zmienić kierunku tego przepływu dokonując tylko bardzo małej zmiany temperatury któregoś z obiektów. Tymczasem w mechanice mając maszynę pracującą praktycznie bez tarcia wystarczy podziałać na nią niewielką siłą w jakimś kierunku, żeby działała ona w tym kierunku, i wystarczy zmienić kierunek działania siły, by zmienić też kierunek ruchu maszyny. Chce/ny znaleźć odpowiednik ruchu bez tarcia: przepływ ciepła, którego kierunek możemy zmieniać drogą niewielkich zmian temperatury. Dla skończonej różnicy temperatur nie jest to do zrealizowania. Ale jeżeli okaże się, że ciepło płynie zawsze między dwoma ciałami o praktycznie tej samej temperaturze, a jedynie nieskończenie mała różnica temperatur określi kierunek jego przepływu, to przepływ ten nazywamy przepływem odwracalnym (rys. 44.4). Jeżeli nieznacznie ogrzejemy ciało z lewej strony, to ciepło popłynie na prawo, a jeżeli je trochę oziębimy, ciepło popłynie na lewo. A więc przekonujemy się, że idealnym silnikiem jest tak zwany silnik odwracalny, w którym każdy proces można odwrócić, czyli dokonując nieskończenie małych zmian można zmie- 44.4. Odwracalny przepływ ciepła st rumie
282 44. ZASADY TERMODYNAMIKI 44.5. Etapy w cyklu Carnota UJ a) iii i mi c) «0 2^ *-* A flz SI 5 r2 nić bieg silnika na przeciwny. Oznacza to, że nigdzie w silniku nie może występować dostrzegalne tarcie i że żadne zbiorniki cieplne, ani palenisko kotła nie może się stykać z niczym, co jest znacznie zimniejsze lub cieplejsze. Zajmijmy się teraz silnikiem idealnym, w którym wszystkie procesy są odwracalne. Chcąc wykazać, że taki silnik jest w zasadzie możliwy, damy przykład cyklu silnika, którego praktyczna realizacja nas nie obchodzi, ale który jest w każdym razie odwracalny, tak jak to rozumiał Carnot. Weźmy gaz zawarty w cylindrze z tłokiem poruszającym się bez tarcia. Gaz nie musi być gazem doskonałym. Płyn roboczy nie musi być nawet gazem, ale żeby się nie rozpraszać, weźmy gaz doskonały. Oprócz tego potrzebne są nam dwa duże zbiorniki ciepła o stałych temperaturach 7\ oraz T2 (rys. 44.5). Przyjmiemy, że Tt jest wyższe od T2. Najpierw ogrzewamy gaz i jednocześnie rozprężamy go, utrzymując go w kontakcie ze zbiornikiem o temperaturze Tt. Gdy zadbamy o to, by tłok wysuwał się bardzo powoli z cylindra podczas dopływu ciepła, będziemy pewni, że temperatura nigdy nie odbiegnie znacznie od temperatury Tt. Jeżeli wyciągniemy tłok zbyt prędko, to temperatura szybko spadnie poniżej wartości Tt i wówczas proces przestanie być w ogóle procesem odwracalnym. Tylko wtedy gdy tłok wyciągamy odpowiednio wolno, temperatura nigdy nie oddali się zbytnio od Tt. Podobnie przy powolnym wsuwaniu tłoka temperatura bardzo nieznacznie różniłaby się od T, i ciepło odpłynęłoby z cylindra. Widzimy więc, że takie izotermiczne (przy stałej temperaturze) rozszerzanie dokonywane powoli i dostatecznie delikatnie jest procesem odwracalnym. Do zrozumienia tego, co robimy, potrzebny nam będzie wykres, (rys. 44.6) zależności ciśnienia gazu od jego objętości. Gdy gaz się rozszerza, jego ciśnienie maleje. Krzywa oznaczona (/) pokazuje, jak zmienia się ciśnienie i objętość, jeżeli utrzymujemy stałą wartość tempera-
♦4-J. SILNIKI ODWRACALNE 283 tury 7\. Dla gazu doskonałego tę krzywą powinna opisywać zależność pv=NkTt. Podczas izotermicznego rozprężenia gazu ciśnienie maleje ze wzrostem objętości aż do punktu b. Jednocześnie pewna ilość ciepła Qx musi przepłynąć ze zbiornika do gazu, ponieważ gdyby gaz rozszerzał się nie będąc w kontakcie ze zbiornikiem ciepła, to jak już wiemy, oziębiłby się. Po skończeniu izotermicznego rozprężania w punkcie b odsuńmy cylinder od zbiornika ciepła i nadal rozprężajmy gaz. Tym razem ciepło nie będzie mogło wpłynąć do cylindra. Ponieważ rozprężenie ciągle przeprowadzamy powoli, nie ma powodu, dlaczego nie moglibyśmy go odwrócić, zakładając jak poprzednio, że tarcie nie występuje. Gaz rozszerza się nadal i jego temperatura maleje, ponieważ teraz ciepło już nie dopływa do cylindra. Pozwolimy, żeby gaz się rozszerzał zgodnie z krzywą oznaczoną (2), aż temperatura jego spadnie do T2, w punkcie oznaczonym c. Takie rozprężenie gazu, bez dopływu ciepła, nazywa się rozprężaniem adiabatycznym. Wiemy już, że dla gazu doskonałego krzywa (2) ma kształt PVy = const, gdzie y jest stałą większą od jedności, a więc adiabata jest bardziej nachylona niż izoterma. Cylinder z gazem ma teraz temperaturę 7\, a więc nie wywołamy zmian nieodwracalnych, gdy zetkniemy go ze zbiornikiem o temperaturze 7\. Następnie powoli sprężamy gaz zgodnie z krzywą (i), podczas gdy cylinder styka się ze zbiornikiem ciepła o temperaturze T2 (rys. 44.5, etap 2). Ponieważ cylinder jest w kontakcie cieplnym ze zbiornikiem o temperaturze T2, temperatura gazu nie wzrasta, ale ciepło Q2 przepływa z cylindra do tego zbiornika. Po izotermicznym sprężeniu gazu wzdłuż izotermy (i) do punktu d usuwamy zbiornik o temperaturze T2 i nadal sprężamy gaz nie dopuszczając do ucieczki ciepła. Temperatura będzie teraz wzrastała, a ciśnienie będzie się zmieniało zgodnie z krzywą (4). Jeżeli każdy etap wykonamy właściwie, możemy wrócić do punktu a o temperaturze 7",, z którego wystartowaliśmy, i cykl powtórzyć. Widzimy z tego wykresu, że wykonaliśmy z gazem pełny cykl, podczas którego dostarczyliśmy ciepło Q, w temperaturze 7", i usunęliśmy ciepło Q2 w temperaturze T2. Istotne znaczenie ma odwracalność cyklu, dzięki której możemy wszystkie etapy wykonać w innej kolejności. Moglibyśmy postępować odwrotnie: wyruszyć z punktu a z temperaturą Tt, rozprężyć gaz zgodnie z krzywą (4), dalej rozprężać go w temperaturze T2 pobierając ciepło Q2 ttd., przechodząc pełny cykl w przeciwnym kierunku. Przebiegając cykl w jednym kierunku musimy wykonać pracę nad gazem, w przeciwnym — gaz pracuje dla nas. Okazuje się, że łatwo można obliczyć całkowitą pracę wykonaną, ponieważ praca podczas rozprężenia gazu równa się iloczynowi ciśnienia i zmiany objętości \PdV. Na pole powierzchni = = praca użyteczna objętość 44.6. Cykl Carnota, a) Rozszerzanie izo- termtczne w temperaturze 7",, absorpcja ciepła Qt, b) rozszerzanie adiabatyczne; temperatura spada od T, do T2, c) sprężanie izotermiczne w temperaturze T2, wydzielanie ciepła £>i, d) sprężanie adiabatyczne, temperatura wzrasta od T2 do 7",
284 44. 7ASADY TERMODYNAMIKI 7"i * i' A ł 1 ■+-W 1 02 ł fi 1 , o,-iv' ł praca użyteczna T2 44.7. Silnik odwracalny 4 pracuje w siecz kosztem silnika B naszym wykresie odłożyliśmy objętość \ na osi poziomej, a ciśnienie P — na osi pionowej. Jeżeli więc zmienną na osi pionowej nazwiemy >■, a na poziomej .y, to praca równa się J y dx — inaczej mówiąc, jest to powierzchnia zawarta pod krzywą. Czyli powierzchnia pod każdą z oznaczonych krzywych jest miarą pracy wykonanej odpowiednio przez gaz lub nad gazem, w zależności od kierunku przejścia. Łatwo się przekonać, że praca wypadkowa równa się powierzchni zakres- kowanej na wykresie. Pamiętając o przytoczonym przykładzie silnika odwracalnego, przyjmiemy, że są możliwe także i inne takie silniki. Weźmy odwracalny silnik A, który pobiera ciepło Qv w temperaturze Tt, wykonuje pracę W i wydziela pewną ilość ciepła w temperaturze T2. Załóżmy też, że mamy jeszcze jeden silnik B, obojętnie czy już wykonany, czy też jeszcze nie wynaleziony, „gumkowy", parowy lub jakiś inny odwracalny lub nie. Przy tym jest on tak zaprojektowany, że pobiera tę samą ilość ciepła Qt w temperaturze 7", i wydziela pewną ilość ciepła w niższej temperaturze T2 (rys. 44.7). Załóżmy, że silnik ten wykonuje pewną pracę W. Udowodnimy teraz, że W nie jest większe od W, że żaden więc silnik nie może wykonać większej pracy od silnika odwracalnego. Dlaczego? Przypuśćmy, że rzeczywiście W jest większe niż W. Możemy wówczas wziąć ciepło (?, ze zbiornika o temperaturze 7', i za pomocą silnika B wykonać pracę W, wydzielając jakąś - mniejsza o to jaką - ilość ciepła do zbiornika o temperaturze 7\. Mamy więc do swej dyspozycji pracę W, która, jak przyjęliśmy, jest większa od l\ . Możemy skorzystać tylko z jej części równej W. a pozostałą część W — >f zaoszczędzić na pracę użyteczną. Kosztem pracy W możemy uruchomić silnik A w odwrotnym kierunku, ponieważ jest on silnikiem odwracalnym. Silnik ten zaabsorbuje wtedy pewną ilość ciepła ze zbiornika o temperaturze T2 i przekaże z powrotem ciepło Q, do zbiornika o temperaturze T,. W wyniku tego podwójnego cyklu wszystko powróci do stanu wyjściowego i ponadto otrzymamy pewną pracę dodatkową, mianowicie W" — W Pracę tę uzyskaliśmy pobierając energię ze zbiornika o temperaturze TĄ Zadbaliśmy przy tym. by ciepło Qt zostało /wrócone do zbiornika T,. Zbiornik ten nie musi być duży i możemy go schować „wewnątrz" naszego złożonego silnika A + B. którego rola sprowadzi się do pobrania wypadkowego ciepła W W ze zbiornika o temperaturze T2 i przekształcenie go na pracę. Zgodnie jednak / postulatem Carnota otrzymanie pracy użytecznej ze zbiornika ciepła v\ stałej temperatur/e bez żadnych zmian dodatkowych jest niemożliwe, nie można tego po prostu dokonać. Dlatego żaden silnik pobierający określoną ilość ciepra ze zbiornika o wyższej temperaturze 7", i przekazujący ją do zbiornika o temperaturze T: nie może wykonać większej prac> niż silnik odwracaln) pracujący w tych samych tempera" turach T, i T2. Załóżmy teraz, że silnik B jest także odwracalny. Wówczas oczywiście nie tylko "
44-3. SILNIKI ODWRACALNE 285 nie może być większe od W, ale odwracając dowód można wykazać, że również W nie może być większe od W. A więc widzimy, że dwa silniki odwracalne muszą wykonywać taką samą pracę i w ten sposób dochodzimy do wspaniałego wniosku Carnota: jeżeli silnik jest odwracalny, jego konstrukcja nie odgrywa żadnej roli, ponieważ praca, którą otrzymamy, gdy silnik pobiera określoną ilość ciepła w temperaturze T, i wydzieli pewną jego ilość w temperaturze 7\, nie zależy od konstrukcji silnika. Jest to właściwość świata, a nie określonego silnika. Jeżeli będziemy w stanie sformułować prawo, które określi, ile otrzymamy pracy, gdy pobieramy ciepło Qv w temperaturze Tt i wydzielimy pewną jego ilość w temperaturze 7~2, to wartość tej pracy będzie uniwersalna, niezależna od substancji. Oczywiście, znając własności wybranej substancji, możemy obliczyć tę ilość pracy i stwierdzić, że wszystkie inne substancje dostarczą tyle samo pracy w silniku odwracalnym. Jest to właśnie najistotniejszy wniosek, idea przewodnia, dzięki której możemy znaleźć na przykład zależność między kurczeniem się ogrzewanej gumki i jej oziębieniem, gdy pozwolimy jej się skurczyć. Wyobraźmy sobie, że dołączyliśmy tę gumkę do odwracalnego silnika i wykonaliśmy pełny odwracalny cykl. Wypadkowy wynik, całkowita ilość wykonanej pracy, jest funkcją uniwersalną, wspaniałą funkcją, która nie zależy od substancji. A więc stwierdzamy, że własności substancji są w jakiś sposób ograniczone, nie można sporządzić wszystkiego, co by się chciało, nie można więc wynaleźć substancji, która użyta w silniku dałaby więcej pracy niż maksymalnie dostępna praca, którą się otrzymuje z silnika odwracalnego. Ta zasada, to ograniczenie, jest najistotniejszym wnioskiem wynikającym z termodynamiki. 44-4. Sprawność silnika idealnego Spróbujemy teraz znaleźć prawo, które określa pracę W'jako funkcję ciepła Qt i temperatury Tt oraz T2. Praca W jest oczywiście proporcjonalna do (2i - Jeśli bowiem weźmiemy pod uwagę dwa silniki odwracalne, pracujące równolegle, stanowiące jeden podwójny silnik, stwierdzimy, że zespół ten jest także silnikiem odwracalnym. Jeżeli każdy z silników absorbuje ciepło Qu to obydwa absorbują ciepło 2Qt i wykonują pracę równą 2WX itd. Zupełnie więc uzasadniony jest wniosek, że W jest proporcjonalne do Qt. Kolejnym ważnym krokiem jest sformułowanie tego uniwersalnego prawa. Możemy zająć się odwracalnym silnikiem zjedna wybraną substancją, której prawa znamy, z gazem doskonałym. Tak właśnie postąpimy. Można też otrzymać to prawo za pomocą tylko logicznych argumentów, nie używając żadnej wybranej substancji. Jest to jedno z najpiękniejszych rozumowań w fizyce i nie mamy zamiaru go czytelnika pozbawiać. Zainteresowanych czytelników zaznajomimy z nim nieco później. Najpierw jednak powinniśmy się zająć znacznie mniej abstrakcyjnym i prostszym wyprowadzeniem dla gazu doskonałego. Potrzebujemy tylko wzorów dla Qx oraz Q2 (zrówna się Q\-Q2), tzn. dla ciepeł wymienianych między zbiornikami podczas izotermicznego rozprężania lub sprężania Chodzi nam o to, ile np. ciepła Qt jest pochłaniane ze zbiornika o temperaturze T, podczas izotermicznego rozprężania oznaczonego (/) na rys. 44.6 od punktu a odpowiadającego ciśnieniu pa, objętości V i temperaturze Tx do punktu b z ciśnieniem równym pbl objętością
286 44. ZASADY TERMODYNAMIKI Vb oraz tą samą temperaturą 7\. Każda cząsteczka gazu doskonałego ma energię zależną tylko od temperatury, a ponieważ temperatura oraz liczba cząsteczek są takie same w punktach a i b, więc wewnętrzne energie są też takie same. Energia wewnętrzna U zatem się nie zmienia. Cała praca wykonana przez gaz, * W= \pdV, a podczas rozprężania równa się energii Qt pobranej ze zbiornika. W czasie tego rozprężania spełnione jest równanie pV=NkTf, czyli NfcT, V co prowadzi do zależności a stąd -J b b f dV pdV= | NfcT,—, (44.4) J Vi 'a Qx jest ciepłem pobranym ze zbiornika w temperaturze Tx. Podobnie podczas sprężania w temperaturze T2 [krzywa (i) na rys. 44.6] ciepło wydzielone do zbiornika T2 równa się Q2 = NkT2 In—. (44.5) Ki Do zakończenia naszej analizy brak nam jeszcze tylko zależności między Vc\ Va oraz Vb\Va. Otrzymamy ją biorąc pod uwagę, że krzywa (2) ilustruje adiabatyczne rozprężanie od punktu b do c, podczas którego p Vy jest stałe. Ponieważ p V= Nk T, możemy równanie adiabaty zapisać jako (/?F)Fy_I= const lub przy pomocy T i V jako TVy~i= const, albo też TlVl~1=T1Vl-1 (44.6) Podobnie, ponieważ krzywa (4) od punktu d do a także przedstawia rozprężanie adiabatyczne, otrzymujemy ^1K^, = 7-2^7-, (44.6a) Dzieląc oba równania stronami, znajdujemy, że VJVa musi równać się VJV^ a więc logarytmy w równaniach (44.4) muszą być równe, czyli ?± =-?2 (44.7) T, T2 O tę właśnie zależność nam chodziło. Chociaż udowodniliśmy ją w przypadku silnika z ga' zem doskonałym, wiemy, że musi ona być słuszna dla każdego silnika odwracalnego- Zobaczymy teraz, jak to uniwersalne prawo może być uzasadnione logicznie, bez ucieka-
44-4. SPRAWNOŚĆ SILNIKA IDEALNEGO 287 |3~[—«-^i2 <?2 kV, "■32" -W, ™3 nia się do określonych substancji. Weźmy trzy silniki i trzy temperatury, powiedzmy Tt,T2,T3. Niech jeden z silników pochłania ciepło (?, ze zbiornika o temperaturze Tt, wykonuje pewną pracę Wl3 i przekazuje ciepło Q3 do zbiornika o temperaturze T3 (rys. 44.8). Niech zaś drugi silnik pracuje w odwrotnym kierunku, od T2 do T3. Wybierzmy tak ten drugi silnik,aby pochłaniał tę samą ilość ciepła Q3, którą wydzielił silnik pierwszy, i wydzielał pewną ilość ciepła Q2 ■ Będziemy musieli włożyć do niego pewną pracę W32 — ujemną, ponieważ pracuje on w kierunku odwrotnym. Gdy pierwszy silnik wykona cykl, pochłonie ciepło (?, i wydzieli ciepło Q3 w temperaturze T3; następnie drugi silnik pochłonie tę samą ilość ciepła Q3 ze zbiornika o temperaturze T3 i przeniesie ją do zbiornika o temperaturze T2. Jedynym zatem wynikiem jednoczesnej pracy obu silników jest pochłonięcie ciepła Q i ze zbiornika o temperaturze 7*, i wydzielenie ciepła Q2 do zbiornika o temperaturze T2. Oba te silniki są więc równoważne trzeciemu, który pochłania ciepło Qt ze zbiornika o temperaturze 7",, wykonuje pracę Wl2 i wydziela ciepło Q2 w temperaturze T2, ponieważ W12=Wl3 — W32, co można łatwo udowodnić na podstawie pierwszej zasady termodynamiki w następujący sposób: 44.8. Silniki 1 i 2 pracując razem są równoważne silnikowi 3 n\*-W32={Ql-Qi)-{Q2-Qi)=Qi-Qi = Wl2. (44.8) Możemy teraz otrzymać prawo wiążące sprawności tych silników, ponieważ musi oczywiście istnieć jakaś zależność między sprawnościami silników pracujących między temperaturami 7, i T3, T2 i T3 oraz 7", i T2. Można to bardzo przekonująco udowodnić: przed chwilą widzieliśmy, że zawsze możemy związać ciepło pochłonięte w temperaturze Tt z ciepłem wydzielonym w temperaturze 7\, znajdując ciepło wydzielone w jakiejś innej temperaturze T3. Dlatego możemy zbadać wszystkie własności silników wprowadzając standardową temperaturę i badając wszystko przy jej pomocy. Zgodnie z tym, jeżeli będziemy znać sprawność silnika pracującego między pewną temperaturą T oraz inną dowolną standardową temperaturą, zawsze będziemy mogli otrzymać sprawność dla dowolnej innej różnicy temperatur Ponieważ przyjęliśmy, że posługujemy się silnikami odwracalnymi, możemy więc ustalić ich warunki pracy od pewnej początkowej temperatury do niższej temperatury standardowej i z powrotem znów do końcowej temperatury. Temperaturę standardową zdefiniujemy zupełnie dowolnie jako jeden stopień. Przyjmiemy także specjalne oznaczenie dla ciepła wydzielonego w tej temperaturze: oznaczymy je symbolem Qs. Inaczej mówiąc, jeżeli silnik odwracalny pochłania ciepło Q w temperaturze T, to w jednostkowej temperaturze wydzieli ciepło Qs. Jeżeli zatem jeden silnik, pochłaniający ciepło Qx w temperaturze T,, wydziela ciepło Q, w temperaturze jednego stopnia i jeżeli inny silnik, pochłaniający ciepło Q2 w temperaturze T2, wydzieli taką samą ilość ciepła Qs w temperaturze jednego stopnia, to stąd wynika, że silnik, który
288 44. ZASADY TERMODYNAMIKI pochłania ciepło Qt w temperaturze Tt, wydzieli ciepło Q2, jeśli pracuje między temperaturami 7\ oraz T2, jak to udowodniliśmy mówiąc o silnikach pracujących między trzema temperaturami. A więc musimy teraz po prostu obliczyć, ile należy dostarczyć ciepła Q w temperaturze 7\, aby wydzieliła się pewna ilość ciepła Q, w-temperaturze jednostkowej. Kiedy to obliczymy, będziemy już wiedzieli wszystko. Ciepło Q jest oczywiście funkcją temperatury T. Łatwo wykazać, że ciepło musi wzrastać, gdy rośnie temperatura, gdyż jak wiemy, do wstecznego biegu silnika i wydzielania ciepła w wyższej temperaturze potrzebna jest praca. Łatwo też zauważyć, że Qt musi być proporcjonalne do Qs. A więc to wielkie prawo może brzmieć tak: Jeśłi silnik cieplny pobierający w temperaturze T ciepło Q wydziela w temperaturze jednego stopnia ciepło Qs, to ciepło absorbowane Q musi równać się iloczynowi Q, i pewnej rosnącej funkcji temperatury: Q = QJ(T). (44.9) 44-5. Termodynamiczna skala temperatur Na razie nie chcemy znajdować wzoru wiążącego powyższą rosnącą funkcję temperatury z naszą znaną rtęciową skalą temperatur. Zamiast tego zdefiniujemy nową skalę temperatury. Kiedyś „temperaturę" definiowano zupełnie dowolnie, dzieląc ściankę rurki zawierającą rozszerzający się słupek wody na równe części, które nazwano stopniami. Ale gdy zmierzono następnie temperaturę termometrem rtęciowym, przekonano się, że odległości między stopniami nie są już równe. Teraz jednak możemy podać definicję temperatury, która nie zależy od wybranej substancji. Możemy skorzystać w tym celu z funkcji f(T), która nie zależy od użytego przez nas urządzenia, ponieważ wydajność silników odwracalnych nie zależy od ich substancji roboczych. Skoro otrzymana funkcja f(T) jest rosnącą funkcją temperatury, możemy ją zdefiniować jako samą temperaturę, mierzoną w jednostkach standardowej temperatury równej jednemu stopniowi: Q = ST, (44.10) gdzie Qs = S-r. (44.11) To znaczy, że będziemy określali temperaturę obiektu obliczając, ile ciepła pochłonie silnik odwracalny pracujący między temperaturą tego obiektu i temperaturą jednostkową (rys. 44.9). Jeżeli, na przykład, siedmiokrotnie więcej ciepła zostało pobrane z kotła niż przekazane do chłodnicy o temperaturze równej jednemu stopniowi, to temperaturę kotła określimy jako siedem stopni itd. A więc mierząc, ile ci;pła zostaje pochłonięte w różnych temperaturach, określamy jednocześnie te temperatury. Zdefiniowana w ten sposób temperatura nosi nazwę bezwzględnej temperatury termodynamicznej i nie zależy od substancji- Poczynając od tego miejsca będziemy posługiwali się wyłącznie tą definicją temperatury*'. *' Poprzednio zdefiniowaliśmy naszą skalę temperatur inaczej. Stwierdziliśmy mianowicie. *e średnia energia kinetyczna cząsteczek gazu doskonałego jest proporcjonalna do temperatury, czyi" w z prawa gazu doskonałego wynika, \żpV jest proporcjonalne do T. Czy ta nowa definicja jest jej ro** noważna? Tak, ponieważ końcowy wynik (44.7) wyprowadzony z prawa gazu doskonałego jest ta sam. jak przytoczony tutaj. Zajmiemy się tym jeszcze raz w następnym rozdziale.
44-5. TERMODYNAMICZNA SKALA TEMPERATUR 289 Widzimy więc, że gdy dwa silniki, jeden pracujący między temperaturą T, i temperaturą jednego stopnia, a drugi między temperaturą T2 i temperaturą jednego stopnia, wydzielają to samo ciepło w jednostkowej temperaturze, wówczas ciepła pochłonięte związane są zależnością: Qi Q.^ -- = S = — . (44.12) T, T2 To zaś oznacza, że dla silnika pochłaniającego energię Qv w temperaturze T, i wydzielającego ciepło Q2 w temperaturze T2, Q, tak się ma do 7"i, jak Q2 do T2. Jest to najistotniejszy wynik całej naszej analizy, jej wspaniały finał. Ta zależność musi być spełniona dla każdego silnika odwracalnego. Zawiera się w niej wszystko: jest to istota całej termodynamiki. Jeżeli w tej zależności zawarta jest istota termodynamiki, to dlaczego uważa się ją za tak trudny przedmiot? Przy rozwiązywaniu zadania dotyczącego jakiejś substancji, której masa się nie zmienia, stan tej substancji opisujemy podając w danej chwili jej temperaturę i objętość. Jeżeli znamy temperaturę i objętość substancji oraz wiemy, że ciśnienie jest pewną funkcją temperatury i objętości, wówczas wiemy, jaka jest energia wewnętrzna. Ktoś mógłby jednak powiedzieć: „To mi nie odpowiada. Powiedz mi, jaka jest temperatura i ciśnienie, a ja ci podam objętość. Mogę przecież traktować objętość jako funkcję temperatury i ciśnienia, a energię wewnętrzną też jako funkcję temperatury i ciśnienia itd." Termodynamika dlatego właśnie jest trudna, że każdy stosuje ją inaczej. Gdybyśmy mogli wszyscy razem zssiąść, uzgodnić nasze zmienne i trzymać się ich stale, wówczas termodynamika byłaby zupełnie łatwym przedmiotem. Teraz zaczniemy wyciągać wnioski. Tak jak zależność F=ma stanowi istotę mechaniki, która w całości z niej wynika, tak i zasada, którą przed chwilą sformułowaliśmy, stanowi podstawę całej termodynamiki. Ale czy można z niej wyciągnąć wnioski? Właśnie zaczynamy to robić. W celu otrzymania pierwszego wniosku musimy skorzystać z obu zasad: zasady zachowania energii i tej zasady, która wiąże ciepło Q2 i £?,. Łatwo wówczas otrzymamy sprawność silnika odwracalnego. Z pierwszej zasady mamy tV= = Qi — Q2. Zgodnie z naszą nową zasadą T2 'i a więc praca równa się H'=e,(i-^=e,^~^, (44.13) co określa nam sprawność silnika - ile pracy otrzymamy z danej ilości ciepła. Sprawność silnika jest wprost proporcjonalna do różnicy temperatur, między którymi silnik pracuje, — silnik odwracalny ■W=Q-S-1° ':w/.w lv"; 1°K 44.9. Bezwzględna temperatura termodynamiczna
290 44 ZASADY TERMODYMAMl podzielonej przez wyższą temperaturę: tt Tt-T2 sprawność = — =— — (44 l&\ G. T2 K l4) Sprawność nie może być większa od jedności, a bezwzględna temperatura nie może być mniejsza od bezwzględnego zera. A więc skoro T2 musi być dodatnia, to sprawność jest sze mniejsza od jedności. 1 to jest właśnie nasz pierwszy wniosek. 44-6. Entropia Równania (44.7) lub (44.12) można interpretować w specjalny sposób. W cyklu pracy silników odwracalnych ciepło (?, w temperaturze T, jest „równoważne" ciepłu Q2 w temperaturze T2, jeżeli QilTt = Q2/T2, przy czym jedno z tych ciepeł jest pochłaniane, a drugie wydzielane. Fakt ten wyróżnia w jakiś sposób wielkość QjT. Możemy bowiem powiedzieć: w procesach odwracalnych ta sama „ilość" wielkości QjT zostaje pochłonięta co wydzielona, nie ma straty, ani zysku QjT. Iloraz Q/T nazywamy entropią. Mówimy, że „entropia nie zmienia się w ciągu cyklu odwracalnego". Jeżeli 7"równa się 1°, wówczas entropia równa się (2/1° lub zgodnie z naszym oznaczeniem £?S/1° = S. W rzeczywistości właśnie S'jest oznaczeniem zwykle używanym dla entropii, która liczbowo równa się ciepłu wydzielonemu (oznaczonemu przez nas Qs)do zbiornika o temperaturze 1° (sama entropia nie jest ciepłem, lecz ciepłem podzielonym przez temperaturę, a więc mierzy się ją w dzidach na stopień). Ciekawe, że oprócz ciśnienia będącego funkcją temperatury i objętości oraz energii wewnętrznej, która również jest funkcją temperatury i objętości, znaleźliśmy inną wielkość, która jest funkcją stanu, a mianowicie entropię substancji. Spróbujmy wyjaśnić, jak ją obliczamy, oraz co mamy na myśli mówiąc, że jest ona „funkcją stanu". Zajmijmy się układem w dwóch różnych stanach, podobnych do tych, o których mówiliśmy przy doświadczeniu z izotermicznym i adiabatycznym rozprężeniem gazu. (Nawiasem mówiąc, nie musimy mieć tylko dwóch zbiorników w silniku cieplnym, silnik może mieć trzy lub cztery zbiorniki o różnych temperaturach, w których pochłania ciepło lub je wydziela.) Możemy przechodzić od jednego stanu do drugiego poruszając się swobodnie po wykresie pV. Inaczej mówiąc, możemy twierdzić, że gaz jest w pewnym stanie a, a następnie przechodzi w inny stan b i żądamy przy tym, aby to przejście od stanu a do i było odwracalne. Załóżmy, że wzdłuż drogi od stanu a do b znajdują się małe zbiorniki ciepła o różnych temperaturach. Ciepło dQ pobrane od substancji w każdym małym odcinku drogi od a do b jest przekazywane do odpowiedniego zbiornika o temperaturze odpowiadającej punktowi na tej drodze. Następnie połączymy wszystkie zbiorniki odwracalnymi silnikami cieplnymi z jednym zbiornikiem o jednostkowej temperaturze. Gdy zakończymy przeprowadzanie substancji od stanu a do b. powinniśmy doprowadzić wszystkie zbiorniki do ich stanu początkowego. Ciepło dQ pobrane od substancji w temperaturze T zostaje przekształcone przez silnik odwracalnyi a w jednostkowej temperaturze zostanie wydzielona pewna ilość entropii dS: dS = dQIT. (44.15)
44-6. ENTROPIA 291 Obliczmy całkowitą ilość wydzielonej entropii- Różnica entropii, czyli entropia potrzebna do przejścia ze stanu a do b drogą wybranego odwracalnego przejścia, równa się całkowitej entropii, tzn. sumie entropii pobranych od małych zbiorników cieplnych i wydzielonych w jednostkowej temperaturze: -f dQ T (44.16) ro 5 TO O CL E ą >a Q s ©A OY I r*b J zbiorniki doT v Y JL JL X dw-C\ 0 D U U L ds-iT T T T ♦ UH J silniki ' objętość 44.10. Zmiana entropii podczas przejścia odwracalnego Powstaje pytanie: czy powyższa różnica entropii zależy od wybranej drogi? Istnieje przecież wiele dróg prowadzących od stanu a do b. Pamiętajmy, że w cyklu Carnota pokazanym na rys. 44.6 mogliśmy przejść ze stanu a do c najpierw rozprężając gaz izotermicznie, a następnie adiabatycznie, lub też moglibyśmy najpierw przejść adiabatę, a następnie izotermę. Pytamy więc, czy zmiana entropii zachodząca przy przejściu od stanu a do b na rys. 44.10 jest taka sama na różnych drogach? Musi ona być taka sama, idąc bowiem najpierw jedną drogą ze stanu a do b i powracając jakąś inną wykonalibyśmy pełny cykl silnika odwracalnego, w którym, jak wiemy, nie byłoby żadnej straty ciepła na rzecz zbiornika o jednostkowej temperaturze. W całkowicie odwracalnym cyklu ze zbiornika o temperaturze jednostkowej nie trzeba też pobierać żadnego ciepła, a więc entropia potrzebna do przejścia od a do b jest na różnych drogach taka sama. Nie zależy ona zatem od drogi, a tylko od jej krańcowych punktów. Możemy więc powiedzieć, że istnieje pewna funkcja, zwana entropią substancji, która zależy tylko od stanu substancji, tzn. tylko od jej objętości i temperatury. Można znaleźć funkcję S(V, T), która ma tę właściwość, że gdy liczymy zmianę entropii przy pomocy ciepła wydzielonego w jednostkowej temperaturze podczas przejścia Drzez substancję pewnej odwracalnej drogi, to dQ T AS= -?, (44.17) gdzie dQ oznacza ciepło pobrane od substancji w temperaturze T. Całkowita zmiana entropii równa się różnicy między entropią obliczoną w punkcie początkowym i końcowym: AS = S(Vb,Tb)-S(Va,Ta) i -I dQ T (44.18) Wyrażenie powyższe nie określa całkowicie entropii, lecz podaje tylko różnicę między jej wartościami dla dwóch różnych stanów. Bezwzględną wartość entropii możemy określić dopiero po obliczeniu entropii pewnego wybranego stanu.
292 44 ZASADY TERMODYNAMIKI Długo wierzono, że bezwzględna wartość entropii nie ma sensu, że można określić tylko jej różnicę. Wyjście z tej sytuacji znalazł w końcu Nernst, który zaproponował twierdzenie, nazwane przez niego twierdzeniem o cieple; zwane jest ono również trzecią zasadą termodynamiki. Zasada ta jest bardzo prosta. Przytoczymy ją tu bez dowodu. Postulat Nernsta głosi po prostu, że entropia dowolnego obiektu w temperaturze zera bezwzględnego równa się zeru. Znamy więc war- objętość togć- entropii dla jednego stanu, mianowicie ..,,„. ... .. . . dla T=0 wynosi ona 5=0. Dzięki temu mo- 44.11. Zmiana entropii przy przejściu całego J . . odwracalnego cyklu żerny podać entropię każdego innego stanu. Aby zilustrować tę ideę, obliczymy entropię gazu doskonałego. Podczas izotermicznego rozprężania (będącego procesem odwracalnym) \dQIT=QIT, gdyż temperatura T jest stała. Dlatego zgodnie z wzorem (44.4) zmiana entropii równa się S(<v,T)-S(<vfc,T) = Mcln^, a więc S(V, T) = NK\n Fplus pewna funkcja samej tylko temperatury T. W jaki sposób 5 zależy od Tl Wiemy, że w adiabatycznym odwracalnym rozprężaniu nie ma wymiany ciepła. Wtedy więc entropia nie zmienia się, mimo że zmieniają się V i T tak, że 7Vr-1=const. Czy potrafisz stąd Czytelniku wywnioskować, że S(V,T) = Nk In V+ In T La , gdzie a jest pewną stałą, która nie zależy ani od V, ani od T, zwaną stałą chemiczną? [Stała a zależy od gazu, którego entropię obliczamy i można ją wyznaczyć eksperymentalnie na podstawie twierdzenia Nersta przez pomiar ciepła wydzielonego podczas oziębiania i skraplania gazu aż do jego zestalenia (lub w przypadku helu aż do osiągnięcia fazy ciekłej) w temperaturze 0° K. Następnie trzeba obliczyć \dQ\T. Stałą tę można także otrzymać na drodze teoretycznej za pomocą mechaniki kwantowej i wyrazić ją poprzez stałą Plancka, ale w bieżącym kursie nie będziemy się tym zajmowali.] Zwróćmy jeszcze uwagę na pewne własności entropii. Przede wszystkim pamiętamy, że przy odwracalnym przechodzeniu od stanu a do b entropia substancji zmienia się o Sb—Sa. Oprócz tego wiemy, że przy przechodzeniu tej drogi entropia, czyli ciepło wydzielone w zbiorniku o jednostkowej temperaturze, wzrasta zgodnie ze wzorem dS=dQ/T, gdzie dQ jest ciepłem, które pobieramy od substancji, gdy jej temperatura wynosi T. Wiemy też, że wykonując cykl odwracalny nie zmieniamy całkowitej entropii całego układu, ponieważ ciepłu £>, pochłoniętemu w temperaturze 7, oraz ciepłu Q2 wydzielone- to 3 ra S a E 0) AS = Sa-Sb a * y^b / AS=Sb-Sa
44-6. ENTROPIA 293 mu w temperaturze T2 odpowiadają zmiany entropii równe co do wartości bezwzględnej o przeciwnych tylko znakach, tak że wypadkowa zmiana entropii równa się zeru. A więc podczas odwracalnego cyklu entropia całości, włączając zbiorniki ciepła, nie zmienia się. Ta zasada może się wydawać podobna do zasady zachowania energii, ale jest to podobieństwo pozorne, stosuje się ona bowiem tylko do procesów odwracalnych. Jeżeli uwzględnimy procesy nieodwracalne, zasada zachowania entropii przestanie obowiązywać. Podamy teraz dwa przykłady. Najpierw założymy, że nad pewnym obiektem wykonujemy pracę w sposób nieodwracalny pokonując tarcie, wytwarzamy wtedy ciepło Q w pewnej temperaturze T Entropia wzrasta o Q/T. Ciepło Q równa się pracy i dlatego gdy wykonamy pewną pracę przeciwko tarciu, którego doznaje obiekt o temperaturze T, entropia Wszechświata wzrasta o WIT. A oto następny przykład procesu nieodwracalnego. Jeżeli zetkniemy dwa obiekty o różnych temperaturach, powiedzmy 7, i T2, wystąpi przepływ pewnej ilości ciepła od jednego z nich do drugiego. Włóżmy na przykład gorący kamień do zimnej wody. O ile zmieni się entropia gorącego kamienia, gdy pewna ilość ciepła AQ zostanie przekazana od T, do T21 Zmaleje ona o AQ/Tt. A o ile zmieni się entropia wody? Wzrośnie o AQjT2. Ciepło oczywiście będzie płynęło od wyższej temperatury T, do niższej T2, a więc AQ będzie dodatnie, gdy 7", będzie większe od T2. A zatem zmiana entropii całego Wszechświata będzie dodatnia i równa różnicy dwóch ułamków AQ AQ AS = ~ * (44.19) T2 7, Jest więc prawdziwe następujące twierdzenie: w każdym nieodwracalnym procesie entropia Wszechświata wzrasta. Tylko podczas procesów odwracalnych entropia pozostanie stała. Ponieważ w rzeczywistości żaden proces nie będzie całkowicie odwracalny, zawsze będzie musiał nastąpić minimalny chociażby wzrost entropii; procesy odwracalne są pewną idealizacją takich procesów, w których wzrost entropii jest minimalny. Niestety, nie będziemy mogli się zajmować termodynamiką zbyt drobiazgowo. Chcemy tylko zilustrować jej zasadnicze idee i uzasadnić twierdzenia, z jej przedmiotu nie będziemy bowiem zbyt wiele korzystać w dalszej części tych wykładów. Termodynamika ma najwięcej zastosowań w technice i w chemii. A więc ci z Was, którzy będą studiować te dziedziny, zapoznają się z termodynamiką stosowaną. Ponieważ nie ma sensu, byśmy tym wykładem dublowali wykłady techniczne, podamy tu jeszcze pewną dyskusję jej podstaw teoretycznych, nie wnikając zbytnio w szczegóły związane z bardziej specjalnymi jej zastosowaniami. Obie zasady termodynamiki często formułuje się w następujący sposób: Pierwsza zasada termodynamiki: Energia Wszechświata jest zawsze stała. Druga zasada termodynamiki: Entropia Wszechświata zawsze wzrasta. Nie jest to bardzo dobre sformułowanie drugiej zasady termodynamiki. Nie mówi ono na przykład, że w procesach odwracalnych entropia pozostaje stała, i nie precyzuje, czym właściwie jest entropia. Jest to tylko wygodny sposób zapamiętania tych dwóch
294 44 ZASADY TERMODYNAMIKI Tabela 44.1. Podsumowanie zasad termodynamiki Pierwsza zasada: Ciepło dostarczone do układu + praca wykonana nad układem = przyrost energii wewnętrznej układu: dQ + dW=dU. Druga zasada: Nie istnieje proces, klórego jedynym rezultatem byłoby pobranie ciepła ze zbiornika i zamiana go na pracę. Nie ma silnika cieplnego pochłaniającego ciepło Qt w temperaturze 7\ i wydzielającego ciepło Q2 w temperaturze T2 i dającego przy tym więcej pracy niż silnik odwracalny, dla którego IT, — T2\ w=Ql-Q2=Qly T~y Entropię układu określamy w następujący sposób: a. Jeżeli ciepło AQ jest dostarczone odwracalnie do układu w temperaturze T, to przyrost entropii układu wynosi AS=AQIT. b. W temperaturze 7"=0, 5=0 {trzecia zasada). Podczas zmian odwracalnych całkowita entropia wszystkich części układu (włączając zbiorniki ciepła) nie ulega zmianie. Podczas zmian nieodwracalnych całkowita entropia układu zawsze wzrasta. zasad, który nie wiele mówi, o co właściwie chodzi. Zasady omawiane w niniejszym rozdziale zebraliśmy w tab. 44.1. W następnym rozdziale zastosujemy je do wykrycia zależności między ciepłem wytwarzanym podczas rozciągania gumy i dodatkowym napięciem, które powstaje przy jej ogrzewaniu.
45 Zastosowania termodynamiki 45-1. Energia wewnętrzna Termodynamika stosowana jest trudnym i złożonym przedmiotem. Dlatego nie byłoby celowe zagłębianie się w tę dziedzinę podczas naszego wykładu. Oczywiście, ma ona wielkie znaczenie dla inżynierów i chemików i zainteresowani mogą się z nią zapoznać na wykładach chemii fizycznej lub termodynamiki technicznej. Istnieją także bardzo dobre podręczniki, np. Zemansky'ego Heat and Thermodynamics (Ciepło i termodynamika)**. Dziedzina termodynamiki jest dlatego tak skomplikowana, że zawiera wiele różnych sposobów mówienia o tym samym. Jeżeli chcemy opisać zachowanie się gazu, to możemy powiedzieć, że ciśnienie zależy od temperatury i objętości albo że objętość zależy od temperatury i ciśnienia. Mówiąc zaś o energii wewnętrznej U możemy twierdzić, że zależy ona od temperatury i od objętości — jeżeli wybraliśmy właśnie te zmienne — lecz możemy także powiedzieć, że zależy od temperatury i od ciśnienia albo od ciśnienia i od objętości itd. W poprzednim rozdziale zajmowaliśmy się jeszcze jedną funkcją temperatury i objętości, entropią S. Oczywiście, możemy skonstruować dowolnie wiele innych funkcji tych zmiennych. Tak na przykład U— TS jest też funkcją temperatury i objętości. A więc mamy wiele różnych wielkości, które mogą być funkcjami wielu różnych kombinacji zmiennych *> W języku polskim ukazały się następujące podręczniki z termodynamiki: K. Gumiński, Termodynamika, PWN, 1955; K. Gumiński, Termodynamika procesów nieodwracalnych, PWN, 1962; J. We- rle. Termodynamika fenomenologiczna, PWN, 1957; K. Zalewski, Wykłady z termodynamiki fenomenologicznej i statystycznej. PWN, 1966. (Przyp. tłum.)
296 45. ZASTOSOWANIA TERMODYNAMIK W niniejszym rozdziale dla uproszczenia postanawiamy od samego początku uważać temperaturę i objętość za zmienne niezależne. Chemicy jako takich zmiennych używają temperatury i ciśnienia, ponieważ łatwiej je mierzyć i kontrolować w doświadczeniach chemicznych. My jednak konsekwentnie pozostaniemy przy temperaturze i objętości, poza jednym wyjątkiem, kiedy zajmiemy się przejściem do chemicznego układu zmiennych. Po pierwsze, uwzględnimy więc tylko jeden układ zmiennych niezależnych: temperaturę i objętość. Po drugie, omówimy tylko dwie zależne funkcje: energię wewnętrzną i ciśnienie. Wszystkie inne funkcje można z nich wyprowadzić, a więc nie musimy się nimi zajmować. Po tych ograniczeniach termodynamika jest nadal dość skomplikowana, ale już nie taka straszna. Na początek trochę matematyki. Jeżeli pewna wielkość jest funkcją dwu zmiennych, to pojęcie pochodnej tej wielkości wymaga nieco dokładniejszych rozważań niż w przypadku jednej zmiennej. Co rozumiemy przez pochodną ciśnienia względem temperatury? Zmiana ciśnienia towarzysząca zmianie temperatury zależy oczywiście częściowo od tego, co się dzieje z objętością podczas zmiany T. Najpierw musimy określić zmianę V, aby precyzyjnie zdefiniować pojęcie pochodnej względem T. Możemy na przykład zapytać, jak zmienia się P ze zmianą T przy stałym V. Jest to po prostu zwyczajna pochodna, którą zwykle zapisujemy jako dPjdT. Tradycyjnie używamy specjalnego symbolu dP/dT, który przypomina nam, że P zależy nie tylko od T, ale i od innej zmiennej V, która pozostaje stała. Będziemy nie tylko używali symbolu d dla zwrócenia uwagi na stałość innej zmiennej, ale oprócz tego będziemy zapisywali tę zmienną, której wartość jest stała, przy symbolu pochodnej: (dP/dT)v. Ponieważ mamy do czynienia tylko z dwiema zmiennymi niezależnymi, więc ten zapis może się wydać przesadny, ale bardzo nam pomoże w przedzieraniu się przez termodynamiczną dżunglę pochodnych cząstkowych. Załóżmy, że funkcja f(x,y) zależy od dwóch zmiennych niezależnych: x oraz y. Przez (df/dx)y rozumiemy po prostu zwyczajną pochodną, obliczoną w zwykły sposób, jeżeli traktujemy y jako stałą: (jL\ = iim /(*+^*> >*)-/(*. y) \dx/y 4x-o Ax Podobnie określamy (dl\ = lim /(*> ■>'+^>)-/(*»>) \dyjx /),-o Ay Jeżeli na przykład f(x,y)=x2 + xy, to (df/dx)y = 2x+y oraz (df/dy)x=x. To postępowanie możemy rozciągnąć też na pochcdne wyższych rzędów: d2f/dy2 lub c2f/dy dx. Ostatni symbol wskazuje, że najpierw różniczkujemy / względem x, traktując y jako stałą, a następnie wynik różniczkujemy względem y, traktując x jako stałą. Kolejność wykonywania różniczkowań nie jest istotna: d2f/dx dy=d2f/dy dx. Będzie nam potrzebna zmiana Aj funkcji f(x, y), gdy x zmieni się na x + Ax, a y zmieni się na y + Ay. Cały czas przyjmujemy, że Ax oraz Ay są nieskończenie małe:
45-1. ENERGIA WEWNĘTRZNA 297 Af=f(x + Ax, y + Ay)-f(x,y) = =f(x + Ax,y + Ay)-f(x,y + Ay)+j(x,y + Ay)-f(x,y) = Ax W, Ay (Ił (45.1) Ostatnie równanie jest podstawową zależnością wyrażającą Af przy pomocy Ax i Ay. Jako przykład korzystania z tej zależności obliczymy zmianę energii wewnętrznej U(T. V), gdy temperatura zmienia się od T do T+AT, a objętość zmienia się od V do V+AV. Korzystając z równania (45.1), piszemy AU = AT[ — ) fdU\ + AV —- VvJi (45.2} W naszym ostatnim rozdziale znaleźliśmy inne wyrażenie dla zmiany energii wewnętrznej Al) na skutek dostarczenia do gazu ciepła AQ: AU=AQ-PAV (45.3) Porównując równania (45.2) oraz (45.3) można z początku przypuszczać, że P=(dU/6V)T, ale to nie jest słuszny wniosek. W celu otrzymania poprawnej zależności załóżmy najpierw, że dostarczymy ciepło AQ do gazu przy stałej objętości, tak że AV=§. Przy zlK=0 równanie (45.3) mówi nam, że AU = AQ, a z równania (45.2) wiemy, że AU=(dU/dT)vAT a więc {dUldT)v = AQjAT. Stosunek AQ/AT, ilość ciepła, którą trzeba dostarczyć do substancji, aby zmienić jej temperaturę o jeden stopień przy stałej objętości, nazywamy ciepłem właściwym przy stałej objętości. Oznaczamy je symbolem Cv. Udowodniliśmy więc, że fd-v) -o (45.4) Następnie znów dostarczmy do gazu ciepło AQ, ale tym razem utrzymujemy stałą temperaturę T, i dopuśćmy zmianę objętości o A V. Analiza tego przypadku jest bardziej skomplikowana, ale można obliczyć A U z twierdzenia Carnota korzystając * cyklu Carnota, którym zajmowaliśmy S'C w poprzednim rozdziale. Wykres zależności ciśnienie-objętość dla cyklu Carnota widzimy na rys. 45.1. Jak już wykazaliśmy, całkowita praca wykonana przez gaz w cyklu odwracalnym 45.1. W>kres zależności ciśnienia od objętości w cyklu Carnota. Krzywe oznaczone symbolami T oraz T- AT są izotermami. Dwie pozostałe strome krzywe są adiabatami. AV oznacza zmianę objętości wywołaną dostarczaniem do gazu ciepła AQ w stałej temperaturze T. AP oznacza zmianę ciśnienia przy stałej objętości gazu, gdy jego temperatura zmienia się od T do T- AT T-AT objętość
298 45. ZASTOSOWANIA TERMODYNAMIKI Pi T 45.2. Powierzchnia zakreskowana = powierzchni ograniczonej liniami przerywanymi = powierzchni prostokąta = AP A V równa się AQ(A T/T), gdzie AQ oznacza ciepło dostarczone do gazu, który rozszerza się izo. termicznie w temperaturze T od objętości Vd0 V+AV, a F-zirjest końcową temperaturą osiąganą przez gaz, który rozszerza się adiabatycznie na drugim odcinku cyklu. Udowodnimy, że praca ta równa się polu zakresko- wanemu na rys. 45.1. W każdych warunkach praca wykonana przez gaz równa się JZ' dV \ jest dodatnia, gdy gaz się rozszerza, a ujemna przy sprężaniu gazu. Jeżeli wykreślimy funkcję P w zależności od V, to zmianę P i y przedstawia krzywa, która w każdym punkcie podaje wartość P odpowiadającą wybranej wartości V. Gdy objętość zmienia się od jednej wartości do drugiej, praca wykonana przez gaz, a więc całka \P dV równa się powierzchni leżącej pod krzywą łączącą początkową i końcową wartość V. Gdy zastosujemy powyższe rozumowanie do cyklu Carnota, zwracając uwagę na znak pracy wykonanej przez gaz, widzimy, że po przejściu całego cyklu praca gazu równa się powierzchni zakreskowanej na rys. 45.1. Teraz chcemy obliczyć tę powierzchnię geometrycznie. Cykl, który wykreśliliśmy na rys. 45.1 różni się od stosowanego w poprzednim rozdziale tym, że obecnie uważamy AT oraz AQ za nieskończenie małe. Obecnie cykl przebiega między adiabatami i izotermami położonymi bardzo blisko siebie, a więc figura ograniczona grubymi liniami na rys. 45.1 będzie zbliżała się do równoległoboku, w miarę jak przyrosty AT oraz AQ będą dążyły do zera. Powierzchnia tego równoległoboku równa się AVAP, gdzie AV jest zmianą objętości przy dostarczaniu energii AQ do gazu w stałej temperaturze, a AP jest zmianą ciśnienia, wywołaną zmianą temperatury o AT przy stałej objętości. Można łatwo udowodnić, że powierzchnia zakreskowana na rys. 45.1 równa się iloczynowi AP 4ł stwierdzając, że równa się ona powierzchni ograniczonej przez linie przerywane na rys. 45.2. Ta zaś z kolei różni się od prostokąta o bokach AP\ AV tylko o pola równych trójkątów dodanych i odjętych na rys. 45.2. Podsumujmy wyniki naszych dotychczasowych rozważań: praca wykonana przez gaz = powierzchnia zakreskowana = A\ AP czyli ~-<t) AT x (ciepło potrzebne do zmiany \ o A \ ), Walc r ' = Jl x (/miana P, gdy T zmienia się o JT). stale Vi czyli x (ciepło potrzebne do /mianv \ o AV )T=T(dPldT)v 1\ (45.?)
i-[. ENERGIA WEWNĘTRZNA 299 Równanie (45.5) wyraża istotną treść twierdzenia Carnota. Z równania tego oraz z pierwszej zasady termodynamiki zapisanej w postaci równania (45.3) można wyprowadzić całą termodynamikę. W istocie rzeczy równanie (45.5) wyraża drugą zasadę termodynamiki, chociaż początkowo było ono wyprowadzone przez Carnota w nieco innej postaci, ponieważ nie korzystał on z naszej definicji temperatury. Teraz już możemy obliczyć (dU/dV)T. O ile zmienia się energia wewnętrzna U, jeżeli zmienimy objętość o AV1 Po pierwsze, U zmienia się na skutek dopływu ciepła, a po drugie, na skutek wykonanej pracy. Ciepło dostarczone równa się zgodnie z równaniem (45.5), a praca wykonana nad substancją wynosi — PAV. Zmiana energii wewnętrznej o AU składa się zatem z dwóch części: (dP\ ll/=T(— ) AV-PAV. (45.6) Dzieląc obie strony tego równania przez A V znajdujemy pochodną U względem V przy stałym T: (a ■» -T$\-, W naszej termodynamice, w której T oraz V są jedynymi zmiennymi niezależnymi, a P i U jedynymi funkcjami, równania (45.3) i (45.7) są podstawowymi równaniami, z których można wyprowadzić wszystkie wnioski. 45-2. Zastosowania Omówimy teraz znaczenie równania (45.7) i zobaczymy, dlaczego odpowiada ono na pytania postawione przez nas w poprzednim rozdziale. Rozważaliśmy tam następujmy problem: w teorii kinetycznej jest oczywiste, że wzrost temperatury prowadzi do ^zrostu ciśnienia na skutek wzmocnienia uderzeń atomów o tłok. Gdy pozwolimy, żeby "ok się wysuwał, to dla tych samych powodów fizycznych gaz oddaje ciepło i w celu trzymania stałej temperatury musimy je dostarczać z zewnątrz. Gaz oziębia się podczas °zPrężania, a ciśnienie wzrasta podczas ogrzewania gazu. Musi istnieć pewien związek ■ędzy tymi dwoma zjawiskami. Jest on zawarty w równaniu (45.7). Jeżeli objętość po- s,aJe stała, a zwiększamy temperaturę, przyrost ciśnienia na jednostkę temperatury równy (dP dT)t Wiąże się z tym następujący wniosek: jeżeli zwiększymy objętość, się oziębi, chyba że dla utrzymania stałej temperatury dostarczymy pewn«{ ilość ciepła Wn:ł właśnie (dUjdV)T. Równanie (45.7) wyraża podstawowy związek między tymi ma zjawiskami. To właśnie obiecaliśmy otrzymać z zasad termodynamiki. Nie ■W wewnętrznej struktury gazu i wiedząc tylko, że nie możemy zrealizować per-
300 45 ZASTOSOWANIA TERMODYNAMIKI petuum mobile drugiego rodzaju*', jesteśmy w stanie otrzymać związek między ilością ciepła potrzebną do utrzymania stałej temperatury rozszerzającego się gazu i zmianą ciśnienia gazu ogrzewanego! Skoro mamy już poszukiwany wynik dotyczący gazu, wróćmy do naszej gumki. Gdy rozciągamy gumkę, jej temperatura wzrasta, a przy podgrzewaniu gumka się kurczy. Jakie równanie da taką samą zależność dla gumki, jak (45.3) dla gazu? W wypadku gumki sytuacja będzie wyglądała następująco: gdy dostarczymy jej ciepło AQ, jej energia wewnętrzna zmieni się o A U i ponadto zostanie wykonana pewna praca. Jedyna różnica polega na tym, że praca wykonana przez gumkę równa się -FAL, a nie PAV, gdzie F oznacza siłę działającą na gumkę a L jest jej długością. Siła F jest pewną funkcją temperatury i długości gumki. Zastępując wyrażenie PAVv/ równaniu (45.3) przez —FAL otrzymujemy AU = AQ + F AL. (45.8) Zestawiając równania (45.3) i (45.8) widzimy, że równanie dla gumki otrzymaliśmy jedynie przez zastąpienie jednych symboli innymi. Ponadto jeżeli zastąpimy V przez L oraz P przez —F, to wszystko co powiedzieliśmy o cyklu Carnota stosuje się też do gumki. Możemy na przykład natychmiast wywnioskować, że ciepło A Q potrzebne do zmiany długości o AL jest dane równaniem analogicznym do równania (45.5): AQ= ~T(dF/dT)LAL. Równanie to mówi nam, o ile wzrośnie podczas ogrzewania napięcie gumki, jeśli długość jej się nie zmienia. W tym celu trzeba obliczyć, ile potrzeba ciepła do utrzymania stałej temperatury, gdy gumkę trochę rozciągniemy. Widzimy więc, że to samo równanie stosuje się i do gazu i do gumki. Rzeczywiście, pisząc równanie AU=AQ + + A AB, gdzie A oraz B przedstawiają różne wielkości, siłę i długość, ciśnienie i objętość, itd., można stosować wyniki otrzymane dla gazu podstawiając A i B w miejsce P i V. Zajmijmy się na przykład różnicą potencjałów, „napięciem" E w ogniwie oraz ładunkiem AZ, który przepływa przez to ogniwo. Wiemy, że praca wykonana przez odwracalne ogniwo elektryczne, np. przez akumulator, równa się E AZ. (Ponieważ nie uwzględniliśmy wyrażenia P AV we wzorze na pracę, założyliśmy tym samym, że cały czas utrzymujemy stałą objętość ogniwa.) Zobaczmy, co może nam powiedzieć termodynamika o pracy takiego ogniwa. Podstawiając E w miejsce P oraz Z w miejsce V w równaniu (45.6) otrzymamy AU fdE\ =-tI)-E. (45.9) AZ \dTjz Równanie (45.9) mówi, że zmienia się energia wewnętrzna U, gdy przez ogniwo przepływa ładunek AZ. Dlaczego AU\AZ nie równa się po prostu E — napięciu baterii? Otóż dlatego, że podczas przepływu prądu rzeczywiste ogniwo się ogrzewa. Energia wewnętrzna ogniwa zmienia się z dwóch powodów. Po pierwsze — wykonuje ono pewną pracę w ob- *' To znaczy skonstruować urządzenie, które dostarczałoby pracę kosztem pobierania ciepła ze zbiornika o stałej temperaturze bez dodatkowych zmian w układzie lub w otoczeniu. (Przyp. red. wydarło rts^lclri^ort \
45-2. ZASTOSOWANIA 301 wodzie zewnętrznym, a po drugie — ogniwo się ogrzewa. Należy zwrócić uwagę, że tę drugą przyczynę można znów wyrazić przez zmianę napięcia baterii na skutek zmiany temperatury. Nawiasem mówiąc, gdy ładunki elektryczne przepływają przez ogniwo, zachodzą tam reakcje chemiczne i równanie (45.9) wskazuje wygodny sposób pomiaru energii potrzebnej do zajścia reakcji chemicznej. W tym celu należy tylko zbudować ogniwo działające na podstawie odpowiedniej reakcji chemicznej, zmierzyć napięcie początkowe, a następnie wyznaczyć, jak się ono zmienia w zależności od temperatury, gdy nie pobieramy prądu z baterii! Przyjęliśmy, że objętość ogniwa się nie zmienia, ponieważ opuściliśmy wyrażenie P A V pisząc, że praca wykonana przez ogniwo równa się E AZ. Okazuje się, że technicznie bardzo trudno utrzymać stałą objętość. Znacznie łatwiej utrzymać ogniwo w stałym ciśnieniu atmosferycznym. Dlatego chemicy nie lubią równań, które wypisaliśmy powyżej. Wolą równania opisujące działanie ogniwa w stałym ciśnieniu. Na początku rozdziału zdecydowaliśmy, że naszymi zmiennymi niezależnymi będą V oraz T. Chemicy tymczasem wolą P i T, sprawdzimy więc, jak nasze wyniki można zapisać w ich układzie zmiennych. Bądźmy ostrożni, łatwo bowiem możemy się teraz pomylić, ponieważ przechodzimy ze zmiennych T i V na T i P. Zacznijmy od równania (45.3), tzn. od AU=AQ—P AV. Iloczyn P AV można zastąpić przez E AZ lub A AB. Jeżeli potrafilibyśmy jakoś zastąpić ostatni wyraz, P AV, wyrazem VAP, wówczas moglibyśmy zastąpić Kprzez Pi chemicy byliby szczęśliwi. Otóż ktoś sprytny spostrzegł, że różniczka iloczynu PV wynosi d(PV) = PdV+VdP, dodał to do równania (45.3) i otrzymał: A(PV) = PAV+V AP AU= AQ -PAV A(U + PV)= AQ +V AP. Aby nasz wynik był podobny do równania (45.3), zdefiniujemy U+PVjako nową wielkość; nazwiemy ją entalpią (H) i napiszemy AH=AQ+VAP. Teraz możemy nasze wyniki przełożyć na język chemików za pomocą następujących reguł: U-*H, P-* — V, V-*P. Tak na przykład, podstawowa zależność, którą chemicy zastąpiliby równanie (45.7), ma postać: (^)r--r(E+"- Wyjaśniliśmy więc już, jak przejść do zmiennych T i P, którymi posługują się chemicy. Teraz wrócimy do naszych dawnych zmiennych: w dalszym ciągu rozdziału zmiennymi niezależnymi będą więc T oraz V. Zastosujemy nasze wyniki do kilku zjawisk fizycznych. Najpierw rozważmy gaz doskonały. Z teorii kinetycznej wiemy, że energia wewnętrzna gazu doskonałego zależy tylko od ruchu cząsteczek oraz od ich liczby. Energia wewnętrzna zależy więc od T, a nie od V. Jeżeli zmieniamy V, utrzymując stałe T, to t/się nie zmienia Dlatego (dlf/dV)T=0 i równanie (45.7) mówi nam, że dla gazu doskonałego
302 45 ZASTOSOWANIA TERMODYNAMIKI -P=0. (45.10) V Równanie (45.10) jest równaniem różniczkowym, z którego możemy dowiedzieć się czegoś o funkcji P Możemy potraktować pochodne cząstkowe w następujący sposób. Ponieważ pochodną cząstkową obliczamy przy stałym V, zastąpimy ją więc przez zwykłą pochodną i dopiszemy, aby nie zapomnieć „V stałe". Wówczas równanie (45.10) przyjmie postać: AP T - -P=0, V stałe. (45.1J) AT ' co po scałkowaniu daje: In />=ln T+const, V stałe, P=const T, V stałe. ( ' ) Wiemy, że ciśnienie gazu doskonałego równa się RT P=y (45.13) co zgadza się z zależnością (45.12), ponieważ V i R są tu stałe. Dlaczego zawracamy sobie głowę tymi obliczeniami, skoro już dawno znamy ich wyniki? Ponieważ używamy dwu niezależnych definicji temperatury*. W pierwszym wypadku założyliśmy, że energia kinetyczna cząsteczek jest proporcjonalna do temperatury, co definiowało jedną skalę temperatur, którą nazywamy skalą gazu doskonałego. Właśnie w tej skali wyrażone jest T w równaniu (45.13). Temperaturę mierzoną w skali gazowej nazywamy także temperaturą kinetyczną. W drugim wypadku określiliśmy temperaturę inaczej, zupełnie niezależnie od jakiejkolwiek substancji. Opierając się na drugiej zasadzie termodynamiki określiliśmy coś, co można nazwać „termodynamiczną temperaturą bezwzględną" T, która występuje w równaniu (45.12). Udowodniliśmy w ten sposób, że ciśnienie gazu doskonałego (zdefiniowanego tak, że jego energia wewnętrzna nie zależy od objętości) jest proporcjonalne do „termodynamicznej temperatury bezwzględnej". Wiemy także, że ciśnienie jest proporcjonalne do temperatury mierzonej w skali gazowej. Możemy stąd wywnioskować, że temperatura kinetyczna jest proporcjonalna do „bezwzględnej temperatury termodynamicznej". To oczywiście znaczy, że gdybyśmy byli roztropni, moglibyśmy obie skale uzgodnić. Przynajmniej w tym przypadk u wybrano je tak, by się zgadzały, by stała proporcjonalności równała się jedności. Na ogół ludzie utrudniają sobie życie, ale tym razem wybrali obie skale równe! 45-3. Równanie Claosiusa-Clapeyrona Wyniki, które otrzymaliśmy, można także zastosować przy opisie parowania cieczy. Weźmy zbiornik z cieczą, którą możemy sprężać za pomocą tłoka i zastanówmy się, jak się zmienia ciśnienie wraz z objętością, jeżeli utrzymamy stałą temperaturę. Inaczej mówiąc, 'G
45-3. RÓWNANIE CLAUS1USA-CLAPEYRONA 303 ciecz i para V T-AT pata objętość 45.3. Izotermy pary sprężanej w zbiorniku. Z lewej strony — substancja w fazie ciekłej, na prawo — para tej substancji, w środku — w zbiorniku oba stany występują jednocześnie chcemy na wykresie P-V poprowadzić izotermę. Substancja zawarta w cylindrze nie jest jak poprzednio gazem doskonałym. Może ona teraz występować w fazie ciekłej lub lotnej albo w obu fazach jednocześnie. Jeżeli wywrzemy dostateczne ciśnienie, substancja będzie się skraplała. Jeżeli jeszcze bardziej ją ściśniemy, objętość będzie się zmieniać bardzo nieznacznie i nasza izoterma będzie gwałtownie rosnąć przy dalszym zmniejszaniu objętości, co widać w lewej części rys. 45.3. Jeżeli będziemy zwiększać objętość wysuwając tłok ze zbiornika, to ciśnienie początkowo będzie maleć aż do chwili, kiedy ciecz zacznie wrzeć i będzie tworzyła się para. Teraz dalsze wysuwanie tłoka spowoduje tylko wyparowanie większej ilości cieczy. Część zbiornika będzie więc wypełniała ciecz, a część para, czyli obie te fazy będą w równowadze — z jednakową szybkością będzie się odbywać parowanie cieczy i kondensacja pary. Jeżeli zrobimy więcej miejsca dla pary, to musi wytworzyć się jej więcej, aby utrzymać stałe ciśnienie, a więc wyparuje trochę więcej cieczy, ale ciśnienie pozostanie takie samo. Na poziomej części krzywej z rys. 45.3 ciśnienie nie zmienia się i jego wartość nosi nazwę ciśnienia pary nasyconej w temperaturze T. Gdy w dalszym ciągu będziemy zwiększać objętość, osiągniemy moment, w którym zabraknie cieczy do tworzenia pary. Od tej chwili dalsze zwiększanie objętości spowoduje spadek ciśnienia, jak w wypadku zwykłego gazu, co widać w prawej części wykresu P-V. Niższa krzywa na rys. 45.3 jest izotermą wykreśloną dla nieco niższej temperatury T—AT. Ciśnienie cieczy jest wówczas nieco niższe, gdyż ciecz się rozszerza przy podwyższeniu temperatury (dla większości substancji, ale nie dla wody blisko punktu zamarzania), i, oczywiście, ciśnienie pary jest niższe w niższej temperaturze. Wykonajmy teraz cykl wzdłuż dwu izoterm łącząc je (np. za pomocą adia- bat) na końcach ich poziomych części, •ak jak na rys. 45.4. Mały skok krzywej w dolnym prawym rogu rysunku nie jest istotny i dlatego pominiemy go. Posłużymy 45.4. Wykres zależności ciśnienia od objętości pary zawartej w zbiorniku dla cyklu Carnota. Po lewej stronie — substancja w stanie ciekłym. Ciepło L potrzebne do wyparowania cieczy jest dostarczone w temperaturze T. Para rozszerza się adiabatycznie, gdy temperatura T przechodzi w temperaturę T—AT AP _I_ T T-AT V9 objętość
304 45. ZASTOSOWANIA TERMODYNAMIKI się rozumowaniem Carnota, które nam określi, jak ciepło dostarczone substancji podczas przejścia ze stanu ciekłego do lotnego wiąże się z pracą wykonaną przez substancję podczas wykonywania cyklu. Niech L będzie ciepłem potrzebnym do wyparowania substancji zawartej w zbiorniku. Z rozważań poprzedzających równanie (45.5) wiemy, że L(AT\T) = pracy wykonanej przez substancję. Jak poprzednio, praca ta równa się polu objętemu krzywą, które w przybliżeniu równa się AP(Vg — Vc), gdzie AP jest różnicą ciśnienia pary nasyconej przy dwóch temperaturach Ti T—AT, Vg jest objętością gazu, a Vc — objętością cieczy. Obie te objętości są mierzone przy ciśnieniu równym ciśnieniu pary nasyconej. Przyrównując te dwa wyrażenia na pole, otrzymujemy L(ATIT)=AP(Vg — Vc) lub L -"- (45,4) T(Vg-Vc) dT Równanie (45.14) podaje zależność między zmianą ciśnienia pary nasyconej wraz z temperaturą i ilością ciepła potrzebną do wyparowania cieczy. Zależność tę wyprowadził Carnot, lecz nazywa się ją równaniem Clausiusa-Clapeyrona. Porównajmy teraz równanie (45.14) z wynikami otrzymanymi na podstawie teorii kinetycznej. Zwykle Vf jest znacznie większe od Vc. Dlatego Vg — Vr-vVt = RT/P dla jednego mola. Jeżeli oprócz tego założymy, że L jest stałe, niezależne od temperatury — co nie jest zbyt dobrym przybliżeniem — wtedy dP/dT=L/(RT2/P). Równanie to ma następujące rozwiązanie: P=const-e~LJRT. (45.15) Porównajmy ten wynik z zależnością ciśnienia od temperatury, którą otrzymaliśmy wcześniej na podstawie teorii kinetycznej. Teoria kinetyczna wskazywała, z grubsza biorąc, że liczba cząsteczek pary znajdujących się nad cieczą równa się n=^-exp\_-(Ug-Uc)IRT], (45.16) 'A gdzie Ug — Uc jest różnicą energii wewnętrznej jednego mola w gazie i w cieczy, czyli jest energią potrzebną do wyparowania jednego mola cieczy. Termodynamiczne równanie (45.15) i równanie kinetycznej teorii gazów (45.16) są bardzo podobne, ponieważ ciśnienie wynosi nkT; nie są jednak identyczne. Równania te byłyby identyczne, gdybyśmy przyjęli że L — Ut = const, zamiast L=const. Skoro założymy, że L — Ug = const, niezależnie od temperatury, wówczas postępowanie prowadzące do równania (45.15) doprowadzi nas do równania (45.16). To porównanie wskazuje na zalety i braki termodynamiki w zestawieniu z teorią kinetyczną. Przede wszystkim równanie (45.14) otrzymane z termodynamiki jest ścisłe, podczas gdy równanie (45.16) jest przybliżone i jest słuszne tylko przy założeniu, że U jest prawie stałe i że nasz model jest prawdziwy. Ponadto nie musimy wcale widzieć, w jaki naprawdę sposób gaz przechodzi w ciecz; niezależnie od wszystkiego równanie (45.14) jest poprawne, podczas gdy (45.16) jest tylko przybliżeniem. Co więcej, chociaż nasze rozważania stosują się do gazu skraplającego się w ciecz, to podane tu rozumowanie jest słuszne dla dowolnej
45-3. RÓWNANIE CLAUSIUSA-CLAPEVRONA 305 z,miany stanu. Tak na przykład, przejście ciała stałego w ciecz jest określone przez taką samą krzywą jak na rys. 45.3 oraz 45.4. Wprowadzając utajone ciepło topnienia, A//mol, otrzymujemy wzór analogiczny do równania (45.14), tzn.(dPtop/dT)y = Ml[T(VciKŁ- Kcialo state). Gdybyśmy nawet nie znali kinetycznej teorii procesu topnienia, otrzymalibyśmy poprawne równanie. Ze znajomością teorii kinetycznej jest jednak związana inna zaleta. Równanie (45.14) jest tylko zależnością różniczkową i nie znamy sposobu otrzymania stałych całkowania. W teorii kinetycznej możemy natomiast otrzymać także i te stałe, pod warunkiem, że posłużymy się dobrym modelem, który w sposób zupełny opisze całe zjawisko. Istnieją wiec wady i zalety obu opisów. Gdy wiedza nasza jest niepełna, a opisywane zjawisko złożone, to zależności termodynamiczne są rzeczywiście najskuteczniejsze. Gdy natomiast sytuacja jest prosta i można dokonać jej analizy od strony teoretycznej, wówczas lepiej za pomocą tej analizy wydobyć możliwie najwięcej informacji. Rozpatrzmy jeszcze jeden przykład: promieniowanie ciała czarnego. Zajmowaliśmy się zbiornikiem zawierającym Samo promieniowanie. Mówiliśmy o równowadze między oscylatorem i promieniowaniem. Przekonaliśmy się także, że fotony uderzając o ściany zbiornika wywierają na nie ciśnienie P i obliczyliśmy, że PV= U/3, gdzie U oznacza całkowitą energię wszystkich fotonów, a V — objętość zbiornika. Jeżeli wstawimy U=3PV do podstawowego równania (45.7), otrzymamy. Ponieważ objętość naszego zbiornika jest stała, możemy zastąpić wyrażenie (dP/8T)y wyrażeniem dPjdT i otrzymujemy zwykłe równanie różniczkowe, które możemy scałkować: In /*=41n r+const, czyli />=stała-T'4. Ciśnienie promieniowania zmienia się jak temperatura podniesiona do czwartej potęgi, a gęstość energii promieniowania U/ V= P/3 także zmienia się jak T*. Zwykle się pisze U/ V=(4c[c) T*, gdzie c jest szybkością światła a a jest stałe. Wartości a nie można otrzymać na podstawie samej tylko termodynamiki. Jest to właśnie dobry przykład jej możliwości i ograniczeń. Pokazanie, że U/V zmienia się jak 7** jest dużym osiągnięciem, ale aby wiedzieć, czemu równa się U/V w dowolnej temperaturze, musimy poznać takie szczegóły, jakich dostarczyć może tylko pełna teoria. Dla promieniowania ciała czarnego znamy taką teorię i dlatego możemy wyprowadzić wyrażenie dla stałej a; uczynimy to w następujący sposób. Niech I(co) dat oznacza rozkład natężenia promieniowania, to znaczy strumień energii promieniowania o częstości zawartej między co a co + dco, przepływający przez 1 m2 w ciągu 1 s. Rozkład gęstości energii = energia/objętość = I(co) dto/c. Stąd U — = całkowita gęstość energii = CO = f(gcslość energii w przedziale między u> a cj + dlO = u)= 0 o
306 «. ZASTOSOWANIA TERMODYNAMIKI Z naszych poprzednich rozważań wiemy, że ha>3 Podstawiając to wyrażenie dla I(w) do naszego równania na UjV otrzymujemy 00 u _ i r e*"*r- 1 Jeżeli w naszej całce dokonamy zmiany zmiennej x = hwjkT, to ~F~fcV?J e'-1' Całka ta równa się po prostu pewnej liczbie, którą moglibyśmy w przybliżeniu otrzymać wykreślając krzywą i wyznaczając pole ograniczonej przez nią powierzchni. Równa się ono w przybliżeniu 6,5. Znajdujący się wśród nas matematycy mogą udowodnić, że całka ta równa się dokładnie ji*/I5 *\ Porównując to wyrażenie z U/V=(4c/c)T*, znajdujemy o: *V . ,_ _p W a= r-r = 5,67-10 60fiV * m2 deg*" Wyobraźmy sobie, że w zbiorniku jest mały otwór i zapytajmy: ile energii wypłynie w ciągu sekundy przez otwór o jednostkowej powierzchni? Aby przejść od gęstości energii do strumienia energii, mnożymy gęstość energii U/V przez c. Mnożymy ją także przez J, co jest iloczynem następujących dwóch czynników: pierwszy czynnik \ jest spowodowany tym, że bierze się pod uwagę tylko energię wypływającą, drugi czynnik \ bierze się stąd, że energii osiągającej otwór pod innym kątem niż 90° jest trudniej wydostać się na zewnątrz; uwzględnimy to mnożąc strumień przez cosinus tego kąta. Średnia zaś wartość cosinusa równa się \. Teraz jest już jasne, dlaczego piszemy U/V=(4c/c)T*: dlatego, abyśmy mogli stwierdzić, że strumień energii wypływający przez mały otwór równa się oT* na jednostkę powierzchni. *' Ponieważ (e*—l)~l =c~*+e'2* +..., więc całka równa się 00 00 -« 3 C «-l Ó AleJe~"dx=l/« i różniczkując trzykrotnie względem n otrzymujemy/ x3e~"dx=6/n*, także całka o o równa się 6(1+-^+^+...). Uzyskamy wystarczająco dobre przybliżenie biorąc tylko kilka piw wszych wyrazów. W rozdziale 50 podamy sposób udowodnienia, że suma odwrotności czwartych potęg liczb całkowitych równa się rzeczywiście n*/90.
46 Mechanizm zapadkowy 46-1. Jak pracuje zębatka W rozdziale niniejszym zajmiemy się bardzo prostym mechanizmem, który sprawia, że oś obraca się tylko w jedną stronę. Możliwość zbudowania takiego urządzenia wymaga dokładnego i ostrożnego badania, z którego wynikają bardzo interesujące wnioski. Zamiar omawiania tego urządzenia wynikł z chęci podania elementarnego, opartego na teorii kinetycznej wyjaśnienia faktu, że istnieje maksymalna praca, którą może wykonać silnik cieplny. Oczywiście, znamy już istotę twierdzenia Carnota, ale byłoby przyjemnie znaleźć wyjaśnienie, które jest elementarne w tym sensie, że umożliwiałoby zrozumienie fizycznych powodów tego, co się dzieje. Wprawdzie istnieją skomplikowane matematyczne metody oparte na prawach Newtona, z których wynika, że można otrzymać tylko ograniczoną ilość pracy, gdy ciepło przepływa z jednego miejsca do drugiego, jednak bardzo trudno przedstawić je w elementarnym sformułowaniu. Krótko mówiąc, nie rozumiemy ich, chociaż doskonale radzimy sobie z matematyką. W dowodzie Carnota to, że przy przejściu od jednej temperatury do drugiej można otrzymać tylko pewną określoną ilość pracy, wynika z innego niż prawa Newtona aksjomatu. Aksjomat ten mówi, że jeżeli wszystkie części jakiegoś układu mają taką samą temperaturę, to nie można zamienić ciepła na pracę w wyniku procesu cyklicznego. Najpierw spróbujmy się przekonać na jednym przynajmniej przykładzie elementarnym, dlaczego to prostsze twierdzenie jest słuszne. Spróbujmy wynaleźć urządzenie, które naruszałoby drugą zasadę termodynamiki. Urządzenie to powinno przekształcać ciepło wzięte ze zbiornika na pracę przy jednakowej temperaturze wszystkich elementów układu. Weźmy zbiornik z gazem o pewnej temperaturze, wewnątrz którego znajduje się oś z przymocowanym do niej wiatraczkiem (jak na rys. 46.1, gdzie na razie Tt = T2 = T). Na skutek uderzeń cząsteczek wiatraczek drga.
308 46 MECHANIZM ZAPADKOWY Na drugim końcu osi umieszczamy kółko zębate, czyli zębatkę z zapadką, które dzięki zapadce może obracać się tylko w jednym kierunku. Kółko się obróci, gdy oś drgnie w jednym kierunku,, natomiast pozostanie nieruchome, gdy uderzenia cząsteczek gazu o wiatraczek będą usiłowały obrócić oś w stronę przeciwną. W wyniku tego kółko będzie się powoli obracało i moglibyśmy nawet przywiązać pchłę 46.1. Mechanizm zapadkowy do nitki Porzuconej przez bęben umieszczony na osi i podnieść ją do góry! Zastanówmy się teraz, czy jest to możliwe? Zgodnie z hipotezą Carnota, oczywiście nie. Ale na pierwszy rzut oka, prima facie, może to się wydawać całkiem możliwe. Musimy więc lepiej się temu zjawisku przyjrzeć. I rzeczywiście, kiedy dokładniej obejrzymy kółko zębate i zapadkę zauważymy liczne komplikacje. Przede wszystkim nasze idealne urządzenie jest tak proste, jak tylko możliwe, ale mimo to jest w nim zapadka, a więc musi być i dociskająca ją sprężynka. Sprężynka jest niezbędna, aby po przeskoczeniu jednego zęba, zapadka mogła znów przyciskać kółko. Bardzo istotna jest jeszcze inna cecha naszego urządzenia, której zresztą nie można dostrzec z rysunku. Załóżmy, że całe urządzenie jest zbudowane z idealnie sprężystych części. Skoro tylko kółko podniesie zapadkę na wysokość zęba, to sprężynka dociskając ją do kółka spowoduje jej ześlizgnięcie się z zęba — zapadka odskoczy i zacznie drgać. Może się wtedy zdarzyć, że przy przeciwnym ruchu łopatek kółko będzie mogło się z powrotem obrócić, gdyż ząb będzie mógł przesunąć się pod zapadką w momencie, kiedy będzie podniesiona! Dlatego istotną przyczyną nieodwracalności ruchu naszego kółka jest mechanizm tłumiący drgania zapadki. Kiedy już występuje takie tłumienie, energia drgań zapadki przechodzi oczywiście do kółka w postaci ciepła. Obracając się kółko zacznie się więc ogrzewać. Aby wszystko uprościć, możemy kółko otoczyć gazem, który by część ciepła pochłonął. W każdym razie gaz będzie się ogrzewać wraz z kółkiem. Czy będzie tak stale? Nie! Zapadka i kółko, w tej samej temperaturze T, wykonują także ruchy Browna. Te ruchy powodują, że od czasu do czasu zapadka przypadkowo sama podnosi się nad ząb właśnie w chwili, gdy ruchy Browna działające na łopatki próbują obrócić oś do tyłu. I gdy całe urządzenie się ogrzewa, zdarza się to coraz częściej. Taki jest właśnie powód, dla którego nasze urządzenie nie znajduje się w ciągłym ruchu. Gdy cząsteczki uderzają o łopatki, zapadka niekiedy podnosi się nad ząb. Ale czasami, gdy kółko próbuje się obrócić w przeciwną stronę, zapadka jest podniesiona dzięki ruchom Browna i może ono obrócić się z powrotem. Tak więc wypadkowy wynik równa się zeru. Nietrudno udowodnić, że w przypadku równych temperatur po obu stronach urządzenia średni ruch kółka nie istnieje. Oczywiście, kółko ciągle skacze w obie strony, ale nie robi tego, o co nam chodzi,- to znaczy nie obraca się stale w tym samym kierunku. Zobaczmy, dlaczego tak się dzieje. Do podniesienia zapadki nad ząb niezbędna jest pewna praca wykonana przeciwko sprężynce. Oznaczmy tę pracę e i niech 6 oznacza kąt między zębami. Prawdopodobieństwo, że układ zgromadzi dostateczną energię e do podnie-
46-1. JAK PRACUJE ZĘBATKA 309 sienią zapadki nad ząb równa się e_"kr. Ale prawdopodobieństwo tego, że zapadka znajduje się przypadkowo w górze, także wynosi e"£'*T Dlatego liczba przypadków, w których zapadka jest uniesiona i kółko może swobodnie się poruszać do tyłu równa się liczbie przypadków, w których mamy energię dostateczną do obrócenia kółka do przodu, gdy przyciska je zapadka. W ten sposób osiągamy „równowagę" i kółko nie może się obracać. 46-2. Zębatka w roli silnika Pójdźmy trochę dalej. Zajmijmy się przykładem, w którym temperatura łopatek wynosi 7",, a temperatura kółka, a zatem i zapadki, T2, przy czym temperatura T2 jest niższa od T,. Ponieważ kółko jest zimne, a drgania zapadki względnie rzadkie, bardzo trudno jej będzie osiągnąć energię e, natomiast łopatki, ponieważ temperatura T, jest wysoka, bardzo często będą miały dostateczną energię e, a więc nasze urządzenie będzie, zgodnie z planem, działało w jednym kierunku. Chcielibyśmy wiedzieć, czy może ono podnosić ciężary. Do bębna umieszczonego na osi przywiązujemy nitkę obciążoną jakimś ciężarem, np. pchłą. Oznaczmy przez L moment siły wywołanej przez ten ciężar. Jeżeli moment L nie będzie zbyt wielki, nasze urządzenie podniesie ciężar, gdyż ruchy Browna spowodują, że kółko będzie się poruszało raczej w jednym kierunku. Chcemy wiedzieć, jaki ciężar może nasze urządzenie podnieść, jak szybko się porusza, itd. Najpierw zajmijmy się ruchem zębatki do przodu, co jest jej naturalnym zadaniem. Ile energii należy pobrać od łopatek, aby zębatka wykonała jeden skok naprzód? Do podniesienia zapadki potrzebna jest energia e. Ponadto kółko obracając się o kąt 6 pokonuje moment siły L, musimy więc dostarczyć mu jeszcze energię LB. Dlatego całkowita energia, jaką musimy pobrać od łopatek równa się e+L6. Prawdopodobieństwo uzyskania takiej energii jest proporcjonalne do exp [ — (e +L8)/kTl]. Właściwie nie chodzi nam tylko o samo otrzymanie tej energii, ale powinniśmy także wiedzieć, ile razy nastąpiło to w ciągu sekundy. Prawdopodobieństwo na sekundę jest proporcjonalne do exp [ — (e4-L8)/k 7", ], a współczynnik proporcjonalności oznaczymy l/r, zresztą i tak skróci się on na końcu obliczeń. Po przejściu jednego kroku praca wykonana nad ciężarem wynosi LB. Energia pobrana od łopatek równa się e+L6. Sprężynka podskoczy z energią e, następnie wykona parę drgań, opadnie i zamieni swoją energię na ciepło. Cała otrzymana energia zostanie zużyta na podniesienie ciężarka i wprawienie w ruch zapadki, która przeskakując przekaże ciepło kółku. Z kolei zajmijmy się przypadkiem ruchu wstecz. Jak się on odbywa? W celu wykonania takiego ruchu musimy tylko dostarczyć energii do podniesienia zapadki tak wysoko, aby kółko mogło się pod nią prześlizgnąć. Ta energia też równa się e. Prawdopodobieństwo na sekundę podniesienia się zapadki na odpowiednią wysokość równa się teraz (l/r) exp ( — efkT2) ■ Stała proporcjonalności jest nadal taka sama, ale ze względu na inną temperaturę pojawiło się teraz kT2. W tych warunkach praca zostanie oddana, ponieważ kółko musi poruszyć się do tyłu. Jeżeli cofnie się o jedno wycięcie, odda pracę LB. Energia wzięta po stronie zębatki równa się e, a energia oddana do gazu o temperaturze T, po stronie łopa-
310 46. MECHANIZM ZAPADKOWY tek wynosi LO + e. Nietrudno się przekonać, dlaczego tak się dzieje. Załóżmy, że na skutek fluktuacji zapadka przypadkowo podniesie się sama. Kiedy następnie opadnie i sprężynka przyciśnie ją do zęba, wystąpi siła, starająca się obrócić kółko, ponieważ zapadka będzie się opierać o nachyloną płaszczyznę. Ta siła wykonuje pracę tak samo, jak i siła wywołana przez ciężarek. Obie składają się na siłę całkowitą, a cała energia, która wyzwala się powoli, zamienia się na ciepło po stronie łopatek. (Musi oczywiście się wydzielić, ze względu na zasadę zachowania energii, ale trzeba to uważnie przemyśleć!) Widzimy, że wszystkie te energie są takie same, różnią się tylko znakiem. A więc zależnie od tego, co jest bardziej prawdopodobne, ciężarek albo zwolna się podnosi, albo powoli opada. Przy tym oczywiście ciągle drży, a więc nieznacznie podnosi się i opada, ale nam chodzi o jego średni ruch. Załóżmy, że dla określonego ciężarka oba prawdopodobieństwa są takie same. Obciążmy nitkę dodatkowym, nieskończenie małym ciężarkiem. Ciężarek taki powoli opuści się na dół i nad urządzeniem będzie wykonana praca. Energia zostanie wzięta od kółka i przekazana łopatkom. Jeżeli natomiast zmniejszymy nieco obciążenie, to brak równowagi spowoduje coś innego. Ciężarek zostanie podniesiony przy pobraniu ciepła od łopatek i przekazaniu do zębatki. A więc mamy spełnione warunki odwracalnego cyklu Carnota, jeżeli ciężarek jest tak dobrany, że szanse obu ruchów są takie same. A to oznacza, że musi zachodzić (e+LO^Ti =e/T2. Powiedzmy, że urządzenie nasze powoli podnosi ciężarek. To oznacza, że energia Q, jest pobierana od łopatek, a energia Q2 przekazana zębatce. Przy tym stosunek tych energii jest równy (e+L0)/e. Jeżeli ciężarek jedzie na dół, to także QilQ2 = = (e+L0)/e. A więc (tab. 46.I) QJQ2 = TJT2. Tabela 46.1. Podsumowanie opisu działania mechanizmu zapadkowego do przodu: wymagana energia pobiera od łopatek wykonuje pracę przekazuje zapadce do tylu: wymagana energia e+LO (od łopatek), LO+e L0 B e (dla zapadki). pobiera od zapadki e wyzwala pracę L6 przekazuje łopatkom L8+e Jeżeli układ jest odwracalny, rJ-Ff) to prawdopodobieństwa są równe. Stąd —-—- = Ti ciepło do zapadki e ciepło od łopatek L9+e Stąd *-TL Ti skąd prawdopodobieństwo = = —exp[-(L0+e)/*7\] T skąd prawdopodobieństwo = = — exp { — elkTt) X tak samo poprzednio, ale z przeciwnym znakiem
46-2. ZĘBATKA W ROLI SILNIKA 311 ponadto stosunek pracy wykonanej przez nasze urządzenie do energii pobranej od łopatek równa się stosunkowi LB do LO + e, a więc wynosi iT,—TI)ITl. Widzimy więc, że nasze urządzenie pracując odwracalnie dostarcza maksymalną pracę. Tego właśnie wniosku spodziewaliśmy się na podstawie twierdzenia Carnota i jest on głównym celem niniejszego wykładu. Możemy jednak wykorzystać jeszcze nasze urządzenie do zrozumienia paru innych zjawisk, niekoniecznie w stanie równowagi i dlatego wykraczających poza termo- ,,,_.,,., . ,. . , ° ° J J 46.2. Prędkość kątowa zębatki jako dynamikę. funkcja momentu siły Obliczmy, jak szybko poruszałoby się nasze jednokierunkowe urządzenie, gdyby wszystkie jego części miały jednakową temperaturę i gdybyśmy zawiesili ciężarek na bębnie. Jeżeli szarpniemy za nitkę bardzo mocno, to oczywiście popadniemy w tarapaty. Zapadka prze- śliznie się nad zębami kółka, pęknie sprężynka lub stanie się coś podobnego. Przypuśćmy jednak, że pociągnęliśmy dość łagodnie i wszystko działa sprawnie. W tych warunkach powyższe rozważania dotyczące prawdopodobieństwa występowania ruchów w obu kierunkach pozostają słuszne, jeżeli pamiętamy, że obie temperatury są takie same. W każdym skoku kółko obraca się o kąt 6, a więc prędkość kątowa równa się kątowi 6 pomnożonemu przez prawdopodobieństwo wykonania jednego skoku w ciągu sekundy. Do przodu kółko porusza się z prawdopodobieństwem (l/r)e_('+L8)/lT, a do tyłu — z prawdopodobieństwem (l/r)e-c/*T, a więc na prędkość kątową otrzymamy następujący wzór: w=(e/T)[e-u+W)/*7"-e-t/*7"]=WT)e-lM7"(e-Ł9/"'-l). (46.1) Jeżeli wykreślimy w jako funkcję L, otrzymamy krzywą pokazaną na rys. 46.2. Widzimy, że znak wartości L ma bardzo istotne znaczenie. Jeżeli L rośnie będąc stale dodatnie, co zachodzi, gdy staramy się obracać zębatkę do tyłu, to prędkość kątowa w tym kierunku osiąga wartość stałą. Gdy natomiast L staje się ujemne, w „skacze" do „góry", ponieważ e podniesione do wysokiej dodatniej potęgi jest bardzo duże! Wartość prędkości kątowej, którą otrzymujemy przy różnych siłach, jest więc bardzo niesymetryczna. Ruch w jedną stronę jest bardzo łatwy: przy małej sile otrzymujemy dużą prędkość kątową. Natomiast w przeciwnym kierunku mimo przyłożenia dużej siły kółko obraca się z trudnością. To samo stwierdzamy w prostowniku prądu elektrycznego. Zamiast siły mamy tu pole elektryczne, a zamiast prędkości kątowej prąd elektryczny. W prostowniku napięcie nie jest proporcjonalne do oporu i zjawiska przebiegają niesymetrycznie Ta sama analiza, która przeprowadziliśmy dla prostownika mechanicznego, stosuje się także dla prostownika prądu. W istocie rzeczy wzór otrzymany powyżej przedstawia typową zależność przepuszczalności prądowej prostownika od przyłożonego napięcia. Wyrzućmy teraz wszystkie ciężarki i przyjrzyjmy się samemu urządzeniu. Gdyby 7\ było mniejsze od T,, zębatka poruszałaby się do przodu i każdy z tym się zgodzi. Ale na
312 46. MECHANIZM ZAPADKOWY pierwszy rzut oka trudno uwierzyć w odwrotną możliwość. Jeżeli T2 jest większe od T, zębatka obraca się w przeciwną stronę! Gorąca zębatka porusza się sama do tyłu na skutek drgań zapadki. Jeżeli zapadka jest przez chwilę oparta o jakieś miejsce skośnej płaszczyzny zęba, to popycha ją w bok. Ale zapadka zawsze napiera na taką płaszczyznę, jeżeli bowiem przypadkiem uniesie się ponad czubek zęba, a jednocześnie koło przesunie się nieco wstecz, to zapadka znowu się oprze na następnej skośnej płaszczyźnie. Dlatego gorąca zębatka z zapadką jest urządzeniem, które może idealnie poruszać się w kierunku odwrotnym do planowanego! Niezależnie od naszej umiejętności wypaczania przeznaczenia urządzeń, w wypadku dwu dokładnie równych temperatur nasze urządzenie nie wykazuje szczególnej skłonności do poruszania się w którymś kierunku. W momencie gdy je obserwujemy, może poruszać się w tę lub w inną stronę, ale gdy popatrzymy przez dłuższą chwilę, nie dostrzeżemy żadnego sumarycznego przesunięcia. Ten brak określonego kierunku jest w istocie podstawową, najgłębszą zasadą, na której opiera się cała termodynamika. 46-3. Odwracalność w mechanice Z jakiej to bardziej podstawowej zasady mechaniki wynika, że gdy temperatury są jednakowe, to nasze urządzenie nie obróci się ostatecznie ani w lewo, ani w prawo? Widocznie istnieje jakieś podstawowe twierdzenie głoszące, że nie można zbudować urządzenia, które pozostawione samo poruszałoby się raczej w jedną stronę niż w drugą przez dostatecznie długi czas. Musimy postarać się sprawdzić, jak to twierdzenie wynika z praw mechaniki. W krótkim zarysie prawa mechaniki wyglądają następująco: masa razy przyspieszenie równa się sile, a silą działająca na każdą cząstkę jest jakąś skomplikowaną funkcją położeń wszystkich innych cząstek. Są też sytuacje, w których siły zależą od prędkości, tak jak w magnetyzmie, ale nie będziemy się tym teraz zajmowali. Weźmy prostszy przypadek, w którym, tak jak w grawitacji, siły zależą tylko od położeń. Załóżmy, że rozwiązaliśmy nasz układ równań i otrzymaliśmy pewien ruch x(i) dla każdej cząstki. Dla układu dostatecznie złożonego rozwiązania będą bardzo skomplikowane i z upływem czasu dzieją się tam bardzo dziwne rzeczy. Jeżeli wymyślimy jakikolwiek rozkład cząstek i poczekamy dostatecznie długo, to na pewno się go doczekamy! Towarzysząc naszemu rozwiązaniu dostatecznie długo stwierdzamy, że — jeśli można się tak wyrazić — wypróbowuje ono wszystkie swoje możliwości. To nie jest bezwzględnie konieczne dla urządzeń najprostszych, ale zdarza się w układach złożonych z dużej liczby atomów. Nasze rozwiązanie ma jeszcze jedną własność. Rozwiązując równania ruchu otrzymujemy pewną funkcję czasu, np. / + /2 + /3 Twierdzimy, że drugim rozwiązaniem będzie -t + t1 — /3. Inaczej mówiąc, jeżeli zastąpimy wielkość / wielkością —/ w całym rozwiązaniu, znów otrzymamy rozwiązanie tego samego równania. Wynika to z faktu, że jeśli w wyjściowym równaniu różniczkowym zastąpimy wielkość t wielkością —/, to nic się nie zmieni, ponieważ występują tylko drugie pochodne względem t. Znaczy to, że jeżeli zachodzi pewien ruch, to jest możliwy również ruch dokładnie przeciwny. W stanie zupełnego chaosu, któr> wystąpi po dostatecznie długim czasie, w pewnei
46-3. ODWRACALNOŚĆ W MECHANIC!! 313 chwili ruch odbywa się w jednym kierunku, a później może wystąpić ruch dokładnie do niego przeciwny. Żaden ruch nie wyróżnia się niczym spośród innych ruchów. A więc nie można wymyślić urządzenia, które na dalszą metę porusza się chętniej w jednym kierunku niż w innych, jeżeli urządzenie to jest dostatecznie skomplikowane. Można podać przykład, w którym to, co powiedzieliśmy przed chwilą, nie jest prawdziwe. Jeżeli na przykład rozkręcimy koło w pustej przestrzeni, to zawsze będzie się poruszało tak samo. A więc istnieją pewne warunki, które, jak zasada zachowania momentu pędu, naruszają powyższe rozważania. Wymaga to jednak tylko staranniejszego potraktowania naszego dowodu. Może moment pędu jest przekazywany ściankom lub dzieje się coś podobnego, co zawiesza działanie zasad zachowania. Wtedy, jeżeli urządzenie jest dostatecznie złożone, nasze rozumowanie jest prawdziwe. Opiera się na fakcie, że prawa mechaniki są odwracalne. Ze względów historycznych chcielibyśmy zwrócić uwagę na urządzenie wymyślone przez Maxwella, twórcę dynamicznej teorii gazów. Rozważył on następującą sytuację: W dwóch zbiornikach połączonych otworkiem znajduje się gaz o tej samej temperaturze. W otwork u siedzi diabełek (można go oczywiście zastąpić jakimś mechanizmem!), który może otwierać lub zamykać znajdujące się tam drzwiczki. Diabełek obserwuje cząsteczki biegnące z lewej strony w prawą. Gdy zobaczy szybką cząsteczkę, to otwiera drzwiczki, a cząsteczek powolnych nie wypuszcza. Jeżeli wyobrazimy go sobie jako super-diabełka, który ma też oczy z tyłu głowy, to może postępować odwrotnie z cząsteczkami biegnącymi z prawej strony. Diabełek przepuszcza więc powolne cząsteczki na lewo, a szybkie na prawo. Wkrótce zatem lewy zbiornik się oziębi, a prawy ogrzeje. Czy taki diabełek naruszyłby więc zasady termodynamiki? Okazuje się jednak, że gdyby nasz diabełek miał skończone rozmiary, to bardzo szybka tak się ogrzałby, że po chwili nie widziałby zbyt dobrze. Najprostszym przykładem takiego diabełka może być klapka utrzymywana przy otworku za pomocą sprężynki. Szybkie cząsteczki przechodziłyby przez otworek, ponieważ mogłyby uchylić klapkę. Powolne nie mogłyby tego zrobić i odbijałyby się z powrotem. Ale nie jest to przecież nic innego jak inna postać naszej zębatki, która w końcu się ogrzewa. Jeżeli założymy, że ciepło właściwe diabełka nie jest nieskończone, to musi się on ogrzać. Przecież musi mieć jakieś przekładnie i kółka, a więc nie może stracić dodatkowego ciepła, które otrzymuje wskutek obserwowania cząsteczek. Wkrótce zacznie się tak trząść od ruchów Browna, że sam nie będzie wiedział, czy zamyka czy otwiera drzwiczki, a tym bardziej czy cząsteczki wlatują, czy wylatują - więc przestanie spełniać swoje zadanie. 46-4. Nieodwracalność Czy wszystkie prawa fizyki są odwracalne? Z pewnością nie! Spróbujmy z jajecznicy otrzymać z powrotem całe jajka! Puśćmy taśmę filmową do tyłu, a po chwili wszyscy zaczną się śmiać. Najbardziej naturalną cechą wszystkich zjawisk jest ich oczywista nieodwracalność. Skąd bierze się ta nieodwracalność? Nie wynika z praw Newtona. Jeżeli twierdzimy,
314 46. MECHANIZM ZAPADKOWY że wszystkie zjawiska mogą być w końcu zrozumiałe na podstawie praw fizyki i jeżeli okazuje się także, że wszystkie równania mają tę dziwną właściwość, iż po podstawieniu /= —/ otrzymujemy także rozwiązanie, to każde zjawisko jest odwracalne. Jak więc się to dzieje, że w przyrodzie ciągle spotykamy się z nieodwracalnością? Oczywiście, musi istnieć jakieś prawo, jakieś trudno dostępne, ale podstawowe równanie, może w elektrodynamice może w fizyce neutrino, w którym kierunek upływu czasu ma znaczenie. Zastanówmy się teraz nad tym zagadnieniem. Znamy jedno z takich praw, prawo, które mówi, że entropia zawsze wzrasta. Jeżeli mamy dwa przedmioty: gorący oraz zimny, ciepło zawsze przepływa od ciepłego do zimnego. A więc prawo wzrostu entropii jest jednym z takich praw. Ale my chcemy zrozumieć to prawo z punktu widzenia mechaniki. Przecież już się nam udało w oparciu o rozumowanie na podstawie mechaniki wyciągnąć wnioski z twierdzenia, że ciepło nie może samo płynąć w odwrotnym kierunku. Dzięki temu zrozumieliśmy drugą zasadę termodynamiki. Widocznie możemy otrzymać nieodwracalność z równań odwracalnych. Ale czy korzystaliśmy tylko z twierdzeń mechaniki? Zajmijmy się tym dokładniej. Skoro nasz problem dotyczy entropii, chodzi nam wiec o znalezienie jej opisu mikroskopowego. Jeżeli mówimy, że mamy pewną energię, zawartą np. w gazie, możemy od razu otrzymać obraz mikroskopowy i mówimy, że każdy atom ma pewną energię. Te wszystkie energie dodane do siebie dają nam energię całkowitą. Może więc każdy atom ma pewną entropię i jeżeli dodamy wszystko razem, otrzymamy entropię całkowitą? Tak dobrze nie jest, lecz zobaczmy, jak to wygląda naprawdę. Obliczymy na przykład różnicę eptropii gazu o pewnej temperaturze i o pewnej objętości i gazu o tej samej temperaturze, ale o innej objętości. Pamiętamy z rozdz. 44, że zmianę entropii zapisujemy jako -If W naszym przypadku energia gazu jest taka sama przed, jak i po rozprężeniu, bo temperatura się nie zmienia. Musimy więc dodać odpowiednią ilość ciepła do wyrównania pracy wykonanej przez gaz, czyli dla każdej małej zmiany objętości dQ = PdV. Podstawiając to wyrażenie za dQ, otrzymujemy Vi Vi f dV CNkTdV V2 J T J V T P,' v, v, tak jak w rozdz. 44. Jeżeli zwiększymy na przykład objętość dwukrotnie, to zmiana entropii wyniesie Nk In 2. Zastanówmy się teraz nad innym interesującym przykładem. Weźmy zbiornik z przegrodą w środku. Po jednej stronie przegrody znajduje się neon („czarne" cząsteczki), a P° drugiej argon („białe" cząsteczki). Usuwamy przegrodę i pozwalamy cząsteczkom się wymieszać. O ile zmieni się entropia? Można też wyobrazić sobie, że zamiast przegrody
46-4 NIEODWRACALNOŚĆ 315 mamy tłok z dziurką przepuszczającą białe, ale zatrzymującą czarne cząsteczki, oraz drugi tłok, który działa odwrotnie. Po przesunięciu tłoków do przeciwnych końców zbiornika stwierdzamy, że dla obu gazów problem jest taki sam jak ten, który już rozwiązaliśmy przed chwilą. A więc uzyskujemy zmianę entropii Nk In 2, co oznacza, że wzrosła ona o k In 2 na każdą cząsteczkę. Czynnik 2 jest związany z dodatkową przestrzenią, którą zyskała cząsteczka, co jest raczej dziwne. Nie należy to do własności samej cząsteczki, ale związane jest z rozmiarami przestrzeni, w której się może poruszać. Sytuacja jest dziwna, gdyż entropia wzrasta, a wszystko ma taką samą energię i temperaturę! Zmiana polega tylko na tym, że cząsteczki są inaczej rozłożone. Dobrze wiemy, że gdy usuniemy przegrodę, wszystko po dłuższym czasie wymiesza się na skutek zderzeń. Białe cząsteczki nieustannie lecą ku czarnym, a czarne — ku białym. Po pewnym czasie białe przenoszą się tam, gdzie znajdują się czarne, a czarne wpadają między białe. Jeżeli poczekamy wystarczająco długo, otrzymamy mieszaninę. W rzeczywistym świecie jest to oczywiście proces nieodwracalny, który powinien spowodować wzrost entropii. Mamy tu prosty przykład procesu nieodwracalnego, złożonego wyłącznie z wydarzeń odwracalnych. W każdej chwili zachodzą zderzenia między dwiema cząsteczkami, które rozbiegają się potem w określonych kierunkach. Jeżeli film o zderzeniu puścimy w odwrotnym kierunku, to otrzymamy prawidłowy obraz. Przecież właściwie wszystkie rodzaje zderzeń są równie prawdopodobne. A więc mechanizm mieszania jest całkowicie odwracalny, a wynik jest nieodwracalny. Wszyscy wiedzą, że jeśli z początku cząsteczki białe i czarne będą oddzielone, to po paru minutach otrzymamy ich mieszaninę. Jeżeli poczekamy spokojnie jeszcze parę minut, to nie rozdzielą się z powrotem, ale nadal będą stanowiły mieszaninę. Mamy więc sytuację nieodwracalną, wywołaną przez odwracalne zjawisko. Widzimy teraz jednak, dlaczego mogło do tego dojść. Rozpoczęliśmy od rozkładu, który był w jakiś sposób uporządkowany. Na skutek chaotycznych zderzeń staje się bezładny. Źródłem nieodwracalności jest przejście od rozkładu uporządkowanego do bezładnego. To prawda, że gdy sfilmujemy proces mieszania i puścimy taśmę filmową do tyłu, to stwierdzimy, że wszystko stopniowo się porządkuje. Ktoś mógłby powiedzieć: „To jest sprzeczne z prawami fizyki!" Gdybyśmy więc puścili film jeszcze raz i przyjrzeli się każdemu zderzeniu z osobna, zobaczylibyśmy, że każde jest w porządku i spełnia prawa fizyki. Wszystkie prędkości cząsteczek są właśnie tak dobrane, że po odwróceniu wszystkich torów cząsteczki powrócą do swych wyjściowych położeń. Taka sytuacja jest jednak niesłychanie mało prawdopodobna. Jeżeli na początku mamy gaz nie uporządkowany w jakiś sposób, po prostu gaz czarno-biały, składający się z czarnych i białych cząsteczek, to gaz ten nigdy się nie uporządkuje. 46-5. Porządek i entropia Musimy teraz wyjaśnić, co rozumiemy przez chaos, a co przez porządek. Nie chodzi tu o przyjemny ład i nieprzyjemny bałagan Gazy wymieszane od uporządkowanych różni coś innego. Załóżmy, że podzieliliśmy przestrzeń na obszary o małej objętości. Jeżeli
316 46. MECHANI/M ZAPADKOWy mamy cząsteczki białe i czarne, to na ile sposobów możemy je rozdzielić między te obszary tak aby białe były zgrupowane po jednej stronie, a czarne po drugiej? A na ile sposobów moglibyśmy je rozdzelić, gdybyśmy nie musieli oddzielnie grupować kolorów? Oczywiście w drugim przypadku jest znacznie więcej sposobów rozłożenia cząstek. „Nieporządek" mierzymy liczbą sposobów, w które można poustawiać składniki, nie naruszając wyglądu zewnętrznego. Logarytm tej liczby równa się entropii. W przypadku gazów rozdzielonych liczba rozkładów jest mniejsza, a więc mniejsza jest entropia lub, jak też mówimy, jest mniejszy „nieporządek". Przy pomocy tej technicznej definicji nieporządku możemy zrozumieć twierdzenie o entropii. Po pierwsze — entropia jest miarą chaosu. Po drugie — Wszechświat zawsze zmierza od „porządku" do „chaosu", a więc entropia zawsze wzrasta. Przez porządek nie rozumiemy przyjemnego ładu, ale to, że liczba różnych sposobów, na które możemy go zmienić nie naruszając wyglądu zewnętrznego, jest względnie ograniczona. W chwili kiedy odwróciliśmy film o mieszaniu się gazów, nie było znów tak wielkiego nieporządku, jak nam się wydawało. Każdy pojedynczy atom miał właściwą szybkość i kierunek i mógł się z powodzeniem wydostać z mieszaniny. Entropia mimo wszystko nie była tak duża, jak mogło się wydawać. A co z odwracalnością innych praw fizyki? Gdy zajmowaliśmy się polem elektrycznym, wytworzonym przez przyspieszony ładunek elektryczny, dowiedzieliśmy się, że musi to być pole opóźnione. W chwili t i w odległości r od ładunku bierzemy pole wywołane przez przyspieszenie w chwili r — r/c, a nie / + r/c. Na pierwszy rzut oka wydawałoby się, że prawo opisujące oddziaływanie elektryczne nie jest odwracalne. A tymczasem, co bardzo dziwne, stosowane przez nas prawa wynikają z układu równań zwanych równaniami Maxwella, które są przecież odwracalne. Można ponadto dowieść, że gdybyśmy używali tylko pola wyprzedzającego, tzn. pola zdającego sprawę ze stanu w chwili t + rjc, i robili to z całkowitą konsekwencją w zamkniętej przestrzeni, to wszystko zaszłoby tak samo jak przy użyciu pól opóźnionych! A więc ta pozorna nieodwracalność praw elektryczności, przynajmniej w przestrzeni zamkniętej, nie jest wcale nieodwracalnością. Powinniśmy się tego spodziewać, ponieważ wiemy, że w przypadku gdy drgający ładunek wytwarza pole elektryczne odbijające się od ścian zbiornika, w końcu osiągamy równowagę, w której nie ma żadnego wyróżnionego zwrotu czasu. Przyjęcie pola opóźnionego jest tylko wygodną metodą otrzymania rozwiązania. Jak wiemy dotychczas, wszystkie podstawowe prawa fizyki, np. równania Newtona, są odwracalne. Skąd się więc bierze nieodwracalność? Pochodzi ona stąd, że porządek przechodzi w chaos. Jednak nic to nam nie wyjaśnia, póki nie znamy źródła porządku. Dlaczego sytuacje, z którymi się ciągle stykamy zawsze charakteryzują się brakiem równowagi? Oto jedno z wyjaśnień. Spójrzmy jeszcze raz na zbiornik z wymieszanymi białymi i czarnymi cząsteczkami. Jeżeli poczekamy dostatecznie długo, to bardzo mało prawdopo dobny, ale w każdym razie możliwy jest przypadek, że cząsteczki ułożą się tak, aby białe występowały przeważnie po jednej stronie, a czarne po drugiej. Potem, wraz z upływem czasu, cząsteczki znów się wymieszają. W ten sposób jednym z wyjaśnień wysokiego stopnia uporządkowania współczesnego świata jest stwierdzenie, że jest to jedynie kwestia przypadku. Może nasz Wszechświa
46-5. PORZĄDEK 1 ENTROPIA 317 doznał w przeszłości jakiejś fluktuacji, w której nastąpiło rozdzielenie wszystkich rzeczy, a obecnie wszystko zmierza do ponownego wymieszania. Ta teoria nie jest niesymetryczna. Na pytanie bowiem, jak będzie wyglądał rozdzielony gaz w niedalekiej przyszłości lub jak wyglądał w niedawnej przeszłości odpowiada ona: w obu przypadkach ujrzelibyśmy szarą masę na granicy między cząsteczkami białymi i czarnymi, ponieważ znów się mieszają. Niezależnie jaki zwrot ma bieg czasu, gaz ulegnie wymieszaniu. Teoria ta głosi więc, że nieodwracalność została wywołana przypadkowo. Spróbujmy dowieść, że tak nie jest. Załóżmy, że nie oglądamy całego zbiornika od razu, a tylko jego część. Załóżmy dalej, że w pewnej chwili stwierdzamy w tej części pewien stopień uporządkowania, białe i czarne cząsteczki oddzieliły się. Co moglibyśmy wówczas wywnioskować o sytuacji w innych częściach zbiornika, których jeszcze nie oglądaliśmy? Jeżeli naprawdę wierzymy, że stan uporządkowania powstał z zupełnego chaosu na skutek fluktuacji, to musimy założyć, że była to fluktuacja najbardziej prawdopodobna z tych, które mogły uporządkować gaz w naszej części, oraz że najbardziej prawdopodobnym stanem reszty zbiornika jest brak uporządkowania! Dlatego z hipotezy, że świat jest fluktuacją, wynika wniosek, że gdy spojrzymy na część świata, której nigdy nie widzieliśmy, powinniśmy znaleźć go w stanie chaosu, inaczej niż część nam znaną? Jeżeli nasz porządek został spowodowany fluktuacją, to nie powinniśmy oczekiwać go nigdzie poza miejscem już nam znanym. Obecnie przyjmujemy, że przyczyn porządku należy szukać w historii Wszechświata, ponieważ w przeszłości Wszechświat był rzeczywiście uporządkowany. Porządek nie został wywołany fluktuacjami, lecz po prostu wszystko było kiedyś białe albo czarne. Teoria ta przewiduje, że uporządkowanie wystąpi i w innych miejscach — nie wynikło bowiem z fluktuacji, ale z wysokiego stopnia uporządkowania na początku czasu. Spodziewamy się więc, że znajdziemy porządek w miejscach, których do tej pory nie oglądaliśmy. Astronomowie na przykład oglądają tylko niektóre gwiazdy. Co noc kierują swe teleskopy na coraz nowe ciała niebieskie, które zachowują się tak samo jak pozostałe. Wnioskujemy .stąd, że Wszechświat nie jest fluktuacją oraz że porządek jest pozostałością po warunkach, które były na początku. Nie mówimy przez to, że rozumiemy jego sens. Z nieznanych nam powodów Wszechświat miał kiedyś bardzo niską entropię w porównaniu z posiadanymi zasobami energii i od tego czasu entropia wzrasta. Taka jest więc droga ku przyszłości. To jest właśnie przyczyną wszelkiej nieodwracalności, to kieruje procesami wzrostu i rozpadu. Dzięki temu pamiętamy przeszłość, a nie przyszłość, pamiętamy wypadki bliższe tej razie historii Wszechświata, w której był wyższy porządek niż obecnie, a nie wiemy nic o tej, w której chaos będzie większy, nie wiemy nic o przyszłości. Tak więc, jak powiedzieliśmy już w jednym z wcześniejszych rozdziałów, cały Wszechświat zawiera się w lampce wina, jeżeli tylko przyjrzymy się jej dokładnie. W tym przypadku ta lampka jest dość złożona, ponieważ istnieje i ciecz i szkło i światło i wszystko inne. Fizyka ma jeszcze tę przyjemną cechę, że nawet tak proste i wyidealizowane urządzenia jak zębatka pracują tylko dlatego, iż są częścią Wszechświata. Zębatka pracuje tylko w jednym kierunku, ponieważ pozostaje w jakimś istotnym związku z resztą Wszechświata. Gdybyśmy ją umieścili w pudełku i odizolowali na dość długo, to kółko poruszałoby się
318 46. MECHANIZM ZAPADKOWY równie dobrze w jedną stronę, jak i drugą. Ale gdy podnosimy zasłony, światło wydostaje się z zamknięcia, gdy chcemy się ochłodzić, szukamy cienia na ziemi, a ciepło czerpiemy ze słońca i dlatego „zębatki", które my stanowimy, mogą pracować tylko w jednym kierunku Ta jednokierunkowość jest wewnętrznie związana z faktem, że zębatka jest częścią Wszechświata. Jest jego częścią nie tylko w tym sensie, że spełnia prawa fizyki obowiązujące we Wszechświecie, ale także dlatego, że jej jednokierunkowy ruch jest związany z jednokierunkowym przebiegiem zjawisk w całym Wszechświecie. Tego wszystkiego nie można w pełni zrozumieć póki tajemnica początków historii Wszechświata nie zostanie sprowadzona od domysłów do naukowego pojmowania.
47 dźwięk • równanie falowe 47-1. Fale W rozdziale niniejszym zajmiemy się zjawiskiem rozchodzenia się fal. Jest to zjawisko, o którym się mówi wielokrotnie w fizyce i dlatego naszą uwagę skupimy na nim nie tylko ze względu na rozpatrywany teraz szczególny przykład, którym jest dźwięk, lecz przede wszystkim ze względu na znacznie szersze zastosowanie związanych z nim pojęć we wszystkich dziedzinach fizyki. Zajmując się poprzednio oscylatorem harmonicznym*' mówiliśmy, że istnieją nie tylko mechaniczne układy drgające, lecz także drgające układy elektryczne. Fale są związane z układami drgającymi. Drgania falowe nie są jednak tylko drganiami w czasie ograniczonymi do jednego miejsca, ale rozchodzą się też w przestrzeni. Właściwie zajmowaliśmy się już falami. Gdy omawialiśmy światło, poznaliśmy jego własności falowe i zwróciliśmy szczególną uwagę na interferencję przestrzenną fal pochodzących z paru różnych źródeł mających tę samą częstość drgań. Istnieją jeszcze dwa ważne zjawiska falowe, przez nas nie omawiane, które występują zarówno w przypadku światła, tzn. dla fal elektromagnetycznych, jak i dla innych rodzajów fal. Pierwszym z tych zjawisk, jest interferencja w czasie, a nie w przestrzeni. Gdy mamy dwa źródła dźwięku, których częstości różnią się nieznacznie i gdy słuchamy ich jednocześnie, to czasem obie fale dochodzą do nas grzbietami, a czasem jedna grzbietem, a druga doliną (patrz rys. 47.1). Wznoszenie się i opadanie dźwięku, które wówczas słyszymy, nazywamy dudnieniem; jest to właśnie interferencja drgań w czasie. Drugie zjawisko dotyczy kształtu fali, która powstaje, gdy fale zamknięte w pewnej przestrzeni odbijają się od przeciwległych ścian. Zjawiska te można było oczywiście omawiać przy rozważaniu fal elektromagnetycznych. •> W rozdz. 21, t. I cz. 1. (Przyp. red. wyd. polskiego.)
320 47 DŹWIĘK. RÓWNANIE FALOWE 47.1. Interferencja w czasie dźwięków wysyłanych przez dwa źródła o nieznacznie różniących się częstościach wywołuje dudnienia. 47.2. Krzywa ciągła przedstawia wykres pola elektrycznego w pewnej chwili, a krzywa przerywana przedstawia to pole w chwilę potem. -ct- i \ Nie zrobiliśmy tego, ponieważ nie uświadomili, byśmy sobie, że własności, o których mówimy dotyczą wielu różnych zjawisk. Aby przypomnieć, że zjawiska falowe występują nie tylko w elektrodynamice, zajmiemy się teraz innym przykładem, a mianowicie falami dźwiękowymi. Znamy także inne przykłady fal: fale morskie długie, które widzimy stojąc nad brzegiem morza, lub też drobniejsze fale, zmarszczki na powierzchni wody wywołane przez napięcie powierzchniowe. Oprócz tego mamy dwa rodzaje fal sprężystych w ciałach stałych: fale zgęszczeniowe (podłużne), w których cząsteczki ciała drgają tam i z powrotem wzdłuż kierunku rozchodzenia się fal (należą do nich fale dźwiękowe w gazie), i fale poprzeczne, w których cząsteczki ciała drgają prostopadle do kierunku rozchodzenia się fal. Fale sejsmiczne składają się z fal sprężystych obu rodzajów wywołanych przez lokalne ruchy w skorupie ziemskiej. Istnieje jeszcze jeden rodzaj fal, odkrytych przez fizykę współczesną. Są to fale, które określają amplitudę prawdopodobieństwa znalezienia cząstki w danym miejscu — „fale materii", którymi już się zajmowaliśmy. Ich częstość jest proporcjonalna do energii cząsteczki, a liczba falowa do jej pędu. Fale te zostały odkryte przez mechanikę kwantową. W rozdziale niniejszym zajmiemy się tylko falami, których prędkość nie zależy od ich długości. Zachodzi to na przykład dla fal świetlnych w próżni. Prędkość światła jest więc taka sama dla fal radiowych, dla światła niebieskiego, zielonego, a także dla światła o każdej innej długości fali. To było właśnie powodem, że rozpoczynając opis zjawisk falowych nie zwróciliśmy początkowo uwagi na zjawisko rozchodzenia się fal. Mówiliśmy tylko, że gdy ładunek porusza się, pole elektryczne w odległości x jest proporcjonalne do jego przyspieszenia nie w chwili /, lecz w chwili wcześniejszej t — x\c- Dlatego też gdybyśmy sporządzili wykres po'3
„7.I. FALE 321 elektrycznego w przestrzeni, w pewnej chwili, jak na rys. 47.2, to po czasie t pole elektryczne przesunęłoby się na odległość et, jak to zaznaczono na rysunku. Możemy to ująć matematycznie przyjmując, że w przypadku jednowymiarowym, którym się tu zajmujemy, pole elektryczne jest funkcją zmiennej x — et. Widzimy, że w chwili / = 0 jest ono pewną funkcją zmiennej x. Jeżeli bierzemy pod uwagę stan nieco późniejszy, to musimy tylko nieco zwiększyć x, aby otrzymać tę samą wartość pola elektrycznego. Jeżeli na przykład pole ma wartość maksymalną w punkcie x = 3, w chwili 0, to dla znalezienia nowego położenia maksimum pola w chwili t trzeba, aby x — cl = 3, czyli x = 3 + et. Widzimy więc, że takie właśnie funkcje odpowiadają rozchodzeniu się fali. Zatem funkcja f(x—ct) przedstawia pewną falę. Możemy krótko ująć podany wyżej opis własności fali stwierdzając po prostu, że f{x-ct)=f(x+Ax-c(t + At)), gdzie Ax=c At. Istnieje oczywiście jeszcze jedna możliwość, mianowicie że zamiast źródła z lewej strony, tak jak na rys. 47.2, mamy źródło z prawej, tak że fala porusza się w kierunku ujemnych wartości osi x. Taką falę można opisać funkcją g(x + ct). Może się również zdarzyć, że w tej samej chwili będziemy mieli więcej niż jedną falę i wtedy pole elektryczne, na przykład, będzie sumą pól, z których każde będzie się rozchodziło niezależnie. To zachowanie się pól elektrycznych można opisać mówiąc, że jeżeli fi(x— cf) jest falą, a/2(x — et) inną falą, to ich suma jest także falą. Jest to tzw. zasada superpozycji. Ta sama zasada stosuje się w przypadku dźwięku. Wiemy, że podczas wytwarzania dźwięków słyszymy je z doskonałą wiernością w takiej samej kolejności, w jakiej były wytwarzane. Gdyby częstości wyższe poruszały się szybciej niż niskie, to słyszelibyśmy urywany ostry hałas zamiast, na przykład, dźwięków muzyki. Podobnie, gdyby czerwone światło poruszało się szybciej niż niebieskie, błysk hiałego światła widzielibyśmy najpierw jako czerwony, później jako biały, a w końcu jako niebieski. Dobrze wiemy, że tak się nie dzieje. Zarówno dźwięk, jak i światło poruszają się w powietrzu z prędkością, która prawie nie zależy od częstości. W rozdziale 48 omówimy przykłady fal, w których ta niezależność nie będzie już występować. W przypadku światła (fal elektromagnetycznych) podaliśmy regułę określającą pole elektryczne w pewnym punkcie, powstałe na skutek przyspieszenia ładunku. Można by oczekiwać, że tym razem też powinniśmy podać regułę, za której pomocą jakaś cecha powietrza, powiedzmy ciśnienie, którego wartość chcemy znać w pewnej odległości od źródła, byłaby zależna od ruchu źródła i opóźniona o czas przelotu dźwięku. W przypadku światła można było się zgodzić na takie postępowanie, ponieważ wiedzielibyśmy tylko, ^e ładunek umieszczony w jednym punkcie działa pewną siłą na ładunek umieszczony w innym punkcie. Znajomość szczegółów rozchodzenia się od jednego miejsca do drugiego nie była tam bezwzględnie konieczna. Jednak w przypadku dźwięku wiemy, że rozchodzi się on w powietrzu między źródłem a słuchaczem i każdy na pewno zapyta, jakie w danym momencie jest ciśnienie powietrza. Chcielibyśmy oprócz tego dokładnie wiedzieć jak się przy tym porusza powietrze W przypadku elektryczności mogliśmy
322 47. DŹWIĘK. RÓWNANIE FALOWfc akceptować sformułowaną wtedy regułę, ponieważ mogliśmy twierdzić, że nie znamy jeszcze praw elektryczności, lecz nie możemy na tym poprzestać w przypadku dźwięku. Nie zadowoliłaby nas reguła ustalająca, jak rozchodzi się ciśnienie powietrza, ponieważ powinniśmy ten proces wyjaśnić w oparciu o prawa mechaniki. Krótko mówiąc, rozchodzenie się dźwięku jest zjawiskiem należącym do mechaniki i dlatego powinniśmy je zrozumieć za pomocą praw Newtona. Rozchodzenie się dźwięku w przestrzeni opisują jedynie prawa mechaniki i zależy ono od własności gazów, gdy dźwięk rozchodzi się w gazie, lub od własności cieczy czy ciał starych, gdy rozchodzi się on w tych właśnie ośrodkach. Później w podobny sposób wyprowadzimy z praw elektrodynamiki własności światła i rozchodzenia się fal świetlnych. 47-2. Rozchodzenie się dźwięku Wyprowadzimy teraz z praw Newtona własności rozchodzenia się dźwięku między źródłem i odbiornikiem. Nie będziemy przy tym uwzględniać wzajemnego oddziaływania źródła i odbiornika. Zwykle kładliśmy raczej nacisk na wynik niż na sposób jego otrzymania. W tym rozdziale postąpimy odwrotnie. Celem naszym stanie się w pewnym sensie samo wyprowadzenie. Problem wyjaśniania nowych zjawisk na podstawie zjawisk znanych, których prawa znamy, jest być może największą sztuką w fizyce teoretycznej. Fizyka teoretyczna zajmuje się problemami dwojakiego rodzaju: pierwsze polegają na znalezieniu rozwiązań danych równań, a- drugie — na znalezieniu równań, które opisują nowe zjawisko. Nasze zadanie jest przykładem drugiego rodzaju problemów. Zajmiemy się tu najprostszym przykładem — rozchodzeniem się dźwięku w jednym wymiarze. Aby wykonać nasz zamiar, musimy najpierw zdać sobie sprawę, co tu się dzieje. Otóż podstawą wszystkiego jest tu to, że ruch jakiegoś obiektu w powietrzu zapoczątkowuje rozprzestrzenianie się zaburzeń powietrza. Jeżeli chodzi o rodzaj tych zaburzeń, to spodziewamy się, że ruch obiektu wywoła zmianę ciśnienia. Gdy obiekt porusza się powoli, powietrze oczywiście opływa go, ale nam chodzi o ruch bardzo szybki, w którym nie ma czasu na tego rodzaju opływanie. Powietrze jest zatem podczas ruchu sprężane i powstaje zmiana ciśnienia, która wywiera nacisk na jego dalsze warstwy. Te warstwy z kolei są sprężane, co wywołuje wzrost ich ciśnienia i w ten sposób w przestrzeni rozchodzi się fala zgęszczeń i rozrzedzeń powietrza. Chcielibyśmy teraz opisać ten proces przy pomocy wzorów. Musimy się zdecydować na wybór zmiennych. W naszym zagadnieniu chcielibyśmy wiedzieć, jakiemu przemieszczeniu ulegnie powietrze, na pewno więc odpowiednią zmienną będzie to przemieszczenie. Oprócz tego chcielibyśmy opisać towarzyszącą temu przemieszczeniu zmianę gęstości powietrza. Ciśnienie powietrza także się zmienia i tym samym też nas interesuje. Ponadto powietrze porusza się przecież z jakąś prędkością, musimy więc umieć określić prędkość jego cząsteczek. Cząsteczki powietrza poruszają się także z pewnym przyspieszeniem. Zastanawiając się jednak nad wyborem zmiennych szybko dojdziemy do wniosku, że prędkość i przyspieszenie będą znane, gdy będziemy wiedzieli jak przemieszczenie powietrza zmienia się w czasie.
47-2. ROZCHODZENIE SIĘ DŹWIĘKU 323 Zapowiedzieliśmy, że będziemy się zajmować falą w jednym wymiarze. Możemy tak postąpić, jeśli jesteśmy tak daleko od źródła, że tzw. czoło fali jest prawie płaszczyzną. Uprościliśmy więc nasze rozważania wybierając możliwie najmniej skomplikowany przypadek. W tej sytuacji możemy powiedzieć, że przemieszczenie x zależy tylko od zmiennych xif,a nie zależy od y i z. Opisujemy więc ruch powietrza za pomocą funkcji #(x, /). Czy opis ten jest zupełny? Wydawałoby się, że nie, gdyż nic nie wiemy o szczegółach ruchu cząsteczek powietrza. Poruszają się one we wszystkich kierunkach, a tego z pewnością nie opisuje funkcja %(x, t). Z punktu widzenia teorii kinetycznej, gdy w pewnym miejscu gęstość cząsteczek jest większa niż w sąsiednim, cząsteczki powinny poruszać się z obszaru o większej gęstości do obszaru o mniejszej gęstości, aż do wyrównania tej różnicy. Nie otrzymalibyśmy więc drgań i dźwięk by się nie wytworzył. Aby mogła powstać fala dźwiękowa, musi być spełniony pewien warunek. Otóż cząsteczki wybiegając z obszaru o większej gęstości i ciśnieniu przekazują pęd cząsteczkom znajdującym się w sąsiednim obszarze o mniejszej gęstości. Aby powstała fala dźwiękowa, obszar, w którym zmienia się ciśnienie i gęstość, musi być większy od odległości, którą przebywają cząsteczki, zanim zderzą się z innymi cząsteczkami. Ta odległość równa się średniej drodze swobodnej i dlatego odstęp między grzbietem i doliną ciśnienia musi być znacznie od niej większy. W przeciwnym przypadku cząsteczki poruszałyby się swobodnie od grzbietu do doliny i natychmiast spłaszczyłyby falę. Mamy oczywiście opisywać zachowanie się dużych obszarów gazu, których rozmiary są znacznie większe od średniej drogi swobodnej, a więc własności gazu nie będziemy wyjaśniali za pomocą zachowania się poszczególnych cząsteczek. Przemieszczenie, na przykład, będzie oznaczało przesunięcie środka masy małego obszaru gazu, a ciśnienie i gęstość będą oznaczały ciśnienie i gęstość w tym obszarze. Ciśnienie oznaczamy literą P, a gęstość literą p. Będą one funkcjami zmiennych x i /. Musimy pamiętać, że opis ten jest pewnym przybliżeniem, które jest słuszne tylko wtedy, gdy te własności gazu nie zmieniają się zbyt szybko wraz z odległością. 47-3. Równanie falowe Zjawiska fizyczne zachodzące w fali dźwiękowej odznaczają się więc następującymi trzema własnościami: I. Ruch gazu wywołuje zmianę gęstości. II. Zmiana gęstości odpowiada zmianie ciśnienia. 111. Nierównomierny rozkład ciśnienia wywołuje ruch gazu. Zajmijmy się najpierw drugą własnością. Dla gazu, cieczy lub ciała stałego ciśnienie jest pewną funkcją gęstości. Przed nadejściem fali dźwiękowej mamy stan równowagi przy ciśnieniu P0 i odpowiedniej gęstości p0. Ciśnienie P w ośrodku wiąże się z gęstością pewną charakterystyczną zależnością P=f(p) i w szczególności ciśnienie w stanie równowagi P0 jest dane przez P0 =f(Po)- Zmiany ciśnienia wywołane przez dźwięk w porównaniu z jego wartością w stanie równowagi są bardzo małe. Wygodną jednostką, w której mierzymy ciśnienie, jest bar; równa się on 105 N m2. Ciśnienie jednej atmosfery jest pra-
324 47. DŹWIĘK. RÓWNANIE FALOWE wie równe ciśnieniu jednego bara: 1 atm= 1,0133 barów. W przypadku dźwięku używamy logarytmicznej skali natężeń, ponieważ czułość ucha z grubsza biorąc wzrasta logarytmicznie. Skalę tę nazywa się skalą decybeli. Określamy w niej poziom siły dźwięku dla danej amplitudy ciśnienia P w następujący sposób: /(poziom siły dźwięku) = 20 logI0(P/PsUr) w decybelach (dB), (47.1) gdzie ciśnienie standardowe wynosi />s„n = 210~'° barów. Amplituda ciśnienia P= = 103 • PMB = 2 ■ 10 ~7 barów*' odpowiada dźwiękowi o umiarkowanym natężeniu 60 dB. Widzimy, że zmiana ciśnienia wywołana przez dźwięk jest bardzo mała w porównaniu z ciśnieniem w stanie równowagi czy też ciśnieniem średnim równym 1 atm. Odpowiednio małe są również przemieszczenia i zmiany gęstości. O wiele większe zmiany występują podczas eksplozji, w których przyrost ciśnienia może przekraczać 1 atm. Tak duże zmiany ciśnienia wywołują nowe zjawiska, którymi zajmiemy się później. W przypadku dźwięku rzadko mamy do czynienia z natężeniami przekraczającymi 100 dB. Dźwięk o natężeniu 120 dB wywołuje już uczucie bólu w uchu. Dlatego jeżeli zapiszemy dla dźwięku P = P0 + Pe, P = Po + P,. (47.2) to zawsze zmiana ciśnienia Pe będzie bardzo mała w porównaniu z P0, a zmiana gęstości pe bardzo mała w porównaniu z p0. Wówczas Po + P. =f(Po + Pe) =f(Po) + Pef(Po), (47.3) gdzie P0=f(Po)> & f'(Po) oznacza pochodną funkcji/(p) obliczoną dla p = p0. Drugie przekształcenie w naszej równości mogliśmy wykonać tylko dlatego, że pe jest bardzo małe. Stwierdziliśmy w ten sposób, że przyrost ciśnienia Pe jest proporcjonalny do przyrostu gęstości pe, wprowadzając więc współczynnik proporcjonalności k możemy napisać: (II) P. = Kpt, K=f'{p0) = (dPldp)0. (47.4) Ten bardzo prosty wzór jest sformułowaniem pod względem ilościowym przytoczonej na wstępie własności II. Zajmijmy się teraz własnością I. Położenie pewnego małego obszaru powietrza nie- zaburzonego przez dźwięk oznaczymy przez x, a jego przemieszczenie w czasie / wywołane przez dźwięk przez %(x, /), a więc nowe położenie tego obszaru równa się x+x(x, ')■ tak jak na rys. 47.3. Położenie sąsiedniego obszaru niezaburzonego równa się x + Ax- a jego nowe położenie równa się x+Ax+x(x + dx, /). Zmianę gęstości możemy obliczyć w następujący sposób. Ponieważ ograniczyliśmy się do fal płaskich, możemy wybrać jednostkową powierzchnię prostopadłą do kierunku x, który jest kierunkiem rozchodzenia się fali dźwiękowej. Ilość powietrza zawarta w prostopadłościanie o wysokości x i o jednostkowej powierzchni podstawy równa się p0 Ax, gdzie p0 oznacza niezaburzoną gęstość powietrza odpowiadającą stanowi równowagi. Powietrze to po przesunięciu przez * Przy przyjętej tu wartości /%,.„ ciśnienie P nie oznacza najwyższego ciśnienia wywołanego przez falę dźwiękową, ale pierwiastek ze średniego kwadratu ciśnienia, który równa się 1,(2)"2 razy ciśnienie maksymalne.
47-J RÓWNANIE FALOWE 325 X(*,t) pt ^ i objętość dawna i objętość nowa V«i »-( h*-J fcn II | I i 1 . 1 _| x x+Ax "+x(x,t) (x+Ax)+X(x+Ax,t) i I |_ x(x+A*.t) J 47.3. Przemieszczenie powietrza w punkcie x równa się xix, /), a w punkcie x+/3x wynosi x(x + Ax, r). Początkowa objętość powietrza przypadająca na jednostkową powierzchnię fali płaskiej równa jest ix: nowa objętość wynosi Ax + x(x + Ax, /) — x(x, t). falę dźwiękową znajduje się między x+x(x, t) oraz x + Ax+x(x + Ax, /). A więc w tym przedziale znajduje się ta sama ilość substancji, która była zawarta w niezaburzonym przedziale Ax. Jeżeli p oznacza nową gęstość, P04x=p[x+Ax + x(x+/lx,t)-x-x(x, r)]. (47.5) Ponieważ Ax jest małe, możemy napisać x(x + Axy t)-x{x, t) = (dx/dx)Ax. Pochodna ta jest pochodną cząstkową, ponieważ x zależy od czasu i od x. Nasze równanie przybiera postać Po czyli Ax = p(-— Ax + Ax\, (47.6) Po = (Po + Pe) gj + Po + Pe ■ (47.7) W fali dźwiękowej wszystkie zmiany są małe, a więc pe jest małe, x jest małe oraz dx/dx jest także małe. Dlatego w zależności, którą przed chwilą znaleźliśmy, P<=-p°Tx-p<-8x (47-8> możemy pominąć pe(dx/dx) w porównaniu z p0(dxldx). W ten sposób otrzymujemy zależność potrzebną do opisu własności I: Sy 0) P.= -Po — . (47.9) dx Równanie powyższe zawiera to, czego można się spodziewać na podstawie rozważań fizycznych. Jeżeli przemieszczenie zmienia się wraz z x, to zmienia się także gęstość. Znak jest także w porządku: jeżeli przemieszczenie x rośnie wraz z jc, a więc powietrze rozszerza s'?» gęstość musi maleć. Potrzebne nam jest jeszcze trzecie równanie, równanie ruchu wywołanego przez zmianę ciśnienia. Skoro znamy zależność między siłą i ciśnieniem, to możemy znaleźć równanie ruchu. Jeżeli weźmiemy cienką warstewkę powietrza zawartą w prostopadłościanie o wysokości Ax i o jednostkowej powierzchni podstawy, to masa powietrza zawartego w tej
326 47. DŹWIĘK. RÓWNANIE FALOWE p(*,*)Z ^ -—4x - ^ P(*+Ax,t) •9- X warstewce wynosi p0Ax, a jej przyspieszenie d2x/dt2. A więc iloczyn masy i przyspieszenia tej warstewki równa się p0Ax(d2x/dt2). (Dla małych Ax nie jest istotne, czy przyspieszenie liczymy na brzegu, czy też wewnątrz tej warstewki.) Jeżeli następnie obliczymy silę działającą na warstewkę, przypadającą na jednostkę powierzchni prostopadłej do osi x, to wynik będzie brzmiał: p0Ax(d2xldf2). Znamy siłę działającą w dodatnim kierunku osi x w punkcie x, która wynosi P(x, t) na jednostkę powierzchni, oraz siłę działającą w przeciwnym kierunku w punkcie x + Ax (rys. 47.4), wynoszącą P(x + Ax, t), a więc 47.4. Sita wypadkowa działająca w dodatnim kierunku osi x wywołana przez ciśnienie wywierane na jednostkową powierzchnię prostopadłą do osi x równa się —(iPjdx) Ax dP dPe P(x,t)-P(x + Ax,t) = Ax=-~-Ax, ex ex (47.10) ponieważ Ax jest małe, a jedyną częścią P, która się zmienia, jest dodatkowe ciśnienie P.. Mamy więc własność HI: ' dx (III) ~d7 (47.11) I w ten sposób znamy już wystarczającą liczbę równań do powiązania występujących wielkości i sprowadzenia wszystkiego do jednej funkcji, powiedzmy do funkcji x- Możemy wyeliminować Pe z równania III, korzystając z równania II. W ten sposób otrzymujemy P°c?=-KTx (47.12) Z kolei korzystamy z równania I do eliminacji pe. W ten sposób p0 upraszcza się i otrzymujemy równanie dt2 -2 dx2 (47.13) Wprowadzimy oznaczenie c2 = k, możemy więc napisać dx2 ć dt2 ' (47.14) To jest właśnie równanie falowe, które opisuje zachowanie się dźwięku w materii. 47-4. Rozwiązania równania falowego Możemy teraz sprawdzić, czy równanie to naprawdę opisuje istotne własności fal dźwiękowych w materii. Chcemy przekonać się czy impuls wywołany przez dźwięk, a więc zaburzenie, którego rozchodzenie opisuje równanie falowe, będzie się poruszało ze stałą
47^4. ROZWIĄZANIA RÓWNANIA FALOWEGO 327 szybkością. Chcemy sprawdzić, czy dwa różne impulsy mogą się nakładać — czy słuszna jest zasada superpozycji. Chcielibyśmy się także przekonać, czy dźwięk może poruszać się zarówno w lewo, jak i w prawo. Wszystkie te własności powinny być zawarte w tym właśnie równaniu. Zauważyliśmy już, że każde zaburzenie w postaci płaskiej fali, która porusza się ze stałą prędkością v, opisuje funkcja f(x—vt). Mamy teraz sprawdzić, czy funkcja #(x, /) = =f(x—vt) jest rozwiązaniem równania falowego. W tym celu należy dx/dx wyrazić przez pochodną funkcji /(x): dxldx=f'(x—vt). Różniczkując jeszcze raz otrzymamy: d\ -±=f"(x-vt). (47.15) ex Różniczkowanie tej samej funkcji względem t daje —v razy pochodna funkcji, czyli d%/dt= —vf"(x—vt). Stąd druga pochodna względem czasu równa się ~c7 = v2f"[x-vt). (47.16) Tak więc funkcja f{x—vt) będzie spełniała równanie falowe, jeżeli prędkość fali v będzie równa c3. Obliczyliśmy więc na podstawie praw mechaniki, że dowolne zaburzenie dźwiękowe rozchodzi się z prędkością cs i ponadto, że Cs = Kl'2=(dPldP)l0'\ wiążąc tym samym prędkość fali z własnościami ośrodka. Wprzypadku fali poruszającej się w przeciwnym kierunku, dla której ^(jc, t) = g(x+vt), łatwo sprawdzić, że takie zaburzenie również spełnia równanie falowe. Jedyna różnica między tą falą i falą poprzednio omawianą zawarta jest w znaku v. Ale niezależnie od tego, czy zmienną w funkcji jest x + xt, czy x—vt, znak d2xldt2 pozostaje bez zmiany, ponieważ pochodna zawiera tylko v2. Wynika stąd, że nasze rozwiązanie przedstawia fale rozchodzące się w obu kierunkach z szybkością cs. Wyjątkowo interesująca jest superpozycja rozwiązań. Załóżmy, że znaleźliśmy jedno rozwiązanie równania falowego, np. Xi ■ Oznacza to, że druga pochodna Xi względem x równa się iloczynowi l/c2 i drugiej pochodnej Xi względem /. Także dowolne inne rozwiązanie Xi ma tC własność. Jeżeli dodamy oba te rozwiązania, otrzymamy: X(x,0 = Xi(*,0 + X2(*,0-. <4717) Chcielibyśmy teraz sprawdzić, czy #(jc, t) jest także falą, tzn. czy x spełnia równanie falowe. Możemy to łatwo udowodnić, ponieważ d2y d\i d\i oraz S2y c2y. a2v, * ^+ *2. (47 19) dt2 dt2 dt2
47. DŹWIĘK RÓWNANIE FALOWE Stąd zaś wynika że d2x/dx2 = (l/c*) d2x/('t2, czyli zasada superpozycji jest spełniona. W jej dowodzie w sposób istotny skorzystaliśmy z tego, że równanie falowe jest liniowe względem x- Możemy teraz przypuszczać, że świetlna fala płaska rozchodząca się w kierunku osi x i spolaryzowana tak, że pole elektryczne ma kierunek osi y, będzie spełniała równanie falowe d2Ey_ 1 d2Ey CX C Ct 2 ^ • (47.20) gdzie c jest prędkością światła. Takie równanie falowe jest jedną z konsekwencji równań Maxwella. Z równań elektrodynamiki będzie wynikało równanie falowe dla światła, podobnie jak z równań mechaniki wynika równanie dla fali dźwiękowej. 47-5. Szybkość dźwięku Wyprowadzenie równania falowego dla dźwięku pozwala nam otrzymać wzór, który wiąże szybkość fali ze zmianą ciśnienia wywołaną zmianą gęstości i wyznaczoną dla wartości normalnej ciśnienia: H3: (47.21) Do obliczenia tej pochodnej konieczna jest znajomość zmian temperatury. Powinniśmy oczekiwać, że w fali dźwiękowej temperatura maleje w obszarze rozrzedzenia i rośnie w obszarze zgęszczenia. Pochodną tę pierwszy obliczył Newton zakładając, że temperatura się nie zmienia. Sądził on, że ciepło przepływa z jednego obszaru do drugiego tak szybko, iż temperatura nie może ani wzrosnąć, ani zmaleć. Założenie to pozwala obliczyć izotermiczną szybkość dźwięku, która jednak nie odpowiada rzeczywistości. Prawidłowe wyprowadzenie podał później Laplace, który zakładał coś odwrotnego że w fali dźwiękowej ciśnienie i temperatura zmieniają się adiabatycznie. Przepływ ciepła z obszaru zagęszczenia do obszaru rozrzedzenia można pomijać tylko dopóty, dopóki długość fali będzie stosunkowo duża w porównaniu ze średnią drogą swobodną. Przy tym założeniu mały strumień ciepła wywołany falą dźwiękową nie zmienia prędkości, chociaż pochłania nieco energii dźwięku. Możemy słusznie oczekiwać, że ta absorpcja wzrośnie, gdy długość fali zbliży się do średniej drogi swobodnej, ale takie długości są mniejsze o około milion razy od długości fali słyszalnych dźwięków. A więc w fali dźwiękowej zmiana ciśnienia przy zmianie gęstości odbywa się bez przepływu ciepła. To odpowiada adiabatycznej zmianie ciśnienia, dla której, jak wiemy, PV = = const, gdzie V oznacza objętość. Ponieważ gęstość p zmienia się jak 1/V, dla procesów adiabatycznych związek P z p jest następujący: P=consty. (47.22) Stąd zaś dPjdp = yPlp. Mamy wiec następującą zależność dla szybkości dźwięku:
47-5 SZYBKOŚĆ DŹWIĘKU 329 c;=—. (47.23) P Możemy także napisać c]~yPVipV i skorzystać z zależności pV=NkT. Następnie widzimy, że pV jest masą gazu, którą możemy także wyrazić jako Nm lub jako //, gdzie m oznacza masę cząsteczki a // jest masą jednego mola. W ten sposób znajdujemy, że c]J<TjRT (4?24) m fi Stąd staje się oczywiste, że szybkość dźwięku zależy tylko od temperatury gazu, a nie od ciśnienia ani od objętości. Wiemy także, że kr = im<r2>, (47.25) gdzie <t>2> jest średnią kwadratową szybkości cząsteczek. Stąd wynika, że c2 = (y/3)<t>2>, czyli l/2\ (47.26) ^(jwijoir Równanie to głosi, że szybkość dźwięku jest liczbą, która równa się w przybliżeniu iloczynowi l/(3)"2 i pewnej uśrednionej szybkości cząsteczek vb (pierwiastkowi kwadratowemu średniej kwadratów prędkości). Inaczej mówiąc, szybkość dźwięku jest wielkością tego samego rzędu co szybkość cząsteczek, a właściwie jest nieco mniejsza od ich średniej szybkości. Mogliśmy się oczywiście spodziewać takiego wyniku, trzeba bowiem pamiętać, że takie zaburzenie jak zmiana ciśnienia rozchodzi się przede wszystkim dzięki ruchowi cząsteczek. Rozumowanie to nie podaje nam jednak dokładnej szybkości rozchodzenia się dźwięku. Mogłoby się okazać, że dźwięk jest przenoszony przede wszystkim przez najszybsze cząsteczki lub przez najwolniejsze. A więc zupełnie uzasadnione i zadowalające jest stwierdzenie, że szybkość dźwięku z grubsza biorąc okazała się równa \ średniej szybkości cząsteczek viT.
48 dudnienia 48-1. Dodawanie dwóch fal Niedawno omawialiśmy dość szczegółowo własności fal świetlnych i ich interferencję, tzn. zjawisko superpozycji dwu fal pochodzących z różnych źródeł. Zakładaliśmy wówczas, że częstości obu źródeł są takie same. Obecnie zajmiemy się pewnymi zjawiskami, które zachodzą na skutek interferencji fal z dwu źródeł o różnych częstościach. Łatwo przewidzieć przebieg tego zjawiska. Postępując w ten sam sposób jak poprzednio załóżmy, że mamy dwa jednakowe źródła drgające o tej samej częstości, których fazy są tak dopasowane, że sygnały dobiegają do punktu P ze zgodnymi fazami. W punkcie tym występuje bądź silne światło, jeżeli są to fale świetlne, bądź bardzo głośny dźwięk w wypadku sygnałów głosowych albo też znajduje się tam wiele elektronów, jeżeli mamy do czynienia ze źródłami elektronów. Z drugiej strony, gdy fazy różnią się o 180°, nie otrzymujemy żadnego sygnału w punkcie P, ponieważ wypadkowa amplituda osiąga wtedy minimum. Przypuśćmy teraz, że ktoś przekręca „gałkę regulacji fazy" jednego ze źródeł i zmienia w ten sposób fazę w punkcie P, np. od powiedzmy 0° do 180° i z powrotem. Wtedy oczywiście stwierdzimy zmianę w natężeniu sygnału wypadkowego. Widzimy więc, że gdy faza jednego źródła powoli zmienia się względem fazy drugiego, stopniowo i regularnie przechodząc przez 0°, 10°, 20°, 30°, 40° itd., to w punkcie P stwierdzimy serie silnych i słabych „pulsacji". Jeżeli bowiem faza przechodzi przez 360°, amplituda powtórnie osiąga maksimum. Stwierdzenie, że jedno źródło przesuwa swą faz? względem fazy drugiego w sposób jednostajny, jest oczywiście równoważne stwierdzeniu, że liczby drgań na sekundę obu źródeł nieznacznie się różnią. A więc znamy już odpowiedź: jeżeli mamy dwa źródła o nieznacznie się różniących częstościach, w wyniku otrzymamy wypadkowe drganie o powoli zmieniającym się natężeniu. I to jest naprawdę wszystko, co zawiera nasz temat!
48-1. DODAWANIE DWÓCH FAL 331 Łatwo jest także sformułować ten wynik matematycznie. Załóżmy na przykład, że mamy dwie fale i że na razie nie troszczymy się wcale o zależności przestrzenne, lecz po prostu badamy, co przybywa do punktu P. Z jednego źródła mamy, na przykład, cos w,/, a z drugiego cosco2f, przy czym obie wartości w nie są dokładnie takie same. Oczywiście, amplitudy mogą być także różne, ale ten ogólniejszy problem zostawimy na później; z początku zajmijmy się przypadkiem jednakowych amplitud. Zatem całkowite wychylenie w punkcie P będzie sumą tych cosinusów. Jeżeli wykreślimy zależność od czasu, jak na rys. 48.1, to zobaczymy, że dla obu fal, tam gdzie spotykają się grzbiety fal, wystąpi silne wychylenie, a gdzie zbiegną się grzbiety z doliną, praktycznie otrzymujemy zero, dwie natomiast doliny znów dadzą silną falę. Aby to wyrazić w postaci matematycznej, musimy tylko dodać dwa cosinusy i wykonać parę przekształceń. Istnieje między cosinusami wiele użytecznych zależności, które nietrudno wyprowadzić. Oczywiście, pamiętamy, że e'ł'+w=etae", (48.1) oraz że e'" ma część rzeczywistą, równą cos a, oraz część urojoną równą sin o. Część rzeczywista e'ia+b) równa się cos (a + b). Gdy pomnożymy: e'" e'b = (cos a + i sin a) (cos b + i sin b), otrzymamy cos a cos b — sin a sin b plus pewna część urojona. Nas jednak interesuje tylko część rzeczywista, a więc mamy cos(a + fc) = coso cosb— sina sinfc. (48.2) Zmieniając znak b otrzymujemy, ponieważ cosinus nie zmienia znaku wraz z b a sinus 48.1. Nakładanie się dwu fal cosinusoidalnych o częstościach w stosunku 8:10. Nie zawsze musi występować dokładne powtórzenie kształtu fali wewnątrz każdego „garbu" cos Wjft WWWWWIAA wwwww cosSjrt cos(5jrt/2)+cos 2jrt=2cos (irt/4)- cos (9jrt/4)
332 48. DUDNIENIA go zmienia, następującą równość: cos (a — b)=cos a cos b + sin a sin b. (48.3) Gdy dodamy te dwie równości, wyrazy z sinusami uproszczą się i widzimy, że iloczyn dwóch cosinusów równa się \ cosinusa sumy plus \- cosinusa różnicy: cos a cos b = \ cos {a + b) + \ cos {a — b). (48.4) Możemy także odwrócić ten wzór i wyprowadzić wzór dla cos a + cos fi, jeżeli tylko podstawimy <x = a + b i f}=a — b, tzn. przyjmiemy a = \~(<x + fł) oraz b = \(<x—fi), tak że cos a + cos P = 2 cos \ (a + /?) cos i (a - /?). (48.5) Teraz możemy przejść do naszego problemu. Suma cos co,/ oraz cos co2/ równa się cosco, r+cosco2i=2 cosJ(w,+G)2)icosi(w,— co2)i. (48.6) Załóżmy teraz, że obie częstości są tu prawie jednakowe, a więc \-ifiii + o)2), średnia częstość, jest mniej więcej taka sama jak każda ze składowych. Ale w, — w2 jest znacznie mniejsze zarówno od w,, jak i od <a2, ponieważ zgodnie z założeniem co, i <o2 są prawie równe. To znaczy, że możemy przedstawić rozwiązanie jako falę cosinusoidalną o wysokiej częstości, mniej więcej zbliżonej do częstości składowych, której „kształt" powoli się zmienia — pulsuje z częstością równą i(<w, — w2). Ale czy z taką częstością słyszymy dudnienie? Chociaż wzór (48.6) mówi, że amplituda zmienia się jak cos ^ (co, — a>2), to naprawdę chodzi w nim tylko o to, że oscylacje o wysokiej częstości są zawarte między dwoma cosinusoidami o przeciwnych znakach (wykreskowanymi na rys. 48.1). Na tej podstawie można powiedzieć, że amplituda zmienia się z częstością \(<ay —oo2), jeżeli jednak interesuje nas natężenie fali, to musimy uznać, że zmienia się ono z dwukrotnie większą częstością. To znaczy, że modulacja amplitudy, gdy chodzi o wielkość natężenia, odbywa się z częstością w, — co2, chociaż ze wzoru widzimy, że mnożymy przez cosi- nusoidę, która ma częstość dwa razy mniejszą. Pomijając tę małą komplikację, wnioskujemy, że dodając dwie fale o częstościach co, i w2 otrzymamy falę wypadkową o średniej częstości i(W|+w2). której natężenie zmienia się z częstością <al—w2. Jeżeli obie amplitudy są różne, to możemy wszystko wykonać jeszcze raz mnożąc cosinusy przez różne amplitudy At i A2 i wykonując za pomocą równań (48.2)-(48.5) szereg przekształceń. Tę samą analizę można jednak przeprowadzić inaczej i łatwiej. Wiemy na przykład, że znacznie łatwiej pracować posługując się zespolonymi funkcjami wykładniczymi niż funkcjami trygonometrycznymi. Wtedy bowiem możemy przedstawić Ai cos Wit jako część rzeczywistą At exp(iW|f). Druga fala byłaby podobnie częścią rzeczywistą A2 exp(iw2t). Gdy je dodamy otrzymamy Ax exp(iw,r) + /42 exp (iw2t). Je" żeli następnie wydzielimy wyraz z częstością średnią, otrzymamy: A t exp (ia>l ) + A2 exp (ico21) = exp [^ i (co, + w2) i] x x {A! exp [} i (co, -<o2) t] -M2exp[ -{• i (c^-coj)/]} . (48.7) I znów mamy falę o wysokiej częstości z amplitudą, która zmienia się z mniejszą częstością
48-2. DUDNIENIE I MODULACJA 333 48-2. Dudnienie i modulacja Jeśli chcemy znaleźć natężenie fali, którą przedstawia równanie (48.7), możemy wziąć kwadrat wartości bezwzględnej lewej, bądź też prawej strony. Zróbmy to dla lewej strony. Wówczas natężenie będzie się równało I = A2i+Al + 2At A2cos{coi-co2)t (48.8) <U|=6j£=UJ 48.2. Wynik złożenia dwu zespolonych wektorów o równych częstościach Widzimy, że natężenie wzrasta i maleje z częstością w,—o»2 zmieniając się w granicach od (Ai +A2)2 do (Ai— A2)2- Jeśli Ay^A2, to minimalne natężenie nie równa się zeru. To samo można też przedstawić graficznie, w sposób zilustrowany na rys. 48.2. Rysujemy wektor o długości A,, obracający się z częstością w i. Wektor ten przedstawia jedną z fal w płaszczyźnie zespolonej. Drugi wektor o długości A2, obracający się częstością co2, przedstawia inną falę. Jeżeli te dwie częstości będą dokładnie równe, w wyniku otrzymujemy obracający się wektor o stałej w czasie długości, tzn. ze złożenia dwóch fal otrzymamy falę o określonym, ustalonym w czasie natężeniu. Ale gdy częstości będą się nieznacznie różnić, oba zespolone wektory będą się obracać z różnymi szybkościami. Rysunek 48.3 przedstawia, jak to wygląda z punktu widzenia wektora /4, exp (iw,/). Wektor A2exp(ia)2t) powoli się obraca oddalając się od A {. Z początku amplituda, którą otrzymujemy ze złożenia dwóch wektorów, jest duża, później, gdy wektor A2 oddalając się osiągnie 180° względem At, wypadkowa amplituda będzie najmniejsza, itd. Gdy wektory obracają się, amplituda ich sumy kolejno wzrasta i maleje i tak samo pulsuje natężenie. Są to stosunkowo proste sprawy i istnieje wiele różnych sposobów ich przedstawienia. Można bardzo łatwo obserwować te zjawiska eksperymentalnie. Jeżeli chodzi o drgania akustyczne, to możemy ustawić dwa głośniki sterowane przez dwa oddzielne oscylatory, po jednym dla każdego głośnika. Każdy głośnik wydaje pewien ton. Słyszymy więc z obu źródeł różne tony. Gdy obie częstości będą dokładnie takie same, otrzymamy określone natężenie w każdym punkcie przestrzeni. Jeśli teraz trochę rozstroimy oscylatory, Usłv*i7vmv npu/m 7minnf» nntP^Pnin H-źu/i*»I^n Iro 48.3. Wynik złożenia dwu zespolonych wektorów o różnych częstościach widziany w obracającym się układzie odniesienia jednego z wektorów. Widać 9 kolejnych położeń wolno obracającego się wektora
334 48. DUDNIENIA bardziej głośniki są rozstrojone, tym szybciej następują zmiany dźwięku. Ucho z trudnością odbiera zmiany szybsze niż około 10 na sekundę. Możemy także obserwować to zjawisko na ekranie oscyloskopu, gdzie widzimy sumę .„„,.. r , ,., . prądów płynących do dwu głośników. Gdy 48.4. Zmodulowana fala nośna. Na tym r •* r j -z j o ^y schematycznym wykresie ««/«,„ = 5. W zwy- częstość pulsacji jest stosunkowo niska, wi- kłej fali radiowej (oc/(o„« 100 dzimy po prostu falę sinusoidalną o pulsującej amplitudzie, ale gdy przyspieszymy pul- sacje, widzimy taką falę jak na rys. 48.1. Gdy różnica częstości rośnie, „grzbiety" zbliżają się coraz bardziej. Także gdy amplitudy nie są równe i gdy zwiększymy jeden sygnał w porównaniu z innymi, otrzymamy falę, której amplituda, zgodnie z przewidywaniem, nigdy nie będzie równa zeru. Wszystko dzieje się jak trzeba, zarówno w akustyce, jak i w elektryczności. Występuje także zjawisko odwrotne! Przy emisji fal radiowych z rozgłośni wykorzystujących zjawisko modulacji amplitudy (MA) dźwięk jest emitowany w następujący sposób: Nadajnik radiowy emituje drgania elektryczne o stałej amplitudzie (AS) i o bardzo dużej częstości, np. 800 kHz, zawartej w paśmie przeznaczonym dla danej rozgłośni. Jeżeli ten sygnał nośny zostanie włączony, radiostacja będzie emitować falę o stałej amplitudzie i o częstości 800 000 Hz. Sposób przekazywania „informacji" polega na tym, że w chwili, gdy ktoś mówi do mikrofonu, amplituda sygnału nośnego zmienia się w rytmie drgań dźwiękowych dochodzących do mikrofonu. W najprostszej, z punktu widzenia matematyki, sytuacji, gdy śpiewaczka śpiewa czystym głosem jedną nutę i jej struny głosowe drgają dokładnie sinusoidalnie, otrzymujemy sygnał, którego natężenie zmienia się tak, jak widać z rys. 48.4. Z kolei częstość akustyczną odczytuje odbiornik, który odrzuca falę nośną i zajmuje się tylko jej „opakowaniem", a więc drganiami strun głosowych, czyli głosem śpiewaczki. Z kolei głośnik wywołuje odpowiednie drgania powietrza o tej samej częstości i jak się to zwykle mówi, słuchacz ma pełne złudzenie żywego głosu. W rzeczywistości na skutek licznych zniekształceń i innych subtelnych efektów, łatwo stwierdzić, czy słuchamy radia czy też bezpośrednio śpiewaczki, poza tym wszystko jest tak, jak powiedzieliśmy wyżej. 48-3. Pasma boczne Falę zmodulowaną, o której mówiliśmy przed chwilą, można przedstawić w postaci następującego wzoru: S = (l + bcoscomt)coswct, (48.9) gdzie wc oznacza częstość nośną, a o»m — częstość akustyczną. Znów korzystamy z naszych twierdzeń o cosinusach lub też bierzemy e", co jest łatwiejsze, a w obu wypadkach wynik jest taki sam. Otrzymujemy wówczas: Wm
48-3. PASMA BOCZNE 335 S = coswc t + i b cos {wc + com) t + + łbcos(wc-wm)t. (48.10) Patrząc na ten wzór z innego punktu widzenia możemy powiedzieć, że fala wychodząca składa się z nałożonych na siebie trzech fal: ze zwykłej fali o częstości o»c, tzn. o częstości nośnej oraz z dwu nowych fal o dwu nowych częstościach. Jedna z nich równa się sumie częstości nośnej i częstości modulacji, a druga — ich różnicy. Gdy więc wykreślimy natężenie dźwięku wytwarzanego przez generator jako funkcję częstości drgań, to oczywiście stwierdzimy bardzo duże natężenie przy częstości nośnej, ale gdy nagle artysta zaśpiewa, to od razu zauważymy natężenie proporcjonalne do siły głosu artysty b2, przy częstości wc + wmorazojc—a>m, jak to widać z rys. 48.5. Są to tzw. pasma boczne. Gdy nadajnik emituje modulowany sygnał, pojawiają się pasma boczne. Jeżeli występuje więcej niż jeden ton jednocześnie, np. io„ i <am., gdy grają dwa instrumenty lub gdy pojawia się inna skomplikowana fala cosinusoidalna możemy stwierdzić na podstawie obliczeń, że mamy wówczas dwie nowe fale, które odpowiadają częstościom wm±a»m-. Dlatego gdy występuje skomplikowana modulacja, którą można przedstawić jako sumę wielu cosinusów*', okazuje się, że nadajnik emituje sygnały w szerokim paśmie częstości zawartym między częstością równą sumie częstości nośnej i maksymalnej częstości, którą zawiera modulowany sygnał, i częstością równą różnicy tych częstości. Chociaż początkowo mogliśmy sądzić, że nadajnik radiowy emituje tylko nominalną częstość nośną, ponieważ zawiera wielkie superstabilne krystaliczne obwody drgające i wszystko jest tak dobrane, aby wypadło dokładnie 800 kHz, to w momencie, gdy ktoś zapowiada, że mówi na częstości 800 kHz, tym samym tak moduluje te 800 kHz, że nie mamy już dokładnie 800 kHz! Jeżeli wzmacniacze tak są zbudowane, że mogą pracować w zakresie odpowiadającym czułości uszu (ucho słyszy dźwięk o częstościach do 20 000 Hz, lecz zwykle nadajniki radiowe i odbiorniki nie pracują powyżej 10 000 kHz, a więc nie słyszymy najwyższych częstości), to gdy ktoś mówi, a jego głos może na przykład zawierać częstości aż do 10 000 Hz, nadajnik emituje częstości zawarte w zakresie od 790 do 810 kHz. Gdyby więc istniała inna stacja pracująca na częstości 795 kHz, powstałyby zakłócenia. Gdybyśmy natomiast zbudowali odbiornik tak czuły, że odbierałby tylko 800 kHz, a nie reagowałby na odchylenia częstości 10 kHz w obie strony, to nie słyszelibyśmy w ogóle spikera, ponieważ informacje zawarte byłyby właśnie w tych innych czę- *' Mała dygresja. Pylanie: W jakich warunkach dowolną krzywą można przedstawić jako sumę dużej liczby cosinusów? Odpowiedz: We wszystkich zwykłych okolicznościach oprócz kilku tych, które wymyślili matematycy. Oczywiście, krzywa musi mieć tylko jedną wartość w danym punkcie i nie może to być zwariowana krzywa, która skacze nieskończoną liczbę razy na nieskończenie małym odcinku lub wyczynia coś podobnego. Ale oprócz tych ograniczeń każda sensowna krzywa (i ta, którą wytworzą drgające struny głosowe występującego śpiewaka) może być zawsze przedstawiona jako suma fal cosinusoidalnvch. /.i OJc-<*>m <*>c <->c+<^m U) 48.5. Widmo częstości fali nośnej <x>c zmodulowanej jedną falą cosinusoidalna co„
336 48. DUDNIENIA stościach! Dlatego bezwzględnie konieczne jest rozmieszczanie częstości stacji nadawczych w pewnych od siebie odległościach, tak aby ich pasma boczne nie nakładały się. Również odbiornik nie może być tak selektywny, aby nie zezwalał na odbiór pasm bocznych razem z główną częstością nominalną. W przypadku dźwięku nie mamy z tym wielkich kłopotów. Możemy słyszeć w zakresie ±20 kHz i zwykle mamy od 500 do 1500 kHz w paśmie radiofonii, tak że jest bardzo dużo miejsca dla ogromnej liczby stacji nadawczych. Nieco gorzej jest z telewizją. Gdy strumień elektronów obiega ekran telewizora, to widzimy na nim różne małe plamki jasne i ciemne. Ich „jasność" i „ciemność" jest „sygnałem". Zwykle strumień elektronów omiata cały obraz w przybliżeniu 500 linii *', w ciągu jg s. Załóżmy, że rozkład obrazu jest taki sam w kierunku poziomym, jak i pionowym, tak że wzdłuż linii, po której biegnie strumień, znajduje się taka sama liczba plamek na 1 cm2. Chcemy odróżnić plamki jasne od ciemnych, np. na 500 liniach. Aby można było to zrobić przy pomocy fal cosinusoidalnych, najmniejsza długość fali musi odpowiadać długości fali równej około 2-|g części rozmiarów ekranu. A więc mamy 250-500-30 informacji w ciągu sekundy. Najwyższa częstość, którą mamy przenieść, bliska jest zatem 4 MHz. W rzeczywistości rozmieszczając stacje tak, aby się nie zakłócały, korzystamy z nieco szerszego pasma, około 6 MHz; część tego pasma wykorzystujemy do przenoszenia dźwięku oraz innych informacji. A więc kanały telewizyjne" mają szerokość 6 MHz. Oczywiście, nie można transmitować programów telewizyjnych na fali nośnej o częstości 800 kHz, ponieważ częstość modulacji nie może być większa od częstości nośnej. W każdym razie pasmo telewizyjne rozpoczyna się od częstości 54 MHz. W USA pierwszy kanał telewizyjny nazywany kanałem 2 (!) jest zawarty między 54 MHz i 60 MHz, a więc jego szerokość równa się 6 MHz **'. „Ale przecież" — mógłby ktoś powiedzieć — „przed chwilą udowodniliśmy istnienie pasm bocznych po obu stronach i dlatego kanał powinien być dwukrotnie szerszy." Okazuje się, że inżynierowie radiotechnicy są bardzo przemyślni. Jeżeli zanalizujemy sygnał modulacji rozkładając go nie na cosinusy, lecz na sinusy i cosinusy, aby uwzględnić różnice faz, to okaże się, że istnieje określona stała zależność między pasmem bocznym po stronie wysokiej częstości i pasmem po stronie niskiej częstości. Rzecz w tym, że to drugie pasmo boczne nie zawiera nowych informacji. A więc należy odciąć jedno pasmo boczne i tak zbudować odbiornik, aby mógł odzyskać brakującą informację tylko za pomocą sygnału nośnego i jednego pasma bocznego. Przenoszenie informacji za pomocą tylko jednego pasma bocznego jest bardzo sprytną metodą zmniejszania szerokości pasma potrzebnego do przekazywania informacji. 48-4. Zlokalizowane paczki falowe Następnym zjawiskiem, które chcemy rozpatrzyć, jest interferencja fal jednocześnie w przestrzeni i czasie. Załóżmy, że -w przestrzeni rozchodzą się dwie fale. Wiemy, oczywi- •' W Polsce 625 linii. (Przyp. tłum.) **' W Polsce obraz telewizyjny ma 625 linii i dlatego szerokość kanałów jest nieco większa i wynosi 6.5 MHz. (Przyp. tłum.)
48-4. ZLOKALIZOWANE PACZKI FALOWE 337 ście, że falę rozchodzącą się w przestrzeni możemy przedstawić jako e"*"'"'"". Może to być na przykład przemieszczenie wywołane falą dźwiękową. Funkcja ta będzie rozwiązaniem równania falowego pod warunkiem, ±e'io2 = k2c2, gdzie c jest szybkością rozchodzenia się fali. W tym przypadku możemy to zapisać jako e'*(x~c,), co jest szczególnym przypadkiem funkcji f(x-ct). Taka funkcja przedstawia falę, która biegnie z szybkością w/k, a. właśnie tyle wynosi c i wszystko jest w porządku. Chcemy teraz dodać dwie takie fale. Załóżmy, że jedna z biegnących fal ma pewną częstość, a druga — częstość od niej różną. Pozostawiamy czytelnikowi zajęcie się przypadkiem, gdy również amplitudy są rożne: nie wprowadza to żadnej istotnej różnicy. Chcemy więc dodać exp [i'(io,f —/c,x)] + exp [i{oj1t — k2x)\. Możemy postąpić tak samo jak przy dodawaniu sygnałów. Oczywiście, łatwo to zrobić, gdy c jest takie samo dla obydwu fal, ponieważ postępowanie nie różni się od tego co robiliśmy poprzednio: exp[i<y,(f-x/e)]+exp[/<y2(f — x/c)]=exp(ito, t') + exp(iw2t'), (48.11 z tym wyjątkiem, że teraz zmienną jest t' = t — xjc, a nie /. Otrzymaliśmy więc naturalnie ten sam rodzaj modulacji, ale widzimy, że te modulacje poruszają się wraz z falą. Inaczej mówiąc, gdy dodajemy dwie fale, które nie tylko oscylują, ale także poruszają się w przestrzeni, wówczas fala wypadkowa porusza się także z tą samą szybkością. Chcemy teraz uogólnić, to na przypadek fal, dla których zależność między częstością i liczbą falową k nie jest tak prosta. Przykład: substancja ma pewien współczynnik załamania. Zajmowaliśmy się już teorią współczynnika załamania w rozdz. 31. Przekonaliśmy się wtedy, że możemy napisać k = nw/c, gdzie n oznacza współczynnik załamania. Tak na przykład dla promieni Róntgena obliczyliśmy, że współczynnik załamania n wynosi: n=\ ^-z. (48.12) 2e0mw Właściwie w rozdz. 31 znaleźliśmy bardziej skomplikowane wzory, ale ten jako przykład jest równie dobry. Przy sposobności przypomnimy, że nawet gdy oj i k nie są wprost proporcjonalne, stosunek co/k z pewnością oznacza szybkość rozchodzenia się przy danej częstości i liczbie falowej. Nazywamy ten stosunek prędkością fazową. Jest to prędkość, z jaką porusza się faza, np. węzeł pojedynczej fali: vf=— (48.13) Prędkość fazowa promieni Róntgena w szkle jest większa od szybkości światła w próżni [ponieważ n we wzorze (48.12) jest mniejsza od l]. Trochę nas to niepokoi, ponieważ nie przypuszczaliśmy, że można wysyłać sygnały biegnące szybciej od światła! Zajmiemy się teraz interferencją dwu fal, dla których wielkości tu i k związane są określoną zależnością. Powyższy wzór dla n mówi, że k jest określoną funkcją w. Ściśle mówiąc, w tym szczególnym przypadku zależność A: od w jest następująca: co a k = , c we (48.14)
338 48 DUDNIENIA gdzie a = Nq]/2c0m i jest stałe. W każdym razie określonej częstości odpowiada określona liczba falowa i właśnie dwie takie fale chcemy dodać. Postąpmy tak jak w równaniu (48.7): exp[i(cu, t-kl x)~] + exp[i(a>2t - k2x)] = exp{ł i[(wl+a}2)t-(kl+ k2)x]} x x(exp{łi[lu)l-w2)t-(kl-k2)x]} + eKp{-ti[(toi-o)2)t-(kl-k2)x]}). (48.15) A więc znów mamy falę zmodulowaną, poruszającą się ze średnią częstością i mającą średnią liczbę falową; natomiast jej natężenie zmienia się zależnie od różnicy częstości i różnicy liczb falowych. Zajmijmy się przypadkiem względnie małej różnicy między obiema falami. Załóżmy, że dodajemy dwie fale, których częstości są prawie równe; wówczas (cu, + cu2)/2 jest praktycznie biorąc równe każdej z co. To samo dotyczy wyrażenia (kl +k2)/2. Zatem szybkość fali, szybkość węzłów nie zmienia się i wynosi nadal co/k. Ale spójrzmy, szybkość rozchodzenia się modulacji jest inna! O ile trzeba zmienić x, aby skompensować zmianę wywołaną upływem czasu /? Szybkość rozchodzenia się modulującej fali równa się stosunkowi co, — a>2 "M=71-ri (4816) k, — k2 Czasami szybkość rozchodzenia się modulacji nazywamy prędkością grupową. Jeżeli zajmiemy się przypadkiem, w którym różnica częstości jest względnie mała i różnica liczb falowych jest także mała, to nasze wyrażenie w granicy osiąga wartość dco ••-«■ <48"> Wynika stąd coś bardzo dziwnego, że dla najwolniejszych modulacji, najwolniejszych dudnień istnieje określona szybkość ich rozchodzenia się, która różni się od fazowej szybkości fal! Prędkość grupowa równa się pochodnej co względem k, a prędkość fazowa wynosi io/k. Sprawdźmy, czy rozumiemy, dlaczego tak jest. Zastanówmy się znów nad dwiema falami o mało różniących się długościach, jak na rys. 48.1. Są one kolejno najpierw w fazie, potem nie w fazie, itd. Otóż teraz przedstawiają one również rzeczywiste fale o nieco różnych częstościach rozchodzące się w przestrzeni. Ponieważ jednak prędkości fazowe, prędkości węzłów obu fal nieco się różnią, dzieje się coś nowego. Załóżmy, że poruszamy się wraz z jedną z nich i obserwujemy drugą. Jeżeli obie poruszają się z tą samą szybkością, to druga pozostaje stale w tym samym miejscu względem nas, gdy jedziemy na grzbiecie pierwszej. Jedziemy na grzbiecie fali i obok widzimy stale grzbiet drugiej. Gdy obie szybkości są takie same, ich grzbiety stale się pokrywają. Ale w naszym przypadku obie szybkości naprawdę nie są jednakowe. Częstością różnią się niewiele, a więc i mała jest różnica ich szybkości. Ale ponieważ prędkości nie są jednakowe, to gdy poruszamy się wraz z jedną falą, druga z nich wyprzedza nas lub zostaje z tyłu. Co się więc dzieje z węzłem w miarę upływu czasu? Jeśli jedną falę przesuniemy odrobinę do przodu, to węzeł przesunie się
48-*. ZLOKALIZOWANE PACZKI FALOWE 339 do przodu (lub do tyłu) na dostrzegalną odległość. Suma obu tych fal ma zatem otoczkę, która, gdy fale się poruszają, przesuwa się wraz z nimi, ale z inną szybkością. Prędkość grupowa jest szybkością, z którą są przesyłane modulujące sygnały. Jeżeli wytworzymy sygnał, tzn. pewną zmianę fali, którą może stwierdzić słuchacz, to sygnał ten, będący pewną modulacją fali, porusza się z szybkością grupową, jeżeli modulacje te były względnie powolne. (W przypadku szybkich modulacji analiza jest znacznie trudniejsza.) Teraz już (po wielu trudach) możemy udowodnić, że szybkość rozchodzenia się promieni Róntgena w kawałku węgla nie jest większa od szybkości światła, chociaż jest od niej większa szybkość fazowa. W tym celu musimy obliczyć wartość dco/dk, korzystając z wzoru (48.14): dk/dco = (llc) + (a/a)2c). Prędkość grupowa równa się odwrotności tego wyrażenia, a więc c i jest mniejsza od c! Chociaż więc fazy mogą poruszać się szybciej niż światło, modulujące sygnały poruszają się wolniej i takie jest właśnie rozwiązanie pozornego paradoksu! Oczywiście, w prostym przypadku, gdy w = kc, dcjfók także równa się c. A więc gdy wszystkie fazy mają tę samą prędkość, to będzie ona równa także prędkości grupowej. 48-5. Amplitudy prawdopodobieństw dla cząstek Zajmijmy się jeszcze jednym bardzo interesującym przykładem prędkości fazowej. Dotyczy on mechaniki kwantowej. Wiemy, że amplituda określająca prawdopodobieństwo znalezienia cząstki w jakimś miejscu może się w pewnych okolicznościach zmieniać w przestrzeni i w czasie; w jednowymiarowym przypadku będzie się ona zmieniała następująco: v, = Aeila"-kx\ (48.19) gdzie co oznacza częstość związaną z klasycznym pojęciem energii E=hw, a k jest liczbą falową, która wiąże się z pędem p=hk. Mówimy, że cząstka ma określony pęd p, jeżeli jej liczba falowa dokładnie równa się k, czyli jeżeli będzie to fala idealna, poruszająca się wszędzie z tą samą amplitudą. Równanie (48.19) określa tę amplitudę i gdy obliczymy kwadrat jej bezwzględnej wartości, otrzymamy względne prawdopodobieństwo znalezienia cząstki jako funkcję położenia i czasu. W tym przypadku daje to stałą wartość, to znaczy, że prawdopodobieństwo znalezienia cząstki jest w każdym miejscu takie samo. Załóżmy jednak coś przeciwnego: sytuację, w której cząstkę łatwiej znaleźć w jednym miejscu niż w jakimś innym. Przedstawimy to przy pomocy fali, która ma jedno maksimum i znika na obu końcach (rys. 48.6). (To nie jest całkiem taka sama fala jak przedstawiona na rys. 48.1, która ma szereg maksimów. Można jednak dodając parę fal o prawie takich samych (o i k zlikwidować wszystkie maksima oprócz jednego.) W tych warunkach, ponieważ kwadrat wyrażenia (48.19) przedstawia prawdopodo-
340 48. DUDN1EN1A #* bieństwo znalezienia cząstki w pewnym miejscu, wiemy, że w danej chwili cząstka najprawdopodobniej znajduje się blisko środka „paczki", gdzie amplituda fali jest największa. Jeżeli teraz odczekamy chwilę, to ponieważ fale się poruszają, „paczka" przesunie się w inne miejsce. 48.6. Zlokalizowana paczka falowa Jeżeli wiedzieliśmy, że początkowo cząstka, zgodnie z teorią klasyczną, znajdowała się w jakimś miejscu, to spodziewamy się, że po pewnym czasie na pewno będzie gdzie indziej, ponieważ ma pewną prędkość i pęd. Teoria kwantowa przejdzie więc w poprawną teorię klasyczną zależności między pędem, energią i prędkością tylko wtedy, gdy prędkość grupowa, prędkość modulacji będzie się równała prędkości, którą otrzymalibyśmy zgodnie z teorią klasyczną dla cząstki o tym samym pędzie. Musimy teraz sprawdzić, czy tak jest naprawdę. Zgodnie z teorią klasyczną energia wiąże się w następujący sposób z prędkością: mc2 £ = —== . (48.20) Vi-i>V Podobnie pęd równa się mv p=-r== (48.21) Vl-D2/C2 Jest to teoria klasyczna i na jej podstawie eliminując v możemy udowodnić, że £2-pV = mV. Jest to ten wielki wzór dla czterowektora energii — pędu, o którym tyle mówiliśmy: pi,pi, = m2. Określa on zależność między energią i pędem w teorii klasycznej. Teraz oznacza on (po podstawieniu E=hto oraz p=hk), że w mechanice kwantowej musi być spełnione równanie hW-h2k2 = m2c2 (48 22) c2 Taka jest więc w mechanice kwantowej zależność między częstością i liczbą falową fali przedstawiającej cząstkę o masie m. Z tego równania wnioskujemy, że w równa się: w = cs]k2 + m2c2lh2 A więc szybkość fazowa cojk znów jest większa od szybkości światła! Zajmijmy się teraz prędkością grupową. Prędkość grupowa powinna równać się dco/dk — prędkości, z jaką poruszają się modulacje. Musimy zróżniczkować pierwiastek kwadratowy, co nie jest zbyt trudne. Otrzymujemy: dco kc
48-5. AMPLITUDY PRAWDOPODOBIEŃSTW DLA CZĄSTEK 341 pierwiastek kwadratowy w mianowniku równa się co/c, tak więc możemy napisać dcoldk — ^c2k[io. Ponadto A/w równa się pjE, a więc Ale z zależności (48.20) oraz (48.21) wynika, że c2p/E=v, prędkości cząstki, zgodnie z mechaniką klasyczną. Widzimy więc, że chociaż podstawowe zależności w mechanice kwantowej E=fiw i p=hk, potrzebne do powiązania to \ k z klasycznymi pojęciami E i p, dają tylko równanie to2 — k2c2 = m2c*jh2, znajomość pojęcia prędkości grupowej pozwala zrozumieć także zależności (48.20) i (48.21), które wiążą wielkość E i p z prędkością. Oczywiście, prędkość grupowa musi być prędkością cząstki, skoro nasza interpretacja ma mieć jakikolwiek sens. Jeżeli przypuszczamy, że w pewnej chwili cząstka znajduje się w jednym miejscu, a po 10 min w innym, to zgodnie z mechaniką kwantową odległość przebyta przez „paczkę falową" podzielona przez ten odstęp czasu musi równać się klasycznej prędkości cząstki. 48-6. Fale trójwymiarowe Nasze rozważania o własnościach fal chcemy zakończyć paroma ogólnymi uwagami dotyczącymi równania fali. Spostrzeżenia te pomogą nam spojrzeć w przyszłość — nie chodzi o to, abyśmy wszystko teraz dokładnie zrozumieli, lecz raczej abyśmy zorientowali się, jak to wszystko będzie wyglądało, gdy bardziej szczegółowo zajmiemy się falami. Przede wszystkim równanie fali dźwiękowej jednowymiarowej miało postać d2X 1 d2X 8x2 c2 dt2 ' gdzie c oznaczało szybkość dźwięku w przypadku równania fali dźwiękowej lub szybkość światła dla fali świetlnej. Udowodniliśmy, że w fali dźwiękowej przemieszczenia poruszają się z pewną szybkością. Ponadto dodatkowe ciśnienie wywołane przez tę falę także porusza się z pewną szybkością; to samo dotyczy zmiany gęstości. Powinniśmy więc oczekiwać, że to ciśnienie powinno spełniać takie samo równanie i tak rzeczywiście się dzieje. Pozostawiamy to czytelnikowi do sprawdzenia. Wskazówka: pe jest proporcjonalne do pochodnej x względem x. Dlatego po zróżniczkowaniu równania falowego względem x natychmiast stwierdzamy, że dx/dx spełnia to samo równanie. A to oznacza, że pe także je spełnia. Ciśnienie Pe jest zaś proporcjonalne do pe, a zatem Pt też spełnia równanie falowe. A więc, ciśnienie, przemieszczenie itd, spełniają to samo równanie falowe. Zwykle spotyka się równania falowe dla dźwięku zapisane dla ciśnienia, a nie przemieszczenia. Ciśnienie jest bowiem skalarem i nie ma kierunku. Natomiast przemieszczenie jest wektorem o pewnym kierunku i dlatego łatwiej zajmować się ciśnieniem. Druga sprawa, którą chcemy się zająć, dotyczy równania falowego w trzech wymiarach. Wiemy, że dla fali dźwiękowej rozwiązaniem w jednym wymiarze jest: e a ,
342 4*. DUDNIENIA gdzie co=kcs. Wiemy także, że w trzech wymiarach fala mogłaby być przedstawiona jako- exp[i(cot-kxx-kyy-kzz)], gdzie co2-k2c2 i oczywiście co2 = (kl + k2, + k2)c2. Chcemy teraz odgadnąć postać równania falowego w trzech wymiarach. Dla dźwięku można je naturalnie wyprowadzić powtarzając te same dynamiczne rozważania, które przeprowadziliśmy dla jednego wymiaru. Jednak tak nie postąpimy, lecz od razu napiszemy sam wynik- równaniem dla ciśnienia (przemieszczenia lub czegokolwiek innego) jest 82Pe d2Pe d2Pe_ 1 d2Pe (48.23) O tym, że jest ono prawdziwe możemy się przekonać podstawiając do niego funkcję e«<»«-kr) jest ona oczywiście jego rozwiązaniem, bo ilekroć różniczkujemy względem x, tylekroć mnożymy przez — ikx. Dwukrotne różniczkowanie względem x jest równoważne pomnożeniu przez —A:*. A więc pierwszy wyraz dla tej fali równa się —k2Pe. Podobnie drugi wyraz równa się -k2Pe, a trzeci —k2zPt. Z prawej zaś strony otrzymujemy —(co2/c2)Pe. Po uproszczeniu przez Pe i zmianie znaku widzimy, że otrzymujemy żądaną zależność między k i co. Znów postępując „od końca" nie możemy oprzeć się pokusie napisania wielkiego równania, które odpowiada dyspersyjnemu równaniu (48.22) dla fal materii. Jeżeli ę przedstawia amplitudę znalezienia cząstki w punkcie x, y, z w chwili t, to wielkie równanie fal materii opisujących cząstki swobodne ma następującą postać: d2tp d2<p d2<p 1 d2c> m2c2 —2-+—r + —T--T—r=—-r~<P- (48.24) dx2 dy2 dz2 c2 dt2 h2 Po pierwsze, od razu widoczny jest relatywistyczny charakter tego równania ze względu na wystąpienie x, y, z oraz t w odpowiedniej kombinacji spotykanej zawsze w teorii względności. Po drugie, jest to równanie falowe, z którego po podstawieniu fali płaskiej wynika, że —k2 + co2lc2 = m2c2lh2, co jest dobrą relacją znaną z mechaniki kwantowej. To równanie ma jeszcze jedną ważną cechę: jego rozwiązaniem jest także dowolna superpozycja fal. A więc zawiera ono wszystko, co dotychczas poznaliśmy z mechaniki kwantowej i z teorii względności, przynajmniej w zakresie, który dotyczy pojedynczej cząstki w pustej przestrzeni, bez zewnętrznych potencjałów i działających na nią sił! 48-7. Drgania własne Obecnie zajmiemy się innym przykładem zjawiska dudnień. Jest to przykład nieco dziwny i odmienny od tych, którymi zajmowaliśmy się dotychczas. Wyobraźmy sobie dwa równe wahadła połączone dosyć słabą sprężyną. Ich długości są w miarę możności równe. Gdy jedno z nich poruszymy, zacznie się wahać pociągając za sobą sprężynę, a więc stanie się po prostu maszyną do wytwarzania siły o częstości równej częstości własnej drugiego wahadła. Dlatego, zgodnie z teorią rezonansu, którą zajmowaliśmy się przedtem.
4g_7. DRGANIA WŁASNE 343 wiemy, że gdy podziałamy na jakieś ciało siłą o odpowiedniej częstości, możemy ją przekazać temu ciału. Widzimy tu, że drgania jednego wahadła wprowadzają w ruch drugie. Jednak w tych warunkach występuje nowe zjawisko: ponieważ całkowita energia układu jest skończona, gdy więc jedno wahadło przekazuje swoją energię drugiemu, samo traci ją stopniowo, aż odda całą swą energię i zatrzyma się, jeżeli przez cały czas wahadła są zsynchronizowane. Z kolei drugie wahadło zyskuje całą energię z upływem czasu, wszystko przebiega w odwrotnym kierunku i energia zostaje przekazana z powrotem pierwszemu wahadłu. Jest to bardzo interesujące i zabawne zjawisko. Powiedzieliśmy jednak, że wiąże się ono z teorią dudnień i musimy teraz wyjaśnić, jak można zbadać ten ruch z punktu widzenia tej teorii. Zauważmy, że ruch każdego z wahadeł jest ruchem drgającym ze zmieniającą się cyklicznie amplitudą. Dlatego też ruch jednego z wahadeł można prawdopodobnie zbadać w inny sposób, jako sumę dwóch jednoczesnych drgań mających nieco różniące się częstości. Powinniśmy więc znaleźć dwa inne ruchy w tym układzie i stwierdzić, że to, co obserwujemy, jest wynikiem nakładania się dwóch drgań, ponieważ jest to oczywiście układ liniowy. Rzeczywiście, łatwo znaleźć dwa sposoby rozpoczęcia ruchu, z których każdy byłby idealnym ruchem periodycznym o jednej częstości. Ruch, od którego zaczęliśmy poprzednio, nie był ściśle periodyczny, ponieważ nie był trwały; bardzo szybko jedno wahadło przekazywało energię drugiemu i zmieniało amplitudę drgań. Istnieją takie sposoby rozpoczęcia ruchu, że nic się w nim nie zmienia w czasie, co łatwo zrozumiemy, jak tylko je poznamy. Gdy na przykład popchniemy oba wahadła jednocześnie w tym samym kierunku, to dzięki temu, że mają taką samą długość, sprężyna nie wywrze żadnego wpływu, czyli oba wahadła będą stale się wahać, jeżeli nie wystąpi tarcie, a całe zjawisko będzie miało idealny przebieg. Może istnieć także inny ruch, również o określonej częstości: mianowicie, gdy poruszymy wahadła w przeciwnych kierunkach, odsuwając je na równe odległości, to również będą się wahać ściśle periodycznie. Możemy spostrzec, że sprężyna nieco zwiększa siły pochodzące od grawitacji i wskutek tego cały układ drga z nieco większą częstością niż w pierwszym przypadku. Dlaczego z większą? Ponieważ sprężyna ściąga wahadła uzupełniając siłę ciążenia, a to powoduje, że układ staje się „sztywniejszy", a więc częstość jego drgań trochę wzrasta w porównaniu z częstością pierwszego układu. Układ taki może więc drgać w dwojaki sposób ze stałą amplitudą: albo w ten sposób, że oba wahadła drgają jednakowo i przez cały czas z tą samą częstością, albo też oba wahadła poruszają się w przeciwnych kierunkach też ze stałą, ale nieco większą częstością. Ruch rzeczywisty tego układu, ponieważ jest to układ liniowy, można przedstawić jako superpozycję obu takich ruchów. (Pamiętajmy, że przedmiotem rozważań tego rozdziału jest wynik złożenia dwóch ruchów o różnych częstościach.) Pomyślmy, co się stanie, gdy dodamy oba rozwiązania. Jeżeli w chwili /=0 oba ruchy rozpoczynają się z jednakowymi amplitudami i w tej samej fazie, to suma ich oznacza, że jedno z wahadeł ciągnięte w jedną stronę w pierwszym ruchu i w przeciwną w drugim, znajduje się w pozycji początkowej, natomiast drugie wahadło przesuwane w tę samą stronę w obu ruchach ma dużą amplitudę drgań. Ponieważ jednak oba te podstawowe ruchy zachodzą niezależnie, więc
344 48. DUDNIENIA z upływem czasu ich względna faza powoli się zmienia. To znaczy, że po dostatecznie długim czasie, wystarczającym na to, aby w jednym ruchu zaszło „900^" drgań, a w drugim tylko „900", względna faza tych ruchów zmieni się na przeciwną w stosunku do pierwotnej Wówczas ruch o dużej amplitudzie ustanie, a wahadło początkowo nieruchome stopniowo osiągnie oczywiście maksymalną amplitudę. Widzimy więc, że można badać taki skomplikowany ruch bądź przy pomocy zjawiska rezonansu, w którym jedno wahadło przekazuje energię drugiemu, bądź jako nakładanie się dwu ruchów o stałej amplitudzie i o różnych częstościach.
49 fale stojqce 49-1. Odbicie fal W niniejszym rozdziale omówimy niektóre ważne zjawiska zachodzące wówczas, gdy fale są zamknięte w pewnym skończonym obszarze. Najpierw poznamy poszczególne zjawiska dotyczące drgającej struny. Ich uogólnienie pozwoli nam później sformułować zasadę, która jest chyba najogólniejszą zasadą fizyki teoretycznej. Pierwszym przykładem fal zamkniętych, jakie rozpatrzymy, będą fale ograniczone z jednej strony. Zajmijmy się prostym przykładem fal jednowymiarowych w strunie. Można by również dobrze zająć się przykładem fal dźwiękowych, odbijających się od ściany lub jakimś innym podobnym, ale dla naszych celów przykład struny zupełnie wystarczy. Załóżmy, że struna jest przytwierdzona jednym końcem do „nieskończenie sztywnej" ściany. Matematycznie wyrazimy to w ten sposób, że wychylenie y struny w punkcie x=0 równa się zeru, ponieważ jej koniec jest nieruchomy. Gdyby nie uwzględniać ściany, ogólne rozwiązanie dla ruchu struny byłoby sumą dwóch funkcji F(x—ct) i G{x + ct), z których pierwsza przedstawia falę poruszającą się w jedną stronę, a druga — falę biegnącą w stronę przeciwną: y=F(x-ct) + G(x + ct) (49.1) — i to jest ogólne rozwiązanie dla dowolnej struny. Musimy jednak uwzględnić fakt, że jeden koniec struny jest nieruchomy. Jeżeli przyjmiemy x=0 w równaniu (49.1) i zbadamy wartość y dla dowolnej chwili /, to otrzymamy y=F( —ct)+G(+ct). Jeżeli y ma być zawsze równe zeru, to znaczy, że funkcja G(ct) musi równać się — F(—et). Inaczej mówiąc, funkcja G pewnej wielkości musi równać się funkcji —F tej samej wielkości ze znakiem minus. Po podstawieniu tego wyniku do równania (49.1) znajdziemy następujące rozwiązanie: y=F{x-ct)-F(-x-ct). (49.2)
346 49. FALE STOJĄCE Koniec nieruchomy \ F(-x-tvt) ,' V Łatwo stwierdzić, że otrzymamy _v = 0, jeśli przyjmiemy .v = 0. Rysunek 49.1 pokazuje falę biegnącą w kierunku ujemnych x blisko punktu x = o i hipotetyczną falę poruszającą się w przeciwnym kierunku ze zmienionym znakiem i z drugiej strony początku układu. Nazwaliśmy ją hipotetyczną, bo oczywiście nie ma struny drgającej po drugiej stronie początku układu. Całkowity ruch struny należy traktować jako sumę tych dwóch fal dla dodatnich x. Gdy osiągną one początek układu to zawsze się zniosą, dając zero dla punktu x=0 i ostatecznie druga (odbita) fala będzie jedyną falą istniejącą dla dodatnich x i oczywiście będzie poruszała się w przeciwnym kierunku. Te wyniki są równoważne następującemu stwierdzeniu: gdy fala dobiega do nieruchomego końca struny, odbija się od niego, zmieniając znak. Takie odbicie można łatwo zrozumieć wyobrażając sobie, że to, co dobiega do końca struny, wychodzi potem odwrócone zza ściany. Krótko mówiąc, należy przyjąć, że struna jest nieskończona i że ilekroć mamy falę biegnącą w jedną stronę, to zawsze znajdziemy falę rozchodzącą się w przeciwnym kierunku z ustaloną symetrią; wtedy — przy takim założeniu — wychylenie w punkcie x = 0 zawsze będzie równało się zeru i nic nie stoi na przeszkodzie, by umocować strunę właśnie w tym punkcie. Z kolei omówimy zjawisko odbijania się fal periodycznych. Załóżmy, że fala przedstawiana przez funkcję F(x —et) jest falą sinusoidalną, która ma się odbić. Wtedy fala odbita, którą przedstawia funkcja -F(—x—ct), jest także falą sinusoidalną o tej samej częstości, ale poruszającą się w przeciwnym kierunku. Sytuację taką najprościej można- opisać korzystając z zapisu za pomocą funkcji zespolonych: F(x— ct) = e,cli'~x,c} oraz F(— x — c/) = e""c,+x'c). Widać, że po podstawieniu tych wyrażeń do równania (49.2) i podstawieniu x=0 otrzymamy y = 0 dla wszystkich wartości /, co spełnia warunek konieczny. Ze względu na własności funkcji wykładniczych możemy to zapisać w prostszej postaci: 49.1. Odbicie fali jako superpozycja dwu fal biegnących y = e (e - .o»/c _ gicx/cj =_2i e'""' sin (loxjc) (49.3) Z rozwiązania tego dowiadujemy się ciekawej rzeczy. Gdy obserwujemy określony punkt x struny, widzimy, że drga on z częstością co. Niezależnie od wyboru tego punktu częstość jest taka sama. Istnieją jednak pewne punkty, w szczególności takie, dla których sin (<yx/c) = 0, gdzie nie ma w ogóle wychyleń. Ponadto jeżeli w pewnej chwili t sfotografujemy drgającą strunę, to na zdjęciu otrzymamy sinusoidę. Jej wychylenia jednak będą zależały od czasu, w którym zrobiono zdjęcie. Na podstawie równania (49.3) stwierdzamy, że długość jednego cyklu naszej fali sinusoidalnej równa się długości fali dowol-
49-1. ODBICIE FAL 347 nej z fal składowych: X = 2kc\id (49.4) Punkty, w których nie ma drgań, spełniają warunek sin (cox/c) = 0, z którego wynika, że (u)x/ć) = 0, n,2n, ...,nn. Punkty te nazywamy węzłami Między dwoma kolejnymi węzłami każdy punkt porusza się do góry i na dół sinusoidalnie. Amplituda tego ruchu zależy od położenia punktu na strunie. Jest to podstawowa cecha tzw. fal stojących. Jeśli stwierdzimy taką postać ruchu, w którym dowolny punkt obiektu porusza się ściśle sinusoidalnie, a wszystkie jego punkty drgają z tą samą częstością (chociaż jedne wychylają się bardziej niż inne), to znaczy, że mamy do czynienia z falą stojącą. 49-2. Fale stojące i częstości własne Z następnym ciekawym problemem stykamy się wówczas, gdy naszą strunę umocujemy na obu końcach, powiedzmy w punktach x=0 i x=L. Nasze rozważania zaczniemy od zjawiska odbicia fal, zajmując się na początek grzbietem fali poruszającej się w jednym kierunku. Po jakimś czasie grzbiet ten zbliży się do jednego z końców struny i zacznie się zmniejszać na skutek interferencji z odwróconym grzbietem fali zbliżającej się z przeciwnej strony. Ostatecznie, początkowy grzbiet zniknie, a grzbiet odbity zacznie poruszać się w przeciwnym kierunku aż do powtórzenia procesu z przeciwnej strony. A więc nasz problem łatwo rozwiązać. Powstaje tylko pytanie, czy możemy otrzymać ruch sinusoidalny (rozwiązanie opisane przed chwilą jest periodyczne, ale oczywiście nie jest sinusoidalnie periodyczne). Spróbujmy wywołać w strunie sinusoidalną falę periodyczną. Jeżeli struna jest umocowana na jednym końcu, to wiemy, że ruch jej musi mieć taką matematyczną postać, jak nasze poprzednie rozwiązanie (49.3). To samo się dzieje, gdy struna jest umocowana na drugim końcu. A więc jedyna możliwość periodycznego mchu sinusoidalnego istnieje wtedy, gdy długość fali sinusoidalnej jest dokładnie dopasowana do długości struny. Jeżeli nie pasuje ona do długości struny, to znaczy, że częstość fali nie równa się częstości drgań własnych struny. Krótko mówiąc, gdy w strunie wywołamy falę sinusoidalną, której postać dokładnie pasuje do struny, to struna będzie utrzymywała dokładny kształt tej fali, drgając harmonicznie z pewną częstością. Matematyczną postać tej fali możemy przedstawić jako sin kx, gdzie k równa się czynnikowi (tu/c) w równaniach (49.3) i (49.4). Funkcja sin Jot równa się zeru dla x = 0. Musi ona się jednak równać zeru też na drugim końcu struny. To oznacza, że k nie może być już dowolne, tak jak to było w wypadku struny półotwartej. Dla struny umocowanej z obu stron musi być spełniony warunek sin (kL)=0, ponieważ tylko ten warunek zapewnia, że oba końce będą nieruchome. Z kolei, aby sinus równał się zeru, kąt musi wynosić 0, 7C, 2n lub dowolną całkowitą wielokrotność n. Równanie kL = nn (49.5) będzie więc określało możliwe wartości k, zależnie od wybranej liczby całkowitej. Dla każdego k istnieje pewna częstość, która zgodnie z równaniem (49.3) równa się po prostu a>=kc=nnc\L. (49.6)
348 49. FALE STOJĄCŁ 49.2. Trzy pierwsze fale stojące, wywołane w drgającej strunie 49.3. Dwie dodane fale stojące wytwarzają falę biegnącą ■fala stojąca -fata stojąca fala złożona Znaleźliśmy więc następującą własność struny: może ona drgać sinusoidalnie, ale tylko przy pewnych częstościach. Jest to najważniejsza cecha fal zamkniętych. Niezależnie od stopnia złożoności układu, zawsze istnieją dla niego pewne postacie ruchu, mające idealnie sinusoidalny przebieg czasowy, lecz z częstościami, które są zależne od wybranego układu i od warunków na brzegach. Dla struny istnieje wiele różnych możliwych częstości własnych, z których każda z definicji odpowiada fali stojącej, ponieważ fala ta jest postacią ruchu, który stale odtwarza swój sinusoidalny kształt. Rysunek 49.2 pokazuje trzy pierwsze fale stojące dla struny. Dla pierwszej fali długość fali, k, równa się 2L. Łatwo się o tym przekonać, gdy przedłużymy falę do punktu x — 2L, bowiem otrzymamy wówczas jeden pełny okres sinusoidy. Częstość kołowa co równa się 2nc podzielone przez długość fali. W naszym przypadku, ponieważ /. równa się 2L, częstość ta równa się nc/L, co zgadza się z zależnością (49.6) dla n—\. Oznaczmy częstość własną odpowiadającą pierwszej fali stojącej przez o>,. Druga fala stojąca - zwana też drugą składową harmoniczną — ma dwa grzbiety rozdzielone po środku węzłem. Jej długość równa się po prostu L, a więc odpowiadająca jej wartość k jest dwukrotnie większa. Również częstość własna jest dwa razy większa i równa się 2o>,. Dla trzeciej fali stojącej - trzeciej składowej harmonicznej - równa się ona 3tu, itd. A więc wszystkie dozwolone częstości struny równają się 1, 2, 3, 4 itd. razy najniższa częstość w i. Wracamy teraz do ogólnego ruchu struny. Okazuje się, że dowolny ruch struny można zawsze wyjaśnić przyjmując, że w strunie wywołano jednocześnie więcej niż jedną falę stojącą. W rzeczywistości w ogólnym przypadku ruchu musimy wzbudzić jednocześnie nieskończoną liczbę fal stojących. Aby trochę
49-2. FALE STOJĄCE I CZĘSTOŚCI WŁASNE 349 się w tym zorientować, zobaczymy, co się będzie działo przy jednoczesnym wzbudzeniu dwu kolejnych drgań harmonicznych. Przypuśćmy, że drgania pierwszej fali stojącej wyglądają tak, jak na poszczególnych fragmentach rys. 49.3, gdzie widzimy odkształcenia struny w równych odstępach czasu w ciągu połowy okresu odpowiadającego najniższej częstości. Załóżmy też, ze jednocześnie istnieją drgania drugiej fali stojącej. Na rysunku 49.3 widać szereg stanów wychylenia także tej fali, która na początku jest przesunięta o 90° w fazie względem pierwszej. Oznacza to, że w pierwszej chwili w ogóle nie ma wychylenia, a obie połowy struny mają prędkości przeciwnie skierowane. Teraz przypomnimy ogólną zasadę, słuszną dla układów liniowych: jeżeli istnieją dwa dowolne rozwiązania, to ich suma jest także rozwiązaniem. Dlatego trzeci możliwy ruch struny otrzymamy dodając dwa rozwiązania pokazane na rys. 49.3. Wynik, także pokazany na rysunku, zaczyna przypominać grzbiet fali, poruszający się tam i z powrotem między końcami struny. Jednak za pomocą tylko dwu fal stojących nie możemy go przedstawić realistycznie; do tego potrzeba znacznie więcej takich fal. Wynik, który przed chwilą otrzymaliśmy, jest szczególnym przypadkiem wielkiej zasady spełnionej przez układy liniowe: Każdy dowolny ruch można zbadać zakładając, że jest on sumą ruchów wszystkich różnych składowych harmonicznych dodanych z odpowiednimi amplitudami i w odpowiednich fazach. Znaczenie tej zasady wypływa z faktu, że każda fala stojąca jest bardzo prostym ruchem drgającym — nie jest niczym innym, jak- tylko sinusoidalnym ruchem w czasie, o częstości odpowiadającej jednej z częstości własnych układu. To prawda, że nawet dowolny ruch struny nie jest zbyt skomplikowany. Istnieją jednak inne układy, np. drgające skrzydła samolotów, których ruchy są znacznie bardziej skomplikowane. Mimo to, nawet w wypadku skrzydeł samolotu wykrywamy pewne szczególne sposoby drgań o określonych częstościach. Jeżeli znajdziemy te fale stojące, to wówczas dowolny ruch skrzydła można zawsze traktować jako superpozycję odpowiednich drgań harmonicznych (oprócz przypadków, w których drgania skrzydeł są tak znaczne, że nie można ich uważać za liniowe). 49-3. Dwuwymiarowe fale stojące Zajmijmy się teraz interesującym zjawiskiem, dwuwymiarowej fali stojącej. Do tej pory mówiliśmy tylko o jednowymiarowych zjawiskach — o napiętej strunie lub o fali dźwiękowej w rurze. W końcu powinniśmy zająć się trzema wymiarami, lecz łatwiejszym etapem będzie fala dwuwymiarowa. W celu uproszczenia rozumowania weźmy pod uwagę prostokątną membranę gumową umocowaną w ten sposób, że jej prostokątny obwód nie może wykonywać drgań. Przy tym niech rozmiary tego prostokąta będą równe a i b, jak na rys. 49.4. Powstaje pytanie: jakie są cechy ruchu membrany? Możemy rozpocząć od tego samego postępowania, co przy strunie. Gdyby nie było żadnych więzów, mogli-
350 49. FALE STOJĄCE unieruchomione byśmy się spodziewać, że w membranie będą się roz- brzegi \ chodzić jakieś fale. Tak na przykład funkcja „SW^^aSI.wv. expd'tu/) [exp(-ikxx+ikyy)] przedstawiałaby falę sinusoidalną biegnącą w pewnym kierunku zależnym od względnych wartości kx i ky. W jaki sposób możemy uczynić oś x, tzn. linię y = 0, linią węzłów? Korzystając z pojęć wprowadzonych dla struny jedno- ?o'^"- LV.UW^V^"' w£§ * wymiarowej, możemy wyobrazić sobie inną falę \ przedstawioną za pomocą funkcji zespolonej 49.4. Prostokątna płaszczyzna exp (-»>/) [exp ( -ik^ -ikyy)]. Superpozycja tych drgająca ^a' ^a zerowe przesunięcia dla osi y=0, niezależnie od wartości x i / (chociaż te funkcje są zdefiniowane również dla ujemnych y, gdzie nie ma membrany, która mogłaby drgać, to nie przejmujmy się tym, ponieważ wychylenie równa się zeru dla y=0). W tym przypadku drugą funkcję traktujemy jako falę odbitą. Jednak chcemy mieć linię węzłów nie tylko dla osi y = 0, ale i dla osi y = b. Jak możemy to osiągnąć9 Odpowiedź wiąże się w pewnym stopniu z tym, co robiliśmy zajmując się odbiciem od kryształów. Te fale, które znoszą się wzajemnie dla y=0, zrobią to samo dla y=b, jeżeli tylko 2bsin6 będzie się równać iloczynowi liczby całkowitej i )., gdzie 6 jest kątem pokazanym na rys. 49.4: mX = 2bsmB, j*=0,l,2,... (49.7) W podobny sposób możemy uczynić oś y linią węzłów dodając dwie inne funkcje —exp {itot) [exp (ikxx + ikyy)] oraz +exp(icot)[exp(ikxx — ikyy)], z których każda przedstawia odbicie drugiej od linii jc = 0. Warunek dla linii węzłów x = a przypomina warunek dla y = b. Mówi on, że 2acos6 musi także równać się iloczynowi liczby całkowitej i X: nX = 2acos0. (49.8) A więc w końcu dowiedzieliśmy się, że fale odbijające się od ścian pudła wytwarzają fale stojące, to znaczy drgania sinusoidalne o częstościach własnych. Aby więc otrzymać falę stojącą, musimy spełnić dwa powyższe warunki (49.7) i (49.8)- Znajdźmy najpierw długość tej fali. Możemy to zrobić eliminując kąt 0 z równań (49.7) i (49.8) i otrzymując długość fali w zależności od wielkości a, b, n i m. Zrobimy to najprościej dzieląc obie strony odpowiednich równań przez Ib i 2a. podnosząc je do kwadratu i dodając oba równania. W rezultacie otrzymamy równanie: sin2 0 +cos2 0= 1 = {nXj2a)2 + + (mX/2b)2. Możemy je rozwiązać dla X i otrzymamy: -7= J + T- (499) X2 4a2 4b2 W ten sposób wyraziliśmy długość fali za pomocą dwóch liczb całkowitych. Mając długość fali natychmiast obliczymy częstość własną co, ponieważ, jak wiemy, częstość równa si? 2nc dzielone przez długość fali. Wynik jest na tyle interesujący i ważny, że powinniśmy go wyprowadzić wyłączni
49-3. DWUWYMIAROWE FALE STOJĄCE 351 z samej analizy matematycznej, bez rozważania odbić. Przedstawmy w tym celu wibracje membrany jako superpozycję czterech fal wybranych tak, te cztery proste x = 0, x = a, v = 0 i y — b są liniami węzłów. Ponadto będziemy wymagać, żeby wszystkie fale miały tę samą częstość, a więc żeby ruch wypadkowy przedstawiał falę stojącą. Z naszych poprzednich rozważań dotyczących odbicia światła w'iemy, że funkcja exp (iot) [exp( — ikxx + ikyy)] przedstawia falę poruszającą się w kierunku oznaczonym na rys. 49.4. Równanie (49.6), tzn. k = toic, jest nadal spełnione, jeżeli przyjmiemy, że k2 = k2x + k2y. (49.10) Z rysunku widzimy, że kx = k cos 6 i ky = k sin 0. Teraz nasze równanie dla wychylenia prostokątnej membrany, które oznaczamy przez (p, przyjmuje bardzo skomplikowaną postać: ę = exp (icoł) [exp (— ikx x + iky y) — exp (ikxx+iky y) — — exp ( - ikx x - iky y) + exp (ikx x — iky >•)] (49.11 a) Chociaż wygląda to dość zawile, sumę tych wyrażeń otrzymujemy jednak bez trudu. Funkcje wykładnicze grupują się dając sinusy, tak że wychylenie równa się ^ = [ — 4sinfcJcx-sinfcJ,_y]exp(i'cu/). (49.1 Ib) Inaczej mówiąc, jest to drganie sinusoidalne, które ma kształt sinusoidy zarówno w kierunku osi x, jak i y. Nasze warunki graniczne są spełnione oczywiście dla x = 0 i y = 0. Chcemy także, aby c równało się zeru dla x = a i y = b. Dlatego dodajemy dwa nowe warunki: kxa musi równać się iloczynowi liczby całkowitej i n, a także kyb musi być równe całkowitej wielokrotności it. Ponieważ widzieliśmy, że kx = k cos 6 i ky = k sin 6, natychmiast otrzymamy równania (49.7) i (49.8), a z nich końcowy wynik (49.9). Dla przykładu rozważmy prostokąt, którego szerokość jest dwa razy większa od wysokości. Jeśli przyjmiemy a = 2b i skorzystamy z równań (49.4) i (49.9), możemy obliczyć częstości wszystkich fal stojących: , (nc\2m2 + n2 "St)-t- (49'2' W tablicy 49.1 zebrano wartości liczbowe dla kilku prostych fal stojących i pokazano jakościowo ich kształt. Najważniejszą rzeczą, na którą należy zwrócić uwagę w tym szczególnym przypadku, jest to, że częstości nawzajem nie są swoimi wielokrotnościami, ani też nie stanowią wielokrotności jakiejś liczby. Zasada, że częstości własne są harmonicznie związane, nie jest ogólnie słuszna. Nie jest słuszna dla układów o więcej niż jednym wymiarze, a także nie zachodzi dla tych jednowymiarowych układów, które są bardziej skomplikowane niż struna o jednorodnej gęstości i napięciu. Takim prostym przykładem jest wiszący łańcuch, którego napięcie jest większe u góry niż na dole. Jeżeli taki łańcuch wprawimy w drganie harmoniczne, wystąpią fale stojące o różnych częstościach, lecz ani częstości te nie są prostymi wielokrotnościami jakiejś liczby, ani kształty fal nie są sinusoidalne.
352 Tabela 49.1 49. FALE STOJĄCE Postać fali stojącej (to/too)2 <o/w0 + ' - + I - I + i + -~l I — i 1,25 2,00 3,25 4,25 5,00 1,12 1,41 1,80 2,06 2,24 Fale stojące dla bardziej złożonych układów są jeszcze bardziej zawiłe. U ludzi, na przykład, ponad strunami głosowymi znajduje się jama ustna. Poruszając językiem i wargami tworzymy z niej zamkniętą lub otwartą rurę o różnych średnicach i kształtach. Jest to ogromnie skomplikowany rezonator, ale mimo wszystko jest to rezonator. Gdy ktoś mówi, wprawia w drgania struny głosowe i wydają one pewien dźwięk. Dźwięk ten jest bardzo skomplikowany, składa się z wielu tonów, ale jama ustna jeszcze bardziej go modyfikuje, ponieważ ma ona różne częstości rezonansowe. Tak na przykład śpiewak może śpiewać samogłoski, a, o, e itd. na tej samej wysokości, lecz brzmią one różnie, ponieważ różne składowe harmoniczne w różnym stopniu rezonują w jamie ustnej. Tę doniosłą rolę częstości rezonansowych jamy ustnej w przekształceniu dźwięków mowy można udowodnić za pomocą prostego doświadczenia. Ponieważ szybkość dźwięku zmienia się jak odwrotność pierwiastka kwadratowego z gęstości, można ją zmieniać używając różnych gazów. Jeżeli użyjemy helu zamiast powietrza obniżając w ten sposób gęstość, szybkość dźwięku będzie większa i wszystkie częstości rezonansowe jamy ustnej wzrosną. A więc gdy ktoś napełni płuca helem, charakter jego głosu zmieni się bardzo wyraźnie, nawet jeżeli struny głosowe będą drgały stale z tą samą częstością.
49-4. WAHADŁA SPRZĘŻONE 353 49-4. Wahadła sprzężone Na zakończenie powinniśmy zwrócić uwagę na fakt, że fale stojące powstają nie tylko w złożonych, ciągłych układach, ale również w bardzo prostych układach mechanicznych. Dobry przykład stanowią dwa sprzężone wahadła, którymi zajmowaliśmy się w poprzednim rozdziale. Udowodniliśmy, że ruch ich można traktować jako superpozycję dwu ruchów harmonicznych o różnych częstościach. A więc nawet ten układ można badać przy pomocy ruchów harmonicznych, czyli fal stojących. W przypadku drgającej struny mamy do czynienia z nieskończoną liczbą drgań własnych, to samo dotyczy drgającej membrany. Gdybyśmy umieli liczyć nieskończoności, można by powiedzieć, że membrana jest podwójnie nieskończona. Ale w drgającym prostym urządzeniu mechanicznym, które ma tylko dwa stopnie swobody i wymaga tylko dwóch zmiennych do ich opisu, mogą powstać tylko dwa drgania własne. Zbadajmy te dwie częstości własne, w przypadku gdy oba wahadła mają taką samą długość. Oznaczmy wychylenie jednego wahadła symbolem x, a drugiego — symbolem y, tak jak na rys. 49.5. Bez sprężyny siła działająca na pierwszą masę, spowodowana ciążeniem, jest proporcjonalna do wychylenia tej masy. Gdyby nie było sprężyny, masa ta poruszałaby się z pewną częstością własną oj0. Równanie takiego ruchu byłoby następujące: m d2x ~d? = — mean x (49.13) Drugie wahadło bez połączenia sprężyną z pierwszym, poruszałoby się w ten sam sposób. Gdy natomiast wahadła połączone są sprężyną, oprócz siły grawitacji występuje dodatkowa siła ciągnąca pierwszą masę. Siła ta zależy od różnicy wychyleń x i y, jest do niej wprost proporcjonalna. Równa się ona iloczynowi pewnej stałej zależnej od geometrii układu i od różnicy (x—y). Ta sama siła działa w przeciwną stronę na drugą masę. Musimy więc rozwiązać następujące równania ruchu: m *1 dt2 — mw0x — k(x—y), d2y m —T=-mo}0y-k(y-x) (49.14) Aby znaleźć ruch, w którym obie masy poruszają się z tą samą częstością, musimy najpierw określić ruch każdej z mas z osobna. Inaczej mówiąc: wahadło x i wahadło y będą drgały z tą samą częstością, lecz musi istnieć ustalona zależność między wartościami ich amplitud A i B. Wypróbujemy takie rozwiązanie: x=Ae lat y=Be' lat (49.15) Po podstawieniu powyższych wyrażeń do równań (49.14) i zebraniu wyrazów podobnych, otrzymamy: 49.5. Dwa wahadła sprzężone yy//^. f —'"0"0"0000'^— Ó-r G-t
354 49. FA.LE STOJ Act (w2-Wo M= 6 \ m J m ioj2-cal ]B=- ~A \ m) m (49.16) Tę postać równań otrzymano po uproszczeniu wspólnego czynnika e"1" i podzieleniu ich przez in. Widzimy więc, że mamy jak gdyby dwa równania z dwiema niewiadomymi. W rzeczywistości jednak nie ma dwóch niewiadomych, ponieważ całego ruchu i tak nie możemy określić z tych równań. Powyższe równania mogą tylko określić stosunek A do B, przy czym oba muszą dać ten sam stosunek. Żądanie zgodności obu równań stawia częstości bardzo szczególne wymagania. W naszym przypadku postępowanie jest dosyć łatwe. Mnożąc stronami oba równania otrzymujemy: (co2 -col ) AB = (—J AB (49.17) Iloczynu AB możemy się łatwo pozbyć, chyba że wielkości A albo B są równe zeru, co oznaczałoby, że ruchu w ogóle nie ma. Jeżeli ruch występuje, to oba czynniki w nawiasach muszą być równe, co daje równanie kwadratowe, które trzeba rozwiązać. W wyniku otrzymujemy dwie możliwe częstości: 2/c co2 = col, a>l = a>2+— (49.18) m Jeżeli następnie podstawimy te częstości z powrotem do równania (49.16), to okaże się, że dla pierwszej częstości A = B, a dla drugiej A = — B. Taką postać mają więc szukane fale stojące, co można łatwo sprawdzić doświadczalnie. Oczywiście, że w pierwszej fali stojącej, dla której A = B, sprężyna nigdy nie jest rozciągnięta i obie masy drgają z częstością co0, jak gdyby sprężyny w ogóle nie było. W drugim przypadku, gdy A= —B, sprężyna dostarcza dodatkowej siły, co zwiększa częstość Bardziej interesujące wyniki otrzymamy dla dwu wahadeł o różnych długościach. Postępowanie jest wówczas bardzo podobne do powyższego i dlatego przeprowadzenie jego pozostawimy czytelnikowi jako ćwiczenie. 49-5. Układ} liniowe Podsumujmy teraz to wszystko, co powiedzieliśmy dotychczas na temat chyba najogólniejszej i najwspanialszej zasady fizyki teoretycznej. Jeżeli mamy pewien układ liniowy, którego charakter jest niezależny od czasu, to jego ruch nie musi być szczególnie prosty, a właściwie może być ogromnie skomplikowany. Istnieją jednak pewne bardzo
49-5. UKŁADY LINIOWE 355 specjalne ruchy tego układu, zwykle serie takich ruchów specjalnych, których cała postać zmienia się wykładniczo wraz z czasem. Dla układów drgających, bo o nich mówimy, ta funkcja wykładnicza jest urojona i zamiast mówić o wykładniczej zmienności, możemy powiedzieć, że zależność od czasu jest „sinusoidalna". Można jednak powiedzieć ogólniej, że ruchy te zmieniają się w czasie w bardzo szczególny sposób, przybierając bardzo specjalną postać. Najogólniejszy ruch takiego układu można zawsze przedstawić jako superpozycję ruchów, zawierającą wszystkie różne funkcje wykładnicze. Warto zwrócić uwagę na przypadek ruchu sinusoidalnego: układ liniowy nie musi poruszać się idealnie sinusoidalnie, to znaczy z określoną jedną częstością, lecz mimo to ruch jego można przedstawić jako superpozycję czystych ruchów sinusoidalnych. Częstość i postać każdego z tych ruchów jest cechą charakterystyczną układu. Dowolny ruch takiego układu można scharakteryzować podając natężenia i fazy każdego z ruchów składowych i następnie je dodając. Inaczej można to wyrazić mówiąc, że dowolny liniowy układ drgający jest równoważny zespołowi niezależnych harmonicznych oscylatorów, których częstości odpowiadają poszczególnym częstościom własnym układu. Rozdział ten zakończymy uwagami na temat związku teorii fal stojących z mechaniką kwantową. W mechanice kwantowej obiektem drgającym, a więc tym co zmienia się w czasie, jest amplituda prawdopodobieństwa, która podaje prawdopodobieństwo znalezienia elektronu lub układu elektronów w danej konfiguracji. Amplituda ta może zmieniać się w przestrzeni i w czasie spełniając równanie liniowe. Ale częstości amplitudy prawdopodobieństwa w mechanice kwantowej odpowiada energia w fizyce klasycznej. Możemy więc naszą zasadę przenieść na grunt mechaniki kwantowej, zastępując w niej wszędzie pojecie częstość pojęciem energia. Brzmi teraz ta zasada mniej więcej tak: układ kwantowy, np. atom, nie musi mieć określonej energii, podobnie jak prosty układ mechaniczny nie musi mieć określonej częstości. Jednak każdy sposób zachowania się tego układu można zawsze przedstawić jako superpozycję stanów o określonej energii. Energia każdego stanu jest cechą charakterystyczną atomu. To samo można powiedzieć o kształcie amplitudy określającej prawdopodobieństwo znalezienia cząstek w różnych miejscach. Podając amplitudę każdego z tych różnych stanów energetycznych możemy opisać ogólny ruch układu. Stąd właśnie bierze się pojęcie poziomów energetycznych w mechanice kwantowej. Ponieważ w mechanice kwantowej opisujemy wszystkie zjawiska za pomocą fal, to w tych warunkach, w których elektron nie ma dostatecznej energii, aby oderwać się od protonu, mówimy o falach zamkniętych. Podobnie jak dla fal zamkniętych w strunie, istnieją w tym przypadku określone częstości dla rozwiązań równania falowego w mechanice kwantowej. Ich kwantową interpretację stanowią określone energie. Dlatego układ kwantowy, ponieważ przedstawiamy go za pomocą fal, może mieć określone stany o ustalonej energii. Przykładem tego są poziomy energetyczne różnych atomów.
50 składowe harmoniczne 50-1. Tony muzyczne Podobno Pitagoras odkrył, że dwie jednakowo napięte struny o różnych długościach tylko wtedy wydają dźwięk przyjemny dla ucha, gdy ich długości są do siebie w stosunku niewielkich liczb całkowitych. Jeżeli stosunek ten równa się 1 : 2, to długości te odpowiadają oktawie muzycznej. Jeżeli mają się do siebie jak 1 : 3, to wydawany dźwięk odpowiada interwałowi między dźwiękami c i g, który nosi nazwę kwinty. Interwały te ogólnie uznano za „przyjemnie" brzmiące akordy. Pitagoras był pod tak wielkim wrażeniem tego odkrycia, że uczynił zeń podstawę szkoły filozoficznej, Pitagorejczyków, którzy wierzyli w mistyczną potęgę liczb. Wierzono, że coś podobnego powinno zachodzić dla planet lub „sfer" (czasami słyszymy określenie „muzyka sfer"). Pitagorejczycy twierdzili, że powinny istnieć pewne liczbowe zależności między orbitami planet, a także między innymi rzeczami w przyrodzie. Sądzi się zwykle, że był to po prostu rodzaj przesądu panującego u Greków. Ale czy w naszym zainteresowaniu się zależnościami liczbowymi tak bardzo oddaliliśmy się od tego przesądu? Odkrycie dokonane przez Pitagorasa było pierwszym wykraczającym poza geometrię przykładem liczbowych zależności w przyrodzie. Zaskakujące musiało być to nagłe odkrycie, że istnieje w przyrodzie zjawisko, w którym zawarta jest prosta zależność liczbowa. Proste pomiary długości pozwoliły przewidzieć coś, co nie miało widocznego związku z geometrią — wytworzenie przyjemnych dla ucha dźwięków. Odkrycie to pozwalało przypuszczać, że arytmetyka i analiza matematyczna są narzędziami, które pozwalają poznać przyrodę. Zdobycze nowoczesnej nauki potwierdzają to stanowisko. Pitagoras mógł dokonać swego odkrycia tylko drogą eksperymentalnej obserwacji- Jednak wydaje się, że nie zwrócił uwagi na tę ważną rolę doświadczenia. W przeciwnym razie fizyka mogłaby rozpocząć się znacznie wcześniej. (Zwykle bardzo łatwo krytykować to, czego ktoś już dokonał, i wyrokować, co powinien był zrobić!)
50-1. TONY MUZYCZNE 357 Może dostrzegliśmy jeszcze jeden szczegół tego bardzo interesującego odkrycia: dotyczyło ono przecież dwóch tonów, które brzmią przyjemnie dla ucha. Możemy zapytać, czy my zdajemy sobie sprawę lepiej niż Pitagoras, dlaczego tylko pewne dźwięki są przyjemne dla naszych uszu. Ogólna teoria estetyki chyba nie jest dziś bardziej rozwinięta niż w czasach Pitagorasa. A więc w tym jednym odkryciu Greków kryją się trzy aspekty: doświadczenie, zależności matematyczne i estetyka. Fizycy dokonali wielkiego postępu tylko w dwu z wymienionych dziedzin. Rozdział ten poświęcimy naszemu współczesnemu rozumieniu odkrycia Pitagorasa. Jeden z rodzajów odgłosów, które słyszymy, nazywamy hałasem. Odpowiada on nieregularnym wibracjom jakiegoś bliskiego obiektu. Gdybyśmy sporządzili wykres ciśnienia powietrza na błonkę bębenkową (a więc i jej wychylenia) jako funkcji czasu, to krzywa odpowiadająca hałasowi mogłaby wyglądać jak ta, którą widać na rys. 50.la (hałas ten odpowiada z grubsza tupaniu). Dźwięki muzyki mają inny charakter. Muzykę charakteryzuje obecność mniej lub bardziej długotrwałych tonów — „nut" muzycznych (instrumenty muzyczne mogą też hałasować!). Ton może trwać stosunkowo krótko, np. gdy ktoś uderzy w klawisz pianina, lub też może ciągnąć się nieskończenie, gdy flecista gra na flecie długą nutę. Co szczególnie charakteryzuje tony muzyczne z punktu widzenia ciśnienia powietrza? Tony muzyczne różnią się od hałasu periodycznością dostrzegalną na ich wykresach. Istnieje pewien wielokrotnie powtarzający się kształt zmian ciśnienia powietrza wraz z czasem. Na rysunku 50.Ib widać przykład funkcyjnej zależności ciśnienia od czasu, odpowiadającej tonowi muzycznemu. Muzycy wyróżniają zwykle trzy charakterystyczne cechy tonu muzycznego: natężenie, wysokość i „barwę". „Natężenie" jest związane z wielkością zmian ciśnienia. „Wysokość" tonu odpowiada czasowi, który potrzebny jest do jednego powtórzenia podstawowej 50.1. Ciśnienie jako funkcja czasu dla a) hałasu i b) dla tonu muzycznego O) 'E O) 'c 10 o m L-r-J
358 50. SKŁADOWE HARMONICZNE funkcji ciśnienia („niskie" tony mają dłuższe okresy niż tony „wysokie"). „Barwa" tonu związana jest z dającą się usłyszeć różnicą między dwoma tonami o tym samym natężeniu i wysokości. Zawsze odróżnimy dźwięki oboju, skrzypiec i śpiewaka, chociaż mogą mieć tę samą wysokość. Barwę dźwięku określa budowa powtarzającego się segmentu. Zajmijmy się na chwilę dźwiękiem wytwarzanym przez drgającą strunę. Gdy szarpniemy ją w jedną stronę i puścimy, jej dalszy ruch będzie określony przez fale, które w niej wytworzyliśmy. Wiemy, że fale te będą biegły w obu kierunkach wzdłuż struny i odbijały się od obu jej końców. Będą tak bardzo długo wędrować tam i z powrotem. Fala będzie się odtwarzać niezależnie od tego, jak bardzo jest skomplikowana. Okres odtwarzania równa się dokładnie czasowi T potrzebnemu na to, aby fala przebiegała dwie pełne długości struny, bowiem w tym właśnie czasie fala od chwili wytworzenia zdąży się odbić od obu końców, powrócić do położenia wyjściowego i znów zwrócić się w tym samym kierunku. Czas ten jest taki sam dla fal wybiegających w obu kierunkach. A więc każdy punkt struny będzie powracał do swego wyjściowego położenia po upływie jednego okresu, dwu okresów itd. Wytworzone fale dźwiękowe muszą także powtarzać się w taki sam sposób. Wiemy więc, dlaczego szarpnięta struna wytwarza ton muzyczny. 50-2. Szeregi Fouriera 50.2. Dowolna funkcja okresowa /(/) równa się sumie prostych funkcji harmonicznych W poprzednim rozdziale zajmowaliśmy się ruchem drgającym układu z innego punktu widzenia. Widzieliśmy, że struna może drgać z różnymi częstościami własnymi i że dowolne drganie struny wywołane przez określone warunki początkowe może być traktowane jako złożenie — w odpowiednich proporcjach — paru drgań własnych zachodzących jednocześnie. Dla struny znaleźliśmy, że drgania własne mają następujące częstości: co0, 2co0,3a)0,... Dlatego dowolny ruch szarpniętej struny jest złożony z sumy drgań sinusoidalnych o częstości własnej podstawowej co0, drugiej składowej harmonicznej o częstości 2o)0, trzeciej składowej harmonicznej o częstości 3w0 itd. Drganie podstawowe powtarza się w okresie 7", = 2n/w0 • Druga składowa harmoniczna powtarza się w okresie T2 = 2n/2ca0. Powtarza się ona również co okres Tx =2T2. tzn. po dwu swoich okresach. Podobnie trzecia składowa harmoniczna powtarza się po czasie 7",, który równa się trzem jej okresom. Widzimy teraz znów, dlaczego szarpnięta struna powtarza swój kształt w okresie T, i wytwarza ton muzyczny. Qo T t "'h^ *■ +0( + a2 W^r itd. itd.
50-2. SZEREGI FOURIERA 359 Mówiliśmy o ruchu struny. Ale dźwięk, który jest ruchem powietrza, jest wywołany przez ruchy struny, a więc jego drgania także muszą się składać z tych samych składowych harmonicznych — chociaż nie są to już drgania własne powietrza. Także względne natężenia składowych harmonicznych mogą być inne w powietrzu niż w strunie, szczególnie jeżeli struna jest „sprzężona" z powietrzem poprzez drgającą deskę. Wydajność tego sprzężenia jest różna dla różnych składowych harmonicznych. Jeśli funkcja /(/) ma przedstawiać ciśnienie powietrza jako funkcję czasu dla tonu muzycznego (taką, jak na rys. 50.Ib), to przypuszczamy, że funkcję f(t) można będzie zapisać jako sumę pewnej liczby prostych harmonicznych funkcji czasu — takich jak cos (ot — dla każdej z różnych częstości harmonicznych. Jeżeli okres drgań wynosi T, podstawowa częstość kołowa równa się 2njT, a kolejne składowe harmoniczne będą miały częstości lxv, 3cv itd. Trochę się wszystko komplikuje. Możemy się spodziewać, że fazy początkowe nie muszą być także same dla wszystkich częstości. Powinniśmy więc zastosować funkcję cos (cot+c). Prościej jednak będzie wziąć obie funkcje sinus i cosinus dla każdej częstości. Przypominamy, że cos(a>t + <o) = (cos (pcoscot — sin cpsincot) (50.1] i ponieważ cp jest stałe, to dowolne sinusoidalne drgania o częstości w można zapisać jakc sumę wyrazu z cos cot i drugiego z sin cot. Wnioskujemy stąd, że dowolną funkcję f{t), która jest funkcją okresową z okresem T, można matematycznie zapisać jako /(0 = fl0 + + alcoscot +blsinwt + + a2 cos 2cot + b2 sin 2wt + + a3 cos 3coi + b3 sin 3cot + + ... + (50.2, gdzie co = 2n/T oraz a, i bt są stałymi liczbowymi, które mówią nam, jak duży jest udzia każdego z drgań składowych w drganiu opisanym funkcją/(f)- Dodaliśmy wyraz o „zerowej częstości" a0, tak aby nasz wzór był zupełnie ogólny, chociaż dla tonów muzycznych wyraz ten zwykle równa się zeru. Przedstawia on przesunięcie średniej wartości (tzn poziomu „zero") ciśnienia dźwięku. Z tym wyrazem nasz wzór można zastosować dc każdego przypadku. Równość (50.2) jest schematycznie przedstawiona na rys. 50.2 (Amplitudy funkcji harmonicznych a„, b„ należy odpowiednio dobrać. Na rysunku przedstawiono je schematycznie, bez wyboru żadnej skali.) Szereg (50.2) nosi nazwę szeregi Fouriera dla funkcji /"(f)- Mówiliśmy, że w ten sposób można przedstawić dowolną funkcję okresową. Powinniśmy nieco to sprecyzować i powiedzieć, że dowolną falę dźwiękową lub dowolną funkcję, którą zwykle spotykamy w fizyce, możemy przedstawić w postaci takiej sumy. Matematyce wymyślili funkcje, których nie można przedstawić w postaci sumy prostych funkcji har
360 50. SKŁADOWE HARMONICZNE monicznych — do nich należy na przykład funkcja, która „skręca z powrotem", a więc ma dwie wartości dla pewnych wartości /! Nie musimy się tu jednak martwić takimi funkcjami. 50-3. Barwa i harmonia Teraz możemy już określić co decyduje o „barwie" dźwięku. Otóż zależy ona od względnej wielkości różnych składowych harmonicznych — od wartości a„ i bn. Ton zawierający tylko pierwszą składową harmoniczną jest tonem „czystym". Ton z wieloma składowymi jest tonem „pełnym". Skrzypce dają inną proporcję składowych harmonicznych niż obój. Możemy „produkować" różne dźwięki muzyczne przyłączając parę „oscylatorów" do głośnika. Możemy tak wybrać częstości oscylatorów, aby równały się one co, 2co, 3co itd. Następnie regulując siłę głosu każdego oscylatora możemy dodawać każdą ze składowych z dowolnym natężeniem — otrzymując w ten sposób tony o różnej barwie. Organy elektryczne działają na podobnej zasadzie. „Klawisze" wybierają odpowiednią częstość podstawowego oscylatora, a „rejestry" służą do kontroli względnych proporcji składowych harmonicznych. Przełączając te rejestry możemy otrzymać z organów dźwięki podobne do dźwięków fletu, oboju lub skrzypiec. Interesujące, że do wytworzenia takich „sztucznych" tonów potrzebny nam jest tylko jeden oscylator dla każdej częstości — nie potrzebne są oddzielne oscylatory dla drgań reprezentowanych przez sinusoidy i cosinusoidy. Ucho nie jest zbyt czułe na względne fazy składowych harmonicznych. Chwyta przede wszystkim sumę części sinusowej i co- sinusowej każdej częstości. Nasza analiza jest bardziej dokładna, niż to jest konieczne do wyjaśnienia subiektywnego aspektu muzyki. Jednak reakcja mikrofonów oraz innych instrumentów fizycznych zależy od faz i dokładna analiza może być przydatna, gdy zajmujemy się właśnie tymi przypadkami. „Barwa" mowy zależy także od dźwięków samogłosek. Kształt ust decyduje o częstościach własnych drgań powietrza w jamie ustnej. Niektóre z tych drgań są wzbudzane przez fale dźwiękowe wywołane drganiami strun głosowych. W ten sposób amplitudy pewnych składowych harmonicznych głosu zwiększają się w porównaniu z innymi. Zmieniając kształt ust dajemy pierwszeństwo składowym harmonicznym o różnych częstościach. W ten sposób powstaje różnica między dźwiękiem „e-e-e" oraz dźwiękiem „a-a-a" Wiemy, że wybrany dźwięk samogłoski powiedzmy „e-e-e" brzmi jednakowo, niezależnie od tego, czy wymawiamy (lub śpiewamy) go wysoko, czy też nisko. Z opisanego mechanizmu wynikałoby, że wzmacniamy tylko określone częstości, zawsze te same, gdy układamy nasze usta do „e-e-e" i że nie zmieniają się one, gdy zmieniamy wysokość naszego głosu. A więc stosunek najważniejszych składowych harmonicznych do składowej podstawowej — tzn. „barwa" — zmienia się, gdy zmienimy wysokość głosu. Widocznie mechanizm, za pomocą którego rozpoznajemy mowę, nie jest oparty na specyficznych zależnościach harmonicznych. Co możemy teraz powiedzieć o odkryciu Pitagorasa? Rozumiemy, że dwie podobne
50-3 BARWA 1 HARMONIA 361 struny o długościach, których stosunek wynosi 2: 3 będą miały częstości podstawowe w stosunku 3 : 2. Ale dlaczego razem „brzmią przyjemnie"? Być może rozwiązanie leży w częstościach składowych harmonicznych. Druga składowa krótszej struny będzie miała taką samą częstość, jak trzecia składowa harmoniczna struny dłuższej. (Łatwo wykazać lub po prostu uwierzyć, że szarpnięta struna wytwarza przede wszystkim najniższe składowe harmoniczne.) Prawdopodobnie słuszne są następujące reguły. Dwa tony współbrzmią harmonicznie (są w konsonansie), gdy oba zawierają składowe harmoniczne o tej samej częstości. Tony brzmią w dysonansie, jeżeli ich wyższe składowe harmoniczne mają częstości bliskie siebie, ale na tyle odległe, że występują szybkie dudnienia. Dlaczego dudnienia nie brzmią przyjemnie, a unisono wyższych składowych harmonicznych brzmi przyjemnie — jest zagadnieniem, którego nie jesteśmy w stanie ani określić, ani opisać. Na podstawie naszej wiedzy, nie możemy przewidzieć, co powinno brzmieć dobrze, podobnie jak nie wiemy, co powinno np. pachnieć przyjemnie. Inaczej mówiąc, nasza znajomość rzeczy nie wykracza poza stwierdzenie, że gdy dźwięki brzmią unisono, to brzmią przyjemnie. Nie możemy z tego wywnioskować nic innego oprócz istnienia własności harmonii w muzyce. Bardzo łatwo sprawdzić opisane przez nas zależności harmoniczne w prostych doświadczeniach z fortepianem. Oznaczamy trzy kolejne dźwięki c blisko środka klawiatury jako c, c' i c" oraz sąsiednie g jako g, g' i g". Wówczas tony podstawowe będą miały następujące częstości względne: c-2, g-3 C-4, g'-6 , c"-8 , g"-12. Te zależności harmoniczne można zademonstrować w następujący sposób. Załóżmy, że lekko przyciskamy klawisz c' — a więc dźwięku nie ma, ale podnosimy tłumik. Jeżeli teraz uderzymy w c, to wytworzy on swe drganie podstawowe oraz jakąś drugą składową harmoniczną. Ta druga składowa wzbudzi drgania w c'. Gdy zwolnimy klawisz c (trzymając c' naciśnięty), to tłumik zatrzyma drgania c i usłyszymy (cicho) ton c' powoli gasnący. W podobny sposób trzecia składowa harmoniczna struny c może wywołać drgania struny g'. Albo też szósta składowa harmoniczna c (teraz znacznie słabiej) może wzbudzić drganie podstawowe struny g". Otrzymamy nieco inny wynik, gdy lekko naciśniemy klawisz g, a następnie zagramy c'. Trzecia składowa c' będzie odpowiadała czwartej harmonicznej g', tak że zostanie pobudzona tylko czwarta harmoniczna g. Usłyszymy wówczas (jeżeli słuchamy uważnie) dźwięk g", który jest o dwie oktawy wyższy od g, które przycisnęliśmy. Łatwo wymyślić znacznie więcej kombinacji dla tej gamy. Przy okazji możemy zauważyć, że skalę majorową można określić jedynie przez warunek, że trzy główne akordy (f-a-c); (c-e-g) i (g-b-d) przedstawiają zbiory tonów, których stosunek częstości równa się (4:5: 6). Te stosunki oraz fakt, że dowolna oktawa (c-c', b-b' itd.) ma stosunek częstości 1:2 — określa całą skalę dla przypadku „idealnego" lub określa, jak mówimy, „skalę naturalną". Instrumenty klawiszowe, np. fortepiany.
362 50. SKŁADOWE HARMONICZNE zwykle nie dostraja się w ten sposób, lecz trochę się je „psuje", tak że stosunki częstości wszystkich możliwych tonów wyjściowych są spełnione tylko w przybliżeniu. Przy tym tzw. dostrojeniu „temperowanym" oktawa (nadal 1 : 2) dzieli się na 12 równych interwałów, dla których stosunek częstości równa się (2)1'12, kwinta nie ma już stosunku częstości 3 -. 2, ale 27,12 = 1,499 — tej różnicy większość ludzi nie słyszy. Ustaliliśmy regułę dla konsonansu (harmonicznego współbrzmienia) jako zgodność składowych harmonicznych. Czyżby ta zgodność stanowiła przyczynę, dla której dwa tony byłyby w konsonansie? Ktoś stwierdził, że czyste tony — wytwarzane bez żadnych składowych harmonicznych — nie sprawiają wrażenia konsonansu lub dysonansu, gdy względne częstości są dobrane w odpowiednim stosunku, czy też tylko blisko niego. (Takie doświadczenia są trudne do przeprowadzenia, ponieważ z powodów, o których dowiemy się później, bardzo trudno wytworzyć czyste tony.) Nadal nie możemy być pewni, czy gdy stwierdzamy, że lubimy jakiś dźwięk, nasze ucho porównuje składowe harmoniczne, czy też przeprowadza obliczenia. 50-4. Współczynniki Fouriera Wróćmy teraz do twierdzenia, że dowolny ton — tzn. dźwięk periodyczny — można przedstawić przy pomocy odpowiedniej kombinacji składowych harmonicznych. Chcielibyśmy podać sposób obliczenia potrzebnego natężenia każdej składowej. Łatwo, oczywiście, obliczyć funkcję/"(f) z równania (50.2), jeżeli mamy dane wszystkie współczynniki a i b. Powstaje pytanie: czy znając funkcję f(t) możemy wiedzieć, jakie powinny hyć współczynniki przy różnych składowych harmonicznych? (Łatwo upiec ciasto według przepisu, ale jak napisać przepis mając gotowe ciasto?) Fourier odkrył, że właściwie nie jest to wcale trudne. Wyraz a0 naprawdę łatwo znaleźć. Mówiliśmy już, że równa się on uśrednionej wartości funkcji/(f) w ciągu jednego okresu (od : = 0 do t=T). Łatwo możemy się przekonać, że tak jest naprawdę. Średnia wartość sinusa lub cosinusa w ciągu jednego okresu równa się zeru. Obliczona dla dwóch, trzech lub dowolnej całkowitej liczby okresów także równa się zeru. A więc średnia wartość wszystkich wyrazów z prawej strony równania (50.2) równa się zeru, oprócz wyrazu a0. (Pamiętajmy, że musimy wybrać o) = 2n/T.) Ale średnia sumy równa się sumie średnich. A więc średnia wartość funkcji/(/) równa się średniej wartości a0. Jednak a0 jest stale, a więc jego wartość średnia równa się a0 Przypominając definicję średniej mamy "o=M/(')</r. (50.3) o Dalsze współczynniki są trochę trudniejsze do znalezienia. Aby je obliczyć, możemy się posłużyć chwytem matematycznym, odkrytym przez Fouriera. Załóżmy, że pomnożyliśmy obie strony równania (50.2) przez pewną funkcję harmoniczną — powiedzmy przez cos lat. Otrzymamy wtedy
SO-4. WSPÓŁCZYNNIKI FOURIERA 363 f(t) cos 7wt = a0 cos lwi + + al cos ot coslcot + bt sin col cos 7<w/+ + a2 cos 2wt cos lot + b2 sin 2wt cos lot + + ... + ... + a 7 cos 7<«f cos Iwt + b-, sin 7w/ cos 7ca/ + + +... (50.4) Teraz obliczymy średnie wartości obu stron. Średnia wartość wyrażenia a0 cos lott obliczona dla jednego okresu T jest wprost proporcjonalna do średniej wartości cosinusa obliczonej dla 7 całych okresów. Ale to równa się zeru. Średnia wartość prawie wszystkich pozostałych wyrazów jest także równa zeru Przyjrzyjmy się wyrazowi za,. Wiemy, że ogólnie cos>lcosB = icosM + B) + icos(^-B). (50.5) Wyraz z a, równa się wówczas i a,(cos 8cof +cos 6cur). (50.6) Mamy w ten sposób dwa wyrazy z cosinusami: jeden z 8 całymi okresami T, a drugi z 6 okresami. Dla obu średnie wartości równają się zeru. A więc średnia wartość wyrazu z at równa się zeru. Dla wyrazu z a2 znaleźliśmy a2 cos 9wt i a1 cos 5wt — oba wyrazy uśredniają się do zera. Wyraz a^ dawałby cos 16wf oraz cos( — 2wt). Ale cos( — lun) równa się cos 2ojf. a więc oba wyrazy mają średnią wartość równą zeru. Jasne więc, że wszystkie wyrażenia przy a będą miały średnią wartość równą zeru, z wyjątkiem jednego. A tym jednym jest wyraz a-,. Mamy dla niego ^c7(cosl4air+cos0). (50.7) Cosinus zera równa się jedności i jego wartość średnia też wynosi jeden. Otrzymaliśmy więc wynik, że średnia wszystkich wyrażeń z a w równaniu (50.4) równa się \an Wyrazy z b są nawet łatwiejsze do wyznaczenia. Po pomnożeniu przez dowolny wyraz typu cos wół możemy udowodnić przy pomocy tej samej metody, że wszystkie wyrazy z b mają średnią wartość równą zeru. Widzimy, że chwyt wymyślony przez Fouriera działa jak pewnego rodzaju sito. Gdy pomnożymy/ (t) przez cos Iwt i uśrednimy, znikają wszystkie wyrazy oprócz a-,. Mamy stąd: średnia [f(i) cos liot] = a-]2 , (50.8) czyli c7=— j(t)coslwtdt (50 9) o Pozostawiamy czytelnikowi do udowodnienia, że współczynnik b7 można otrzymać
364 SO SKŁADOWE HARMONICZNI mnożąc równanie (50.2) przez sin lat i uśredniając obie strony. Wynik jest następujący T b7^—\f(t)sm7atdt (50.10) o Przewidujemy, że to, co jest prawdziwe dla 7, zachodzi także dla dowolnej liczby całkowitej. Możemy więc podsumować nasz dowód i nasze wyniki w następujący, matematycznie bardziej elegancki sposób: Jeżeli m i n są liczbami całkowitymi różnymi od zera i jeżeli o>=2n/T, to 1. J sin ncot cos mat dt = 0 . (50.11) o T II. JcosMa>łcosm<y/</f = T III. J sinwcaisinmcof di = 0, jeśli »#m, T/2 , jeśli h = m . (50.12) IV. f(t)=a0+ Y. ancosncot+ £ bnsinnat. (50.13) n=l n=l T V. a„=-i-f/(0A. (50.14) r y'(0 cos nwtdt. (50.15) o r .-yJj o T , = y|/0)si: sin nwtdt. (50.16) o W poprzednich rozdziałach wygodne było zapisywanie prostych ruchów harmonicznych przy pomocy funkcji wykładniczych. Zamiast cos cot używaliśmy Re e'"", rzeczywistej części funkcji wykładniczej. Natomiast tutaj używaliśmy sinusów i cosinusow, co sprawiało, ie wyprowadzenie było nieco bardziej przejrzyste. Można jednak nasz końcowy wynik, równanie (50.13), zapisać w zwartej postaci: yOHRefa.e*"-, (50.17) n = 0 gdzie fl, jest liczbą zespoloną: an — ib„ (z bo=0). Jeżeli chcemy stale używać tego samego "">«"'" #*"* m"h-»*4*»w*"i»f rńu;mp4 nontGQra
50-4. WSPÓŁCZYNNIKI FOURIERA 365 fl»4I +1 -1 1 1 1 1 1 1 i i i i i 50.3. Funkcja opisująca falę schodkową: /(r)=+l dla 0<t<TI2. /(/)=-! dla T/2<t<T — /(0e"'na"dl («>l). (50.18) Wiemy teraz jak „rozłożyć" falę periodyczną na jej składowe harmoniczne. Ta procedura nosi nazwę analizy Fouriera, a oddzielne wyrazy nazywamy składowymi Fouriera. Nie udowodniliśmy jednak, że skoro znajdziemy wszystkie składowe Fouriera i dodamy je do siebie, to rzeczywiście otrzymamy z powrotem naszą funkcję/(r). Matematycy udowodnili dla szerokiej klasy funkcji, a właściwie dla wszystkich, które interesują fizyków, że po obliczeniu całek otrzymamy z powrotem funkcję /(/). Istnieje jeden mały wyjątek. Jeżeli funkcja /(/) jest nieciągła, to znaczy skacze gwałtownie od jednej wartości do drugiej, suma Fouriera w punkcie skoku da wartość leżącą w połowie drogi między dolną i górną wartością funkcji w punkcie nieciągłości. A wiec jeśli mamy taką dziwną funkcję f(t) = 0, 0<f<fo i/(0 = l dla t0^t^T, to suma Fouriera da poprawną wartość wszędzie oprócz punktu t0, gdzie będzie miała wartość { zamiast 1. W każdym razie żądanie, aby funkcja równała się zeru aż do punktu f0, a dokładnie 1 w punkcie /0, jest raczej niefizyczne. Może więc powinniśmy ustalić dla fizyków „regułę", że dowolna funkcja nieciągła (która może być tylko uproszczeniem jakiejś realnej funkcji fizycznej) powinna być dookreślona w ten sposób, że jej wartości w punktach nieciągłości równają się sumie Fouriera obliczonej w tych punktach. Wówczas dowolna funkcja tego rodzaju — z dowolną skończoną liczbą takich skoków — podobnie jak inne fizycznie interesujące funkcje zostaje przez sumę Fouriera określona prawidłowo. Jako ćwiczenie proponujemy, aby czytelnik znalazł szereg Fouriera dla funkcji przedstawionej na rys. 50.3. Ponieważ funkcji tej nie można zapisać w jawnej postaci analitycznej, nie będzie można obliczyć całek od 0 do T w zwykły sposób. Całki te łatwo obliczyć po rozdzieleniu ich na dwie: całkę od zera do T/2 [gdzie/(/)=1] i całkę od punktu T/2 do T [gdzie /(/)= — 1]. Powinniśmy otrzymać następujący wynik: /(0 = —(sin cot+^ sin 3cot+$sin Scot + ...), (50.19) gdzie co = 2n/T. Stwierdziliśmy w ten sposób, że nasza fala schodkowa (z wybraną szczególną fazą) ma tylko nieparzyste składowe harmoniczne, a ich amplitudy są odwrotnie proporcjonalne do częstości. Sprawdźmy, że równanie (50.19) daje nam rzeczywiście z powrotem funkcję/(O dla pewnej wartości t. Wybierzmy wartości t=T/4, czyli wt=n/2. Podstawiając wybrane wartości do równania (50.19) otrzymujemy
66 SKŁADOWI HARMONIC 4 / Tc 1 3n 1 5n Ul) sin sin - - mii .1= (50 2' k \ 2 3 " ' " ' 2 5 2 Suma*' tego szeregu równa się rr 4 a stąd znajdujemy, że / (/) 1. 50..., 50-5. Twierdzenie o energii Energia fali jest proporcjonalna do kwadratu amplitudy. Dla fali o skomplikowanym T kształcie energia w ciągu jednego okresu jest proporcjonalna do j f2(t) dl Możemy również p powiązać tę energię ze współczynnikami Fouriera. Piszemy: T T X. a \f2(t)dt \ [a0 Y. a„cosnwt+ £ ''„sinnw*]2^ . (50.22) l' O n- 1 n= 1 Pr podniesieniu do kwadratu wyrażenia w nawiasie otrzymamy wszystkie możliwe iloczyny, takie jak a5 cos Sotb-, cos 7wf Jednak udowodniliśmy już [równania (50 11) i (50.12)], że wszystkie całki z takich wyrazów obliczone dla jednego okresu dają zero Pozostają nam tylko wyrazy kwadratowe typu a&cos 2 5a>t Całka z cosinusa do kwadratu lub sinusa do kwadratu, obliczona dla jednego okresu, jest równa 772, a więc otrzymujemy ; f2(t)dt=Ta20 + --(a2 a22 + +b2 + b22 + b23+ )=Ta20+ ^Y(an + b2n) (50.23. ^ n = Równanie to nazywamy .twierdzeniem energii" , głosi ono, że całkowita energia tali ' iwna się sumie energii wszystkich składowych Fouriera. Stosując na przykład to twierdz ■lie do szeregu (50.19). ponieważ [/(M]2=l. otrzymujemy r , 4 , / ' ' 1 U I 1 więc dowiadujemy się. ze suma odwrotności kwadratów liczb nieparzvstych ro \n Podobnie <.-trz\mu|ąL najpierw szereg Fouriera din funkcii c następnie korzy uerdzenia nergii, m vna udowodnić że I -*- I 2*- I 34 równa się t4 90. n v 'trzym^ .nik. ktor\ ył nam potrzebnv w rozdz 45 * zereg_ *m jstępi_. Najpierw stwierd N nk cp alk *ą w szereg 1 .razi i otrz>m jemy c .. .
M> ZJAWISKA NI1L1VIOW1 367 50-6. Zjawiska nieliniowe W teorii drgań harmonicznych istnieje jeszcze pewne bardzo ważne zjawisko - efekty nieliniowe, o którym trzeba pamiętać ze względu na jego zastosowania praktyczne. Do tej pory zakładaliśmy, że wszystkie rozważane układy działały liniowo, że przesunięcia i przyspieszenia wywołane przez siły były zawsze do nich proporcjonalne. Podobnie prądy w obwodach były proporcjonalne do napięć itd Teraz chcemy się zająć przypadkami, w których nie ma ścisłej proporcjonalności. Na razie weźmy pod uwagę jakieś urządzenie. Którego reakcja, nazwiemy ją .xskutek w chwili t, jest określona przez x Tak na przykład xpT7yc być prądem, a xskulek zachodz'c w chwili /. ,„...„= może , może oznaczać siłę, a xskutck - przesunięcie, lub xprZi napięciem. Jeżeli nasze urządzenie działa liniowo, to powinno XskutekW — KXp a(0 (50.24) gdzie K jest stałą niezależną od / i xprzyczyna Załóżmy jednak, że nasze urządzenie działa prawie, ale nie dokładnie liniowo, tak że zachodzi -^skutek'')— K- |_Xprzyczyna(O+E*. a(0] (50.25) •*nrz t)) niel (.n^J gdzie £ jest małe w porównaniu z jednością. Takie liniowe i nieliniowe efekty pokazano na wykresach na rys. 50.4. Efekty nieliniowe mają pewne ważne konsekwencje praktyczne. Niektórymi z nich zajmiemy się teraz. Najpierw zastanówmy się, co nastąpi, gdy przez urządzenie nieliniowe przepuścimy czysty ton. Mamy xprzyczyna = cos wt. Po wykreśleniu xskutc.k jako funkcji czasu, otrzymamy krzywą ciągłą pokazaną na rys. 50.5. Krzywa przerywana przedstawia dla porównania skutek dla układu liniowego. Widzimy że w urządzeniu nieliniowym nie otrzymujemy już funkcji cosinus, lecz funkcję, która jest bardziej stro- rna na górze i bardziej płaska na dole. Mówimy, że fala wyjściowa jest zniekształcona Wiem\ już, że taka fala nie jest czystym tonem, że będzie miała składowe harmoniczne. Możemy teraz znaleźć te składowe. Biorąc vprzvC2vna cos ot z równania (50.25) i trz>r..^em> iniowe 50.4. Zjawiska liniowe i nieliniowe 50.5. Reakcja urządzenia nieliniowego na sygnał wejściowy cos wt. Dla porównania pokazano reakcję liniową k
368 50 SKŁADOWE HARMONICZNE *skutek = K (COS V>t+E COS2 COt) . (50.26) Z równości cos2 0 = j(\ +cos 29) mamy: *sku.ek = K [cOStOt + j + yCOS 2o>M (50.27) Nasze urządzenie wytworzyło więc falę, która ma nie tylko składowe o częstości podstawowej, obecnej w fali wejściowej, ale ma także drugą składową harmoniczną. Fala wyjściowa zawiera także stały wyraz K(e/2), który odpowiada przesunięciu wartości średniej, pokazanemu na rys. 50.5. Proces wytwarzania przesunięcia wartości średniej nazywamy rektyfikacją (wyprostowaniem). Urządzenia nieliniowe będą wyprostowywały (rektyfikowały) falę wejściową oraz wytwarzały nowe składowe harmoniczne. Chociaż założona nieliniowość wytwarza tylko drugą składową harmoniczną, to nieliniowości wyższych rzędów — zawierające np. wyrazy Xprzyczyna oraz Xp^^s, - będą wytwarzały wyższe składowe harmoniczne. Innym efektem związanym z zjawiskami nieliniowymi jest modulacja. Jeżeli nasza fala wejściowa zawiera dwa (lub więcej) czyste tony, to fala wyjściowa będzie miała nie tylko ich składowe harmoniczne, ale także składowe o innych częstościach. Niech -Vprzy„yna = = A cos cott + B cos co2t, gdzie w, i co2 nie są związane zależnością harmoniczności. Oprócz wyrazu liniowego (który równa się K razy fala wejściowa) na wyjściu będziemy mieli składową określoną przez -Kjkuick = Ke (A cos a>, t + B cos u>21)2 = (50.28) = Ke(/l2cos2w,r-l-B2cos2W2t + 2/lBcosa>1f cosa>20 - (50.29) Pierwsze dwa wyrazy w nawiasie w równaniu (50.29) dają stałą składową oraz drugie składowe harmoniczne, które znaleźliśmy już przedtem. Tylko ostatni wyraz jest nowy. Możemy spojrzeć na ten nowy iloczyn AB cos co1t cos co2t dwojako. Przede wszystkim, jeżeli te dwie częstości bardzo się różnią (gdy np. (ot jest znacznie większe od co2), to możemy traktować ten iloczyn jako drganie cosinusoidalne o zmiennej amplitudzie. Możemy więc spojrzeć na czynniki tego iloczynu w następujący sposób: AB cosał, t -cosGJ2f = C(f)cosa>, t, (50.30) gdzie C(t) = ABcosio1t. (5031) Mówimy, że amplituda fali cosa*!/ jest zmodulowana z częstością u>2. Można też iloczyn ten zapisać w inny sposób: AB -46 cosa>, t cosa>2/= [cos(oj, +a>2)/-l-cos(a>1 — a)2)/] . (50.3-) W tym wypadku powiemy, że zostały wytworzone dwie nowe składowe: jedna — o częstości (wi+co2), a druga — o częstości równej różnicy częstości (a>, — co2). Mamy dwa różne, ale równoważne sposoby traktowania tego samego wyniku W specjalnym przypadku, gdy a»,>o;2» możemy powiązać te dwa punkty widzenia stwierdzając,
50-6. ZJAWISKA NIELINIOWE 369 że skoro (o), -t-a>2) i («, — oj2) są bardzo bliskie siebie, to powinniśmy zaobserwować dudnienia, dudnienia te jednak wywołują z kolei modulację amplitudy drgań o średniej częstości w, z częstością równą połowie różnicy częstości 2w2- Widzimy więc, dlaczego te dwa opisy są równoważne. W sumie, dowiedzieliśmy się, że reakcje nieliniowe wywołują szereg zjawisk: rektyfikację, wytworzenie składowych harmonicznych i modulację, tzn. wytworzenie składowych z sumą i różnicą częstości. Musimy zwrócić uwagę, że wszystkie efekty wywołane przez te zjawiska [równanie (50.29)] są proporcjonalne nie tylko do współczynnika nieliniowości e, ale także do iloczynu obu amplitud, czyli do A1, B2 bądź AB. Spodziewamy się więc, że zjawiska te będą znacznie istotniejsze dla sygnałów silnych niż dla słabych. Zjawiska, o których mówiliśmy, mają wiele praktycznych zastosowań. Przede wszystkim, jeżeli chodzi o dźwięk, to uważa się, że organ słuchu jest układem nieliniowym. Tłumaczy to fakt, że słuchając głośnych dźwięków odnosimy wrażenie, że słyszymy składowe harmoniczne, a także dudnienia, nawet gdy fala dźwiękowa zawiera tylko tony czyste. Części składowe różnych urządzeń odtwarzających dźwięk wzmacniacze, głośniki itd. — zawsze, wykazują pewną nieliniowość. Powodują one zniekształcenia (wytwarzają składowe harmoniczne itd.), których nie ma w oryginalnym dźwięku. Te nowe składowe odbiera ucho i są one z pewnością niepożądane. Dlatego też urządzenia wysokiej klasy, tzw. „Hi-Fi", powinny być w miarę możności jak najbardziej liniowe. (Nie wiadomo na pewno, dlaczego nieliniowości słuchu nie są tak samo „niepożądane", ani czy ta nieliniowość tkwi raczej w głośniku, a nie jest związana ze słuchem}.) Nieliniowości są jednak konieczne i zostają w rzeczywistości zwiększone w pewnych radiowych urządzeniach transmisyjnych i odbiorczych. W nadajniku z modulacją amplitudy AM, sygnał „głosu" (z częstością paru kiioherców) jest nałożony na sygnał nośny (z częstością paru megaherców) w nieliniowym obwodzie nazywanym modulatorem,w celu otrzymania drgań zmodulowanych, które są następnie emitowane. W odbiorniku odbierany sygnał przekazywany jest do obwodu nieliniowego, który dodaje i odejmuje częstości zmodulowanego sygnału i wytwarza sygnał głosu. Omawiając rozchodzenie się światła zakładaliśmy, że indukowane drgania ładunków były proporcjonalne do pola elektrycznego światła, tzn. że reakcja jest liniowa. Jest to oczywiście bardzo dobre przybliżenie. Dopiero od paru lat istnieją źródła światła (lasery) wytwarzające światło o takim natężeniu, że można zaobserwować efekty nieliniowe. Można obecnie wytwarzać wyższe składowe harmoniczne dla światła. Gdy silne czerwone światło przepuścimy przez kawałek szkła, to w świetle wychodzącym dostrzeżemy również drugą składową harmoniczną — trochę światła niebieskiego!
51 (ale 51-1. Fale czołowe Chociaż właściwie zakończyliśmy ilościową analizę zjawisk falowych, poświęcimy im jeszcze jeden rozdział. Zamierzamy w nim podać jakościową ocenę różnych związanych z falami zjawisk, które są zbyt skomplikowane, aby się nimi zajmować dokładnie. Ponieważ zajmowaliśmy się już falami w paru rozdziałach, właściwy tytuł tego rozdziału powinien brzmieć: „Niektóre bardziej złożone zjawiska związane z falami". Z początku omówimy zjawiska, które wystąpią, gdy źródło fal będzie się poruszało szybciej niż same fale, tzn. będzie miało prędkość większą od prędkości fazowej fal. Najpierw weźmy pod uwagę fale, które mają określoną prędkość, jak np. fala świetlna lub dźwiękowa. Zobaczmy więc, co się stanie, gdy źródło dźwięku będzie się poruszało szybciej niż dźwięk. Załóżmy, że w pewnej chwili przez źródło znajdujące się w punkcie .x, na rys. 51.1 zostaje wytworzona fala dźwiękowa. Następnie gdy źródło przesunie się do punktu jc2, czoło fali wytworzonej w punkcie x, będzie miało promień rx mniejszy od odległości, którą przebyło źródło, a z punktu x2 wybiegnie oczywiście druga fala. Gdy źródło dojdzie do punktu x3, który stanie się nowym z kolei źródłem fali, czoło fali z punktu x2 będzie już teraz miało promień r2, a fala z punktu xt przebędzie odległość r3. Oczywiście, wszystko to będzie się działo w sposób ciągły, a nie skokowy i dlatego pojawi się tu ciąg fal kulistych o wspólnej stycznej, przechodzącej przez środek źródła. Widzimy więc, że zamiast źródła nieruchomego wytwarzającego fale kuliste mamy teraz źródło poruszające się, które wytwarza falę o stożkowej powierzchni falowej w trzech wymiarach lub w przypadku dwuwymiarowym falę, kórej powierzchnię falową tworzą dwie przecinające się proste. Łatwo znaleźć kąt rozwarcia tego stożka. W ciągu pewnego czasu źródło przebywa drogę x3— jc, proporcjonalną do prędkości źródła v. Jednocześnie czoło fali przebędzie odległość r3, proporcjonalną do szybkości fali, którą oznaczymy przez cf. Wnioskujemy
51-1. FALI CZOŁOWE 371 stąd od razu, że sinus połowy kąta przy wierzchołku stożka równa się stosunkowi szybkości fali do szybkości źródła i że sinus ten jest dobrze określony tylko wtedy, gdy szybkość cs jest mniejsza od v, tzn. gdy obiekt porusza się szybciej niż dźwięk. sin0=^ (5l.l) i' Nawiasem mówiąc, poruszające się ciało wcale nie musi być źródłem dźwięku. Okazuje się, że ciało poruszające się szybciej niż dźwięk samo wytwarza dźwięk. Dowolne ciało poruszające się w ośrodku szybciej niż rozchodząca się w nim fala dźwiękowa wytwarza automatycznie fale dźwiękowe tylko dzięki swemu ruchowi. To jest zrozumiałe w przypadku dźwięku, ale okazuje się, że coś podobnego występuje też dla światła. Na pierwszy rzut oka można by sądzić, że nic nie może poruszać się szybciej od światła. Światło w szkle ma jednak prędkość fazową mniejszą od prędkości światła w próżni. Można więc nadać naładowanej cząstce tak dużą.energię, że jej prędkość przy przelatywaniu przez blok szkła będzie bardzo bliska prędkości światła w próżni, podczas gdy szybkość światła w szkle może stanowić tylko j tej prędkości. Cząstka poruszająca się szybciej niż światło w ośrodku będzie wytwarzała stożkową falę świetlną z wierzchołkiem w źródle, podobną do fali czołowej wytwarzanej przez okręt (która przecież stanowi to samo zjawisko). Mierząc kąt rozwarcia stożka możemy określić prędkość cząstki. Jest to jedna z metod określania prędkości cząstek, którą używamy do pomiaru energii cząstek elementarnych o bardzo dużej energii. W tym celu musimy tylko wyznaczyć kierunek światła. Światło to nazywamy niekiedy promieniowaniem Czerenkowa, ponieważ on to za- 51.2. Fala uderzeniowa wywołana w gazie przez obserwował je po raz pierwszy. Frank zaś P°cisk Poruszający się szybciej niż dźwięk i Tamm zbadali teoretycznie natężenie tego _^ światła. Ci trzej fizycy otrzymali za tę pracę Nagrodę Nobla w dziedzinie fizyki w roku 1958. Przebieg tego zjawiska w przypadku dżwię- _ —■—■■» ku pokazano na fot. 51.2. Jest to fotografia ""■■■—— ciała poruszającego się w gazie z szybkością większą niż dźwięk. Zmiany ciśnienia gazu wywołują zmiany współczynnika załamania i za pomocą odpowiedniego urządzenia opty- 51.1. Czoło Tali uderzeniowej jest stożkiem, którego wierzchołek znajduje się w źródle, aj kąta rozwarcia równa się 0= arc sin (crjv)
372 51. FALE cznego można obserwować czoło fali. Widzimy, że ciało poruszające się szybciej od dźwięku rzeczywiście wytwarza falę stożkową. Dokładniejsza jednak obserwacja pozwala stwierdzić pewną krzywiznę czoła fali. Asymptotycznie jest to powierzchnia płaska, ale zakrzywia się ona w pobliżu wierzchołka. Teraz musimy wyjaśnić, dlaczego tak się dzieje, ale jest to już następny temat tego rozdziału. 51-2. Fale uderzeniowe Szybkość fali zależy często od jej amplitudy. W przypadku fali dźwiękowej zależność ta powstaje w następujący sposób. Otóż dowolne ciało poruszające się w powietrzu musi usuwać powietrze ze swej drogi. Dlatego też wywoływane zaburzenie jest czymś w rodzaju schodka ciśnienia. Przy tym ciśnienie jest większe z tyłu czoła fali niż w obszarze nieza- burzonym, do którego fala jeszcze nie dotarła (oczywiście fala poruszająca się z normalną szybkością). Ale powietrze, które zostaje z tyłu po przejściu czoła fali, jest zgęszczone adiabatycznie i dlatego jego temperatura wzrasta. Ponieważ szybkość dźwięku wzrasta wraz z temperaturą, więc w obszarze za skokiem ciśnienia jest ona większa od szybkości w powietrzu przed falą. Oznacza to, że jakieś inne zaburzenie wywołane za skokiem, będzie miało szybkość większą od czoła fali, ponieważ szybkość będzie wzrastała ze wzrostem ciśnienia. Na rysunku 51.3 przedstawiono to zjawisko wraz z małymi garbkami dodatkowego ciśnienia na konturze ciśnienia, umieszczonymi w celu lepszego zobrazowania zjawiska. Widzimy, że znajdujący się z tyłu obszar podwyższonego ciśnienia wraz z upływem czasu dogania czoło aż do chwili, gdy fala .zgęszczona wytworzy w końcu ostry skok ciśnienia. Gdy natężenie fali będzie bardzo duże, wyrażenie „w końcu" praktycznie oznacza „natychmiast"; gdy natomiast będzie raczej małe, trwa to dość długo. Może się również zdarzyć, że dźwięk rozprzestrzeni się i wygaśnie przed powstaniem takiego skoku. Zmiany ciśnienia wywołane przez dźwięki, które wytwarzamy w trakcie mówienia, są bardzo słabe w porównaniu z ciśnieniem atmosferycznym — stosunek ich równa się jeden do miliona. Lecz dla zmian ciśnienia rzędu 1 Atm prędkość fali wzrasta o około 20% i odpowiednio szybko tworzy się prostopadły „skok" ciśnienia. W przyrodzie nic nie dzieje się nieskończenie szybko, i to, co nazywamy „prostopadłym" skokiem, w rze- 51.3. „Migawkowe zdjęcia" czoła fali uderzeniowej w kolejnych odstępach czasu odległość
51-2. FALE UDERZENIOWE 373 czywistości ma pewną bardzo małą szerokość. Skok ten nie jest nieskończenie stromy, jego szerokość jest rzędu średniej drogi swobodnej. Do opisu zmian ciśnienia na takich odległościach nie możemy stosować równania falowego, ponieważ nie uwzględnia ono struktury atomowej gazu. Wracając do rys. 51.2 widzimy, że można zrozumieć występowanie zakrzywienia czoła fali, jeżeli zauważymy, że ciśnienia blisko wierzchołka są większe niż daleko z tyłu, a więc i kąt 6 jest tu większy. Oznacza to, że krzywizna powstaje, ponieważ szybkość fali zależy od jej amplitudy. Dlatego fala uderzę- 51.4 niowa wywołana eksplozją bomby atomowej porusza się szybciej niż dźwięk, póki nie oddali się dostatecznie od miejsca wybuchu i nie osłabnie na tyle, że przyrost ciśnienia przez nią wywołany będzie mały w porównnniu z ciśnieniem atmosferycznym. Szybkość tej fali osiąga wówczas szybkość dźwięku w gazie, w którym ta fala się porusza. (Nawiasem mówiąc, okazuje się, że szybkość skoku ciśnienia jest zawsze większa niż szybkość dźwięku w gazie przed skokiem, ale mniejsza od szybkości dźwięku w gazie za skokiem. Oznacza to, że impulsy wywołane za skokiem będą doganiały czoło fali, ale czoło to porusza się w ośrodku z szybkością większą od normalnej szybkości sygnałów. A więc metodami akustycznymi nie można stwierdzić zbliżania się skoku aż do chwili, gdy jest już za późno. Błysk wybuchu bomby oczywiście dostrzegamy wcześniej, ale nie można stwierdzić zbliżania się skoku, zanim on nadejdzie, ponieważ nie ma sygnałów dźwiękowych, które by go poprzedzały.) To zjawisko spiętrzania się fal jest bardzo interesujące. Występuje ono dzięki temu, że po przejściu fali szybkość następnej wywołanej fali wzrasta. Istnieje jeszcze jeden przykład tego zjawiska. Zastanówmy się nad ruchem wody płynącej w długim kanale. Kanał ten ma skończoną szerokość i głębokość. Jeśli tłok lub poprzecznie ustawiona ścianka porusza się dostatecznie szybko wzdłuż kanału, to woda spiętrza się podobnie jak śnieg przed pługiem śnieżnym. Załóżmy teraz, że sytuacja wygląda tak, jak na fot. 51.4, na której widzimy nagły skok poziomu wody w kanale. Można udowodnić, że fale długie w kanale poruszają się szybciej w wodzie głębokiej niż w płytkiej. Dlatego też każde nowe zaburzenia albo zmiany energii wywołane przez tłok biegną do przodu i spiętrzają czoło fali. I znów, teoretycznie, otrzymujemy ostry skok poziomu wody. Jednak jak wynika z fot. 51.4, występują tu pewne komplikacje. Na zdjęciu widzimy falę biegnącą w kanale, tłok znajduje się daleko po prawej stronie kanału. Początkowo fala może wyglądać zupełnie normalnie, zgodnie z przewidywaniem, ale dalej wzdłuż kanału czoło fali coraz bardziej się zaostrza, aż do wystąpienia zjawiska, które widzimy na zdjęciu. Na powierzchni woda opada, kotłuje się, ale istotny jest tu bardzo ostry wzrost poziomu wody przy braku zaburzeń przed czołem fali.
374 51- FALE 1 h2 D)-^ V _ -JL+ h »- I I b) *2 51.5. Dwa przekroje fali wysokiego przypływu w kanale: w momencie b) późniejszym o At w stosunku do a) W rzeczywistości tego rodzaju zjawiska falowe w wodzie są bardziej skomplikowane niż rozchodzenie się dźwięku w powietrzu. Jednak dla ich zilustrowania spróbujmy zbadać szybkość tej tzw. fali wysokiego przypływu w kanale**. Wnioski, jakie stąd wyciągniemy, nie będą miały podstawowego znaczenia dla naszych celów — nie posłużą nam one do żadnych uogólnień — a pozwolą nam tylko wykazać, że znane nam prawa mechaniki nadają się do wyjaśnienia tego typu zjawisk. Wyobraźmy sobie, że przepływ wody w kanale można schematycznie przedstawić tak, jak na rys. 5I.5a. Woda na górnym poziomie h2 porusza się z prędkością v, a czoło fali wchodzi z prędkością u w wodę niezaburzoną, której głębokość równa się hx. Chcielibyśmy znaleźć szybkość czoła fali. W czasie At płaszczyzna pionowa znajdująca się początkowo w punkcie x, przesunie się o v At do punktu x2, podczas gdy czoło fali przesunie się o u At. Teraz wypiszemy równania zachowania masy oraz zachowania pędu. Najpierw zajmiemy się pierwszym z nich. Widzimy, że masa h2v At, która przepływa przez jednostkową powierzchnię kanału umieszczoną w punkcie jc, (na rysunku obszar zakreskowany) jest skompensowana przez masę (/i2— h,)u At, którą oznaczyliśmy drugim obszarem zakresko- wanym. Dzieląc obie masy przez At otrzymujemy vh2 = u(h2 — h{). To nam nie wystarcza, bo chociaż znamy wielkości h2 i ht, nie wiemy, jakie jest u ani v. Spróbujmy obliczyć obie te prędkości. W tym celu skorzystajmy z zasady zachowania pędu. Dotychczas nic nie mówiliśmy o ciśnieniu wódy, nie zajmowaliśmy się hydrodynamiką, ale tak czy inaczej wiemy, że ciśnienie wody na danej głębokości utrzymuje znajdującą się nad nią kolumnę wody. Dlatego ciśnienie wody równa się iloczynowi gęstości wody p, przyspieszenia ziemskiego g oraz głębokości wody. Ponieważ ciśnienie wzrasta liniowo wraz z głębokością, średnie ciśnienie wywierane na płaszczyznę w punkcie x, równa się \pgh2. Tyle wynosi średnia siła przypadająca na jednostkę szerokości i jednostkę długości. Siła ta popycha płaszczyznę znajdującą się w punkcie x{ w kierunku punktu x2. Po pomnożeniu ciśnienia jeszcze raz przez h2 otrzymujemy całkowitą siłę działającą na wodę z lewej strony. Jednak istnieje też ciśnienie wody działające w przeciwnym kierunku, które wywiera na omawiany obszar siłę równą \pgh\, co obliczamy na podstawie podobnej analizy. Teraz musimy porównać różnicę tych sił z przyrostem pędu. Musimy w tym celu ocenić, o ile większy jest pęd w sytua- •' To znaczy fali tworzącej się przy ujściu rzeki (lub kanału) podczas przypływu morza. (Przyp- red. wydania polskiego.)
51-2. FALE UDERZENIOWE 375 cji b z rys. 51.5 w porównaniu z sytuacją a. Widzimy, że dodatkowa masa, która zyskuje szybkość v, równa się ph2u At — ph2v At (na jednostkową szerokość). Mnożąc to wyrażenie przez v otrzymujemy dodatkowy pęd, który należy porównać z popędem F At: (ph2uAt-ph2vAt)v = tipgh\-\pgh\)At. Gdy pozbędziemy się z tego równania v, podstawiając je ze znanego już równania vh2 = = u(h2—ht), po uproszczeniach otrzymamy u2 = gh2(h1+łi2)/2h1. Jeżeli różnica wysokości jest bardzo mała, tak że hx \h2 są prawie równe, nasze równanie mówi, że u = \'gh. Jak przekonamy się później, jest to słuszne tylko wtedy, gdy długość fali jest większa od głębokości kanału. Takie samo rozumowanie można przeprowadzić dla fal dźwiękowych dodając tylko zasadę zachowania energii wewnętrznej, ale już nie entropii, ponieważ tworzenie skoku jest nieodwracalne. W rzeczywistości, gdybyśmy chcieli sprawdzić zasadę zachowania energii dla fali wysokiego przypływu, okazałoby się, że nie jest ono spełnione. Przy małych różnicach wysokości jest ono prawie idealnie spełnione, natomiast przy znacznych różnicach występują już duże straty energii. Objawiają się one w postaci opadania wody i wirów widocznych na fot. 51.4. Z punktu widzenia procesów adiabatycznych analogiczna dostrzegalna strata energii występuje w fali uderzeniowej. Energia fali dźwiękowej za skokiem jest użyta do ogrzania gazu po przejściu skoku, co odpowiada wirom na wodzie w fali wysokiego przypływu. Do obliczenia tej straty dla fali dźwiękowej potrzebne są trzy równania i okazuje się, że temperatura za skokiem, zgodnie z tym, co już mówiliśmy, nie równa się temperaturze gazu przed czołem fali. Jeżeli spróbujemy wywołać odwrotną falę wysokiego przypływu (h2<h,), to się okaże, że strata energii na sekundę ma wartość ujemną. Ponieważ nie ma żadnego źródła energii, fala taka nie może sama się utrzymać, jest nietrwała. Gdy wywołamy taką falę, rozpłynie się ona, ponieważ zależność szybkości fali od wysokości, która poprzednio spowodowała zaostrzenie czoła fali, wywoła teraz zjawisko odwrotne. 51-3. Fale w ciałach stałych Drugim rodzajem fal, którymi teraz się zajmiemy, będą fale rozchodzące się w ciałach stałych. Fale te są bardziej złożone od fal rozchodzących się w wodzie lub w powietrzu Zajmowaliśmy się już falami dźwiękowymi w gazach i w cieczach. Analogiczne fale możni wywołać w ciałach stałych. Gdy raptownie naciśniemy ciało stałe, zmieni ono swą objętość Ciało to będzie się przy tym przeciwstawiało naciskowi, a to wywoła falę analogiczną dc fali dźwiękowej. W ciele starym można wywołać jeszcze inny rodzaj fal, które nie występuj, w cieczach. Gdy ciało stałe odkształcimy bez zmiany objętości, działając siłą styczną dc powierzchni, to będzie ono usiłowało wrócić do swej pierwotnej postaci. To właśnie z defi nicji odróżnia ciało stałe od cieczy: jeżeli zaburzymy ciecz przechylając naczynie, a następ nie przetrzymamy ją chwilę aż do uspokojenia i puścimy swobodnie, to ciecz będzii trwała nadal w tej nowej postaci. Ale gdy zdeformujemy ciało stałe, np. kawałek galaretki
376 51. FALE a następnie usuniemy siłę, to galaretka wróci do pierwotnej postaci i wytworzy falę poprzeczną poruszającą się w podobny sposób jak fale zgęszczeniowe. We wszystkich przypadkach szybkość fal poprzecznych jest mniejsza od szybkości fal podłużnych. Fale poprzeczne są bardziej podobne, jeżeli chodzi o własność polaryzacji, do fal świetlnych. Dźwięku nie można spolaryzować, jest on po prostu falą ciśnieniową. Natomiast światło charakteryzuje się orientacją prostopadłą do kierunku jego rozchodzenia się. W ciele starym występują oba rodzaje fal. Przede wszystkim są fale zgęszczeniowe analogiczne do fal dźwiękowych, poruszające się z pewną prędkością, oraz fale poprzeczne. Jeżeli dane ciało nie jest ciałem krystalicznym, fala poprzeczna spolaryzowana w dowolnym kierunku będzie rozchodziła się w tym ciele z pewną szybkością zależną od własności ciała. (Oczywiście, wszystkie ciała stałe są ciałami krystalicznymi, jeżeli jednak weźmiemy kawałek substancji zbudowanej z mikrokryształów o różnej orientacji, to anizotropia krystaliczna się uśredni.) Istnieje jeszcze jeden ciekawy problem dotyczący fal dźwiękowych. Co się mianowicie stanie, jeżeli będziemy brali coraz krótsze i krótsze fale w ciele stałym? Jakie mogą być fale najkrótsze? Oczywiście, że nie ma fali krótszej niż odległość między atomami, ponieważ wiemy, że w fali jedne punkty poruszają się do góry, a inne na dół, a więc najkrótszą falą jest fala o długości równej odległości międzyatomowej. Mówiąc o różnych rodzajach drgań, mamy na myśli drgania podłużne, poprzeczne, drgania długofalowe oraz drgania krótkofalowe. Gdy bierzemy pod uwagę długości fal porównywalne z odległościami między- atomowymi, szybkości fal przestają być stałe. Występują tu efekty dyspersji, kiedy prędkość fali nie jest niezależna od liczby falowej. Ale tak czy inaczej najwyższą częstość będzie miała ta fala poprzeczna, w której każdy atom porusza się inaczej niż atomy sąsiednie. Z atomowego punktu widzenia sytuacja jest podobna do omawianego wypadku dwóch wahadeł mających dwa rodzaje drgań własnych: jeden, kiedy oba poruszają się razem, i drugi, kiedy poruszają się w przeciwne strony. Można też badać falę w ciele stałym w inny sposób, rozważając układ sprzężonych oscylatorów harmonicznych, np. olbrzymią liczbę wahadeł z jedną składową harmoniczną o najwyższej częstości, w której wszystkie wahadła drgają w różne strony, i o niższych częstościach przy innym sposobie doboru faz drgań. Najkrótsze fale są tak krótkie, że zwykle są praktycznie nieosiągalne. Odgrywają jednak bardzo dużą rolę w termodynamice ciał stałych, ponieważ przy pomocy własności najkrótszych fal dźwiękowych bada się cieplne własności ciał stałych, np. ich ciepła właściwe. Przechodząc do omawiania najkrótszych fal dźwiękowych z konieczności dochodzimy do ruchów poszczególnych atomów; w każdym razie oba te zagadnienia dotyczą tego samego zjawiska. Bardzo interesującym przykładem, zarówno podłużnych, jak i poprzecznych fal dźwiękowych w ciele starym są fale wywoływane w skorupie ziemskiej. Co wywołuje te hałasy wewnątrz Ziemi, nie wiemy, ale czasem wewnątrz kuli ziemskiej jedne skały przesuwają się względem drugich wywołując trzęsienie Ziemi, przypominające niskie fale dźwiękowe- W trakcie trzęsienia Ziemi fale podobne do fal dźwiękowych wybiegają z jego źródła, mając długości znacznie większe od zwykłych fal dźwiękowych. Są to jednak zwykłe fale dźwiękowe, które obiegają Ziemię wkoło. Jednak wnętrze Ziemi nie ma budowy jednorodnej i ciśnienie, gęstość, ściśliwość itp., a zatem i szybkość fal zmienia się wraz z głębo-
51-3. FALE W CIAŁACH STAŁYCH • 377 kością. Fale te nie poruszają się więc wzdłuż linii prostych — wnętrze Ziemi wykazuje pewien współczynnik załamania i dlatego biegną wzdłuż krzywych. Fale poprzeczne i podłużne różnią się szybkością, istnieją więc dla różnych prędkości różne „mieszanki" tych fal. Dlatego gdy po umieszczeniu sejsmografu w pewnym miejscu obserwujemy drgania wywołane jakimś trzęsieniem Ziemi, to nie ujrzymy po prostu nieregularnych drgań. Możemy natomiast przez pewien czas obserwować drgania, potem ich zupełne wygaszanie a następnie nowe drgania — wszystko zależy od miejsca, gdzie jest umieszczony sejsmograf. Jeżeli jest umieszczony dość blisko źródła drgań, to zauważymy najpierw falę podłużną wywołaną zaburzeniem, a następnie, po pewnym czasie, fale poprzeczne, ponieważ poruszają się one znacznie wolniej. Mierząc różnicę czasu między tymi momentami możemy określić odległość od źródła trzęsienia Ziemi, jeśli wiemy dostatecznie dużo o szybkościach i budowie wnętrza obszaru, w którym to trzęsienie zachodzi. Na rysunku 51.6 pokazano przykład rozchodzenia się fal w Ziemi. Każdy rodzaj fal oznaczono innym symbolem. Jeżeli trzęsienie Ziemi zaszło w miejscu oznaczonym jako „źródło", to fale podłużne i poprzeczne poruszając się po najprostszych drogach nie przybędą do stacji jednocześnie. Będą ponadto odbijały się na nieciągłościach, co jeszcze bardziej skomplikuje ich drogi i szybkości. Okazuje się, że wewnątrz Ziemi znajduje się rdzeń, w którym nie rozchodzą się fale poprzeczne. Jeżeli obserwatorium znajduje się po przeciwnej stronie kuli ziemskiej od źródła, fale poprzeczne wprawdzie dochodzą do niego, ale są przesunięte w fazie. Wyjaśniamy to mówiąc, że gdy fala poprzeczna dotrze do rdzenia i padnie na powierzchnię oddzielającą dwa różne materiały, wówczas powstaną dwie nowe fale, poprzeczna i podłużna. Natomiast wewnątrz rdzenia fala poprzeczna się nie rozchodzi (a w każdym razie tego nie stwierdzono w przeciwieństwie do fali podłużnej). Następnie z rdzenia znów wybiegają dwie fale: podłużna i poprzeczna, które dochodzą do obserwatorium. Badając zachowanie się fal wywołanych trzęsieniem Ziemi stwierdzamy, że fale poprzeczne nie mogą się rozchodzić wewnątrz pewnej kuli stanowiącej rdzeń Ziemi. Oznacza to, że wnętrze Ziemi jest ciekłe w tym sensie, że nie przepuszcza fal poprzecznych. Wszystko, co wiemy o wnętrzu Ziemi, pochodzi z badania trzęsień ziemi. Korzystając z olbrzymiej liczby obserwacji wielu trzęsień z różnych obserwatoriów poznano wiele szczegółów — szybkości, krzywe, po których biegną fale itd.; wszystko to jest znane. Wiemy, jakie są szybkości różnych rodzajów fal na każdej głębokości. Mając te wiadomości, można określić drgania własne Ziemi, ponieważ znamy szybkość rozchodzenia się fal dźwiękowych, tzn. sprężyste własności Ziemi na każdej głębokości. Przypuśćmy, *e spłaszczyliśmy Ziemię do elipsoidy, SI.6. Schemat wnętrza Ziemi ukazujący drogi poprzecznych i podłużnych fal dźwiękowych źródło obserwatorium podłużne (P,K) poprzecznej
378 51. FALE a następnie przestaliśmy działać siłą. Wówczas do określenia okresu i kształtu drgań swobodnych Ziemi musimy znać superpozycję drgań obiegających kulę ziemską. Wiemy, że w tym przypadku na superpozycję tę składa się wielka liczba drgań własnych od najniższego, elipsoidalnego, do wyższych o bogatszej strukturze. Trzęsienie Ziemi w Chile w maju 1960 r. wywołało tak głośne „hałasy", że ich sygnały obiegły wielokrotnie Ziemię. Akurat na krótko przedtem zainstalowano bardzo czułe sejsmografy, które mogły zmierzyć częstości podstawowych drgań własnych Ziemi i porównać je z wartościami otrzymanymi na podstawie teorii dźwięku ze znanych szybkości fal dźwiękowych zmierzonych w czasie innych trzęsień Ziemi. Wynik tego doświadczenia przedstawia rys. 51.7, na którym wykreślono zależność natężenia sygnału od częstości jego drgań (analiza fourierowska). Zauważmy, że dla pewnych częstości sygnały są szczególnie silne; istnieją bardzo dobrze określone maksima. Odpowiadają one częstościom własnym Ziemi, ponieważ są to główne częstości, z jakimi Ziemia może drgać. Inaczej mówiąc, jeżeli dowolny ruch drgający kuli ziemskiej składa się z wielu różnych drgań własnych, to powinniśmy w każdym obserwatorium otrzymać nieregularne skoki oznaczające superpozycję wielu częstości. Gdy rozłożymy je na częstości składowe, to będziemy w stanie określić częstości własne Ziemi. Cienkie pionowe linie na rysunku oznaczają częstości obliczone; stwierdzamy doskonałą zgodność, która wskazuje na to, że teorię dźwięku można stosować do wnętrza Ziemi. Bardzo interesujące zjawisko ujawnia rys. 51.8. Na rysunku tym przedstawiono bardzo dokładne pomiary, przeprowadzone z większą zdolnością rozdzielczą, najniższego drgania własnego, drgania elipsoidalnego Ziemi. Zauważmy, że nie ma tu maksimum pojedynczego, lecz występują dwa, nieco przesunięte, maksima: 54,7 min i 53,1 min. Przyczyna wystąpienia tych dwóch częstości nie była znana w momencie pomiaru; być może, została odkryta później. Istnieją przynajmniej dwie możliwości wyjaśnienia. Jedna opiera się na 51.7. Wykres natężenia jako funkcji częstości odczytany z sejsmografów w Nana (Peru) i Isabella (Kalifornia). Widoczna koherencja jest miarą sprzężenia między obserwatoriami [Benioff, Press and Smith, J. Geoph. Research 66, 605 (1961)1 drganie powierzchni Ziemi
51-3. FALF W CIAŁACH STAŁYCH 379 400 prawdopodobieństwie występowania asymetrii w rozkładzie masy Ziemi, co spowodowałoby pojawienie się dwu podobnych drgań własnych. Druga możliwość jest może bardziej interesująca. Wyobraźmy sobie fale wybiegające ze źródła w dwu kierunkach wokół Ziemi. Szybkości ich nie będą równe ze względu na wpływ obrotu Ziemi na równania ruchu, co nie zostało uwzględnione przy tej analizie. Ruch w układzie obracającym się zmienia się na skutek siły Coriolisa i to może spowodować obserwowane rozszczepienie. Jeżeli chodzi o metodę, przy pomocy której analizowano te trzęsienia, to wykres otrzymany z sejsmografu nie przedstawia amplitudy jako funkcji częstości, ale podaje przemieszczenia powierzchni Ziemi jako funkcję czasu; jest to zwykle bardzo nieregularna krzywa. Wiemy, że w celu znalezienia zawartości różnych fal sinusoidalnych o różnych częstościach należy pomnożyć dane z sejsmografu przez falę sinusoidalną o danej częstości i scał- kować, to znaczy uśrednić, w wyniku czego znikną wszystkie inne częstości. Nasze rysunki przedstawiają więc wykresy całek znalezionych po pomnożeniu danych przez fale sinusoidalne o różnych częstościach. 0,0180 0,0182 0,0184 0.0186 0,0188 0,0190 0/1192 częstość w okresach na minutę SI.8. Analiza fourierowska jednego z zapisów sejsmografu o dużej zdolności rozdzielczej, ujawniająca dublet widmowy 51-4. Fale powierzchniowe Następnym rodzajem fal, które każdy łatwo może obserwować i których zwykle używa się jako przykładu w elementarnych wykładach fizyki, są fale na wodzie. Jak się o tym wkrótce przekonamy, stanowią one najgorszy z możliwych przykładów, ponieważ nie mają nic wspólnego z falami dźwiękowymi lub świetlnymi, natomiast są najbardziej skomplikowane ze wszystkich rodzajów fal. Zacznijmy od fal długich na głębokiej wodzie. Jeżeli traktujemy ocean jako nieskończenie głęboki i wywołamy zaburzenie na jego powierzchni, to wytworzy się fala. Występują tu różne ruchy nieregularne, ale ruch sinusoidalny przy małym zaburzeniu może wyglądać jak gładkie fale biegnące po oceanie ku brzegowi. Oczywiście, przy takich falach woda średnio biorąc pozostaje nieruchoma, a tylko fale się poruszają. Jaki jest ten ruch: poprzeczny czy podłużny? Nie może być ani taki, ani taki — ani podłużny, ani poprzeczny. Chociaż woda w danym miejscu stanowi albo grzbiet, albo dolinę fali, to nie może po prostu poruszać się do góry i na dół ze względu na zachowanie
380 51. FALE kierunek fali fala na wodzie . N. grzbiet fali poruszają się po orbiłch kołowych 51.9. Fale na głębokiej wodzie tworzą się dzięki ruchowi cząsieczek po okręgach. Zwróćmy uwagę na systematyczne przesunięcie fazy przy przejściu od jednego okręgu do drugiego. Jak poruszałby się pływający przedmiot? ilości wody. Gdzie by się podziewała woda, jeżeli opadałaby na dół? Woda jest praktycznie biorąc zupełnie nieściśliwa. Szybkość fali zgęszczeniowej w wodzie - tzn. dźwięku w wodzie — jest o wiele większa i nie będziemy się nią tutaj zajmować. Jeżeli więc woda jest aż tak nieściśliwa, to gdy grzbiet fali opada, woda musi uciekać z tego obszaru. Zjawisko to polega na tym, że cząsteczki cieczy znajdujące się blisko jej powierzchni mają ruch w przybliżeniu kołowy. Gdy zbliża się łagodne wzniesienie wody, ktoś unoszący się na wodzie w kole gumowym stwierdzi, że sąsiednie przedmioty poruszają się po okręgach. A więc mamy tu połączenie ruchów podłużnych i poprzecznych, co tylko zwiększa trudność przy opisie tych fal. Na większej głębokości ruchy odbywają się po mniejszych okręgach a jeszcze głębiej ustają zupełnie (rys. 51.9). Znalezienie prędkości takich fal jest zadaniem dość interesującym. Prędkość ta musi zależeć od gęstości wody, od przyspieszenia ziemskiego, które jest natężeniem siły wywołującej fale, i prawdopodobnie od długości fali oraz od głębokości wody. Jeżeli zajmiemy się przypadkiem nieskończonej głębokości, to prędkość nie będzie od niej zależała. Każdy wzór na prędkość fazową tych fal musi zawierać taką kombinację różnych czynników, która daje odpowiedni wymiar. Jeżeli spróbujemy wyprowadzić wzór na różne sposoby, przekonamy się, że istnieje tylko jedno powiązanie, wielkości g i /, które daje wymiar prędkości, mianowicie \j kg — nie zawiera ono w ogóle gęstości. W rzeczywistości wzór ten nie jest zupełnie ścisły, ale z dokładnej analizy dynamicznej tego zjawiska, w którą nie będziemy się tu wdawać, wynika, że wszystko się zgadza oprócz czynnika V 2n: Vtmz = \gk/2n (dla fal na wodzie wywołanych grawitacją). Ciekawe, że fale długie poruszają się szybciej od fal krótkich. Dlatego gdy pędząca motorówka wytwarza fale, po chwili do brzegu dobiega fala z rzadkimi chlapnięciami, a dopiero później z coraz częstszymi, ponieważ pierwsze dobiegające fale są falami długimi. Do brzegu wraz z upływem czasu dobiegają fale coraz krótsze, ponieważ ich szybkości zależą od pierwiastka kwadratowego z długości fali. Ktoś mógłby zaprotestować: „To wszystko nieprawda, do opisu zjawiska musimy użyć prędkości grupowej". Oczywiście miałby rację. Wzór na prędkość fazową nie mówi,
51-4. FALE POWIERZCHNIOWE 381 co przybędzie najpierw; możemy się o tym dowiedzieć tylko za pomocą prędkości grupowej. Musimy więc ją obliczyć. Należy tylko udowodnić, co potraktujemy jako zadanie dla czytelnika, że równa się ona połowie prędkości fazowej — wystarczy tylko przyjąć, że prędkość fazowa zależy od pierwiastka kwadratowego z długości fali. Prędkość grupowa także zmienia się jak pierwiastek kwadratowy z długości fali. Jak to się dzieje, że szybkość grupowa jest dwa razy mniejsza od szybkości fazowej? Gdy patrzyrpy na szereg fal powstałych za płynącym statkiem i zatrzymamy wzrok na wybranym grzbiecie fali, zauważymy, że przesuwa się on do przodu wewnątrz grupy, stopniowo słabnie i na przodzie zanika. Jednocześnie słaby początkowo grzbiet fali z tyłu cudownie i tajemniczo przesuwa się jego śladem i staje się coraz mocniejszy. Krótko mówiąc, fale poruszają się wewnątrz grupy, podczas gdy cała grupa biegnie z prędkością o połowę mniejszą od tej, z którą się fale przesuwają.. Ponieważ prędkości grupowe i fazowe nie są równe, fale wytwarzane przez poruszający się obiekt nie tworzą zwykłego stożka, lecz coś o wiele bardziej interesującego. Możemy to zobaczyć na fot. 51.10, na której widać fale wytworzone przez jakieś ciało poruszające się na wodzie. Zwróćmy uwagę, że wygląda to zupełnie inaczej niż w przypadku dźwięku, kiedy prędkość nie zależy od długości fali i czoła fali tworzą stożki rozchodzące się na boki. Tutaj mamy fale powstające za ciałem, z czołami, które są prostopadłe do ruchu ciała, a także małe fale po bokach biegnące pod innymi kątami. Całe to zjawisko można z powodzeniem zbadać korzystając tylko z tego, że prędkość fazowa jest proporcjonalna do pierwiastka kwadratowego z długości fali. Sztuka polega na tym, że rozkład fal jest stacjonarny względem (poruszającego się ze stałą prędkością) statku. Każdy inny rozkład fal oderwałby się od statku. Fale na wodzie, którymi zajmowaliśmy się do tej pory, były falami długimi, w których siła wywołująca drgania pochodziła od przyciągania ziemskiego. Natomiast dla bardzo krótkich fal na wodzie główną siłą wywołującą drgania jest włoskowatość, a więc istotną rolę odgrywa tu energia powierzchniowa, napięcie powierzchniowe. Prędkość fazowa fal wywołanych napięciem powierzchniowym równa się , 51.10. Ślad statku l>fliZ = \2nT/Xp (dla zmarszczek na wodzie), gdzie T oznacza napięcie powierzchniowe, a p — gęstość. Mamy tu dokładnie odwrotne zjawisko: w wypadku fal bardzo krótkich prędkość fazowa się zwiększa, gdy długość fali maleje. W ogólnie spotykanym wypadku, gdy jednocześnie działa grawitacja i napięcie powierzchniowe, otrzymujemy kombinację ■ obu tych prędkości: vfliZ = yjTkip + glk, gdzie k = 2n,Ji jest liczbą falową. Widzimy, że Wzór na prędkość fal na wodzie jest rzeczy-
382 SI- FALE X,cm 51.1). Wykres prędkości fazowej jako funkcji długości fali dla fali na wodzie wiście dość skomplikowany. Prędkość fazową jako funkcję długości fali pokazano na rys. 51.11. Dla bardzo krótkich fal jest ona bardzo duża, podobnie rzecz ma się dla fal bardzo długich istnieje więc minimalna prędkość, z jaką fale mogą się poruszać. Z naszego wzoru można też obliczyć prędkość grupową, która równa się f prędkości fazowej zmarszczek na wodzie i i fazowej prędkości fal wywołanych przyciąganiem ziemskim. Na lewo od minimum prędkość grupowa jest większa od prędkości fazowej, na prawo - mniejsza. Istnieje wiele interesujących zjawisk związanych z tym faktem. Przede wszystkim, ponieważ prędkość grupowa tak szybko rośnie, gdy długość fali maleje, to po wywołaniu jakiegoś zaburzenia można zaobserwować jego najwolniejszy kraniec poruszający się z minimalną prędkością odpowiadającą pewnej długości fali oraz czoło złożone z fali krótkiej i bardzo długiej biegnące z większą szybkością. Bardzo trudno dostrzec fale długie, ale w zbiorniku z wodą fale krótkie łatwo można obserwować. Widzimy więc, że zmarszczki na wodzie tak często podawane jako przykład fal są bardzo interesujące i bardzo złożone. Nie mają wcale wyraźnego czoła jak proste fale dźwiękowe lub świetlne. Główna fala składa się z małych zmarszczek, które biegną na przodzie. Ostre zaburzenie na wodzie nie wytwarza wyraźnego czoła fali ze względu na dyspersję. Pierwsze zawsze biegną fale bardzo drobne. Nawiasem mówiąc, gdy jakiś obiekt porusza się w wodzie z pewną szybkością, powstaje bardzo złożony układ fal, ponieważ wiele różnych fal porusza się z różnymi szybkościami. Można to łatwo pokazać na przykładzie półmiska z wodą. Widać wówczas, że najszybsze są bardzo drobne fale wywołane napięciem powierzchniowym. Istnieją też fale najwolniejsze, biegnące na końcu. Przechylając półmisek można stwierdzić, że w płytszym miejscu szybkość fali maleje. Gdy fala zbliża się pod pewnym kątem do linii maksymalnego spadku, załamuje się i dalej biegnie już zgodnie z tą linią. W ten sposób można pokazać różne rzeczy i przekonać się, że fale na wodzie są znacznie bardziej skomplikowane niż fale w powietrzu. Szybkość długich fal na wodzie z kołowym ruchem cząstek jest mniejsza w 51.12. Fale morskie
51-4. PALE POWIERZCHNIOWE 383 płytszej wodzie, a zwiększa się na wodzie głębokiej. Dlatego gdy fala zbliża się do plaży, gdzie jest coraz płyciej, porusza się coraz wolniej. Natomiast na głębszej wodzie fale są szybsze, obserwujemy więc zjawisko fal uderzeniowych. Teraz jednak, ponieważ fale są bardziej złożone, zmienia się czoło fali uderzeniowej i fale ,.przełamują się" w znany sposób pokazany na fot. 51.12. Tak właśnie wyglądają fale dobiegające do brzegu. W tych zjawiskach doskonale widoczna jest cała złożoność przyrody. Nikomu dotychczas nie udało się opisać, jaki kształt powinna mieć fala rozbijająca się o brzeg. Dość łatwo to zrobić dla fal małych, ale gdy stają się duże i rozbijają się o brzeg, wszystko staje się bardziej skomplikowane. Interesującą cechą fal wywołanych napięciem powierzchniowym można zaobserwować w zaburzeniach wywołanych przez jakiś przedmiot poruszający się w wodzie. Z punktu widzenia samego przedmiotu woda płynie do tyłu, a fale wokół niego mają po prostu taką szybkość, że pozostają zawsze przy nim. Podobnie wokół przedmiotu tkwiącego w strumieniu układ fal jest stacjonarny, a ich długości takie, że fale poruszają się z tą samą szybkością jak opływająca woda. Ale gdy prędkość grupowa jest mniejsza od prędkości fazowej, wówczas zaburzenia poruszają się w strumieniu do tyłu, ponieważ prędkość grupowa jest za mała i zaburzenie nie nadąża za strumieniem. Gdy prędkość grupowa będzie większa od prędkości fazowej, fale pojawią się przed przedmiotem. Gdy przyjrzymy się uważnie przedmiotom tkwiącym w strumieniu, zauważymy delikatne zmarszczki z przodu i długie fale za przedmiotem. Podobnie interesujące zjawiska można zaobserwować przy lejących się cieczach. Gdy na przykład dostatecznie szybko wylewa się mleko z butelki, to można zauważyć wiele linii przecinających z dwóch stron wylewający się strumień. Są to fale wywołane zaburzeniami na brzegu butelki i rozchodzące się w strudze mleka podobnie jak fale rozchodzące się od przedmiotu tkwiącego w strumieniu. Teraz jednak zjawiska te występują z obu stron strugi, co wytwarza krzyżujące się linie. Zbadaliśmy pewne interesujące własności fal oraz różne komplikacje wynikłe z zależności prędkości fazowej od długości fali, zależności szybkości fal od głębokości itd. Wszystko to wywołuje naprawdę złożone i dlatego tak interesujące zjawiska przyrody.
52 symetria praw fizyki 52-1. Operacje symetrii Tematem obecnego rozdziału jest symetria praw fizyki. Pewnymi cechami symetrii, wykazywanymi przez prawa fizyki, zajmowaliśmy się już poprzednio. Odbywało się to w związku z analizą wektorową (rozdz. 11), z teorią względności (rozdz. 16) i z obrotami (rozdz. 20). Dlaczego jednak mamy się zajmować symetrią? Przede wszystkim należy stwierdzić, że symetria jest dla umysłu ludzkiego czymś urzekającym i każdy lubi przedmioty czy wzory, które są symetryczne. Ciekawe, że wśród przedmiotów, które nas otaczają, często natrafiamy na takie, w których przyroda ujawnia najrozmaitsze cechy symetrii. Prawdopodobnie najbardziej symetrycznym obiektem, jaki można sobie wyobrazić, jest kula, i w przyrodzie aż roi się od ciał o kształcie kulistym — są nimi gwiazdy, planety, kropelki wody w chmurach. Kryształy znajdowane w skałach wykazują najrozmaitsze cechy symetrii. Tabela 52.1. Operacje symetrii przesunięcie w przestrzeni przesunięcie w czasie obrót o ustalony kąl jednostajna prędkość wzdłuż linii prostej (przekształcenie Lorentza) odwrócenie czasu odbicie przestrzenne wymiana jednakowych atomów faza kwaniowo-mechaniczna materia-antymateria (sprzężenie lub jednakowych ładunkowe) cząstek
52-1. OPERACJE SYMETRII 385 których badanie pozwala na uzyskanie wielu ważnych informacji o budowie ciał stałych. Nawet świat roślinny i zwierzęcy wykazuje pewien stopień symetrii, aczkolwiek symetria kwiatu czy pszczoły nie jest ani tak doskonała, ani nie ma tak podstawowego charakteru jak symetria kryształu. Nie chodzi nam tu jednak o to, że obiekty, na które natrafiamy w przyrodzie, są często symetryczne. Chcielibyśmy raczej zbadać jeszcze bardziej zadziwiające przykłady symetrii — symetrie, jakie wykazują podstawowe prawa rządzące zachowaniem świata fizycznego. Przede wszystkim, czym jest symetria? W jaki sposób prawo fizyki może być „symetryczne"? Problem zdefiniowania symetrii jest bardzo interesujący i — jak już wspomnieliśmy — Weyl podał dobrą definicję sprowadzającą się do tego, że jakaś rzecz jest symetryczna, jeżeli możemy coś z nią zrobić, a mimo to będzie wyglądać tak samo jak poprzednio. Symetryczną wazę, na przykład, możemy odbić w zwierciadle lub obrócić, a mimo to jej wygląd się nie zmieni. Chcemy się obecnie zastanowić, co można zrobić z prawami fizyki lub z sytuacją fizyczną, w jakiej dane doświadczenie się odbywa, aby wyniki pozostały takie same. Przegląd znanych operacji, pod których wpływem różne zjawiska fizyczne pozostają niezmienione, podano w tab. 52.1. 52-2. Symetria czasu i przestrzeni Pierwszą rzeczą, jaką moglibyśmy na przykład spróbować zrobić, jest przesunięcie zjawiska w przestrzeni. Gdy wykonamy doświadczenie w pewnym miejscu, a następnie zbudujemy takie samo urządzenie, gdzie indziej (lub przesuniemy pierwsze), wówczas cokolwiek zajdzie w pierwszym urządzeniu, powtórzy się w tym samym porządku czasowym i w drugim urządzeniu, jeżeli tylko udało się nam odtworzyć te same warunki. Przy tym, jak już wspomnieliśmy poprzednio, wszystkie cechy otoczenia, które mogłyby spowodować inny przebieg zjawiska, muszą również zostać odtworzone na nowym miejscu. Mówiliśmy już o tym, jak zdefiniować to, co należy uwzględnić w odtwarzanych warunkach; nie będziemy więc już do tych szczegółów powracać. Podobnie, obecnie uważamy, że przesunięcie w czasie nie będzie miało wpływu na prawa fizyki (tzn. o ile nam obecnie wiadomo; wszystko, co tu omawiamy, jest słuszne z zastrzeżeniem: „o ile nam obecnie wiadomo"!). Oznacza to, że jeżeli zbudujemy pewne urządzenie i puścimy je w jakiejś chwili w ruch, powiedzmy w czwartek o godzinie 1000, a następnie zbudujemy takie samo urządzenie i uruchomimy je w trzy dni później, lecz w takich samych warunkach, wówczas ruch obu urządzeń jako funkcja czasu będzie taki sam, niezależnie od czasu uruchomienia; oczywiście pod warunkiem, że istotne cechy otoczenia również zostały odpowiednio zmodyfikowane w czasie. Symetria ta oznacza bez wątpienia, że nie ma żadnej różnicy czy kupiliśmy akcje giełdowe obecnie, czy trzy miesiące temu! Musimy również uwzględnić różnice geograficzne, gdyż w różnych miejscach powierzchni Ziemi pewne charakterystyki ulegają zmianie. Jeśli na przykład mierzymy pole magnetyczne w pewnym obszarze, a następnie przesuniemy urządzenie w inne miejsce, może ono nie pracować dokładnie tak samo, ponieważ pole magnetyczne jest obecnie inne.Wiemy i
386 32. SYMETRIA PRAW FIZYJcj jednak, że dzieje się tak, ponieważ pole magnetyczne jest związane z Ziemią. Zdajemy sobie sprawę, że gdybyśmy przesunęli wraz z całym urządzeniem i Ziemię, nie spowodowałoby to żadnej różnicy w pracy przyrządów. Inną sprawą, o której mówiliśmy już dość szczegółowo, były obroty w przestrzeni: jeżeli przyrząd obrócimy o pewien kąt, będzie pracować tak jak poprzednio, pod warunkiem, że wraz z nim obrócimy wszystko, co jest istotne. Problem symetrii względem obrotu w przestrzeni omawialiśmy już właściwie w rozdz. 11. (t. I, cz. 1). Wprowadziliśmy wówczas metodę matematyczną, zwaną analizą wektorową, pozwalającą na zgrabne podejście do tych spraw. Na wyższym szczeblu wtajemniczenia mamy jeszcze inny przykład symetrii — symetrię względem prędkości jednostajnej, skierowanej wzdłuż linii prostej. To znaczy, mamy do czynienia z dość niezwykłym faktem, gdy pracujące w pewien sposób urządzenie umieścimy w pojeździe, który wraz z całym — mającym w tym wypadku znaczenie — otoczeniem wprawimy następnie w ruch z prędkością jednostajną po linii prostej i obserwując wówczas zjawiska zachodzące wewnątrz pojazdu, nie stwierdzimy żadnej różnicy; wszystkie prawa fizyki będą miały swą poprzednią postać. Wiemy nawet, jak wypowiedzieć to fachowo, mianowicie: wszystkie równania matematyczne wyrażające prawa fizyczne muszą pozostać niezmienione pod wpływem przekształcenia Lorentza. Nawiasem mówiąc, właśnie studia nad teorią względności zwróciły uwagę fizyków na problem symetrii praw fizycznych. Wszystkie rozpatrywane powyżej przykłady symetrii miały charakter geometryczny; czas i przestrzeń są mniej więcej tym samym. Istnieje jednak inny rodzaj symetrii. Mamy na przykład symetrię opisującą możliwość zastąpienia jednego atomu przez drugi atom tego samego typu; inaczej mówiąc, istnieją atomy tego samego typu. Istnieją grupy atomów, wśród których można wymieniać dowolne pary miejscami, i nie spowoduje to żadnej zmiany — atomy są jednakowe. Cokolwiek zrobi atom tlenu pewnego typu, to samo zrobi atom tlenu tego samego typu. Mógłby ktoś powiedzieć: „To śmieszne, przecież to jest właśnie definicja identyczności!" Można to traktować jedynie jako definicję, lecz wówczas dalej nie będziemy wiedzieć, czy istnieją jakieś „atomy tego samego typu". Chodzi właśnie o to, że jest ich wiele. A zatem powiedzenie, że nie ma żadnej różnicy, gdy zastąpimy jeden atom innym atomem tego samego typu, ma sens. Tak zwane cząstki elementarne, z których atomy są zbudowane, są również w powyższym sensie cząsteczkami ident>cz- nymi - wszystkie elektrony są takie same; wszystkie protony są takie same; wszystkie dodatnie jony są takie same; i tak dalej. Po tak drugiej liście operacji, których można dokonać nie zmieniając zjawiska, mógłby ktoś sądzić, że praktycznie można zrobić niemal wszystko; pokażmy więc na kilku prz>- kładach, że tak nie jest. Przypuśćmy, że pytamy: „Czy prawa fizyki są symetryczne względem zmiany skali?" Przyjmijmy, że budujemy jakieś urządzenie, a następnie jego odpowiednik, którego każda część jest 5 razy większa i pytamy, czy nowe urządzenie będzie działać dokładnie tak samo. Odpowiedź w tym przypadku brzmi: nie1. Tak na przykład długość fali świetlnej emitowanej przez zajmujące pewien obszar atomy sodu nie jest 5 razy mniejsza od długości fali świetlnej emitowanej przez atomy sodu, które zajmują obszar 5 razy większy, lecz jest taka sama. Stosunek długości fali do rozmiarów urządzenia wys> łającego zmienia się więc.
52-2. SYMETRIA CZASU 1 PRZESTRZENI 387 Inny przykład: od czasu do czasu widzimy w amerykańskich dziennikach zdjęcia ogromnych katedr wykonanych z samych zapałek, wspaniałe dzieła sztuki, których autorami są emerytowani faceci zajmujący się klejeniem. Katedry te są nawet bogatsze i wspanialsze od prawdziwych. Jeżeli wyobrazimy sobie, że taką drewnianą katedrę wykonano w prawdziwych rozmiarach, zaraz zobaczymy, na czym polega kłopot; konstrukcja nie wytrzymałaby i wszystko by runęło, ponieważ powiększone zapałki nie byłyby wystarczająco wytrzymałe. „No tak — mógłby ktoś powiedzieć — wiemy jednak również, że mamy pewien wpływ z zewnątrz, należy więc i to odpowiednio zmienić!" Ponieważ chodzi nam o odporność przedmiotu na ciążenie, trzeba najpierw rozpatrywać model katedry z prawdziwych zapałek oraz prawdziwą Ziemię. To, jak wiemy, jest stabilne. Następnie powinniśmy rozpatrywać większą katedrę i większą Ziemię. Jednak wówczas sytuacja się pogarsza, ponieważ grawitacja wzrasta jeszcze bardziej! Dzisiaj zdajemy sobie oczywiście sprawę, że zależność zjawiska od skali spowodowana jest atomową budową materii. Z pewnością, jeżeli zbudujemy przyrząd tak mały, że składający się tylko z 5 atomów, nie będziemy mogli go dowolnie zwiększać ani zmniejszać. Skala pojedynczego atomu nie jest wcale dowolna — jest dobrze określona. To, że prawa fizyki zmieniają się przy zmianie skali, odkrył już Galileusz. Zdawał on sobie sprawę z tego, że wytrzymałość materiałów nie jest dokładnie proporcjonalna do ich rozmiarów. Własność tę, o której właśnie mówiliśmy na przykładzie katedry z zapałek, zilustrował rysując dwie kości: pierwsza z nich była kością psa, podaną z uwzględnieniem właściwych proporcji pozwalających na wytrzymanie jego ciężaru, druga zaś była kością „super-psa", powiedzmy 10-krotnie lub 100-krotnie większego. Kość ta była ogromna, jednakże miała zupełnie inne proporcje. Nie wiemy, czy Galileusz wyciągnął ostateczny wniosek, że prawa przyrody muszą mieć określoną skalę, jednakże był pod takim wrażeniem swego odkrycia, że uważał je za równie ważne jak odkrycie praw ruchu, oba zamieścił bowiem w tej samej książce zatytułowanej O dwóch nowych naukach. A oto inny dobrze znany przykład braku symetrii praw fizyki: w obracającym się ze stałą prędkością kątową układzie nie mamy tych samych praw co w układzie, który się nie obraca. Jeśli wykonamy jakieś doświadczenie, a następnie zapakujemy cały ekwipunek do pojazdu kosmicznego, który będzie wirował w pustej przestrzeni ze stałą prędkością kątową, urządzenie nie będzie działało tak jak poprzednio. Jak wiemy, poszczególne elementy ekwipunku zostaną wyrzucone na zewnątrz; spowodują to siły odśrodkowe, siły Coriolisa itd. Używając na przykład wahadła Foucaulta możemy bez wyglądania na zewnątrz stwierdzić, że Ziemia się obraca. Z kolei wspomnimy o bardzo interesującej symetrii, która jest z pewnością fałszywa, mianowicie o odwracalności w czasie. Prawa fizyki najwyraźniej nie mogą być odwracalne w czasie, gdyż jak wiemy, wszelkie codzienne zjawiska odbywające się w dużej skali są nieodwracalne. Obecnie jednak jesteśmy przekonani, że ta nieodwracalność jest związana z dużą liczbą cząstek uczestniczących w zjawisku, i gdybyśmy mogli śledzić pojedyncze cząsteczki, nie potrafilibyśmy powiedzieć, czy cały mechanizm porusza się do przodu, czy do tyłu. Wypowiedzmy to bardziej precyzyjnie: budujemy mały przyrząd, w którym znamy ruch każdego z atomów; możemy śledzić jak każdy z nich sobie drga. Następnie budujemy drugi taki sam przyrząd, który jednak rozpoczyna swój ruch w warunkach, w których
JOB 52. SYMETRIA PRANV FIZYKI skończył swój ruch pierwszy przyrząd, przy czym kierunek wszystkich prędkości został zmieniony. Ruchy zachodzące w nowym przyrządzie będą wówczas takie same, lecz dokładnie w kierunku przeciwnym. Ujmując to jeszcze inaczej, możemy powiedzieć, że jeżeli zrobimy wystarczająco szczegółowy film pokazujący to, co się dzieje we wnętrzu jakiejś substancji, i wyświetlimy go na ekranie w kierunku wstecznym, żaden fizyk nie będzie mógł powiedzieć: „Tu jest coś nie w porządku, to jest niezgodne z prawami fizyki". Oczywiście, jeżeli nie będziemy widzieli wszystkich szczegółów, sytuacja nie będzie budzić żadnych wątpliwości. Gdy zobaczymy, że jajko spada na ziemię, jego skorupka rozbija się itd., z pewnością powiemy: „To jest proces nieodwracalny, gdyż jeśli puścilibyśmy film od końca, widzielibyśmy, jak wszystkie skorupki zlepiają się, dając znów całe jajko, a to byłoby oczywiście śmieszne!" Gdy jednak rozważamy oddzielne atomy, prawa, którym podlegają, wyglądają na całkowicie odwracalne. Odkryć tę symetrię było oczywiście znacznie trudniej niż pozostałe, niemniej jednak prawdą jest, że podstawowe prawa fizyki rządzące atomami i cząsteczkami są całkowicie odwracalne w czasie! 52-3. Symetria a zasady zachowania Już teraz własność symetrii praw fizycznych wydaje się bardzo ciekawa, lecz jak się okazuje, staje się ona jeszcze ciekawsza i porywająca, gdy przechodzimy do mechaniki kwantowej. Z przyczyn, których na poziomie obecnych rozważań nie umiemy wystarczająco jasno podać (większość fizyków uważa to zresztą wciąż za coś niezwykłego), w mechanice kwantowej mamy do czynienia z niezwykle pięknym i doniosłym faktem: każdej zasadzie symetrii odpowiada zasada zachowania; istnieje ściśle określony związek między zasadami zachowania a symetriami praw fizyki. Obecnie możemy to jedynie stwierdzić bez jakiejkolwiek próby wyjaśnienia. Okazuje się, na przykład, że to, iż prawa fizyki są symetryczne względem przesunięcia w przestrzeni, po dodaniu zasad mechaniki kwantowej jest równoważne zasadzie zachowania pędu. To zaś, że prawa są symetryczne względem przesunięcia w czasie, oznacza w mechanice kwantowej, że zachowana jest energia. Niezmienniczość względem obrotów przestrzennych o stały kąt odpowiada zasadzie zachowania momentu pędu. Powiązania te są bardzo interesujące i piękne, jedne z najpiękniejszych i mające najdonioślejsze znaczenie w całej fizyce. W mechanice kwantowej występuje również wiele symetrii, które nie mają swojego odpowiednika klasycznego i których nie można opisać za pomocą języka fizyki klasycznej. Oto jedna z nich: Jeżeli y/ jest amplitudą dla pewnego procesu, to jak wiemy, kwadrat modułu y/ jest prawdopodobieństwem zajścia tego procesu. Gdyby jednak ktoś inny wykonywał swoje rachunki-nie z funkcją yi, lecz z y/' różniącą się jedynie fazą (niech A będzie pewną stałą i pomnóżmy stare y/ przez e"1), wówczas kwadrat modułu y/', będący prawdopodobieństwem zdarzenia, równałby się kwadratowi modułu yr. ¥' = Veu; H2 = H2- (52.1)
52-3. SYMETRIA A ZASADY ZACHOWANIA 389 A zatem prawa fizyczne pozostają niezmienione, jeżeli faza funkcji falowej zostanie przesunięta o dowolną stałą. To właśnie ta inna symetria. Prawa fizyki muszą mieć taki charakter, aby przesunięcie kwantowomechanicznej fazy nie powodowało żadnej różnicy Jak właśnie wspomnieliśmy, w mechanice kwantowej każdej symetrii odpowiadają zasady zachowania. Wydaje się, że zasadą zachowania, która jest związana z kwantowomechanicz- ną fazą, jest zasada zachowania ładunku elektrycznego. Wszystko to razem jest bardzo ciekawe! 52-4. Odbicia zwierciadlane Następnym zagadnieniem, którym będziemy się zajmować przez większą część tego rozdziału, jest symetria względem odbicia przestrzennego. Pytamy: czy prawa fizyki są symetryczne względem takiego odbicia? Możemy podejść do tego problemu w następujący sposób. Przypuśćmy, że budujemy jakieś urządzenie, powiedzmy zegar ze wskazówkami, cyframi i dużą liczbą kółek; zegar nasz tyka, chodzi, wszystko w nim działa sprawnie. Następnie spójrzmy na nasz zegar w zwierciadle. Nie ograniczamy się jednak do samego spojrzenia, lecz staramy się zbudować zegar, który wygląda dokładnie tak, jak odbicie zwierciadlane pierwszego. Za każdym razem, gdy w zegarze pierwszym mamy śrubę prawoskrętną, umieszczamy w odpowiednim miejscu drugiego zegara śrubę lewoskrętną; tam, gdzie na tarczy jednego zegara mamy cyfrę VIII. umieszczamy HIV na tarczy drugiego; każdą sprężynę skręconą w jedną stronę w pierwszym zegarze, skręcamy w przeciwną w zegarze odbitym. Po skończeniu całej pracy mamy więc dwa zegary, oba fizyczne, które pozostają w takim związku jak przedmiot i jego odbicie zwierciadlane, aczkolwiek, co podkreślamy, oba są prawdziwymi, materialnymi obiektami. Pytamy obecnie: Czy jeżeli oba zegary zostaną uruchomione w takich samych warunkach i ich sprężyny zostaną równie mocno skręcone, zegary te będą odtąd chodzić tak, jakby jeden był dokładnym odbiciem zwierciadlanym drugiego? (Jest to pytanie o charakterze fizycznym, a nie filozoficznym.) Nasza intuicja dotycząca praw fizyki podpowiada nam odpowiedź twierdzącą. Podejrzewamy, przynajmniej w przypadku tych zegarów, że odbicie przestrzenne jest jedną z symetrii praw fizycznych, że jeżeli zmienimy wszystko z „prawego" na „lewe", a poza tym pozostawimy takie samo, nie będziemy mogli stwierdzić różnicy. Przypuśćmy więc na chwilę, że to prawda. Jeżeli to prawda, to przy pomocy żadnego zjawiska fizycznego nie można rozróżnić „prawego" i „lewego", podobnie jak na przykład nie można przy pomocy zjawiska fizycznego zdefiniować absolutnej prędkości. Nie powinno więc być możliwe zdefiniowanie przy pomocy żadnego zjawiska fizycznego, co rozumiemy przez „w prawo", a co przez „w lewo". Oczywiście, świat nie musi być symetryczny. Posługując się na przykład tym, co nazwiemy „geografią", z pewnością można zdefiniować stronę, prawą. Jeżeli znajdujemy się w Nowym Orleanie i patrzymy w kierunku Chicago, Floryda jest po naszej prawej stronie (gdy nasze stopy są na ziemi!). Przy pomocy pojęć geograficznych możemy więc zdefiniować „w prawo" i „w lewo". Rzecz jasna, dowolny układ nie musi wykazywać symetrii, o której tu mówimy; chodzi o to, czy prawa rządzące tym układem są symetryczne; innymi słowy,
390 52. SYMETRIA PRAW FIZYKI czy byłoby sprzeczne z prawami fizyki, gdybyśmy mieli kulę w rodzaju Ziemi, na niej „lewą powierzchnię" i kogoś podobnego do nas, patrzącego w kierunku miasta w rodzaju Chicago z miejsca w rodzaju Nowego Orleanu, lecz wszystko byłoby odwrócone: Floryda znalazłaby się więc po lewej stronie. Najwyraźniej nie wydaje się to niemożliwe ani sprzeczne z prawami fizyki. Nasza definicja „prawego" i „lewego" nie powinna być również zależna od historii. Łatwy bowiem sposób rozróżnienia między kierunkiem prawym a lewym polega na wejściu do sklepu z artykułami metalowymi i wybraniu na chybił trafił jakiejś śruby. Wszystko przemawia za tym, że będzie to śruba prawoskrętna (nie musi tak oczywiście być, lecz prawdopodobieństwo znalezienia śruby lewoskrętnej jest znacznie mniejsze). Związane to jest z historią, konwencjami, z obecnym wyglądem poszczególnych przedmiotów. I znów nie mamy tu do czynienia z podstawowymi prawami. Jak sobie dobrze zdajemy sprawę, każdy mógłby się zabrać do produkowania śrub lewoskrętnych! Musimy więc spróbować znaleźć jakieś zjawisko, w którym kierunek „prawy" występuje w sposób zasadniczy. Następna możliwość, jaką rozważymy, to skręcanie płaszczyzny polaryzacji światła po przejściu przez roztwory wodne cukru. Jak się dowiedzieliśmy z rozdz. 33, płaszczyzna ta zostaje skręcona w prawo w pewnym roztworze. Jest to więc sposób zdefiniowania strony prawej, gdyż możemy rozpuścić trochę cukru w wodzie i płaszczyzna polaryzacji przesunie się w prawo. Lecz użyty przez nas cukier jest pochodzenia roślinnego, a gdybyśmy spróbowali wyprodukować cukier sztucznie, stwierdzilibyśmy, że nie skręca on płaszczyzny polaryzacji! Gdybyśmy jednak do tego wyprodukowanego sztucznie cukru, który nie skręcał płaszczyzny polaryzacji, wpuścili bakterie (żywią się one niektórymi rodzajami cukru), a następnie odsączyli je, stwierdzilibyśmy, że trochę cukru pozostało (prawie połowa tego, co było poprzednio) i że obecnie skręca on płaszczyznę polaryzacji, lecz w stronę przeciwną] Wydaje się to bardzo tajemnicze, lecz jest łatwe do wyjaśnienia. Weźmy inny przykład. Jedną z substancji wspólnych wszystkim istotom żywym i odgrywających zasadniczą rolę w procesach życiowych są białka. Składają się one z łańcuchów aminokwasów. Model takiego aminokwasu pokazuje fot. 52.1. Aminokwas ten nosi nazwę alaniny i jego cząsteczka jest zbudowana tak jak przedstawia to fot. 52. la, jeżeli cząsteczka ta jest wydzielona z białka materii żywej. Gdybyśmy natomiast spróbowali wyprodukować alaninę z dwutlenku węgla, etanu i amoniaku {można ją zbudować, nie jest to skomplikowana cząsteczka), stwier- c, , , , , . ..._,,- dzilibyśmy, że otrzymaliśmy w równej 52.1. a) L-alamna i b) D-alamna ' J J , ilości cząsteczki, których modele przedstawia fot. 52.la i fot. 52.Ib! Pierwszą cząsteczkę, tę, którą wydzielono z materii żywej, nazywamy L-alaniną. Druga, -^ która jest chemicznie taka sama, w tym ""* sensie, że ma takie same i tak samo połączone atomy, jest cząsteczką „pra" wą" w porównaniu z „lewą" L-alaniną i nazywamy ją D-alaniną. Gdy produkujemy alaninę w laboratorium uży-
52-4. ODBICIA ZWIERCIADLANE 391 wając prostych gazów, otrzymujemy mieszankę obu cząsteczek występujących w równych ilościach. Jednakże istoty żywe spożytkowują jedynie L-alaninę. (Nie jest to całkiem zgodne z prawdą. Gdzieniegdzie istoty żywe robią specjalny użytek z D-alaniny, jest to jednak bardzo rzadkie. Wszystkie białka wykorzystują wyłącznie L-alaninę.) Jeżeli więc wyprodukujemy oba rodzaje cząsteczek i tą mieszanką nakarmimy jakieś zwierzę, które lubi „jeść" lub jakoś wykorzystywać alaninę, nie będzie mogło ono użyć D-alaniny, użyje więc wyłącznie L-alaninę. To właśnie stało się z naszym cukrem — gdy bakterie spożyły cukier, który im odpowiadał, pozostał tylko cukier „nieodpowiedni" („lewy" cukier jest słodki, ale inaczej niż „prawy")! Wygląda więc na to, jak gdyby zjawiska życiowe pozwalały na rozróżnienie między „prawym" a-„lewym" lub jak gdyby chemia pozwalała na to rozróżnienie, gdyż obie cząsteczki są pod względem chemicznym różne. Tak jednak nie jest! Wszelkie pomiary fizyczne, które można wykonać, np. pomiar energii, szybkości reakcji chemicznych itd., dają takie same wyniki dla obu cząsteczek, jeżeli tylko wszystko inne jest również odbiciem zwierciadlanym. Jedna cząsteczka będzie obracać światło w prawo, a druga będzie obracać je w lewo, przy czym odchylenie będzie dokładnie takie samo. Jeśli więc chodzi o fizykę, oba aminokwasy są równoprawne. Tak jak rozumiemy te sprawy obecnie, podstawy równania Schródingera zapewniają, że obie cząsteczki będą się zachowywać w ściśle odpowiedni sposób i jedna będzie „prawa", a druga „lewa". Niemniej jednak w zjawiskach życiowych tylko jedna z nich występuje! Przyjmuje się, że przyczyna tego jest następująca. Przypuśćmy, że w jakiś sposób życie znalazło się w pewnej chwili w takim stanie, że wszystkie białka pewnych istot żywych mają „lewe" aminokwasy, podobnie „lewe" są enzymy, jak i każda inna ich substancja. Gdy więc enzymy trawienne starają się zmienić substancje chemiczne na pożywienie, niektóre z tych substancji „pasują" do enzymów, a inne nie (jak w bajce o Kopciuszku i pantofelku, z tym że to, co obecnie sprawdzamy, jest „stopą lewą"). O ile nam wiadomo, możemy w zasadzie zbudować żabę, w której każda cząsteczka jest „odwrócona": wygląda wszystko jak w „lewym", zwierciadlanym obrazie prawdziwej żaby; mamy więc „lewą" żabę. Ta „lewa" żaba przez jakiś czas będzie się miała zupełnie dobrze, następnie jednak nie znajdzie niczego do jedzenia, jej enzymy bowiem są tak zbudowane, że gdy połknie muchę, nie będzie mogła jej strawić. Mucha ma dla niej nieodpowiedni „rodzaj" aminokwasów (chyba, że damy żabie „lewą" muchę). O ile nam wiadomo, procesy chemiczne i życiowe przebiegałyby w ten sam sposób, gdyby wszystko zostało odwrócone. Jeżeli życie jest zjawiskiem całkowicie fizycznym i chemicznym, to możemy zrozumieć, że wszystkie białka są zbudowane tylko w jeden sposób, przyjmując jedynie, że na samym początku powstało przypadkowo trochę żywych cząsteczek i kilka z nich nie uległo zniszczeniu. Gdzieś, kiedyś jakaś cząsteczka organiczna była skręcona w pewien sposób i począwszy od tego momentu kierunek „prawy" zaczął się rozwijać w naszym zakątku Wszechświata. Szczególny przypadek historyczny, o którym mowa, nie miał charakteru symetrycznego i od tego czasu ta jednostronność wciąż się odtwarzała i rozszerzała. Doszedłszy do obecnego stanu nie może już oczywiście ulec zmianie wszystkie enzymy trawią tylko pewne substancje i wytwarzaj;} jedynie pewne: gdy dwutlenek węgla.
392 52. SYMETRIA PRAW FIZYKI para wodna itd. dostają się do liści roślin, enzymy, które wytwarzają cukier, wyprodukują go skręcony w jedną stronę, ponieważ same są skręcone. Jeżeli pojawiłby się jakiś nowy rodzaj wirusa czy czegoś żywego, przetrwałby, jeżeli mógłby „spożywać" już istniejącą żywą materię. Musiałby więc być taki sam jak ona. Liczba „prawych" cząsteczek nie musi być zachowana, możemy ją stale zwiększać. Wnioskujemy więc, że zjawiska życiowe nie wskazują na brak symetrii praw fizycznych, wskazują natomiast na wspólnotę i jednakowy początek, w sensie opisanym powyżej, wszystkich istot żywych na Ziemi. 52-5. Wektory i pseudowektory Idziemy obecnie dalej. W fizyce spotykamy się często z regułami „prawej" lub „lewej" ręki. Gdy na przykład zajmowaliśmy się analizą wektorową, trzeba było uwzględnić pojęcie prawoskrętności, aby otrzymać właściwy kierunek momentu pędu, momentu siły, pola magnetycznego itd. Siła działająca na poruszający się w polu magnetycznym ładunek równa się np. F=q\xB. Czy jednak w określonej sytuacji, w której znamy wielkości F, v i B już samo to równanie nie wystarcza do zdefiniowania prawoskrętności? Gdy cofniemy się trochę i spojrzymy, skąd się brały nasze wektory, zobaczymy, że „reguła prawej ręki" była po prostu konwencją; był to jedynie pewien chwyt. Wielkości w rodzaju momentu pędu czy prędkości kątowej nie były wcale wektorami! Wszystkie one są w jakiś sposób związane z pewną płaszczyzną i tylko dlatego, że przestrzeń ma trzy wymiary, możemy je powiązać z kierunkiem prostopadłym do tej płaszczyzny. Z dwu możliwych kierunków wybieramy kierunek prawy. Jeśli więc prawa fizyki są symetryczne, powinniśmy stwierdzić, że gdyby jakiś demon zakradł się do wszystkich fizycznych laboratoriów i zastąpił słowo „prawy" przez „lewy" we wszystkich książkach, w których dane są „reguły prawej ręki", i musielibyśmy używać „reguł lewej ręki", nie spowodowałoby to jakiejkolwiek różnicy w prawach fizycznych. Dostarczmy jakiejś ilustracji. Mamy dwa rodzaje wektorów. Pierwsze z nich to „uczciwe" wektory, np. przesunięcie Ar w przestrzeni. Jeśli w naszym urządzeniu mamy jakiś element tu, a coś innego tam, to w urządzeniu zwierciadlanym będziemy mieli obraz tego elementu i obraz czegoś innego i jeżeli narysujemy wektor od „elementu" do czegoś 52.2. Wektor położenia i jego odbicie zwierciadlane
52-5. WEKTORY 1 PSEUDOWEKTORY 393 U) Al m 52.3. Obracające się koło i jego odbicie zwierciadlane. Jak widzimy, „wektor" prędkości kątowej nie zmienia swego kierunku innego, jeden wektor będzie odbiciem zwierciadlanym drugiego (rys. 52.2). Strzałka wektorowa zmienia swój kierunek, podobnie odwraca się cała przestrzeń; takie wektory nazywamy wektorami biegunowymi. Jednak drugi rodzaj wektorów, które są związane z obrotami, ma inny charakter. Przypuśćmy na przykład, że w przestrzeni trójwymiarowej obraca się jakieś ciało, jak to widzimy na rys. 52.3. Jeśli teraz spojrzymy na to w zwierciadle, obrót będzie wyglądał tak jak to pokazano, mianowicie jak odbicie zwierciadlane pierwszego obrotu. Ponieważ zgodziliśmy się opisywać obrót zwierciadlany przy pomocy tych samych praw, mamy „wektor", który przy odbiciu się nie zmienia, lecz jest odwrócony względem wektorów biegunowych i względem osi współrzędnych. Taki wektor nazywamy pseudowektorem lub wektorem osiowym. Jeśli więc prawo symetrii względem odbicia jest w fizyce słuszne, to wszelkie równania muszą mieć taki charakter, że gdy zmienimy znak każdego wektora osiowego i każdego iloczynu wektorowego dwu wektorów biegunowych — to właśnie odpowiada odbiciu — nic się nie stanie. Gdy na przykład piszemy wzór mówiący, że moment pędu równa się L = rxp, równanie to jest w porządku, ponieważ gdy przejdziemy do układu lewo- skrętnego, musimy zmienić znak L, lecz r i p pozostaną takie same; znak iloczynu wektorowego zostaje zmieniony, ponieważ musimy przejść od reguł prawoskrętnych do lewo- skrętnych. Weźmy inny przykład. Wiemy, że siła działająca na ładunek poruszający się w polu magnetycznym równa się F=cvxB. Jeśli przejdziemy z układu prawoskrętnego do lewoskrętnego, to ponieważ v i F są wektorami biegunowymi, zmiana znaku iloczynu wektorowego musi być skompensowana przez zmianę znaku B, co oznacza, że B musi być pseudowektorem. Innymi słowy, jeśli dokonamy takiego odbicia, B musi przejść w — B. Jeśli więc zmienimy skrętność naszego układu współrzędnych, musimy również zmienić bieguny magnesu. Zobaczmy na przykładzie, dlaczego tak się dzieje. Przypuśćmy, że mamy dwa magnesy, jak to pokazano na rys. 52.4. W pierwszym magnesie cewka jest nawinięta w pewien sposób i prąd biegnie w określonym kierunku. Drugi magnes wygląda jak odbicie pierwszego w zwierciadle — cewka jest nawinięta w odwrotnym kierunku, wszystko co w niej zachodzi jest dokładnie odwrócone, a prąd biegnie tak, jak to pokazano na rysunku. Z praw dotyczących powstawania pola magnetycznego, których jeszcze oficjalnie nie znamy, ale których z pewnością uczyliście się w szkole średniej, wynika więc, że pole
394 52. SYMETRIA PRAW FIZYKI __ < < < ■ ) ■ ) * ) s < - ) < ) N B' a' 52.4. Magnes i jego odbicie zwierciadlane magnetyczne jest takie, jak to pokazano. W jednym przypadku biegun jest biegunem południowym, w drugim natomiast prąd biegnie w przeciwnym kierunku i kierunek pola magnetycznego jest odwrócony — mamy biegun północny. Widzimy więc, że przy przejściu od prawego do lewego musimy rzeczywiście zmienić północ na południe! Nie przejmujemy się jednak zmianą północy na południe; to przecież tylko konwencja. Mówmy o zjawiskach. Przypuśćmy na przykład, że w pierwszym polu mamy elektron wchodzący pod kątem prostym w stronicę książki. Jeżeli użyjemy wzoru na siłę, v x B (pamiętajmy, że ładunek jest ujemny), stwierdzimy, że zgodnie z prawami fizycznymi elektron będzie zbaczał w zaznaczonym kierunku. Zjawisko polega więc na tym, że w pobliżu cewki z płynącym w określonym kierunku prądem elektron biegnie w pewien sposób — to jest fizyka, niezależnie od tego, jakich nazw użyjemy. Zróbmy teraz takie samo doświadczenie w zwierciadle: wysyłamy elektron w tym samym kierunku i jeśli użyjemy teraz tych samych praw, siła będzie odwrócona, ale to właśnie bardzo dobrze, ponieważ wówczas jeden ruch jest odbiciem zwierciadlanym dru- giego\ 52-6. Która ręka jest prawa? Okazuje się więc, że przy badaniu dowolnego zjawiska mamy zawsze do czynienia z dwiema regułami prawej ręki lub z ich parzystą liczbą. Ostateczny wynik jest więc taki, że zjawisko zawsze przebiega symetrycznie. Krótko mówiąc, nie możemy odróżnić prawego od lewego, jeżeli nie umiemy odróżnić północy od południa. Mogłoby się jednak wydawać, że umiemy rozpoznać północny biegun magnesu. I tak na przykład, północny biegun igły kompasowej to ten, który skierowany jest na północ. Lecz oczywiście jest to znów własność lokalna związana z geografią Ziemi; jest to coś podobnego do mówienia, w jakim kierunku jest Chicago, tak że to się nie liczy. Jeżeli przyglądaliśmy się igłom kompasowym, mogliśmy zauważyć, że biegun wskazujący północ ma pewien niebieski
52-6. KTÓRA RĘKA JEST PRAWA? 395 odcień. Lecz jest tak po prostu dlatego, że ktoś go tak pomalował. Wszystko to są lokalne, konwencjonalne kryteria. Gdyby jednak magnes miał takie własności, że po uważnym przyjrzeniu się moglibyśmy dostrzec na przykład wyrastające z bieguna północnego maleńkie wąsiki, których nie byłoby na biegunie południowym, i byłoby to zawsze słuszne, lub gdyby istniał jakiś inny jednoznaczny sposób odróżnienia bieguna północnego magnesu od bieguna południowego, wówczas moglibyśmy powiedzieć, z którym z dwu przypadków mamy do czynienia i byłby to koniec prawa głoszącego symetrię względem odbicia. Aby zilustrować cały problem jeszcze jaśniej, wyobraźmy sobie, że rozmawiamy przez telefon z Marsjaninem lub z kimś innym bardzo od nas oddalonym. Nie wolno nam posłać mu jakiejkolwiek próbki do zbadania. Gdybyśmy na przykład mogli przesłać światło, moglibyśmy wybrać światło spolaryzowane w kierunku prawym i powiedzieć: „To jest światło spolaryzowane w kierunku prawym — wystarczy, jeśli mu się dobrze przyjrzysz". Jednak nie możemy mu niczego przekazać, możemy z nim jedynie rozmawiać. Znajduje się on poza tym bardzo daleko lub w jakimś dziwnym miejscu i nie jest w stanie zobaczyć niczego, co my widzimy. Nie możemy na przykład powiedzieć: „Spójrz na Wielką Niedźwiedzicę i przyjrzyj się jak poszczególne gwiazdy są ustawione. Przez kierunek „prawy" rozumiemy..." Wolno nam tylko do niego telefonować. Przypuśćmy, że chcemy naszemu rozmówcy opowiedzieć o nas jak najwięcej. Oczywiście zaczynamy od zdefiniowania liczb i mówimy: „Tik, tik — dwa, tik, tik, tik — trzy...", tak że stopniowo zaczyna on rozumieć wiele słów. Po jakimś czasie możemy się z nim nieźle zaznajomić i prawdopodobnie spyta nas: „Jak też wyglądacie chłopcy"? Zaczynamy więc opis i mówimy: „No cóż, mamy 1 metr 80 wzrostu" Na to on: „Chwileczkę, co to jest 1 metr 80"? Czy można mu to wyjaśnić? Oczywiście! Mówimy: „Znasz średnicę atomu wodoru - mamy 17 000 000 000 atomów wodoru wzrostu!". Jest to możliwe, ponieważ prawa fizyczne nie są niezmiennicze względem zmiany skali, a zatem możemy zdefiniować absolutną długość. Określamy więc rozmiary naszego ciała i opisujemy jegc ogólny kształt: ma ono długie wyrostki, na których końcach znajduje się 5 guzów itd Kończymy wreszcie nasz opis zewnętrzny, prawdopodobnie bez natrafienia na jakie: szczególne trudności. Nasz rozmówca w miarę naszego opisu sporządza sobie nawel odpowiedni modeł i mówi: „No, no, przystojni z was chłopcy; powiedzcie teraz co tei macie w środku"? Zaczynamy więc opisywać nasze różne organa wewnętrzne, docho dzimy do serca, starannie opisujemy jego kształt i mówimy: „Umieść serce z lewej strony" Na to on: „Hm, z lewej strony"? Nasz problem polega więc obecnie na wyjaśnieniu mi gdzie ma umieścić serce; wiemy przy tym, że nie może on zobaczyć czegokolwiek, co rrrj widzimy, i -nie możemy mu posłać jakiejkolwiek próbki czegoś, co uważamy za „prawe' — żadnego standardowego prawego obiektu. Czy można to zrobić? 52-7. Parzystość nie jest zachowana! Okazuje się, że prawa grawitacji, prawa elektryczności i magnetyzmu, jak równie; prawa sił jądrowych spełniają bez wyjątku zasadę symetrii względem odbicia, praw tyci
396 52 SYMETRIA PRAW FIZYKI 52.5. Schematyczny rysunek pokazujący rozpady cząstek z* i 6* więc, ani jakiegokolwiek wniosku z nich uzyskanego nie można użyć. Lecz z wieloma cząstkami, na które natrafiamy w przyrodzie, wiążą się zjawiska zwane rozpadem beta i rozpadami słabymi. Jeden z słabych rozpadów, związany z cząstką odkrytą około roku 1954, stanowił dużą zagadkę..Istniała pewna naładowana cząstka, która rozpadała się na trzy mezony n, jak to pokazano schematycznie na rys. 52.5. Cząstka ta została nazwana wówczas mezonem t. Na rysunku 52.5 widzimy jednak również i inną cząstkę, która rozpada się na dwa mezony; jeden z nich musi być neutralny na podstawie zasady zachowania ładunku. Ta cząstka została nazwana mezonem 6. Mamy więc cząstkę t, która rozpada się na trzy mezony n, oraz cząstkę 6 rozpadającą się na dwa mezony 71. Dość szybko przekonano się, że cząstki t i 0 mają niemal jednakową masę; z dokładnością do błędów doświadczalnych obie masy są równe. Z kolei stwierdzono, że czas, jaki zajmowało im rozpadniecie się na trzy mezony n i dwa mezony n był niemal dokładnie taki sam; żyją one równie długo. Wreszcie, zawsze gdy cząstki te były produkowane, stwierdzano taki sam ich stosunek, powiedzmy 14% cząstek z wobec 86% cząstek 6. Każdy przy zdrowych zmysłach uświadamia sobie natychmiast, że muszą to być te same cząstki, że po prostu produkujemy obiekt mogący się rozpadać na dwa sposoby, a nie dwie różne cząstki. Obiekt ten ma zatem jeden czas życia, a stosunek, w jakim zachodzi produkcja, jest zawsze taki sam (ponieważ jest to stosunek prawdopodobieństw obu rodzajów rozpadu). Można było jednakże udowodnić (i nie możemy w ogóle tu wyjaśnić, w jaki sposób) wychodząc z zasady symetrii względem odbicia w mechanice kwantowej, że ta sama cząstka nie może się rozpadać na oba podane sposoby. Zasada zachowania, odpowiadająca zasadzie symetrii względem odbicia, jest czymś nie mającym klasycznego odpowiednika, nazwano więc tę kwantowomechaniczną zasadę zachowania zasadą zachowania parzystości. Z zachowania parzystości lub dokładniej — z symetrii względem odbić równań kwantowomechanicznych opisujących słabe rozpady wynikało, że ta sama cząstka nie może się rozpadać na oba sposoby, musimy więc mieć do czynienia z pewną przypadkową zgodnością mas, czasów życia itd. Lecz im bardziej się tym zajmowano, tym bardziej zdumiewająca była ta zgodność i stopniowo narastało podejrzenie, że prawdopodobnie prawo symetrii przyrody względem odbicia jest fakzywe. Biorąc za punkt wyjścia widoczne w tym przypadku załamanie tego prawa, fizycy Lee i Yang zaproponowali, aby przeprowadzić dalsze doświadczenia z podobnymi rozpadami i spróbować stwierdzić, czy prawo to jest słuszne w innych przypadkach. Pierwsze z tych
52-7 PARZYSTOŚĆ NIE JEST ZACHOWANA! 397 doświadczeń przeprowadziła pani Wu z Uniwersytetu Columbia. Zostało ono wykonane w następujący sposób. Gdy użyjemy bardzo silnego magnesu w bardzo niskiej temperaturze, okaże się, że pewien izotop kobaltu, który rozpada się emitując elektron, jest magnetyczny i jeżeli temperatura jest wystarczająco niska, aby drgania termiczne nie mogły za bardzo wstrząsać atomowymi magnesami, ułożą się one wszystkie wzdłuż pola magnetycznego. Wszystkie atomy kobaltu ustawiają się więc w tym silnym polu w jednym kierunku. Następnie rozpadają się emitując elektron. Jak stwierdzono, gdy atomy były ustawione w polu, którego wektor B wskazywał ku górze, większość elektronów była emitowana ku dołowi. Jeśli ktoś nie jest wprowadzony w tajniki otaczającego go świata, tego rodzaju spostrzeżenie nie brzmi dla niego jak coś ważnego; dla kogoś jednak, kto rozumie problemy i interesujące sprawy przyrody, jest to najbardziej dramatyczne odkrycie: Gdy umieścimy atomy kobaltu w niezwykle silnym polu magnetycznym, więcej elektronów rozpadu biegnie w dół niż w górę. Gdybyśmy zatem przeprowadzili odpowiednie doświadczenie „w zwierciadle", gdzie atomy kobaltu byłyby ustawione w przeciwnym kierunku, wyrzucałyby swoje elektrony do góry, a nie w dół; proces byłby niesymetryczny. Magnesowi urosły wąsy] Południowy biegun magnesu ma taki charakter, że elektrony w rozpadzie P starają się go unikać: odróżnia to w sposób fizyczny biegun północny od południowego. Przeprowadzono następnie wiele innych doświadczeń, zbadano rozpad mezonu n na n i v, mezonu // na elektron i dwa neutrina, obecnie, A na proton i mezon n\ rozpad L i wiele innych rozpadów. 1 rzeczywiście, niemal we wszystkich przypadkach, w których można było tego oczekiwać, stwierdzono niezachodzenie symetrii względem odbicia! Prawo symetrii względem odbicia na tym szczeblu fizyki nie jest więc słuszne. Krótko mówiąc, możemy wyjaśnić naszemu Marsjaninowi, gdzie ma umieścić serce. Mówimy: „Posłuchaj, zbuduj sobie magnes, nawiń drut i puść w nim prąd, następnie weź kobalt i obniż temperaturę. Przygotuj doświadczenie w ten sposób, aby elektrony biegły od stóp do głowy; wówczas kierunek, w jakim biegnie prąd przez cewkę, to kierunek, który nazywamy z prawa na lewo". Wykonując więc eksperyment tego rodzaju można zdefiniować stronę prawą i lewą. Przewidziano również inne zjawiska. Okazuje się, na przykład, że spin czyli moment pędu jądra kobaltu wynosi przed rozpadem 5 jednostek h, a po rozpadzie 4 takie jednostki. Elektron ma spinowy moment pędu i występuje również neutrino. Łatwo stąd dostrzec, że spinowy moment pędu elektronu musi być ustawiony wzdłuż jego kierunku ruchu, podobnie dla neutrina. Wygląda więc jak gdyby elektron wirował w lewo i to również zostało sprawdzone. Faktycznie, właśnie tu w Kalifornijskim Instytucie Techniki Boehm i Wapstra sprawdzili, że elektrony wirują głównie w lewo. (Pewne inne doświadczenia dały odpowiedź przeciwną, ale były one błędne!) Następny problem polegał oczywiście na znalezieniu prawa opisującego fakt łamania parzystości. Jak brzmi prawo określające siłę tego łamania? Brzmi ono następująco: łamanie zachodzi jedynie w tych bardzo powolnych reakcjach, które nazywamy słabymi rozpadami, a gdy zachodzi, cząstki rozpadu, które mają spin, takie jak elektron, neutrino itd. starają się wirować w lewo. Nie jest to reguła symetryczna; wiąże ona wektor pręd-
398 52. SYMETRIA PRAW FIZYKI kości z pseudowektorem momentu pędu i mówi, że jest bardziej prawdopodobne, iż moment pędu będzie skierowany przeciwnie do prędkości niż zgodnie z nią. Tak brzmi to prawo, lecz dziś nie rozumiemy jeszcze wszystkich „dlaczego" i „skąd", które się z nim wiążą. Dlaczego prawo to brzmi właśnie tak? Jaka kryje się za nim podstawowa przyczyna? Jak wiąże się ono z innymi sprawami? Chwilowo jesteśmy tak oszołomieni samym faktem niesymetryczności, że nie otrząsnęliśmy się jeszcze dostatecznie, aby móc zrozumieć, co ono oznacza w stosunku do innych praw. Jednakże sam problem jest interesujący, aktualny i wciąż nie rozwiązany, wydaje się więc słuszne rozważenie kilku związanych z nim zagadnień. 52-8. Antymateria Gdy któraś z symetrii zostaje złamana, pierwsza rzecz, jaką należy zrobić, to przebiec jeszcze raz listę znanych lub zakładanych symetrii i sprawdzić, czy tak samo nie dzieje się z' którąś z nich. Nie wspominaliśmy dotychczas o jednej z występujących na naszej liście operacji, która z konieczności musi być zakwestionowana — o przejściu od materii do antymaterii. Jak przewidział Dirac, obok elektronów musi występować jeszcze inna cząstka, zwana pozytronem (odkrył ją w Kalifornijskim Instytucie Techniki Anderson), związana ściśle z elektronem. Wszystkie własności tych dwóch cząstek są wzajemnie powiązane: energie są jednakowe; masy są jednakowe; ładunki są przeciwne. Lecz co najważniejsze, gdy obie się spotkają, anihilują, uwalniając w postaci energii, powiedzmy kwantów y, całą swą masę. Pozytron nazywamy antycząst^ą elektronu i powyżej podaliśmy właśnie własności cząstki i jej antycząstki. Z argumentu Diraca było widoczne, że również wszystkie inne spotykane cząstki powinny mieć swoje antycząstki. Tak na przykład obok protonu powinien istnieć antyproton, który obecnie oznacza się przez p. p będzie miało ujemny ładunek elektryczny, taką samą masę jak proton itd. Najważniejszą jednak cechą jest to, że gdy proton i antyproton zetkną się, nastąpi ich anihilacja. Podkreślamy to dlatego, że ludzie zwykle nie rozumieją, że istnieje zarówno neutron, jak i antyneutron, i mówią: „Przecież neutron jest nienaładowany, jak więc możliwy jest ładunek przeciwny"? Przepis tworzenia antycząstek nakazuje odwrócić nie tylko ładunek, lecz również wiele innych własności. Antyneutron można odróżnić od neutronu w następujący sposób: jeżeli złączymy dwa neutrony, będą one dalej istnieć jako neutrony, jeśli jednak zetkniemy neutron i antyneutron, nastąpi ich anihilacja i wyzwolenie ogromnej ilości energii, z pojawieniem się mezonów n, kwantów y, itd., itd. Jeżeli więc mamy antyneutrony, antyprotony i antyelektrony, możemy w zasadzie utworzyć antyatomy. Nie zostały one jeszcze zbudowane, lecz w zasadzie jest to możliwe. Tak na przykład atom wodoru ma w środku proton i elektron, który go obiega. Wyobraźmy więc sobie, że teraz mamy antyproton i obiegający go pozytron; czy jest to możliwe? Antyproton jest elektrycznie ujemny, antyelektron elektrycznie dodatni, przyciągają się więc tak samo — masy są takie same, wszystko jest takie same. Jest to jedna z zasad symetrii fizyki. Równania wydają się wskazywać, że jeżeli na przykład zbudujemy zegar z materii a nastecnie taki sam zeear z antymaterii, oba będą chodziły tak samo. (Oczy-
.'2-8. ANTYMATERIA 399 wiście, jeżeli zetkniemy ze sobą oba te zegary, to nastąpi ich anihilacja, ale to już jest inna sprawa.) Nasuwa się natychmiast pewien problem. Z materii możemy zbudować dwa zegary: jeden — „lewy", drugi - „prawy". Możemy na przykład zbudować zegar, który nie ma prostej konstrukcji, lecz zawiera kobalt, magnesy, detektory elektronów, które wykrywają obecność elektronów z rozpadu fi i liczą je. Za każdym razem, gdy elektron zostanie zarejestrowany, wskazówka sekundowa będzie się przesuwać. Zegar zwierciadlany rejestrujący mniej elektronów będzie więc chodził wolniej. Możemy więc zbudować dwa zegary, z których lewy nie jest zgodny z prawym. Zbudujemy więc z materii zegar, który będziemy nazywać zegarem standardowym lub zegarem prawym. Zbudujemy też, również z materii, zegar, który będziemy nazywać zegarem lewym. Stwierdziliśmy właśnie, że ogólnie biorąc oba te zegary nie będą chodzić tak samo; przed odkryciem niezachowania parzystości uważano, że będą. Poprzednio zakładano jednak również, że materia i antymateria są równoważne, czyli jeśli zbudujemy z antymaterii zegar prawy, będzie chodził tak samo jak zegar prawy z materii, a jeśli zbudujemy zegar lewy, też będzie chodził tak samo. Innymi słowy, początkowo uważano, że te wszystkie cztery zegary są takie same. Obecnie oczywiście wiemy, że materia prawa i materia lewa nie są takie same. Prawdopodobnie więc antymateria prawa i antymateria lewa też nie będą takie same. Nasuwa się więc oczywiste pytanie: co pasuje do czego, jeśli w ogóle coś pasuje? Innymi słowy, czy materia prawa zachowuje się tak samo jak antymateria prawa, czy też prawa materia zachowuje się tak samo jak antymateria lewa? Doświadczenia nad rozpadami /?. w których zamiast elektronów mamy pozytrony, wskazują, że prawdziwe jest drugie powiązanie: materia „w prawo" działa tak samo jak antymateria „w lewo" A zatem ostatecznie symetria między „prawym" a „lewym" jest dalej zachowana! Jeżeli zbudujemy zegar lewy, lecz zrobimy go z innego rodzaju materii, z antymaterii zamiast materii, będzie chodził tak samo. Zamiast dwóch niezależnych zasad na naszej liście symetrii mamy obecnie jedną nową, którą otrzymaliśmy z połączenia poprzednich i która głosi, że materia prawa i antymateria lewa są symetryczne. Jeśli więc Marsjanin, z którym rozmawiamy przez telefon, jest zbudowany z antymaterii i na podstawie otrzymanych instrukcji zbuduje nasz model, wszystko w nim będzie umieszczone odwrotnie. Co się stanie, jeżeli po długich konwersacjach, w których trakcie nauczyliśmy się nawzajem budować pojazdy kosmiczne, spotykamy się w połowie drogi w przestrzeni? Przekazaliśmy sobie nawzajem nasze tradycje itd. i obaj wybiegamy naprzeciw, aby uścisnąć sobie dłonie. No cóż, jeśli wyciągnie lewą rękę, miejmy się na baczności! 52-9. Naruszone symetrie Oto następny problem, nad którym się zastanowimy: co można odczytać z praw, które są niemal symetryczne? To zdumiewająca rzecz, że dla tak szerokiego zakresu ważnych „silnych" zjawisk, jak siły jądrowe i zjawiska elektryczne, a nawet dla „słabych" zjawisk w rodzaju grawitacji — dla niemal całej fizyki prawa wyglądają na symetryczne. A mimo to ten mały dodatkowy człon związany ze słabymi rozpadami powiada, że „jednak tak
400 52. SYMETRIA PRAW EIZYK1 nie jest, prawa nie są symetryczne!". Dlaczego tak się dzieje, że przyroda może być prawie symetryczna, ale nie symetryczna dokładnie? Czy można to zrozumieć? Przede wszystkim, czy mamy i inne przykłady? Odpowiedź brzmi: tak. Istotnie, mamy kilka innych przykładów. Oto jeden z nich. Części jądrowe sił między protonem a protonem, neutronem a neutronem i protonem a neutronem są dokładnie takie same. Mamy pewną nową symetrię dotyczącą sił jądrowych, polegającą na tym, że możemy wymieniać proton z neutronem. Z pewnością nie jest to jednak ogólna symetria, gdyż odpychanie elektryczne, które ma miejsce dla protonów, nie istnieje dla neutronów. Nie jest więc prawdą, że możemy zawsze zastąpić proton neutronem, jest to jedynie słuszne w dobrym przybliżeniu Dlaczego w dobrym? Ponieważ siły jądrowe są silniejsze niż elektryczne. Jest to więc również „prawie" symetria. Mamy więc przykłady i gdzie indziej. Umysł nasz ma tendencję do akceptowania symetrii jako swojego rodzaju doskonałości. Już Grecy uważali koła za coś doskonałego i wydawało się czymś strasznym uważać, że orbity planet nie są kołami, lecz prawie kołami. Różnica między kołem a prawie kołem nie jest mała, dla umysłu jest to zasadnicza zmiana. Koło ma w sobie symetrię i doskonałość, która znika, gdy tylko lekko je zniekształcimy. Oczywiście, nasuwa się wówczas pytanie: dlaczego mamy tylko w przybliżeniu koło? To już znacznie trudniejszy problem. Ruchy planet powinny się w ogólności odbywać po elipsach, lecz występowanie najrozmaitszych sił zaburzających spowodowało, że ruchy te są niernal symetryczne. Chodzi teraz o to, czy i my mamy do czynienia z podobnym problemem. Jeśli chodzi o koła, to gdy mamy do czynienia z doskonałymi kołami, nie ma czego wyjaśniać. Ale ponieważ są one jedynie w przybliżeniu kołami, pozostaje wiele do wyjaśnienia i jak się okazuje, otrzymujemy skomplikowany problem dynamiczny, w którym patrząc na sił\ zaburzające trzeba wyjaśnić przybliżoną symetrię. Nasz problem polega więc na wyjaśnieniu, skąd się bierze symetria. Dlaczego przyroda jest niemal symetryczna? Tego nikt nie wie. Możemy jedynie zaproponować coś takiego: W Japonii w miejscowości Neiko znajduje się brama nazywana niekiedy najpiękniejszą bramą w całej Japonii. Została ona zbudowana w czasach dużych wpływów sztuki chińskiej. Brama ta wykonana jest niezwykle kunsztownie, pełno tam najrozmaitszych rzeźb, kolumn, głów smoków i książąt rytych na filarach itd. Jeżeli jednak przyjrzeć się dokładnie kunsztownemu i skomplikowanemu rysunkowi na jednym z filarów, można stwierdzić, że jeden element został wyryty „do góry nogami", poza tym wszystko jest całkowicie symetryczne. Jeżeli spytać się, dlaczego tak się stało, słyszy się, że uczyniono tak dlatego, aby bogowie nie byli zazdrośni o bezbłędność ludzką. Umieszczono celowo błąd, aby bogowie kierowani zazdrością nie rozzłościli się na człowieka. Myśl tę możemy odwrócić i uważać, że prawdziwe wyjaśnienie przybliżonej symetrii przyrody jest następujące: bogowie uczynili prawa jedynie w przybliżeniu symetryczne, abyśmy nie byli zazdrośni o ich doskonałość!
zadania** Rozdział 26 26.1. Mężczyzna idzie po chodniku z prędkością 2 m/s, natomiast po „równomiernie wyboistym" polu może iść z prędkością równą najwyżej 1,2 m/s. Wyrusza on z punktu A oddalonego o 56 m od ściany (patrz rysunek) i idzie do punktu B, leżącego przy ścianie, 48 m na południe od chodnika. a. Jaką trasę AKB powinien wybrać, aby dojść do punktu B w najkrótszym czasie? Uwaga. Można przyjąć, że do problemu tego slosuje się „prawo załamania". Niemniej jednak, jeśli czytelnik ma dość odwagi, może spróbować rozwiązać zadanie bez takiego założenia! b. Jaki jest ten najkrótszy czas? c. Ile czasu zabiera przejście tras ACB i ACB, jeżeli CK=4m = KC"> 26.2. Źródło S wysyła wąską wiązkę światła prostopadłą do ekranu oddalonego o 1,0 m. Promień pada na ekran w punkcie P. Na drodze wiązki umieszczono płytkę lucytową o grubości 0,20 m i o współczynniku załamania 1,50. Przyjmując, że kąt padania wiązki na powierzchnię płytki wynosi 30°, oblicz: *» Autorem zadań oznaczonych przy numerze gwiazdką (*) jest Foster Strong. A^ Pf> 26 Feynmana wykłady z fizyki
W2 ZADA NU a) poprzeczne przesunięcie promienia, PP', b) procentowy przyrost czasu potrzebnego na przebycie drogi SP' w porównaniu z pierwotną drogą w powietrzu SP. 26.3. 5 jest punktowym źródłem światła, P — jego obrazem utworzonym przez soczewkę. SC=CP= 1,00 m. Grubość soczewki mierzona przy jej krawędzi wynosi 3,0 mm. Wiedząc, że droga optyczna promienia SCP jest taka sama jak promieni SAP i SBP, oblicz, jaka jest grubość soczewki w pobliżu punktu C? (Przyjmij, że współczynnik załamania szkła jest równy 1,60.) 26.4. Gdy stoimy przed zwierciadłem płaskim, wydaje się nam, że zamienia ono prawą stronę na lewą i odwrotnie, tzn. obraz naszej prawej ręki wygląda jak lewa ręka „osoby" w lustrze. Dlaczego zwierciadło nie zamienia również góry na dół? Jaka jest naprawdę rola zwierciadła? 26.5. Dwa zwierciadła płaskie przecinają się w ten sposób, że kąt utworzony przez nie jest kątem prostym. Linia przecięcia zwierciadeł jest pionowa. Wyjaśnij, dlaczego w takim lustrze „widzimy siebie tak, jak nas widzą inni"? 26.6. Trzy wzajemnie prostopadłe zwierciadła przecinają się tworząc narożnik o prostych kątach wewnętrznych. Promień świetlny pada na jedno ze zwierciadeł, a po odbiciu na drugie lub kolejno na oba pozostałe zwierciadła. Pokaż, że po wszystkich odbiciach promień jest jedynie przesunięty i biegnie w kierunku dokładnie przeciwnym do kierunku pierwotnego (zakładamy, że rozmiary zwierciadeł są bardzo duże). Czy znane jest praktyczne zastosowanie takiego układu zwierciadeł? 26.7. Wiadomo, że przy przechodzeniu światła z jednego przezroczystego ośrodka do innego światło częściowo się załamuje, częściowo ulega odbiciu, a bardzo mała jego część zostaje pochłonięta lub rozproszona. Co się dzieje, gdy wiązka światła biegnąca pierwotnie w ośrodku optycznie gęstszym, pod dużym kątem względem normalnej do powierzchni, pada na powierzchnię oddzielającą dwa ośrodki? Rozdział 27 27.1. Biegnąca w powietrzu równoległa wiązka światła zostaje skupiona w jednym punkcie (ognisku) przez pojedynczą powierzchnię załamującą, oddzielającą obszar o współczynniku załamania n. Jaki jest kształt tej powierzchni? powietrze / ~- ^' szkło
ZADANIA DO ROZDZIAŁU 27 403 27.2. Zbieżna wiązka światła skupia się w punkcie P. W punkcie Q leżącym na osi wiązki chcemy umieścić zwierciadło, które skupiałoby promienie tej wiązki w innym punkcie P'. Znajdź kształt powierzchni tego zwierciadła, wiedząc, że QP' = D, a QP = d. 27.3. Zewnętrzna średnica szklanej rurki kapilarnej wynosi D, a jej współczynnik załamania jest równy n. Jeżeli patrzymy na kapilarę z boku wydaje się nam, że jej wewnętrzna średnica ma długość d. Jaka jest prawdziwa długość tej średnicy? 27.4. Soczewka o ogniskowej F daje obraz rzeczywisty odległego przedmiotu. Obraz ten jest następnie oglądany przez szkło powiększające o ogniskowej /. Znajdź kątowe powiększenie układu, gdy oko patrzącego jest nastawione na nieskończoność. 27.5. Akomodacja przeciętnego oka ludzkiego pozwala na ostre oglądanie przedmiotów leżących w odległości między 25 cm i nieskończonością od oka. Bezpośrednio przed okiem zostało umieszczone cienkie szkło powiększające o ogniskowej /= + 5 cm. a. W jakim przedziale odległości należy teraz umieszczać przedmiot, aby można go było widzieć ostro? b. Określ powiększenie kątowe dla obu położeń granicznych w tym przedziale. 27.6. Układ optyczny teleobiektywu składa się z soczewki skupiającej o ogniskowej /i = +30cm oraz soczewki rozpraszającej o ogniskowej f2= —lOcm. Odległość po- K 27,5^. płyta cm^ fotograficzna ł i£« iJL _!_*.?_] J przedmiot \YJ J\ \ między tymi soczewkami wynosi 27,5 cm. Gdzie powinna być umieszczona płyta fotograficzna, aby można było sfotografować przedmiot leżący w odległości 10 m przed pierwszą soczewką? Wykonaj staranny rysunek biegu promieni. 27.7. Ogniskowa 5-metrowego teleskopu Hale'a jest równa 163 m. Jaka będzie odległość między płaszczyznami ogniskowania światła pochodzącego z odległej gwiazdy oraz a) Księżyca, b) sztucznego satelity ziemskiego odległego od punktu obserwacji o 320 km? 27.8. Dwie cienkie soczewki S i 5" o ogniskowych fi f są ustawione w odległości D od siebie. Znajdź ogniskową całego układu oraz odległości płaszczyzn głównych, A i A', od odpowiednich soczewek S i S'.
404 ZADANIA Rozdział 28 i 29 28.1. Podaj interpretację geometryczną dwóch wielkości opisanych podanymi liczbami zespolonymi, a następnie oblicz wartości bezwzględne A w obydwu przypadkach: a) A = reie'1 + re-""2, b)A=£reM n = 0 29.1. Drgania w dwu równoległych antenach umieszczonych w odległości A/2 od siebie (rys. 29.5a) odbywają się w zgodnych fazach. Gdyby w każdej z anten drgania były wzbudzane oddzielnie, natężenie promieniowania wysyłanego przez jedną z nich we wszystkich kierunkach poziomych byłoby równe 70, a przez drugą — 2/0. Jakie będą natężenia promieniowania wysyłanego przez układ obu anten w kierunkach zaznaczonych na rysunku? 29.2. Cztery identyczne dipole promieniujące są ułożone równolegle obok siebie w odstępach 2,50 cm tak, że środki ich leżą na linii prostopadłej do osi dipoli. Są one pobudzane do drgań z częstością 3,00-10' Hz, przy czym fazy kolejnych dipoli są opóźnione względem siebie o 90°. Znajdź rozkład natężeń promieniowania w dużej odległości od dipoli, w płaszczyźnie równikowej (prostopadłej do osi dipoli i przechodzącej przez ich środki). Zrób wykres otrzymanej funkcji we współrzędnych biegunowych. 29.3. Dwa paraboidalne „talerze" radioteleskopu obserwatorium Kalifornijskiego Instytutu Techniki w Owens Valley mogą być odsuwane od siebie na odległość500 m. Każdy talerz skupia przychodzące promieniowanie na małym odbiorniku umieszczonym w ognisku paraboloidy, a następnie oba sygnały są przekazywane do „miksera" umieszczonego w połowie drogi między talerzami. Mikser dodaje te sygnały i wylicza średni kwadrat amplitudy sygnału wypadkowego. Z jaką dokładnością można określać położenia kątowe odległych źródeł punktowych za pomocą tego układu, jeżeli pozwala on mierzyć fluktuacje o wartości 10% w sygnale wyjściowym. Przyjmij, że długość fali jest równa 50 cm. 29.4. Ładunek ą porusza się po torze kołowym o promieniu a z prędkością kątową w. Oblicz natężenie pola elektrycznego w dużej odległości R od ładunku, pod kątem 6 względem osi toru. Znajdź natężenie promieniowania w płaszczyźnie koła i na jego osi, w dużej odległości R. 29.5. Na rysunku poniżej widzimy dwa szeregi zawierające po N równomiernie rozmieszczonych, drgających dipoli. Wszystkie dipole w szeregu A drgają w tych samych fazach. fi o o o oooooo o—*- A O O O OOOOOO o r natomiast wszystkie dipole w szeregu B mają fazy opóźnione o 90° w stosunku do dipoli z szeregu A. Naszkicuj rozkład promieniowania w płaszczyźnie równikowej układu (patrz zad. 29.2) w dużej odległości od dipoli.
ZADANIA DO ROZDZIAŁU 29 405 29.6. Elektrony długiego, prostego, cienkiego drutu o długości L drgają wzdłuż tego drutu z częstością kołową w i małą amplitudą a, wszystkie w tej samej fazie. Znajdź natężenie pola elektrycznego w dużej odległości R(R^>L) od drutu, pod kątem 6 względem osi związanej z dru- tem- dipol 29.7. Moc na jednostkę powierzchni przenoszona przez falę elektromagnetyczną jest proporcjonalna do średniego kwadratu natężenia pola elektrycznego. Określ, jaka część całkowitej mocy emitowanej przez drgający ładunek pada na jednostkową powierzchnię prostopadłą do promienia o długości R, łączącego ją z ładunkiem i tworzącego kąt 0 z osią drgań. Oblicz tę moc (w W/m2) dla pionowo zorientowanego dipola zawieszonego na balonie-radiosondzie, używanym do badania promieniowania kosmicznego, znajdującym się na wysokości 25 km, w odległości poziomej 25 km od odbiornika, jeśli całkowita moc promieniowana przez nadajnik wynosi 0,5 W. 25 km Z5km odbiornik Rozdział 30 30.1. Długości fal linii D widma sodu są odpowiednio równe 5889,95 A oraz 5895,92 A. Jakie rozmiary powinna mieć siatka dyfrakcyjna, mająca 600 szczelin na mm, aby mogła ona rozszczepić te linie w widmie pierwszego rzędu? 30.2. Samochód z zapalonymi światłami przednimi (traktowanymi jako źródła punktowe) zbliża się po prostej drodze. Światła są umieszczone w odległości 120 cm od siebie. Jak daleko od obserwatora znajdował się samochód w momencie, gdy obserwator zorientował się, że widzi dwa światła, a nie jedno? Przyjmij, że źrenica oka ma średnicę równą 0,5 cm, a efektywna długość fali światła wynosi 5500 A. Czy fakt, że światło jest białe (mieszanina różnych długości fal) ułatwia, czy utrudnia rozdzielane widzenie obu świateł? 30.3. Na rysunku pokazano schemat konstrukcji często spotykanego typu spektrografu siatkowego. Światło ze źródła Z przechodzi przez wąską szczelinę 5, a następnie przez soczewkę (lub zwierciadło) kolimatora K,, który przekształca je w wiązkę równo-
406 ZADANIA ległą (tak, że pada ono na siatkę dyfrakcyjną G jako płaska fala biegnąca z nieskończoności;. Po ugięciu na siatce G światło, rozchodzące się znowu w różnych kierunkach, pada na drugą soczewkę Kz (obiektyw komory fotograficznej) i jest ogniskowane w płaszczyźnie P, gdzie tworzy (na ogół) pasmo z szeregiem nałożonych na nie wąskich linii spektralnych. Załóżmy, że szczelina ma długość h oraz szerokość w, ogniskowe soczewki Kt i K2 wynoszą Ft i F2, kąty między normalną do siatki a osiami soczewek Ky i K2 są odpowiednio równe 0t i 62 oraz że siatka ma N linii na jednym mm. a. Jaka jest szerokość pasma na płaszczyźnie PI b. Jaka długość fali pojawi się na płaszczyźnie P w punkcie leżącym na osi soczewki K21 c. Jaka będzie wzajemna odległość na płaszczyźnie ogniskowej P dwóch linii widmowych, których długości fali różnią się o 1,00 A? Wielkość ta często nazywana jest dyspersją przyrządu. d. Jaka będzie szerokość linii widmowej na płaszczyźnie P, jeżeli szerokość szczeliny w jest znacznie większa niż zdolność rozdzielcza soczewki kolimatora, równa 1,22 XFlIAl, gdzie Ai jest źrenicą wejściową układu. 30.4. Na rysunku pokazano schematycznie spektrograf 50-metrowego słonecznego teleskopu wieżowego obserwatorium na Mount Wilson. Jest to spektrograf typu Littrowa, w którym pojedyncza soczewka działa równocześnie jako kolimator i jako obiektyw komory fotograficznej, a kąt 0L = — 62 (w przybliżeniu) i obraz powstaje obok szczeliny. Ogniskowa soczewki spektrografu na Mont Wilson wynosi F= 23 m, a część powierzchni siatki pokryta rysami jest równa 15 cm x 25 cm, przy czym na jednym milimetrze znajduje się 600 linii. Na ogół korzysta się z widma piątego rzędu. a. Jaki powinien być kąt nachylenia siatki 6, żeby położenie linii 5250,218 A obojętnego żelaza w widmie piątego rzędu pokrywało się ze szczeliną wejściową? b. Dla jakich innych długości fal w zakresie od 3600 do 7000 A linie widma również pokrywają się ze szczeliną? c. Zaproponować prostą metodę usunięcia niepożądanych rzędów widma z zachowaniem jedynie widma piątego rzędu. d. Jaka jest wartość dyspersji przyrządu dla długości fali 5250 A w widmie piątego rzędu? e. Jaki jest przedział AX określający najmniejszą odległość linii widmowych, które (teoretycznie) można rozdzielić za pomocą tego przyrządu, dla długości fali 5250 A w widmie piątego rzędu? 30.5. Długości fal linii widmowych mierzy się zwykle z dokładnością do 0,001 A przy użyciu spektrografów, których zdolność rozdzielcza może sięgać tylko 0,010 A. Czy to postępowanie narusza jakieś podstawowe prawa fizyki?
ZADANIA DO ROZDZIAŁU 30 407 30.6. Gdy rowki siatki dyfrakcyjnej mają taki kształt, że większość padającego promieniowania zostaje ugięta w jakimś określonym kierunku, o siatce mówimy, że jest „rozjaśniona" dla tego kierunku. Przypuśćmy, że rowkom można idealnie nadać kształt podobny do kształtu zębów piły (patrz rysunek), taki że nachylone powierzchnie zębów tworzą kąt 8b z poziomem. U-l a. Posługując się modelem przedstawiającym wiązkę ugiętą jako promieniowanie emitowane przez zbiór oscylatorów drgających w fazie zgodnej z fazą padającego promieniowania określ, dla jakiego kierunku wiązka ugięta będzie miała największe natężenie, jeżeli kąt padania 0pad=O. b. Oszacuj przybliżony zakres kątów, dla których wystąpi rozjaśnienie. 30.7. Interferometr Fabry'ego-Perota składa się z dwóch idealnie gładkich płytek umieszczonych w odległości D od siebie. Wewnętrzne powierzchnie płytek, wzajemnie równoległe, pokryte są warstwami, które odbijają część R2 światła padającego prostopadle, a przepuszczają część T2. Przypuśćmy, że wiązka światła o natężeniu I0 i długości fali X pada na jedną z tych powierzchni z lewej strony (patrz rysunek). Część wiązki przechodzi bezpośrednio przez układ, a część doznaje wielokrotnych odbić od obu powierzchni i dopiero wtedy przechodzi na zewnątrz. Ostatecznie wiązka wychodząca składa się z światła, które zostało odbite 0, 2, 4, 6, ...-krotnie i przeszło przez dwie warstwy. Znajdź zależność natężenia przepuszczonego światła od D, X, R i Tl Uwaga. Na tej samej zasadzie działają wąskopasmowe filtry optyczne nazywane filtrami interferencyjnymi. Powierzchnie odbijające wykonuje się w tym przypadku metodą pokrywania płytek ze szkła, w warunkach wysokiej próżni, kilkoma warstwami (o dokładnie kontrolowanej grubości) przezroczystych substancji mających różne współczynniki załamania. 1 1 "*"-—-^_^ p y4 yĄ \ '<%>, »■ 1 Rozdział 31 31.1. Znajdź współczynnik załamania glinu dla promieni Róntgena o długości fali 1,56-10 ~8 cm. Załóż, że częstości własne elektronów w glinie są znacznie mniejsze od częstości promieni Róntgena. 31.2. Współczynnik załamania jonosfery dla fal radiowych o częstości 100 MHz wynosi w = 0,90. Oblicz gęstość elektronów (na cm3) w jonosferze
408 ZADANIA 31.3. Natężenie pola elektrycznego fali świetlnej przechodzącej przez ośrodek o współczynniku załamania n jest dane wzorem gdzie tu jest częstością kołową fali, z — odległością przebytą przez falę. a. Pokaż, że jeśli n = ri — in", to p_c -n"<ui/c iwU-n i/c) Nq2 1 b. Korzystając z równania w —1 = 5 j , gdzie A'jest gęstością ładunku, 2e0m co0—co +iya> a y współczynnikiem tłumienia, znajdź zależność natężenia wiązki promieniowania od odległości przebytej przez falę (z) dla przypadku, gdy częstość promieniowania to jest dokładnie równa częstości własnej atomu w0. 31.4. Jak wiadomo, gęstość strumienia energii niesionej przez falę wynosi S=e0cEz W/m2. a. Oblicz, z jaką szybkością jest wypromieniowana energia przez elektron drgający z amplitudą x0 i z częstością kołową w. b. Porównaj energię wypromieniowywaną w ciągu jednego cyklu ze zmagazynowaną energią \mco2Xo i znajdź współczynnik tłumienia yR. c. Wzbudzony atom wysyła promieniowanie o pewnej długości fali X. Oblicz teoretycznie oczekiwaną szerokość A\ linii widmowej, związaną wyłącznie z tłumieniem promieniowania. (Potraktuj atom jako mały oscylator tłumiony, o dużym Q.) Rozdział 32 32.1. Pokaż, że jeżeli równanie ruchu naładowanego oscylatora ma postać (m d2x/dł2) + a>lx-(2e2/3c3) d3xldt3 = F(t), to człon zawierający trzecią pochodną opisuje szybkość strat energii na promieniowanie (związaną z oporem promieniowania) dla dowolnej częstości. Wskazówka. Przyjmij, że FU) = A cos cot, i oblicz moc pobieraną ze źródła wymuszającego drgania. 32.2. Wiązka światła przechodzi przez obszar zawierający w jednostce objętości A' centrów rozpraszających o przekroju czynnym na rozpraszanie światła równym a. Pokaż, że natężenie światła, jako funkcja przebytej drogi .y, dane jest wzorem /=/0e-"". 32.3. Posługując się wzorem określającym przekrój czynny na rozpraszanie światła : to4 (co2-to20y 3 wv
ZADANIA DO ROZDZIAŁU J2 409 oraz wzorem na współczynnik załamania dla gazów Ne2 t n = 1 + j , 2e0 meoj0 — a) wykaż, że wielkość Na można zapisać w postaci 3n N \ X / (Na pomiarach rozpraszania światła przez atmosferę oparto jedną z pierwszych metod oszacowania liczby Avogadry.) 32.4. O ile zostaje osłabione natężenie niebieskiego światła (A=4500 A) słonecznego podczas przechodzenia przez atmosferę, gdy słońce znajduje się a) w zenicie? b) 10c powyżej horyzontu? 32.5. Obserwujemy rozpraszanie na elektronach nowo odkrytego promieniowania (nazwanego ze względu na jego nowość i tajemniczość, promieniowaniem X). Przypuszcza się, że promieniowanie to, podobnie jak światło, jest falą poprzeczną. W jaki sposób można by udowodnić, że jest to rzeczywiście fala poprzeczna i że można ją spolaryzować? 32.6. Światło słoneczne rozproszone przez swobodne elektrony tworzy wewnętrzną koronę słoneczną (nazywaną koroną K). Jasność tej korony obserwowana w odległości jednego promienia Słońca od brzegu tarczy słonecznej jest 10 ~8 razy mniejsza niż jasność samej tarczy (na jednostkę powierzchni). Oceń w przybliżeniu, jaka jest gęstość elektronów w pobliżu Słońca? 32.7. Pokaż, że wielkość l/e0c ma wymiar oporu, i oblicz wartość liczbową tej wielkości. 32.8. Przestrzeń międzygwiezdna jest wypełniona chmurami drobnych ziarenek pyłu, składających się z węgla, lodu oraz z małych ilości innych pierwiastków. Ocenić w przybliżeniu, jaka minimalna masa tego pyłu przypadająca na jednostkę powierzchni (g/cm2) mogłaby zmniejszyć obserwowaną przez nas jasność gwiazd, znajdujących się poza chmurami pyłu, o czynnik równy np. 100 (tzn. o 5,0 w skali jasności gwiazdowych). Trzeba pamiętać, że ziarenka pyłu mogą zarówno rozpraszać, jak i pochłaniać światło gwiazd. 32.9. Krótki, prosty kawałek miedzianego drutu umieszczony na drodze wiązki fal elektromagnetycznych wysyłanej przez antenę radarową „rozprasza" część tych fal. Pole elektryczne fali zmusza elektrony, do drgań, w czasie których emitują one promieniowanie „rozproszone". Dla krótkiego kawałka drutu (o długości «:/) możemy przyjąć, że elektrony drgają wzdłuż jego osi i że ich średnie przesunięcie jest proporcjonalne do składowej natężenia pola elektrycznego równoległej do drutu. Jeżeli więc w drucie znajduje się A^ elektronów i d jest ich średnim chwilowym przemieszczeniem, to d=xE,., gdzie £|i jest składową pola elektrycznego fali równoległą do drutu. Znajdź (w funkcji x i N)
410 ZADANIA a) maksymalny przekrój czynny drutu na rozpraszanie, b) zależność tego przekroju czynnego od orientacji drutu. Rozdział 33 33.1. Między dwa polaroidy o wzajemnie prostopadłych osiach wsunięto trzeci polaroid o osi tworzącej kąt 6 z osią pierwszego polaroidu. Jakie jest natężenie światła przepuszczonego przez ten układ? (Zakładamy, że polaroidy są idealne i straty pomijamy.) 33.2. Załóżmy, że na polaroid pada wiązka światła spolaryzowanego liniowo. W przypadku gdy oś polaroidu jest równoległa do osi polaryzacji, zostaje przepuszczona część a2 natężenia, natomiast gdy kąt między tymi osiami jest prosty — część e2. (Dla idealnego polaroidu a2 = 1, e2 = 0.) Jakie będzie natężenie przepuszczonego światła, jeżeli na parę polaroidów, których osie tworzą kąt 6, pada prostopadle światło niespolaryzowane o natężeniu /0? (Odbicia pomijamy.) 33.3. Pokaż, że dla kąta Brewstera (tzn. takiego kąta padania 0B, przy którym promień odbity jest spolaryzowany liniowo) tg0B=«. 33.4. Jakie będą natężenie i polaryzacja promieniowania wysyłanego przez elektron poruszający się ze stałą prędkością po torze kołowym a) na osi koła, b) w płaszczyźnie koła? 33.5. Współczynniki załamania krystalicznego kwarcu dla światła o długości fali 600 mu wynoszą odpowiednio «0= 1,544 dla promienia zwyczajnego oraz nt = 1,553, dla promienia nadzwyczajnego. Największą różnicę prędkości rozchodzenia się promienia zwyczajnego i nadzwyczajnego w krysztale uzyskujemy przy prostopadłym padaniu światła na kryształ kwarcu wycięty równolegle do osi optycznej. Jaka musi być grubość kryształu dla światła o omawianej długości fali, aby przesunął względną fazę tych dwu promieni o 90°? 33.6. Przebywający na wakacjach student pierwszego roku Ca Itech-u spacerując ze swoją dziewczyną patrzy na Księżyc (znajdujący się 10° ponad horyzontem) odbity w spokojnej wodzie jeziora. Przypominając sobie wiadomości z rozdz. 33 student próbuje obliczyć, jaka powinna być jasność obrazu w porównaniu z jasnością samego Księżyca. Zakłada on, że światło Księżyca jest (prawie) niespolaryzowane. Jaki wynik powinien otrzymać? Pokaż, że gdy promienie padają stycznie do powierzchni wody, natężenie światła odbitego zbliża się do 100%. 33.7. a. Jaka część padającego promieniowania zostaje odbita, gdy światło pada prostopadle na płaską ściankę kryształu diamentu? b. Jaka jest wielkość kąta Brewstera dla diamentu? 33.8. Wracając do zad. 33.5, przypuśćmy, że współczynniki załamania kwarcu dla światła o długości fali 410 mu są odpowiednio równe «D= 1,557 oraz ne= 1,567 i że z kryształu kwarcu została wycięta płytka ćwierćfalowa dla światła o długości fali 600 mu Opisz stan
ZADANIA DO ROZDZIAŁU 33 411 polaryzacji światła o podanej, krótszej długości fali, wychodzącego z tej płytki, jeżeli przed wejściem do kryształu było ono spolaryzowane liniowo. 33.9. Trzeba zmierzyć współczynnik załamania czarnego obsydianu mając do dyspozycji wypolerowaną płytkę tego minerału. W jaki sposób wykona się pomiar i jaka będzie jego dokładność? Rozdział 34 34.1. Krążek o promieniu A toczy się bez poślizgu po poziomej płaszczyźnie. Napisz parametryczne równania linii zakreślonej przez punkt odległy o R<s:A od środka krążka, w zależności od A, R oraz od kąta obrotu krążka 0. Wybierz układ współrzędnych o osi x skierowanej pionowo i o osi z skierowanej poziomo. 34.2. Zakładając, że z = ct, znajdź poprzeczne przyspieszenie d2x dt2 punktu, o którym była mowa w poprzednim zadaniu. Jest to przyspieszenie retardowane, wykorzystywane przy obliczaniu promieniowania ładunku poruszającego się po kole o promieniu R. Wyraź otrzymany wynik przez wielkości obserwowane: R, v (prędkość cząstki wzdłuż jej toru) oraz v (poprzeczne przesunięcie cząstki w chwili obserwacji). 34.3. Oblicz stosunek obserwowanych natężeń promieniowania, gdy naładowana cząstka porusza się po drodze kołowej w kierunku „od" i „do" obserwatora (patrz zad. 34.2). 34.4. Posługując się przekształceniem Lorentza i korzystając ze wskazówek podanych na str. 135, pokaż, że sin 8=v/c. 34.5. Wykaż, że prędkość elektronu o energii 1 GeV różni się od prędkości światła c o 1/8-10". 34.6. Linia D sodu (laboratoryjna długość fali równa 589,0 mu) w widmie pewnej gwiazdy ma długość równą 588,0 mu. Jaka jest prędkość tej gwiazdy względem obserwatora? Czy trzeba tu uwzględnić poprawkę relatywistyczną? 34.7. Astronom z Kalifornijskiego Instytutu Techniki, R. Minkowski, stwierdził, że najbardziej odległa mgławica, jaką obserwował, oddala się od Ziemi z prędkością 0,6 c. Jakie przesunięcie dopplerowskie powstanie w świetle tej mgławicy? Znajdź obserwowaną długość fali linii widmowej, dla której długość fali zmierzona w warunkach laboratoryjnych wynosi 300 mu. 34.8. W 1728 roku Bradley zauważył, że na skutek ruchu Ziemi po orbicie okołosło- necznej obserwowane położenia gwiazd na kuli niebieskiej są przesunięte względem ich położeń rzeczywistych. Zjawisko to nazywamy aberracją światła. Przy obserwacji gwiazd położonych w pobliżu bieguna ekliptyki teleskop należy pochylić w kierunku ruchu o kąt 20°5". Jaka jest długość promienia orbity ziemskiej obliczona na podstawie tych obserwacji? Przyjmij, że prędkość światła jest równa 3,00-108 m/s. 34.9. Załóżmy, że przestrzeń międzyplanetarna jest wypełniona drobnymi cząstkami
412 ZADANIA „pyłu", o kształcie w przybliżeniu kulistym, o średnim ciężarze właściwym p i o promieniu R. a. Pokaż, że dla każdej takiej cząstki (o dowolnych rozmiarach), stosunek siły grawitacyjnego przyciągania przez Słońce do ciśnienia padającego promieniowania słonecznego nie zależy od odległości tej cząstki od Słońca. b. Wiedząc, że promieniowanie słoneczne na orbicie Ziemi ma natężenie 1374 W/m2 oraz przyjmując, że przekrój czynny cząstek na pochłanianie wynosi nR2. oblicz, dla jakiej wartości R ciśnienie promieniowania i przyciąganie grawitacyjne się równoważą? c. Czy efektywny przekrój czynny cząstek pyłu może być znacznie większy od nR2? Skorzystaj z wiadomości zawartych w rozdz. 32. 34.10. W jednym z rozwiązań napędu pojazdów kosmicznych miano użyć cienkiej, bardzo dobrze odbijającej błony ze sztucznego tworzywa, jako „żagla" pchanego ciśnieniem promieniowania. Przypuśćmy, że na statku kosmicznym o masie I03 kg umieszczono żagiel o powierzchni 100 m2. Opisz, w jaki sposób należy posługiwać się żaglem w celu zwiększenia średniego promienia orbity statku, przyjmując, że początkowo porusza się on po kołowej orbicie okołosłonecznej o średnim promieniu 1 A.U. Oblicz, jaka będzie szybkość zmian promienia tej orbity. Rozdział 38 38.1. Ogrodnik zauważył, że łatwo jest zasadzić 2 drzewka w linii prostej, natomiast znacznie trudniej zasadzić 3 Niemniej jednak, dzięki dużemu doświadczeniu i starannym pomiarom, udało się mu wysadzić 64 małe drzewka w kwadratową sieć o kierunkach E-W i N-S: 8 rzędów po 8 drzewek w rzędzie. Podstawowa komórka sieci miała wymiary 6m x 6m. Stając w narożniku swojego sadu mógł on widzieć 3 proste z ośmioma drzewami w każdej, wliczając w to drzewko w narożniku, z którego patrzył, 2 proste po 4 drzewka w każdej i 4 proste po 3 drzewka. a. Jaki był najmniejszy kąt pomiędzy dwiema sąsiednimi spośród tych dziewięciu prostych? b. Jaka była największa odległość między dwoma kolejnymi drzewkami z tych prostych? c. Gdyby w podobny sposób zasadzono „nieskończony sad", patrząc z powietrza zamiast każdej z tych prostych widzielibyśmy rodzinę równoległych prostych, jednakowo zagęszczonych drzewkami. Odległości pomiędzy sąsiednimi prostymi jednej rodziny można traktować jako „stałe sieci". Znaleźć wartości tych stałych dla kolejnych rodzin prostych między kierunkiem E-W i kierunkiem tworzącym z nim kąt 45° 38.2. W krysztale NaCI atomy sodu i chloru są rozmieszczone na przemian w narożnikach sześciennych komórek kryształu, przy czym najmniejsza odległość atomu Na od atomu Cl wynosi d=2,S2 A. Znajdź 5 największych odległości międzypłaszczyznowych dla kryształu NaCI i oblicz, dla jakich kątów wystąpi odbicie Bragga pierwszego rzędu od odpowiadających im zespołów płaszczyzn, jeżeli użyje się promieni Róntgena o długości fali 1,50 A.
ZADANIA DO ROZDZIAŁU J8 413 38.3. W rozdziale 32 (str. 97) stwierdziliśmy, że wzbudzony atom wypromieniowuje z pewną szybkością otrzymaną energię. Wynikiem tego jest ograniczenie „czasu życia" stanu wzbudzonego i równocześnie pojawienie się skończonej szerokości odpowiedniej linii widmowej. Wykaż, że efekty te, interpretowane jako niepewności pomiaru czasu i energii (albo pędu i położenia) fotonu, są zgodne z zasadą nieoznaczoności. 38.4. a. Posługując się analizą wymiarową wyprowadź wzór na „promień Bohra" atomu wodoru. b. Wykaż, korzystając z zasady nieoznaczoności, że energia niezbędna do uwolnienia elektronu z atomu wodoru jest rzędu kilku elektronowoltów. 38.5. W nadfioletowym obszarze widma obserwuje się serię linii widmowych znanych jako seria Lymana. Trzy największe długości fali dla trzech prążków z tej serii wynoszą w angstremach: 1216, 1026 i 973. Oblicz, na podstawie tych informacji oraz zasady kombinacji Ritza, przewidywane długości fal trzech innych możliwych linii widmowych wodoru. Dwie z tych linii leżą w obszarze widzialnym widma (seria Balmera), a jedna w podczerwieni (pierwsza linia serii Paschena) Rozdział 39 39.1. Gdy gaz doskonały sprężamy adiabatycznie, iloczyn PKy = const. Z drugiej strony dla dowolnej przemiany zachodzi związek PVIT= const. Wyprowadź na podstawie tych wzorów związki pomiędzy P i T oraz V i T, zachodzące podczas sprężania adiabatycznego. 39.2. Dętka rowerowa jest napełniona powietrzem do ciśnienia 4,4 atm za pomocą pompki pobierającej powietrze pod ciśnieniem atmosferycznym (I atm), w temperaturze 20°C (2933K). Jaką temperaturę w skali Celsjusza ma powietrze opuszczające pompkę, jeżeli y=l,40. Pomiń straty ciepła na ogrzanie ścianek pompki. 39.3. W połowie objętości każdego z dwu identycznych pojemników znajduje się hel, a druga połowa jest pusta. Obie części każdego pojemnika są oddzielone tłokiem, zaopatrzonym w mały zawór. Przeprowadzamy dwa następujące doświadczenia: a. W jednym tłoku otwieramy zawór i gaz przepływa do pustej części pojemnika, dopóki nie zostanie osiągnięty stan równowagi. Wówczas tłok bardzo wolno przesuwamy do końca pojemnika. b. Drugi tłok najpierw bardzo wolno przesuwamy do końca pustej części pojemnika, a następnie otwieramy zawór. Porównaj jakościowo końcowe stany gazu w obydwu pojemnikach. (Pomiń tarcie oraz przepływ ciepła przez ścianki pojemników.) ZE 'AV'A.-i:A'^ Trrrr JL. I* i:.v.:w.v.vw,,,"sy-;,V.si stan początkowy stan końcowy
414 ZADANIA 39.4. a. Wyobraź sobie wysoki słup gazu lub cieczy, których gęstość p(h) zmienia się z wysokością. Wykaż, że ciśnienie P wewnątrz tego słupa, jako funkcja wysokości h, spełnia równanie różniczkowe dP/dh= —p(h)g. b. Rozwiąż to równanie różniczkowe dla gazu o ciężarze cząsteczkowym u, zakładając że temperatura gazu nie zależy od wysokości. 39.5. Atmosfera, której ciśnienie i gęstość rozpatrywane jako funkcje wysokości spełniają równanie Pp ' = const, nazywana jest atmosferą adiabatyczną. a. Pokaż, że temperatura takiej atmosfery spada liniowo z wysokością i znajdź współczynnik proporcjonalności. Współczynnik ten nazywamy adiabatycznym gradientem temperatury. Oblicz wartość tego gradientu temperatury dla atmosfery ziemskiej. b. Na podstawie rozważań energetycznych pokaż, że atmosfera mająca mniejszy (lub większy) gradient temperatury niż atmosfera adiabatyczna będzie stabilna (lub niestabilna) ze względu na konwencję. 39.6. Cylinder zamknięty szczelnym, poruszającym się bez tarcia tłokiem, zawiera 1 m3 gazu jednoatomowego(x = |) pod ciśnieniem 2 atm(2,02-105 N/m2). Gaz ten zostaje powoli sprężony w stałej temperaturze, tak że końcowa objętość wynosi tylko 0,4 m3. Jaką pracę należy wykonać przy sprężaniu? 39.7. Dwa gazy, A i B, zajmujące takie same początkowe objętości V0 i mające takie same początkowe ciśnienie P0 zostały gwałtownie sprężone adiabatycznie, każdy do połowy swojej początkowej objętości. Jakie będą stosunki ich ciśnień końcowych do ciśnienia początkowego, jeżeli yA jest równe § (gaz jednoatomowy), a yB — | (gaz dwuatomowy)? 39.8. Znajdź stosunek prac niezbędnych do przeprowadzenia sprężeń opisanych w zad. 39.7. 39.9.* Dwie bańki o pojemnościach równych odpowiednio 200 cm3 oraz 100 cm3 są połączone krótką rurką, w której znajduje się izolujący, porowaty korek. Korek umożliwia wyrównywanie ciśnień w obu bańkach, ale nie dopuszcza do wyrównania temperatur. Układ został zalutowany w temperaturze 27°C, gdy znajdował się w nim tlen pod ciśnieniem 760 mm Hg. Następnie mniejszą bańkę zanurzono w mieszaninie wody z lodem, a większą umieszczono w kąpieli parowej o temperaturze 100°C. Jakie jest końcowe ciśnienie w bańkach? Pomiń przepływ ciepła pomiędzy bańkami. 39.10.* 50-litrowy zbiornik jest połączony krótką rurą ze zbiornikiem 15-Iitrowym. Rura jest zaopatrzona w zawór ciśnieniowy, umożliwiający przepływ gazu wyłącznie z większego zbiornika do mniejszego, jeśli ciśnienie w większym zbiorniku przewyższa ciśnienie w mniejszym zbiorniku o 88 cm Hg. Jakie będzie ciśnienie w mniejszym zbiorniku, gdy w obydwu zbiornikach temperatura wyniesie 162°C, jeżeli w temperaturze 17°C większy zbiornik był wypełniony powietrzem pod ciśnieniem atmosferycznym, a mniejszy był opróżniony? Oo
ZADANIA OO ROZDZIAŁU 59 415 39.11.* W temperaturze pokojowej czterotlenek azotu jest częściowo zdysocjowany na dwutlenek azotu, według reakcji N,04~*2N02. Do kolby o pojemności 250 cm3, opróżnionej z powietrza, nalano 0,90 g ciekłego N204 o temperaturze 0°C. Gdy temperatura w kolbie wzrosła do 27CC, cała ciecz wyparowała, a ciśnienie pary osiągnęło 960 mm Hg. Jaki procent czterotlenku azotu uległ dysocjacji? 39.12.* Gramocząsteczka jednoatomowego gazu doskonałego zamknięta jest w mogącym przewodzić ciepło pojemniku, zaopatrzonym w ruchomy tłok. W chwili początkowej parametry gazu wynoszą F,, F, oraz 7, = 27DC. Następnie gaz zostaje powoli podgrzany, przy czym całkowita dostarczona energia wynosi 8,31 Wh a równocześnie rozszerza się on pod stałym ciśnieniem. W stanie końcowym ciśnienie wynosi Px, objętość V2. a temperatura T2. Obliczając końcową energię wewnętrzną gazu oraz pracę wykonaną przez gaz podczas rozprężania znajdź: a) 7-,, b) V2/Vt. Rozdział 40 40.1. W mierniku promieniowania cząsteczki rozrzedzonego gazu bombardują zespół cienkich, lekkich łopatek poczernionych po jednej a błyszczących po drugiej stronie. Gdy na łopatki pada promieniowanie, pochłaniają one energię, która następnie jest unoszona (głównie) przez cząsteczki uderzające w poczernione strony łopatek. W wyniku tego na łopatki zaczynają działać niezrównoważone siły, które powodują ich ruch obrotowy. Rozważmy naczynie, w którym, w jednostce objętości, znajduje się « cząstek gazu, każda o masie m. Temperatura gazu w skali bezwzględnej wynosi T. Cienka łopatka o jednostkowej powierzchni pochłania w jednostce czasu energię promienistą równą I1W, a następnie energia ta jest unoszona (izotropowo) przez cząsteczki uderzające w jedną ze stron łopatki. Oszacuj w przybliżeniu wielkość niezrównoważonej siły działającej na łopatkę umieszczoną w powietrzu o temperaturze pokojowej. 40.2. Jaka część cząsteczek uderzających w powierzchnię naczynia ma energię: a) większą niż przeciętna, b) 3 razy większą niż przeciętna, jeżeli gaz znajduje się w stanie równowagi cieplnej? 40.3. Ciepłem molowym substancji w stałej objętości, CY, nazywamy ilość energii potrzebną do podniesienia temperatury jednego mola tej substancji o jeden stopień, przy zachowaniu stałej objętości. Jakie jest ciepło molowe w stałej objętości a) jednoatomowego gazu doskonałego, b) dwuatomowego gazu doskonałego? 40.4. Przez gładką rurę o stałym przekroju poprzecznym A przepływa powietrze z prędkością v, w normalnych warunkach ciśnienia i temperatury. Po drodze jest ono ogrzewane
416 ZADANIA za pomocą grzałki stawiającej mu mały opór, możliwy do pominięcia, i opuszcza rurę z prędkością v'. Moc grzałki jest równa PW Napisz równanie zachowania masy, energii i pędu dla powietrza przechodzącego przez rurę, a następnie oblicz: a) p', b) końcową temperaturę gazu T' c) siłę ciągu *> F. 40.5. Oszacuj w przybliżeniu, w świetle powyższego zadania, siłę ciągu lotniczego silnika odrzutowego zużywającego 100 kg powietrza i 2 kg nafty w ciągu sekundy. Ciepło spalania nafty wynosi około 4,65-107 J'kg. Jakie czynniki mogłyby unieważnić otrzymany wynik? 40.6. Maxwellowskie prawo rozkładu prędkości opisane jest wzorem dNldv = Av2t~bvl. "Wzór ten można przekształcić w równanie y = x2e~* . a. Zrób wykres tego równania dla 0^x^3,0, aby zobaczyć, jak rosnąca krzywa v = x2 zostaje wygaszona przez czynnik wykładniczy. b. Znajdź maksymalną wartość rzędnej. c. Sprawdź, że powierzchnia pod krzywą bardzo mało różni się od wartości całki ]x2e~x2dx. o 40.7. Wyrażenie kTjmg = RT'ng=h0, gdzie fu jest masą jednego mola; występującą we wzorze barometrycznym wielkość n = n0e~m9hlkT można przyjąć za jednostkę skali wysokości. Oblicz wartość h0 dla atmosfery ziemskiej oraz atmosfery słonecznej, przyjmując, że ^, = 29 g/mol, rs = 300°K, Juj = ł,5 g'mol, T =5500 °K, g = 2,7102 m/s2. Rozdział 41 41.1. Oblicz i zapamiętaj wartości liczbowe następujących wielkości: a) temperatury T, dla której iloczyn kT jest równy I eV; b) wartości kT w elektronowoltach w temperaturze pokojowej; c) długości fali fotonu odpowiadającej przeskokowi kwantowemu ze zmianą energii o 1 eV. ' 41.2. Prawo rozkładu promieniowania ciała doskonale czarnego raa postać hw3 dw I(co) dw= -7-5—j—ji= . rc2cV -1) Dokonując zamiany zmiennych x=htojkT, pokaż, że: a) całkowite natężenie promieniowania (scałkowane po wszystkich częstościach) jest proporcjonalne do czwartej potęgi temperatury w skali bezwzględnej; b) częstość tom, dla której I(lo) przyjmuje wartość maksymalną, jest proporcjonaina do temperatury w skali bezwzględnej. *' Urządzenie to stanowi w zasadzie silnik odrzutowy.
ZADANIA DO ROZDZIAŁU 41 417 41.3. Znajdź względne natężenie światła o długości fali 0,31 u, wysyłanego przez dwa doskonale czarne źródła o temperaturach 2000 °K i 4000 °K. Rozdział 42 42.1. Energię aktywacji, ciepło parowania, ciepło dysocjacji itp. wyraża się zwykle w J/m lub eV/atom. Ilu J/mol równy jest 1 eV/atom? Uwaga. Chemicy używają jednostki energii zwanej kilokalorią. 1 kcal = 4186 J. 42.2. a. Wykonaj na papierze półlogarytmicznym wykres zależności gęstości pary nasyconej rtęci od l/T (niezbędne dane zaczerpnij z odpowiednich tablic fizyko-chemicznych), a następnie na podstawie tego wykresu znajdź ciepło parowania rtęci. Porównaj otrzymany wynik z wartością wziętą z tablic. b. Zrób to samo dla wody. 42.3. W zakresie temperatur od 0° do 300 CC ciepło parowania rtęci zmienia się tylko o 3 % i wynosi przeciętnie 0,61 eV/atom. Jak duży błąd można popełnić przy obliczaniu gęstości pary rtęci w temperaturze 0°, jeżeli zamiast ciepła parowania w tej temperaturze przyjmie się odpowiednią wartość w temperaturze 300 CC. Morał. Mały, procentowo, błąd popełniony w dużym wykładniku potęgi może spowodować duży błąd tej potęgi. 42.4. Na rysunku obok przedstawiono zależność oporu właściwego niemal czystego krzemu od temperatury. Wyciągnij jakościowe wnioski dotyczące przepływu prądu w tej substancji w temperaturach powyżej i poniżej 300 °C. 10' 10 e o a 10 Si J t\~ >fy ■""przewodnictwo domieszkowe fi I przewodnictwo / samoistne I 1 if 500 301 / / 200100 1 ' ot -100 - - 0,001 0002 0,003 0,004 0,005 0,006 0,007 i,(K°)-' Rozdział 43 43.1. Średnica cząsteczki tlenu jest równa w przybliżeniu 3 A. Oszacuj brednią drogę swobodną oraz średni odstęp czasu między kolejnymi zderzeniami cząsteczek tlenu, w warunkach normalnych. 43.2. Pewne naczynie zawiera 1024 cząsteczek gazu. Średnia droga swobodna cząsteczek jest równa k. Dla jakiej długości drogi Z. istnieje mniej niż 50°/ szans, że którakolwiek
418 ZADANIA z cząsteczek znajdujących się w naczyniu przebiegnie do chwili następnego zderzenia drogę dłuższą niż LI 43.3. Jeżeli w jakimś ciele istnieją różnice temperatur, płynie w nim strumień energii proporcjonalny do gradientu temperatury (pomijamy konwekcję). Współczynnik proporcjonalności, równy energii przepływającej przez jednostkową powierzchnię w jednostce czasu, jest nazywany współczynnkiem przewodnictwa cieplnego K. Tak więc dEjdt = KA dT/dx. Pokaż, że gdy nie ma konwekcji, współczynnik przewodnictwa cieplnego gazu wyraża się wzorem K = kn0 vkj(y -1) = kvj{y -1) a, gdzie k jest stałą Boltzmanna, n0 — liczbą cząsteczek w jednostce objętości, v — średnią prędkością cząsteczki, A — średnią drogą swobodną cząsteczek, y — stosunkiem cpjcv, a — przekrojem czynnym cząsteczki. Wskazówka. Przewodnictwo ciepine należy traktować jako transport energii wewnętrznej (cie- pinej) U przez jakąś płaszczyznę, z obszarów ograniczonych płaszczyznami leżącymi po obu stronach tej płaszczyzny w odległości średniej drogi swobodnej od niej, podobnie jak to się robi przy liczeniu współczynnika dyfuzji. 43.4. Jeżeli wewnątrz płynu istnieje gradient prędkości, taki że prędkość zmienia się wraz z odległością mierzoną poprzecznie do kierunku przepływu płynu, pojawiają się efekty hamujące, zwane lepkością. W gazie efekty te związane są z przenoszeniem pędu przez pewną płaszczyznę, z obszarów leżących po obu jej stronach i ograniczonych płaszczyznami leżącymi w odległości, mniej więcej, średniej drogi swobodnej od niej. Jeżeli kierunek przepływu pokrywa się z kierunkiem osi x i istnieje gradient prędkości vx w kierunku osi y, to wówczas siła hamująca, na jednostkę powierzchni prostopadłej do y, wynosi F[A = rj dvjdy . Wykaż, że dla gazu współczynnik lepkości tj jest w przybliżeniu równy r] = n0vmk = vmja, gdzie «0 jest liczbą cząsteczek gazu w jednostce objętości, v — średnią prędkością cząsteczek, m — masą jednej cząsteczki, k — średnią drogą swobodną cząsteczek, a — przekrojem czynnym cząsteczki. 43.5. Zwróć uwagę na to, że ani współczynnik przewodnictwa cieplnego gazu, ani jego współczynnik lepkości, nie zależą od ciśnienia. Wprowadź odpowiednie modyfikacje do wzorów na przepływ energii między dwiema powierzchniami, których temperatury wynoszą Ti T+AT, oddalonymi od siebie o D, jeżeli D<śL To samo zrób z wzorem opisującym przenoszenie pędu między dwiema powierzchniami poruszającymi się z prędkościami U oraz U+AU (patrz zad. 43.3 i 43.4). 43.6. Dwa gazy, A i B, mają w temperaturze T0 gęstości pA i pB. Obserwuje się, że pewien wybrany jon ma w gazie A ruchliwość fiA, a w gazie B ma ruchliwość fiB. Jaka będzie ruchliwość tego jonu w mieszaninie tych gazów mającej gęstość pa + Pb ' temperaturę 7~0?
ZADANIA DO ROZDZIAŁU 44 419 Rozdział 44 44.1. Pewna ilość gazu doskonałego o współczynniku y = * została dwukrotnie przeprowadzona ze stanu A (ciśnienie 1 atm, objętość 22,4 1, temperaturze 300 °K) do stanu C (2 atm, 33,61, 900 °K), raz po drodze ABC, a drugi raz po drodze ADC (patrz rysunek). P(atrnj a. Wykaż, że zmiana entropii w obu przypadkach 2" I I jest taka sama. b. Oblicz wielkość tej zmiany. * D 44.2. Dany jest wykres idealnego cyklu Carnota, ' 55 j^ /g *" abcd, na płaszczyźnie p-V, między temperaturami T, v/22/u i T2 oraz punktami (pa, V„) i (pc, Vc). Wykonaj wykres entropowy tego cyklu (na płaszczyźnie T-S) między odpowiednimi punktami ABCD (patrz rys. 44.6). 44.3. W nowoczesnej elektrowni parowej pracującej z parą przegrzaną, temperatura wewnątrz urządzenia wytwarzającego parę (wytwornicy pary) wynosi 600 °C. Woda rzeczna, używana do chłodzenia skraplacza, ma temperaturę 20 °C. Jaką największą sprawność może mieć ta elektrownia? 44.4. Idealna maszyna odwracalna, w której substancją roboczą jest 28 g azotu (y=|), pracuje cyklicznie, zgodnie z cyklem pokazanym na rys. 44.6. Temperatura źródła ciepła wynosi 400 K, a chłodnicy 300 °K. W punkcie początkowym a gaz zajmował objętość 6,01, a w punkcie c miał objętość 18,01. a. Przy jakiej objętości Vb cylinder powinien zostać izolowany od źródła ciepła (koniec rozprężania izotermicznego) w celu umożliwienia rozprężania adiabatycznego (od Vb do Vc)7 Przy jakiej objętości Vd zaczyna się sprężanie adiabatyczne? b. Jaka ilość ciepła jest dostarczana do maszyny na odcinku Va-> Vbl c. Jaka ilość ciepła zostaje oddana przez maszynę na odcinku Vc^Vp. d. Jaka jest sprawność maszyny? e. O ile zmieni się entropia 1 g substancji roboczej podczas przemiany a->bl c^dl Wskazówka. Udowodnij, że w cyklu Carnota dla gazu doskonałego wyrażenia VtIV, oraz Ki V{ są sobie równe. 44.5. Nieuważny eksperymentator, wyjeżdżając na weekend, pozostawił niedomknięty zawór zbiornika helu. Gaz, którego początkowe ciśnienie wynosiło 200 atm, powoli ulatniał się ze zbiornika. Proces przebiegał izotermicznie w temperaturze 20°C. O ile zmieniła się entropia 1 kg gazu? Rozdział 45 45.1. Słońce promieniuje, w przybliżeniu, jak ciało czarne o temperaturze 5700 °K. Jaką temperaturę w stanie równowagi będzie miała poczerniona kula miedziana, oświetlona promieniami Słońca, od którego jest oddalona o 1 A.U.? Kąt, pod jakim widać z Ziemi średnicę Słońca, wynosi 0,50°.
420 ZADANIA 45.2. Światło słoneczne pada prostopadle na wielki, pokryty czarną nawierzchnią plac w Afryce Równikowej. Jaką najwyższą temperaturę osiągnie nawierzchnia placu, jeżeli promieniuje ona jak ciało doskonale czarne? Stała słoneczna wynosi 1395 W/m2. 45.3. Kuliste ciało czarne o promieniu r i o temperaturze T jest otoczone cienką osłoną o promieniu R, poczernioną po obu stronach. Oblicz, w jakim stopniu taka osłona promieniowania zmniejsza szybkość stygnięcia ciała. (Przyjmij, że przestrzeń między kulami jest opróżniona, a więc nie ma strat na przewodnictwo cieplne.) 45.4. Gęstość materii (gazowej) w pobliżu środka Słońca wynosi około 80 g/cm3, a temperatura około 13106°K. Materia składa się tam prawie wyłącznie z protonów i elektronów. Oblicz ciśnienie gazu i ciśnienie promieniowania w centrum Słońca. 45.5. Ciepło parowania wody wynosi około 2,44-106 J/kg, a gęstość pary nasyconej w temperaturze 100 °C jest równa 0,598 kg/m3. Posługując się równaniem Clausiusa- -Clapeyrona oblicz szybkość zmian temperatury wrzenia wody w funkcji wysokości, w pobliżu poziomu morza (w °C/km). Przyjmij, że temperatura powietrza wynosi 300° K. 45.6. Pokaż, że różnica między ciepłem molowym przy stałym ciśnieniu, a ciepłem molowym w stałej objętości, dla gazu doskonałego, którego energia wewnętrzna zależy wyłącznie od T, jest równa stałej gazowej R: CP — CV=R. 45.7. Objętość właściwa nasyconej pary wodnej w temperaturze 0 °C jest równa 206 m3/kg. Jakie jest (w J/kg) ciepło parowania wody w tej temperaturze? (Znajdź w tablicach wartość dp/dT, oblicz L i porównaj otrzymany wynik z wartością wziętą z tablic.) 45.8. Wykaż, że jeżeli pewien przedmiot pochłania ustaloną część A całkowitego promieniowania padającego na jego powierzchnię, a odbija resztę, to po ogrzaniu do temperatury obędzie on emitował energię AoT* na jednostkę powierzchni (oT* — energia emitowana przez jednostkę powierzchni ciała doskonale czarnego). 45.9. a. Wykaż na podstawie rozważań termodynamicznych, że jeżeli substancja rozszerza się podczas krzepnięcia, to jej temperatura krzepnięcia musi maleć ze wzrostem ciśnienia. b. Oszacuj, przy jakiej .najniższej temperaturze lodu na ślizgawce jest jeszcze możliwa jazda na łyżwach. Rozdział 47 47.1. Znajdź stosunek prędkości dźwięku w helu do prędkości dźwięku w wodorze przy tej samej temperaturze. 47.2. Z dwóch gwizdków o tej samej długości jest wydobywany dźwięk przy użyciu a) powietrza oziębionego do temperatury skraplania ( — 180 CC) oraz b) powietrza ogrzanego. Dźwięk jednego gwizdka jest dokładnie o oktawę wyższy niż dźwięk drugiego (częstość drgań dwa razy większa). Jaka musi być temperatura powietrza wdmuchiwanego do gwizdka omawianego w punkcie b)?
ZADANIA DO ROZDZIAŁU 47 421 47.3. Jeśli ktoś mówi wdychając hel, jego głos brzmi nienaturalnie i wyżej niż zwykle. O jaki mniej więcej czynnik wzrosłaby każda częstość rezonansowa, gdyby wszystkie, spełniające rolę wnęk rezonansowych, „puste miejsca w głowie" były wypełnione helem zamiast powietrza? Jaki byłby wpływ helu, gdyby ktoś śpiewał jakąś melodię, na tonację, w której śpiewał? Przedyskutuj to. 47.4. Rozważ stacjonarną płaską falę akustyczną o częstości 1000 Hz, w której największe odchylenia ciśnienia od panującego ciśnienia atmosferycznego (1-106 dyna/cm2) wynoszą +1 dyna/cm2. a. Jakie zmiany gęstości towarzyszą takiej fali? b. Jakie są maksymalne przemieszczenia xm cząsteczek? c. Jakie jest natężenie fali? Przyjmij, że prędkość dźwięku wynosi 340 m/s. 47.5. Zaobserwuj wysokości dźwięku, jakie można wydobyć brząkając na kawałku paska gumowego o długości około 5 cm, trzymanym między paznokciami obu rąk i rozciąganym 2, 3, 4 i 5-krotnie w porównaniu z długością pierwotną, bez zmiany masy drgającej części paska. Rozważ zaobserwowane wyniki doświadczenia. Dlaczego struna skrzypiec nie zachowuje się tak samo? 47.6. Jednorodna, doskonale sprężysta struna o gęstości liniowej a kg/fli, została naciągnięta tak, że jej naprężenie wynosi T. Wyprowadź równanie falowe opisujące poprzeczne wychylenie struny, y, i znajdź prędkość rozchodzenia się zaburzeń wzdłuż struny. Załóż, że dla wszystkich punktów i w dowolnej chwili czasu dy/Bx^il. Składowa naprężenia w kierunku poprzecznym względem struny jest bardzo bliska T (dy/dx). Rozważ jedynie drgania odbywające się w pewnej płaszczyźnie. 47.7. Pokaż, że wielkość u=Ae'(a>t~kx) spełnia równanie falowe d2u 1 d2u przy założeniu, że w i k związane są zależnością co=vk. Rozdział 48 48.1. Prędkość fazowa fal o długości A, rozchodzących się na powierzchni wody, przy pominięciu napięcia powierzchniowego i efektów związanych ze skończoną głębokością wody, wyraża się wzorem vf=\fgXJ2n. Wykaż, że prędkość grupowa tej fali równa jest połowie jej prędkości fazowej. Oblicz prędkość grupową i fazową fali o długości 1000 m. 48.2. Przy uwzględnieniu napięcia powierzchniowego prędkość fazowa fali na powierzchni cieczy o gęstości p i o napięciu powierzchniowym T wynosi
422 ZADANIA (2nT gX\'2 jeżeli tylko głębokość cieczy jest dostatecznie duża. Znajdź prędkość grupową takiej fali. 48.3. Oblicz prędkość fazową „zmarszczek" o długości fali 1 cm rozchodzących się na powierzchni a) wody (napięcie powierzchniowe 70 dyna/cm), b) alkoholu (napięcie powierzchniowe 26 dyna/cm). 48.4. Znajdź długość fali i częstość „zmarszczek" na wodzie rozchodzących się z najmniejszą prędkością. 48.5. Długi pociąg towarowy, ciągnięty przez lokomotywę motorową, jedzie pod górę z prędkością 5,0 m/s, po prostych szynach. Gdy pociąg zbliża się do tunelu przebitego w pionowej ścianie, maszynista daje długi, jednostajny sygnał syreną, o częstości podstawowej 340 Hz. Zarówno dźwięk syreny, jak i jej echo, po odbiciu od ściany, są słyszane a) przez maszynistę, b) przez stojącą na ziemi osobę, koło której przejeżdża lokomotywa. Ile dudnień w ciągu sekundy słyszy każda z tych osób? Rozdział 49 49.1. Dwie masy, mogące ślizgać się bez tarcia po powierzchni, na której leżą, są przymocowane do dwóch przeciwległych ścian za pomocą sprężyn o stałych sprężystości równych odpowiednio kt i k2, a równocześnie połączone ze sobą sprężyną o stałej sprężystości k (patrz rysunek). Napisz równanie obu mas. Niech kllml=k2lm2~co0. 49.2. Podstaw do równań wyprowadzonych w poprzednim zadaniu x=A e'°* oraz y=Be'°" i oblicz częstości oraz amplitudy dwóch podstawowych rodzajów drgań. 49.3. Wykaż, że funkcja f(x,y, z, t)=A e'°" sin/rcx/asin mny/b sin nKzjc, gdzie co2=v2n2[(l2/a2) + (m2lb2) + (n2/c2)], a /, m, n są dodatnimi liczbami całkowitymi a) spełnia trójwymiarowe równanie falowe (z prędkością propagacji v), b) jest równa zeru dla x=0 i x = a, y=0 i y=b oraz z=0 i z = c, c) oscyluje sinusoidalnie w czasie. 49.4. Przyjmij, że w poprzednim zadaniu stosunek a:b:c= 1:2:3 i oblicz 10 najmniejszych częstości drgań, wyrażając je przez najniższą częstość <u0. Ułóż je w kolejności rosnących częstości, a następnie odłóż odpowiadające im wartości na pionowej osi liczbowej. 49.5. Posługując się pojęciem nieskończenie długich, okresowych ciągów falowych
ZADANIA DO ROZDZIAŁU 49 423 poruszających się w przeciwnych kierunkach wywnioskuj, co się stanie, gdy środek idealnej, równomiernie napiętej sprężyny o długości L zostanie odchylony od położenia równowagi o odcinek A, a następnie puszczony swobodnie. Naszkicuj wygląd sprężyny w kilku różnych chwilach czasu w ciągu połowy okresu ruchu. Rozdział 50 50.1. Posługując się fourierowskim rozkładem funkcji opisującej falę prostokątną I /(*) = ¥-* = 4/rc (sin x +-i sin 3x +~ sin 5x+...), wykaż, że a> l-£ + i + !+...=*/4, b) l + 4+^ + 4^ + ...=ir2/8, 50.2. Rozłóż funkcję »(*) = na składowe fourierowskie i wykaż, że ten wynik pokrywa się z wynikiem otrzymanym przez scałkowanie funkcji z poprzedniego zadania. 50.3. Korzystając z wyników poprzedniego zadania, wykaż, że a) l + l/3*+l/5*+ł/7* + ... = rt*/96, 00 b) £ l/n* = P*/(24-l)]( 1 + 1/3* +1/5*+ ...) = rt*/90. n=l 50.4. Spróbuj obliczyć wartość całki f x3dx mnożąc licznik i mianownik przez e i rozwijając 1-e" w szereg 1-e" - = l+e-"+e-2*+... a następnie całkując wyraz po wyrazie. Postępując w ten sposób powinno się otrzymać
424 ZADANIA I XX_X=\ w3e""f/«[1+1/2*+1/3* + ...] = 6rc4/90=rc*/15. o o 50.5. Znajdź szereg Fouriera przedstawiający funkcję piłową wykorzystywaną w obwodzie odchylania poziomego w oscyloskopie: 1 /"(*) = 2jr 4jt 6ji 50.6. Prostownik dwupołówkowy jest urządzeniem, które przekształca sinusoidalne napięcie o amplitudzie V0 w napięcie pulsujące o postaci: "A a. Oblicz wartość średnią napięcia V(t). Będzie ona równa składowej stałej napięcia wyjściowego. b. Znajdź amplitudę drugiej składowej harmonicznej napięcia wyjściowego. 50.7. Pewien transformator wytwarza napięcie wyjściowe dane wzorem V =V ■ + e• V3 wyi wej T wej * Zanalizuj wpływ drugiego składnika sumy (zawierającego trzecią potęgę) na a) sinusoidalny sygnał wejściowy, b) sygnał wejściowy składający się z dwóch lub większej liczby fal sinusoidalnych o różnych częstościach.
odpowiedzi do zadań Rozdział 26 26.1. AK=20m, f = 60,0s, ACB, ACB; 60,1 s. 26.2. PP' =0,0425 m, T„. = \,\0T„. 26.3. 2,0 cm . Rozdział 27 27.1. y = ±y/2(l-lln)F'x-(l-lln2)x2. 27.3. d' =d/n. 27.4. M=F/f. 27.5. a) 4 1/6 cm-5 cm. 27.7. a) 6,86-10-* cm, b) 8,13 cm. 27.8. F=ff'l(f+f'-D) albo llF=Uf+llf'-Dlff'; * =fDKf+f'-D) od 5 w kierunku S', S=f'D/(f+f'-D) od S' w kierunku 5. Rozdział 28 28.1. a) \A\=2rcos6/2, r sin (N+1)6/2 b) \A\- sin0/2 Rozdział 29 29.1. S: 7=0,17 /„, S 60°W: 7=3,0 /„, W: 7=5,8 /„.
426 ODPOWIEDZI DO ZADAŃ 29.2. /(0)=/o sin1 In(l-coiO)} sin2(ir(l-cos0)/4] 29.3. ax2\",5. 32.9. a. o 6nclc* \E0J b. -L'=cos0. ■|sinS|— sin0*| A. Rozdział 30 30.1. Z. = 1,6 mm. 30.2. 9,1 km. 30.3. a. hF2/Ft. 107 nN c. D = H>-7nNF2/cos0«. d. w'= wFz cos 6,1 Ft cos 0,. 30.4. a. 0=51,9°. b. 3750, 4370, 6560. d. 5,6 mm/A. e. 0,007 A. T1 30.7. /,//„= 1-rV 2 l*nD/X Rozdział 31 31.1. Mierzony współczynnik wynosi (1-») = 8,410-6. 31.2. Rzędu 107 na cm3. 31.3. /= /o exp( — Afy2z\e0 myc). 31.4. a. P=q3to*xl/\2m0c3. b. 7n = q w2/6tt£0mc . 2nc , . c. AX=—j-yM=0,74-10 3A. w Rozdział 32 i-»« *r ~1(V» cm-3. Rozdział 33 33.2. /,//„=i(a*+e4) cos2 0+aV sin* 0. 33.5. l,67-10-2mm. 33.6. 34,5%, a dziewczyna opuszcza go zawiedziona. 33.7. a) 17%, b) 67,4°. Rozdział 34 34.1. Z=A0 + R sin 0, x=-Rcos0. -v2x 1 —vR/cx 34.2. x = R2 (l-vx/cR)3 34.3. /m«/Vn,i„ =(1 +v/cf/U -vjcf . 34.6. Zbliża się z prędkością 510 km/s. 34.7. 600 mu. 34.8. 150-106 kro. 34.9. K=0,585//>u. 34.10. dR\dt=360 m/s. Rozdział 38 38.1. a. 6°8'. b. 21,6 m. c. 1,9; 2,7; 3,3; 4,3 m.
ODPOWIEDZI DO ZADAŃ 38.2. 15°44', 22°13\ 27024', 32°13', 36°31'. 38.5. 6560, 4860, 18800. Rozdział 39 39.1. Pł",/T,,=const, r^'"'=const. 39.2. 173°C. 39.4. P=P0e~',<*"'T. 39.6. 1,82-105J. 39.7. P. = 3,17P0, P* = 2,64/>0. 39.9. 842 mm Hg. 39.10. 20 cm Hg. 39.11. 31. 39.12. a) 1740°K, b) 5.8. Rozdział 40 40.1. F=jt/3v/*77'wa;l,210-3itNm-2. 40.2. 0,366; 0,050. 40.3. a) i*, 40.6. b. 0,368. c. V"/4- Rozdział 41 41.1. a. 11,600°K, b. 1/40 eV. c. 1,24 u, czyli 12400 A. 41.3. fl~e-l,-6«10-'. 427 Rozdział 42 42.1. 1 eV/atom = 96520 J/mol. 42.3. Zmiana prawie dwukrotna. Rozdział 43 43.1. ^=10"7m, T=10"9S. 43.2. L = 56A( = X]n2N). 43.5. dEldt=nQvkJTI(y-\), FI A = tiovm A U. Rozdział 44 44.3. 66,3%. 44.5. 11•103 J/°K. Rozdział 45 45.1. 7"x;270oK. 45.2. 122°C. 45.3. F=R2l(R2 + r2). 45.4. P,= l,7 1016 N/m2, J', = 7,2-10'2 N/m2. 45.5. dTtdh = 3,l°C/km. 45.7. 2490-103 J/kg. Rozdział 47 47.1. 0,78. 47.2. 99°C.
428 ODPOWIEDZI DO ZADAŃ 47.3. 2,9; nie ulegnie zmianie tonacja, natomiast zmieni się bardzo jakość (barwa) dźwięku. 47.6. diyldx^iolDd^yldt2, skąd v2 — Tlo. Rozdział 48 48.3. 24,4 cm/s; 1,78 cm/s. Rozdział 49 49.1. d^/dS+colx + kix-yym^O, d yjdt +tooy-k-k(y — x)jm% = 0. 49.2. o*=io%; A/B= + l, <oI=(o0+k/ml+k/m2 ; AjB= -m2/nil. Rozdział 50 50.5. h{x)=i (l/jt)(sinA:+isin2jc + + isin3x + ...).
skorowidz Aberracja 135 aberracje (sferyczna i chromatyczna) 35 absorpcja 88, 259 adiabatyczność 209 akomodacja oka 157 aksony 156 aktywność optyczna 113 amplituda prawdopodobieństwa 186. 189. 339 analiza wektorowa 386 Anderson C. D. 398 antena 52, 93. 244 — paraboliczna 68 antymateria 398 Barwa 140 i nast. - tonu 357, 360 błądzenie przypadkowe 244 Boehm 397 Boltzmann L. 234 Born N. 173, 201. 258 Brown R. 233 Carnot 278 cieplik 279 ciepło 278 właściwe 297 — gazów 227 ciśnienie ciśnienie gazu 205 — pary nasyconej 303 - światła 136 Clausius 278 cykl Carnota 282, 297, 303 cykłoida 124 cząstka 190 częstość kątowa 50 — rezonansowa oscylatora 83 własna 347 czopki 139 cztero wektor k,io 133 Ćwierćfalówka 109 D-alanina 390 dichromaty 149 dipol promieniujący 43 —, dwa dipole 51 Dirac P. A. M. 398 długość fali II, 22, 50, 190 drgania własne 342 dudnienia 99, 319, 330 dwójłomność 109 dyfrakcja (ugięcie) 59 - na kryształach 194 — na nieprzezroczystych ekranach 70, 90 — światła 63 dyfuzja 262 — cząsteczkowa 271 dyspersja 85 — normalna i anomalna 87 dźwięk 322 Efekt interferencyjny 57 Einstein A. 233, 258, 274 ekwipartycja 241 elektrodynamika kwantowa 41 elektronowolt 125 emisja 259 energia — aktywacji 256 — fali elektrycznej 89 — gazu 208, 301 — wewnętrzna 295 entalpia 301 entropia 290, 315 Fala — nośna 334 — zmodulowana 334 fale 319 — czołowe 370 — dwuwymiarowe 349 — elektromagnetyczne 47 321 — krótkie 11
430 fale milimetrowe 11 — powierzchniowe 379 — radarowe 11 — radiowe 11, 85, 126 — sinusoidalne 50 — stojące 345 — trójwymiarowe 341 — uderzeniowe 371, 372 — w ciałach stałych 375 falowody 120 fasetki 163 faza 50, 86, 107 Fermat P. 14 figura Haidingera 163 filtry 111 fizjologia oka 157 fluktuacje 235, 245, 317 fotony 137, 183 Frank 371 Galileusz 387 gaz — doskonały 215 gaz dwuatomowy 229 — jednoatomowy 208, 228 Hamilton 25 harmonia dźwięku 360 Heisenberg W. 173, 201 Helmholtz H. 148 Heron z Aleksandrii 15 Huygens Ch. 12, 117 Impedancja próżni 95 indcterminizm mechaniki kwantowej 201 interferencja 45, 55, 100, 177, 319 — destruktywna i konstruktywna 57 — fal elektronowych 179 Jeans J. 230, 241 jon 254 jonizacja termiczna 253 Katalizator 257 kąt Brewstera 112 klasyczna teoria promieniowania elektromagnetycznego 12 klasyczny promień elektronu 98 komórka — Kerra 111 — podstawowa 195 komórki pręcikowe 139, 160 skorowidz kryterium Rayleigha 67 krzywa wrażliwości świetlnej 148 L-alanina 390 Land 153 laser 100, 369 Lee 396 Leonardo da Vinci 156 liczba — Avogadry 247 — falowa 50 linie absorpcyjne 88 Ładunki drgające 73 Maxwell J. C. 38, 213, 230, 243 mechanika — kwantowa 172, 185 — statystyczna 218 mechanizm — widzenia 153 — zapadkowy 307 mezony (rozpad) 397 mgławica Krab 129, 141 Miller W. C. 140 miraże 18 modulacja 333, 368 — amplitudy 334 modulator 369 mol 215, 247 moment pędu światła 119, 137 Nadfiolet 11, 163 naruszenie symetrii 399 natężenie — fali 89, 176 — tonu 359 neurologia widzenia 166 Newton I. 173 nieodwracalność 313 nocna ślepota 161 Obraz (pozorny i rzeczywisty) 29 odbicie 13, 15, 114 fal 345 — od siatki dyfrakcyjnej 65 — zwierciadlane 389 odwracalnośc 312, 387 odwracalny przepływ ciepła 281 ognisko 19 ogniskowa — powierzchni załamującej 26
SKOROWIDZ ogniskowa soczewki 30 oko - ludzkie 138 — ośmiornicy 166 skrzypłocza 167 — złożone (owadzie) 162 - żaby 169 okres 50 Iommatidia 163 operacje symetrii 384 Sopór promieniowania 93, 244 optyka geometryczna 12, 25 oscylator - harmoniczny 228, 231, 237, 241, 319 — kwantowy 241 oś optyczna 109 1 Paczki falowe 336, 340 parowanie 221, 248 1 parzystość 395 pasma poboczne 334 perpetuum mobile 299 pęd światła 136 Pitagoras 356 plamka żółta 139 Planck M. 232, 242 płaszczyzny główne 34 podczerwień 11 polaroid 109 1 polaryzacja 106 — światła rozproszonego 105, 108 polaryzatory 111 powierzchnia załamująca (kulista) 26 powiększenie 32 r poziomy energetyczne 199 prawa promieniowania Einsteina 258 [ prawo — Boltzmanna 220 — Coułomba 40 — odbicia 13 — Rayleigha 241 — załamania (Snella) 14, 80, 118 prądy konwekcyjne 271 pręciki J39, 160 prędkość — dźwięku 328 — fazowa 337 — grupowa 338, 380 promienie — y 11 promienie przyosiowe (paraksjalne) 27 — rentgenowskie 11, 85, 127, 337 promieniowanie — ciała doskonale czarnego 240, 305 — Czerenkowa 371 — elektromagnetyczne 11, 39 — hamowania 129 — synchrotronowe 124 — — kosmiczne 128 promień — Bohra 197 — nadzwyczajny 118 — zwyczajny 117 prostownik 311 przekrój czynny — na rozpraszanie 102, 238 — rozpraszanie Thomsona 103 przekształcenie Lorentza 135, 386 przewodnictwo — cieplne 275 — jonowe 270 pseudowektor 392 Ptolemeusz Klaudiusz 13 purpura wzrokowa 150 Reakcje chemiczne 256 retardacja 40 rctincn 161 rezonatory wnękowe 120 rodopsyna 161 rogówka 138, 157 rozkład prędkości cząsteczek 223 rozmiary atomu 196 rozpraszanie światła 100, 238 równanie — Clausiusa-Clapeyrona 302 — dyspersyjne 85 — falowe 323, 326 — jonizacji Sahy 255 ruch unoszenia 268 ruchliwość 268 ruchy Browna 233, 244, 309, 313 Rushton 151 rydberg 198 Schródinger fc. 145, 173, 201 siatka dyfrakcyjna 63 siatkówka 139, 156 sieć krystaliczna 195 silniki cieplne 276 — odwracalne 281 składanie barw 145
432 skok ciśnienia 372 Snell Willebrord 14 soczewka 19, 30 - cienka 31 oka 157 — złożona 33 sprawność silnika 285 stała Bo/tzmanna 247 stopień — KeKina 215 swobody 217 strefa Talowa 51 sygnał 85 — nośny 334 symetria czasu / przestrzeni 385 szereg Fouriera 358 szerokość linii widmowych 98 szumy Johnsona 236, 243 szybkość unoszenia 267 Ściśliwość promieniowania 209 średni czas między zderzeniami 263 średnia droga swobodna 265 światło 11 — niespolaryzowane 108 — polaryzacja podczas rozpraszania 105, 108 — spolaryzowane 108, 118, 127, 163 Tamm 371 temperatura 211 — bezwzględna 215 — kinetyczna 302 — termodynamiczna 288 termodynamiczna równowaga promieniowania 237 skala temperatur 302 termodynamika 201, 276 termoemisja 252 tęczówka 157 tłumienie promieniowania 97 tony muzyczne 356 trichromaty 150 twierdzenie — Nernsia 292 — o energii 366 Ukladv liniowe 354 Wahadła sprzężone 353 Wapstra 397 wektor — biegunowy 393 — falowy 190 SKOROWIDZ wektor osiowy 393 węzły fali 85, 347 widzenie barwne 138 witamina A 161 włókna osiowe 156 współczynnik — dyfu/ji 273 — pochłaniania 88 za/amania 21. 77, 88, 337 współczynniki Fouriera 362 Wu 397 wykres barwności 146 wysokość tonu 357 wzory — de Broglie'a 137 — Fresnela 117 wzór — barometryczny 220 — soczewkowy 33 Young 148, 396 Vustova 150 Załamanie 13, 16, 79 — anomalne 117 zasada — ekwipartycji energii 217 — Fermata (najkrótszego czasu) 14 - 24 — kombinacja Ritza 199 — nieoznaczoności 184, 187, 192 — superpozycji 321 — wzajemności 17, 28, 68 zasady — termodynamiki 276 druga 279, 293, 294, 307 pierwsza 276, 293, 294 zasady zachowania 388 zdolność rozdzielcza 37 — siatki dyfrakcyjnej 67 zjawiska nieliniowe 367 zjawisko — Dopplera 130 — Purkinjego 141 zwierciadło 13, 15 — elipsoidalne 19 — kuliste 29 — paraboloidalne 20 Źródła — niezależne 99 — ruchome 120
do nabycia w KSIĘGARNIACH H. Abramczyk Wstęp do spektroskopii laserowej H. Haken, H.Ch. Wolf Fizyka molekularna z elementami chemii kwantowej B.M. Jaworski, A.A. Dietłaf Fizyka. Poradnik encyklopedyczny Z. Kęcki Podstawy spektroskopii molekularnej R Kowalczyk Fizyka cząsteczek. Energie i widma H. Szydłowski Pracownia fizyczna J.R. Taylor Wstęp do analizy btędu pomiarowego Książki PWN są do nabycia w księgarniach własnych PWN: Warszawa, ul. Miodowa 10, tel. (22) 635 80 88; Gdańsk, ul. Korzenna 33/35, tel. (58) 305 24 50; Katowice, al. Korfantego 51, tel. (32) 58 32 26; Kraków, ul. Św. Tomasza 30, tel. (12) 421 75 64; Łódź, ul. Więckowskiego 13, tel. (42) 630 67 69; Poznań, ul. Wodna 8/9, tel. (61) 85174 94; Wrocław, ul. Kuźnicza 56, tel. (71) 343 54 52. Zamówienia telefoniczne i pisemne przyjmuje: Dział Dystrybucji Wysyłkowej i Prenumerat, ul. Miodowa 10, 00-251 Warszawa, infolinia 0-801 351 929; fax 69 54 179 Zapraszamy do księgarni PWN w Internecie www.pwn.com.pl