5 maja 2010

Pierwiastek obliczony w pamięci

Jak policzyć w pamięci pierwiastek, np. _e ? Zazwyczaj bierzemy do tego kalkulator, ale to wcale nie jest konieczne.
Pamiętamy, że e = 2.72 .Potrzebujemy punktu startu, na przykład jeśli znamy na pamięć potęgi dwójki, to od razu mamy 16 ² = 256, czyli 1.6² = 2.56.

Teraz szukamy takiego x, że:

( 1.6 + x )² = e

Stosujemy wzór skróconego mnożenia: a² + 2ab + b²
1.6² + 2 × 1.6 × x + x² = 2.72
Stąd:
3.2 × x = 0.16 - x²
x = 0.05 - x² / 3.2

Oszacujmy x². Szybki rachunek pokazuje 17² = 289, czyli ponad 272, czyli na pewno x < 0.1.
Stąd x² < 0.01, czyli x²/3.2 < 0.005, czyli w sumie z niedokładnością podania wartości e, mamy błąd nie większy niż 0.01.
Ku uciesze gawiedzi po dwudziestu sekundach rachunków podajemy wynik:

_e = 1.65 ± 0.01

Znany fizyk Richard Feynman opisuje w swojej książce, jak w jednej brazylijskiej restauracji tą samą metodą licząc ∛____1729 wygrał pojedynek z pewnym japońskim sprzedawcą liczydeł. Siła takich przybliżonych metod jest wielka i są tym przydatniejsze, im trudniejsze zadanie mamy do rozwiązania.

Nic nie stoi na przeszkodzie, żeby liczyć to dalej. Jako punkt wyjścia używamy liczby 1.65 z poprzedniego rachunku. 

(1.65 + x )² = e
Teraz już musimy wziąć kartkę i ołówek, bo trzeba przemnożyć trzycyfrowe liczby:
165² = 27225
Jak widać będziemy potrzebowali e z dokładnością do czwartego miejsca po przecinku (niektórzy pamiętają):
e = 2.7183 ± 0.00005
Dalej wzór skróconego mnożenia, który tak naprawdę ukrywa liczenie pochodnej:
× 1.65 × x = 2.7183 - 2.7225 - x²

I znowu kartka się przyda, bo trzeba odjąć dwie pięciocyfrowe liczby:
3.3 × x = -0.0042 - x²
Z poprzedniego wyniku wiemy, że x < 0.01, czyli x² < 0.0001, stąd ostatni człon po podzieleniu przez 3.3 jest mniejszy niż 0.00005. Błąd z pierwszego członu jest taki sam, i po szybkim dzieleniu 42 ÷ 33 ≈ 13 otrzymujemy:
x = -0.0013 ± 0.0001


Po dodaniu do wyjściowego 1.65 mamy:
_e = 1.6487 ± 0.0001
W ten sposób bez kalkulatora policzyliśmy pierwiastek kwadratowy z dokładnością do czwartego miejsca po przecinku.

28 marca 2010

Twierdzenie o paradoksalnym rozkładzie kuli

Twierdzenie Banacha-Tarskiego mówi, że trójwymiarową kulę można rozdzielić na skończoną liczbę podzbiorów, a potem z tych kawałków złożyć przez izometrie kulę o większym promieniu. Czyli przy tych operacjach nie jest zachowana objętość.
Każda przyzwoita definicja miary wymaga, żeby miara była addytywna, czyli np. żeby suma dwóch rozłącznych odcinków o długości 1 miała długość 2. Czyli jak sumujemy skończoną liczbę kawałków, powinniśmy mieć zachowaną objętość.
W paradoksalnym rozkładzie kuli rozdzielamy kulę na zbiory, które nie mają określonej objętości (są niemierzalne w sensie Jordana), dlatego nie musi być spełniona addytywność miary. W dowodzie konstruuje się zbiory, które są niemierzalne nawet silniejszej mierze (Lebesgue'a). Istnienie takich niemierzalnych zbiorów ⁿ zapewnia pewnik wyboru. Pewnik wyboru mówi, że jeśli mamy dowolny zbiór niepustych zbiorów, to istnieje funkcja wybierająca z każdego z tych zbiorów jeden element:
Pewnik wyboru wynika z intuicyjnego przekonania, że z każdego zbioru da się wybrać element. Jeśli tak założymy, niestety musimy się pogodzić z istnieniem zbiorów niemierzalnych w sensie Lebesgue'a, czyli musimy się przyzwyczaić do paradoksalnego rozkładu kuli.

26 marca 2010

Wyznacznik macierzy

Wyznacznik w n-wymiarowej przestrzeni jest to odwzorowanie, które n wektorom przyporządkowuje liczbę.

Jego naturalna interpretacja, to jest objętość równoległościanu rozpiętego na tych wektorach. Wynika to z tego, że wyznacznik jest wieloliniowy, tzn. liniowy w każdym z argumentów, np. drugim:


Dodatkowo jest antysymetryczny, tzn. można dowolnie zamieniać miejscami argumenty, tylko przy zamianie wyskakuje nam -1.
Czyli jak go przekosimy, to nie zmieni się objętość, a jak przemnożymy jakieś ramię przez 2, to nam dwukrotnie zwiększy się objętość. Jest taka zorientowana objętość   jeśli damy wektory w innej skrętności, to znak będzie -. Z tego od razu wynika, że na liniowo zależnych wektorach daje 0.



Co ładnie zgadza nam się z interpretacją jako objętość (płaski równoległościan ma zerową objętość).
Dodatkowo czasem definiuje się, że wyznacznik bazy ma być równy 1. Ta stała określa jednostkę, w jakiej mierzymy objętość na naszej przestrzeni wektorowej. Nic nie stoi na przeszkodzie, żeby określić że akurat nasza baza ma objętość np. 0.5 m³.


Co to jest wyznacznik macierzy? Jeśli mamy jakieś odwzorowanie liniowe, możemy zadziałać nim na elementy bazy. Wyznacznik odwzorowania, to objętość obrazu kostki o jednostkowej objętości.




Jeśli zapiszemy A przy pomocy macierzy w bazie o jednostkowej objętości, to dostaniemy, że wyznacznik macierzy to objętość równoległościanu rozpiętego na jej kolumnach (bo kolumny to obrazy bazy).
Wyznacznik macierzy nie zmienia się przy zmianie bazy. Należy jednak zachować tu ostrożność, ponieważ warto myśleć o wyznaczniku jako o własności przestrzeni. Przy zmianie bazy współczynnik (stała) wyznacznika się zmienia, i licząc wyznacznik macierzy musimy wyznacznik i macierz wyrazić w tej samej bazie.

7 lutego 2009

arctg´

Jak wyrazić pochodną funkcji odwrotnej?
Czyli widzimy, że żeby uprościć to wyrażenie, trzeba przedstawić f´(x) jako funkcję f(x). Fizycy oznaczają to tak: f´ = f´( f ).
Na przykład dla tangensa:
Czyli mamy pochodną tangensa w funkcji tangensa. I po podstawieniu upraszcza nam się do:

6 lutego 2009

Ortogonalizacja

Ortogonalizacja układu wektorów polega na znalezieniu ortogonalnej bazy przestrzeni rozpiętej przez te wektory, czyli po prostu trzeba je „ponaginać” tak by były do siebie parami ortogonalne.
Najpierw problem dla dwóch wektorów. Szukamy b´ takiego, że: 

Teraz wystarczy podstawić i mamy rozwiązanie:
Na obrazku wygląda to bardzo prosto (zakładam że a – znormalizowany):

Można sobie uprościć rachunki normalizując każdy wektor:
Dalsza procedura jest zupełnie analogiczna, tylko kolejny wektor przedstawiamy w postaci kombinacji liniowej tym razem trzech danych wektorów, itd.

3 listopada 2008

arsinh

Każdy chyba czuje, że area sinus hiperboliczy musi mieć coś wspólnego z logarytmem, bo sinus hiperboliczny to z grubsza eksponens. Ich asymptotyczne zachowania są takie same. Przy dążeniu do +∞
więc
Okazuje się że prawdziwy jest związek:
Co ciekawe, nie trzeba wstawiać modułu pod logarytmem, bo liczba pod logarytmem jest wciąż dodatnia (dla x→-∞ ta liczba dąży do 0, czyli logarytm do -∞). Ujemną stronę arsinh odwzorowuje kawałek logarytmu od 0 do 1, i ona jest dokładnie symetryczna do tej dodatniej odwzorowywanej przez logarytm od 1 do ∞. Na pierwszy rzut oka nie widać dlaczego miałoby tak być (ujemna i dodatnia strona logarytmu wyglądają zupełnie inaczej), ale okazuje się ze jest.
Ten wzorek łatwo można pokazać licząc pochodne obu stron:
Pochodne się zgadzają, wartość w np. x = 0 się zgadza.
Kiedyś udało mi się z kolegą z liceum go wyprowadzić licząc na dwa sposoby całkę:Raz wychodzi coś z arsinh, a raz z log. Niestety nie potrafię sobie przypomnieć tego drugiego sposobu. No i jeszcze przydałoby się wyprowadzić analogiczny wzór dla arcosh.

30 października 2008

Liczby pierwsze

Co jest szczególnego w liczbach pierwszych?
Najważniejsza własność to to, że każdą liczbę naturalną da się rozłożyć na czynniki pierwsze, tzn. każda liczba jest iloczynem liczb pierwszych. Co więcej, ten rozkład jest jednoznaczny, czyli żaden iloczyn liczb pierwszych nie jest równy innemu iloczynowi liczb pierwszych.
Dzięki temu istnieje bijekcja między N a wielozbiorami liczb pierwszych.
Co nam to daje? Na przykład jak chcemy dowiedzieć się czy n jest dzielnikiem liczby m, to rozkładamy obie na czynniki pierwsze i sprawdzamy czy rozkład n zawiera się w rozkładzie m. Jeśli szukamy największego wspólnego dzielnika, to wybieramy po prostu wszystkie powtarzające się liczby (z maksymalnymi krotnościami) z obu rozkładów — czyli przecięcie rozkładów. Jeśli szukamy najmniejszej wspólnej wielokrotności, to po prostu bierzemy sumę rozkładów. W ten sposób skracamy ułamki, wyciągamy liczby przed nawias itp.
Co ciekawe, nie we wszystkich pierścieniach liczby pierwsze mają tą fajną własność. Szczerze mówiąc trudno mi podać jakiś pierścień, inny niż Z, w którym by miały.

18 października 2008

Droga

Żeby odpowiedzieć na pytanie co to jest pochodna wektora wodzącego po drodze, trzeba się zastanowić jak mierzymy długość krzywej.
Weźmy krzywą w R3 w postaci parametrycznej.
Naszą krzywą przybliżamy łamaną.
Następnie każdy wektor odpowiadający odcinkowi przenosimy do przestrzeni stycznej w danym punkcie przez zwykły izomorfizm pomiędzy standartowymi bazami.Ta przestrzeń styczna to zwykły R3, więc możemy w niej liczyć długość naszego kawałka łamanej.
Sumujemy wszystkie uzyskane długości i przechodzimy do granicy. Czyli w skrócie policzyliśmy całkę.
Jeśli s(t) nie ma kawałków stałych, to jest bijekcją, i istnieje funkcja odwrotna s-1:
W takim razie możemy sparametryzować naszą krzywą parametrem s, i już trywialnie liczyć pochodną po s ze wzoru na pochodną złożenia funkcji:
Jeśli ma się ochotę, konstrukcję s(t) przez łamaną można zapisać trochę inaczej, korzystając z geometrii różniczkowej. Pochodna funkcji w danym punkcie jest odwzorowaniem liniowym przybliżającym ją w tym punkcie.
Czyli w danym punkcie r(t0) mamy odwzorowanie liniowe R3R3
Jest to macierz 1x3. Można myśleć o tym jako o wektorze w przestrzeni stycznej do R3 w punkcie należącym do krzywej — wystarczy podziałać tym odwzorowaniem na liczbę 1, i już mamy odpowiadający wektor.
Możemy zdefiniować w każdym punkcie krzywej wielkość:
Będzie ona miała interpretację prędkości. I już stąd można otrzymać przez całkowanie funkcję o którą nam chodzi:
Jest to konstrukcja trochę mniej ogólna, bo nie włożyłem tu możliwości określenia tensora metrycznego zależnego od punktu w przestrzeni, ale generalnie znaczy to samo, tyle że innymi słowami.
Dzięki temu, że mamy zdefiniowane s(t), możemy już powiedzieć co to jest pochodna wektora wodzącego po drodze, czyli coś co fizycy nazywają wektorem stycznym do toru:

15 października 2008

Układ współrzędnych

Przedstawię pewne podejście do krzywoliniowych układów współrzędnych. Nie jest to oczywiście pełny obraz, ale pozwala wyrobić sobie pewną intuicję na ten temat, szczególnie jeśli potem dozwolimy na układy odniesienia poruszające się w przestrzeni i obracające.





7 października 2008

Prędkość kątowa

Mamy dwa układy współrzędnych, przy czym jeden z nich ma zmienne w czasie wersory. Podstawowa definicja dotyczy różniczkowania w danym układzie współrzędnych (tu primowanym):
Niektórzy oznaczają to d', ale ja wolę notację w kreską. Weźmy wektor, przy czym nie przywiązujemy oznaczeń do wielkości fizycznych, tylko do samych wektorów, a dokładniej do ich współczynników:
Różniczkujemy stronami i z wyniku separujemy pochodną w primowanym układzie.
Dostajemy pewną resztę (dodatek). Tu pojawia się nowe oznaczenie A' — to znaczy po prostu wektor współczynników ai' (fizycy często oznaczają to po prostu A, bo to jest ten sam wektor, tylko zapisany w innej bazie). Czyli dostaliśmy:
Najciekawsze okazuje się to, że jeśli założymy że każdy z naszych układów jest ortonormalny, to łatwo można ten dodatek zapisać jako iloczyn wektorowy A' z pewnym wektorem (oznaczonym ω) zależnym tylko od pochodnych wersorów e'. Czyli da się opisać tę ewolucję czasową układu primowanego (oczywiście chwilową -- w danym punkcie czasu) niezależnie od współczynników rozkładów wektora A w bazie e i e'. To jest właśnie prędkość kątowa.

6 października 2008

Dyfeomorfizmy

Dyfeomorfizm to odwzorowanie klasy C1, którego odwzorowanie odwrotne też jest klasy C1. Czasem nazywę pisze się diffeomorfizm (od różniczkowalności). Wiemy że nie zawsze odwzorowanie odwrotne do ciągłego jest ciągłe (np. z odcinka na okrąg), i tak samo jest z różniczkowalnymi. Na przykład x3.
Ma zerową pochodną w zerze, więc odwrotne ma nieskończoną (jest nieróżniczkowalne). F -- lokalny dyfeomorfizm, to znaczy że każdego punku istnieje otwarte otoczenie, na którym F jest dyfeomorfizmem.
Jest bardzo fajne twierdzenie, które działa w wielu wymiarach. Jeśli F' w punkcie x0 jest bijekcją, to F jest lokalnym dyfeomorfizmem w x0. Przy czym pochodną w punkcie rozumiemy tu jako odwzorowanie liniowe (macierz):
Bijekcja, czyli detF' ≠ 0. Dla przypadku jednowymiarowego, po prostu ma niezerować się pochodna. Czyli x3 nie jest lokalnym dyfeomorfizmem w x=0, ale jest wszędzie indziej.
Dyfeomorfizmy są izomorfizmami gładkich rozmaitości, i prawdę mówiąc nie znam żadnego lokalnego układu współrzędnych np. na kuli czy walcu, który nie byłby lokalnym dyfeomorfizmem.

4 października 2008

Odwzorowania ciągłe

Odwzorowanie ciągłe, to takie które zachowuje granice ciągów, tzn:
Co ważne, odwzorowania ciągłe zachowują zwartość i spójność zbiorów.
Inaczej można ciągłe odwzorowania definiować jako takie, w których przeciwobrazami zbiorów otwartych są zbiory otwarte (przy czym oczywiście chodzi otwartość jako podzbioru dziedziny i obrazu, a nie całych przestrzeni).
Jeśli mamy ciągłą bijekcję, to czy odwzorowanie odwrotne też jest ciągłe? Nie koniecznie. Na przykład odwzorowanie
Jest ciągłe. Ale już odwrotne rozrywa okrąg, tzn. jeśli weźmiemy ciąg zbieżny do punktu (0;0) od strony 2π, to po przekształceniu przez F-1 dostaniemy ciąg, który co prawda jest ciągiem Cauchyego, ale byłby zbieżny do 2π, a to już jest poza obrazem.
Można to też pokazać tak. Odcinek [0,ε) jest otwarty, traktowany jako podzbiór [0,2π). Natomiast już łuk, który jest odwzorowywany na ten odcinek w okręgu nie jest otwarty -- nie istnieje kula bez brzegu o środku (0;0) całkowicie zawarta w tym łuku. Czyli przeciwobrazem zbioru otwartego nie jest zbiór otwarty.
Można też zobaczyć, że odwzorowanie F zachowuje spójność zbiorów, a F-1 już nie -- spójne otoczenie punktu (0;0) jest rozrywane na dwa kawałki.

30 września 2008

Eksponens sumy

Do tego celu najlepiej zdefiniować eksponens na liczbach zespolonych przez rozwinięcie Taylora:
Jest to szereg potęgowy. Wiemy że szeregi potęgowe są zbieżne w pewnym kole zbieżności. Są tam też bezwzględnie zbieżne (czyli zbieżny jest szereg modułów elementów).
Gdzie lim inf (limes inferior) znaczy granicę infimów ,,ogonów'' ciągu:
Tu to koło ma promień nieskończony. Czyli ten szereg jest zbieżny w każdym punkcie z, czyli jest to dobra definicja. Policzmy iloczyn dwóch eksponensów.Iloczyn dwóch szeregów bezwzględnie zbieżnych można policzyć sumując po prostu wszystkie kombinacje elementów (wystarczy żeby tylko jeden z nich był bezwzględnie zbieżny). Taki iloczyn nazywa się iloczynem Cauchyego. Po prostu dla każdego n bierzemy wszystkie iloczyny w których suma potęg jest równa n, a potem sumujemy to po wszystkich n. W ten sposób przemnożymy każdy element z każdym.
Czyli w zwięzłej postaci
Teraz pozostało nam już tylko przekształcenie tego na dwumian Newtona.Czyli rzeczywiście eksponens sumy to iloczyn eksponensów.