"Opettavainen esimerkki" [Survo-keskustelupalstan (2001-2013) arkisto]

"Opettavainen esimerkki"

Kirjoittaja:	Seppo Mustonen
Sähköposti:	-
Päiväys:	12.2.2013 13:56
Palaan vielä tähän Hessun esittämään tehtävään erityisesti
"opettavaisena esimerkkinä".

Ratkaisun olennainen osa on laskea pienimmän pisteluvun odotusarvo.
Olipa jäänyt huomaamatta, että sen yleinen lauseke on esitettävissä
n-nopalla ja yleisesti m rippumattoman heiton tapauksessa varsin
sievässä summamuodossa

              n
(1) E(m,n) = SUM (k/n)^m
             k=1

eli Survon kielellä

E(m,n):=for(k=1)to(n)sum((k/n)^m)

Siis esim. alkuperäisessä tilanteessa m=3, n=6
E(3,6)=2.0416666666667
ja aukikirjoitettuna aikaisempaa yksinkertaisemmin

(1^3+2^3+3^3+4^3+5^3+6^3)/6^3=2.0416666666667

Tämä johtuu siitä, että vaikka todennäköisyyksiä

P(m,n,k):=((n-k+1)/n)^m-((n-k)/n)^m  (k=1,2,...,n)

ei saa nätimmiksi, niiden muuttujan arvoilla painotettu summa

E1(m,n):=for(k=1)to(n)sum(k*P(m,n,k))

(eli määritelmän mukainen odotusarvo) on helppo supistaa muotoon (1)
peräkkäisten termien kumotessa osittain toisiansa.

            * * *

En huomannut tätä olennaista yksinkertaistusta ilman osittaista
"arvailulaskentaa", missä päättelin seuraavasti:

Näytin jo ensimmäisessä viestissä, että

(Pol3) E(3,n) = (n+1)^2/(4*n)                   "Polynomi"

mikä on tietenkin yksinkertaisempi esitys kuin kaavan (1) mukainen

(Pot3) E(3,n) = (1^3+2^3+3^3+4^3+...+n^3)/n^3   "Potenssisumma"

Vastaavanlaiset rinnakkaisesitykset tapauksessa m=4 ovat

(Pol4) E(4,n) = 1/30*(6*n^5+15*n^4+10*n^3-n)/n^4
ja
(Pot4) E(4,n) = (1^4+2^4+3^4+4^4+...+n^4)/n^4

Näistä tuloksen (Pol4) määräsin, siis vielä tuntematta Pot-esityksiä,
Survon avulla kokeellisesti arvoilla n=2,3,...8 käyttäen esim.
arvolla n=8 laskentakaaviota

COMB L TO NOPAT.TXT  / L=LATTICE,4 MIN=1,1,1,1 MAX=8,8,8,8
FILE SAVE NOPAT.TXT TO NEW NOPAT
VARSTAT NOPAT,*,SORT
.......................
STAT NOPAT,CUR+1 / VARS=X1 SUMS=1 RESULTS=0
Basic statistics: NOPAT N=4096
Variable: X1       X1 (##)
min=1         in obs.#1
max=8         in obs.#4096
mean=2.1416016 stddev=1.2872884 skewness=1.1458813 kurtosis=0.8478106
sum1=8772
autocorrelation=0.76781
lower_Q=1         median=2         upper_Q=3


josta saadaan E(4,8)=8772/8^4=8772/4096=2.1416015625.
Kun tarkastellaan näiden lukujen osoittajia arvoilla n=1,2,...,8,
(nimittäjinä luvut n^4), sain lukujonon alkupään
1,17,98,354,979,2275,4676,8772
ja kutsuin apuun verkosta kokonaislukujonojen "tietosanakirjan" (OEIS)
http://oeis.org/ 
jonka hakukenttään syötin nuo luvut ja OEIS tarjosi tulokseksi

A000538: Sum of fourth powers 0^4+1^4+...n^4

ja samalla (Pol4)-kaavaa vastaavan lausekkeen.

Vasta kun näin tämän, "arvasin" yleisen tuloksen (1) ja ihmettelin
jonkin aikaa, kunnes tajusin, miten siihen päästään suoraan.
Tämänhän kerroin tämän viestini alussa.
Ilman tällaista hapuilua (1) saattaisi olla vieläkin minulta
tietymättömissä.

            * * *

Pol Pot -vertailua:
(Huom. ei mitään tekemistä Kamputsean entisen diktaattorin kanssa:)

OEIS kertoi myös, että esityksen (Pol4) summaosan, mutta varmaankin aika
erilaisilla merkinnöillä, on esittänyt (persialainen) matemaatikko
al-Kachi jo 1400-luvun alussa.
Saksalainen Johann Faulhaber kykeni löytämään oikeat polynomilausekkeet
tapaukseen (Pol23) asti 1600-luvun alussa.
Niinpä summien 1^m+2^m+...+n^m "Pol"-esitykset tunnetaan nykyisin
Faulhaberin kaavoina ja niistä kerrotaan mm. Wikipedia-artikkelissa
http://en.wikipedia.org/wiki/Faulhaber's_formula 

Vasta vuonna 1834 Carl Jacobi todisti nuo kaavat yleisesti.
"Pol"-kaavat näyttävät hyviltä sikäli "Pot"-kaavoihin verrattuna, että
silloin kun ollaan kiinnostuneita tapauksista, joissa m on pieni lukuun
n verrattuna, "Pol"-kaavoilla yhteenlaskettavia on vain noin m kpl,
mutta "Pot"-kaavoilla niitä on n kpl.

Pienillä arvoilla "Pol"-kaavat m=1,2,3,4 ovat todellisia klassikoita.
Yleisillä m-arvoilla "Pol"-kaavat ovat sikäli konstikkaampia, että ne
sisältävät termiensä kertoimina sekä hieman hankalia Bernoulli-lukuja
että binomikertoimia.

Nykyisin numeerinen laskenta koneilla on kuitenkin niin nopeaa, että
tyytyisin käyttämään "Pot"-kaavaa käytännössä.
Esim. jos miljoonasta ensimmäisestä kokonaisluvusta valitaan 10 kpl
toisistaan riippumatta umpimähkään, niin niistä pienimmän odotusarvo
saadaan nykyisellä koneellani Survolla "Pot"-kaavaa käyttäen
seuraavasti:

E(m,n):=for(k=1)to(n)sum((k/n)^m)

TIME COUNT START              (jatkuva aktivointi F2 ESC sarakkeelta 12)
E(10,10^6)=90909.590909925
TIME COUNT END   0.765

Tulos syntyy alle sekunnissa. On huomattava vielä, että editoriaalinen
laskenta Survossa (koska kaikki tapahtuu resursseja kuluttavalla
tulkkiperiaatteeella) vie aikaa ainakin kymmenen kertaa enemmän kuin
ajamalla esim. suoralla, erikseen laaditulla, C-kielisellä ohjelmalla.
"Pot"-kaava (1) lienee täysin riittävä kaikkiin numeerisiin tarpeisiin.

"Pol"-kaavojen merkitys rajoittunee näin lähinnä teoreettisiin
tarkasteluihin.

Oma mielenkiintonsa on sillä, että odotusarvo 90909.59...on tässä
tapauksessa lähellä lukua         10^6/(10+1)=90909.090909091
ja on ilmeinen houkutus päätellä, että asymtoottisesti luvun n kasvaessa
E(m,n) on noin n/(m+1).
Tämä näkyy myös edellä olevista "Pol"-kaavoista Pol3 ja Pol4, mutta ei
ainakaan suoraan niiden yleisestä esityksestä, joka on myös esim.
sivulla
http://mathworld.wolfram.com/FaulhabersFormula.html 
(mutta tässähän saatan erehtyä).

On jälleen arvattavissa, että k:nneksi pienimmän luvun odotusarvo on
asymptoottisesti (alle ykkösen tarkkuudella) k*n/(m+1), k=1,2,...,m eli
nuo odotusarvot jakautuvat käytännössä "tasaisesti" välille (1,n).
Tämä vaikuttaa intuitiivisestikin hyvin uskottavalta.

            * * *

Olisin voinut lopettaa tämän viestin ensimmäiseen *** -riviin.
Kirjoitukseni varsinaisena pontimena on ollut kuitenkin osoittaa
tämän vähäpätöisen todennäköisyysongelman ratkaisun yhteydessä, miten
tärkeätä olisi se, että matemaattisluontointen juttujen ja jopa
julkaisujen yhteydessä jollain tapaa rehdisti kerrottaisiin, miten
todellisuudessa päädyttiin saavutettuihin tuloksiin.
Tyylinä on aina ollut, että artikkelit laaditaan niin viimeistellyiksi,
että kaikki roskat on lakaistu pois ja tekijät näyttäytyvät fiksumpina,
mitä todellisuudessa ovat olleet ongelmia ratkoessaan.
Ennen nykyistä tietoteknologiaa oli ymmärrettävää, että jo
panatuskustannukset huomioon ottaen esityksen tiivistäminen oli kaiken
a&o ja eleganssi ehdoton vaatimus.
Matemaattispitoisissa (painetuissa) julkaisuissa ehkä edelleenkin nämä
perinteiset hyveet vallitkoot, mutta mielestäni monissa tapauksissa
olisi upeaa, jos tekijät laatisivat verkkoon sen todellisen tarinan
kompendiumina, joka avaisi lukijoille mahdollisuudet tarkastella ja
paremmin ymmärtää erilaisia yksityiskohtia sekä toistaa numeeriset ja
symboliset laskennat (ja jopa jatkaa omilla, uusilla tarkasteluilla).

Tällainen käytäntö olisi myös alaa opetteleville varsin hyödyllistä.

Korostan näitä näkökohtia tietenkin myös (rehellisesti) sen vuoksi, että
esim. Survo-tyylillä näiden kompendiumien laatiminen olisi usein
sangen luonnollista, koska tehty työ luonnostaan raportoi tällöin
itsensä.
Siis tämänkin viestin voi siirtää leikepöydän kautta Survon tai Musteen
toimituskenttään ja tarkistella yksityiskohtia.

Seppo Mustonen
Vastaukset:
[ei vastauksia]
Luettelo keskustelunaiheista
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!
Etusivu | Keskustelu